FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CAR�TULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32� Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
INSTITUTO
POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO
PARA PROYECTOS DE INVESTIGACI�N
PROYECTO INDIVIDUAL
X
CORTO PLAZO
PROYECTO EN PROGRAMA ESPECIAL
PROYECTO DE INNOVACIÓN
PROYECTO MULTIDISCIPLINARIO
MEDIANO PLAZO
X
PROYECTO TRANSDISCIPLINARIO
PROYECTO DE RED
PROPUESTA DE ESTUDIO
Informaci�n General del Proyecto de Investigaci�n
CIC
Lab. de Lenguaje Natural y Procesamiento de Texto
Escuela, Centro o Unidad
Secci�n. Divisi�n o Departamento
Registro asignado por la SIP: 20060735
Datos del director(a) del Proyecto de investigaci�n:
Sidorov
-
Grigori
Apellido Paterno
Apellido Materno
Nombres
Tipo de plaza en el IPN: Titular C - (BASE)
Grado acad�mico: Doctorado
Horas de nombramiento: 40
RFC: SIGR651028
CURP: SIXG651028HNEDXR09
SNI: III
BECAS:
COFAA IV
EDD ---
EDI IX
(Indicar nivel)
Tel�fono oficina (Ext): 56518
Correo electrónico
Tel�fono particular: 5591887293
Nivel acad�mico en el que se realizar� el Proyecto de Investigaci�n:
Medio Superior
Superior
Posgrado
X
Ubique su propuesta solamente en uno de los campos que a continuaci�n se enuncian:
Ingenier�a y Tecnología
X
Ciencias Sociales
Ciencias Naturales
Ciencias Agr�colas
Ciencias M�dicas
Humanidades
Educación
Clasificaci�n CONACyT:
Sector: Sector Comunicaciones y Transportes
Subsector: Fomento a la integración de servicios y acceso a las nuevas tecnologías de la información
Tipos de investigaci�n:
B�sica
X
Aplicada
Autoequipamiento
Desarrollo Tecnol�gico
Educativa
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género
Sustentabilidad
Ninguno
Red a la que pertenece ó podría pertenecer el proyecto: ---
¿A que tipo de investigación pertenece su proyecto?:
Investigación Científica
X
Investigación Tecnológica
¿A que tipo de avance contribuye su proyecto? :
Avance del conocimiento:
Desarrollo de la enseñanza:
Aprovechamiento de los recursos naturales y materiales:
Scopus: ---
Orcid: ---
Grigori Sidorov -
Director(a) del Proyecto de
Investigaci�n
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El t�tulo deber� ser breve,
conciso y representativo del tema central de investigaci�n
La presentaci�n deber� hacerse
de acuerdo a la siguiente estructura:
1. Descripci�n del proyecto
2. Subproductos comprometidos
Nacional
Internacional
Nacional
Internacional
Art�culo de Divulgaci�n
0
0
Art�culo Cient�fico
0
2
Congresos
0
3
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invenci�n
0
0
Hardware
0
0
Software
0
1
Medio
Superior
Posgrado
Tesistas
0
0
1
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
0
Prestante de Servicio Social
0
0
Otros (especificar)
0
2. Subproductos comprometidos a�o 2
Nacional
Internacional
Nacional
Internacional
Art�culo de Divulgaci�n
0
0
Art�culo Cient�fico
0
0
Congresos
0
0
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invenci�n
0
0
Hardware
0
0
Software
0
0
Medio
Superior
Posgrado
Tesistas
0
0
0
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
0
Prestante de Servicio Social
0
0
Otros (especificar)
0
2. Subproductos comprometidos a�o 3
Nacional
Internacional
Nacional
Internacional
Art�culo de Divulgaci�n
0
0
Art�culo Cient�fico
0
0
Congresos
0
0
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invenci�n
0
0
Hardware
0
0
Software
0
0
Medio
Superior
Posgrado
Tesistas
0
0
0
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
0
Prestante de Servicio Social
0
0
Otros (especificar)
0
3. Monto y distribuci�n
del presupuesto solicitado (anexar): honorarios (s�lo centros
for�neos), materiales y suministros, servicios generales
y equipamiento (anexar cotizaci�n)
3.1 �Ha participado en convocatorias externas al Instituto
para el financiamiento de proyectos de investigaci�n?
No
X
Si
Nombre de la convocatoria
4. Recursos humanos. Investigadores y alumnos participantes.
4.1 Investigadores participantes
N�mero
Nombre
Actividad espec�fica a desarrollar
1
Grigori Sidorov -
Director del proyecto
2
Alexander Gelbukh -
Desarrollo del módulo de generación morfológica, aplicación de los programas de análisis morfológico, recopilación automática de los datos de los corpus. (Tiene mucha experiencia en el análisis morfológico de varios idiomas y procesamiento automático de los corpus)
3
Igor Bolshakov -
Consultas sobre los métodos de aprendizaje automático y recopilación de datos de Internet (Tiene mucha experiencia en aplicación de los métodos aprendizaje automático y procesamiento de los datos en Internet). Consultas lingüísticas sobre idiomas diferentes.
4.2 Alumnos participantes
N�mero
Nombre
Status*
Actividad espec�fica a desarrollar
1
Vicente Cubells Nonell
PF
Recopilación de los datos (palabras diferentes) para el español a través de Internet. Análisis de los datos morfológicos de varios idiomas detectando los parámetros que se varían entre idiomas: estructura de morfemas, posición de morfemas, número de morfemas
2
José Ernesto Gómez Balderas
PF
Análisis de aplicabilidad de redes neuronales backpropagation para la detección de estructura morfémica de las palabras
Implementación de una red neuronal backpropagation
Preparación de los datos de entrada de una red neuronal relacionados con la estructura de las palabras.
Experimentos con la re
3
Diego Lara Reyes
PF
Recopilación de los datos (palabras diferentes) para el español usando los sistemas de generación de las formas gramaticales. Desarrollo de la metodología y algoritmos de detección de estructura morfémica (etapa de pruebas)
4
Omar Olivas Zazueta
TS
Aplicación del conocimiento de estrucutra morfológica de palabras en resolución de anáfora
5.Programaci�n de Actividades de Investigaci�n
N�mero de meta
Valor % de cada meta
Descripci�n de actividades
Mes de inicio
Mes de terminaci�n
1
15
Recopilación de los datos a través de Internet Se escribe el programa robot que busca en Internet las páginas en español y despliega palabras en varias formas gramaticales que no están en el diccionario del sistema
Enero 2006
Marzo 2006
2
10
Recopilación de los datos de los corpus existentes Se escribe el programa que en los corpus existentes en español y despliega palabras en varias formas gramaticales que no están en el diccionario del sistema
Enero 2006
Febrero 2006
3
15
Recopilación de los datos usando los sistemas de generación de las formas grama Se escribe el programa que implementa un ciclo para todas las formas gramaticales, incluyendo las formas con clíticos verbales, y llama la función de generación que es parte del analizador morfológico que hemos desarrollado. En el analizador se implementó el método ?análisis a través de generación?, pero no existe una lista hecha de palabras.
Febrero 2006
Abril 2006
4
15
Análisis de los métodos de aprendizaje automático existentes y elección de los m Se hace comparación de los métodos de aprendizaje automático existentes y se elige el método que mejor corresponde a los objetivos propuestos
Abril 2006
Junio 2006
5
10
Preparación de las publicaciones y reportes Se preparan las publicaciones, reportes, y manuales del usuario.
Mayo 2006
Diciembre 2006
6
10
Análisis de los datos morfológicos de varios idiomas detectando los parámetros i Se comparan las descripciones morfológicas de varios idiomas y se definen los parámetros que se deben tomar en cuenta los métodos de aprendizaje
Junio 2006
Septiembre 2006
7
15
Implementación de los métodos de aprendizaje automático elegidos Se escribe el código que implementa el algoritmo en C++, se hace pruebas de funcionamiento correcto del programa
Junio 2006
Septiembre 2006
8
10
Desarrollo de la metodología y algoritmos de detección de estructura morfémica ( Se desarrolla el algoritmo a base del método desarrollado y se escribe el código que implementa la versión preliminar del algoritmo en C++ (para etapa de pruebas, sin interfaz de usuario y funciones adicionales).
Septiembre 2006
Noviembre 2006
Porcentaje:
100 %
Nota: La planeaci�n debe hacerse de acuerdo a las actividades del a�o actual (sumando 100 %), incluso si el proyecto es a mediano plazo.
6. Presupuesto
Solicitado (para 2024 solo aplica capítulo 4000)
Cap�tulo
Descripci�n / Concepto
Total (Pesos)
2000
Partes de computadoras (memoria adicional, tarjetas de video, discos duros, teclados, etc.) $2,500.00
Discos DVD-ROM gravables de 8 GB (50 piezas x 100 pesos c/u) $5,000.00
7500
3000
Mantenimiento de equipo. 5,000
Publicación de un libro derivado de los proyectos IPN, 25,000
Estancia de trabajo en la Universidad de Valencia (Dr. P. Rosso) donde se hacen trabajos sobre los métodos de de aprendizaje automático. 10,000
Participación de los integrantes de proyecto en un congreso nacional. 6,000