FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CARÁTULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32º Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
INSTITUTO
POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO
PARA PROYECTOS DE INVESTIGACIÓN
PROYECTO INDIVIDUAL
X
CORTO PLAZO
PROYECTO EN PROGRAMA ESPECIAL
PROYECTO DE INNOVACIÓN
PROYECTO MULTIDISCIPLINARIO
MEDIANO PLAZO
X
PROYECTO TRANSDISCIPLINARIO
PROYECTO DE RED
PROYECTO DE INICIACIÓN
PROYECTO CON IMPACTO CyT
Información General del Proyecto de Investigación
CIC
Lab. de Lenguaje Natural y Procesamiento de Texto
Escuela, Centro o Unidad
Sección. División o Departamento
Registro asignado por la SIP: 20060735
Datos del director(a) del Proyecto de investigación:
Sidorov
-
Grigori
Apellido Paterno
Apellido Materno
Nombres
Tipo de plaza en el IPN: Titular C - (BASE)
Grado académico: Doctorado
Horas de nombramiento: 40
RFC: SIGR651028
CURP: SIXG651028HNEDXR09
SNI: III
BECAS:
COFAA IV
EDD ---
EDI IX
(Indicar nivel)
Teléfono oficina (Ext): 56518
Correo electrónico
Teléfono particular: 5591887293
Nivel académico en el que se realizará el Proyecto de Investigación:
Medio Superior
Superior
Posgrado
X
Ubique su propuesta solamente en uno de los campos que a continuación se enuncian:
Ingeniería y Tecnología
X
Ciencias Sociales
Ciencias Naturales
Ciencias Agrícolas
Ciencias Médicas
Humanidades
Educación
Clasificación CONACyT:
Sector: Sector Comunicaciones y Transportes
Subsector: Fomento a la integración de servicios y acceso a las nuevas tecnologías de la información
Tipos de investigación:
Básica
X
Aplicada
Autoequipamiento
Desarrollo Tecnológico
Educativa
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género
Sustentabilidad
Ninguno
Objetivo de desarrollo sostenible: ---
Red a la que pertenece el proyecto: ---
¿A que tipo de investigación pertenece el proyecto:
Investigación científica
investigación tecnológica
Posgrado
X
¿A que tipo de avance contribuye el proyecto: ---
Scopus: ---
Orcid: ---
Grigori Sidorov -
Director(a) del Proyecto de
Investigación
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El título deberá ser breve,
conciso y representativo del tema central de investigación
La presentación deberá hacerse
de acuerdo a la siguiente estructura:
1. Descripción del proyecto
2. Subproductos comprometidos
Nacional
Internacional
Nacional
Internacional
Artículo de Divulgación
0
0
Artículo Científico
0
2
Congresos
0
3
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invención
0
0
Hardware
0
0
Software
0
1
Medio
Superior
Posgrado
Tesistas
0
0
1
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
0
Prestante de Servicio Social
0
0
Otros (especificar)
0
2. Subproductos comprometidos año 2
Nacional
Internacional
Nacional
Internacional
Artículo de Divulgación
0
0
Artículo Científico
0
0
Congresos
0
0
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invención
0
0
Hardware
0
0
Software
0
0
Medio
Superior
Posgrado
Tesistas
0
0
0
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
0
Prestante de Servicio Social
0
0
Otros (especificar)
0
2. Subproductos comprometidos año 3
Nacional
Internacional
Nacional
Internacional
Artículo de Divulgación
0
0
Artículo Científico
0
0
Congresos
0
0
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invención
0
0
Hardware
0
0
Software
0
0
Medio
Superior
Posgrado
Tesistas
0
0
0
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
0
Prestante de Servicio Social
0
0
Otros (especificar)
0
3. Monto y distribución
del presupuesto solicitado (anexar): honorarios (sólo centros
foráneos), materiales y suministros, servicios generales
y equipamiento (anexar cotización)
3.1 ¿Ha participado en convocatorias externas al Instituto
para el financiamiento de proyectos de investigación?
No
X
Si
Nombre de la convocatoria
4. Recursos humanos. Investigadores y alumnos participantes.
4.1 Investigadores participantes
Número
Nombre
Actividad específica a desarrollar
1
Grigori Sidorov -
Director del proyecto
2
Alexander Gelbukh -
Desarrollo del módulo de generación morfológica, aplicación de los programas de análisis morfológico, recopilación automática de los datos de los corpus. (Tiene mucha experiencia en el análisis morfológico de varios idiomas y procesamiento automático de los corpus)
3
Igor Bolshakov -
Consultas sobre los métodos de aprendizaje automático y recopilación de datos de Internet (Tiene mucha experiencia en aplicación de los métodos aprendizaje automático y procesamiento de los datos en Internet). Consultas lingüísticas sobre idiomas diferentes.
4.2 Alumnos participantes
Número
Nombre
Status*
Actividad específica a desarrollar
1
Vicente Cubells Nonell
PF
Recopilación de los datos (palabras diferentes) para el español a través de Internet. Análisis de los datos morfológicos de varios idiomas detectando los parámetros que se varían entre idiomas: estructura de morfemas, posición de morfemas, número de morfemas
2
José Ernesto Gómez Balderas
PF
Análisis de aplicabilidad de redes neuronales backpropagation para la detección de estructura morfémica de las palabras
Implementación de una red neuronal backpropagation
Preparación de los datos de entrada de una red neuronal relacionados con la estructura de las palabras.
Experimentos con la re
3
Diego Lara Reyes
PF
Recopilación de los datos (palabras diferentes) para el español usando los sistemas de generación de las formas gramaticales. Desarrollo de la metodología y algoritmos de detección de estructura morfémica (etapa de pruebas)
4
Omar Olivas Zazueta
TS
Aplicación del conocimiento de estrucutra morfológica de palabras en resolución de anáfora
Recopilación de los datos a través de Internet Se escribe el programa robot que busca en Internet las páginas en español y despliega palabras en varias formas gramaticales que no están en el diccionario del sistema
Enero 2006
Marzo 2006
2
10
Recopilación de los datos de los corpus existentes Se escribe el programa que en los corpus existentes en español y despliega palabras en varias formas gramaticales que no están en el diccionario del sistema
Enero 2006
Febrero 2006
3
15
Recopilación de los datos usando los sistemas de generación de las formas grama Se escribe el programa que implementa un ciclo para todas las formas gramaticales, incluyendo las formas con clíticos verbales, y llama la función de generación que es parte del analizador morfológico que hemos desarrollado. En el analizador se implementó el método ?análisis a través de generación?, pero no existe una lista hecha de palabras.
Febrero 2006
Abril 2006
4
15
Análisis de los métodos de aprendizaje automático existentes y elección de los m Se hace comparación de los métodos de aprendizaje automático existentes y se elige el método que mejor corresponde a los objetivos propuestos
Abril 2006
Junio 2006
5
10
Preparación de las publicaciones y reportes Se preparan las publicaciones, reportes, y manuales del usuario.
Mayo 2006
Diciembre 2006
6
10
Análisis de los datos morfológicos de varios idiomas detectando los parámetros i Se comparan las descripciones morfológicas de varios idiomas y se definen los parámetros que se deben tomar en cuenta los métodos de aprendizaje
Junio 2006
Septiembre 2006
7
15
Implementación de los métodos de aprendizaje automático elegidos Se escribe el código que implementa el algoritmo en C++, se hace pruebas de funcionamiento correcto del programa
Junio 2006
Septiembre 2006
8
10
Desarrollo de la metodología y algoritmos de detección de estructura morfémica ( Se desarrolla el algoritmo a base del método desarrollado y se escribe el código que implementa la versión preliminar del algoritmo en C++ (para etapa de pruebas, sin interfaz de usuario y funciones adicionales).
Septiembre 2006
Noviembre 2006
Porcentaje:
100 %
Nota: La planeación debe hacerse de acuerdo a las actividades del año actual (sumando 100 %), incluso si el proyecto es a mediano plazo.
6. Presupuesto
Solicitado
Capítulo
Descripción / Concepto
Total (Pesos)
2000
Partes de computadoras (memoria adicional, tarjetas de video, discos duros, teclados, etc.) $2,500.00
Discos DVD-ROM gravables de 8 GB (50 piezas x 100 pesos c/u) $5,000.00
7500
3000
Mantenimiento de equipo. 5,000
Publicación de un libro derivado de los proyectos IPN, 25,000
Estancia de trabajo en la Universidad de Valencia (Dr. P. Rosso) donde se hacen trabajos sobre los métodos de de aprendizaje automático. 10,000
Participación de los integrantes de proyecto en un congreso nacional. 6,000