FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CAR�TULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32� Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
 
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO PARA PROYECTOS DE INVESTIGACI�N

PROYECTO INDIVIDUAL   X   CORTO PLAZO    
PROYECTO EN PROGRAMA ESPECIAL      
PROYECTO DE INNOVACIÓN      
PROYECTO MULTIDISCIPLINARIO       MEDIANO PLAZO   X  
PROYECTO TRANSDISCIPLINARIO      
PROYECTO DE RED      
PROPUESTA DE ESTUDIO      
Informaci�n General del Proyecto de Investigaci�n
  CIC    Laboratorio de Procesamiento de Lenguaje Natural 
Escuela, Centro o Unidad Secci�n. Divisi�n o Departamento
T�tulo
Detección de la implicación textual y relaciones léxicas en los textos en lenguaje natural

Registro asignado por la SIP:  20113295  Registro Anterior  20100773   
    Porcentaje de avance:  50   
Datos del director(a) del Proyecto de investigaci�n:
  Gelbukh     -     Alexander  
Apellido Paterno Apellido Materno Nombres
Tipo de plaza en el IPN:  Titular C - (BASE)  Grado acad�mico:  Doctorado 
Horas de nombramiento:  40  RFC:  GEAL620912  CURP:  GEXA620912HNELXL08 
SNI:  III  BECAS: COFAA  IV  EDD  ---  EDI  IX  (Indicar nivel)
Tel�fono oficina (Ext):  56544  Correo electrónico Tel�fono particular:  55-1810-4587 
Nivel acad�mico en el que se realizar� el Proyecto de Investigaci�n:
Medio Superior         Superior         Posgrado    X   
Ubique su propuesta solamente en uno de los campos que a continuaci�n se enuncian:
Ingenier�a y Tecnología          Ciencias Sociales     X   
Ciencias Naturales          Ciencias Agr�colas         
Ciencias M�dicas          Humanidades         
Educación         
Clasificaci�n CONACyT:
Sector:   Sector Educación  
Subsector:   Infraestructura                                                                                                                                                   
Tipos de investigaci�n:
B�sica     X    Aplicada          Autoequipamiento         
Desarrollo Tecnol�gico          Educativa           
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género      Sustentabilidad     
Ninguno    
Red a la que pertenece ó podría pertenecer el proyecto:   ---  
¿A que tipo de investigación pertenece su proyecto?:
Investigación Científica          Investigación Tecnológica     X  
¿A que tipo de avance contribuye su proyecto? :
Avance del conocimiento:        Desarrollo de la enseñanza:        Aprovechamiento de los recursos naturales y materiales:       
Scopus:   ---  
Orcid:   ---  
  Alexander Gelbukh -                                             
Director(a) del Proyecto de
Investigaci�n
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El t�tulo deber� ser breve, conciso y representativo del tema central de investigaci�n


La presentaci�n deber� hacerse de acuerdo a la siguiente estructura:

1. Descripci�n del proyecto
1.1 Resumen
La tarea de la detección de la implicación textual (recognizing textual entailment, en inglés) es una tarea de razonamiento automático sobre el texto escrito en lenguaje natural, tal como el español o inglés. La tarea consiste en decidir la computadora si un enunciado lógicamente implica otro, por ejemplo: el enunciado "los casos de la influenza porcina no se han vuelto a suceder en Puebla en este año" ¿implica "el año pasado había casos de influenza en Puebla"? Esta tarea es de importancia primordial para varias tareas clave del procesamiento de texto y conocimiento: para la recuperación de informción (un documento dado, ¿responde a la pregunta?), traducción automática (la traducción, ¿es lógicamente equivalente a la frase original?), manejo automático de contenidos educativos (un módulo del curso, ¿cuáles módulos presupone lógicamente?), entre otras.

Consecutivamente es una tarea muy difícil, que requiere investigación en múltiples campos de la inteligencia artificial, tales como la desambiguación semántica, textos multilíngües, aprendizaje estadístico, análisis simbólico de textos, etcétera.

Este proyecto continúe la colaboración internacional entre los grupos relevantes del IPN y la U. de Jadavpur, India, que tiene como meta la contribución en los métodos de la detección automática de la implicación textual y desambiguación semántica. De igual manera, continúe la colaboración internacional (con la U. de Madrid), nacional (con SOMECE) e intrainstitucional (entre los grupos del CIC y UPIICSA) en la cual se investigan las posibilidades de la aplicación de los métodos desarrollados a la elaboración y manejo de los contenidos educativos. Se espera tanto elaboración de artículos científicos como la formación de recursos humanos (Maestría y Doctorado) en los temas relacionados a la detección de la implicación textual e identificación de las relaciones léxicas en el texto.

La presente propuesta abarca el segundo año del proyecto de mediano plazo.

1.2 Objetivo general
Desarrollo de los métodos de la detección de la implicación textual y relaciones léxicas en los textos en lenguaje natural, incluido el español e inglés.

1.3 Objetivos específicos
Algoritmos de análisis semántico de texto con el propósito de detectar la implicación textual y las relaciones léxicas; recursos léxicos correspondientes, incluidos diccionarios de las fucniones léxicas.

2. Subproductos comprometidos
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   5 
Congresos  0   1  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  1   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   1 
Medio       Superior Posgrado
Tesistas  0   0   2 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   2 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos a�o 2
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos a�o 3
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
 3. Monto y distribuci�n del presupuesto solicitado (anexar): honorarios (s�lo centros for�neos), materiales y suministros, servicios generales y equipamiento (anexar cotizaci�n)

3.1 �Ha participado en convocatorias externas al Instituto para el financiamiento de proyectos de investigaci�n?
No    X   Si        Nombre de la convocatoria       

4. Recursos humanos. Investigadores y alumnos participantes.

  4.1 Investigadores participantes

N�mero Nombre Actividad espec�fica a desarrollar
1 Alexander Gelbukh - Director del proyecto
2 Grigori Sidorov -
  
Colaboración estrecha en la dirección del proyecto, consultoría sobre los asuntos lingüísticos; co-dirección de varios de los estudiantes participantes
3 Liliana Chanona Hernández
  
Implementación de varios algoritmos y seguimiento a los estudiantes programadores
4 Marina Vicario Solórzano
  
Coordinación del proyecto con las aplicaciones en la elaboración y manejo de los contenidos educativos


  4.2 Alumnos participantes

N�mero Nombre Status* Actividad espec�fica a desarrollar
1 NOÉ ALEJANDRO CASTRO SÁNCHEZ PF Participación en metas.
2 Noé Alejandro Castro Sánchez TS Determinación de las relaciones sintagmáticas entre las palabras en el texto, en base a diccionarios explicativos.
3 Olga Kolesnikova - TS Investigación en la determinación de las funciones léxicas.
4 Alfredo López Monroy TS Aplicación de las relaciones léxicas en la tarea de la respuesta automática a preguntas sobre el texto.
5 Reyna Elia Melara Abarca TS Determinación de las relaciones léxicas en los recursos colaborativos parcialmente estructurados.
6 Sabino Miranda Jiménez TS Aplicaciones de las relaciones léxicas e inferencia lógica en la tarea de la construcción automática de resúmenes.
7 Sonia del Carmen Ordoñez Salinas TS Desarrollo de los métodos para la representación semántica de las relaciones léxicas entre las palabras en el texto.
8 Partha Parkay - TS Detección automática de la implicación textual en los textos y su uso para las tareas de la respuesta a preguntas.
9 Rodrigo Gabino Ramírez Moreno TS Apoyo en programación de varias tareas del proyecto; pruebas y documentación de los resultados.
10 FRANCISCO VIVEROS JIMENEZ PF Participación en metas.
11 Francisco Viveros Jiménez TS Implementación de los algoritmos de la desambiguación automática de los sentidos de las palabras.
12 Alisa Zhila - TS Investigación bibliográfica sobre los métodos avanzados para la desambiguación de los sentidos de las palabras.
13 ALISA ZHILA - PF Participación en metas.

  * PIFIS(PF), Servicio Social (SS), Tesistas (TS), Pr�cticas Profesionales (PP), Alumnos Participantes (AP)

 5.Programaci�n de Actividades de Investigaci�n   

N�mero
de meta
Valor % de
cada meta
Descripci�n de actividades Mes de inicio Mes de terminaci�n
1 15 Representación semántica
Desarrollo de los métodos para la representación semántica de las relaciones en el texto, así como investigación en sus aplicaciones.
Enero 2011 Febrero 2011
2 20 Funciones léxicas
Desarrollo de los métodos para la detección automática de las funciones léxicas y su clasificasión automática.
Marzo 2011 Abril 2011
3 15 Desambiguación de los sentidos de las palabras
Desarrollo de los métodos para el uso de las relaciones léxicas en el texto para la desambiguación automática de los sentidos de las palabras en el texto.
Mayo 2011 Junio 2011
4 15 Detección de la implicación textual
Desarrollo y pruebas de la metodología para la detección de la posible implicación lógica en el texto en lenguaje natural.
Julio 2011 Agosto 2011
5 20 Aplicaciones
Aplicación de las relaciones textuales en la recuperación de la información y en respuesta a preguntas sobre textos, con enfoque a los textos legales, tales como reglamentos o leyes, así como a la compilación automática de los resúmenes.
Septiembre 2011 Octubre 2011
6 15 Evaluación y documentación
Experimentos con los métodos desarrollados, evaluación del desempeño obtenido. Preparación de las publicaciones que reportan los resultados obtenidos.
Noviembre 2011 Diciembre 2011
Porcentaje: 100 %

Nota: La planeaci�n debe hacerse de acuerdo a las actividades del a�o actual (sumando 100 %), incluso si el proyecto es a mediano plazo.

  6. Presupuesto Solicitado (para 2024 solo aplica capítulo 4000)

Cap�tulo Descripci�n / Concepto Total
(Pesos)
2000  Ya que el proyecto implica el trabajo con grandes masivos de texto, se planea la adquisición del equipo de cómputo, incluidas estaciones de trabajo modernas. Adicionalmente, el proyecto necesitará la adquisición de papel, tóner, discos CD, discos duros y memorias para las computadoras existentes. 33000   
3000  Se prevé la contratación de expertos en lingüística para la elaboración de diccionarios. Se planea organización de al menos un congreso e impresión de otros materiales y libros derivados de este proyecto. 15000   
4000      
5000      
7000  Se planea la asistencia de los profesores y alumnos a varios congresos internacionales más relevantes en esta área de investigación, tales como posiblemente CICLing, MICAI, NLDB, TSD o equivalentes. Ya que el proyecto prevé la colaboración internaional (con la U. de Jadavpur), se esperan adicionalmente al menos dos viajes transatlánticos y estancias correspondientes. 50000   
Total:  $ 98000