FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CARÁTULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32º Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
 
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO PARA PROYECTOS DE INVESTIGACIÓN
(Enero 2011 - Diciembre 2011)

PROYECTO INDIVIDUAL   X   CORTO PLAZO    
PROYECTO EN PROGRAMA ESPECIAL      
PROYECTO DE INNOVACIÓN      
PROYECTO MULTIDISCIPLINARIO       MEDIANO PLAZO   X  
PROYECTO TRANSDISCIPLINARIO      
PROYECTO DE RED      
Información General del Proyecto de Investigación
  CIC    Laboratorio de Procesamiento de Lenguaje Natural 
Escuela, Centro o Unidad Sección. División o Departamento
Título
Detección de la implicación textual y relaciones léxicas en los textos en lenguaje natural

Registro asignado por la SIP:  20113295  Registro Anterior  20100773   
    Porcentaje de avance:  50   
Datos del director(a) del Proyecto de investigación:
  Gelbukh     -     Alexander  
Apellido Paterno Apellido Materno Nombres
Tipo de plaza en el IPN:  Titular C - (BASE)  Grado académico:  Doctorado 
Horas de nombramiento:  40  RFC:  GEAL620912  CURP:  GEXA620912HNELXL08 
SNI:  II  BECAS: COFAA  IV  EDD  ---  EDI  IX  (Indicar nivel)
Teléfono oficina (Ext):  56544  Teléfono particular:  55-1810-4587 
Nivel académico en el que se realizará el Proyecto de Investigación:
Medio Superior         Superior         Posgrado    X   
Ubique su propuesta solamente en uno de los campos que a continuación se enuncian:
Ingeniería y Tecnología          Ciencias Sociales     X   
Ciencias Naturales          Ciencias Agrícolas         
Ciencias Médicas          Humanidades         
Clasificación CONACyT:
Sector:   Sector Educación  
Subsector:   Infraestructura  
Tipos de investigación:
Básica     X    Aplicada          Autoequipamiento         
Desarrollo Tecnológico          Educativa           
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género      Sustentabilidad     Ninguno   
  Alexander Gelbukh -                                             
Director(a) del Proyecto de
Investigación
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El título deberá ser breve, conciso y representativo del tema central de investigación


La presentación deberá hacerse de acuerdo a la siguiente estructura:

1. Descripción del proyecto
1.1 Resumen
La tarea de la detección de la implicación textual (recognizing textual entailment, en inglés) es una tarea de razonamiento automático sobre el texto escrito en lenguaje natural, tal como el español o inglés. La tarea consiste en decidir la computadora si un enunciado lógicamente implica otro, por ejemplo: el enunciado "los casos de la influenza porcina no se han vuelto a suceder en Puebla en este año" ¿implica "el año pasado había casos de influenza en Puebla"? Esta tarea es de importancia primordial para varias tareas clave del procesamiento de texto y conocimiento: para la recuperación de informción (un documento dado, ¿responde a la pregunta?), traducción automática (la traducción, ¿es lógicamente equivalente a la frase original?), manejo automático de contenidos educativos (un módulo del curso, ¿cuáles módulos presupone lógicamente?), entre otras.

Consecutivamente es una tarea muy difícil, que requiere investigación en múltiples campos de la inteligencia artificial, tales como la desambiguación semántica, textos multilíngües, aprendizaje estadístico, análisis simbólico de textos, etcétera.

Este proyecto continúe la colaboración internacional entre los grupos relevantes del IPN y la U. de Jadavpur, India, que tiene como meta la contribución en los métodos de la detección automática de la implicación textual y desambiguación semántica. De igual manera, continúe la colaboración internacional (con la U. de Madrid), nacional (con SOMECE) e intrainstitucional (entre los grupos del CIC y UPIICSA) en la cual se investigan las posibilidades de la aplicación de los métodos desarrollados a la elaboración y manejo de los contenidos educativos. Se espera tanto elaboración de artículos científicos como la formación de recursos humanos (Maestría y Doctorado) en los temas relacionados a la detección de la implicación textual e identificación de las relaciones léxicas en el texto.

La presente propuesta abarca el segundo año del proyecto de mediano plazo.

1.2 Objetivo general
Desarrollo de los métodos de la detección de la implicación textual y relaciones léxicas en los textos en lenguaje natural, incluido el español e inglés.

1.3 Objetivos específicos
Algoritmos de análisis semántico de texto con el propósito de detectar la implicación textual y las relaciones léxicas; recursos léxicos correspondientes, incluidos diccionarios de las fucniones léxicas.

2. Subproductos comprometidos
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos año 2
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos año 3
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
 3. Monto y distribución del presupuesto solicitado (anexar): honorarios (sólo centros foráneos), materiales y suministros, servicios generales y equipamiento (anexar cotización)

3.1 ¿Cuenta con financiamiento externo?
No    X   Si               

4. Recursos humanos. Investigadores y alumnos participantes.

  4.1 Investigadores participantes

Número Nombre Actividad específica a desarrollar
1 Alexander Gelbukh - Director del proyecto
2 Grigori Sidorov -
  
Colaboración estrecha en la dirección del proyecto, consultoría sobre los asuntos lingüísticos; co-dirección de varios de los estudiantes participantes
3 Liliana Chanona Hernández
  
Implementación de varios algoritmos y seguimiento a los estudiantes programadores
4 Marina Vicario Solórzano
  
Coordinación del proyecto con las aplicaciones en la elaboración y manejo de los contenidos educativos


  4.2 Alumnos participantes

Número Nombre Status* Actividad específica a desarrollar
1 NOÉ ALEJANDRO CASTRO SÁNCHEZ PF Participación en metas.
2 Noé Alejandro Castro Sánchez TS Determinación de las relaciones sintagmáticas entre las palabras en el texto, en base a diccionarios explicativos.
3 Olga Kolesnikova - TS Investigación en la determinación de las funciones léxicas.
4 Alfredo López Monroy TS Aplicación de las relaciones léxicas en la tarea de la respuesta automática a preguntas sobre el texto.
5 Reyna Elia Melara Abarca TS Determinación de las relaciones léxicas en los recursos colaborativos parcialmente estructurados.
6 Sabino Miranda Jiménez TS Aplicaciones de las relaciones léxicas e inferencia lógica en la tarea de la construcción automática de resúmenes.
7 Sonia del Carmen Ordoñez Salinas TS Desarrollo de los métodos para la representación semántica de las relaciones léxicas entre las palabras en el texto.
8 Partha Parkay - TS Detección automática de la implicación textual en los textos y su uso para las tareas de la respuesta a preguntas.
9 Rodrigo Gabino Ramírez Moreno TS Apoyo en programación de varias tareas del proyecto; pruebas y documentación de los resultados.
10 FRANCISCO VIVEROS JIMENEZ PF Participación en metas.
11 Francisco Viveros Jiménez TS Implementación de los algoritmos de la desambiguación automática de los sentidos de las palabras.
12 Alisa Zhila - TS Investigación bibliográfica sobre los métodos avanzados para la desambiguación de los sentidos de las palabras.
13 ALISA ZHILA - PF Participación en metas.

  * PIFIS(PF), Servicio Social (SS), Tesistas (TS), Prácticas Profesionales (PP), Alumnos Participantes (AP)

 5.Programación de Actividades de Investigación   (Enero 2011 - Diciembre 2011)

Número
de meta
Valor % de
cada meta
Descripción de actividades Mes de inicio Mes de terminación
1 15 Representación semántica
Desarrollo de los métodos para la representación semántica de las relaciones en el texto, así como investigación en sus aplicaciones.
Enero 2011 Febrero 2011
2 20 Funciones léxicas
Desarrollo de los métodos para la detección automática de las funciones léxicas y su clasificasión automática.
Marzo 2011 Abril 2011
3 15 Desambiguación de los sentidos de las palabras
Desarrollo de los métodos para el uso de las relaciones léxicas en el texto para la desambiguación automática de los sentidos de las palabras en el texto.
Mayo 2011 Junio 2011
4 15 Detección de la implicación textual
Desarrollo y pruebas de la metodología para la detección de la posible implicación lógica en el texto en lenguaje natural.
Julio 2011 Agosto 2011
5 20 Aplicaciones
Aplicación de las relaciones textuales en la recuperación de la información y en respuesta a preguntas sobre textos, con enfoque a los textos legales, tales como reglamentos o leyes, así como a la compilación automática de los resúmenes.
Septiembre 2011 Octubre 2011
6 15 Evaluación y documentación
Experimentos con los métodos desarrollados, evaluación del desempeño obtenido. Preparación de las publicaciones que reportan los resultados obtenidos.
Noviembre 2011 Diciembre 2011
Porcentaje: 100 %

Nota: La planeación debe hacerse de acuerdo a las actividades del año actual (sumando 100 %), incluso si el proyecto es a mediano plazo.

  6. Presupuesto

Capítulo Descripción / Concepto Total
(Pesos)
2000  Ya que el proyecto implica el trabajo con grandes masivos de texto, se planea la adquisición del equipo de cómputo, incluidas estaciones de trabajo modernas. Adicionalmente, el proyecto necesitará la adquisición de papel, tóner, discos CD, discos duros y memorias para las computadoras existentes. 33000   
3000  Se prevé la contratación de expertos en lingüística para la elaboración de diccionarios. Se planea organización de al menos un congreso e impresión de otros materiales y libros derivados de este proyecto. 15000   
4000      
5000      
7000  Se planea la asistencia de los profesores y alumnos a varios congresos internacionales más relevantes en esta área de investigación, tales como posiblemente CICLing, MICAI, NLDB, TSD o equivalentes. Ya que el proyecto prevé la colaboración internaional (con la U. de Jadavpur), se esperan adicionalmente al menos dos viajes transatlánticos y estancias correspondientes. 50000   
Total:  $ 98000