FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CAR�TULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32� Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
 
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO PARA PROYECTOS DE INVESTIGACI�N

PROYECTO INDIVIDUAL   X   CORTO PLAZO   X  
PROYECTO EN PROGRAMA ESPECIAL      
PROYECTO DE INNOVACIÓN      
PROYECTO MULTIDISCIPLINARIO       MEDIANO PLAZO    
PROYECTO TRANSDISCIPLINARIO      
PROYECTO DE RED      
PROPUESTA DE ESTUDIO      
Informaci�n General del Proyecto de Investigaci�n
  CIC     
Escuela, Centro o Unidad Secci�n. Divisi�n o Departamento
T�tulo
Generación automática de resúmenes de textos cortos

Registro asignado por la SIP:  20111146     
Datos del director(a) del Proyecto de investigaci�n:
  Sidorov     -     Grigori  
Apellido Paterno Apellido Materno Nombres
Tipo de plaza en el IPN:  Titular C - (BASE)  Grado acad�mico:  Doctorado 
Horas de nombramiento:  40  RFC:  SIGR651028  CURP:  SIXG651028HNEDXR09 
SNI:  III  BECAS: COFAA  IV  EDD  ---  EDI  IX  (Indicar nivel)
Tel�fono oficina (Ext):  56518  Correo electrónico Tel�fono particular:  5591887293 
Nivel acad�mico en el que se realizar� el Proyecto de Investigaci�n:
Medio Superior         Superior         Posgrado    X   
Ubique su propuesta solamente en uno de los campos que a continuaci�n se enuncian:
Ingenier�a y Tecnología     X    Ciencias Sociales         
Ciencias Naturales          Ciencias Agr�colas         
Ciencias M�dicas          Humanidades         
Educación         
Clasificaci�n CONACyT:
Sector:   Otros  
Subsector:   Otros  
Tipos de investigaci�n:
B�sica     X    Aplicada          Autoequipamiento         
Desarrollo Tecnol�gico          Educativa           
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género      Sustentabilidad     
Ninguno    
Red a la que pertenece ó podría pertenecer el proyecto:   ---  
¿A que tipo de investigación pertenece su proyecto?:
Investigación Científica     X    Investigación Tecnológica        
¿A que tipo de avance contribuye su proyecto? :
Avance del conocimiento:        Desarrollo de la enseñanza:        Aprovechamiento de los recursos naturales y materiales:       
Scopus:   ---  
Orcid:   ---  
  Grigori Sidorov -                                             
Director(a) del Proyecto de
Investigaci�n
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El t�tulo deber� ser breve, conciso y representativo del tema central de investigaci�n


La presentaci�n deber� hacerse de acuerdo a la siguiente estructura:

1. Descripci�n del proyecto
1.1 Resumen
En este proyecto se propone un nuevo método para la generación de resúmenes abstractivos basado en la representación textual por medio del formalismo de grafos conceptuales y posteriores transformaciones del dicho grafo. En este método, las oraciones principales de un texto se representan en grafos conceptuales, los cuales mantienen la estructura y la relación entre los elementos de la oración basándose el análisis sintáctico. Por medio de varias operaciones como generalización, unión, intersección y poda se fusionan las oraciones y se mantiene la cohesión y coherencia entre ellas; para el soporte de dichas operaciones, se utiliza conocimiento lingüístico, por ejemplo WordNet. Se hace la evaluación sobre un conjunto de los textos cortos.

1.2 Objetivo general
Desarrollar un método y su implementación en software (prototipo) para la generación de resúmenes abstractivos basado en la representación de textos por medio de grafos conceptuales, aplicado a los textos cortos.

1.3 Objetivos específicos
Un método para generar resúmenes, su implementación en un prototipo de software y su evaluación sobre unos textos cortos, que utiliza 1) la representación estructural de los textos usando loas algoritmos directos para la síntesis de grafos conceptuales basándose en un árbol sintáctico 2) transformaciones de los grafos conceptuales para resumir.

2. Subproductos comprometidos
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   1 
Congresos  1   1  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  1   0 
Medio       Superior Posgrado
Tesistas  0   0   2 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   2 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos a�o 2
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos a�o 3
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
 3. Monto y distribuci�n del presupuesto solicitado (anexar): honorarios (s�lo centros for�neos), materiales y suministros, servicios generales y equipamiento (anexar cotizaci�n)

3.1 �Ha participado en convocatorias externas al Instituto para el financiamiento de proyectos de investigaci�n?
No    X   Si        Nombre de la convocatoria       

4. Recursos humanos. Investigadores y alumnos participantes.

  4.1 Investigadores participantes

N�mero Nombre Actividad espec�fica a desarrollar
1 Grigori Sidorov - Director del proyecto
2 Alexander Gelbukh Kahn
  
Coordinación de esfuerzos de programación, ayuda en programación, ayuda en selección de la metodología de evaluación y desarrollo


  4.2 Alumnos participantes

N�mero Nombre Status* Actividad espec�fica a desarrollar
1 HONORATO AGUILAR GALICIA PF Varios aspectos de síntesis directo de los grafos conceptuales, transformación de los grafos, experimentos
2 Honorato Aguilar Galicia TS Elegir la herramienta apropiada para la tarea,
Investigar la posibilidad de convertir la herramienta elegida en un
Operación de Eliminación o poda
interfaz para la evaluación del método.
Preparar un conjunto de textos de prueba.
3 Francisco Castillo Velasquez TS Desarrollar manualmente unos ejemplos de los grafos.
Operación de Inclusión
Operación de Intersección
Aplicar el método desarrollado a los datos preparados.
Seleccionar la medida de evaluación de los resultados.
4 FRANCISCO ANTONIO CASTILLO VELASQUEZ PF Varios aspectos de síntesis directo de los grafos conceptuales, transformación de los grafos, experimentos
5 Noe Castro Sanchez TS Apoyo en programación
6 Eduardo Cendejas Castro TS Apoyo en programación
7 Ismael Diaz Rangel TS Apoyo en programación
8 Sabino Miranda Jimenez TS Aplicar la herramienta a algunos ejemplos.
Ponderar los fragmentos de los grafos conceptuales
Operación de Generalización
Operación de Unión
Evaluar los resultados.
9 SABINO MIRANDA JIMENEZ PF Varios aspectos de síntesis directo de los grafos conceptuales, transformación de los grafos, experimentos
10 Obdulia Pichardo Lagunas TS Apoyo en programación
11 Juan Pablo Posadas Duran TS Apoyo en programación
12 Francisco Viveros Jimenez TS Apoyo en programación
13 Alisa Zhila - TS Apoyo en programación

  * PIFIS(PF), Servicio Social (SS), Tesistas (TS), Pr�cticas Profesionales (PP), Alumnos Participantes (AP)

 5.Programaci�n de Actividades de Investigaci�n   

N�mero
de meta
Valor % de
cada meta
Descripci�n de actividades Mes de inicio Mes de terminaci�n
1 10 Preparación de publicaciones y reportes
Preparación de publicaciones y reportes
Enero 2011 Diciembre 2011
2 5 Síntesis directo de los grafos conceptuales 1: Elegir la herramienta apropiada
Descarga e investigación de los programas disponibles, su evaluación y comparación. Elegir la herramienta apropiada para la tarea, haciendo el uso de varias herramientas disponibles para el análisis sintáctico (Connexor, FreeLing, C&C, etc.)
Enero 2011 Febrero 2011
3 5 Investigar la posibilidad de convertir la herramienta elegida en un módulo
Investigar la posibilidad de convertir la herramienta elegida en un módulo para su compilación junto con el software.
Marzo 2011 Marzo 2011
4 5 Aplicar la herramienta a algunos ejemplos
Aplicar la herramienta a algunos ejemplos de los textos y evaluar su desempeño.
Marzo 2011 Abril 2011
5 5 Desarrollar manualmente unos ejemplos de los grafos conceptuales
Desarrollar manualmente unos ejemplos de los grafos conceptuales para la evaluación.
Marzo 2011 Abril 2011
6 10 Ponderar los fragmentos de los grafos conceptuales
Desarrollar el modelo de ponderación de los fragmentos de los grafos conceptuales según su importancia
Mayo 2011 Junio 2011
7 5 Operación de Generalización
Desarrollar e implementar el algoritmo que realiza la Operación de Generalización
Mayo 2011 Junio 2011
8 5 Operación de Unión
Desarrollar e implementar el algoritmo que realiza la Operación de Unión
Mayo 2011 Junio 2011
9 5 Operación de Inclusión
Desarrollar e implementar el algoritmo que realiza la Operación de Inclusión
Mayo 2011 Junio 2011
10 5 Operación de Intersección
Desarrollar e implementar el algoritmo que realiza la Operación de Intersección
Mayo 2011 Junio 2011
11 5 Operación de Eliminación o poda
Desarrollar e implementar el algoritmo que realiza la Operación de Eliminación
Junio 2011 Julio 2011
12 10 Desarrollar una interfaz para la evaluación del método
Desarrollo de la estrategia de presentación de los datos e interacción con el usuario, su implementación
Agosto 2011 Septiembre 2011
13 5 Preparar un conjunto de textos de prueba.
Buscar y seleccionar los textos cortos con ciertas características. Describirlos.
Septiembre 2011 Octubre 2011
14 5 Seleccionar la medida de evaluación de los resultados
Entre las medidas disponibles para medir la calidad de resúmenes seleccionar alguna que se aplicará.
Septiembre 2011 Octubre 2011
15 5 Aplicar el método desarrollado a los datos preparados.
Realizar el procedimiento de aplicación del método desarrollado a los textos seleccionados
Octubre 2011 Noviembre 2011
16 10 Evaluar los resultados
Realizar la comparación con un estándar utilizando la métrica seleccionada
Noviembre 2011 Diciembre 2011
Porcentaje: 100 %

Nota: La planeaci�n debe hacerse de acuerdo a las actividades del a�o actual (sumando 100 %), incluso si el proyecto es a mediano plazo.

  6. Presupuesto Solicitado (para 2024 solo aplica capítulo 4000)

Cap�tulo Descripci�n / Concepto Total
(Pesos)
2000  Compra de partes de las computadoras (memorias, discos duros, etc.) para mejorar el equipo existente (50,000 pesos). 28000   
3000  Para la asistencia a un congreso internacional para presentar los resultados del proyecto 15000   
4000      
5000      
7000  Para la asistencia de los estudiantes a los congresos nacionales e internacionales para presentar los resultados del proyecto 15000   
Total:  $ 58000