FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CARÁTULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32º Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
 
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO PARA PROYECTOS DE INVESTIGACIÓN
(Enero 2011 - Diciembre 2011)

PROYECTO INDIVIDUAL   X   CORTO PLAZO   X  
PROYECTO EN PROGRAMA ESPECIAL      
PROYECTO DE INNOVACIÓN      
PROYECTO MULTIDISCIPLINARIO       MEDIANO PLAZO    
PROYECTO TRANSDISCIPLINARIO      
PROYECTO DE RED      
Información General del Proyecto de Investigación
  CIC     
Escuela, Centro o Unidad Sección. División o Departamento
Título
Generación automática de resúmenes de textos cortos

Registro asignado por la SIP:  20111146     
Datos del director(a) del Proyecto de investigación:
  Sidorov     -     Grigori  
Apellido Paterno Apellido Materno Nombres
Tipo de plaza en el IPN:  Titular C - (BASE)  Grado académico:  Doctorado 
Horas de nombramiento:  40  RFC:  SIGR651028  CURP:  SIXG651028HNEDXR09 
SNI:  III  BECAS: COFAA  IV  EDD  ---  EDI  IX  (Indicar nivel)
Teléfono oficina (Ext):  56518  Teléfono particular:  5591887293 
Nivel académico en el que se realizará el Proyecto de Investigación:
Medio Superior         Superior         Posgrado    X   
Ubique su propuesta solamente en uno de los campos que a continuación se enuncian:
Ingeniería y Tecnología     X    Ciencias Sociales         
Ciencias Naturales          Ciencias Agrícolas         
Ciencias Médicas          Humanidades         
Clasificación CONACyT:
Sector:   Otros  
Subsector:   Otros  
Tipos de investigación:
Básica     X    Aplicada          Autoequipamiento         
Desarrollo Tecnológico          Educativa           
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género      Sustentabilidad     Ninguno   
  Grigori Sidorov -                                             
Director(a) del Proyecto de
Investigación
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El título deberá ser breve, conciso y representativo del tema central de investigación


La presentación deberá hacerse de acuerdo a la siguiente estructura:

1. Descripción del proyecto
1.1 Resumen
En este proyecto se propone un nuevo método para la generación de resúmenes abstractivos basado en la representación textual por medio del formalismo de grafos conceptuales y posteriores transformaciones del dicho grafo. En este método, las oraciones principales de un texto se representan en grafos conceptuales, los cuales mantienen la estructura y la relación entre los elementos de la oración basándose el análisis sintáctico. Por medio de varias operaciones como generalización, unión, intersección y poda se fusionan las oraciones y se mantiene la cohesión y coherencia entre ellas; para el soporte de dichas operaciones, se utiliza conocimiento lingüístico, por ejemplo WordNet. Se hace la evaluación sobre un conjunto de los textos cortos.

1.2 Objetivo general
Desarrollar un método y su implementación en software (prototipo) para la generación de resúmenes abstractivos basado en la representación de textos por medio de grafos conceptuales, aplicado a los textos cortos.

1.3 Objetivos específicos
Un método para generar resúmenes, su implementación en un prototipo de software y su evaluación sobre unos textos cortos, que utiliza 1) la representación estructural de los textos usando loas algoritmos directos para la síntesis de grafos conceptuales basándose en un árbol sintáctico 2) transformaciones de los grafos conceptuales para resumir.

2. Subproductos comprometidos
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos año 2
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos año 3
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
 3. Monto y distribución del presupuesto solicitado (anexar): honorarios (sólo centros foráneos), materiales y suministros, servicios generales y equipamiento (anexar cotización)

3.1 ¿Cuenta con financiamiento externo?
No    X   Si               

4. Recursos humanos. Investigadores y alumnos participantes.

  4.1 Investigadores participantes

Número Nombre Actividad específica a desarrollar
1 Grigori Sidorov - Director del proyecto
2 Alexander Gelbukh Kahn
  
Coordinación de esfuerzos de programación, ayuda en programación, ayuda en selección de la metodología de evaluación y desarrollo


  4.2 Alumnos participantes

Número Nombre Status* Actividad específica a desarrollar
1 HONORATO AGUILAR GALICIA PF Varios aspectos de síntesis directo de los grafos conceptuales, transformación de los grafos, experimentos
2 Honorato Aguilar Galicia TS Elegir la herramienta apropiada para la tarea,
Investigar la posibilidad de convertir la herramienta elegida en un
Operación de Eliminación o poda
interfaz para la evaluación del método.
Preparar un conjunto de textos de prueba.
3 Francisco Castillo Velasquez TS Desarrollar manualmente unos ejemplos de los grafos.
Operación de Inclusión
Operación de Intersección
Aplicar el método desarrollado a los datos preparados.
Seleccionar la medida de evaluación de los resultados.
4 FRANCISCO ANTONIO CASTILLO VELASQUEZ PF Varios aspectos de síntesis directo de los grafos conceptuales, transformación de los grafos, experimentos
5 Noe Castro Sanchez TS Apoyo en programación
6 Eduardo Cendejas Castro TS Apoyo en programación
7 Ismael Diaz Rangel TS Apoyo en programación
8 Sabino Miranda Jimenez TS Aplicar la herramienta a algunos ejemplos.
Ponderar los fragmentos de los grafos conceptuales
Operación de Generalización
Operación de Unión
Evaluar los resultados.
9 SABINO MIRANDA JIMENEZ PF Varios aspectos de síntesis directo de los grafos conceptuales, transformación de los grafos, experimentos
10 Obdulia Pichardo Lagunas TS Apoyo en programación
11 Juan Pablo Posadas Duran TS Apoyo en programación
12 Francisco Viveros Jimenez TS Apoyo en programación
13 Alisa Zhila - TS Apoyo en programación

  * PIFIS(PF), Servicio Social (SS), Tesistas (TS), Prácticas Profesionales (PP), Alumnos Participantes (AP)

 5.Programación de Actividades de Investigación   (Enero 2011 - Diciembre 2011)

Número
de meta
Valor % de
cada meta
Descripción de actividades Mes de inicio Mes de terminación
1 5 Síntesis directo de los grafos conceptuales 1: Elegir la herramienta apropiada
Descarga e investigación de los programas disponibles, su evaluación y comparación. Elegir la herramienta apropiada para la tarea, haciendo el uso de varias herramientas disponibles para el análisis sintáctico (Connexor, FreeLing, C&C, etc.)
Enero 2011 Febrero 2011
2 10 Preparación de publicaciones y reportes
Preparación de publicaciones y reportes
Enero 2011 Diciembre 2011
3 5 Investigar la posibilidad de convertir la herramienta elegida en un módulo
Investigar la posibilidad de convertir la herramienta elegida en un módulo para su compilación junto con el software.
Marzo 2011 Marzo 2011
4 5 Aplicar la herramienta a algunos ejemplos
Aplicar la herramienta a algunos ejemplos de los textos y evaluar su desempeño.
Marzo 2011 Abril 2011
5 5 Desarrollar manualmente unos ejemplos de los grafos conceptuales
Desarrollar manualmente unos ejemplos de los grafos conceptuales para la evaluación.
Marzo 2011 Abril 2011
6 10 Ponderar los fragmentos de los grafos conceptuales
Desarrollar el modelo de ponderación de los fragmentos de los grafos conceptuales según su importancia
Mayo 2011 Junio 2011
7 5 Operación de Generalización
Desarrollar e implementar el algoritmo que realiza la Operación de Generalización
Mayo 2011 Junio 2011
8 5 Operación de Unión
Desarrollar e implementar el algoritmo que realiza la Operación de Unión
Mayo 2011 Junio 2011
9 5 Operación de Inclusión
Desarrollar e implementar el algoritmo que realiza la Operación de Inclusión
Mayo 2011 Junio 2011
10 5 Operación de Intersección
Desarrollar e implementar el algoritmo que realiza la Operación de Intersección
Mayo 2011 Junio 2011
11 5 Operación de Eliminación o poda
Desarrollar e implementar el algoritmo que realiza la Operación de Eliminación
Junio 2011 Julio 2011
12 10 Desarrollar una interfaz para la evaluación del método
Desarrollo de la estrategia de presentación de los datos e interacción con el usuario, su implementación
Agosto 2011 Septiembre 2011
13 5 Preparar un conjunto de textos de prueba.
Buscar y seleccionar los textos cortos con ciertas características. Describirlos.
Septiembre 2011 Octubre 2011
14 5 Seleccionar la medida de evaluación de los resultados
Entre las medidas disponibles para medir la calidad de resúmenes seleccionar alguna que se aplicará.
Septiembre 2011 Octubre 2011
15 5 Aplicar el método desarrollado a los datos preparados.
Realizar el procedimiento de aplicación del método desarrollado a los textos seleccionados
Octubre 2011 Noviembre 2011
16 10 Evaluar los resultados
Realizar la comparación con un estándar utilizando la métrica seleccionada
Noviembre 2011 Diciembre 2011
Porcentaje: 100 %

Nota: La planeación debe hacerse de acuerdo a las actividades del año actual (sumando 100 %), incluso si el proyecto es a mediano plazo.

  6. Presupuesto

Capítulo Descripción / Concepto Total
(Pesos)
2000  Compra de partes de las computadoras (memorias, discos duros, etc.) para mejorar el equipo existente (50,000 pesos). 28000   
3000  Para la asistencia a un congreso internacional para presentar los resultados del proyecto 15000   
4000      
5000      
7000  Para la asistencia de los estudiantes a los congresos nacionales e internacionales para presentar los resultados del proyecto 15000   
Total:  $ 58000