FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CARÁTULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32º Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
 
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO PARA PROYECTOS DE INVESTIGACIÓN
(Enero 2016 - Diciembre 2016)

PROYECTO INDIVIDUAL   X   CORTO PLAZO   X  
PROYECTO EN PROGRAMA ESPECIAL      
PROYECTO DE INNOVACIÓN      
PROYECTO MULTIDISCIPLINARIO       MEDIANO PLAZO    
PROYECTO TRANSDISCIPLINARIO      
PROYECTO DE RED      
Información General del Proyecto de Investigación
  CIC    Laboratorio de Lenguaje Natural y Procesamiento de Texto 
Escuela, Centro o Unidad Sección. División o Departamento
Título
Tratamiento computacional de afectividad en el texto y en la música

Registro asignado por la SIP:  20161958     
Datos del director(a) del Proyecto de investigación:
  Gelbukh     -     Alexander  
Apellido Paterno Apellido Materno Nombres
Tipo de plaza en el IPN:  Titular C - (BASE)  Grado académico:  Doctorado 
Horas de nombramiento:  40  RFC:  GEAL620912  CURP:  GEXA620912HNELXL08 
SNI:  II  BECAS: COFAA  IV  EDD  ---  EDI  IX  (Indicar nivel)
Teléfono oficina (Ext):  56544  Teléfono particular:  55-1810-4587 
Nivel académico en el que se realizará el Proyecto de Investigación:
Medio Superior         Superior         Posgrado    X   
Ubique su propuesta solamente en uno de los campos que a continuación se enuncian:
Ingeniería y Tecnología          Ciencias Sociales         
Ciencias Naturales          Ciencias Agrícolas         
Ciencias Médicas          Humanidades     X   
Clasificación CONACyT:
Sector:   Sector Educación  
Subsector:   Formación de recursos humanos de alto nivel  
Tipos de investigación:
Básica     X    Aplicada          Autoequipamiento         
Desarrollo Tecnológico          Educativa           
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género      Sustentabilidad     Ninguno  X
  Alexander Gelbukh -                                             
Director(a) del Proyecto de
Investigación
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El título deberá ser breve, conciso y representativo del tema central de investigación


La presentación deberá hacerse de acuerdo a la siguiente estructura:

1. Descripción del proyecto
1.1 Resumen
La computación afectiva y el tratamiento computacional de estilo y subjetividad en las redes sociales atraen gran atención de los investigadores y de la industria en los años recientes. Las emociones y sentimientos es lo básico de la naturaleza humana, y su tratamiento computacional tiene muchas aplicaciones en el comercio electrónico (sistemas de recomendación), educación (tutores inteligentes), política (detección de la opinión pública), ciencia forense (detección de plagio y autoría), salud y otros sectores. En el proyecto se desarrollarán métodos para el análisis del lenguaje que mejorarán la precisión de la detección de emociones y sentimientos en el lenguaje, con el énfasis en las técnicas de aprendizaje profundo con redes neuronales. Se espera desarrollar una arquitectura de la red neuronal profunda que tome en cuenta las relaciones sintácticas y semánticas de las palabras, con el fin de detectar las emociones, la polaridad de opiniones (emoción positiva o negativa) y los aspectos de opinión en el texto (sobre qué cosa o aspecto de la cosa se expresa la opinión). Además, se desarrollarán los métodos auxiliares, recursos léxicos y gramaticales necesarios para la correcta clasificación de los sentimientos, según sea necesario, con aplicaciones a tareas relacionadas tales como el análisis de estilo y autoría, generación de resumenes y análisis de textos educativos. En la segunda fase del proyecto, los métodos lingüísticos de gramáticas formales se aplicarán a tal actividad humana afectiva como la música, con el propósito de generación automática de la música con una jerarquía de las gramáticas formales, metodología que todavía no ha sido explorada en las aproximaciones existentes y por lo tanto es muy novedosa. El proyecto es basado en una amplia experiencia de los participantes en los temas correspondientes, expresada en publicaciones recientes y tesis dirigidas.

1.2 Objetivo general
Desarrollar las técnicas para la detección de afectividad (sentimientos, emociones y polaridad) en el lenguaje usando métodos de aprendizaje automático, así como aplicar los métodos lingüísticos a la generación automática de música.

1.3 Objetivos específicos
1. Investigar los efectos de la estructura sintáctica y las relaciones semánticas a la clasificación de polaridad y emociones.

2. Desarrollar los métodos de aprendizaje automático basados en redes neuronales profundas para modelar la afectividad en el lenguaje humano.

3. Aplicar los métodos desarrollados a los conjuntos de datos de referencia, con el propósito de evaluar su rendimiento.

4

2. Subproductos comprometidos
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos año 2
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos año 3
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
 3. Monto y distribución del presupuesto solicitado (anexar): honorarios (sólo centros foráneos), materiales y suministros, servicios generales y equipamiento (anexar cotización)

3.1 ¿Cuenta con financiamiento externo?
No    X   Si               

4. Recursos humanos. Investigadores y alumnos participantes.

  4.1 Investigadores participantes

Número Nombre Actividad específica a desarrollar
1 Alexander Gelbukh - Director del proyecto
2 Sofia Galicia Haro
  
SNI 1. Desarrollo de las técnicas de análisis de textos orientadas a la detección de la polaridad, afectividad y emociones.
3 Ildar Batyrshin .
  
SNI 2. Desarrollo de las técnicas para el aprendizaje automático orientadas a las tareas de detección de afectividad, estilo y autoría.
4 Olga Kolesnikova .
  
SNI 1. Desarrollo de los recursos léxicos y aplicaciones del conocimientos lingüístico en el análisis de texto.
5 Francisco Hiram Calvo Castro
  
SNI 1. Desarrollo de las técnicas de generación de música y de análisis de afectividad en el lenguaje usando información sintáctica.


  4.2 Alumnos participantes

Número Nombre Status* Actividad específica a desarrollar
1 Jesús Alexander Alvarado Gutiérrez TS Desarrollo e implementación de los métodos para el análisis de los contenidos educativos.
2 Hugo Michel Barbosa López SS Participación en la implementación de la conversión de la estructura sintáctica al conjunto de n-gramas sintácticos para la detección de polaridad en los textos
3 Claudia Jeanneth Becerra Cortés TS Desarrollo de aplicaciones a los sistemas de recomendación.
4 Vanessa Camacho Vázquez TS Desarrollo e implementación de los métodos para la detección de emociones negativas en las redes sociales.
5 Pabel Carrillo Mendoza TS Desarrollo e implementación de los métodos para la generación de resúmenes de múltiples documentos usando grafos.
6 Mauricio Cervantes Delgadillo SS Participación en la implementación de la adaptación de la estructura sintáctica al vector de rasgos para análisis de polaridad con una red neuronal convolucional
7 CAROLINA FOCIL ARIAS PF participación en metas
8 Carolina Fócil Arias TS Desarrollo de la metodología de aplicaciones a los textos médicos y de sector salud.
9 Helena Montserrat Gómez Adorno TS Desarrollo e implementación de los métodos de análisis de textos con aplicaciones a respuesta automática a preguntas.
10 Navonil Majumder  TS Desarrollo e implementación de las técnicas del aprendizaje neuronal profundo aplicadas a la clasificación de polaridad.
11 YARIK MENCHACA RESENDIZ PF participación en metas
12 Yarik Menchaca Reséndiz TS Implementación de las técnicas de generación automática de resumenes.
13 Fernando Monroy Tenorio TS Implementación de los métodos para la comparación de textos usando medidas de asociación en escalas bipolares.
14 Soujanya Poria  TS Desarrollo e implementación de las técnicas de análisis de emociones y sentimentos usando redes neuronales profundas.
15 Juan Pablo Pozadas Durán TS Desarrollo e implementación de los métodos para el análisis del estilo personal y la detección de autoría de los textos.
16 Rodrigo Gabino Ramírez Moreno TS Desarrollo e implementación de los métodos para la generación de música usando una jerarquía de gramáticas formales.
17 MIGUEL ANGEL SANCHEZ PEREZ PF participación en metas
18 Miguel Ángel Sánchez Pérez TS Desarrollo e implementación de los métodos para la detección de perífrasis y plagio en los textos.

  * PIFIS(PF), Servicio Social (SS), Tesistas (TS), Prácticas Profesionales (PP), Alumnos Participantes (AP)

 5.Programación de Actividades de Investigación   (Enero 2016 - Diciembre 2016)

Número
de meta
Valor % de
cada meta
Descripción de actividades Mes de inicio Mes de terminación
1 10 Investigación bibliográfica
Un estudio detallado del estado del arte en la computación afectiva usando redes neuronales profundas y de la generción de la música
Enero 2016 Enero 2016
2 5 Desarrollo de los recursos léxicos
Compilación de los recursos léxicos necesarios y la adaptación de las gramáticas del método de los patrones lingüísticos
Febrero 2016 Febrero 2016
3 5 Estudio de las relaciones sintácticas
Estudio del uso de las relaciones sintácticas en la clasificación de sentimientos y polaridad
Marzo 2016 Marzo 2016
4 10 Desarrollo de la red neuronal
Desarrollo de la red neuronal para el procesamiento de los textos usando la información sintáctica
Abril 2016 Abril 2016
5 10 Desarrollo de gramáticas
Desarrollo de las gramáticas correspondientes a los instrumentos individuales para la generación de música
Mayo 2016 Mayo 2016
6 10 Desarrollo del método jerárquico
Desarrollo e implementación de la interacción jerárquica de las gramáticas para la generación de música
Junio 2016 Junio 2016
7 5 Evaluación de la generación de música
Formación de la muestra y el ejercicio de laencuesta entre los expertos, con su evaluación estadística
Julio 2016 Julio 2016
8 10 Aplicación a detección de autoría
Aplicación del análisis del estilo a la detección de autoría
Agosto 2016 Agosto 2016
9 10 Aplicación a los contenidos educativos
Desarrollo e implementación de las aplicaciones de los métodos del análisis de texto a los contenidos educativos
Septiembre 2016 Septiembre 2016
10 5 Evaluación de clasificación de polaridad
Evaluación de los métodos desarrollados para la clasificación de la polaridad en los textos usando un corpus de referencia.
Octubre 2016 Octubre 2016
11 10 Ajustes
Correcciones y ajustes a los métodos desarrollados según los resultados de evaluación.
Noviembre 2016 Noviembre 2016
12 10 Documentación
Elaboración del informe y las publicaciones según los resultados del proyecto
Diciembre 2016 Diciembre 2016
Porcentaje: 100 %

Nota: La planeación debe hacerse de acuerdo a las actividades del año actual (sumando 100 %), incluso si el proyecto es a mediano plazo.

  6. Presupuesto

Capítulo Descripción / Concepto Total
(Pesos)
2000  Actualización de equipos de cómputo para los estudiantes participantes (memorias, discos: 8 estudiantes x 5000 MN en memorias y discos). Discos para el resguardo de los datos. Tóner para impresiones. Compra de libros. 63000   
3000  Se prevé una estancia de investigación en el extranjero. Además, se prevé la presentación de los resultados del proyecto en los congresos CICLing, MICAI o equivalentes, indizados en el Índice de congresos de ISI Thomson. 25000   
4000  Los alumnos participantes del proyecto asistirán a los congresos internacionales de alto prestigio. Considerando 2 alumnos, con el costo de inscripción de 300 dólares, son 600 dólares = 12000 MN. 12000   
5000      
7000      
Total:  $ 100000