FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CAR�TULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32� Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
 
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO PARA PROYECTOS DE INVESTIGACI�N

PROYECTO INDIVIDUAL   X   CORTO PLAZO   X  
PROYECTO EN PROGRAMA ESPECIAL      
PROYECTO DE INNOVACIÓN      
PROYECTO MULTIDISCIPLINARIO       MEDIANO PLAZO    
PROYECTO TRANSDISCIPLINARIO      
PROYECTO DE RED      
PROPUESTA DE ESTUDIO      
Informaci�n General del Proyecto de Investigaci�n
  CIC    Laboratorio de Lenguaje Natural y Procesamiento de Texto 
Escuela, Centro o Unidad Secci�n. Divisi�n o Departamento
T�tulo
Tratamiento computacional de afectividad en el texto y en la música

Registro asignado por la SIP:  20161958     
Datos del director(a) del Proyecto de investigaci�n:
  Gelbukh     -     Alexander  
Apellido Paterno Apellido Materno Nombres
Tipo de plaza en el IPN:  Titular C - (BASE)  Grado acad�mico:  Doctorado 
Horas de nombramiento:  40  RFC:  GEAL620912  CURP:  GEXA620912HNELXL08 
SNI:  III  BECAS: COFAA  IV  EDD  ---  EDI  IX  (Indicar nivel)
Tel�fono oficina (Ext):  56544  Correo electrónico Tel�fono particular:  55-1810-4587 
Nivel acad�mico en el que se realizar� el Proyecto de Investigaci�n:
Medio Superior         Superior         Posgrado    X   
Ubique su propuesta solamente en uno de los campos que a continuaci�n se enuncian:
Ingenier�a y Tecnología          Ciencias Sociales         
Ciencias Naturales          Ciencias Agr�colas         
Ciencias M�dicas          Humanidades     X   
Educación         
Clasificaci�n CONACyT:
Sector:   Sector Educación  
Subsector:   Formación de recursos humanos de alto nivel                                                                                                                       
Tipos de investigaci�n:
B�sica     X    Aplicada          Autoequipamiento         
Desarrollo Tecnol�gico          Educativa           
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género      Sustentabilidad     
Ninguno   X
Red a la que pertenece ó podría pertenecer el proyecto:   ---  
¿A que tipo de investigación pertenece su proyecto?:
Investigación Científica          Investigación Tecnológica        
¿A que tipo de avance contribuye su proyecto? :
Avance del conocimiento:        Desarrollo de la enseñanza:        Aprovechamiento de los recursos naturales y materiales:       
Scopus:   ---  
Orcid:   ---  
  Alexander Gelbukh -                                             
Director(a) del Proyecto de
Investigaci�n
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El t�tulo deber� ser breve, conciso y representativo del tema central de investigaci�n


La presentaci�n deber� hacerse de acuerdo a la siguiente estructura:

1. Descripci�n del proyecto
1.1 Resumen
La computación afectiva y el tratamiento computacional de estilo y subjetividad en las redes sociales atraen gran atención de los investigadores y de la industria en los años recientes. Las emociones y sentimientos es lo básico de la naturaleza humana, y su tratamiento computacional tiene muchas aplicaciones en el comercio electrónico (sistemas de recomendación), educación (tutores inteligentes), política (detección de la opinión pública), ciencia forense (detección de plagio y autoría), salud y otros sectores. En el proyecto se desarrollarán métodos para el análisis del lenguaje que mejorarán la precisión de la detección de emociones y sentimientos en el lenguaje, con el énfasis en las técnicas de aprendizaje profundo con redes neuronales. Se espera desarrollar una arquitectura de la red neuronal profunda que tome en cuenta las relaciones sintácticas y semánticas de las palabras, con el fin de detectar las emociones, la polaridad de opiniones (emoción positiva o negativa) y los aspectos de opinión en el texto (sobre qué cosa o aspecto de la cosa se expresa la opinión). Además, se desarrollarán los métodos auxiliares, recursos léxicos y gramaticales necesarios para la correcta clasificación de los sentimientos, según sea necesario, con aplicaciones a tareas relacionadas tales como el análisis de estilo y autoría, generación de resumenes y análisis de textos educativos. En la segunda fase del proyecto, los métodos lingüísticos de gramáticas formales se aplicarán a tal actividad humana afectiva como la música, con el propósito de generación automática de la música con una jerarquía de las gramáticas formales, metodología que todavía no ha sido explorada en las aproximaciones existentes y por lo tanto es muy novedosa. El proyecto es basado en una amplia experiencia de los participantes en los temas correspondientes, expresada en publicaciones recientes y tesis dirigidas.

1.2 Objetivo general
Desarrollar las técnicas para la detección de afectividad (sentimientos, emociones y polaridad) en el lenguaje usando métodos de aprendizaje automático, así como aplicar los métodos lingüísticos a la generación automática de música.

1.3 Objetivos específicos
1. Investigar los efectos de la estructura sintáctica y las relaciones semánticas a la clasificación de polaridad y emociones.

2. Desarrollar los métodos de aprendizaje automático basados en redes neuronales profundas para modelar la afectividad en el lenguaje humano.

3. Aplicar los métodos desarrollados a los conjuntos de datos de referencia, con el propósito de evaluar su rendimiento.

4

2. Subproductos comprometidos
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   5 
Congresos  1   0  Seminiarios  0   0 
Cursos  3   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  2   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   1 
Medio       Superior Posgrado
Tesistas  0   0   4 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   3 
Prestante de Servicio Social  2   0 
Otros (especificar)  0       
2. Subproductos comprometidos a�o 2
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos a�o 3
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
 3. Monto y distribuci�n del presupuesto solicitado (anexar): honorarios (s�lo centros for�neos), materiales y suministros, servicios generales y equipamiento (anexar cotizaci�n)

3.1 �Ha participado en convocatorias externas al Instituto para el financiamiento de proyectos de investigaci�n?
No    X   Si        Nombre de la convocatoria       

4. Recursos humanos. Investigadores y alumnos participantes.

  4.1 Investigadores participantes

N�mero Nombre Actividad espec�fica a desarrollar
1 Alexander Gelbukh - Director del proyecto
2 Sofia Galicia Haro
  
SNI 1. Desarrollo de las técnicas de análisis de textos orientadas a la detección de la polaridad, afectividad y emociones.
3 Ildar Batyrshin -
  
SNI 2. Desarrollo de las técnicas para el aprendizaje automático orientadas a las tareas de detección de afectividad, estilo y autoría.
4 Olga Kolesnikova -
  
SNI 1. Desarrollo de los recursos léxicos y aplicaciones del conocimientos lingüístico en el análisis de texto.
5 Francisco Hiram Calvo Castro
  
SNI 1. Desarrollo de las técnicas de generación de música y de análisis de afectividad en el lenguaje usando información sintáctica.


  4.2 Alumnos participantes

N�mero Nombre Status* Actividad espec�fica a desarrollar
1 Jesús Alexander Alvarado Gutiérrez TS Desarrollo e implementación de los métodos para el análisis de los contenidos educativos.
2 Hugo Michel Barbosa López SS Participación en la implementación de la conversión de la estructura sintáctica al conjunto de n-gramas sintácticos para la detección de polaridad en los textos
3 Claudia Jeanneth Becerra Cortés TS Desarrollo de aplicaciones a los sistemas de recomendación.
4 Vanessa Camacho Vázquez TS Desarrollo e implementación de los métodos para la detección de emociones negativas en las redes sociales.
5 Pabel Carrillo Mendoza TS Desarrollo e implementación de los métodos para la generación de resúmenes de múltiples documentos usando grafos.
6 Mauricio Cervantes Delgadillo SS Participación en la implementación de la adaptación de la estructura sintáctica al vector de rasgos para análisis de polaridad con una red neuronal convolucional
7 CAROLINA FOCIL ARIAS PF participación en metas
8 Carolina Fócil Arias TS Desarrollo de la metodología de aplicaciones a los textos médicos y de sector salud.
9 Helena Montserrat Gómez Adorno TS Desarrollo e implementación de los métodos de análisis de textos con aplicaciones a respuesta automática a preguntas.
10 Navonil Majumder  TS Desarrollo e implementación de las técnicas del aprendizaje neuronal profundo aplicadas a la clasificación de polaridad.
11 YARIK MENCHACA RESENDIZ PF participación en metas
12 Yarik Menchaca Reséndiz TS Implementación de las técnicas de generación automática de resumenes.
13 Fernando Monroy Tenorio TS Implementación de los métodos para la comparación de textos usando medidas de asociación en escalas bipolares.
14 Soujanya Poria  TS Desarrollo e implementación de las técnicas de análisis de emociones y sentimentos usando redes neuronales profundas.
15 Juan Pablo Pozadas Durán TS Desarrollo e implementación de los métodos para el análisis del estilo personal y la detección de autoría de los textos.
16 Rodrigo Gabino Ramírez Moreno TS Desarrollo e implementación de los métodos para la generación de música usando una jerarquía de gramáticas formales.
17 MIGUEL ANGEL SANCHEZ PEREZ PF participación en metas
18 Miguel Ángel Sánchez Pérez TS Desarrollo e implementación de los métodos para la detección de perífrasis y plagio en los textos.

  * PIFIS(PF), Servicio Social (SS), Tesistas (TS), Pr�cticas Profesionales (PP), Alumnos Participantes (AP)

 5.Programaci�n de Actividades de Investigaci�n   

N�mero
de meta
Valor % de
cada meta
Descripci�n de actividades Mes de inicio Mes de terminaci�n
1 10 Investigación bibliográfica
Un estudio detallado del estado del arte en la computación afectiva usando redes neuronales profundas y de la generción de la música
Enero 2016 Enero 2016
2 5 Desarrollo de los recursos léxicos
Compilación de los recursos léxicos necesarios y la adaptación de las gramáticas del método de los patrones lingüísticos
Febrero 2016 Febrero 2016
3 5 Estudio de las relaciones sintácticas
Estudio del uso de las relaciones sintácticas en la clasificación de sentimientos y polaridad
Marzo 2016 Marzo 2016
4 10 Desarrollo de la red neuronal
Desarrollo de la red neuronal para el procesamiento de los textos usando la información sintáctica
Abril 2016 Abril 2016
5 10 Desarrollo de gramáticas
Desarrollo de las gramáticas correspondientes a los instrumentos individuales para la generación de música
Mayo 2016 Mayo 2016
6 10 Desarrollo del método jerárquico
Desarrollo e implementación de la interacción jerárquica de las gramáticas para la generación de música
Junio 2016 Junio 2016
7 5 Evaluación de la generación de música
Formación de la muestra y el ejercicio de laencuesta entre los expertos, con su evaluación estadística
Julio 2016 Julio 2016
8 10 Aplicación a detección de autoría
Aplicación del análisis del estilo a la detección de autoría
Agosto 2016 Agosto 2016
9 10 Aplicación a los contenidos educativos
Desarrollo e implementación de las aplicaciones de los métodos del análisis de texto a los contenidos educativos
Septiembre 2016 Septiembre 2016
10 5 Evaluación de clasificación de polaridad
Evaluación de los métodos desarrollados para la clasificación de la polaridad en los textos usando un corpus de referencia.
Octubre 2016 Octubre 2016
11 10 Ajustes
Correcciones y ajustes a los métodos desarrollados según los resultados de evaluación.
Noviembre 2016 Noviembre 2016
12 10 Documentación
Elaboración del informe y las publicaciones según los resultados del proyecto
Diciembre 2016 Diciembre 2016
Porcentaje: 100 %

Nota: La planeaci�n debe hacerse de acuerdo a las actividades del a�o actual (sumando 100 %), incluso si el proyecto es a mediano plazo.

  6. Presupuesto Solicitado (para 2024 solo aplica capítulo 4000)

Cap�tulo Descripci�n / Concepto Total
(Pesos)
2000  Actualización de equipos de cómputo para los estudiantes participantes (memorias, discos: 8 estudiantes x 5000 MN en memorias y discos). Discos para el resguardo de los datos. Tóner para impresiones. Compra de libros. 63000   
3000  Se prevé una estancia de investigación en el extranjero. Además, se prevé la presentación de los resultados del proyecto en los congresos CICLing, MICAI o equivalentes, indizados en el Índice de congresos de ISI Thomson. 25000   
4000  Los alumnos participantes del proyecto asistirán a los congresos internacionales de alto prestigio. Considerando 2 alumnos, con el costo de inscripción de 300 dólares, son 600 dólares = 12000 MN. 12000   
5000      
7000      
Total:  $ 100000