FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CAR�TULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32� Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
 
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO PARA PROYECTOS DE INVESTIGACI�N

PROYECTO INDIVIDUAL   X   CORTO PLAZO   X  
PROYECTO EN PROGRAMA ESPECIAL      
PROYECTO DE INNOVACIÓN      
PROYECTO MULTIDISCIPLINARIO       MEDIANO PLAZO    
PROYECTO TRANSDISCIPLINARIO      
PROYECTO DE RED      
PROPUESTA DE ESTUDIO      
Informaci�n General del Proyecto de Investigaci�n
  CIC    Laboratorio de Lenguaje Natural y Procesamiento de Texto 
Escuela, Centro o Unidad Secci�n. Divisi�n o Departamento
T�tulo
Aplicaciones de redes neuronales convolucionales al análisis de redes sociales

Registro asignado por la SIP:  20172008     
Datos del director(a) del Proyecto de investigaci�n:
  Gelbukh     -     Alexander  
Apellido Paterno Apellido Materno Nombres
Tipo de plaza en el IPN:  Titular C - (BASE)  Grado acad�mico:  Doctorado 
Horas de nombramiento:  40  RFC:  GEAL620912  CURP:  GEXA620912HNELXL08 
SNI:  III  BECAS: COFAA  IV  EDD  ---  EDI  IX  (Indicar nivel)
Tel�fono oficina (Ext):  56544  Correo electrónico Tel�fono particular:  55-1810-4587 
Nivel acad�mico en el que se realizar� el Proyecto de Investigaci�n:
Medio Superior         Superior         Posgrado    X   
Ubique su propuesta solamente en uno de los campos que a continuaci�n se enuncian:
Ingenier�a y Tecnología     X    Ciencias Sociales         
Ciencias Naturales          Ciencias Agr�colas         
Ciencias M�dicas          Humanidades         
Educación         
Clasificaci�n CONACyT:
Sector:   Sector Comunicaciones y Transportes  
Subsector:   Fomento a la integración de servicios y acceso a las nuevas tecnologías de la información                                                                         
Tipos de investigaci�n:
B�sica     X    Aplicada          Autoequipamiento         
Desarrollo Tecnol�gico          Educativa           
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género      Sustentabilidad     
Ninguno   X
Red a la que pertenece ó podría pertenecer el proyecto:   ---  
¿A que tipo de investigación pertenece su proyecto?:
Investigación Científica     X    Investigación Tecnológica        
¿A que tipo de avance contribuye su proyecto? :
Avance del conocimiento:        Desarrollo de la enseñanza:        Aprovechamiento de los recursos naturales y materiales:       
Scopus:   ---  
Orcid:   ---  
  Alexander Gelbukh -                                             
Director(a) del Proyecto de
Investigaci�n
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El t�tulo deber� ser breve, conciso y representativo del tema central de investigaci�n


La presentaci�n deber� hacerse de acuerdo a la siguiente estructura:

1. Descripci�n del proyecto
1.1 Resumen
El análisis de redes sociales o minería de opiniones, ha atraído recientemente mucha atención de la academia y la industria, debido a su importancia para la economía y política. Su tarea principal es la detección, extracción y análisis de las tendencias masivas de opiniones en las redes sociales, tales como Facebook o Twitter, sobre un producto, servicio o asunto. Tal análisis proviene aumento significativo de los ingresos de las empresas y mejoras importantes de nivel de vida para todos nosotros, compradores de productos y usuarios de servicios.

Este tipo de análisis usa una gran gama de tecnologías, tales como el procesamiento del lenguaje natural, análisis psicológico y de tipo de personalidad, análisis de tendencias con el tiempo (usando series de tiempo y medidas de asociación) y de las relaciones entre usuarios (usando el análisis de grafos). Con el aumento considerablemente del número de reseñas en forma de video, requiere procesamiento multimodal. Los participantes de este proyecto tenemos amplia experiencia en las tecnologías mencionadas y su aplicación al análisis de las emociones y las opiniones, demostrada a través de publicaciones de alto nivel.

En el proyecto aplicaremos las tecnologías del aprendizaje profundo y las tecnologías del análisis lingüístico y del análisis de series de tiempo y medidas de asociación, abordando principalmente el análisis de texto, pero expandiéndolo también al análisis multimodal. Entre los aspectos a atender en este proyecto serán también aspectos externos a la semántica de los textos, tales como la correlación de los temas mencionados en los mensajes con las tendencias del mercado económico y financiero, la detección de opiniones falsificadas o mentirosas con la tecnología de redes neuronales convolucionales y la determinación de perfil social del usuario, tal como su lenguaje nativo o su tipo de personalidad.

1.2 Objetivo general
Desarrollar los métodos para varios aspectos del análisis de redes sociales y minería de opiniones usando las redes neuronales convolucionales y técnicas del análisis de series de tiempo y del procesamiento del lenguaje natural

1.3 Objetivos específicos
1. Desarrollar arquitectura de red neuronal convolucional adecuada para el análisis de texto.
2. Desarrollar métodos para la detección de opiniones mentirosos en texto, determinación del tipo de personalidad en el texto, análisis multimodal de sentimiento e interpretación del contenido semántico en redes sociales.
3. Aplicar los métodos desarrollados a los datos disponibles de redes sociales par

2. Subproductos comprometidos
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   5 
Congresos  0   1  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   2 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   1 
Medio       Superior Posgrado
Tesistas  0   0   5 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   3 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos a�o 2
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos a�o 3
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
 3. Monto y distribuci�n del presupuesto solicitado (anexar): honorarios (s�lo centros for�neos), materiales y suministros, servicios generales y equipamiento (anexar cotizaci�n)

3.1 �Ha participado en convocatorias externas al Instituto para el financiamiento de proyectos de investigaci�n?
No    X   Si        Nombre de la convocatoria       

4. Recursos humanos. Investigadores y alumnos participantes.

  4.1 Investigadores participantes

N�mero Nombre Actividad espec�fica a desarrollar
1 Alexander Gelbukh - Director del proyecto
2 Olga Kolesnikova -
  
Desarrollo de los métodos de análisis semántico de texto usando semántica distribucional y análisis de colocaciones.
3 Ildar Batyrshin -
  
Desarrollo de los métodos de análisis de series de tiempo y medidas de asociación.
4 Liliana Chanona Hernández
  
Desarrollo de los métodos de perfilado del autor y análisis lingüístico de textos en redes sociales.
5 Grigori Sidorov -
  
Desarrollo de los métodos para la combinación del conocimiento lingüístico con aprendizaje de máquina y sus aplicaciones a las tareas de clasificación de textos y perfilado de autor.


  4.2 Alumnos participantes

N�mero Nombre Status* Actividad espec�fica a desarrollar
1 Diego Aguilar Mayen TS Implementación de los métodos de análisis de series de tiempo requeridos para el proyecto.
2 José Adriel Alonso Castro TS Implementación de los métodos lingüísticos del análisis de texto con aplicación a los textos de redes sociales.
3 Iqra Ameer . TS Implementación de los métodos de clasificación de los mensajes en redes sociales usando aprendizaje automático.
4 Vanessa Camacho Vázquez TS Detección de emociones y tendencias negativas en los intercambios de mensajes en las redes sociales.
5 Eduardo Cueto Mendoza TS Implementación de los métodos de análisis comparativo de series de tiempo con aplicación a redes sociales.
6 CAROLINA FOCIL ARIAS PF Participación en metas.
7 Carolina Fócil Arias TS Implementación de los métodos de análisis psicométrico para la determinación del estado mental del usuario.
8 Roddy Fuentes Alba TS Implementación de los módulos de aprendizaje profundo requeridos para el proyecto.
9 Francisco Javier García López TS Desarrollo de medidas de asociación para las series de tiempo, con aplicación al análisis de noticias.
10 Helena Monserrat Gómez Adorno TS Desarrollo de los métodos para el perfilado de autor, incluida la determinación de su lenguaje natal.
11 Navonil Majumder . TS Desarrollo de arquitecturas novedosas de redes convolucionales con aplicación al análisis de texto y la detección de opiniones falsas y texto mentiroso.
12 NAVONIL MAJUMDER . PF Participación en metas.
13 NAVONIL MAJUMDER . PF Participación en metas.
14 Sergio Andrés Mancera Nomesque TS Desarrollo de medidas de similitud entre textos para su clasificación, basadas en el lenguaje de redes universal (UNL).
15 Ilia Markov . TS Implementación de los métodos de perfilado de autor y determinación e interpretación de su grupo social.
16 Yarik Menchaca Reséndiz TS Implementación de los métodos de análisis de polaridad y sentimiento en el texto.
17 Fernando Monroy Tenorio TS Implementación y comparación de varias medidas de asociación en las series de tiempo.
18 Francisco Ortigoza García TS Implementación del procedimiento de colección de datos
19 ALINA MARIANA PEREZ SOBERANES PF Participación en metas.
20 Iván Ramírez Mejía TS Implementación de métodos de comparación cualitativa de series de teimpo.
21 Steffy Mónica Robles Ruíz TS Participación en la colección de datos para el entrenamiento
22 Eduardo René Rodríguez Ávila TS Desarrollo de los métodos del estudio de tendencias del mercado usando el análisis de los textos de las noticias.
23 MIGUEL ANGEL SANCHEZ PEREZ PF Participación en metas.
24 Miguel Ángel Sánchez Pérez TS Desarrollo de los métodos de análisis de grafos y medidas de similitud semántica entre textos.
25 Francisco Gabriel Sandoval Flores TS Desarrollo de los métodos de interpretación de texto con aplicaciones al análisis de situación criminalística.
26 Jorge Luis Zúñiga Hernández TS Implementación de los métodos para la aplicación del análisis de series de tiempo al análisis de redes sociales.

  * PIFIS(PF), Servicio Social (SS), Tesistas (TS), Pr�cticas Profesionales (PP), Alumnos Participantes (AP)

 5.Programaci�n de Actividades de Investigaci�n   

N�mero
de meta
Valor % de
cada meta
Descripci�n de actividades Mes de inicio Mes de terminaci�n
1 10 Investigación bibliográfica
Estudio detallado sobre los aspectos relevantes de las redes neuronales profundas, series de tiempo y aplicaciones del procesamiento del lenguaje natural al análisis de textos en redes sociales
Enero 2017 Enero 2017
2 5 Preparación de recursos léxicos
Preparación de los conjuntos de datos para el entrenamiento y prueba de los métodos de aprendizaje de máquina, con el contenido extraídos de las redes sociales
Febrero 2017 Febrero 2017
3 10 Desarrollo de arquitectura de red neuronal
Desarrollo de arquitectura de la red neuronal convolucional adecuada para la representación de la estructura jerárquica del texto en lenguaje natural
Marzo 2017 Marzo 2017
4 10 Implementación de la red neuronal
Implementación y pruebas de la red neuronal convolucional desarrollada en la actividad anterior para la experimentación con su desempeño sobre el texto
Abril 2017 Abril 2017
5 5 Adaptación de la red neuronal al procesamiento paralelo
Adaptación de la implementación que resultará de la actividad anterior, al procesamiento paralelo en la unidad gráfica de la computadora, con el uso de bibliotecas disponibles
Mayo 2017 Mayo 2017
6 5 Desarrollo de métodos de análisis de texto y multimodal
Desarrollo y mejoras de los métodos de análisis de texto necesarios para el proyecto, así como del análisis de datos multimodales
Junio 2017 Junio 2017
7 10 Aplicación a los textos extraídos de las redes sociales
Aplicación de los métodos y herramientas desarrollados en las actividades anteriores a los conjuntos de datos extraídos de las redes sociales y el estudio de su desempeño
Julio 2017 Julio 2017
8 10 Desarrollo de medidas de asociación en series de tiempo
Desarrollo de las medidas de asociación entre series de tiempo adecuadas para el análisis de comportamiento de temas de interés principal en los mensajes de redes sociales
Agosto 2017 Agosto 2017
9 5 Aplicación de las medidas de asociación a las redes sociales
Implementación y aplicación de las medidas desarrolladas en las actividades anteriores a los datos temporales extraídos de los textos de noticias y mensajes en las redes sociales
Septiembre 2017 Septiembre 2017
10 10 Evaluación
Evaluación de los métodos desarrollados en las actividades anteriores y su comparación con el estado del arte, con análisis de fortalezas y debilidades de los métodos desarrollados
Octubre 2017 Octubre 2017
11 10 Ajustes
Aplicación de los ajustes necesarios determinados en el proceso de evaluación, y evaluación de los métodos mejorados y su comparación con el estado del arte en el área
Noviembre 2017 Noviembre 2017
12 10 Documentación
Elaboración del informe del proyecto y preparación de las publicaciones y los tesis que reflejarán los resultados del proyecto
Diciembre 2017 Diciembre 2017
Porcentaje: 100 %

Nota: La planeaci�n debe hacerse de acuerdo a las actividades del a�o actual (sumando 100 %), incluso si el proyecto es a mediano plazo.

  6. Presupuesto Solicitado (para 2024 solo aplica capítulo 4000)

Cap�tulo Descripci�n / Concepto Total
(Pesos)
2000  Dos tarjetas gráficas GPU para el procesamiento paralelo de datos en redes neuronales. Actualización de equipos de cómputo para los estudiantes participantes (memorias, discos). Discos para el procesamiento masivo y resguardo de los datos. Tóner para impresiones. Compra de libros. 65000   
3000  Se prevé una estancia de investigación en el extranjero. Además, se prevé la presentación de los resultados del proyecto en los congresos CICLing, MICAI o equivalentes, indizados en el Índice de congresos de ISI Thomson. 30000   
4000  Los alumnos participantes del proyecto asistirán a los congresos internacionales de alto prestigio. Considerando 2 alumnos, con el costo de inscripción de 2500 pesos. 5000   
5000      
7000      
Total:  $ 100000