FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CARÁTULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32º Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
 
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO PARA PROYECTOS DE INVESTIGACIÓN

PROYECTO INDIVIDUAL   X   CORTO PLAZO   X  
PROYECTO EN PROGRAMA ESPECIAL      
PROYECTO DE INNOVACIÓN      
PROYECTO MULTIDISCIPLINARIO       MEDIANO PLAZO    
PROYECTO TRANSDISCIPLINARIO      
PROYECTO DE RED      
PROPUESTA DE ESTUDIO      
Información General del Proyecto de Investigación
  CIC    Depto de Ciencias en la Computación 
Escuela, Centro o Unidad Sección. División o Departamento
Título
Desarrollo de un corpus de textos marcado con emociones para el español y su evaluación

Registro asignado por la SIP:  20131441     
Datos del director(a) del Proyecto de investigación:
  Sidorov     -     Grigori  
Apellido Paterno Apellido Materno Nombres
Tipo de plaza en el IPN:  Titular C - (BASE)  Grado académico:  Doctorado 
Horas de nombramiento:  40  RFC:  SIGR651028  CURP:  SIXG651028HNEDXR09 
SNI:  III  BECAS: COFAA  IV  EDD  ---  EDI  IX  (Indicar nivel)
Teléfono oficina (Ext):  56518  Correo electrónico Teléfono particular:  5591887293 
Nivel académico en el que se realizará el Proyecto de Investigación:
Medio Superior         Superior         Posgrado    X   
Ubique su propuesta solamente en uno de los campos que a continuación se enuncian:
Ingeniería y Tecnología     X    Ciencias Sociales         
Ciencias Naturales          Ciencias Agrícolas         
Ciencias Médicas          Humanidades         
Educación         
Clasificación CONACyT:
Sector:   Otros  
Subsector:   Otros  
Tipos de investigación:
Básica     X    Aplicada          Autoequipamiento         
Desarrollo Tecnológico          Educativa           
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género      Sustentabilidad     Ninguno   
Objetivo de desarrollo sostenible:   ---  
Red a la que pertenece ó podría pertenecer el proyecto:   ---  
Scopus:   ---  
Orcid:   ---  
  Grigori Sidorov -                                             
Director(a) del Proyecto de
Investigación
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El título deberá ser breve, conciso y representativo del tema central de investigación


La presentación deberá hacerse de acuerdo a la siguiente estructura:

1. Descripción del proyecto
1.1 Resumen
En este proyecto se propondrá un método para la construcción de un corpus de textos marcado con emociones para el español y su evaluación. Se buscarán los textos en Internet, se marcarán de manera manual con las emociones básicas, se seleccionarán los evaluadores más concordantes (y sólo se quedarán esos evaluadores). Se compondrá el corpus marcado a nivel de oraciones. Después se aplicarán las herramientas de clasificación de textos, para evaluar si en este corpus se podrá realizar el reconocimiento de frases con una emoción específica.

1.2 Objetivo general
Desarrollar un método para la construcción de un corpus de textos marcado con emociones para el español, su implementación en software (prototipo), preparación de un corpus marcado, y realización de su evaluación empleando varios métodos de clasificación automática de textos.

1.3 Objetivos específicos
Método para la construcción de un corpus de textos marcado con emociones para el español, su implementación en software (prototipo), un corpus marcado con emociones, y su evaluación empleando varios métodos de clasificación automática de textos.

2. Subproductos comprometidos
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   1 
Congresos  0   1  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   1 
Medio       Superior Posgrado
Tesistas  0   0   1 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   3 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos año 2
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos año 3
Nacional Internacional Nacional Internacional
Artículo de Divulgación  0   0  Artículo Científico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invención  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
 3. Monto y distribución del presupuesto solicitado (anexar): honorarios (sólo centros foráneos), materiales y suministros, servicios generales y equipamiento (anexar cotización)

3.1 ¿Ha participado en convocatorias externas al Instituto para el financiamiento de proyectos de investigación?
No    X   Si        Nombre de la convocatoria       

4. Recursos humanos. Investigadores y alumnos participantes.

  4.1 Investigadores participantes

Número Nombre Actividad específica a desarrollar
1 Grigori Sidorov - Director del proyecto
2 Alexander Gelbukh -
  
Coordinación de esfuerzos de programación, ayuda en programación, ayuda en selección de la metodología de evaluación y desarrollo.
3 Obdulia Pichardo Lagunas
  
Supervisión de desarrollo de las técnicas de concordancia entre evaluadores. Selección de métodos de clasificación.


  4.2 Alumnos participantes

Número Nombre Status* Actividad específica a desarrollar
1 FRANCISCO ANTONIO CASTILLO VELASQUEZ PF Participación en metas.
2 Francisco Antonio Castillo Velásquez TS Marcación manual de los textos por los evaluadores.
Desarrollo del prototipo de software que realiza el procesamiento de los datos de evaluadores, mide la concordancia, y selecciona los evaluadores más concordantes.
3 Eduardo Cendejas Castro TS Apoyo en diseño de experimentos.
4 Ivan Omar Cruz García TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis.
5 Ismael Díaz Rangel TS Apoy en experimentos, disño de la métrica de concordancia, programación.
6 Martín Ibarra Romero TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis.
7 Alain Menchaca Reseéndiz TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis.
8 Sabino Miranda Jiménez TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis.
9 Juan Pablo Posadas Durán TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis.
10 Rodrigo Gabino Ramírez Moreno TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis.
11 Alexandra Roschina - TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis.
12 MIGUEL ANGEL SANCHEZ PEREZ PF Participación en metas.
13 Migel Ángel Sánchez Pérez TS Selección de las emociones que participan en la evaluación.
Selección de textos que conformarán el corpus.
Aplicación de los métodos de clasificación a los datos obtenidos.
14 FRANCISCO VIVEROS JIMENEZ PF Participación en metas.
15 Francisco Viveros Jiménez TS Desarrollo del método basado en el cálculo de concordancia entre los evaluadores.
Selección de los métodos de clasificación más relevantes.
16 Alisa Zhila - TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis.

  * PIFIS(PF), Servicio Social (SS), Tesistas (TS), Prácticas Profesionales (PP), Alumnos Participantes (AP)

 5.Programación de Actividades de Investigación   

Número
de meta
Valor % de
cada meta
Descripción de actividades Mes de inicio Mes de terminación
1 15 Desarrollo del método basado en el cálculo de concordancia entre los evaluadores
Investigar las medidas de concordancia existentes entre los evaluadores.
Considerar sus condiciones de aplicación y analizar varios ejemplos de sus aplicaciones.
Proponer una nueva medida de concordancia.
Enero 2013 Febrero 2013
2 5 Selección de las emociones que participan en la evaluación
Investigar las teorías de emociones existentes.
Investigar las emociones que se usan en los trabajos de la lingüística de corpus.
Seleccionar las emociones más utilizadas.
Febrero 2013 Marzo 2013
3 10 Selección de textos que conformarán el corpus
Considerar los textos de varios géneros que tengan emociones expresadas.
Seleccionar un género que tenga mayor número de emociones.
Buscaran entre los textos disponibles de este género y descargarlos.
Marzo 2013 Abril 2013
4 25 Marcación manual de los textos por los evaluadores.
Buscar las personas dispuestas a servir como evaluadores.
Desarrollar los criterios para los evaluadores.
Desarrollar el instructivo para la evaluación
Marzo 2013 Junio 2013
5 10 Preparación de publicaciones y reportes.
Preparar publicaciones y reportes.
Marzo 2013 Diciembre 2013
6 10 Desarrollo del prototipo de software que realiza el procesamiento de los datos d
Desarrollar el software que implementa el algoritmo de concordancia, la interfaz de usuario, los formatos de archivos de entrada y salida.
Mayo 2013 Junio 2013
7 5 Aplicación del prototipo de software a las evaluaciones obtenidas.
Aplicar el software desarrollado a los datos generados por el algoritmo.
Junio 2013 Junio 2013
8 5 Generación de los archivos de entrada para los clasificadores automáticos.
Generar los archivos de salida del algoritmo que al mismo tiempo serán los archivos de entrada de los clasificadores automáticos, algoritmos de Weka
Julio 2013 Julio 2013
9 5 Selección de los métodos de clasificación más relevantes.
Probar varios algoritmos disponibles en la herramienta de clasificación y seleccionar 3-4 algoritmos con el mejor desempeño.
Agosto 2013 Agosto 2013
10 5 Aplicación de los métodos de clasificación a los datos obtenidos.
Desarrollar los filtros para los archivos de entrada de clasificadores.
Aplicar los clasificadores a los datos obtenidos.
Agosto 2013 Septiembre 2013
11 5 Análisis de las métricas de evaluación de los resultados.
Analizar las métricas de evaluación disponibles en la herramienta de clasificación.
Comparar los resultados de varios clasificadores
Octubre 2013 Noviembre 2013
Porcentaje: 100 %

Nota: La planeación debe hacerse de acuerdo a las actividades del año actual (sumando 100 %), incluso si el proyecto es a mediano plazo.

  6. Presupuesto Solicitado (para 2024 solo aplica capítulo 4000)

Capítulo Descripción / Concepto Total
(Pesos)
2000  Compra de partes de las computadoras (memorias, discos duros, etc.) para mejorar el equipo existente. 45000   
3000  Para la asistencia a un congreso internacional para presentar los resultados del proyecto, envio de materiales relacionados con el proyecto 6500   
4000  Para la asistencia de los estudiantes a los congresos nacionales e internacionales para presentar los resultados del proyecto 15000   
5000      
7000      
Total:  $ 66500   

Dictamen del Proyecto:
                                             Aprobado