FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CAR�TULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32� Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
INSTITUTO
POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO
PARA PROYECTOS DE INVESTIGACI�N
PROYECTO INDIVIDUAL
X
CORTO PLAZO
X
PROYECTO EN PROGRAMA ESPECIAL
PROYECTO DE INNOVACIÓN
PROYECTO MULTIDISCIPLINARIO
MEDIANO PLAZO
PROYECTO TRANSDISCIPLINARIO
PROYECTO DE RED
PROPUESTA DE ESTUDIO
Informaci�n General del Proyecto de Investigaci�n
CIC
Departamento de Ciencias de la Computación
Escuela, Centro o Unidad
Secci�n. Divisi�n o Departamento
Registro asignado por la SIP: 20171813
Datos del director(a) del Proyecto de investigaci�n:
Sidorov
-
Grigori
Apellido Paterno
Apellido Materno
Nombres
Tipo de plaza en el IPN: Titular C - (BASE)
Grado acad�mico: Doctorado
Horas de nombramiento: 40
RFC: SIGR651028
CURP: SIXG651028HNEDXR09
SNI: III
BECAS:
COFAA IV
EDD ---
EDI IX
(Indicar nivel)
Tel�fono oficina (Ext): 56518
Correo electrónico
Tel�fono particular: 5591887293
Nivel acad�mico en el que se realizar� el Proyecto de Investigaci�n:
Medio Superior
Superior
Posgrado
X
Ubique su propuesta solamente en uno de los campos que a continuaci�n se enuncian:
Ingenier�a y Tecnología
X
Ciencias Sociales
Ciencias Naturales
Ciencias Agr�colas
Ciencias M�dicas
Humanidades
Educación
Clasificaci�n CONACyT:
Sector: Sector Comunicaciones y Transportes
Subsector: Fomento a la integración de servicios y acceso a las nuevas tecnologías de la información
Tipos de investigaci�n:
B�sica
X
Aplicada
Autoequipamiento
Desarrollo Tecnol�gico
Educativa
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género
Sustentabilidad
Ninguno
X
Red a la que pertenece ó podría pertenecer el proyecto: ---
¿A que tipo de investigación pertenece su proyecto?:
Investigación Científica
X
Investigación Tecnológica
¿A que tipo de avance contribuye su proyecto? :
Avance del conocimiento:
Desarrollo de la enseñanza:
Aprovechamiento de los recursos naturales y materiales:
Scopus: ---
Orcid: ---
Grigori Sidorov -
Director(a) del Proyecto de
Investigaci�n
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El t�tulo deber� ser breve,
conciso y representativo del tema central de investigaci�n
La presentaci�n deber� hacerse
de acuerdo a la siguiente estructura:
1. Descripci�n del proyecto
2. Subproductos comprometidos
Nacional
Internacional
Nacional
Internacional
Art�culo de Divulgaci�n
0
0
Art�culo Cient�fico
0
1
Congresos
0
1
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invenci�n
0
0
Hardware
0
0
Software
0
1
Medio
Superior
Posgrado
Tesistas
0
0
3
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
3
Prestante de Servicio Social
0
0
Otros (especificar)
0
2. Subproductos comprometidos a�o 2
Nacional
Internacional
Nacional
Internacional
Art�culo de Divulgaci�n
0
0
Art�culo Cient�fico
0
0
Congresos
0
0
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invenci�n
0
0
Hardware
0
0
Software
0
0
Medio
Superior
Posgrado
Tesistas
0
0
0
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
0
Prestante de Servicio Social
0
0
Otros (especificar)
0
2. Subproductos comprometidos a�o 3
Nacional
Internacional
Nacional
Internacional
Art�culo de Divulgaci�n
0
0
Art�culo Cient�fico
0
0
Congresos
0
0
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invenci�n
0
0
Hardware
0
0
Software
0
0
Medio
Superior
Posgrado
Tesistas
0
0
0
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
0
Prestante de Servicio Social
0
0
Otros (especificar)
0
3. Monto y distribuci�n
del presupuesto solicitado (anexar): honorarios (s�lo centros
for�neos), materiales y suministros, servicios generales
y equipamiento (anexar cotizaci�n)
3.1 �Ha participado en convocatorias externas al Instituto
para el financiamiento de proyectos de investigaci�n?
No
X
Si
Nombre de la convocatoria
4. Recursos humanos. Investigadores y alumnos participantes.
4.1 Investigadores participantes
N�mero
Nombre
Actividad espec�fica a desarrollar
1
Grigori Sidorov -
Director del proyecto
2
Alexander Gelbukh -
Coordinación de aplicación de los métodos de aprendizaje automático.
3
Ildar Batyrshin -
Coordinación de esfuerzos de programación, ayuda en programación, ayuda en selección de la metodología de evaluación y desarrollo
4
Obdulia Pichardo Lagunas
Coordinación de desarrollo de software de obtención de n-gramas sintácticos continuos y no continuos de textos, de n-gramas de caracteres de diferentes tipos y de combinaciones de características.
5
Olga Kolesnikova -
Coordinación de desarrollo de construcción de n-gramas sintácticos, de n-gramas de caracteres de diferentes tipos y combinaciones de características
4.2 Alumnos participantes
N�mero
Nombre
Status*
Actividad espec�fica a desarrollar
1
Diego Aguilar Mayen
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
2
José Adriel Alonso Castro
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
3
Iqra Ameer
TS
Programación de herramientas, interfaces y algoritmos.
4
Vanessa Camacho Vasquez
TS
Preprocesamiento de los conjuntos de datos.
5
VANESSA ALEJANDRA CAMACHO VAZQUEZ
PF
Participación en metas.
Preprocesamiento de los conjuntos de datos.
6
Carolina Fócil Arias
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
7
Roddy Fuentes Alba
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
8
Francisco Javier García López
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
9
Helena Gomez Adorno
TS
Construcción de n-gramas sintácticos, de n-gramas de caracteres de diferentes tipos y de combinaciones de características.
Evaluación de los resultados en diferentes métricas.
10
HELENA MONTSERRAT GÓMEZ ADORNO
PF
Participación en metas.
Construcción de n-gramas sintácticos, de n-gramas de caracteres de diferentes tipos y de combinaciones de características.
11
Navonil Majumder .
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
12
Sergio Andrés Mancera Nomesque
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
13
Ilia Markov .
TS
Procesamiento sintáctico del conjunto de datos.
Aplicación del método desarrollado a los conjuntos de datos.
Experimentos con diferentes parámetros del método y diferentes métodos de clasificación.
14
ILIA MARKOV .
PF
Participación en metas.
Procesamiento sintáctico del conjunto de datos.
Aplicación del método desarrollado a los conjuntos de datos.
Experimentos con diferentes parámetros del método y diferentes métodos de clasificación.
15
CAROLINA MARTÍN DEL CAMPO RODRÍGUEZ
PF
Participación en metas.
Evaluación de los resultados en diferentes métricas.
16
B160623 Menchaca Reséndiz
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
17
Eduardo René Rodríguez Ávila
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
18
Miguel Ángel Sánchez Pérez
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
19
Jorge Luis Zúñiga Hernández
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
20
JORGE LUIS ZÚÑIGA HERNÁNDEZ
PF
Participación en metas.
Experimentos con selección de diferentes características y diferentes escalas de valores para la tarea seleccionada.
5.Programaci�n de Actividades de Investigaci�n
N�mero de meta
Valor % de cada meta
Descripci�n de actividades
Mes de inicio
Mes de terminaci�n
1
5
Obtención del conjunto de datos Escribir a los organizadores de la tarea de identificación de lenguaje nativo y solicitar los datos de la tarea. Los datos son ensayos escritos por hablantes de inglés no nativos como parte de una prueba de alto nivel de competencia general en inglés académico.
Enero 2017
Enero 2017
2
10
División de este conjunto de datos por tópicos Desarrollar un método que divide el conjunto de datos de la manera que los ensayos en diferentes tópicos forman conjuntos de entrenamiento y evaluación
Febrero 2017
Abril 2017
3
10
Preprocesamiento de estos conjuntos de datos Aplicar varios algoritmos de preprocesamiento de datos que permiten eliminar los elementos innecesarios o indeseables de los textos (ligas, stopwords, etc.).
Febrero 2017
Abril 2017
4
10
Procesamiento sintáctico de estos conjuntos de datos Instalar y aplicar a los textos el analizador sintáctico disponible para el inglés. Guardar los resultados de parseo en los archivos correspondientes
Febrero 2017
Abril 2017
5
10
Experimentos con diferentes parámetros del método y diferentes métodos de clasif Realizar experimentos con diferentes parámetros presentes en el método desarrollado utilizando también varios algoritmos de clasificación y agrupamiento.
Marzo 2017
Octubre 2017
6
10
Preparación de publicaciones y reportes Preparar publicaciones y reportes.
Marzo 2017
Diciembre 2017
7
10
Experimentos con selección de diferentes características y diferentes escalas de Realizar experimentos con selección de diferentes características de textos y diferentes valores de esas características (tf-idf, ganancia de información, con o sin normalización).
Abril 2017
Noviembre 2017
8
15
Construcción de los n-gramas sintácticos y los n-gramas de caracteres de diferen Desarrollar y aplicar los algoritmos de construcción de los n-gramas sintácticos a partir de los árboles sintácticos y de construcción de los n-gramas de caracteres de diferentes tipos. Desarrollar los algoritmos de extracción de características de los n-gramas sintácticos, de los n-gramas de caracteres y combinaciones de características
Abril 2017
Agosto 2017
9
10
Aplicación del método desarrollado a los conjuntos de datos. Aplicar el método desarrollado a los conjunto de datos: al conjunto original y al conjunto dividido por tópicos. Guardar los resultados en los archivos correspondientes
Julio 2017
Agosto 2017
10
5
Análisis de varias métricas de evaluación Considerar varias métricas de evaluación de resultados: precisión, exhaustividad, exactitud, medida F, c@.
Noviembre 2017
Diciembre 2017
11
5
Evaluación de los resultados en diferentes métricas Aplicar varias métricas de evaluación a los resultados obtenidos.
Noviembre 2017
Diciembre 2017
Porcentaje:
100 %
Nota: La planeaci�n debe hacerse de acuerdo a las actividades del a�o actual (sumando 100 %), incluso si el proyecto es a mediano plazo.
6. Presupuesto
Solicitado (para 2024 solo aplica capítulo 4000)
Cap�tulo
Descripci�n / Concepto
Total (Pesos)
2000
65,000 Compra de partes de las computadoras (memorias, discos duros, etc.) para mejorar el equipo existente
65000
3000
5,000 Para la asistencia a un congreso internacional para presentar los resultados del proyecto
30,000 Para publicacion de los resultados de proyectos en revistas