FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CAR�TULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32� Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
INSTITUTO
POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO
PARA PROYECTOS DE INVESTIGACI�N
PROYECTO INDIVIDUAL
X
CORTO PLAZO
X
PROYECTO EN PROGRAMA ESPECIAL
PROYECTO DE INNOVACIÓN
PROYECTO MULTIDISCIPLINARIO
MEDIANO PLAZO
PROYECTO TRANSDISCIPLINARIO
PROYECTO DE RED
PROPUESTA DE ESTUDIO
Informaci�n General del Proyecto de Investigaci�n
CIC
Departmento de Ciencias en la Computación
Escuela, Centro o Unidad
Secci�n. Divisi�n o Departamento
Registro asignado por la SIP: 20151406
Datos del director(a) del Proyecto de investigaci�n:
Sidorov
-
Grigori
Apellido Paterno
Apellido Materno
Nombres
Tipo de plaza en el IPN: Titular C - (BASE)
Grado acad�mico: Doctorado
Horas de nombramiento: 40
RFC: SIGR651028
CURP: SIXG651028HNEDXR09
SNI: III
BECAS:
COFAA IV
EDD ---
EDI IX
(Indicar nivel)
Tel�fono oficina (Ext): 56518
Correo electrónico
Tel�fono particular: 5591887293
Nivel acad�mico en el que se realizar� el Proyecto de Investigaci�n:
Medio Superior
Superior
Posgrado
X
Ubique su propuesta solamente en uno de los campos que a continuaci�n se enuncian:
Ingenier�a y Tecnología
X
Ciencias Sociales
Ciencias Naturales
Ciencias Agr�colas
Ciencias M�dicas
Humanidades
Educación
Clasificaci�n CONACyT:
Sector: Otros
Subsector: Otros
Tipos de investigaci�n:
B�sica
X
Aplicada
Autoequipamiento
Desarrollo Tecnol�gico
Educativa
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género
Sustentabilidad
Ninguno
X
Red a la que pertenece ó podría pertenecer el proyecto: ---
¿A que tipo de investigación pertenece su proyecto?:
Investigación Científica
X
Investigación Tecnológica
¿A que tipo de avance contribuye su proyecto? :
Avance del conocimiento:
Desarrollo de la enseñanza:
Aprovechamiento de los recursos naturales y materiales:
Scopus: ---
Orcid: ---
Grigori Sidorov -
Director(a) del Proyecto de
Investigaci�n
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El t�tulo deber� ser breve,
conciso y representativo del tema central de investigaci�n
La presentaci�n deber� hacerse
de acuerdo a la siguiente estructura:
1. Descripci�n del proyecto
2. Subproductos comprometidos
Nacional
Internacional
Nacional
Internacional
Art�culo de Divulgaci�n
0
0
Art�culo Cient�fico
0
1
Congresos
0
1
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invenci�n
0
0
Hardware
0
0
Software
1
1
Medio
Superior
Posgrado
Tesistas
0
0
2
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
2
Prestante de Servicio Social
0
0
Otros (especificar)
0
2. Subproductos comprometidos a�o 2
Nacional
Internacional
Nacional
Internacional
Art�culo de Divulgaci�n
0
0
Art�culo Cient�fico
0
0
Congresos
0
0
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invenci�n
0
0
Hardware
0
0
Software
0
0
Medio
Superior
Posgrado
Tesistas
0
0
0
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
0
Prestante de Servicio Social
0
0
Otros (especificar)
0
2. Subproductos comprometidos a�o 3
Nacional
Internacional
Nacional
Internacional
Art�culo de Divulgaci�n
0
0
Art�culo Cient�fico
0
0
Congresos
0
0
Seminiarios
0
0
Cursos
0
0
Manuales
0
0
Libros
0
0
Programa de Radio y TV
0
0
Conferencias o Ponencias
0
0
Piloto
Laboratorio
Piloto
Laboratorio
Proceso
0
0
Prototipo
0
0
Patente
0
0
Certificado de Invenci�n
0
0
Hardware
0
0
Software
0
0
Medio
Superior
Posgrado
Tesistas
0
0
0
Practicantes Profesionales
0
0
0
Alumnos PIFI
0
0
0
Prestante de Servicio Social
0
0
Otros (especificar)
0
3. Monto y distribuci�n
del presupuesto solicitado (anexar): honorarios (s�lo centros
for�neos), materiales y suministros, servicios generales
y equipamiento (anexar cotizaci�n)
3.1 �Ha participado en convocatorias externas al Instituto
para el financiamiento de proyectos de investigaci�n?
No
X
Si
Nombre de la convocatoria
4. Recursos humanos. Investigadores y alumnos participantes.
4.1 Investigadores participantes
N�mero
Nombre
Actividad espec�fica a desarrollar
1
Grigori Sidorov -
Director del proyecto
2
Ildar Batyrshin -
Coordinación de desarrollo del concepto para lenguajes de programación análogo a los n-gramas sintácticos en los lenguajes naturales
3
Aelxander Gelbukh -
Coordinación de esfuerzos de programación, ayuda en programación, ayuda en selección de la metodología de evaluación y desarrollo.
4
Obdulia Pichardo Lagunas
Coordinación de desarrollo de software de obtención de n-gramas tradicionales y n-gramas sintácticos continuos y no continuos aplicados a los códigos de programas. Coordinación de aplicación de los métodos de aprendizaje automático.
4.2 Alumnos participantes
N�mero
Nombre
Status*
Actividad espec�fica a desarrollar
1
José Adriel Alonso Castro
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
2
Vanessa Camacho Vazquez
TS
Selección de los métodos automáticos de clasificación más relevantes, análisis de sus implementaciones disponibles, y su implementación/inclusión en el software desarrollado.
Selección y preparación de la línea base.
3
VANESSA ALEJANDRA CAMACHO VAZQUEZ
PF
Participación en metas.
4
Vcitor Carrera Trejo
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
5
Helena Gomez Adorno
TS
Desarrollo de software de obtención de n-gramas tradicionales y n-gramas sintácticos continuos y no continuos para los códigos.
Generación de archivos de entrada para los clasificadores automáticos con varios parámetros, también tomando en cuenta reducción de dimensiones (tipo LSA).
6
HELENA MONTSERRAT GÓMEZ ADORNO
PF
Participación en metas.
7
Hugo Librado Jacobo
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
8
ILIA MARKOV
PF
Participación en metas.
9
Ilia Markov .
TS
Selección de códigos de programas en el lenguaje escogido y su marcación manual según las tareas que se resuelvan.
Análisis de las métricas de evaluación de los resultados y su aplicación
10
ILIA MARKOV .
PF
Participación en metas.
11
Fernando Monroy Tenorio
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
12
Juan Pablo Posadas Durán
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
13
Eduardo René Rodríguez Avila
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
14
Rodrigo Gabino Roriguez Moreno
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
15
Miguel Angel Sánchez Pérez
TS
Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
5.Programaci�n de Actividades de Investigaci�n
N�mero de meta
Valor % de cada meta
Descripci�n de actividades
Mes de inicio
Mes de terminaci�n
1
5
Selección de un lenguaje de programación (C, C++, Pascal, Karel, Java, Python, P Se analizarán varios lenguajes de programación desde el punto de vista de disponibilidad de un número significativo de programas, que resuelvan mismos problemas. Se seleccionará uno de los lenguajes.
Enero 2015
Enero 2015
2
15
Selección de códigos de programas en el lenguaje escogido y su marcación manual Se seleccionarán los códigos de varios programas disponibles libremente. Se realizará marcación manual de estos programas con las tareas que aquellos resuelvan
Febrero 2015
Abril 2015
3
10
Selección de los métodos automáticos de clasificación más relevantes Se seleccionarán o desarrollarán los métodos de clasificación automática, dependiendo de sus parámetros de uso y disponibilidad de su implementación. Se elegirán o se implementarán los métodos más relevantes
Febrero 2015
Abril 2015
4
15
Desarrollo del concepto para lenguajes de programación análogo a los n-gramas si Proponer y desarrollar el concepto para lenguajes de programación análogo a los n-gramas sintácticos en los lenguajes naturales (por ejemplo, el código dentro de los ciclos o condiciones), considerar ejemplos y metalenguaje.
Febrero 2015
Abril 2015
5
10
Selección y preparación de la línea base Analizar las posibilidades de seleccionar algún método sencillo y aplicarlo como línea base para posterior comparación.
Marzo 2015
Septiembre 2015
6
10
Preparación de publicaciones y reportes Preparación de publicaciones y reportes
Marzo 2015
Diciembre 2015
7
15
Desarrollo de software de obtención de n-gramas Se desarrollará un software que permite realizar el análisis de los datos y generar los n-gramas de varios tipos y de composición variada (palabras clave del lenguaje, nombres de variables, comentarios, caracteres, etc.). Es decir, se desarrollarán herramientas de extracción de las características de los códigos
Mayo 2015
Junio 2015
8
5
Generación de archivos de entrada para los clasificadores automáticos con varios Generar los archivos de salida del algoritmo de selección de características, que al mismo tiempo serán los archivos de entrada de los clasificadores automáticos. Considerar los algoritmos de Weka. Aplicar el software desarrollado a los datos generados por el algoritmo. Considerar también la reducción de dimensiones (análisis semántico latente)
Julio 2015
Agosto 2015
9
10
Aplicación de los métodos de clasificación a los datos obtenidos. Probar varios algoritmos disponibles en la herramienta de clasificación y seleccionar 3-4 algoritmos con el mejor desempeño.
Probar la aplicación de los filtros para los archivos de entrada de clasificadores.
Aplicar los clasificadores a los datos obtenidos
Octubre 2015
Noviembre 2015
10
5
Análisis de las métricas de evaluación de los resultados y su aplicación Analizar las métricas de evaluación disponibles en la herramienta de clasificación.
Comparar los resultados de varios clasificadores con varios parámetros.
Noviembre 2015
Diciembre 2015
Porcentaje:
100 %
Nota: La planeaci�n debe hacerse de acuerdo a las actividades del a�o actual (sumando 100 %), incluso si el proyecto es a mediano plazo.
6. Presupuesto
Solicitado (para 2024 solo aplica capítulo 4000)
Cap�tulo
Descripci�n / Concepto
Total (Pesos)
2000
Compra de partes de las computadoras (memorias, discos duros, etc.) para mejorar el equipo existente.
43000
3000
Para la asistencia a un congreso internacional para presentar los resultados del proyecto
5000
4000
Para la asistencia de los estudiantes a los congresos nacionales e internacionales para presentar los resultados del proyecto