FECHA DE CLASIFICACIÓN: JUNIO DE 2007
UNIDAD RESPONSABLE: DIV. DE OPERACIÓN Y PROMOCIÓN A LA INVESTIGACIÓN
CARACTER CONFIDENCIAL
PARTES CONFIDENCIALES: CAR�TULA Y ANEXOS
FUNDAMENTO LEGAL: Art. 3 Fracc. II, Art. 18 Fracc. II y 21, LFTAIPG, Lineamiento 32� Fracc. VII, VIII, XVII
FIRMA DEL TITULAR DE LA UNIDAD:___________________________________
 
INSTITUTO POLITÉCNICO NACIONAL
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
PROTOCOLO PARA PROYECTOS DE INVESTIGACI�N

PROYECTO INDIVIDUAL   X   CORTO PLAZO   X  
PROYECTO EN PROGRAMA ESPECIAL      
PROYECTO DE INNOVACIÓN      
PROYECTO MULTIDISCIPLINARIO       MEDIANO PLAZO    
PROYECTO TRANSDISCIPLINARIO      
PROYECTO DE RED      
PROPUESTA DE ESTUDIO      
Informaci�n General del Proyecto de Investigaci�n
  CIC    Departamento de Ciencias de la Computacion 
Escuela, Centro o Unidad Secci�n. Divisi�n o Departamento
T�tulo
Construcción y análisis comparativo de medidas de similitud y asociación para diferentes áreas de aplicación

Registro asignado por la SIP:  20171344     
Datos del director(a) del Proyecto de investigaci�n:
  Batyrshin     -     Ildar  
Apellido Paterno Apellido Materno Nombres
Tipo de plaza en el IPN:  Titular C - (BASE)  Grado acad�mico:  Doctorado 
Horas de nombramiento:  40  RFC:  BAIL520916TP  CURP:  BAXI520916HNETXL09 
SNI:  III  BECAS: COFAA  ---  EDD  ---  EDI  IX  (Indicar nivel)
Tel�fono oficina (Ext):  56599  Correo electrónico Tel�fono particular:  5635551566 
Nivel acad�mico en el que se realizar� el Proyecto de Investigaci�n:
Medio Superior         Superior         Posgrado    X   
Ubique su propuesta solamente en uno de los campos que a continuaci�n se enuncian:
Ingenier�a y Tecnología     X    Ciencias Sociales         
Ciencias Naturales          Ciencias Agr�colas         
Ciencias M�dicas          Humanidades         
Educación         
Clasificaci�n CONACyT:
Sector:   Sector Comunicaciones y Transportes  
Subsector:   Fomento a la integración de servicios y acceso a las nuevas tecnologías de la información                                                                         
Tipos de investigaci�n:
B�sica     X    Aplicada          Autoequipamiento         
Desarrollo Tecnol�gico          Educativa           
¿Su proyecto aborda los siguientes temas?
Perspectiva de Género      Sustentabilidad     
Ninguno   X
Red a la que pertenece ó podría pertenecer el proyecto:   ---  
¿A que tipo de investigación pertenece su proyecto?:
Investigación Científica     X    Investigación Tecnológica        
¿A que tipo de avance contribuye su proyecto? :
Avance del conocimiento:        Desarrollo de la enseñanza:        Aprovechamiento de los recursos naturales y materiales:       
Scopus:   ---  
Orcid:   ---  
  Ildar Batyrshin -                                             
Director(a) del Proyecto de
Investigaci�n
Vo. Bo. de la Academia o
Colegio de Profesores
Nombre y firma de Director(a) de la
Escuela, Centro o Unidad
Nota: El t�tulo deber� ser breve, conciso y representativo del tema central de investigaci�n


La presentaci�n deber� hacerse de acuerdo a la siguiente estructura:

1. Descripci�n del proyecto
1.1 Resumen
Es muy importante la selección de las medidas de similitud y asociación adecuadas para diferentes tareas de minería de datos, aprendizaje de máquina, reconocimiento de patrones entre otros. Basado en nuestros trabajos anteriores sobre de métodos generales de construcción de medidas de asociación usando medidas de similitud en este proyecto vamos estudiar diferentes clases de similitud y asociación para varios dominios como conjuntos de vectores binarios, series temporales, grupos etc. Vamos proponer los nuevos métodos de visualización de medidas de similitud y asociación que va facilitar comparación estas medidas y selección las mejores para diferentes áreas de aplicación como finanzas y lingüística entre otros. Vamos desarrollar los nuevos métodos de análisis de relaciones entre datos financieros basados en nuevas medidas de asociación.

1.2 Objetivo general
Desarrollar los métodos de visualización y análisis comparativo de medidas de similitud y asociación para diferentes dominios y áreas de aplicación. Desarrollar las nuevas medidas y clases de medidas de similitud y asociación más adecuadas que medidas conocidas para varias áreas de aplicación. Desarrollar los métodos y algoritmos para análisis las relaciones entre datos basados en medidas consideradas.

1.3 Objetivos específicos
Desarrollar los métodos de visualización y análisis comparativo de medidas de similitud y asociación para vectores binarios y 2x2 tablas.
Desarrollar las nuevas medidas de similitud y asociación para vectores binarios y 2x2 tablas.
Desarrollar las nuevas medidas de similitud y asociación para vectores de datos de escalas bipolares. Proponer los métodos de su aplicación en sistemas de recomendac

2. Subproductos comprometidos
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  1   2 
Congresos  2   2  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   1 
Medio       Superior Posgrado
Tesistas  0   0   6 
Practicantes Profesionales  0   0   1 
Alumnos PIFI  0   0   3 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos a�o 2
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
2. Subproductos comprometidos a�o 3
Nacional Internacional Nacional Internacional
Art�culo de Divulgaci�n  0   0  Art�culo Cient�fico  0   0 
Congresos  0   0  Seminiarios  0   0 
Cursos  0   0  Manuales  0   0 
Libros  0   0  Programa de Radio y TV  0   0 
Conferencias o Ponencias  0   0 
Piloto Laboratorio Piloto Laboratorio
Proceso  0   0  Prototipo  0   0 
Patente  0   0  Certificado de Invenci�n  0   0 
Hardware  0   0  Software  0   0 
Medio       Superior Posgrado
Tesistas  0   0   0 
Practicantes Profesionales  0   0   0 
Alumnos PIFI  0   0   0 
Prestante de Servicio Social  0   0 
Otros (especificar)  0       
 3. Monto y distribuci�n del presupuesto solicitado (anexar): honorarios (s�lo centros for�neos), materiales y suministros, servicios generales y equipamiento (anexar cotizaci�n)

3.1 �Ha participado en convocatorias externas al Instituto para el financiamiento de proyectos de investigaci�n?
No    X   Si        Nombre de la convocatoria       

4. Recursos humanos. Investigadores y alumnos participantes.

  4.1 Investigadores participantes

N�mero Nombre Actividad espec�fica a desarrollar
1 Ildar Batyrshin - Director del proyecto
2 Alexander Gelbukh -
  
Análisis de asociaciones entre series temporales
3 Liliana Chanona Hernandez
  
Analysis de asociaciones entre datos binarios y 2x2 tablas
4 Grigori Sidorov -
  
Análisis de asociaciones entre textos, eventos y datos financieros


  4.2 Alumnos participantes

N�mero Nombre Status* Actividad espec�fica a desarrollar
1 Diego Aguilar Mayen TS Aplicación de medidas de asociación de series temporales para datos financieros
2 DIEGO AGUILAR MAYEN PF Aplicación de medidas de asociación de
series temporales para datos
financieros
3 José Adriel Alonso Castro TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
4 Iqra Ameer  TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
5 Vanessa Camacho Vázquez TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
6 Eduardo Cueto Mendoza TS Desarrollo de medidas de asociación para grupos
7 Carolina Fócil Arias TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
8 Roddy Fuentes Alba TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
9 Francisco Javier García López TS Desarrollo algoritmos de análisis de asociaciones entre series temporales
10 FRANCISCO JAVIER GARCÍA LÓPEZ PF Desarrollo algoritmos de análisis de
asociaciones entre series temporales
11 Helena Moserrat Gómez Adorno TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación.
12 Navonil Majumder  TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
13 Sergio Andrés Mancera Nomesque TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
14 Ilia Markov  TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
15 Yarik Menchaca Reséndiz TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
16 Iván Ramírez Mejía TS Visualización medidas de similitud y asociación de datos binarios
17 Steffy Mónica Robles Ruíz TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
18 Eduardo René Rodríguez Ávila TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
19 Miguel Ángel Sánchez Pérez TS Programación de herramientas, interfaces y algoritmos. Aplicación de las herramientas existentes de análisis y clasificación
20 Jorge Luis Zúñiga Hernández TS Análisis de asociaciones entre eventos y datos financieros
21 JORGE LUIS ZÚÑIGA HERNÁNDEZ PF Análisis de asociaciones entre eventos
y datos financieros

  * PIFIS(PF), Servicio Social (SS), Tesistas (TS), Pr�cticas Profesionales (PP), Alumnos Participantes (AP)

 5.Programaci�n de Actividades de Investigaci�n   

N�mero
de meta
Valor % de
cada meta
Descripci�n de actividades Mes de inicio Mes de terminaci�n
1 25 Visualización y análisis, vectores binarios, tablas 2x2
Visualización y análisis de medidas de similitud y asociación para vectores binarios y 2x2 tablas.
Desarrollo de las nuevas medidas de similitud y asociación para vectores binarios y 2x2 tablas.
Enero 2017 Marzo 2017
2 25 Desarrollo de las nuevas medidas de similitud y asociación para datos bipolares.
Desarrollo de las nuevas medidas de similitud y asociación para datos bipolares. Proponer los métodos de su aplicación en sistemas de recomendación.
Abril 2017 Junio 2017
3 25 Hacer análisis comparativo de las medidas de asociación para series temporales.
Hacer análisis comparativo de las medidas de asociación para series temporales.
Desarrollo de los nuevos métodos de análisis de relaciones entre datos financieros basados en nuevas medidas de asociación.
Julio 2017 Septiembre 2017
4 25 Introducir, desarrollar y analizar propiedades de las medidas de asociación, gru
Introducir, desarrollar y analizar propiedades de las medidas de asociación para grupos.
Octubre 2017 Diciembre 2017
Porcentaje: 100 %

Nota: La planeaci�n debe hacerse de acuerdo a las actividades del a�o actual (sumando 100 %), incluso si el proyecto es a mediano plazo.

  6. Presupuesto Solicitado (para 2024 solo aplica capítulo 4000)

Cap�tulo Descripci�n / Concepto Total
(Pesos)
2000  Consumibles para impresión y organización de la información, cartuchos de tinta para impresora, papelería, discos para el resguardo de la información. 40000   
3000  Trabajo de campo, servicios y mantenimiento de equipo de investigación. $5,000.00 se utilizarán para gastos relacionados con congresos y seminarios científicos para la presentación de los resultados de la investigación 30000   
4000  Transporte y viáticos para trabajo de campo de alumnos participantes en el proyecto de investigación. Cursos de capacitación para alumnos. Inscripción a congresos para alumnos 20000   
5000      
7000      
Total:  $ 90000