Teaching‎ > ‎

Minería de datos 16-P





It is a capital mistake to theorize before one has data.

Sherlock Holmes






























Información general
Clave: 4600043
Trimestre: 16-P
Grupo: CL01C
Profesor: Antonio López Jaimes (Cubículo C-802alopez <arroba> correo.cua.uam.mxtonio.jaimes <arroba> gmail.com).

Herramientas del curso
El lenguaje de programación que usaremos en el curso es MATLAB. Si no pueden coseguir el intérprete e IDE de este lenguaje, una excelente alternativa es Octave que es lenguaje muy similar a MATLAB y su intérprete es libre y está disponible para Windows, Mac OS y Linux.

Presentaciones sobre máquinas de vectores-soporte:

Ejemplo para aplicar análisis de componentes principales (PCA, Principal Component Analysis).



Contenido del curso (resumen)
  1. Introducción a la minería de datos.

  2. Preprocesamiento de datos.

  3. Clasificación de datos.

  4. Agrupamiento de datos.

  5. Aplicaciones a problemas del mundo real.


La planeación detallada del curso la encuentran aquí.

Prácticas
 # Práctica Fecha entrega Comentario
0 Mayo 23, antes de 1 PMIntroducción a Octave y descripción de la práctica
Los archivos de las funciones de los ejercicios deben ponerlos en su carpeta compartida
 1 Mayo 30, 1PMGraficando en Octave y descripción de la práctica
Archivos: deptos.dat y datos2D.dat

Ayuda: Este es un ejemplo de un script que grafica la superficie de la función Sombrero,
pero definiendo manualmente la matriz Z.
 2 Junio 7, 11:59PMDescripción de la práctica
Archivo: regponderada.txt 
 3Junio 27 Descripción de la práctica
Archivo: clases.txt
 4 Julio 11, 2PMPráctica de SVMs 
Archivos: clases.txt y doslunas.txt
 5 Julio 11, 2PM Práctica de agrupación: k-means
Archivos: lena.pgm


Tareas
 # Tarea Fecha entrega Comentario
1 Mayo 27, hora de clase Aquí está la descripción de la tarea 1
 2 Junio 17, hora del examen Descripción de la tarea 2.

RecordatorioLa carpeta compartida de Google Drive para sus tareas debe tener el nombre midas - su nombre. Por ejemplo, la carpeta de Alan Turing se llamaría midas - alan turing. Lo importante es que tenga el prefijo "midas" al inicio para identificarla fácilmente.



Ponderación y escala de calificaciones
Para calcular la calificación final se tomarán en cuenta los siguientes porcentajes:
Prácticas: 40%
Proyecto final: 30%
Exámenes: 20%
Tareas: 10%

Intervalos para la calificación:

NA: 0.0 ≤ Cal <  6.0
S:  6.0 ≤ Cal <  7.8
B:  7.8 ≤ Cal <  9.0
MB: 9.0 ≤ Cal ≤ 10.0


Calificaciones

Bibliografía para el curso
    1. Charu C. Aggarwal. Data Mining: The Textbook. Springer, 2015.
    2. Max Bramer. Principles of Data Mining. 2a ed. Springer, 2013.
    3. Ian H. Witten, Frank Eibe y Mark A. Hall. Data Mining: practical machine learning tools and techniques. 3a ed. Morgan Kaufmann, 2011.
    4. Pang-Ning Tan, Michael Steinbach y Vipin Kumar. Introduction to Data Mining. 1a ed. Pearson, 2005.
    5. José Hernández Orallo, María José Ramírez Quintana y César Ferri Ramírez. Introducción a la minería de datos. 1a ed. Pearson Prentice Hall, 2004.




    Subpáginas (1): Anuncios del curso