Post on 10-Nov-2014
Minería de DatosMinería de DatosMinería de DatosMinería de Datos
Ph.D.(c) MSc. Carlos Alberto Cobos LozadaOficina 422 FIET
ccobos@unicauca.edu.coccobos@unicauca.edu.cohttp://www.unicauca.edu.co/~ccobos
Grupo de I+D en Tecnologías de la Información (GTI)Departamento de Sistemas
Facultad de Ingeniería Electrónica y TelecomunicacionesUniversidad del Cauca
� Conocer� Comprender� Saber usar
Técnicas de minería de datos
Problemas concretos de extracción de
conocimiento
en
Objetivo GeneralObjetivo General
� Conceptos y terminología� Reconocer los beneficios� Conocer las fases (CRISP-DM)
Comprensión del negocio
Análisis de los datos
Preparación de los datos
ModelamientoEvaluación
Despliegue Datos
Objetivos EspecíficosObjetivos Específicos
� Conocer las distintas técnicas◦ Clasificación
� Árboles de Decisión (CART, C4.5)� Redes Bayesianas Ingenuas (Naive Bayes)� K Vecinos más Cercanos (K-NN)� K Vecinos más Cercanos (K-NN)� Redes Neuronales (Perceptron)
◦ Clustering� K-means� Algoritmos jerárquicos� Redes neuronales (Kohonen)
◦ Reglas de Asociación� Apriori
Objetivos EspecíficosObjetivos Específicos
� Apriori� Fp-Growth
� Usar una herramienta◦ Weka◦ Rapid Miner◦ SQL Server
Objetivos EspecíficosObjetivos Específicos
� Saber elegir la técnica más apropiada
� Evaluación de modelos◦ Validación Cruzada◦ Criterios y Gráficas
� Implementar por lo menos un algoritmo◦ K-NN◦ K-means◦ Algoritmo Genético◦ Validación Cruzada◦ Llamar librerías desde C#
� Entender conceptos de minería web
Objetivos EspecíficosObjetivos Específicos
� Entender conceptos de minería web
� Conocer congresos, eventos y fuentes
� Primer corte (35%)◦ Proyecto Fase I◦ Implementación I
� Segundo corte (35%)� Segundo corte (35%)◦ Proyecto Fase II (Final)◦ Implementación II
� Tercer corte (Examen Final 30%)◦ Exposición◦ Implementación III
EvaluacionesEvaluaciones
◦ Implementación III
1. Pete Chapman, Julian Clinton, Randy Kerber and other. CRISP-DM 1.0. Step-by-step data mining guide, 1999-2000. SPSS Inc.
2. Larose, Daniel T. Discovering Knowledge in Data: An Introduction to Data Mining. Hoboken, NJ, USA: John Wiley & Sons, Incorporated, 2005. E-Book.
3. Larose, Daniel T. Data Mining Methods and Models. Daniel T. Larose. ISBN: 0-471-75647-4. E-Book. 385 pages. February 2006, Wiley-IEEE Press.
4. Análisis y Extracción de Conocimiento en Sistemas de Información: Datawarehouse y Datamining. Departamento de Sistemas Informáticos y Computación. Universidad Politécnica de Valencia. http://www.dsic.upv.es/~jorallo/cursoDWDM. Libro: Introducción a la Minería de Datos, José Hernández Orallo, M. José Ramírez Quintana, César Ferri Ramírez. Editorial Pearson, 2004. ISBN: 84-205-4091-9.Orallo, M. José Ramírez Quintana, César Ferri Ramírez. Editorial Pearson, 2004. ISBN: 84-205-4091-9.
5. Kantardzic, Mehmed. Data Mining: Concepts, Models, Methods, and Algorithms, John Wiley & Sons 2003 (343 pages). ISBN: 0471228524.
6. Berry, Michael J. A.; Linoff, Gordon S. Data Mining Techniques: For Marketing, Sales, and CustomerRelationship Management. John Wiley & Sons, Incorporated. 2004. ISBN: 0-471-47064-3.
7. Markov, Zdravko and Larose, Daniel. Data Mining the Web: Uncovering Patterns in Web Content, Structureand Usage. Hoboken, NJ, USA: John Wiley & Sons, 2007.
8. Data Mining with SQL Server 2005. ZhaoHui Tang, Jamie Maclennan. Wiley Publishing, Indiana, 2005. 9. Wang, John (Editor). Data Mining: Opportunities and Challenges. Hershey, PA, USA: Idea Group Inc., 2003. 10. Scime, Anthony. Web Mining: Applications and Techniques. Hershey, PA, USA: Idea Group Publishing,
2004.11. Hsu, Hui-Huang. Advanced Data Mining Technologies in Bioinformatics. Idea Group Publishing. 2006. ISBN:
1-59140-865-2.
BibliografíaBibliografía
1-59140-865-2.12. Last, Mark; Kandel, Abraham; Bunke, Horst. Data Mining in Time Series Databases. World Scientific
Publishing Company, Incorporated. 2004. ISBN: 9-81-238290-9.
Minería de DatosMinería de DatosMinería de DatosMinería de Datos
Ph.D.(c) MSc. Carlos Alberto Cobos LozadaOficina 422 FIET
ccobos@unicauca.edu.coccobos@unicauca.edu.cohttp://www.unicauca.edu.co/~ccobos
Grupo de I+D en Tecnologías de la Información (GTI)Departamento de Sistemas
Facultad de Ingeniería Electrónica y TelecomunicacionesUniversidad del Cauca