Mineria de datos

27
Trabajo de Investigación ICI344- Bases de datos. Minería de datos. Enzo Barbaguelatta D. Fernando Püschel A. Nicolas Zárate G.

description

Es aquí donde se introduce la minería de datos. Ésta, una tecnología cuyo objetivo es mirar los datos más allá de consultarlos; se analizan, se emplean variadas técnicas para ver que comportamientos tienen un subgrupo de éstos, grandes o pequeños, y se descubre nueva información, generando así nuevo conocimiento el cual puede ser de vital utilidad para el negocio y para sus tomas de decisiones.

Transcript of Mineria de datos

Page 1: Mineria de datos

Trabajo de InvestigaciónICI344- Bases de datos.

Minería de datos.

Enzo Barbaguelatta D.Fernando Püschel A.

Nicolas Zárate G.

Page 2: Mineria de datos

Bases de datos

• Mundo actual muy dependiente de la información.

• Generación de datos en masa.• Rápidas consultas de rápida

respuesta.• Empleo de bases de datos.

Page 3: Mineria de datos

Pero…

• Éstas consultas son superficiales.• Principalmente no se ve mas allá de

los datos en “crudo”.• Datos podrían aprovecharse aun mas

de lo que ya se esta aprovechando actualmente.

Page 4: Mineria de datos

Introducción a la minería de Datos.

Definición general

Page 5: Mineria de datos

Minería de datos

Muchas definiciones.• Un mecanismo de explotación

consistente en la búsqueda de información valiosa en grandes volúmenes de datos.

• Análisis de bitácoras y archivos, buscando relaciones, patrones, reglas, las cuales pueden ser útiles para la toma de decisiones.

• Y mas…

(Data mining).

Page 6: Mineria de datos

En el entorno comercial

• Una de las etapas de descubrimiento de la extracción de conocimiento en la información.

KDD

Page 7: Mineria de datos

Extracción del conocimiento de la información.

Historia de la minería de datos

Page 8: Mineria de datos

KDDKnowledge Discovery in Databases

• Los datos son la materia prima bruta.

• En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información.

• Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación de la información y ese modelo representen un valor agregado, entonces nos referimos al conocimiento.

Page 9: Mineria de datos

• El proceso de KDD consiste en usar métodos de minería de datos (algoritmos) para extraer (identificar) lo que se considera como conocimiento.

• Se estima que la extracción de patrones (minería) de los datos ocupa solo el 15% - 20% del esfuerzo total.

KDDKnowledge Discovery in Databases

Page 10: Mineria de datos

Pasos del KDD

• Determinar las fuentes de información: Que pueden ser útiles y dónde conseguirlas.

• Diseñar el esquema de un almacén de datos (Data Warehouse): Que consiga unificar de manera operativa toda la información recogida.

Page 11: Mineria de datos

Implantación del almacén de datos.

• Permitir la visualización de datos para discernir cuales estudiar.

Selección, limpieza y transformación de los datos que se van a analizar.

• La limpieza y pre-procesamiento de datos se logra diseñando una estrategia adecuada para manejar ruido, valores incompletos, secuencias de tiempo, casos extremos (si es necesario), etc.

Pasos del KDD

Page 12: Mineria de datos

• Seleccionar y aplicar el método de minería de datos apropiado: Se selecciona lo que se desea buscar, utilizando algoritmos y técnicas apropiadas para ello.

Búsqueda de patrones y su representación en modelos(dependiendo del algoritmo de minería).Pasos del KDD

Page 13: Mineria de datos

• Evaluación, interpretación, transformación y representación de los patrones extraídos.

• Interpretar los resultados y posiblemente regresar a los pasos anteriores.

• Involucrar repetir el proceso, quizás con otros datos, otros algoritmos, otras metas y otras estrategias.

• Requiere tener conocimiento del dominio.• La interpretación puede beneficiarse de

procesos de visualización, y sirve también para borrar patrones redundantes o irrelevantes.Pasos del KDD

Page 14: Mineria de datos

• Difusión y uso del nuevo conocimiento.

• Incorporar el conocimiento

descubierto al sistema (normalmente para mejorarlo) lo cual puede incluir resolver conflictos potenciales con el conocimiento existente. Pasos del KDD

Page 15: Mineria de datos

Funcionamiento de la minería de datos.

Tipos, técnicas, algoritmos.

Page 16: Mineria de datos

2 tipos esenciales

• Minería de datos predictiva (MDP).

Emplea uso de técnicas estadísticas.

• Minería de datos para el descubrimiento de la información (MMDC).

Uso de diversas técnicas de inteligencia artificial para obtener datos.

Page 17: Mineria de datos

Funcionamiento

• Emplean técnicas de diversas ciencias para lograr su trabajo.

• Muchas veces se mezclan éstas para reforzar las técnicas.

• Han estado en constante evolución.

Page 18: Mineria de datos

Sub-procesos data mining

• Extracción de datos.• Interpretación de éstos.

• Generación de nuevo conocimiento.

• La interpretación de los datos generalmente es apoyado por herramientas y personas no profesionales en los

campos.• Todo este proceso está basado en el método científico.

Page 19: Mineria de datos

Procesos y Técnicas

• Técnicas de Visualización: Se utiliza para determinar calidad en los datos.

• Reglas de Asociación: Permite realizar asociaciones entre perfiles de los clientes.

• Descripción: Análisis preliminar de los datos, para aumentar el conocimiento posterior.

Page 20: Mineria de datos

Extensiones de la MD

• WEB Mining: Aplicación de las técnicas de la MD a documentos y servicios webs.

• Text Mining: Examinación de las colecciones de documentos con el fin de encontrar información no contenida en ningún documento individual.

Page 21: Mineria de datos

Resultados

• La minería de datos añade a la situación inicial nuevo conocimiento de calidad.

• Permite tener visión global de los datos, inclusive ocultos.

• Ayuda a una mejor toma de decisiones, y a hacer pronósticos de tendencias.

• Todo lo anterior puede trabajarse en masas grandes de datos, automáticamente.

• No necesariamente requiere de equipamiento especializado.

Page 22: Mineria de datos

Pero también…

• Altos costos, tanto infraestructura como implementación.

• Personal especializado.• Puesta en marcha de largo plazo.

Difícil.• No existen estandarizaciones respecto

a la minería de datos.

Page 23: Mineria de datos

Minería de datos en la actualidad.Casos de uso, presente y futuro

Page 24: Mineria de datos

Aplicaciones de la MD

• FBI. Trata de buscar a potenciales terroristas, con antelación antes de que puedan cometer un atentado.

• Tiendas Comerciales. Busca conocer los hábitos de los clientes con respecto a los productos que compran.

• Deportes. La NBA utiliza la MD para apoyar a su cuerpo técnico en la toma de decisiones en las futuras tácticas.

Page 25: Mineria de datos

• Televisión: Se puede estimar el rating de los programas.

• Entrevistas de trabajo: Se ocupa la MD para identificar las características de los empleados.

• Y más…

Aplicaciones de la MD

Page 26: Mineria de datos

Futuro de la minería de datos.

• Muy bien aprovechado en el presente.• Tecnología aún emergente, aún falta más

investigación.• No hay estandarización.

• Nuevas técnicas emergentes.

Page 27: Mineria de datos

Trabajo de InvestigaciónICI344- Bases de datos.

Minería de datos.