Post on 12-Oct-2020
Carlos J. Alonso González
Departamento de Informática
Universidad de Valladolid
Weka: Waitako Environmentfor Knowledge Analysis
Introducción
Explorer
Introducción a Weka: explorer 2
Contenidos
Fuentes
Introducción
The Explorer
Introducción a Weka: explorer 3
Fuentes
El contenido de esta presentación se basa en el capítulo 10 deI. Witten, E. Frank. Data Minig: Practical Machine Learning tools and Techniques, Second Edition. Morgan Kaufmman, Elsevier. San Francisco, CA, 2005. ISBN: 0 12 088407
Sitio weka: http://www.cs.waikato.ac.nz/ml/weka/
Presentación weka.ppt (descripción de todas las interfaces gráficas de weka, por E. Franck)
Varios tutoriales, en el sitio wekaTutorial.pdf (parte II de la obra citada)
Introducción de Alex K. Seewald
Manual en español: http://metaemotion.com/diego.garcia.morate/download/weka.pdf
Introducción a Weka: explorer 4
Introducción
Software para el aprendizaje automático/minería de datos escrito en JAVA con licencia GNU
Principalmente investigación, educación
Complementa DATA MINIG, de Witten y Frank
Características principales Sistema integrado de herramientas de preprocesado
de datos, algoritmos de aprendizaje y métodos de evaluación de algoritmos
Interfaces gráficas
Entorno para la comparación de herramientas de aprendizaje
Introducción a Weka: explorer 5
Ejecución
Instalada máquina virtual java
Instalado weka
java –jar weka.jar
Aparece la ventana selector de interfaces
Introducción a Weka: explorer 6
Selector de interfaces
Introducción a Weka: explorer 7
Introducción a Weka: explorer 8
Explorer: formato de datos ARFF
@relation heart-disease-simplified
@attribute age numeric@attribute sex { female, male}@attribute chest_pain_type { typ_angina, asympt, non_anginal,
atyp_angina}@attribute cholesterol numeric@attribute exercise_induced_angina { no, yes}@attribute class { present, not_present}
@data63,male,typ_angina,233,no,not_present67,male,asympt,286,yes,present67,male,asympt,229,yes,present38,female,non_anginal,?,no,not_present...
Introducción a Weka: explorer 9
Explorer: formato de datos ARFF
@relation heart-disease-simplified CABECERA
@attribute age numeric DECLARACIóN DE ATRIBUTOS@attribute sex { female, male}@attribute chest_pain_type { typ_angina, asympt, non_anginal,
atyp_angina}@attribute cholesterol numeric@attribute exercise_induced_angina { no, yes}@attribute class { present, not_present}
@data SECCIÓN DE DATOS63,male,typ_angina,233,no,not_present67,male,asympt,286,yes,present67,male,asympt,229,yes,present38,female,non_anginal,?,no,not_present...
Introducción a Weka: explorer 10
Explorer: preprocesado
Se pueden importar datos en varios formatos: ARFF, CSV, binarios...
Herramientas de preprocesado: filters
Filtros para: discretización, normalización, selección de atributos, resampling,...
Introducción a Weka: explorer 11
Datos: IRIS
Problema: determinar la clase de planta Iris: setosa, versicoulor, virginica
Descripción de instancias: 4 atributos numéricos
1. sepal longitud en cm
2. sepal anchura en cm
3. petal longitud en cm
4. petal anchura en cm
Nº de ejemplos: 150 (50 de cada clase)
Dominio muy simple
Introducción a Weka: explorer 12
Archivo IRIS.ARFF
@relation iris
@attribute sepallength numeric@attribute sepalwidth numeric@attribute petallength numeric@attribute petalwidth numeric@attribute class {Iris-setosa,Iris-versicolor,Iris-virginica}
@data
5.1,3.5,1.4,0.2,Iris-setosa4.9,3,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa4.6,3.1,1.5,0.2,Iris-setosa....
Introducción a Weka: explorer 13
Introducción a Weka: explorer 14
Introducción a Weka: explorer 15
Introducción a Weka: explorer 16
Introducción a Weka: explorer 17
Introducción a Weka: explorer 18
Introducción a Weka: explorer 19
Introducción a Weka: explorer 20
Introducción a Weka: explorer 21
Introducción a Weka: explorer 22
Introducción a Weka: explorer 23
Introducción a Weka: explorer 24
Introducción a Weka: explorer 25
Introducción a Weka: explorer 26
Introducción a Weka: explorer 27
Introducción a Weka: explorer 28
Introducción a Weka: explorer 29
Introducción a Weka: explorer 30
Introducción a Weka: explorer 31
Introducción a Weka: explorer 32
Introducción a Weka: explorer 33
Explorer: construcción de clasificadores
WEKA denomina clasificador a cualquier modelo con capacidad de predecir un valor nominal (clase discreta, clasificación) o un valor numérico (regresión)
Numerosos métodos básicos
Listas decisión, árboles decisión, reglas, PMC, SVM...
Meta-clasificadores
Baggin, boosting, stacking...
Introducción a Weka: explorer 34
Introducción a Weka: explorer 35
Introducción a Weka: explorer 36
Introducción a Weka: explorer 37
Introducción a Weka: explorer 38
Introducción a Weka: explorer 39
Introducción a Weka: explorer 40
Introducción a Weka: explorer 41
Introducción a Weka: explorer 42
Introducción a Weka: explorer 43
Introducción a Weka: explorer 44
Introducción a Weka: explorer 45
Introducción a Weka: explorer 46
Introducción a Weka: explorer 47
Introducción a Weka: explorer 48
Introducción a Weka: explorer 49
Introducción a Weka: explorer 50
Introducción a Weka: explorer 51
Introducción a Weka: explorer 52
Introducción a Weka: explorer 53
Introducción a Weka: explorer 54
Introducción a Weka: explorer 55
Introducción a Weka: explorer 56
Introducción a Weka: explorer 57