Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La...

61
Análisis Exploratorio de Datos

Transcript of Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La...

Page 1: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Análisis Exploratorio

de Datos

Page 2: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

¿Qué son los Datos?

Una variable es una propiedad o

característica de un Individuo

Ejemplos: color de ojos

de un persona,

temperatura, estado civil

Una colección de variables

describen a un Individuo

Un individuo también se conoce

como registro, punto, caso,

objeto, entidad, ejemplo de

observación

Id Dev. Estado Civil

Impuestos Fraude

1 Si Soltero 125Mil No

2 No Casado 100Mil No

3 No Soltero 70Mil No

4 Si Casado 120Mil No

5 No Divorciado 95Mil Si

6 No Casado 60Mil No

7 Si Divorciado 220Mil No

8 No Soltero 85Mil Si

9 No Casado 75Mil No

10 No Soltero 90Mil Si 10

Variables

Individuos

Page 3: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Tipos de Variables

Cualitativos vs. Cuantitativos

Cualitativo (o categórico) las variables

representan distintas categorías en lugar de

números. Las operaciones matemáticas como la

suma y la resta no tienen sentido.

Ejemplos: color de los ojos, grado académico, dirección IP,

código postal.

Cuantitativos (o numéricos) las variables son los

números y pueden ser tratados como tales.

Ejemplos: peso, fallos por hora, el número de televisores, la

temperatura

Page 4: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Variables Cualitativas

Page 5: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Tipos de Variables

Page 6: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Variables Cuantitativas

• Los valores de la variable son “números” = cada valor posible es menor o mayor que otro valor

• Ejemplos: edad, ingresos, nota en un examen, número de años de educación, kilómetros de distancia entre trabajo y residencia…

• OJO: hay “números” que son “etiquetas”; por ejemplo: el código postal; el número de teléfono; el código de una asignatura

Page 7: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Variable Discreta vs Variable Continua

• Una Variable Discreta es aquella en la cuál se puede contar el número posible de valores (son números enteros)

• Una Variable Continua puede tomar cualquier valor en un intervalo dado (son números reales)

Page 8: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Variables Cualitativas

• Variables cualitativas son aquellas que clasifican las unidades en categorías. Las categorías pueden tener un orden natural (ordinales) o no (nominales).

• Cuando las variables son ordinales podemos contar número de casos, comparar entre categorías, pero no podemos realizar operaciones numéricas.

Page 9: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Variables Ordinales

• Categorías, no números, que tienen un orden, pero no existe una distancia o intervalo definido entre los valores

– Ejemplo: profesión Bachiller, Licenciado, Máster, Doctor

• Tratamiento estadístico:

– A veces, como variables cualitativas

– A veces, como variables cuantitativas

Page 10: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Variables Nominales

• Los valores son “categorías”

• Las categorías son valores diferentes por una cualidad, no por una cantidad

• Ningún “valor” se puede decir que sea mayor o menor que otro

• Ejemplos: partido político al que votó; región en que vive; sexo; estado civil.

Page 11: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

¿cómo transformar variables cuantitativas en cualitativas?

• La conversión de una variable cuantitativa en cualitativa se denomina categorización. 1. Se ordena la variable

2. Se decide el número k de categorías

3. Se buscan los límites e intervalos para cada categoría [min, min+(max-min)/k[, [min, min+2*(max-min)/k[ …

4. Se asigna una etiqueta para cada categoría

5. En la variable original (sin ordenar) se cambia cada valor por una etiqueta según el intervalo al que corresponda

Page 12: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Ejemplo: Ejemplo Transforma Variable.xlsx

Page 13: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Los Datos

Variable j

Page 14: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Ejemplo

Matemáticas Ciencias Español Historia EdFísica

Lucía 7.0 6.5 9.2 8.6 8.0

Pedro 7.5 9.4 7.3 7.0 7.0

Inés 7.6 9.2 8.0 8.0 7.5

Luis 5.0 6.5 6.5 7.0 9.0

Andrés 6.0 6.0 7.8 8.9 7.3

Ana 7.8 9.6 7.7 8.0 6.5

Carlos 6.3 6.4 8.2 9.0 7.2

José 7.9 9.7 7.5 8.0 6.0

Sonia 6.0 6.0 6.5 5.5 8.7

María 6.8 7.2 8.7 9.0 7.0

Page 15: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Nubes de Puntos

Luis 5.0 6.5 6.5 7.0 9.0

INDIVIDUOS - FILAS

VARIABLES - COLUMNAS Español

9.2

7.3

8.0

6.5

7.8

7.7

8.2

7.5

6.5

8.7

Page 16: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Nube de Puntos

Page 17: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

¿Cómo leer los datos en R?

Matemáticas Ciencias Español Historia EdFísica

Lucía 7.0 6.5 9.2 8.6 8.0

Pedro 7.5 9.4 7.3 7.0 7.0

Inés 7.6 9.2 8.0 8.0 7.5

Luis 5.0 6.5 6.5 7.0 9.0

Andrés 6.0 6.0 7.8 8.9 7.3

Ana 7.8 9.6 7.7 8.0 6.5

Carlos 6.3 6.4 8.2 9.0 7.2

José 7.9 9.7 7.5 8.0 6.0

Sonia 6.0 6.0 6.5 5.5 8.7

María 6.8 7.2 8.7 9.0 7.0

Page 18: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Desde Excel

Page 19: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Guardar como *.CSV separado por ;

Page 20: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Visto como archivo de texto

Page 21: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Leyendo los datos desde R

Mediante Código R:

> Datos <- read.table("C:/Datos/EjemploEstudiantes.csv“, header=TRUE, sep=";", dec=".", row.names=1)

Page 22: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Leyendo datos desde RComander

Page 23: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Leyendo datos desde FactoMineR

Page 24: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Leyendo desde FactoMineR

Page 25: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Visualizando los datos en RComander

Page 26: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.
Page 27: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.
Page 28: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Tabla de Datos

Matemáticas Ciencias Español Historia EdFísica

Lucía 7 6.5 9.2 8.6 8

Pedro 7.5 9.4 7.3 7 7

Inés 7.6 9.2 8 8 7.5

Luis 5 6.5 6.5 7 9

Andrés 6 6 7.8 8.9 7.3

Ana 7.8 9.6 7.7 8 6.5

Carlos 6.3 6.4 8.2 9 7.2

José 7.9 9.7 7.5 8 6

Sonía 6 6 6.5 5.5 8.7

María 6.8 7.2 8.7 9 7

Estadísticas Básicas

Promedio 6.79 7.65 7.74 7.9 7.42

DesEstándar 0.90 1.53 0.82 1.06 0.88

Notas Escolares

Page 29: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

En RComander

Page 30: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Desde RComander

Page 31: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

En RComander

Page 32: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

La Matriz de Correlaciones

Page 33: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Gráficos en RComander

Page 34: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Histogramas

Page 35: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Identificando datos atípicos

Page 36: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Diagramas de Caja (Boxplots)

Una muy simple resumen de la distribución de los

datos.

Diagramas de caja son útiles para encontrar datos

atípicos (outlier)

outlier

10th percentile

25th percentile

75th percentile

50th percentile

90th percentile

Page 37: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Diagramas de Caja (Boxplots)

Por defecto, los diagramas de caja en R presentan el

máximo y el mínimo (si no son los valores atípicos)

en lugar de los percentiles 10 y 90 como lo hacen

algunos otros programas

outlier

10th percentile

25th percentile

75th percentile

50th percentile

90th percentile Máximo

Mínimo

Page 38: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Diagramas de Caja en RComander

Page 39: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Identificando datos atípicos

Page 40: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Identificando datos atípicos

Page 41: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.
Page 42: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.
Page 43: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Notas Escolares

Page 44: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.
Page 45: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

La Matriz de Correlaciones

Interpretación: 1. Correlaciones altas positivas implican que si

una variable crece la otra también crece. 2. Correlaciones altas negativas implican que

si una variable crece la otra también decrece y a la inversa.

3. Correlaciones cercanas a cero implican que no hay relación entre las variables

Page 46: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Interpretación geométrica del coeficiente de correlación

VARIABLES - COLUMNAS

Español

9.2

7.3

8.0

6.5

7.8

7.7

8.2

7.5

6.5

8.7

Page 47: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

q

X

Y

Cos(q) = R(X,Y)

Page 48: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

q

X Y

q = 0° implica que Cos(q) = R(X,Y) = 1

CASO 1:

q

X

Y

q = 90° implica que Cos(q) = R(X,Y) = 0

CASO 2:

Y

q = 180° implica que Cos(q) = R(X,Y) = -1 CASO 3:

q

X

Page 49: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Ejemplo: Servicio

al Cliente

Page 50: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

En RComander

Page 51: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

En RComander

Page 52: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

La Matriz de Correlaciones

Page 53: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Gráficos en RComander

Page 54: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Histogramas

Page 55: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Diagramas de Caja en Rcomander Identificando datos atípicos

Page 56: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Identificando datos atípicos

Page 57: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Identificando datos atípicos

Page 58: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Identificando datos atípicos

Page 59: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.
Page 60: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

¿Dónde obtener más información?

Page 61: Análisis Exploratorio de Datos¿cómo transformar variables cuantitativas en cualitativas? •La conversión de una variable cuantitativa en cualitativa se denomina categorización.

Gracias….