DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA
description
Transcript of DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIA
11
DIRECCIÓN DE ESTADÍSTICAS DE LA DIRECCIÓN DE ESTADÍSTICAS DE LA PROVINCIAPROVINCIA
INTRODUCCIÓN A LA INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVAESTADÍSTICA DESCRIPTIVA
Lazarte Víctor Fabio y Naidicz Paula LorenaLazarte Víctor Fabio y Naidicz Paula Lorena
22
MEDIDAS DE POSICIÓN Y DISPERSIÓNMEDIDAS DE POSICIÓN Y DISPERSIÓN
MEDIDAS DE POSICIÓN:MEDIDAS DE POSICIÓN:
Resumen la información referida de la posición de la muestra. Las Resumen la información referida de la posición de la muestra. Las
medidas de posición más utilizadas son: medidas de posición más utilizadas son: MediaMedia, , MedianaMediana, , ModaModa
y y CuartilesCuartiles, las tres primeras, media, mediana y moda son , las tres primeras, media, mediana y moda son
medidas de tendencia central.medidas de tendencia central.
Supongamos que los datos observados son: xSupongamos que los datos observados son: x11, x, x22, …, x, …, xnn..
MediaMedia:: es el promedio de los datos es el promedio de los datos
33
Ejemplo 1:Ejemplo 1: Las notas de un alumno son: 10, 8, 7, 9, 10, 7, 6. Las notas de un alumno son: 10, 8, 7, 9, 10, 7, 6.
Nota promedioNota promedio
En este caso la media es un buen representante del rendimiento En este caso la media es un buen representante del rendimiento
académico del alumno.académico del alumno.
La media tiene la propiedad de equilibrar los desvíos.La media tiene la propiedad de equilibrar los desvíos.
44
Ejemplo 2:Ejemplo 2: En el ejemplo de la cantidad de miembros de una En el ejemplo de la cantidad de miembros de una
familia de cierta ciudad.familia de cierta ciudad.
La cantidad promedio de miembros de una familia esLa cantidad promedio de miembros de una familia es
xxx xx xx xx xx xx xx xx xx xx x xx x x
x x x xx x x xx x x xx x x x x
x x x x x xx x x x x xx x x x x x x
x x x x x x x x xx x x x x x x x x
1 2 3 4 5 6 7 8 9 10
55
Existen casos en donde la media no es un buen representante del Existen casos en donde la media no es un buen representante del
conjunto de datos.conjunto de datos.
Ejemplo 3: Ejemplo 3: Una empresa tiene 5 empleados, sus sueldos en Una empresa tiene 5 empleados, sus sueldos en
pesos son: 1000, 1000, 1000, 1000, 10000. pesos son: 1000, 1000, 1000, 1000, 10000.
Entonces la media es Entonces la media es ::
El dueño de la empresa diría orgulloso El dueño de la empresa diría orgulloso ¡El sueldo promedio de los ¡El sueldo promedio de los
empleados mi empresa es de $ 2800 al mes!!empleados mi empresa es de $ 2800 al mes!!
Pero claramente, la media no es un buen representante de este Pero claramente, la media no es un buen representante de este
conjunto de datos, dado que hay 4 empleados que ganan sólo conjunto de datos, dado que hay 4 empleados que ganan sólo
1000 y sólo uno que gana 10000.1000 y sólo uno que gana 10000.
66
En general cuando la muestra tenga valores alejados o presente En general cuando la muestra tenga valores alejados o presente
asimetría, la media no será un buen representante del conjunto asimetría, la media no será un buen representante del conjunto
de datos.de datos.
Una medida de posición alternativa a la media sería la Una medida de posición alternativa a la media sería la MedianaMediana..
La Mediana:La Mediana: Es el valor central de la muestra ordenada.Es el valor central de la muestra ordenada.
Si la cantidad de datos es impar, la mediana es el valor Si la cantidad de datos es impar, la mediana es el valor
central de la muestra ordenada.central de la muestra ordenada.
Si la cantidad de datos es par, la mediana es el promedio de Si la cantidad de datos es par, la mediana es el promedio de
los dos datos centrales de la muestra ordenada.los dos datos centrales de la muestra ordenada.
77
Ejemplos Ejemplos
Para n impar.Para n impar.
Notas de un alumno A: 10, 8, 7, 9, 10, 7, 6.Notas de un alumno A: 10, 8, 7, 9, 10, 7, 6.
Datos ordenados: 6, 7, 7, Datos ordenados: 6, 7, 7, 88, 9, 10, 10. , 9, 10, 10.
La mediana de las notas es 8. Notación: La mediana de las notas es 8. Notación:
Para n parPara n par
Notas de un alumno B: 10, 8, 7, 9, 10, 7, 6, 9.Notas de un alumno B: 10, 8, 7, 9, 10, 7, 6, 9.
Datos ordenados: 6, 7, 7, Datos ordenados: 6, 7, 7, 88, , 99, 9, 10, 10. , 9, 10, 10.
La mediana de las notas es: La mediana de las notas es:
88
En el ejemplo de la empresa con 5 empleados la mediana sería En el ejemplo de la empresa con 5 empleados la mediana sería
igual a igual a $ 1000$ 1000, por lo tanto sería un mejor representante del , por lo tanto sería un mejor representante del
conjunto de datos.conjunto de datos.
La mediana no es afectada por valores alejados ni es afectada La mediana no es afectada por valores alejados ni es afectada
por asimetría.por asimetría.
Cuartiles:Cuartiles: En cierta forma, dividen el lote de datos ordenado en En cierta forma, dividen el lote de datos ordenado en
cuatro partes iguales.cuatro partes iguales.
Para calcular los cuartiles, se toma la primera mitad de la Para calcular los cuartiles, se toma la primera mitad de la
muestra ordenada y se calcula la mediana de este conjunto que muestra ordenada y se calcula la mediana de este conjunto que
será el primer cuartil, para el tercer cuartil se trabaja igual con será el primer cuartil, para el tercer cuartil se trabaja igual con
los datos de la segunda mitad. los datos de la segunda mitad.
99
Ejemplos Ejemplos
Para n imparPara n impar
Datos ordenados: 6, 7, 7, Datos ordenados: 6, 7, 7, 88, 9, 10, 10. , 9, 10, 10.
Primer cuartil: Primer cuartil: QQ1 1 = 7= 7 Tercer cuartil: Tercer cuartil: QQ3 3 = 9,5= 9,5
Para n parPara n par
Datos ordenados: 6, 7, 7, Datos ordenados: 6, 7, 7, 88, , 99, 9, 10, 10. , 9, 10, 10.
Primer cuartil: Primer cuartil: QQ1 1 = 7= 7 Tercer cuartil: Tercer cuartil: QQ3 3 = 9,5= 9,5
1010
En el ejemplo de la empresa con 5 empleados los datos son:En el ejemplo de la empresa con 5 empleados los datos son:
1000, 1000, 1000, 1000, 100001000, 1000, 1000, 1000, 10000
Así la moda es igual a Así la moda es igual a $ 1000$ 1000, por lo tanto sería un buen , por lo tanto sería un buen
representante del conjunto de datos.representante del conjunto de datos.
Moda:Moda: Es el dato más frecuente (si es que este existe) Es el dato más frecuente (si es que este existe)
En los ejemplos de las notas del alumno no existe la moda En los ejemplos de las notas del alumno no existe la moda
por que hay varios datos que se repiten dos veces.por que hay varios datos que se repiten dos veces.
6, 7, 7, 6, 7, 7, 88, 9, 10, 10, 9, 10, 10
1111
En el ejemplo de la En el ejemplo de la cantidad de miembros de una familiacantidad de miembros de una familia
¿Cuál sería la moda?¿Cuál sería la moda?
Cantidad de miembros
Cantidad de familias
Porcentajes % acumulado
1 2 2,5 % 2,5 %
2 5 6,3 % 8,8 %
3 9 11,3 % 20,0 %
4 22 27,5 % 47,5 %
5 20 25,0 % 72,5 %
6 11 13,8 % 86,3 %
7 6 7,5 % 93,8 %
8 3 3,8 % 97,5 %
10 2 2,5 % 100,0 %
Total 80 100,0 %
Moda Moda
Mediana Mediana
1212
MEDIDAS DE DISPERSIÓNMEDIDAS DE DISPERSIÓN
Ejemplo :Ejemplo :
Notas del alumno Juan: 6, 6, 8, 10, 10.Notas del alumno Juan: 6, 6, 8, 10, 10.
Notas del alumno Pedro: 8, 8, 8, 8, 8.Notas del alumno Pedro: 8, 8, 8, 8, 8.
La nota promedio de los dos alumnos es 8, sin embargo La nota promedio de los dos alumnos es 8, sin embargo
claramente su desempeño no es igual.claramente su desempeño no es igual.
¿Cómo los comparo? ¿Cuál es la diferencia?¿Cómo los comparo? ¿Cuál es la diferencia?
Una medida de dispersión es una medida de cuan alejados están Una medida de dispersión es una medida de cuan alejados están
los datos del centro de la distribución, ya sea que se tome como los datos del centro de la distribución, ya sea que se tome como
centro a la media o a la mediana de los datoscentro a la media o a la mediana de los datos
1313
Varianza muestral:Varianza muestral:
La varianza es el promedio de los desvíos al cuadrado, es decir, La varianza es el promedio de los desvíos al cuadrado, es decir,
se mide la distancia de cada dato a la media, se la eleva al se mide la distancia de cada dato a la media, se la eleva al
cuadrado y se las promedia.cuadrado y se las promedia.
Desviación Estándar:Desviación Estándar: es la raíz cuadrada positiva de la varianza. es la raíz cuadrada positiva de la varianza.
1414
Ejemplo:Ejemplo:
Notas del alumno Juan: 6, 6, 8, 10, 10.Notas del alumno Juan: 6, 6, 8, 10, 10.
La media es 8 por lo tanto los desvíos son: -2, -2, 0, 2, 2, los La media es 8 por lo tanto los desvíos son: -2, -2, 0, 2, 2, los
desvíos al cuadrado son: 4, 4, 0, 4, 4.desvíos al cuadrado son: 4, 4, 0, 4, 4.
La varianza será:La varianza será:
Desviación Estándar: Desviación Estándar:
Para el alumno Pedro naturalmente la varianza y la desviación Para el alumno Pedro naturalmente la varianza y la desviación
estándar serán iguales a cero.estándar serán iguales a cero.
1515
Coeficiente de variaciónCoeficiente de variación
El coeficiente de variación es una medida de la magnitud de la El coeficiente de variación es una medida de la magnitud de la
dispersión en relación a la media.dispersión en relación a la media.
Estas tres medidas toman como centro a la media, por lo tanto Estas tres medidas toman como centro a la media, por lo tanto
están asociadas a ella.están asociadas a ella.
Si el lote de datos es simétrico y no tiene valores alejados, Si el lote de datos es simétrico y no tiene valores alejados,
utilizaremos a la media y la desviación estándar para describir utilizaremos a la media y la desviación estándar para describir
el conjunto de datos.el conjunto de datos.
1616
Una medida de dispersión asociada a la mediana es el Una medida de dispersión asociada a la mediana es el Rango Rango
IntercuartilIntercuartil. .
El El Rango intercuartilRango intercuartil es simplemente la diferencia entre el primer es simplemente la diferencia entre el primer
y el tercer cuartil: y el tercer cuartil: RI = Q3 – Q1RI = Q3 – Q1
Si el conjunto de datos es simétrico y no tiene valores alejados Si el conjunto de datos es simétrico y no tiene valores alejados
se recomienda utilizar a la media como medida de posición con se recomienda utilizar a la media como medida de posición con
la desviación estándar como medida de dispersión.la desviación estándar como medida de dispersión.
Si el conjunto de datos es asimétrico o tiene valores alejados se Si el conjunto de datos es asimétrico o tiene valores alejados se
recomienda utilizar a la mediana como medida de posición con recomienda utilizar a la mediana como medida de posición con
el rango intercuartil como medida de dispersión.el rango intercuartil como medida de dispersión.
1717
¿Cómo analizo simetría?¿Cómo analizo simetría?
GráficamenteGráficamente
Coeficiente de asimetría:Coeficiente de asimetría:
Figura 5: Figura 5: Ejemplo de una distribución asimétrica positivaEjemplo de una distribución asimétrica positiva
0
10
20
30
40
50
60
70
80
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
1000
0
1100
0
1200
0
Fre
cuen
cias
1818
Valores alejados:Valores alejados: Estos son valores observados que se apartan Estos son valores observados que se apartan
demasiado del resto de la muestra. Para detectarlos se puede demasiado del resto de la muestra. Para detectarlos se puede
utilizar la siguiente regla: utilizar la siguiente regla:
Si un valor Si un valor xxii de la muestra es menor que de la muestra es menor que QQ11 – 1.5 (Q – 1.5 (Q33 – Q – Q11)) , ,
entonces entonces xxii es alejado por defecto. es alejado por defecto.
Si un valorSi un valor x xii de la muestra es mayor que de la muestra es mayor que QQ33 + 1.5 (Q + 1.5 (Q33 – Q – Q11)) , ,
entoncesentonces x xii es alejado por exceso. es alejado por exceso.
No significa que haya que descartar ese dato, significa que hay No significa que haya que descartar ese dato, significa que hay
que estudiar ese caso y usar medidas que no se vean que estudiar ese caso y usar medidas que no se vean
afectadasafectadas por valores alejados. por valores alejados.
1919
Diagrama de tipo caja:Diagrama de tipo caja:
Se deben calcular mínimo y máximo, mediana, Q1 , Q3 y Detectar Se deben calcular mínimo y máximo, mediana, Q1 , Q3 y Detectar
valores alejadosvalores alejados
Figura 5:Figura 5: Peso en gramos de los recién nacidos en un cierto periodo de Peso en gramos de los recién nacidos en un cierto periodo de
una cierta ciudad.una cierta ciudad.
4500
3500
2500
1500
Pe
so e
n g
r.
2020
Diagrama de tipo caja:Diagrama de tipo caja:
Figura 5:Figura 5: Cantidad de miembros de una familia. Cantidad de miembros de una familia.
02
46
81
0C
antid
ad
de m
iem
bro
s