Tema 18 Estadistica Unidimensional
description
Transcript of Tema 18 Estadistica Unidimensional
Muestra
Población: es el conjunto de todos los elementos que cumplen unacaracterística.Muestra: cualquier subconjunto de la población.Muestreo aleatorio: proceso mediante el cual se extrae una muestrarepresentativa de la población.
Población
Estrato 1 Estrato 2
Para que una muestra sea representativa de la población se elegirá de modo que:• Sea aleatoria.• Los individuos en la muestra conserven la misma proporción que en la población.
1. Población y muestra
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
Carácter estadístico: es una propiedad que permite clasificar a los individuosde la población.
Caracteres estadísticos
Cualitativos
Cuantitativos
: no se pueden medir.
: se pueden medir.
Dentro de él se pueden establecer modalidades.
2. caracteres estadísticos
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
Variable estadística: es el conjunto de valores que toma un carácterestadístico cuantitativo.
Variable estadística
Discreta
Continua
: toma valores aislados.
: puede tomar infinitos valoresdentro de un intervalo.
3. Variables estadísticas
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
• En caso de que la variable sea continua, o discreta con un número de datos• muy grande, resulta aconsejable agrupar los datos en intervalos (clases).• El punto medio de cada clase recibe el nombre de marca de clase.• Los intervalos se deben hacer de manera que el extremo superior de cada• clase coincida con el extremo inferior de la siguiente.
Se han anotado las tallas en cm de los 36 alumnos de una clase. Se han obtenido:168, 168, 159, 160, 163, 156, 164, 160, 164, 171, 169, 166, 169, 163, 160, 154,174, 165, 161, 162, 157, 170, 166, 164, 162, 157, 158, 170, 159, 172, 167, 161,178, 169, 177, 169.Al agrupar los datos en 6 intervalos de amplitud 5 cm se obtuvo:
4. Intervalos. Marca de clases y tabla de frecuencia
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
Talla en cm. Recuento Marcas declase
Número dealumnos
[150–155) / 152,5 1[155–160) / / / / / / 157,5 6[160–165) / / / / / / / / / / / / 162,5 12[165–170) / / / / / / / / / / 167,5 10[170–175) / / / / / 172,5 5[175–180) / / 177,5 2
• Frecuencia absoluta (fi) del valor xi: es el número de veces que se repite• ese valor.• Frecuencia relativa (hi) del valor xi: es el cociente entre la frecuencia• absoluta de xi y el número total de datos que intervienen en la distribución.
ClasesMarcas
xi
Frecuenciaabsoluta
fi
Frecuenciarelativa
hi
[150–155) 152,5 11
16
[155–160) 157,5 66
16
[160–165) 162,5 1212
16
[165–170) 167,5 1010
16
[170–175) 172,5 55
16
[175–180) 177,5 22
16
5. Tablas de frecuencias absolutas y relativas
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
• Frecuencia absoluta acumulada (Fi) del valor xi: es la suma de las• frecuencias absolutas de los valores anteriores o iguales a xi.• Frecuencia relativa acumulada (Hi) del valor xi: es la suma de las• frecuencias absolutas relativas de los valores anteriores o iguales a xi.
ClasesMarcas
xi
Frecuenciaabsoluta
fi
Frecuenciarelativa
hi
Frecuenciaabsoluta
acumuladaFi
Frecuenciarelativa
acumuladaHi
[150–155) 152,5 11
161
1
16
[155–160) 157,5 66
167
7
16
[160–165) 162,5 1212
1619
19
16
[165–170) 167,5 1010
1629
29
16
[170–175) 172,5 55
1634
34
16
[175–180) 177,5 22
1636 1
6. Tablas de frecuencias absolutas y relativas acumuladas
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
7. Porcentajes
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
Clases Marcasxi
Frecuencia absoluta
fi
Frecuenciarelativa
hi
Frecuenciaabsoluta
acumuladaFi
Frecuenciarelativa
acumuladaHi
Porcentajespi =
Porcentajesacumulados
Pi =
[150–155) 152,5 1 0,028 1 0,028 2 2[155–160) 157,5 6 0,17 7 0.198 17 19[160–165) 162,5 12 0,33 19 0,528 33 52[165–170) 167,5 10 0,28 29 0,806 28 80[170–175) 172,5 5 0,14 34 0,944 14 94[175–180) 177,5 2 0,056 36 1 5 100
• Se utilizan para comparar las modalidades de un carácter mediante sectores• circulares.• El ángulo central de un sector ha de ser proporcional a la frecuencia absoluta• correspondiente.
¿Qué importancia le das a tu trabajo? ¿Qué importancia le das a tu tiempo libre?
8. Diagrama de sectores
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
Se utilizan para comparar datos cualitativos o cuantitativos discretos.
9. Diagrama de barras
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
Se utilizan para distribuciones de variables estadísticas continuas o paradistribuciones de variables estadísticas discretas con un gran número de datosy agrupados en clases.
10. Histograma y polígono de frecuencias
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
La media aritmética de una variable agrupada en clases es:
i i i i1 1 2 2 n n
1 2 n i
x f x fx f x f ... x fx
f f ... f f N
ClasesMarcas
xi
Frecuenciaabsoluta
fi
xi f i
[150–155) 152,5 1 152,5[155–160) 157,5 6 945[160–165) 162,5 12 1950[165–170) 167,5 10 1675[170–175) 172,5 5 862,5[175–180) 177,5 2 355
36 5940
5940x 165 cm
36
11. Parámetros de centralización. Media
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
Para calcular la moda de una variable estadística agrupada en clases se toma como valor aproximado de la moda la marca de la clase que presenta mayor frecuencia absoluta. Esta clase se llama clase modal.
ClasesMarcas
xi
Frecuenciaabsoluta
fi
[150–155) 152,5 1[155–160) 157,5 6[160–165) 162,5 12[165–170) 167,5 10[170–175) 172,5 5[175–180) 177,5 2
36
Mo = 162,5 cm
12. Parámetros de centralización. Moda
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
• La mediana separa los datos ordenados de menor a mayor en dos intervalos con el mismo número de datos.
• Si los datos están agrupados, el intervalo o clase mediana es el primer intervalo cuya frecuencia absoluta acumulada es mayor que la mitad del número de datos y la mediana es la marca de la clase mediana.
ClasesMarcas
xi
Frecuenciaabsoluta
fi
Frecuenciaabsoluta
acumuladaFi
[150–155) 152,5 1 1[155–160) 157,5 6 7 < 18[160–165) 162,5 12 19 > 18[165–170) 167,5 10 29[170–175) 172,5 5 34[175–180) 177,5 2 36
M = 162,5 cm
13. Parámetros de centralización. Mediana
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
Los cuartiles separan los datos en cuatro grupos de la manera siguiente:
1 1 2 2 2 3 3 3 3 4 4 4 4 4 5 5 5 6 6 7 7 7 7 8 9 9
Q1 Q2 Q3
xi fi Fi Hi
1 2 2 0,082 3 5 0,193 4 9 0,354 5 14 0,545 3 17 0,656 2 19 0,737 4 23 0,888 1 24 0,929 2 26 1
Q1: es el primer valor que superaa la cuarta parte de los datos
Q2: es el valor de la mediana
Q3: es el primer valor que superaa las tres cuartas partes de los datos
14. Cuartiles
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
Se llama desviación media de una variable estadística X a la media aritmética de losvalores absolutos de las desviaciones respecto a la media.
i i i i
i
f | x x | f | x x |DM
f N
ClasesMarcas
xi
Frecuenciaabsoluta
fi
xi – | x i – | fi | x i – |
[150–155) 152,5 1 –12,5 12,5 12,50[155–160) 157,5 6 –7,5 7,5 45,00[160–165) 162,5 12 –2,5 2,5 30,00[165–170) 167,5 10 2,5 2,5 25,00[170–175) 172,5 5 7,5 7,5 37,00[175–180) 177,5 2 12,5 12,5 25,00
36 175,00
175DM 4,86 cm
36
15. Parámetros de dispersión. Desviación media
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
Se llama varianza de la variable estadística X a la media aritmética de los cuadradosde las desviaciones respecto de la media. A su raíz cuadrada se le llama desviacióntípica. 2 2
i i i i2 2
i i
f (x x) f xs x
f f
ClasesMarcas
xi
Frecuenciaabsoluta
fi
xi2 fi xi
2
[150–155) 152,5 1 23256 23256[155–160) 157,5 6 24804 148838[160–165) 162,5 12 26406 316875[165–170) 167,5 10 28056 280563[170–175) 172,5 5 29756 148781[175–180) 177,5 2 31506 63013
36 981325
2 2i i i i 2
i i
f (x x) f xs x
f f
2
i i2 2
i
2 2
f xs x
f
981325165 34,03 cm
36
s 34,03 5,83 cm
16. Parámetros de dispersión. Varianza y desviación típica
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández
En distribuciones unimodales y bastante simétricas se verifica que:
• En el intervalo se encuentra aproximadamente el 68% de los datos.• En el intervalo se encuentra aproximadamente el 95% de los datos.• En el intervalo se encuentra aproximadamente el 99% de los datos.
(x s, x s) (x 2s, x 2s) (x 3s, x 3s)
68% 95% 99%
17. Distribución de los datos respecto a la media
MATEMÁTICAS 4 ESO TEMA 18. ESTADÍSTICA UNIDIMENSIONAL Javier Fernández