ESTADÍGRAFOS DE POSICIÓN Y DISPERSIÓN
UNIDAD III
ESTADÍGRAFOS DE POSICIÓN Y DISPERSIÓN
Tendencia central Dispersión
Datos no agrupados
Recorrido
Desviación media absolutaVarianza y desviación típica
Percentiles
Datos agrupados
Percentiles
Varianza y desviación típica
Datos no agrupados
Media aritmética
Mediana
Moda
Media aritmética ponderada
Media geométrica
Datos agrupados
Media aritmética
MedianaModa
Conceptos relacionados
Teorema de Chebyshev
Regla empírica Sesgo Coeficiente de variación
Medidas de la
tendencia
central y de la dispersi
ón
Las medidas de tendencia
central ttienen como
objetivo el sintetizar los datos
en un valor representa
tivo, las medidas de dispersión nos dicen hasta que
punto estas
medidas de tendencia
central son representativas como síntesis de
la informació
n. Las medidas de dispersión cuantifican
la separación
, la dispersión,
la variabilida
d de los valores de
la distribución respecto
al valor central.
Distinguimos entre
medidas de dispersión absolutas, que no son comparables entre
diferentes muestras y
las relativas que nos
permitirán comparar
varias muestras.
Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización.
MEDIA ARITMET
ICA
EjemploLos pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el
peso medio.
Es el valor resultante que se obtiene al dividir la
sumatoria de un conjunto de datos sobre el número
total de datos. Solo es aplicable para el
tratamiento de datos cuantitativos.
MEDIANA Ejempl
o: Encontrar la
mediana para los siguientes
datos:4 1 2 3 4 2 2 1
5 5 3SOLUCIÓN
1: Ordenar los datos.
1 1 2 2 2 3 3 4 4 5 5
2: Localizar el valor que divide
en dos parte iguales el número de
datos.1 1 2 2 2 3 3 4
4 5 5La mediana es 3, dejando 5 datos a cada
lado.
Mediana (Me): Valor que divide una serie de
datos en dos partes iguales. La cantidad de datos que queda por
debajo y por arriba de la mediana son iguales.
MODA
ejemplo: “hallar la moda del siguiente
conjunto de datos.”
14,15,16,18,5,7,5,9,15,5. se ordenan:
5,5,5,7,9,14,15,15,16,18. la moda es igual a 5..
La moda es el valor que se presenta con
mayor frecuencia en un
conjunto de datos. a una
distribucion que tiene una sola
moda se le denomina
unimodal, si tiene dos datos que se repiten igualmente, se le conoce como
bimodal, y si tiene tres o mas
modas se le conoce como multimodal. si ningun dato se
repite, entonces no tiene moda.
MEDIA GOMETRI
CA
Por ejemplo, la media
geométrica de 2 y 18 es
En matemáticas y estadística, la media geométrica de una
cantidad arbitraria de números (digamos n números) es la raíz n-ésima del producto de
todos los números.
DATOS AGRUPADOS
En la mayor parte de casos tenemos un número grande de datos y
tomamos en cuenta que en estos casos generalmente los datos son
resumidos en una tabla de frecuencia. La fórmula para el
cálculo cuando se trata de datos agrupados es diferente a la de los no
agrupados.
MEDIA ARITMET
ICA
Si los datos vienen
agrupados en una tabla de frecuenci
as, la expresión
de la media
es:
La media aritmética es igual a la división de la sumatoria del
producto de las clases por la
frecuencia sobre el número de datos.
MEDIANA
EJEMPLOLas
calificaciones en la
asignatura de
Matemáticas de 39
alumnos de una clase
viene dada por la
siguiente tabla:
Calificaciones 1 2 3 4 5 6 7 8 9 Número de alumnos 2 2 4 5 8 9 3 4
2 Se halla las frecuencias absolutas
acumuladas .Asociada a la
mediana para n impar, se obtiene .Ni-1< n/2 < Ni = N19 < 19.5 < N20
Me = 5 puntos, la
mitad de la clase ha
obtenido un 5 o menos, y la otra mitad un 5 o más.
En el ámbito de la
estadística, una
mediana es el valor de la variable que
deja el mismo
número de datos antes y después que él, una vez ordenados
estos.
MODAEjemplo
Encontrar la estatura
modal de un grupo que se
encuentra distribuido de la siguiente
forma:Entre 1.80 y 1.70 hay 6
estudiantes.Resolviendo:
Se suma 0.075 (la distancia parcial) a
1.60 (el límite inferior),
obteniéndose la moda.
la moda es la
observación que se
presenta mas a
menudo, se encontrara en la clase
de frecuencia mas alta. Esta clase de máxima frecuencia se llama
clase modal.
MEDIDAS DE DISPERSIÓN
Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que
permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables
cuantitativas.
La dispersión es importante porque:
Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.
Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
Desviación media absoluta
La desviación media es la media de las diferencias en valor absoluto de los valores a la media.
Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha función al no ser derivable.Siendo más formales, la desviación media debería llamarse desviación absoluta respecto a la media, para evitar confusiones con otra medida de dispersión, la desviación absoluta respecto a la mediana, DM, cuya fórmula es la misma, sustituyendo la media aritmética por la mediana M. Pero tal precisión no es relevante, porque la desviación absoluta respecto a la mediana es de uso todavía menos frecuente.
Ejemplo: Desviación media para datos no agrupadosTres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al alumno más idóneo para representar al colegio en un torneo a nivel nacional.El número de preguntas buenas por materia se muestra a continuación:
Materia Carlos Pedro Juan
1 2 7 52 9 2 63 10 2 54 2 6 55 3 6 56 1 3 57 9 6 48 9 7 59 1 6 610 4 5 4
SOLUCIÓNLo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinar el alumno con mayor promedio de preguntas buenas.Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. ¿Cuál sería entonces el indicador diferenciador entre los alumnos?.Complementemos el análisis anterior calculando la desviación media:Carlos muestra una desviación media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variación (2,9), siendo Juan el que menos variación presenta con 0,9 preguntas tanto por arriba como por debajo de la media aritmética. Se recomienda al colegio elegir como ganador en este caso a Juan, presenta resultados más constantes que los otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una variación muy baja (rondando entre 4 y 6).
CENTILES O PERCENTILE
S
Los percentiles son, tal vez, las medidas
más utilizadas para
propósitos de ubicación o clasificación
de las personas cuando
atienden características
tales como peso,
estatura, etc. Los
percentiles son ciertos
números que dividen la
sucesión de datos
ordenados en cien partes
porcentualmente iguales.
Estos son los 99 valores
que dividen en cien partes
iguales el conjunto de
datos ordenados.
Los percentiles (P1, P2,...
P99), leídos primer
percentil,..., percentil 99.
DATOS AGRUPADOS
En la mayor parte de casos tenemos un número grande de datos y
tomamos en cuenta que en estos casos generalmente los datos son
resumidos en una tabla de frecuencia. La fórmula para el
cálculo cuando se trata de datos agrupados es diferente a la de los no
agrupados.
PERCENTILES:
Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.
Para datos agrupados los deciles se calculan mediante la fórmula.
k= 1,2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Salarios No. De fa(I. De Clases) Empleados (f1)200-299 85 85300-299 90 175400-499 120 295500-599 70 365600-699 62 427700-800 36 463
EJEMPLO.- Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla:Como son datos agrupados, se utiliza la fórmula
Como son datos agrupados, se utiliza la fórmula
Siendo
El cuadrado de la desviación estándar recibe el nombre de varianza y se representa por . La suma de los cuadrados de los desvíos de la totalidad de las observaciones, respecto de la media aritmética de la distribución, es menor que la suma de los cuadrados de los desvíos respecto de cualquier otro valor que no sea la media aritmética.
Varianza
El coeficiente de variación:
Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón.
Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón.
El coeficiente de variación
Para comparar la dispersión de variables que aparecen en unidades diferentes (metros, kilos, etc.) o que corresponden a poblaciones extremadamente desiguales, es necesario disponer de una medida de variabilidad que no dependa de las unidades o del tamaño de los datos. Este coeficiente únicamente sirve para comparar las dispersiones de variables correspondientes a escalas de razón. Una manera de construir una medida de variabilidad que cumpla los requisitos anteriores es el llamado coeficiente de variación
(las barras del denominador representan el valor absoluto, es decir, indican que debe prescindirse de la unidad de medida de la media). A menor coeficiente de variación consideraremos que la distribución de la variable medida es más homogénea.
Ejemplo: Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor dispersión?
Top Related