Post on 27-Jan-2017
Dr. Mayhuasca Salgado RonaldDocente
Medidas de posición
relativa
ESTADÍSTICA
2016-II
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE PSICOLOGÍA
• Conocer y determinar las medidas de posición relativas como
las cuantilas: deciles, percentiles y cuartiles, de un conjunto
de datos dispersos o agrupados.
• Elaborar e interpretar el gráfico de caja y bigote de un conjunto
de datos
Propósito
Medidas de tendencia central
ESTADÍSTICA DESCRIPTIVA
Nos informan de los valores centrales hacia los que se dirige la distribución: media, mediana y moda
Medidas de posición
Nos localizan un dato determinado dentro de la serie, informándonos acerca de la propia distribución: mediana y percentiles
Medidas de dispersión
Nos informan de los valores centrales hacia los que se dirige la distribución: rango, desviación media, desviación típica, varianza y coeficiente de variación de Pearson
Mald
on
ado
M. M
edicin
a Preven
tiva. Bio
estadística y ep
idem
iolo
gia. Españ
a: Cu
rso
inten
sivo M
IR A
sturias; 2
01
1
Mald
on
ado
M. M
edicin
a Preven
tiva. Bio
estadística y ep
idem
iolo
gia. Españ
a: Cu
rso
inten
sivo M
IR A
sturias; 2
01
1
…Los percentiles son estadísticos de posición que dividen el número de observaciones de la distribución en partes porcentuales acumulativas…
Son llamados también de orden por que requieren un ordenamiento ascendente
Estadística Descriptiva
• Organización de datos• Representación de datos: Tablas y Gráficos• Medidas de resumen
• Medición de datos numéricos1. Medidas de tendencia central2. Medidas de dispersión3. Medidas de posición relativa4. Medidas de forma
• Medición de datos nominales1. Proporción2. Razón3. Medición epidemiológica
Son medidas útiles para comparar valores de diferentes
conjuntos de datos o dentro del mismo conjunto de
datos.
En estas medidas se incluyen a los cuartiles (Q) y
percentiles (p) que dividen al conjunto de datos que han
sido ordenados en proporciones diferentes.
Medidas de posición relativa
Es un valor en el recorrido de la variable en el que se acumula una
porción p de datos con medida máxima el valor de la cuantila, o
sea un porcentaje (px100) de datos, toma medidas menores o
iguales a Xp y el resto toma medidas mayores o iguales a Xp.
A las cuantilas se les denomina de manera particular según la
porción acumulada a la izquierda del punto.
- Decil: di
- Cuartil: qi
- Percentil: pi
- Mediana: Me=X0,50
Cuantiles o cuantila (Xp)
Cuartil (qi) q1=X0,25 ; q2=X0,50 ; q3= X0,75
Son puntos que dividen al conjunto de datos en 4 partes donde
cada uno acumula el 25% de datos, por ejemplo:
De los siguientes 60 datos:
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,25
X0,50
X0,75
Cuartil (qi)
Interpretación: Indica que el 25% de las personas tienen hasta 24
años de edad, y que a lo más el 75% posee a lo más hasta 38
años, es decir el 50% tienen entre 24 y 38 años.
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
q1=X0,15 ; q2=X0,30 ; q3= X0,45 n=60
p1=X0,01 ; p2=X0,02 … p99= X0,99
Son puntos que dividen al conjunto de datos en 100 partes donde
cada uno acumula el 1% de datos, por ejemplo:
De los siguientes datos:
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,11
X0,32
X0,45
Percentil (pi)
Indica que 11% de las personas tiene un máximo de 21 años y que
el 32% de individuos poseen hasta 32años, también diremos que el
65% de individuos tiene más de 38 años y que el 34% de personas
poseen entre 21 y 38 años :
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,11
X0,32
X0,45
p11=X0,11 = 21p32=X0,32 = 32p45= X0,45 = 38
Percentil (pi)
Percentil (pi)
“Px=y” significa que hay un “x” % de individuos
con menor o igual valor que “y”
“P80=30cm” significa que hay un “80” % de
individuos con menor o igual valor que “30”; o que
el 20% tienen más de 30cm
Cálculo de las cuantilas
𝑋𝑝 = 𝑋(𝑘)
• Si k no es entero redondear al entero superior
Donde:k = n x p
Luego de ordenas los datos ascendentemente se determina la cuantila p como el lugar que ocupa el lugar «k»
a. Para datos no agrupados
Sea la variable edad:
Varones:
𝑋0,50 = 31 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 30)
𝑋0,25 = 24 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 15)
𝑋0,75 = 38 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 45)
Cálculo de las cuantilas
La cuantila será al percentildeseado si:
Fj ≥ n* p
F j-1 ≤ n*p
Consideramos las fi y las Fi
b. Para datos agrupados por conteo individual
Ejemplo
De la siguiente tabla determine los percentiles 10, 25, , 50, 75, 90 y 05
Categorías f
0123456
48
111510133
Cálculo de las cuantilas
b. Para datos agrupados por conteo individual
De la siguiente tabla determine los percentiles 10, 25, 50, 75 y 95
Categorías f
0123456
48
111510133
P10 = 1 pues n*p = 64 x 0,10 = 6,4
P25 = 2 pues n*p = 64 x 0,25 = 16
P75 = 4 pues n*p = 64 x 0,75 = 48
P95 = 5 pues n*p = 64 x 0,95 = 60,8
Cálculo de las cuantilas
• Se determina el intervalo quecontiene a la cuantila Xpcomo el intervalo j:
Consideramos las fi y las Fi
c. Para datos agrupados en intervalos
Usamos la siguiente fórmula:
𝑋𝑝 = 𝐿𝑗𝑖 + 𝑐(𝑛 . 𝑝 − 𝐹𝑗−1)
𝑓𝑗
𝐹𝑗−1Frecuencia absoluta acumulada anterior a la clase cuantila j
𝐿𝑗𝑖
Frontera de la clase intervalo j (el puntomedio entre los extremos consecutivospara intervalos discretos) o límite inferiorpara intervalos continuos
Cálculo de las cuantilas
• Del siguiente cuadroobtengamos los percentiles,25, 50 y 75
Ejemplo
c. Para datos agrupados en intervalos
Edad fi
20-2930-3940-4950-5960-6970-79
56
10521
Cálculo de las cuantilas
c. Para datos agrupados en intervalos
Edad fi
20-2930-3940-4950-5960-6970-79
56
10521
𝑋25 = 29,5 + 10(29 ∗0,25 −5)
6= 33,5 años
𝑋50 = 39,5 + 10(29 ∗0,50 −11)
10= 43 años
𝑋75 = 49,5 + 10(29 ∗0,75 −21)
2= 53,25 años
El percentil 90 de la talla de los recién nacidos de una determinada
población es 53cm. Esto quiere decir que:
1. El 90% de los recién nacidos miden más de 53cm.
2. El 10% de los recién nacidos miden más de 53 cm
3. El 90% de los recién nacidos miden 53cm
4. El 10% de los recién nacidos miden 53cm o más
5. El 90% de los recién nacidos miden 53cm o más
MIR 93
Un niño de 10 años pesa 40 kg. Al consultar las curvas de crecimiento
infantil se observa que corresponde al percentil 90 desde el punto de vista
del crecimiento. ¿Cuál de las siguientes afirmaciones es correcta?:
1. El 90% de los niños de 10 años tienen un peso igual o superior a 40 kg
2. El 90% de los niños de 10 años pesa alrededor de 40 kg
3. Se tiene el 90% de confianza de que el peso medio de los niños de 10 años
es de 40 kg
4. Existe un 90% de probabilidades de que un niño de 10 años pese más de
40 kg
5. El 90% de los niños de 10 años tienen un peso igual o menor a 40 kg
MIR 95
Al consultar la distribución de peso en una muestra de sujetos adultos, se
aprecia que el percentil 25 corresponde a 65 kg. ¿Cuál de las siguientes
afirmaciones es correcta?:
1. El 25 % de sujetos de la muestra pesan aproximadamente 65 kg
2. El 25 % de los sujetos de la muestra tienen un peso igual o superior a 65 kg
3. Para poder interpretar este valor, es necesario conocer la desviación
estándar de la distribución
4. Para poder interpretar este valor, es necesario conocer la media de la
distribución
5. El 25% de los sujetos de la muestra tienen un peso igual o inferior a 65 kg
MIR 97
Análisis exploratorio de datos
Es el proceso de usar herramientas estadísticas (sean gráficas,medidas de tendencia central y de dispersión) con la finalidad deobservar la disposición y otras características de uno o variosconjuntos de datos
Gráfico de caja y bigotes (box plot)
Son útiles para expresar la tendencia central de los datos, sudispersión, simetría y presencia de valores extremos
Para su construcción se requieren los valores mínimos y máximos,mediana, cuartil 1 y 3.
Permite la identificación e incorporación de valores atípicos
Q1 Q2 Q3Vm VM
Valores atípicos
Son datos que son distantes o numéricamente extremos del resto de los datos
Podrían distorsionar nuestras observaciones si no son tomados en cuentacomo tal.
Si en un análisis de los valores de creatinina de 15 pacientes, la mayoría deellos posee entre 0,8mg/dl y 1,05 mg/dl excepto uno de ellos que posee1,45mg/dl; tal vez su mediana es 0,97…pero su media será 1,28mg/dl
A valores extremos la mediana representa mejor la distribución de los datos
Tipos de valores atípicos
Al conocer los valores de Q1, Q3 y los rangos intercuartílicos sepueden hallar los siguientes valores atípicos:
Valores atípicos leves Valores atípicos extremos
𝑄1 − 1,5 𝑥 𝑅𝐼𝐶Min =
𝑄3 + 1,5 𝑥 𝑅𝐼𝐶Max =
𝑄1 − 3 𝑥 𝑅𝐼𝐶Min =
𝑄3 + 3 𝑥 𝑅𝐼𝐶Max =
Rango intercuartílico
Es la diferencia entre el cuartil tres (Q3) y el cuartiluno (Q1), se representa por:
RIC= Q3 – Q1
Desviación intercuartil
Es una medida que acompaña a la mediana en ladescripción de datos:
𝑸𝟑 −𝑸𝟏
2
Resuelva
De la siguiente tabla sobre los pesos (en libras) de individuos con
sobrepeso y obesidad en relación a sus niveles de ansiedad, represente la
información en un diagrama de caja y bigotes
Tallo Hoja
131415161718
0, 1, 1, 2, 3, 5, 6, 81, 1, 1, 2, 2, 4, 6 ,7, 7, 90, 1, 2, 2, 3, 4, 5, 5, 6, 7, 7, 8, 92, 4, 4, 5, 6, 7, 80, 1, 2, 3, 3, 50, 2, 3
¿Cuál de las siguientes NO es una medida estadística de posición?
1. Rango
2. Media
3. Mediana
4. Moda
5. Percentiles
MIR 91