Análisis de Varianza No Paramétrica
description
Transcript of Análisis de Varianza No Paramétrica
E S T A D I S T I C A
Análisis de varianza no paramétrico
Alternativas no paramétricas para las comparaciones múltiples
Resumen del tema
Introducción
Se denomina en general análisis de varianza a las pruebas estadísticas que permiten la
comparación de k poblaciones, con 2k
Desde el punto de vista del esquema de comparación de poblaciones planteado en el capítulo
anterior, se trata de formular los tests que permitan generalizar el esquema de comparación
de poblaciones al caso en que tenemos verticalmente más de 2 grupos independientes, u
horizontalmente más de 2 momentos:
En la clase anterior se estudió este mismo problema y se le dio una solución estadística
paramétrica a las comparaciones verticales.
Supongamos ahora que la variable que se mide no tiene distribución normal, o que sus
varianzas no son iguales. El test ANOVA ya estudiado no puede aplicarse.
El análisis de varianza unifactorial no paramétrico
Momentos
...... 1
.....
......
......
2
3
Grupos
......
...... ...... ...... ......
p
:
1 2 3 ..... k
E S T A D I S T I C A
Sean X1, X2,..., Xp variables aleatorias continuas que no siguen una distribución normal o
variables aleatorias discretas ordinales. Se explicarán en este epígrafe pruebas no
paramétricas.
Debe recordarse que tales pruebas no trabajan sobre los datos originales sino sobre rangos
asociados a los datos. Para asignar rangos se parte de ordenar los datos originales y se
procede como sigue:
Datos originales: 23 20 19 25 20 28
Datos ordenados: 19 20 20 23 25 28
Rangos asociados: 1 2.5 2.5 4 5 6
Se desea entonces docimar:
ji
po
rrH
rrrH
que talj,i j), (i,par un existe :
:
1
21
donde ir representa el rango medio del grupo i, o sea, el valor medio de los rangos del grupo
i, i = 1, 2, 3,...p. Nótese en principio que los volúmenes ni no son necesariamente iguales.
Al igual que en la clase anterior se puede tener una tabla – no necesariamente rectangular-
de valores de estas variables de la forma:
F 1 2 3 p
X11 X21 X31 ... Xp1
X12 X22 X32 ... Xp2
... ... ... ... ...
11nX
22nX 33nX
ppnX
E igualmente no debe confundirse esta representación con los datos con la supuesta
estructura del fichero a procesar y mucho menos con las ideas del esquema de comparación
de poblaciones. Aquí, los datos de cada columna iinii XXX ,, 21 representan la muestra de
volumen ni de la variable Xi. Por ello, la longitud de las columnas puede no ser la misma y por
tanto, la tabla no es rectangular. El factor ( piF ,,3,2,1 ) identifica grupos
independientes porque una de las hipótesis es precisamente la independencia de las variables
Xi = 1, 2, 3,...p; de manera que desde el punto de vista del esquema, estamos formulando un
test para la comparación vertical o transversal. Un fichero de datos apropiados para ejecutar
este test con el SPSS tendría una forma compatible con la idea de la comparación vertical,
E S T A D I S T I C A
esto es tendríamos realmente una variable de agrupación (F) y una única variables (X) a
comparar por niveles de F:
F X
1
1
.
.
.
1
X11
X12
.
.
.
11nX
2
2
.
.
.
2
.
.
.
X21
X22
.
.
.
22nX
.
.
.
P
P
.
.
.
p
Xp1
Xp2
.
.
.
ppnX
A veces se dice con más justicia que tenemos una muestra (población) de una variable X
dividida en p submuestras (grupos) independientes.
Comparaciones verticales
Para realizar las comparaciones entre más de dos grupos independientes se utiliza el test de
Kruskal Wallis. Constituye la versión no paramétrica más acertada del análisis de varianza
clásico. La hipótesis nula sostiene que las múltiples muestras independientes provienen de la
misma población.
El test de la mediana es otra de las pruebas que pueden aplicarse para comparar más de dos
grupos. La hipótesis nula sostiene que los grupos provienen de poblaciones que tienen el
mismo valor de la mediana.
Por último, el SPSS también tiene implementado el test de Jonckheere-Terpstra, que se utiliza
con el mismo objetivo.
A continuación se muestran salidas del SPSS:
Prueba de Kruskal-Wallis
E S T A D I S T I C A
Rangos
50 77.88
50 67.38
50 81.24
150
Grupos segun
alimentacion
Continua
Con ayuno
Intensiva
Total
Peso vivo a las 4
semanas (gr.)
N
Rango
promedio
Estadísticos de contrastea,b
2.770
2
.250
Chi-cuadrado
gl
Sig. asintót.
Peso vivo a
las 4
semanas (gr.)
Prueba de Kruskal-Wallisa.
Variable de agrupación: Grupos segun alimentacionb.
Prueba de la mediana
Frecuencias
26 21 28
24 29 22
> Mediana
<= Mediana
Peso vivo a las 4
semanas (gr.)
Continua Con ayuno Intensiva
Grupos segun alimentacion
Estadísticos de contrasteb
150
160.69
2.080a
2
.353
N
Mediana
Chi-cuadrado
gl
Sig. asintót.
Peso vivo a
las 4
semanas (gr.)
0 casillas (.0%) tienen frecuencias esperadas
menores que 5. La frecuencia de casilla esperada
mínima es 25.0.
a.
Variable de agrupación: Grupos segun alimentacionb.
E S T A D I S T I C A
Prueba de Jonckheere-Terpstraa
3
150
3859.000
3750.000
289.740
.376
.707
Número de niveles en
Grupos segun
alimentacion
N
Estadístico de J-T
observado
Media del estadístico J-T
Desviación típica del
estadístico de J-T
Estadístico de J-T
tipificado
Sig. asintót. (bilateral)
Peso vivo a
las 4
semanas (gr.)
Variable de agrupación: Grupos segun alimentaciona.
Como puede apreciarse los tres tests coinciden en no hallar diferencias significativas en el
peso de los pollos en la cuarta semana de vida.
Sin embargo, si se analiza el peso de los pollos en la semana 12, los tres tests coinciden en
afirmar que existen diferencias significativas en cuanto a la forma de alimentación.
Prueba de Kruskal-Wallis
Rangos
50 32.24
50 125.50
50 68.76
150
Grupos segun
alimentacion
Continua
Con ayuno
Intensiva
Total
Peso vivo a las
12 semanas (gr.)
N
Rango
promedio
Estadísticos de contrastea,b
117.010
2
.000
Chi-cuadrado
gl
Sig. asintót.
Peso vivo a
las 12
semanas (gr.)
Prueba de Kruskal-Wallisa.
Variable de agrupación: Grupos segun alimentacionb.
E S T A D I S T I C A
Prueba de la mediana
Frecuencias
3 50 22
47 0 28
> Mediana
<= Mediana
Peso vivo a las
12 semanas (gr.)
Continua Con ayuno Intensiva
Grupos segun alimentacion
Estadísticos de contrasteb
150
1335.58
89.440a
2
.000
N
Mediana
Chi-cuadrado
gl
Sig. asintót.
Peso vivo a
las 12
semanas (gr.)
0 casillas (.0%) tienen frecuencias esperadas
menores que 5. La frecuencia de casilla esperada
mínima es 25.0.
a.
Variable de agrupación: Grupos segun alimentacionb.
Prueba de Jonckheere-Terpstraa
3
150
4663.000
3750.000
289.745
3.151
.002
Número de niveles en
Grupos segun
alimentacion
N
Estadístico de J-T
observado
Media del estadístico J-T
Desviación típica del
estadístico de J-T
Estadístico de J-T
tipificado
Sig. asintót. (bilateral)
Peso vivo a
las 12
semanas (gr.)
Variable de agrupación: Grupos segun alimentaciona.
Los tests de rangos y el análisis de contrastes
E S T A D I S T I C A
No existen tests de rangos no paramétricos, por lo que la única solución es realizar
comparaciones dos a dos, reduciendo el nivel de significación con el que se compara para
evitar que aumente el error de tipo 1.
Para el ejemplo anterior, tendría que utilizars un test de Mann Whitney para comparar:
o Grupo de alimentación continua grupo con períodos de ayuno
o Grupo de alimentación continua grupo con alimentación intensiva
o Grupo con períodos de ayuno con grupo con alimentación intensiva
Comparaciones horizontales
Para realizar comparaciones en el tiempo se utilizan los tests de Friedman, la W de Kendall y
si las variables son dicotómicas la prueba Q de Cochran.
A continuación se muestran los resultado de comparar los pollos con alimentación continua en
los tres momentos analizados:
Grupos segun alimentacion = Continua
Prueba de Friedman
Rangosa
1.00
2.00
3.00
Peso vivo a las 4
semanas (gr.)
Peso vivo a las
12 semanas (gr.)
Peso vivo a las
20 semanas (gr.)
Rango
promedio
Grupos segun alimentacion = Continuaa.
Estadísticos de contrastea,b
50
100.000
2
.000
N
Chi-cuadrado
gl
Sig. asintót.
Prueba de Friedmana.
Grupos segun alimentacion = Continuab.
Prueba W de Kendall
E S T A D I S T I C A
Rangosa
1.00
2.00
3.00
Peso vivo a las 4
semanas (gr.)
Peso vivo a las
12 semanas (gr.)
Peso vivo a las
20 semanas (gr.)
Rango
promedio
Grupos segun alimentacion = Continuaa.
Estadísticos de contrasteb
50
1.000
100.000
2
.000
N
W de Kendalla
Chi-cuadrado
gl
Sig. asintót.
Coeficiente de concordancia de Kendalla.
Grupos segun alimentacion = Continuab.
Como puede apreciarse ambas pruebas coinciden en afirmar que existen diferencias
significativas en el tiempo.
Pueden aplicarse pruebas de Wilcoxon dos a dos para detectar otras diferencias.