Análisis de Varianza No Paramétrica

8
E S T A D I S T I C A Análisis de varianza no paramétrico Alternativas no paramétricas para las comparaciones múltiples Resumen del tema Introducción Se denomina en general análisis de varianza a las pruebas estadísticas que permiten la comparación de k poblaciones, con 2 k Desde el punto de vista del esquema de comparación de poblaciones planteado en el capítulo anterior, se trata de formular los tests que permitan generalizar el esquema de comparación de poblaciones al caso en que tenemos verticalmente más de 2 grupos independientes, u horizontalmente más de 2 momentos: En la clase anterior se estudió este mismo problema y se le dio una solución estadística paramétrica a las comparaciones verticales. Supongamos ahora que la variable que se mide no tiene distribución normal, o que sus varianzas no son iguales. El test ANOVA ya estudiado no puede aplicarse. El análisis de varianza unifactorial no paramétrico Momentos ...... 1 ..... ...... ...... 2 3 Grupos ...... ...... ...... ...... ...... p : 1 2 3 ..... k

description

Análisis de varianza no paramétrica

Transcript of Análisis de Varianza No Paramétrica

Page 1: Análisis de Varianza No Paramétrica

E S T A D I S T I C A

Análisis de varianza no paramétrico

Alternativas no paramétricas para las comparaciones múltiples

Resumen del tema

Introducción

Se denomina en general análisis de varianza a las pruebas estadísticas que permiten la

comparación de k poblaciones, con 2k

Desde el punto de vista del esquema de comparación de poblaciones planteado en el capítulo

anterior, se trata de formular los tests que permitan generalizar el esquema de comparación

de poblaciones al caso en que tenemos verticalmente más de 2 grupos independientes, u

horizontalmente más de 2 momentos:

En la clase anterior se estudió este mismo problema y se le dio una solución estadística

paramétrica a las comparaciones verticales.

Supongamos ahora que la variable que se mide no tiene distribución normal, o que sus

varianzas no son iguales. El test ANOVA ya estudiado no puede aplicarse.

El análisis de varianza unifactorial no paramétrico

Momentos

...... 1

.....

......

......

2

3

Grupos

......

...... ...... ...... ......

p

:

1 2 3 ..... k

Page 2: Análisis de Varianza No Paramétrica

E S T A D I S T I C A

Sean X1, X2,..., Xp variables aleatorias continuas que no siguen una distribución normal o

variables aleatorias discretas ordinales. Se explicarán en este epígrafe pruebas no

paramétricas.

Debe recordarse que tales pruebas no trabajan sobre los datos originales sino sobre rangos

asociados a los datos. Para asignar rangos se parte de ordenar los datos originales y se

procede como sigue:

Datos originales: 23 20 19 25 20 28

Datos ordenados: 19 20 20 23 25 28

Rangos asociados: 1 2.5 2.5 4 5 6

Se desea entonces docimar:

ji

po

rrH

rrrH

que talj,i j), (i,par un existe :

:

1

21

donde ir representa el rango medio del grupo i, o sea, el valor medio de los rangos del grupo

i, i = 1, 2, 3,...p. Nótese en principio que los volúmenes ni no son necesariamente iguales.

Al igual que en la clase anterior se puede tener una tabla – no necesariamente rectangular-

de valores de estas variables de la forma:

F 1 2 3 p

X11 X21 X31 ... Xp1

X12 X22 X32 ... Xp2

... ... ... ... ...

11nX

22nX 33nX

ppnX

E igualmente no debe confundirse esta representación con los datos con la supuesta

estructura del fichero a procesar y mucho menos con las ideas del esquema de comparación

de poblaciones. Aquí, los datos de cada columna iinii XXX ,, 21 representan la muestra de

volumen ni de la variable Xi. Por ello, la longitud de las columnas puede no ser la misma y por

tanto, la tabla no es rectangular. El factor ( piF ,,3,2,1 ) identifica grupos

independientes porque una de las hipótesis es precisamente la independencia de las variables

Xi = 1, 2, 3,...p; de manera que desde el punto de vista del esquema, estamos formulando un

test para la comparación vertical o transversal. Un fichero de datos apropiados para ejecutar

este test con el SPSS tendría una forma compatible con la idea de la comparación vertical,

Page 3: Análisis de Varianza No Paramétrica

E S T A D I S T I C A

esto es tendríamos realmente una variable de agrupación (F) y una única variables (X) a

comparar por niveles de F:

F X

1

1

.

.

.

1

X11

X12

.

.

.

11nX

2

2

.

.

.

2

.

.

.

X21

X22

.

.

.

22nX

.

.

.

P

P

.

.

.

p

Xp1

Xp2

.

.

.

ppnX

A veces se dice con más justicia que tenemos una muestra (población) de una variable X

dividida en p submuestras (grupos) independientes.

Comparaciones verticales

Para realizar las comparaciones entre más de dos grupos independientes se utiliza el test de

Kruskal Wallis. Constituye la versión no paramétrica más acertada del análisis de varianza

clásico. La hipótesis nula sostiene que las múltiples muestras independientes provienen de la

misma población.

El test de la mediana es otra de las pruebas que pueden aplicarse para comparar más de dos

grupos. La hipótesis nula sostiene que los grupos provienen de poblaciones que tienen el

mismo valor de la mediana.

Por último, el SPSS también tiene implementado el test de Jonckheere-Terpstra, que se utiliza

con el mismo objetivo.

A continuación se muestran salidas del SPSS:

Prueba de Kruskal-Wallis

Page 4: Análisis de Varianza No Paramétrica

E S T A D I S T I C A

Rangos

50 77.88

50 67.38

50 81.24

150

Grupos segun

alimentacion

Continua

Con ayuno

Intensiva

Total

Peso vivo a las 4

semanas (gr.)

N

Rango

promedio

Estadísticos de contrastea,b

2.770

2

.250

Chi-cuadrado

gl

Sig. asintót.

Peso vivo a

las 4

semanas (gr.)

Prueba de Kruskal-Wallisa.

Variable de agrupación: Grupos segun alimentacionb.

Prueba de la mediana

Frecuencias

26 21 28

24 29 22

> Mediana

<= Mediana

Peso vivo a las 4

semanas (gr.)

Continua Con ayuno Intensiva

Grupos segun alimentacion

Estadísticos de contrasteb

150

160.69

2.080a

2

.353

N

Mediana

Chi-cuadrado

gl

Sig. asintót.

Peso vivo a

las 4

semanas (gr.)

0 casillas (.0%) tienen frecuencias esperadas

menores que 5. La frecuencia de casilla esperada

mínima es 25.0.

a.

Variable de agrupación: Grupos segun alimentacionb.

Page 5: Análisis de Varianza No Paramétrica

E S T A D I S T I C A

Prueba de Jonckheere-Terpstraa

3

150

3859.000

3750.000

289.740

.376

.707

Número de niveles en

Grupos segun

alimentacion

N

Estadístico de J-T

observado

Media del estadístico J-T

Desviación típica del

estadístico de J-T

Estadístico de J-T

tipificado

Sig. asintót. (bilateral)

Peso vivo a

las 4

semanas (gr.)

Variable de agrupación: Grupos segun alimentaciona.

Como puede apreciarse los tres tests coinciden en no hallar diferencias significativas en el

peso de los pollos en la cuarta semana de vida.

Sin embargo, si se analiza el peso de los pollos en la semana 12, los tres tests coinciden en

afirmar que existen diferencias significativas en cuanto a la forma de alimentación.

Prueba de Kruskal-Wallis

Rangos

50 32.24

50 125.50

50 68.76

150

Grupos segun

alimentacion

Continua

Con ayuno

Intensiva

Total

Peso vivo a las

12 semanas (gr.)

N

Rango

promedio

Estadísticos de contrastea,b

117.010

2

.000

Chi-cuadrado

gl

Sig. asintót.

Peso vivo a

las 12

semanas (gr.)

Prueba de Kruskal-Wallisa.

Variable de agrupación: Grupos segun alimentacionb.

Page 6: Análisis de Varianza No Paramétrica

E S T A D I S T I C A

Prueba de la mediana

Frecuencias

3 50 22

47 0 28

> Mediana

<= Mediana

Peso vivo a las

12 semanas (gr.)

Continua Con ayuno Intensiva

Grupos segun alimentacion

Estadísticos de contrasteb

150

1335.58

89.440a

2

.000

N

Mediana

Chi-cuadrado

gl

Sig. asintót.

Peso vivo a

las 12

semanas (gr.)

0 casillas (.0%) tienen frecuencias esperadas

menores que 5. La frecuencia de casilla esperada

mínima es 25.0.

a.

Variable de agrupación: Grupos segun alimentacionb.

Prueba de Jonckheere-Terpstraa

3

150

4663.000

3750.000

289.745

3.151

.002

Número de niveles en

Grupos segun

alimentacion

N

Estadístico de J-T

observado

Media del estadístico J-T

Desviación típica del

estadístico de J-T

Estadístico de J-T

tipificado

Sig. asintót. (bilateral)

Peso vivo a

las 12

semanas (gr.)

Variable de agrupación: Grupos segun alimentaciona.

Los tests de rangos y el análisis de contrastes

Page 7: Análisis de Varianza No Paramétrica

E S T A D I S T I C A

No existen tests de rangos no paramétricos, por lo que la única solución es realizar

comparaciones dos a dos, reduciendo el nivel de significación con el que se compara para

evitar que aumente el error de tipo 1.

Para el ejemplo anterior, tendría que utilizars un test de Mann Whitney para comparar:

o Grupo de alimentación continua grupo con períodos de ayuno

o Grupo de alimentación continua grupo con alimentación intensiva

o Grupo con períodos de ayuno con grupo con alimentación intensiva

Comparaciones horizontales

Para realizar comparaciones en el tiempo se utilizan los tests de Friedman, la W de Kendall y

si las variables son dicotómicas la prueba Q de Cochran.

A continuación se muestran los resultado de comparar los pollos con alimentación continua en

los tres momentos analizados:

Grupos segun alimentacion = Continua

Prueba de Friedman

Rangosa

1.00

2.00

3.00

Peso vivo a las 4

semanas (gr.)

Peso vivo a las

12 semanas (gr.)

Peso vivo a las

20 semanas (gr.)

Rango

promedio

Grupos segun alimentacion = Continuaa.

Estadísticos de contrastea,b

50

100.000

2

.000

N

Chi-cuadrado

gl

Sig. asintót.

Prueba de Friedmana.

Grupos segun alimentacion = Continuab.

Prueba W de Kendall

Page 8: Análisis de Varianza No Paramétrica

E S T A D I S T I C A

Rangosa

1.00

2.00

3.00

Peso vivo a las 4

semanas (gr.)

Peso vivo a las

12 semanas (gr.)

Peso vivo a las

20 semanas (gr.)

Rango

promedio

Grupos segun alimentacion = Continuaa.

Estadísticos de contrasteb

50

1.000

100.000

2

.000

N

W de Kendalla

Chi-cuadrado

gl

Sig. asintót.

Coeficiente de concordancia de Kendalla.

Grupos segun alimentacion = Continuab.

Como puede apreciarse ambas pruebas coinciden en afirmar que existen diferencias

significativas en el tiempo.

Pueden aplicarse pruebas de Wilcoxon dos a dos para detectar otras diferencias.