Tema 5 Normailidad

28
Tema 5: Contrastes de Hipótesis no-paramétricos

Transcript of Tema 5 Normailidad

  • Tema 5: Contrastes de Hiptesis no-paramtricos

  • PRELIMINARES:Test de hiptesisParamtricos: hiptesis sobre los parmetros que definen la pobla-cin (por ej., pobl. Normales, y tests sobre la media o la desv. tpica).No paramtricos: no se refieren a parmetros de la poblacin; se aplican tpicamente cuando no conocemos la distribucin de la poblacin, o cuando sudistribucin es no normal. Primer cuatrimestre

  • PRELIMINARES:Media versus MedianaDiferencias/Semejanzas?

  • Ambas sirven para estimar el valor o tamao medio de una variable, que debe entenderse como el valor esperable o normal. Si la distribucin es normal, media y mediana coinciden. Si hay discrepancia entre ambas, es preferible la mediana. La razn es que la mediana es robusta, es decir, poco sensible a datos atpicos. La media, en cambio, es muy sensible.

    PRELIMINARES:Media versus MedianaEn particular, en ausencia de normalidad son relevanteslos contrastes no sobre la media, sino sobre la mediana

  • Ejemplo: La biblioteca de un museo recibe en un da 9 peticiones dedistintas instituciones para consultar volmenes de la biblioteca; cada uno de los peticionarios solicita consultar el siguiente nmero de volmenes:

    6, 3, 10, 3, 3, 120, 3, 11, 2Media: 1789

    Mediana: 3

  • PRELIMINARES:SimetraMediaMedia Normalidad implica simetra; sin embargo, simetra no implica necesariamente normalidad. Se mide con el coeficiente de asimetra (debe estar entre -2 y 2). Si hay simetra, media y mediana coinciden.

  • 1. Tests sobre la mediana.Ho: M = MoH1: M Mo; M>Mo; M
  • 2. Tests de bondad de ajuste.Ho: X sigue cierta distribucinH1: X no sigue cierta distribucin Test chi-cuadrado: general (todas las variables, todas las distribuciones.

    (B) Test de Kolmogorov-Smirnov : requiere var. continua.

    (C) Tests de normalidad: slo para contrastar normalidad

  • (A) Test Chi-cuadrado:Ho: X sigue cierta distribucinH1: X no sigue cierta distribucinPor ejemplo, Ho: X=N(10,2.85)1.- Tomamos muestra de tamao n (por ej., n=32)2.- Establecemos regiones en el intervalo donde puede tomar valores la variable:1012857151234

  • 1012857151234(A) Test Chi-cuadrado:Ho: X sigue cierta distribucinH1: X no sigue cierta distribucinPor ejemplo, Ho: X=N(10,2.85)3.- Establecemos los valores esperados: (n=32)0,3434%0,1616%E1: 16% de 32 = 5 (aprox.)E2: 34% de 32 = 11 (aprox.)

  • 1012857151234(A) Test Chi-cuadrado:Ho: X sigue cierta distribucinH1: X no sigue cierta distribucinPor ejemplo, Ho: X=N(10,2.85)4.- Contabilizamos los valores observados, en la muestra, en cada intervalo:E1: 5; E2: 11; E3: 11; E4: 5O1: 4; O2: 9; O3: 13; O4: 6

  • (A) Test Chi-cuadrado:Ho: X sigue cierta distribucinH1: X no sigue cierta distribucinPor ejemplo, Ho: X=N(10,2.85)5.- La idea es RECHAZAR la hiptesis, si los valores observados difieren demasiado de los observados. Concretamente, se utiliza el estadstico: Requisitos: n suficientemente grande; Ei mayores o iguales de 5

  • (B) Test de Kolmogorov-Smirnov:Ho: X sigue cierta distribucinH1: X no sigue cierta distribucinEl test anterior, en realidad, compara las frecuencias obtenidas, con las esperadas; es decir, compara el polgono de frecuencias (muestra), con la curva correspondiente a la distribucin que conjeturamos: muestrapoblacin

  • (B) Test de Kolmogorov-Smirnov:Ho: X sigue cierta distribucinH1: X no sigue cierta distribucinEl test de Kolmogorov-Smirnov, que requiere variable continua, compara el polgono de frecuencias acumuladas, con la funcin de distribucin.%muestrapoblacin

  • (C) Test de normalidad:Ho: X es normalH1: X no es normalSlo sirven para contrastar la normalidad, y no otro tipo de distribuciones.

  • 3. Tests de comparacin de poblaciones.Ho: M1 = M2H1: M1 M2; M1 >M2; M1 2; 1< 2Si alguna de las poblaciones es no normal, entonces comparamos medianas:Para comparar medianas, se utiliza el test de Mann-Whitney(A) Comparacin de medianas:

  • Test de Mann-Whitney : La idea es similar a la del test de los rangos signados: 1. tomamos muestras en ambas poblaciones (x1xn, y1 ym) 2. mezclamos los datos, y los ordenamos: x6

  • Ho: MD = 0H1: MD 0; MD >0; MD 0; D< 0Si D no es normal, entonces comprobamos si la mediana de D es 0, o no, utilizando el test de los signos y, si D es simtrica, el de los rangos signados.IMPORTANTE: como la media (resp. la mediana) de D es igual a la diferencia de las medias (resp. de las medianas), aceptar la hiptesisnula equivale a aceptar que ambas medias (resp. medianas ) son iguales.

  • Mis datos son pareados?NOSILa diferencia D es normal?SI NOH0: D=0(t-test)H0: MD=0(test signos,etc.)Las variables son normales?SI H0: 1=2(t-test)(Ojo, primerohay que comprobarsi las desviaciones tpicasson iguales, o no)NOH0: M1=M2(test de Mann-Whitney)

  • Ho: X e Y tienen la misma distribucinH1: X e Y no tienen la misma distribucinTest de Kolmogorov-Smirnov (comparacin de distribuciones): idea similar a la del test de bondad de ajuste (comparamos funciones de distribucin deX e Y). Requiere variable continua. (B) Comparacin de distribuciones:Statgraphics

  • 4. Tests de aleatoriedad.Una secuencia de datos es aleatoria si no exhibe ninguna tendenciaconcreta, es decir, si se entiende que las fluctuaciones en los datosse deben al AZAR.

  • ALEATORIEDAD/NO ALEATORIEDAD

  • Tests de aleatoriedad: tests de RACHASTest 1: ejecuciones por encima y debajo de la mediana.

    Test 2: ejecuciones arriba y abajo.

    Test 3: test de Box-Pierce (autocorrelaciones). Busca ciclos.Ho: Los datos son aleatoriosH1: Los datos no son aleatorios

  • 5. Test de independencia chi-cuadrado.Se trata de contrastar si dos variables CUALITATIVAS son independien-tes (es decir, si existe relacin entre ellas), o no. Por ejemplo:

    Ser hombre o mujer predispone, de algn modo, a fumar o no fumar? Los hbitos de lectura de los padres influyen en los hbitos de lectura de los hijos? Los gustos literarios son los mismos en las distintas comunidades espaolas? La proporcin de textos de ficcin/no ficcin es la misma en todas las bibliotecas de Alcal?Ho: X e Y son independientesH1: X e Y no son independientesX e Y estn relacionadas, una de ellas influye en la otra, hay diferencias significativas, determinadas proporciones cambian

  • EJEMPLO: Hemos preguntado a un grupo de 20 hombres y 20 mujeressi fumaban o no. Crees que hay diferencias significativas entre ambossexos?X: sexo; Y: Fumador (S/N)Ho: X e Y son independientesH1: X e Y no son independientes

    HombresMujeresTOTAL:Fuma5712No fuma151328TOTAL:202040

  • Qu debera salir, si fueran perfectamente independientes?

    HombresMujeresTOTAL:Fuma12No fuma28TOTAL:202040

  • 50%50%Qu debera salir, si fueran perfectamente independientes?

    HombresMujeresTOTAL:Fuma6612No fuma141428TOTAL:202040

  • Comparamos frecuencias observadas (Oi) y esperadas (Ei)La idea es RECHAZAR la hiptesis, si los valores observados difieren demasiado de los observados. Concretamente, se utilizael estadstico: (Igual que en tests de bondad de ajuste)Statgraphics

    ****************************