Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros...

78
Pruebas de hipótesis Pruebas de hipótesis

Transcript of Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros...

Page 1: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

Pruebas de hipótesisPruebas de hipótesisPruebas de hipótesisPruebas de hipótesis

Page 2: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

2

Introducción

Pruebas de hipótesis estadísticas

Pruebas para parámetros de una población

Pruebas para parámetros de dos poblaciones

CONTENIDOCONTENIDO

Page 3: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

3

INTRODUCCIONINTRODUCCION

En ciencia se denomina hipótesis a una En ciencia se denomina hipótesis a una declaración cuya veracidad no ha podido declaración cuya veracidad no ha podido comprobarse en forma definitiva. comprobarse en forma definitiva.

El método científico proporciona una El método científico proporciona una herramienta para la comprobación tentativa de herramienta para la comprobación tentativa de las hipótesis. En la misma forma, los métodos las hipótesis. En la misma forma, los métodos estadísticos proporcionan un mecanismo estadísticos proporcionan un mecanismo científico de prueba de las hipótesis. científico de prueba de las hipótesis.

Page 4: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

4

INTRODUCCIONINTRODUCCION

Al igual que el método científico, del cual es Al igual que el método científico, del cual es derivado, el método estadístico no prueba la derivado, el método estadístico no prueba la veracidad absoluta de las hipótesis. veracidad absoluta de las hipótesis.

El método estadístico proporciona un El método estadístico proporciona un procedimiento y una conclusión de la prueba, la procedimiento y una conclusión de la prueba, la cual está sujeta a cierta probabilidad de error. cual está sujeta a cierta probabilidad de error.

Page 5: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

5

EJERCICIOEJERCICIO

¿Cómo se diferencia una hipótesis cualquiera ¿Cómo se diferencia una hipótesis cualquiera de una hipótesis científica, y de una hipótesis de una hipótesis científica, y de una hipótesis estadística?estadística?

Suponga las siguientes aseveraciones:Suponga las siguientes aseveraciones:

Prefiero usar el equipo de microKjeldhal a otros Prefiero usar el equipo de microKjeldhal a otros equipos para medir contenido de proteína en equipos para medir contenido de proteína en alimentos.alimentos.

Los fenómenos solares son más frecuentes cuando Los fenómenos solares son más frecuentes cuando la tierra está en la parte más lejana de la órbita solar. la tierra está en la parte más lejana de la órbita solar.

Page 6: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

6

EJERCICIOEJERCICIO

De las aseveraciones mencionadas señale De las aseveraciones mencionadas señale cuales son hipótesis científicas y cuales no lo son.cuales son hipótesis científicas y cuales no lo son.

Las que son hipótesis científicas, ¿Cómo se Las que son hipótesis científicas, ¿Cómo se pueden probar?pueden probar?

En las siguientes diapositivas se verán las En las siguientes diapositivas se verán las hipótesis estadísticas. Guarde los ejemplos para hipótesis estadísticas. Guarde los ejemplos para plantear las hipótesis estadísticas correspondientes.plantear las hipótesis estadísticas correspondientes.

Page 7: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

7

INTRODUCCIONINTRODUCCION

Una Una hipótesishipótesis se define como una aseveración que se define como una aseveración que se acepta provisionalmente para explicar ciertos hechos.se acepta provisionalmente para explicar ciertos hechos.

Una hipótesis estadística es una declaración Una hipótesis estadística es una declaración matemática acerca de parámetros de la distribución matemática acerca de parámetros de la distribución poblacional sobre la cual se va a hacer inferencia poblacional sobre la cual se va a hacer inferencia estadística. estadística.

Las hipótesis estadísticas constan de dos Las hipótesis estadísticas constan de dos declaraciones: Una hipótesis llamada “declaraciones: Una hipótesis llamada “nulanula” (H” (H00), y una ), y una

hipótesis llamada “hipótesis llamada “alternativaalternativa” (H” (Haa).).

Page 8: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

8

INTRODUCCIONINTRODUCCION

La hipótesis nula comprende las La hipótesis nula comprende las declaraciones sobre los parámetros o declaraciones sobre los parámetros o propiedades que sujetaremos a prueba.propiedades que sujetaremos a prueba.

La hipótesis alternativa comprende La hipótesis alternativa comprende declaraciones sobre los parámetros o propiedades declaraciones sobre los parámetros o propiedades que aceptaremos eventualmente, en el caso de que aceptaremos eventualmente, en el caso de rechazar la hipótesis nula. rechazar la hipótesis nula.

Page 9: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

9

INTRODUCCIONINTRODUCCION

Las hipótesis pueden ser sobre la forma de la Las hipótesis pueden ser sobre la forma de la distribución de los datos de la población, o sobre los distribución de los datos de la población, o sobre los parámetros que caracterizan esta distribución.parámetros que caracterizan esta distribución.

Si se puede suponer "a priori" que la función Si se puede suponer "a priori" que la función de distribución de la población es conocida, se de distribución de la población es conocida, se pueden plantear hipótesis sobre los parámetros de pueden plantear hipótesis sobre los parámetros de esa función de distribución. esa función de distribución.

Page 10: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

10

INTRODUCCIONINTRODUCCION

Las hipótesis sobre parámetros de una Las hipótesis sobre parámetros de una población se denominan hipótesis paramétricas. población se denominan hipótesis paramétricas.

Estas hipótesis son las que veremos en el Estas hipótesis son las que veremos en el resto de esta unidad.resto de esta unidad.

Recuerde que los principios de prueba de Recuerde que los principios de prueba de hipótesis son semejantes para todas las hipótesis hipótesis son semejantes para todas las hipótesis estadísticas.estadísticas.

Page 11: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

11

HIPOTESIS ESTADISTICASHIPOTESIS ESTADISTICAS

La hipótesis estadística llamada “nula” es La hipótesis estadística llamada “nula” es la negación de lo que queremos probar.la negación de lo que queremos probar.

Si queremos probar que a los estudiantes Si queremos probar que a los estudiantes les gustan los chocolates, la hipótesis nula será:les gustan los chocolates, la hipótesis nula será:HH0 0 : A los estudiantes no les gustan los chocolates: A los estudiantes no les gustan los chocolates

De esta forma, cuando se rechaza la De esta forma, cuando se rechaza la hipótesis nula, se prueba la hipótesis de trabajo.hipótesis nula, se prueba la hipótesis de trabajo.

Page 12: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

12

HIPOTESIS ESTADISTICASHIPOTESIS ESTADISTICASHipótesis simple sobre una proporciónHipótesis simple sobre una proporción

0A

00pp:Hpp:H

0A

00pp:Hpp:H

0A

00pp:Hpp:H

AA

00pp:Hpp:H

Hipótesis compuestas sobre una proporción

Page 13: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

13

HIPOTESIS ESTADISTICASHIPOTESIS ESTADISTICAS

Hipótesis simple sobre la mediaHipótesis simple sobre la media

AA

00:H:H

0A

00:H:H

0A

00:H:H

0A

00:H:H

i

Hipótesis compuestas sobre la media

Page 14: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

14

PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESIS

Una vez planteada la hipótesis, se procede a realizar la Una vez planteada la hipótesis, se procede a realizar la prueba mediante procedimientos estadísticos y se toma una prueba mediante procedimientos estadísticos y se toma una decisión. Las decisiones pueden ser de dos tipos: Se rechaza Hdecisión. Las decisiones pueden ser de dos tipos: Se rechaza H00, ,

o no se rechaza Ho no se rechaza H00..

En las pruebas de hipótesis estadísticas se corre cierto En las pruebas de hipótesis estadísticas se corre cierto riesgo de tomar una decisión equivocada. Si se toma una riesgo de tomar una decisión equivocada. Si se toma una decisión equivocada se dice que se cometió un decisión equivocada se dice que se cometió un error. error.

Como no se conoce la verdadera situación (Como no se conoce la verdadera situación (recordar que recordar que se tiene una muestra, no toda la poblaciónse tiene una muestra, no toda la población), se establece de ), se establece de antemano una probabilidad de cometer errores.antemano una probabilidad de cometer errores.

Page 15: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

15

PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESIS

Hay cierta probabilidad de cometer los Hay cierta probabilidad de cometer los errores tipo I y tipo II. errores tipo I y tipo II. Se comete el error tipo I cuando se

concluye que algo es diferente, cuando en realidad no lo es.

Se comete el error tipo II cuando se concluye que no hay diferencias, cuando en realidad si las hay.

Sólo se puede establecer de antemano la probabilidad de cometer el error tipo I.

Page 16: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

16

PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESIS

En el siguiente cuadro se resumen las situacionesEn el siguiente cuadro se resumen las situaciones

DECISIONDECISION SITUACION REALSITUACION REAL

HH00 Cierta Cierta HH00 Falsa Falsa

Rechazar HRechazar H00 Error tipo IError tipo I Decisión Decisión CorrectaCorrecta

No rechazar HNo rechazar H00Decisión Decisión correctacorrecta Error tipo IIError tipo II

Page 17: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

17

PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESIS

A la máxima probabilidad de cometer el error A la máxima probabilidad de cometer el error tipo I se le llama “nivel de significancia”, y se tipo I se le llama “nivel de significancia”, y se denota por la letra griega denota por la letra griega ..

La probabilidad de cometer el error tipo II (se La probabilidad de cometer el error tipo II (se denota por la letra griega denota por la letra griega ββ) ) se puede reducir o se puede reducir o aumentar, pero no se puede fijar, ya que depende aumentar, pero no se puede fijar, ya que depende de la hipótesis alternativa.de la hipótesis alternativa.

Page 18: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

18

PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESIS

Se puede establecer de antemano la Se puede establecer de antemano la probabilidad de cometer el error tipo I (probabilidad de cometer el error tipo I ().).

Se puede reducir la probabilidad de cometer Se puede reducir la probabilidad de cometer el error tipo II (el error tipo II (), por medio de:), por medio de:

Aumentar la probabilidad de Aumentar la probabilidad de cometer el error tipo I (cometer el error tipo I ())

Aumentar el tamaño de la muestraAumentar el tamaño de la muestra

Page 19: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

19

POTENCIA DE LA PRUEBAPOTENCIA DE LA PRUEBA

El rechazo de la hipótesis nula depende de qué El rechazo de la hipótesis nula depende de qué tan “lejos” está el verdadero parámetro, y del nivel de tan “lejos” está el verdadero parámetro, y del nivel de significancia elegido.significancia elegido.

A la probabilidad de rechazar una hipótesis A la probabilidad de rechazar una hipótesis nula que realmente es falsa se le llama Potencia de la nula que realmente es falsa se le llama Potencia de la Prueba de Hipótesis.Prueba de Hipótesis.

Esto se puede expresar como: Esto se puede expresar como:

P{Rechazar Ho / Ho es falsa} = 1-P{Rechazar Ho / Ho es falsa} = 1-Es lógico que para cualquier prueba de Es lógico que para cualquier prueba de

hipótesis que hacemos, quisiéramos tener la máxima hipótesis que hacemos, quisiéramos tener la máxima potencia de la prueba.potencia de la prueba.

Page 20: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

20

POTENCIA DE LA PRUEBAPOTENCIA DE LA PRUEBA

La potencia de la prueba aumenta con:La potencia de la prueba aumenta con:

La reducción de la probabilidad de cometer el error tipo II, la cual es .

El tamaño de la muestra.

La distancia del valor del parámetro en la hipótesis y el verdadero valor en la población.

Page 21: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

21

PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESIS

Qué tan lejos está el verdadero parámetro:Qué tan lejos está el verdadero parámetro:

0tc A

= 0.05

A

= 0.05

0 tc

Parámetro está lejos

Parámetro está cerca

Page 22: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

22

PRUEBAS DE HIPOTESISPRUEBAS DE HIPOTESIS

Importancia del nivel de significanciaImportancia del nivel de significancia

0 Atc

p = 0.05

0 Atc

p = 0.01

α es más grande

α es más chica

α es más grandeα es más grande

Page 23: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

23

EJEMPLOEJEMPLO

Se desea probar si un nuevo producto Se desea probar si un nuevo producto alimenticio tiene mejores características que alimenticio tiene mejores características que productos similares que ya están en el mercado.productos similares que ya están en el mercado.

La hipótesis estadística será:La hipótesis estadística será:

HH00: El producto nuevo es igual o peor que los demás: El producto nuevo es igual o peor que los demás

HHaa: El producto nuevo es mejor que los demás: El producto nuevo es mejor que los demás

Si se rechaza HSi se rechaza H00, se concluye que el producto , se concluye que el producto

nuevo es mejor. Si no se rechaza Hnuevo es mejor. Si no se rechaza H00 , la conclusión , la conclusión

será que no hay suficiente evidencia para decir que será que no hay suficiente evidencia para decir que el producto nuevo es mejor. el producto nuevo es mejor.

Page 24: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

24

EJEMPLOEJEMPLO

Si se rechaza HSi se rechaza H00, y el producto , y el producto

realmente no era mejor que los demás (Error realmente no era mejor que los demás (Error tipo I), se está engañando al consumidor.tipo I), se está engañando al consumidor.

Si no se rechaza HSi no se rechaza H00, y el producto , y el producto

nuevo es realmente mejor que los demás nuevo es realmente mejor que los demás (Error tipo II), se está negando al consumidor (Error tipo II), se está negando al consumidor un producto mejor.un producto mejor.

¿Cuál error se debe considerar más ¿Cuál error se debe considerar más importante para reducir la probabilidad de importante para reducir la probabilidad de cometerlo?cometerlo?

Page 25: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

25

EjercicioEjercicio

En un estudio para determinar el envenenamiento por cloro de los peces de cierto río, se capturaron 20 peces recién nacidos y se les crió en un acuario con una concentración de 20 microgramos de cloro por litro de agua.

Se midió la longitud de los peces después de 10 semanas. La longitud promedio de peces normales de la misma especie y en las mismas condiciones, es de 29 mm.

Page 26: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

26

EjercicioEjercicio

Cuál es mi hipótesis de trabajo?Cuál es mi hipótesis de trabajo?

¿Cuál será mi hipótesis estadística?¿Cuál será mi hipótesis estadística?

¿Cuál tipo de error puede ser más grave en la ¿Cuál tipo de error puede ser más grave en la decisión estadística para esta prueba?decisión estadística para esta prueba?

¿Cuál será el nivel de significancia de la ¿Cuál será el nivel de significancia de la prueba?prueba?

Page 27: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

27

PRUEBA DE HIPOTESIS PARA PRUEBA DE HIPOTESIS PARA MEDIAMEDIA

Caso 1 Caso 2 Caso 3

     

0A

00:H:H

0A

00:H:H

0A

00:H:H

)μx(Z 0

c

Fijar Nivel de significancia .Calcular estadísticos muestrales: media de la muestra, y n.

Calcular Zc :

     Se rechaza si: Se rechaza si: Se rechaza si:

1c ZZ 1c ZZ)2/(1c ZZ )2/(1c ZZ

Page 28: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

28

PRUEBA DE HIPOTESIS PARA PRUEBA DE HIPOTESIS PARA MEDIAMEDIA

Caso 1 Caso 2 Caso 3

     

0A

00:H:H

0A

00:H:H

0A

00:H:H

ns

)μx(t 0

c

Fijar Nivel de significancia .Calcular estadísticos muestrales: media y varianza de la muestra, y n.

Calcular tc :

     Se rechaza si: Se rechaza si: Se rechaza si:

1c tt 1c tt)2/(1c tt )2/(1c tt

No se conoce la varianza de la población

Page 29: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

29

EJEMPLOEJEMPLOEn un estudio para determinar el envenenamiento En un estudio para determinar el envenenamiento

por cloro de los peces de cierto río, se capturaron 20 por cloro de los peces de cierto río, se capturaron 20 peces recién nacidos y se les crió en un acuario con una peces recién nacidos y se les crió en un acuario con una concentración de 20 microgramos de cloro por litro de concentración de 20 microgramos de cloro por litro de agua.agua.

Después de 10 semanas, la longitud promedio de Después de 10 semanas, la longitud promedio de los peces era de 27.5 milímetros, con una desviación los peces era de 27.5 milímetros, con una desviación estándar de 2.6 milímetros. estándar de 2.6 milímetros.

Si la longitud para la especie ha sido determinada Si la longitud para la especie ha sido determinada con anterioridad en 28.8 milímetros, ¿Qué concluiría con anterioridad en 28.8 milímetros, ¿Qué concluiría Usted del estudio, usando un nivel de significancia del Usted del estudio, usando un nivel de significancia del 5%? 5%?

Suponga que la longitud de los peces tiene una Suponga que la longitud de los peces tiene una

distribución aproximadamente normal.distribución aproximadamente normal.

Page 30: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

30

EJEMPLOEJEMPLO

Datos: Datos:

Media de la muestra= 27.5Media de la muestra= 27.5

Desviación estándar de la muestra=2.60Desviación estándar de la muestra=2.60

n=20n=20

ttcc = (27.5-28.8)(20)/(2.60) =-2.23 = (27.5-28.8)(20)/(2.60) =-2.23

Regla de Decisión: Como –2.23 < -1.73 {valor de tRegla de Decisión: Como –2.23 < -1.73 {valor de t[0.05,(n-1)][0.05,(n-1)] }, },

rechazamos la hipótesis nula, y concluimos que los rechazamos la hipótesis nula, y concluimos que los peces tienen una longitud menor.peces tienen una longitud menor.

¿Cuál es la conclusión de trabajo?¿Cuál es la conclusión de trabajo?

8.28:H8.28:H

A

0

Page 31: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

31

PRUEBA DE HIPOTESIS PARA PRUEBA DE HIPOTESIS PARA PROPORCIONPROPORCION

Caso 1 Caso 2

     Se rechaza si: Se rechaza si: Se rechaza si:

1c ZZ 1c ZZ)2/(1c ZZ )2/(1c ZZ

nqp

)p(pZ

00

0c

Fijar Nivel de significancia .Calcular estadísticos muestrales: proporción de la muestra, y n.

Calcular Zc :

Caso 3

     0A

00pp:Hpp:H

0A

00pp:Hpp:H

0A

00pp:Hpp:H

Page 32: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

32

EJEMPLOEJEMPLO

En un lote de harina envasada en paquetes de un kilo, En un lote de harina envasada en paquetes de un kilo, se encontró que de 50 paquetes revisados 7 contenían se encontró que de 50 paquetes revisados 7 contenían gorgojos. gorgojos.

La norma es que si hay más de 2% de paquetes con La norma es que si hay más de 2% de paquetes con gorgojos, el lote se desecha por estar fuera de normas. gorgojos, el lote se desecha por estar fuera de normas.

La hipótesis estadística a plantear es: La hipótesis estadística a plantear es:

02.0p:H02.0p:H

A

0

Page 33: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

33

EJEMPLO (Cont)EJEMPLO (Cont)

Fijar Nivel de significancia =0.05.Calcular estadísticos muestrales: proporción de la muestra: p = 7/50 = 0.14; n=50.Calcular Zc :

86.4250/)98.0)(02.0(

02.014.0

nqp

)p(pZ

00

0c

Se rechaza si:

1c ZZ

Page 34: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

34

PRUEBA DE HIPOTESIS PARA PRUEBA DE HIPOTESIS PARA VARIANZAVARIANZA

Caso 1 Caso 2 Caso 3

     

     Se rechaza si: Se rechaza si: Se rechaza si:

20

20

20

20

:H:H

20

20

20

20

:H:H

20

20

20

20

:H:H

Fijar Nivel de significancia .Calcular estadísticos muestrales: media y varianza de la muestra, y n.

Calcular 2c :

20

22c

s)1n(

22c 2

12c 2

)2/(2c 2

)2/(12c

Page 35: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

35

PRUEBA DE HIPOTESIS PARA DOS PRUEBA DE HIPOTESIS PARA DOS MEDIASMEDIAS

Caso 1 Caso 2 Caso 3

     Se rechaza si: Se rechaza si: Se rechaza si:

1c tt 1c tt)2/(1c tt )2/(1c tt

     

21A

210:H:H

21A

210:H:H

21A

210:H:H

Fijar Nivel de significancia .Calcular estadísticos muestrales: medias de las muestras, n1, n2, varianzas de

las muestras y varianza conjunta.Calcular tc :

)(2

22

1

21

2121c

n

s

n

s

)()xx(t

Page 36: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

36

PRUEBA PARA DOS MEDIASPRUEBA PARA DOS MEDIAS

Si las dos medias están suficientemente lejos una de Si las dos medias están suficientemente lejos una de otra, su diferencia será estadísticamente significativa.otra, su diferencia será estadísticamente significativa.

Cuando el nivel de significancia (Cuando el nivel de significancia () es pequeño, la ) es pequeño, la diferencia entre las medias deberá ser más grande para que diferencia entre las medias deberá ser más grande para que haya una diferencia estadísticamente significativa. haya una diferencia estadísticamente significativa.

1

tc 2

= 0.05

t

Page 37: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

37

PRUEBA PARA DOS PRUEBA PARA DOS PROPORCIONESPROPORCIONES

     Se rechaza si: Se rechaza si: Se rechaza si:

1c ZZ 1c ZZ)2/(1c ZZ )2/(1c ZZ

Caso 1 Caso 2 Caso 3

     

21A

210pp:Hpp:H

21A

210pp:Hpp:H

21A

210pp:Hpp:H

Fijar Nivel de significancia .Calcular estadísticos muestrales: p1, p2, n1, n2 y n (n= n1 + n2).

Calcular Zc :

nqp

)p(pZ

cc

21c

2

)p(pp 21

c

cc p1q

Page 38: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

38

EjercicioEjercicio

Se está estudiando si el estrés es un factor Se está estudiando si el estrés es un factor importante en los niveles de colesterol en sangre. importante en los niveles de colesterol en sangre. Se tiene un grupo control (sin estrés), y un grupo con Se tiene un grupo control (sin estrés), y un grupo con estrés. En el grupo control, formado por 20 personas se estrés. En el grupo control, formado por 20 personas se encuentran 3 personas con colesterol alto. encuentran 3 personas con colesterol alto.

En el grupo con estrés formado por 35 personas En el grupo con estrés formado por 35 personas se encuentran 10 personas con colesterol alto. se encuentran 10 personas con colesterol alto.

Probar si el estrés es un factor que incide en la Probar si el estrés es un factor que incide en la elevación del colesterol en sangre. elevación del colesterol en sangre.

Page 39: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

39

PRUEBA PARA DOS PRUEBA PARA DOS VARIANZASVARIANZAS

Fijar Nivel de significancia .Calcular estadísticos muestrales: medias, varianzas, n1 y n2.

Calcular Fc :

Caso 1 Caso 2 Caso 3

     22

210

22

210

:H:H

22

210

22

210

:H:H

21

220

21

220

:H:H

22

21

c s

sF

     )]1n(),1n(c 21

FF )]1n(),1n(c 12FF

)]1n(),1n(2/c 21FF

Page 40: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

40

Pruebas de hipótesis en ExcelPruebas de hipótesis en Excel

En el menú de análisis de datos del Excel se En el menú de análisis de datos del Excel se pueden hallar las pruebas de una media (está en pueden hallar las pruebas de una media (está en “Estadísticas descriptivas), de dos medias con “Estadísticas descriptivas), de dos medias con varianza conocida, de dos medias con varianza varianza conocida, de dos medias con varianza desconocida y la prueba de dos varianzas.desconocida y la prueba de dos varianzas.

Las pruebas de una proporción y de dos Las pruebas de una proporción y de dos proporciones con aproximación por el teorema proporciones con aproximación por el teorema central del límite, se pueden hacer usando las central del límite, se pueden hacer usando las anteriores. anteriores.

(Ver en clase, con los ejemplos expuestos)(Ver en clase, con los ejemplos expuestos)

Page 41: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

41

Pruebas de hipótesis en InfostatPruebas de hipótesis en Infostat

El Infostat tiene en el menú de análisis El Infostat tiene en el menú de análisis estadísticos las pruebas vistas en esta sección con estadísticos las pruebas vistas en esta sección con los mismos nombres.los mismos nombres.

Page 42: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

42

Pruebas de hipótesis en InfostatPruebas de hipótesis en Infostat

Page 43: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

43

EjercicioEjercicio

Use el Excel y el Infostat para realizar las pruebas de Use el Excel y el Infostat para realizar las pruebas de hipótesis de los ejemplos y de los ejercicios.hipótesis de los ejemplos y de los ejercicios.

Page 44: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

Estadística no-paramétricaEstadística no-paramétricaEstadística no-paramétricaEstadística no-paramétrica

Page 45: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

45

Introducción

Estadísticos de orden de los datos

Prueba de la mediana de una población

Prueba para dos medianas

Prueba de Wilcoxon para muestras pareadas

Pruebas de independencia y de homogeneidad

CONTENIDOCONTENIDO

Page 46: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

46

OBJETIVOSOBJETIVOS

Introducir los conceptos de propiedades Introducir los conceptos de propiedades poblacionales que no son parámetros.poblacionales que no son parámetros.

Describir la estimación de los estadísticos no-Describir la estimación de los estadísticos no-paramétricos.paramétricos.

Describir las pruebas de hipótesis para una Describir las pruebas de hipótesis para una muestra.muestra.

Describir las pruebas de hipótesis para dos Describir las pruebas de hipótesis para dos muestras.muestras.

Describir las pruebas de hipótesis de Describir las pruebas de hipótesis de homogeneidad y de independencia.homogeneidad y de independencia.

Page 47: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

47

INTRODUCCIONINTRODUCCION

En las unidades anteriores se En las unidades anteriores se estudiaron los procedimientos para calcular estudiaron los procedimientos para calcular intervalos de confianza y realizar pruebas intervalos de confianza y realizar pruebas de hipótesis, a partir de una muestra de la de hipótesis, a partir de una muestra de la población en estudio. población en estudio.

Se partió de la suposición de que se Se partió de la suposición de que se conoce el modelo de distribución de conoce el modelo de distribución de frecuencias de la variable estudiada. frecuencias de la variable estudiada. Además, se estaban haciendo inferencias Además, se estaban haciendo inferencias sobre un parámetro de dicha distribución.sobre un parámetro de dicha distribución.

Page 48: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

48

INTRODUCCIONINTRODUCCION

Muchas veces el tamaño de la muestra Muchas veces el tamaño de la muestra es pequeño, o la distribución de frecuencias es pequeño, o la distribución de frecuencias de la variable en estudio no se conoce, o no de la variable en estudio no se conoce, o no se aproxima a la normal, o la distribución es se aproxima a la normal, o la distribución es altamente asimétrica. altamente asimétrica.

Page 49: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

49

INTRODUCCIONINTRODUCCION

En otros casos, el interés del estudio En otros casos, el interés del estudio es estimar alguna característica poblacional es estimar alguna característica poblacional que que no es un parámetrono es un parámetro del modelo de del modelo de distribución de frecuencias de la población, distribución de frecuencias de la población, como es el caso de la mediana, el rango, o como es el caso de la mediana, el rango, o el grado de asociación de dos criterios de el grado de asociación de dos criterios de clasificación de los datos.clasificación de los datos.

Page 50: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

50

INTRODUCCIONINTRODUCCION

Sea porque la muestra es pequeña, o Sea porque la muestra es pequeña, o porque se desea estudiar alguna propiedad porque se desea estudiar alguna propiedad que no es un parámetro, o porque la que no es un parámetro, o porque la distribución de los datos es asimétrica, las distribución de los datos es asimétrica, las estadísticas que podemos emplear en esos estadísticas que podemos emplear en esos casos son las estadísticas llamadas no-casos son las estadísticas llamadas no-paramétricas. paramétricas.

Page 51: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

51

INTRODUCCIONINTRODUCCION

Las estadísticas no-paramétricas no Las estadísticas no-paramétricas no tienen una distribución conocida “a priori”, tienen una distribución conocida “a priori”, por lo que los métodos de estimación son por lo que los métodos de estimación son algo diferentes de los vistos en estadística algo diferentes de los vistos en estadística paramétrica.paramétrica.

Page 52: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

52

CONCEPTOSCONCEPTOS

Los métodos de estadística no-paramétrica Los métodos de estadística no-paramétrica tienen la ventaja de que algunos cálculos son tienen la ventaja de que algunos cálculos son fáciles y rápidos. fáciles y rápidos.

Cuando los datos están en una escala Cuando los datos están en una escala nominal o de orden, éstos métodos son los únicos nominal o de orden, éstos métodos son los únicos disponibles. disponibles.

Las desventajas de dichos métodos son su Las desventajas de dichos métodos son su menor eficiencia frente a los métodos paramétricos menor eficiencia frente a los métodos paramétricos equivalentes; además, los cálculos manuales de equivalentes; además, los cálculos manuales de algunas pruebas son largos y tediosos.algunas pruebas son largos y tediosos.

Page 53: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

53

EJEMPLOSEJEMPLOS Si se quiere hacer una prueba de hipótesis Si se quiere hacer una prueba de hipótesis

sobre el valor de la mediana del contenido de sobre el valor de la mediana del contenido de aflatoxinas en un alimento, es conveniente emplear aflatoxinas en un alimento, es conveniente emplear la estadística no-paramétrica. la estadística no-paramétrica.

El contenido de aflatoxinas es una variable El contenido de aflatoxinas es una variable que tiene una distribución altamente sesgada, que tiene una distribución altamente sesgada, siendo la mediana una mejor medida del centro de siendo la mediana una mejor medida del centro de los datos, que el promedio aritmético o media.los datos, que el promedio aritmético o media.

Por otra parte, cuando los datos están Por otra parte, cuando los datos están medidos en una escala de clasificación, o de medidos en una escala de clasificación, o de orden, o los datos son conteos, y tenemos orden, o los datos son conteos, y tenemos tamaños de muestra pequeños, es más adecuado tamaños de muestra pequeños, es más adecuado hacer estimaciones y pruebas no-paramétricas.hacer estimaciones y pruebas no-paramétricas.

Page 54: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

54

EJEMPLOSEJEMPLOS

Un ejemplo de este caso es cuando se Un ejemplo de este caso es cuando se quiere estimar el número de insectos presentes en quiere estimar el número de insectos presentes en lotes de grano, y el tamaño de la muestra (o sea, el lotes de grano, y el tamaño de la muestra (o sea, el número de lotes de granos) es menor que 20. número de lotes de granos) es menor que 20.

Si queremos probar que diferentes Si queremos probar que diferentes condiciones de mantenimiento afectan la condiciones de mantenimiento afectan la proporción de camarones con una cierta proporción de camarones con una cierta característica (la cual se mide por su presencia o característica (la cual se mide por su presencia o ausencia), lo más adecuado es realizar una prueba ausencia), lo más adecuado es realizar una prueba de homogeneidad de proporciones; este es un de homogeneidad de proporciones; este es un método no-paramétrico.método no-paramétrico.

Page 55: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

55

DETERMINACION DEL ORDENDETERMINACION DEL ORDEN

El orden es un estadístico que corresponde a El orden es un estadístico que corresponde a la magnitud relativa de un valor en un conjunto de la magnitud relativa de un valor en un conjunto de valores. valores.

El cálculo de los órdenes de una muestra es El cálculo de los órdenes de una muestra es un procedimiento usual al realizar pruebas no-un procedimiento usual al realizar pruebas no-paramétricas.paramétricas.

Sea una muestra de n observaciones: Sea una muestra de n observaciones: XX11,X,X22,.....,X,.....,Xnn. Si ordenamos los valores de X de . Si ordenamos los valores de X de

menor a mayor, el valor más pequeño de X tendrá menor a mayor, el valor más pequeño de X tendrá orden 1. orden 1.

Page 56: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

56

DETERMINACION DEL ORDENDETERMINACION DEL ORDEN

El valor siguiente tendrá orden 2, y así El valor siguiente tendrá orden 2, y así sucesivamente, hasta el valor más grande de sucesivamente, hasta el valor más grande de las X, que tendrá orden n. las X, que tendrá orden n.

Para diferenciar los valores ordenados Para diferenciar los valores ordenados de la muestra, del subíndice que se usa para de la muestra, del subíndice que se usa para identificación, el orden se indica con un identificación, el orden se indica con un subíndice entre paréntesis, tal como Xsubíndice entre paréntesis, tal como X(3)(3), el cual , el cual será el tercer valor de menor a mayor. será el tercer valor de menor a mayor.

Page 57: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

57

EJEMPLOEJEMPLO

Sean los valores de pH de una muestra de 5 Sean los valores de pH de una muestra de 5 observaciones (n=5), los siguientes: observaciones (n=5), los siguientes:

XX11 = 5 X = 5 X22 = 2 X = 2 X33 = 7 X = 7 X44 = 7.5 X = 7.5 X55 = 3 = 3

Los valores de orden serán:Los valores de orden serán:XX(1)(1)= X= X22 = 2; X = 2; X(2)(2)= X= X55 = 3; X = 3; X(3)(3)= X= X11 = 5; X = 5; X(4)(4)= X= X33 = 7; X = 7; X(5)(5)= X= X44 = 7.5. = 7.5.

Esto se puede resumir en una tabla como la siguiente:Esto se puede resumir en una tabla como la siguiente: 

Obs.

 X1

 X2

 X3

 X4

 X5

 Valor

 5

 2

 7

 7.5

 3

 Orden

 3

 1

 4

 5

 2

Page 58: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

58

EJEMPLO (Cont.)EJEMPLO (Cont.) Si dos o más observaciones son iguales, por Si dos o más observaciones son iguales, por

ejemplo, si Xejemplo, si X33= 7 y X= 7 y X44 =7, entonces se calcula el =7, entonces se calcula el

orden promedio, 3.5 y se asigna a Xorden promedio, 3.5 y se asigna a X33 y a X y a X4,4,,como ,como

XX(3.5)(3.5)

La La medianamediana de una muestra de tamaño par de una muestra de tamaño par será:será:

La mediana de una muestra de tamaño impar La mediana de una muestra de tamaño impar será:será:

2

XXMe }2/)1n{(}2/)1n{(

(n/2)XMe

Page 59: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

59

PRUEBA DE WILCOXONPRUEBA DE WILCOXON

Sea la hipótesis HSea la hipótesis Hoo: M = Mo , donde Mo es la : M = Mo , donde Mo es la

mediana de la población bajo estudio, y se mediana de la población bajo estudio, y se establece establece como el nivel de significancia. como el nivel de significancia.

Las hipótesis alternativas pueden ser: Las hipótesis alternativas pueden ser:

HHaa: M >Mo, Ha:M < Mo, y Ha: M : M >Mo, Ha:M < Mo, y Ha: M Mo. Mo.

Habrá una regla de decisión para cada una Habrá una regla de decisión para cada una de ellas. de ellas.

Se toma una muestra al azar de n Se toma una muestra al azar de n observaciones de la población bajo estudio. observaciones de la población bajo estudio.

Sean las observaciones de la muestra:Sean las observaciones de la muestra:

XX11, X, X22,......,X,......,Xnn

Page 60: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

60

PRUEBA DE WILCOXONPRUEBA DE WILCOXON

Se obtiene la diferencia de cada observación Se obtiene la diferencia de cada observación XXi i con la mediana bajo hipótesis (Mo):con la mediana bajo hipótesis (Mo):

DDii = X = Xii – Mo – Mo

Se ordenan las diferencias en valor absoluto, Se ordenan las diferencias en valor absoluto, esto es, ignorando el signo calcular el orden de esto es, ignorando el signo calcular el orden de cada diferencia |Di|. cada diferencia |Di|. Así, Así, D(1)D(1) es la diferencia es la diferencia más chica, y tiene orden 1, más chica, y tiene orden 1, D(2)D(2) es la es la siguiente,....hasta siguiente,....hasta D(n)D(n) la diferencia mayor, con la diferencia mayor, con orden n. orden n. Si se tienen empates (valores iguales, Si se tienen empates (valores iguales, positivos o negativos) se usa el orden promedio, positivos o negativos) se usa el orden promedio, como se explicó antes.como se explicó antes.

Page 61: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

61

PRUEBA DE WILCOXONPRUEBA DE WILCOXON

A cada diferencia ordenada se le pone el signo A cada diferencia ordenada se le pone el signo (si es positiva, signo + y si es negativa, signo -). (si es positiva, signo + y si es negativa, signo -).

Se obtiene la suma de los órdenes con signo Se obtiene la suma de los órdenes con signo positivo (+); esta suma se llamará: T+. Lo mismo positivo (+); esta suma se llamará: T+. Lo mismo con los órdenes de signo negativo: T‑.con los órdenes de signo negativo: T‑.

Si la hipótesis alternativa es Ha: M Si la hipótesis alternativa es Ha: M Mo, Mo, entonces el estadístico a usar será la suma de entonces el estadístico a usar será la suma de órdenes que sea menor: Si T‑ es menor que T+, el órdenes que sea menor: Si T‑ es menor que T+, el estadístico será T‑; si T+ es menor que T‑ estadístico será T‑; si T+ es menor que T‑ entonces el estadístico será T+.entonces el estadístico será T+.

Page 62: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

62

PRUEBA DE WILCOXONPRUEBA DE WILCOXON

Se rechaza Ho al nivel de significancia de Se rechaza Ho al nivel de significancia de , si , si T es menor o igual que el valor dado en tablas como T es menor o igual que el valor dado en tablas como "d", el cual se denota d("d", el cual se denota d(,n), donde ,n), donde es el nivel de es el nivel de significancia para dos colas, y significancia para dos colas, y es el nivel de es el nivel de significancia para una cola, siendo n el tamaño de significancia para una cola, siendo n el tamaño de muestra. (Tabla de Wilcoxon, en Apéndice I). muestra. (Tabla de Wilcoxon, en Apéndice I).

Page 63: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

63

EJEMPLOEJEMPLO

En un estudio sobre la influencia de las drogas sobre el coeficiente intelectual de jóvenes, se planteó la hipótesis de que la mediana del coeficiente intelectual de jóvenes drogadictos es diferente al coeficiente intelectual normal, el cual es de 107.

Para probar esta hipótesis se tomó una muestra al azar de 15 jóvenes drogadictos de diferentes colonias, y se les realizó la prueba de inteligencia.

La prueba de hipótesis estadística fue:Ho: M > 107 vs. Ha: M 107

Se usó un nivel de significancia de =0.05.

Page 64: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

64

EJEMPLOEJEMPLO

Valores de X

99 100 90 94 135 108 107 111 119 104 127 109 117 105 125

Xi -Mo =Di -8 -7 -17 -13 +28 +1 0 +4 +12 -3 +20 +2 +10 -2 +18

Orden de Di 7 6 11 10 14 1 5 9 4 13 2.5 8 2.5 12

Orden de Di

con Signo-7 -6 -11 -10 +14 +1 +5 +9 -4 +13 +2.5 +8 -2.5 +12

T+ = 64.5; T- = 40.5

Page 65: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

65

EJEMPLOEJEMPLO

Como T- es menor que T+, el estadístico de Como T- es menor que T+, el estadístico de prueba será T- = 40.5. La regla de decisión será: prueba será T- = 40.5. La regla de decisión será: Rechazar si T- es menor que el valor de las tablas de Rechazar si T- es menor que el valor de las tablas de Wilcoxon con a=0.05, y n -1=14, el cual es 22.Wilcoxon con a=0.05, y n -1=14, el cual es 22.

Como 40.5 >22, entonces no tenemos Como 40.5 >22, entonces no tenemos suficiente evidencia en la muestra, para rechazar la suficiente evidencia en la muestra, para rechazar la hipótesis nula.hipótesis nula.

Page 66: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

66

PRUEBA DE MANN-WHITNEYPRUEBA DE MANN-WHITNEY

Sean dos muestras independientes y aleatorias, Sean dos muestras independientes y aleatorias, obtenidas de dos poblaciones sobre las que se desea probar obtenidas de dos poblaciones sobre las que se desea probar la hipótesis:la hipótesis:

HHoo: Las poblaciones tienen medianas iguales : Las poblaciones tienen medianas iguales

HHaa: Las poblaciones difieren con respecto a su mediana.: Las poblaciones difieren con respecto a su mediana.

Supongamos que se tienen dos muestras aleatorias de Supongamos que se tienen dos muestras aleatorias de tamaños ntamaños n11 y n y n22, respectivamente. , respectivamente.

Se combinan ambas muestras y se calculan los órdenes,(XSe combinan ambas muestras y se calculan los órdenes,(X (ij)(ij)).).

Se suman los órdenes de la muestra 1: Se suman los órdenes de la muestra 1:

SS11= y los de la muestra 2: S= y los de la muestra 2: S22= separadamente.= separadamente.j

jX )1( j

)j2(X

Page 67: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

67

PRUEBA DE MANN-WHITNEYPRUEBA DE MANN-WHITNEY

Se calcula el estadístico T = SSe calcula el estadístico T = S11 ‑ [n ‑ [n11(n(n11 + 1)]/2, donde + 1)]/2, donde

SS11 es la suma de los órdenes que corresponden a la muestra es la suma de los órdenes que corresponden a la muestra

1.1.

Page 68: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

68

PRUEBA DE MANN-WHITNEYPRUEBA DE MANN-WHITNEY

Se rechaza Ho si T es menor que Se rechaza Ho si T es menor que ww/2/2 o T es o T es mayor que mayor que ww(1-(1-/2/2), donde ), donde ww(1-(1-/2)/2) = n = n11nn22 – – ww/2/2 y el y el

valor valor ww/2/2 con con(n(n11, y n, y n22) es un valor límite calculado ) es un valor límite calculado

por Mann-Whitney (Tabla de Mann-Whitney en por Mann-Whitney (Tabla de Mann-Whitney en Apéndice I).Apéndice I).

Cuando los valores de T son muy grandes, Cuando los valores de T son muy grandes, se busca en la tabla con (nse busca en la tabla con (n11nn22 -T). Así, los -T). Así, los

parámetros para buscar en la tabla son: parámetros para buscar en la tabla son:

nn11, n, n22, y T ó (n, y T ó (n11nn22 -T). -T).

Page 69: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

69

PRUEBAS DE INDEPENDENCIA PRUEBAS DE INDEPENDENCIA Y DE HOMOGENEIDADY DE HOMOGENEIDAD

Cuando tenemos frecuencias o proporciones Cuando tenemos frecuencias o proporciones de casos en tablas clasificadas de acuerdo a dos o de casos en tablas clasificadas de acuerdo a dos o más criterios o factores nominales, muchas veces más criterios o factores nominales, muchas veces interesa conocer si las proporciones en las clases interesa conocer si las proporciones en las clases correspondientes a un factor, corresponden o se correspondientes a un factor, corresponden o se asocian con las proporciones observadas en las asocian con las proporciones observadas en las clases del segundo factor o criterio. clases del segundo factor o criterio.

Page 70: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

70

PRUEBAS DE INDEPENDENCIA PRUEBAS DE INDEPENDENCIA Y DE HOMOGENEIDADY DE HOMOGENEIDAD

Las pruebas de este tipo se llaman pruebas Las pruebas de este tipo se llaman pruebas de independencia.de independencia.

Podemos además querer comparar una Podemos además querer comparar una clase de un factor con otra clase del mismo factor. clase de un factor con otra clase del mismo factor. Estas se llaman pruebas de homogeneidad.Estas se llaman pruebas de homogeneidad.

Page 71: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

71

PRUEBAS DE INDEPENDENCIAPRUEBAS DE INDEPENDENCIA

Sean n observaciones procedentes de una Sean n observaciones procedentes de una población que fue muestreada aleatoriamente. población que fue muestreada aleatoriamente.

Las observaciones están clasificadas según Las observaciones están clasificadas según dos criterios; esto es, cada observación puede dos criterios; esto es, cada observación puede pertenecer a una categoría Apertenecer a una categoría Aii de la clasificación A de la clasificación A

y a una categoría By a una categoría Bjj de la clasificación B. de la clasificación B.

Así, tenemos una tabla de doble entrada con Así, tenemos una tabla de doble entrada con cierto número de observaciones para cada celda, cierto número de observaciones para cada celda, como en el cuadro.como en el cuadro.

Page 72: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

72

PRUEBAS DE INDEPENDENCIAPRUEBAS DE INDEPENDENCIA

 

  B1 B2 . . . Bb

   

  A1

  A2

  .  Aa

  n11 n21 . . .nb1

  n12 n22 . . .nb2

  . . . . . . . n1a n2a . . nba

  n.1

  n.2

  .  n.a

  

  n1. n2. . . . nb.

  n..

 

Page 73: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

73

PRUEBAS DE INDEPENDENCIAPRUEBAS DE INDEPENDENCIA

Si los dos criterios de clasificación son Si los dos criterios de clasificación son independientes, el número de individuos en la clase independientes, el número de individuos en la clase BBiiAAjj, será: E, será: Eijij = [n = [ni.i.* n* n.j.j]/ n]/ n.... Este es el valor esperado de Este es el valor esperado de

frecuencia de la clase (i,j). A los valores observados de frecuencia de la clase (i,j). A los valores observados de nnijij se les denomina O se les denomina Oijij..

Page 74: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

74

PRUEBAS DE INDEPENDENCIAPRUEBAS DE INDEPENDENCIA

Sea la hipótesis nula:Sea la hipótesis nula:

HHoo : Los dos criterios de clasificación son independientes : Los dos criterios de clasificación son independientes

HHaa : Los dos criterios de clasificación están relacionados : Los dos criterios de clasificación están relacionados

El estadístico de prueba será: El estadístico de prueba será:

22 = = [(O[(Oijij ‑ E ‑ Eijij))22/ E/ Eijij]]

Si , entonces se rechaza HSi , entonces se rechaza Hoo..2

1)}1)(b(a,{2 χχ

Page 75: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

75

EJEMPLOEJEMPLO

Se desea conocer si existe asociación entre la Se desea conocer si existe asociación entre la humedad con que se almacena un grano y la presencia humedad con que se almacena un grano y la presencia de grano dañado. de grano dañado.

Para ello se toma una muestra aleatoria de Para ello se toma una muestra aleatoria de granos (de 56 lotes de grano), donde se observa si el granos (de 56 lotes de grano), donde se observa si el contenido de humedad inicial del grano fué alto o bajo contenido de humedad inicial del grano fué alto o bajo (sólo dos categorías); y si el grano después de 6 (sólo dos categorías); y si el grano después de 6 meses de almacenamiento tiene o no porcentajes de meses de almacenamiento tiene o no porcentajes de grano dañado por encima de la norma.grano dañado por encima de la norma.

Page 76: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

76

EJEMPLOEJEMPLOLos resultados muestran : Humedad baja, No Los resultados muestran : Humedad baja, No

daño=14 Humedad Alta, No daño=6; Humedad baja, Daño= daño=14 Humedad Alta, No daño=6; Humedad baja, Daño= 16; Humedad alta, Daño=20.16; Humedad alta, Daño=20.

Los resultados del número de lotes esperado, si no Los resultados del número de lotes esperado, si no existiera asociación son: 30*20/56, 26*20/56, 36*30/56, y existiera asociación son: 30*20/56, 26*20/56, 36*30/56, y 26*36/56.26*36/56. La hipótesis estadística será: La hipótesis estadística será: Ho: No existe asociación entre la humedad inicial del Ho: No existe asociación entre la humedad inicial del

grano y el porcentaje de lotes con grano dañado.grano y el porcentaje de lotes con grano dañado.Ha: Hay asociación entre la humedad inicial y el Ha: Hay asociación entre la humedad inicial y el

porcentaje de lotes con grano dañado.porcentaje de lotes con grano dañado.El estadístico de prueba será: El estadístico de prueba será: 22 = 3.376. La = 3.376. La

decisión será no rechazar la hipótesis nula, puesto que decisión será no rechazar la hipótesis nula, puesto que 22 = 3.376 no es mayor que = 3.376 no es mayor que 22

(1, 0.05)(1, 0.05)=3.84.=3.84.

Page 77: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

77

EjercicioEjercicio

Construya una tabla con los datos del Construya una tabla con los datos del ejemplo anterior.ejemplo anterior.

1.1. ¿Qué proporción de lotes dañados se encontró?¿Qué proporción de lotes dañados se encontró?

2.2. ¿Cuál es la proporción de lotes con humedad baja ¿Cuál es la proporción de lotes con humedad baja entre los lotes dañados? ¿Y la de lotes no entre los lotes dañados? ¿Y la de lotes no dañados?dañados?

3.3. ¿Son esas proporciones diferentes ¿Son esas proporciones diferentes (estadísticamente)?(estadísticamente)?

4.4. En el caso de que pruebe que las proporciones son En el caso de que pruebe que las proporciones son diferentes, ¿Cuáles serían sus conclusiones? diferentes, ¿Cuáles serían sus conclusiones?

Page 78: Pruebas de hipótesis. 2 Introducción Pruebas de hipótesis estadísticas Pruebas para parámetros de una población Pruebas para parámetros de dos poblaciones.

78

RESUMENRESUMEN

Diferencias entre métodos paramétricos y no-paramétricos.Cálculo de estadísticos de orden.Prueba de Wilcoxon para la mediana.Prueba de Mann-Whitney para dos medianas.Pruebas de independenciaPruebas de homogeneidad