PRUEBA DE IPÓTESIS PARTE 4

25
PRUEBA DE HIPÓTESIS PARTE 4 Dr. José Dionicio Zacarias Flores [email protected] [email protected]

Transcript of PRUEBA DE IPÓTESIS PARTE 4

PRUEBA DE HIPÓTESIS PARTE 4

Dr. José Dionicio Zacarias Flores

[email protected]

[email protected]

• Parte de estos apuntes fueron apoyados por el libro Introduction to Probability and Statistics, de William Mendenhall, III, Robert J. Beaver, Barbara M. Beaver, 2013. Editorial Brooks/Cole .

• En los ejemplos anteriores, la decisión de rechazar o aceptar H0 se hizo comparando el valor calculado de la estadística de prueba con un valor crítico de z basado en el nivel de significancia α de la prueba. Sin embargo, diferentes niveles de significación pueden conducir a conclusiones diferentes. Por ejemplo, si en una prueba de cola derecha, la estadística de prueba es z = 2.03, puede rechazar H0 al nivel de significación de 5%, porque el estadístico de prueba supera z = 1.645. Sin embargo, no se puede rechazar H0 al nivel de significancia del 1%, porque la estadística de prueba es menor que z = 2.33 (ver Figura siguiente).

Calculando el valor p

Regiones de rechazo variable

• Para evitar cualquier ambigüedad en sus conclusiones, algunos experimentadores prefieren usar un nivel variable de significancia llamado p-valor para la prueba.

Calculando el valor p

• El valor de p o el nivel de significancia observado de una prueba estadística es el menor valor de α para el cual H0 puede ser rechazado. Es el riesgo real de cometer un error de Tipo I, si H0 es rechazado basado en el valor observado de la estadística de prueba. El valor de p mide la fuerza de la evidencia contra H0.

Definición

Regresando a lo explicado al inicio, en la prueba de cola derecha con estadística de prueba observada z = 2.03, el valor crítico más pequeño que puede usar y rechazar H0 es z = 2.03. Para este valor crítico, el riesgo de una decisión incorrecta es 𝑃 𝑧 ≥ 2.03 = 1 − .9788 =0.0212

Esta probabilidad es el valor de p para la prueba. Observe que en realidad es el área a la derecha del valor calculado de la estadística de prueba.

Regiones de rechazo variable

• Un valor de p pequeño indica que el valor observado de la estadística de prueba está muy lejos del valor hipotético de . Esto presenta una fuerte evidencia de que H0 es falso y debe ser rechazado. Los grandes p-valores indican que la estadística de prueba observada no está lejos de la media de la hipótesis y no apoya el rechazo de H0.

Definición

• Si el valor de p es menor o igual que un nivel de significación preajustado α, entonces la hipótesis nula puede ser rechazada, y puede reportar que los resultados son estadísticamente significativos en el nivel α.

• Cuando se realiza un trabajo de investigación muestral, ¿cuán pequeño debería ser el valor p antes de decidir rechazar H0? Muchos investigadores usan una "escala móvil" para clasificar sus resultados.

Escala móvil

• Si el valor p es menor que 0.01, se rechaza H0. Los resultados son muy significativos.

• Si el valor p está entre 0.01 y 0.05, se rechaza H0. Los resultados son estadísticamente significativos.

• Si el valor p está entre 0.05 y 0.10, H0 no suele rechazarse. Los resultados sólo tienden a una significación estadística.

• Si el valor p es mayor que 0.10, H0 no se rechaza. Los resultados no son estadísticamente significativos.

Sin embargo, el enfoque p-value tiene dos ventajas:

• El resultado estadístico de los paquetes de software de computadora suele reportar el valor p de la prueba.

• Con base en el valor p, los resultados de las pruebas se pueden evaluar utilizando cualquier nivel de significación que desee utilizar. Muchos investigadores informan el menor nivel de significación posible para el cual sus resultados son estadísticamente significativos.

EJEMPLOS

Ejemplo 1

• Los estándares establecidos por las agencias gubernamentales indican que los estadounidenses no deben exceder la ingesta diaria promedio de sodio de 3300 miligramos (mg). Para averiguar si los estadounidenses están excediendo este límite, se selecciona una muestra de 100 estadounidenses, y la media y la desviación estándar de la ingesta diaria de sodio son de 3400 mg y 1100 mg, respectivamente. Usar una α = 0.05 para realizar una prueba de hipótesis.

Solución

• La prueba de hipótesis la establecemos como:

𝐻0: 𝜇 = 3300𝐻1: 𝜇 > 3300

• El estadístico de prueba es 𝑧 = 𝑥 − 𝜇0

𝑠/ 𝑛=

3400 −3300

1100/ 100= 0.91

• El enfoque del valor crítico. Dado que el nivel de significancia es α = .05 y la prueba es de una cola, la región de rechazo se determina por un valor crítico con área de cola igual a α = 0.05; es decir, H0 puede ser rechazada si z > 1.645. Pero z = .91 no es mayor que el valor crítico, por lo que H0 no se rechaza (véase la siguiente figura).

• La aproximación de p-valor: Calcular el p-valor, la

probabilidad de que z es mayor o igual a z = .91: P(z > 0.91) = 1 – 0.8186 = 0.1814 De acuerdo a la escala móvil y a que el p-valor es de 0.1814, H0 sólo puede ser rechazada si fuera menor o igual al nivel de significancia propuesto, en este caso α = 0.05, pero 0.1814 > 0.05, por lo tanto, no puede ser rechazada H0. Conclusión: no hay fuerte evidencia para suponer que la ingesta diaria promedio de sodio supera los 3300 mg

Región de rechazo y p-valor para el ejemplo propuesto. Nota. Ambas formas realmente son lo mismo, por lo que generalmente usen el que más les agrade.

Ejemplo 2

• Supongamos que deseamos probar la hipótesis de que las madres con un bajo nivel socioeconómico (BNS)entregan a los bebés cuyos pesos al nacer son, en cierto sentido, inferiores a lo normal. Para probar esta hipótesis se obtiene una lista de los pesos al nacer de 100 partos consecutivos, nacidos vivos de la maternidad de un hospital en un área de BNS. Encontramos que la media de recién nacidos (𝑥 ) es de 115 onzas con desviación estándar muestral (s) de 24 onzas.

Ejemplo 2

• Supongamos que sabemos de grandes encuestas a nivel nacional basadas en millones de partos que el peso promedio de nacimientos en los Estados Unidos es de 120 onzas con una desviación estándar de 25 onzas.

• ¿Podemos decir que realmente el peso promedio de los recién nacidos de este hospital es menor que el promedio nacional?

Solución

• Debemos plantear nuestra hipótesis nula:

𝐻0: 𝜇 = 120 𝑜𝑛𝑧𝑎𝑠𝐻1: 𝜇 < 120 𝑜𝑛𝑧𝑎𝑠

• Si 𝑥 es suficientemente más pequeño que 0, entonces debemos rechazar H0; de lo contrario, aceptamos H0. es razonable pensar así, ya que si H0 es verdadera, entonces la mayor parte de las veces, los valores de 𝑥 tenderán a estar alrededor de 0, mientras que si H1 es verdadera, la mayor parte de las veces se acercarán a un 1 0.

• Obteniendo el punto crítico: 𝑧𝑝 =𝑥 −𝜇0

𝜎 𝑛 el p-

valor es 𝑝 = 𝑥 −𝜇0

𝜎 𝑛 , así para el ejemplo

el p-valor es 115−120

25 100 = .023

• Concluimos que debemos considerar a los resultados estadísticamente significativos, por lo que interpretamos esto diciendo que los nacimientos que ocurren en este hospital están inferiormente por debajo de la media nacional.

Definición

𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑥 𝑏𝑎𝑗𝑜 𝐻1

= 𝑁 𝜇1, 𝜎2 /𝑛

𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑥 𝑏𝑎𝑗𝑜 𝐻0

= 𝑁 𝜇0, 𝜎2 /𝑛

Valor 𝜇1 𝜇0

𝜇0 + 𝑧𝛼 ∙ 𝜎/ 𝑛

Región de rechazo Región de

aceptación

Fre

cue

nci

a

Ejemplo 3

• Supóngase que 100 neumáticos de cierta marca duraron en promedio 21431 millas con una desviación estándar de 1295 millas. Utilizando α = 0.05, probar la hipótesis nula = 22000 millas contra la hipótesis alternativa < 22000.

• ¿Cuál es la conclusión?

¿PREGUNTAS? O ¿ALGUNA INQUIETUD?