Taller juzgamiento de hip+¦tesis 2013 - 1

20
UNIVERSIDAD PEDAGÓGICA Y TECNOLÓGICA DE COLOMBIA LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA INFERENCIA ESTADÍSTICA TAREA SOBRE JUZGAMIENTO DE HIPÓTESIS E INTERVALOS DE CONFIANZA SEÑORES ESTUDIANTES DE INFERENCIA Las dos primeras hojas hablan sobre el pvalor y cómo usar el intervalo de Confianza como proceso para juzgar hipótesis, por favor leer lo relacionado. Luego aparecen tres bloques de ejercicios, distribuidos así: El bloque uno con ejercicios numerados del 18 al 36, en la parte izquierda de cada ejercicio aparece el nombre del estudiante, es decir, indica el ejercicio que debe entregar. El bloque dos, contiene ejercicios en inglés (páginas 393, 405 Y 459), se desarrollan de la siguiente manera: Estudiante cuyo último dígito de su código sea par hace los ejercicios pares Estudiante cuyo último dígito de su código sea impar hace los ejercicios impares El bloque tres, son ejercicios para estudiar más no para entregar. La tarea se entrega en hojas de examen con el procedimiento, a su vez deben usar el paquete R como soporte, luego construyen un archivo con la sintaxis que necesiten el cual debe ser entregado junto con la tarea.

Transcript of Taller juzgamiento de hip+¦tesis 2013 - 1

UNIVERSIDAD PEDAGÓGICA Y TECNOLÓGICA DE COLOMBIA LICENCIATURA EN MATEMÁTICAS Y ESTADÍSTICA ‐ INFERENCIA ESTADÍSTICA  TAREA SOBRE JUZGAMIENTO DE HIPÓTESIS E INTERVALOS DE CONFIANZA 

 

SEÑORES ESTUDIANTES DE INFERENCIA  Las  dos  primeras  hojas  hablan  sobre  el  p‐valor  y  cómo  usar  el  intervalo  de Confianza como proceso para juzgar hipótesis, por favor leer lo relacionado.  Luego aparecen tres bloques de ejercicios, distribuidos así:  El bloque uno con ejercicios numerados del 18 al 36, en la parte izquierda de cada ejercicio aparece el nombre del estudiante, es decir,  indica el ejercicio que debe entregar.  El bloque dos, contiene ejercicios en inglés (páginas 393, 405 Y 459), se desarrollan de la siguiente manera:  Estudiante cuyo último dígito de su código sea par hace los ejercicios pares Estudiante cuyo último dígito de su código sea impar hace los ejercicios impares   El bloque tres, son ejercicios para estudiar más no para entregar.  La tarea se entrega en hojas de examen con el procedimiento, a su vez deben usar el  paquete  R  como  soporte,  luego  construyen  un  archivo  con  la  sintaxis  que necesiten el cual debe ser entregado junto con la tarea.  

'RUEBA DE HIPÓTESIS PARA LA MEDIA DE UNA SOLA POBLACIÓN� 215

8.� Decisión estadística. Con base en la regla de decisión, se puede rechazar la hipótesis nula porque -2.12 está en la región de rechazo. Se puede decir que el valor calculado de la prueba estadística tiene un nivel de significación de .Op.

9. Conclusión.� Se concluye que Jl no es igual que 30 y que las accio­nes del administrador o médico deberán estar de acuerdo con esta conclusión.

10. Valor dep. En lugar de decir que un valo~ observado de la estadís­tica de prueba es o no significativo, muchos autores de obras de investigación prefieren informar la probabilidad exacta de obtener u:t;l valor tanto o más extremo que el observado? si la hipótesis nula es verdadera. En el presente caso, estos investigadores darían el va­lor calculado de la estadística de prueba junto con la proposición p =.0340. Dicha proposición significa que la probabilidad de obte­ner 1,l,n valor tan extremo como 2.12 en cualquier dirección, cuando la hipótesis nula es verdadera, es de .0340. Este valor se obtiene de la tt:lb1a D y es la probabilidad de observar z 2.12 o a z - 2.12 cuando la hipótesis nula es verdadera. Es decir, cuando Ro es verda­dera, la probabilidad de obtener un valor de z mayor o igual que 2.12 es .0170, y la probabilidad de observar un valor de z menor o igual que - 2.12 es de .0170. La probabilidad de que ocurra cual­quiera de estos casos, cuando Ro es verdadera, es igual a la suma de las dos probabilidades individuales, y en consecuencia, en este ejem­plo, se dice qu~p =.0170 + .0170 = .0340. La cantidadp se conoce como el valor ppara la prueba.

DEFINICIÓN

El valor p'para la prueba de una hipótesis es la probabilidad de obtener, cuando H eso verdadera, un valor de la estadística de prueba tan extremo o más (en la dirección adecuada para HA) que el valor calculado en realidad.

El valor p para una prueba puede definirse tamb,ién como el valor más pequeño de ex por el cual la hipótesis nula se puede rechazar. Puesto que, en el ejemplo 7.2.1, el valor de p es .0340, se sabe que se podría haber seleq::ionado un valor ex tan pequeño comp .0340 y aun rechazar la hipótesis nula. Si se hubiera elegido un valor de a menor que .0340, no hubiera sido posible rechazar la hipótesis nula. Una regla general que vale la pena recordar es: si el valor p es menor o igual que ex., es posible rechazar la hipótesis nula; si el valor p es mayor que a no es posible rechazar la hipótesis nula.

Administrador
Rectángulo
Administrador
Rectángulo

CAPÍTULO 7 PRUEBA DE HIPÓTESIS

El informe de valores p como parte de los resultados de una inves­tigación proporciona más información al lector que afirmaciones como "la hipótesis nula se rechaza con un nivel de significación de .05" o "los resultados no fueron significativos en el nivel.05". Al informar el valor p asociado con una prueba se permite al lector saber con exactitud qué tan extraño o qué tan común es el valor calculado de la estadística de prueba dado que Ro es verdadera. •

Prueba de Hopor medio de un intervalo de confianza Anteriormente se estableció que es posible utilizar intervalos de confianza para probar hipótesis. En el ejemplo 7.2.1 se utilizó un procedimiento de prueba de hipótesis para probar H o: Jl = 30 contra la hipótesis alternativa HA: Jl ~ 30. Fue posible rechazar la hipó­tesis nula Ro porque el valor calculado de la estadística de prueba cayó en la región de rechazo.

A continuación se muestra cómo se hubiera podido llegar a esta misma con­clusión mediante el uso de un intervalo de confianza de 1OO( 1 - ex.) por ciento. El intervalo de confianza de 95 por ciento para tL es

27 ± 1.96VezO/10

27 ± 1.96(1.4142) 27 ± 2.7718 24.2282, 2~.7718

Dado que este intervalo no incluye a 30, se dice que 30 no es un candidato para la media que se está estimando y, por lo tanto, f..l no es igual a 30 y se rec~aza aHO' Ésta es la misma conclusión a la que se llegó mediante el procedimiento de prueba de hipótesis.

Si el parámetro supuesto, 30, se hubiera incluido en el intervalo de confianza de 95 por ciento, se habría dicho que.Ró no se rechaza en el nivel .05 de significa­ción. En general, cuando se prueba una hipótesis nula por medio de un intervalo de con­fianza bilateral, se rechaza a Ro en el nivel a de significación si el parámetro supuesto no está contenido dentro del intervalo de confianza de 100(1 - a) por ciento. Si el parámetro supuesto está contenido dentro de dicho intervalo, no es posible rechazar Ro en el nivel ex. de significación.

Prueba de hipótesis unilateral El intervalo de hipótesis ilustradq por el ejemplo 7.2.1 es un ejemplo de prueba bilateral, llamada así porque la región de rechazo se divide entre los dos lados o colas deja distribución de la estadística de prueba. Una prueba de hipótesis puede ser unilateral, en cuyo caso toda la re­gión de rechazo está en una u otra cola de la distribución. El que se utilice una prueba unilateral o bilateral depende de la naturaleza de la cuestión planteada por el investigador.

Si tanto los valores pequefios como los grandes causan el rechazo de una hi­pótesis nula, lo indicado es utilizar una prueba bilateral. Cuando únicamente los valores suficientemente "pequeños" o suficientemente "grandes" causan el rechazo de la hipótesis nula, lo indicado es utilizar una prueba unilateral.

Administrador
Rectángulo

  

EJERCICIOS BLOQUE UNO 

18.- Una prueba de detección de la hepatitis vírica produce un 2% de falsos positivos (prueba positiva en una persona sana) y un 5% de falsos negativos (prueba negativa en una persona enferma). Se aplica esta prueba a 800 personas independientes tomadas al azar en una población.

a) Hallar la relación entre p="probabilidad de dar positivo en la prueba" y q="probabilidad de padecer hepatitis vírica".

b) ¿Cuál es el máximo número de pruebas positivas que podríamos obtener, entre las 800, para considerar probado que la enfermedad afecta a menos del 8% de la población?. Tomar 0.01α = .

sol.: a) p=0.02+0.93q; b) A lo sumo 46. 19.- El Verapamil y el Nitroprusside son dos productos utilizados para reducir la hipertensión. Para

compararlos, unos pacientes son tratados con Verapamil y otros con Nitroprusside. Los resultados obtenidos se muestran en la siguiente tabla, donde X="reducción (en mm.) de la presión arterial de un paciente tratado con Verapamil" e Y="reducción (en mm.) de la presión arterial de un paciente tratado con Nitroprusside":

X 10 15 18 23 12 16 15 Y 15 10 19 9 14 12 18

a) Admitiendo normalidad, ¿se puede aceptar la igualdad de varianzas a un nivel de significación de

0.1?. b) ¿Proporcionan estos datos suficiente evidencia estadística, a un nivel de significación de 0.1, para

concluir que el Verapamil es más efectivo que el Nitroprusside para reducir la presión arterial?. sol.: a) Sí; b) no, de modo que mantendremos la hipótesis de que ambos productos son

igualmente efectivos para reducir la presión arterial. 20.- Se tienen indicios de que el consumo de tabaco tiende a provocar problemas de trombosis debidos a

un aumento en la capacidad de coagulación. Para estudiar estas hipótesis, Levine (1973) extrajo muestras de sangre de 11 individuos antes y después de que fumasen un cigarrillo, y midió la capacidad de agregación de las plaquetas, obteniendo los datos siguientes (correspondientes al máximo porcentaje de plaquetas que se agregaron después de haber sido sometidas a un estímulo adecuado):

Antes de fumar (X) 25 25 27 44 30 67 53 53 52 60 28 Después de fumar (Y) 27 29 37 56 46 82 57 80 61 59 43

¿Hay suficiente evidencia estadística, a un nivel de significación de 0.01, a favor de la hipótesis de que los fumadores presentan una mayor tendencia a la formación de coágulos?. Suponer normalidad en los datos.

sol.: Sí 21.- Es generalmente aceptado que existen diferencias ligadas al sexo relacionadas con la respuesta a la

tensión producida por el calor. Se sometió aun grupo de 10 hombres y 8 mujeres a un programa de ejercicios duros que implicaban el empleo de aparatos de rueda. La variable de interés es el porcentaje de peso corporal perdido. Se obtuvieron los datos siguientes:

varones 2.9 3.5 3.9 3.8 3.6 3.7 3.8 4.0 3.6 3.7 mujeres 3.0 2.5 3.7 3.3 3.8 4.1 3.6 4.0

a) Establecer una estimación puntual para la diferencia de porcentaje medio de peso corporal perdido entre hombres y mujeres que hacen ejercicio en estas condiciones. b) Supuesta normalidad y varianzas iguales, hallar un intervalo de confianza al 95% para la diferencia de medias poblacionales.

sol.: a) 0.15; b)[-0.276 , 0.576].

22.- Se lleva a cabo un estudio para comparar algunos de los atributos físicos de las nadadoras olímpicas con los de las corredoras olímpicas. Una variable de interés es la grasa corporal total en kilogramos. Se han obtenido muestras de 12 corredoras y 10 nadadoras. Los valores observados son:

corredoras 11.2 10.1 9.4 9.2 8.3 8.2 7.6 7.3 6.9 5.5 5.0 3.7 nadadoras 14.1 15.1 11.4 14.3 9.2 12.7 13.7 11.9 10.7 8.7

Administrador
Cuadro de texto
YOBANI
Administrador
Cuadro de texto
LIZETH ZARABANDA
Administrador
Cuadro de texto
RAMIRO A.

Supuesta normalidad, hallar un intervalo de confianza del 98% para la diferencia de grasa corporal total media entre corredoras y nadadoras olímpicas. En base a este intervalo, ¿piensas que existe diferencia entre la cantidad media de grasa total de corredoras y nadadoras olímpicas?. Razonar la respuesta.

sol.: Como podemos suponer varianzas iguales, el intervalo de confianza de nivel 0.98 para la diferencia de medias es [-6.848, -2.112]. El intervalo indica, claramente, que las corredoras tienen menor cantidad media de grasa corporal que las nadadoras.

23.- Se lleva a cabo un estudio de dos tipos de tratamiento por fármacos para su utilización potencial en

transplantes de corazón. El fin de los fármacos es actuar como inmunosupresores: reprimir la tendencia natural del cuerpo a rechazar el transplante. Las ratas ACI machos sirven como donantes, y las ratas Lewis Brown Norway machos como receptoras. Estas ratas son conocidas por su defectuosa compatibilidad. La variable de interés es X, tiempo de supervivencia de días. Se han obtenido los siguientes resultados estadísticos:

Salicilato sódico solo Salicilato sódico y azatioprina n=9 m=9 x =16 días y =15 días sX=10.1 días sY=10 días

Hallar un intervalo de confianza del 90% para la diferencia entre los tiempos medios de supervivencia de los dos tratamientos. Suponer que las variables de interés son normales.

sol.: [-7.77 , 9.77]. 24.- Se han utilizado 23 vegetarianos en un estudio de enfermedad diverticular y dieta. Una variable de

interés es el total de fibra dietética. Se ha obtenido la siguiente información para los dos grupos, los que no tenían la enfermedad y los que sí la tenían:

Sin Con n=18 m=5 x =42.7 g y =27.7 g s X=9.9 g s Y=9.5 g

Suponiendo normalidad, a) Contrastar la igualdad de varianzas iguales. b) ¿Hay razón suficiente para afirmar que la media total de contenido de fibra dietética, en las dietas de los que no tienen la enfermedad, es más alta que en la de aquellos que la tienen?. Explicar la respuesta en base al p-valor del contraste.

sol.: a) S e aceptan varianzas iguales. b) Si, ya que el p-valor es inferior a 0.005.

25.- En un estudio de características corporales de las gaviotas de pico anillado, la variable considerada es la longitud del pico. Se dispone de los siguientes datos:

Hembras Machos n=51 m=41 x =59.1mm y =65.2 mm s X=1.9 mm s Y=2.0 mm

No se han detectado diferencias en las varianzas poblacionales. ¿Hay razón para sostener el argumento de que la longitud media del pico en los machos es mayor que en las hembras?. Explicar la respuesta en base al p-valor. (suponer que la distribución de las variables es normal).

sol.: Si, el p-valor es inferior a 0.0025. 26.- Se cree que los jóvenes adolescentes que fuman comienzan a hacerlo a una edad más temprana que

las chicas adolescentes fumadoras. ¿Los siguientes datos apoyan esta suposición?. (Suponer que la distribución de la variable edad a la que empiezan a fumar hombres y mujeres, es normal).

Administrador
Cuadro de texto
YURY PAOLA
Administrador
Cuadro de texto
RAFAEL C.
Administrador
Cuadro de texto
EDNA Y.

Hombres Mujeres n=33 m=14 x =11.3 años y =12.6 años s 2

X=4 s 2Y=3.5

sol.: Si, el p-valor del contraste es inferior a 0.025.

27.- Se realiza un estudio para comparar las tortugas en Malabar con las de Grande-Terre, islas del atolón

Aldabra en el Océano Índico. Una variable de interés es X, el peso de un huevo en el momento de la puesta. Muestras aleatoriamente seleccionadas de las dos islas proporcionan los siguientes resultados (supóngase normalidad):

Grande-Terre Malabar n=31 m=148 x =64.0 g y =82.7 g s X=6.5 g s Y=3.6 g

A la vista de estos datos, ¿se puede afirmar que el peso medio de un huevo en el momento de la puesta en tortugas de Malabar es mayor que en tortugas de Grande-Terre?. Razonar la respuesta.

sol.: Si, el p-valor es inferior a 0.0025. Además también se comprueba que las varianzas son distintas.

28.- Se realiza un estudio de velocidad de vuelo de diversas especies de pájaros. Se va a comparar el

pelícano pardo con el ostrero americano. Se cronometra a los pájaros volando con el viento de costado con una velocidad de viento de 5 a 8 mph. Los resultados obtenidos son los siguientes:

Pelícano pardo Ostrero n=9 m=12 x =26.05 mi/h y =30.19 mi/h s X=6.34 mi/h s Y=3.2 mi/h

Suponiendo normalidad, hallar un intervalo de confianza del 90% para la diferencia en la velocidad de vuelo media de los pelícanos pardos y los ostreros americanos cuando vuelan con el viento de costado. Basándose en este intervalo, ¿hay evidencias de que exista una diferencia en las medias poblacionales? Razonar la respuesta.

sol.: [-8.29 , 0.006], no. 29.- Para estudiar el efecto del ejercicio físico sobre el nivel de triglicérido, se ha realizado el siguiente

experimento con 11 individuos: previo al ejercicio, se tomaron muestras de sangre para determinar el nivel de triglicérido por 100 mililitros de sangre, de cada sujeto. Después los individuos fueron sometidos a un programa de ejercicios que se centraba diariamente en carreras y marchas. Al final del periodo de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de triglicérido. De este modo, se dispone de dos conjuntos de observaciones del nivel de triglicérido por 100 mililitros de sangre de los sujetos: (suponer normalidad)

Sujeto 1 2 3 4 5 6 7 8 9 10 11 Previo 68 77 94 73 37 131 77 24 99 629 116

Posterior 95 90 86 58 47 121 136 65 131 630 104

a) Hallar un intervalo de confianza del 90% para el cambio medio en el nivel de triglicérido. b) ¿Hay pruebas suficientes para afirmar que el ejercicio físico produce cambios en el nivel de triglicérido?.

sol.: a) [-25.91 , 0.83]; b) No, el p-valor es superior a 0.1.

30.- Se ha realizado un estudio para comparar el contenido de sodio en el plasma de la piel de las focas australes jóvenes, con el nivel de sodio de la leche de las focas. Los resultados obtenidos, sobre el contenido de sodio en la piel y en la leche, de 10 focas aleatoriamente seleccionadas son:

Administrador
Cuadro de texto
YAQUELIN C.
Administrador
Cuadro de texto
YENNY BRIGGITT
Administrador
Cuadro de texto
YURANY C.

Sujeto 1 2 3 4 5 6 7 8 9 10 Leche 93 104 95 81.5 95 95 76.5 80.5 79.5 87.0

Plasma 147 157 142 141 142 147 148 144 144 146

Suponiendo normalidad, hallar un intervalo de confianza del 95% para la diferencia media de niveles de sodio en los dos fluidos corporales. ¿Hay pruebas suficientes para afirmar que existe alguna diferencia?.

sol.: [-62.78 , -51.41]; Si, el p-valor es mucho más pequeño que 0.0025. 31.- Se intenta estudiar la influencia de la hipertensión en los padres sobre la presión sanguínea de los

hijos. Pare ello se seleccionan dos grupos de niños, unos con padres de presión sanguínea normal (grupo 1) y otros con uno de sus padres hipertenso (grupo 2), obteniéndose las siguientes presiones sistólicas:

Grupo 1 104 88 100 98 102 92 96 100 96 96 Grupo 2 100 102 96 106 110 110 120 112 112 90

Hallar un intervalo de confianza para la diferencia de medias, suponiendo normalidad y que las varianzas en las dos poblaciones de niños son iguales.

sol.: A un nivel de confianza del 95%, [-15.2776 , -1.9224] 32.- En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones (A1 y A2)

aisladas se obtuvieron los siguientes datos:

1 1 1

2 2 2

ˆ13 4 3ˆ11 5 2.2

n x sn x s= = == = =

Suponiendo que el tiempo de desarrollo en la población Ai sigue una distribución ( ),i iN µ σ , para i=1,2, se pide:

a) Hallar un intervalo de confianza para el cociente de varianzas al nivel 0.9. b) Obtener un intervalo de confianza para 1 2µ µ− , con nivel de confianza 0.95 (suponiendo varianzas

iguales). c) ¿Cuántos individuos habría que observar para estimar 1µ con un error máximo de 0.2 y un nivel de

confianza de 0.95?. sol.: a) [0.6383 , 5.1198]; b) [-7.0407 , -5.0407]; c) al menos 865 33.- Se efectúa un estudio sobre el color de los escarabajos tigre para conseguir pruebas que apoyen el

argumento de que la proporción de escarabajos negros puede variar de un lugar a otro. En una muestra de 500 escarabajos capturados en una extensión próxima a Providence, Rhode Island, 95 eran negros. Una captura de 112 escarabajos en Aqueduct, Nueva York, contenía 17 individuos negros.

a) Hallar una estimación puntual para la diferencia entre las proporciones de escarabajos negros en las dos regiones. En base a esa estimación, ¿crees que hay diferencia entre las proporciones poblacionales?. b) Construir un intervalo de confianza, de nivel de confianza 0.95, para la diferencia de proporciones poblacionales desconocida. En base a esa estimación, ¿crees que hay diferencia entre las proporciones poblacionales?.

c) Responder a la pregunta de los apartados a) y b) efectuando un contraste de hipótesis. ¿Cuál es su p-valor?.

sol.: a) 0.0382; b) [-0.0409 , 0.1173]; c) A un nivel de significación de 0.05 no podemos afirmar que exista diferencia entre las proporciones de escarabajos negros en las regiones estudiadas. El p-valor del contraste es 0.3472.

34.- Uno de los ejemplos de selección natural estudiados es el de la polilla moteada. Hasta 1845, todas las

especies conocidas presentaban colores claros, pero ese año fue capturada en Manchester una polilla negra. A causa de la industrialización en la zona, los troncos de los árboles, las rocas, e incluso la tierra, se habían ennegrecido por el hollín. Esta forma mutante negra se extendió rápidamente. H.B.D. Kettlewell creyó que la expansión era debida, en parte, a que el color negro protege a la polilla de sus depredadores naturales, en particular de los pájaros. Los entomólogos de la época declararon que ellos nunca habían visto a un pájaro comerse una polilla moteada de color alguno y desecharon la idea. En

Administrador
Cuadro de texto
YEISON D.
Administrador
Cuadro de texto
DIEGO O.
Administrador
Cuadro de texto
YENIFER G.
Administrador
Cuadro de texto
JEFERSON ALEXANDER

un experimento para estudiar la teoría, Kettlewell marcó una muestra de 100 polillas de cada color y las liberó después. Volvió por la noche con trampas de luz y recobró el 40% de las polillas negras y solamente el 19% de las de color claro. Supóngase que las polillas no recobradas fueron presas de algún depredador.

a) Encontrar una estimación puntual para la diferencia en las tasas de supervivencia de las polillas negras y las de color claro, en la región de Manchester. ¿Crees que esa estimación apoya la teoría de que el color negro contribuye a proteger a estas polillas de los depredadores?.

b) Construir un intervalo de confianza del 98% para la diferencia entre las tasas de supervivencia de las polillas negras y las de color claro, en la región de Manchester. ¿Crees que esa estimación apoya la teoría de que el color negro contribuye a proteger a estas polillas de los depredadores?.

c) Responder a la pregunta de los apartados a) y b) efectuando un contraste de hipótesis. ¿Cuál es su p-valor?.

sol.: a) 0.21; b) [0.0597 , 0.3603]; c) A un nivel de significación de 0.02 podemos afirmar que las polillas de color negro están mejor protegidas contra los depredadores que las de color claro. El p-valor del contraste es 6*10-4.

35.- Se han realizado diversos estudios analizando la incidencia de la malaria en niños africanos

heterocigóticos respecto al gen asociado a la anemia falciforme, y en niños homocigóticos normales. En un estudio realizado por ALLC se obtuvieron los siguientes datos: de 136 niños heterocigóticos, 36 sufrieron la malaria, mientras que, de 407 homocigóticos, la sufrieron 152. ¿Hay evidencia estadística (al nivel 0.05) de que los heterocigóticos están mejor protegidos frente a la malaria que los homocigóticos normales?.

sol.: Sí. 36.- En una granja experimental se intenta comparar la virulencia de dos organismos patógenos causantes

de epidemias en los pollos. De 200 pollos inoculados con el organismo 1, 137 manifestaron síntomas durante los 14 primeros días. De 150 pollos inoculados con el organismo 2, 98 manifestaron síntomas durante los 14 primeros días. ¿Existe diferencia entre la virulencia de los dos organismos?. Razonar en base al p-valor.

sol.: No, pues el p-valor es 0.5352, aproximadamente.

Administrador
Cuadro de texto
CARLOS A.
Administrador
Cuadro de texto
SANDRA M.

  

EJERCICIOS BLOQUE DOS 

S fe TI o N HYPOTHE515 TE5TING fOR THE MEAN (LARGE 5AMPLE5) 393

41. Light Bulbs� A light bulb manufacturer guarantees that the mean life of a certain type of light bulb is at least 750 hours. A random sample of 36 light bulbs has a mean life of 745 hours with a standard deviation of 60 hours. At Q' = 0.02, do you have enough evidence to reject the manufacturer's claim?

42. Sodium Content in Cereal In your work for a national health organization, you are asked to monitor the amount of sodium in a certain brand of cereal. You find that a random sample of 52 cereal servings has a mean sodium content of 232 milligrams with a standard deviation of 10 milligrams. At Q' = 0.04, can you conclude that the mean sodium content per serving of cereal is greater than 230 milligrams?

43. Nitrogen Dioxide Levels� A scientist estimates that the mean nitrogen dioxide level in Calgary is greater than 32 parts per billion. You want to test this estimate. To do so, you determine the nitrogen dioxide levels for 34 randomly selected days. The results (in parts per billion) are listed below. At Q' = 0.06, can you support the scientist's estimate? IAdapted

fíDiIl C1ean Air Strategic /l/lilll/ce)

24 36 44 35 44 34 29 40 39 43 41 32 33 29 29 43 25 39 25 42 29 22 22 25 14 15 14 29 25 27 22 24 18 17

• ~ 44. Fluorescent Lamps A fluorescent lamp manufacturer guarantees that the mean life of a certain type of lamp is at least 10,000 hours. You want to test this guarantee. To do so, you record the life of a random sample of 32 fluorescent lamps. The results (in hours) are shown below.At a = 0.09, do you have enough evidence to reject the manufacturer's claim?

8,800 9,155 13,001 10,250 10,002 11,413 8,234 10,402 10,016 8,015 6,110 11,005 11,555 9,254 6,991 12,006 10,420 8,302 8,151 10,980 10,186 10,003 8,814 11,445 6,277 8,632 7,265 10,584 9,397 11,987 7,556 10,380

•� 45. Weight Loss A weight loss program claims that program participants have a mean weight loss of at least 10 pounds after 1 month. You work for a medical association and are asked to test this claim. A random sample of 30 program participants and their weight losses (in pounds) after 1 month is listed in the stem-and-Ieaf plot below. At Q' = 0.03, do you have enough evidence to reject the program's claim?

Weight Loss (in pounds)� after One Month�

5 7 7 Key: 517 = 5.7�

6 67�

7 01 9�

8 2279�

9 03568�

10 2566�

1] 1 2578�

12 078�

13� 8

14�

15 O�

Administrador
Cuadro de texto
Administrador
Cuadro de texto

SEC flON 7 3 HYPOTHESIS TESTlNG FOR THE MEAN (SMAll SAMPlES) 405

27.� Annual Pay An employment information service claims the mean annual pay for full-time male workers over age 25 and without a high school diploma is $25,000. The annual pay for a random sample of] Ofull-time mate workers without a high schooJ diploma is ]isted. At a = 0.05, test the claÍm lhat the mean saJary Ís $25,000. I 'JrliIj>/i't/ ¡/fWI I .. r /lll/mll rI/'I{/!J(Jf' .5r/!{I.I!klj

26,185 23,814 22,374 25,189 26,318 20,767 30,782 29,541 24,597 28,955

28.� Annnal Pay An employment information service claims the mean annual pay for fu U-time female workers over age 25 and without a high school diploma is $19,100. The annual pay for a random sample of 12 full-time female workers without a high school diploma is listed. At a = 0.05, test the c1aim that the mean salary is $19,100. I/Ii/u/JI<,ri ¡i'/I/Ij es l1ure{{/I (JI' f.{{;',,/

S(l/llllln;

18,165 16,012 18,794 18,803 19,864 19,177 17,328 21,445 20,354 19,143 18,316 19,237

Testing Claims Using P·values In Exercises 29-34, (a) write the claim mathematieally and identify H o and Ha> (h) use teehnology to find the P-value, (e) decide whether to rejeet or fail to rejeet the null hypothesis, and (d) interpret the decision in the eontext of the original claim. Assume the population is normally distributed.

29. Soda Consumption For your study on the food consumption habits oí teenage males, you randomly select 20 teenage males and ask each how many 12-ounce servings oí soda he drinks each day. The results are listed below. At a = 0.05, is there enough evidence to support the claim that teenage males drink fewer than three 12-ounce servings of soda per day? I Adaplerlli'o/ll Cenrerl(Jr Selel/C!' 111 rlw I'/lb/ic Il1lere.ll)

2.1 2.3 2.4 1.2 0.8 2.] 2.0 2.2 2.5 2.1 1.6 2.1 1.8 2.2 2.0 2.8 3.2 0.5 1.4 1.2

30. School Snpplies� A company that manufactures school supplies says that teachers spend a mean of more than $550 of their own money on school supplies in a year. A random sample of the amounts (in dollars) that 24 teachers spent on school supplies in a recent year is listed below. At a = 0.05, is there enough evidence to support the company's claim? (A da/)/n/ /io/1l :Vallol1a/ ~)'c/IO{)/ S/lP/,!I' Ul/tI D¡uifJl//I'/1/ Á.llociuri/JI/ J

715 623 582 72] 602 62] 462 320 532 566 686 532 603 420 684 713 531 888 482 361 560 910 546 860

31. Class Size� You receive a brochure from a large university. The brochure indicates that the mean class size for full-time faculty is fewer than 32 students. You want to test this c1aim. You randomly select 18 c1asses taught by fun-time faculty and determine the class size of each. The results are listed below. At a = 0.01, can you support the university's c1aim? (!\dafJIl'tI

.li'Oll/ :V{{liO/lu/ Center lin- t;r!/lclIliOf/ SllItisliCl J

35� 28 29 33 32 40 26 25 29 28 30 36 33 29 27 30 28 25

32. Faculty Classroom Hours The dean of a university estimates that the mean number of classroom hours per week for full-time facu1ty is 11.0. As a member of the student council, you want to test this c1aim. A random sample of the number of c1assroom hours for eight full-time faculty for one week is listed below. At a = 0,01, can you reject the dean's claim? (/lr!ap/ed li-"1I1

VlItiO//I/! (,'nI('/' túr E<I/lClftl(l1l Sll/tI'lin)

11.8 8.6 12.6 7.9 6.4 10.4 13.6 9.1

Administrador
Cuadro de texto
Administrador
Cuadro de texto
Administrador
Cuadro de texto

5f:C110N 8) TESTING THE DIFFERENCE BETWEEN MEANS (SM LL INDEPENDENT SAMPLES) 459

, 23. Teaching Methods A new method of teac' reading is being tested on third grade students. A group of randomly selected third grade students is taught using the new curriculum. A control group of randomly selected third grade students is taught using the old curriculum. The reading test scores of the two groups are shown in the stem-and-Ieaf plot.

Old Curriculum New Curriculum

9 3 Key:

99 4 3 914 = 49 (old curriculum) 98843321 5 24 413 = 43 (new curriculum) 76422100 6 011477777899

7 01123349

8 24

At a = 0.10, is there enough evidence to conclude that the new method of teaching reading produces higher reading test scores than the old method does? Would you recommend changing to the new method does? Assume the population variances are equal.

..~ 24. Teaching Methods Two teaching methods and their effects on science test scores are being reviewed. A randomly selected group of students is taught in traditionallab sessions. A second randomly selected group of students is taught using interactive simulation software. The science test scores of the two groups are shown in the stem-and-Ieaf plot.

Traditional Lab Interactive Simulation Software

4 6 Key: 99887663210 7 0455778 019 = 90 (traditional)

98511100 8 003478899 911 = 91 (interactive) 20 9 139

At a = 0.05, can you support the claim that the mean science test score is 10wer for students taught using the traditionallab method than it is for students taught using the interactive simulation software? Assume the population variances are equal.

• Extending Concepts

Constructing Confidence Intervals for #L1 - #L2 1f the sampling distribution for Xl - X2 is approximated by a t-distribution and the populations have equal variances, you can construct a confidence interval for ¡.ti - ¡.t2 by using the following.

~ )(ni - 1)s7 + (n2 - i)sjwhere (T = and dI = ni + n2 - 2

ni + n2 - 2

in Exercises 25 and 26, construct a confidence inlerval for ¡.tI - ¡.t2' Assume lhe populations are approximately normal with equal variances.

Administrador
Cuadro de texto
Administrador
Cuadro de texto

  

EJERCICIOS BLOQUE TRES 

- - -r..----------------­

226 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

7.2.6� Nueve animales de laboratorio fueron infectados con cierta bacteria y luego inmunosuprimi­dos. El número medio de organismos aislados posteriormente de los tejidos de dichos ani­males fue de 6.5 (datos codificados) con una desviación estándar de .6. ¿Es posible concluir a partir de estos datos que la media de la población es mayor que 6? Sea a = .05. ¿Qué supuestos se deben cumplir?

7.2.7� Una muestra de 25 estudiantes de enfermería de primer año tuvo una calificación media de 77 en una prueba para medir su actitud hacia el paciente moribundo. La desviación estándar de la muestra fue de 10. ¿Proporcionan estos datos evidencia suficiente como para indicar,

. en un nivel de significación de .05, que la media de la población es menor que 80? ¿Qué supuestos se deben cumplir?

7.2.8� Sé desea saber si es posible concluir que el consumo medio diario de calorías de la población rural de un país en desarrollo es de menos de 2000. Una muestra de 500 individuos prodttio un consumo medio de 1985 y una desviación estándar de 210. Sea a = .05.

7.2.9� Una encuesta de 100 hospitales de tamaño similar reveló un censo medio diario en el servi­cio de pediatría de 27 con una desviación estándar de 6.5. ¿Proporcionan estos datos sufi­ciente evidencia para indicar que la media de la población es mayor que 25? Sea a = .05.

7.2.10� Después de seguir un programa de capacitación en supervisión de hospitales durante una se­mana, 16 administradores de hospital obtuvieron una calificación media de 74 en una prueba llevada a cabo como parte de la evaluación del programa de capacitación. La desviación estándar de la muestra fue de 12. ¿Es posible concluir a partir de estos datos que la media de la población es mayor que 70? Sea a = .05. ¿Cuáles son los supuestos que se deben cumplir?

7.2.11� Se extrajo una muestra aleatoria de 16 informes de urgencias de los archivos de un servicio de ambulancias. El tiempo medio (calculado a partir de los datos de la muestra) para que las ambulancias llegaran a sus destinos fue de 13 minutos. Suponga que la población de tiempos sigue una distribución normal con una variancia de 9. ¿Es posible concluir, en un nivel de significación de .05, que la media de la población es mayor que 10 minutos?

@� Los siguientes datos son los consumos de oxígeno (en mI) durante la incubación de una muestra aleatoria de 15 suspensiones celulares:

14.0,14.1,14.5,13.2,11.2,14.0,14.1,12.2,

11.1,13.7,13.2,16.0,12.8,14.4,12.9

¿Proporcionan estos datos suficiente evidencia, en un nivel de significación de .05, de que la media de la población no es igual a 12 mI? ¿Qué supuestos se deben cumplir?

~ Una muestra aleatoria de 20 profesores universitarios aparentemente sanos proporcionó los ~ siguientes valores de capacidad respiratoria máxima. ¿Es posible concluir que la media máxima

de respiración no es de 110 litros por minuto?

132,33,91,108,67,169,54,203,190,133,

96,30,187,21,63,166,84,110,157,138

Sea a =� .01. ¿Qué supuestos se deben cumplir?

1

~ I� I� I� I� I�

­�I�

EJERCICIOS 227�

8 Los siguientes datos son las presiones sistólicas sanguíneas (en mm Hg) de 12 pacientes sometidos a terapia con medicamentos contra la hipertensión:

183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158�

Es posible concluir con base en 'estos datos que la media de la población es menor que 165? Sea a = .05. ¿Qué supuestos se deben cumplir?

@~~ ¿Es posible concluir que la edad media de defunción por la enfermedad de células falciformes homocigótica es menor que 30 años? Una muestra de 50 pacientes proporciona las siguien­tes edades en años:

15.5 2.0 45.1 1.7 .8 1.1 18.2 9.7 28.1 18.2

27.6 45.0 1.0 66.4 2.0 67.4 2.5 61.7 16.2 31.7

6.9 13.5 1.9 31.2 9.0 2.6 29.7 13.5 2.6 14.4

20.7 30.9 36.6 1.1 23.6 .9 7.6 23.5 6.3 40.2

23.7 4.8 33.2 27.1 36.7 3.2 38.0 3.5 21.8 2.4

Sea C!- =� .05. ¿Qué supuestos deben cumplirse?

~ Los siguientes datos se refieren a los niveles de presión intraocular (en mm Hg) registrados en una muestra de 21 individuos de edad avanzada:

14.5 12.9 14.0 16.1 12.0 17.5 14.1 12.9 17.9 12.0

16.4 24.2 12.2 14.4 17.0 10.0 18.5 20.8 16.2 14.9

19.6

¿Es posible concluir a partir de estos datos que la media de la población de la cual se extrajo la muestra es mayor que 14? Sea a = .05. ¿Qué supuestos se deben cumplir?

7.2.17� Suponga que las calificaciones para el IQ (coeficiente de inteligencia) de una población adulta siguen una distribución aproximadamente normal, con una desviación estándar de 15. Una muestra aleatoria simple de 25 adultos procedentes de esta población tiene un IQ medio de 105. Con base en estos datos, ¿es posible concluir que el IQ medio para la pobla­ción es diferente de lOO? La probabilidad de cometer un error de tipo 1 es de .05.

7.2.18� Un equipo de investigación se inclina a suponer que la presión sistólica sanguínea en una población de hombres sigue una distribución aproximadamente normal con una desvia­ción estándar de 16. Una muestra aleatoria simple de 64 hombres presentó una media de presión sistólica sanguínea de 133. ¿Proporcionan estos datos suficiente evidencia para con­cluir, con un nivel de significación de ,05, que la media de la población es mayor que 130?

---------------------------

r� 238 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

Se pretende saber si es posible concluir, con base en los datos, que, en promedio, los pacien­tes diabéticos tienen reflejos tendinosos profundos reducidos en comparación con pacientes sin diabetes de la misma edad. Sea a =.Ol.

7.3.2� Un estudio de los investigadores Hommes el al. (A-9) tiene dos propósitos: 1) investigar si el gasto de energía en reposo aumenta en la etapa primaria, sin síntomas de infección de VIH, y 2) estudiar las contribuciones relativas de la oxidación de carbohidratos de grasas durante el gasto de energía en reposo en los pacientes. Los individuos estudiados eran 11 pacientes externos varones infectados de VIH, que no presentaban síntomas y cuyas edades eran entre 23 y 50 años. El grupo de control estaba formado por 11 voluntarios varones sanos, con edades entre 25 y 51 años, que resultaron físicamente normales en sus exámenes y expedien­tes médicos. Entre los hallazgos se tienen las estadísticas respecto a la medición del gasto de energía en reposo.

Muestra Media Error estándar de la media

Individuos con VIH 7116� 173 Individuos de control 7058� 205

FUENTE: Mirjam]. T. Hommes, Johannes A. Romijn, Erik Endert y Hans P. Sauerwein, "Resting Energy Expenditure and Substrate Oxidation in Human Imunodeficieney Virus (HIV)-InfectedAsymptomatic Men: HIV Affects Host Metabolism in the Early Asymptomatic Stage", American joumal 01 Clinical Nutrition, 54, 311-315.

¿Ofrecen estos datos suficiente evidencia que permita concluir que el gasto de energía en reposo aumenta durante la primera etapa, cuando no hay síntomas presentes de la infección de VIH? Sea a = .05.

7.3.3� Frigerio el al. (A-lO) midieron la energía consumida en 32 mujeres de Cambia. Dieciséis de los individuos estudiados eran mujeres en periodo de lactancia (L) y el resto eran mujeres no embarazadas que no estaban en etapa de lactancia (NENL). Se reportaron los siguientes datos:

Muestra Consumo de energía (kJ/d)

L 5289,6209,6054,6665,6343,7699,5678,6954,6916, 4770,5979,6305,6502,6113,6347,5657

NENL 9920,8581,9305,10765,8079,9046,7134, 8736,10230,7121,8665,5167,8527,7791,8782,6883

FUENTE: Chistian Frigerio, Yves Schutz, Roger Whitehead y EricJ équier, "A New Procedure to Assess the Energy Requirements ofLactation in Gambian Women", Americanj oumal 01 Clinical Nutrition, 54, 526-533. © American Society for Clinical Nutrition.

¿Proveen estos datos suficiente evidencia que permita concluir que las poblaciones muestreadas difieren respecto a la media de consumo de energía? Sea a = .05.

7.3.4� ¿Es posible concluir que los niños crónicamente enfermos tienden, en promedio, a tener menos confianza en sí mismos que los niños sanos? Se aplicó una prueba diseñada para

l

EJERCICIOS 239

estimar la confianza en sí mismos en 16 niños crónicamente enfermos y 21 niños sanos. Las calificaciones medias y desviaciones estándar fueron las siguientes:

s

Grupo enfermo 22.5 4.1 Grupo sano 26.9 3.2

Sea a = .05.

7.3.5� Un investigador de enfermería desea saber si los graduados de los programas de enfermería a nivel bachillerato y los graduados en programas asociados de enfermería difieren en cuan­to a las calificaciones medias obtenidas en un estudio de personalidad. Una muestra de 50 graduados de programas asociados (grupo A) y una muestra de 60 graduados de bachillera­to (grupo B) proporcionaron las siguientes medias y desviaciones estándar:

Muestra . s

A 52.5 10.5 B 49.6 11.2

Con base en estos datos, ¿qué puede concluir el investigador? Sea a = .05.

7.3.6� Una prueba diseñada para medir las actitudes de las madres en cuanto al trabajo de parto y el periodo de expulsión se aplicó a dos grupos de madres primerizas. La muestra 1 (asisten­tes) acudieron a clases de instrucción prenatal impartidas en el departamento de salud. La muestra 2 (ausentes) no asistieron a clases. El tamaño de las muestras, medias y desviaciones estándar de las calificaciones para las pruebas son las siguientes:

Muestra n s

1 15 4.75 1.0 2 22 3.00 1.5

¿Proporcionan estos datos la evidencia suficiente para indicar que las asistentes, en prome­dio, tienen calificaciones más altas que las ausentes? Sea a = .05.

7.3.7� Se midieron las concentraciones de cortisol en dos grupos de mujeres al momento de dar a luz. Al grupo 1 se le practicó una operación cesárea de urgencia después de inducido el parto. Las del grupo 2 dieron a luz mediante operación cesárea o vía vaginal después de presentarse el trabajo de parto espontáneamente. El tamaño de las muestras, los niveles medios del cortisol y las desviaciones estándar fueron los siguientes:

Muestra n s

1 10 435 65 2 12 645 80

240 CAPÍTULO 7 PRUEBA DE HIPÓTESIS

¿Proporcionan estos datos la evidencia suficiente para indicar que existe una diferencia en las concentraciones medias del cortisol en las dos poblaciones? Sea a = .05.

7.3.8� Se midieron las concentraciones de protoporfrrina en dos muestras de individuos. La mues­tra 1 consistió en 50 varones adultos alcohólicos con sideroblastos anulares en la médula ósea. La muestra 2 consistió en 10 varones adultos no alcohólicos aparentemente sanos. Los niveles medios de protoporfirina y las desviaciones estándar de las dos muestras son los si­guientes:

Muestra x s

1 340 250 2 45 25

ms posible concluir con base en estos datos que los niveles de protoporfirina son más altos en la población de alcohólicos que en la población no alcohólica? Sea a.= .01.

7.3.9� Un investigador está interesado en saber si los niños nacidos prematuramente con acidosis metabólica tardía y los niños prematuros que no tienen dicha enfermedad, difieren en lo que respecta a las concentraciones en la orina de cierta sustancia química. Las concentraciones medias, desviaciones estándar y el tamaño de la muestra para ambos grupos son los siguientes:

Muestra n s

Con acidosis 35 8.5 5.5� Sin acidosis 40 4.8 3.6�

¿Qué puede concluir el investigador con base en estos resultados? Sea a =..05.

7.3.10� Varios investigadores desean saber si es posible concluir que dos poblaciones de niños difie­ren respecto a la edad promedio en la mal pueden caminar por sí solos. Los investigadores obtuvieron los siguientes datos (edades en meses).

Muestra de la población A: 9.5, 10.5,9.0,9.75, 10.0, 13.0,

10.0, 13.5, 10.0,9.5, 10.0,9.75

Muestra de la población B: 12.5,9.5,13.5,13.75,12.0,13.75,

12.5,9.5, 12.0, 13.5, 12.0, r~.o

¿Qué pueden concluir los investigadores? Sea a = .05.

7.3.11� ¿La privación sensorial tiene algún efecto sobre la frecuencia de las ondas alfa de las perso­nas? Se divide aleatoriamente en dos grupos a veinte voluntarios. Los individuos en el grupo A se sometieron a un periodo de privación sensorial durante 10 días, mientras que los indi­

1� 7.4 CPMPARACIÓN POR PAREJAS 241

viduos del grupo B sirvieron como grupo de control. Al terminar el periodo experimen­tal, se midió la frecuencia de las ondas alfa a partir de los electroencefalogramas de estas personas. Los.resultados son los siguientes:

Grupo A: 10.2,9.5,10.1,10.0,9.8,10.9,11.4,10.8,9.7,10.4

Grupo B: 11.0,11.2,10.1,11.4,11.7,11.2,10.8,11.6,10.9,10.9

Sea a =� .05.

7.3.12� ¿Es posible concluir que, en promedio, los linfocitos y las células tumorales difieren en tamaño? Los siguientes datos son el diámetro celular (en ~m) de 40 linfocitos y 50 célu­las tumorales obtenidas a partir de la biopsia del tejido de pacientes con melanoma.

Linfocitos

9.0 9.4 4.7 4.8 8.9 4.9 8.4 5.9 6.3 5.7 5.0 3.5 7.8 10.4 8.0 8.0 8.6 7.0 6.8 7.1 5.7 7.6 6.2 7.1 7.4 8.7 4.9 7.4 6.4 7.1 6.3 8.8 8.8 5.2 7.1 5.3 4.7 8.4 6.4 8.3 ~

Células tumorales

12.6 14.6 16.2 23.9 23.3 17.1 20.0 21.0 19.1 19.4 16.7 15.9 15.8 16.0 17.9 3.4 19.1 16.6 18.9 18.7 20.0 17.8 13.9 22.1 13.9 18.3 22.8 13.0 17.9 15.2 17.7� 15.1 16.9 16.4 22.8 19.4 19.6 18.4 18.2 20.7 16.3� 17.7 18.1 24.3 11.2 19.5 18.6 16.4 16.1 21.5

Sea a =� .05.

~ 7.4 COMPARACIÓN POR PARIlJAS

En el análisis referente a la diferencia entre las medias de dos poblaciones, se supone que las muestras son independientes. Un método que se utiliza con frecuencia para averiguar la eficacia de un tratamiento o procedimiento experi­mental es aquel que hace uso de observaciones relacionadas que resultan de muestras no independientes. Una prueba d~ hipótesis que se basa en este tipo de datos se conoce como prueba de comparaciones por parejas.

~-----------------------_!----