Unidad IV. Pruebas de Hipótesis

download Unidad IV. Pruebas de Hipótesis

of 22

Transcript of Unidad IV. Pruebas de Hipótesis

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    1/22

     

    Prof. Felipe R. Tuz Poot   91

    UNIDAD IV. PRUEBAS DE HIPÓTESIS

    CONCEPTOS BÁSICOS DE PRUEBAS DE HIPÓTESIS

    La inferencia estadística está relacionada con los métodos para obtener conclusiones o

    generalizaciones acerca de una población. Estas conclusiones acerca de la población pueden estarrelacionadas con la forma de la distribución de una variable aleatoria, ó con los valores de uno ovarios parámetros de la misma.

    El campo de la inferencia estadística se divide en dos:

    a)  Por un lado, el interés de la estimación de los parámetros de una distribución y,b)

     

    Las pruebas de hipótesis.

    En el caso de la estimación, se trata de elegir el valor de un parámetro de la población, mientras que

    en las pruebas de hipótesis se trata de decidir entre aceptar o rechazar si un valor especificado del

    parámetro  corresponde a la población (por ejemplo, si el tiempo de vida de un artículo es un valor

      o no lo es).

    En el campo de las pruebas de hipótesis se pueden considerar dos áreas:

    a)  Pruebas de hipótesis respecto a los parámetros, para determinar si un parámetro de unadistribución toma o no un determinado valor, o si puede tomar un conjunto de valores y,

     b)  Pruebas de Bondad de Ajuste, para definir o establecer si un conjunto de datos se puede

    modelar mediante una determinada distribución.

    En las secciones siguientes solamente se aborda, el primer inciso, es decir, las pruebas de hipótesis.

    Una hipótesis estadística es una proposición o conjetura que se hace de la población o poblacionesrespecto a sus respectivos parámetros. Por ejemplo, si con base en una muestra aleatoria se tiene

    que decidir si un proceso está produciendo una determinada media, digamos µ 100, o si hay quedecidir si una determinada droga sirve a un grupo específico de pacientes, lo anterior, puedetraducirse en un lenguaje de “Pruebas de Hipótesis”, y utilizar metodologías estadísticas para tomaruna decisión al respecto.

    Estadísticamente una prueba de hipótesis es una afirmación o conjetura de una o más poblaciones.

    Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística, a no ser que se

    examine la población entera. Esto último, por supuesto sería impráctico en la mayoría de las

    situaciones, es por esto que en lugar de la población, se toma una muestra aleatoria representativa

    de la población de interés y se utilizan los datos de tal muestra para proporcionar evidencia que

    confirme o no la hipótesis planteada.

    Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra latoma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una hipótesis en favorde la otra. En el proceso de una prueba de hipótesis para una toma de decisión estadística se

    involucran dos tipos de hipótesis: Hipótesis nula e hipótesis alternativa , éstas se abordan con más

    detalle a continuación.

    Hipótesis Nula y Alternativa

    La hipótesis nula denotada por  es una declaración afirmando ningún cambio o ningún efecto en elestado de la naturaleza.  se considera cierta, o sin cambio alguno salvo que los datos proporcionenevidencia convincente de que es falsa. Comúnmente es planteada con el objetivo de ser rechazada, ya

    que se pretende probar que los datos dan evidencia de algún cambio.

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    2/22

     

    Prof. Felipe R. Tuz Poot   92

    La hipótesis alternativa es una declaración que contradice  y es denotada por  o bien . Esaceptada sólo si los datos proporcionan evidencia convincente de su verdad. Comúnmente es

    planteada como la hipótesis del investigador, la cual es la que se pretende aceptar rechazando .Ejemplo Supóngase que se sospecha que los niños tienen un CI más alto si comen alimentos con aceite de

    pescado durante seis meses.

    La hipótesis alternativa :“Los niños que comen alimentos con aceite de pescado por seis meses tienen un CI mayor que los

    niños que no lo hacen.

    La hipótesis nula :“Los niños que comen alimentos con aceite de pescado durante seis meses no muestran un mayor CI

    que los niños que no lo hacen”

    En un experimento se consideran dos grupos: un grupo de control al que no se le proporciona

    alimentos con aceite de pescado y otro grupo al que sí se le proporciona. A ambos grupos se les mideel CI al inicio del experimento y después de los seis meses del experimento.

    De las pruebas del coeficiente intelectual del grupo de control, se encuentra un CI medio de 100 antes

    del experimento y 100 después, esto es, no hay aumento.

    Los niños alimentados con aceite de pescado muestran un aumento de 100 a 106. Esto parece ser un

    aumento, pero aquí es donde la estadística entra en el proceso de comprobación de hipótesis. Es

    necesario comprobar si el aumento es significativo como para afirmarlo a nivel poblacional.

    Usando una prueba adecuada, el investigador puede comparar las dos medias finales de los dosgrupos (100 y 106), teniendo en cuenta el aumento, el número de datos en las muestras y laasignación al azar relativa de los grupos. El resultado permitirá determinar si existe evidencia

    suficiente para apoyar si la conjetura hecha por el investigador es afirmativa.

    Es importante tener en cuenta que, no rechazar la hipótesis nula no es lo mismo que aceptarla. Essólo que este experimento en particular no puso de manifiesto que el consumo de alimento con aceite

    de pescado no afecta al coeficiente intelectual. Este principio se encuentra en la esencia de la pruebade hipótesis.

    Errores de tipo I y tipo II

    Al utilizar un proceso de prueba de hipótesis para tomar decisiones sobre el parámetro poblacional,

    existe el riesgo de llegar a una conclusión equivocada, eso es, al aplicar la metodología de prueba dehipótesis, puede cometerse uno de dos tipos de error: el error de tipo I y el error de tipo II.

    Error tipo I: Se presenta cuando se rechaza la hipótesis nula siendo cierta y no debería rechazarse.

    Nivel de significancia. Es la probabilidad de cometer un error tipo I, denotado por alfa, . Nivel de confianza: Es la probabilidad de la decisión correcta de aceptar la hipótesis nula cuando esverdadera, esta probabilidad se denota por 1 .Error tipo II: Este tipo de error se presenta cuando no se rechaza la hipótesis nula siendo falsa ydebería rechazarse.

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    3/22

     

    Prof. Felipe R. Tuz Poot   93

    Característica de la prueba: Es la probabilidad de cometer un error de tipo II y se denota por . Potencia de la prueba o poder de la prueba. Es la probabilidad de la decisión correcta de rechazar la

    hipótesis nula cuando es falsa, esta probabilidad es denotada por 1 .En la siguiente tabla se resumen las probabilidades según la toma de decisión en una prueba dehipótesis.

    Estado de H0 

    Decisión es verdadera  es falsa

    Aceptar   Decisión correcta1 a   Nivel de confianza Error tipo II b   característica de la pruebaRechazar   Error tipo I

    a   Nivel de significancia Decisión correcta1  b   potencia de la pruebaUna hipótesis es una afirmación sobre un parámetro poblacional, la cual será aceptada o rechazada

    en base a la evidencia que proporciona la muestra. La hipótesis inicial que se define sobre la

    población se llama hipótesis nula; pero si rechazamos esa hipótesis nula debemos tener una hipótesis

    alternativa, la cual tomaremos como cierta si la hipótesis inicial o nula es falsa.

    EjemploEn un juzgado se le acusa a una persona de un delito, desde el punto de vista legal la persona acusadase le considera inocente (hipótesis nula o inicial) hasta que se demuestre lo contrario. Si el juez con

    todas las evidencias presentadas determina más allá de toda duda razonable que la persona esculpable; entonces rechaza la hipótesis nula y determina como verdadera una hipótesis alternativa

    (¡culpable!).

    Para que las reglas de decisión sean buenas, deben diseñarse de modo que minimicen los errores dedecisión, y no es una cuestión sencilla, porque para cualquier tamaño de la muestra, un intento de

    disminuir un tipo de error (por ejemplo error tipo I) suele ir acompañado de un crecimiento del otro

    tipo de error (error tipo II). En la práctica un tipo de error puede ser más grave que el otro, y debe

    alcanzarse un compromiso que disminuya el error más grave, la única forma de disminuir ambos ala vez es aumentar el tamaño de la muestra, que no siempre es posible.

    En general, en una prueba de hipótesis se trata de minimizar el error tipo I, es decir, “el error derechazar  y aceptar la hipótesis alternativa”, por lo que hay que cuidar que la probabilidad  deeste error sea lo más pequeña posible. Como se mencionó anteriormente, la hipótesis del

    investigador se encuentra en la hipótesis alternativa, por lo que se tratará de buscar evidencia en la

    P(Error tipo II) =

    Bajo H0

    P(Error tipo I) =

    Bajo Ha

    Valor crítico

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    4/22

     

    Prof. Felipe R. Tuz Poot   94

    muestra para rechazar la hipótesis nula y aceptar la alternativa, esto trae como consecuencia que se

    tenga probabilidad de cometer el error tipo I pero con la probabilidad más pequeña.

    Las dos decisiones posibles que se pueden hacer nos llevan a una de las dos siguientes conclusiones:

    1)  La conclusión de que hay suficiente evidencia para apoyar la hipótesis alternativa (rechazar

    la hipótesis nula a favor de la alternativa)

    2)  La conclusión de que no hay pruebas suficientes que apoyen la hipótesis alternativa (no

    rechazar la hipótesis nula a favor de la alternativa)

    Estadístico de Prueba: El estadístico de prueba es el que permite tomar la decisión en una pruebade hipótesis establecida por el investigador, ya que es una función de la muestra con la característica

    de tener una distribución, misma que se utiliza para calcular probabilidades que permiten definir la

    región de rechazo y la región de aceptación respecto a la hipótesis nula. Sin el conocimiento de dicha

    distribución no sería posible definir dichas regiones, pues todo lo relacionado a inferencia estadísticaes basado en probabilidades de una distribución teórica de la población.

    Región de aceptación y de rechazo 

    Región de aceptación: La región de aceptación es un subconjunto de valores del estadístico deprueba para los cuales la hipótesis nula no se rechaza. 

    Región de rechazo:  Es el conjunto de valores fuera de la región de aceptación. Si el valor delestadístico de prueba se encuentra dentro de esta región, la hipótesis nula es rechazada. En talescasos, se dice que la hipótesis nula ha sido rechazada con un nivel de significación .Valor crítico: Es el valor o el punto límite que divide a la región de rechazo y la región de aceptación.

    En un proceso de prueba de hipótesis, para tomar la decisión con respecto a la hipótesis nula (aceptar

    o rechazar esta hipótesis) se debe determinar el valor crítico en la distribución de la estadística de

    prueba. El valor crítico divide la región de rechazo de la región de aceptación.

    Por ejemplo, supóngase que se plantea una hipótesis respecto al parámetro µ  y además el estadísticode prueba adecuado para la prueba es,  el cual tiene una distribución normal estándar.Considerando la probabilidad del error tipo I, es decir estableciendo α, se utiliza la distribución de

    probabilidad del estadístico de prueba para establecer las regiones de rechazo y las de aceptación

    respecto a la hipótesis nula.

    Si lo que se desea probar es:

    : µ µ  contra la hipótesis alternativa : µ ≠ µ con un nivel de significancia α (es decir, permitir el error tipo I con la probabilidad establecida)entonces las regiones de rechazo se presenta en la siguiente figura con 0.05 

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    5/22

     

    Prof. Felipe R. Tuz Poot   95

    donde     usando la distribución normal estándar son tales que: <   /2  y >   /2.

    En el caso particular

    0.05 se tiene que

      1.96   1.96 Las áreas sombreadas en la figura, son las llamadas regiones críticas o zonas de rechazo de la hipótesis

    nula, los valores   y   son denominados puntos críticos. Así que si al calcular el estadístico deprueba e, el valor de este se encuentra dentro de la región de rechazo, entonces se rechaza , encaso contrario, se dice que no hay suficiente evidencia para rechazarla. Ahora, si el valor de e 

    correspondiente a la muestra observada cae dentro de la zona de aceptación en la figura, el

    investigador se inclinara a pensar que no reunió suficiente evidencia para poder rechazar la hipótesisnula a favor de la alternativa, aunque aquí también cabe la posibilidad de cometer un error en la

    decisión, que será del tipo II.

    En la práctica, los niveles de significancias más usuales son: 1%, 5% o bien el 10%.

    Las pruebas de hipótesis pueden ser de una o de dos colas dependiendo del planteamiento que se

    desee probar en la hipótesis alternativa. Si al establecer la hipótesis alternativa, ésta es de la forma: µ > µ, entonces se considera que se trata de una prueba de hipótesis de una cola a la derecha, osea, que la región de rechazo estará en el lado derecho de la distribución del estadístico de prueba y

    se considera la prueba con nivel de significancia α; ahora, si se establece la hipótesis alternativa: µ < µ , entonces se trata de prueba de hipótesis de una cola a la izquierda y se especifica laprueba con nivel de significancia α; por último si el signo es de desigualdad en la hipótesis alterna osea, es : µ ≠ µ   , se trata de una prueba de hipótesis de dos colas, una a la derecha y otra a laizquierda, como son dos las zonas de rechazo, se tendrá que dividir el nivel de significancia α entre

    dos (éste el caso presentado en la figura anterior). Observe, en las siguientes gráficas se presentanlas regiones de rechazo que se dan en cada caso mencionado:

    Prueba de hipótesis de una cola a la derecha (

    : µ > µ)

    95%

    =0.025   =0.025

    Región cr ítica o

     zona de rechazo de

    la hipótesis nula

    Región crítica o

     zona de rechazo de

    la hipótesis nula

     Zona de aceptación

    de la hipótesis

    nula

     z

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    6/22

     

    Prof. Felipe R. Tuz Poot   96

    Prueba de hipótesis de una cola a la izquierda (: µ < µ)

    Prueba de hipótesis de dos colas (: µ ≠ µ)Los pasos para realizar una prueba de hipótesis son los siguientes:

    1.  Plantear la hipótesis nula

    2.  Plantear la hipótesis alternativa3.  Especificar el nivel de significancia

    4. 

    Considerar el tamaño de muestra

    5.  Establecer los valores críticos que definen las regiones de rechazo de las de no rechazo.

    6.  Determinar cuál debe ser la estadística de prueba a emplear7.

     

    Coleccionar los datos de la muestra y calcular el valor muestral de la Estadística de prueba

    apropiada8.  Determinar si la estadística de prueba calculada corresponde a la región de rechazo o la

    región de aceptación. Recuérdese que la ubicación de estas regiones son respecto al signo de

    desigualdad ≠,>,

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    7/22

     

    Prof. Felipe R. Tuz Poot   97

    estudio se desea comprobar estadísticamente si la media de combustión es 50 cm/s o no lo es, es

    decir las hipótesis de interés son:

    : µ 50  vs : µ ≠ 50 Supóngase que la región de no rechazo de  es:

    {̅: 48.5 ≤ ̅ ≤ 51.5}  Suponiendo que la verdadera media es µ 52 , considerando 10 . El interés aquí es el dedeterminar la potencia de la prueba, para ello determínese la probabilidad del error tipo II es decir, . =Probabilidad (Aceptar  cuando es falsa)

    =Probabilidad (Aceptar  cuando µ 52)=Probabilidad (48.5 ≤ ̅ ≤ 51.5 cuando µ 52) .−./√  ≤     ̅−./√  ≤  .−./√   4.43 ≤ ≤ 0.63  0.63 ≤ ≤ 4.43  ≥ 0.63 ≥ 4.43

     

    0.2643 0000  0.2643 Entonces la potencia de la prueba es: 1 1 0.2643 0.7357  cuando µ 52.La potencia de la prueba es una medida descriptiva y concisa de la sensibilidad de una estadística,

    donde la sensibilidad se entiende como la habilidad de la prueba para detectar diferencias; en el caso

    del ejemplo, la sensibilidad de la prueba para detectar la diferencia entre la rapidez de combustión

    media de 50 cm/s y 52 es 0.7357, o sea, si la media verdadera es en realidad 52 cm/s, esta pruebarechazará : µ 50 y detectará esta diferencia en un 73.57% de las veces. Podría decirse tambiénque la prueba tiene la capacidad de rechazar

    : µ 50  con un 73.57% de confianza cuando la

    verdadera media es µ 52. Si este valor potencia, se considera muy bajo, el investigador podríaincrementar el tamaño de la muestra.

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    8/22

     

    Prof. Felipe R. Tuz Poot   98

    PRUEBA DE HIPÓTESIS A PARTIR DE UNA MUESTRA

    Prueba de hipótesis para la media 

    Se comenzará estudiando las pruebas de hipótesis para la media  de una sola población sobre la quese desea hacer inferencia. Los estadísticos a utilizar son: el estadístico

     y el estadístico

    , ¿cuál se

    empleará? Pues dependerá de si se conoce o desconoce  y considerando ciertas características dela muestra y la población.Prueba de hipótesis para la media  con  conocidaLas hipótesis que pueden ser de interés al investigador respecto a la media  son:

    :   : ≠  II  :   : >  III  :   : <  

    donde

     es una constante.

    Para las hipótesis establecidas aquí, es importante considerar que la prueba sólo es válida  bajo

    cualquiera de las siguientes condiciones:

    i)  la muestra aleatoria es obtenida de una población con distribución normal o aproximadamente

    normal

    ii)  Se desconoce la distribución poblacional correspondiente a la muestra, pero el tamaño de lamuestra n es grande, mayor o igual a 30.

    Así, por la teoría de distribuciones muestrales, y considerando el error tipo I se tiene que el

    estadístico de prueba adecuado es:

      √   donde:  es la media muestral con el tamaño de muestra   es la media poblacional planteada en la hipótesis nula es la desviación estándar poblacional.El estadístico   tiene una distribución normal estándar o aproximadamente normal, entonces, laregión de rechazo de  con el nivel de significancia  es:

    a)  Para las hipótesis planteadas en I la región de rechazo está dada por los valores que se

    obtienen de z y que cumplen || > ⁄  b)  Para las hipótesis planteadas en II la región de rechazo está dada por los valores que obtienende z que cumplan >  

    c)  Para las hipótesis planteadas en III la región de rechazo está dada por los valores que se

    obtienen de z que cumplan <  EjemploUn ingeniero establece que en promedio las mediciones del diámetro del tubo de albañil es mayor

    que 30. Para comprobar que lo que establece el ingeniero efectivamente es lo correcto se toma una

    muestra aleatoria de 100 tubos del cual resulta una media de 32 cm y una varianza de 4. ¿Apoya la

    muestra la aseveración del ingeniero? Responda con un 95% de confianza.

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    9/22

     

    Prof. Felipe R. Tuz Poot   99

    Solución

    La hipótesis que se desea probar es:

    : 30 : > 30.Este ejemplo es el caso ii) planteado en esta sección pues   es desconocida pero el tamaño demuestra

    100 es grande.

    Se estima la varianza poblacional  a través de la varianza muestral   4. Así, el estadístico deprueba es

      √   ≈  √ 

       32 302√ 100  10 

    Y el valor crítico es z .  1.64 . Ya que  calculada cumple que > .  1.64 entonces serechaza la hipótesis nula a favor de la hipótesis alternativa, esto es, se acepta la hipótesis que plantea

    el ingeniero con un 95% de confianza.

    Prueba de hipótesis para la media µ, con  desconocida.Las hipótesis que pueden ser de interés al investigador respecto a la media  son:

    :   : ≠  II  :   : >  III  :   : <  

    donde  es una constante.Para las hipótesis establecidas es importante que la muestra aleatoria obtenida esté bajo cualquiera

    de las siguientes condiciones:

    i)  la muestra aleatoria es obtenida de una población con distribución normal o aproximadamentenormal

    ii)  Se desconoce la distribución poblacional correspondiente a la muestra, pero el tamaño de lamuestra n es grande, mayor o igual a 30.

    Así, bajo cualquiera de estas condiciones que cumpla la muestra, se tiene por teoría de distribuciones

    muestrales y considerando el error tipo I que, el estadístico de prueba adecuado para cualquiera delas hipótesis planteadas es:

       √  

    el cual tiene una distribución  con 1 grados de libertad y donde: es la media muestral con el tamaño de muestra   es la media poblacional planteada en la hipótesis nula  es la desviación estándar muestral.

    Considerando la distribución  (distribución  con 1 grados de libertad), se puede determinar laregión de rechazo y la región de aceptación de  con el nivel de significancia .

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    10/22

     

    Prof. Felipe R. Tuz Poot   100

    a)  Para las hipótesis del caso I, la región de rechazo es válida para cada valor  que cumple:|| > ⁄   ,− b)  Para las hipótesis del caso II, la región de rechazo es válida para cada valor t que cumple:  >,− c)  Para las hipótesis del caso III, la región de rechazo es válida para cada valor  que cumple: < ,− 

    Notas1)

     

    En el caso i) no importa el tamaño de muestra, siempre será válido utilizar el estadístico .2)  En el caso ii) cuando el tamaño de muestra es grande, la distribución  con 1 grados de

    libertad se aproxima a la distribución normal estándar, por lo que podemos utilizar el

    estadístico de prueba

       √   con la desviación estándar poblacional  estimada por la desviación estándar muestral .

    3) 

    Cuando no se cumple ninguno de los casos i) y ii), es decir, se desconoce la distribución de la

    que proviene la muestra y el tamaño de muestra es < 30 , no es posible utilizar losestadísticos  y  para resolver la prueba de hipótesis respecto a la media. En esta situaciónse emplea metodología estadística no paramétrica, que en este curso no será abordada.

    Ejemplo En una fábrica de materiales se fabrican unas varillas con una resistencia de 4500 kg/cm 2. Un

    ingeniero sospecha que cierta maquinaria tiene fallas en la fabricación y asegura que la máquina está

    fabricando varillas con resistencia diferente a 4500 kg/cm2, por lo propone un ajuste a dichamaquinara. Con la finalidad de mostrar que la máquina está fallando, un día al azar se toma una

    muestra aleatoria de 10 varillas de la producción, al probarlas a la tensión hasta la ruptura se obtieneuna resistencia media de 4200 kg./cm2, con una desviación estándar de 200 kg. /cm2. Compruebe

    con un nivel de significancia de 0.05 si la máquina realmente necesita un ajuste. Considere que la

    variable poblacional resistencia tiene distribución normal.

    SoluciónLa muestra proviene de una población con distribución normal, se desconoce la desviación estándar

    poblacional , y además el tamaño de muestra es pequeño, por lo que se usará la distribución  destudent para estimar el promedio poblacional,  (si el tamaño de muestra fuese grande podría usarses como estimación para  y usar el estadístico de prueba , como se indica en la sección anterior).La hipótesis a probar es:

    : 4500 : ≠ 4500.El estadístico de prueba es:

       √     4200 4500200 √ 10  

      30063.246  4.74 El valor crítico es ,−  .,  2.262.La región de rechazo está dada por || > /,−. Entonces el valor del estadístico cae en la regiónde rechazo, por tanto se rechaza la hipótesis nula y se concluye que los datos favorecen la hipótesisplanteada por el ingeniero, por lo que se sugiere que la maquinaria entre a revisión con un 95% de

    confianza.

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    11/22

     

    Prof. Felipe R. Tuz Poot   101

    Prueba de hipótesis para la proporción

    Prueba de hipótesis para la proporción poblacional , en muestras grandes ≥ .Como se ha mencionado en la sección de intervalos de confianza, la proporción observada de éxitos

    en la muestra,

    ̂  

    , es un estimador de la proporción poblacional

    , que en realidad resulta la media

    de una población Bernoulli.

    Las hipótesis que pueden ser de interés respecto a la proporción  de una población  son:

    I  :   : ≠  II  :   : >  III

      :   : <  Considerando el error tipo I, el estadístico de prueba adecuado para cualquiera de las hipótesis

    respecto a , planteadas es:

     ̂  

     

    la cual tiene aproximadamente una distribución normal estándar, justificada por el teorema dellímite central, debido a que el tamaño de la muestra es ≥ 30.En este estadístico de prueba:

    ̂ es la proporción poblacional estimada con el tamaño de muestra   es la proporción hipotética planteada en la hipótesis nula y   1  Considerando la distribución aproximada de

     es posible definir las regiones de rechazo para cada

    hipótesis planteada, las cuales resultan ser:a)  Para las hipótesis del caso I, la región de rechazo es válida para los valores de  que cumplan|| > ⁄  b)

     

    Para las hipótesis del caso II, la región de rechazo es válida para los valores de   que cumplan >  c)  Para las hipótesis del caso III, la región de rechazo es válida para los valores de  que cumplan <  

    EjemploUn fabricante de insecticidas para moscas, desea comprobar que una nueva marca “Matamos K” esmucho más efectivo que una determinada marca “X” que se encuentra en el mercado. La marca X

    mata en promedio 800 de 1000 moscas. Para comprobar si la nueva marca es más efectiva, se realizaun experimento en el cual, se colocan 1000 moscas en un cuarto y se usa el insecticida “Matamos K”y resulta que sucumben 815. ¿De acuerdo a estos datos es estadísticamente más efectiva esta nueva

    marca? Justifique con un 99% de confianza.

    Solución

    La hipótesis de interés a probar es: : 0.80 : > 0.80.Se está en el caso de que la muestra es grande, por lo que el siguiente proceso tiene validez

    ̂   

      8151000  0.815

     

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    12/22

     

    Prof. Felipe R. Tuz Poot   102

    El estadístico de prueba es:

        ̂     ⁄     0.8150.800 0.80.2   1000⁄  

      0.0150.01265  1.186 Además se tiene que el valor crítico es

      .  2.33. Por lo tanto como el estadístico

    1.186 

    calculado es tal que < .  2.33, es decir, el valor del estadístico  no cae en la región de rechazo,no es posible rechazar  a favor de la hipótesis alternativa.Se concluye que no hay razón suficiente para decir que el nuevo insecticida es más eficiente que el

    de la marca X, es decir, los datos no apoyan a la hipótesis del fabricante.

    Prueba de hipótesis para la varianza

    Prueba de hipótesis para la varianza poblacional, , cuando la población tiene distribuciónnormal o aproximadamente normal

    Para realizar la prueba de hipótesis para la varianza poblacional,  sólo se abordará el caso máscomún en el que la media poblacional  es desconocida. Hay muchas situaciones prácticas donde  es el objetivo principal de una investigación experimental; así, este parámetro puede asumir una

    importancia mucho mayor que la de la media poblacional. Por ejemplo, los instrumentos de medicióncientífica deben producir valores insesgados con un error de medición muy pequeño; el altímetro de

    una aeronave que mide en promedio la altitud correcta sería de poco valor si la desviación estándardel error de medición fuese 2000 metros; los repuestos que se producen en un proceso industrial

    deben tener un mínimo de variabilidad con el objeto de reducir el número de productos cuyo tamaño

    esté fuera de número de productos defectuosos. Además, en general es deseable mantener unavarianza mínima en las mediciones para conseguir el control de determinados proceso y por lo tanto

    minimizar el porcentaje de productos de poca calidad.

    Las hipótesis de interés respecto a la varianza poblacional  son:I  :     :  ≠  II  :     :  >  III  :     :  <  

    donde  es una constante positiva, un valor hipotético.Es importante hacer énfasis de que bajo la condición de que la muestra obtenida es de una

    distribución normal, se tiene, por la teoría de distribuciones muestrales y considerando el error tipo

    I que el estadístico de prueba adecuado para cualquiera de las hipótesis establecidas para  es:    1  La cual tiene una distribución Chi- cuadrada con 1 grados de libertad y donde

     es la varianza establecida en la hipótesis nula es la varianza muestral con tamaño de muestra  A partir de esta distribución correspondiente al estadístico de prueba, es posible definir las regionesde rechazo para cada hipótesis planteada:

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    13/22

     

    Prof. Felipe R. Tuz Poot   103

    a)  Para las hipótesis del caso I, la región de rechazo está formada por los valores de   quecumplen que  > ,−   o   < −,−  

    b)  Para las hipótesis del caso II, la región de rechazo está formada por los valores de   quecumplen que:   > ,−  

    c)  Para las hipótesis del caso III, la región de rechazo está formada por los valores de  quecumplen que:

     

     < −,−  

    EjemploUn experimentador está convencido de que su equipo de medición tiene una variabilidad medida por

    una desviación estándar de    2. Durante un experimento, obtuvo las observaciones 4.1, 5.2, 10.2.¿Están en desacuerdo estos datos con su posición? Si esta respuesta es afirmativa, es necesaria la

    revisión del equipo. Responda con un nivel de significancia de a   0.1. Supóngase que los datos demedición tienen una distribución normal.

    Solución

    La hipótesis que se desea probar es:

    : 2 : ≠ 2 

    que es equivalente a :   4 :  ≠ 4 La varianza muestral de estos datos es

      12 ∑  ̅

    =  10.57 

    El estadístico de prueba es

     

       1

       210.57

    4   5.285 

    Se sabe que se rechaza  si el valor que se obtiene de  cumple que: 2 > 2,12   o  2 < 12,12

     

    Los valores críticos obtenidos de la tabla de la distribución Ji-cuadrada son  ,−   .,   5.99 y −,−   .,   0.103 , por lo que el valor del estadístico de prueba no cae en la región derechazo, no se puede rechazar la hipótesis nula a favor de la hipótesis alternativa. Como consecuencia

    no hay razón suficiente para dar una revisión al equipo con 90% de confianza.

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    14/22

     

    Prof. Felipe R. Tuz Poot   104

    PRUEBA DE HIPÓTESIS A PARTIR DE DOS MUESTRAS

    Pruebas de hipótesis para diferencia de medias poblacionales,     cuando lasdesviaciones estándar poblacionales   y  son conocidasSupóngase que se tienen dos muestras aleatorias:

     

    , … ,  y

    , … , . Las pruebas de hipótesis

    aquí planteadas se establecen bajo cualquiera de las siguientes condiciones.

    i)  Las poblaciones de donde son extraídas las muestras tienen distribución normal o

    aproximadamente normal y entre las muestras hay independencia.

    ii)  Las distribuciones poblacionales de donde son extraídas las muestras son desconocidas

    pero los tamaños de las muestras son mayores o iguales a 30 y entre las muestras hay

    independencia.

    En el siguiente cuadro  se presentan los posibles planteamientos de hipótesis con suscorrespondientes estadísticas de prueba y regiones de rechazo utilizando la distribución normal

    estándar.

    Hipótesisnula 

    Hipótesisalternativa   Medida Estadísticade Prueba Región de rechazo

             ≠    ̅   

     

    || > 2⁄           >   >           <   <  

    El valor

     se refiere a la posible diferencia entre las medias poblacionales. Cuando en el estudio se

    desea probar  si los promedios poblacionales son diferentes, entonces se considera   0  y losplanteamientos de las hipótesis se reducen a cualquiera de las dos formas siguientes que sepresentan a manera de ejemplo:

    :     0 :    ≠ 0 ó :     :  ≠  EjemploSe desea analizar el peso de las varillas fabricadas por dos compañías, por tanto se toman muestras

    aleatorias de 100 varillas de acero que se fabrican en cada una de las compañías A y B. De la muestra

    de la compañía A se obtiene un peso medio de 6.5 kg., asimismo, la muestra de la compañía B indicaun peso medio de 6.3 kg. Considerando que las desviaciones estándar poblacionales de cadacompañía son respectivamente   0.4   kg. y   0.3   kg. Se puede concluir que alguna de lascompañías fabrica las varillas con mayor peso? Responda estadísticamente con un 99% de confianza.

    Solución

    Se desea probar la hipótesis:

    :     :  ≠  La información que se tiene es     100,̅  6.5 ̅  6.3 . Además las desviaciones sonconocidas, a saber,

      0.4 kg y

      0.3 kg. De manera natural, las muestras son independientes,

    por lo que el estadístico de prueba es:

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    15/22

     

    Prof. Felipe R. Tuz Poot   105

      ̅  

      6.56.3 0.4100   0.3100

      0.20.05  4 

    El valor crítico es /   .  2.58 y como el valor del estadístico de prueba es tal que || >.  2.58, se rechaza la hipótesis nula a favor de la alternativa con una confianza del 99%, esdecir, los datos apoyan que efectivamente una de las fábricas produce varillas con mayor peso.

    Prueba de hipótesis para diferencia de medias poblacionales     cuando lasdesviaciones estándar poblacionales   y  son desconocidasSupóngase que se tienen dos muestras aleatorias X, … , Xn y Y, … , Yn  y se cumple alguna de lassiguientes condiciones:

    i) Las poblaciones de las cuales se extraen las muestras tienen distribución normal o aproximadamentenormal y entre las dos muestras hay independencia.

    ii) Las distribuciones poblacionales de donde son extraídas las muestras son desconocidas pero lostamaños de las muestras son mayores o iguales a 30 y entre las dos muestras hay independencia.

    Entonces, bajo la condición i), la prueba de hipótesis para     se determina de acuerdo a algunode los dos casos siguientes:

    Caso 1:     En este caso, los posibles planteamientos de las hipótesis con sus correspondientes estadísticas de

    prueba y regiones de rechazo utilizando la distribución  de student, se presentan en el siguientecuadro.Hipótesis

    nula Hipótesis

    alternativa   Medida Estadística dePrueba Región de rechazo         ≠    ̅

      1    1 

        2    −+−+−  

    || > ⁄   ,          >   > ,           <   < ,  

    EjemploSe llevó a cabo un experimento para comparar el deterioro abrasivo de dos materiales laminadosdiferentes. Se probaron doce piezas del material 1, exponiendo cada una a una máquina para medir

    el deterioro. De la misma manera, se probaron diez piezas del material 2. En cada caso, se observó la

    profundidad del deterioro. Las muestras del material 1 dieron un deterioro promedio (registrado)

    de 85 unidades con una desviación estándar muestral de 4, mientras que las muestras del material 2dieron un promedio de 81 y una desviación estándar muestral de 5. ¿Puede concluirse en el nivel de

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    16/22

     

    Prof. Felipe R. Tuz Poot   106

    significancia de 0.05 que el deterioro abrasivo del material 1 excede al del material 2 por más de dos

    unidades? Asuma que las poblaciones son aproximadamente normales con varianzas iguales.

    SoluciónSi

     y

     representan las medias poblacionales de los deterioros abrasivos para el material 1 y 2

    respectivamente, entonces se tienen las hipótesis siguientes:

    :     2 :    > 2 Se trata de una prueba de hipótesis de una cola a la derecha con 0.05 y 12 10 2 20 grados de libertad. De la tabla de distribución  de student se obtiene el valor crítico de 1.725.De la información del ejemplo se tiene que:

    ̅  85 

      4 

      12 

    ̅  81    5    10 La medida estadística de prueba es:

       1116 9251 2 1 0 2   4.478   ̅  ̅  1    1

      85 81 24.478  112   110  1.04 

    La medida estadística de prueba 1.04 es menor que el valor crítico 1.725 por lo que cae en la región

    de aceptación y se acepta la hipótesis nula.

    Decisión: No se está en condiciones de concluir que el deterioro abrasivo del material 1 excede al del

    material 2 por más de dos unidades, la muestra no aporta evidencia para esta conclusión. 

    EjemploSe deben eliminar gases ácidos de otros gases de refinería en una instalación de productos químicos,esto para reducir al mínimo la corrosión de las plantas. Dos métodos para eliminar estos gases

    produjeron el ritmo de corrosión (mm./año), medidas que se representan a continuación:

    Método A: 0.3, 0.7, 0.5, 0.8, 0.9, 0.7, 0.8Método B: 0.7, 0.8, 0.7, 0.6, 2.1, 0.6, 1.4, 2.3

    ¿Se puede concluir que el método A tiene una media menor en el ritmo de corrosión que el métodoB? Justifique estadísticamente con un nivel de significancia de 0.1. ¿Qué hipótesis se deben hacer para

    comprobar la validez de la respuesta?

    0 1.7251.04 t

    0.45

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    17/22

     

    Prof. Felipe R. Tuz Poot   107

    Solución

    Se desea probar la hipótesis:

    :     :  <  Equivalente a:

    :     0 :    < 0 La información que se tiene es: ̅  0.6714    0.0424    7 ̅  1.15    0.4886    8 

        1    1    2    7 10.0424 8 10.48867 8 2   0.2827 

    Para poder utilizar el estadístico de prueba descrito previamente es necesario realizar los siguientes

    supuestos:  Las muestras aleatorias provienen de poblaciones con distribución normal y son

    independientes.

      Las poblaciones tienen desviaciones estándar iguales, o sea   .Luego, el estadístico de prueba es:

      ̅  ̅ 1 ⁄   1 ⁄ ()   0.67141.15 1 7⁄   1 8⁄ 0.2827  1.7392 

    Como 0.10, el valor crítico es ,+−  .,  1.35. Como la estadística de prueba estal que < ., entonces se rechaza , es decir, los datos presentan evidencia para concluir queel método A tiene una media en el ritmo de corrosión más baja que el método B.

    Caso 2:   ≠  En este caso, los posibles planteamientos de las hipótesis con sus correspondientes estadísticas de

    prueba y regiones de rechazo utilizando la distribución t de student, se presentan en el siguiente

    cuadro.

    Hipótesisnula   Hipótesisalternativa   Medida Estadística dePrueba Región de rechazo         ≠    ̅    

     

    donde 

        

      ⁄   1  

    (     )

      1

     

    || > ⁄   ,          >   > ,  

             <   < ,  

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    18/22

     

    Prof. Felipe R. Tuz Poot   108

    EjemploUn fabricante de unidades reproductoras de video está probando el diseño de dos microcircuitos

    para determinar si producen un flujo de corriente medio equivalente. El departamento de ingenieríade desarrollo ha obtenido los siguientes datos:

    Para el Diseño 1

      15 

    ̅ 24.2 

      10 

    Para el Diseño 2   10  23.9    20 Se desea determinar si hay alguna diferencia en el flujo de corriente medio entre los dos diseños,

    donde se supone que las poblaciones tienen distribución normal, pero no se desea suponer que las

    varianzas son iguales. Utiliza un nivel de significancia de 0.1 para dar respuesta a esta hipótesis.

    SoluciónLa hipótesis de interés a probar es:

    :   :  ≠  Ya que se considera que los datos de las muestras provienen de distribuciones normales, además lasvarianzas son desconocidas y diferentes, el estadístico de prueba adecuado a emplear es:

            

     24.2 23.9 1015 2010

        0.31.632993  0.184 

        

      ⁄   1   (     )  1   1015 2010

    101514   20109   7.111

    0.0320.444  14.93 

    es decir 15 pues el valor de  se redondea al entero más cercano.El valor crítico es ,  .,   1.753 y como el estadístico de prueba es tal que || < /,  seconcluye que no se rechaza   por lo que los datos no proporcionan evidencia suficiente paraconcluir que existe diferencia entre las medias.

    Una vez presentada la condición i) se abordará a continuación la condición ii) que tiene las siguientes

    características:

     

    Las distribuciones poblacionales son desconocidas  Las desviaciones estándar  y  son desconocidas  Los tamaños de las muestras son mayores o iguales a 30 y,

      Las muestras son independientes.

    Como las desviaciones estándar son desconocidas se estiman con las desviaciones muestrales   por ser estos estimadores consistentes de sus desviaciones estándar poblacionalesrespectivas. Por ello pueden ser tratadas como desviaciones estándar poblacionales conocidas, lo que

    permite utilizar la estadística de prueba y regiones de rechazo presentadas en la tabla siguiente:

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    19/22

     

    Prof. Felipe R. Tuz Poot   109

    Hipótesisnula

    H0 

    Hipótesisalternativa   Medida Estadísticade Prueba Región de rechazo

             ≠    ̅

     

     

     

    || > ⁄  

         

       >  

    >  

             <   <  Esta tabla es exactamente la misma que la empleada en el caso cuando las muestras provienen dedistribuciones normales y sus desviaciones estándares son conocidas.

    Prueba de hipótesis para la diferencia de proporciones

    Intervalo de confianza para diferencia de proporciones poblacionales

      , con muestras

    mayores o iguales a 30.Cuando se tienen dos poblaciones en las cuales el interés radica en comparar las proporciones, al

    igual que como se hizo con la diferencia de medias poblacionales, se realiza considerado un

    estimador insesgado para la diferencia de proporciones     y este estimador es ̂  ̂, con̂      y ̂    , donde  es el número de éxitos obtenido del tamaño de muestra  de unapoblación con distribución  y  es el número de éxitos obtenido del tamaño demuestra  de una población con distribución .En el siguiente cuadro se presentan los posibles planteamientos de las hipótesis nula y alterna, lamedida estadística de prueba utilizando la distribución normal estándar, así como, las regiones de

    rechazo correspondientes.

    Hipótesisnula   Hipótesisalternativa   Medida Estadísticade Prueba Región de rechazo         ≠    ̂  ̂  ̂ 1    1

     

    ̂        1 ̂ 

    || > ⁄           >   >           <   <  

    EjemploConsidere un proceso de producción que tiene una fracción defectuosa   desconocida. A esteproceso se le realizan unas mejoras para reducir el porcentaje de defectuosos que está produciendo,

    y queremos saber si estos cambios sí reducen sustancialmente la proporción de artículos defectuosos

    del proceso. Para ello, se toma una muestra de 200 artículos del proceso original, y se encuentran 12defectuosos, por otro lado se examinan 150 artículos del nuevo proceso y se observan 6 defectuosos.

    ¿Cree usted que los cambios efectuados al proceso han reducido el porcentaje de artículosdefectuosos? Use un nivel de confianza del 95%.

    SoluciónSean

     y

      proporciones poblacionales del proceso original y del nuevo respectivamente, entonces

    se desea probar la hipótesis:

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    20/22

     

    Prof. Felipe R. Tuz Poot   110

    :     :  >  Los datos que se tienen son

      12    6    200    150 por lo que las proporciones muestrales son

    ̂      0.06  y ̂      0.04 y además

    ̂          1 2 6200150  0.05143 

    Ya que las muestras son grandes el estadístico de prueba adecuado es:

      ̂  ̂ ̂ 1    1    0.060.04 0.051430.94857   1200   1150

        0.020.02386  0.8382 

    El valor crítico es   .  1.64 y como el valor del estadístico es tal que <   1.64 entoncesla hipótesis nula no puede ser rechazada, es decir, los datos no presentan evidencia para concluir que

    los cambios efectuados al proceso ayudan a disminuir el porcentaje de defectuosos con una confianzadel 95%.

    Prueba de hipótesis para el cociente de varianzasPrueba de hipótesis para la igualdad de varianzas     , poblaciones con distribuciónnormal.

    Cuando nuestro objetivo es el de comparar las medias de dos poblaciones con distribución normal,el parámetro que se estudia es la diferencia de medias, ahora, si el objetivo es el de comparar las

    variabilidad de las poblaciones, el parámetro que se estudia es el cociente de varianzas,   , lajustificación es que en distribuciones muestrales se comprueba que el estadístico

      tiene unadistribución −,− ( tamaño de muestra de  y  tamaño de muestra de ); en particular si   o bien   1, entonces    tiene la misma distribución de Fisher. En cambio no hay taljustificación si se usa diferencia de varianzas.En el siguiente cuadro  se presentan los posibles planteamientos de las hipótesis con suscorrespondientes estadísticas de prueba y regiones de rechazo utilizando la distribución de Fisher.

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    21/22

     

    Prof. Felipe R. Tuz Poot   111

    Hipótesisnula   Hipótesisalternativa   Medida Estadísticade Prueba Región de rechazo

       

     ≠  

        con

        1 

    grados de libertad enel numerador y    1 grados de

    libertad en el

    denominador.

      <   ⁄   ,, 

    ó

      > ⁄   ,,      >     > ,,      <     <   1 ,, 

    La notación ,  indica que se debe considerar el valor crítico de la tabla F-Fisher con  gradosde libertad en el numerador,  grados de libertad en el denominador y con un nivel de significancia.En las siguientes gráficas se presentan los diferentes casos de pruebas de hipótesis de una cola y dedos colas, así como las fórmulas para calcular los valores críticos; también se muestran las regiones

    de rechazo identificadas como la parte sombreada. En el caso de pruebas de hipótesis de una cola, yasea a la izquierda o a la derecha, el nivel de significancia es el valor de α mientras que cuando la

    prueba de hipótesis es de dos colas el nivel de significancia es /2.

    Región de rechazo para la prueba de hipótesis cuando :  <  

    Región de rechazo para la prueba de hipótesis cuando :  >  

     

    a

  • 8/18/2019 Unidad IV. Pruebas de Hipótesis

    22/22

     

    Prof. Felipe R. Tuz Poot   112

    Región de rechazo para la prueba de hipótesis cuando :  ≠  Ejemplo

    Un médico asegura que la variabilidad entre el peso de las niñas ( ) y los niños () es diferente. Paracomprobar estadísticamente dicha afirmación se realiza el experimento de seleccionar dos muestras,una de 10 niñas y otra de 8 niños, de los cuales se tuvieron varianzas de   2.1  y   3.21 ,respectivamente. ¿Presentan las varianzas muestrales suficiente evidencia que indique que laafirmación del médico es cierta? Compruebe con un nivel de significancia de 0.1

    Solución

    Se desea probar la hipótesis

    :     :  ≠  Supóngase que las poblaciones tienen distribuciones que son razonablemente monticulares y que

    por lo tanto satisfacen la suposición de que las poblaciones son normales, dado esto el siguiente

    proceso es válido, estadísticamente.

    El estadístico de prueba es

          2.13.21  0.6542 

    Se sabe que la región de rechazo es para cualquier valor   que cumple cualquiera de los siguientescasos:  > ,−,−  o   < ,−,−

    −.

    Se tiene que:   ,−,−  .,,  3.68  ,−,−−  ( .,,)−  3.29−  0.3039.

    Como el estadístico f no cumple con ninguna de las condiciones entonces no pertenece a la región derechazo. Como consecuencia no hay suficiente evidencia para concluir que la variación en pesos entre

    los niños difiera con respecto a la variación en el peso entre las niñas con 90% de confianza. Los datosno apoyan a la hipótesis que plantea el médico.