Lectura 2 - Pruebas de HipóTesis

download Lectura 2 - Pruebas de HipóTesis

of 36

description

Pruebas de HipóTesis, Matematicas Aplicadas, Estadistica, Universidad Siglo 21, Cordoba Argentina

Transcript of Lectura 2 - Pruebas de HipóTesis

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 1 -

    MODULO 2 2.- PRUEBAS DE HIPTESIS Bibliografa bsica: Berenson y Levine (1996) Estadstica para Administracin y Economa. 6. Ed. Prentice Hall Hispanoamericana. Madrid. Captulos: 11 (Apartados 11.1, 11.2, 11.3, 11.4, 11.5, 11.6, 11.7, 11.8, 11.9, 11.10, 11.11, 11.12), 12 (Apartados 12.3, 12.5), 13 (Apartados 13.1, 13.2, 13.3, 13.4, 13.9), 15 (Apartado 15.1)

    Concepto y estrategia general de las pruebas de hiptesis En algunas ocasiones, el estadstico debe proveer soporte para responder un interrogante sobre si es cierta o no determinada idea previa que tenemos, por ejemplo, sobre el valor de algn parmetro. Para poder dar respuesta, las pruebas de hiptesis tienen la siguiente lgica: si conocemos la distribucin muestral de un estadstico que relacione el parmetro sobre el cual nos interesa comprobar una afirmacin, con un estimador del mismo, podemos decidir que la afirmacin es aceptable si en la muestra obtenemos un resultado razonablemente cercano al previsto en la afirmacin. Si por el contrario, la evidencia de la muestra arroja un valor muy alejado, desconfiaremos de la validez de la idea supuesta sobre el valor del parmetro. Como puede verse, este tipo de razonamiento es de lo ms habitual en la forma de proceder y tomar decisiones a diario: someter nuestras ideas a alguna evidencia (siempre parcial, limitada, accesible, como una muestra), y considerar vlida la idea en el caso de que la informacin recogida parezca consistente con ella, y descartarla en caso contrario. Como permite ver esta estrategia, de lo ms prctica por cierto, estamos dispuestos a asumir ciertos riesgos de equivocarnos, justamente por basar nuestra decisin en informacin parcial. La realidad podra ser diferente a la situacin descripta por los datos que reunimos en nuestra muestra, y en definitiva, estar tomando una decisin equivocada acerca del valor del parmetro poblacional. De estos aspectos se trata la unidad que comenzamos a recorrer. Algunas analogas tiles para comprender esta metodologa Antes de iniciar el abordaje estadstico de las pruebas de hiptesis, recorrer algunas comparaciones tiles que suelen presentarse en la literatura:

    1. Se desea informar sobre la presencia de alguien o algo en una habitacin cerrada. Slo podemos observar por la rendija de la puerta (la zona que nos

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 2 -

    permite observar sera nuestra muestra). Si alguien o algo es visible en ese sector, podemos tomar una decisin correcta. Si no aparece nada en la muestra, podra ser tanto que efectivamente no hay nadie en la habitacin, como que, hay alguien o algo, pero se encuentra en una zona de la habitacin no accesible desde nuestro punto de observacin. Este es uno de los errores de las pruebas estadsticas que estudiaremos.

    Muestra: Observacin por la cerradura de una habitacin cerrada Error posible:

    - Considerar que no hay nada o nadie por no observarlo en la muestra.

    2. Otro ejemplo interesante es el vinculado con un juicio, donde se est

    analizando la culpabilidad o inocencia de un acusado de un crimen. El proceso trata de reunir pruebas para determinar la culpabilidad o inocencia del acusado. La decisin que se tome en base a la evidencia (muestral, de las pruebas), puede ser correcta, si se lo declara inocente y efectivamente no cometi el crimen. Tambin es correcta si el acusado es culpable y el veredicto as lo determina.

    Muestra: Evidencia reunida por la fiscala (o por los querellantes, de acuerdo con las reglas del proceso legal); o las coartadas del acusado. Errores posibles:

    - Declarar culpable a un inocente.

    - Declarar inocente a un culpable.

    Sin embargo, hay dos situaciones que claramente reflejan errores (que nos haran pensar en injusticias en una situacin de juicio): si el acusado es culpable y se lo declara inocente, como tambin si el acusado es inocente y se

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 3 -

    lo declara culpable). Los sistemas de justicia estn diseados de acuerdo a cual de estos errores se desee minimizar, cuando por ejemplo, nadie es culpable hasta que se pruebe lo contrario, o cuando un acusado debe demostrar su inocencia.

    3. Como estudiantes (en su caso) y como docente en el mo, la situacin que les mencionar ahora, es una de las que ms nos ocupa cotidianamente: establecer a travs de un examen o evaluacin, si los alumnos comprendieron o aprendieron una serie de temas. Permanentemente en el sistema educativo estamos emitiendo este tipo de juicios, basados en la evidencia de muestras (las evaluaciones mismas son muestras donde se han seleccionado temas del conjunto total de tpicos incluidos en el temario a evaluar, como tambin de ejercicios o competencias que resultan de inters). Por supuestos que si una evaluacin aprueba a un alumno que efectivamente conoce / comprende los temas, estamos tomando una decisin correcta. Idnticamente, si se reprueba a quien no sabe los contenidos. Los problemas aparecen si un alumno que sabe los contenidos es reprobado en la evaluacin, o bien, si se aprueba a quien realmente no los conoce. En este caso tambin los docentes suelen definir sus estrategias evaluativas de manera de minimizar el error que consideran ms grave o daino de los dos.

    Muestra: la evaluacin Errores posibles:

    - Aprobar a quien no sabe los contenidos

    - Reprobar a quien sabe los contenidos

    Hiptesis nula y alternativa La primera tarea consiste en definir de manera correcta cul va a ser la hiptesis que queremos someter a contraste o prueba. Comenzaremos trabajando en este mdulo con hiptesis referidas a valores de un parmetro poblacional en particular. En todos los problemas aparecen dos hiptesis contrapuestas: la hiptesis nula y la hiptesis alternativa. Cada una de ellas representa un estado de la naturaleza que

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 4 -

    involucra valores del parmetro poblacional. En la hiptesis nula siempre aparece un igual (ya sea un igual estricto o, un mayor o igual, o un menor o igual), referido a cierto valor del parmetro. La hiptesis alternativa de cada caso respectivo siempre es una negacin de la hiptesis nula, de manera de resultar cierta siempre que sea falsa la hiptesis nula. La hiptesis alternativa nunca incluye el signo igual. La hiptesis nula es la idea previa sobre el valor del parmetro que se va a probar. La hiptesis alternativa (establecida siempre como lo opuesto a lo afirmado en la hiptesis nula) indica la conclusin que es verdadera si se lograr rechazar la hiptesis nula. La hiptesis nula se representa simblicamente de la siguiente manera: Ho. La hiptesis alternativa se indica con alguna de las simbologas: H1 Ha Veamos algunos ejemplos. Supongamos una prueba referida a la media poblacional : Ho: =15 H1: 15 Ho: 15 H1: 15 En las pruebas de hiptesis, a travs de la evidencia muestral, se decidir rechazar la hiptesis nula si as permiten los datos analizados, o bien, no rechazarla. Observen atentamente que no decimos aceptarla, ya que no tenemos informacin suficientemente contundente, por el hecho de ser muestral y estar por tanto sometida a los riesgos vinculados con este tipo de informacin. Tal como indican Berenson y Levine: La metodologa de prueba de hiptesis est diseada de modo que nuestro rechazo de la hiptesis nula est basado en evidencias, aportadas por la muestra, de que es ms probable de que nuestra hiptesis alternativa sea verdadera. Sin embargo, el hecho de no rechazar la hiptesis nula no es una prueba de que sta sea verdadera. Valor crtico del estadstico de la prueba Cuando describimos en trminos generales el procedimiento lgico implicado en las pruebas de hiptesis indicamos que rechazaramos la hiptesis nula si de la evidencia muestral resultara un valor muy alejado al hipotetizado, as como no la rechazaramos

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 5 -

    en caso de obtener de la muestra un valor relativamente cercano al establecido en la Ho. Deberemos trabajar con las distribuciones correspondientes para establecer qu es demasiado cercano o demasiado alejado de la idea previa explcita en la hiptesis nula. El valor crtico definir un punto de corte para tomar la decisin estadstica, un valor que antes de considerar la informacin muestral, ser el criterio para definir la regla de decisin, estableciendo qu valores se tomarn como cercanos al establecido en la hiptesis nula, y cules (por estar ms all del valor crtico) como demasiado alejados del establecido en la Ho. Determinacin de las zonas de rechazo y no rechazo Los (o el valor crtico, segn se trate de una prueba bilateral o unilaterial) del estadstico van a determinar las zonas de rechazo y no rechazo de la hiptesis nula en la distribucin muestral del estadstico de prueba. Si el estadstico de prueba calculado en base a los datos de la muestra, cae en la zona de rechazo, se tomar esa decisin; y por el contrario, si el estadstico resulta ms alejado del valor hipottico del parmetro (es decir, cae en la zona de rechazo), se tomara esta otra decisin estadstica, vale decir, rechazar la hiptesis nula. Figura: Valores crticos y determinacin de las zonas de rechazo y no rechazo en una prueba bilaterial

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 6 -

    La figura anterior, se muestra cmo se relacionan las zonas de rechazo en una prueba bilateral (donde aparece un signo de igualdad estricta en la hiptesis nula y una desigualdad en la hiptesis alternativa) con los valores crticos. Riesgos considerados en las pruebas de hiptesis Como presentamos en las analogas a las pruebas de hiptesis, la decisin estadstica tiene asociados riesgos o errores derivados de tomar una decisin incorrecta. Se comete el error tipo I, cuando la hiptesis nula es cierta, pero se la rechaza (esto ocurre cuando la evidencia de la muestra indica que es inverosmil nuestra hiptesis, lo cual nos lleva a tomar esa decisin incorrecta). El error tipo II est implicado en el no rechazo de la hiptesis nula cuando sta es falsa. Si bien debera ser rechazada, tambin a instancias de un valor muestral no tan alejado, se toma una decisin incorrecta. Veamos las situaciones posibles que pueden encontrarse en las decisiones de una prueba estadstica: Estado de la naturaleza Decisin Ho cierta Ho falsa No rechazar Ho Decisin correcta

    Probabilidad asociada: Coeficiente de confianza:

    1-

    Decisin incorrecta Probabilidad asociada:

    Riesgo:

    Rechazar Ho Decisin incorrecta

    Probabilidad asociada: Nivel de significacin:

    Decisin correcta Probabilidad asociada:

    Potencia de la prueba: 1-

    El coeficiente de confianza (1-) indica la probabilidad de no rechazar la Ho cuando sta es verdadera. El nivel de significacin () es la probabilidad de cometer el error tipo I, es decir, de rechazar la Ho cuando sta es verdadera. El riesgo () es la probabilidad de cometer un error tipo II, o lo que es lo mismo, de no rechazar la hiptesis nula cuando sta es falsa. La potencia de la prueba (1-) es la probabilidad de rechazar la Ho cuando sta es falsa. Las probabilidades y estn relacionadas, de manera que si una de ellas disminuye, la otra aumenta. Por ello, la manera de disminuir ambos riesgos es aumentar el tamao de la muestra.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 7 -

    Pasos para realizar una prueba de hiptesis En todos los casos y ejercicios de pruebas de hiptesis se deben desarrollar ordenadamente los siguientes pasos:

    1. Establecer la hiptesis nula 2. Establecer la hiptesis alternativa 3. Seleccionar el nivel de significacin 4. Definir el tamao de la muestra 5. Establecer qu estadstico muestral, con distribucin conocida, se utilizar en la

    prueba 6. Calcular el o los valores crticos, identificando as las zonas de rechazo y no

    rechazo (lo cual deriva en disponer de una la regla de decisin) 7. A partir de los datos muestrales, obtener el valor del estadstico muestral 8. Verificar en qu zona (de rechazo o de no rechazo) cay el estadstico de

    prueba obtenido con los datos muestrales 9. Tomar la decisin estadstica en base a la regla de decisin 10. Indicar la conclusin del problema

    Prueba de hiptesis para la media poblacional Varianza conocida Prueba Z Supongamos que queremos someter a prueba una hiptesis referida a la edad de emigracin promedio de los ciudadanos de determinado pas. Expertos en la problemtica de la emigracin refieren que para la corriente migratoria que se analiza, la edad promedio es de 25 aos. Se conoce que la varianza de esta variable es 3,5 aos2. Se tom una muestra de 24 emigrantes seleccionados al azar en un perodo de 6 meses, y se obtuvo que la edad promedio era de 22 aos. Con una significacin =0,05, puede considerarse verdadera la hiptesis? En este caso estamos analizando una prueba bilateral, porque se trata de someter a prueba una igualdad estricta versus una desigualdad. Sigamos cada uno de los pasos planteados:

    1. Establecer la hiptesis nula Ho: =25 aos Es decir, la edad promedio al momento de emigrar es de 25 aos.

    2. Establecer la hiptesis alternativa Ho: 25 aos Es decir, la edad promedio al momento de emigrar es distinta de 25 aos.

    3. Seleccionar el nivel de significacin

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 8 -

    Se trabajar con =0,05

    4. Definir el tamao de la muestra La muestra de trabajo consta de 24 casos.

    5. Establecer qu estadstico muestral, con distribucin conocida, se utilizar en la prueba Como se conoce la varianza, se trabajar con el estadstico Z:

    nxZ/

    =

    6. Calcular el o los valores crticos, identificando as las zonas de rechazo y no rechazo (lo cual deriva en disponer de una la regla de decisin) Como se pidi trabajar con una significacin de 0,05, los valores crticos de Z sern -1,96 y 1,96. As, queder determinada la siguiente regla de decisin (indicada tambin en la siguiente figura):

    Si el estadstico muestral resultante es inferior a -1,96, o si es mayor a 1,96, se rechazar la hiptesis nula.

    Si el estadstico muestral es mayor a -1,96 y menor a 1,96, entonces, no se rechaza la hiptesis nula.

    Figura: Determinacin de zona de rechazo y no rechazo, en la distribucin normal estndar

    -Z1-/2=-1,96 0 Z1-/2=1,96

    7. A partir de los datos muestrales, obtener el valor del estadstico muestral Bajo Ho cierta:

    nxZ/

    =

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 9 -

    24/87,12522 =Z

    85,7=Z

    8. Verificar en qu zona (de rechazo o de no rechazo) cay el estadstico de prueba obtenido con los datos muestrales

    El valor del estadstico muestral se ubica en la zona crtica o zona de rechazo.

    9. Tomar la decisin estadstica en base a la regla de decisin

    Se debe rechazar la Ho.

    10. Indicar la conclusin del problema

    Con la evidencia muestral disponible no puede suponerse que la edad promedio de emigracin es 25 aos.

    Casos de pruebas de hiptesis: uno y dos extremos En los casos en los cuales queremos someter a prueba una hiptesis referida a la igualdad del parmetro a determinado valor, contra la hiptesis alternativa de desigualdad de ese valor. En ese caso, tanto si la evidencia muestral resulta en valores muy elevados o muy reducidos del parmetro, sospechamos de la veracidad de la hiptesis nula, y optaremos por rechazarla. Por lo tanto en estos caso, situamos la probabilidad de rechazar una hiptesis nula siendo cierta (significacin) en los extremos superior e inferior de la distribucin que estamos considerando. Este tipo de pruebas se conoce como prueba de dos extremos o de dos colas. En tales caso, el nivel de significacin se reparte entre ambas colas (/2 en cada una). Figura Prueba de dos colas (o dos extremos): Ho: =0

    H1: 0

    Donde representa un parmetro cualquiera

    )(f

    En el grfico puede observarse cmo la significacin se reparte entre los dos extremos. Fuente: Elaboracin propia

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 10 -

    Cuando estamos sometiendo a prueba una hiptesis nula con una desigualdad contra su complemento, todo el riesgo se ubica en uno de los extremos. Estas son las pruebas de un extremo o una cola. Figura Prueba de una cola (o un extremo): Ho: 0

    H1: >0

    )(f

    Ho: 0

    H1:

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 11 -

    Pese a esta especie de dualidad, los propsitos de ambos tipos de procedimientos son substancialmente diferentes en el marco de las correspondientes investigaciones que los enmarcan. Valor p Otra manera en la que puede abordarse y resolverse una prueba de hiptesis es determinar el nivel de significacin que tiene asociado el valor resultante del estadstico con los datos muestrales. El valor p es la probabilidad de obtener un estadstico igual o mayor que el valor muestral, siendo la hiptesis nula cierta. R. Weiers, en su texto de Estadstica para los negocios, indica la siguiente analoga, en una prueba de salto en alto: equivale a que Ud. saltara tan alto como pudiera sin tener que pasar sobre una barra, y que luego los jueces le indicaran a qu altura la habra rebasado si la barra estuviera en el lugar (pp. 432). Esta modalidad de resolucin es de gran practicidad en el caso de contar con resultados procesados a travs de software estadstico, que directamente aproximan numricamente el clculo de probabilidad implicado, arrojando para la muestra, el valor p (o p-valor como tambin se lo conoce). Simplemente el investigador compara esa significacin con la que considera para su investigacin (el valor ), y si el valor p supera al , entonces no se rechaza la hiptesis nula, y en cambio, si es mayor que p, entonces se rechaza la hiptesis nula. Obviamente, esta regla de decisin se relaciona con el hecho de que si la significacin del estadstico muestral es mayor que , entonces, ese valor se encuentra en la zona de rechazo, y viceversa. Siguiendo al texto de la materia, los pasos correspondientes a una prueba de hiptesis utilizando el valor p, se sintetizan de la siguiente manera:

    1. Establecer la hiptesis nula

    2. Establecer la hiptesis alternativa

    3. Seleccionar el nivel de significacin () 4. Considerar el tamao de la muestra

    5. Determinar la prueba y el estadstico que se utilizarn.

    6. Calcular el estadstico con los datos muestrales

    7. Estimar el valor p para el estadstico muestral

    a. Considerar la distribucin bajo hiptesis nula cierta

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 12 -

    b. Utilizar un grfico de la distribucin y ubicar el valor del estadstico muestral calculado.

    c. Calcular la probabilidad deseada ayudado de las tablas o programa estadstico apropiado

    8. Comparar el valor p con 9. Tomar la decisin estadstica

    10. Elaborar la conclusin

    Potencia de una prueba La potencia de la prueba es la sensibilidad que sta tiene para detectar situaciones en las cuales corresponde rechazar la hiptesis nula por ser sta falsa. Como mencionamos anteriormente, la potencia tiene una probabilidad 1-, ya que es el complemento del riesgo (asociado con el error tipo II, correspondiente a no rechazar Ho cuando sta es falsa). En general, el clculo de la potencia de una prueba es una tarea compleja, cuando puede llegar a calcularse. Intuitivamente se puede comprender que es ms alta esta probabilidad a medida que ms alejada est la hiptesis nula de la realidad: mientras ms distanciado sea el valor que se postula en la hiptesis nula referido al parmetro, del que realmente tiene, es ms probable que la evidencia muestral nos seale el error. Por el contrario, cuando el valor que se postula en la hiptesis nula est prximo (aunque no exacto) al verdadero, la evidencia muestral nos confundir, ya que en muchos casos caer el estadstico muestral en la zona de no rechazo. El siguiente ejemplo est elaborado teniendo en cuenta la distribucin de la media muestral, en una prueba de hiptesis para la media poblacional. El sitio http://www.seeingstatistics.com/seeing1999/resources/opening.html permite ver cmo vara la potencia de la prueba para diferentes escenarios que suponemos referidos al verdadero valor de la media poblacional. Como permiten ver los paneles grficos de las siguientes pginas, en los casos en los cuales el verdadero valor est alejado de lo hipotetizado, la probabilidad de rechazar la hiptesis nula es alta. La potencia de la prueba est identicada como el rea sombreada de azul en cada una de las figuras. Las reas sombreadas de rojo corresponden a la significacin (que tiene una probabilidad ), y se grafican en la distribucin que supone que la hiptesis nula es cierta. La probabilidad de rechazar la hiptesis nula siendo falsa se ilustra en la distribucin correspondiente a cada verdadero valor alternativo (asociado con ese escenario en particular). En todos los casos, se supone en la hiptesis nula que la media poblacional es igual a 10.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 13 -

    Figura: la potencia de la prueba Escenario 1: El verdadero valor de la media es 7,69.

    Escenario 2: El verdadero valor de la media es 7,89.

    Escenario 3: El verdadero valor de la media es 8,13.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 14 -

    Escenario 4: El verdadero valor de la media es 8,38.

    Escenario 5: El verdadero valor de la media es 8,87.

    Escenario 6: El verdadero valor de la media es 9,13.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 15 -

    Escenario 7: El verdadero valor de la media es 9,7.

    Escenario 8: El verdadero valor de la media es 10,02.

    Escenario 9: El verdadero valor de la media es 11,56.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 16 -

    Escenario 10: El verdadero valor de la media es 12,12.

    Escenario 11: El verdadero valor de la media es 12,51.

    Escenario 12: El verdadero valor de la media es 12,98.

    Fuente. Elaboracin propia con la herramienta de simulacin provista por: http://www.seeingstatistics.com/seeing1999/resources/opening.html Reflexione sobre la informacin que proveen los grficos. Qu informacin le est faltando si Ud. quiere corroborar estos clculos de probabilidades, considerando que se trata de una distribucin normal? Sinteticemos la informacin del ejemplo, en una tabla donde se consignen los valores de la potencia.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 17 -

    Tabla: Relacin entre el verdadero del valor del parmetro y la potencia Escenario Verdadero valor de la

    media poblacional Potencia

    1 7,69 0,98 2 7,89 0,96 3 8,13 0,90 4 8,38 0,80 5 8,87 0,50 6 9,13 0,32 7 9,7 0,08 8 10,02 0,05 9 11,56 0,77 10 12,12 0,96 11 12,5 0,99 12 12,98 1 Fuente: Elaboracin propia La relacin descripta en la tabla anterior puede representarse en un grfico que se denomina Curva de potencia. El grfico presenta un mnimo en el valor correspondiente al que se postula en la hiptesis nula. La potencia en ese caso es igual a la significacin. Curva de potencia

    Fuente: Elaboracin propia

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 18 -

    Prueba de hiptesis para la media poblacional Varianza desconocida Prueba t Un docente sostiene la idea de que el promedio de horas de estudio de sus alumnos ha sido inferior a 3 horas diarias en la semana previa a una evaluacin. A fin de comprobar su idea previa, realiza una breve encuesta annima, y obtiene la siguiente informacin a partir de una muestra de 15 alumnos tomados al azar del total (muy elevado) de los alumnos de las 10 divisiones que tiene a su cargo:

    Alumno (muestra)

    Cantidad de horas que estudi en la semana previa a la evaluacin

    1 3 2 6 3 7 4 2 5 1 6 0,57 1 8 2 9 2,5 10 2 11 1 12 2 13 3 14 2 15 0,5

    En este caso estamos analizando una prueba unilateral, porque se plantea una desigualdad. Sigamos cada uno de los pasos planteados:

    1. Establecer la hiptesis nula Ho: 3 horas Note cmo se seleccion la hiptesis nula. Si bien se sostiene que la cantidad de horas de estudio promedio fue inferior a esa cantidad, se utiliza en la hiptesis nula la afirmacin complementaria porque incluye la igualdad. Y en particular, si se encuentra evidencia que permita refutar la hiptesis nula, haberla planteado de esta manera, nos permite un resultado ms slido.

    2. Establecer la hiptesis alternativa Ho: < 3 horas

    3. Seleccionar el nivel de significacin

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 19 -

    Se trabajar con =0,05

    4. Definir el tamao de la muestra La muestra de trabajo consta de 15 casos.

    5. Establecer qu estadstico muestral, con distribucin conocida, se utilizar en la prueba Como se desconoce la varianza, se trabajar con el estadstico t, con n-1 grados de libertad:

    nsxt/

    =

    6. Calcular el o los valores crticos, identificando as las zonas de rechazo y no rechazo (lo cual deriva en disponer de una la regla de decisin) Como se pidi trabajar con una significacin de 0,05, el valor crtico de t, con 14 grados de libertad es -1,7613 Luego, quedar determinada la siguiente regla de decisin (indicada tambin en la siguiente figura):

    Si el estadstico muestral resultante es inferior a -1,7613, se rechazar la hiptesis nula.

    Si el estadstico muestral es mayor a -1,7613, entonces, no se rechaza la hiptesis nula.

    Figura: Determinacin de zona de rechazo y no rechazo, en la distribucin t

    -t1-; n-1=-1,7613 0 t

    7. A partir de los datos muestrales, obtener el valor del estadstico muestral Bajo Ho cierta:

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 20 -

    nsxt/

    =

    15/866,1337,2 =t

    315,1=t

    8. Verificar en qu zona (de rechazo o de no rechazo) cay el estadstico de prueba obtenido con los datos muestrales.

    El valor del estadstico muestral se ubica en la zona de no rechazo.

    9. Tomar la decisin estadstica en base a la regla de decisin

    No se debe rechazar la Ho.

    10. Indicar la conclusin del problema

    Con la evidencia muestral disponible no puede descartarse que el promedio de horas de estudio haya sido mayor o igual a 3.

    Prueba de hiptesis para la varianza Prueba Chi cuadrado Tambin es posible llevar a cabo hiptesis referidas a valores particulares de la varianza poblacional. En este caso, el nico aspecto novedoso se relaciona con el estadstico muestral que incluye tanto a la varianza poblacional como a su estimador, la varianza muestral. Este estadstico posee distribucin Chi cuadrado1, una variable aleatoria que presentaremos a continuacin.

    2

    22

    1)1(

    sn

    n=

    1 Esta distribucin corresponde a una variable no negativa, cuya forma depende del parmetro grados de libertad que posea. Mientras ms reducidos son los grados de libertad, ms sesgada a la derecha es la forma de la distribucin.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 21 -

    Vamos a considerar el problema propuesto por Berenson y Levine, en la seccin de ejercicios del tema (pgina 441, ejercicio 12.22). Problema: Un investigador de mercado est realizando un estudio encargado por una concesionaria de automviles que tiene sucursales en todo el pas, en relacin con las reparaciones de autos. En particular tiene inters en averiguar cul es el gasto promedio en reparaciones. Para estimar cuntos casos incluir en la muestra, debe considerar un valor de la desviacin estndar. En base a su experiencia cree apropiado considerar una desviacin estndar de $200 del gasto realizado en reparaciones. No obstante, decide corroborar su hiptesis a travs de una encuesta piloto a 25 dueos de automviles. Una vez que lleva a cabo este estudio preliminar, resulta una desviacin estndar de la muestra de $237,52. An puede trabajar con su idea previa de la desviacin estndar para calcular el tamao muestral? Apliquemos una vez ms los pasos de la prueba de hiptesis:

    1. Establecer la hiptesis nula Ho: 2= 40.000 pesos2. Note que se estableci la hiptesis en trminos de la varianza, y que se tuvo en cuenta la unidad de medida correspondiente tambin elevada al cuadrado. 2. Establecer la hiptesis alternativa Ho: 2 40.000 pesos2 3. Seleccionar el nivel de significacin Se trabajar con =0,10 4. Definir el tamao de la muestra La muestra de trabajo consta de 25 casos. 5. Establecer qu estadstico muestral, con distribucin conocida, se utilizar

    en la prueba Se utilizar el estadstico Chi cuadrado presentado, con n-1 grados de libertad:

    2

    22

    1)1(

    sn

    n=

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 22 -

    6. Calcular el o los valores crticos, identificando as las zonas de rechazo y no rechazo (lo cual deriva en disponer de una la regla de decisin)

    Con una significacin de 0,10, los valores crticos de la distribucin Chi cuadrado, con 24 grados de libertad son: 13,848 y 36,415, respectivamente. Luego, quedar determinada la siguiente regla de decisin (indicada tambin en la siguiente figura):

    Si el estadstico muestral resultante es inferior a 13,848 mayor a 36,415, se rechazar la hiptesis nula.

    Si el estadstico muestral es menor a 13,848 mayor a 36,415, entonces, no se rechaza la hiptesis nula.

    Figura: Determinacin de zona de rechazo y no rechazo, en la distribucin Chi cuadrado

    2 24, 0,05=13,848 2 24, 0,95=36,415 7. A partir de los datos muestrales, obtener el valor del estadstico muestral Bajo Ho cierta:

    2

    22

    1)1(

    sn

    n=

    4000075,56415)24(2

    24 =

    85,33224 =

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 23 -

    8. Verificar en qu zona (de rechazo o de no rechazo) cay el estadstico de prueba obtenido con los datos muestrales

    El valor del estadstico muestral se ubica en la zona de no rechazo.

    9. Tomar la decisin estadstica en base a la regla de decisin No se debe rechazar la Ho. 10. Indicar la conclusin del problema

    Con la evidencia muestral disponible no puede descartarse que la varianza sea igual a 40000 pesos2 (o que la desviacin estndar sea igual a 200 pesos), tal como supone el investigador. La siguiente figura ilustra los casos de pruebas de hiptesis referidas a la varianza, para pruebas bilaterales y unilaterales. Figura Prueba bilateral Ho: 2 = 20

    H1: 2 20

    Prueba unilateral Ho: 2 20

    H1: 2 > 20

    2

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 24 -

    Prueba unilateral Ho: 2 20

    H1: 2

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 25 -

    En el caso de muestras independientes, consideraremos dos pruebas de hiptesis referidas a las diferencias entre medias de ambas muestras, teniendo en cuenta qu supuestos corresponda aplicar. Prueba de diferencia de medias para muestras independientes Caso de varianza conjunta Consideremos el siguiente problema: Una marca de combustibles ha desarrollado un nuevo combustible Premium que reemplazara al que se produce actualmente, para lo cual quiere analizar si realmente hay una diferencia en cuanto a rendimiento. Se contrata a un experto en combustibles para determinar si existe alguna diferencia de estos combustibles de la marca, en el mismo modelo de automvil. El combustible A, que se est evaluando para considerar su introduccin en el mercado, se prob en 20 autos, y se calcul una media muestral de 14 km por litro (con una desviacin estndar de 2 km por litro), mientras que el combustible B que se prob en 10 automviles, produjo una media de rendimiento de 13,2 kilmetros por litro, con una desviacin estndar de 2,1 km por litro. Suponiendo varianzas iguales, existe evidencia de que el nuevo combustible, A, supera al que se produce en la actualidad? Veamos paso a paso cmo comprobamos esta hiptesis.

    1. Establecer la hiptesis nula Ho: 12 0 Vamos a llamar muestra 1 a la correspondiente al nuevo combustible (A), y 2 a la del combustible que se produce actualmente. Dado que nos interesa ver si el nuevo combustible tiene ms rendimiento que el actual, en la hiptesis nula planteamos el estado de la naturaleza que si se puede se descartar con evidencia muestral contundente.

    2. Establecer la hiptesis alternativa H1: 12> 0

    3. Seleccionar el nivel de significacin Se trabajar con =0,05

    4. Definir el tamao de la muestra Las muestras de trabajo constan de 20 casos y 10 casos respectivamente.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 26 -

    5. Establecer qu estadstico muestral, con distribucin conocida, se utilizar en la

    prueba El estadstico tiene distribucin t, con n1+n2-2 grados de libertad:

    +

    =

    21

    2

    2121

    11

    )()(

    nns

    xxt

    p

    Donde, la varianza conjunta se construye de la siguiente manera a partir de las varianzas muestrales de cada muestra respectiva:

    )1()1()1()1(

    21

    222

    2112

    ++=

    nnsnsns p

    6. Calcular el o los valores crticos, identificando as las zonas de rechazo y no rechazo (lo cual deriva en disponer de una la regla de decisin) Como se pidi trabajar con una significacin de 0,05, el valor crtico de t, con 28 grados de libertad es 1,701. Luego, quedar determinada la siguiente regla de decisin (indicada tambin en la siguiente figura):

    Si el estadstico muestral resultante es mayor a 1,701, se rechazar la hiptesis nula.

    Si el estadstico muestral es menor a 1,701, entonces, no se rechaza la hiptesis nula.

    Figura: Determinacin de zona de rechazo y no rechazo, en la distribucin t

    0 t=1,701

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 27 -

    7. A partir de los datos muestrales, obtener el valor del estadstico muestral Bajo Ho cierta:

    +

    =

    21

    2

    2121

    11

    )()(

    nns

    xxt

    p

    +=101

    2011318,4

    0)2,1314(t

    0162,1=t

    Donde

    )1()1()1()1(

    21

    222

    2112

    ++=

    nnsnsns p

    )110()120(41,4)110(4)120(2

    ++=ps

    1318,42 =ps

    8. Verificar en qu zona (de rechazo o de no rechazo) cay el estadstico de prueba obtenido con los datos muestrales

    El valor del estadstico muestral (t= 1,01602) se ubica en la zona de no rechazo.

    9. Tomar la decisin estadstica en base a la regla de decisin

    No se debe rechazar la Ho.

    10. Indicar la conclusin del problema

    Con la evidencia muestral disponible no puede descartarse que el rendimiento del nuevo combustible sea igual o menor que el combustible actual.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 28 -

    Prueba de diferencia de medias para muestras independientes Caso de varianzas separadas Cuando no podemos asumir que las dos poblaciones tienen iguales varianzas, adoptamos esta prueba. Vamos a desarrollar tambin un ejemplo en este caso. El dueo de una veterinaria desea comprobar si existe diferencia en la cantidad total de dinero gastada por mes entre los dueos de perros y los dueos de gatos. Se consider una muestra de individuos que slo posea una de estas mascotas, considerando animales (tanto perros como gatos) de un rango de peso de 3 a 5 kilos. En el caso de los dueos de gatos, se obtuvo una media muestral de $19,16 por semana, para una muestra de 26 casos, con una desviacin estndar de $8,52. En la muestra de 37 dueos de perros se estim que en promedio gastan $26,47 por semana, con una desviacin estndar de $9,45. Existe una diferencia significativa en el gasto promedio?

    1. Establecer la hiptesis nula Ho: 12= 0 Vamos a llamar muestra 1 a la correspondiente a los dueos de gatos y 2 a la muestra de dueos de perros. Planeamos una prueba bilateral ya que se desea saber si existe o no diferencia. 2. Establecer la hiptesis alternativa H1: 12 0 3. Seleccionar el nivel de significacin Se trabajar con =0,05 4. Definir el tamao de la muestra Las muestras de trabajo constan de 26 casos de dueos de gatos y 37 casos de dueos de perros. 5. Establecer qu estadstico muestral, con distribucin conocida, se utilizar

    en la prueba El estadstico tiene distribucin t, con v grados de libertad:

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 29 -

    2

    22

    1

    21

    2121 )()(

    ns

    ns

    xxt

    +=

    Donde, v est dado por:

    11 2

    2

    2

    22

    1

    2

    1

    21

    2

    2

    22

    1

    21

    +

    +

    =

    nns

    nns

    ns

    ns

    v

    6. Calcular el o los valores crticos, identificando as las zonas de rechazo y no

    rechazo (lo cual deriva en disponer de una la regla de decisin)

    Aproximemos en primer lugar el valor de v:

    11 2

    2

    2

    22

    1

    2

    1

    21

    2

    2

    22

    1

    21

    +

    +

    =

    nns

    nns

    ns

    ns

    v

    137376809,89

    126265904,72

    376809,89

    265904,72

    22

    2

    +

    +=v

    27,57=v

    Se procede a tomar la parte entera del valor obtenido de v: 57.

    Como se pidi trabajar con una significacin de 0,05, los valores crticos de t, con 57 grados de libertad son -2 y 2. Luego, quedar determinada la siguiente regla de decisin (indicada tambin en la siguiente figura):

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 30 -

    Si el estadstico muestral resultante es menor a -2 o mayor a 2, se

    rechazar la hiptesis nula. Si el estadstico muestral es mayor a -2 y menor a 2, entonces, no se

    rechaza la hiptesis nula. Figura: Determinacin de zona de rechazo y no rechazo, en la distribucin t

    Se sombrean en el grfico las zonas de rechazo de la hiptesis. 7. A partir de los datos muestrales, obtener el valor del estadstico muestral Bajo Ho cierta:

    2

    22

    1

    21

    2121 )()(

    ns

    ns

    xxt+

    =

    +=

    376809,89

    265904,72

    0)47,2616,19(t

    20,3=t

    8. Verificar en qu zona (de rechazo o de no rechazo) cay el estadstico de prueba obtenido con los datos muestrales

    El valor del estadstico muestral se ubica en la zona de rechazo.

    9. Tomar la decisin estadstica en base a la regla de decisin Se debe rechazar la Ho.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 31 -

    10. Indicar la conclusin del problema

    Con la evidencia muestral disponible no puede sostenerse la idea de que los dueos de perros y gatos gastan lo mismo semanalmente en sus mascotas.

    Prueba de diferencia de medias para muestras relacionadas El caso de las muestras relacionadas es de amplia utilizacin cuando se necesita disponer de comparaciones entre sujetos con mnima variabilidad entre s o en pruebas sucesivas repetidas (estudios antes y despus sobre un mismo sujeto). En este caso, analizamos la diferencia especfica para el par de observaciones apareadas, que denominaremos D.

    21 iii XXD = Esta diferencia para cada par de datos que estamos estudiando representa las diferencias uno a uno. Por ejemplo, si es un estudio entre gemelos, en el cual a uno de los gemelos de cada conjunto de hermanos gemelos que se est estudiando se le aplic un tratamiento, cuyo efecto se quiere comprobar, la diferencia D es la medida de la distancia en la variable de respuesta para ambos sujetos. Justamente lo que se pretende someter a prueba es la existencia o no de tal diferencia entre los sujetos que fueron sometidos a tratamiento y los que no, an en estos casos, en los cuales los sujetos poseen mucha homogeneidad entre s. El promedio muestral de tales diferencias se obtiene considerando todas las D para los n pares de sujetos de estudio:

    nD

    D i= Denotaremos D a la diferencia poblacional, que se somete a prueba. La prueba se lleva a cabo con el mismo procedimiento utilizado previamente para los diversos casos de pruebas de hiptesis. Las hiptesis nula y alternativa en este caso sern: Ho: 0=D H1: 0D El estadstico de prueba ser:

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 32 -

    ns

    DtD

    D2

    =

    Este estadstico posee n-1 grados de libertad. Para el clculo de la desviacin estndar muestral se deber considerar la siguiente frmula:

    1

    22

    =

    nDnD

    s iD

    Pruebas de hiptesis para datos categricos En muchas ocasiones el problema de decisin planteado tiene que ver con un valor asignado en la hiptesis a la proporcin de individuos de la poblacin que poseen cierta caracterstica. Prueba de hiptesis para la proporcin poblacional Debido a que el procedimiento no difiere respecto del ya desarrollado, simplemente en estos casos indicaremos cul es el estadstico de prueba. En el caso de las pruebas para proporciones, el estadstico bajo hiptesis nula cierta se distribuye normal:

    nPP

    PpZ)1(

    =

    Prueba para la diferencia de dos proporciones En el caso de las pruebas para diferencia de proporciones, para muestras independientes, el estadstico bajo hiptesis nula cierta se distribuye normal:

    +

    =

    21

    2121

    11)1(

    )()(

    nnpp

    PPppZ

    Donde:

    21

    21 )(nnXXp +

    +=

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 33 -

    Ejercitacin Resuelva los siguientes ejercicios, si tiene dudas o consultas, envelas a su tutor virtual.

    1. El siguiente caso ha sido tomado de un estudio real llevado a cabo en Estados Unidos. Tras lanzar una variedad de papas fritas reducidas en grasa, la empresa Pringles realiz un estudio para conocer si los consumidores las identificaban o no respecto de las papas normales. Se indagaron 44 participantes de un estudio, a quienes se les ofreca dos tazas separadas de papas de la marca. En una de las tazas haba papas normales y en la otra las reducidas en grasa. En promedio, si las papas hubieran tenido el mismo sabor, se espera que el 50% de los catadores hubiera identificado correctamente las papas normales. En el estudio, 25 catadores lograron identificarlas correctamente. Significa este resultado que las papas reducidas en grasa tienen un sabor distinto o la diferencia entre lo obtenido y el 50% esperado es slo un valor al azar? Fuente: Introduccin a la Estadstica para Negocios. Ronald Weiers. (2005). 5 Edicin. a. Qu prueba de hiptesis se lleva a cabo? b. Plantee las hiptesis nula y alternativa c. Complete los pasos de la prueba de hiptesis d. Responda la pregunta planteada.

    2. En un estudio reciente sobre audiencia televisiva, se report que los hombres jvenes estadounidenses tienen una exposicin promedio de 56,2 minutos a la televisin en las horas de mxima audiencia. Un experto europeo considera que en el Viejo continente la exposicin es ms elevada. Se toma una muestra de 1300 hombres en las mismas edades en Europa, y se detecta que en promedio ven 50,5 minutos en ese horario. Si bien no se conocen las varianzas, se pueden considerar iguales, y en el estudio para Estados Unidos surgi una varianza muestral de 45 minutos2, mientras que en la muestra europea, alcanza unos 46 minutos2.

    a. Qu prueba de hiptesis se lleva a cabo? b. Plantee las hiptesis nula y alternativa c. Complete los pasos de la prueba de hiptesis d. Elabore una conclusin

    3. En la etiqueta de una bebida en base a frutas dice que en promedio contiene 1 gramo por litro o menos de grasa. Disee un experimento para poder realizar una prueba para comprobarlo. Establezca la probabilidad de cometer un error tipo II si el verdadero valor de la cantidad de grasa promedio es 2 gramos por litro (tenga en cuenta una desviacin estndar de 0,25 gramos por litro, con una significacin de 0,05, y una muestra de tamao 20 unidades). Y si es 1,5 el verdadero valor de la cantidad promedio de grasa?

    a. Responda las preguntas planteadas

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 34 -

    b. Grafique c. Elabore una conclusin

    4. El presidente de una compaa que fabrica electrodomsticos afirm recientemente en una entrevista que al menos 85% de sus clientes hogareos estn completamente satisfechos con el producto de su marca que compraron. Qu tipo de prueba se debe realizar para corroborarlo? Establezca las hiptesis nula y alternativa.

    5. Al realizar las pruebas de alcoholemia, para determinar si un conductor bebi

    alguna bebida alcohlica por encima de los niveles permitidos, se est trabajando con una especie de prueba de hiptesis. Plantee las hiptesis. Indique cules seran el error tipo I y tipo II. Cul es uno de los problemas estadsticos que plantea este tipo de test?

    6. Segn el gerente comercial de una moderna sala de cine, que desea terciarizar el servicio de venta de alimentos, los clientes gastan en promedio $20 en golosinas y pochoclo para consumir durante las pelculas, con una desviacin estndar de $4. Estos gastos por cliente se distribuyen normal. Una posible concesionaria realiza un estudio basado en una muestra de 18 clientes, y en su estudio la media resulta de $16. Con un nivel de significacin de 0,05, Ud. creera la afirmacin del gerente comercial?

    a. Qu prueba se est llevando a cabo? b. Realice la prueba correspondiente c. Elabore una recomendacin para la concesionaria interesada.

    7. Una mquina debe empaquetar automticamente envases de especias con

    un contenido promedio de 70 gramos. Se realiz una muestra de 35 envases en la ltima semana y en promedio el peso de cada unidad es 65 gramos La desviacin estndar muestral es de 1 gramo. Con un nivel de significacin de 0,01, cree que la mquina est envasando de acuerdo con sus especificaciones tcnicas?

    8. La edad promedio del parque automotor en el pas es 8,4 aos. Para una muestra aleatoria de 34 automviles del estacionamiento de un hipermercado, la edad promedio es 9,7 aos con una desviacin estndar de 3.1 aos. Con una significacin de 0,05, se puede afirmar que la edad promedio de los autos de ese supermercado es idntica a la del total nacional?

    9. Se est analizando la produccin de programas televisivos para las personas

    que esperan en las colas de las cajas de supermecados. Para establecer la duracin de los programas, se consider un supuesto acerca de la demora promedio en las cajas, que se supone de 8 minutos. Se realiz una muestra de 120 clientes, y la muestra resultante dio una media de 8,5 minutos, con una desviacin estndar de 3,2 minutos. Cul es le valor p? Elabore una conclusin.

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 35 -

    10. Se considera que entre los ejecutivos hay una proporcin elevada de individuos diestros. Se conoce que el 85% de la poblacin en general es diestra. En una muestra de 300 ejecutivos se detect que el 96% era diestro, podemos considerar que el porcentaje de diestros es superior entre los ejecutivos?

  • Materia: HERRAMIENTAS MATEMTICAS V ESTADSTICA II

    Profesora: Vernica Herrero- 36 -

    ANEXO La siguiente tabla debe utilizarse para realizar ejercicios, trabajos prcticos y EPC, junto con las tablas del mdulo anterior.

    TABLA CHI CUADRADO