Estadística Prueba de hipótesis 4546474849505152535455 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 H0: =50 H1:...

59
Estadística Prueba de hipótesis 45 46 47 48 49 50 51 52 53 54 55 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 H0: m=5 0 H1: m=5 2

Transcript of Estadística Prueba de hipótesis 4546474849505152535455 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 H0: =50 H1:...

  • Diapositiva 1
  • Diapositiva 2
  • Estadstica Prueba de hiptesis 4546474849505152535455 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 H0: =50 H1: =52
  • Diapositiva 3
  • Pruebas de Hiptesis Introduccin La experiencia sobre el comportamiento de algn ndice de un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones sobre el valor de algn parmetro estadstico. Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisin entre aceptar o rechazar la proposicin Estas proposiciones se denominan Hiptesis y el procedimiento para decidir si se aceptan o se rechazan se denomina Prueba de Hiptesis Una prueba de hiptesis es una herramienta de anlisis de datos que puede en general formar parte de un experimento comparativo ms completo
  • Diapositiva 4
  • Qu es una hiptesis? Una creencia sobre los parmetros de la poblacin: Media Varianza Proporcin/Tasa Si queremos contrastarla, debe establecerse antes del anlisis. Dicha creencia puede ser o no ser verdadera Creo que el porcentaje de enfermos ser el 5%
  • Diapositiva 5
  • Contrastando una hiptesis Creo que la edad media es 17 aos... Son demasiados... Gran diferencia! Rechazo la hiptesis Muestra aleatoria
  • Diapositiva 6
  • Pruebas de Hiptesis Introduccin Una hiptesis Estadstica es un proposicin sobre los parmetros de una poblacin o sobre la distribucin de probabilidad de una variable aleatoria Ejemplo: Se tiene inters en la rapidez de combustin de un agente propulsor para los sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable aleatoria con alguna distribucin de probabilidad). Especialmente interesa la rapidez de combustin promedio (que es un parmetro ( ) de dicha distribucin). De manera ms especfica, interesa decidir si esta rapidez promedio es o no 50 cm/seg. El planteamiento formal de la situacin se realiza en trminos de una Hiptesis Nula (que es la proposicin que se quiere poner a prueba) y una Hiptesis Alternativa, la cual se aceptar si se rechaza la hiptesis nula: Hiptesis Nula: H 0 : = 50 cm/seg Hiptesis Alternativa:H 1 : 50 cm/seg En el ejemplo se tiene una Hiptesis Alternativa Bilateral, ya que se verifica para valores de a ambos lados de 50 cm/seg. En el ejemplo se tiene una Hiptesis Alternativa Bilateral, ya que se verifica para valores de a ambos lados de 50 cm/seg.
  • Diapositiva 7
  • Identificacin de hiptesis Hiptesis nula H o La que contrastamos Los datos pueden refutarla No debera ser rechazada sin una buena razn. Hiptesis Alternativa H 1 Niega a H 0 Los datos pueden mostrar evidencia a favor No debera ser aceptada sin una gran evidencia a favor.
  • Diapositiva 8
  • Pruebas de Hiptesis En ocasiones interesa una Hiptesis Alternativa Unilateral, Por ejemplo: H 0 : = 50 cm/seg H 0 : = 50 cm/seg H 0 : = 50 cm/seg H 0 : = 50 cm/seg H 1 : 50 cm/seg H 1 : 50 cm/seg De donde puede surgir una Hiptesis Nula sobre un parmetro? Cul sera el inters dependiendo del origen de la hiptesis? 1)Origen: Experiencia, pruebas pasadas o conocimiento del proceso. Inters: averiguar si ha cambiado el parmetro 2)Origen: Alguna teora o modelo sobre el funcionamiento del proceso. Inters: Verificar la valids de dicha teora 3)Origen: Especificaciones de diseo, obligaciones contractuales, normas a cumplir o solicitudes del cliente. Inters: probar el cumplimiento o incumplimiento de las especificaciones. La verdad o falsedad de la hiptesis NO puede conocerse con total seguridad a menos que pueda examinarse toda la poblacin La verdad o falsedad de la hiptesis NO puede conocerse con total seguridad a menos que pueda examinarse toda la poblacin
  • Diapositiva 9
  • Quin es H 0 ? Problema: La altura media o promedio de los estudiantes de la UNT es 1.60 m? Solucin: Traducir a lenguaje estadstico: Establecer su opuesto: Seleccionar la hiptesis nula
  • Diapositiva 10
  • Quin es H 0 ? Problema: El tiempo de vida promedio de una determinada pieza usada en el ensamblaje de una marca de computadoras es de 20,000 horas. Solucin: Traducir a lenguaje estadstico: Establecer su opuesto: Seleccionar la hiptesis nula
  • Diapositiva 11
  • Quin es H 0 ? Problema: El porcentaje de personas atacadas por cierta epidemia es una ciudad grande, no es mayor del 10%. Solucin: Traducir a lenguaje estadstico: Establecer su opuesto: Seleccionar la hiptesis nula
  • Diapositiva 12
  • Pruebas de Hiptesis Procedimiento General para la prueba de una hiptesis Tomar un muestra aleatoria Calcular un estadstico basado en la muestra Usar el estadstico y sus propiedades para tomar una decisin sobre la Hiptesis Nula
  • Diapositiva 13
  • Ejercicios: Durante los ltimos semestres, el profesor de Estadstica de una universidad ha registrado que el rendimiento medio de sus alumnos es de 14 puntos. Este ao le ha tocado 40 alumnos sobresalientes porque su rendimiento medio ha sido 17 puntos y el profesor les proclama como superiores a todos los alumnos que ha tenido en la fecha. Qu hiptesis planteara?
  • Diapositiva 14
  • Regin crtica y nivel de significacin Regin crtica Valores improbables si... Es conocida antes de realizar el experimento: resultados experimentales que refutaran H 0 Nivel de significacin: Nmero pequeo: 1%, 5% Fijado de antemano por el investigador Es la probabilidad de rechazar H 0 cuando es cierta No rechazo H0 Reg. Crit. =5% =40
  • Diapositiva 15
  • Contrastes: unilateral y bilateral La posicin de la regin crtica depende de la hiptesis alternativa Unilateral Bilateral H 1 : 20 H 1 : 20
  • Diapositiva 16
  • Pruebas de Hiptesis Hiptesis Unilaterales H 0 : =50 cm/seg H 1 : 50
  • Diapositiva 17
  • Pruebas de Hiptesis Hiptesis Unilaterales Ejemplo: Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor que supera el mnimo de presin de estallamiento de 200 psi. El embotellador puede formular una prueba de hiptesis de dos maneras: Con el planteamiento (1) Como el rechazo de H 0 es una conclusin fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que las botellas soportan mayor presin que 200 psi H 0 : =200 psiH 0 : =200 psi H 1 : >200 psiH 1 : 200 psiH 1 :
  • Pruebas de Hiptesis Hiptesis Unilaterales Es decir, en la Hiptesis alternativa se debe poner la proposicin sobre la cual es importante llegar a una conclusin fuerte: H 0 : =200 psiH 0 : =200 psi H 1 : >200 psiH 1 : 200 psiH 1 :
  • Pruebas de Hiptesis Prueba de hiptesis sobre la media, varianza conocida UMSNH - FIE 5) La estadstica de prueba es 6) Rechazar H 0 si z>1.96 o si z 1.96 o si z 1.96, se rechaza H 0 : = 50 cm/seg con un nivel de significancia = 0.05 8) Es decir, Se concluye que en base a una muestra de 25 mediciones la rapidez promedio de combustin es diferente de 50 cm/seg, de hecho, existe evidencia fuerte de que sta es mayor.
  • Diapositiva 29
  • Pruebas de Hiptesis Valores P Una manera de notificar los resultados de una prueba de hiptesis es establecer si la hiptesis nula fue o no rechazada con un nivel especificado de significancia Una alternativa es especificar el nivel de significancia ms pequeo que conduce al rechazo de la hiptesis nula. A este se le llama el Valor P Este valor P slo depende de la muestra tomada, es decir, para una muestra y un estadstico calculado se puede obtener su valor P y comparar con un especificado. Entonces, si P
  • Pruebas de Hiptesis Valores P En el caso de la distribucin normal para la prueba sobre la media es fcil calcular el valor P. Si z 0 fue el valor calculado del estadstico de prueba, entonces: Donde (z) = P(Z z) (Funcin de distribucin normal N(0,1)) Para el ejemplo z 0 = 3.25, entonces P=2(1- (3.25))=0.0012. Es decir, H 0 ser rechazada con cualquier nivel de significancia 0.0012 P = 2 [ 1- (|z 0 |) ]Prueba de dos colas: H 0 : = 0, H 1 : 0 1- (z 0 )Prueba de cola superior: H 0 : = 0, H 1 : > 0 (z 0 )Prueba de cola inferior: H 0 : = 0, H 1 : < 0 Si se usa el enfoque del valor P el paso 6 del procedimiento general de prueba de hiptesis ya no es necesario.
  • Diapositiva 31
  • Ejemplo 1: De acuerdo a las normas establecidas en una prueba de aptitud acadmica, las personas que han concluido sus estudios secundarios deban tener un promedio de 76.7 puntos. Si se sabe por una investigacin anterior sobre el caso, que la desviacin estndar fue de 8.6 puntos y si 45 personas que concluyeron estudios secundarios son elegidas aleatoriamente y alcanzan un promedio de 73.2, pruebe la hiptesis de que el promedio ha disminuido. Z=-2.33 Zoz /2 o z z /2 o z
  • Diapositiva 34
  • Prueba de hiptesis sobre la igualdad de dos medias (varianzas conocidas) Ejemplo: Un diseador quiere reducir el tiempo de secado de una pintura. Se prueban dos frmulas de pintura. La frmula 1 es la normal y la frmula 2 posee un ingrediente secante que se espera reduzca el tiempo de secado. Se sabe que el tiempo de secado tiene una desviacin estndar de 8 min y que sta no se afecta con la adicin del nuevo ingrediente. Se pintan 10 especmenes con la frmula 1, y 10 con la frmula 2, obtenindose tiempos promedio de secado de x 1 =121 min, y x 2 =112 min. respectivamente. A qu conclusin se llega sobre la eficacia del nuevo ingrediente utilizando =0.05.? 1)Cantidad de inters: 1 - 2 2)H 0 : = 2 3)H 1 : > 2 (se busca evidencia fuerte que indique que el tiempo de secado promedio de la muestra 2 es menor) _ _
  • Diapositiva 35
  • Prueba de hiptesis sobre la igualdad de dos medias (varianzas conocidas) =0.05 =0.05 5)El estadstico de prueba es 6)H 0 se rechazar si z>z 0.05 = 1.645 7)Sustituyendo los datos, obtenemos z=(121-112)/(12.8) 1/2 =2.52 8)Conclusin: Puesto que z = 2.52 > 1.645 se rechaza H 0 con un nivel de significancia =0.05 concluyndose el nuevo ingrediente s disminuye el tiempo de secado. Alternativamente puede calcularse un valor P =1- (2.52) = 0.0059, es decir, se rechazar H 0 para cualquier nivel de significancia 0.0059
  • Diapositiva 36
  • Prueba de Hiptesis sobre una media poblacional Caso B: Cuando no se conoce la varianza poblacional es conocida y el tamao de la muestra es pequea. T(n-1)
  • Diapositiva 37
  • Prueba de Hiptesis sobre la media, varianza desconocida Si la poblacin tiene una distribucin Normal con media y varianza 2 desconocidas pudiera utilizarse el estadstico S 2 y el procedimiento descrito anteriormente para varianza conocida (esto es vlido para N grande), pero si la muestra es pequea, tendremos que usar el estadstico siguiente, el cual tiene una distribucin t con N-1 grados de libertad, el cual tiene una distribucin t con N-1 grados de libertad, As, para la prueba de Hiptesis bilateral H 0 : = 0 H 1 : 0 Se rechazar H 0 si t>t /2,N-1 o si t t /2,N-1 o si t
  • Diapositiva 38
  • Prueba de Hiptesis sobre la media, varianza desconocida Ejercicio: Los siguientes son datos de pruebas de resistencia a la adhesin, los siguientes datos presentan la carga (en Mpa) a la cual 22 especmenes fallaron Sugieren los datos que la carga promedio de falla es mayor que 10Mpa? Supngase que la carga de falla tiene una distribucin Normal y utilice =0.05. Desarrolle los 8 pasos del procedimiento general y encuentre un valor P para la prueba. 19.818.517.616.715.815.4 14.113.611.911.4 8.8 7.515.4 19.514.912.7 11.911.410.17.9
  • Diapositiva 39
  • Pruebas de Hiptesis Valor P de una prueba t El valor P es el ms pequeo nivel de significancia para el que H 0 debe rechazarse, esto es el rea de la cola (de la curva de densidad de probabilidad) que est ms all del valor del estadstico (en este caso t). o el doble de esta rea en pruebas bilaterales. Seleccin del Tamao de la Muestra En todas las pruebas de hiptesis estadsticas se puede calcular el tamao de la muestra (N) adecuada en funcin de la magnitud del error de tipo I que se permite. En cada tipo de prueba se encuentran frmulas diferentes para N.
  • Diapositiva 40
  • Pruebas de Hiptesis Otras pruebas de Hiptesis En forma similar a como se describi el caso de la media y la diferencia de medias, se pueden realizar diferentes pruebas de hiptesis para estos mismos u otros parmetros, lo nico que cambia en cada caso es: - Las suposiciones sobre la distribucin de la poblacin - El estadstico elegido y por consiguiente - La distribucin del estadstico. En la siguiente tabla se resumen algunas de las pruebas de hiptesis ms utilizadas
  • Diapositiva 41
  • Ejemplo 3: Suponga que un estudio relativo a 28 familias de la urbanizacin El Sol, arroj un ingreso medio durante el 2001, de $6,548.00 con una desviacin estndar de $952.00. Pruebe la hiptesis de que el verdadero ingreso familiar promedio diario por da de urbanizacin es de $6,000.00 (en el ao), frente a la alternativa de que no fue $6,000.00 use un nivel de significancia del 5%.
  • Diapositiva 42
  • Desarrollo Ejercicio 3: Ho se rechaza y se acepta H1 t=-2.052 t=2.052
  • Diapositiva 43
  • Ejercicio 4: En una muestra aleatoria de 10 sacaos de arroz extra envasado, se obtuvo una media de 9.4 Kg. con una desviacin estndar de 1.8 Kg. Contiene esta muestra suficiente evidencia para indicar que el peso medio es menor que 10 Kg. de arroz, a un nivel de significacin de 0.1?
  • Diapositiva 44
  • Ho se acepta entonces podemos decir que No existe suficiente evidencia para indicar que el peso medio de cada bolsa de arroz extra envasado, es menor que 10 kg. a un nivel de significancia de 10% t=-1.383 Desarrollo Ejercicio 4:
  • Diapositiva 45
  • Ejercicio 5: Suponga que se desea demostrar, sobre una base de una muestra tomada al azar de tamao 5, si el contenido de grasa en una mantequilla diettica, pasa el 30%.Qu puede concluir con un nivel del 1% de significacin, si los valores de la muestra son: 31.9, 30.3, 32.1, 31.7, 30.9
  • Diapositiva 46
  • Prueba de Hiptesis para la proporcin poblacional: p Se trata de efectuar una prueba de hiptesis acerca de la proporcin p de elementos con cierto atributo en una poblacin.
  • Diapositiva 47
  • Ejercicio 5 Se realiz una encuesta con el fin de estudiar las prcticas sanitarias dentales y las actutudes, de cierta poblacin urbana de adultos. De 300 adultos entrevistados, 123 dijeron que regularmente se sometan a una revisin dental dos veces al ao. Pruebe la hiptesis nula de que p=0.5 (el 50 % de los adultos de dicha poblacin se someten regularmente a una revisin dental, dos veces al ao)
  • Diapositiva 48
  • Desarrollo Ejercicio 5: Ho se rechaza y se puede concluir por tanto que el 50% de la poblacin no se hace una revisin dental dos veces al ao. Z=-1.96Z=1.96
  • Diapositiva 49
  • Ejercicio 6: Suponga que se sabe que el porcentaje de artculos buenos producidos por un cierto proceso es slo el 90%. Se elige una muestra aleatoria de 625 artculos en un cierto momento y se encuentran que 550 son buenos. Si ud. desea rechazar una hiptesis verdadera no ms de una vez en 100. Concluira que el porcentaje de artculos buenos producidos por el mencionado proceso, es exagerado.
  • Diapositiva 50
  • Z=-2.575 Desarrollo Ejercicio 6: Ho se acepta, es decir que no existe razn para concluir que el porcentaje de artculos buenos producidos es exagerado.
  • Diapositiva 51
  • Prueba de Hiptesis en dos poblaciones normales Caso A: Cuando la varianza poblacional es conocida y el tamao de la muestra es grande o se sabe que la poblacin tiene una distribucin normal, la estadstica de prueba es:
  • Diapositiva 52
  • Ejercicio 7: En un sistema educativo se aplicaron dos mtodos A y B para ensear el curso de estadstica. En un grupo de 80 estudiantes se aplic el mtodo A y en otro de 120 se aplic el mtodo B. Las medias de las calificaciones obtenidas fueron 13 y 13.5 respectivamente. Podemos admitir que los mtodos de enseanza no son diferentes y que las diferencias encontradas en las muestras se deben al azar? Experiencias anteriores dicen que las variables X 1 y X 2 que representan los rendimientos con los mtodos A y B, respectivamente, tienen distribucin normal con varianza 3 y 3.5 y =0.05
  • Diapositiva 53
  • Desarrollo Ejercicio 7: Ho se acepta, es decir que la diferencia encontrada entre las medias de las muestras no es significativa al nivel de significancia de 0.05. Z=-1.96Z=1.96
  • Diapositiva 54
  • Prueba de Hiptesis en dos poblaciones normales Caso B: Igualdad de medias cuando las varianzas poblacionales son desconocidas e iguales
  • Diapositiva 55
  • Ejercicio 8: Un investigador en el campo educativo sostiene que el mdulo didctico empleado en la enseanza de Matemticas es uno de los factores que influye y determina en el proceso de enseanza aprendizaje y, por lo tanto, el mdulo adoptado incidir en el rendimiento acadmico de los estudiantes. Para verificar su hiptesis decide realizar el siguiente experimento: durante un semestre se llev a cabo el trabajo lectivo en dos grupos independientes de estudiantes de la misma carrera en la misma universidad, empleando dos mtodos (A y B) de caractersticas bien diferenciadas, que fueron seleccionados aleatoriamente. Al final del curso se aplic el mismo examen y se obtuvo las siguiente notas:
  • Diapositiva 56
  • Mtodo A15161513 16 1417 Mtodo B1314 11121413 Suponiendo que las muestra provienen de poblaciones normales con varianzas iguales, los resultados encontrados por el profesor apoyan la hiptesis de investigacin con nivel de significancia de 0.01
  • Diapositiva 57
  • Desarrollo Ejercicio 8: Ho se rechaza, es decir que la diferencia encontrada entre las medias de las muestras es significativa a un nivel de significancia de 0.05. t=-2.947t=2.947
  • Diapositiva 58
  • Prueba de Hiptesis en dos poblaciones independientes Caso C: Prueba de hiptesis para diferencia de proporciones
  • Diapositiva 59
  • Ejercicio 9:
  • Diapositiva 60
  • Pruebas de Hiptesis Otras pruebas paramtricas de Hiptesis Prueba sobreHiptesis NulaSuposiciones Estadstico de Prueba La media = 0 2 conocida Normal = 0 2 desconocida T Igualdad de medias = 2 2 = 2 conocidas Normal = 2 2 = 2 desconocidas T = 2 2 2 conocidas T La varianza 2 = 2 dist. Normal, N pequeaJi 2 2 = 2 N grandeNormal Igualdad de dos varianzas 2 = 2 F Una proporcinp = p 0 Normal Igualdad de dos proporciones p 1 = p 2 Normal