Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula...
Transcript of Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula...
Estadística Técnica
Prueba de hipótesis para la diferencia de medias
Cladera Ojeda, Fernando
Conceptos previos
Inferencia estadística Población Muestra Parámetro Estadístico Hipótesis estadística
Pruebas de hipótesis
Hipótesis nula Hipótesis alternativa Regiones – Valor crítico
De rechazo De aceptación
Errores Tipo I – Nivel de significancia Tipo II - Potencia
Diferencia de medias
Hipótesis nula
Hipótesis alternativa
1−2=01−2=d0
1−201−2d0
1−2≠0
Poblaciones y muestras
Tenemos ahora, dos poblaciones:Población 1 Población 2
Muestra 1 Muestra 2
1 2
12 1
2
x1 x2
s12 s2
2
n1 n2
Posibilidades...
Varianzas poblacionales conocidas Varianzas poblacionales desconocidas
Se suponen iguales Se suponen diferentes
12=2
2
12≠2
2
Varianzas conocidas - TLC
Si X es la media de una muestra aleatoria de tamaño n tomada de una población con media varianza finita , entonces, la forma límite de la distribución
Si es la disttribución normal estándar n(z;0;1).
Z=X−
−n
n∞
2
Por propiedad reproductiva, y aplicando TLC.
Ya que son independientes:
X1 – X2 ~ Normal ( , )
Media
VarianzaX 1−X2
2 =X1
2 X2
2 =1
2
n1
2
2
n2
X1−X 2=X1
−X 2=1−2
X1−X 2X 1−X2
Aplicando TLC, tenemos
Entonces, evaluaremos nuestra hipótesis en función de z y , obtenida mediante la tabla de la distribución normal.
Z=X 1−X2−X1
−X 2
12
n1
2
2
n2
Z=X 1−X2−d0
12
n1
2
2
n2
z
Varianzas desconocidas e iguales
Z=X 1−X2−1−2
2 [ 1n1
1n2 ]
n1−1S12
2
n2−1S22
2
v. a. con
X2
=n−1
T=Z
Vv
T=X1−X 2−1−2
S p 1n1
1n2
S p2=
n1−1S12n2−1S2
2
n1n2−2
Usamos la distribución t-student, con n1+n2-2 gl. A partir de ella, encontramos y comparamos con el valor calculado.
t ,
Varianzas desconocidas diferentes
T=X1−X 2−1−2
S12
n1
S2
2
n2
= s1
2/n1s22 /n2
2
[s12/n1
2/n1−1 ] [s2
2/n2
2/n2−1 ]
¿
Usamos la distribución t-student, v gl. A partir de ella, encontramos y comparamos nuevamente.
t ,
P 6.23 – Apuntes de la Cátedra
Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura. Se prueban dos fórmulas de pintura; la fórmula 1 tiene el contenido químico estándar y la fórmula 2 tiene un nuevo ingrediente secante que tiende a reducir el tiempo de secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es ocho minutos y esta variabilidad inherente no debe verse afectada por a adición del nuevo ingrediente.Se pintan 35 placas con la fórmula 1 y otras 35 con la fórmula 2. Los dos tiempos promedio de secado muestrales son 116 minutos para la fórmula 1 y 112 minutos para la fórmula 2. ¿A qué conclusión puede llegar el diseñador del producto sobre la eficacia delnuevo ingrediente, al nivel de significancia 0,01?
X1 : tiempo de secado de la fórmula 1 X1 ~ Desc( ) X2: tiempo de secado de la fórmula 2 X2 ~ Desc( ) X1 – X2 ~ N( ) x1 = 116 minutos x2 = 112 minutos n1 = n2 = 35 = 0,01
1 ,1=8
2 ,1=8
1−2 ,12 /n12
2/n2
h0 :1−2=0h1 :1−20
Por tabla, observamos que Zc = 2,33
Decidimos entonces aceptar la hipótesis nula. No hay evidencia suficiente como para demostrar que el tiempo de secado disminuye significativamente.
Podemos calcular el valor P, por tabla normal.
Z0=x1−x2
12
n1
2
2
n2
⇒Z 0=116−112
8 135
1
35
=2,09
La verdadera probabilidad de cometer error de tipo 1 es de 0,01831. Es decir, mayor que la aceptable.
Esto valida nuestra conclusión, de que para este nivel de significancia los tiempos de secado no son significativamente diferentes.
P 10 . 24 - Walpole
Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. Cada muestra se divide en dos submuestras y se aplican los dos tipos de análisis. A continuación, se presentan los datos codificados que muestran los análisis de contenido de hiero:
Suponga que las poblaciones son normales, pruebe con un nivel de significancia de 0,05 si los dos métodos de análisis dan, en promedio, el mismo resultado.
Analysis 1 2 3 4 5X-ray 2.0 2.0 2.3 2.1 2.4
Chemical 2.2 1.9 2.5 2.3 2.4
X1 : Contenido de Fe en muestra analizada con Rx X2: Contenido de Fe en muestra de análisis
químico X1 ~ N( ) X2 ~ N( ) x1 = 2,16 s1 = 0,18165 x2 = 2,26 s2 = 0,23021 n1 = n2 = 5
= 0,05
1 ,1
2 ,2
h0 :2−1=0h1 :2−1≠0
Si las varianzas son iguales
T o=x2−x1
S p 1n1
1n2
=0,1
0,02072/5=0,7624
S p2=
n1−1 s12n2−1 s2
2
n1n2−2=
4.0,0330,0538
=0,043
Ya que T0 < T = 2,306 se opta por no rechazar la hipótesis nula. No hay evidencia significativa de que el contenido promedio de Fe es mayor en un método que en otro.
Si las varianzas son diferentes
T=X2−X 1
S12
n1
S2
2
n2
=0,10
0,01311=0,7624
= s1
2/n1s22 /n2
2
[s12/n1
2/n1−1 ] [s2
2/n2
2/n2−1 ]
≈8
Nuevamente, concluímos no rechazar la hipótesis nula.
Pueden tomarse ambos métodos de análisis indistintamente.
Bibliografía
Walpole, Myers y Myers (1999). Probabilidad y Estadística para Ingenieros. Sexta edición. Ed. Prentice Hall. México.
Apuntes de la cátedra Estadística Técnica (2009). Facultad de Ingeniería. Universidad Nacional de Cuyo.