• Inferencia estadística (intervalos de confianza y
prueba de hipótesis)
• Hipótesis nula e hipótesis alternativa
• Nivel de significancia y valor crítico del estadístico
de prueba
• Error Tipo I y Error Tipo II
Nuestro objetivo es hacer inferencias sobre una población (ej. los parámetros que la caracterizan) a partir de la información contenida en una muestra elegida al azar.
El procedimiento de prueba de hipótesis es muy similar al método científico.
Inferencia: Una conclusión que surge de forma lógica a partir de
observaciones o premisas
Método científico:
- Observar la naturaleza de un fenómeno
- Formular una teoría
- Confrontar la teoría con la evidencia observada
Si lo observado difiere de la teoría, se rechaza la hipótesis. En caso contrario, podemos concluir:
i) La teoría es verdadera, o
ii) La muestra no detectó diferencias importantes o significativas entre los valores reales y los postulados por la hipótesis planteada.
¿Qué puede hacer la estadística en lo que se refiere a pruebas de hipótesis?
¿Cómo decidimos si la información contenida en una muestra dada está en desacuerdo con la teoría?
¿Es adecuado el tamaño de la muestra?
¿En qué circunstancias deberíamos rechazar/aceptar la hipótesis?
¿Cómo emitir una conclusión?
Definición: una hipótesis estadística es una afirmación o conjetura sobre los parámetros de la distribución de probabilidades de una o más variables aleatorias.
Una Hipótesis estadística simple especifica completamente la distribución, de lo contrario hablamos de Hipótesis estadística compuesta.
Denominamos Hipótesis nula, H0 a la hipótesis a ser probada. A la hipótesis nula contraponemos una segunda hipótesis que llamaremos Hipótesis alternativa, H0.
Todas las pruebas de hipótesis trabajan en base a ciertos principios los que se pueden resumir en los siguientes elementos: 1. Una hipótesis nula H0 2. Una hipótesis alternativa HA
3. Un estadístico de prueba 4. Una zona de rechazo 5. Regla de decisión 6. Conclusión
El estadístico de prueba, al igual que un estimador, es una función de la muestra. Nos interesa que contenga el máximo de información sobre la H0 planteada. Es en base a la información contenida en esta función que se tomará la decisión respecto de la aceptación o rechazo de H0 .
La zona de rechazo (ZR), también llamada región crítica (RC), define los valores del estadístico de prueba para los cuales la información muestral contradice la hipótesis nula. Estos valores permitirán adoptar una regla de decisión consistente.
Regla de decisión. Si para una muestra particular el estadístico de prueba (valor calculado) cae dentro de la ZR o RC, rechazaremos H0 en favor de HA . Si el valor no cae dentro de ZR no podremos rechazar H0 .
El criterio para delimitar los límites de la ZR o RC es similar al utilizado para los límites de los intervalos de confianza. Esto es, deseamos rechazar la H0 en aquellos casos en que el parámetro de interés esté fuera del intervalo de confianza.
Definición: el nivel de significancia ( ) es la probabilidad que
el valor observado del estadístico de prueba esté en la región
crítica o zona de rechazo.
El nivel de significancia también se conoce como “valor-p” de
la prueba de hipótesis y representa la cantidad de evidencia en
contra de H0 encontrada en la muestra bajo el supuesto que H0
es verdadera.
Si es mayor que p: se rechaza H0.
Si es menor que p: se acepta H0.
Una probabilidad de 5% (0.05) o menos se considera un buen
criterio para rechazar H0.
1) H0: µ=10.00 mg/m3 y HA: µ≠10.00 mg/m3
2) Estadístico Z
3) Zona de rechazo
4) Regla de decisión
5) Conclusión
1.96 -1.96 0
Imaginemos que tenemos 25 jaibas del inter-mareal de
Bahía Coliumo que fueron expuestas a temperatura
ambiente a 24.3°C. Deseamos saber si la temperatura
corporal de los miembros de esta especie de jaiba es la
misma que la temperatura del aire (24.3°C).
H0: µ=24.3°C
HA: µ≠24.3°C
X
XZ
Es una variable normal; es útil para
determinar la probabilidad de
obtener una muestra con media
desde una población con una media
específica µ.
El cálculo de Z requiere conocer
el error estándar de la media, que normalmente no es el caso.
La mejor alternativa es calcular
Si n es muy, pero muy pequeño entonces no es un buen estimado
de y no podemos calcular Z usando este estimado.
X
Xs
Xs
Xt
Como sucede con muchas
distribuciones estadísticas, la
distribución t tiene diferentes formas
las que dependen de lo que se
conoce como grados de libertad
(denotado por v).
donde :
Recordemos que n es el número es el tamaño de la muestra
1nv
Ejemplo de test t de dos colas para la diferencia entre una
media poblacional y una media poblacional hipotética.
Individuo Temperatura corporal
1 25.8
2 24.6
3 26.1
4 22.9
5 25.1
6 27.3
7 24.0
8 24.5
9 23.9
10 26.2
11 24.3
12 24.6
13 23.3
14 25.5
15 28.1
16 24.8
17 23.5
18 26.3
19 25.4
20 25.5
21 23.9
22 27.0
23 24.8
24 22.9
25 25.4
Promedio 25.03
varianza 1.80
desv. Est. 1.34
Error est. 0.27
1) H0: µ=24.3°C; HA: µ≠24.3°C
2) Estadístico t
3) Zona de rechazo
4) Regla de decisión
5) Conclusión
Considere: =0.05; n=25; Promedio=25.03°C; v=24;
704.227.0
3.2403.25
C
CC
s
Xt
X
2.064 -2.064 0
064.224),2(05.0t
24),2(05.0|| tt
Rechazamos H0 y concluimos que la muestra de 25 temperaturas corporales
viene de una muestra cuya media no es 24.3°C
Cuando en una prueba de hipótesis consideramos un valor de
t tan extremo en cualquier dirección respecto de µ que
causará rechazar H0 , decimos que consideramos una prueba
de “dos colas” (o “de dos lados”).
En general, para una prueba t de dos colas rechazamos H0 si:
vtt ),2(||
Cambio de peso de 12 ratas sometidas a un régimen de
ejercicio forzado. Cada cambio en peso (en gramos) es el
peso después del ejercicio menos el peso antes del ejercicio.
Cambio de peso
1.7
0.7
-0.4
-1.8
0.2
0.9
-1.2
-0.9
-1.8
-1.4
-1.8
-2.0
Promedio -0.7
Varianza 1.6
Desv. Est. 1.3
Muchas veces el valor
hipotético de las hipótesis
nula y alternativa es cero.
H0: µ=0; HA: µ≠0
En muchos casos nuestro interés es saber si la media de
la muestra es significativamente mayor (o
significativamente menor) que µ0.
A esto lo denominaremos prueba de una cola (o prueba
de un lado).
Por ejemplo, consideremos un caso en que se prueba
una droga (derivada de un alga) que causa disminución
del peso en humanos. El investigador está interesado
sólo en si la el peso disminuye después de que se
administra la droga.
Individuo cambio en peso
1 0.2
2 -0.5
3 -1.3
4 -1.6
5 -0.7
6 0.4
7 -0.1
8 0
9 -0.6
10 -1.1
11 -1.2
12 -0.8
-1.796 0
796.111),1(05.0t
H0: µ 0; HA: µ<0
Si estamos interesados que la media de la muestra sea
significativamente mayor que algún valor µ0
H0: µ≤µ0 ; HA: µ> µ0 ; rechazamos H0 si
La situación contraria (que la media de la muestra sea
significativamente menor que algún valor µ0 )
H0: µ µ0 ; HA: µ< µ0 ; rechazamos H0 si
vtt ),1(
vtt ),1(