curvas
description
Transcript of curvas
Clase 20: Intervalos de confianza para medias de
poblaciones normales, intervalo de confianza de diferencia
de medias para muestras normales y no normales
Estudiante de posgrado: Lina Marıa Acosta Avena*
Abril de 2013
Escuela de Estadıstica
Universidad Nacional de Colombia, Sede Medellin
[email protected]*Maestrıa en Ciencias Estadıstica
Estadıstica I.
1
Introducci on
En muchas ocaciones surge la necesidad de comparar medias de dos pobla-
ciones distintas, por ejemplo mirar si una media es mas grande o mas pequena
que la otra.
Pueden suceder varios casos: que las muestras aleatorias sean normales o
no normales, y ademas puede que se conozca la varianza o no.
Estadıstica I.
2
Diferencia de medias
Caso I: poblaciones no normales con muestras grandes
Sean X1,X2, . . . ,Xn y Y1,Y2, . . . ,Ym dos muestras de dos distribuciones nor-
males independientes, con medias µx y µy, y varianzas σ2x y σ2
y, respectiva-
mente.
Se desea construir un intervalo de confianza para la diferencia µx−µy
Estadıstica I.
3
Diferencia de medias
(a) Varianzas conocidas
Como ambas muestras son independientes, X y Y tambien lo son, ası que:
E(X−Y) = E(X)−E(Y) = µx−µy
Var(X−Y) = Var(X)+Var(Y) = σ2x
n +σ2
ym
Estadıstica I.
4
Diferencia de medias
Por el T.L.C
X−Y− (µx−µy)√
σ2x
n +σ2
ym
∼ n(0,1)
Ası que un intervalo de confianza para µx−µy es
X−Y±Z(α/2)
√
σ2x
n+
σ2y
m
Estadıstica I.
5
Diferencia de medias
(b) Varianzas desconocidas
Como n,m→ ∞ se pueden usar S2x y S2
y, ası que un I.C. aproximado al
100(1−α)% para µx−µy es
X−Y±Z(α/2)
√
S2xn+
S2y
m
Estadıstica I.
6
Diferencia de medias
EJEMPLO 1.
Dos universidades financiadas por el gobierno tienen dos metodos distintos
para inscribir a sus alumnos a principios de cada semestre. Las dos desean
comparar el tiempo promedio que les toma a los estudiantes completar el
tramite de inscripcion. En cada universidad se anotaron los tiempos de in-
scripcion para 100 alumnos al azar, las medias y las desviaciones estandares
fueron las siguientes:
X = 50,2 Y = 52,9 Sx = 4,8 Sy = 5,4
Con base en esta evidencia, se estarıa inclinando a concluir que existe una
diferencia real entre los tiempos medios para cada universidad?
Estadıstica I.
7
Diferencia de medias
Sln:
Note que no se dice cual es la distribucion, pero como n= 100, m= 100son
grandes, entonces un I.C. al 95%para µx−µy es
X−Y±Z(α/2)
√
S2xn+
S2y
m=(50,2−52,9)±1,96
√
(4,8)2
100+(5,4)2
100=(−4,12 ;−1,28)
Estadıstica I.
8
Diferencia de medias
Como el intervalo no contiene al cero, las medias no son iguales, ası que
existen diferencias entre los tiempos medios de las universidades.
OBS: µx−µy < 0=⇒ µx < µy
Estadıstica I.
9
Diferencia de medias
EJEMPLO 2.
Se hicieron pruebas de resistencia a la tension a dos tipos distintos de varillas
para alambres y se obtuvieron los siguientes resultados:
Grado Tamano muestral Media muestral Desviacion estandar
AISI-1064 n= 129 107,6 1,3AISI-1078 m= 129 123,6 2,0
Indican estos datos que la resistencia promedio real del grado 1078 supera a
la del grado 1064 en mas de 10kg mm2?. Comente.
Estadıstica I.
10
Diferencia de medias
Sln:
Sean
X : Resistencia a la tension de varillas de tipo 1064
Y : Resistencia a la tension de varillas de tipo 1078
Como n = m= 129 son “grandes” entonces un I.C aproximado al 95% para
µx−µy es
Y−X±Z(1−α/2)
√
S2xn+
S2y
m=(123,6−107,6)±1,96
√
(1,3)2
129+(2,0)2
129=(15,59 ; 16,41)
Note que el intervalo se encuentra a la derecha de 10, por lo cual µy−µx> 10,
ası que con una confianza aproximada del 95% la sospecha es cierta.
Estadıstica I.
11
Diferencia de medias
Caso II: poblaciones normales
Sean X1,X2, . . . ,Xn y Y1,Y2, . . . ,Ym dos muestras de dos distribuciones nor-
males independientes, con medias µx y µy, y varianzas desconocidas σ2x y σ2
y,
respectivamente.
Se desea construir un intervalo de confianza para la diferencia µx−µy
Estadıstica I.
12
Diferencia de medias
(a) Varianzas desconocidas iguales σ2x = σ2
y.
Un I.C. al 100(1−α)% para µx−µy es
X−Y± t(α/2,n+m−2)Sp
√
1n+
1m
donde S2p =
(n−1)S2x+(m−1)S2
yn+m−2 (varianza muestral combinada)
Estadıstica I.
13
Diferencia de medias
Observacion
Se sabe que
n
∑i=1
(
Xi −µσ
)2=
n
∑i=1
(Xi −µ)2
σ2 ∼ χ2(n)
Ahora
n−1n−1
n
∑i=1
(Xi −µ)2
σ2 = (n−1)S2
x
σ2 ∼ χ2(n−1)
analogamente
(m−1)S2
y
σ2 ∼ χ2(m−1)
Estadıstica I.
14
Diferencia de medias
Ası
(n−1)S2
x
σ2+(m−1)S2
y
σ2 ∼ χ2(v=m+n−1−1=m+n−2)
(b) Varianzas diferentes σ2x 6= σ2
yUn I.C al 100(1−α)% para µx−µy es
X−Y± t(α/2,v)
√
S2xn+
S2y
mdonde
v=
[
S2xn +
S2y
m
]2
(
S2xn
)2
n+1 +
(
S2y
m
)2
m+1
−2
Estadıstica I.
15
Diferencia de medias
EJEMPLO 1.
En dos ciudades se llevo a cabo una encuesta sobre el costo de la vida para
obtener el gasto promedio en alimentacion en familias constituidas por cuatro
personas. De cada ciudad se selecciono aleatoriamente una muestra de 20
familias y se observaron sus gastos semanales en alimentacion. Las medias
y las desviaciones muestrales fueron las siguientes:
X = 135 Y = 122 Sx = 15 Sy = 10
Estadıstica I.
16
Diferencia de medias
Si se supone que se muestrearon dos poblaciones independientes con dis-
tribucion normal cada una, se podrıa afirmar que existe una diferencia real
entre µx y µy?
Sln
Como se esta asumiendo que las poblaciones son normales y no se conocen
las varianzas, entonces:
Si σ2x = σ2
y
un I.C al 100(1−α)% para µx−µy es
X−Y± t(α/2,n+m−2)Sp
√
1n+
1m
Estadıstica I.
17
Diferencia de medias
donde
S2p =
(n−1)S2x+(m−1)S2
y
n+m−2=
(20−1)(15)2+(20−1)(10)2
20+20−2= 162,5
Luego
(135−122)±2,024√
162,5
√
120
+120
= (4,84;21,16)
Como el intervalo no contiene al cero, se puede decir que existen diferencias
entre µx y µy, ası µx−µy > 0⇒ µx > µy, pues el intervalo esta a la derecha
de cero.
Estadıstica I.
18
Diferencia de medias
Si σ2x 6= σ2
y
Un I.C al 100(1−α)% para µx−µy es
X−Y± t(α/2,v)
√
S2xn+
S2y
m
donde
v=
[
S2xn +
S2y
m
]2
(
S2xn
)2
n+1 +
(
S2y
m
)2
m+1
−2= 34,59≈ 35
Estadıstica I.
19
Diferencia de medias
luego
135−122±2,030
√
152
20+
102
20= (4,82 ; 21,18)
Como en cero no esta en el intervalo, existen diferencias entre µx y µy
Estadıstica I.
20