curvas

20
Clase 20: Intervalos de confianza para medias de poblaciones normales, intervalo de confianza de diferencia de medias para muestras normales y no normales Estudiante de posgrado: Lina Mar´ ıa Acosta Avena * Abril de 2013 Escuela de Estad´ ıstica Universidad Nacional de Colombia, Sede Medellin [email protected] * Maestr´ ıa en Ciencias Estad´ ıstica Estad´ ıstica I. 1

description

proceso para conseguir una curva

Transcript of curvas

Page 1: curvas

Clase 20: Intervalos de confianza para medias de

poblaciones normales, intervalo de confianza de diferencia

de medias para muestras normales y no normales

Estudiante de posgrado: Lina Marıa Acosta Avena*

Abril de 2013

Escuela de Estadıstica

Universidad Nacional de Colombia, Sede Medellin

[email protected]*Maestrıa en Ciencias Estadıstica

Estadıstica I.

1

Page 2: curvas

Introducci on

En muchas ocaciones surge la necesidad de comparar medias de dos pobla-

ciones distintas, por ejemplo mirar si una media es mas grande o mas pequena

que la otra.

Pueden suceder varios casos: que las muestras aleatorias sean normales o

no normales, y ademas puede que se conozca la varianza o no.

Estadıstica I.

2

Page 3: curvas

Diferencia de medias

Caso I: poblaciones no normales con muestras grandes

Sean X1,X2, . . . ,Xn y Y1,Y2, . . . ,Ym dos muestras de dos distribuciones nor-

males independientes, con medias µx y µy, y varianzas σ2x y σ2

y, respectiva-

mente.

Se desea construir un intervalo de confianza para la diferencia µx−µy

Estadıstica I.

3

Page 4: curvas

Diferencia de medias

(a) Varianzas conocidas

Como ambas muestras son independientes, X y Y tambien lo son, ası que:

E(X−Y) = E(X)−E(Y) = µx−µy

Var(X−Y) = Var(X)+Var(Y) = σ2x

n +σ2

ym

Estadıstica I.

4

Page 5: curvas

Diferencia de medias

Por el T.L.C

X−Y− (µx−µy)√

σ2x

n +σ2

ym

∼ n(0,1)

Ası que un intervalo de confianza para µx−µy es

X−Y±Z(α/2)

σ2x

n+

σ2y

m

Estadıstica I.

5

Page 6: curvas

Diferencia de medias

(b) Varianzas desconocidas

Como n,m→ ∞ se pueden usar S2x y S2

y, ası que un I.C. aproximado al

100(1−α)% para µx−µy es

X−Y±Z(α/2)

S2xn+

S2y

m

Estadıstica I.

6

Page 7: curvas

Diferencia de medias

EJEMPLO 1.

Dos universidades financiadas por el gobierno tienen dos metodos distintos

para inscribir a sus alumnos a principios de cada semestre. Las dos desean

comparar el tiempo promedio que les toma a los estudiantes completar el

tramite de inscripcion. En cada universidad se anotaron los tiempos de in-

scripcion para 100 alumnos al azar, las medias y las desviaciones estandares

fueron las siguientes:

X = 50,2 Y = 52,9 Sx = 4,8 Sy = 5,4

Con base en esta evidencia, se estarıa inclinando a concluir que existe una

diferencia real entre los tiempos medios para cada universidad?

Estadıstica I.

7

Page 8: curvas

Diferencia de medias

Sln:

Note que no se dice cual es la distribucion, pero como n= 100, m= 100son

grandes, entonces un I.C. al 95%para µx−µy es

X−Y±Z(α/2)

S2xn+

S2y

m=(50,2−52,9)±1,96

(4,8)2

100+(5,4)2

100=(−4,12 ;−1,28)

Estadıstica I.

8

Page 9: curvas

Diferencia de medias

Como el intervalo no contiene al cero, las medias no son iguales, ası que

existen diferencias entre los tiempos medios de las universidades.

OBS: µx−µy < 0=⇒ µx < µy

Estadıstica I.

9

Page 10: curvas

Diferencia de medias

EJEMPLO 2.

Se hicieron pruebas de resistencia a la tension a dos tipos distintos de varillas

para alambres y se obtuvieron los siguientes resultados:

Grado Tamano muestral Media muestral Desviacion estandar

AISI-1064 n= 129 107,6 1,3AISI-1078 m= 129 123,6 2,0

Indican estos datos que la resistencia promedio real del grado 1078 supera a

la del grado 1064 en mas de 10kg mm2?. Comente.

Estadıstica I.

10

Page 11: curvas

Diferencia de medias

Sln:

Sean

X : Resistencia a la tension de varillas de tipo 1064

Y : Resistencia a la tension de varillas de tipo 1078

Como n = m= 129 son “grandes” entonces un I.C aproximado al 95% para

µx−µy es

Y−X±Z(1−α/2)

S2xn+

S2y

m=(123,6−107,6)±1,96

(1,3)2

129+(2,0)2

129=(15,59 ; 16,41)

Note que el intervalo se encuentra a la derecha de 10, por lo cual µy−µx> 10,

ası que con una confianza aproximada del 95% la sospecha es cierta.

Estadıstica I.

11

Page 12: curvas

Diferencia de medias

Caso II: poblaciones normales

Sean X1,X2, . . . ,Xn y Y1,Y2, . . . ,Ym dos muestras de dos distribuciones nor-

males independientes, con medias µx y µy, y varianzas desconocidas σ2x y σ2

y,

respectivamente.

Se desea construir un intervalo de confianza para la diferencia µx−µy

Estadıstica I.

12

Page 13: curvas

Diferencia de medias

(a) Varianzas desconocidas iguales σ2x = σ2

y.

Un I.C. al 100(1−α)% para µx−µy es

X−Y± t(α/2,n+m−2)Sp

1n+

1m

donde S2p =

(n−1)S2x+(m−1)S2

yn+m−2 (varianza muestral combinada)

Estadıstica I.

13

Page 14: curvas

Diferencia de medias

Observacion

Se sabe que

n

∑i=1

(

Xi −µσ

)2=

n

∑i=1

(Xi −µ)2

σ2 ∼ χ2(n)

Ahora

n−1n−1

n

∑i=1

(Xi −µ)2

σ2 = (n−1)S2

x

σ2 ∼ χ2(n−1)

analogamente

(m−1)S2

y

σ2 ∼ χ2(m−1)

Estadıstica I.

14

Page 15: curvas

Diferencia de medias

Ası

(n−1)S2

x

σ2+(m−1)S2

y

σ2 ∼ χ2(v=m+n−1−1=m+n−2)

(b) Varianzas diferentes σ2x 6= σ2

yUn I.C al 100(1−α)% para µx−µy es

X−Y± t(α/2,v)

S2xn+

S2y

mdonde

v=

[

S2xn +

S2y

m

]2

(

S2xn

)2

n+1 +

(

S2y

m

)2

m+1

−2

Estadıstica I.

15

Page 16: curvas

Diferencia de medias

EJEMPLO 1.

En dos ciudades se llevo a cabo una encuesta sobre el costo de la vida para

obtener el gasto promedio en alimentacion en familias constituidas por cuatro

personas. De cada ciudad se selecciono aleatoriamente una muestra de 20

familias y se observaron sus gastos semanales en alimentacion. Las medias

y las desviaciones muestrales fueron las siguientes:

X = 135 Y = 122 Sx = 15 Sy = 10

Estadıstica I.

16

Page 17: curvas

Diferencia de medias

Si se supone que se muestrearon dos poblaciones independientes con dis-

tribucion normal cada una, se podrıa afirmar que existe una diferencia real

entre µx y µy?

Sln

Como se esta asumiendo que las poblaciones son normales y no se conocen

las varianzas, entonces:

Si σ2x = σ2

y

un I.C al 100(1−α)% para µx−µy es

X−Y± t(α/2,n+m−2)Sp

1n+

1m

Estadıstica I.

17

Page 18: curvas

Diferencia de medias

donde

S2p =

(n−1)S2x+(m−1)S2

y

n+m−2=

(20−1)(15)2+(20−1)(10)2

20+20−2= 162,5

Luego

(135−122)±2,024√

162,5

120

+120

= (4,84;21,16)

Como el intervalo no contiene al cero, se puede decir que existen diferencias

entre µx y µy, ası µx−µy > 0⇒ µx > µy, pues el intervalo esta a la derecha

de cero.

Estadıstica I.

18

Page 19: curvas

Diferencia de medias

Si σ2x 6= σ2

y

Un I.C al 100(1−α)% para µx−µy es

X−Y± t(α/2,v)

S2xn+

S2y

m

donde

v=

[

S2xn +

S2y

m

]2

(

S2xn

)2

n+1 +

(

S2y

m

)2

m+1

−2= 34,59≈ 35

Estadıstica I.

19

Page 20: curvas

Diferencia de medias

luego

135−122±2,030

152

20+

102

20= (4,82 ; 21,18)

Como en cero no esta en el intervalo, existen diferencias entre µx y µy

Estadıstica I.

20