Intervalos de Confianza

15
CAPITULO V Intervalos de confianza Hasta ahora los estimadores estudiados son puntuales, es decir, exhiben un valor como estimación del parámetro de interés. En muchos casos esto no es suficiente; se requiere de un rango de posibles valores donde se cree el parámetro de interés estará con una alta confianza. Sea un parámetro de interés y ˆ un estimador puntual de . Una estimación de por intervalos es un intervalo real de la forma ( ) ( ) l,u l u < < , donde l y u dependen de ˆ y de la distribución de ˆ . Para cada m.a se obtiene un valor ˆ diferente y por lo tanto valores diferentes para l y u . Por lo tanto estos extremos se convierten en v.a las cuales denotaremos L y U . El intervalo ( ) L,U es llamado Intervalo aleatorio . Usando ˆ y la distribución de ˆ se pueden determinar L y U tales que ( ) ( ) 1 0 1 PL U , , < < = dado. Se tiene una probabilidad de 1 de que el intervalo ( ) l,u obtenido a partir de una m.a particular contenga el valor real de . Para ésta muestra el intervalo ( ) l,u es llamado intervalo de confianza al ( ) 100 1 % para . l y u son llamados limites de confianza (inferior y superior respectivamente) y 1 es llamado coeficiente de confianza . Notación: IC al ( ) 100 1 % para . “De todas las posibles muestras que pueden obtener y sus respectivos IC al ( ) 100 1 % , el ( ) 100 1 % de estos contendrá el valor real de Este intervalo se conoce como IC Bilateral, pero tambien es posible calcular IC unilaterales : I.C inferior para al ( ) ( ) 100 1 %: l l, + I.C superior para al ( ) ( ) 100 1 %: u ,u En un IC bilateral la longitud u l es una medida de la calidad de la información obtenida. El semi- intervalo l ó u se conoce como Precisión del estimador. Lo ideal es tener IC angostos con una alta confianza. Obtención de un IC Suponga que 1 n X, ,X es una m.a de una distribución con parámetro desconocido. Suponga que se puede encontrar un estimador de , ˆ es cual es una función de la muestra. Digamos ( ) 1 n ˆ hX, ,X = NO depende de ni de otros parámetros desconocidos. Para ( ) 0 1 , dado, podemos encontrar constantes a y b tal que ( ) ( ) 1 1 n Pa hX, ,X ; b < < = . Suponga que es posible despejar a de esta desigualdad y obtener ( ) ( ) ( ) 1 1 1 n n PlX, ,X uX, ,X < < = ( ) 1 n lX, ,X y ( ) 1 n uX, ,X son los límites de confianza y para una muestra particular se obtiene el intervalo de confianza ( ) l,u al IC al ( ) 100 1 % para .

description

estadistica descriptiva.

Transcript of Intervalos de Confianza

Page 1: Intervalos de Confianza

CAPITULO V Intervalos de confianzaHasta ahora los estimadores estudiados son puntuales, es decir, exhiben un valor como estimación del parámetro de interés. En muchos casos esto no es suficiente; se requiere de un rango de posibles valores donde se cree el parámetro de interés estará con una alta confianza. Sea θ un parámetro de interés y θ̂ un estimador puntual de θ . Una estimación de θ por intervalos es un intervalo real de la forma ( ) ( )l , u l u< θ < , donde l y u dependen de θ̂ y de la

distribución de θ̂ .Para cada m.a se obtiene un valor θ̂ diferente y por lo tanto valores diferentes para l y u . Por lo tanto estos extremos se convierten en v.a las cuales denotaremos L y U . El intervalo ( )L , U es

llamado Intervalo aleatorio. Usando θ̂ y la distribución de θ̂ se pueden determinar L y U tales que ( ) ( )1 0 1P L U , ,< θ < = − α α∈ dado. Se tiene una probabilidad de 1 − α de que el

intervalo ( )l , u obtenido a partir de una m.a particular contenga el valor real de θ . Para ésta muestra el intervalo ( )l , u es llamado intervalo de confianza al ( )100 1 %− α para θ . l y u son

llamados limites de confianza (inferior y superior respectivamente) y 1 − α es llamado coeficientede confianza. Notación: IC al ( )100 1 %− α para θ .

“De todas las posibles muestras que pueden obtener y sus respectivos IC al ( )100 1 %− α , el

( )100 1 %− α de estos contendrá el valor real de θ ”Este intervalo se conoce como IC Bilateral, pero tambien es posible calcular IC unilaterales:I.C inferior para θ al ( ) ( )100 1 % : l l ,− α ≤ θ + ∞

I.C superior para θ al ( ) ( )100 1 % : u , u− α θ ≤ −∞

En un IC bilateral la longitud u l− es una medida de la calidad de la información obtenida. El semi-intervalo lθ − ó u − θ se conoce como Precisión del estimador. Lo ideal es tener IC angostos con una alta confianza. Obtención de un ICSuponga que 1 nX , ,X… es una m.a de una distribución con parámetro θ desconocido. Suponga

que se puede encontrar un estimador de θ , θ̂ es cual es una función de la muestra. Digamos ( )1 n

ˆ h X , ,X…θ = NO depende de θ ni de otros parámetros desconocidos.

Para ( )0 1,α∈ dado, podemos encontrar constantes a y b tal que

( )( )1 1nP a h X , ,X ; b…< θ < = −α .

Suponga que es posible despejar a θ de esta desigualdad y obtener ( ) ( )( )1 1 1n nP l X , ,X u X , ,X… …< θ < = −α

( )1 nl X , ,X… y ( )1 nu X , ,X… son los límites de confianza y para una muestra particular se

obtiene el intervalo de confianza ( )l , u al IC al ( )100 1 %− α para θ .

Page 2: Intervalos de Confianza

Usando Bootstrap

Sea θ̂ un estimador puntual para θ . La distribución de θ̂ depende de θSi θ̂ es insesgado para θ , sabemos que ˆE θ = θ y por lo tanto un estimador de θ sería

θ̂ = θ (media Muestral). Usando este hecho un IC al %95 para θ puede ser ( )l , u , donde ˆ ˆl Percentil . de= θ − θ − θ= θ − θ − θ= θ − θ − θ= θ − θ − θ97 5 ˆ ˆu Percentil . de= θ − θ − θ= θ − θ − θ= θ − θ − θ= θ − θ − θ2 5

Pues (((( ))))ˆP Percentil . Percentil . .< θ − θ < ≈< θ − θ < ≈< θ − θ < ≈< θ − θ < ≈2 5 97 5 0 95

Suponga que 1 nX , ,X… es una m.a de (((( ))))f x ;θθθθ , θθθθ desconocido. De esta muestra obtenemos

θ̂ = θθ = θθ = θθ = θ 0 . Se generan m muestras de tamaño n de la distribución (((( ))))f x ;θθθθ 0 .

Calculamos mˆ ˆ ˆ, , ,∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗θ θ θθ θ θθ θ θθ θ θ1 2 … de cada muestra y ∗∗∗∗θθθθ . Calcule m

ˆ ˆ ˆ, , ,∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗ ∗ ∗θ − θ θ − θ θ − θθ − θ θ − θ θ − θθ − θ θ − θ θ − θθ − θ θ − θ θ − θ1 2 … ysobre estos m valores calcule los Percentiles .2 5 y .97 5 .

El IC bootstrap al %95 para θθθθ será

(((( ))))ˆ ˆ ˆ ˆPercentil . de , Percentil . de∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗ ∗θ − θ − θ θ + θ − θθ − θ − θ θ + θ − θθ − θ − θ θ + θ − θθ − θ − θ θ + θ − θ97 5 2 5

Intervalos de Confianza para MediasSupongamos que 1 nX , ,X… es una m.a de una población normal (((( ))))n ,µ σµ σµ σµ σ 2 con media µ

desconocida y varianza 2σ conocida.

Sabemos que (((( ))))X n ,n

− µ− µ− µ− µσσσσ

0 1∼

Hallemos L y U tales que (((( ))))P L M , dado< µ < = − α α< µ < = − α α< µ < = − α α< µ < = − α α1(((( )))) (((( ))))

(((( ))))

P L M P M L

X M X X LP X M X X L Pn n n

< µ < = − < −µ < − = − α ⇔< µ < = − < −µ < − = − α ⇔< µ < = − < −µ < − = − α ⇔< µ < = − < −µ < − = − α ⇔

− − µ −− − µ −− − µ −− − µ −

− < − µ < − = < < = − α− < − µ < − = < < = − α− < − µ < − = < < = − α− < − µ < − = < < = − α σ σ σσ σ σσ σ σσ σ σ

1

1

Z Z

X X LP Zn n

− µ −− µ −− µ −− µ − < < = − α< < = − α< < = − α< < = − α

σ σσ σσ σσ σ 1 2

1

����� �����

Page 3: Intervalos de Confianza

( )( )

1

2

2 1 2 21 2 2 2

12

21 2

P Z Z

P Z Z

TambiénZ Z y Z Z Z Z Z

Z Z

α α α−

α

α< =

α< ≅ −

= = − = =

= −

Así 2

L X Znα

σ= − y2

M X Znα

σ= + . Con esto intervalo de confianza al ( )100 1 %− α para µ

es

2x Z

nασ± ó

2 2x Z , x Z

n nα α

σ σ − +

Ejemplo: Se sabe que la duración en horas de un foco de 75 watts es una v.a con distribución aproximadamente normal, con una desviación estándar de 25 horas. Una m.a de 20 focos permite obtener una duración promedio de 1014 horas. Construya un I.C al %95 para µµµµ , para la duración media de estos focos. Solución: Supongamos que 1 20X , ,X… es una m.a que representa las duraciones de los 20 focos,

cada ( )625 1 2 20iX n , , i , , ,µ =∼ … .

Se sabe que 1014x = . Un I.C al ( )100 1 %− α para µ es

( ) ( ) ( )0 025 0 025

2

25 251014 1 96 1014 1 96 1014 10 957

20 20

. .x Z Z donde Z . . .nα

σ± ⇔ ± = ∴ ± ⇔ ±

( )1003 043 1024 957. , .⇔La duración media real estará en este intervalo con una confianza del %95

Suponga que deseamos saber cuál debería ser el tamaño de la muestra para que el error de estimación absoluto sea inferior a 5 horas, con una confianza del %95 en este caso, se quiere

halla n para el cuál (((( )))) (((( ))))XP X . P . P Z z .n n

− µ− µ− µ− µ − µ < = ⇔ < = ⇔ < =− µ < = ⇔ < = ⇔ < =− µ < = ⇔ < = ⇔ < =− µ < = ⇔ < = ⇔ < = σσσσ

55 0 95 0 95 0 9525

n nzn

= = == = == = == = =5 525 25 5

( ) 0 975

1 96 9 8 96 045

96

P Z z .

nz . n . n .

n

≤ = ∴

= = ∴ = ⇒ =

Page 4: Intervalos de Confianza

Pero que pasa si la muestra no proviene de una normal? En este caso sabemos que si n es

grande, el tamaño de la muestra, entonces (((( ))))X n ,n

− µ− µ− µ− µσσσσ

0 1∼ .

Por el T.C.L sabemos que (((( ))))X n ,n

− µ− µ− µ− µσσσσ

0 1∼ y XP . .n

− µ− µ− µ− µ < =< =< =< = σσσσ

1 96 0 975 y XP . .n

− µ− µ− µ− µ < − =< − =< − =< − = σσσσ

1 96 0 025

Así .nσσσσ1 96 es el percentil .97 5 y .

nσσσσ

−−−−1 96 es el percentil .2 5 de la distribución de X − µ− µ− µ− µ .

Así P . X . .n nσ σσ σσ σσ σ

− < − µ < ≈− < − µ < ≈− < − µ < ≈− < − µ < ≈ 1 96 1 96 0 95

Así, un IC aproximado al ( )100 1 %− α para µµµµ es

2 2x Z , x Z

n nα α

σ σ − +

Si además σσσσ 2 es desconocida y n es grande, esta puede ser estimada usando S 2 . Así, un IC

aproximado al ( )100 1 %− α para µµµµ seria 2

Sx Znα±

Ejemplo: Un ingeniero civil analiza la resistencia a la compresión del concreto. De una m.a de 49 especimenes se obtuvo una resistencia promedio de 3250 psi y una desviación estándar de 31.62 psi. Construya un I.C al 95% y al 99% para la resistencia media a la compresión para este concreto. Solución: Suponga que 1 49X , ,X… una m.a que representa las resistencias a la compresión de 49

especimenes de este concreto y suponga que iE X = µ y 2 1 49iV X , i , , = σ = … .

Un I.C al ( )100 1 %− α para µµµµ es 2

x Z aproximadonα

σ±

Como 2σ es desconocida, entonces un IC aproximado al ( )100 1 %− α para µµµµ es 2

Sx Znα±

Como (((( ))))X , S . n= = == = == = == = =223250 31 62 49

Si . Z .ααααα = ⇒ =α = ⇒ =α = ⇒ =α = ⇒ =2

0 05 1 96 y así, un IC al 95% para µµµµ es (((( )))) (((( )))). .X . X± ⇔ ±± ⇔ ±± ⇔ ±± ⇔ ±

1 96 31 6251 9649 49

(((( )))). . , .± ⇔± ⇔± ⇔± ⇔3250 8 854 3241 146 3258 854Si .. Z Z .ααααα = ⇒ = =α = ⇒ = =α = ⇒ = =α = ⇒ = =0 005

20 01 2 58 . Un I.C al 99% para µ es

( )( ) ( )2 58 31 523250 3250 11 65 3238 35 3261 65

49. .

. . , .

± ⇔ ± ⇔

.

Ejemplo: Se piensa que la concentración de ingrediente activo de un detergente líquido para ropa, es afectada por el tipo de catalizador utilizado en el proceso de fabricación. Se sabe que la desviación estándar de la concentración activa es 3g l , sin importar el tipo de catalizador

Page 5: Intervalos de Confianza

utilizado. Se realizan 36 observaciones con cada catalizador y se obtiene los siguientes resultados: Catalizador 1: Concentración Media 65.22, 36 mediciones Catalizador 2: Concentración Media 68.42, 36 mediciones a) Encuentre un I.C al 95% para la diferencia entre las medias de las concentraciones activas para los dos catalizadores. b) ¿Existe alguna evidencia que indique que las concentraciones activas madis dependen del catalizador utilizado? Solución: Suponga que 1 36X , ,X… es una m.a de concentraciones activas usando el catalizador

uno, suponga que además que 1iE X = µ y 2 9iV X = σ = . Suponga adicionalmente que

1 36Y , ,Y… es otra m.a de concentraciones activas usando el catalizador dos, 2

2 2 9j jE Y , V Y = µ = σ = ; ambas m.a independientes entre si

1

2

65 22 3 444 36

68 42 2 224 36

x . , S . , n

y . , S . , m

= = =

= = =

a) Un I.C al 95% para 1 2µ − µ es 2 2

1 20 025.x y Z

n mσ σ

− ± +

Un I.C al 95% para 1 2µ − µ es 1 96 1 963 2 3 22 2. .. , . − − − +

( ) 1 24 586 1 386. , . " "− − µ < µ

b) Como 0 ∉ I.C ⇒ con una confianza del 95% podemos afirmar que 1 2µ − µ ≈ 10 ∴ µ ≈ 2µ .

Si dependen del catalizador usado. Si el tamaño de la muestra es pequeño el T.C.L no garantiza necesariamente una buena aproximación. Suponga que 1 nX , ,X… es una m.a de una distribución con media 1µ y varianza 2

1σ Si n es

pequeño X

n

− µσ

no está muy cerca de una normal estándar en general.

Si ( )21iX n ,µ σ∼ entonces ( )1

1

Xn 0,1

n

− µσ

∼ , pero si 2σ es desconocida ( )X t n 1Sn

− µ−∼ .

En este caso un I.C al ( )100 1 %− α para µ , se obtiene de manera similar a los casos anteriores

y estará dado por ( ) ( )1 1

2 2

n nS Sx t , x tn n

− −α α

− +

.

Ejemplo: La dirección de una clínica desea estimar el número de días de estancia promedio necesarios para el tratamiento de pacientes entre 25 y 34 años. Una m.a de 15 pacientes arrojó una media de 5.4 días y una desviación estándar de 3.1 días.

Page 6: Intervalos de Confianza

Halle un I.C al 95% para el número de días de estancia promedio. Solución: Suponga que 1 15X , ,X… es una m.a de tiempos en días para los 15 pacientes. Asuma

( )2 1 2 15iX n , , i , , ,µ σ =∼ … .De la información Muestral se sabe que

5 4 3 1 15x . , S . , n= = = .

Un I.C al 95% para µ es ( ) ( ) ( )14 140 025 0 025

3 15 4 2 145

15. .

.. t , t .± = .

Un I.C al 95% para µ es ( )3 683 7 117. , . .

Ejemplo: Una máquina produce varillas de metal utilizadas en el sistema de suspensión de un automóvil. Se toma una m.a de 15 varillas y se miden sus diámetros. Asuma que los diámetros de las varillas tienen una distribución normal. Halle un I.C al 95% para el diámetro promedio real de la varilla. 8.24 8.21 8.23 8.25 8.26 8.23 8.20 8.26 8.19 8.23 8.20 8.28 8.24 8.25 8.24 Solución: Suponga que 1 15X , ,X… es una m.a de variables aleatorias que representa los

diámetros de las 15 varillas. ( )2 1 2 15iX n , , i , , ,µ σ =∼ … .8 234 0 0253 15x . , S . , n= = = .

Un I.C al 95% para µ es ( ) ( )140 025

0 02538 234

15.

.. t± o sea ( )8 22 8 248. , . .

IC para proporciones

Sea X el número de éxitos en una muestra aleatoria de n individuos u objetos, con probabilidad de éxito p desconocida. Si p es constante ó el tamaño de n es pequeño comparado con el

tamaño de la población, entonces (((( ))))

(((( ))))X n p n ,n p p

−−−−

−−−−0 1

1∼

Un estimador puntual para p es Xp̂n

==== : fracción Muestral de éxitos. Ahora

(((( )))) (((( )))) (((( ))))

(((( ))))(((( ))))

X Xn p pX n p n nn p p n p p p p

np̂ p n ,

p pn

−−−− −−−− −−−− = == == == =− − −− − −− − −− − −

−−−−====−−−−

1 1 1

0 11

Hallemos L y U tales que (((( ))))P L P U , dado< < = − α α< < = − α α< < = − α α< < = − α α1

Page 7: Intervalos de Confianza

(((( )))) (((( )))) (((( ))))

(((( )))) (((( )))) (((( ))))

(((( )))) (((( ))))

ˆ ˆ ˆP L P U P U P L P p U p p p L

ˆ ˆ ˆp U p p p L Pp p p p p p

n n n

ˆ ˆp U p L P Zp p p p

n n

< < = − < − < − = − < − < −< < = − < − < − = − < − < −< < = − < − < − = − < − < −< < = − < − < − = − < − < −

− − −− − −− − −− − −= < <= < <= < <= < <

− − −− − −− − −− − − − −− −− −− −

≈ < < ≅ − α≈ < < ≅ − α≈ < < ≅ − α≈ < < ≅ − α − −− −− −− −

1 1 1

11 1

(((( ))))p̂ U Z

p pn

αααα

−−−−∴ = −∴ = −∴ = −∴ = −

−−−− 21y

(((( )))) (((( ))))ˆ ˆp L p pZ P Z Z

p p p pn n

α α αα α αα α αα α α

− −− −− −− −= ∴ − < < ≈ − α= ∴ − < < ≈ − α= ∴ − < < ≈ − α= ∴ − < < ≈ − α

− −− −− −− −

2 2 21

1 1

de aquí (((( ))))p̂ p Z

p pn

αααα

−−−− <<<<−−−− 21

entonces despejando a p

(((( ))))(((( ))))

(((( ))))

Z Zp̂ p ˆ ˆZ p p p pp p n n

n

Z Z Zˆ ˆ ˆp p p

n n np

Z

n

Z Zˆ ˆp pp̂ Zn n n n

pZ

n

α αα αα αα α

αααα

α α αα α αα α αα α α

αααα

α αα αα αα α

αααα

αααα

−−−− = ⇔ + − + + == ⇔ + − + + == ⇔ + − + + == ⇔ + − + + =−−−−

+ ± + − ++ ± + − ++ ± + − ++ ± + − + ∴ =∴ =∴ =∴ =

++++

+ ± − ++ ± − ++ ± − ++ ± − +

==== ++++

2 222 2 22 2

2

22 2 2

22 2 2

2

2

2 22

22 22

2

2

2

1 2 01

2 2 4 1

2 1

22 4

1

(((( ))))Z Zˆ ˆp pp̂ Z

n n npZ

n

α αα αα αα α

αααα

αααα

−−−−+ ± ++ ± ++ ± ++ ± +

==== ++++

2 2

2 22

22

2

12 4

1

Así, un I.C al ( )100 1 %− α para p es

Page 8: Intervalos de Confianza

(((( ))))Z Zˆ ˆp pp̂ Z

n n nZ

n

α αα αα αα α

αααα

αααα

−−−−+ ± ++ ± ++ ± ++ ± +

++++

2 2

2 22

22

2

12 4

1

Si n es grande entonces Z Z Z

, yn n nα α αα α αα α αα α α2 2 2

2 2 222 4

son muy pequeños (tienden a cero entonces

obtenemos el I.C (((( ))))p pp̂ Z nαααα−−−−± →± →± →± →

2

1 tradicional I.C para p .

El primer intervalo se acerca más al valor real de confianza del ( )100 1 %− α que el segundo. Ejemplo: Se lleva a cabo un estudio para determinar la efectividad de una vacuna contra la gripe. Se administra la vacuna a una muestra aleatoria de 3000 sujetos y 13 contraen gripe. Obtenga un I.C al %95 para la proporción real de individuos vacunados que contraen la gripe. Solución: En este caso .α =α =α =α = 0 05 y . Z .αααα

αααα = == == == =2

0 025 1 962Un I.C al %95 para p es

(((( ))))Z Zˆ ˆp pp̂ Z

n n n p̂ ; nZ

n

α αα αα αα α

αααα

αααα

−−−−+ ± ++ ± ++ ± ++ ± +

= == == == = ++++

2 2

2 22

22

2

1132 4 30003000

1

(((( ))))

(((( ))))

(((( )))). ..

.

−−−−

+ ± ++ ± ++ ± ++ ± +

++++

2 22

2

2

13 3000 1313 1 96 1 9630001 96 30003000 2 3000 4 3000

1 9613000

(((( ))))

(((( ))))

. . . ..

. . .p̂ .

.. .. .. , ..

± +± +± +± +

±±±±====

⇔ ±⇔ ±⇔ ±⇔ ±±±±±⇔⇔⇔⇔

0 0049736 1 96 0 0000014382 0 000000106711 001281

0 0049736 1 96 0 00000124390 004333

1 0012810 004967 0 0024350 0049736 0 0024380 002532 0 0074021 001281

Con el método tradicional, un I.C al %95 para p es

Page 9: Intervalos de Confianza

(((( ))))

(((( ))))

ˆ ˆp pp̂ Z n

.

. . .

. . . , .

αααα−−−−± ⇔± ⇔± ⇔± ⇔

−−−− ± ⇔± ⇔± ⇔± ⇔

±±±±± ⇔± ⇔± ⇔± ⇔

2

1

13 1313 3000 30001 96 300030000 004333 1 96 0 00000143820 004333 0 002351 0 001982 0 006684

Ejemplo: En una muestra de 85 soportes para el cigüeñal de un motor de automóvil, 10 tienen un terminado que es más rugoso de lo que las especificaciones permiten. Una estimación de l proporción de soportes en la población que exceden la especificación de rugosidad es

xp̂ .n

= = == = == = == = =10 0 1285

. Un I.C al %95 para p es

(((( ))))Z Zˆ ˆp pp̂ Z

n n n Z . ; nZ

n

α αα αα αα α

αααα

αααααααα

−−−−+ ± ++ ± ++ ± ++ ± +

= == == == = ++++

2 2

2 22

22 22

14 1 96 85

1

(((( ))))(((( )))) (((( ))))

(((( ))))

(((( ))))

. .. .. .

.

. .. .. , ..

+ ± ++ ± ++ ± ++ ± +

⇔⇔⇔⇔

++++

⇔ ±⇔ ±⇔ ±⇔ ±±±±±⇔⇔⇔⇔

2 2

2

2

0 12 0 881 96 1 960 12 1 962 85 85 4 85

1 96185

0 1581 0 06960 1652 0 07270 0885 0 22771 0452

Tradicional (((( ))))ˆ ˆp pp̂ Zn αααα−−−−±±±±

2

1

(((( )))) (((( )))) (((( )))) (((( )))). .. .

. .. , .

±±±±± ⇔± ⇔± ⇔± ⇔

0 12 0 06910 12 0 880 12 1 96

0 0509 0 189185

Intervalos de confianza basados en una población Normal

Sea nX , , X1 … una muestra aleatoria de una distribución con media µµµµ y varianza σσσσ 2 . Si n es

grande, sabemos que (((( )))) (((( )))) (((( ))))SX n , T . C . Ln

− µ− µ− µ− µ

0 1∼

Si n es pequeño dicha aproximación ya no es tan adecuada. Cuando n es pequeña S 2 puede no estar tan cerca de σσσσ 2 y por lo tanto la dispersión de la

distribución de (((( ))))X

Sn

− µ− µ− µ− µ

será mayor que la de una normal estándar.

Page 10: Intervalos de Confianza

Si suponemos que (((( ))))iX n ,µ σµ σµ σµ σ 2∼ , entonces (((( ))))X

Sn

− µ− µ− µ− µ

tiene una p.d.f llamada Distribución t con

n −−−−1 grados de libertad (gl)

Escribimos (((( )))) (((( ))))X

T t nS

n

− µ− µ− µ− µ= −= −= −= −

1∼

En general diremos que una v.a (((( ))))T t v∼ si su p.d.f es de la forma

(((( ))))(((( ))))vv

ttf t ;v vvv

++++−−−−

++++ ΓΓΓΓ ∈∈∈∈ = += += += + >>>> Γ πΓ πΓ πΓ π

12 2

12 1

02

R

La forma de esta distribución es similar a la normal pero con colas más alargadas. Es simetrica respecto a t ==== 0 . Se puede mostrar que

[[[[ ]]]] [[[[ ]]]] vE T y V T ; vv

= = >= = >= = >= = >−−−−

0 22

Si (((( ))))T t v∼ , el valor (((( ))))t vαααα representa el valor real que deja un área a derecha de αααα

(((( ))))(((( ))))P T t v , dadoαααα> = α α> = α α> = α α> = α α . (((( ))))t vαααα es llamado un cuantil de la distribución t

Usando un procedimiento análogo para hallar un I.C al ( )100 1 %− α para µµµµ , se tiene que un I.C

al ( )100 1 %− α para µµµµ es (asumiendo una población normal)

(((( )))) SX t nnαααα± −± −± −± −

21

Ejemplo: La dirección de una clínica desea estimar el número de días de estancia promedio necesarios para el tratamiento de pacientes entre 25 y 34 años. Una m.a de 15 pacientes arrojó una media de 5.4 días y una desviación de 3.1 días. Halle un I.C al %95 para el número promedio de días de estancia. Solución: Suponga que X , , X1 15… es una m.a de tiempos en días, para los 15 pacientes. Asuma

que cada (((( ))))iX n , ; i , , ,µ σ =µ σ =µ σ =µ σ =2 1 2 15∼ …

Sabemos que X . , S . , n= = == = == = == = =5 4 3 1 15

Un I.C al %95 para µµµµ es (((( )))) SX t nnαααα± −± −± −± −

21 donde .α =α =α =α = 0 005 . Así, (((( )))).t .====0 025 14 2 145 .

Con esto un I.C al %95 para µµµµ es: (((( )))) (((( )))) (((( )))).. . . , .± ⇔± ⇔± ⇔± ⇔

3 15 4 2 145 3 683 7 117

15

Page 11: Intervalos de Confianza

Ejemplo: Una máquina produce varillas de metal utilizadas en el sistema de suspensión de un automóvil. Se toma una m.a de 15 varillas y se miden sus respectivos diámetros. Asuma que los diámetros de las varillas se distribuyen normalmente. Los diámetros registrados son: 8.24 8.21 8.23 8.25 8.26 8.23 8.20 8.26 8.19 8.23 8.20 8.28 8.24 8.25 8.24 Estime el diámetro promedio real de este tipo de varillas y establezca un I.C al %95 para dicho parámetro. Solución: Suponga que X , , X1 15… es una m.a que representan los diámetros de estas 15

varillas, (((( ))))iX n , ; i , , ,µ σ =µ σ =µ σ =µ σ =2 1 2 15∼ … . De la información registrada se tiene que

X . S . . n= = ≈ == = ≈ == = ≈ == = ≈ =8 234 0 02529 0 0253 15 .

Un estimador para µµµµ es X .==== 8 234 y un I.C al %95 para µµµµ es de la forma (((( )))).SX t

n±±±± 0 025 14

(((( )))).t .====0 025 14 2 145 . Así un I.C al %95 para µµµµ es (((( )))). , .8 220 8 248Con una confianza del %95 se espera que el diámetro medio de este tipo de arillas esté en este rango Intervalos de confianza para diferencia de medias

Suponga que nX , , X1 … es una m.a de una población con media 1µ y varianza 21σ y sea

mY , , Y1 … otra m.a, independiente de la anterior, de una población con media 2µ y 22σ . ¿Cómo

hallar un I.C al ( )100 1 %− α para 1 2µ −µ ?

Debido a que ambas muestras son E.I entonces X y Y también son E.I.

Además E X Y y V X Yn m

σ σσ σσ σσ σ − = µ − µ − = +− = µ − µ − = +− = µ − µ − = +− = µ − µ − = +

2 21 2

1 2

Por el T.C.L (((( ))))� (((( ))))

X Y aproxn ,

n . m grandesn m

− − µ − µ− − µ − µ− − µ − µ− − µ − µ

σ σσ σσ σσ σ++++

1 2

2 21 2

0 1

Si σσσσ 21 y σσσσ 2

2 no son conocidas, se pueden estimar usando S 21 y S 2

2 . Así, cuando n y m son

grandes (((( ))))

� (((( ))))X Y aprox

n ,

n m

− − µ − µ− − µ − µ− − µ − µ− − µ − µ

σ σσ σσ σσ σ++++

1 2

2 21 2

0 1

Un I.C al ( )100 1 %− α para 1 2µ −µ será de la forma

S SX Y Z

n mαααα− ± +− ± +− ± +− ± +2 21 2

2“Aproximado”

Si n y m son pequeños y las poblaciones son normales, la distribución es exacta (siempre y cuando 2

1σ y 22σ sean conocidas). El I.C en este caso se obtiene similar pero usando 2

1σ y 22σ .

Pero si las varianzas son desconocidas y los tamaños muestrales pequeños, el I.C en este caso

Page 12: Intervalos de Confianza

se obtiene similar pero usando 21σ y 2

2σ . Pero si las varianzas son desconocidas y los tamaños muestrales pequeños, el I.C anterior no es adecuado. Se hace necesario el supuesto de normalidad Ejemplo: En un proceso químico pueden emplearse dos catalizadores 1 y 2. Se sospecha que el catalizador 2 podría tener en promedio mejor rendimiento que el catalizador 1. Para verificar esta afirmación, se prepararon 36 lotes con el catalizador 1 y 49 lotes con el catalizador 2. Para el primer lote el rendimiento promedio fue 86 con una desviación estándar de 3. Para el segundo lote se obtuvo un rendimiento medio de 89 y una desviación estándar de 2. Use un I.C al %95 para verificar las sospechas. Solución: Sea X , , X1 36… los rendimientos usando el catalizador 1 y sea Y , , Y1 49… los rendimientos usando el catalizador 2. Ambas m.a son E.I. Ahora X Y−−−− es un estimador puntual de la diferencia real. Suponga que

i X i X

j Y j Y

E X y V X

E Y y V Y

= µ = σ= µ = σ= µ = σ= µ = σ = µ = σ= µ = σ= µ = σ= µ = σ

2

2

X YE X Y

X Y es insesgado

− = µ − µ− = µ − µ− = µ − µ− = µ − µ −−−−

Un I.C aproximado al ( )100 1 %− α para X Yµ − µµ − µµ − µµ − µ es

X YS SX Y Z αααα− ± +− ± +− ± +− ± +

2 2

2 36 49, pues � (((( ))))

X Y

aproxX Y n ,S S

n m

−−−−

++++2 2

0 1 X YX , S , Y , S= = = == = = == = = == = = =86 3 89 2

. Z .ααααα = ⇒ =α = ⇒ =α = ⇒ =α = ⇒ =2

0 05 1 96

Un I.C aproximado al %95 para X Yµ − µµ − µµ − µµ − µ es

(((( ))))(((( )))) X Y

. .

. . .

. , . I.C aproximado al 95% para

− ± + ⇔ − ±− ± + ⇔ − ±− ± + ⇔ − ±− ± + ⇔ − ±

⇔ − ± ⇔ − ±⇔ − ± ⇔ − ±⇔ − ± ⇔ − ±⇔ − ± ⇔ − ±

− − µ − µ− − µ − µ− − µ − µ− − µ − µ

9 4 6586 89 1 96 3 1 9636 49 196

3 1 96 0 5758 3 1 128

4 128 1 872

Se concluye con una confianza del %95 que X Y Y Xµ − µ < ⇔ µ > µµ − µ < ⇔ µ > µµ − µ < ⇔ µ > µµ − µ < ⇔ µ > µ0 . Mejor rendimiento promedio los catalizadores tipo 2. Ejemplo: Se hicieron de resistencia a la tensión a dos tipos distintos de varilla para alambres y se obtuvieron los siguientes datos

Grado Tamaño muestra Media desv. stanAISI 1064 n =129 107.6 1.3 AISI 1078 m =129 123.6 2.0

Indican estos datos que la resistencia promedio real del grado 1078 es mayor que la del grado 1064 en más de kg / m m210 ? Comente.

Page 13: Intervalos de Confianza

Solución: Suponga que X , , X1 129… es una m.a que representa las resistencias de 129 varillas

grado 1078 y además que i X i XE X y V X ; i , , , = µ = σ == µ = σ == µ = σ == µ = σ = 2 1 2 129…

Adicionalmente sea Y , , Y1 129… otra m.a que representa las resistencias de 129 varillas grado

1064 con j Y j YE Y y V U ; j , , , = µ = σ == µ = σ == µ = σ == µ = σ = 2 1 2 129…

Ambas m.a son estadísticamente independientes entre si. Queremos verificar si Y X X Yµ > µ + ∴ µ − µ >µ > µ + ∴ µ − µ >µ > µ + ∴ µ − µ >µ > µ + ∴ µ − µ >10 10Un I.C al %95 para X Yµ − µµ − µµ − µµ − µ es

(((( ))))

(((( ))))

X Y.

Z .S SX Y Z

.

.. . .

. . .

αααα ====− ± + ⇔− ± + ⇔− ± + ⇔− ± + ⇔

α =α =α =α =

− ± + ⇔− ± + ⇔− ± + ⇔− ± + ⇔

± ⇔ ±± ⇔ ±± ⇔ ±± ⇔ ±

2 22

0 025

2 2

1 96

129 129 0 05

20 1 3123 6 107 6 1 96129 129

16 1 96 0 21 16 0 4116

Un I.C al %95 para X Yµ − µµ − µµ − µµ − µ es (((( )))). , .15 59 16 41

Observe que con una confianza del %95 X Yµ − µ >µ − µ >µ − µ >µ − µ > 0 . Es decir el grado 1078 tiene una resistencia promedio superior a la del grado 10 64 en mas de kg / m m210 ?Un I.C al %99 para X Yµ − µµ − µµ − µµ − µ es (((( )))). , .15 46 16 54 , la conclusión es igual.

Muestras Pequeñas.

Suponga que se tiene una m.a 1 nX , ,X… de una distribución ( )21n ,µ σ y que 1 mY , ,Y… es otra

m.a de una distribución ( )22 2n ,µ σ y ambas m.a son independientes entre sí.

Si 21σ y 2

2σ son conocidas, no hay problema, el I.C para 1 2µ − µ es similar al hallado antes; pero

si 21σ y 2

2σ son desconocidas y n y m son pequeños, debemos usar la distribución t. Caso 1: 2 2

1 2σ = σ pero desconocidas.

Un I.C al ( )100 1 %− α para 1 2µ − µ es de la forma

( ) ( )

( ) ( ) ( ) ( ) ( ) ( ) ( )

2 2

2 2

2 2 2 21 2 1 22 2 2

2 2 2 21 2 1 2

1 1 1 1

1 1 1 11 1

con

n m n mp px y t S , x y t Sn m n m

n S m S n S m SX n , X m X v ;

v n

+ − + −α α

− − + − + +

− − − −

− − ⇒ +σ σ σ σ

=

∼ ∼ ∼

2m+ −

y( ) ( )1 2 2 2 2

1 22 21 2

0 1X Y

n , si

n m

− − µ − µ⇒ σ = σ = σ

σ σ+

Page 14: Intervalos de Confianza

Entonces

( )

( ) ( )( )

( )1 2

1 2

2 21 2

2

1 1

1 11 12

p

X Y

X Yn mTn S m S S

n mn m

− − µ − µ

σ + − − µ − µ= =

− + − +σ + −

, con ( ) ( )2 2

1 22 1 12p

n S m SS

n m− + −

=+ −

.

Caso 2: Si 2 21 2σ ≠ σ

( ) � ( )1 2

2 21 2

X YT aprox t v

S Sn m

∗− − µ − µ

=

+

, Con

22 21 2

2 22 21 2

2

1 1

S Sn m

V .S Sn mn m

+

= − +

+ +

I.C al ( )100 1 %− α para 1 2µ − µ es ( )2 2

1 2

2

v S Sx y t

n mα− ± + .

Ejemplo: Se investiga el diámetro de las varillas de acero fabricadas en dos diferentes máquinas de extrusión. Para ello se toman dos m.a de tamaños 14n = y 18m = . Las medias y varianzas muestrales son 2 2

1 28 73 0 35 8 68 y 0 4x . , S . , y . S .= = = = .Construya un I.C bilateral al 95% para la diferencia en los diámetros promedios de la varilla. Si: a) 2 2

1 2σ = σ

b) 2 21 2σ ≠ σ

Solución: Suponga que 1 15X , ,X… es una m.a de diámetros de varillas de la máquina 1 y sea

1 18Y , ,Y… otra m.a de diámetros de varillas de la maquina 2. Suponga además que

( ) ( )2 21 1 2 2i jX n , , Y n ,µ σ µ σ∼ ∼ .

2 21 28 73 0 35 14 8 68 0 4 y 18x . , S . , n , y . , S . , m= = = = = = .

a) Un I.C al 95% para 1 2µ − µ es ( )0 0251 18 73 8 68 30

14 18. p. . t S− ± + .

( )2 2

1 220 025

13 170 3783 0 0615 30 2 042

30p p .

S SS . S . t .

+= = ∴ = = .

Un I.C al 95% para 1 2µ − µ es ( )0 05 0 447 0 397 0 497. . . , .± ⇔ −

b) Un I.C al 95% para 1 2µ − µ es ( )2 2

1 20 0258 73 8 68

14 18.

S S. . t v− ± +

( )26 91 27 0 05 2 052 0 217v . v . . .= ≅ ±

( )0 05 0 446 0 396 0 496. . . , .± − muy similar.

Page 15: Intervalos de Confianza

Intervalo de Confianza para Varianza

Suponga que 1 nX , ,X… es una m.a de una distribución normal con media 1µ y varianza 21σ

desconocida. Sean L y M variables aleatorias tal que ( )2

1 1P L M ,< σ < = − α α dado

( ) ( ) ( )2 2 21 1 1

2 21 1

1 1 11 1 1 1 1n S n S n S

P , PM L M L

− − −< < = − α ⇔ < < = − α σ σ

( )( )( ) ( )

21 2

2 21 21 2 2

1 1

1 1

P X X n X

X X n , X X nα α−

< − < = − α

= − = −

Un I.C al ( )100 1 %− α para 21σ es

( )( )

( )( )

2 21 1

2 212 2

1 11 1

n S n SX n X nα α−

− −<

− −

Suponga que 1 mY , ,Y… es otra m.a de una distribución normal con media 2µ y varianza 22σ

desconocida. Ambas m.a independientes entre sí

Sabemos que ( )2 2

1 22 2

2 1

1 1S

f n , mS

σ− −

σ∼ . Así, un I.C al ( )100 1 %− α para

222

1

σ

σes

( ) ( )2 2

1 12 2

22 22

1 1 11 1

S S, f m , n

S f n , m S αα

− − − −

.

Ejemplo: Para los datos del ejemplo anterior, halle un I.C al 95% para 2

12

2

σσ

.

Solución: 2 2

1 20 05 8 73 0 35 8 68 0 4

14 18

. , x . , S . , y . , S .

n m

α = = = = =

= =

( ) ( )( ) ( )0 025 0 025 0 02513 17 aproximado a 12 17 2 82 17 13 3 00. . .f , f , . , f , .= =

valores exactos ( ) ( )0 025 0 02513 17 2 78625 17 13 3 003885. .f , . , f , .= =

Usando los valores interpolados de la tabla un I.C al 95% para 2

12

2

σ

σes ( )0 35 1 0 35 3

0 4 2 82 0 4. .,. . .

o

sea ( )0 310 2 625. , . .

Con los valores exactos es ( )0 314 2 628. , . , muy similar!