2�6 Estadística y probabilidad
10.1.1 Estimación puntual
Unestimadoresunelementodescriptivobasadoenlasmedicionescontenidasenunamuestra.Porejemplo,lamediadelamuestra
xn
xii
n=
=∑1
1
es un estimador puntual para la media de la población µ0.Supóngasequesequiereobtenerunainferenciarespectodelacalificaciónmedia
detodoslosalumnosquecursanlamateriadecálculo,paraestoseanalizaunamuestraaleatoriadediezdeellos,cuyascalificacionesson
8,4,9,9,6,8,2,7,3y6
Mediante el promedio de los datos de una muestra se calcula un valor para elestadísticoX
x = + + + + + + + + + =1
108 4 9 9 6 8 2 7 3 6 6 2( ) .
ConbaseenelvalorcalculadodelestadísticoXsepuedellevaracabounainferenciarespectodelparámetroµ,esdecir,unaestimación puntualdelparámetromediarespectodelascalificacionesdelamateriadecálculo.Enestecasolacalificaciónpromedioes6.2.Engeneral
Dada una población en donde θ es un parámetro, y Θ̂ su estadística correspondiente, se le llama estimador puntual de θ a cualquier valor θ̂ de Θ̂.
Deladefinicióndeestimador puntualnosepuedeesperarquedichovalorrealiceunaestimacióncerteradelparámetro,dehecho,éstatambiéndependedelestadísticoutilizado.Porejemplo,silapoblaciónestudiantildelamateriadecálculotienecalificaciónpromedioµ=6.5,yseconsideraunamuestraalazardetresestudiantesconcalificaciones3,6y6,pararealizarunaestimacióndelparámetro,setiene
x = + + =1
33 6 6 5( )
Esdecir,elestadísticomediadifieredelparámetroen1.5unidades,mientrasqueelestadísticomediana
x = 6,difieredelparámetroensólo0.5.Portanto,conlamuestraanterior,elestadísticomedianaestimamejorelparámetro.
Pero,quépasarásienunasegundamuestraaleatoriadetamañotres,lascalificacionesparalaestimacióndelparámetroresultan4,4,y10,setiene
x = + + =1
34 4 10 6( )
Por tanto, para esta muestra el estadístico media difiere del parámetro en 0.5unidades,mientrasqueelestadístico x = 4,difieredelparámetroen2.5.
Esdecir,conlamuestraanteriorelestadísticomediaestimamejorelparámetro.Portanto,puedeserdeinteresquéestimadorpuntualparaunmismoparámetroesmejorelegir.Larespuestaseencuentraenlassiguientesdefiniciones.
Definición 10.1
2�7Unidad 10 • infErEncia Estadística
El estadístico Θ̂ se llama estimador insesgado del parámetro θ si E(Θ̂)= θ.
DadasX1,X2, . . .,X5 unamuestra aleatoriadeunapoblación cuyadistribución esnormal,conmediaµyvarianzaσ 2,considerandolosestadísticos
T X TX X X
TX X X X X
1 21 2 5
31 2 3 4 5
10 3= =
+ + +=
+ + − +,
y
secompruebacuálessonestimadoresinsesgadosdeµ.Paraverificarquéestimadoressoninsesgados,seemplealadefiniciónylapropiedad
delvaloresperadoenvariablesindependientes
E a X a X a X a E X a E X a E Xn n n n( ) ( ) ( ) ( )1 1 2 2 1 1 2 2+ + + = + + +
ParaelestadísticoT1
E T E X EX X X X X
E X X X X X( ) ( )11 2 3 4 5
1 2 3 4 55
1
5
1
5
= =+ + + +
= + + + + =
EE X E X E X E X E X( ) ( ) ( ) ( ) ( )
( ) ( )
1 2 3 4 5
1
5
1
55
+ + + + =
+ + + + = =µ µ µ µ µ µ µ
SemuestraqueT1esunestimador insesgado.ParaelestadísticoT2
E T EX X X X X
E X X X X X
E
( )
(
21 2 3 4 5
1 2 3 4 5101
10
110
=+ + + +
= + + + + =
XX E X E X E X E X1 2 3 4 51
105
12
) ( ) ( ) ( ) ( ) ( )+ + + + = = ≠µ µ µ
SemuestraqueT2esunestimador sesgado.ParaelestadísticoT3
E T EX X X X X
E X X X X X
E X
( )
( )
31 2 3 4 5
1 2 3 4 5
1
313
13
=+ + − +
= + + − + =
++ + − + = + + − + = =E X E X E X E X( ) ( ) ( ) ( ) ( ) ( )2 3 4 513
13
3µ µ µ µ µ µ µ
Portanto,T3tambiénesunestimador insesgadodelamedia.
Enelejemploanteriorseapreciaqueaunmismoparámetrolepuedencorrespondervariosestimadoresinsesgados.Porconsiguiente,enelestudiodelaestadísticaresultadeinterésconocerelestimadorinsesgadoquetengalamenorvarianza,yaqueentalcasosudistribuciónestámáscercanaalparámetro.
Dado un parámetro θ y un conjunto de estimadores insesgados de él, ˆ , ˆ , , ˆΘ Θ Θ1 2 m , se llama estimador más eficiente de θ al de menor varianza.
Definición 10.2
Definición 10.3
Ejemplo 1
2�� Estadística y probabilidad
DadalamuestraaleatoriadelejemploanteriorX1,X2,...,X5yconsiderandolosestadísticosqueresultaroninsesgadosdeµ,
T X TX X X X X
1 31 2 3 4 5
3= =
+ + − +y
secompruebacuálesmáseficiente.Paraestoseusaladefiniciónylapropiedaddelavarianzaenvariablesindependientes
V a X a X a X a V X a V X a V Xn n n n( ) ( ) ( ) ( )1 1 2 2 12
1 22
22+ + + = + + +
ParaelestadísticoT1
V T VX X X X X
V X X X X X
V X
( )
(
11 2 3 4 5
2 1 2 3 4 551
5
125
=+ + + +
= + + + + =
11 2 3 4 52 2 2 2 21
25
125
5
) ( ) ( ) ( ) ( ) ( )
(
+ + + + = + + + + =V X V X V X V X σ σ σ σ σ
σ 22 215
)= σ
ParaelestadísticoT3
V T VX X X X X
V X X X X X
V X
( )
(
31 2 3 4 5
2 1 2 3 4 5
1
31
3
19
=+ + − +
= + + − + =
)) ( ) ( ) ( ) ( ) ( ) ( )
(
+ + + − +
= + + + + =V X V X V X V X2 3
24 5
2 2 2 2 2119
19
σ σ σ σ σ
5559
2 2σ σ)=
De los cálculos anteriores, resultaque el estadísticoT1 esmás eficientequeT3,puestoque1/5<5/9.
Entrelosparámetrosmáscomunesysusestadísticos,existenlosinsesgadosqueseempleanconmayorregularidad:
Ejercicio 1
1. Dadas X1, X2, X3 y X4 una muestra aleatoria seleccionada de una poblacióndistribuidaen formanormalconmediaµ ydesviaciónestándarσ, considera lossiguientesestimadoresdeµ
TX X X X
11 2 3 4
6=
+ + + T
X X X X2
1 2 3 4
4=
+ + + T
X X X X3
1 2 3 42 3 4
10=
+ + +
ydeterminacuálessoninsesgadosyentreéstoscuálesmáseficiente.
Ejemplo 2
2��Unidad 10 • infErEncia Estadística
2. Lalecturaenunvoltímetroconectadoauncircuitodepruebatieneunadistribuciónuniformeenelintervalode(θ,θ +1),dondeθeselparámetroparaelvoltajedelcircuito. SupónqueX1,X2,X3 yX4 esunamuestra aleatoriade tales lecturas yverificaque ˆ .θ = −X 0 5esunestimadorinsesgado.
3. DadasX1,X2yX3yY1,Y2yY3comomuestrasaleatorias independientesdedospoblacionesconmediasµ1yµ2yvarianzaσ1
2 yσ22,respectivamente
a) compruebaqueX Y− esunestimadorinsesgadodeµ1yµ2 b) calculalavarianzadelestimadorX Y−
10.1.2 Estimación por intervalo
Despuésde iniciadoel estudiode los estimadorespuntuales es lógico suponerque lainferencia realizadamedianteun valorpuntualno es lamás adecuada, yaquepuedevariar considerablemente de muestra en muestra, por tanto, es preferible indicar unintervalo enelque sepueda estimar, con cierto grado de confianza, la localizacióndelparámetroenestudio.
Dada θ como parámetro, supóngase que, bajo ciertas condiciones (como se veráenlassiguientessubsecciones),seencuentraqueθ θ θ∈ ( ˆ , ˆ )i s ,dondelospuntosextremosˆ ˆθ θi sy llamados extremo inferior y extremo superior, respectivamente, dependen del
valor de la estadística Θ̂ para una muestra particular. Como los extremos ˆ ˆθ θi sy delintervalodependendelamuestra,resultaquesólosonvaloresdelasvariablesaleatoriascorrespondientes ˆ ˆΘ Θi sy . Con base en las variables aleatorias anteriores y sus valorescorrespondientes, se calcula la probabilidad de que el parámetro θ se encuentre en elintervaloestablecido.Sesimbolizapor1–αconα∈(0,1)alaprobabilidadmencionada
P i s( ˆ ˆ )Θ Θ< < = −θ α1
Esdecir,setieneunaprobabilidadde1–αdeseleccionarunavariablealeatoriaqueconbaseenunamuestraproduzcaunintervaloquecontengaaθ.
El intervalo anterior en el que se localiza el parámetro θ, ˆ ˆΘ Θi s< <θ , se llama intervalo de confianza de (1 – α)100%; mientras que la fracción 1 – α se le llama coeficiente o grado de confianza y los extremos ˆ ˆθ θi sy , son los límites de confianza inferior y superior, respectivamente.
Porejemplo,setieneunamuestrade20focoscuyaduraciónpromedioenhorases x = 750yconbaseenestevalorseestimaqueelparámetroµpuedeencontrarseconunaprobabilidad1–α,establecidadeantemanoenelintervalodeconfianza(740,760),esdecir
P( )740 760 1< < = −µ α
En las siguientes subsecciones se analizarán los intervalos de confianza máscomunesparalosparámetros,medias,diferencia de medias,varianzasyproporciones.
¿Qué es una estimación por medio de un intervalo?
Definición 10.4
2�0 Estadística y probabilidad
Intervalos de confianza para medias de poblaciones aproximadamente normales
Establecidaslasbasesgeneralesdelosintervalosdeconfianzayutilizandoelteoremadellímitecentral,losconceptossobreestimadorespuntualesylasdistribucionesdeterminadasenlaunidad9,sepresentanmétodosparaelcálculodeintervalosdeconfianza.Unodeestosmétodosserefierealamedia,ysedivideentrescasos:
1. Intervalo de confianza para la media poblacional µ con distribución normal, cuando se conoce σ.
Dada x la media de una muestra aleatoria de tamaño n de una población condistribución aproximadamente normal, de la cual se conoce σ 2, el intervalo deconfianza(1–α)de100%paraµestádadopor
x zn
x zn
−
< < +
α α
σµ
σ
2 2
dondezα/2eselvalordeladistribuciónnormalestándar,aladerechadelcualtieneunáreadeα/2. Sedenotaenestecasoqueparapoderaplicarlafórmula,ladistribucióntienequesernormaloaproximadamentenormalyse debe conocer el parámetro σ.
Una máquina de refrescos está ajustada de tal manera que la cantidad de líquidosuministrado se distribuye en forma normal con desviación estándar de 0.15 dl. Secalcula95%deintervalodeconfianzaparalamediaderefrescosservidosdeunamuestrade36vasostomadaalazarconuncontenidopromediode2.25dl.
Setomanlosdatos:σ=0.15dl,eltamañodelamuestraes36conmediamuestralde x = 2 25. dl.Paracalcularelintervalodeconfianzadelparámetromediaseemplealafórmulaanterior.
Primerosecalculaelvalordezα/2,con1–α=0.95.Delastablasporcentualesparaladistribuciónnormalestándarsetienezα/2=1.96.Portanto,
2 25 1 960 15
362 25 1 96
0 15
36
2 201 2 299
. ..
. ..
. .
−
< < +
< <
µ
µ
Esdecir,con95%deprobabilidadseafirmaqueelparámetromediadellíquidosuministradoporlamáquinaderefrescosseencuentraentre2.201y2.299dl.
2. Intervalo de confianza para la media poblacional µ cuando se desconoce σ en muestras grandes.
Dada x lamediadeunamuestraaleatoriadetamañon(n≥30)tomadaalazardeunapoblacióndelacualseconocesudesviaciónestandar sysedesconoceσ,elintervalodeconfianza(1–α)de100%paraµestádadopor
x zs
nx z
s
n−
< < +
α αµ
2 2
Ejemplo 3
2�1Unidad 10 • infErEncia Estadística
dondezα/2eselvalordeladistribuciónnormalestándar,lacualtieneunáreadeα /2ysesladesviaciónestándarobtenidadelestadísticovarianzainsesgada. Enestecasoesposiblenotarqueparapoderaplicarlafórmula,adiferenciadelanterior,sedesconoce la distribución.
Setieneunamáquinaderefrescoscomoenelejemploanterior,perodelacualsedesconocesudesviaciónestándar.Paraestimarlacantidadpromediodelíquidosuministradoporlamáquinasetomaunamuestraalazarde50vasos,conmediade240mlydesviaciónestándarde20. Se calcula99%de intervalode confianzapara lamediade refrescosservidos.
Setomanlosdatos:eltamañodelamuestraes50, x = 240ys=20ml.Elintervalodeconfianzadelparámetromediaseobtienesustituyendoestosvaloresen la fórmulaanterior.
Secalculaprimeroelvalordezα/2,con1–α=0.99.Delastablasporcentualesparaladistribuciónnormalestándarsetienezα/2=2.575.Portanto,
240 2 57520
50240 2 575
20
50
232 72 247 28
−
< < +
< <
. .
. .
µ
µ
Esdecir,con99%deprobabilidadseafirmaqueelparámetromediadellíquidosuministradoporlamáquinaderefrescosseencuentraentre232.72y247.28ml.
3. Intervalo de confianza para la media poblacional µ cuando se desconoce σ en muestras pequeñas.
Dada x lamediadeunamuestradetamañon(n<30)tomadaalazardeunapoblacióncondistribuciónnormaldelacualseconoces2,ysedesconoceσ 2,elintervalodecon-fianza(1–α)de100%paraµestádadopor
x ts
nx t
s
n−
< < +
α αµ
2 2
dondetα/2eselvalordeladistribución t-Studentconv = n–1gradosdelibertad,lacualtieneunáreadeα/2,yses ladesviaciónestándarobtenidadelestadísticovarianzainsesgada. Sedenotaenestecasoquelaaplicacióndelafórmulasepuederealizarsiladistri-bucióndelapoblaciónesnormaloaproximadamentenormal,peroadiferenciadelcaso1,noseconoceelparámetroσ,ydelcaso2,eltamañodelamuestradebeserpequeño.
Unfabricantedemáquinasderefrescosaseguraquesusmáquinassuministranenpromedio240mlderefresco99.9%deloscasos.Uncompradordecideverificarestosdatos,porloquetomaunamuestraalazarde15vasos,obteniendolossiguientesresultados
243 250 240 248 245 250 238 246 252 247 246 240 250 249 248 240 245 247 238 248 250 252 247 239 245 249 250 248 247 251
Secalculacon99.9%deconfianzasiesválidalaafirmacióndelfabricante.Paraencontrarelintervalodeconfianzasenecesitacalcularlamediaylavarianza
insesgadadelamuestraobtenida: x = 246 27. y sn− =12 17 58. ,esdecir,s=4.19.
Ejemplo 4
Ejemplo 5
2�2 Estadística y probabilidad
Siendolamuestrade15vasos,seaplicaelcaso3,paralocualsecalculaelvalordetα/2,conv =15–1=14gradosdelibertady1–α=0.999,dondeα=0.001,esdecirα/2=0.0005.Portanto,aplicandolastablasporcentualesparaladistribuciónt-Studentsetienet0.0005=4.14.Enconclusión
246 27 4 144 19
15246 27 4 14
4 19
15
241 79
. ..
. ..
.
−
< < +
< <
µ
µ 2250 75.
Es decir, con 99.9% de probabilidad se determina que el parámetro media dellíquidosuministradoporlamáquinaderefrescosseencuentraentre241.79y250.75ml.Portanto,laafirmacióndelfabricantenoseráválidacon99%deconfianza,puestoqueelvalor240mlestáfueradelintervalo.
Ejercicio 2
1. Delasiguientemuestraaleatoria,tomadadeunpoblaciónnormal
13 19 14 12 21 14 17 20 17
calcula95%deintervalodeconfianzaparalamediadelapoblación
a) sisesabequelavarianzapoblacionales4 b) sinoseconoceelvalordelavarianzapoblacional
2. Uningenierodecontroldecalidadmidió lasparedesde25botellasdevidriodedoslitros.Lamediamuestralfue4.02mmyladesviaciónestándarmuestral0.09,calcula95%deintervalodeconfianzarespectodelamediadelespesordelasparedesdelasbotellas.
3. Mientrasseefectúaunatareadeterminadaencondicionessimuladasdeausenciadegravedadelritmocardiacode40astronautasenadiestramientoseincrementa,26.4pulsacionesporminutoenpromediocondesviaciónestándarde4.28,calculalaverdaderamediaenelincrementodelritmocardiacosi x = 26 4. seutilizacomounaestimaciónpuntualdelincrementomedioenelritmocardiacoyseutiliza95%deconfianza.
4. Se realizan cinco mediciones en un medidor de volumen en la bomba de unaestacióndegasolina(10.5,10.0,9.90,9.95y10.15),supónnormalidadycalculaunintervalodeconfianzaparalamediaconα=0.05
5. Unamáquinaproducepiezasmetálicasdeformacilíndrica.Setomaunamuestraalazardepiezascuyosdiámetrosson10,12,11,11.5,9,9.8,10.4,9.8,10y9.8mm.Supónquelosdiámetrostienenunadistribuciónaproximadamentenormaly
a) calcula99%deintervalodeconfianzaparaeldiámetropromediodetodaslaspiezas
b) calcula99%deintervalodeconfianzaparaeldiámetropromediodepiezassiσ=1.
2�3Unidad 10 • infErEncia Estadística
Intervalos de confianza para la diferencia de medias en poblaciones aproximadamente normales
Despuésdeanalizarlosintervalosdeconfianzaparalamediapoblacional,secontinúaconelcálculodeintervalosdeconfianzaparaladiferenciademedias,elcualsedivideencincocasos.
1. Intervalo de confianza para µ1 – µ2 de poblaciones con distribuciones normales,
cuando se conocen σσ σσ12
22y .
Dadas x x1 2y lasmediasdemuestrasaleatoriasindependientesdetamañosn1yn2,respectivamente,depoblacionescondistribucionesaproximadamentenormales,delascualesseconoceσ σ1
222y ,elintervalodeconfianzade(1–α)de100%para
µ1yµ2estádadopor
( ) ( )x x zn n
x x zn n1 2
2
12
1
22
21 2 1 2
2
12
1
22
2− − + < − < − + +α α
σ σµ µ
σ σ
dondezα/2eselvalordeladistribuciónnormalestándar,elcualtieneunáreadeα/2.
Secomparandostiposderoscadetornillosparadeterminarsuresistenciaalatensión.Sepruebandocepiezasdecadatipodecuerdabajocondicionessimilares,obteniéndoselossiguientesresultados(enkg)
Siµ1yµ2sonresistenciaspromedioa latensióndelostornillostipoIytipoII,respectivamente,conlasvariacionesalatensióndelostornillostipoIytipoIIσ1
2 5= yσ2
2 10= ,respectivamente,secalcula90%deintervalodeconfianzaparaµ1–µ2.Primerosecalculanlasmediasmuestrales: x x1 270 5 71 4= =. .y .Lasmuestrassondetamañon1=n2=12.Secalculaelvalorparazα/2con90%de
intervalodeconfianzausandolastablasporcentuales,zα/2=1.645.
( . . ) . ( . . ) .70 5 71 4 1 6455
12
10
1270 5 71 4 1 645
5
12
10
121 2− − + < − < − + +
−
µ µ
22 74 0 941 2. .< − <µ µ
Esdecir,ladiferenciadelaresistenciapromedioalatensiónalfabricarlostornillostiposIyIIseencuentraentreelintervalo(–2.74,0.94),con90%deconfianza.Dadoqueenel intervaloseencuentrael0,nohaydiferenciasignificativaentre losdostiposderosca.
Ejemplo 6
1 2 3 4 5 6 7 8 9 10 11 12
68 70 72 69 71 72 70 69 75 69 70 71
75 73 73 68 68 67 69 75 74 68 73 74
Tipode rosca
1
2
2�4 Estadística y probabilidad
2. Intervalo de confianza para µ1 – µ2 de poblaciones cuando se desconocen σσ σσ12
22y
en muestras grandes.
Dadas x x1 2y lasmediasdemuestrasaleatoriasindependientesdetamañosn1yn2(n1≥30yn2≥30),respectivamente,depoblacionesdelascualessedesconocenσ σ1
222y ,elintervalodeconfianza(1–α)de100%paraµ1–µ2estádadopor
( ) ( )x x zs
n
s
nx x z
s
n
s
n1 22
12
1
22
21 2 1 2
2
12
1
22
2− − + < − < − + +α αµ µ
dondezα/2eselvalordeladistribuciónnormalestándar,elcualtieneunáreadeα/2y s s1
222, sonlasvarianzasinsesgadasrespectivasdelasmuestras1y2.
Retomandoelejemplo6,seprueban40tornillosdecadatipodecuerdabajocondicionessimilaresyseobtienenlossiguientesresultados(enkg).
deltipoI x s n1 1 172 5 2 45 40= = =. . ,y
deltipoII x s n2 2 269 8 1 75 40= = =. . ,y
Siµ1yµ2sonresistenciaspromedioalatensión,delostornillostipoIytipoII,respectivamente, se calcula 95% de intervalo de confianza para µ1– µ2 con el fin dedeterminarconcuáltipodetornillosesmásresistente.
Comoyaseconocenlosvaloresmuestralesparalamediayladesviaciónestándar,ysiendolasmuestrasgrandes(n1=n2=40>30),faltaúnicamenteencontrarelvalorparazα/2con95%deintervalodeconfianza.Usandolastablasporcentuales,zα/2=1.96
( . . ) .. .
( . . ) ..
72 5 69 8 1 962 45
40
1 75
4072 5 69 8 1 96
2 452 2
1 2− − + < − < − +µ µ22 2
1 2
40
1 75
40
1 78 3 62
+
< − <
.
. .µ µ
Puestoqueelintervaloparaladiferenciadelasmediaspoblacionalessiempreserápositivo,setiene95%deconfianzadequelaresistenciaalatensióndelostornillostipoIesmayoraladelosdeltipoII
µ1–µ2∈(1.78,3.62)indicaqueµ1–µ2>0,esdecirµ1>µ2
3. Intervalo de confianza para µ1 – µ2 de poblaciones normales cuando se desconocen
σσ σσ12
22y , pero se sabe que σσ σσ1
222== en muestras pequeñas.
Dadas x x1 2y lasmediasdemuestrasaleatoriasindependientesdetamañosn1yn2(n1<30yn2<30),respectivamente,depoblacionesaproximadamentenormalesdelasquesedesconocenσ σ1
222y peroseconocequeσ σ1
222= ,elintervalodeconfianza
(1–α)de100%paraµ1–µ2estádadopor
( ) ( ) ( ) ( )x x t sn n
x x t sn np p1 2
2 1 21 2 1 2
2 1 2
1 1 1 1− − + < − < − + +α αµ µ
Ejemplo 7
2�5Unidad 10 • infErEncia Estadística
dondetα/2eselvalordeladistribuciónt-Studentconv=n1+n2–2gradosdelibertad,elcualtieneunáreadeα/2
sn s n s
n np =− + −
+ −( ) ( )1 1
22 2
2
1 2
1 1
2
eslaestimacióncomúndeladesviaciónestándarpoblacionaly s s12
22y sonlasvarianzas
insesgadasrespectivasdelasmuestras1y2.
Laspruebasdetracciónendiezpuntosdesoldaduraparaundispositivosemiconductorprodujeronlossiguientesresultadosenlibrasrequeridaspararomperlasoldadura
15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5
Unsegundoconjuntodeochopuntosfueprobadoparadeterminarsilaresistenciaalatracciónseincrementaconunrecubrimiento,produciendolossiguientesresultados
24.9 23.6 19.8 22.1 20.4 21.6 21.8 22.5
Sesuponedistribuciónnormal,secalcula90%deintervalodeconfianzaparaµ1–µ2,considerandoσ σ1
222= ,ambasdesconocidas.
Primerosecalculanlasmediasyvarianzasmuestrales
delconjunto1 x s n1 12
114 29 7 50 10= = =. . ,y
delconjunto2 x s n2 22
222 09 2 68 8= = =. . ,y
Conestosvaloressecalcula
sn s n s
n np =− + −
+ −=
− + −+ −
=( ) ( ) ( ) . ( ) .1 1
22 2
2
1 2
1 1
2
10 1 7 50 8 1 2 68
10 8 22..32
Faltadeterminarenlastablasporcentualesdeladistribuciónt-Studentelvalordetα/2con90%deconfianza(α=0.10esdecir,α/2=0.05)yv=n1+n2–2=16gradosdelibertad.Sedeterminaenlastablascorrespondientesquet0.05=1.746.
( . . ) . . ( . . ) .14 29 22 09 1 746 2 321
10
1
814 29 22 09 1 746 21 2− − × + < − < − + ×µ µ ..
. .
321
10
1
8
9 72 5 881 2
+
− < − < −µ µ
4. Intervalo de confianza para µ1 – µ2 de poblaciones normales cuando se desconocen
σσ σσ12
22y , pero se sabe que σσ ≠≠ σσ1
222 en muestras pequeñas.
Dadas x x1 2y lasmediasdemuestrasaleatoriasindependientesdetamañosn1yn2(n1<30yn2<30),respectivamente,depoblacionesaproximadamentenormalesdondesedesconocenσ σ1
222y perosesabequeσ σ1
222≠ ,elintervalodeconfianza
(1–α)de100%paraµ1–µ2estádadopor
( ) ( )x x ts
n
s
nx x t
s
n
s
n1 22
12
1
22
21 2 1 2
2
12
1
22
2− − + < − < − + +α αµ µ
Ejemplo �
2�6 Estadística y probabilidad
dondetα/2eselvalordeladistribuciónt-Studentcon
ν =
+
−
+
sn
sn
sn n
sn
12
1
22
2
2
12
1
2
1
22
2
11
−
2
2
11n
gradosdelibertad,elcualtieneunáreadeα/2,y s s12
22y sonlasvarianzasinsesgadas
respectivasdelasmuestras. De la fórmula anterior sepuede estimarque el resultadodel cálculode losgradosdelibertadgeneralmenteseráunacantidad no entera,porloquesiemprese debe redondear al entero más próximo(noalsiguiente),porejemplo,siv =14.3≈14;v =14.7≈15;v =14.5≈15.
Se retoman los datos del ejemplo 8, considerando que σ σ12
22≠ y son ambas desco-
nocidas.Sesuponenormalidad;secalcula90%deintervalodeconfianzaparaµ1–µ2;sedeterminaquétipodesemiconductorsinrecubrimiento(1)oconrecubrimiento(2)tienemásresistenciaalatracción.
Lasmediasyvarianzasmuestralessecalcularonanteriormente
delconjunto1 x s n1 12
114 29 7 50 10= = =. . ,y
delconjunto2 x s n2 22
222 09 2 68 8= = =. . ,y
Conestosvaloressecalculanlosgradosdelibertad
ν =
+
−
+
sn
sn
sn n
sn
12
1
22
2
2
12
1
2
1
22
2
11
−
=+
−
2
2
2
21
1
7 5010
2 688
7 5010
110 1n
. .
.
+
−
= ≈2 68
81
8 1
14 99 152..
Falta determinar, usando las tablas porcentuales de la distribución t-Student, elvalordetα/2con90%deconfianza(α=0.10esdecir,α/2=0.05)yv=15gradosdelibertad.Sedeterminaenlastablascorrespondientesquet0.05=1.753.
( . . ) .. .
( . . ) .14 29 22 09 1 7537 50
10
2 68
814 29 22 09 1 753
71 2− − + < − < − +µ µ
.. .
. .
50
10
2 68
8
9 63 5 971 2
+
− < − < −µ µ
Comoelintervalodeconfianzasiempreresultanegativo(de–9.63a–5.97),setiene90%deconfianzadequelaresistenciaalatracciónconrecubrimientoesmayorquesinrecubrimiento.
5. Intervalo de confianza para µd = µ1 – µ2 de poblaciones normales, cuando se desconocen σσ σσ1
222y , pero se sabe que son observaciones por pares en muestras pequeñas.
Dadas x sd dy la media y la desviación estándar de las diferencias normalmentedistribuidas de n pares aleatorios y dependientes de mediciones de muestras detamaño n(n < 30), respectivamente, de poblaciones aproximadamente normales
Ejemplo �
2�7Unidad 10 • infErEncia Estadística
dondesedesconoceσ σ12
22y ,elintervalodeconfianza(1–α)de100%para
µd=µ1–µ2estádadoporx t
s
nx t
s
nd
dd d
d−
< < +
α αµ
2 2
dondetα/2eselvalordeladistribuciónt-Studentcon v=n–1gradosdelibertad,elcualtieneunáreadeα/2.
En un proceso químico se comparan dos catalizadores para comprobar su efecto en elresultadodelareacción.SepreparóunamuestradedoceprocesosutilizandoelcatalizadormarcaL y tambiéndocede lamarca M; a continuación semuestran losdatos con losrendimientos.
Secalcula99%deintervalodeconfianzaparaladiferenciadeobservacionesigua-ladasysesuponequelosdatosestándistribuidosnormalmente.
Primerosedeterminanlasdiferenciasdelosdatosdelamuestra
Conestasdiferenciassecalculasuvalormedioyladesviaciónestándar
x sd d= =0 074 0 207. .y
Eltamañodelamuestraesdiez,porconsiguientelosgradosdelibertadv=10–1=9.De las tablasporcentualescorrespondientesa ladistribución t-Studentcon99%decon-fianza(α=0.01yα/2=0.005),setienequet0.005=3.25.Porúltimoelintervalodeconfianzaresulta
0 074 3 250 207
100 074 3 25
0 207
10
0 139
. ..
. ..
.
−
< < +
− <
µ
µ
d
dd < 0 287.
Ejercicio 3
1. Calcula si enunaclasedediezestudiantessetieneelmismorendimientoendospruebasdiferentes.Suspuntuacionesson
Considera95%de intervalode confianzapara ladiferenciade laspuntuacionesigualadasysupónnormalidadenlaspoblaciones.
Ejemplo 10
0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92
0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86
L
M
0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92
0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86
0.04 0.50 0.28 0.08 0.01 0.05 0.23 0.11 0.18 0.06
L
M
L – M
1 2 3 4 5 6 7 8 9 10
90 90 90 80 90 92 88 90 63 70
84 84 82 94 90 85 89 62 65 52
Estudiante:
Prueba 1:
Prueba 2:
2�� Estadística y probabilidad
2. Seaplicóunexamendematemáticasfinancierasaungrupodealumnos(grupoA),elcualobtuvolassiguientescalificaciones
3.0 3.5 4.0 8.1 7.2 8.9 8.2 10.0 10.0 9.0
Aotrogruposeleaplicóunexamendeálgebralinealconlassiguientescalificaciones
2.0 3.0 3.7 8.0 5.0 4.0 3.0 8.0 9.0 10.0 7.0 7.0 6.0
Calculaunintervalodeconfianzaparaladiferenciademediascon90%deniveldeconfianza.
3. Uncentrodeinvestigaciónenmedicinadeldeportedioaconocerlasdiferenciasenlastasasdeconsumodeoxígenoparavaronesuniversitariosentrenadoscondosmétodosdiferentes.Unodeellosrecibeentrenamientocontinuoyelotrointermitente,losdosconigualduración.Enlasiguientetablaseregistranlostamañosdemuestra,mediasydesviacionesestándarrespectivas,expresadosenmlporkg/min
Calcula las medias de estas poblaciones con 99% de intervalo de confianza;supónquelasvarianzaspoblacionalessondiferentesyquesudistribuciónesaproxima-damentenormal.
4. LosdatosquesemuestranacontinuaciónsonlosgradosdedurezaBrinellobtenidosparamuestrasdedosaleacionesdemagnesio
Supónqueprovienendepoblacionesaproximadamentenormalesconvarianzasquesondistintasyconsidera98%deintervalodeconfianzaparaµ1–µ2.
5. Sedicequeunanuevadietareduceelpesodeunapersona,4.5kgenpromedio,enunperiododedossemanas.Lospesosdesietemujeresquesiguieronestadietafueronanotadosantesydespuésdedichoperiodo.
Determinalaeficaciadeladietaconsiderando95%deintervalodeconfianzaparaladiferenciademediade lospesos;supónquesudistribuciónaproximadamentenormal.
a) siσ σ12
22=
b) siσ σ12
22≠
Entrenamiento intermitenteEntrenamiento continuo
xc = 43.71
nc = 9
= 4.87sc
x i = 39.63
ni = 7
= 9.68s i
1 2 3 4 5 6 7
58.5 60.3 61.7 69.0 64.0 62.6 56.7
60.0 54.9 58.1 62.1 58.5 59.9 54.4
Mujer
Peso anterior
Peso posterior
2��Unidad 10 • infErEncia Estadística
Intervalos de confianza para la varianza de poblaciones aproximadamente normales
Cuandosetratadeintervalosdeconfianzaparalavarianza,seconsiderandoscasos,unoparalasvarianzaspoblacionalesyelotroparaunarazónentrevarianzas.
1. Intervalo de confianza para σ 2 de poblaciones normales en muestras pequeñas.
Dadas2lavarianzadeunamuestraaleatoriadetamañon(n<30)deunapobla-ciónaproximadamentenormal,elintervalodeconfianza(1–α)de100%paraelparámetroσ 2estádadopor
( ) ( )n s n s−< <
−
−
1 12
22
22
1 22χ
σχα α
donde χ χα α22
1 22y − sonvaloresdeladistribuciónjicuadrada χ 2
(vertablasestadís-ticascorrespondientes)conv = n–1gradosdelibertad,loscualestienenáreasdeα /2y1–α /2,respectivamente.
Unantropólogomidióelancho(encentímetros)deunamuestratomadaalazardenuevecráneosdemiembrosdeciertatribu,yobtuvolossiguientesresultados
13.3 14.2 13.5 16.7 11.1 13.1 13.0 12.2 13.0
Secalcula95%deintervalodeconfianzaparalavarianzadedichatribu.Primerosecalculalavarianzainsesgadadelamuestras2=2.33.Elgradodeconfianzaestádadopor1–α=0.95,dondeα=0.05,esdecir
α/2=0.025y1–α/2=0.975.Buscandoenlastablasdeladistribuciónjicuadradaconv=9–1=8gradosdelibertad,setiene
χ χ χ χα α22
0 0252
1 22
0 975217 5345 2 1797= = = =−. .. .y
Porúltimo,resulta( ) .
.
( ) .
.
. .
9 1 2 33
17 5345
9 1 2 33
2 1797
1 06 8 55
2
2
−< <
−
< <
σ
σ
2. Intervalo de confianza para σσ σσ12
22 de poblaciones normales en muestras pequeñas.
Dadas s s12
22y lasvarianzasdemuestrasaleatoriasindependientesdetamañosn1y
n2 (n1 < 30 y n2 < 30), respectivamente, de poblaciones normales, el intervalo deconfianza(1–α)de100%paralarazóndelasvarianzasσ σ1
222estádadopor
s
s
s
s12
22
2 1 2
12
22
12
22 2 2 1
1
< <
f
fα
αν νσσ
ν ν( , )
( , )
donde fα ν ν2 1 2( , )eselvalordeladistribuciónF(vertablascorrespondientes),conv1=n1–1gradosde libertaddelnumeradoryv2=n2–1gradosde libertaddeldenominadorelcualtieneunáreade α/2,similarmente fα ν ν2 2 1( , ).
Ejemplo 11
300 Estadística y probabilidad
Retomandolosdatosdelejemplo8sehizo lasuposicióndequeσ σ12
22= y secalculó
un intervalo de confianza para la razón de varianzas y se determinó si fue válida lasuposición,con90%deconfianza.
Losresultadosdelconjunto1fueron
15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5
Losresultadosdelconjunto2fueron
24.9 23.6 19.8 22.1 20.4 21.6 21.8 22.5
Alcalcularlasvarianzasmuestrales,delconjunto1seobtuvo s12 7 50= . ,n1=10,y
delconjuntodos s22 2 68= . ,n2=8.
FaltadeterminarusandolastablasporcentualesdeladistribuciónFlosvaloresde f fα αν ν ν ν2 1 2 2 2 1( , ) ( , )y con90%deconfianza(α=0.10esdecir,α/2=0.05)yv1=n1–1=10–1=9yv2=n2–1=8–1=7gradosdelibertad.SebuscaenlastablasdeladistribuciónFyseobtiene
f f f fα αν ν ν ν2 1 2 0 05 2 2 1 0 059 7 3 677 7 9 3 29( , ) ( , ) . ( , ) ( , ) .. . = = = =y 33Elintervalodeconfianzaresulta
7 50
2 68
1
3 677
7 50
2 683 293
0 76
12
22
12
22
.
. .
.
..
.
< <
<
σσ
σσ
<< 9 22.
Delintervalodeconfianzaparalarazónentrevarianzassedeterminaqueelvalor1estácontenidoenelintervalo.Portanto,con90%deconfianzasejustificalasuposiciónde
queσ σ12
22= ,yaqueσ σ1
222 1 0 76 9 22= ∈ ( . , . )ysisemultiplicanporσ2
2ambosmiembros
delaigualdadseobtieneσ σ12
22= .
Ejercicio 4
1. Ungeólogoestudiaelmovimientodeloscambiosrelativosenlacortezaterrestreenunsitioparticular,enunintentopordeterminarelángulomediodelasfracturaseligión=50fracturasydeterminaquelamediaesde39.8°yladesviaciónestándarmuestral esde17.20°.Considera99%de intervalode confianzapara estimar lavarianzadelapoblación(supónquelapoblaciónestánormalmentedistribuida).
2. Enunprocesoquímicosecomparandoscatalizadoresparaverificarsuefectoenelresultadodelareacción.SepreparóunamuestradediezprocesosutilizandoelcatalizadormarcaLydiezconelde lamarcaM,acontinuaciónsemuestran losdatosconlosrendimientos
Ejemplo 12
0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92
0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86
L
M
301Unidad 10 • infErEncia Estadística
Considera99%deintervalodeconfianzapararazónentrevarianzasdelosrendi-mientosdeloscatalizadores;supónquelosdatosestándistribuidosnormalmente.
3. Elespesordelasparedesde25botellasdevidriodedoslitrosfuemedidoporuningenierodecontroldecalidad.Lamediamuestralfuede4.02mmyladesviaciónestándarmuestralde0.09.Considera95%deintervalodeconfianzaconrespectodelavarianzadelespesordelasparedesdelasbotellas.
4. Se realizan cinco mediciones en un medidor de volumen en la bomba de unaestacióndegasolina(10.5,10.0,9.90,9.95y10.15),supónnormalidadycalculaunintervalodeconfianzaparalavarianzaconα=0.05.
Intervalos de confianza para las proporciones en muestras grandes
1. Intervalo de confianza para el parámetro p en muestras grandes.
Si ˆ ˆ ˆp q py = −1 sonlasproporcionesrespectivasdeéxitosyfracasosenunamuestraaleatoriade tamañon (n≥30),el intervalodeconfianza (1–α)de100%paraelparámetrobinomialpestádadopor
ˆˆˆ
ˆˆˆ
p zpq
np p z
pq
n− < < +α α
2 2
dondezα/2eselvalordeladistribuciónnormalestándar,elcualtieneunáreadeα/2.
Enunamuestraaleatoriadecienposiblesclientes,70prefierendeterminadoproducto.Se considera95%de intervalode confianzapara la proporciónde todos losposiblesclientesqueprefierentalproducto.
Paraelintervalodeconfianzadelaproporciónprimerosedeterminaelvalordeéstadepersonasqueprefierenelproducto
ˆ . ˆ .p q= = = =70
1000 70
30
1000 30y
Enestecasosetiene95%deconfianza,portanto,1–α=0.95,yusandolastablasporcentualesdeladistribuciónnormalsetienezα/2=1.96.Porúltimo
0 70 1 960 70 0 30
1000 70 1 96
0 70 0 30
100
0 6102 0 78
. .. .
. .. .
. .
−×
< < +×
< <
p
p 998
2. Intervalo de confianza para p1 – p2 de poblaciones en muestras grandes.
Dadas ˆ ˆp p1 2y lasproporcionesdeéxitosdelasmuestrasaleatoriasdetamañosn1yn2(n1≥30yn2≥30),respectivamenteyˆ ˆ ˆ ˆq p q p1 1 2 21 1= − = −y ,elintervalodeconfianza(1–α)de100%paraladiferenciaentrelosdosparámetrosbinomialesp1–p2estádadopor
(ˆ ˆ )ˆ ˆ ˆ ˆ
(ˆ ˆ )ˆ ˆ
p p zp q
n
p q
np p p p z
p q
n1 22
1 1
1
2 2
21 2 1 2
2
1 1
1− − + < − < − +α α ++
ˆ ˆp q
n2 2
2
dondezα/2eselvalordeladistribuciónnormalestándar,elcualtieneunáreadeα/2.
Ejemplo 13
302 Estadística y probabilidad
Unafirmamanufactureradecigarrosdistribuyedosmarcas.Siseencuentraque56de200fumadoresprefierenlamarcaAyque29de150fumadoresprefierenlamarcaB,seconsidera95%deintervalodeconfianzaparapA–pB;sedeterminasiesválidosuponerquelapoblacióndefumadoresprefierelamarcaB,sobrelamarcaA.
DadapA laprobabilidaddeque56de200 fumadoresprefieran lamarcaA, suestadísticoresulta
ˆ .pA = =56
2000 28
detalformaque ˆ .qA = 0 72conn1=200.Asimismolaprobabilidaddeque29de150prefieranlamarcaBresulta
ˆ .pB = =29
1500 19
detalformaqueˆ .qB = 0 81conn2=150.Porúltimoparaelintervalode95%deconfianza,delastablasporcentualesparaladistribuciónnormalresultaquezα/2=1.96,empleandolafórmulacorrespondienteparapA–pB
( . . ) .. . . .
( . .0 28 0 19 1 960 28 0 72
200
0 19 0 81
1500 28 0 19− −
×+
×< − < −p pA B )) .
. . . .
. .
+×
+×
< − <
1 960 28 0 72
200
0 19 0 81
150
0 0018 0 1782p pA B
ComopA–pB>0entoncespA>pB.Portanto,noesválidalasuposicióndequelapoblacióndefumadoresprefierela
marcaBsobrelaAcon95%deconfianza.
Ejercicio 5
1. Para estimar la propuesta de los trabajadores desempleados en Panamá, uneconomistatomaunamuestraalazarde400personasdeclaseobrera,donde25resultaronsinempleo.CalculalaproporciónrealdetrabajadoresdesempleadosenPanamáconsiderando97%deunintervalodeconfianza.
2. Unrector registródebidamenteelporcentajedecalificacionesD yFotorgadasalosestudiantespordosprofesoresuniversitariosdehistoria.ElprofesorIalcanzó32% contra 21% del profesor II, con 200 y 180 estudiantes, respectivamente.Considera90%deintervalodeconfianzaparaladiferenciadeproporciones.
3. Un antropólogo está interesado en la proporción de individuos que presentanbraquicefaliaendostribusindígenas.Supónquesetomanmuestrasindependientesdecadaunadelastribusysedescubreque24decada100nativosdelatribuAy36decada120delatribuBposeendichacaracterística.Considera95%deintervalodeconfianzaparaladiferenciap1–p2entrelasproporcionesdeestasdostribus.
10.2 Pruebas de hipótesis
En la sección anterior se analizaron los intervalos de confianza para el cálculo deestimacionessobrelosparámetrosyparatomardecisionesaltrabajarconlapoblacióndeinterés.Enestasecciónseestudiaráotrométodoestadísticoquepermitatomardeci-sionesenproblemasrelacionadosconpoblacionesqueresultanmuydifícilesoimposiblesdeanalizarensutotalidad.Porejemplo,parapoderconcluirconciertaveracidadsobrela
Ejemplo 14
Top Related