Capítulo 7 - Departamento de Informática USMcvalle/ILI-280/Cap7-II-07-2pp.pdf · Entonces, dentro...

Universidad Técnica Federico Santa María

Capítulo 7Capítulo 7

Estimación de ParámetrosEstimación de Parámetros

Estadística ComputacionalEstadística Computacional

II Semestre 2007II Semestre 2007

Prof. Carlos Valle

Página : www.inf.utfsm.cl/~cvalle

e-mail : cvalle@inf.utfsm.cl

C.Valle

El objetivo de la estimación de parámetros es proveer de

métodos que permitan determinar con cierta precisión, el

vector de parámetros desconocidos ϑ, de un modelo

estadístico f(x ; ϑ) a partir de una muestra aleatoria de

una población bajo estudio.

1. Método de estimación Puntual

2. Método de estimación por Intervalos

Estimación de Parámetros

1. Método de estimación Puntual:

Se busca un estimador ϑ que, con base en los

datos muestrales, dé origen a una estimación

univaluada del valor del parámetro.

2. Método de estimación por Intervalos:

Se determina un intervalo aleatorio I(ϑ), donde

con cierta probabilidad, se encuentra el valor del

parámetro ϑ.

Estimación de Parámetros

La idea detrás de la estimación puntual es bastante

simple. Cuando muestreamos desde una población

descrita por su función de densidad o cuantía,

conocer significa conocer la población entera.

Por lo tanto, es natural contar con métodos para

encontrar buenos estimadores del parámetro .

Estimación Puntual

)|( θxf

Un estimador es una regla que nos indica cómo obtener un

parámetro de un modelo, basándose en la información

contenida en una muestra ( M={ f ( x | θθθθ ) : θθθθ ∈∈∈∈ ΘΘΘΘ }}}} modelo )

T : χ τ ⊂ Θ

x T (x) = T (X1, X2,...., Xn)

T (x) : Estimador de θ, variable aleatoria, función de la

muestra, que no depende del parámetro θ.

(T (x) es una estadística basada en la Información χχχχ)

χ={x : x es una muestra aleatoria} Espacio de Información

♦ En lo que sigue = T (X1, X2,..., Xn) estimador de θ.

Definición de Estimador

Métodos de Estimación Puntual

♦ Método de Momentos

♦ Método de Máxima Verosimilitud

Momentos Observados

krm rr ,...,1, == µ

Método de Momentos

ΜΜΜ

y resolvemos el sistema de ecuaciones:

Momentos Observados

(centrados en cero)

El método de MV es la técnica más popular para

derivar estimadores. Sea X1,X2,…,Xn, una muestra

desde una población con función de densidad

La función de verosimilitud se define como:

Para cada punto Xi de la muestra, es el estimador

de los parámetros en el cual alcanza su valor

máximo como función del verdadero valor .

Método de Máxima Verosimilitud

),...,,|( 21 kxf θθθ

)|( θxL

∏ ===

i kikn xfxxxLθxL1 212111 ),..,,|(),..,,|,..,,()|( θθθθθθ

Si la función de verosimilitud es diferenciable (en ),

el estimador de máxima verosimilitud (EMV) del

verdadero valor es aquel que resuelve:

No obstante, habría que chequear que se cumple:

kiθxLi

,...,1,0)|( ==∂

kjiθxLji

,...,1,0,)|( ˆ

∂∂

∂=θθθθ

Dependiendo de la p.d.f, puede resultar muy

complicada la función de verosimilitud, es por ello que

es más fácil trabajar con la función de log-

verosimilitud, definida como:

Equivalentemente, el EMV es el valor de para el

cual se cumple:

∑ ===

i kixfθxLθx1 21 ),...,,|(ln)|(ln)|( θθθλ

kiθxi

,...,1,0)|( ==∂

θθ̂

Métodos de Evaluación de E.Puntual

Error Cuadrático Medio (ECM):

El ECM de un estimador del parámetro es

El ECM mide el promedio de la diferencias cuadrática entre el

estimador y el verdadero valor del parámetro, y ha sido por

mucho tiempo una medida razonable del desempeño de todo

estimador puntual.

Una medida alternativa podría ser . No obstante, la

medida cuadrática que utiliza ECM tiene ventajas sobre otras

medidas: primero que es tratable analíticamente, y segundo que

tiene la siguiente interpretación ( dilema sesgo/ variancia):

θ̂≡T ])[( 2θ−TE

|][| θ−TE

]2[][)( 222 θθθ +−=−= TTETETECM

))((][

)][(][

][2])[(][

TSesgoTV

TETETV

+−+=

θ−= ][)( TETSesgo

Donde se define el Sesgo (Bias) de un estimador puntual

El ECM incorpora dos componentes, una que mide la

variabilidad del estimador (precisión) y la otra que mide su

sesgo (cercanía al verdadero valor).

Un buen estimador tiene un ECM pequeño, i.e. tiene

varianza y sesgo pequeños. Parece razonable entonces

escoger como el mejor estimador de , la estadística que

tenga el ECM más pequeño posible de entre todos posibles

los estimadores

Error Cuadrático Medio (ECM): No obstante, no existe

ningún estimador que minimice el ECM para todos los

posibles valores de . Es decir, un estimador puede tener

un ECM mínimo para algunos valores de , mientras que

otro estimador tendrá la misma propiedad, pero para otros

valores de .

Ejemplo: Considere la m.a. X1,X2,…,Xn de alguna

distribución tal que y . Considere

las estadísticas (estimadores):

como posibles estimadores de .

i == ∑=1

[ ] µ=iXE [ ] 2σ=iXV

Estimadores Consistentes:

Es razonable esperar que un buen estimador de un

parámetro sea cada vez mejor conforme crece el tamaño

de la muestra.

Esto es, conforme la información de una v.a. se vuelve más

completa, la distribución de muestreo de un buen estimador

se encuentra cada vez más centrada alrededor del

parámetro .

Estimadores Consistentes:

Sea el estimador del parámetro , y sea una

secuencia de estimadores que representan a con base en

muestras de tamaño 1,2..,n, respectivamente. Se dice que es

un estimador consistente para si

( ) 0 , , 1||lim >∀∀=≤−∞→ εθεθnn TP

θT nTTT ,...,, 21

Obs.: Esta definición proviene del concepto de Convergencia

en Probabilidad. Como ejemplo, anteriormente demostramos

que la media muestral es un estimador consistente de la

media poblacional .

Estimadores Insesgados de Varianza Mínima:

Es difícil determinar un estimador con mínimo ECM para

todo valor de . Sin embargo, podemos efectuar esta

búsqueda dentro de una clase de estimadores llamados

“estimadores insesgados”. Si un estimador se encuentra

dentro de esta clase, se tiene que:

Entonces, dentro de la clase de estimadores insesgados,

podemos comparar éstos según su varianza.

][)( TVTECM =y ][ θ=TE

Estimadores Insesgados de Varianza Mínima:

Sea X1,X2,…,Xn una m.a. de una distribución cuya densidad

tiene la forma . Si es un estimador insesgado de ,

entonces la varianza de debe satisfacer la siguiente

desigualdad:

Esta desigualdad establece un límite inferior para la varianza

de un estimador de (denominado “cota inferior de Cramér-

Rao”).

θ)|( θxf T

)|(ln][

∂≥

θXfnETV

Estimadores Eficientes:

Si es un estimador insesgado del parámetro , se dice que

es un estimador eficiente si se cumple que:

)|(ln][

θXfnETV

Por lo tanto, el estimador eficiente de es el estimador de

mínima varianza, cuyo valor corresponde a la cota inferior de

Cramér-Rao.

El estimador eficiente de , si se puede encontrar, es el mejor

estimador insesgado de , en el contexto del ECM.

Ejemplo: Sean X1,X2,…,Xn una m.a. de una distribución

Poisson de parámetro . Encuentre el estimador eficiente

de .λλ

Solución: Consideremos una distribución Poisson.

dada por , y su esperanza y varianza

están dadas por y . Luego:

!/)|( xexp xλλ λ−=λµ ==][XE λσ == 2][XV

)!ln()ln()|(ln xxxp −−= λλλ

λ −=−=

∂ xxxp1

Ejemplo:

Entonces:

Y por la definición de eficiencia, el estimador eficiente T de

debe ser tal que se cumpla:

De aquí inferimos que el estimador eficiente de es la

media muestral: .

22)|(ln

[ ]λλ

2==−=

λXT =

Eficiencia Relativa:

Se define la eficiencia relativa del estimador T2 respecto del

estimador T1 como:

La varianza de un estimador insesgado es la cantidad más

importante para decidir qué tan bueno es. Si T1 y T2 son dos

cualesquiera estimadores insesgados de :

Se dice que T1 es más eficiente que T2 si .][][ 21 TVTV ≤

TECMTTef =

TVTTef =

Métodos de Evaluación de E.PuntualUna estadística suficiente de un parámetro es aquella que utiliza

toda la información contenida en la m.a. con respecto a

Estimadores Suficientes:

Sea X1,X2,…,Xn una m.a. de una distribución con densidad de

probabilidad . Se dice que T = T(X1,X2,…,Xn) es

suficiente para sí y sólo si la función de verosimilitud

puede factorizarse de la siguiente forma:

para cualquier valor t = T(x1,x2,…,xn) de T (realización) y en

donde no contiene al parámetro .

)|( θxf

),...,()|()|,...,,()|( 111 nn xxgthxxxLθxL θθ ==

θ),...,( 1 nxxg

Ejemplo: Sea X1,X2,…,Xn una m.a. de una distribución

Poisson con pdf .

Demostrar que el estimador eficiente de es a su vez

suficiente.

!/)|( xexp xλλ λ−=

Solución:

)|()|()|()|,...,,( 2111 λλλλ nn xpxpxpxxxL Λ=

−−−

⋅⋅⋅=

xexexe

!/!/!/

λλλ

λλλ Λ

Solución:

( ) ),...,,(|)|,...,,( 21111 n

i in xxxgxhxxxL λλ ∑ ==

( ) λλλ nxn

i i exhn

i i −

∑= =∑ 1|1

Entonces es una estadística suficiente para . Dado

que el estimador eficiente es una función uno a uno de

esta estadística, también es suficiente para .

i ix1 λX

Propiedades de los Estimadores

Máximo Verosímiles

Todo estimador máximo verosímiles es:

�Asintóticamente insesgados

�Asintóticamente normales

�Asintóticamente eficientes

�Invariantes bajo transformaciones biunívocas

�Si ∃∃∃∃ estimador suficiente, es suficienteMVθ̂

Estimación por Intervalos

En la práctica, interesa no sólo dar una estimación

de un parámetro, sino que además, un intervalo

que permita precisar la incertidumbre existente en

la estimación.

Definición: Sea x m.a. ∝∝∝∝ f ( x , θθθθ ). Sean θθθθ1=T1(x),

θθθθ2=T2(x) dos estadísticas de θθθθ : T1 ≤≤≤≤ T2 ∧∧∧∧ ∀∀∀∀x ∈∈∈∈χχχχ ;

P [θ[θ[θ[θ1 ≤≤≤≤ θθθθ ≤≤≤≤ θθθθ2]]]] = 1 - αααα = γγγγ

Entonces el I = [θ[θ[θ[θ1 ; θθθθ2]]]] se llama intervalo aleatorio

de confianza del 100 γγγγ % para θθθθ ( 0 < αααα < 1 ).

Fijado αααα, el problema de determinar θθθθ1 y θθθθ2 puede

resolverse encontrando una variable aleatoria

Q(x,θθθθ) cuya distribución esté totalmente definida,

que sea independiente de θθθθ.

La variable Q(x,θθθθ) se denomina “Cantidad Pivotal”.

La construcción del intervalo de confianza se

efectúa con base en el mejor estimador del

parámetro desconocido θθθθ.

1. Encontrar una cantidad Q.

2. P [[[[q1 ≤≤≤≤ Q ≤≤≤≤ q2]]]] = 1 - αααα = γγγγ3. Invertir P [θ[θ[θ[θ1 ≤≤≤≤ θθθθ ≤≤≤≤ θθθθ2]]]] = γγγγ , obteniendo así un

intervalo I=[θ[θ[θ[θ1 ; θθθθ2]]]] de confianza para θθθθ de nivel

100 γγγγ %.

Obs: Para muestras grandes existe una v. a. Q asintótica

ya que para , se tiene MVθ̂

( ) )1;0(ˆ

MV ≈−

==θσ

Método de la Cantidad Pivotal

( )[ ]MVMV zI θσθ α

ˆˆ21−±=El intervalo para θθθθ estaría dado por:

donde el cuantil puede obtenerse de la tabla de la

distribución Normal estándar.2/1 α−z

I. C. para cuando suponemos normalidad con varianza

conocida:

Considerando como estimador de la media poblacional

como la media muestral , deseamos construir un intervalo

de confianza tal que:

Donde y

)]()([1)]()([ 2121 xTxTPgXgP <<=−=<< µαµµ

αµµ

=∫∞−

xdxf 2/);()(2

αµµ

=∫∞

);( µxf es la función de densidad de la distribución de muestreo

de , y y son funciones de , las cuales

no contienen a ningún otro parámetro desconocido.

X )(1 µg )(2 µg µ

I. C. para cuando suponemos normalidad con

varianza conocida:

Puesto que , la v.a. ,

entonces:

µµ αα −=

+<<−=<< −− 1)]()([ 2/12/121

nzXPgXgP

),(~ σµNX )1,0(~)/(

µ−=

considerando y ,

además de se tiene:

µµzq

−2/12

µµ−==

µ ααγ −=

+<<−= −− 1)( 2/12/1

2/1212/ αα −−=−== zqqz

conocida:

Luego, el intervalo de confianza del para la media

poblacional es:

)%1(100 α−

distribución Normal estándar.

+−= −−−

σσσααα 2/12/12/1 ,

2/1 α−z

desconocida:

Sabemos que cuando se muestrea una v.a. ,

donde tanto como son desconocidos, la v.a.

sigue una distribución t-Student con (n-1) gl.,

donde S es la desviación estándar y n es el

tamaño de la muestra.

Por lo tanto, es posible determinar el valor del cuantil

de T, para el cual:

ααα −=<<− −−−− 1][ 1,2/11,2/1 nn tTtP

µ σ),(~ σµNX

µ−=

1,2/1 −− nt α

conocida:

Entonces:

αµ αα −=

+<<− −−−− 11,2/11,2/1

StXP nn

Luego, el intervalo de confianza del para la media

poblacional es:

)%1(100 α−

distribución t-Student con (n-1) grados de libertad.

+−= −−−−−−

stxI nnn 1,2/11,2/11,2/1 , ααα

1,2/1 −− nt α

I. C. para la diferencia de medias ( distribuciones

normales independientes):

Sean X1,X2,…,Xn y Y1,Y2,…,Ym dos m.a. provenientes de

dos distribuciones normales independientes, con medias

y y varianzas y , respectivamente.

Se desea construir un intervalo de confianza para la

diferencia , con el supuesto que se conocen las

varianzas.

Es sabido que la v.a.

)1,0(~)(

−−−=

YX µµ −

I.Confianza para la diferencia de medias cuando se

muestrean dos distribuciones normales independientes:

Por lo tanto, es posible determinar el valor del cuantil

para el cual

ααα −=<<− −− 1][ 2/12/1 zZzP2/1 α−z

ασσ

µµσσ

αα −=

++−<−<+−− −− 1

zYXP YXYX

+±−=− −mn

zyxI YX

2/121 )(σσ

µµ αγ

Entonces:

distribución Normal estándar.2/1 α−z

El intervalo está dado por:

I. C. para la diferencia de medias ( distribuciones normales

independientes):

Si las varianzas se desconoce, pero son iguales, entonces la

donde el estimado combinado de la varianza común es:

)(kStudentt

YX −

−−−=

µµ2−+= mnk

2)1()1( −+−

+±−=− −mn

styxI pk

11)( ,2/121 αγ µµ

I.C. para cuando suponemos normalidad con media

desconocida:

Sabemos que cuando se muestrea una v.a. ,

donde tanto como son desconocidos, la v.a.

sigue una distribución Ji-cuadrada con (n-1) gl.,

donde S es la desviación estándar y n es el

tamaño de la muestra.

Por lo tanto, es posible determinar el valor de los cuantiles

y tales que

αχχχ αα −=<< −−− 1][ 1,2/12

µ σ),(~ σµNX

22 )1(

Sn −=

−nαχ

1,2/12

−− nαχ

Luego, el intervalo de confianza del , para la

varianza, con base en los datos de una muestra de tamaño n

)%1(100 α−

donde los cuantiles y se obtienen de la

tabla de la distribución Ji-Cuadrada con (n-1) g.l.

−−=

−−− 1,2/2

1,2/12

2 )1(,

αα χχ

−nαχ 1,2/12

−− nαχ

4) I. C. para cuando suponemos normalidad con media

desconocida:

I. C. para el cuociente de dos varianzas (distribuciones

Sean X1,X2,…,Xn y Y1,Y2,…,Ym dos m.a. de dos

distribuciones normales independientes, con medias y

y varianzas y , respectivamente.

Se desea construir un intervalo de confianza para el

cuociente .

Es sabido que la v.a.

Xµ Yµ2

)1,1(~/2

−−= mnFSS

22 / XY σσ

I. C. para el cuociente de dos varianzas (distribuciones

Por lo tanto, es posible determinar los cuantiles a y b tales

[ ] α−=<< 1ba FFFP

1,1,2/1

−−−

Fα 1,1,2/1

−−−

donde los cuantiles Fa y Fb pueden obtenerse de la tabla de la

distribución F con (n-1) y (m-1) grados de libertad.

Intervalo de ConfianzaIntervalo de Confianza Cantidad Cantidad PivotalPivotal

µ media la Para n

−= 0µ

(σ conocido)

(σ desconocido)

2 variancia σlaPara ( )1

−−

χ ∼

Intervalo de ConfianzaIntervalo de Confianza Cantidad Cantidad PivotalPivotal

21 Diferencia µµ − ( ) ( )2

21 −++

−−−nn

XX µµ

1 /σσ

( )112

21 −− nnFS

( ) ( )2

21 −∆−+

−−−nn

XX µµ∼

( )( )1,0

−∼

adesconocid

Capítulo 7 - Departamento de Informática USMcvalle/ILI-280/Cap7-II-07-2pp.pdf · Entonces, dentro...

Documents

Transcript of Capítulo 7 - Departamento de Informática USMcvalle/ILI-280/Cap7-II-07-2pp.pdf · Entonces, dentro...

Medina Fisica1 Cap7

Jeopardy Cap7

Cap7-1 Paraguay Inundaciones

00 d1085 cap7

Cap7 elaboracion de_plan_de_negocios_zavatex

Redman Origen Civilizacion Cap7

cap7-momentos estáticoshh

Creswell Cap7

cap7 ondas barotropicas

PMC MAIPO-Cap7

Cap7 Motores de Induccion

cap7 mankiw 2004

Cap7 movimiento ármonico simple

CAP7. Circuitos electroneumaticos

Cap7 aines

cap7 resultados

cap7 estrategias de mercadeo

CAP7 Austenita en Aceros

Cap7 b y la

Meiksins cap7