stat04

download stat04

of 6

description

estatica

Transcript of stat04

  • 4. ESTIMACIN POR INTERVALO

    43

    4 ESTIMACION POR INTERVALO

    4.1 INTRODUCCION

    Vimos en el captulo anterior mtodos de estimacin puntual. Pero no podemos esperar que la estimacinque produce coincida exactamente con el verdadero valor del parmetro desconocido . Aqu buscamosentonces construir un intervalo [ 1 , 2 ] tal que la probabilidad que est en el intervalo sea alta.

    Esta probabilidad tiene diferente interpretacin segn estemos en el caso bayesiano o no. Se tiene entoncesdos clases de mtodos para construir estos intervalos.

    4.2 CASO BAYESIANO

    En el caso bayesiano, el intervalo tiene una interpretacin inmediata a partir de la distribucin a posteriori de . Lo nico inconveniente es la falta de unicidad de tal intervalo. Pero es natural buscar el intervalo delargo mnimo.

    Ejemplo 1: Vimos que si )(Bernoulli~X y una distribucin a priori )b,a(Beta~ , entonces ladistribucin a posteriori de es una distribucin )Xnnb,Xna(Beta nn ++ :

    )Xnnb,Xna(B/)1()x,...,x|( nn1xnnb1xnan1 nn ++= ++ )10(

    Se define entonces un intervalo ],[ 21 de probabilidad 1 fijada a priori con pequeo, tal que = 1]),[(P 21 , calculada a partir de la distribucin .

    4.3 INTERVALO DE CONFIANZA DE NEYMANN

    En el caso de estimacin no bayesiana, el parmetro no se considera como una variable aleatoria. En estecaso es el intervalo [ 1 , 2 ] que es aleatorio, y se habla de la probabilidad de que el parmetro cubre elintervalo. Los valores 1 y 2 son entonces funciones de los valores muestrales.

    Sean n21 X,...,X,X valores muestrales de X, se tiene que encontrar dos funciones )X,...,X,X(t n2111 = y)X,...,X,X(t n2122 = tales que :

    = 1]),[(P 21

    siendo la cantidad 1 fijada a priori y llamada el nivel de confianza. Generalmente se determinan lasfunciones 1t y 2t a partir de un estimador de .

    Ejemplo 2: Intervalo de confianza para una media.

    Sea ),(N~X 2 , con la media desconocida y la varianza 2 conocida y una muestra de tamao n.

    Sean n21 X,...,X,X valores muestrales de X, entonces si nX es la media muestral, )1,0(N~n/

    XZ n

    = .

  • N. LACOURLY

    44

    Luego si = 1)uZu(P 21 , ]n

    uX,n

    uX[ 1n2n

    define un intervalo para de nivel de

    confianza 1 .

    Hay una infinidad de intervalos de mismo nivel de confianza 1 . Pero se puede mostrar que el intervalode la forma ]uX,uX[ nn + , simtrico con respecto a nX , tiene el largo mnimo entre los intervalos demismo nivel de confianza igual a 1 . Por ejemplo, para 05.0= , se obtiene el intervalo

    ]n

    96.1X,n

    96.1X[ nn

    + .

    Si no se supone que la varianza 2 es conocida, se tiene que usar un estadstico cuya distribucin muestralno depende de 2 . Eso nos lleva a usar el estadstico

    =

    )1n/()XX()X(n

    T2

    ni

    n

    que sigue una distribucin t-Student a n-1 g.l..

    El estadstico T puede escribirse en funcin del estimador sesgado =i

    2ni

    2n )XX(

    n

    1S de 2 :

    1n/SX

    Tn

    n

    =

    o del estimador insesgado

    =

    i

    2ni

    2n )XX(1n

    1~ :

    n/~X

    Tn

    n

    = .

    Si = 1)tTt(P 21 , ]n

    ~

    tX,n

    ~

    tX[ 2n1n

    ++ define un intervalo para de nivel de confianza

    1 .

    Como en el caso de la distribucin normal, el intervalo ms corto de nivel de confianza 1 es simtrico

    con respecto a nX : ],n

    ~

    tX,n

    ~

    tX[ nn

    + con t tal que = 1)tTt(P en donde 1nt~T .

    Ejemplo 3: Intervalo de confianza para una varianza.

    Sean los valores muestrales n21 X,...,X,X i.i.d. de la v.a. ),(N~X 2 . Observando que2

    1n2

    2ni

    ~

    )XX(U

    =

    , se construye un intervalo de nivel de confianza 1 a partir de

    =

    = 1u

    )XX(u

    )XX(P)uUu(P

    1

    2ni2

    2

    2ni

    21

  • 4. ESTIMACIN POR INTERVALO

    45

    Ejemplo 4: Intervalo para la diferencia de dos mediasSean dos poblaciones normales ),(N 211 y ),(N 222 . Se consideran una muestra aleatoria de tamao

    1n de la primera poblacin y una muestra aleatoria de tamao 2n de la segunda poblacin, las dos muestrassiendo independientes. Si 1X y 2X son las medias muestrales respectivas:

    )nn

    ,(N~XXd2

    22

    1

    21

    2121 += .

    Si las varianzas son conocidas entonces un intervalo para 21 = esta dado por:

    ]nn

    uXX,nn

    uXX[2

    22

    1

    21

    212

    22

    1

    21

    21

    +++

    en donde u se determina a partir de las tablas de la distribucin normal segn el nivel de confianza 1 .

    Si las varianzas no son conocidas, para encontrar un estadstico que nos sirve y cuya distribucin no dependede estas varianzas, hay que hacer alguno supuesto suplementario. En efecto si tomamos como estimador de

    la varianza de la diferencia 2

    22

    1

    21

    n

    n

    + con 21 y

    22 las respectivas varianzas muestrales sesgadas,

    22

    222

    21

    211 nn

    + ~ 2 2nn 21 + y

    2nn

    2122

    222

    21

    211

    2

    22

    1

    21

    21

    21t~

    )2nn/(nnnn

    /)XX(+

    ++

    +

    que depende de las varianzas desconocidas 21 y 22 .

    Si se supone que estas varianzas son proporcionales: 2122 k = , entonces se tiene un estadstico que no

    depende de 21 y 22 . Usualmente se toma k=1:

    2nn

    21

    21

    21

    222

    211

    2121

    t~

    )nn

    nn)(2nnnn(

    )XX(+

    +

    +

    +

    Ejemplo 5: Intervalo para el cuociente de dos varianzas: la distribucin F de FisherSean dos poblaciones normales ),(N 211 y ),(N 222 . Nos interesamos al cuociente de las varianzas:

    Q= 22

    21

    .

    El estadstico 2 1n21

    211

    1~

    n

    y el estadstico 2 1n2

    2

    222

    2~

    n

    , siendo estos independientes.

  • N. LACOURLY

    46

    Si 2r~U y 2s~V y son independientes, entonces se dice que rVsUY = sigue una distribucin de F de

    Fisher a r y s grados de libertad denotada s,rF con una funcin de densidad igual a:

    0y )sry)(2/s()2/r(

    ysr)2/)sr(()y(h 2/)sr(2/)2r(2/s2/r

    >+

    +=

    +

    En efecto, como U y V son independientes, se puede calcular fcilmente la funcin de densidad conjunta de(U,V):

    0v ,0u )2/s(2)2/r(2

    eveu)v,u(f 2/s2/r2/v2/)2s(2/u2/)2r(

    >>=

    Con el cambio de variables (U,V) (Y,Z) con U=rYZ/s y V=Z, obtenemos la densidad conjunta de (Y,Z):

    0z ,0y )2/s()2/r(2

    eezy)s/r()s/rz()z,y(g 2/)sr(2/zs2/ryz2/)sr(22/)2r(2/)2r(

    >>=+

    ++

    Se deduce la densidad marginal de Y:

    0y )sry)(2/s()2/r(

    ysr)2/)sr((dz)z,y(g)y(f0

    2/)sr(

    2/)2r(2/s2/rY >

    +

    +== + +

    Para construir un intervalo de confianza para el cuociente Q= 22

    21

    , usamos entonces el estadstico

    121n21

    22

    222

    211

    1

    2 n,F~))(n

    n)(1n1n(

    1

    .

    Ejercicio: Muestre que si s,rF~Y entonces r,sF~Y

    1.

    Muestre que )2/)2s(,2/)2r((Beta~s/rY1

    s/rY

    +.

    Ejemplo 6: Intervalo para una proporcinSea la proporcin de piezas defectuosas en un lote de piezas fabricadas por una industria. El nmero depiezas defectuosas Y encontradas en una muestra aleatoria simple de tamao n sigue una distribucinbinomial ),n(B . Para construir un intervalo de confianza para una proporcin es ms complicado que parauna media o varianza. Cuando n es pequeo hay que recorrer a la distribucin binomial (tablas y bacosfueron calculados para determinar valores de 1 y 2 para los diferentes valores de k y n y del nivel deconfianza 1 ).

  • 4. ESTIMACIN POR INTERVALO

    47

    Cuando n es grande, se puede usar la aproximacin a la distribucin normal ))1(n,n(N , pero lavarianza depende tambin de .

    Sea n

    Y= el estimador de Mxima Verosimilitud de , se tiene:

    =

    1)u)1()(n(P

    Lo que equivale a: = 1)0)1(u)(n(P 22 .

    Las soluciones de la ecuacin: 0n)un2()un( 2222 =+++

    siendo )un(2

    un4un4uun22

    22242

    +

    ++ , se obtiene el siguiente intervalo de confianza para :

    ]n4

    u

    n

    )1(u)

    n2u

    (un

    n,

    n4u

    n

    )1(u)

    n2u

    (un

    n[ 222

    22

    22

    2 +

    +++

    +

    ++

    Para n muy grande, se puede aproximar a un intervalo de confianza ms simple por:

    ]n

    )1(u,

    n

    )1(u[ +

    4.4 EJERCICIOS

    1. Sea una m.a.s. n21 X,...,X,X de una distribucin normal de media desconocida y varianza 2conocida.

    a) D el nmero mnimo n del tamao de la muestra para que un intervalo de confianza I a 95% tenga unlargo L a lo ms igual a 016.0 .b) Sea 5/L = . D el nivel de confianza 1 cuando n=10, 20, 30 y 100.c) Repetir b) con 2 desconocido. Comente.d) D el intervalo de confianza de largo mnimo para con un nivel de confianza de 95%, cuando 42 = .

    2. Una empresa desea estimar el promedio de tiempo que necesita una secretaria para llegar a su trabajo. Setoma una m.a.s. de 36 secretarias y se encuentra un promedio muestral de 40 minutos. Suponiendo que eltiempo de trayecto proviene de una ),(N 2 , con 122 = , d un intervalo de confianza para la media .

    3. Se dispone de 10 muestras de sangre tomadas en las mismas condiciones a una misma persona. Seobtiene para cada una la dosis de Colesterol (en gramos) 245, 248, 250, 247, 249, 247, 247, 246, 246, 248.Cada medida puede considerarse como una realizacin particular de la variable X "tasa de Colesterol". Sesupondr que ),(N~X 2 .

    a) D un intervalo de confianza para al 95% suponiendo 5.12 = .

  • N. LACOURLY

    48

    b) D un intervalo de confianza para al 95% suponiendo 2 desconocida.c) Construya un intervalo de confianza para 2 con un nivel de confianza de 95% .

    4. En el ejercicio 6 del capitulo 3, muestre que para construir un intervalo de confianza al 95% para , en elcaso no bayesiano, hay que resolver una desigualdad de segundo grado en y escriba la desigualdad.

    5. En el ejercicio 7 del capitulo 3, suponiendo las iY independientes y n grande, d un intervalo deconfianza para con un nivel de confianza de 95% .

    6. Se tienen 2 muestras de tamaos 1n y 2n respectivamente de una misma v.a. X medida sobre dospoblaciones distintas. Se asume que para ambas poblaciones X sigue una distribucin Normal: ),(N 211 y

    ),(N 222 respectivamente.

    a) Construya un intervalo de confianza para 21 = , suponiendo que 21222 k = en que k es unaconstante conocida.b) Muestre que los extremos del intervalo anterior convergen en probabilidad si los tamaos de las muestrascrecen.c) Se supone ahora la constante k desconocida. D un mtodo para construir un intervalo de confianza parala constante k.d) Que inconveniente cree Ud. que tiene este mtodo?

    7. Se considera una v.a. )1,(N~X y una m.a.s. de X con una sola observacin x. Dada una constantea>0, se define el intervalo aleatorio: )]ax,0(Max),ax,0(Min[)x(Ca += .

    a) Muestre que x 1)0|)x(C(P a == .b) Muestre que |)x(Ca es un intervalo de confianza para de nivel de confianza =1 95%, cuandoa=1.65.c) Sea )( ( ) una distribucin a priori para . Deducir la distribucin a posteriori de dado x.d) Sea la funcin de distribucin de la normal N(0,1). Muestre que se encuentra una probabilidad

    condicional

    >

    =

    ax si)x()a(axa- si)a()a(

    -ax si)a()x()x|)x(C(P a

    e) Deducir que, para a=1.65, la probabilidad condicional 90.0)x|)x(C(P a y que1)x|)x(C(Plim a

    a=

    .