stat02

11
2. DISTRIBUCIONES EN EL MUESTREO 13 2 DISTRIBUCIONES EN EL MUESTREO 2.1 INTRODUCCION Los métodos estadísticos permiten confrontar modelos matemáticos o probabilísticos con los datos empíricos obtenidos sobre una muestra: Ejemplo 1: Se saca una muestra al azar de n ampolletas del mismo tipo en un proceso de producción y se considera sus tiempos de vida. Si el proceso de fabricación no ha cambiado, las fluctuaciones entre las ampolletas observadas pueden considerarse como aleatorias y todas las observaciones provienen de una misma variable aleatoria X de distribución desconocida abstracta llamada distribución de población, el tiempo de vida de este tipo de ampolleta. Ejemplo 2: se saca una muestra al azar de n chilenas mayores de 14 años y se mide sus tallas. En este caso la población no es abstracta ya que se podría medir la talla de todas las chilenas mayores de 14 años y entonces determinar la distribución de población, que es discreta, y por ejemplo calcular la talla media de la población. Sin embargo es muy difícil realizar en la práctica y la función de distribución de población se considera como abstracta y se tomara como continua (normal en general) dado que el tamaño de la población es muy elevado. Si se tiene una sola variable aleatoria X cuya función de distribución F de población es generalmente desconocida, obteniendo observaciones de esta variable X, buscaremos conocer a la función de distribución F. Se le da en general una expresión teórica. Los valores n 2 1 X ,..., X , X de una v.a. X obtenidos sobre una muestra de tamaño n son los valores muestrales. Se busca entonces, por ejemplo, estimar la media de la distribución F a partir de los valores muestrales. Esto tendrá sentido si la muestra es representativa de la población. 2.2 TIPOS DE VARIABLES La cantidad y la naturaleza de las características que se pueden medir sobre los elementos de una población son de varios tipos. Supondremos aquí una sola variable que es una función X: Q . Se distingue la naturaleza de la variable X según el conjunto Q: Variable cuantitativa (también llamada intervalar) si Q es el conjunto de los reales o un intervalo de ; es una v.a. real continua. Variable discreta si Q es un subconjunto de N; Variable cualitativa (o nominal) si Q es un conjunto finito de atributos (o modalidades) no numéricos; Variable ordinal si Q es un conjunto de atributos no numéricos que se pueden ordenar. Por ejemplo, la edad de un individuo es una variable cuantitativa, mientras que el sexo es una variable nominal y la preferencia por un producto (poco, regular, mucho) es una variable ordinal. Sin embargo la Dadas mediciones obtenidas sobre una muestra de tamaño n, se busca deducir propiedades de la población de la cual provienen.

description

Estadistica

Transcript of stat02

Page 1: stat02

2. DISTRIBUCIONES EN EL MUESTREO

13

2 DISTRIBUCIONES EN EL MUESTREO

2.1 INTRODUCCION

Los métodos estadísticos permiten confrontar modelos matemáticos o probabilísticos con los datosempíricos obtenidos sobre una muestra:

Ejemplo 1: Se saca una muestra al azar de n ampolletas del mismo tipo en un proceso de producción y seconsidera sus tiempos de vida. Si el proceso de fabricación no ha cambiado, las fluctuaciones entre lasampolletas observadas pueden considerarse como aleatorias y todas las observaciones provienen de unamisma variable aleatoria X de distribución desconocida abstracta llamada distribución de población, eltiempo de vida de este tipo de ampolleta.

Ejemplo 2: se saca una muestra al azar de n chilenas mayores de 14 años y se mide sus tallas. En este casola población no es abstracta ya que se podría medir la talla de todas las chilenas mayores de 14 años yentonces determinar la distribución de población, que es discreta, y por ejemplo calcular la talla media de lapoblación. Sin embargo es muy difícil realizar en la práctica y la función de distribución de población seconsidera como abstracta y se tomara como continua (normal en general) dado que el tamaño de lapoblación es muy elevado.

Si se tiene una sola variable aleatoria X cuya función de distribución F de población es generalmentedesconocida, obteniendo observaciones de esta variable X, buscaremos conocer a la función de distribuciónF. Se le da en general una expresión teórica. Los valores n21 X,...,X,X de una v.a. X obtenidos sobre una

muestra de tamaño n son los valores muestrales.

Se busca entonces, por ejemplo, estimar la media de la distribución F a partir de los valores muestrales.Esto tendrá sentido si la muestra es representativa de la población.

2.2 TIPOS DE VARIABLES

La cantidad y la naturaleza de las características que se pueden medir sobre los elementos de una poblaciónΩ son de varios tipos. Supondremos aquí una sola variable que es una función X: Q→Ω . Se distingue lanaturaleza de la variable X según el conjunto Q:

• Variable cuantitativa (también llamada intervalar) si Q es el conjunto ℜ de los reales o un intervalo deℜ ; es una v.a. real continua.

• Variable discreta si Q es un subconjunto de N;• Variable cualitativa (o nominal) si Q es un conjunto finito de atributos (o modalidades) no numéricos;• Variable ordinal si Q es un conjunto de atributos no numéricos que se pueden ordenar.

Por ejemplo, la edad de un individuo es una variable cuantitativa, mientras que el sexo es una variablenominal y la preferencia por un producto (poco, regular, mucho) es una variable ordinal. Sin embargo la

Dadas mediciones obtenidas sobre una muestra de tamaño n, sebusca deducir propiedades de la población de la cual provienen.

Page 2: stat02

N. LACOURLY

14

edad se puede transformar en una variable nominal o ordinal considerando como conjunto Q un conjunto declases de edad. Según la precisión de la edad requerida y los métodos utilizados se usara la edad comovariable cuantitativa o nominal.

El tratamiento estadístico depende del tipo de variable considerada.

2.3 FUNCION DE DISTRIBUCION EMPIRICA

2.3.1 Caso de variables numéricas (reales o enteras)

Sean n21 X,...,X,X , los valores muestrales obtenidos de un m.a.s. Se define la función de distribución

empírica como:

n

)xX(Card)x(F i

n≤

=

la proporción de observaciones de la muestra inferiores o iguales a x; )x(Fn tiene las propiedades de una

función de distribución (Figura 1):• )x(Fn es monótona no decreciente;

• )x(Fn tiene limites a la derecha y a la izquierda;

• )x(Fn es continua a la derecha; 0)(Fn =−∞ ; 1)(Fn =+∞ ;

• )x(Fn tiene un número finito de puntos de discontinuidad y estos son con salto.

Además para x fijo )x(Fn es una variable aleatoria y )x(nFn es una v.a. igual a la suma de variables de

Bernoulli independientes de mismo parámetro )x(Fn , o sea ))x(F,n(B~)x(nFn .

-5 0 5 10 15

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Fn

Figura 1: Una función de distribución empírica

x

Page 3: stat02

2. DISTRIBUCIONES EN EL MUESTREO

15

Teorema 1 Para todo x, )x(Fn converge casi-seguramente hacia el valor teórico )x(F .

Demostración: Como ))x(F,n(B~)x(nFn , de la ley de los grandes números se concluye que:

1))x(F)x(Flim(P nn

==

O sea que )x(F)x(F.s.c

n → .

Se tiene dos otros resultados que no se demuestran:

Teorema 2 (Glivenko-Cantelli):

0|)x(F)x(F|SupD nx

n →−=

Teorema 3 (Kolmogorov): La distribución asintótica de nD es conocida y no depende de X:

∑+∞

−∞=+∞→−−=<

k

22kn

n)yk2exp()1()yDn(Plim

2.3.2 Caso de variables no numéricas (nominal u ordinal)

Cuando las variables no son numéricas, Q es un conjunto finito: Q q,...,q,q r21= . La distribución de

población P está definida por las probabilidades r,...,2,1j( )qX(P j =∀= ).

Dada una muestra aleatoria simple n21 X,...,X,X de tamaño n, se define la función de probabilidad

empírica nP a partir de las proporciones en el muestreo n

)qX(Card)j(f

jin

== , j=1,2,…,r.

Teorema 4: ))qX(P,n(B~)j(nf jn = y la distribución empírica nf tiende en ley hacia la distribución de

población P.

2.4 DISTRIBUCIONES EN EL MUESTREO Y DISTRIBUCIONES EN LA POBLACION

Sea una v.a. X de función de distribución F. Sean n21 X,...,X,X valores muestrales independientes

obtenidos sobre una muestra de tamaño n. Si nos interesamos a la media µ de la población (Esperanza de ladistribución F), la muestra nos permitirá estimar a µ ; pero si se saca otra muestra del mismo tamaño de lapoblación obtendremos posiblemente otra estimación. El resultado de la estimación es aleatorio. Elcarácter aleatorio del resultado proviene de la aleatoriedad del muestreo y depende del tamaño y del tipo demuestreo efectuado. Es decir que los valores muestrales y resúmenes de estos que sirven a la estimación sonvariables aleatorias; conviene determinar sus distribuciones antes de inferir a la población.

Page 4: stat02

N. LACOURLY

16

Definición 1: Las funciones de los valores muestrales son variables aleatorias llamadas estadísticos y lasdistribuciones de los estadísticos se llaman distribuciones en el muestreo.

La distribución de un estadístico S en el muestreo depende de la distribución de población. Si se supone quela distribución de población pertenece a una familia de distribuciones teóricas, por ejemplo una distribuciónnormal, una distribución beta, una distribución de Bernoulli o una distribución de Poisson. Quedandesconocidas, en este caso, sólo algunas características de la distribución de población, como por ejemplo lamedia y la varianza para la normal, el parámetro p para la Bernoulli. Estas características, son losparámetros de la distribución de población. En este caso la distribución del estadístico S dependerá de losparámetros.

Los estadísticos y sus distribuciones en el muestreo (o sus distribuciones asintóticas cuando el tamaño ntiende a ∞+ ) permiten estimar los parámetros desconocidos de la distribución de población.

2.4.1 Proporción muestral

Suponemos n21 X,...,X,X , valores muestrales independientes obtenidos de una población de Bernoulli de

parámetro p desconocido.

Consideramos en primer lugar el caso de una población infinita o una población finita con un muestreo conreemplazo. Por ejemplo 1X i = si se saca "cara" en el lanzamiento i de n lanzamientos de una moneda; obien una pieza fabricada es defectuosa con probabilidad p desconocida o no es defectuosa con probabilidad1-p.

Se define la proporción muestral como n

X

f ii

n

∑= la proporción de caras o piezas defectuosas encontradas

entre las n observadas. La distribución de nnf esta totalmente definida: nnf toma valores en 0,1,…,n y

sigue una distribución Binomial(n,p), con knkn )p1(p

k

n)knf(P −−

== .

Se deduce que p)f(E n = y n

)p1(p)f(Var n

−= . Es decir que la distribución de la proporción empírica nf

esta centrada en el parámetro p y su dispersión depende del tamaño n de la muestra. Además:

n

)p1(p)f(Var])pf[(E n

2n

−==−

El error estándar es entonces: n

)p1(p|]pf(|e n

−=−

Observamos que se tiene la convergencia en media cuadrática: 0])pf[(E 2n →− .

Además se tiene las otras convergencias de nf hacia p. La convergencia en probabilidad: por la ley débil de

los grandes números la diferencia |pf| n − es tal que para un ε dado:

1)|pf(|Plim nn

=<−+∞→

ε

Page 5: stat02

2. DISTRIBUCIONES EN EL MUESTREO

17

La convergencia casi segura: 1)pflim(P nn

==+∞→

y además la convergencia en ley hacia una normal:

)n

)p1(p,p(Nf

ley

n−→

En el caso de una población finita de tamaño N con un muestreo sin reemplazo, se obtiene una distribuciónhipergeométrica:

−−

==

n

N

kn

)p1(N

k

Np

)knf(P n

Se obtiene en este caso un error estandar: )1N(n

)nN)(p1(p|]pf(|e n −

−−=−

Si el tamaño N de la población es grande, da lo mismo si se hace un muestreo con o sin reemplazo. Si N espequeño, conviene usar un muestreo sin reemplazo. La última formula muestra que el tamaño de la muestranecesario para alcanzar un error e dado es casi independiente del tamaño N de la población:

)1N(e)p1(p

)p1(Npn

2 −+−−=

Se presenta a continuación los tamaños muestrales necesarios para obtener un error e=0.05 cuando p=0.5:

N 500 1000 5000 10000 50000 +∞n 83 91 98 99 100 100

2.4.2 Media muestral

Sean n21 X,...,X,X , valores muestrales independientes e idénticamente distribuidos (i.i.d.) de una v.a. X.

Se define la media muestral o media empírica como ∑=i

in Xn

1X . Si la distribución de población tiene

como esperanza y varianza µ y 2σ respectivamente ( µ=)X(E i y 2i )X(Var σ= para todo i), entonces

µ=)X(E n . Lo que significa que en promedio los valores dados por las medias muestrales nX coinciden

con la media µ de la población. Pero por una muestra dada, el valor nX se encontrara en general un pocopor debajo o encima de µ debido al muestreo. La pregunta entonces es de evaluar el error promedio. La

repuesta esta dada por la varianza de nX , es decir la dispersión promedio de nX alrededor de µ :

n)X(Var

2

nσ= .

Luego observamos que la dispersión de los valores de nX alrededor de µ disminuye cuando el tamaño n dela muestra crece. Además con la desigualdad de Chebychev, para un ε dado se tiene:

Page 6: stat02

N. LACOURLY

18

2

2

nn

)X(|Pεσµ ≤−

Nota: si el muestreo es aleatorio sin reemplazo en una población finita de tamaño N entonces

n)1N(

)nN()X(Var

2

n −−= σ

. Cuando la población es infinita ( +∞→N ) se obtiene la expresión de la varianza

del caso con reemplazo.

Si además la distribución de población es normal entonces la distribución en el muestreo de nX también lo

es. Los valores muestrales iX no provienen necesariamente de una distribución normal pero si son i.i.d.,

entonces la distribución asintótica de n/

X n

σµ−

es N(0,1) (TEOREMA CENTRAL LIMITE).

De aquí el rol privilegiado de la distribución normal. Pero se observara que la propiedad no es cierta si no secumple la condición de Lindberg. Muchas distribuciones empíricas son representables por una distribuciónnormal, pero no es siempre el caso. En particular en hidrología , el caudal de los ríos, que es la suma devarios ríos más pequeños, no se tiene la independencia entre las componentes que intervienen y se obtienedistribuciones claramente asimétricas.

2.4.3 Varianza muestral

Sea una m.a.s. n21 X,...,X,X , con µ=)X(E i y 2i )X(Var σ= . Se define la varianza muestral o

varianza empírica a la dispersión promedio de los valores muestrales con respecto de la media muestral:

∑∑ ∑ −−−=−=−=i

2n

2i

i i

2n

2i

2ni

2n )X()X(

n

1XX

n

1)XX(

n

1S µµ

Teorema 5 (Liapounoff): Si n21 X,...,X,X ... es una sucesión de v.a. independientes tales que

• sus varianzas ,...v,...,v,v n21 son finitas;

• a suma ∑=

=n

1jjn vS crece con n pero los cocientes

n

j

S

v tienden hacia cero cuando n crece

(condición de Lindeberg)

Entonces si ∑=

=n

1jjn XT , la distribución de la v.a.

)T(Var

)T(ETZ

n

nnn

−= ,cuando n aumenta, tiende hacia

una distribución que tiene una forma independiente de las distribuciones de las jX : es la

distribución N(0,1).

Page 7: stat02

2. DISTRIBUCIONES EN EL MUESTREO

19

Propiedades:

• 2.s.c

2nS σ→ ( )X(EX

n

1 2

i

.s.c2i∑ → y 2

.s.c2n )]X(E[X → ).

• 2.c.m

2nS σ→ ( 0])S[(E 222

n →−σ )

• Cálculo de )S(E 2n

∑∑ −−−=−= ])X[(E])X(n

1[E])XX(

n

1[E)S(E 2

n2

i2

ni2n µµ

222

2ni

2n n

1n

nn

1)X(Var)X(Var

n

1)S(E σσσσ →−=−=−= ∑∑

• Cálculo de )S(Var 2n

])3n()1n[(n

1n)S(Var 4

432n σµ −−−−=

en que ])X[(E 44 µµ −= es el momento teórico de orden 4 de la v.a. X.

(Se deja este cálculo como ejercicio)

0n

)S(Var4

42n →

−≈

σµ

• Cálculo de )S,X(Cov 2nn

)n

1nS)(X[(E)S,X(Cov 22

nn2nn σµ −−−=

)]n

1n)X()X

n

1)(X

n

1[(E)S,X(Cov 22

n2

ji2nn σµµµ −−−−−−= ∑∑

Como 0)X(E i =− µ i∀ y 0)X)(X[(E ji =−− µµ )j,i(∀

∑ ∑∑ −−=−−−= )X(En

1])X[E

n

1])X([E])X[E

n

1)S,X(Cov 3

i33

i23

n3

i22nn µµµ

0n

)1n()S,X(Cov 32

2nn →−= µ (lo que no significa que hay independencia).

En particular si la distribución es simétrica ( 03 =µ ), entonces 0)S,X(Cov 2nn = .

2.4.4 Caso de una distribución normal

Sean ),(N~X 2i σµ i.i.d. (i=1,2,…,n) )

n,(N~X

2

nσµ⇒ .

∑ −−−= 2n

2i

2n )X()X(

n

1S µµ ⇒

2n

2i

2

2n

n/

XXnS

−−

=∑ σµ

σµ

σ

Como las v.a. i.i.d.

σµiX

siguen una distribución N(0,1), entonces 2

iX∑

σµ

es una suma de los

cuadrados de n v.a. independientes de la distribución N(0,1) cuya distribución es fácil de calcular y se llama

Page 8: stat02

N. LACOURLY

20

Ji-cuadrado con n grados de libertad y se denota 2nχ . Por otro lado,

2n

n/

X

−σ

µ sigue una distribución

21χ con 1 grado de libertad.

En efecto recordemos en primer lugar la distribución de 2ZY = , en que )1,0(N~Z . Sea Φ la función dedistribución de Z y F la función de distribución de Y:

)y()y()yZy(P)yZ(P)yY(P)y(F 2 −−=≤≤−=≤=≤= ΦΦ

Se deduce la función de densidad de Y:

0y )2

yexp(y

2

1)y(f 2

1

>∀−=−

π

Se dice que Y sigue una distribución Ji-cuadrado con 1 grado de libertad, denotada 21χ .

Observando que la v.a. 21χ tiene una distribución Gamma particular )

2

1,

2

1(Gamma , la función generatriz

de momentos (f.g.m.) se escribe: 2

1t

t21

1)e(E)t(

2/1tY

Y <∀

−==Ψ

Sea ∑ ∑==i i

2ii ZYU en que las 2

iZ son 21χ independientes, entonces

t21

1)t(

2/n

U

−=Ψ , que es la

f.g.m. de una distribución )2

1,

2

n(Gamma .

Se deduce así la función de densidad de U la v.a. 2nχ , con distribución Ji-cuadrado con n g.l.:

0u )2

uexp(

)2/n(2

u)u(f

2/n

12

n

U >∀−=−

Γ

Se observa que E(U)=n y Var(U)=2n y se tiene el siguiente resultado:

Corolario 1: La suma de k v.a. independientes y de distribución 2χ a k21 r,...,r,r g.l. respectivamente

sigue una distribución 2χ a k21 r...rr +++ g.l..

Aplicamos estos resultados al cálculo de la distribución de 2nS cuando ),(N~X 2σµ .

Teorema 6: Sean n21 X,...,X,X v.a. i.i.d. de la ),(N 2σµ , entonces la v.a. 22n /nS σ sigue una

distribución Ji-cuadrado 21n−χ a n grados de libertad.

Page 9: stat02

2. DISTRIBUCIONES EN EL MUESTREO

21

Demostración:

Sea X el vector formado de las n v.a. iX y una transformación ortogonal Y=BX tal que la primera fila de Bes igual a

)n/1 ,...,n/1 ,n/1( . Se tiene entonces que:

• n1 XnY =

• ∑ ∑ ∑ +−==i i i

2n

2ni

2i

2i Xn)XX(XY

• 2n

2n

23

22 nSY...YY =+++

• 2n

21

2n

22

21 )X(...)X(Y...Y)nY( µµµ −++−=+++−

La densidad conjunta de )Y,...,Y( n1 es entonces proporcional a:22

n2

22

1 2/Y...Y)nY(exp σµ −−−−−

Luego las v.a. 2n

21 Y,...,Y son independientes y ),n(N~XnY 2

n1 σµ= .Se deduce que

21n2

2n

22

2

2n ~

Y...YnS−

++= χ

σσ

Además nX y 2nS son independientes.

Teorema 7: Sean n21 X,...,X,X v.a. i.i.d., entonces nX y 2nS son independientes si y sólo si los

valores iX provienen de una distribución normal.

La demostración se deduce del teorema 6 y del corolario 1.

Definimos a continuación la distribución t de Student (Student es un seudónimo utilizado por el estadísticoinglés W. S. Gosset para publicar), que tiene muchas aplicaciones en inferencia estadística como la

distribución 2χ .

Definición 2 : Si X e Y son dos v.a. independientes, )1,0(N~X e 2n~Y χ , entonces la v.a.

n/Y

XT =

sigue una distribución t de Student a n grados de libertad.

Buscamos la función de densidad de la v.a. T. Si f es la densidad conjunta de (X,Y) y 1f y 2f las

densidades marginales de X e Y respectivamente, entonces )y(f)x(f)y,x(f 21= .

ℜ∈∀−= x )2

xexp(

2

1)x(f

2

1 π

0y )2/n(2

)2

yexp(y

)y(f2/n

12

n

2 >∀−

=

Γ

Page 10: stat02

N. LACOURLY

22

El jacobiano del cambio de variables con n/WTX = e Y=W es n/WJ = . Deducimos la densidadconjunta de (T,W):

ℜ∈∀>∀=−−−

t 0,w )2/n(2

ew

2

e

n

w)w,t(g

2/n

2

w1

2

n

n2

wt2

Γπ

ℜ∈∀>∀=+

+−−

t 0,w )2/n(2n

ew)w,t(g

1n

w)n

t1(

2

1

2

1n 2

Γπ

Y la función de densidad de T:

ℜ∈∀++

=

+−

t )2/n(n

)n

t1)(2/)1n((

)t(h

2/)1n(2

Γπ

Γ

Se observa que la función de densidad de T es simétrica y E(T)=0 y 1n

n)T(Var

−= para 2n ≥ . Además

para n=1 se tiene la distribución de Cauchy y para n grande se puede aproximar la distribución de T a unaN(0,1).

Aplicando estos resultados, deducimos que la distribución de la v.a.

)1n/(S

XV

2n

n

−=

µ

es una t de Student con n-1 grados de libertad denotada 1nt − .

2.4.5 Valores extremos

Es importante estudiar más precisamente la distribución F considerando su forma, entre que valores podríanestar los valores muestrales, si hay simetría, entre otro.

Sean n21 X,...,X,X valores muestrales. Se define )h(X el estadístico de orden h como el hiesimo valor

muestral de la muestra ordenada de menor a mayor. Es decir que )n()2()1( X...XX ≤≤≤ . Los estadísticos

de orden son variables aleatorias y nos interesamos en particular en XMinX ii

)1( = y XMaxX ii

)n( = .

En el curso de Probabilidades se estudio las distribuciones de estos estadísticos de orden en función de ladistribución de población F(x) de X. En particular:

• La distribución de XMinX ii

)1( = es: n))x(F1(1 −− ;

• La distribución de XMaxX ii

)n( = es: n))x(F( .

El rango )1()n( XXW −= o ( )X,X( )k()h( son otros estadísticos interesantes a estudiar.

Page 11: stat02

2. DISTRIBUCIONES EN EL MUESTREO

23

2.4.6.Cuantilas muestrales

Definición 3: Dada una función de distribución F(x) de X, se llama cuantila de orden α al valor αx tal que

αα =)x(F .

En el caso empírico, si tomamos 5.0=α , entonces 5.0x es tal que hay tantos valores muestrales por debajo

que por arriba de 5.0x , que se llama mediana muestral o empírica. Se llaman cuartiles a 25.0x y 75.0x y

intervalo intercuartil a 25.075.0 xx − .

Se observara que para una distribución discreta o empírica nF una cuantila para un α dado no es única en

general. Se define entonces como αx al valor tal que

)xX(P)xX(P αα α ≤≤≤<