Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de...
-
Upload
hoangnguyet -
Category
Documents
-
view
222 -
download
0
Transcript of Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de...
Inferencia Estadística
Mg. Stella Figueroa
Clase Nº10
1er C.2019
Población: Es el conjunto de todos los elementos o unidadeselementales con características comunes. Cada característica a
estudiar es una variable observada en la población.
Muestra: Es un subconjunto de la población al que
tenemos acceso y sobre el que efectuamos las mediciones.
Población y Muestra- Parámetro y Estimación puntual
Parámetro : Es una característica numérica que describe una variable observada en
la población
Estimación puntual: Es una característica numérica que describe una variable
observada en la muestra
Muestra aleatoria yMuestreo Aleatorio Simple (M.A.S.)
• En el M.A.S, cada elemento de la población
tiene la misma probabilidad de ser elegido
para formar parte de la muestra.
• El M.A.S, en poblaciones finita, se realiza
“con reemplazamiento”. Este
procedimiento garantiza la independencia de
las observaciones.
• Dada una población donde observamos la variable
aleatoria X, con características numéricas µ y σ2,
una Muestra aleatoria simple de tamaño n, es un
conjunto de n variables aleatorias X1, X2, X3,….Xn
que verifican:
• Ser Independientes entre sí
• Cada Xi tiene idénticas características numéricas
que X, es decir E(Xi)= µ y V(Xi)= σ2
Muestra aleatoria Muestreo Aleatorio Simple
(M.A.S.)
Muestra
Estos valores numéricos son
estimaciones puntuales
¿Podemos asegurarnos que son buenas estimaciones?
El objetivo de
tomar una
muestra es
obtener
información sobre
los parámetros
no conocidos de
la población
Parámetros
desconocidos
𝑥 𝑠2 𝑝
Inferencia Estadística
Distribución de frecuencias de las estimaciones de la media poblacional μ
Distribución de frecuencias de las estimaciones de la proporción
poblacional ρ
Estimaciones puntuales y Estadísticos muestrales (o Estimadores)
𝑥
Las estimaciones son
valores numéricos de
la variable media
muestral
Las estimaciones son valores
numéricos de la variable
proporción muestral
El Estadístico o Estimador de la media poblacional o de la proporción poblacional, es la variable
aleatoria media muestral o proporción muestral respectivamente. Su distribución de probabilidad se
conoce como distribución muestral del estadístico respectivo.
1. Propiedad de insesgadura:
Un estimador 𝜃 es un estimador insesgado del parámetro θ, si E( 𝜃)= θ
Propiedades de los estimadores (o de los estadísticos muestrales)
Es decir, el valor esperado del estimador de un parámetro es ese parámetro
Ejemplos: la media y la varianza muestrales son estimadores insesgados de μ y
σ2 Respectivamente. Demostrarlo2. Propiedad de eficiencia:
Un estimador 𝜃1 es más eficiente que otro estimador 𝜃2
Si es insesgado de θ y la varianza de 𝜃1 es menor que la varianza de 𝜃2
3. Propiedad de suficiencia:
Un estimador es suficiente si utiliza toda la información de la muestra.
Propiedades de los estimadores (o de los estadísticos muestrales)
La media muestral es un estimador suficiente de µ
4. Propiedad de consistencia:
Un estimador de un parámetro es consistente si converge en
probabilidad a ese parámetro cuando el número de datos de la
muestra es lo suficientemente grande.
La media muestral es un estimador consistente de μ ¿Por qué?
La frecuencia relativa o proporción muestral es un estimador
consistente de qué parámetro? ¿Por qué?
1 2, ,...., nx x xSean variables aleatorias independientes y distribuidas en
forma normal estandarizada. Entonces la variable
aleatoria 2 2 2 2 2
1 2 3 ..... nx x x x
Tiene distribución Chi-Cuadrado con n grados de libertad.
La media y la varianza de esta distribución es
2 2n n
Es no negativa y asimétrica hacia la derecha.
Distribución de probabilidades del estadístico Chi-Cuadrado
Distribución muestral del estadístico 𝑺𝟐
2
2
1 2
1n
n S
Si es la varianza de una muestra aleatoria de tamaño n tomada
de una población normal que tiene una varianza 2
Entonces el estadístico se distribuye como
gl=2
gl=3
gl=4gl=5
0 2 Chi2 6 8
2
2 1
1
n
i
i
x x
Sn
2
1n
La distribución muestral de s2 es
la distribución Chi-cuadrado con n-1 gr de
libertad.
Si se extraen todas las muestras posibles de una
población normal y a cada muestra se le calcula
su varianza, se obtendrá la distribución
muestral de varianzas con esta distribución.
Verificarlo!!!
Uso de la tabla para la Distribución de Chi-Cuadrado
gl=2
gl=3
gl=4gl=5
0 2 Chi2 6 8
P(𝜒22 ≥ 𝜒0,05;2
2 ) =P(𝜒22 ≥ 5,99 ) = 0,05
Una máquina de llenado opera con una varianza de 0.83 g2. Si se toma una
muestra de 15 unidades, ¿cuál es la probabilidad de tener una varianza
muestral superior a 1,249 g2?
2S
Problema
𝑃(𝑆2 ≥ 1,249) = P𝑛−1 x 𝑆2
𝜎2≥14 x 1,249
0,83=P 𝜒14
2 ≥14 x 1,249
0,83=
=P(𝜒142 ≥ 21,067) = 0,1
Distribución de probabilidades del estadístico T (de Student)
Si Z~ 𝑁 0,1 y 𝑆2 ~𝜒𝑛−12 son v.a.independientes, entonces t=
𝑍
𝑆2⁄𝑛~𝑇𝑛−1
• Tiene forma de campana, pero su dispersión es mayor
que la curva normal estándar (más aplanada)
• Es simétrica respecto a x = 0, es decir 𝜇 = 0
• No se trata de una única curva. Cada curva está
caracterizada por los grados de libertad (n-1), donde n es
el tamaño de la muestra.
• Para n mayor que 30, la dispersión muestral se aproxima
a la dispersión de la población. Esto hace que la curva se
aproxime a la distribución normal
https://es.wikibooks.org/wiki/Tablas_estad%C3%ADsticas/D
istribuci%C3%B3n_t_de_Student#/media/File:Distribuci%C3%
B3n_T_01.svg
Uso de la tabla para la Distribución T
0,05;10
0,95;10 0,05;10
1,812 0,05
1,812
P T t P T
t t
Distribución de probabilidades del estadístico Fisher
Esta distribución
muestral se utiliza para
comparar varianzas
Si X1, X2, . . . , Xn y Y1, Y2 , Y3, . . . , Ym son dos conjuntos de variables aleatorias independientes, con
distribución N(0 , 1). Si 𝑆𝑥2 ~𝜒𝑛−1
2 𝑦 𝑆𝑦2 ~𝜒𝑚−1
2 son variables aleatorias independientes, la variable
aleatoria (cociente de dos v.a.s chi-cuadrado normalizadas), llamado estadístico F= 𝑺𝒙𝟐
𝑺𝒚𝟐 ~𝑭 (n-1, m-1)
Distribución de Fisher
Ej: Si n1 =n-1 y
n2=m-1 son los
grados de
libertad de cada
muestra,
Para n1= 4
y n2 =6
P(F>4,53)= 0,05
P(F>9,15)=0,01
Distribución de algunos estimadores o estadísticos muestrales
• De la media muestral con varianza poblacional conocida:
~~
• De la media muestral con varianza poblacional desconocida y n < 30:
• De la media muestral con varianza poblacional desconocida y n ≥30:
Problema
Se sabe que el diámetro de discos de metal de cierta marca, en mm, se
distribuye normalmente con una media de 50 mm y una dispersión de 5 mm.
Una muestra aleatoria de estos discos de tamaño 20, dio un promedio de sus
diámetros de 48 mm. ¿Es un valor posible, de acuerdo a la información dada?
Para saberlo, calcula la probabilidad de que la media muestral de los discos
alcance, al menos, 48 mm.