Tema 4: Introducci on a la Inferencia Estad stica...Cuando los elementos de la poblaci on son homog...

38
1 Tema 4: Introducci´on a la Inferencia Estad´ ıstica Contenidos I Conceptos b´ asicos. I Muestreo y muestras aleatorias simples. I Distribuciones en el muestreo. La distribuci´ on de la media muestral. I Estimaci´ on puntual. I Intervalos de confianza. I Contraste de hip´ otesis. Estad´ ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

Transcript of Tema 4: Introducci on a la Inferencia Estad stica...Cuando los elementos de la poblaci on son homog...

  • 1

    Tema 4: Introducción a la Inferencia Estad́ıstica

    Contenidos

    I Conceptos básicos.

    I Muestreo y muestras aleatorias simples.

    I Distribuciones en el muestreo. La distribución de la media muestral.

    I Estimación puntual.

    I Intervalos de confianza.

    I Contraste de hipótesis.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 2

    Tema 5: Introducción a la Inferencia Estad́ıstica

    Lecturas recomendadasI Peña, D. y Romo, J., Introducción a la Estad́ıstica para las Ciencias

    Sociales.I Caṕıtulos 19, 20, 21 y 22.

    I Newbold, P. Estad́ıstica para los Negocios y la Econoḿıa.I Caṕıtulos 6.1, 6.2, 7, 8.1, 8.2, 9.1, 9.2.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 3

    Inferencia estad́ıstica

    Objetivo: Estudiar las caracteŕısticas de interés de una población a través dela información contenida en una muestra.

    Identificamos el concepto de población estad́ıstica con el de la variablealeatoria X que es objeto de estudio.

    La ley o distribución de la población es la distribución de valores de la v.a. deinterés, X . Esta distribución puede ser total o parcialmente desconocida (porejemplo, podemos saber es normal, pero desconocer los valores de µ y σ, osaber que es Binomial con p desconocido).

    Las constantes desconocidas que determinan la distribución de la población sellaman parámetros. Son valores numéricos FIJOS, NO ALEATORIOS,inherentes a una población. Los más importantes son:

    I La media poblacional: E [X ].

    I La varianza poblacional: Var [X ].

    I La proporción poblacional: p= probabilidad de éxito en la población.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 4

    MuestreoMuestra: subconjunto finito de una población. El número de individuos queforman la muestra se denomina tamaño muestral.

    ¿Por qué seleccionamos una muestra?

    En la práctica no es posible estudiar todos los elementos de una población:

    I Los elementos pueden existir conceptualmente, pero no en realidad(población de piezas defectuosas que producirá una máquina en su vidaútil).

    I Puede ser inviable económicamente estudiar a toda la población.

    I El estudio llevaŕıa tanto tiempo que seŕıa impracticable e incluso laspropiedades de la población podŕıan variar con el tiempo (encuestaselectorales).

    I El estudio puede implicar la destrucción del elemento (estudio de la vidamedia de una partida de bombillas, estudio de la tensión de rotura deunos cable...)

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 5

    Muestreo aleatorio simple¿Cuándo se utiliza?

    Cuando los elementos de la población son homogéneos respecto de la variablede estudio, es decir, cuando a priori no disponemos de información adicionalsobre la población.

    Una muestra aleatoria simple es aquella en la que:

    1. cada elemento de la población tiene la misma probabilidad de ser escogido,

    2. las extracciones se realizan con reposición, de manera que la población esidéntica en todas las extracciones.

    Comentarios:

    I La condición (1) asegura la representatividad.

    I La condición (2) se impone por simplicidad: si el tamaño de la poblaciónN es grande con respecto al tamaño muestral n, es prácticamenteindiferente realizar el muestreo con o sin reposición.

    Otros tipos de muestreo son por ejemplo el muestreo estratificado y elmuestreo por conglomerados.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 6

    Muestra aleatoria simpleFormalmente:

    Sea X la v. a. de estudio en la población, con distribución F . Una muestraaleatoria simple de tamaño n es un conjunto de n v. a. X1,X2, . . . ,Xn t. q.:

    I X1,X2, . . . ,Xn tienen todas distribución F (Xi ∼ F ∀i).I X1,X2, . . . ,Xn son independientes entre śı.

    Cada valor concreto (x1, x2, . . . , xn) de dicha m. a. s. se denomina muestraparticular.

    Un estad́ıstico es una función real de la m.a.s. X1,X2, . . . ,Xn. Por tanto, unestad́ıstico es una variable aleatoria (a diferencia de un parámetro que es unnúmero FIJO, inherente a la población).

    Ejemplo: Para aproximar E [X ] usamos el estad́ıstico media muestral:

    X =1

    n

    n∑i=1

    Xi .

    Para una muestra particular (x1, x2, . . . , xn), x =1n

    ∑ni=1 xi . ¡OJO! : X 6= x

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 7

    Ejemplo de muestreo e inferenciaDatos:

    I Población compuesta por 24 individuos.

    I V. a. de interés: X = “Tiempo para completar una consulta médica”.

    I Valores:Población 5,1 1,0 0,9 3,8 10,2 2,1 9,5 4,5

    1,0 2,2 1,5 4,8 1,6 8,8 4,3 1,09,0 5,1 0,2 2,3 0,8 7,8 7,7 1,5

    I Media poblacional: E [X ] = 4, 0

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 8

    Ejemplo de muestreo e inferencia

    Muestra 1:

    I Muestra seleccionada en la figura, tamaño 7:

    Muestra 3,8 9,5 4,8 1,6 0,2 0,8 1,5

    I Estad́ıstico de interés: promedio de la muestra 3, 1.

    I Error (sesgo) relativo: (4, 0− 3, 1)/4, 0 = 0, 225.

    Cambios en el muestreo:

    I Selecciones alternativas de los elementos de la muestra.

    I Aumento del tamaño de la muestra.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 9

    Ejemplo de muestreo e inferencia

    Cambios en el tamaño muestral:

    I Si a la muestra del ejemplo anterior le añadimos nuevos elementos, lamedia muestral cambia.

    I Se aproxima al valor de la media poblacional

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 10

    Ejemplo de muestreo e inferencia

    Selección de observaciones:

    I las primeras 7 observ.: 5,1 1,0 0,9 3,8 18,2 2,1 9,5. Media muestral: x̄ = 5, 8.

    Cambios para diferentes selecciones:

    Todas las posibles selecciones

    de 7 observaciones (346,104

    posibilidades)

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 11

    Ejemplo de muestreo e inferencia

    Distribución de la media muestral:

    Para todas las muestras de tamaño 7 y 17 obtenemos:

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 12

    Distribuciones en el muestreo

    Conclusiones:

    I Una muestra aleatoria simple de tamaño n de una v.a. X es un conjuntode v.a. independientes, todas con la misma distribución que X :

    {Xi}ni=1 i.i.d.

    I La media muestral es una variable aleatoria (los estad́ısticos son variablesaleatorias).

    I Depende de la selección (aleatoria) de los individuos en la muestra.

    I Distribución muestral del estad́ıstico: distribución de probabilidad del valor

    de interés para todas las muestras del mismo tamaño.

    I La distribución muestral cambia con el tamaño de la muestra.

    I La variabilidad de los estad́ısticos muestrales disminuye con el tamaño dela muestra.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 13

    Distribuciones en el muestreoEsperanza y Varianza de combinaciones lineales de variables aleatorias:

    Dadas X e Y dos v.a. y a, b ∈ R, se verifica que:

    E [aX ] = aE [X ]E [X + Y ] = E [X ] + E [Y ]

    }⇒ E [aX + bY ] = aE [X ] + bE [Y ]

    Var [aX ] = a2Var [X ]

    si X e Y son independientes:Var [X + Y ] = Var [X ] + Var [Y ]

    ⇒ Var [aX + bY ] = a2Var [X ] + b2Var [Y ](si X e Y indep.)En general, si X1, . . . ,Xn es un conjunto de v.a. y a1, . . . , an ∈ R, se verificaque:

    E [a1X1 + · · ·+ anXn] = a1E [X1] + · · ·+ anE [Xn]

    Var [a1X1 + · · ·+ anXn] = a21Var [X1] + · · ·+ a2nVar [Xn] (si X1, . . . ,Xn indep.)

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 14

    La distribución de la media muestral

    {Xi}ni=1 m.a.s. de tamaño n de una población X .

    I Se define el estad́ıstico media muestral como X =1

    n

    n∑i=1

    Xi .

    I La esperanza de la media muestral es la esperanza poblacional:

    E[X ]def .= E

    [1

    n

    n∑i=1

    Xi

    ]=

    1

    n

    n∑i=1

    E[Xi ]1

    n

    n∑i=1

    E[X ] =1

    nnE [X ] = E [X ]

    I La varianza de la media muestral es la varianza poblacional entre n:

    Var[X ]def .= Var

    [1

    n

    n∑i=1

    Xi

    ]=

    1

    n2Var

    [n∑

    i=1

    Xi

    ]ind.=

    1

    n2

    n∑i=1

    Var [Xi ]=1

    n2

    n∑i=1

    Var [X ] =1

    nVar[X ]

    I Podemos reducir el error de estimación aumentando n.

    I La reducción en el error es lenta.

    I Para reducir el error (medido por la desviación t́ıpica) a la mitad debemosaumentar el tamaño de la muestra 4 veces.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 15

    La distribución de la media muestralI Si X tiene una distribución normal, X ∼ N(E[X ],Var[X ]):

    X =1

    n

    n∑i=1

    Xi ∼ N(E[X ],Var[X ]/n) ⇒X − E[X ]√

    Var[X ]/n∼ N(0, 1)

    (por ser combinación lineal de v.a. indep. con dist. normal, ver Tema 4)

    I Si el tamaño de muestra es suficientemente grande (independientementede cuál sea la distribución de X ):

    Teorema Central del Ĺımite: Dada una muestra aleatoria simple{Xi}ni=1 de tamaño n obtenida de una variable aleatoria X con mediaE[X ] y varianza Var[X ] finitas, se cumple que

    1n

    ∑ni=1 Xi − E[X ]√Var[X ]/n

    → N(0, 1)

    cuando n→∞.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 16

    La distribución de la media muestral

    Observaciones sobre el TCL:

    I En la práctica se dice que X ≈ N(E[X ],Var[X ]/n) cuando n es grande. Laaproximación es buena para n ≥ 30.

    I Si X1, . . . ,Xn es una m.a.s. de una Bernoulli(p) y n es grande

    X ≈ N(p, p(1− p)/n) ⇒ nX ≈ N(np, np(1− p))

    Pero además

    nX =n∑

    i=1

    Xi ∼ B(n, p)

    por ser suma de Bernoullis independientes.Por lo tanto obtenemos una aproximación de una distribución binomialpor una distribución normal para tamaños de muestra grandes.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 17

    La distribución de la media muestral

    Ejemplo:

    Sea X la v.a. discreta con función de probabilidad

    P(X = x) =

    {1/4 si x = 1, 2, 3, 40 si no.

    Se toma una m.a.s. de tamaño 125 de X . ¿Cuál es la probabilidad de que lamedia muestral se encuentre entre 2,4 y 2,6?

    (Dato: FZ (1) = 0,8413, siendo FZ la función de distribución de una normalestándar.)

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 18

    Estimación puntualObjetivo:

    Estimar los parámetros poblacionales que determinan la ley de la población.

    Procedimiento:

    I El proceso de estimación consiste en calcular, a partir de los datos de lamuestra, algún estad́ıstico (por ejemplo, X ) que sirva como aproximacióndel parámetro poblacional correspondiente (E [X ]).

    I Un estad́ıstico es una función real de la m.a.s.: T (X1, . . . ,Xn).

    I Un estimador puntual es un estad́ıstico (sólo función de la muestra) quese utiliza para estimar un parámetro (p.e. X ).

    I Una estimación puntual es el valor de un estimador en una muestraparticular (x 6= X ).

    I De los parámetros sólo conocemos su posible rango de valores, el espacioparamétrico.

    I La notación estándar para un estimador de un parámetro θ es θ̂.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 19

    Estimación puntualPara estimar un mismo parámetro pueden extistir varios estimadores posibles.

    Ejemplo:

    Queremos estimar el gasto medio anual en libros de texto de un estudianteuniversitario.Es decir, si X = “gasto anual en libros de texto/estudiante”queremos estudiarel parámetro poblacional µ = E[X ]. Para ello consideramos una m.a.s. detamaño n.

    Cuatro posibles estimadores de µ son:

    T1(X1, . . . ,Xn) = µ̂1 =1

    n

    n∑i=1

    Xi T2(X1, . . . ,Xn) = µ̂2 =1

    n − 1

    n∑i=1

    Xi

    T3(X1, . . . ,Xn) = µ̂3 =X1 + Xn

    2T4(X1, . . . ,Xn) = µ̂4 = X2 − X1

    ¿Cómo elegimos un estimador? ¿Qué propiedades ha de tener?

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 20

    Estimación puntual

    Sea X1, . . . ,Xn una m.a.s., θ el parámetro de interés y T (X1, . . . ,Xn) unestimador de θ.

    Propiedades deseables en un estimador puntual:

    I Se dice que T es insesgado (o centrado) si

    E[T (X1, . . . ,Xn)] = θ.

    I Dados dos estimadores insesgados de θ, T1 y T2, se dice que T1 es máseficiente que T2 si

    Var[T1(X1, . . . ,Xn)] < Var[T2(X1, . . . ,Xn)].

    I Se dice que T es consistente si T (X1, . . . ,Xn) “converge” a θ cuando ntiende a infinito.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 21

    Estimación puntualEjemplo (cont.):

    E [T1] = E

    [1

    n

    n∑i=1

    Xi

    ]=

    1

    n

    n∑i=1

    µ︷ ︸︸ ︷E [Xi ] = µ ⇐ insesgado

    E [T2] = E

    [1

    n − 1

    n∑i=1

    Xi

    ]=

    1

    n − 1

    n∑i=1

    E [Xi ] =n

    n − 1µ

    E [T3] = E

    [X1 + Xn

    2

    ]=

    E [X1] + E [Xn]

    2=µ+ µ

    2= µ ⇐ insesgado

    E [T4] = E [X2 − X1] = E [X2]− E [X2] = µ− µ = 0

    Var[T1] = Var[X ] = Var[X ]/n

    Var[T3] = Var

    [X1 + Xn

    2

    ]=

    1

    4Var [X1 + Xn]

    ind.=

    Var[X1] + Var[Xn]

    4= Var[X ]/2

    Elegiremos T1 = X ya que es insesgado y más eficiente que T3.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 22

    Estimación puntual¿Cómo comparar un estimador sesgado con uno insesgado?

    El error cuadrático medio (E.C.M.) de un estimador T (X1, . . . ,Xn) de θ es:

    ECM[T (X1, . . . ,Xn)] = E[(T (X1, . . . ,Xn)− θ)2

    ]Eligiremos el estimador con menor E.C.M.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 23

    Estimación puntual

    Propiedades del E.C.M.:

    I Se verifica que:

    ECM[T (X1, . . . ,Xn)] = Var[T (X1, . . . ,Xn)] + (E [T (X1, . . . ,Xn)]− θ)2

    = Var[T (X1, . . . ,Xn)] + (Sesgo(T (X1, . . . ,Xn)))2

    I Para un estimador insesgado de θ:

    ECM[T (X1, . . . ,Xn)] = Var[T (X1, . . . ,Xn)]

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 24

    Estimación puntual

    Ejemplo:

    El consumo de un cierto producto en una familia de cuatro miembros durantelos meses de verano, es una variable aleatoria con distribución uniforme en elintervalo (α, α + 1)

    f (x) =

    {1 x ∈ (α, α + 1)0 resto

    Sea (X1, . . . ,Xn) una m.a.s. de consumos de distintas familias.

    a) Demostrar que la media muestral es un estimador sesgado de α y quesu sesgo es 12 .

    b) Calcular el error cuadrático medio de X̄ .

    c) Obtener un estimador insesgado de α (a partir de X̄ ).

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 25

    Estimación por intervalos de confianza

    Sea XXX = (X1,X2, . . . ,Xn) una m.a.s. de una población X con función dedistribución Fθθθ donde θθθ = (θ1, θ2, . . . , θk) es un vector de parámetros.

    Un estimador por intervalos de confianza de θi al nivel de confianza 1− α esuna función que a la muestra particular xxx = (x1, x2, . . . , xn) le hacecorresponder un intervalo

    (T1(xxx),T2(xxx)) =(T1(x1, x2, . . . , xn),T2(x1, x2, . . . , xn)

    )que satisface:

    P (θi ∈ (T1(XXX ),T2(XXX ))) = 1− α

    para cada θi ∈ Θi (espacio parmétrico).

    I Notar que (T1(XXX ),T2(XXX )) 6= (T1(xxx),T2(xxx)).I Se dice (T1(xxx),T2(xxx)) es un intervalo de confianza de θi al nivel 1− α.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 26

    Estimación por intervalos de confianza

    Ejemplo: X1,X2, . . . ,Xn es una m.a.s. de una población X ∼ N (µ, σ2) con σ2conocida. Hallar un estimador por intervalos de confianza para la media, µ.

    I Sabemos que X̄ ∼ N (µ, σ2

    n) ⇒ X̄ − µ

    σ/√

    n∼ N (0, 1)

    I Entonces P(− zα/2 <

    X̄−µσ/√n< zα/2

    )= 1− α

    Un intervalo de confianza para µ al nivel 1− α es(x̄ − zα/2

    σ√n, x̄ + zα/2

    σ√n

    )Otros intervalos son (

    x̄ − zασ√n,+∞

    )(−∞, x̄ + zα

    σ√n

    )Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 27

    Estimación por intervalos de confianza

    Ejemplo: Supongamos que los rendimientos de las acciones de la empresaSEGURA.SL siguen una distribución normal de media µ euros y varianzaσ2 = 1. Se toma una m.a.s. de n = 20 rendimientos y se tiene

    5,29, 3,66, 5,71, 6,62, 4,30, 5,85, 6,25, 3,40, 3,55, 5,57,

    4,60, 5,69, 5,81, 5,71, 6,29, 5,66, 6,19, 3,79, 4,98, 4,84

    a) Calcular un intervalo de confianza al 90 % para el rendimiento promedio deesta empresa.

    x̄ =1

    20

    (5,29 + 3,66 + · · ·+ 4,84

    )= 5,188(

    x̄ ∓ zα/2σ√n

    )=(

    5,188∓ 1,645× 1√20

    )= (4,6678, 5,7082)

    I ¿P(µ ∈ (4,6678, 5,7082))?I ¿µ ∈ (4,6678, 5,7082) ?

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 28

    Interpretación frecuentista del intervalo de confianza

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 29

    Contraste de hipótesisObjetivo: El objetivo de los tests o contrastes de hipótesis es el de tomar unadecisión sobre la población estudiada, a partir de una muestra.

    Hipótesis estad́ısticas: Una hipótesis estad́ıstica (H) es una proposiciónacerca de una caracteŕıstica de la población de estudio (“la variable X tomavalores en (a, b)”, “el valor de θ es 2”, “la distribución de X es normal”, etc.)

    Ejemplos:

    I Una compañ́ıa recibe un gran cargamento de piezas. Sólo acepta el env́ıosi no hay más de un 5 % de piezas defectuosas. ¿Cómo tomar una decisiónsin verificar todas las piezas?

    I Se quiere saber si una propuesta de reforma legislativa es acogida de igualforma por hombres y mujeres. ¿Cómo se puede verificar esa conjetura?

    Estos ejemplos tienen algo en común:

    I Se formula la hipótesis sobre la población.

    I Las conclusiones sobre la validez de la hipótesis se basarán en lainformación de una muestra.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 30

    Contraste de hipótesis

    Tipos de hipótesis estad́ısticas:I Paramétricas: Una hipótesis paramétrica es una proposición sobre los

    valores que toma un parámetro.

    I Simple: aquella que especifica un único valor para el parámetro.

    Ejemplos: ‘H : θ = 0”, “H : θ = −23”, etc.

    I Compuesta: aquella que especifica un intervalo de valores para elparámetro.

    Ejemplos: ‘H : θ ≥ 0”, “H : 1 ≤ θ ≤ 4”, etc.

    I Unilateral: “H : θ ≤ 4”, ‘H : 0 < θ”, etc.

    I Bilateral: “H : θ 6= 4⇔ H : θ < 4 y θ > 4”

    I No paramétricas: Una hipótesis no paramétrica es una proposición sobrecualquier otra caracteŕıstica de la población.

    Ejemplos: “H : X ∼ N”, “H : X ind. Y ”, etc.Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 31

    Contraste de hipótesis

    Hipótesis nula y alternativa:

    La hipótesis nula, H0, es la hipótesis que se desea contrastar. Es la hipótesisque se plantea en primer lugar y la que mantendremos a no ser que los datosindiquen su falsedad.

    I La hipótesis nula siempre contiene los signos “=”, “≤” ó “≥”.I La hipótesis nula nunca se acepta, se rechaza o no se rechaza.

    La hipótesis alternativa, H1, supone una alternativa a la hipótesis nula(generalmente es su negación). Es generalmente la hipótesis que se quiereverificar.

    I La hipótesis alternativa nunca contiene los signos “=”, “≤”ó “≥”.I La hipótesis alternativa puede aceptarse o no aceptarse.

    Ejemplo: En cursos pasados, el número medio de préstamos por año y poralumno en la biblioteca de la Carlos III ha sido de 6. Este año la biblioteca hahecho una campaña de información y quiere saber el efecto que ésta ha tenidoentre los estudiantes. ¿Cuáles seŕıan las hipótesis nula y alternativa?

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 32

    Contraste de hipótesis

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

    ¿Es probable queX = 1,72 si µ = 1,60?

    Si no lo es, rechazamos H0

    La media muestrales 1.72 m(x = 1,72)

    Muestreo aleatoriosimple

    Muestra

    Población

    Hipótesis: la alturamedia de lapoblación es 1.60 m(H0 : µ = 1,60)

  • 33

    Contraste de hipótesis

    Estad́ıstico del contraste: es un estad́ıstico, T , que se construye a partir deun estimador del parámetro y cuya distribución bajo H0 es conocida.

    Regla de decisión: un contraste de hipótesis es una regla que determina, a uncierto nivel de significación, α, para qué valores de la muestra se rechaza o nose rechaza la hipótesis nula.Se trata de definir una región cŕıtica o de rechazo, RCα, y una región deaceptación, RAα tales que

    R = RCα∪RAα, RCα∩RAα = ∅

    P(T (XXX ) ∈ RCα|H0) = αP(T (XXX ) ∈ RAα|H0) = 1− α

    El nivel de significación es la probabilidad de que, bajo H0, el estad́ıstico delcontraste tome valores en la RCα.Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 34

    Contraste de hipótesisEstado real

    Decisión H0 cierta H0 falsaError de Tipo I Decisión correcta

    Rechazar H0 P(Rech.|H0cierta) = α P(Rech.|H0falsa) = 1− βnivel de significación potencia

    No rechazar H0 Decisión correcta Error de Tipo IIP(No Rech.|H0cierta) = 1− α P(No Rech.|H0falsa) = β

    1. Podemos hacer la probabilidad del error de tipo I tan pequeña como queramos,PERO esto hace que aumente la probabilidad del error de tipo II.

    2. Un contraste de hipótesis puede rechazar la hipótesis nula pero NO puedeprobar la hipótesis nula.

    3. Si no rechazamos la hipótesis nula, es porque las observaciones no han aportadoevidencia para descartarla, no porque sea neceseariamente cierta.

    4. Por el contrario, si rechazamos la hipótesis nula es porque seestá razonablemente seguro (P(Rech.|H0cierta) ≤ α) de que H0 es falsa yestamos aceptando impĺıcitamente la hipótesis alternativa.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 35

    Contraste de hipótesis

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

    p =P (T (X1, . . . ,Xn) > T (x1, . . . , xn))

    El nivel cŕıtico, p, o p-valor es el nivel de significación más pequeño para elque la muestra particular obtenida obligaŕıa a rechazar la hipótesis nula. Esdecir:

    p = P(Rech.H0 para x1, . . . , xn|H0cierta)

    Ejemplo: si T (X1, . . . ,Xn) es el estad́ıstico de un contraste unilateral en elque RCα = {T (x1, . . . , xn) | T (x1, . . . , xn) > Tα} entonces

  • 36

    Contraste de hipótesisEjemplo: Supongamos que la altura (en cm) de los estudiantes de la UC3M esuna v.a. X con distribución N(µ, 52). Con el objetivo de estimar µ se toma unam.a.s. de 100 estudiantes y se obtiene x = 156,8.

    Se quiere contrastar la siguiente hipótesis sobre esta población: “la alturamedia de los estudiantes de la UC3M es de 160c” al nivel de significación 0.05.

    1. Plantear las hipótesis nula y alternativa:

    H0 : µ = 160 H1 : µ 6= 160

    2. Determinar el estad́ıstico del test y su distribución bajo H0 (Formulario).

    X ∼ N(µ, 52), por tanto

    X − µ5/√

    n∼ N(0, 1)⇒ X − 160

    5/√

    n

    H0∼ N(0, 1)

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 37

    Contraste de hipótesis

    3.a Construir la región cŕıtica y comprobar si la muestra obtenida está en ella(rechazamos H0) o no (no rechazamos H0). Sabemos que bajo H0

    1− α = P(−zα

    2<

    X − 1605/√

    n< zα

    2

    )Por tanto

    RCα ={∣∣∣ x−1605/√n ∣∣∣ > zα2 }

    RAα = R\RCα ={∣∣∣ x−1605/√n ∣∣∣ ≤ zα2 }

    Para α = 0,05 (n = 100, x = 156,8):∣∣∣∣x − 1605/√n∣∣∣∣ = ∣∣∣∣156,8− 1605/10

    ∣∣∣∣ = |−6,4| = 6,4 y zα2 = 1,96es decir x−160

    5/√n∈ RC0,05 ⇒ rechazamos H0 al nivel de significación 0.05.

    Estad́ıstica I. ECO/ Dobles grados ECO-DER y ADE-INF 2010/11 Tema 4

  • 38

    Contraste de hipótesis

    3.b (Otra alternativa) Calcular el p-valor para la muestra obtenida.

    p = P(Rech.H0 para x1, . . . , xn|H0cierta)

    = P(∣∣∣X−1605/√n ∣∣∣ > ∣∣∣ x−1605/√n ∣∣∣ |H0cierta)

    Z= X−1605/√

    n

    H0∼N(0,1)= P

    (|Z | >

    ∣∣∣ 156,8−1605/10 ∣∣∣) = P(|Z | > 6,4) = 2 · P(Z > 6,4) ≈ 0El p-valor obtenido es menor que α (p ≈ 0