Semana 03-Prueba de Hipotesis

download Semana 03-Prueba de Hipotesis

of 56

description

HIPOTESIS

Transcript of Semana 03-Prueba de Hipotesis

  • Lic. Segundo A. Garca Flores

    ESTADSTICA PARA NEGOCIOS II

    Mdulo: II Unidad: II Semana: 03

  • TTULO DEL TEMA

    PRUEBA DE HIPTESIS

  • ORIENTACIONES

    Lea las previamente las orientaciones generalesdel curso.

    Revise los temas afines a este en la BibliotecaVirtual de la UAP

    Participe de los foros

  • Hiptesis

    Prueba de hiptesis

    Nivel de significancia

    Error

    CONTENIDOS TEMTICOS

  • DESARROLLO DE CONTENIDOS - SUBTTULOS

    DEL TEMA

  • 6OBJETIVO:

    Determinar la validez de supuestospoblacionales a partir del mtodo deprueba de hiptesis para una, dos oms poblaciones.

  • Hiptesis: Es una suposicin acerca del valor de

    un parmetro de una poblacin con el propsito

    de discutir su validez.

    Ejemplo de hiptesis acerca de un parmetro de

    una poblacin son:

    1) El sueldo promedio de un profesional recien

    egresado de la Universidad asciende a $2,625.

    2) El 20% de las amas de casa de Lima utiliza aceite de

    oliva.

    8-3

    Qu es una Hiptesis?

  • Prueba de hiptesis: es un procedimiento,

    basado en la evidencia de la muestra y en la

    teora de las probabilidades, usado para

    determinar si la hiptesis es una afirmacin

    razonable y debera no ser rechazada o si no es

    razonable debera ser rechazada

    8-4

    Qu es una prueba de hiptesis?

  • No rechzar la hiptesis nula Rechazar la nula y aceptar la alternativa

    Paso 5: Tomar una muestra, llegar a una decisin

    Paso 4: Formular una regla de decisin

    Paso 3: Identificar el estadstico de prueba

    Paso 2: Seleccionar el nivel de significacin

    Paso 1: Establecer la hiptesis nula y la alternativaP

    rueb

    a d

    e h

    ip

    tesi

    s

  • Hiptesis nula (H0): Una afirmacin acerca del valor

    de un parmetro de la poblacin.

    Hiptesis Alternativa (H1): Una afirmacin que es

    aceptada si la muestra provee la evidencia de que

    la hiptesis nula es falsa.

    Nivel de significacin: La probabilidad de rechazar

    la hiptesis nula cuando en realidad es verdadera.

    8-6

    Nivel de significacin

  • Error tipo I: Rechazar la hiptesis nula cuando enrealidad es verdadera

    Error tipo II: Aceptar la hiptesis nula cuando enrealidad es falsa.

    Estadstico de prueba: Es un valor, determinado apartir de la informacin de la muestra, usado paradecidir si rechazar o no la hiptesis nula.

    Valor crtico: El punto que divide la regin entre ellugar en el que la hiptesis nula es rechazada y y laregin donde la hiptesis nula es no rechazada.

    8-7

    Error

  • Paso a paso

    a) Hiptesis

    Se debe formular el supuesto valor del parmetro de lapoblacin antes de empezar el muestreo. La suposicinque se desea probar, se denomina hiptesis nula y serepresenta por H0. Si se rechaza la hiptesis nula, laconclusin que debemos aceptar se llama hiptesisalternativa y se simboliza por H1.

  • Ejemplo:Supongamos que se quiere probar la hiptesis de que el promedio decalificacin de los alumnos de cierta Universidad es de 8.5, entonces:

    H0 : = 8.5 (Establece que la media de la poblacin es igual a 8.5)

    La hiptesis alternativa se puede interpretar de tres maneras:

    H1 : 8.5 (Establece que la media de la poblacin no es igual a 8.5)

    H1 : 8.5 (Establece que la media de la poblacin es mayor que 8.5)

    H1 : 8.5 (Establece que la media de la poblacin es menor que 8.5)

    La prueba de hiptesis tiene como finalidad emitir un juicio sobre ladiferencia que existe entre el valor calculado del estadstico muestraly el parmetro supuesto de la poblacin. No consiste en poner enduda el valor calculado del estadstico muestral.

    Despus de formular las hiptesis nula y alternativa, se debe decidir elcriterio que se va a aplicar para aceptar o rechazar la primera.

  • b) Nivel de significanciaSupongamos que la media de calificaciones del ejemplo anterior de 8.5, se expresa

    con un nivel de confianza del 95%, entonces el nivel de significancia ser de 0.05, es

    decir:

    = 1 0.95 = 0,05

    14

    Se puede comprender mejor observando la grfica siguiente:

  • El nivel de significancia est repartido en las zonasde rechazo, 0.025 + 0.025 = 0.05, significa que existeuna diferencia significativa entre el estadstico de lamuestra y el supuesto parmetro de la poblacin, esdecir, que si esto se demuestra, se rechaza la hiptesisnula H0 de que el promedio de la poblacin sea de 8.5 yse acepta la hiptesis alternativa H1.

    Entonces se concluira que el promedio de lascalificaciones de la poblacin, no es de 8.5, puede serdiferente, mayor o menor de 8.5.

    El nivel de significancia representa la zona derechazo de la hiptesis nula y el nivel deconfianza de la zona de aceptacin.

  • c) Seleccin de un nivel de significancia

    No hay un nivel de significancia que sea oficial o universalcon el cual probar las hiptesis. Pero la eleccin delcriterio mnimo de una probabilidad aceptable, o nivel designificancia, es asimismo el riesgo que se corre derechazar una hiptesis nula aunque sea verdadera. Cuandoms alto sea el nivel de significancia que utilizamos alprobar una hiptesis, mayores probabilidades habr derechazar una hiptesis nula que sea verdadera.

  • d) Errores de tipo I y II

    Si se rechaza una hiptesis nula que sea verdadera es unerror de tipo I, y su probabilidad se representa con .

    Si se acepta una hiptesis nula que sea falsa se llama errorde tipo II, y su probabilidad se representa con .

    La probabilidad de cometer uno de estos errores sereduce si se aumenta la probabilidad de incurrir en otrotipo de error.

    A fin de conseguir una baja, habremos de conformarnoscon una alta. Para sortear esto en situaciones personalesy profesionales, los encargados de tomar decisiones eligenel nivel apropiado de significancia examinando los costoso castigos que conllevan a ambos tipos de error.

  • d) Errores de tipo I y II

    Por ejemplo:

    Supngase que el cometer un error de tipo I implica eltiempo y el trabajo de reelaborar un lote de sustanciasqumicas que debera haber sido aceptado. En cambio, elincurrir en un error de tipo II significa correr el riesgo deque se envenene un grupo entero de usuarios de lasustancia. La gerencia de esta compaa preferira el errorde tipo I al de tipo II y, en consecuencia, estableceraniveles muy elevados de significancia en sus pruebas paraconseguir bajas.

  • e) Pasos para seleccionar la distribucin correcta

    1.- Se define el nivel de significancia a usar.

    2.- Determinar la distribucin adecuada deprobabilidad: puede ser la distribucin normalo la distribucin t. Las reglas para elegir ladistribucin apropiada al efectuar pruebas delas medias son:

    a) Si la muestra tomada es mayor de 30 (muestrasgrandes), debe elegirse la distribucin normal (Z).

    b) Si la muestra tomada es igual o menor que 30(muestras pequeas), debe elegirse la distribucin t.

  • PRUEBA DE HIPTESIS DE LAS MEDIAS DE

    MUESTRAS GRANDES

    Realizaremos algunos ejemplos, en diferentes

    condiciones cuando se conocen las desviaciones

    estndar de la poblacin.

  • a) Prueba de dos extremos para las medias

    Es cuando el nivel de significancia (zona de rechazo)

    abarca los dos extremos o colas de la campana de

    Gauss.

  • Ejemplo 1

    El fabricante de una llanta especial para camiones afirma

    que la duracin media de la parte rodante de agarre es de

    60,000 mi. La desviacin estndar de los millajes es de 5,000

    mi. Una empresa de transportes compr 48 llantas y hall

    que la duracin media para sus vehculos fue de 59,500 mi.

    Es la experiencia distinta de la expresada por el fabricante

    al nivel de significacin de 0.05?

    Solucin:

    = 60000 mi; = 5000 mi

    Datos: n = 48 llantas

    = 59500 mi; = 0,05x

  • Solucin:

    Las hiptesis se expresan de la siguiente manera:

    H0 : = 60,000 mi La duracin de las llantas es de 60,000 millas

    H1 : 60,000 mi La duracin de las llantas es distinta a 60,000 millas

    Primero, vamos a calcular el error estndar de la media y para elloemplearemos la expresin del error estndar:

    nx

    Sustituyendo valores en ella, se tiene:

    mix 69,7219282,6

    000,5

    48

    000,5

  • En el siguiente paso vamos a obtener el valor de Z y para ello vamos aapoyarnos en la grfica siguiente:

  • Recurrimos a las tablas de la distribucin normal y en ellaslocalizamos 0.475, que se ubica en un valor de Z = 1.96

    En el tercer paso, vamos a determinar los lmites superior e inferiorde confianza para el intervalo de la media poblacional ya que se tratade una prueba de dos extremos. Para ello aplicaremos la expresinsiguiente:

    Sustituyendo valores en ella, se tiene:

    Lc = 60,000 1.96 (721.69)

    Ls = 60,000 + 1,414.51 = 61,414.51 millas.

    Li = 60,000 1,414.51 = 58,585.49 millas

    Entonces la media de la poblacin flucta entre 58,585.49 y 61,414.51 millas en

    un nivel de confianza del 95%.

    xH ZLc 0

  • Regresemos a la grfica anterior para ubicar los lmitesde confianza y la media muestral. Con ello analizaremossi se acepta la hiptesis nula adems de verificar si esverdadera o falsa.

  • La media muestral se ubica dentro de la zona de aceptacin, por lo que

    podemos decir que la hiptesis nula es verdadera, pero vamos a verificar

    est aseveracin por medio de la expresin siguiente:

    x

    xZ

    693.0

    69,721

    000,60500,59

    Z

    Entonces la media muestral se ubica en -0.693 y se confirma que

    cae en la zona de aceptacin.

    Concluimos que la duracin media de las llantas es muy

    cercana a la que afirma el fabricante de 60,000 millas, con

    un nivel de significancia de 0.05.

  • b) Prueba de un extremo para las medias

    En este caso, el nivel de significancia (zona de rechazo)

    slo abarca un extremo o cola de la campana de Gauss.

  • Ejemplo 2

    Una cadena de restaurantes afirma que el tiempo medio

    de espera de clientes por atender est distribuido

    normalmente con una media de 3 minutos y una

    desviacin estndar de 1 minuto. Su departamento de

    aseguramiento de la calidad hall en una muestra de 50

    clientes en un cierto establecimiento que el tiempo medio

    de espera era de 2.75 minutos. Al nivel de significacin de

    0.05, Es dicho tiempo menor de 3 minutos?

    Solucin:

    = 3 minutos. = 0.05

    = 1minuto. n = 50 clientes.

    = 2.75 minutos.x

  • Representemos estos datos

    en la campana de Gauss:

    Las hiptesis son:

    Ho : = 3 El tiempo

    promedio de espera es de 3

    minutos.

    H1 : 3 El tiempo

    promedio de espera es

    menor de 3 minutos.

    30

  • Primero calculemos el error estndar

    de la media:

    Ahora determinemos el valor de Z,(tenemos una muestra mayor de 30):

    Como = 0.05 y es una prueba dehiptesis para un extremo, en este caso,el extremo izquierdo, entonces, el nivelde significancia est contenido en esteextremo, por lo que el nivel de confianzaes 0.5 0.05 = 0.45 .

    Buscando en las tablas de la distribucinnormal 0.45, encontramos que: Z= 1.64

    El lmite izquierdo del intervalo deconfianza ser:

    Li = 3 1.64 (0.1414) = 3 0.2319

    Li = 2.768

    Grficamente esto se representa as:

    31

    x . 1

    0 141450

  • La media muestral 2.75, se localiza en la zona de rechazo, por lo que

    se puede establecer que se rechaza la hiptesis nula y se acepta la

    alternativa.

    Comprobemos con :

    x

    xZ

    . .Z .

    . .

    2 75 3 0 25

    1 770 1414 0 1414

    Como podemos observar 1.77 est localizado ms hacia la izquierda

    del lmite de confianza 1.64.

    Podemos concluir que el tiempo medio de espera de clientes por

    atender en este establecimiento es menor de 3 minutos.

  • Ejemplo 3 (se desconoce la desviacin estndar)

    Una cadena grande de tiendas de autoservicio, expide su propia tarjeta

    de crdito. El gerente de crdito desea averiguar si el saldo insoluto

    medio mensuales mayor que 400 dlares. El nivel de significacin se fija

    en 0.05. Una revisin aleatoria de 172 saldos insolutos revel que la

    media muestral 407 dlares y la desviacin estndar de la muestra es 38

    dlares. Debera concluir ese funcionario de la media poblacional es

    mayor que 400 dlares, o es razonable suponer que la diferencia de 7

    dlares (obtenida de 407- 400 = 7) se debe al azar?

    Solucin:

    = 400 dlares. = 0.05

    n = 172 saldos insolutos.

    = 407 dlares.

    s = 38 dlares (desviacin estndar estimada).x

  • Las hiptesis son:

    Ho : = 400 dlares.

    H1 : 400 dlares.

    Debido a que la hiptesis

    alternativa nos indica un

    sentido a la derecha de la

    media, debemos aplicar una

    prueba de una cola.

    Veamos la grfica:

    34

  • Si calculamos el error estndar estimados, tenemos que:

    Si leemos en las tablas de la

    distribucin normal 0.45,

    encontramos que: Z = 1.64

    Determinando el lmite superior

    del intervalo de confianza, se

    tiene:

    Ls = 400 + 1.64 (2.897)

    Ls = 404.75 dlares.

    Grficamente esto ocurre:

    35

    x

    s .

    n

    382 897

    172

  • Comprobando con:

    x

    xZ

    407 - 400 7Z = = = 2.416

    2.897 2.897

    Con esto comprobamos que el valor de la media muestral, cae

    dentro de la zona de rechazo, por lo que se rechaza la hiptesis nula

    y se acepta la alternativa.

    Con esto el gerente de crdito debe concluir que el saldo

    insoluto medio mensuales es mayor que 400 dlares.

  • PRUEBAS DE HIPOTESIS DE LAS

    MEDIAS DE MUESTRAS PEQUEAS

    a) Prueba de dos extremos para medias

    Mediante el siguiente ejemplo explicaremos el

    razonamiento a seguir para demostrar una prueba de

    hiptesis de dos extremos con una muestra menor a 30,

    en donde aplicaremos la distribucin t.

  • Ejemplo 1

    Un especialista en personal que labora en una gran corporacin, est

    reclutando un vasto nmero de empleados para un trabajo en el

    extranjero. Durante la realizacin de pruebas, la gerencia pregunta

    cmo marchan las cosas y el especialista contesta: Bien, creo que la

    puntuacin promedio en el test de actitudes ser 90. Cuando la

    gerencia revisa 20 de los resultados de la prueba, averigua que la

    puntuacin media es 84 y la desviacin estndar de esta puntuacin es

    11. Si la gerencia quiere probar la hiptesis del especialista en personal

    en el nivel de significancia de 0.10, cul ser el procedimiento a que

    recurra?

    Solucin:

    = 90 n = 20 = 0.10

    = 84

    s = 11

    x

  • Las hiptesis son:

    Ho: = 90

    H1 : 90

    El error estndar estimado de la media ser:

    x

    .

    n

    112 46

    20

  • En la tabla t de Student se localiza =

    0.10 y gl = 20 1 = 19 y se encuentraque: t = 1.729

    Con estos datos ya podemos

    determinar los limites superior e

    inferior del intervalo de confianza,

    mediante la expresin:

    Ls = 90+ 1.729 (2.46)= 94.25

    Li = 90 1.729 (2.46) = 85.75

    Grficamente esto sucede:

    40

    Como la media muestral cae en la zona de rechazo, entonces se rechazala hiptesis nula y se acepta la hiptesis alternativa.

    Concluimos que la gerencia tiene suficientes evidencias para demostrarque el especialista est equivocado, que la puntuacin media no es 90.

    xLc t

  • b) Prueba de un extremo para medias

    Para este caso, ya sabemos que el nivel de significancia

    (zona de rechazo) slo abarca un extremo o cola de la

    campana de Gauss.

  • Ejemplo 2Una persona tom una muestra aleatoria de 7 casas enun suburbio muy elegante de una gran ciudad yencontr que el valor promedio estimado del mercadoera de $560,000, con una desviacin estndar de$49,000. Pruebe la hiptesis de que, para todas las casasdel rea, el valor medio estimado es de $600,000,contra la alternativa de que sea menor que $600,000.Use el nivel de significancia de 0.05.

    Solucin:

    n = 7 casas = $600,000

    = $560,000 = 0.05

    s = = $49,000x

  • Las hiptesis son:

    Ho : = $600,000

    H1 : $600,000

    Calculando el error estimado de la muestra, setiene que:

    x

    , $ , .

    n

    49 00018 518 52

    7

    i xL t

    Li = 600,000 1.943 (18,518.52) = $564,018.52

    En la campana de Gauss:

  • Sabemos que el nivel de significancia

    es de 0.05, para una cola, por lo que

    se supone, que si fuera una prueba

    para dos colas, cada una tendra 0.05,

    es decir, el nivel de significancia =

    0.10. Por lo tanto 0.10 es el valor que

    debemos localizar en la tabla

    correspondiente de la distribucin t

    de Student, con 6 grados de libertad

    (7 1).

    Encontramos entonces que t = 1.943

    Con estos datos, ya podemos

    determinar el lmite inferior del

    intervalo de confianza en donde se

    encuentra la verdadera media de la

    poblacin. 44

  • Como la media muestral cae la zona de rechazo, entonces serechaza la hiptesis nula y se acepta la hiptesis alternativa.

    Comprobando lo anterior, se tiene que:

    Podemos concluir que el valor medio estimado del valor de

    todas las casas es menor de $600,000.

    560,000 -600,000 -40,000Z = = = -2.16

    18,518.52 18,518.52

  • PRUEBA DE HIPOTESIS PARA PROPORCIONES

    a) Prueba de dos extremos para proporciones.

    La prueba de hiptesis para proporciones, tiene algunasvariantes en la demostracin de las hiptesis respecto a laprueba de hiptesis de medias, variantes que se irnexplicando conforme se vayan aplicando.

  • Ejemplo 1

    Una compaa que est evaluando la promovibilidad de sus empleados;

    es decir, est determinando la proporcin de aquellos cuya habilidad,

    preparacin y experiencia en la supervisin los clasifica para un ascenso a

    niveles superiores de la jerarqua. El director de recursos humanos le

    dice al presidente que el 80%,o sea el 0.8, de los empleados son

    promovibles. El presidente crea un comit especial para valorar la

    promovibilidad de todo el personal. El comit realiza entrevistas en

    profundidad con 150 empleados y en su juicio se da cuenta que slo el

    70% de la muestra llena los requisitos de la promocin. El presidente

    quiere probar, en un nivel de significancia de 0.05, la hiptesis de que 0.8

    de los empleados pueden ser promovidos.

    Solucin:

    p = 0.8 q = 0.2 n = 150

    = 0.7 = 0.3 = 0.05p q

  • Las hiptesis son:

    Ho : p = 0.8 80% de los empleados son promovibles.

    H1 : p 0.8 La proporcin de empleados promoviblesno es 80%.

    Primero calculamos el error estndar de la proporcin,mediante la siguiente expresin:

    H Hp q

    n

    0 0

    Sustituyendo valores:

    p

    ( . )( . ). .

    0 8 0 20 0010666 0 0327

    150

  • En este caso, la compaa quiere saber si la verdadera proporcin es mayoro menor que la supuesta proporcin. Por consiguiente, es apropiada unaprueba de dos extremos para una proporcin. El nivel de significanciacorresponde a las dos regiones sombreadas, cada una de las cuales contiene0.025 del rea. La regin de aceptacin de 0.95 se ilustra como dos reas de0.475 cada una. Puesto que la muestra es mayor que 30, podemos recurrir ladistribucin normal. Basndonos en la tabla de sta distribucin, podemoscalcular que el valor correspondiente de Z para 0.475 del rea bajo la curvaes 1.96 . Por tanto, los limites de la regin de aceptacin son:Lc = PH0 Z

    Lc = 0.8 1.96(0.0327)

    Ls = 0.8 + 0.06409 Ls = 0.8641

    Li = 0.8 0.06409 Li = 0.7359

    Vindolo en la campana de Gauss:

  • La probabilidad de la muestra = 0.7, se localiza en lazona de rechazo, por lo que se rechaza la hiptesis nula yse acepta la alternativa. Vamos a demostrarlo:

    p

    p

    . . .Z .

    . .

    0 7 0 8 0 1

    3 0580 0327 0 0327

    Podemos concluir que existe una diferencia significativa entre la

    supuesta proporcin de empleados promovibles comunicada por el

    director de recursos humanos y la observada en la muestra, la

    proporcin de toda la compaa no es del 80%.

  • b) Prueba de un extremo para proporciones

    Ejemplo 2.-

    Un artculo reciente en el peridico Reforma report que un empleadoest disponible slo para que uno de tres egresados universitarios congrado. Las principales razones aportadas fueron que existe unasobreabundancia de graduados de universidad y una economa dbil.Suponga que una encuesta con 200 graduados recientes de la institucinde usted, revela que 80 estudiantes tenan empleo. Al nivel de significanciade 0.02, se puede concluir que una proporcin mayor de estudiantesegresados tienen trabajo?

    p = 0.8; q = 0.2; Datos: n = 150

    = 0.7

    = 0.3

    = 0.05

    pq

  • Las hiptesis son:

    Ho : p = 0.3333

    H1 : p 0.3333

    Calcularemos primero el error estndar de la proporcin:

    n

    qpp

    HoHo

    Sustituyendo valores:

    0333.00011.200

    2222.0

    200

    )6667.0()3333.0( pppp

  • En este caso, se quiere saber si la verdadera proporcin es mayor que lasupuesta proporcin. Por consiguiente, es apropiada una prueba de unextremo para una proporcin. El nivel de significancia corresponde a laregin derecha de rechazo. La regin de aceptacin de 0.98 se ilustracomo un rea de 0.5 y otra de 0.48 como la muestra es mayor de 30,podemos recurrir a la distribucin normal. Basndonos en la tabla de deesta distribucin el valor correspondiente de Z, para 0.48 del rea bajo lacurva es 2.05, por tanto, el lmite de la regin de aceptacin es:

    Ls = 0.3333 + 2.05 (0.0333) Ls = 0.3333 + 0.068265 Ls = 0.4016

    Como = 0.4, y es menor que 0.4016, se localiza en la zona de aceptacin,entonces, se acepta la hiptesis nula.

    Demostrando lo anterior se tiene:

    p

    p

    ppZ

    pZZZ 003.20333.0

    0667.0

    0333.0

    3333.04.0

    En la campana de Gauss:

  • Concluimos que no es mayor la proporcin de estudiantesegresados que tienen trabajo.

  • C) Prueba de hiptesis para proporciones de

    muestras pequeas.

    Si usamos la distribucin t para una prueba hiptesis paraproporciones en muestras pequeas, de dos colas, seguimos elmismo procedimiento que se utiliz en la prueba para medias demuestras pequeas.

    Lo mismo sucede si se trata de una prueba de un extremo,recordando que, para obtener el valor apropiado de t en un nivelde significancia de 0.05 con 10 grados de libertad, buscaremosen la tabla de la distribucin t bajo la columna 0.10, frente alrengln 10 grados de libertad. Esto es verdad porque la columna0.10 del rea bajo la curva contenida en ambos extremoscombinados; por ello tambin representa 0.05 del rea bajo lacurva contenida en cada uno de los extremos. Por esta razn enlugar de buscar en la columna 0.05, se busca 0.10.

  • GRACIAS