IC Media y Para Las Proporciones

27
Estimación. Intervalos de Confianza para la Media y para las Proporciones

description

intervalos de confianza parala media

Transcript of IC Media y Para Las Proporciones

  • Estimacin.Intervalos de Confianza para la Media y para

    las Proporciones

  • Estimacin

    El objetivo principal de la estadstica inferencial es la estimacin, estoes que mediante el estudio de una muestra de una poblacin se quieregeneralizar las conclusiones hacia el total de dicha poblacin. Comovimos en la seccin anterior, los estadsticos pueden variar muchodentro de sus distribuciones muestrales. Mientras menor sea el errorestndar de un estadstico, ms cercanos sern sus valores. El Errorestandard podramos expresarlo conceptualmente como el error que sepuede cometer al intentar conocer a una poblacin por medio de unamuestra tomada de dicha poblacin.Existen dos tipos de estimaciones para parmetros; puntuales y porintervalo.

    Una estimacin puntual es un nico valor estadstico y se usa paraestimar un parmetro. El estadstico usado se denomina estimador.

    Una estimacin por intervalo es un rango, generalmente de anchofinito, que se espera que contenga el parmetro.

  • Estimacin por Intervalos

    Un estimado puntual, por ser un slo nmero, no proporciona por s mismoinformacin alguna sobre la precisin y confiabilidad de la estimacin.

    Por ejemplo, imagine que se usa la media de una muestra para estimar(estimador puntual) la resistencia real a la ruptura de toallas de papel decierta marca y suponga que = 9322.7.

    Debido a la variabilidad de la muestra, casi nunca se tendr el caso de que= . El estimador puntual nada dice sobre lo cercano que esta de . Una

    alternativa para reportar el valor del parmetro que se est estimando escalcular un intervalo de valores factibles, es decir un lmite de confianza ointervalo de confianza (IC).

    x

    x

    x

  • Un nivel de confianza de 95% implica que 95% de las muestras daralugar a un intervalo que incluye m o cualquier otro parmetro que seest estimando, y slo 5% de las muestras producir un intervaloerrneo. Cuanto mayor sea el nivel de confianza podremos creer que elvalor del parmetro que se estima est dentro del intervalo.

    Un intervalo de confianza se calcula siempre seleccionando primero unnivel de confianza, que es una medida del grado de confiabilidad en elintervalo. Entonces, en el ejemplo anterior, si queremos un nivel deconfianza de 95% diramos que es posible tener cualquier valor de mentre 9162.5 y 9482.9.

    Todo est muy bien, perocmo sabemos estos

    valores?

  • Si, por ejemplo, queremos tener un nivel de confianza de 95% (locual es muy comn), entonces usamos la distribucin normalestndar y encontramos los valores que incluyen a 95% del rea.

    0.4

    0.3

    0.2

    0.1

    .00

    z

    Density

    -1.96

    0.95

    1.960

    Distribution PlotNormal, Mean=0, StDev=1

    95% del rea.

  • En el siguiente ejemplo, tomado de una simulacin efectuada conMinitab se crean 100 muestras (n = 9) de una poblacin con =80 y = 5. Para 95% de confianza, 95 de los 100 intervaloscalculados contienen a .

    Los intervalos que no contienen al valor de estn marcados en rojo.

    100

    True mean

    50

    10090807040 50 60

    Interval Number

    3020101

    95% Confidence Intervals for the Mean

    200

    150

    0

    ConfidenceIntervals

  • mn

    Para nuestro ejemplo, la distribucin muestral de la media tendra unamedia de 90 y una desviacin estndar de 36/3 = 12. Recordemos que ladesviacin estndar de una distribucin muestral es igual al errorestndar.

    Intervalos de confianza para la media

    Supongamos que la estatura de los nios de 2 aos est distribudanormalmente con una media de 90 cm y una desviacin estndar de 36cm. Cul sera la distribucin muestral de la media para una muestra detamao 9? Recordemos que la media de una distribucin muestral demedias es igual a :

    x

    Y el error es:

    estndar

  • La siguiente figura muestra esta distribucin en donde el reasombreada representa el 95% del total, encontrndose entre losvalores de 66.48 y 113.52. Estos lmites fueron calculados aadiendo yrestando 1.96 desviaciones estndar del valor de la media de 90, lo queequivale al 95% del rea bajo una curva normal estndar, es decir:

    90 - (1.96 x 12) =90 - 23.52 = 66.4890 + (1.96 x 12) =90 + 23.52 = 113.52

    Lo que nos muestra la figura es que 95% de las medias se encontraran ano ms de 23.52 de la media de 90 (o sea a 1.96 desviaciones estndar).Ahora si consideramos la probabilidad de que la media de una muestraaleatoria se encuentre a cierta distancia de la media de la poblacin,entonces podemos decir que como 95% de la distribucin est a 23.5 de90, la probabilidad de que la media de cualquier muestra est a 23.52 de90 es de 0.95.

    95% del rea.23.52

  • Lo anterior significa que si calculamos repetidamente la media de una muestra, x , y consideramos un intervalo que vaya dex - 23.52 a x + 23.52, este intervalo contendr a la media de lapoblacin 95% de las veces. En general, podemos calcular el intervalo de confianza con la siguiente frmula:

    x zn

    x 1.96n

    Notar que no es otracosa que despejar dela frmula para el valorZ de la distribucin demedias

    Donde z es el valor de la curva estandar normal para la confianza que se requiere. En el caso de 95% de confianza:

  • De esta formula se puede observar que tanto el tamao de la muestracomo el valor de se deben conocer. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de confianza establecido.

    Como en muchas ocasiones se desconoce en esos casos lo correcto es

    utilizar otra distribucin para muestras (la llamada t de student queveremos en la siguiente sesin) si la poblacin de donde provienen losdatos es normal.

    En este caso se puede utilizar una estimacin puntual de la desviacinestndar de la poblacin por medio de la desviacin estndar de lamuestra, es decir ( ~ s).

  • Ejemplos:

    1. Se encuentra que la concentracin promedio de zinc de una muestrade 36 cereales es de 2.6 gramos por miligramo. Encuentre los intervalosde confianza de 95% y 99% para la concentracin media de zinc en elcereal. Suponga que la desviacin estndar de la poblacin es 0.3.

    Solucin:La estimacin puntual de es x = 2.6 (el valor de la media de lamuestra). El valor de z para un nivel de confianza del 95% es 1.96, por lotanto:

    2.5 2.6 2.7

    Valores z

    Valores reales

  • Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo ser ms amplio:

    2.47 2.6 2.73Valores reales

    Z

  • 2. Los vuelos de una empresa de aviacin tienen una duracin bimestralaproximadamente distribuida de forma normal con una desviacinestndar de 40 horas. Si una muestra de 30 vuelos tiene una duracinpromedio de 780 horas, encuentre los intervalos de confianza de 96%para la media de la poblacin de todos los vuelos de esta empresa.

    Con un nivel de confianza del 96% se sabe que la duracin media de los vuelos est entre 765 y 795 horas.

  • Un estimador puntual de la proporcin P en un experimento binomialest dado por la estadstica P=X/N, donde X representa el nmero de xitos en N pruebas.Por tanto, la proporcin de la muestra p=x/n se utilizar comoestimador puntual del parmetro P.Si no se espera que la proporcin P desconocida est demasiado cercade 0 de 1, se puede establecer un intervalo de confianza para P alconsiderar la distribucin muestral de proporciones.

    Considerando el valor z para la distribucin de proporciones

    z p P

    Intervalos de confianza para la proporcin

    P(1 P)

    n

  • Si intentamos despejar el valor de Pnos encontramos con que

    P(1 P)

    nP p z

    Pero cmo podemos encontrar P si tambin est del lado derechode la ecuacin?Lo que haremos es aproximar la proporcin de la poblacin por lade la muestra, es decir sustituir P por la proporcin de la muestrap siempre y cuando el tamao de muestra no sea pequeo.

    p(1 p)

    nP p z

  • Cuando n es pequea y la proporcin desconocida P se consideracercana a 0 a 1, el procedimiento del intervalo de confianza que seestablece aqu no es confiable ya que realmente se debera emplearla distribucin binomial, por tanto, no se debe utilizar. Para estarseguros, se debe requerir que np y n(1-p) sea mayor o igual a 5.

    El error de estimacin ser la diferencia absoluta entre p y P, ypodemos tener el nivel de confianza de que esta diferencia noexceder el valor de

    p(1 p)

    nz

  • 0.4

    0.3

    0.2

    0.1

    0.00

    z

    Density

    -1.64

    0.05

    1.64

    0.05

    DistributionPlotNormal, Mean=0, StDev=1

    Ejemplos:

    1. Un fabricante de reproductores de discos compactos utiliza unconjunto de pruebas amplias para evaluar la funcin elctrica de suproducto. Todos los reproductores de discos compactos deben pasartodas las pruebas antes de venderse. Una muestra aleatoria de 500reproductores tiene como resultado 15 que fallan en una o mspruebas. Encuentre un intervalo de confianza de 90% para laproporcin de los reproductores de discos compactos de la poblacinque no pasaran todas las pruebas.

    Solucin:

    n=500p = 15/500 = 0.03z(0.90) = 1.645

    0.03(1 0.03)P 0.031.645

    500

    0.01752 < P < 0.042548

    z=1.645 nos da un rea de~0.05 a cada lado, si lobuscamos en las tablas

    el valorencontraramos de 0.04998

  • Ejemplo 2.En un estudio de 300 accidentes de automvil en una ciudadespecfica, 60 tuvieron consecuencias fatales. Con base en estamuestra, construya un intervalo del 95% de confianza paraaproximar la proporcin de todos los accidentes automovilsticos queen esa ciudad tienen consecuencias fatales.

    Solucin:n = 300

    P= 60/300 = 0.20

    Z(0.95) = 1.96

    El intervalo de confianza es entonces:

    0.154737 < P < 0.245263

    300

    0.20(1 0.20)P 0.20 1.96

    0.4

    0.3

    0.2

    0.1

    0.00

    z

    Density

    -1.96

    0.025

    1.96

    0.025

    DistributionPlotNormal, Mean=0, StDev=1