Inferencia estadística

15
Inferencia Estadística Básica PARTE 1 ESTIMACIÓN DE PARÁMETROS INTRODUCCIÓN El objetivo más importante de la Estadística es obtener una inferencia con respecto a una población basándose en la información contenida en una muestra. Como las poblaciones se describen mediante medidas numéricas denominadas parámetros, el objetivo de la mayoría de las investigaciones estadísticas es deducir una inferencia con respecto a uno o más parámetros de la población. Una vez estudiadas las nociones fundamentales de distribución de probabilidades; se está en condiciones, entonces, de tratar los métodos de inferencia estadística, los cuales comprenden los procedimientos para estimar parámetros de poblaciones y probar (contrastar) si una afirmación provisional sobre un parámetro poblacional se ve apoyada o desaprobada ante la evidencia de la muestra. Hablando en general, hay dos tipos de inferencia: la deductiva y la inductiva. Una inferencia deductiva es un juicio o generalización que se basa en un razonamiento o proceso dialéctico a priori. Por ejemplo, se supone que dos monedas están perfectamente equilibradas y que entonces la probabilidad de cada una de caer "cara" es = 0,5 (premisa). La media o número esperado de "caras" en la jugada de las monedas deber ser 1 (conclusión). Si las premisas son ciertas, las conclusiones no pueden ser falsas. Una inferencia inductiva, por otra parte, es un juicio o generalización derivado de observaciones empíricas o experimentales; la conclusión sobre el número promedio de "caras" con base en los resultados de una muestra de prueba. Si los resultados de las pruebas son diferentes, la conclusión también será diferente. No se requiere una suposición a priori sobre la naturaleza de las monedas. La inferencia estadística es primordialmente de naturaleza inductiva y llega a generalizaciones respecto de las características de una población al valerse de observaciones empíricas de la muestra. Es muy probable que un estadístico muestral sea diferente del parámetro de la población y sólo por coincidencia sería el uno exactamente igual al otro. La diferencia entre el valor de un estadístico muestral y el correspondiente parámetro de la población se suele llamar error de estimación. Sólo se sabría cuál es el error si se conociera el parámetro poblacional, pero éste por lo general se desconoce. La única manera de tener alguna certeza al respecto es hacer todas las observaciones posibles del total de la población en la mayoría de las aplicaciones prácticas, lo cual, desde luego, es imposible o impracticable. Y en efecto, la razón de ser de la inferencia estadística es la falta de conocimientos acerca de las características de la población. Pero que tales características se desconozcan no impide el que se actúe. Las inferencias estadísticas se hacen por posibilidades o probabilidades. De la media de la muestra se hacen inferencias sobre la media de la población. No se sabe exactamente cuál es la diferencia entre estas dos medias, ya que la última es desconocida en la mayoría de los casos. No obstante, si se sabe que es más bien poca la probabilidad de que esta diferencia sea mayor que, por ejemplo, tres errores estándares. Los problemas que se tratan en la inferencia estadística se dividen generalmente en dos clases: los problemas de estimación y los de prueba de hipótesis. Como al estimar un parámetro poblacional desconocido se suele hacer una afirmación o juicio este último ofrece solamente una estimación. Es un valor particular obtenido de observaciones de la muestra. No hay que confundir este concepto con el de estimador, que se refiere a la regla o método de estimar un parámetro

description

Teoría de estadística inferencial

Transcript of Inferencia estadística

Page 1: Inferencia estadística

Inferencia Estadística Básica PARTE 1

ESTIMACIÓN DE PARÁMETROS

INTRODUCCIÓN

El objetivo más importante de la Estadística es obtener una inferencia con respecto a una población basándose en la información contenida en una muestra. Como las poblaciones se describen mediante medidas numéricas denominadas parámetros, el objetivo de la mayoría de las investigaciones estadísticas es deducir una inferencia con respecto a uno o más parámetros de la población.

Una vez estudiadas las nociones fundamentales de distribución de probabilidades; se está en condiciones, entonces, de tratar los métodos de inferencia estadística, los cuales comprenden los procedimientos para estimar parámetros de poblaciones y probar (contrastar) si una afirmación provisional sobre un parámetro poblacional se ve apoyada o desaprobada ante la evidencia de la muestra.

Hablando en general, hay dos tipos de inferencia: la deductiva y la inductiva. Una inferencia deductiva es un juicio o generalización que se basa en un razonamiento o proceso dialéctico a priori. Por ejemplo, se supone que dos monedas están perfectamente equilibradas y que entonces la probabilidad de cada una de caer "cara" es = 0,5 (premisa). La media o número esperado de "caras" en la jugada de las monedas deber ser 1 (conclusión). Si las premisas son ciertas, las conclusiones no pueden ser falsas.

Una inferencia inductiva , por otra parte, es un juicio o generalización derivado de observaciones empíricas o experimentales; la conclusión sobre el número promedio de "caras" con base en los resultados de una muestra de prueba. Si los resultados de las pruebas son diferentes, la conclusión también será diferente. No se requiere una suposición a priori sobre la naturaleza de las monedas. La inferencia estadística es primordialmente de naturaleza inductiva y llega a generalizaciones respecto de las características de una población al valerse de observaciones empíricas de la muestra.

Es muy probable que un estadístico muestral sea diferente del parámetro de la población y sólo por coincidencia sería el uno exactamente igual al otro. La diferencia entre el valor de un estadístico muestral y el correspondiente parámetro de la población se suele llamar error de estimación . Sólo se sabría cuál es el error si se conociera el parámetro poblacional, pero éste por lo general se desconoce. La única manera de tener alguna certeza al respecto es hacer todas las observaciones posibles del total de la población en la mayoría de las aplicaciones prácticas, lo cual, desde luego, es imposible o impracticable.

Y en efecto, la razón de ser de la inferencia estadística es la falta de conocimientos acerca de las características de la población. Pero que tales características se desconozcan no impide el que se actúe.

Las inferencias estadísticas se hacen por posibilidades o probabilidades. De la media de la muestra se hacen inferencias sobre la media de la población. No se sabe exactamente cuál es la diferencia entre estas dos medias, ya que la última es desconocida en la mayoría de los casos. No obstante, si se sabe que es más bien poca la probabilidad de que esta diferencia sea mayor que, por ejemplo, tres errores estándares.

Los problemas que se tratan en la inferencia estadística se dividen generalmente en dos clases: los problemas de estimación y los de prueba de hipótesis. Como al estimar un parámetro poblacional desconocido se suele hacer una afirmación o juicio este último ofrece solamente una estimación . Es un valor particular obtenido de observaciones de la muestra. No hay que confundir este concepto con el de estimador, que se refiere a la regla o método de estimar un parámetro

Page 2: Inferencia estadística

poblacional. Por ejemplo, se dice que x es un estimador de μ porque la media muestral proporciona un método para estimar la media de la población. Un estimador es por naturaleza un estadístico y como tal tiene una distribución. El procedimiento mediante el cual se llega a la obtención y se analizan los estimadores se llama estimación estadística, que a su vez se divide en estimación puntual y estimación por intervalos.

ESTIMACION: GENERALIDADES

El uso principal de la inferencia estadística en la investigación empírica, es lograr conocimiento de una gran clase de unidades estadísticas de un número relativamente pequeño de los mismos elementos.

Los métodos de inferencia estadística emplean el razonamiento inductivo, razonamiento de lo particular a lo general y de lo observado a lo no observado.

Cualquier colección o agregación grande de cosas que deseamos estudiar o de las cuales deseamos hacer inferencias, se llama población. El término población tiene más significado cuando se lo junta con la definición de muestra de una población : una muestra es una parte o subconjunto de una población.

Una muestra de n elementos de la población de N elementos, debería ser seleccionada de forma tal que las características de la población puedan ser estimados con un margen de error conocido.

Los valores de varias medidas descriptivas calculadas para las poblaciones, se llaman parámetros . Para las muestras, estas mismas medidas descriptivas se llaman estadísticos.

Un parámetro describe una población de la misma manera que una estadístico describe a una muestra.

Estadístico Parámetro

Media aritmética

μ

Varianza s² σ 2

Desvío estándar S Σ

Un estadístico calculado a partir de una muestra es un estimador del parámetro en la población. Una estimación es alguna función de los resultados de una muestra que produce un valor, llamado estimador .

El estimador da alguna información respecto al parámetro. Por ejemplo, la media de la muestra, , es un estimador de la media μ en la población.

Las poblaciones pueden ser infinitas o finitas.

Para la mayoría de los propósitos de investigación, se supone que las poblaciones son infinitas, no finitas, en tamaño, las cuales son algo artificial o imaginario.

Una población finita puede ser extremadamente grande. Es posible concebir un proceso de conteo de los elementos de la población, el cual puede ser computado; luego la población es técnicamente finita. Afortunadamente no es necesario crear problemas en cuanto a la distinción entre poblaciones infinitas y finitas.

El método usado para seleccionar la muestra es muy importante al juzgar la validez de la inferencia que se hace de la nuestra a la población.

Page 3: Inferencia estadística

Para que una muestra sirva adecuadamente como base para obtener estimadores de parámetros poblacionales, debe ser representativa de la población. El muestreo al azar de una población producirá muestras que "a la larga" son representativas de la población.

Si una muestra se extrae aleatoriamente, es representativa de la población en todos los aspectos, esto es, el estadístico diferirá del parámetro solo por azar. La habilidad para estimar el grado de error debido al azar (error de muestreo), es un rasgo importante de una muestra al azar.

ESTIMACIÓN DE PARÁMETROS

La teoría clásica de la Inferencia Estadística trata de los métodos por los cuales se selecciona una muestra de una población y, basándose en las pruebas de las muestras, se trata de:

* Estimar el valor de un parámetro desconocido, por ejemplo θ.

* Verificar si θ es o no igual a cierto valor predeterminado, por ejemplo θ0.

El primero de estos dos procedimientos, de inferir de una muestra a una población, se llama estimación de un parámetro ; el segundo, prueba de una hipótesis acerca de un parámetro .

Dentro del primer procedimiento, la estimación de un parámetro puede tener por resultado un solo punto (estimación puntual ), o un intervalo dentro del cual exista cierta probabilidad de encontrarlo (estimación por intervalos ).

Un estimador puntual es un único punto o valor, el cual se considera va a estimar a un parámetro. La expresión E( ) = μ sugiere que el único valor de es un estimador puntual insesgado o no viciado de μ .

Un estimador por intervalo se construye sobre el concepto de un estimador puntual, pero además, proporciona algún grado de exactitud del estimador. Como el término lo sugiere, un estimador por intervalo es un rango o banda dentro de la cual el parámetro se supone va a caer.

PROPIEDADES DE UN BUEN ESTIMADOR

Para poder utilizar la información que se tenga de la mejor manera posible, se necesita identificar los estadísticos que sean buenos estimadores, cuyas propiedades son:

Insesgabilidad: , estimador de es una variable aleatoria y por lo tanto tiene una distribución de probabilidad con una cierta media y varianza. Se puede definir estimador insesgado diciendo: Si se utiliza un estadístico muestral para estimar el parámetro de la población , se dice que es un estimador insesgado de , si la esperanza matemática de coincide con el parámetro que desea estimar.

En símbolos: es insesgado

O sea que es de esperar que si se toman muchas muestras de igual tamaño partiendo de la misma distribución y si de cada una se obtiene un valor , la media de todos los valores de ha de ser .

Por ejemplo:

* La media muestral es un estimador insesgado de la media poblacional, o sea que E( ) = X

* La varianza muestral, ¿es un estimador insesgado de la varianza poblacional?

Page 4: Inferencia estadística

La respuesta depende de cómo se defina la varianza muestral.

Si , entonces S² es un estimador sesgado de σ² pues . Más aún,

. Pero el sesgo se puede corregir alterando la definición de varianza muestral.

En efecto, si es la varianza muestral corregida, entonces (S )2 2E • = σ y S² es un estimador insesgado de σ².

Eficiencia: si se utilizan dos estadísticos como estimadores del mismo parámetro, entonces aquel cuya distribución muestral tenga menor varianza, es un estimador más eficiente o más eficaz que

el otro. Es decir: es eficiente mínima.

Consistencia: Si es un estimador muestral calculado a partir de una muestra de tamaño n y si es el parámetro de población que se va a estimar, entonces es un estimador consistente de

si la probabilidad de que el valor absoluto de la diferencia entre y su esperanza iguale o supere a e (error admitido que tiende a cero, o sea que es tan pequeño como se quiera), tienda a cero cuando el número de elementos de la muestra tienda a infinito. En símbolos:

si n →∞

Por ejemplo, se sabe que la media muestral y la variancia son estimadores consistentes ya que tienden a acercarse a los correspondientes valores de la población a medida que aumenta el tamaño de la muestra, pero un estadístico muestral puede ser un estimador sin consistencia. Por ejemplo, si el valor de la primera observación o la media entre la primera y última observación de una muestra se utilizaran para estimar la esperanza de la población, tal estimador no sería consistente pues no tiende a acercarse más y más al valor de la población cuando se aumenta el tamaño de la muestra.

Suficiencia: Un estimador suficiente del parámetro θ es aquel que agota toda la información pertinente sobre θ que se puede disponer en la muestra. Por ejemplo, si se toma una muestra de n = 30 valores con el fin de estimar μ, pueden utilizarse como estimadores la primera, la décimo quinta o la última observación, o el promedio entre la primera y la quinta observación. Pero estos estimadores no son suficientes pues no contienen toda la información disponible de la muestra. La media aritmética calculada con las 30 observaciones sí lo es pues tiene en cuenta todas las observaciones.

En definitiva, por ejemplo la media aritmética muestral y la forma corregida de la varianza muestral, son estadísticos que satisfacen los criterios o propiedades de "buenos " estimadores.

ESTIMACIÓN POR INTERVALOS DE CONFIANZA

Lo dicho hasta ahora se refiere a una estimación puntual, es decir, estimar un parámetro a través de un único valor. Esta estimación no es muy conveniente pues con ella no se puede determinar el error de muestreo, ni la precisión de la estimación, ni la confianza que merece tal estimación.

El procedimiento de determinar un intervalo (a, b) que comprenda un parámetro de población θ con cierta probabilidad 1 - ����, se llama estimación por intervalos . Se verán los casos paramétricos, es decir aquellos en los que se tiene conocimiento del tipo de distribución de la población (Binomial, Poisson, Normal, etc.)

Page 5: Inferencia estadística

En general, para cualquier parámetro θ y su correspondiente estimador , el intervalo de confianza será:

Donde:

es el límite inferior del intervalo de confianza.

es el límite superior del intervalo de confianza.

k es una constante no negativa. Es el llamado multiplicador correspondiente a 1 - α.

α es la probabilidad de que el intervalo no incluya al verdadero valor del parámetro.

1 - α es el nivel de confianza , es una medida de la fiabilidad de la estimación. Por ejemplo, si se toma α = 10%, entonces 1 - α = 90% y se dice que se tiene un intervalo de confianza del 90% y que la probabilidad de que el intervalo contenga al verdadero valor del parámetro es del 90%. Es decir, que si repetidamente se muestra y se construye tal intervalo una y otra vez, 90 de cada 100 de estos intervalos, contendrá al parámetro y 10 de ellos no.

Se puede pensar que 1 significa certeza, seguridad y α significa riesgo. La seguridad menos el riesgo, es decir 1 - ���� da, por lo tanto, el coeficiente de confianza de nuestras afirmaciones.

En el caso anterior, se tiene una confianza de que 90 de cada 100 intervalos que se extraigan como muestra, contendrán el verdadero valor del parámetro. Pero una vez determinado el intervalo, es decir, una vez calculados numéricamente los extremos, ya no debe hablarse en términos de confiabilidad ni en términos probabilísticos, pues la situación pasa a ser completamente determinística. De tal manera, asociado a un intervalo de confianza ya calculado, se tiene una probabilidad 0 ó 1 de que contenga al parámetro a estimar y no hay otra opción, ya que lo contiene o no lo contiene.

Resumiendo, los extremos del intervalo son variables aleatorias, mientras que el parámetro a determinar es constante.

En general, los pasos a seguir para estimar un parámetro por el método de los intervalos de confianza, son:

* Fijar el coeficiente de confianza que se desea en la estimación.

* Extraer la muestra y calcular el o los estadísticos necesarios.

* Determinar la distribución en el muestreo que tiene el estadístico empleado.

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL

CASO 1) Con conocido:

Sea donde μ es desconocido y σ conocido.

Sea x1, x2, ... , xn una muestra aleatoria de la variable aleatoria X y sea la media muestral.

Page 6: Inferencia estadística

Se sabe que independientemente del valor de n, por el teorema central del límite.

Luego, tipificando:

Se plantea: entonces:

Observaciones:

- Si las muestras se toman sin reposición de una población finita de tamaño N, debe emplearse el factor de corrección por finitud y el intervalo será:

- Si la población es sólo aproximadamente normal, la igualdad sigue siendo válida en forma aproximada.

Ejemplo 1 : Un grupo de investigadores en Medicina desea estimar el cambio medio de presión sanguínea por paciente en un sanatorio. Se ha seleccionado una muestra al azar de 30 pacientes y se halló que puls/seg. Los investigadores saben que la desviación estándar de los cambios de presión sanguínea para todos los pacientes es σ = 3 puls/seg según estudios anteriores. Ellos desean estimar el cambio medio de la presión sanguínea por paciente con un intervalo del 95% de confianza, suponiendo que la variable aleatoria "cambios de presión sanguínea" tiene asociada una distribución normal de probabilidad.

Respuesta:

X = cambio en la presión sanguínea por paciente del sanatorio (en pulsaciones por segundo)

Page 7: Inferencia estadística

n = 30 σ = 3 1 - ���� = 0.95

Por tabla: Entonces:

Límite inferior (LI) =

Límite superior (LS) =

Por lo tanto resulta el Intervalo del 95% de confianza para la media:

ICM0,95 = (3,9 ; 6,1)

Luego, puede decirse que el cambio medio en la presión sanguínea por paciente, pertenece al intervalo (3,9 ; 6,1) pulsaciones, con un nivel de confianza del 95%.

Observación: Nótese que se cae en un abuso de lenguaje pues se debería decir que el intervalo (3,9 ; 6,1) pulsaciones pertenece a la sucesión que ofrece un nivel de confianza del 95% para estimar el cambio medio de presión sanguínea, pero se simplifica la expresión para hacerla menos engorrosa o extensa.

En cuanto al tamaño óptimo de muestra , = e determina el error máximo admitido de muestreo e indica la precisión de la estimación. Lógicamente se pretende que sea lo más pequeño posible. Por otra parte, (1 - ����) es el coeficiente de confianza y se pretende que sea lo más grande

posible. Pero depende del valor de α y al hacer mayor el coeficiente de confianza (1 - ����), el

valor será mayor y por lo tanto el error aumentará. Esto se puede regular aumentando el tamaño de la muestra con lo que el error disminuirá.

Para el ejemplo 1, con un nivel de confianza del 95%.

Si se desea elevar el nivel de confianza a 99%, pero sin aumentar el error e de estimación, el tamaño de la muestra debería ser:

O sea que debe tomarse una muestra de aproximadamente 52 pacientes en lugar de 30.

Por el contrario, si el investigador deseara un error de estimación menor, por ejemplo 1 puls/seg, manteniendo el nivel de confianza en 95%, el tamaño de la muestra requerido será:

Page 8: Inferencia estadística

pacientes.

CASO 2) Con desconocido

Para estimar σ se debe utilizar el desvío estándar muestral corregido.

, ya que según se ha visto, es un estimador insesgado del correspondiente

parámetro poblacional σ. Reemplazando en la variable tipificada por resulta:

Nota: para el caso del desvío, en vez de la normal, se utiliza una distribución llamada t de Student.

Por lo tanto:

= 1- α

Ejemplo 2 : Una muestra de 15 aves tomadas al azar en un establecimiento con 5000 aves, (que elabora alimentos balanceados), permitió establecer un aumento de peso promedio de 90 g por semana y por ave, y un desvío típico de 10 g. Se busca estimar el incremento de peso promedio para las 5000 aves del establecimiento con un intervalo de confianza del 90%.

Respuesta:

X = aumento de peso por ave

n = 15 = 90 g S = 10 g ¿ICM0,90?

Por tabla:

y el intervalo resulta:

Interpretando este resultado, se dice que el aumento de peso por ave por semana en el establecimiento está entre 85,5 y 94,6 gramos, con un 90% de confianza.

TEST DE HIPÓTESIS

INTRODUCCION

Recuérdese que muchas veces el objetivo de la Estadística es hacer inferencias con respecto a parámetros poblacionales desconocidos, basadas en la información obtenida mediante datos muestrales. Estas inferencias se expresan en una de dos maneras: como estimaciones de los

Page 9: Inferencia estadística

parámetros respectivos o como pruebas de hipòtesis referentes a sus valores. En esta parte se estudiará el tema de la prueba (o contraste, o test) de hipótesis.

Con frecuencia, los problemas a los que se enfrenta el científico o el experimentador no se refieren sólo a la estimación de un parámetro poblacional como se indicó anteriormente, sino, y es aún más frecuente en los problemas prácticos, el que se tenga que formular un procedimiento de decisión basado en los datos que conduzcan a una conclusión acerca de algún planteamiento científico. Esta es la situación en que se encuentra, por ejemplo, un investigador que pretende demostrar que la droga A es más efectiva para el tratamiento de cierta enfermedad que la droga B; cuando un psicólogo desea comprobar si cierto formato de instrucción incrementará la eficiencia en el aprendizajes; cuando un ingeniero agrónomo desea comprobar si una nueva distancia de siembra entre surcos, para un cultivo, produce mejores rendimientos que las distancias que se usaban comúnmente en la zona; cuando el jefe de marketing asegura que determinado producto se aceptado por el 60% de la población consumidora, etc.

En cada uno de los anteriores casos el responsable del estudio postula o conjetura algo acerca de un sistema. Estos constituyen enunciados provisionales , puesto que al no poder integrar el cúmulo de sus conocimientos todo lo concerniente a la situación, aparece la incertidumbre . La función de la estadística en su aspecto inferencial es la de apoyar el razonamiento para llegar a decisiones sólidas a pesar de la incertidumbre. Al respecto, es tan importante el papel que desempeña la estadística en estas situaciones que se suele hablar de la estadística moderna como "el estudio de las decisiones ante la incertidumbre " .

Se puede decir que se llaman decisiones estadísticas a las decisiones que deben tomarse con respecto a las poblaciones a partir de una información obtenida de una muestra de las mismas. Por ejemplo, a partir de los datos del muestreo podemos querer llegar a decidir si un suero nuevo es realmente efectivo para la cura de una enfermedad, si un sistema educacional es mejor que otro, si una moneda está o no cargada, etc.

En los casos que se han señalado se observa que se deben tomar decisiones en base a datos experimentales. Y si hay que tomar decisiones es porque hay alternativas; cada una de estas alternativas es formalizada como una hipótesis estadística y el proceso mediante el cual se enfrentan o confrontan las hipótesis al tomar como punto de apoyo los datos muestrales constituye lo que se denomina prueba o contraste de hipótesis .

ELEMENTOS DE UN TEST DE HIPÓTESIS.

Una hipótesis es una suposición sobre la naturaleza de una población. Las hipótesis generalmente están expresadas en términos de parámetros poblacionales.

Las siguientes son algunos ejemplos de hipótesis:

μ = 5 (la media poblacional es igual a 5)

μ < 67 (la media poblacional es menor que 67)

2 = 4 (la varianza poblacional es igual a 4)

2 >11 (la varianza poblacional es mayor que 11)

Un test de una hipótesis es un procedimiento estadístico usado para tomar una decisión sobre el valor de un parámetro poblacional.

La hipótesis nula (H0) especifica el valor de un parámetro poblacional. Se conduce un experimento para ver si el valor especificado no es razonable.

Page 10: Inferencia estadística

Ejemplo :Un semillero publicita que el peso promedio de una espiga de una cierta variedad es de 180 gramos con una desvío estándar de 30 gramos. Un productor de avanzada sospecha que el peso es distinto de 180 gramos, decide por lo tanto conducir un experimento. El propósito del mismo es ver si el peso de 180 gramos es incorrecto. Por lo tanto la hipótesis nula de interés es:

H0 : μ = 180 gramos

La hipótesis alternativa (H1) da una suposición opuesta a aquella presentada en la hipótesis nula. El experimento se lleva a cabo para conocer si la hipótesis alternativa puede ser sustentada.

En el ejemplo previo el productor sospecha que el peso medio es distinto de 180 gramos. Esta es la hipótesis a ser sustentada y así la hipótesis alternativa es:

H1 μ > 180 gramos ó μ < 180 gramos ó 180 gramos

Se puede ver que las hipótesis son excluyentes. La hipótesis alternativa frecuentemente se llama hipótesis de investigación , porque este tipo de hipótesis expresa la teoría que el investigador o experimentador cree va a ser verdadera.

Un test estadístico es una cantidad calculada de la muestra y se usa cuando se va a hacer una decisión sobre la hipótesis de interés.

Después que el productor de este ejemplo prueba la variedad en 50 parcelas sembradas al azar, seleccionando un conjunto de espigas por parcela, el test estadístico debe ser calculado. Por

ejemplo la media de la muestra se podría usar como test estadístico para tomar una decisión acerca del valor de μ, o si se obtiene una muestra suficientemente grande se podría utilizar un

estadístico z para comparar el valor observado de con respecto a 180 gramos especificado en la hipótesis nula. Así un posible test estadístico cuando 2 se conoce, sería :

Para interpretar el valor del test estadístico es necesario introducir un elemento más al test de hipótesis: la región de rechazo , que especifica los valores del test estadístico para los cuales la hipótesis nula es rechazada (y para los cuales la hipótesis alternativa no es rechazada).

La región de rechazo identifica los valores del test estadístico que sostienen o sustentan la alternativa y serían improbables, (raros) si la hipótesis nula fuera verdadera.

Ya que no se espera observar sucesos raros (valores improbables del test estadístico) la hipótesis nula se rechazará cuando la muestra produzca un valor tal.

Para el ejemplo si la media fuera menor que 180 gr o mayor que 180 gr esta sustentaría la hipótesis alternativa

(μ 180) y un valor de más de 2, (1,96) errores estándares por debajo o por encima de 180 sería raro o poco probable.

El propósito de cualquier test de hipótesis es decidir cual hipótesis - la nula o la alternativa - sería rechazada. Ya que cualquier decisión estará basada sobre información parcial de una población, contenida en una muestra, habrá siempre una posibilidad de una decisión incorrecta. La siguiente tabla resume cuatro posibles situaciones que pueden surgir en un test de hipótesis.

Page 11: Inferencia estadística

Verdadero estado de la población Decisión posible H0 es cierta H1 es cierta Se rechazo H0 Error de tipo I (α) Decisión correcta No se rechaza H0 Decisión correcta Error de tipo II (β)

Si la hipótesis nula es rechazada y de hecho, la hipótesis nula es verdadera, se cometió un error, que se llama Error de tipo I ( ).

Un Error de tipo II ( ) ocurriría si la hipótesis nula fuera aceptada y de hecho, la hipótesis alternativa es verdadera.

Ya que nunca se puede eliminar la posibilidad de cometer un error de tipo I o un error de tipo II cuando se usan muestras para hacer inferencias, se considerarán las posibilidades de cometer estos errores.

= p(error de tipo I)

p(rechazar H0 si H0 es verdadera)

= p(error de tipo II)

p(aceptar H0 si H0 es falsa)

Es deseable que tanto como estén próximos a cero pero en general esto no es posible, ya que si el experimentador desea concluir que H1 es verdadera (rechazar H0) el interés está en que

tenga una probabilidad pequeña tal como 0,01 ó 0,05. En otras palabras, se desea estar seguro que si H0 es verdadera, será muy raro que sea rechazada. El experimentador es libre de elegir el valor de , esto es, determinar cuán raro un suceso observado debe ser para rechazar H0.

Determinar si el valor de estará presente para el test de hipótesis es algo más complicado, de modo que no se intentará su cálculo.

Manteniendo pequeño se evita aceptar la hipótesis de investigación (alternativa) si la hipótesis nula es verdadera. De otra forma se induciría a la crítica de que se ha sesgado la investigación para probar la alternativa. El sacrificio de mantener pequeña es que la "chance" de aceptar la

hipótesis nula, si la hipótesis de investigación es verdadera ( ), puede ser mayor de lo que se desea.

Resumiendo, en el ejemplo considerado el productor aceptando un error de 0,05 (5%), conocido también como nivel de significación y utilizando la variable z, plantearía la hipótesis como sigue:

H0 : μ = 180 gramos

H1 : μ 180 gramos

Suponiendo que los resultados del experimento produjeron una media muestral de 187 gramos, el test estadístico se construiría como:

Page 12: Inferencia estadística

donde : 187 = media de la muestra ( = 187)

180 = media hipotética (poblacional = 180)

30 = desvío estándar poblacional (conocido) ( =30)

50 = tamaño de la muestra o repeticiones (n=50)

Para decidir si la hipótesis nula (H0) se rechaza o no; se compara el valor de z calculado (1,65) con el valor de z tabulado N (0,1), para un nivel de probabilidad = 0,05. Por tratarse de una prueba bilateral , indicado por la desigualdad de la hipótesis alternativa (μ 180) el valor de se particiona en dos /2 = 0,025, lo que implica que la probabilidad con la que se busca el valor de z, en la tabla de la distribución normal es 0,975, el valor de z correspondiente a esta probabilidad es 1,96.

Gráficamente las zonas de rechazo y aceptación serían:

como el valor de z calculado= 1,65 es menor que 1,96, o sea cae en la región de aceptación , no hay evidencias suficientes como para rechazar la hipótesis de que la media de la población es igual a 180.

Conclusión: la publicidad que hace el semillero de que el peso promedio de las espigas de una cierta variedad es de 180 gramos, es correcta, aunque podría existir una probabilidad de error tipo II, si de hecho la media de tal variedad no fuera 180 gramos

HIPÓTESIS UNILATERALES

Si en el mismo ejemplo, el productor, basándose en algún conocimiento de la variedad en cuestión sospechara que el peso promedio de las espigas es menor que 180, las hipótesis se plantearían como:

H0: μ = 180 gramos o H0 : μ > 180 gramos

H1: μ < 180 gramos

= 0,05

En este caso la desigualdad de la hipótesis alternativa indica cuál sería la zona de rechazo, el valor de ya no se particiona sino que se acumula todo hacia un solo lado, el izquierdo en este ejemplo y el valor tabulado de z se busca en la tabla con un valor de probabilidad del 95% siendo z= -1,64

Page 13: Inferencia estadística

Si por otra parte, el productor sospechara que el peso promedio es mayor que 180 gramos, la hipótesis y la zona de rechazo se plantearían como:

H0: μ = 180 gramos ó H0: μ < 180 gramos

H1: μ > 180 gramos

= 0,05

en ambas situaciones el test estadístico se construye como:

cuando se desconoce, el test estadístico se construye como:

Este valor difiere del anterior en que, en lugar de aparecer la desviación estándar de la población, nos encontramos con su estimador muestral insesgado S, que se distribuye según la distribución t de Student.

POTENCIA DEL CONTRASTE

Partiendo del planteo de las siguientes hipótesis:

H0 : μ = μ0

H1 : μ μ0

La probabilidad de error tipo I ( ) está dada por el nivel de significación; en cambio, la

probabilidad del error tipo II ( ) ya no es una cantidad determinada para cada nivel de significación, sino que depende del valor de μ.

Page 14: Inferencia estadística

La probabilidad del error tipo II ( ) para valores de μ próximos a μ0 es grande en comparación con la probabilidad de este error para valores de μ que están alejados de μ0.

Por ejemplo, si H0 afirma que la media es igual a 20, la probabilidad de no rechazar H0 es evidentemente mayor si la verdadera media es 25 que si es 30. Esto se detalla con mayor claridad

en la figura precedente, en la que el área rayada indica la probabilidad de error tipo II ( ).

Por supuesto se puede calcular la probabilidad de error tipo II para cualquier valor de μ. Cuanto menor sea esta probabilidad mejor será el contraste para distinguir entre hipótesis ciertas y falsas, o sea, cuanto menor sea la probabilidad de no rechazar H0 cuando esta sea falsa, más "potente" es el contraste. La potencia de un contraste se mide por la probabilidad de rechazar H0 cuando

sea falsa. Al ser la probabilidad de no rechazar H0 cuando esta es falsa, la potencia del contraste es igual a: 1 – ����....

ESQUEMA PARA CONTRASTAR HIPÓTESIS

Cuando se tiene que contrastar una hipótesis estadística es conveniente seguir un esquema, el cual debe incluir las siguientes etapas:

1) Enunciado de la hipótesis nula y alternativa

2) Elección del nivel de significación ( )

3) Selección del estadístico de prueba.

4) Determinación de la región crítica.

5) Cálculo del estadístico.

6) Exposición de las conclusiones.

Page 15: Inferencia estadística

1jÑ Ê s �e.egf�spopU/Ëpm����{v|degfdm�f¦egf�|XUvy��� ft|dmjk+U�ÒjÑ Ê s �e.egf�spopU/�putspeg�pU/ype.Ëpm����{v|degfdm�f�ÒjÑ Ê s �e.egf�enh�egudut{xui|�m��1{�Á�ego�spo�U��puds�eg��U�ype.Ëpmj�¦�{v|�enfdmjf�ÒjÑ Ê s �e.egf�enh�egudut{xui|�m��1{�Á³Á eno(spopU/�putspeg�pU/ype.Ëpm����{v|degfdm�f�ÒjÑ Ê s �e.egf�hjU�udegwvmC�{xoLkgug�� |dmjk+U�eno(s�o�U/��udspen��U/y�elË�mj���{v|degftmjf�ÒjÑ Ê s �e.egf�enh�opm��vegh�ype.fdm�wxopm«Þ�k+Uvo�kgm�U�eno(s�o�U/��udspen��U/y�elË�mj���{v|degftmjf�Ò

1)

2)

3)

4)

5)

6)

7)

8)

jÑ Ê s �e�fde(ego^|�m�egopype§�1{xu´|�Uv��UÛ³o�{·y�e§h�UÆudenwxmC�{voÌknu+�� |dmjkgU·eno£spo�U·�pudspen��U)ype Ë�mj���{v|degftmjf�Òa) Un nivel de significación del 5% significa que, en promedio 5 de cada 100 veces que

rechacemos la hipótesis nula estaremos equivocados (verdadero /falso).

b) Un nivel de significación del 5% significa que, en promedio, 5 de cada 100 veces que

la hipótesis nula es cierta la rechazaremos (verdadero / falso).

Analizar las siguientes afirmaciones y decidir el valor de verdad de cada una (verdadera/falsa), justificando las respuestas.

9) Se considera que el tiempo medio que está desocupado un profesional de un determinado sector es de 13,5 meses. Para contrastar esta hipótesis frente a la alternativa (que no sea cierta dicha consideración), se tomó una muestra de 45 profesionales que estuvieron desocupados en ese sector y se obtuvo una media de 17,2 meses y un cuasi-desvío típico de 15,3 meses. Si se considera un nivel de significación del 5%, ¿se debe rechazar o aceptar la hipótesis?

El control de calidad una fábrica de pilas y baterías sospecha que hubo defectos en la producción de un modelo de batería para teléfonos móviles, bajando su tiempo de duración. Hasta ahora el tiempo de duración en conversación seguía una distribución normal con media 300 minutos y desviación típica 30 minutos. Sin embargo, en la inspección del último lote producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 baterías el tiempo medio de duración en conversación fue de 290 minutos. Suponiendo que ese tiempo sigue siendo Normal con la misma desviación típica: ¿Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de significación del 2%?

10)

Trabajo Práctico