PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB

BIOESTADÍSTICA: TEORÍA PP6 Lola Fernández de la Fuente Bursón

PRUEBA DE PREPARACIÓN Nº6

PRUEBAS DE HIPÓTESIS

CONCEPTO DE HIPÓTESIS

La consecución del conocimiento científico viene definida por los siguientes pasos:

Poseemos un cuerpo de conocimiento A, que tras una serie de deducciones por normas lógicas mentales, nos da una serie de consecuencias contrastables, suposiciones, conjeturas o hipótesis. Estas hipótesis serán sometidas a la observación o experimentación mediante las denominadas pruebas de hipótesis cuyo resultado afirmativo asentaría un nuevo cuerpo de conocimiento A’. Este nuevo cuerpo es una modificación, resultado de la ampliación y la investigación, del primer cuerpo de conocimiento A.

CUERPO DE CONOCIMIENTO

Normas lógicas

CONSECUENCIAS CONTRASTABLES

Observación Experimentación

PRUEBAS DE HIPÓTESIS

NUEVO CUERPO DE CONOCIMIENTO

Así sometemos las ideas teóricas o hipótesis a un filtro: las pruebas de hipótesis, para que sean validadas y establezcan así un nuevo conocimiento.

Estas suposiciones en bruto deben ser elaboradas para darle una expresión concreta a su significado antes de someterlas a dichas pruebas. Para ello formulamos dos tipos de hipótesis:

Página 1 de 7


Hipótesis nula (H0).

Hipótesis alternativa (H1), que supone la negación de la hipótesis nula, es todo lo que no es H0.

TIPOS DE PRUEBAS DE HIPÓTESIS

Todos los siguientes planteamientos de hipótesis tienen una característica común: la hipótesis nula ofrece una única posibilidad para ser válida, frente a las infinitas posibilidades de la hipótesis alternativa, que no concreta nada y sólo niega la H0.

De conformidad

Se usan cuando se pretende averiguar si una muestra proviene de una población teórica previamente especificada, definiendo las siguientes hipótesis:

H0: la muestra proviene de dicha población.

H1: la muestra no proviene de dicha población.

Frecuentemente se le exige a la variable de la hipótesis nula que siga una distribución determinada (generalmente la normal), mientras que esto no ocurre con la hipótesis alternativa. Entonces las hipótesis quedarían de la siguiente forma:

H0: la variable X sigue una distribución determinada (normal, binomial...).

H1: la variable X no sigue dicha distribución determinada (sino que sigue cualquier otra).

De homogeneidad

Este tipo de pruebas se usa cuando la pregunta es si dos o más muestras observadas provienen de una misma población teórica no especificada, quedando las hipótesis de la siguiente forma:

H0: todas las muestras provienen de la misma población.

H1: las muestras no provienen todas de la misma población.

De relación

Con estas pruebas pretendemos averiguar si la muestra que hemos obtenido proviene de una población en la cual las variables estudiadas no están relacionadas. Así formularemos las siguientes hipótesis:

H0: las variables son independientes en la población origen.

Página 2 de 7


H1: las variables no son independientes en la población origen, sino que existe cierta relación entre ellas.

Hay que tener en cuenta el tipo de variables que estemos estudiando, ya que utilizaremos distintas pruebas según sean cualitativas o cuantitativas.

SOLUCIÓN PROBABILÍSTICA

Este tipo de construcciones vistas anteriormente nos permiten calcular las probabilidades de presentación de los posibles valores de una muestra, suponiendo que dichos valores proceden de una población en al cual se cumple la hipótesis nula.

Para explicar esto mejor, recurriremos a un ejemplo con variable discreta:

Estamos estudiando la eficacia de un nuevo fármaco (F) en comparación con un producto de referencia, ambos aplicados en un cierto número de pacientes.

H0: ambos fármacos son igualmente eficaces. P(F mejor) = 0,5.

H1: los dos fármacos no son igualmente eficaces, es decir, que el nuevo fármaco es mejor que el de referencia. P(F mejor) ≠ 0,5.

Debemos calcular entonces las probabilidades de aparición de los posibles valores, es decir, calcular las probabilidades de que el fármaco nuevo resulte mejor en un número concreto de aplicaciones.

Si la H0 es cierta, sería inverosímil observar una única aplicación con mejor resultado.

Si H1 es cierta, será muy probable observar varias aplicaciones en las que el nuevo fármaco ofrezca mejor resultado.

La solución probabilística propone aceptar o rechazar la hipótesis nula según si la muestra es “probabilísticamente compatible” con ella o no. Esto nos ofrece dos tipos de resultados posibles:

Aquellos cuya probabilidad de aparición es lo suficientemente pequeña como para que dudemos de si tienen su origen en una población que cumpla las características de la hipótesis nula, es decir, que nos hagan dudar de si esta hipótesis es cierta o no.

Aquellos que resultan “probabilísticamente compatibles” con H0, es decir, que nada nos haga suponer que la hipótesis nula no sea cierta . Esto podría corresponderse a una “absolución por falta de pruebas”.

Estos dos tipos de resultado se pueden agrupar en dos zonas:

Página 3 de 7


Zona I de rechazo a la H0 o hipótesis nula.

Zona II de aceptación de la H0.

Debemos delimitar estas zonas dándoles un peso probabilístico determinado que, en el caso de la zona de rechazo, se denomina “nivel de significación ()”, cuyo valor se fija generalmente en un 0,05.

Pruebas bilaterales

La hipótesis alternativa nos lleva a dos conclusiones totalmente contrarias (como en el caso anterior: el fármaco podría ser mejor o peor). Este tipo de situaciones reciben el nombre de bilaterales.

La expresión de estas hipótesis sigue este esquema:

H0: p = 0,5.

H1: p ≠ 0,5.

Para construir las zonas de rechazo y aceptación partimos de un intervalo centrado alrededor de un valor central que representa el 50% de los casos mejores. Este intervalo deja a ambos lados una probabilidad máxima () de 0,05.

IMAGEN 9-4

Pruebas unilaterales

Si seguimos con el ejemplo anterior y afirmamos que, por razones teóricas obvias (como que el producto de referencia es un placebo), sólo es posible que el nuevo fármaco sea mejor, sería imposible caer en la zona de rechazo ya que esto nos llevaría a una contradicción.

Así construiremos la zona de rechazo únicamente en el extremo inferior en el que se acumulan todas las probabilidades. Deducimos, pues, que si el fármaco sólo pudiera ser peor, la construcción de las zonas sería totalmente simétrica.

IMAGEN 9-5

La expresión de las hipótesis en esta ocasión sigue este esquema:

H0: p = 0,5.

H1: p > 0,5; ó H1: p < 0,5 (según el fármaco sea mejor o peor que la referencia, respectivamente).

Página 4 de 7


Para explicarlo mejor pondremos otro ejemplo, en este caso una variable continua:

Queremos averiguar si cierto fármaco actúa sobre la glucemia. Para ello lo administramos a 100 voluntarios sanos y medimos el nivel de glucosa anterior y posterior a la aplicación del mismo. Si tiene un efecto hipoglucemiante, la diferencia entre ambas medidas sería siempre positiva. La media de las diferencias, pues, también.

Construimos las siguientes hipótesis:

H0: el fármaco no tiene efecto. La media de las diferencias es igual a cero: μ = 0.

H1: el fármaco sí tiene efecto. La media de las diferencias es distinta de cero: μ ≠ 0.

Si suponemos que las medias de las diferencias siguen una distribución normal, rechazaremos la hipótesis nula cuando el valor observado de la media de las diferencias se sitúe en las zonas extremas de la distribución, y aceptaremos dicha hipótesis si el valor se sitúa en la zona central de la misma.

IMAGEN 9-6

TIPOS DE ERRORES

Tipo I o (error de primera especie): rechazar la hipótesis nula siendo cierta (aceptar la hipótesis alternativa).

Tipo II o β (error de segunda especie): aceptar la hipótesis nula cuando es cierta la alternativa.

TIPOS DE ERRORES ES CIERTA LA H0 ES CIERTA LA H1

LA CONCLUSIÓN DE LA PRUEBA ES H0 DECISIÓN CORRECTA Error tipo II

LA CONCLUSIÓN DE LA PRUEBA ES H1 Error tipo I DECISIÓN CORRECTA

La posibilidad de cometer estos errores recibe el nombre de “riesgo”. Estos se estudian mediante probabilidades condicionadas:

Riesgo tipo : es la P(rechazar H0/siendo cierta H0).

Riesgo tipo β: es la P(aceptar H0/siendo cierta H1).

Página 5 de 7


El riesgo tipo se puede estudiar fácilmente ya que la hipótesis nula solo ofrece una única posibilidad, mientras que el tipo β es imposible de calcular ya que existen infinitas posibilidades para validar la hipótesis alternativa.

Los razonamientos de los tipos de errores se pueden analizar mediante un esquema tipo “árbol” como el siguiente:

H0 H0: P(Concluir H0 siendo cierta H0) = 1 -

Realidad H1: P(Concluir H1 siendo cierta H0) =

H1 H0: P(Concluir H0 siendo cierta H1) = β

H1: P(Concluir H1 siendo cierta H1) = 1 – β

POTENCIA DE UNA PRUEBA

La potencia mide la capacidad para detectar las diferencias existentes que tiene una prueba de hipótesis. Es el caso complementario a β, es decir, a la P(concluir la hipótesis alternativa/siendo cierta la hipótesis nula) = 1 - β.

Es necesario poner un límite a las infinitas posibilidades que supone la H1.

Al desplazar el límite hacia la izquierda entre las zonas de rechazo y aceptación se reduce el riesgo β y aumenta la potencia para concluir H1 (detectar diferencias), a expensas de aumentar el riesgo , lo cual no nos interesa.

IMAGEN 9-10

Una posible solución es separar las dos curvas mediante un aumento en el valor de H1

manteniendo el de H0 y el mismo valor de riesgo , pero aunque disminuya el riesgo β nos exige variar el criterio de valores de las hipótesis.

IMAGEN 9-11

La única solución válida es reducir ambos riesgos haciendo las curvas más puntiagudas. Esto se consigue aumentando el tamaño de las muestras, lo cual disminuye el valor de las varianzas.

IMAGEN 9-12

GRADO DE SIGNIFICACIÓN: “p”

Página 6 de 7


La conclusión de las pruebas de hipótesis desembocará en la hipótesis alternativa cuando la distancia del valor observado al teórico de la hipótesis nula supere un cierto límite. Esta distancia podrá ser mayor o menor, por lo que para valorarla utilizamos el grado de significación “p”, que se define como la probabilidad de observar valores más o menos alejados.

El nivel de significación nos fija el límite máximo de distancia que puede tomar esa probabilidad.

El grado de significación nos da la probabilidad exacta de que habiendo aparecido dichos valores alejados, sea cierta la hipótesis nula.

INTERPRETACIÓN ABUSIVA DEL “p” (ERRORES)

No debemos nunca:

1. Utilizar la “p” como una medida de la intensidad de la relación existente entre las variables, ya que depende del número de individuos utilizados (tamaño de la muestra).

2. Confundir una relación meramente estadística con una causal. Una relación causal sólo puede comprobarse mediante experimentación u observación; además, puede estar bajo la influencia de otras variables desconocidas por lo que no se pueden usar modelos de simulación ya que resultarían incompletos.

3. Utilizar la “p” como medida de la probabilidad de error una vez rechazada la hipótesis nula. Recordamos que “p” es la probabilidad de descartar la hipótesis nula siendo cierta (“caer” en la región crítica de rechazo), sin embargo no nos indica la probabilidad de error una vez obtenido un valor en dicha región.

4. Considerar que “p” nos protege de cualquier tipo de error, incluso de los cometidos en los planteamientos previos a la construcción de una hipótesis nula razonable.

En conclusión: todo depende de la calidad del trabajo teórico previo, de la capacidad del investigador para plantear hipótesis adecuadas.

Hay que tener en cuenta que la estadística confirmatoria de las pruebas de hipótesis no puede utilizarse como técnica para la exploración de datos sin exponerse a cometer errores.

Página 7 de 7

PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB

Health & Medicine

Transcript of PRUEBAS DE HIPÓTESIS. Bioestadística. LolaFFB