Download - pruebas parametricas y no parametricas

Pruebas paramétricas y no paramétricas para

comparar distribuciones de variables numéricas

Eddy SeguraFacultad de Salud Publica y AdministraciónUniversidad Peruana Cayetano Heredia

Hoja de ruta

• Introducción• Definiciones clave• Un caso/ejemplo motivacional• Consideraciones clave

– Independencia de observaciones– Cumplimiento de supuestos paramétricos

• Tipos de pruebas• Algunas aplicaciones

¿Qué dijo qué?

• “…Hemos encontrado una diferencia estadísticamente significativa al realizar la prueba de t de Studentcomparando los indicadores de las distribuciones de las notas del examen del final de este curso, encontrando que las mujeres alcanzaron un mayor puntaje que los varones…”

Introducción

• En investigación, en general, hay 3 planteamientos básicos:– Describir un fenómeno o parte de una realidad

– Entender (Analizar) un fenómeno/realidad

– Experimentar (Evaluar) sobre un fenómeno/realidad

• Idealmente, deberíamos seguir estos 3 pasos

Introducción

• Y hacemos ello por que quisiéramos:– Presenciar el evento (El hecho!)

– Conocer las causas del evento (Lo diferente!)

– Modificar la ocurrencia del evento (Lo útil)

• Y esto es especialmente cierto en salud ☺

• Lamentablemente, no todos lo ven así.

Definiciones clave

• Hipótesis

• Prueba de hipótesis

• Estadístico de prueba

• Parámetro (Y lo paramétrico y no paramétrico)

Definiciones clave

• Hipótesis– Cualquier conjetura, a priori y evaluable, sobre la realidad o fenómeno de interés.

• Prueba de hipótesis (estadística)– Un procedimiento (estadístico) para evaluar la veracidad de la hipótesis.

– En estadística se usa un “estadístico de prueba”que se compara contra una distribución de e.d.p.

Definiciones clave

• Estadístico de prueba– Un valor numérico que se origina de la muestra de estudio y se usa para evaluar la hipótesis.

– Su distribución puede ser real o teórica

• Parámetro– Característica de la población de interés y que deseamos estimar. Real y desconocido; pero su distribución muestral teórica es asumida

Definiciones clave

• Pruebas paramétricas– Pruebas de hipótesis estadísticas que asumencierto comportamiento de:

• Muestras obtenidas aleatoriamente

• Distribución normal de las observaciones

• Existe un parámetro de interés que buscamos estimar

• Pruebas no paramétricas– No asumen lo anterior total o parcialmente.

El problema

• Queremos comparar dos distribuciones de observaciones que se comportan como variables numéricas continuas (y también para semi‐continuas en ocasiones)

• Por ejemplo: las notas de ustedes a final del curso, para mujeres y varones

El abordaje

• Primero identifico:– La pregunta e hipótesis

– Las variables

– La forma como se colectaron las unidades y datos

– La forma como están medidas

– La forma como se comportan o distribuyen

• Y recién, decido como proceder

Consideraciones claves

• Para comparar dos distribuciones de variables numéricas existen dos consideraciones:

– Debo hacer una prueba paramétrica o no paramétrica?

– Se trata de observaciones independientes o dependientes (“pareadas”)

Consideraciones claves

• Verificación de los supuestos paramétricos– Grafica

– Analítica

• Observaciones independientes o “pareadas”– Datos de dos poblaciones distintas, entonces son observaciones independientes

– Datos de la misma persona en dos momentos diferentes, entonces son datos “pareados”.

Tipos de pruebas

Independientes Dependientes

Cumple supuestos paramétricos

Prueba de t de Student

Prueba de t de Student para datos pareados

No cumple supuestos paramétricos

Prueba de U de Mann‐Whitney

Prueba de Wilcoxon

Prueba de t de Student “no pareado”

• Las hipótesis– Nula: Diferencia de medias = 0

– Alterna: Diferencia de medias ≠ 0

• El estadístico de prueba– T de Student (que tiene una distribución muy similar a la distribución normal)


• Entonces, requiere conocer:– Media de cada grupo/muestra de observaciones

– Media hipotética propuesta bajo la hipótesis nula

– Tamaño de muestra de cada grupo

– Varianzas de cada una de las poblaciones de origen:

• Conocidas (Casi nunca!)

• No conocidas pero iguales (Usar cuasi‐varianza)

• Conocidas pero iguales (Usar cuasi‐varianza)

Cuasivarianza

Prueba de t de Student “pareado”

Pero no olviden que….

• Las pruebas de hipótesis estadísticas paramétricas asumen cierto comportamiento de:– Muestras obtenidas aleatoriamente– Distribución normal de las observaciones– Existe un parámetro de interés que buscamos estimar

• Si no se cumplen, entonces hay otras pruebas.

Pruebas no paramétricas

• Es mejor aplicar estas pruebas cuando no se cumplen los supuestos paramétricos

• Otra forma practica se reflexionar si es que tiene “sentido” calcular un promedio y compararlo, o si el promedio realmente representa bien la tendencia central.

• Tambien son llamadas pruebas de “rangos”


• En breve:– No usan los valores, sino los rangos

– No se basan en la media sino en la mediana

– Pueden ser datos que estén en una escala ordinal


• Ojo, lo mas probable es que no se cumplan los supuestos paramétricos y realmente deban usarse pruebas no paramétricas.

• Sin embargo, y por suerte, con un gran tamaño de muestra, las pruebas t son “robustas”.

• En la realidad, pocas cosas tienen una distribución normal y han sido tomadas de forma aleatoria.

Muchas gracias ☺

[email protected]