Pruebas paramétricas y no paramétricas para
comparar distribuciones de variables numéricas
Eddy SeguraFacultad de Salud Publica y AdministraciónUniversidad Peruana Cayetano Heredia
Hoja de ruta
• Introducción• Definiciones clave• Un caso/ejemplo motivacional• Consideraciones clave
– Independencia de observaciones– Cumplimiento de supuestos paramétricos
• Tipos de pruebas• Algunas aplicaciones
¿Qué dijo qué?
• “…Hemos encontrado una diferencia estadísticamente significativa al realizar la prueba de t de Studentcomparando los indicadores de las distribuciones de las notas del examen del final de este curso, encontrando que las mujeres alcanzaron un mayor puntaje que los varones…”
Introducción
• En investigación, en general, hay 3 planteamientos básicos:– Describir un fenómeno o parte de una realidad
– Entender (Analizar) un fenómeno/realidad
– Experimentar (Evaluar) sobre un fenómeno/realidad
• Idealmente, deberíamos seguir estos 3 pasos
Introducción
• Y hacemos ello por que quisiéramos:– Presenciar el evento (El hecho!)
– Conocer las causas del evento (Lo diferente!)
– Modificar la ocurrencia del evento (Lo útil)
• Y esto es especialmente cierto en salud ☺
• Lamentablemente, no todos lo ven así.
Definiciones clave
• Hipótesis
• Prueba de hipótesis
• Estadístico de prueba
• Parámetro (Y lo paramétrico y no paramétrico)
Definiciones clave
• Hipótesis– Cualquier conjetura, a priori y evaluable, sobre la realidad o fenómeno de interés.
• Prueba de hipótesis (estadística)– Un procedimiento (estadístico) para evaluar la veracidad de la hipótesis.
– En estadística se usa un “estadístico de prueba”que se compara contra una distribución de e.d.p.
Definiciones clave
• Estadístico de prueba– Un valor numérico que se origina de la muestra de estudio y se usa para evaluar la hipótesis.
– Su distribución puede ser real o teórica
• Parámetro– Característica de la población de interés y que deseamos estimar. Real y desconocido; pero su distribución muestral teórica es asumida
Definiciones clave
• Pruebas paramétricas– Pruebas de hipótesis estadísticas que asumencierto comportamiento de:
• Muestras obtenidas aleatoriamente
• Distribución normal de las observaciones
• Existe un parámetro de interés que buscamos estimar
• Pruebas no paramétricas– No asumen lo anterior total o parcialmente.
El problema
• Queremos comparar dos distribuciones de observaciones que se comportan como variables numéricas continuas (y también para semi‐continuas en ocasiones)
• Por ejemplo: las notas de ustedes a final del curso, para mujeres y varones
El abordaje
• Primero identifico:– La pregunta e hipótesis
– Las variables
– La forma como se colectaron las unidades y datos
– La forma como están medidas
– La forma como se comportan o distribuyen
• Y recién, decido como proceder
Consideraciones claves
• Para comparar dos distribuciones de variables numéricas existen dos consideraciones:
– Debo hacer una prueba paramétrica o no paramétrica?
– Se trata de observaciones independientes o dependientes (“pareadas”)
Consideraciones claves
• Verificación de los supuestos paramétricos– Grafica
– Analítica
• Observaciones independientes o “pareadas”– Datos de dos poblaciones distintas, entonces son observaciones independientes
– Datos de la misma persona en dos momentos diferentes, entonces son datos “pareados”.
Tipos de pruebas
Independientes Dependientes
Cumple supuestos paramétricos
Prueba de t de Student
Prueba de t de Student para datos pareados
No cumple supuestos paramétricos
Prueba de U de Mann‐Whitney
Prueba de Wilcoxon
Prueba de t de Student “no pareado”
• Las hipótesis– Nula: Diferencia de medias = 0
– Alterna: Diferencia de medias ≠ 0
• El estadístico de prueba– T de Student (que tiene una distribución muy similar a la distribución normal)
Prueba de t de Student “no pareado”
Prueba de t de Student “no pareado”
• Entonces, requiere conocer:– Media de cada grupo/muestra de observaciones
– Media hipotética propuesta bajo la hipótesis nula
– Tamaño de muestra de cada grupo
– Varianzas de cada una de las poblaciones de origen:
• Conocidas (Casi nunca!)
• No conocidas pero iguales (Usar cuasi‐varianza)
• Conocidas pero iguales (Usar cuasi‐varianza)
Cuasivarianza
Prueba de t de Student “pareado”
Pero no olviden que….
• Las pruebas de hipótesis estadísticas paramétricas asumen cierto comportamiento de:– Muestras obtenidas aleatoriamente– Distribución normal de las observaciones– Existe un parámetro de interés que buscamos estimar
• Si no se cumplen, entonces hay otras pruebas.
Pruebas no paramétricas
• Es mejor aplicar estas pruebas cuando no se cumplen los supuestos paramétricos
• Otra forma practica se reflexionar si es que tiene “sentido” calcular un promedio y compararlo, o si el promedio realmente representa bien la tendencia central.
• Tambien son llamadas pruebas de “rangos”
Pruebas no paramétricas
• En breve:– No usan los valores, sino los rangos
– No se basan en la media sino en la mediana
– Pueden ser datos que estén en una escala ordinal
Pruebas no paramétricas
• Ojo, lo mas probable es que no se cumplan los supuestos paramétricos y realmente deban usarse pruebas no paramétricas.
• Sin embargo, y por suerte, con un gran tamaño de muestra, las pruebas t son “robustas”.
• En la realidad, pocas cosas tienen una distribución normal y han sido tomadas de forma aleatoria.
Muchas gracias ☺
Top Related