Post on 03-Jan-2016
description
ESTADÍSTICA NO PARAMÉTRICA
ProporcionesChi-Cuadrado (2)
Mann-WhitneyKruskal-Wallis
Correlación de Spearman
Tipo de Variables y test a utilizar
Variable Grupos TestIntervalar 2 - ind dif. Student no pareado
Intervalar 2 - mismos ind. Student pareado
Intervalar 3 ó más grupos ANOVA/Scheffé/...
Dep/Ind Análisis de Reg. / r
Nominal 2 grupos Chi cuadrado
Ordinal 2 grupos Chi cuadrado
Ordinal 2 grupos Mann-Whitney
Ordinal 3 grupos Kruskal-Wallis
Ordinal 2 g /mismos ind Wilcoxon
Ordinal dep/ind Spearman
Tipo de experimento
Escala de medición
Dos grupos de tratamiento consistentes de individuos diferentes
Tres o más grupos consistentes de individuos diferentes
Antes y después de un tratamiento en los mismos individuos
Múltiples tratamientos en los mismos individuos
Asociación entre dos variables
Intervalar (y obtenida de población con distribución normal)*
Test t no pareado Análisis de Varianza
Test t pareado Análisis de varianza de medidas repetidas
Regresión linear y correlación de Pearson; análisis de Bland-Altman
Nominal Chi-cuadrado de tabla de contingencia
Chi-cuadrado de tabla de contingencia
Test de McNemar
Q de Cochrane
Coeficiente de contingencia
Ordinal Test de suma de rangos de Mann-Whitney
Estadístico de Kruskal-Wallis
Test del signo de rangos de Wilcoxon
Estadístico de Friedman
Correlación de rangos de Spearman
Tiempo de sobrevida
Test de Gehan ó Test de rango del Log
* Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales
Proporción
• Resumen de variables binarias:– Síntoma: Presente / Ausente– Tratamiento: Efectivo / Fracaso
• Si r, número de sujetos observados con la característica, en la muestra n la proporción será:– Con la característica p = r / n– Sin la característica q = 1- p
Intervalo de confianza de una proporción
)(96,1
/)1()(
%95 psepIC
npppse
En una clínica dental le preguntan a 263 pctes si confían que sus CD tengan los datos en un PC, 81 dicen que la privacidad se pierde, el IC 95% es:
0,364 a 252,00285,096,1308,0
0285,0263/)308,01(308,0)(
308,0263/81
%95
IC
pse
p
30.8%No confía
69.2%Si confía
Tests de proporciones
• Si existe diferencia con una proporción conocida
• Comparar si existen diferencias significativas entre dos proporciones no pareadas
• Comparar si existen diferencias significativas entre dos proporciones pareadas
Si existe diferencia con una proporción conocida
• Similar a lo visto en test t (comparar con promedio conocido), o sea:
observado valor de estándar error
esperado valor - observado Valor
En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel nacional se sabe que el asma se presenta en 15%. ¿Existen diferencias significativas, entre 15% y 18%?
1872,0 1,23 :(buscar) z valoresde Tabla
23,10244,0
15,018,0
0244,0215
85,015,0)(
)1()(
)(
z
pse
n
pppse
pse
ppz esp
A 25 pctes con osteoartrosis cervical se les dividió, al azar, en dos grupos (Lewith y Machin, 1981):
• 12 fueron tratados con estimulación infra roja (IR).• 13 recibieron placebo.
9/12 con IR mejoró o desapareció el dolor = 0,75
4/13 en el grupo placebo mejoró =0,31
¿Existen diferencias significativas?
ivassignificat dif Existen 0,79 a 0,09 95% IC sea o
es estándar Error ely
0,44230,3077-0,7500 :ejemplo el En
)var(p)var(p 21
1789,096,1
1789,0)(13
6923,03077,0
12
25,075,0)(
)(96,1
)1()1()(
)(
21%95
21
21
2121%95
2
22
1
1121
21
ppIC
ppse
ppse
ppseppIC
n
pp
n
ppppse
ppse
Chi cuadrado
Lado del dado f(0) f(E) (0-E)2/E -------------------------------------------------------------------------------------- 1 7 10 0,9 2 5 10 2,5 3 15 10 2,5 4 17 10 4,9 5 5 10 2,5 6 11 10 0,1 ------------------------------------------------------------------------------------- TOTAL 60 60 =13,40 =
Gl = 6 - 1 = 5 Crític : 0.05 = 11.07 Rechazar Ho
2= 31,793, gl = 1, p<0,0001
SI NO
75
25
34
63
MEJORA SINTOMAS DEL RESFRIO
VITAMINA C
PLACEBO
793,3133,43
)33,4363(
67,44
)67,4425(
67,53
)67,5334(
33,55
)33,5575(
)(
22222
22
E
EO
Cálculo del test – chi-cuadrado
Mejoran de los síntomas del resfrío
SI NO Total
Vitamina C fo =75
fe =55,33
fo =34
fe =53,67
109
Placebo fo =25
fe =44,67
fo =63
fe =43,33
88
Total
f columna
100 25 197
= 100*109/197
= 100*88/197
Cálculo de valores esperados
A
C
B
D
)/())((
)/())((
)/())((
)/())((
DCBADCDBE
DCBADCCAE
DCBADBBAE
DCBACABAE
d
c
b
a
Cálculo de valores esperados
Si No
Total
Esperados
75 34 109 55,33 53,67
25 63 88 44,67 43,33
100 97 197
793,3133,43
)33,4363(
67,44
)67,4425(
67,53
)67,5334(
33,55
)33,5575(
)(
22222
22
E
EO
Chi-Square Table
ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTI-CÁLCULO
PD Bajo E Moderado E Alto E TOTAL
A 49 (55) 30 (26) 21 (19) 100
B 67 (55) 21 (26) 12 (19) 100
C 49 (55) 27 (26) 24 (19) 100
TOTAL165 78 57 300
E = 100 E = 55
165 300
2 = (49 - 55)2/55 + ... + (24 - 19)2/19 = 9,65
gl = (f - 1) (c - 1) = (3 - 1) (3 - 1) = 4
Crítico: 2 0.05 = 9,49. SE RECHAZA HO
Chi-Square Table
Chi - cuadrado (2)
2 = (O - E)2/E (Chi cuadrado de Pearson)
= (|O - E|2 - 1/2) / E Corrección de Yates
Corrección de Yates: para tablas 2x2, con muestras pequeñas (en una celda existen menos de 5 observaciones).
Tamaño de muestra: n de celdas x 10.
Ej: 2 x 2 = 4 x 10 = 40
Ej. Ant: 3x3 = 9 x 10 = 90
Áreas bajo la curva
Distribución de Chi-Cuadrado
• Supongamos que repetimos experimento 1000 veces (el de la Vit C / Placebo). Para cada experimento calculamos el valor de Chi-Cuadrado y ploteamos dichos valores.
• Eje X es el valor calculado de Chi-cuadrado de acuerdo a la fórmula.
• Eje Y es el número de veces que se obtiene el valor de chi-cuadrado.
ODDS RATIO
• Proporciona:– Estimado de la relación entre dos variables
binarias (si / no)– Permite examinar los efectos de otras
variables en dicha relación – Forma especial y conveniente de
interpretación en estudios caso-control
• “The odds that a single throw of a die will produce a six are 1 to 5, or 1/5”.
• “ODDS: es la relación de la probabilidad que el evento de interés ocurra contra la probabilidad de que esto no ocurra”.
Bland y Altman. The odds ratio, BMJ 320;1468, 2000
Razón de desigualdad (Odd ratio)
OR = 5,559
IC 95% : 3,00 a 10,29
75 (a) 34 (b)
25 (c) 63 (d)
Si No
Si
No
)(log96,1
1111)(log
%95 ORSEORICdcba
ORSE
bc
ad
dbca
OR
e
e
)(ln96,1lnexp
314035,0)(log63
1
34
1
25
1
75
1)(log
1111)(log
559,52534
6375
%95 ORSEORORIC
ORSE
ORSE
dcbaORSE
bc
ad
dbca
OR
e
e
e
3,00 a 10,286IC
exp(1,100) ),exp(2,3308
1,100 a
95%
3308,2
3140,096,17154,1
7154,1)559,5(
559,52534
6375
IC
LN
OR
Cases are weighted by the value of variable N. Frequencies HACE_EJERC$ (rows) by MEJOR_SINT$ (columns)
si no TotalSi 75.000 34.000 109.000No 25.000 63.000 88.000Total 100.000 97.000 197.000
Test statistic Value df ProbPearson Chi-square 31.793 1.000 0.000Yates corrected Chi-square 30.197 1.000 0.000
Coefficient Value Asymptotic Std ErrorOdds Ratio 5.559Ln(Odds) 1.715 0.314
OjO: Debe calcular IC 95% = 1.715 ± 1.96 * 0.314
Riesgo Relativo
• Relación de frecuencias de dos categorías. O desigualdad de ser clasificado en la columna 1 en lugar de la columna 2.
• OR = (A/C) / (B/D)• >1: personas con factor de riesgo tienen más
probabilidad que presenten el evento.• <1: personas con factor de riesgo son menos
probable que experimenten el evento.
Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 10 40 50
> 20 a. 15 135 150
Total 25 175 200
Existe asociación entre niños de bajo peso al nacery edad de la madre?
Odds ratio (es solamente para estudios caso-control, variables
nominales, tablas 2x2)(similar a riesgo relativo)
• Si OR >1: existe una asociación positiva entre el factor de riesgo y el evento.
• Si OR <1: hay una asociación negativa, (presencia del factor disminuye la probabilidad de encontrar el evento.
Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 10 40 50
> 20 a. 15 135 150
Total 25 175 200
n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2
2 = ------------------------------------------ = --------------------------------------------- = 2,58 n1.n2.n.1n.2 50x150x25x175
Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. n11 n12 n1.
> 20 a. n21 n22 n2.
Total n.1 n.2 n..
n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2
2 = ------------------------------------------ = --------------------------------------------- = 2,58 n1.n2.n.1n.2 50x150x25x175
Proporciones(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 0,050 0,200 0,25
> 20 a. 0,075 0,675 0,75
Total 0,125 0,875 1,00
Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g Total
Edad Mat
<= 20 a. 20 80 100
> 20 a. 30 270 300
Total 50 350 400
Existe asociación entre niños de bajo peso al nacery edad de la madre?
• Sensibilidad: proporción de positivos que son correctamente identificados por el test.
• Especificidad: proporción de negativos que son correctamente identificados por el test
Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad
de tests para diagnóstico
SI NO
SI
NO
(a)Verdad +45
(c)Falso –5
(b)Falso +10
(d)Verdad -40
TEST
ENFERMEDAD
Sensibilidad = a / a + c = 45 / 50 = 0,90Especificidad = d / b + d = 40 / 50 = 0,80VPP = a / a + b = 45 / 55 = 0,82VPN = d / c + d = 40 / 45 = 0,89
N = 100
Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad de tests
para diagnósticoTomado de Kramer, 1988
SI NO
SI
NO
(a)Verdad +9
(c)Falso –1
(b)Falso +18
(d)Verdad -72
TEST
ENFERMEDAD
Sensibilidad = a / a + c = 9 / 10 = 0,90Especificidad = d / b + d = 72 / 90 = 0,80VPP = a / a + b = 9 / 27 = 0,33VPN = d / c + d = 72 / 73 = 0,99
N = 100
• Valor predictivo positivo (VPP): proporción de pacientes con resultado de test positivo que son correctamente diagnosticados.
• Valor predictivo negativo (VPN): proporción de pacientes con resultado de test negativo que son correctamente diagnosticados.
Tests no paramétricos para dos o más muestras
Equivalente a test t pareado: Wilcoxon
Equivalente a test t no pareado: Mann-Whitney
Equivalente a ANOVA: Kruskal Wallis
Utilizar con variables ordinales o cuando variables intervalares no presenten distribución normal
Test U de Mann-Whitney
• Colocar rangos a las observaciones en orden de menor a mayor
Test de Mann-Whitney
Producción de orina diaria mL/día.
Placebo Rango Droga Rango
------------------------------------------------------------------------
1000 1 1400 6
1380 5 1600 7
1200 3 1180 2
1220 4
T= 9 19
--------------------------------------------------------------------------
Mann-Whitney U= 3, p = 0.289
Test de Tukey-Duckworth
• Cálculos se pueden hacer en la cabeza
• Existe solamente un requisito que cumplir:
4 ≤ n1 ≤ n2 ≤ 30
• Ho: Las muestras son idénticas
• Ha: Las muestras son diferentes
• El test estadístico a calcular es C
Test de Tukey-Duckworth
• Existen solamente dos valores críticos:
C0,05 = 7
C0,01 = 10
Test de Tukey-DuckworthProcedimiento
1. Determine medición más grande y más pequeña en cada muestra ranqueada.
2. En la muestra que contiene el valor más grande de todos los valores combinados, cuente todos los valores que son mayores que la medición más grande en el otro grupo.
3. En la otra muestra, cuente todas las mediciones que son más pequeñas que la medición más pequeña del grupo de la primera medición.
4. Sume ambas cantidades (= C).
Grupo1 Grupo280 8481 8982 9283 9284 9285 9486 9587 9689 9692 9693 9894 9896 9997 10198 103 Mayor valor
Valores de exclusión
Ccalc = 4 + 3 = 7 C0,05 = 7
Ccalc ≥ C0,05 por lo tanto se rechaza Ho.Conclusión: las muestras son diferentes
Kruskal-Wallis
• Equivalente a Anova• Extensión del test de Mann-Whitney a más
de dos grupos• Al conjunto de observaciones (N) se les da
rango (1 a N), indiferente de qué grupo estén, y para cada grupo se calcula la suma de rangos, y posteriormente se calcula H, definido por
Donde R es el promedio de todos los rangos, y es siempre igual a (N+1)/2. Ri = es la suma de los rangos de ni observaciones.
Para calcular es más fácil:
)1(
)(12 2
NN
RRnH ii
)1(3)1(
12 2
Nn
R
NNH
i
i
% de reducción de cefalea en tres grupos (Fentress et al, 1986)
(Rangos en paréntesis)
Relajación y biofeedback Relajación No tratados
62 (11) 69 (10) 50 (12)
74 ( 8,5) 43 (13) -120 (17)
86 ( 7) 100 ( 2) 100 ( 2)
74 ( 8,5) 94 ( 5) -288 (18)
91 ( 6) 100 ( 2) 4 (15)
37 (14) 98 ( 4) -76 (16)
rango 55 36 80
Rango medio 9,17 6,00 13,33
69,51936
80
6
36
6
55
1918
12
)1(3)1(
12
222
2
H
Nn
R
NNH
i
i
Gl = GRUPOS – 1 = 2Valor crítico: tabla de = 5,99Se acepta Ho.
Correlación de Spearman
• Medida No Paramétrica para establecer relación de dos variables ordinales (ó intervalares sin DN)
Ventajas:
- No se necesita distribución normal
- No se ve tan afectada por “outliers”
Sicólogo, 1863 - 1945
Correlación de Spearman
• Correlación para variables ordinales
• Para determinar la significancia de la asociación de dos variables continuas en que no existe normalidad de las variables.
• Contrapartida no paramétrica de la correlación de Pearson.
(n: número de pares de obs.)
(d= dif de rangos)
nn
dr
nn
yxr
s
iis
3
2
2
2
61
)1(
)(61
Grado de reabsorción ósea en mandíbula, lado der e izq. Existe relación ?
Derecha (x) 83 97 91 72 76 88 95 89 75 74
Rango 5 10 8 1 4 6 9 7 3 2
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Izquierda(y) 87 98 84 82 74 92 91 83 80 77
Rango 7 10 6 4 1 9 8 5 3 2
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -Dif. de rangos: -2 0 2 -3 3 -3 1 2 0 0
(x – y)
d2 = 4 0 4 9 9 9 1 4 0 0
d2 = 40
rs = 1 – [ 6(40) / 10(102 – 1)] = 0,757
Diferentes escalas, diferentes medidas de su asociación
Escala de ambas variables
Medida de asociación
Nominal Chi-Square de Pearson: χ2
Ordinal rho de Spearman
Intervalar r de Pearson
Resumen
• Método de investigación– Protocolo– Artículo científico
• Bioestadística– Estadística descriptiva: n, %, x ± ds– Inferencia estadística: test t, ANOVA, ARS,
RL, 2