Tipo de Variables y test a utilizar

57
ESTADÍSTICA NO PARAMÉTRICA Proporciones Chi-Cuadrado ( 2 ) Mann-Whitney Kruskal-Wallis Correlación de Spearman

description

ESTADÍSTICA NO PARAMÉTRICA Proporciones Chi-Cuadrado ( c 2 ) Mann-Whitney Kruskal-Wallis Correlación de Spearman. Tipo de Variables y test a utilizar. VariableGruposTest Intervalar2 - ind dif.Student no pareado Intervalar2 - mismos ind.Student pareado - PowerPoint PPT Presentation

Transcript of Tipo de Variables y test a utilizar

Page 1: Tipo de Variables y test a utilizar

ESTADÍSTICA NO PARAMÉTRICA

ProporcionesChi-Cuadrado (2)

Mann-WhitneyKruskal-Wallis

Correlación de Spearman

Page 2: Tipo de Variables y test a utilizar

Tipo de Variables y test a utilizar

Variable Grupos TestIntervalar 2 - ind dif. Student no pareado

Intervalar 2 - mismos ind. Student pareado

Intervalar 3 ó más grupos ANOVA/Scheffé/...

Dep/Ind Análisis de Reg. / r

Nominal 2 grupos Chi cuadrado

Ordinal 2 grupos Chi cuadrado

Ordinal 2 grupos Mann-Whitney

Ordinal 3 grupos Kruskal-Wallis

Ordinal 2 g /mismos ind Wilcoxon

Ordinal dep/ind Spearman

Page 3: Tipo de Variables y test a utilizar

Tipo de experimento

Escala de medición

Dos grupos de tratamiento consistentes de individuos diferentes

Tres o más grupos consistentes de individuos diferentes

Antes y después de un tratamiento en los mismos individuos

Múltiples tratamientos en los mismos individuos

Asociación entre dos variables

Intervalar (y obtenida de población con distribución normal)*

Test t no pareado Análisis de Varianza

Test t pareado Análisis de varianza de medidas repetidas

Regresión linear y correlación de Pearson; análisis de Bland-Altman

Nominal Chi-cuadrado de tabla de contingencia

Chi-cuadrado de tabla de contingencia

Test de McNemar

Q de Cochrane

Coeficiente de contingencia

Ordinal Test de suma de rangos de Mann-Whitney

Estadístico de Kruskal-Wallis

Test del signo de rangos de Wilcoxon

Estadístico de Friedman

Correlación de rangos de Spearman

Tiempo de sobrevida

Test de Gehan ó Test de rango del Log

* Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales

Page 4: Tipo de Variables y test a utilizar

Proporción

• Resumen de variables binarias:– Síntoma: Presente / Ausente– Tratamiento: Efectivo / Fracaso

• Si r, número de sujetos observados con la característica, en la muestra n la proporción será:– Con la característica p = r / n– Sin la característica q = 1- p

Page 5: Tipo de Variables y test a utilizar

Intervalo de confianza de una proporción

)(96,1

/)1()(

%95 psepIC

npppse

Page 6: Tipo de Variables y test a utilizar

En una clínica dental le preguntan a 263 pctes si confían que sus CD tengan los datos en un PC, 81 dicen que la privacidad se pierde, el IC 95% es:

0,364 a 252,00285,096,1308,0

0285,0263/)308,01(308,0)(

308,0263/81

%95

IC

pse

p

30.8%No confía

69.2%Si confía

Page 7: Tipo de Variables y test a utilizar

Tests de proporciones

• Si existe diferencia con una proporción conocida

• Comparar si existen diferencias significativas entre dos proporciones no pareadas

• Comparar si existen diferencias significativas entre dos proporciones pareadas

Page 8: Tipo de Variables y test a utilizar

Si existe diferencia con una proporción conocida

• Similar a lo visto en test t (comparar con promedio conocido), o sea:

observado valor de estándar error

esperado valor - observado Valor

Page 9: Tipo de Variables y test a utilizar

En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel nacional se sabe que el asma se presenta en 15%. ¿Existen diferencias significativas, entre 15% y 18%?

1872,0 1,23 :(buscar) z valoresde Tabla

23,10244,0

15,018,0

0244,0215

85,015,0)(

)1()(

)(

z

pse

n

pppse

pse

ppz esp

Page 10: Tipo de Variables y test a utilizar

A 25 pctes con osteoartrosis cervical se les dividió, al azar, en dos grupos (Lewith y Machin, 1981):

• 12 fueron tratados con estimulación infra roja (IR).• 13 recibieron placebo.

9/12 con IR mejoró o desapareció el dolor = 0,75

4/13 en el grupo placebo mejoró =0,31

¿Existen diferencias significativas?

Page 11: Tipo de Variables y test a utilizar

ivassignificat dif Existen 0,79 a 0,09 95% IC sea o

es estándar Error ely

0,44230,3077-0,7500 :ejemplo el En

)var(p)var(p 21

1789,096,1

1789,0)(13

6923,03077,0

12

25,075,0)(

)(96,1

)1()1()(

)(

21%95

21

21

2121%95

2

22

1

1121

21

ppIC

ppse

ppse

ppseppIC

n

pp

n

ppppse

ppse

Page 12: Tipo de Variables y test a utilizar

Chi cuadrado

Lado del dado f(0) f(E) (0-E)2/E -------------------------------------------------------------------------------------- 1 7 10 0,9 2 5 10 2,5 3 15 10 2,5 4 17 10 4,9 5 5 10 2,5 6 11 10 0,1 ------------------------------------------------------------------------------------- TOTAL 60 60 =13,40 =

Gl = 6 - 1 = 5 Crític : 0.05 = 11.07 Rechazar Ho

Page 13: Tipo de Variables y test a utilizar

2= 31,793, gl = 1, p<0,0001

SI NO

75

25

34

63

MEJORA SINTOMAS DEL RESFRIO

VITAMINA C

PLACEBO

793,3133,43

)33,4363(

67,44

)67,4425(

67,53

)67,5334(

33,55

)33,5575(

)(

22222

22

E

EO

Page 14: Tipo de Variables y test a utilizar

Cálculo del test – chi-cuadrado

Mejoran de los síntomas del resfrío

SI NO Total

Vitamina C fo =75

fe =55,33

fo =34

fe =53,67

109

Placebo fo =25

fe =44,67

fo =63

fe =43,33

88

Total

f columna

100 25 197

= 100*109/197

= 100*88/197

Page 15: Tipo de Variables y test a utilizar

Cálculo de valores esperados

A

C

B

D

)/())((

)/())((

)/())((

)/())((

DCBADCDBE

DCBADCCAE

DCBADBBAE

DCBACABAE

d

c

b

a

Page 16: Tipo de Variables y test a utilizar

Cálculo de valores esperados

Si No

Total  

Esperados  

75 34 109   55,33 53,67

25 63 88   44,67 43,33

100 97 197      

793,3133,43

)33,4363(

67,44

)67,4425(

67,53

)67,5334(

33,55

)33,5575(

)(

22222

22

E

EO

Page 17: Tipo de Variables y test a utilizar

Chi-Square Table

Page 18: Tipo de Variables y test a utilizar

ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTI-CÁLCULO

PD Bajo E Moderado E Alto E TOTAL

A 49 (55) 30 (26) 21 (19) 100

B 67 (55) 21 (26) 12 (19) 100

C 49 (55) 27 (26) 24 (19) 100

TOTAL165 78 57 300

E = 100 E = 55

165 300

2 = (49 - 55)2/55 + ... + (24 - 19)2/19 = 9,65

gl = (f - 1) (c - 1) = (3 - 1) (3 - 1) = 4

Crítico: 2 0.05 = 9,49. SE RECHAZA HO

Page 19: Tipo de Variables y test a utilizar

Chi-Square Table

Page 20: Tipo de Variables y test a utilizar

Chi - cuadrado (2)

2 = (O - E)2/E (Chi cuadrado de Pearson)

= (|O - E|2 - 1/2) / E Corrección de Yates

Corrección de Yates: para tablas 2x2, con muestras pequeñas (en una celda existen menos de 5 observaciones).

Tamaño de muestra: n de celdas x 10.

Ej: 2 x 2 = 4 x 10 = 40

Ej. Ant: 3x3 = 9 x 10 = 90

Page 21: Tipo de Variables y test a utilizar

Áreas bajo la curva

Page 22: Tipo de Variables y test a utilizar

Distribución de Chi-Cuadrado

• Supongamos que repetimos experimento 1000 veces (el de la Vit C / Placebo). Para cada experimento calculamos el valor de Chi-Cuadrado y ploteamos dichos valores.

• Eje X es el valor calculado de Chi-cuadrado de acuerdo a la fórmula.

• Eje Y es el número de veces que se obtiene el valor de chi-cuadrado.

Page 23: Tipo de Variables y test a utilizar

ODDS RATIO

• Proporciona:– Estimado de la relación entre dos variables

binarias (si / no)– Permite examinar los efectos de otras

variables en dicha relación – Forma especial y conveniente de

interpretación en estudios caso-control

Page 24: Tipo de Variables y test a utilizar

• “The odds that a single throw of a die will produce a six are 1 to 5, or 1/5”.

• “ODDS: es la relación de la probabilidad que el evento de interés ocurra contra la probabilidad de que esto no ocurra”.

Bland y Altman. The odds ratio, BMJ 320;1468, 2000

Page 25: Tipo de Variables y test a utilizar

Razón de desigualdad (Odd ratio)

OR = 5,559

IC 95% : 3,00 a 10,29

75 (a) 34 (b)

25 (c) 63 (d)

Si No

Si

No

)(log96,1

1111)(log

%95 ORSEORICdcba

ORSE

bc

ad

dbca

OR

e

e

Page 26: Tipo de Variables y test a utilizar

)(ln96,1lnexp

314035,0)(log63

1

34

1

25

1

75

1)(log

1111)(log

559,52534

6375

%95 ORSEORORIC

ORSE

ORSE

dcbaORSE

bc

ad

dbca

OR

e

e

e

Page 27: Tipo de Variables y test a utilizar

3,00 a 10,286IC

exp(1,100) ),exp(2,3308

1,100 a

95%

3308,2

3140,096,17154,1

7154,1)559,5(

559,52534

6375

IC

LN

OR

Page 28: Tipo de Variables y test a utilizar

Cases are weighted by the value of variable N. Frequencies HACE_EJERC$ (rows) by MEJOR_SINT$ (columns)

si no TotalSi 75.000 34.000 109.000No 25.000 63.000 88.000Total 100.000 97.000 197.000

Test statistic Value df ProbPearson Chi-square 31.793 1.000 0.000Yates corrected Chi-square 30.197 1.000 0.000

Coefficient Value Asymptotic Std ErrorOdds Ratio 5.559Ln(Odds) 1.715 0.314

OjO: Debe calcular IC 95% = 1.715 ± 1.96 * 0.314

Page 29: Tipo de Variables y test a utilizar

Riesgo Relativo

• Relación de frecuencias de dos categorías. O desigualdad de ser clasificado en la columna 1 en lugar de la columna 2.

• OR = (A/C) / (B/D)• >1: personas con factor de riesgo tienen más

probabilidad que presenten el evento.• <1: personas con factor de riesgo son menos

probable que experimenten el evento.

Page 30: Tipo de Variables y test a utilizar

Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)

Peso al nacer

<= 2500 g >2500 g Total

Edad Mat

<= 20 a. 10 40 50

> 20 a. 15 135 150

Total 25 175 200

Existe asociación entre niños de bajo peso al nacery edad de la madre?

Page 31: Tipo de Variables y test a utilizar

Odds ratio (es solamente para estudios caso-control, variables

nominales, tablas 2x2)(similar a riesgo relativo)

• Si OR >1: existe una asociación positiva entre el factor de riesgo y el evento.

• Si OR <1: hay una asociación negativa, (presencia del factor disminuye la probabilidad de encontrar el evento.

Page 32: Tipo de Variables y test a utilizar

Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)

Peso al nacer

<= 2500 g >2500 g Total

Edad Mat

<= 20 a. 10 40 50

> 20 a. 15 135 150

Total 25 175 200

n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2

2 = ------------------------------------------ = --------------------------------------------- = 2,58 n1.n2.n.1n.2 50x150x25x175

Page 33: Tipo de Variables y test a utilizar

Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)

Peso al nacer

<= 2500 g >2500 g Total

Edad Mat

<= 20 a. n11 n12 n1.

> 20 a. n21 n22 n2.

Total n.1 n.2 n..

n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2

2 = ------------------------------------------ = --------------------------------------------- = 2,58 n1.n2.n.1n.2 50x150x25x175

Page 34: Tipo de Variables y test a utilizar

Proporciones(Fleiss y col, 3ª. Ed,)

Peso al nacer

<= 2500 g >2500 g Total

Edad Mat

<= 20 a. 0,050 0,200 0,25

> 20 a. 0,075 0,675 0,75

Total 0,125 0,875 1,00

Page 35: Tipo de Variables y test a utilizar

Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)

Peso al nacer

<= 2500 g >2500 g Total

Edad Mat

<= 20 a. 20 80 100

> 20 a. 30 270 300

Total 50 350 400

Existe asociación entre niños de bajo peso al nacery edad de la madre?

Page 36: Tipo de Variables y test a utilizar

• Sensibilidad: proporción de positivos que son correctamente identificados por el test.

• Especificidad: proporción de negativos que son correctamente identificados por el test

Page 37: Tipo de Variables y test a utilizar

Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad

de tests para diagnóstico

SI NO

SI

NO

(a)Verdad +45

(c)Falso –5

(b)Falso +10

(d)Verdad -40

TEST

ENFERMEDAD

Sensibilidad = a / a + c = 45 / 50 = 0,90Especificidad = d / b + d = 40 / 50 = 0,80VPP = a / a + b = 45 / 55 = 0,82VPN = d / c + d = 40 / 45 = 0,89

N = 100

Page 38: Tipo de Variables y test a utilizar

Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad de tests

para diagnósticoTomado de Kramer, 1988

SI NO

SI

NO

(a)Verdad +9

(c)Falso –1

(b)Falso +18

(d)Verdad -72

TEST

ENFERMEDAD

Sensibilidad = a / a + c = 9 / 10 = 0,90Especificidad = d / b + d = 72 / 90 = 0,80VPP = a / a + b = 9 / 27 = 0,33VPN = d / c + d = 72 / 73 = 0,99

N = 100

Page 39: Tipo de Variables y test a utilizar

• Valor predictivo positivo (VPP): proporción de pacientes con resultado de test positivo que son correctamente diagnosticados.

• Valor predictivo negativo (VPN): proporción de pacientes con resultado de test negativo que son correctamente diagnosticados.

Page 40: Tipo de Variables y test a utilizar

Tests no paramétricos para dos o más muestras

Equivalente a test t pareado: Wilcoxon

Equivalente a test t no pareado: Mann-Whitney

Equivalente a ANOVA: Kruskal Wallis

Utilizar con variables ordinales o cuando variables intervalares no presenten distribución normal

Page 41: Tipo de Variables y test a utilizar

Test U de Mann-Whitney

• Colocar rangos a las observaciones en orden de menor a mayor

Page 42: Tipo de Variables y test a utilizar

Test de Mann-Whitney

Producción de orina diaria mL/día.

Placebo Rango Droga Rango

------------------------------------------------------------------------

1000 1 1400 6

1380 5 1600 7

1200 3 1180 2

1220 4

T= 9 19

--------------------------------------------------------------------------

Mann-Whitney U= 3, p = 0.289

Page 43: Tipo de Variables y test a utilizar

Test de Tukey-Duckworth

• Cálculos se pueden hacer en la cabeza

• Existe solamente un requisito que cumplir:

4 ≤ n1 ≤ n2 ≤ 30

• Ho: Las muestras son idénticas

• Ha: Las muestras son diferentes

• El test estadístico a calcular es C

Page 44: Tipo de Variables y test a utilizar

Test de Tukey-Duckworth

• Existen solamente dos valores críticos:

C0,05 = 7

C0,01 = 10

Page 45: Tipo de Variables y test a utilizar

Test de Tukey-DuckworthProcedimiento

1. Determine medición más grande y más pequeña en cada muestra ranqueada.

2. En la muestra que contiene el valor más grande de todos los valores combinados, cuente todos los valores que son mayores que la medición más grande en el otro grupo.

Page 46: Tipo de Variables y test a utilizar

3. En la otra muestra, cuente todas las mediciones que son más pequeñas que la medición más pequeña del grupo de la primera medición.

4. Sume ambas cantidades (= C).

Page 47: Tipo de Variables y test a utilizar

Grupo1 Grupo280 8481 8982 9283 9284 9285 9486 9587 9689 9692 9693 9894 9896 9997 10198 103 Mayor valor

Valores de exclusión

Ccalc = 4 + 3 = 7 C0,05 = 7

Ccalc ≥ C0,05 por lo tanto se rechaza Ho.Conclusión: las muestras son diferentes

Page 48: Tipo de Variables y test a utilizar

Kruskal-Wallis

• Equivalente a Anova• Extensión del test de Mann-Whitney a más

de dos grupos• Al conjunto de observaciones (N) se les da

rango (1 a N), indiferente de qué grupo estén, y para cada grupo se calcula la suma de rangos, y posteriormente se calcula H, definido por

Page 49: Tipo de Variables y test a utilizar

Donde R es el promedio de todos los rangos, y es siempre igual a (N+1)/2. Ri = es la suma de los rangos de ni observaciones.

Para calcular es más fácil:

)1(

)(12 2

NN

RRnH ii

)1(3)1(

12 2

Nn

R

NNH

i

i

Page 50: Tipo de Variables y test a utilizar

% de reducción de cefalea en tres grupos (Fentress et al, 1986)

(Rangos en paréntesis)

Relajación y biofeedback Relajación No tratados

62 (11) 69 (10) 50 (12)

74 ( 8,5) 43 (13) -120 (17)

86 ( 7) 100 ( 2) 100 ( 2)

74 ( 8,5) 94 ( 5) -288 (18)

91 ( 6) 100 ( 2) 4 (15)

37 (14) 98 ( 4) -76 (16)

rango 55 36 80

Rango medio 9,17 6,00 13,33

Page 51: Tipo de Variables y test a utilizar

69,51936

80

6

36

6

55

1918

12

)1(3)1(

12

222

2

H

Nn

R

NNH

i

i

Gl = GRUPOS – 1 = 2Valor crítico: tabla de = 5,99Se acepta Ho.

Page 52: Tipo de Variables y test a utilizar

Correlación de Spearman

• Medida No Paramétrica para establecer relación de dos variables ordinales (ó intervalares sin DN)

Ventajas:

- No se necesita distribución normal

- No se ve tan afectada por “outliers”

Sicólogo, 1863 - 1945

Page 53: Tipo de Variables y test a utilizar

Correlación de Spearman

• Correlación para variables ordinales

• Para determinar la significancia de la asociación de dos variables continuas en que no existe normalidad de las variables.

• Contrapartida no paramétrica de la correlación de Pearson.

Page 54: Tipo de Variables y test a utilizar

(n: número de pares de obs.)

(d= dif de rangos)

nn

dr

nn

yxr

s

iis

3

2

2

2

61

)1(

)(61

Page 55: Tipo de Variables y test a utilizar

Grado de reabsorción ósea en mandíbula, lado der e izq. Existe relación ?

Derecha (x) 83 97 91 72 76 88 95 89 75 74

Rango 5 10 8 1 4 6 9 7 3 2

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Izquierda(y) 87 98 84 82 74 92 91 83 80 77

Rango 7 10 6 4 1 9 8 5 3 2

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -Dif. de rangos: -2 0 2 -3 3 -3 1 2 0 0

(x – y)

d2 = 4 0 4 9 9 9 1 4 0 0

d2 = 40

rs = 1 – [ 6(40) / 10(102 – 1)] = 0,757

Page 56: Tipo de Variables y test a utilizar

Diferentes escalas, diferentes medidas de su asociación

Escala de ambas variables

Medida de asociación

Nominal Chi-Square de Pearson: χ2

Ordinal rho de Spearman

Intervalar r de Pearson

Page 57: Tipo de Variables y test a utilizar

Resumen

• Método de investigación– Protocolo– Artículo científico

• Bioestadística– Estadística descriptiva: n, %, x ± ds– Inferencia estadística: test t, ANOVA, ARS,

RL, 2