Tipo de Variables y test a utilizar

Post on 03-Jan-2016

32 views 0 download

description

ESTADÍSTICA NO PARAMÉTRICA Proporciones Chi-Cuadrado ( c 2 ) Mann-Whitney Kruskal-Wallis Correlación de Spearman. Tipo de Variables y test a utilizar. VariableGruposTest Intervalar2 - ind dif.Student no pareado Intervalar2 - mismos ind.Student pareado - PowerPoint PPT Presentation

Transcript of Tipo de Variables y test a utilizar

ESTADÍSTICA NO PARAMÉTRICA

ProporcionesChi-Cuadrado (2)

Mann-WhitneyKruskal-Wallis

Correlación de Spearman

Tipo de Variables y test a utilizar

Variable Grupos TestIntervalar 2 - ind dif. Student no pareado

Intervalar 2 - mismos ind. Student pareado

Intervalar 3 ó más grupos ANOVA/Scheffé/...

Dep/Ind Análisis de Reg. / r

Nominal 2 grupos Chi cuadrado

Ordinal 2 grupos Chi cuadrado

Ordinal 2 grupos Mann-Whitney

Ordinal 3 grupos Kruskal-Wallis

Ordinal 2 g /mismos ind Wilcoxon

Ordinal dep/ind Spearman

Tipo de experimento

Escala de medición

Dos grupos de tratamiento consistentes de individuos diferentes

Tres o más grupos consistentes de individuos diferentes

Antes y después de un tratamiento en los mismos individuos

Múltiples tratamientos en los mismos individuos

Asociación entre dos variables

Intervalar (y obtenida de población con distribución normal)*

Test t no pareado Análisis de Varianza

Test t pareado Análisis de varianza de medidas repetidas

Regresión linear y correlación de Pearson; análisis de Bland-Altman

Nominal Chi-cuadrado de tabla de contingencia

Chi-cuadrado de tabla de contingencia

Test de McNemar

Q de Cochrane

Coeficiente de contingencia

Ordinal Test de suma de rangos de Mann-Whitney

Estadístico de Kruskal-Wallis

Test del signo de rangos de Wilcoxon

Estadístico de Friedman

Correlación de rangos de Spearman

Tiempo de sobrevida

Test de Gehan ó Test de rango del Log

* Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales

Proporción

• Resumen de variables binarias:– Síntoma: Presente / Ausente– Tratamiento: Efectivo / Fracaso

• Si r, número de sujetos observados con la característica, en la muestra n la proporción será:– Con la característica p = r / n– Sin la característica q = 1- p

Intervalo de confianza de una proporción

)(96,1

/)1()(

%95 psepIC

npppse

En una clínica dental le preguntan a 263 pctes si confían que sus CD tengan los datos en un PC, 81 dicen que la privacidad se pierde, el IC 95% es:

0,364 a 252,00285,096,1308,0

0285,0263/)308,01(308,0)(

308,0263/81

%95

IC

pse

p

30.8%No confía

69.2%Si confía

Tests de proporciones

• Si existe diferencia con una proporción conocida

• Comparar si existen diferencias significativas entre dos proporciones no pareadas

• Comparar si existen diferencias significativas entre dos proporciones pareadas

Si existe diferencia con una proporción conocida

• Similar a lo visto en test t (comparar con promedio conocido), o sea:

observado valor de estándar error

esperado valor - observado Valor

En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel nacional se sabe que el asma se presenta en 15%. ¿Existen diferencias significativas, entre 15% y 18%?

1872,0 1,23 :(buscar) z valoresde Tabla

23,10244,0

15,018,0

0244,0215

85,015,0)(

)1()(

)(

z

pse

n

pppse

pse

ppz esp

A 25 pctes con osteoartrosis cervical se les dividió, al azar, en dos grupos (Lewith y Machin, 1981):

• 12 fueron tratados con estimulación infra roja (IR).• 13 recibieron placebo.

9/12 con IR mejoró o desapareció el dolor = 0,75

4/13 en el grupo placebo mejoró =0,31

¿Existen diferencias significativas?

ivassignificat dif Existen 0,79 a 0,09 95% IC sea o

es estándar Error ely

0,44230,3077-0,7500 :ejemplo el En

)var(p)var(p 21

1789,096,1

1789,0)(13

6923,03077,0

12

25,075,0)(

)(96,1

)1()1()(

)(

21%95

21

21

2121%95

2

22

1

1121

21

ppIC

ppse

ppse

ppseppIC

n

pp

n

ppppse

ppse

Chi cuadrado

Lado del dado f(0) f(E) (0-E)2/E -------------------------------------------------------------------------------------- 1 7 10 0,9 2 5 10 2,5 3 15 10 2,5 4 17 10 4,9 5 5 10 2,5 6 11 10 0,1 ------------------------------------------------------------------------------------- TOTAL 60 60 =13,40 =

Gl = 6 - 1 = 5 Crític : 0.05 = 11.07 Rechazar Ho

2= 31,793, gl = 1, p<0,0001

SI NO

75

25

34

63

MEJORA SINTOMAS DEL RESFRIO

VITAMINA C

PLACEBO

793,3133,43

)33,4363(

67,44

)67,4425(

67,53

)67,5334(

33,55

)33,5575(

)(

22222

22

E

EO

Cálculo del test – chi-cuadrado

Mejoran de los síntomas del resfrío

SI NO Total

Vitamina C fo =75

fe =55,33

fo =34

fe =53,67

109

Placebo fo =25

fe =44,67

fo =63

fe =43,33

88

Total

f columna

100 25 197

= 100*109/197

= 100*88/197

Cálculo de valores esperados

A

C

B

D

)/())((

)/())((

)/())((

)/())((

DCBADCDBE

DCBADCCAE

DCBADBBAE

DCBACABAE

d

c

b

a

Cálculo de valores esperados

Si No

Total  

Esperados  

75 34 109   55,33 53,67

25 63 88   44,67 43,33

100 97 197      

793,3133,43

)33,4363(

67,44

)67,4425(

67,53

)67,5334(

33,55

)33,5575(

)(

22222

22

E

EO

Chi-Square Table

ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTI-CÁLCULO

PD Bajo E Moderado E Alto E TOTAL

A 49 (55) 30 (26) 21 (19) 100

B 67 (55) 21 (26) 12 (19) 100

C 49 (55) 27 (26) 24 (19) 100

TOTAL165 78 57 300

E = 100 E = 55

165 300

2 = (49 - 55)2/55 + ... + (24 - 19)2/19 = 9,65

gl = (f - 1) (c - 1) = (3 - 1) (3 - 1) = 4

Crítico: 2 0.05 = 9,49. SE RECHAZA HO

Chi-Square Table

Chi - cuadrado (2)

2 = (O - E)2/E (Chi cuadrado de Pearson)

= (|O - E|2 - 1/2) / E Corrección de Yates

Corrección de Yates: para tablas 2x2, con muestras pequeñas (en una celda existen menos de 5 observaciones).

Tamaño de muestra: n de celdas x 10.

Ej: 2 x 2 = 4 x 10 = 40

Ej. Ant: 3x3 = 9 x 10 = 90

Áreas bajo la curva

Distribución de Chi-Cuadrado

• Supongamos que repetimos experimento 1000 veces (el de la Vit C / Placebo). Para cada experimento calculamos el valor de Chi-Cuadrado y ploteamos dichos valores.

• Eje X es el valor calculado de Chi-cuadrado de acuerdo a la fórmula.

• Eje Y es el número de veces que se obtiene el valor de chi-cuadrado.

ODDS RATIO

• Proporciona:– Estimado de la relación entre dos variables

binarias (si / no)– Permite examinar los efectos de otras

variables en dicha relación – Forma especial y conveniente de

interpretación en estudios caso-control

• “The odds that a single throw of a die will produce a six are 1 to 5, or 1/5”.

• “ODDS: es la relación de la probabilidad que el evento de interés ocurra contra la probabilidad de que esto no ocurra”.

Bland y Altman. The odds ratio, BMJ 320;1468, 2000

Razón de desigualdad (Odd ratio)

OR = 5,559

IC 95% : 3,00 a 10,29

75 (a) 34 (b)

25 (c) 63 (d)

Si No

Si

No

)(log96,1

1111)(log

%95 ORSEORICdcba

ORSE

bc

ad

dbca

OR

e

e

)(ln96,1lnexp

314035,0)(log63

1

34

1

25

1

75

1)(log

1111)(log

559,52534

6375

%95 ORSEORORIC

ORSE

ORSE

dcbaORSE

bc

ad

dbca

OR

e

e

e

3,00 a 10,286IC

exp(1,100) ),exp(2,3308

1,100 a

95%

3308,2

3140,096,17154,1

7154,1)559,5(

559,52534

6375

IC

LN

OR

Cases are weighted by the value of variable N. Frequencies HACE_EJERC$ (rows) by MEJOR_SINT$ (columns)

si no TotalSi 75.000 34.000 109.000No 25.000 63.000 88.000Total 100.000 97.000 197.000

Test statistic Value df ProbPearson Chi-square 31.793 1.000 0.000Yates corrected Chi-square 30.197 1.000 0.000

Coefficient Value Asymptotic Std ErrorOdds Ratio 5.559Ln(Odds) 1.715 0.314

OjO: Debe calcular IC 95% = 1.715 ± 1.96 * 0.314

Riesgo Relativo

• Relación de frecuencias de dos categorías. O desigualdad de ser clasificado en la columna 1 en lugar de la columna 2.

• OR = (A/C) / (B/D)• >1: personas con factor de riesgo tienen más

probabilidad que presenten el evento.• <1: personas con factor de riesgo son menos

probable que experimenten el evento.

Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)

Peso al nacer

<= 2500 g >2500 g Total

Edad Mat

<= 20 a. 10 40 50

> 20 a. 15 135 150

Total 25 175 200

Existe asociación entre niños de bajo peso al nacery edad de la madre?

Odds ratio (es solamente para estudios caso-control, variables

nominales, tablas 2x2)(similar a riesgo relativo)

• Si OR >1: existe una asociación positiva entre el factor de riesgo y el evento.

• Si OR <1: hay una asociación negativa, (presencia del factor disminuye la probabilidad de encontrar el evento.

Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)

Peso al nacer

<= 2500 g >2500 g Total

Edad Mat

<= 20 a. 10 40 50

> 20 a. 15 135 150

Total 25 175 200

n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2

2 = ------------------------------------------ = --------------------------------------------- = 2,58 n1.n2.n.1n.2 50x150x25x175

Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)

Peso al nacer

<= 2500 g >2500 g Total

Edad Mat

<= 20 a. n11 n12 n1.

> 20 a. n21 n22 n2.

Total n.1 n.2 n..

n.. (|n11n22 – n12n21| - ½ n..)2 200(|10x135-40x15| -1/2 200)2

2 = ------------------------------------------ = --------------------------------------------- = 2,58 n1.n2.n.1n.2 50x150x25x175

Proporciones(Fleiss y col, 3ª. Ed,)

Peso al nacer

<= 2500 g >2500 g Total

Edad Mat

<= 20 a. 0,050 0,200 0,25

> 20 a. 0,075 0,675 0,75

Total 0,125 0,875 1,00

Edad Materna y peso al nacer(Fleiss y col, 3ª. Ed,)

Peso al nacer

<= 2500 g >2500 g Total

Edad Mat

<= 20 a. 20 80 100

> 20 a. 30 270 300

Total 50 350 400

Existe asociación entre niños de bajo peso al nacery edad de la madre?

• Sensibilidad: proporción de positivos que son correctamente identificados por el test.

• Especificidad: proporción de negativos que son correctamente identificados por el test

Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad

de tests para diagnóstico

SI NO

SI

NO

(a)Verdad +45

(c)Falso –5

(b)Falso +10

(d)Verdad -40

TEST

ENFERMEDAD

Sensibilidad = a / a + c = 45 / 50 = 0,90Especificidad = d / b + d = 40 / 50 = 0,80VPP = a / a + b = 45 / 55 = 0,82VPN = d / c + d = 40 / 45 = 0,89

N = 100

Comparación de sensibilidad y especificidad vs. Valores predictivos positivo y negativo para evaluar la seguridad de tests

para diagnósticoTomado de Kramer, 1988

SI NO

SI

NO

(a)Verdad +9

(c)Falso –1

(b)Falso +18

(d)Verdad -72

TEST

ENFERMEDAD

Sensibilidad = a / a + c = 9 / 10 = 0,90Especificidad = d / b + d = 72 / 90 = 0,80VPP = a / a + b = 9 / 27 = 0,33VPN = d / c + d = 72 / 73 = 0,99

N = 100

• Valor predictivo positivo (VPP): proporción de pacientes con resultado de test positivo que son correctamente diagnosticados.

• Valor predictivo negativo (VPN): proporción de pacientes con resultado de test negativo que son correctamente diagnosticados.

Tests no paramétricos para dos o más muestras

Equivalente a test t pareado: Wilcoxon

Equivalente a test t no pareado: Mann-Whitney

Equivalente a ANOVA: Kruskal Wallis

Utilizar con variables ordinales o cuando variables intervalares no presenten distribución normal

Test U de Mann-Whitney

• Colocar rangos a las observaciones en orden de menor a mayor

Test de Mann-Whitney

Producción de orina diaria mL/día.

Placebo Rango Droga Rango

------------------------------------------------------------------------

1000 1 1400 6

1380 5 1600 7

1200 3 1180 2

1220 4

T= 9 19

--------------------------------------------------------------------------

Mann-Whitney U= 3, p = 0.289

Test de Tukey-Duckworth

• Cálculos se pueden hacer en la cabeza

• Existe solamente un requisito que cumplir:

4 ≤ n1 ≤ n2 ≤ 30

• Ho: Las muestras son idénticas

• Ha: Las muestras son diferentes

• El test estadístico a calcular es C

Test de Tukey-Duckworth

• Existen solamente dos valores críticos:

C0,05 = 7

C0,01 = 10

Test de Tukey-DuckworthProcedimiento

1. Determine medición más grande y más pequeña en cada muestra ranqueada.

2. En la muestra que contiene el valor más grande de todos los valores combinados, cuente todos los valores que son mayores que la medición más grande en el otro grupo.

3. En la otra muestra, cuente todas las mediciones que son más pequeñas que la medición más pequeña del grupo de la primera medición.

4. Sume ambas cantidades (= C).

Grupo1 Grupo280 8481 8982 9283 9284 9285 9486 9587 9689 9692 9693 9894 9896 9997 10198 103 Mayor valor

Valores de exclusión

Ccalc = 4 + 3 = 7 C0,05 = 7

Ccalc ≥ C0,05 por lo tanto se rechaza Ho.Conclusión: las muestras son diferentes

Kruskal-Wallis

• Equivalente a Anova• Extensión del test de Mann-Whitney a más

de dos grupos• Al conjunto de observaciones (N) se les da

rango (1 a N), indiferente de qué grupo estén, y para cada grupo se calcula la suma de rangos, y posteriormente se calcula H, definido por

Donde R es el promedio de todos los rangos, y es siempre igual a (N+1)/2. Ri = es la suma de los rangos de ni observaciones.

Para calcular es más fácil:

)1(

)(12 2

NN

RRnH ii

)1(3)1(

12 2

Nn

R

NNH

i

i

% de reducción de cefalea en tres grupos (Fentress et al, 1986)

(Rangos en paréntesis)

Relajación y biofeedback Relajación No tratados

62 (11) 69 (10) 50 (12)

74 ( 8,5) 43 (13) -120 (17)

86 ( 7) 100 ( 2) 100 ( 2)

74 ( 8,5) 94 ( 5) -288 (18)

91 ( 6) 100 ( 2) 4 (15)

37 (14) 98 ( 4) -76 (16)

rango 55 36 80

Rango medio 9,17 6,00 13,33

69,51936

80

6

36

6

55

1918

12

)1(3)1(

12

222

2

H

Nn

R

NNH

i

i

Gl = GRUPOS – 1 = 2Valor crítico: tabla de = 5,99Se acepta Ho.

Correlación de Spearman

• Medida No Paramétrica para establecer relación de dos variables ordinales (ó intervalares sin DN)

Ventajas:

- No se necesita distribución normal

- No se ve tan afectada por “outliers”

Sicólogo, 1863 - 1945

Correlación de Spearman

• Correlación para variables ordinales

• Para determinar la significancia de la asociación de dos variables continuas en que no existe normalidad de las variables.

• Contrapartida no paramétrica de la correlación de Pearson.

(n: número de pares de obs.)

(d= dif de rangos)

nn

dr

nn

yxr

s

iis

3

2

2

2

61

)1(

)(61

Grado de reabsorción ósea en mandíbula, lado der e izq. Existe relación ?

Derecha (x) 83 97 91 72 76 88 95 89 75 74

Rango 5 10 8 1 4 6 9 7 3 2

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Izquierda(y) 87 98 84 82 74 92 91 83 80 77

Rango 7 10 6 4 1 9 8 5 3 2

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -Dif. de rangos: -2 0 2 -3 3 -3 1 2 0 0

(x – y)

d2 = 4 0 4 9 9 9 1 4 0 0

d2 = 40

rs = 1 – [ 6(40) / 10(102 – 1)] = 0,757

Diferentes escalas, diferentes medidas de su asociación

Escala de ambas variables

Medida de asociación

Nominal Chi-Square de Pearson: χ2

Ordinal rho de Spearman

Intervalar r de Pearson

Resumen

• Método de investigación– Protocolo– Artículo científico

• Bioestadística– Estadística descriptiva: n, %, x ± ds– Inferencia estadística: test t, ANOVA, ARS,

RL, 2