Causalidad, Erik Cobo - UPC. Universitat Politècnica de Catalunya · al azar Grupo R Respuesta...
Transcript of Causalidad, Erik Cobo - UPC. Universitat Politècnica de Catalunya · al azar Grupo R Respuesta...
13/03/2015
1
Causalidad, Erik Cobo
Grupo AEFI de Trabajo en Farmacovigilancia: Thais Baleeiro, Meritxell Lloret, Sara Balaguer, Cristina de Irala, Sonia López
10:45 ‐ 11:30 Causalidad. Erik Cobo. Ejercicio: Fluconazole Case Report. CARE Reporting Guideline
11:30 ‐ 12:00 Pausa ‐ café
12:00 ‐ 12:45 Medidas de Frecuencia. Jordi Cortés.Ejercicio: Rosiglitazone RECORD trial. Interpretar medidas riesgos
12:45 ‐ 13:30 Inferencia frente a decisión J. A. González. Ejercicio: Rosiglitazone RECORD trial (Cont). Interpretar ICes
13:30 ‐ 15:00 Almuerzo de trabajo Ejercicio: Vit B12 con PPIs y H2Ras: calcular OR con R
15:00 ‐ 16:00 Riesgos de sesgo: confusión. Jordi Cortés. Ejercicio: Vit B12 con PPIs y H2Ras: ¿sesgo confusión?
16:00 ‐ 17:00 Riesgos de sesgo: selección. José Antonio González.Ejercicio: Vit B12 con PPIs y H2Ras: ¿sesgo selección?
17:00 ‐ 18:00 Transparencia y Guías de publicación Erik Cobo. Ejercicio: Rosiglitazone RECORD trial comprobar cumple RG
13/03/2015
2
Tipos de estudios
Causas y condiciones
Experimentos y observaciones
Farmacología y Etiología
Causas o efectos
El mejor diseño para estimar efectos
En busca de la causa perdida
Preguntas del paciente, médica y científica:
¿Qué me pasa? diagnóstico Clasificación
¿Qué me pasará? pronóstico Predicción
¿Por qué me pasa? etiología Causas
¿Puede ayudarme? tratamiento
+ Efectosprevención
Objetivos
Lon
git
ud
inal
es
13/03/2015
3
Las respuestas Y
Las queremos o cambiar o avanzar dependiendo de:
A) Causas X
Intervenimos sobre las causas X para cambiar el futuro Y
B) Condiciones Z
Usamos las condiciones Z para anticipar el futuro Y
Causas o Condiciones?
13/03/2015
4
Experimento frente a Observación
A) Experimento:
Hacemos (“do”): Asignamos X a las unidades
Ejemplo: Asignamos 1 o 4 visitas/año a los hipertensos y
les seguimos en el tiempo para medir la respuesta.
B) Observación:
Vemos (“see”): Z en las unidades
Ejemplo: Miramos el número de visitas/año y…
8
13/03/2015
5
A) ¿Cuál es la causa de este efecto?Se me ha ido el dolor: ¿será porque me tomé una aspirina?
R
B) ¿Cuál es el efecto de esta causa?Si me tomo una aspirina, ¿se me irá el dolor?
P
Ejemplo: Asma pre-olímpica en Barcelona:
brotes epidémicos en días y barrios concretos
1ª pregunta: ¿Causas del asma?
Respuesta: interacción entre viento y descarga de soja
2ª pregunta: ¿Efecto de descargar la soja con protección?
Respuesta: el efecto de lona protectora es no-asma
Causa o Efecto ?
R
P
Etiology or pharmacologya) Etiology:
What are the causes of an effect?
b) Pharmacology:What is the effect of this cause?
13/03/2015
6
Comparabilidad
Poblaciónobjetivo
Criteriosclínico-
epidemiológicos
Monitorización
Técnicas
estadísticas
Comparabilidad
Criterios de
selección
Poblaciónexterna
Transportabilidad
Grupo T
Asignaciónal azar
Grupo R
RespuestaRespuesta
Seguimiento idéntico y completo
El mejor diseño para estimar efectos
13/03/2015
7
Asignar los más graves a T : Sesgo de selección
Aleatorización y Asignación oculta
Dar rescate a R: Sesgo de actuación (performance)
Placebo y Enmascaramiento
Eliminar a curados, no toman… : Sesgo por atrición o desgaste
Seguimiento completo: ‘dejar el tratamiento’ ≠ ‘dejar el estudio’
Ser más generoso al valorar la respuesta en T: Sesgo de evaluación
Enmascaramiento y Variables “automáticas”
Escoger resultado deseado: Sesgo de análisis
Plan de análisis previo (protocolo)
Riesgos de sesgo
13/03/2015
8
15
En busca de la causa perdida
16
13/03/2015
9
17
18
13/03/2015
10
19
Causalidad, Erik Cobo
Grupo AEFI de Trabajo en Farmacovigilancia: Thais Baleeiro, Meritxell Lloret, Sara Balaguer, Cristina de Irala, Sonia López
13/03/2015
1
Medidas Riesgo, Jordi Cortés
Grupo AEFI de Trabajo en Farmacovigilancia: Thais Baleeiro, Meritxell Lloret, Sara Balaguer, Cristina de Irala, Sonia López
2
Cocientes de riesgos
Diferencias de riesgos
Terminología para cocientes
Cocientes de tasas
Interpretando el Hazard ratio
13/03/2015
2
P
P<0.001
P<0.001
P<0.001
P>0.001
Cocientes de riesgos
13/03/2015
3
Diferencias de riesgos
Propor-ciones
yProbabi-lidades
Tasas
Momios
13/03/2015
4
RR, HR, and OR numerically approximateone another with shorter follow-up, rarer end points, and risks closer to 1
When HR is > 1.0, it exceeds RR, and is exceeded by the OR
Their divergence increases with the product of three factors: (1) the length of follow-up, (2) the average rate of the end point occurrence, and (3) the magnitude of risk.
8
13/03/2015
5
9
10
13/03/2015
6
11
Medidas Riesgo, Jordi Cortés
Grupo AEFI de Trabajo en Farmacovigilancia: Thais Baleeiro, Meritxell Lloret, Sara Balaguer, Cristina de Irala, Sonia López
3/13/2015
1
Inferencia y decisión, J. A. González
Grupo AEFI de Trabajo en Farmacovigilancia: Thais Baleeiro, Meritxell Lloret, Sara Balaguer, Cristina de Irala, Sonia López
a) Inferencia: proceso inductivo sobre el conocimiento. ¿Qué sé?
Inferencia frente a decisión. Dos escuelas enfrentadas
‘Evidencia’ de Fisher (de lo particular a lo general)
Valor de P: evidencia en contra de H
La P es un estadístico procedente de los datos
Se reporta P: menor P, mayor evidencia
Si la P ha sido muy pequeña, “o un evento excepcionalmente raro
ha ocurrido, o la teoría no es cierta”
Sólo dispone de H : “ausencia de pruebas no es prueba de ausencia”
3/13/2015
2
P
Fre
qu
en
cy
0.0 0.2 0.4 0.6 0.8 1.0
01
00
20
03
00
40
05
00
En el entorno de las “pruebas de significación” de Fisher
P se entiende como la probabilidad de un evento x, o más extremo aún: P(x | H)
Si los datos del experimento provienen realmente de la Hipótesis H planteada,
el valor de P se distribuye uniformemente entre 0 y 1.
Por ejemplo, comparando la
proporción de un evento en dos
poblaciones independientes, a
partir de dos muestras de 300
participantes, mediante OR
(10 000 simulaciones,
en este caso, las dos proporciones
eran idénticas)
Segundo estudio, las proporciones
eran 0.20 y 0.25 respectivamente.
Según la prueba de Fisher, H
puede ser rechazada cuando P no
supera cierto umbral (llamado por
él “level of significance”).
Este proceso permitiría el progreso
del conocimiento, poniendo a
prueba las hipótesis o “Teorías”,
que irían cayendo si no son
plausibles con los datos.
P
Fre
qu
en
cy
0.0 0.2 0.4 0.6 0.8 1.0
01
00
02
00
03
00
04
00
0
3/13/2015
3
Denominado por Neyman-Pearson “prueba/contraste de hipótesis”, porque
introduce explícitamente H0 y H1. (nula y alternativa)
Luego, el resultado conlleva una acción.
Minimización del coste de la decisión final;
hay dos errores de distinta naturaleza, con riesgos α y β
Introduce el concepto de “potencia” de la prueba: P(A1 | H1)
b) Decisión: proceso deductivo sobre la acción. ¿Qué hago?
Hacer A0 Hacer A1
H0 es cierta Error tipo I
H0 es falsa Error tipo II
Es “frecuentista”: se fija un porcentaje α tolerado de errores tipo I y
se minimiza el porcentaje β de errores tipo II.
No habla de razonamiento inductivo sino de comportamiento inductivo
(en un proceso completamente deductivo).
Es decir: de acuerdo con tal regla de comportamiento, “a la larga las
equivocaciones serán pocas”.
Como se puede comprobar, no se habla de conocimiento.
3/13/2015
4
¿En qué punto estamos?
Fisher y Neyman sostuvieron una larga controversia, durante años.
Hubbard y Bayarri (ASA, 2003) insisten en su mutua incompatibilidad.
Paradójicamente, la práctica real parece haber hecho un Frankenstein
combinando ambas líneas. El mismo Neyman contribuyó, denominando
también “level of significance” al valor α.
(hay que decir que ambos pensaron en el número 0.05 como apropiado)
Es habitual que el experimentador asigne un valor α=5% (u otro), para
comparar con él los valores de P obtenidos: ¿P < α?
P es erróneamente interpretado como una tasa del error tipo I y,
simultáneamente, como una medida de la evidencia contra H0.
• α: interpretación frecuentista (tras muchas pruebas con H0, 100α% fallan)
• P: es dependiente de los datos
¿Por qué es tan difícil entender el valor de P?
La confusión alrededor de las P (y, en general, de las pruebas) es grande.
• ¿El valor de P es la probabilidad de que la hipótesis nula sea cierta?
• ¿Es la probabilidad de que si se repite la prueba obtengamos la misma
conclusión?
• ¿Una diferencia no significativa (como P>0.05) significa que no hay
diferencia entre los grupos?
• ¿Hay contradicción si un estudio obtiene P<0.05 y otro P>0.05?
• ¿Si P >0.05 los resultados del estudio se explican solo por el azar?
• ¿P nos indica la importancia o el efecto de la intervención?
• ¿Cuándo P<0.05 hemos demostrado que la hipótesis nula es falsa, o que
la alternativa es cierta?
3/13/2015
5
Lo que dicen las guías
16. Main results: 16 (a). Give unadjusted estimates and, if applicable,
confounder-adjusted estimates and their precision (e.g., 95% confidence
intervals).
Y así de categóricamente:
Estimates should be given with confidence intervals.
(STROBE. Explanation and elaboration. 2007)
Para estudios aleatorizados:
The use of confidence intervals has increased markedly in recent years,
[…]. Although P values may be provided in addition to confidence
intervals, results should not be reported solely as P values.
(CONSORT. Explanation and elaboration. 2010)
El IC aporta información
relativa a la magnitud del
efecto de interés.
La amplitud del IC viene dada
por la incertidumbre del
muestreo (error aleatorio),
NO está relacionada con la
variabilidad del efecto,
NO incluye diferencias
sistemáticas (sesgos no
aleatorios).
IC = estimación puntual ±
error típico × Kconfianza
3/13/2015
6
a) Inferencia: ¿evidencia sobre efectos del tabaco?
Inferencia frente a decisión. ¿Fumar?
b) Decisión: ¿qué acción tomamos sobre el tabaco?
Fisher: Ausencia de diseño experimental posibles confusoras no evidencia
Greenland. Humo en bosque: ¿enviar científicos para confirmar o bomberos?
Cobo. Criterio de estupidez
Hill: Si se cumplen criterios Koch-Hill, causalidad es la interpretación más plausible
13/03/2015
1
Confusión, Jordi Cortés
Grupo AEFI de Trabajo en Farmacovigilancia: Thais Baleeiro, Meritxell Lloret, Sara Balaguer, Cristina de Irala, Sonia López
Validez o ausencia de Sesgo
El reto de la colinealidad
Confusión
Interacción es otra cosa
Terminología
13/03/2015
2
Y+ Y-
Z1 120 60
Z2 60 120
OR=4 IC95%:2’6,6’2
Diseño X+ X-
Z1 90 90
Z2 90 90
OR=1
Un buen diseñoanula larelación ZX
Y+ Y-
X+ 90 90
X- 90 90
OR=1 IC95%:0’7,1’5
Z1 Y+ Y- Z2 Y+ Y-
X+ 60 30 X+ 30 60
X- 60 30 X- 30 60
OR=1 IC95%:0’5,1’9 OR=1 IC95%:0’5,1’9
Efecto de X en Y condicionado o ajustado por Z1.
Efecto de X en Y sin condicionar por Z:Efecto ‘global’, ‘conjunto’, ‘sin ajustar’, ‘raw’, ..
Z1Z2
1/8 ¼ ½ 1 2 4 8
Se obtienen los mismos resultados en el análisis separando Z1 y Z2 que en el conjunto
Validez o ausencia de sesgo
Todos
Los atributos Zpueden predecirla respuesta Y
Y+ Y-
Z1 120 60
Z2 60 120
OR=4 IC95%:2’6,6’2
X+ X-
Z1 150 30
Z2 30 150
OR=25
Sin diseño, hayrelación ZX
Y+ Y-
X+ 110 70
X- 70 110
Z1 Y+ Y- Z2 Y+ Y-
X+ 100 50 X+ 10 20
X- 20 10 X- 50 100
OR=1 IC95%:0’4,2’3 OR=1 IC95%:0’4,2’3
Z1Z2
1/8 ¼ ½ 1 2 4 8
Se obtienen diferentes resultados separando Z1 y Z2 que en el conjunto
El reto de la colinealidad (= relación ZX)
Todos
OR=2’5 IC95%:1’6,3’8
Si hay relación ZX: éstas tienen sus efectos confundidos
13/03/2015
3
La relación ZY es fija: son las cosas de la vida
La relación ZX puede anularse en el entorno experimental con un buen diseño
observacional ajuste
Al olvidar Z, “aparece” una relación espúrea
X
Y
Para que exista confusión deben haber dos relaciones
ZX: Z y X están “confundidas”
ZY: Z debe ser predictora de Y
X
YZ
Confusión
pretende
· Una estimación única del efecto de X en Y no tiene sentido.
Z1 Y+ Y-
X+ 20 40
X- 40 20
OR=1/4
Z2 Y+ Y-
X+ 60 30
X- 30 60
OR=4
Y+ Y-
X+ 80 70
X- 70 80
OR1’31
Y+ Z1 Z2 Y- Z1 Z2 Z1 Z2
X+ 20 60 X+ 40 30 X+ 60 60
X- 40 30 X- 20 60 X- 90 90
OR=1/4 OR=4 OR=1
X+ Z1 Z2 X- Z1 Z2 Z1 Z2
Y+ 20 60 Y+ 40 30 Y+ 51 330
Y- 40 30 Y- 20 60 Y- 155 26
OR=1/4 OR=4 OR=1
· Aparece aunque el diseño sea balanceado: X y Z son independientes.
Efecto de X en Y condicionado o ajustado por Z1
Modificación del efecto
El efecto de X en Ycambia de Z1 a Z2
Efecto de X en Y condicionado o ajustado por Z2
Efecto de Y en X sin condicionar por Z:Efecto ‘global’, ‘conjunto’, ‘sin ajustar’, ‘raw’, ..NO representa nada
13/03/2015
4
a) Confusión: diferente efecto ajustado y no ajustado
b) Modificación: diferente efecto (ajustado) según los niveles del atributo
Modificación del efecto frente a confusión
“Jergas”: Epidemiología: modificación del efecto
Farmacología: sinergismo y antagonismo
Estadística: interacción
Bioquímica: catalizador, enzima
Confusión, Jordi Cortés
Grupo AEFI de Trabajo en Farmacovigilancia: Thais Baleeiro, Meritxell Lloret, Sara Balaguer, Cristina de Irala, Sonia López
3/13/2015
1
Sesgo selección, J. A. González
Grupo AEFI de Trabajo en Farmacovigilancia: Thais Baleeiro, Meritxell Lloret, Sara Balaguer, Cristina de Irala, Sonia López
Simpáticos Antipáticos
Guapos
GS GA
Feos
FS FA
¿Por qué los hombres guapos son tan patanes?http://www.slate.com/blogs/how_not_to_be_wrong/2014/06/03/berkson_s_fallacy_why_are_handsome_men_such_jerks.html
Los hombres con los que has quedado parecen mostrar que si son guapos no son simpáticos, y viceversa. ¿Es que son rasgos poco compatibles?
En realidad, detrás hay un proceso de selección:
3/13/2015
2
Supongamos que, en la población, una cosa no tiene qué ver con la otra.
Entonces, P(guapo) = P(guapo | simpático) = P(guapo | antipático), o
P(simpático) = P(simpático | guapo) = P(simpático | feo)
Sin embargo, si has pedido una cosa u otra, el equilibrio se rompe:
P(guapo | guapo o simpático) ≠ P(guapo)
S A
G 25 25
F 25 25
En el ejemplo, P(G) = 50/100 = 1/2
Pero P(G | G o S) = 50/75 = 2/3
Puesto que los hombres más guapos no han
de ser tan simpáticos para ser
seleccionados, veremos que los dos rasgos
están negativamente correlacionados.
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
x
z
0.0 0.2 0.4 0.6 0.8
0.0
0.2
0.4
0.6
0.8
cor= -0.442
x
z
0.0 0.2 0.4 0.6 0.8
0.0
0.2
0.4
0.6
0.8
1.0
cor= -0.867
x
z
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.2
0.4
0.6
0.8
1.0
cor= -0.864
x
z
0.2 0.4 0.6 0.8 1.0
0.2
0.4
0.6
0.8
1.0
cor= -0.47
x
z
En función de los valores de la respuesta (Y < Y < Y < Y)aparece una relación entre las covariantes.
13/03/2015
1
Transparencia, Erik Cobo
Grupo AEFI de Trabajo en Farmacovigilancia: Thais Baleeiro, Meritxell Lloret, Sara Balaguer, Cristina de Irala, Sonia López
Pregunta: la frase “En general, la literatura médica es sólo una parte de los datos existentes que (…) sobreestima los beneficios, subestima los peligros y tiene un impacto negativo
en la atención al paciente y la investigación” es de:
1. Un grupo radical antisistema
2. Una asociación anti-ciencia
3. Un grupo de editores y científicos médicos
13/03/2015
2
4
13/03/2015
3
5
Transparencia, Erik Cobo
Grupo AEFI de Trabajo en Farmacovigilancia: Thais Baleeiro, Meritxell Lloret, Sara Balaguer, Cristina de Irala, Sonia López