Post on 10-May-2020
1
Diseño del estudio desde un punto de vista
estadístico
Dr. Josep Mª Sol Área de Biometría
josepm.sol@pfizer.com
Estudios según objetivo Superioridad,
No-inferioridad y Equivalencia
Josep M Sol Marzo 2009 3
Ensayos para evaluar superioridad
El objetivo principal es mostrar que la respuesta al producto en investigación es superior al agente comparativo (control activo o placebo)
Científicamente es el ensayo más convincente
Es el más común
Josep M Sol Marzo 2009 4
Superioridad
0 Superioridad No Superioridad
Mejor Test Mejor Control
Josep M Sol Marzo 2009 5
Ensayos para evaluar equivalencia
El objetivo principal es confirmar la ausencia de una diferencia significativa entre tratamientos
Ensayos de bioequivalencia
Josep M Sol Marzo 2009 6
Equivalencia
0 +
- Equivalencia No equivalencia
2
Josep M Sol Marzo 2009 7
Ensayos para evaluar no-inferioridad
El objetivo principal es confirmar que el nuevo tratamiento no es menos efectivo que el existente (puede ser más efectivo o con un efecto similar)
Josep M Sol Marzo 2009 8
No-inferioridad
0 - No-Inferioridad No No-Inferioridad
Mejor Test Mejor Control
Josep M Sol Marzo 2009 9
Ensayos de no-inferioridad Necesidad
Implicaciones legales Implicaciones metodológicas Limitaciones éticas y prácticas al uso de
placebo Limitaciones prácticas a la superioridad
frente a control activo Necesidad de información comparativa Posibles valores añadidos
Josep M Sol Marzo 2009 10
Valores añadidos
Posología: 1 vez al día Vía: vía oral Seguridad: Acontecimientos adversos Poblaciones especiales: Ancianos, pediatría Interacciones
Josep M Sol Marzo 2009 11
Ensayos de no-inferioridad Premisas
El control activo posee un determinado efecto.
Las diferencias entre el fármaco experimental y el control activo no son superiores a una magnitud prefijada.
Si fueran superiores a esa magnitud, las detectaríamos.
Sensibilidad a los efectos del fármaco
Margen de no-inferioridad
Sensibilidad del estudio
Josep M Sol Marzo 2009 12
Basado en los datos conocidos sobre el control activo.
En principio menor que la menor de las diferencias entre el control activo y placebo.
Opción más conservadora: Más segura Más cara ¿Siempre éticamente aceptable?
Ensayos de no-inferioridad Margen de no-inferioridad
3
Josep M Sol Marzo 2009 13
No soy peor conductor que Fernando Alonso…
Josep M Sol Marzo 2009 14
Cumplimiento terapéutico pobre Medicación concomitante Enfermedades con tendencia a la mejoría
espontánea Criterios de selección muy laxos Medición del efecto poco sensible Excesiva variabilidad en la medición Evaluación sesgada por el hecho de conocer que
ambos tratamientos son activos
Ensayos de no-inferioridad Sensibilidad del ensayo
Tipos de Diseño Paralelo, cruzado
Josep M Sol Marzo 2009 16
Diseño en grupos paralelos
Josep M Sol Marzo 2009 17
Diseño en grupos paralelos
Es el diseño usado con más frecuencia en ensayos clínicos
Es aplicable a la mayoría de situaciones experimentales
Es “robusto” a la mayoría de problemas que pueden ocurrir en los ensayos clínicos (p.e. visitas no realizadas, datos no obtenidos …)
Josep M Sol Marzo 2009 18
Diseño cruzado (“crossover”)
4
Josep M Sol Marzo 2009 19
La variabilidad de los datos es menor. diferencias entre-pacientes vs intra-pacientes Paralelos Cruzado A ⇒ Efecto A A/P ⇒ Efecto a=a-p P ⇒ Efecto P P/A ⇒ Efecto a=a-p menos pacientes para detectar el mismo efecto
Sin embargo, tiene varios problemas que pueden invalidar sus resultados
Diseño cruzado (“crossover”)
A=A-P A=media(a)
Josep M Sol Marzo 2009 20
Inicio de cada periodo en condiciones similares En enfermedades crónicas estables Periodo adecuado para demostrar eficacia Los pacientes deberán estar, como mínimo, 2
veces más tiempo en el estudio No debe existir efecto “carryover”
Diseño cruzado (“crossover”) Requisitos
Josep M Sol Marzo 2009 21
Influencia residual de los tratamientos en el periodo siguiente
La prueba para este efecto puede no ser sensible puesto que se realiza entre-sujetos
Periodo de lavado suficientemente largo (mínimo 10 vidas medias)
Diseño cruzado (“crossover”) Efecto “carryover”
Selección Variables
Josep M Sol Marzo 2009 23
Variable principal Primary variable, ‘target’ variable, primary endpoint La variable capaz de proporcionar la mayor
evidencia clinicamente relevante y convincente directamente relacionada con el principal objetivo del ensayo
Única Normalmente variable de eficacia. Var. Seguridad - Calidad de vida - Var.
farmacoeconómicas
Josep M Sol Marzo 2009 24
Variable principal Fármaco antihipertensivo
Disminución de la TAd % pacientes con TA controlada Accidente Vascular Cerebral:
% AVC después de 1 año Tiempo hasta el primer AVC
Mortalidad: % vivos después de 1 año comparación de curvas de supervivencia
5
Josep M Sol Marzo 2009 25
Variables secundarias
Medidas de soporte en relación al objetivo principal
Medidas de los efectos relacionados con objetivos secundarios
Su número debería estar limitado
Josep M Sol Marzo 2009 26
Variables compuestas
Se usan cuando no se puede seleccionar una sola variable para medir la eficacia (p.e. escalas psiquiátricas …)
No es lo mismo que usar 2 variables principales
Josep M Sol Marzo 2009 27
Variables compuestas Escalas
Las escalas deben estar validadas: Validez de contenido: La escala debe medir lo
que queremos Precisión (‘reliability’) inter- e intra-observador Sensibilidad para detectar cambios
Josep M Sol Marzo 2009 28
Escala de Young (manía) 1.Euforia 0. Ausente 1. Posible o moderada, sólo cuando se le pregunta 2. Clara aunque subjetiva y apropiada al contenido: optimista,
seguro de sí mismo/a, alegre 3. Elevada e inapropiada 4. Grave y desorganizada
2. Hiperactividad 0. Ausente 1. Subjetivamente aumentada 2. Vigorosos/a, hipergestual 3. Energía excesiva, hiperactividad fluctuante, inquietud 4. Agitación o hiperactividad constante
3. Impulso Sexual 0. No aumentado 1. Posible o moderadamente aumentado 2. Claro aumento al preguntar 3. Espontáneamente referido como elevado, contenido sexual del
discurso, preocupación por temas sexuales 4. Actos o incitaciones sexuales evidentes
4. Sueño 0. No reducido 1. Disminución en menos de una hora 2. Disminución en más de una hora 3. Refiere disminución de la necesidad de dormir 4. Niega necesidad de dormir
5. Irritabilidad 0. Ausente 2. Subjetivamente aumentada 4. Irritabilidad fluctuante, episodios recientes de rabia o
enfadado 6. Predominantemente irritable, brusco y cortante 8. Hostil, no colaborador/a, no entrevistable
6. Expresión Verbal 0. No aumentada 2. Sensación de Locuacidad 4. Aumentada de forma fluctuante, difícil de interrumpir,
intrusiva 6. Claramente aumentada, difícil de interrumpir, intrusiva 8. Verborrea ininterrumpible y continua ................
Josep M Sol Marzo 2009 29
Variables de valoración global Desarrolladas para medir la seguridad, la eficacia
global y/o la utilidad global del tratamiento Integran las variables objetivo y la impresión global
del investigador (componente subjetivo) Se incluyen componentes de riesgo/beneficio Se puede concluir equivalencia con productos muy
diferentes (productos con poca eficacia y pocos efectos adversos)
Josep M Sol Marzo 2009 30
CGIC (Clinical Global Impression of Change)
Comparando con el estado del paciente en el momento de su entrada en el estudio, ¿cuál ha sido el cambio?
0 No Valorable 4 Sin cambios 1 Mucho mejor 5 Mínimamente peor 2 Mejor 6 Peor 3 Mínimamente mejor 7 Mucho peor
6
Josep M Sol Marzo 2009 31
Variables ‘surrogate’ (sustitutas) Proporcionan una medida indirecta de un efecto en
situaciones donde la medida directa no es posible o no es práctica
Consideraciones: Pueden no ser un buen predictor de la variable de interés A veces no producen una medida cuantitativa de beneficio
clínico que pueda servir para sopesar el beneficio/riesgo
Josep M Sol Marzo 2009 32
Variables ‘surrogate’
Plausibilidad biológica de la relación Demostración en estudios epidemiológicos
del valor pronóstico de la var.’surrogate’ Evidencia en ensayos clínicos que los
efectos sobre la var.’surrogate’ se corresponden a efectos sobre la var.verdadera
Var.surrogate Var.verdadera
Josep M Sol Marzo 2009 33
Variables ‘surrogate’ Ejemplos
Poblaciones
Josep M Sol Marzo 2009 35
Poblaciones
Josep M Sol Marzo 2009 36
Poblaciones
Definidas en el Protocolo y PAE Minimizar sesgos y el error tipo I
7
Josep M Sol Marzo 2009 37
Poblaciones
Pérdida de seguimiento
Eventos Adversos
Retirada Sin Eval.Seguimiento
Desviación Protocolo
Josep M Sol Marzo 2009 38
Poblaciones
Retirados en Screening
Retiradas Sin Eval.Seguimiento
Retirados por Eventos Adversos
Retirados por Pérdidas de Seguimiento
Completados
Desviación Importante Protocolo
TODOS
PP
SEGURIDAD
ITT
Josep M Sol Marzo 2009 39
Poblaciones Población por Intención de Tratar (ITT):
ITT = Pacientes randomizados ITT = Pacientes randomizados + que hayan recibido al
menos una dosis + una evaluación de seguimiento Pacientes con desviaciones del protocolo ⇒ menos
diferencias entre tratamientos: Posición conservadora en estudios de superioridad
Población por Protocolo (PP) PP = Pacientes randomizados sin desviaciones
importantes del protocolo ⇒ Efecto Máximo Posición conservadora en estudios de no-inferioridad
Sesgos
Josep M Sol Marzo 2009 41
Factores que influyen en la respuesta observada
Respuesta 1: El 30% de los individuos con el tratamiento A
responden Respuesta 2:
El 3% de los individuos con el tratamiento A responden
Respuesta 3: El 80% de los individuos con el tratamiento A
responden
Josep M Sol Marzo 2009 42
Factores que influyen en la respuesta observada
Respuesta real del fármaco Población seleccionada
Cumplimiento Otras medidas de ayuda
Prejuicios (expectativas...) Cómo hemos medido la respuesta
Otros efectos (efectos secundarios) Efecto placebo
Subjetividad en la evaluación Motivación y apoyo al individuo
Factores desconocidos Azar
8
Josep M Sol Marzo 2009 43
Factores que influyen en la respuesta observada
Respuesta real del fármaco
Población seleccionada
Cumplimiento
Otras medidas de ayuda (soporte psicológico, chicle...)
Prejuicios (expectativas...)
Cómo hemos medido la respuesta
Otros efectos (efectos secundarios)
Efecto placebo
Subjetividad en la evaluación
Motivación y apoyo al individuo
Factores desconocidos
Azar
CONTROLARLO
Josep M Sol Marzo 2009 44
Desviación del verdadero valor
Error de muestreo aleatorio (azar) En promedio, nulo
Sesgo Error sistemático
Josep M Sol Marzo 2009 45
Cómo minimizar los sesgos
Randomización Ciego
Josep M Sol Marzo 2009 46
Randomización
El tratamiento está determinado por el azar Tiende a producir grupos de tratamiento
similares en relación a los factores pronósticos (conocidos
y desconocidos) Es necesario para el análisis estadístico y la
evaluación del efecto del tratamiento
Josep M Sol Marzo 2009 47
Randomización
Diferentes estrategias: Simple Bloques Estratificado por factores pronósticos
Josep M Sol Marzo 2009 48
Ciego
Intenta limitar el sesgo consciente o inconsciente al evitar la influencia que pueda tener el conocimiento del tratamiento en la asignación y seguimiento de los sujetos las actitudes de los sujetos a los tratamientos la comprobación de los objetivos el manejo de las retiradas la exclusión de datos para el análisis ...
9
Tamaño Muestra
Josep M Sol Marzo 2009 50
Tamaño de la Muestra
Josep M Sol Marzo 2009 51
Tamaño muestral
El número de sujetos de un ensayo clínico debería ser siempre lo suficientemente grande para permitir contestar de forma fiable las preguntas planteadas.
El número de sujetos se determina normalmente teniendo en cuenta el objetivo primario del estudio.
Josep M Sol Marzo 2009 52
Qué necesitamos conocer… Variable principal Diferencia entre los tratamientos Variabilidad Error tipo I / Nivel de significación Error tipo II / Poder (habitualmente 80% o 90%) Bilateral o unilateral Tipo de análisis, poblaciones Retiradas, pérdidas, etc. Presupuesto/Costes/Recursos, tiempos, etc.
Josep M Sol Marzo 2009 53
Relacionado por:
C x Variabilidad n = (Efecto del tratamiento)2
donde C depende de α y β Josep M Sol Marzo 2009 54
Qué necesitamos conocer… Variable principal Diferencia entre los tratamientos Variabilidad Error tipo I / Nivel de significación Error tipo II / Poder (habitualmente 80% o 90%) Bilateral o unilateral Tipo de análisis, poblaciones Retiradas, pérdidas, etc. Presupuesto/Costes/Recursos, tiempos, etc.
10
Josep M Sol Marzo 2009 55
Diferencia clínicamente relevante “La diferencia a detectar entre los tratamientos
puede estar basada en un juicio sobre el efecto mínimo el cual tiene relevancia clínica para el paciente o en un juicio sobre el efecto anticipado del nuevo tratamiento, cuando este es superior.” ICH-E9
Es muy importante y difícil de cuantificar.
Josep M Sol Marzo 2009 56
Qué necesitamos conocer… Variable principal Diferencia entre los tratamientos Variabilidad Error tipo I / Nivel de significación Error tipo II / Poder (habitualmente 80% o 90%) Bilateral o unilateral Tipo de análisis, poblaciones Retiradas, pérdidas, etc. Presupuesto/Costes/Recursos, tiempos, etc.
Josep M Sol Marzo 2009 57
Variabilidad ¿Cómo medirla?
Variables cuantitativas Varianza o Desviación Estándar
Variables cualitativas Varianza = p · (1-p) p=proporción del
evento en el grupo de referencia
Josep M Sol Marzo 2009 58
Variabilidad Variables Cuantitativas
Josep M Sol Marzo 2009 59
Variabilidad Variables Cualitativas
Josep M Sol Marzo 2009 60
Qué necesitamos conocer… Variable principal Diferencia entre los tratamientos Variabilidad Error tipo I / Nivel de significación Error tipo II / Poder (habitualmente 80% o 90%) Bilateral o unilateral Tipo de análisis, poblaciones Retiradas, pérdidas, etc. Presupuesto/Costes/Recursos, tiempos, etc.
11
Josep M Sol Marzo 2009 61
Pruebas Estadísticas
Josep M Sol Marzo 2009 62
Pruebas Diagnósticas
Sin Enfermedad Enfermo
Criterio Positividad
Se declara libre de enfermedad Se declara enfermo
Falso - Falso +
Josep M Sol Marzo 2009 63
Pruebas Diagnósticas
Prueba Diagnóstica
Realidad
Enfermo Sano
Enfermo Verdadero + Falso +
Sano Falso – Verdadero -
Josep M Sol Marzo 2009 64
Pruebas Diagnósticas
Prueba Diagnóstica
Realidad
Enfermo Sano
Enfermo Verdadero + Falso +
Sano Falso – Verdadero -
Josep M Sol Marzo 2009 65
Ensayo Situación Real
Efecto No Efecto
Efecto Verdadero + Falso +
No Efecto Falso – Verdadero -
Pruebas de hipótesis
Josep M Sol Marzo 2009 66
Ensayo Situación Real
Efecto No Efecto
Efecto Poder Error Tipo I
(α)
No Efecto Error Tipo II
(β)
Pruebas de hipótesis
12
Josep M Sol Marzo 2009 67
Pruebas Diagnósticas
Sin Enfermedad Enfermo
Criterio Positividad
Se declara libre de enfermedad Se declara enfermo
Falso - Falso +
Josep M Sol Marzo 2009 68
Pruebas Estadísticas
H0 verdadera H1 verdadera
Criterio Positividad
Nivel de Significación
No rechaza H0 Se rechaza H0
β α
Josep M Sol Marzo 2009 69
Valor real 12%
Muestra 1 7,5%
Muestra 2 15%
Sin diferencia real
Error estadístico alfa (α)
Concluir que existe diferencias cuando en realidad no existen: falso positivo
Josep M Sol Marzo 2009 70
Valor real 12%
Muestra 1 15%
Muestra 2 15%
Falsa ausencia de diferencia
Valor real 19%
Error estadístico beta (β)
No concluir que existe diferencias cuando en realidad existen: falso negativo
Josep M Sol Marzo 2009 71
Riesgo de error estadístico
Riesgo alfa: Considerar un tratamiento como efectivo cuando en realidad no lo es
Riesgo beta: No concluir que un tratamiento es efectivo cuando en realidad lo es
Poder: Mostrar la eficacia de un tratamiento realmente efectivo
Josep M Sol Marzo 2009 72
Conventionally the probability of type I error is set at 5% or less or as dictated by any adjustments made necessary for multiplicity considerations; the precise choice may be influenced by the prior plausibility of the hypothesis under test and the desired impact of the results. The probability of type II error is conventionally set at 10% to 20%; it is in the sponsor’s interest to keep this figure as low as feasible especially in the case of trials that are difficult or impossible to repeat. Alternative values to the conventional levels of type I and type II error may be acceptable or even preferable in some cases.
Convenciones: Probabilidad del error tipo I
= 5% o menos Probabilidad del error tipo II
= 20% o menos
ICH - E9 Statistical Principles for Clinical Trials Convenciones
13
Josep M Sol Marzo 2009 73
Qué necesitamos conocer… Variable principal Diferencia entre los tratamientos Variabilidad Error tipo I / Nivel de significación Error tipo II / Poder (habitualmente 80% o 90%) Bilateral o unilateral Tipo de análisis, poblaciones Retiradas, pérdidas, etc. Presupuesto/Costes/Recursos, tiempos, etc.
Josep M Sol Marzo 2009 74
Ejemplo Asunciones:
Ensayo de superioridad entre 2 tratamientos Variable Principal: % pacientes responden a Rx Proporción respuesta esperada en C = 10% Proporción respuesta esperada en E = 20% Prob. Error tipo I = 0,05 (bilateral) Prob. Error tipo II = 0,20 (poder = 80%)
Tamaño muestra por tratamiento = 219
Josep M Sol Marzo 2009 75
Ejemplo
Josep M Sol Marzo 2009 76
“Jugando” con los tamaños Al mantener constantes las otras variables:
↓ error Tipo I: ↑ n ↑ poder: ↑ n ↑ la diferencia entre los tratamientos, con una proporción
inalterada: ↓ n Proporciones cercanas al 50%, diferencia entre
tratamientos inalterada: ↑ n Sobreestimar la diferencia entre los tratamientos da
lugar a un estudio con un poder (demasiado) bajo C x Variabilidad n = (Efecto del tratamiento)2
Josep M Sol Marzo 2009 77
The method by which the sample size is calculated should be given in the protocol, together with the estimates of any quantities used in the calculations (such as variances, mean values, response rates, event rates, difference to be detected). The basis of these estimates should also be given.
... In confirmatory trials, assumptions should normally be based on published data or on the results of earlier trials.
Se debe especificar: el método de cálculo las estimaciones la base de las
estimaciones ⇒ basado en estudios publicados
ICH - E9 Statistical Principles for Clinical Trials A especificar…
Josep M Sol Marzo 2009 78