Análisis de supervivencia

Download Report

Transcript Análisis de supervivencia

ANÁLISIS DE SUPERVIVENCIA
?
Isabel Coll y Jordi Ginés. Servicio de Farmacia. Hospital Son Espases.
8 de Mayo 2012
Tipos de medida de la respuesta al
tratamiento en los EECC de Oncología
• Respuesta “inmediata” al tratamiento
– Remisión completa, Remisión parcial….
– Precisan ensayos de corta duración
• Respuesta a “largo plazo”: Miden la duración del
efecto del tratamiento
– SLE, SLP, TTP, SG
– Precisan ensayos de mayor duración
• Otras: Toxicidad, Calidad de vida
Tipos de variables
Las variables en Oncología
– Cualitativas*: hacen referencia a la escala nominal
• % de pacientes con respuesta total o parcial
• Tasa estimada de SLE a 5 años, SG a 3 años
– Cuantitativas/Continuas: hacen referencia a la escala de
intervalo con una unidad que permite comparar cantidades
• Tiempo mediano de supervivencia
• Cambio en el volumen o diámetro tumoral
– Time-to-event: “Análisis de supervivencia”
Nociones Básicas
• Variable: “Tiempo transcurrido hasta la aparición de un
suceso” (time-to-event)
• Aunque se le siga denominando análisis de
supervivencia, no siempre tiene que ser la muerte el
acontecimiento de desenlace
Nociones Básicas
• El desenlace de interés no es una cantidad numérica
ni una cualidad dicotómica sino la combinación de
ambas cosas
• La cualidad corresponde a si se ha producido o no el
suceso y es una variable dicotómica (muerte, recidiva,
etc.) y la variable numérica indica cuánto tiempo ha
pasado en producirse ese desenlace
Nociones Básicas
• Eventos de interés
– Muerte, progresión de la enfermedad,
fracaso del tratamiento, …
• Variable: Tiempo hasta el evento
– Tiempo de supervivencia global
– Tiempo hasta progresión de la enfermedad
– Tiempo hasta el fracaso del tratamiento
Métodos estadísticos utilizados en
las curvas de supervivencia
• Se requiere de métodos de análisis específicos por varias
razones fundamentales:
– Los pacientes no inician el tratamiento o entran en el
estudio al mismo tiempo
– Se analizan los datos antes de que todos los pacientes
hayan sufrido el evento, ya que si no habría que
esperar muchos años para realizar dichos estudios
– Los tiempos de supervivencia no presentan una
distribución normal (no podemos aplicar una t de
Student)
Métodos estadísticos utilizados en
las curvas de supervivencia
• La existencia de información truncada o individuos censurados
(censored)
– Pacientes que llegan al final del estudio sin sufrir el evento
– Pacientes que voluntariamente abandonan el estudio,
pérdidas de seguimiento o retirados del estudio por los
investigadores
Desarrollo del estudio en el tiempo
suceso
suceso
suceso
abandono
inicio
final
Posibilidades
• Datos exactos: Situación ideal
– Pacientes que presentan el evento antes de terminar el
estudio
• Datos “censurados”: Situación real
– Pacientes que abandonan el estudio, se les pierde o que no
han presentado el evento al final del estudio
• En estos casos, el tiempo hasta el evento es , al menos ,
desde la aleatorización hasta que se les pierde,
abandonan o hasta que se acaba el estudio
Métodos estadísticos utilizados en
las curvas de supervivencia
• Los métodos estadísticos más utilizados son los no
paramétricos:
– Kaplan-Meier: Estimar e interpretar la curva de superv.
– Log-Rank: Comparar curvas de supervivencia
– Modelo de Cox: Cuantificar el efecto de un tratamiento
controlando el efecto de otras variables pronósticas
• Se asumen dos supuestos básicos:
– Los sujetos censurados se habrían comportado del mismo
modo que los que han sido seguidos hasta el final
– Todos los pacientes entran en el estudio en el mismo
momento de la historia natural de su enfermedad
Ejemplo: Tiempo hasta la progresión
• Sin datos censurados
– Si tenemos los siguientes tiempos de progresión de 6
pacientes: 14, 13, 12, 23, 23 y 24 meses
– ¿Cuál es la proporción de pacientes que sobreviven sin
progresión más de 24 meses? 0/6
• Con datos censurados (+)
– Si tenemos los siguientes tiempos de progresión de 6
pacientes: 14, 13, 12, 23+, 23+ y 24 meses
– ¿Cuál es la proporción de pacientes que sobreviven sin
progresión más de 24 meses? ¿?/6 No lo podemos
calcular
Supervivencia y riesgo
• Los datos de supervivencia se pueden analizar con dos tipos de
probabilidades diferentes: supervivencia y riesgo
• Función de supervivencia S(t) (“probabilidad de
supervivencia”)
– Probabilidad de que un individuo sobreviva desde la fecha
de entrada en el estudio hasta un momento determinado
en el tiempo t
– Se centra en la “no ocurrencia del evento”
• Función de riesgo (Hazard Rate) h(t)
– Probabilidad de que a un individuo que está siendo
observado en el tiempo t le suceda el evento de interés en
ese preciso momento
– Se centra en la “ocurrencia del evento”
ANÁLISIS DE SUPERVIVENCIA
SUPERVIVENCIA GLOBAL
1. ¿Qué significado tiene esta curva?
2. ¿Qué significan las caídas?
3. ¿Qué son las cruces?
Mediana de supervivencia = 22 meses
IC95% = [20 – 24]
Gráfica por Kaplan-Meier
Meses
Estimación de la Función de Supervivencia:
El método de Kaplan-Meier
• Aprovecha la información “censurada”
• Calcula la supervivencia cada vez que un paciente
presenta el evento
• Se basa en el concepto de probabilidad condicional
K-M: Representación gráfica
En la ordenada (eje Y) está la
probabilidad del evento y en la
abscisa (eje X) está el tiempo
Evento
Censurado
1) Los “saltos” se dan sólo cuando ocurre algún evento
2) ¿Cómo influyen los individuos “censurados”?
3) Cada dato censurado influye disminuyendo el denominador, con lo que,
aunque un individuo “censurado” no provoque un salto, sí provoca una
mayor magnitud en el tamaño del siguiente salto
¿Cómo construir la curva de K-M?
Tiempo
(meses)
Estatus
1
F
2
F
2,5
C
3
F
4
C
Fallecidos
durante el
intervalo
Vivos al inicio del
intervalo
Probabilidad de
sobrevivir en
ese intervalo
Probabilidad
acumulada de
sobrevivir
¿Cómo construir la curva de K-M?
Tiempo
(meses)
Estatus
1
F
2
F
3
F
Fallecidos
durante el
intervalo
Vivos al inicio del
intervalo
Probabilidad de
sobrevivir en
ese intervalo
Probabilidad
acumulada de
sobrevivir
¿Cómo construir la curva de K-M?
Tiempo
(meses)
Estatus
Fallecidos
durante el
intervalo
Vivos al inicio del
intervalo
Probabilidad de
sobrevivir en
ese intervalo
Probabilidad
acumulada de
sobrevivir
1
F
1
3
2/3
2/3=0,67
2
F
1
3
1/3
1/3=0,37
3
F
1
3
0/3
0
¿Cómo construir la curva de K-M?
Tiempo
(meses)
Estatus
1
F
2
F
2,5
C
3
F
4
C
Fallecidos
durante el
intervalo
Vivos al inicio del
intervalo
Probabilidad de
sobrevivir en
ese intervalo
Probabilidad
acumulada de
sobrevivir
¿Cómo construir la curva de K-M?
Tiempo
(meses)
Estatus
Fallecidos
durante el
intervalo
Vivos al inicio del
intervalo
Probabilidad de
sobrevivir en
ese intervalo
Probabilidad
acumulada de
sobrevivir
1
F
1
5
4/5
4/5 = 0,8
2
F
1
4
3/4
0,8 x 3/4 =
0,6
2,5
C
3
F
1
2
1/2
0,6 x 1/2 =
0,3
4
C
¿Cómo afecta la inclusión de los censurados?
Supervivencia libre de progresión: DIFERENCIAS
1
0,8
1
+
0,8
+
++
0,6
0,6
0,4
0,4
+
+
0,2
0,0
+
0,2
Mediana: 3 meses
1
2
0,0
3
4
Mediana: 2 meses
1
2
+
3
4
1- La gráfica de K-M nos informa sobre la probabilidad de no sufrir el evento en un tiempo determinado. No
representa el % de pacientes que quedan sin evento en un tiempo determinado sobre el total inicial.
2-No. at Risk: Cantidad de casos que están informando sobre la supervivencia en cada momento del
tiempo de seguimiento. Van haciéndose menores porque excluyen tanto a los casos que han abandonado
el estudio antes de dicha fecha como a los que ya han sufrido el evento.
3- La incertidumbre (variabilidad debida azar) aumenta gradualmente con el paso del tiempo. En las fases
finales, cuando hay pocos pacientes en riesgo, un solo evento puede producir un gran efecto. Las estimaciones en la cola derecha son menos fiables. Un evento al final produce un salto o “escalón” más alto.
¿Cómo resumir la curva?
• El problema está en cómo resumir en un solo dato la
información contenida en una curva de supervivencia
• Análisis puntuales de las curvas de supervivencia
ANALISIS PUNTUALES
1-Tiempo mediano o mediana del evento
“Solamente puede calcularse el tiempo medio de supervivencia de un
grupo de pacientes con cáncer una vez que han fallecido todos. Por el
contrario, es posible calcular la mediana de supervivencia aunque la
mitad de los pacientes todavía estén vivos”
“Cuando los datos no siguen una distribución gaussiana, la mediana es
mejor reflejo de las características de una población que la media”
2-Probabilidad acumulada del evento a un tiempo determinado
*Ejemplos:
-% SG o SLP 1, 3 ó 5 años
Tiempo mediano de supervivencia
Es aquel instante en el que la
probabilidad acumulada de
tener el evento es de un 50%
Ensayo fase III FOLFOX±Bevacizumab en segunda línea de CCR metastásico
BCIRG 001: Overall Survival (ITT)
1.0
Cumulative Probability
TAC
0.8
FAC
87%
81%
0.6
0.4
Análisis puntual de una curva de supervivencia
Probabilidad acumulada de Supervivencia global a 5
años
0.2
¡No es el % de pacientes que permanece sin fallecer
sobre el total inicial!
0.0
0
6
12
18
48
24
36
30
42
Survival Time (months)
54
60
66
Tiempo hasta el evento
(7 pacientes)
6,10,12,18,20,20,170 meses
Mediana 18 meses
Media 37 meses
Críticas a los análisis puntuales
• En cualquiera de los dos casos no deja de ser un
resumen puntual de todo el contenido de una curva
• Puede darnos una idea equivocada
• Puede ser útil a nivel práctico pero tiene el problema
de la posible arbitrariedad del punto elegido
Arbitrariedad del punto elegido
Mediana de supervivencia
50
Años 1
2
3
4
5
6
RAR y NNT
¿Cómo calcularlos a partir de curvas de supervivencia?
– En un análisis de supervivencia, no podemos hablar de una
única RAR (ó NNT). Se pueden calcular para cualquier instante
de tiempo desde el inicio del tratamiento.
– RAR y NNT en un punto del tiempo de seguimiento
• RAR directamente de los datos crudos del ensayo.
Probabilidad de supervivencia de cada grupo en un tiempo
determinado en curvas de Kaplan-Meier.
RAR =St- Sc
NNT=100/ St- Sc
Seguimiento medio 66 meses
US Oncology 9735
ASCO 2003
SABCS 2005
RAR=3%
NNT=33
RAR=6%
NNT=17
Algunos autores han propuesto utilizar curvas de NNT calculadas a partir de la curva de supervivencia
de K-M, pero son poco utilizadas
¡Cuidado con los análisis de
supervivencia puntuales!
• Se ha convertido en práctica común comparar la
supervivencia usando como referencia un punto común
en el tiempo
• Pero esto es básicamente incorrecto
• Este procedimiento desprecia el resto de la información
• Además, la elección de ese punto en el tiempo puede ser
controvertida
• La curva hay que interpretarla en su aspecto general
¡Cuidado con los análisis de
supervivencia puntuales!
Conclusión errónea:
El pronóstico de los
dos grupos es idéntico
50%
Dos situaciones muy distintas, Grupos A y B, pueden dar lugar a los mismos resultados de
probabilidad de supervivencia a 5 años (50%). Los pacientes del grupo B tienen, claramente,
una peor supervivencia desde el principio del estudio.
¿Cómo magnificar las diferencias?
•
•
La escala debería ser de 0 a 100
En caso contrario se magnifican diferencias de forma engañosa, ya que el cambio de
escala puede pasar desapercibido
Comparación de dos o más curvas
de supervivencia
La t de Student no es apropiada ya que los tiempos de
supervivencia no presentan una distribución normal
Log-Rank Test
Ho= La Supervivencia de los grupos que se comparan es la misma
H1= Al menos uno de los grupos tiene una Supervivencia diferente
Estadístico utilizado: Jicuadrado con k-1 grados de libertad, siendo k
el número de grupos (nº de curvas que se comparan)
Erlotinib vs placebo (BR.21): overall survival
H0= Erlotinib no modifica la supervivencia global en relación a placebo
H1= Erlotinib modifica la supervivencia global en relación a placebo
Percentage OS
100
A simple vista, las dos curvas difieren pero, ¿es eso suficiente
para concluir que la SG es mayor en los pacientes tratados con
erlotinib?
80
60
Erlotinib
Placebo
40
20
0
0
6
12
18
Time (months)
24
30
Shepherd F et al. N Engl J Med 2005;353:123–32
Log-Rank Test
• Tiene en cuenta la evolución completa de la curva de
supervivencia de ambos grupos, es decir, es capaz de detectar
diferencias “persistentes” a lo largo del tiempo en la
supervivencia
• Otorga la misma ponderación a todos los tiempos de
seguimiento
• También se le denomina Test de Mantel-Haenszel
• Muy útil cuando el evento es poco frecuente o si las curvas
son aproximadamente paralelas (no se cruzan)
Cada vez que sucede un evento se calcula el número observado de eventos en cada
grupo y el número esperado en cada grupo si no existieran diferencias entre ellos (es
decir si la Ho fuera cierta)
Log-Rank Test
• Sin embargo, si las curvas de supervivencia se cruzan (al principio hay mejor
supervivencia en un grupo y luego en el otro), el log-rank test tiene problemas
para detectar diferencias
• En estos casos, es más útil el test de Wilcoxon generalizado, también llamado
Test de Breslow (Gehan). Otorga una mayor ponderación a los tiempos
iniciales, que tienen más observaciones
• Nos da el valor de la p
• Permite detectar y establecer la supremacía de una población respecto a la
otra pero no nos proporciona un parámetro que nos resuma y/o cuantifique las
diferencias entre ambas poblaciones, lo que dificulta la evaluación de la
relevancia clínica
Erlotinib vs placebo (BR.21): overall survival
100
Log-rank p < 0.001
Percentage
80
60
Erlotinib
Placebo
40
20
0
0
6
12
18
Time (months)
24
30
Shepherd F et al. N Engl J Med 2005;353:123–32
Problemas del log-rank
• No valora o cuantifica esa diferencia
• No estudia el posible efecto de otras covariables
(variables pronósticas o predictoras)
– Variables de confusión
• Su presencia produce sesgos entre la variable dependiente y la
independiente. Solución: Ajustes estadísticos realizados con análisis
estratificado o con técnicas de análisis multivariable
– Variables de interacción o modificadoras del efecto
• Sus valores cambian la intensidad o el sentido de la relación entre el
factor de estudio (exposición) y la variable dependiente (respuesta)
Comparación ajustada
• Hazard Rate, Hazard Ratio
• Modelo de riesgos proporcionales
(Regresión de Cox)
Análisis multivariable
Regresión múltiple Regresión logística Regresión de COX
(proportional
hazards model)
y= a + bx1 + cx2…
Odds Ratio
La variable
dependiente es
La variable
dependiente es
cuantitativa
dicotómica
Hazard Ratio
La variable
dependiente es del
tipo “tiempo hasta
un evento”
Es un modelo matemático que permite hacer más comparables a los grupos
expuestos o no expuestos a un determinado factor evitando que la comparación
de interés quede distorsionada por otros factores pronósticos.
Regresión de Cox
(proportional hazards model)
• A diferencia de la regresión logística, además de considerar si se produce o
no un desenlace o un evento, tiene en cuenta el tiempo que ha tardado en
producirse
• No se trata de valorar el efecto a un tiempo determinado (p.e SG a los 5
años), sino de valorar el efecto sobre la función supervivencia (a lo largo del
todo el período, sea cual sea el punto temporal elegido)
• Si sólo interesase estudiar el efecto sobre un tiempo determinado, bastaría
con un análisis de regresión logística, porque la variable de respuesta sería
dicotómica
• El parámetro de asociación que se obtenía en la regresión logística es la OR
(Odds ratio). En cambio el que se obtiene con la regresión de Cox es el HR
(hazard ratio)
• HR: razón entre las funciones de riesgo de los grupos en comparación
Entonces...
¿qué ... es el “Hazard Ratio”?
EL HAZARD RATIO
ES EL HAZARD RATIO
¡¡y no le des más vueltas!!
Función de riesgo (hazard rate)
• Tasa condicional de fallo/Fuerza de mortalidad
• Es una tasa más que una probabilidad
• El término hazard corresponde a una tasa instantánea, que
conceptualmente sólo requiere una duración de tiempo
infinitesimal
• Es la probabilidad condicional de presentar el evento en el
siguiente instante de tiempo, con la condición de que no se haya
presentado antes del inicio de ese instante
• Se calcula simplemente dividiendo los sucesos ocurridos en ese
instante entre el total de sujetos en riesgo
Conceptos de hazard y hazard ratio
Hazard: Se calcula dividiendo los sucesos ocurridos en ese instante (tiempo = 2 años) entre
el total de sujetos en riesgo
Probabilidad (P)
Δt
Hazard
(Intervalo de tiempo)
1/5 (Grupo A)
2 años
0,2 (a 2 años)
2/6 (Grupo B)
2 años
0,33 (a 2 años)
La Hazard Ratio (HR) no es más que una razón de hazards (razón entre dos
funciones de riesgo). En nuestro caso HR=0,33/0,2 ~ 1,67. La “velocidad” con
la que ocurre el fenómeno es 1,67 veces superior en el grupo B que en el grupo
A. Pero esto es lo que ocurre cuando se les compara a los 2 años
Regresión de Cox y Hazard Ratio (HR)
• La estimación final de la HR global que produce el análisis de
regresión de Cox viene a ser algo similar al promedio de las HR
parciales
• Promedia de manera ponderada las HR de los diversos
momentos en los que se produce un evento, dando lugar a una
HR global
• La regresión de Cox asume que la relación de tasas instantáneas
es constante en el tiempo (proportional hazards model)
– Las HR parciales que se van obteniendo no difieren o varían excesivamente a lo
largo de los diversos tiempos de seguimiento
Hazard A
Hazard B
Forma de las funciones de supervivencia y riesgo cuando se asume que la razón de riesgo es constante
Las funciones de supervivencia se van separando progresivamente como resultado del mayor riesgo en
uno de ellos, mientras que las funciones de riesgo son paralelas, con una cierta oscilación por las
fluctuaciones del muestreo.
Pero el HR no es siempre constante....
Kaplan-Meier
Kaplan-Meier
survival estimates,
survival estimates,
by group by group
Función de riesgo
1.001.00
0.750.75
Las curvas se cruzan
HR=1,09 (IC95% 0,94 a 1,22)
0.500.50
group 1
group 1
0.250.25
group 0
0.000.00
0
0
10
10
group 0
20
20 30
analysis time analysis time
30
40
40
La premisa de proporcionalidad de los riesgos no tiene por qué ser siempre correcta, y es obligación del investigador y del
estadístico analizar hasta qué punto los datos permiten seguir empleándola. Hay métodos para verificar esta suposición
(modelos de Cox con covariables dependientes en el tiempo) y también hay técnicas que permiten trabajar con modelos de
riesgo no proporcionales
En esta situación no sería correcto asumir un efecto constante del tratamiento. Ambos efectos se anularían mútuamente. La
razón de riesgos ó HR cambia de una parte a la otra del seguimiento
Pero el HR no es siempre constante....
Kaplan-Meier survival estimates, by group
Kaplan-Meier survival estimates, by group
1.00
1.00
Función de riesgo
A
Las curvas se cruzan
0.75
0.75
HR=1,09 (IC95% 0,94 a 1,22)
B
0.50
0.50
group 1
group 1
0.25
0.25
group 0
0.00
0.00
group 0
0
0
10
10
20
20
30
analysis time
analysis time
30
40
40
En estas situaciones en que los HR difieren con el tiempo y los riesgos no son proporcionales en el tiempo no procede hacer una
estimación única para el HR
La interpretación práctica es que el tratamiento A es más efectivo que el tratamiento B sólo a corto plazo, pero a partir de un
determinado momento el riesgo de fallecer es superior en los pacientes asignados al tratamiento A que a B. Una forma alternativa
más sencilla de interpretar es segmentar el evento, haciendo distintas estimaciones de HR para los eventos precoces o tardíos
Aplicación y Ventajas de la Regresión de Cox
Permite estimar la influencia de más de un factor (no sólo el tratamiento) sobre la
variable resultado
Eso permite cuantificar la diferencia debida al tratamiento ajustando los posibles
factores de confusión que pueden haber influido (edad, sexo, estadio tumoral, etc.. )
Comprueba que a igualdad de edad, sexo, estadío tumoral, etc..,los pacientes que
fueron tratados con el fármaco A sobrevivieron más que los tratados con B en
cualquier punto posible dentro del seguimiento del estudio
Permite valorar si una de las variables independientes interacciona con otra y
modifica su efecto.
BCIRG 001
500 mg/m2
F 5-FU
50 mg/m2
A Doxorubicin
2
Cyclophosphamide
500
mg/m
C
R
Stratification:
• Nodes:
1-3
4+
• Center
Every 3 weeks x 6 cycles
75 mg/m2
T Docetaxel
50 mg/m2
A Doxorubicin
2
C Cyclophosphamide 500 mg/m
Dexamethasone premedication, 8 mg bid, 3 days
Prophylactic Cipro 500 mg bid, day 5-14
Tamoxifen for 5 years was recommended for all patients with HR+
tumors, beginning at the end of adjuvant chemotherapy
BCIRG 001: Overall Survival (ITT)
1.0
Cumulative Probability
TAC
0.8
FAC
0.6
HR: 0.70 (0.53-0.91) p = 0.008
0.4
0.2
0.0
0
6
12
18
48
24
36
30
42
Survival Time (months)
54
60
66
BCIRG 001: Overall Survival (ITT)
1.0
Cumulative Probability
TAC
0.8
FAC
HR: 0.70 (0.53-0.91) p = 0.008
HR: 0.68 (0.52-0.89) p = 0.005 (*)
0.6
(*) ajustado según siguientes variables: nº N+, edad, tamaño tumoral,
grado histológico, Receptores hormonales y HER2
0.4
La regresión de Cox permite afirmar que el beneficio de TAC sobre FAC en
SG es debido propiamente al tratamiento y no a las otras variables
0.2
Al tratarse de un EC aleatorizado, no cabe esperar grandes diferencias
entre los grupos en cuanto a estas variables, por lo que los resultados sin
ajustar y ajustados no deberían diferir mucho
0.0
0
6
12
18
48
24
36
30
42
Survival Time (months)
54
60
66
Interpretación del Hazard Ratio
• TAC vs FAC ¿Cuál de las siguientes afirmaciones es cierta?
• HR* = 0,7 (0,53-0,91)  1 - 0,7 = 0,3
-> 30 % (9-47%)
– A) TAC aumenta la supervivencia un 30% en términos absolutos
– B) El tiempo mediano de supervivencia se incrementa un 70% con TAC
– C) TAC produce una reducción relativa del riesgo instantáneo de
fallecer del 30% con respecto a FAC
HR–* del
grupo
tratado
con TAC con
respecto
al grupo tratado
con FAC
D) Con
TAC
se incrementa
un 70%
los pacientes
que sobreviven
Interpretación del Hazard Ratio
•
TAC vs FAC ¿Cuál de las siguientes afirmaciones es cierta?
•
HR = 0,7 (0,53-0,91)  1 - 0,7 = 0,3
-> 30 % (9-47%)
– A) TAC aumenta la supervivencia un 30% en términos absolutos
– B) El tiempo mediano de supervivencia se incrementa un 70% con TAC
– C) TAC produce una reducción relativa del riesgo instantáneo de fallecer del
30% con respecto a FAC
– D) Con TAC se incrementa un 70% los pacientes que sobreviven
“No sabemos cúantos años le quedan de vida, pero podemos garantizarle que si se trata
con TAC en lugar de FAC su riesgo (instantáneo) de fallecer queda reducido entre un 9 y
un 47%, con una seguridad del 95% (probabilidad de equivocarnos <5%)”
Interpretación del Hazard Ratio
• FAC vs TAC
– En este caso tomamos a TAC como referencia (en el
denominador)
• HR = 1/0,7 = 1,428
– FAC produce un aumento relativo del riesgo instantáneo de
fallecer del 42,8 % (IC 95%.....) con respecto a TAC
– El resultado del HR depende del grupo que hayamos
escogido como referencia, es decir, del grupo que se
coloque en el denominador
El aumento de mediana de supervivencia
siempre guarda relación con el HR
Tto estándar
Fármaco A
% supervivencia
Fármaco B
tiempo
no
HR = 0,73 (IC95% 0,56-0,95)
p=0,018
↑ mediana = 19,7
meses
Bonner et al. N Eng J Med 2006;354(6):567-78
Bonner et al. Lancet Oncol 2010;11(1):21-8
En este caso el HR sería
muy inferior a 0,73
↑ mediana = 19,7
meses
Problemas del HR
Es una medida relativa, y por tanto, su interpretación práctica es más
compleja que el de una medida absoluta
Hazard Ratio associated with the experimental
therapy (by increase in median PFS or OS)
Median PFS or OS with standard
therapy
0.9
0.7
3 months
10 days
39 days
6 months
20 days
9 weeks
1 year
6 weeks
22 weeks
1.5 years
9 weeks
33 weeks
2 years
12 weeks (~ 2.8 months)
44 weeks (~ 10.5 months)
¿Beneficio grande o pequeño?
Adaptado de Sobrero A and Bruzzi P. J Clin Oncol 2009;27(35):5868-73
Uso del intervalo de confianza (IC 95%) como valor de
significación estadística del HR
• Como estamos ante una medida relativa del tipo RR ó
OR, debemos comprobar si el IC (95%) del HR incluye
o no el valor 1
•
Si el IC (95%) del HR incluye el valor 1 diremos que no
existen diferencias estadísticamente significativas
entre los dos grupos
• Si el IC (95%) del HR no incluye el valor 1 diremos que
existen diferencias estadísticamente significativas
entre los dos grupos
Interpretación del HR
Ensayos de superioridad
Ensayos de no inferioridad
Interpretación del Hazard Ratio
• Habitualmente los estudios comparativos se diseñan para
demostrar la superioridad de un tratamiento frente a otro
• Sin embargo, cada vez es más frecuente la aparición de ensayos
en los que se pretende demostrar la no inferioridad de una pauta
con respecto a otra
• Esta decisión tiene implicaciones no sólo en el tamaño de la
muestra sino también en el análisis estadístico
• La interpretación del HR será distinta según si el ensayo ha sido
diseñado para demostrar superioridad o no inferioridad
Ensayo de superioridad: AVAIL
Placebo
+ CG
n = 347
Bev 7.5
+ CG
n = 345
HR
[95%
CI]
---
0.75
[0.62,
0.91]
p-value
---
0.0026
Possibility of PFS
1.0
0.8
HR
0.6
0.4
Placebo + CG
Bev 7.5mg/kg + CG
0.2
0.0
0
No. at risk
Placebo + CG 347
Bev 7.5 + CG 345
3
6
228
251
122
150
9
Time (months)
36
52
12
15
18
12
18
3
3
0
0
Reck M. J Clin Oncol 2009;27(8):1227-34
Uso del intervalo de confianza (IC 95%) como valor de
significación estadística del HR
• Hipótesis nula: las dos curvas son iguales, es decir, se
superponen. Por tanto el HR sería igual a 1. (HR=1)
•
Este es el valor que debemos contrastar con nuestro IC
• Ensayo AVAIL: HR= 0,75 (IC95% 0,62-0,91)
Como el IC no incluye el valor 1, la diferencia entre las dos curvas
es significativa, p<0,05 (exactamente p=0,0026), demostrándose la
hipótesis de superioridad del estudio
Ensayos de no inferioridad
• El contraste de hipótesis para el HR no se hace frente al valor
de la hipótesis nula (HR=1), sino que se realiza frente a un
valor predeterminado a priori en el protocolo, denominado
Límite de no inferioridad (LNI)= δ
• La determinación del LNI no es fácil, puede ser subjetivo,
requiere consenso clínico
• LNI (δ): Máxima diferencia entre los tratamientos a comparar
que vamos a considerar como clínicamente irrelevante
SUPERIORIDAD
NOINFERIORIDAD
HIPÓTESIS NULA
H(o)
HIPÓTESIS ALTERNATIVA
H(a)
C=E
E≠C
No hay diferencia
Son diferentes
HIPÓTESIS NULA
H(o)
HIPÓTESIS ALTERNATIVA
H(a)
C-E>δ
C-E≤δ
La diferencia es mayor de
lo aceptado
La diferencia está en el margen
de NI
Chemotherapy-Naive Patients with Advanced NSCLC
Scagliotti GV et al. J Clin Oncol 2008;26:3543-51
Scagliotti GV et al. J Clin Oncol 2008;26:3543-51
Cisplatino-Pemetrexed / Cisplatino-Gemcitabina
Diseño de no inferioridad
• Potencia del 80% para rechazar la hipótesis nula (Ho)
• Ho: Cis-Gem proporciona una reducción del riesgo de
muerte > 15% con respecto a Cis-Pem HR > 1/0,85 >
1,176
• Margen superior de HR: 1,176 (LNI=δ)
0,84
0,94
1,05
Global
Como el IC obtenido en el ensayo (0,84-1,05) no supera el LNI
(1,176), se rechaza la Ho, quedando demostrada la no-inferioridad
de Cisplatino-Pemetrexed con respecto a Cisplatino-Gemcitabina
1,176
Análisis de supervivencia
Conclusiones
• Debe basarse en el estudio de las funciones de
supervivencia y riesgo
• El modelo de riesgos proporcionales de Cox permite
disponer al investigador de un estimador del efecto de
un tratamiento (HR), junto con su intervalo de confianza
• La disponibilidad del HR (IC95%) permite evaluar tanto
la significación estadística como la relevancia clínica
Utilización del análisis de regresión de Cox con
finalidades pronósticas y predictivas
Docetaxel plus prednisone or mitoxantrone plus prednisone
for advanced prostate cancer
Study TAX-327
Tannock et al. N Engl J Med 2004;351:1502-12
TAX 327: overall survival
1.0
Docetaxel q3w
Docetaxel weekly
Mitoxantrone
Probability of surviving
0.9
0.8
0.7
0.6
0.5
Median
survival
(months)
18.9
17.3
16.4
0.4
0.3
D q3w:
D weekly:
M:
0.2
0.1
Hazard
ratio p-value
0.76
0.009
0.91
0.36
—
—
0
0
6
12
18
Time (months)
24
30
Análisis multivariable TAX327
Variables pronósticas independientes
Armstrong AJ et al. Clin Cancer Res 2007;13(21):6396-403
Aplicaciones
• ¿Cúal es el HR de un paciente sin metástasis hepáticas (MH)
tratado con docetaxel cada 3 sem en relación a otro paciente
con MH tratado con mitoxantrona?
– HR Docetaxel c/3 sem vs Mitoxantrona 1/1,43 = 0,70
– HR no MH vs MH 1/1,66 = 0,6
– 0,7 x 0,6 = 0,42
• Permite predecir la probabilidad de supervivencia (o en
general de permanencia libre del evento) para un
determinado sujeto a partir del patrón de valores que
presentan sus variables pronósticas (nomograma pronóstico)
CONFUSION E INTERACCION
Variables o factores que pueden enmascarar el
efecto objeto del estudio: Variables predictoras
Pemetrexed + BSC vs Placebo + BSC
Overall Survival
HR=0.79 (95% CI: 0.65–0.95)
P =0.012
Survival Probability
1 .0
0 .9
0 .8
0 .7
0 .6
Pemetrexed 13.4 months
0 .5
0 .4
Placebo 10.6 m
0 .3
0 .2
0 .1
0 .0
0
3
6
9
12
15
18
21
24
27
30
33
36
39
42
45
48
Time (months)
Ciuleanu T et al. Lancet 2009;374:1432-40
Overall Survival by Histology
Non-squamous (n=481)
Squamous (n=182)
Survival Probability
HR=0.70 (95% CI: 0.56-0.88)
P =0.002
HR=1.07 (95% CI: 0.77–1.50)
P =0.678
1.0
1.0
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6
Pemetrexed 15.5 months
0.5
0.4
0.4
0.3
0.3
Placebo
10.3 months
0.2
0.1
0.0
0.0
3
6
9
12
15
18
Placebo
10.8 months
0.2
0.1
0
Pemetrexed 9.9 months
0.5
21
24
27
30
33
Time (months)
36
39
42
45
48
0
3
6
9
12
15
18
21
24
27
30
33
36
39
Time (months)
Ciuleanu T et al. Lancet 2009;374:1432-40
42
45
48
Test de interacción
“En los análisis de subgrupos correctamente
realizados, la presentación de los resultados no
debe basarse en los valores de la p de las
comparaciones intragrupo, sino en el test de
interacción estadístico entre grupos”
Maintenance pemetrexed vs placebo
Squamous
Non-squamous
Pemetrexed
Placebo
Pemetrexed
Placebo
n
116
66
325
156
mPFS
(months)
2.4
2.5
4.4
1.8
HR
(95% CI)
1.03 (0.71-1.49)
0.47 (0.37-0.60)
p=0.896
p < 0,0001
Interaction between treatment and histology p = 0.036
mOS
(months)
9.9
10.8
15.5
10.3
HR
(95% CI)
1.07 (0.77-1.50)
0.70 (0.56-0.88)
p=0.678
p =0.002
Interaction between treatment and histology p = 0.033
¿Cómo se comporta la variable “histología” en
este ensayo?
Existe interacción, la variable “histología” actúa como variable
modificadora del efecto. (Factor predictivo de respuesta).
SG. El HR global (0,79), sin estratificar, representa un valor
promedio de los HR obtenidos en ambos estratos (0,70 noescamosos y 1,07 escamosos).
Cuando hay interacción, el HR global tiene poco interés práctico
ya que no informa de manera precisa sobre la relación objeto del
estudio
Detectar la interacción, enriquece la información
¿Equivale HR a RR?
• Se interpreta como un riesgo relativo pero….
• Se asemeja más a la razón de densidades de incidencia (razón de tasas) que a la
razón de incidencias acumuladas (razón de proporciones o RR)
• Un RR de 0,5 en un año significa que el riesgo de que un paciente muera antes de
acabar el año es la mitad con el tratamiento que con el control. No tiene en
cuenta el tiempo en el que se producen los sucesos.
• Un HR de 0,5 implica que, en cualquier momento del año, el riesgo de morir de
un paciente es la mitad con el tratamiento que con el control. El tiempo es
absolutamente decisivo.
– ¡No significa que la mortalidad se reduce un 50% en el global del estudio!
¡PARECE LO MISMO PERO NO LO ES!
¿Equivale HR a RR?
• Ambos estimadores pueden tener resultados
diferentes de manera análoga, pero menos
pronunciada que la divergencia entre OR y RR
• Habrá mayor divergencia entre RR y HR:
– Cuanto más largo sea el seguimiento
– Cuanto mayor sea la incidencia de eventos
– Cuanto mayor sea el valor de RR (en especial cuando
el RR sea > 2,5)
La paradoja de los intervalos
Supuesto: Tenemos 2 poblaciones distintas (A y B). En la población A
fallecen el 40% de pacientes cada día, mientras que en la B, lo hacen el
20%. El HR sería 20% / 40% = 0,5 (que se mantiene a lo largo del
estudio)
HR=0,5
1º día
2º día
3º día
Muertes
totales
Población
A
1000
600 v
400 m
360 v
240 m
216 v
144 m
784
Población
B
1000
800 v
200 m
640 v
160 m
512 v
128 m
488
v vivos
m muertos
RR=0,62
No es lo mismo reducir la mortalidad un 50% al cabo de 3 días que reducirla un 50% el primer día, un 50%
el 2º día y un 50% el 3º día
La paradoja de los intervalos
Supuesto: Tenemos 2 poblaciones distintas (A y B). En la población A
fallecen el 4% de pacientes cada día, mientras que en la B, lo hacen el
2%. El HR sería 2% / 4% = 0,5 (que se mantiene a lo largo del estudio)
HR=0,5
1º día
2º día
3º día
Muertes
totales
Población
A
1000
960 v
40 m
921 v
39 m
884 v
37 m
116
Población
B
1000
980 v
20 m
960 v
20 m
941 v
19 m
59
v vivos
m muertos
RR=0,508
Cuando la mortalidad es muy baja y el tiempo de seguimiento es muy corto, el HR se asemeja al RR
SUPERVIVENCIA