Vuoso Celestino Comunicazione apertura offerte economiche

Download Report

Transcript Vuoso Celestino Comunicazione apertura offerte economiche

E- APPENDICE 1 E 2
Novembre 2014
1
A. Battaggia
2
A. Donzelli
3
M. Font
1. MMG Verona
2. Consiglio direttivo
Fondazione Allineare
Sanità e Salute
3. Farmacista ULSS
20 Verona
InfoFarma 5
TARGET DI EMOGLOBINA GLICATA NEL
DIABETE 2: USQUE TANDEM?
Trial sequential monitoring boundaries
Il modello descritto in questa sede è quello di Lan-DeMets implementato utilizzando i
boundaries di O’Brien-Fleming, il più frequentemente utilizzato. Non ci soffermeremo
sulla descrizione di altre tecniche perchè ciò esula dagli scopi dell’articolo.
Trial sequental Analysis in un RCT
In un trial randomizzato e controllato è pratica abbastanza comune eseguire analisi ad interim. L’obiettivo di questi
‘look’ è valutare se sia il caso di interrompere precocemente la sperimentazione in seguito a dimostrazione precoce
di beneficio o di dannosità del trattamento. In questa sede consideriamo “precoce” una analisi dei risultati condotta
prima di aver completato il reclutamento di pazienti previsto ex ante, ossia prima di aver raggiunto il 100% del
campione programmato.
Queste analisi “precoci” pongono gli stessi problemi di altri tipi di analisi multiple eseguite sullo stesso campione
(es: analisi di outcome secondari, analisi per sottogruppi): più alto è il loro numero, più aumenta - al livello abituale
di confidenza - la probabilità di falsi positivi (=errore alfa, cioè la probabilità di definire erroneamente “reale” un
risultato che invece è dovuto al caso). Per ovviare a questo problema al momento in cui si esegue ogni analisi ad
interim occorre aggiustare adeguatamente il cut off di significatività statistica. Ciò significa che non potremo più
definire “significativo” un risultato utilizzando il classico cut off 0,05, ma dovremo adottare criteri restrittivi,
abbassando fortemente questo cut off a valori molto piccoli di p.
Quanto abbassare il cut off di p?
Dipende dal momento in cui eseguiamo l’analisi: più è precoce, cioè quanto più la dimensione campionaria finora
raggiunta è bassa, più occorre abbassare il cut off di p. Quello necessario per dichiarare significatività tende ad
aumentare man mano che aumenta il numero dei pazienti arruolati.
La comprensione di questi concetti può essere ardua per chi non è avvezzo ad affrontare argomenti statistici, ma di
solito le difficoltà che si incontrano dipendono in questo caso da un motivo semplice: anche se i ‘boundaries’
potrebbero essere definiti teoricamente– come descritto per ragioni didattiche- dall’insieme dei singoli valori di cut
off necessari a dichiarare ‘significatività statistica’ (che come visto aumentano all’aumentare del campione), nella
realta’ operativa (matematicamente è la stessa cosa) al posto dei valori di p si usano i corrispondenti valori di z, che
fanno assumere al grafico un andamento speculare.
Non ci soffermeremo a descrivere in dettaglio la statistica z, ma qualche cenno è necessario per capire la natura dei
boundaries in un’analisi sequenziale. Basta ricordare in questa sede che quando l’endpoint è dicotomico come nel
caso di un evento cardiovascolare (un paziente può averlo [codice: 1] o non averlo [codice 0]) la probabilità con cui
si distribuisce il valore standardizzato della misura di efficacia che esprime il confronto tra braccio di intervento e
braccio di controllo si distribuisce (a meno che il campione sia piccolissimo) secondo una distribuzione gaussiana.
La statistica z corrisponde appunto al valore standardizzato di questo confronto.
In una distribuzione gaussiana standardizzata i valori di z si posizionano sull’asse delle ascisse e il range di tutti i
loro possibili valori va da - infinito a + infinito; il centro esatto dell’asse zeta corrisponde a zero.
La gaussiana ha un’interessante proprietà: possiamo infatti essere certi che il 95% di tutti i possibili valori di z siano
compresi tra -1,96 e +1,96 e che il rimanente 5% sia distribuito equamente nelle due code (metà tra - infinito e 1,96; l’ altra metà tra +1,96 e + infinito).
In un confronto tra i due bracci di un trial in cui si studia il rischio di un evento cardiovascolare, qualora sia
soddisfatta l’ipotesi nulla (= quando la differenza tra i due bracci è dovuta al caso), il valore di z che corrisponde al
valore standardizzato della differenza (che sotto il punto di vista operativo è prodotto dal test statistico di
significatività) si trova con una probabilità alta (95%=0,95) tra -1,96 e +1,96 e con una probabilità molto bassa
(5%=0,05) in una delle due code. Per convenzione statistica, quando il risultato si trova in una delle due code si è
legittimati a pensare, data la scarsa frequenza con cui si osserva tale fenomeno nella condizione in cui l’ipotesi
nulla è vera, che in realtà il risultato non sia dovuto al caso, ma piuttosto imputabile a una differenza reale (= non
casuale) tra i due bracci. Per cui, se ragioniamo in termini di ‘significativita’ statistica’, per convenzione definamo
‘non dovuto al caso’, dunque ‘significativo’, un risultato caratterizzato da una z più negativa di -1,96 oppure più
positiva di +1,96 (p<0,05); e ‘dovuto al caso’, dunque ‘non significativo’ un valore di z compreso tra -1,96 e +1,96.
La comprensione di questi concetti dovrebbe ora illuminare il lettore sul significato del grafico illustrato nella
Figura A.
La linea orrizzontale numerata tra 1 e 10 esprime il progressivo incremento nel tempo del numero dei pazienti
arruolati (da 0% a 100%) e va usata come base di ragionamento.
1
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
Le due linee blu non tratteggiate esprimono per ogni punto i valori critici di z superati i quali può essere dichiarata
per l’analisi eseguita in quel punto ‘significativita’ statistica’.
Le linee blu tratteggiate corrispondono ai valori limite di z utilizzati per definire ‘significativita’ statistica quando
non si eseguono analisi ad interim, ma si valuta piuttosto la differenza tra i due bracci una volta raggiunta la
numerosità campionaria programmata ex ante per l’endpoint primario (+1,96 e -1,96): ciò corrisponde all’unica
situazione in cui è legittimo accettare il livello usuale di confidenza (95%).
La linea rossa non tratteggiata corrisponde ai valori di z di volta in volta prodotti dai test di significatività riferiti a
una serie progressiva di analisi ad interim. Se in un punto questa linea rossa oltrepassa la linea blu tratteggiata, ma
non la linea blu non trateggiata, il risultato si definisce ‘falso positivo”.
Infatti una situazione del genere si potrebbe considere come ‘vero positivo’ solo se l’analisi non rientrasse in una
serie di analisi ad interim, ma fosse piuttosto un’unica analisi eseguita al 100% della numerosità campionaria
programmata. Lo stesso valore di z non può insomma rappresentare “significatività” (= vero positivo) se inserito in
una analisi sequenziale, perchè non è stato ancora superato il limite di z definito dai boundaries.
Figura A – Modello generale di Analisi sequenziale
+1.96
- 1.96
Per il significato delle linee grigie (futility boundaries: vedi oltre)
Se l’esempio didattico illustrato in figura A rappresentasse quanto realmente accaduto in un trial su un intervento
farmacologico, vedremmo che all’analisi interinale 3 (corrispondente al raggiungimento del 30% della numerosità
campionaria programmata) al valore di z prodotto dal test statistico (più positivo di +1,96) corrisponderebbe
senz’altro un valore di p < 0.05.
Tuttavia il risultato dovrebbe essere considerato comunque falso, in quanto il valore di z non è piu’ positivo del
valore critico di z identificato dai boundaries (infatti la linea rossa in cui è inserito non ha ancora intersecato la linea
blu dei boundaries).
La linea blu dei boundaries è invece intersecata dalla linea rossa delle analisi ad interim nel punto corrispondente
all’analisi ad interim numero 9 (raggiungimento del 90% della numerosità campionaria programmata): il risultato si
deve qui considerare un vero positivo (= non dovuto al caso).
Vediamo però all’analisi 9 che la linea dei boudaries intersecata dalla linea rossa delle analisi ad interim è quella
che rappresenta i valori negativi di z.
Ciò significa (come testimonierebbe in maniera più intuitiva il risultato non standardizzato corrispondente al valore
di zeta), che la differenza tra i due bracci qui osservata presenta una direzione opposta a quella che sarebbe stata
(erroneamente) valorizzata all’analisi ad interim numero 3, qualora avessimo dichiarato “positivo” quel “falso
positivo”.
Se nell’esempio in questione i valori positivi di z rappresentassero ‘efficacia dell’intervento’ e i valori negativi di z
rappresentassero ‘dannosita dell’intervento’, adottando erroneamente all’analisi ad interim n. 3 il cut off
abitualmente utilizzato per definire significativita’ (z= ±1,96), avremmo erroneamente concluso che il farmaco
2
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
produce vantaggi con significatività statistica, mentre come abbiamo visto dai risultati dell’analisi 9 la
significatività statistica esiste ma è associata a prova di dannosità.
Per il significato delle linee grige (futility boundaries): vedi oltre
Trial sequental Analysis in una metanalisi
Lo stesso principio si può esemplificare in ambito metanalitico prendendo come esempio una metanalisi
cumulativa, che prevede nel tempo aggiornamenti successivi (= man mano che vengano prodotte altre ricerche sullo
stesso tema). Lo scopo dell’analisi sequenziale è in questo caso definire il momento in cui la letteratura ha prodotto
un livello sufficiente di prove, rendendo così superflua l’organizzazione di nuovi trial. Questa condizione
corrisponde all’identificazione di risultati veri positivi o di risultati veri negativi. La verifica di una condizione
diversa (falsi positivi o falsi negativi) suggerirebbe invece che allo stato attuale delle conoscenze non esistono
ancora prove sufficienti a certificare la validità o l’inutilità dell’intervento studiato. La Trial Sequential Analysis in
ambito metanalitico parte come per un trial dalla definizione della numerosità campionaria necessaria a dimostrare
la differenza tra i due bracci che corrisponde all’obiettivo primario della revisione. Il calcolo del sample size è
effettuato utilizzando lo stesso metodo che sarebbe stato impiegato per la definizione del sample size in un unico
trial, ma il valore è successivamente aggiustato per il grado di eterogeneità rilevato entro i trial inseriti nel pool.
Il calcolo della numerosità campionaria implica questi passaggi:
 Definizione del risultato atteso = differenza attesa tra i due bracci nell’esito studiato
 Definizione della varianza del risultato atteso
 Definizione dell’errore alfa accettato = definizione del livello massimo accettato di probabilità di definire
erroneamente non casuale un risultato spiegato invece dal caso; per convenzione deve essere <0,05
 Definizione dell’errore beta accettato = definizione del livello massimo accettato di probabilità di definire
erroneamente casuale un risultato invece non spiegato dal caso; per convenzione deve essere <0,20
 Aggiustamento del sample size così calcolato per il valore di eterogeneità (si può definire in vari modi; di
solito si usa il rapporto tra la varianza osservata nella metanalisi usando un pooling ‘random effect based’
e la varianza osservata nella metanalisi usando un pooling ‘fixed effect based’ [Thorlund 2011].
Figura B (vedi http://www.ctu.dk/tsa/files/tsa_manual.pdf pagina 54 Figure 12 [Thorlund
2011]): esempio di vero negativo
In ambito metanalitico l’esecuzione di un’analisi sequenziale corrisponde (ogni volta che si aggiunge un trial al
pool per aggiornarne i risultati) all’esecuzione di una ‘metanalisi ad interim’, finalizzata a certificare se occorre
produrre altra ricerca o se il risultato della metanalisi si può considerare conclusivo.
Nell’esempio prodotto per l’analisi sequenziale applicata agli RCT abbiamo illustrato come si identifica, in caso di
“significativita’ statistica” ai livelli di confidenza comunemente accettati (z oltrepassa il range -1,96  +1,96) un
vero positivo e un falso positivo.
Un vero positivo come abbiamo visto oltrepassa anche il valore di z definito dai boundaries, un falso positivo no.
E’ interessante ricordare che esistono anche boundaries per distinguere, in caso di “non signignificatività
statistica” ai livelli di errore beta accettati, un vero negativo da un falso negativo: sono definiti “futility
boundaries”.
Un falso negativo corrisponderà a un valore di z che non oltrepassa il range -1,96  +1,96 ma, allo stesso tempo,
resta più grande del cut off di z definito dai futility boundaries.
Un vero negativo non oltrepassa il range -1,96  +1,96 ma è anche più piccolo del cut off di z definito dai futility
boundaries. Il fatto che z oltrepassi futility boudaries significa in questo caso che la metanalisi ha raggiunto una
numerosità campionaria sufficiente a certificare che il valore di z prodotto dal test statistico è stabilmente basso.
Questa condizione garantisce una quantità di errore beta non superiore a quella programmata (massima quantità
tollerata = 0,20).
Questi concetti sono chiariti dalla figura B
3
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
La tabella A riassume le modalità con cui dovrebbero essere interpretati i risultati metanalitici
applicando un’analisi sequenziale
Tabella A
Risultato Pooled
della metanalisi al
limite di confidenza
comunemente
accettato (95%)
Risultato della Analisi sequenziale
Boundaries ±
1.96
O’Brien-Fleming
Boundaries (alpha
spending function)
Significativo
Non significativo
superati
non superati
superati
-
O’Brien-Fleming
Boundaries
(beta spending
function = Futility
boundaries )
superati
Non significativo
Significativo
non superati
superati
non superati
non superati
-
Interpretazione
Azioni
Vero positivo
Vero negativo
Falso negativo
Falso positivo
Considerare
definitivo il risultato
della metanalisi
Produrre altra
ricerca (risultati non
definitivi)
Le figure C D E F, a cui si rimanda in link per ragione di copyright, rappresentano esempi di
vera negatività, potenziale falsa negatività, vera positività e potenziale falsa positività: tutte sono
tratte dalla metanalisi di Hemimgsen [Hemmingsen 2011]. La metanalisi ha eseguito analisi
sequenziali per i due endpoint primari (mortalità generale e mortalità cardiovascolare) e per tutti
gli endpoint secondari per i quali il risultato pooled era “significativo” al livello di confidenza
abituale (95%).
Figura C: Il grafico illustra una situazione di vera negatività
http://onlinelibrary.wiley.com/doi/10.1002/14651858.CD008143.pub2/abstract;jsessionid=D36FFD049AF5BF1DB
68FC3C75C89DC83.f02t04, Figure 4 pag 25
[Hemmingsen 2013], Outcome = mortalità generale
Figura D: Il grafico illustra una situazione in cui non si può escludere un falso negativo
http://onlinelibrary.wiley.com/doi/10.1002/14651858.CD008143.pub2/abstract;jsessionid=D36FFD049AF5BF1DB
68FC3C75C89DC83.f02t04, Figure 6 pag 27
([Hemmingsen 2013] Outcome = mortalità cardiovascolare
Figura E: Il grafico illustra una situazione di vera positività
([Hemmingsen 2013], web Figura 15 Outcome = outcome composito microvascolare
http://www.ctu.dk/media/8448/Web15_599x431.jpg
Figura F: Il grafico illustra una situazione in cui non si può escludere un falso positivo
([Hemmingsen 2013], web Figura 15 Outcome = outcome composito microvascolare
http://www.ctu.dk/media/8448/Web15_599x431.jpg
Risultati della metanalisi di Hemmingsen
La tabella B illustra in modo sintetico i risultati generali della metanalisi, che vengono di seguito
elencati.
Le terapie ipoglicemizzanti aggressive non sono efficaci sulla mortalità generale
L’adozione di terapie ipoglicemizzanti aggressive non produce alcuna riduzione della mortalità
generale [RR=1,00 (0,92-1,08)], e il risultato si può considerare definitivo, in quanto l’analisi
sequenziale identifica questo risultato come vero negativo (Figura C). L’autore segnala “small
trial effect” (asimmetria della distribuzione) all’ispezione visiva del funnel plot che riguarda
l’esito e che abbiamo riprodotto autonomamente (figura F); tuttavia nella discussione imputa
questo dato alla presenza nel pooling di trial di piccole dimensioni gravati da errori sistematici
in grado di produrre risultati falsamente a favore dell’intervento. Abbiamo verificato in ogni
caso in modo autonomo l’assenza di publication bias per l’outcome mortalità generale
utilizzando un test statistico per la diagnosi formale di publication bias (test di Peters) che
saggia l’ipotesi nulla H0=assenza di publication bias e che rispetto al più noto test di Egger è
meno gravato da risultati falsamente positivi. Il valore p=0,1863 esclude la presenza di
publication bias: l’analisi è attendibile in quanto per questo endpoint esiste un numero di trial
4
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
sufficiente a escludere con ragionevole sicurezza la probabilità di falsi negativi ai test per
publication bias [Higgins 2011].
Le terapie ipoglicemizzanti aggressive sono efficaci sull’endpoint composito microvascolare
Il risultato pooled a favore dell’intervento [RR=0,88 (0.82-0.95)] è confermato dall’analisi
sequenziale che lo identifica come vero positivo. Tuttavia la metanalisi non ha rilevato beneficio
per le terapie ipoglicemizzanti aggressive nei confronti di tre componenti di questo endpoint
(retinopatia, fotocoagulazione, nefropatia), i cui risultati ‘significativi’ (tabella B) in base ai
risultati della analisi sequenziale potrebbero essere falsi positivi. L’autore sottolinea che la
maggior parte dei pazienti che hanno avuto questo esito composito hanno con ogni probabilità
subito sottocomponenti caratterizzati prevalentemente da minor gravità. I risultati significativi a
favore dell’intervento che si riferiscono alla nefropatia, per esempio [RR= 0,75 (0,59-0,95],
gravati da notevole eterogeneità (I2=77%), non sono confermati dai risultati non significativi
riferiti alle complicanze renali più gravi [RR=0,87 (0,71-1,06)].
Le terapie ipoglicemizzanti aggressive aumentano il rischio di eventi avversi gravi (SAES)
Il risultato pooled [1,06 (1,02-1,10) è infatti confermato dall’analisi sequenziale, che lo
identifica come vero positivo.
Le terapie ipoglicemizzanti aggressive aumentano il rischio di ipoglicemie gravi
Il risultato pooled [2,18 (1,53-3,11)) è infatti confermato dall’analisi sequenziale, che lo
identifica come vero positivo.
Per gli altri risultati (positivi o negativi) non è possibile formulare conclusioni
Elenchiamo fra questi endpoint: (a) mortalità cardiovascolare (per la quale non si può escludere
un falso negativo); (b) infarto non fatale, amputazione agli arti inferiori, nefropatia, retinopatia e
fotocoagulazioni (per i quali l’analisi sequenziale non ha escluso falsi positivi); (c) esito
composito macrovascolare, ictus non fatale, rivascolarizzazioni coronariche, rivascolarizzazioni
periferiche, nefropatia terminale e scompenso cardiaco (i cui risultati erano negativi, ma per i
quali non è stata eseguita analisi sequenziale).
5
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
Tabella B – risultati generali della metanalisi
esito
RR (IC 95%)
R=random effect
based
F=fixed effect based
Eterogeneita
entro il
pool’ (I2)
Significativita’al
livello di
confidenza 95%
Sample size
attuale (%)
Risultato della
analisi sequenziale
Qualita’
della
evidenza
(GRADE)
Indirizzi operativi
Sample
size
teorico
Morte da ogni
causa
1.00 (0.92-1.08) R
16%
Morte
cardiovascolare
1.06 (0.94-1.21) R
Esito composito
macrovascolare
(varie definizioni
tra i trial)
Analisi sequenziale
Assente
46305
33806
(73.0%)
Vero negativo
moderata
20%
Assente
115094
33658 (29.2%)
moderata
0.91 (0.82-1.02) R
0.93 (0.87-0.99) F
47%
Assente R
Presente F
-
-
Non si può
escludere un falso
negativo
-
Stop a ulteriori ricerche (
porterebbero agli stessi
risultati negativi)
Ulteriori ricerche potrebbero
portare a risultati diversi
Infarto non fatale
0.87 (0.77-0.98) R
13%
Presente
89450
29021 (32.4%)
moderata
Stroke non fatale
RR 0.99 (0.841.18) R
17%
Assente
-
-
Non si può
escludere un falso
positivo
-
moderata
Non viene riportata l’ analisi
sequenziale
Amputazioni arti
inferiori
RR 0.65(0.45-0.94)
R
0%
Presente
98246
5993(6.1%)
bassa
Ulteriori ricerche potrebbero
portare a risultati diversi
Rivascolarizzazioni
coronariche
Rivascolarizzazioni
periferiche
Esito composito
microvascolare
(varie definizioni
tra i trial)
RR 0.81(0.65-1.01)
R
RR 0.93 (0.81-1.06)
R
0.88 (0.82-0.95) R
0%
Assente
-
-
Non si può
escludere un falso
positivo
-
-
0%
Assente
-
-
-
-
20%
Presente
32010
25857 (80.7%)
Vero positivo
-
Non viene riportata l’ analisi
sequenziale
Non viene riportata l’ analisi
sequenziale
Stop a ulteriori ricerche
(porterebbero agli stessi
risultati positivi)
Nefropatia (varie
definizioni tra i
trial)
Nefropatia
terminale (varie
definizioni tra i
trial)
Retinopatia
0.75 (0.59-0.95) R
77%
Presente
503206
28026 (5.5%)
-
Ulteriori ricerche potrebbero
portare a risultati diversi
0.87 (0.71-1.06) R
0%
Assente
-
-
Non si può
escludere un falso
positivo
-
moderata
Non viene riportata l’ analisi
sequenziale
0.79(0.68-0.92) R
53%
Presente
38260
10230 (26.7%)
-
Ulteriori ricerche potrebbero
portare a risultati diversi
Fotocoagulazioni
retiniche
0.77 (0.61-0.97) R
43%
Presente
105351
11142 (10.5%)
-
Ulteriori ricerche potrebbero
portare a risultati diversi
SAEs
1.06 (1.02-1.10) R
0%
Presente
10975
10876 (99.1%)
Non si può
escludere un falso
positivo
Non si può
escludere un falso
positivo
Vero positivo
-
Scompenso
cardiaco
Ipoglicemia severa
(varie definizioni
tra i trial)
0.98 (0.87-1.10) R
***
Assente
-
-
-
-
2.18 (1.53-3.11) R
66%
Presente
100678
28341 (28.1%)
Vero positivo
alta
Stop A ulteriori ricerche
(porterebbero agli stessi
risultati positivi)
Non viene riportata l’ analisi
sequenziale
Ulteriori ricerche porterebbero
agli stessi risultati positivi
-
La presenza di livelli non bassi
di eterogeneita’ valorizza i
risultati random effect based;
manca tuttavia l’ analisi
sequenziale per questo
endpoint
Ulteriori ricerche potrebbero
portare a risultati diversi
1
al livello di errore beta programmato (20%)
Publication bias
I Funnel plot vengono utilizzati in ambito metanalitico per una prima verifica (visuale) della
presenza di publication bias. La maggior probabilità di trovare pubblicati risultati di efficacia a
favore dell’intervento e/o caratterizzati da significatività statistica rispetto a risultati a sfavore
dell’intervento e/o non significativi configura la situazione chiamata “publication bias”. In
assenza di publication bias plottando in un grafico i risultati dei trial arruolati dalla metanalisi
versus la precisione dei risultati stessi (proporzionale a propria volta alle dimensioni del
campione) si dovrebbe ottenere in assenza di publication bias una distribuzione simmetrica a
campana, con i trial più piccoli alla base della gaussiana e con i trial più grandi vicino all’apice.
Un’asimmetria della distribuzione può essere dovuta a mancata pubblicazione di risultati a
sfavore dell’intervento e può quindi indicare publication bias. Tuttavia un’asimmetria può
dipendere anche da cause diverse dal publication bias. Per esempio può essere associata alla
presenza di ricerche gravate da errori sistematici in grado di produrre risultati tendenzialmente a
favore dell’intervento. L’ispezione grafica del funnel plot dovrebbe essere sempre seguita da
una conferma formale dell’esistenza di asimmetria, che si ottiene attraverso test statistici idonei
(test di Egger, test di Beggs, test di Peters e altri [Higgins 2011]). Questi test sono attendibili
solo in presenza di un numero sufficiente di trial (almeno 10) e producono un valore di P che
può indicare publication bias quando è <0,10 . La metanalisi segnala asimmetrie distributive per
alcuni endpoint, ma in nessun caso (nostra analisi indipendente) la presenza di publication bias è
stata confermata dal test statistico formale.
6
InfoFarma 5
Figura F: Funnel plot per diagnosi di Publication Bias: outcome Mortalità Generale.
Morte da ogni causa (n trial=15)
s.e. of logrr
1
.5
0
Peters test for publication bias: t= -1.4 p=0.19
1.5
E- APPENDICE 1 E 2
Novembre 2014
-4
-2
0
logrr
2
4
7
InfoFarma 5
Figura G: Funnel plot per diagnosi di Publication Bias: outcome Mortalità Cardiovascolare.
Morte Cardiovascolare (n trial=15)
1.5
1
s.e. of logrr
.5
0
Peters test for publication bias: t= -1.2 p=0.25
-4
-2
0
logrr
2
4
Figura H: Funnel plot per diagnosi di Publication Bias: outcome Microangiopatia
Microangiopatia (n trial=5)
.4
s.e. of logrr
.2
0
Peters test for publication bias: t= -1.91 p=0.15
.6
E- APPENDICE 1 E 2
Novembre 2014
-1.5
-1
-.5
0
.5
1
logrr
8
InfoFarma 5
Figura I: Funnel plot per diagnosi di Publication Bias: outcome Eventi avversi gravi
Eventi avversi gravi (n trial=8)
1.5
s.e. of logrr
1
.5
0
Peters test for publication bias: t= -.58 p=0.58
-4
-2
0
logrr
2
4
Figura L: Funnel plot per diagnosi di Publication Bias: outcome Ipoglicemia severa
Ipoglicemia severa (n trial=7)
1.5
s.e. of logrr
1
.5
0
Peters test for publication bias: t= -.99 p=0.37
2
E- APPENDICE 1 E 2
Novembre 2014
-2
0
2
4
logrr
9
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
Number Needed to Treat
Il NNT è una misura fortemente influenzata sia dal rischio basale dell’evento che dalla
lunghezza del follow-up entro cui questo viene intercettato: i trial reclutati da una metanalisi
sono il più delle volte caratterizzati da valori molto diversi di questi parametri per cui il calcolo
di un ‘pooled NNT’ da una metanalisi è in grado di produrre risultati assai distorti [Smeet 1999].
Per superare questo rischio abbiamo aggiustato i rischi basali dei due esiti per un’identica
lunghezza di follow-up (= 5 anni) e abbiamo calcolato l’NNT per ciascuno dei trial inseriti nel
pool attraverso il risultato pooled prodotto dalla metanalisi per ciascun esito (Risk Ratio).
Abbiamo così identificato un range di valori diversi (uno per trial) potenzialmente in grado di
fornire un’idea complessiva sull’efficacia dei regimi ‘aggressivi’ [Higgins 2011, Smeeth 1999].
Si ricorda qui che l’NNT esprime il numero di pazienti da trattare per ottenere un esito in un
solo paziente: valori negativi indicano che nel braccio di intervento la frequenza dell’esito è
maggiore rispetto al braccio di controllo; valori positivi esprimono il contrario. Il confronto tra
l’NNT che riguarda la prevenzione a 5 anni della microangiopatia diabetica e l’NNT che
riguarda l’induzione a 5 anni di di ipoglicemie gravi permette una stima approssimativa del
rapporto rischio-efficacia associato a un approccio ipoglicemizzante aggressivo. Per confrontare
i due NNT abbiamo utilizzato il metodo formale proposto da Sackett, calcolando il rapporto
LHH (Likelihood of being helped vs to be harmed) [Sackett 2001]. LHH è espresso nel nostro
caso da (1/NNTprevenzione retinopatia)/(1/NNTinduzione ipoglicemia grave): valori superiori a 1 indicano un
rapporto rischio/efficacia favorevole, valori inferiori a 1 indicano un rapporto rischio/efficacia
sfavorevole. Ovviamente il significato del LHH dipende fortemente dal tipo degli esiti a
confronto (idealmente: il miglior beneficio e rispettivamente dal peggior danno associato al
trattamento) e non tiene conto delle preferenze del paziente, che andrebbero comunque discusse
e rispettate [Sackett 2001].
Tabella C
Microangiopatia
(esito
composito)
ACCORD
Zhang
ADVANCE
UKPDS
Fantin
Steno2
Tabella D
Eventi
avversi gravi
Steno2
VADT
Fantin
Melidonis
Jaber
ACCORD
Blonde
Bagg
UGPD
Stefanidis
ADVANCE
followup Rischio Rischio a
(anni)
a 5a
5a
Controlli Intervento
3.5
5.0
5.0
10.0
0.003
7.8
15.3%
17.1%
10.4%
5.2%
0.0%
47.3%
followup Rischio
(anni)
a 5a
Controlli
7.8
0.0%
5.60
12.3%
0.0
0.0%
0.016
nd
0.333
79.7%
4
2.3%
0.4
33.6%
0.4
0.0%
12.00
2.6%
0.008
nd
5
36.0%
13.6%
15.2%
9.3%
4.6%
0.0%
42.1%
Rischio a
5a
Intervento
0.0%
13.0%
0.0%
nd
84.4%
2.4%
35.6%
0.0%
2.7%
nd
38.2%
NNT a 5
anni
NNT
IC95%
lower
NNT
IC95%
upper
59
53
87
175
19
41
37
60
120
13
109
98
160
320
35
NNT a 5
anni
NNT
IC95%
lower
-136
-408
nd
nd
-2092.4% -6277.2%
-736
-2207
-50
-149
-653
-1959
nd
nd
-46
-139
NNT
IC95%
upper
-82
nd
-1255.4%
-441
-30
-392
nd
-28
10
E- APPENDICE 1 E 2
Novembre 2014
Tabella E
Ipoglicemia
severa
ADVANCE
Zhang
Blonde
UKPDS
ACCORD
Fantin
Melidonis
IDA
VADT
Steno2
Natarajan
VA_CSDM
Jaber
Kumamoto
Stefanidis
Cao
Bagg
followup Rischio
(anni)
a 5a
Controlli
5.0
1.4%
5.0
0.0%
0.4
0.0%
10.0
0.4%
3.5
7.1%
0.003
0.0%
0.016
0.0%
0.6
0.0%
5.6
2.8%
7.8
10.7%
0.5
0.0%
2.3
5.6%
0.333
0.0%
10.0
0.0%
0.008
0.0%
0.077
nd
0.417
0.0%
InfoFarma 5
Rischio a
5a
Intervento
3.9%
0.0%
0.0%
1.0%
19.3%
0.0%
0.0%
0.0%
7.5%
29.3%
0.0%
15.2%
0.0%
0.0%
0.0%
nd
0.0%
NNT a 5
anni
-40
-165
-8
-21
-5
-10
nd
-
NNT
IC95%
lower
-48
-196
-10
-25
-6
-12
nd
-
NNT
IC95%
upper
-34
-138
-7
-18
-5
-9
nd
-
11
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
Analisi per tipologia di finanziamento
Abbiamo ripetuto con alcune correzioni le analisi stratificate per tipologia di finanziamento
descritte dagli autori ai punti 19.1 (mortalità generale) e 1.25 (mortalità cardiovascolare). Il trial
ACCORD è infatti erroneamente classificato in queste analisi nel gruppo di ricerche “finanziate
dall’industria” mentre in realtà e’ stato finanziato essenzialmente attraverso fondi pubblici.
Un’altra ricerca (il trial VADT) è inoltre a nostro giudizio finanziata attraverso fondi pubblici, o
quanto meno difficilmente inquadrabile nell’una o nell’altra tipologia in base ai dati pubblicati
dall’articolo originale.
Figura M1: Correzione della analisi originale Cochrane n. 1.9 (Mortalità da ogni causa)
Il Forest plot illustra i risultati prodotti dalla ripetizione dell’analisi per sottogruppi stratificati
per tipologia di finanziamento dopo correzione della stratificazione originale. Infatti l’autore
[Hemmingsen 2013] aveva erroneamente classificato ACCORD come “trial finanziato
dall’industria”. Nell’analisi abbiamo qui lasciato il trial VADT nel sottogruppo “Finanziati
dall’industria” (come originariamente fatto dall’autore nell’analisi 1.9 [Hemmingsen 2013],
anche se non concordiamo alla luce di quanto figura nella pubblicazione originale di VADT).
La nostra revisione dimostra che nel sottogruppo di trial non finanziati dall’industria le terapie
aggressive risultano associate a un incremento significativo (+15%) della mortalità da ogni
causa. Nel sottogruppo di trial finanziati dall’industria abbiamo al contrario rilevato con terapie
aggressive una lieve tendenza alla riduzione della mortalità Abbiamo indagato l’esistenza di
‘effetto sottogruppo’ attraverso tecnica di metaregressione, che ha dimostrato che la differenza
rilevata tra i due strati non è dovuta al caso (p=0,016)
Morte da ogni causa
stratificazione in base alla tipologia di finanziamento
trial
year
RR (95% CI)
Events,
Events,
%
Treatment
Control
Weight
NON FINANZIATI DALL' INDUSTRIA
ACCORD
2008
1.19 (1.04, 1.38) 391/5128
327/5123
19.99
Araki
2012
1.17 (0.79, 1.72) 51/585
44/588
2.68
Cao
2011
0.76 (0.21, 2.73) 4/92
5/87
0.31
Fantin
2011
0.33 (0.01, 7.91) 0/35
1/35
0.09
Melidonis
2000
1.00 (0.07, 15.08) 1/24
1/24
0.06
Stefanidis
2003
1.08 (0.07, 16.69) 1/36
1/39
0.06
UGPD
1975
1.03 (0.74, 1.44) 52/204
52/210
3.13
Zhang
2011
0.15 (0.01, 2.75) 0/48
3/49
0.21
Bagg
2001
(Excluded)
0/21
0/22
0.00
Service
1983
(Excluded)
0/10
0/10
0.00
1.15 (1.02, 1.31) 500/6183
434/6187
26.55
ADDITION_Europe 2011
0.93 (0.71, 1.23) 102/1645
90/1352
6.04
ADVANCE
2008
0.93 (0.83, 1.05) 498/5571
533/5569
32.58
DIGAMI2
2005
1.11 (0.89, 1.38) 153/474
89/306
6.61
Kumamoto
2000
0.50 (0.13, 1.90) 3/55
6/55
0.37
Natarajan
2012
0.39 (0.02, 9.23) 0/36
1/42
0.08
REMBO
2008
0.98 (0.26, 3.64) 4/41
4/40
0.25
Steno2
2008
0.60 (0.40, 0.90) 24/80
40/80
2.44
UKPDS
1998
0.94 (0.81, 1.08) 539/3071
213/1138
19.00
VA_CSDM
1995
1.04 (0.31, 3.45) 5/75
5/78
0.30
VADT
2009
1.08 (0.83, 1.41) 102/892
95/899
5.78
Guo
2008
(Excluded)
0/166
0/54
0.00
IDA
2009
(Excluded)
0/51
0/51
0.00
Jaber
1996
(Excluded)
0/23
0/22
0.00
Yang
2007
(Excluded)
0/57
0/32
0.00
Subtotal (I-squared = 0.0%, p = 0.823)
.
FINANZIATI DALL' INDUSTRIA
Subtotal (I-squared = 3.3%, p = 0.409)
0.95 (0.88, 1.02) 1430/12237 1076/9718
73.45
.
Overall (I-squared = 15.9%, p = 0.264)
.00773
1.00 (0.94, 1.07) 1930/18420 1510/15905 100.00
1
MEGLIO TERAPIA INTENSIVA
129
MEGLIO TERAPIA NON INTENSIVA
hemmingsen2013 14 Aug 2014
Test for subgroup Effect (Metaregression): p=0.016
12
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
Figura M2: Correzione dell’analisi originale Cochrane n. 1.9 (Mortalità da ogni causa)
Il Forest plot illustra i risultati prodotti dalla ripetizione dell’analisi per sottogruppi stratificati
per tipologia di finanziamento dopo correzione della stratificazione originale. L’autore infatti
[Hemmingsen 2013] aveva erroneamente classificato ACCORD come “trial finanziato
dall’industria”. Nell’analisi abbiamo qui classificato il trial VADT (la cui fonte di finanziamento
ci è sembrata difficilmente inquadrabile come “commerciale”) nel sottogruppo “NON finanziati
dall’industria” (al contrario di quello che aveva fatto l’autore nell’analisi 1.9 [Hemmingsen
2013]).
La nostra revisione dimostra che nel sottogruppo di trial non finanziati dall’industria le terapie
aggressive risultano associate a un incremento significativo (+14%) della mortalità da ogni
causa. Nel sottogruppo di trial finanziati dall’industria non abbiamo al contrario rilevato
significative differenze tra i due bracci. Abbiamo indagato l’esistenza di ‘effetto sottogruppo’
attraverso tecnica di metaregressione, che ha dimostrato che la differenza rilevata tra i due strati
non è dovuta al caso (p=0,012)
Morte da ogni causa
stratificazione in base alla tipologia di finanziamento
trial
year
RR (95% CI)
Events,
Events,
%
Treatment
Control
Weight
NON FINANZIATI DALL' INDUSTRIA
ACCORD
2008
1.19 (1.04, 1.38) 391/5128
327/5123
19.99
Araki
2012
1.17 (0.79, 1.72) 51/585
44/588
2.68
Cao
2011
0.76 (0.21, 2.73) 4/92
5/87
0.31
Fantin
2011
0.33 (0.01, 7.91) 0/35
1/35
0.09
Melidonis
2000
1.00 (0.07, 15.08) 1/24
1/24
0.06
Stefanidis
2003
1.08 (0.07, 16.69) 1/36
1/39
0.06
UGPD
1975
1.03 (0.74, 1.44) 52/204
52/210
3.13
VADT
2009
1.08 (0.83, 1.41) 102/892
95/899
5.78
Zhang
2011
0.15 (0.01, 2.75) 0/48
3/49
0.21
Bagg
2001
(Excluded)
0/21
0/22
0.00
Service
1983
(Excluded)
0/10
0/10
0.00
1.14 (1.02, 1.28) 602/7075
529/7086
32.33
ADDITION_Europe 2011
0.93 (0.71, 1.23) 102/1645
90/1352
6.04
ADVANCE
2008
0.93 (0.83, 1.05) 498/5571
533/5569
32.58
DIGAMI2
2005
1.11 (0.89, 1.38) 153/474
89/306
6.61
Kumamoto
2000
0.50 (0.13, 1.90) 3/55
6/55
0.37
Natarajan
2012
0.39 (0.02, 9.23) 0/36
1/42
0.08
REMBO
2008
0.98 (0.26, 3.64) 4/41
4/40
0.25
Steno2
2008
0.60 (0.40, 0.90) 24/80
40/80
2.44
UKPDS
1998
0.94 (0.81, 1.08) 539/3071
213/1138
19.00
VA_CSDM
1995
1.04 (0.31, 3.45) 5/75
5/78
0.30
Guo
2008
(Excluded)
0/166
0/54
0.00
IDA
2009
(Excluded)
0/51
0/51
0.00
Jaber
1996
(Excluded)
0/23
0/22
0.00
Yang
2007
(Excluded)
0/57
0/32
0.00
Subtotal (I-squared = 0.0%, p = 0.874)
.
FINANZIATI DALL' INDUSTRIA
Subtotal (I-squared = 3.2%, p = 0.408)
0.94 (0.87, 1.01) 1328/11345 981/8819
67.67
.
Overall (I-squared = 15.9%, p = 0.264)
.00773
1.00 (0.94, 1.07) 1930/18420 1510/15905 100.00
1
MEGLIO TERAPIA INTENSIVA
129
MEGLIO TERAPIA NON INTENSIVA
hemmingsen2013 14 Aug 2014
Test for subgroup Effect (Metaregression): p=0,012
13
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
Figura N1: Correzione dell’analisi originale Cochrane n. 1.25 (Mortalità Cardiovascolare)
Il Forest plot illustra i risultati prodotti dalla ripetizione dell’analisi per sottogruppi stratificati
per tipologia di finanziamento dopo correzione della stratificazione originale. Infatti l’autore
[Hemmingsen 2013] aveva erroneamente classificato ACCORD come “ trial finanziato
dall’industria”.
Nell’analisi abbiamo qui lasciato il trial VADT nel sottogruppo “finanziati dall’industria”,
benché la sua fonte di finanziamento ci paia difficilmente inquadrabile come “commerciale”.
La nostra revisione dimostra che nel sottogruppo di trial non finanziati dall’industria le terapie
aggressive risultano associate a un incremento significativo (+23%) della mortalità
cardiovascolare. Nel sottogruppo di trial finanziati dall’industria non abbiamo al contrario
rilevato significative differenze tra i due bracci. Abbiamo indagato l’esistenza di ‘effetto
sottogruppo’ attraverso tecnica di metaregressione, che in questo caso non ha prodotto risultati
compatibili con differenze significative tra i due strati (p=0,346).
Morte CVD
stratificazione in base alla tipologia di finanziamento
Events,
trial
year
Events,
%
RR (95% CI)
Treatment Control
Weight
NON FINANZIATI DALL' INDUSTRIA
ACCORD
2008
1.30 (1.05, 1.61)
187/5128
144/5123
18.86
Araki
2012
1.58 (0.62, 4.05)
11/585
7/588
1.80
Cao
2011
0.95 (0.14, 6.57)
2/92
2/87
0.44
Melidonis
2000
1.00 (0.07, 15.08) 1/24
1/24
0.23
REMBO
2008
0.49 (0.05, 5.17)
1/41
2/40
0.30
Stefanidis
2003
1.08 (0.07, 16.69) 1/36
1/39
0.22
UGPD
1975
1.00 (0.63, 1.57)
31/204
32/210
6.68
Zhang
2011
0.15 (0.01, 2.75)
0/48
3/49
0.19
Bagg
2001
(Excluded)
0/21
0/22
0.00
Service
1983
(Excluded)
0/10
0/10
0.00
1.23 (1.02, 1.48)
234/6189
192/6192
28.71
ADDITION_Europe 2011
0.94 (0.57, 1.57)
31/1645
27/1352
5.49
ADVANCE
2008
0.88 (0.74, 1.03)
253/5571
289/5569
23.90
DIGAMI2
2005
1.14 (0.86, 1.51)
104/474
59/306
13.44
Kumamoto
2000
1.00 (0.06, 15.59) 1/55
1/55
0.22
Steno2
2008
0.47 (0.23, 0.98)
9/80
19/80
2.89
UKPDS
1998
1.23 (0.98, 1.53)
301/3071
91/1138
17.92
VA_CSDM
1995
1.04 (0.22, 4.99)
3/75
3/78
0.67
VADT
2009
1.22 (0.78, 1.92)
40/892
33/899
6.76
Guo
2008
(Excluded)
0/166
0/54
0.00
IDA
2009
(Excluded)
0/51
0/51
0.00
Jaber
1996
(Excluded)
0/23
0/22
0.00
Yang
2007
(Excluded)
0/57
0/32
0.00
1.01 (0.85, 1.21)
742/12160 522/9636
1.06 (0.94, 1.21)
976/18349 714/15828 100.00
Subtotal (I-squared = 0.0%, p = 0.775)
.
FINANZIATI DALL' INDUSTRIA
Subtotal (I-squared = 38.1%, p = 0.126)
71.29
.
Overall (I-squared = 19.7%, p = 0.229)
NOTE: Weights are from random effects analysis
.00773
1
MEGLIO TERAPIA INTENSIVA
129
MEGLIO TERAPIA NON INTENSIVA
hemmingsen2013 14 Aug 2014
Test for subgroup Effect (Metaregression): p=0,346
14
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
Figura N2: Correzione della analisi originale Cochrane n. 1.9 (Mortalità da ogni causa)
Il Forest plot illustra i risultati prodotti dalla ripetizione dell’analisi per sottogruppi stratificati
per tipologia di finanziamento dopo correzione della stratificazione originale. Infatti l’autore
[Hemmingsen 2013] aveva erroneamente classificato ACCORD come “trial finanziato dall’
industria”. In questa analisi abbiamo classificato il trial VADT (la cui fonte di finanziamento ci
sembra difficilmente inquadrabile come “commerciale”) nel sottogruppo “NON finanziati
dall’industria” (al contrario di quello che aveva fatto l’autore nell’analisi 1.25 [Hemmingsen
2013]). La nostra revisione dimostra che nel sottogruppo di trial non finanziati dall’industria le
terapie aggressive risultano associate a un incremento significativo (+23%) della mortalità
cardiovascolare. Nel sottogruppo di trial finanziati dall’industria non abbiamo al contrario
rilevato significative differenze tra i due bracci. Abbiamo indagato l’esistenza di ‘effetto
sottogruppo’ attraverso tecnica di metaregressione, che in questo caso non ha prodotto risultati
compatibili con differenze significative tra i due strati (p=0,231)
Morte CVD
stratificazione in base alla tipologia di finanziamento
Events,
trial
year
Events,
%
RR (95% CI)
Treatment Control
Weight
NON FINANZIATI DALL' INDUSTRIA
ACCORD
2008
1.30 (1.05, 1.61)
187/5128
144/5123
18.86
Araki
2012
1.58 (0.62, 4.05)
11/585
7/588
1.80
Cao
2011
0.95 (0.14, 6.57)
2/92
2/87
0.44
Melidonis
2000
1.00 (0.07, 15.08) 1/24
1/24
0.23
REMBO
2008
0.49 (0.05, 5.17)
1/41
2/40
0.30
Stefanidis
2003
1.08 (0.07, 16.69) 1/36
1/39
0.22
UGPD
1975
1.00 (0.63, 1.57)
31/204
32/210
6.68
VADT
2009
1.22 (0.78, 1.92)
40/892
33/899
6.76
Zhang
2011
0.15 (0.01, 2.75)
0/48
3/49
0.19
Bagg
2001
(Excluded)
0/21
0/22
0.00
Service
1983
(Excluded)
0/10
0/10
0.00
1.23 (1.03, 1.46)
274/7081
225/7091
35.47
ADDITION_Europe 2011
0.94 (0.57, 1.57)
31/1645
27/1352
5.49
ADVANCE
2008
0.88 (0.74, 1.03)
253/5571
289/5569
23.90
DIGAMI2
2005
1.14 (0.86, 1.51)
104/474
59/306
13.44
Kumamoto
2000
1.00 (0.06, 15.59) 1/55
1/55
0.22
Steno2
2008
0.47 (0.23, 0.98)
9/80
19/80
2.89
UKPDS
1998
1.23 (0.98, 1.53)
301/3071
91/1138
17.92
VA_CSDM
1995
1.04 (0.22, 4.99)
3/75
3/78
0.67
Guo
2008
(Excluded)
0/166
0/54
0.00
IDA
2009
(Excluded)
0/51
0/51
0.00
Jaber
1996
(Excluded)
0/23
0/22
0.00
Yang
2007
(Excluded)
0/57
0/32
0.00
0.99 (0.81, 1.20)
702/11268 489/8737
1.06 (0.94, 1.21)
976/18349 714/15828 100.00
Subtotal (I-squared = 0.0%, p = 0.853)
.
FINANZIATI DALL' INDUSTRIA
Subtotal (I-squared = 42.9%, p = 0.105)
64.53
.
Overall (I-squared = 19.7%, p = 0.229)
NOTE: Weights are from random effects analysis
.00773
1
MEGLIO TERAPIA INTENSIVA
129
MEGLIO TERAPIA NON INTENSIVA
hemmingsen2013 14 Aug 2014
Test for subgroup Effect (Metaregression): p=0,231
Conclusioni
Non adottare una terapia ipoglicemizzante aggressiva non significa “non trattare” il paziente
[Hemmingsen 2013]. Il problema più importante messo in luce dalla metanalisi è che non
esistono prove sufficienti per orientare la terapia farmacologica del diabete tipo 2 verso soglie
ben definite di glicemia o di emoglobina glicata. La metanalisi ha certamente dimostrato che
strategie ipoglicemizzanti aggressive non sono in grado di ridurre la mortalità generale (nei trial
non sponsorizzati dall’industria questa sembra addirittura peggiorata) e ha ragionevolmente
suggerito che i vantaggi sull’endpoint composito microangiopatico, pur essendo reali, sono
probabilmente influenzati dai risultati ottenuti sui sottocomponenti minori. La metanalisi ha
infine dimostrato che terapie ipoglicemizzanti aggressive si accompagnano a un aumento del 6%
del rischio di eventi avversi gravi e del 118% del rischio di ipoglicemia grave. Non esistono
invece prove sull’efficacia o meno di queste strategie nei confronti di endpoint stettamente legati
allo stato di salute e alla prognosi del paziente quali morte cardiovascolare, complicanze
macroangiopatiche, infarto non fatale, ictus non fatale, amputazioni, rivascolarizzazioni,
15
E- APPENDICE 1 E 2
Novembre 2014
InfoFarma 5
nefropatia, retinopatia e fotocoagulazioni. I risultati ottenuti su questi endpoint sono stati infatti
probabilmente gravati da errore random e/o dall’inclusione di studi con limiti metodologici. Per
identificare con precisione quali target risultino più vantaggiosi e sicuri per le terapie
farmacologiche nei diabetici tipo 2 l’autore raccomanda di orientare la ricerca verso trial
randomizzati e controllati dove si considerino endpoint maggiori e in cui si arruolino categorie
di pazienti diabetici ancora poco studiate (ad esempio i pazienti più giovani senza complicazioni
cardiovascolari e pazienti più anziani che già hanno subito complicanze).
eAppendice 2
Una revisione delle tabelle di analisi dei dati prodotte da Hemmingsen permette di dimostrare che l’effetto sulla
mortalità differisce in relazione alla fonte di finanziamento degli RCT. Infatti il pooling dei RCT con sponsor
commerciale “rileva” che un trattamento più aggressivo tende a proteggere dalla mortalità totale; al contrario il
pooling dei RCT non finanziati dall’industria dimostra che la mortalità totale e la mortalità cardiovascolare
sono aumentate con significatvità statistica nei pazienti assegnati ai trattamenti più aggressivi (per la
mortalità totale il finanziamento privato si è dimostrato un sicuro modificatore d’effetto anche all’analisi
statistica formale: p for interaction=0,016 (v. eAppendice).
Ciò non appare chiaro a un primo esame delle tabelle sulla mortalità da tutte le cause (Analisi 1.9.) e
cardiovascolare (Analisi 1.25.) stratificate per fonte di finanziamento. Ad esempio per la mortalità da tutte le cause
la tabella pubblicata non mostra differenze tra trattamento aggressivo e standard nei RCT finanziati dall’industria
(RR 1,00; IC 95% 0,94-1,07), come in quelli che non lo sono (RR 1,03; 0,81-1,32). Ma ciò deriva da un errore di
collocazione del RCT ACCORD [ACCORD writing group 2008], posto tra i RCT con sponsor commerciale,
mentre è indiscutibilmente finanziato dalla Sanità pubblica (le industrie produttrici, come d’uso, si sono
limitate a fornire gratuitamente i farmaci utilizzati nella sperimentazione). Dopo aver corretto questo errore, i
risultati cambiano sostanzialmente [vedi Appendice]: i RCT con sponsor industriale rilevano una tendenza alla
protezione dalla mortalità con trattamenti più aggressivi: RR 0,95 (0,88-1,02), mentre quelli senza sponsor
commerciali rilevano un significativo aumento di mortalità totale: RR 1,15 (1,02-1,31). La differenza tra i due
strati non e’ dovuta al caso (test for subgroup effect p=0.016)
Per la mortalità cardiovascolare, ricollocando ACCORD, si ripete la stessa dicotomia: i RCT finanziati
dall’industria “vedono” con i trattamenti più aggressivi un risultato neutro: RR 1,01 (0,85-1,21), i RCT senza
sponsor commerciale un aumento significativo di mortalità: RR 1,23 (1,02-1,48). In questo caso tuttavia non e’
stata dimostrata interazione (test for subgroup effect p=0.346)
Un’ulteriore analisi per sottogruppi in cui il trial VADT è stato riclassificato come non sponsorizzato dall’industria,
(anche questo a nostro avviso era stato impropriamente collocato da Hemmingsen tra quelli finanziati
dall’industria), allarga ulteriormente la forbice tra ciò che rilevano i RCT con sponsor commerciale rispetto agli
altri (eAppendice).
Un’ultima considerazione. Numerose revisioni sistematiche [es. 28,29] hanno mostrato che la corrispondenza di
risultati e conclusioni alle “possibili attese dello sponsor” è molto maggiore quando questo è privato for profit,
anziché pubblico o privato no profit. Altre revisioni sistematiche30,31 hanno documentato un’esagerazione
sistematica dei risultati a favore del trattamento sperimentale quando gli endpoint sono “soggettivi” e sono
inadeguate/non chiare la generazione della sequenza di randomizzazione o il mascheramento dell’allocazione
(esagerazione media rispettivamente del 7% e dell’11%), o manca/non è chiara la presenza di un doppio cieco
(esagerazione media del 13%). Gli endpoint “oggettivi” sarebbero più affidabili, e fra questi in particolare la
mortalità totale sarebbe quello meno prono a distorsioni. Il caso esaminato, però, mostra che anche la mortalità
totale può essere soggetta a “variabilità interpretativa”, e trovarsi di fatto a corrispondere alle aspettative di
sponsor commerciali.
1. Di Pietrantoni C, Demicheli V.. Epidemiol Prev 2005; 29:85-95.
2. Lundh A, Sismondo S, Lexchin J et al. Cochrane Database Syst Rev 2012, Issue 12: MR000033.
3. Wood L et al.. BMJ 2008; 336:601.
4. Savovic J, Jones HE, Altman DG et al.. Ann Intern Med 2012; 157:429-38.
16