Analisi stratificata - Sezione di Epidemiologia & Statistica Medica

Download Report

Transcript Analisi stratificata - Sezione di Epidemiologia & Statistica Medica

INTRODUZIONE
ALL’ANALISI STRATIFICATA
Prof. Roberto de Marco
Sezione di Epidemiologia & Statistica Medica
Università degli Studi di Verona
STRATIFICAZIONE
SCOPI:
• valutare il ruolo di una covariata
• valutare e controllare i confondenti
• valutare e descrivere i modificatori d’effetto
Mediator
Confounder
Effect modifier
?
Exposure
Disease
1. Confounding
• A confounding variable is associated with the
exposure and it affects the outcome, but it is not an
intermediate link in the chain of causation between
exposure and outcome.
Alcohol
Lung cancer
Smoking
example
Lung cancer
No lung cancer
Drinker
50
50
Non-drinker
50
150
100
200
smokers
Lung cancer
Drinker
45
Non-drinker 30
No lung
cancer
15
10
OR=3
grezzo
Non smokers
Lung
cancer
5
20
No lung
cancer
35
140
OR=1
OR=1
Stima corretta (aggiustata) OR=1
 Esercizio:
Il fumo è un confodente della relazione tra consumo di alcool e tumore al
polmone perché è un determinate della malattia ed è associato all’esposizione!
L’associazione stimata condizionalmente al potenziale confondente
(entro strati del potenziale confondente) è libera da confondimento.
La stima corretta è una “media ponderata” delle stima strato-specifiche.
Verificate (e stimate) sulla base dei dati precedenti:
- l’associazione tra fumo e tumore al polmone
- l’associazione tra fumo e consumo di alcool
VALUTAZIONE DEL CONFONDIMENTO :
 confronto tra la stima grezza e la stima ‘corretta’
(ottenuta controllando l’effetto del potenziale confondente)
nell’esempio: stima grezza=3 stima corretta = 1
 Intensità del confondimento-
stima grezza  stima corretta 
x 100
stima corretta
Nell’esempio
31
x 100 = 200%
1
L’analisi stratificata consiste nella:
i)Definizione degli strati in base ai livelli della
covariata/e in studio;
ii)Valutazione dell’associazione entro ogni strato;
iii)Stima di una misura aggiustata su tutti gli strati,
quando appropriato.
RR
grezzo
ES1: 3.0
ES2 : 1.2
ES3: 2.2
ES4: 2.5
RR
strato1
1.0
0.3
1.5
2.3
RR
RR
la covariata è:
strato2 aggiustato confondente modificatore
1.0
3.5
4.8
2.9
1.0
non app.
3.0(?)
2.5
SI
NO
SI
NO
NO
SI
SI
NO
Introduzione alle stime di MantelHaenszel
• L’esempio mostra che non è mai appropriato
utilizzare la stima di associazione grezza
(marginale) in presenza di potenziali confondenti
(o modificatori d’effetto) non controllati col
disegno. Quindi, le misure che ci informano sula
“vera” relazione tra esposizione e malattia sono
quelle condizionali (aggiustate) stimate entro
strati della covariata.
Introduzione agli stimatori di
Mantel-Haenszel
• Misure aggiustate:
– Caso 1: le stime condizionali (entro strato) sono
differenti. In questo caso la covariata è un
modificatore d’effetto. Una misura aggiustata
nasconde tale effetto.
– Caso 2:le stime condizionali sono identiche o
simili. La misura aggiustata è la miglior stima
di associazione
STIMATORI DI MANTEL ed HAENSZEL
Semplici stime proposte per ottenere misure di associazione aggiustate
sotto l’ipotesi di effetto (associazione) uniforme negli strati.
Definito Q il vero parametro di associazione tra esposizione e
malattia, gli stimatori M.H sono calcolati sotto la seguente H0:
H0:Q1 = Q2 = ... = Qk = Q

omogeneità dell’effetto tra gli strati
STIMATORI DI MANTEL ed HAENSZEL
Indagine caso controllo sull’uso materno di spermicidi prima del
concepimento (Esposizione) e nascita di un bambino con sindrome
di Down (outcome) con in funzione dell’età della madre (covariata)
Casi
Spermicidi
No
spermicidi
Controlli
4
109
12
1145
100
200
OR=3.5
Età della madre
<35
>=35
casi cancer
controlli
Casi
Controlli
3
104
1
5
9
1059
3
86
OR=3.4
OR=5.7
The Mantel-Haenszel Summary
Odds Ratio
k
ai di
åT
i
i=1
k
bi ci
åT
i
i=1
Case
Control
Exposed
a
b
Not Exposed
c
d
Ti
STIMATORE DI MH dell OR
condizionale (aggiustata)
k
ORMH
ai di
å
ORi .wi
å
i=1 Ti
=
=i k
bi ci
å wi
åT
i
i=1
dove.wi =
1
var(ln(ORi ))
STIMATORI DI MANTEL ed HAENSZEL
Continuazione esempio
Età della madre
<35
>=35
casi cancer
controlli
Casi
Controlli
3
104
1
5
No
9
spermicidi
1059
3
86
spermicidi
OR=3.4
ORMH
1175
OR=5.7
(3.1059) /1175+ (1)(86) / 95
=
= 3.8
(104.9) /1175+ (5)(3) / 95
Sotto HO
95
Cochran-Mantel-Haenszel Test
of Conditional Independence
• The (Cochran)-Mantel-Haenszel statistic tests the
null hypothesis that exposure and disease are
independent when conditioned on the confounder.
H0:Q1 = Q2 = ... = Qk = 1
l’odds ratio è sempre uguale a 1 in tutti gli
strati
CMH test of conditional
independence
Strata k
Disease
No Disease
Exposed
a
b
Unexposed
c
d
Nk
k
[

(ak  E (ak ))] 2
i 1
k
Var(a )
k
i 1
~
2
1
E ( ak ) 
row1k * col1k
Nk
Var (ak ) 
row1k * row2 k * col1k * col 2 k
N k2 ( N k  1)
TEST DI MANTEL ed HAENSZEL
Continuazione esempio
Età della madre
<35
>=35
casi cancer
controlli
Casi
Controlli
3
104
1
5
NO
9
Sperm.
1059
3
86
Sperm.
107*12
E(a1) =
= 1.09
1175
107*1068*12 *1163
Var(a1) =
= 0.98
1175*1175(1174)
1175
6*4
E(a2) =
= 0.25
95
6 *89 * 4 * 91
Var(a2) =
= 0.23
95* 95(94)
2
95
[(3-1.09)+ (1- 0.25)]
c =
= 5.84 ¾¾
® p < 0.05
0.98 + 0.23
2
IL test di MH è una misura globale di
associazione tra l’esposizione e la malattia
sotto l’assunzione di uniformità del rischio nei
vari strati.
L’associazione è presente quando viene
rifiutata H0 (p<0.05).
Quando l’ipotesi di uniformità del rischio è
palesemente violata il test e le stime di MH
non sono utilizzabili.
Come valutare l’ipotesi di uniformità dell’associazione
tra i vari strati
k
Breslow-Day Test
H0:Q1 = Q2 = ... = Qk = QMH
l’odds ratio è sempre uguale a QMH (la stima
di MH) in tutti gli strati
Breslow-Day Test
• Breslow-Day test statistics takes the form:
k
2
c BD
=å
i=1
[
ak - E(ak ;qˆMH )
Var(a ;qˆ )
k
]
2
MH
• Under H0, Breslow-Day test statistics has a
chi-squared distribution with degrees of
freedom k-1.
Nell’esercizio sull’ utilizzo di spermicidi e nascita di
un bambino con sindrome di down il test di BD:
2
c BD
= 1.7 ® n.s
Quindi la stima di MH è appropriata.
Stimatori e test di MH o analoghi sono stati
derivati anche per gli studi di coorte o crosssectional.
Qualsiasi software statistico prevede la
possibilità di analisi stratificata dei dati con il
calcolo dei test condizionali di indipendenza,
dei test di eterogeneità e delle stime
aggiustate.
STEP DELL’ANALISI STRATIFICATA
e
1. Calcolare ed esaminare le stime d’effetto strato-specifiche
2. Valutare la presenza di modificazione della misura d’effetto
( test statistico per l’omogeneità dell’effetto. Es test di Breslow e Day)
3a. In presenza di eterogeneità dell’effetto
 riportare e descrivere le stime d’effetto strato-specifiche
 stimare una misura d’effetto aggiustata per valutare l’impatto
netto dell’esposizione (se le stime vanno nello stesso senso)
3b. In assenza di eterogeneità dell’effetto
 calcolare una singola stima di sintesi (‘pooled’) tra gli strati
4. Test per l’indipendenza condizionale tra l’esposizione e la malattia
( es test di Mantel-Haenszel)
Associazione tra eventi stressanti durante la gravidanza (lutto, divorzio, perdita del lavoro) e insorgenza di asma nel bambino in
funzione del peso alla nascita.
peso alla nascita
OR
[95% Conf. Interval]
normopeso (2.5-4.2kg)
1.364683
.8719141
2.06666
sottopeso (<2.5kh)
1.956522
.4536863
6.409957
sovrappeso(>4.2kg)
3.911111
.7749241
16.0958)
Crude
1.516583
1.021686
2.196633
M-H combined
1.521609
1.055097
2.194389
Test of homogeneity (M-H)
chi2 =
2.51{txt}
Pr>chi2 = 0.2858
Test that combined OR = 1:
Mantel-Haenszel chi2(1) =
5.10
Pr>chi2 =
0.0239
Il peso alla nascita non è un modificatore d’effetto (test per
l’omogeneità dell’associazione non significativo) ne’
un confondente (la stima grezza e quella aggiustata sono
simili. L’associazione tra il verificarsi di eventi stressanti e
l’insorgenza di asma nel bambino è statisticamente significativa
(p<0.05 test di MH). La miglior stima dell’associazione è quella
aggiustata (MH)
 Esempio 2: Tassi di mortalità età-specifici per malattie coronariche nei medici inglesi
maschi per abitudine al fumo.
[Rothman KJ & Greenland S. Modern Epidemiology. 2nd Edition. Lippincott-Raven,
Philadelphia, 1998; pag. 259]
FUMATORI
età
(anni)
morti
STRATO 1
35-44
32
52,407
6.1
2
18,790
1.1
5.7
STRATO 2
45-54
104
43,248
24.0
12
10,673
11.2
2.1
STRATO 3
55-64
206
28,612
72.0
28
5,710
49.0
1.5
STRATO 4
65-74
186
12,663
146.9
28
2,585
108.3
1.4
STRATO 5
75-84
102
5,317
191.8
31
1,462
212.0
0.9
630
142,247

101
39,220


TOTALE
• IR ‘grezzo’ = 1.7
PY
NON-FUMATORI
tasso
morti
PY
(per 10,000 PY)
tasso
IRi
(per 10,000 PY)
( potrebbe essere confuso dall’età)
STRATO 1:
IR1 = 5.7
STRATO 2:
IR2 = 2.1
STRATO 3:
IR2 = 1.5
STRATO 4:
IR2 = 1.4
STRATO 5:
IR2 = 0.9
IR = 1.42
Misura di associazione
aggiustata (uquivalente a
MH per dati di incidenza)
2 = per omogeneita = 10.41
p-value = prob(24  10.30  H0 vera) = 0.034
ipotesi nulla di omogeneità del rapporto fra tassi rifiutata  modificazione della
misura di effetto
IN PRESENZA DI MODIFICAZIONE DELLA MISURA D’EFFETTO:
RIPORTARE E DESCRIVERE LE STIME STRATO-SPECIFICHE
• non si presenta una singola stima di sintesi dell’effetto ...
( non fornisce informazioni sul pattern di variazione delle stime strato-specifiche)
… ma si riportano i risultati dell’analisi (stime e intervalli di confidenza)
separatamente per ogni strato
• si può descrivere il pattern di variazione delle stime strato-specifiche
tramite un modello di regressione
 solo se a ciascun strato può essere assegnato un valore numerico sensato
 ciascuna stima strato-specifica deve essere opportunamente pesata
 Esempio 2 (continua):
IC95% esatto: 1.5-49.4
IRi
IC95%
35-44
5.7
1.4-23.8
45-54
2.1
1.2-3.8
55-64
1.5
1.0-2.2
65-74
1.4
0.9-2.1
75-84
0.9
0.6-1.3
IC95% approssimato: exp{ln(IRi)  1.96*ES[ln(IRi)]}
4
35-44
3
ln(IRi)
età (anni)
2
1
45-54
55-64
75-84
0
-1
65-74
ETA’
4
35-44
ln(IRi)
3
modello lineare pesato
wi1/2ln(IRi) = wi1/2(a + b*AGEi) + w i1/2i
2
1
45-54
55-64 65-74
75-84
0
wi = 1 / VAR[ln(IRi)] = (1/A1i + 1/A0i
)-1
AGEi = {1,2,3,4,5}
^ = 1.405
a
-1
ETA’
^ = exp( 0.297) = 0.743
exp(b)
^ =  0.297 (IC95%:  0.520 to  0.074)
b
differenza tra log(rischi relativi)
per
unità di cambiamento in AGEi
( passaggio da una classe di età a
quella successiva)
rapporto tra rischi relativi per unità di
cambiamento in AGEi
ESERCIZIO
• Example: Gender Bias at Berkeley?
(From: Sex Bias in Graduate Admissions: Data from Berkeley, Science 187: 398-403; 1975.)
Female
Male
Denied
1276
1486
Admitted
559
1835
1195
2681
Crude RR =
(1276/1835)/(1486/2681) =1.25
(1.20 – 1.32)
Relazione tra rischio di non ammissione e sesso in
funzione del corso scelto
Crude RR = 1.25 (1.20 – 1.32)
Stratum specific RR’s:
A
.46 (.30-.70)
B
0.86 (.48-1.54)
C
1.05 (.94-1.16)
D
1.02 (.92-1.12)
E
0.96 (.87-1.05)
F
1.01 (.97-1.05)
Maentel-Haenszel Summary RR: .97
Cochran-Mantel-Haenszel Test is NS.
Summary
Crude RR = 1.25 (1.20 – 1.32)
Stratum specific RR’s:
.46 (.30-.70)
0.86 (.48-1.54)
1.05 (.94-1.16)
1.02 (.92-1.12)
0.96 (.87-1.05)
1.01 (.97-1.05)
Breslow-Day test rejects (p=.0023)