3_Analisis_Survival

Download Report

Transcript 3_Analisis_Survival

Metode Non-parametrik utk Data
Survival
• Untuk melihat ketahanan hidup dari sekumpulan individu yg
merupakan sampel acak dr populasi.
• Perluasan dari frekuensi relatif utk data tersensor.
Misal data waktu ketahanan kita buat menjadi k buah interval yakni
I1, ..., Ik.
(
0
I1
](
1
I2
]
(
2
j-1
Ij
Ik
]
(
j
k-1
]
k
(
0
I1
](
I2
1
]
(
2
i-1
Ii
Ik
]
(
i
k-1
]
k
ni = #bertahan hidup melewati awal interval Ii
di = #mati pada interval Ii
wi = #tersensor pada interval Ii
pi = P(bertahan melewati Ii | hidup pada awal Ii)
qi = 1  pi
S(k) = P(T > k)
pk  PT   k | T   k 1 
PT   k 

PT   k 1 
PT   k   PT   k 1  PT   k | T   k 1 
 PT  0 PT  1 | T  0 PT   2 | T  1 
 PT   k | T   k 1 
 1 p1  pk
Misal ada n individu dgn waktu ketahanan hidupnya t1, t2, tn dan ada
r individu yang mati, dimana r ≤ n. Waktu meninggalnya diurutkan
t1  t2    tr 
Misal nj = #individu yg masih hidup sesaat sebelum t(j) termasuk yg
meninggal pd t(j), j = 1,2,…,r
dj = #individu yg meninggal pd t(j)
P(mati pd [t(j)-, t(j)]) = dj/nj, dimana  lebar selang waktu yg kecil
P(bertahan melewati [t(j)-, t(j)]) = (nj -dj)/nj
Utk t(k) ≤ t < t(k+1), dimana k = 1,2,…, r, taksiran Kaplan-Meier
fungsi ketahanan
k 

nj  d j
ˆ

S t    
 n 
j 1 
j

dgn Sˆ t   1 utk t < t(1) dan t(r+1) = ∞
Contoh: Data ttg waktu sampai berhentinya pemakaian IUD dari
18 wanita (dlm minggu).
10
56+
13+
59
18+ 19 23+
75 93 97
30
36
38+
104+ 107 107+
54+
107+
Taksiran Kaplan-Meier dr fungsi Ketahanan
Time interval
Sˆ t 
nj
dj
(nj-dj)/nj
[0,10)
18
0
1.0000
1.0000
[10,19)
18
1
0.9444
0.9444
[19,30)
15
1
0.9333
0.8815
[30,36)
13
1
0.9231
0.8137
[36,59)
12
1
0.9167
0.7459
[59,75)
8
1
0.8750
0.6526
[75,93)
7
1
0.8571
0.5594
[93,97)
6
1
0.8333
0.4662
[97,107)
5
1
0.8000
0.3729
[107,∞)
3
1
0.6667
0.2486
Selang kepercayaan adalah suatu selang yang sedemikian
sehingga ada peluang tertentu bhw nilai fungsi ketahanan yg
sebenarnya terkandung dalam selang ini.
Dgn asumsi bahwa Sˆ t  berdistribusi N(S(t),var{Sˆ t  }), dimana
     n n
var Sˆ t   Sˆ t 
dj
2 k
j 1
j
j
dj
,
utk tk   t  tk 1
Selang kepercayaan 100(1-)% bagi S(t), utk t tertentu adalah
 
 
 Sˆ t   z
ˆ t  , Sˆ t   z
ˆ t  
var
S
var
S

 /2
 /2


data IUD;
input disctime status @@;
CARDS;
10 1 13 0 18 0 19 1 23 0 30 1 36 1 38 0 54 0
56 0 59 1 75 1 93 1 97 1 104 0 107 1 107 0 107 0
;
PROC LIFETEST plots=(s);
time disctime*status(0);
RUN;
disctime
0.000
10.000
13.000*
18.000*
19.000
23.000*
30.000
36.000
38.000*
54.000*
56.000*
59.000
75.000
93.000
97.000
104.000*
107.000
107.000*
107.000*
Survival
1.0000
0.9444
.
.
0.8815
.
0.8137
0.7459
.
.
.
0.6526
0.5594
0.4662
0.3729
.
0.2486
.
.
Failure
0
0.0556
.
.
0.1185
.
0.1863
0.2541
.
.
.
0.3474
0.4406
0.5338
0.6271
.
0.7514
.
.
Standard
Error
0
0.0540
.
.
0.0790
.
0.0978
0.1107
.
.
.
0.1303
0.1412
0.1452
0.1430
.
0.1392
.
.
Number
Failed
0
1
1
1
2
2
3
4
4
4
4
5
6
7
8
8
9
9
9
Number
Left
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
1. 00
0. 75
0. 50
0. 25
0. 00
0
20
40
60
d i s c t i me
80
100
120
disctime <- c(10,13,18,19,23,30,36,38,54,56,59,75,93,
97,104,107,107,107)
status <- c(1,0,0,1,0,1,1,0,0,0,1,1,1,1,0,1,0,0)
library(survival)
estS <- survfit(Surv(iud,status)~1,conf.type="plain")
plot(estS,conf.int=T,xlab="Discontinuation time (in
weeks)", ylab="Estimated survivor function")
time n.risk n.event survival std.err lower 95% CI upper 95% CI
10
18
1
0.944 0.0540
0.8386
1.000
19
15
1
0.881 0.0790
0.7267
1.000
30
13
1
0.814 0.0978
0.6220
1.000
36
12
1
0.746 0.1107
0.5290
0.963
59
8
1
0.653 0.1303
0.3972
0.908
75
7
1
0.559 0.1412
0.2827
0.836
93
6
1
0.466 0.1452
0.1816
0.751
97
5
1
0.373 0.1430
0.0927
0.653
107
3
1
0.249 0.1392
0.0000
0.522
0.8
0.6
0.4
0.2
0.0
Estimated survivor function
1.0
Taksiran Kaplan-Meier bagi fungsi Ketahanan
0
20
40
60
Discontinuation time (in weeks)
80
100
• Cara pertama utk menaksir fungsi kegagalan pada waktu t(j) :
kegagalan pada t j  
# gagal pada t j 
# yg berisiko pada t j 
dj
~
h t  j   
nj
• Taksiran kegagalan pd selang t(j) ≤ t < t(j+1) :
hˆ t j   
dj
n j t  j 1  t j  
adalah taksiran laju kegagalan per satuan waktu dlm selang [t(j),t(j+1)).
• Dengan H(t) = - log S(t), dan jika Sˆ t  adalah taksiran KM dr
fungsi kegagalan, maka Hˆ t    logSˆ t  adalah taksiran
kegagalan kumulatif sampai waktu t.
k
 nj  d j 
ˆ

H t    log
 n

j 1
j


 nj  d j
•Karena log
 n
j


~
d
   j , maka taksirannya H t  

nj

k
dj
n
j 1
j
yakni jumlah kumulatif dari taksiran peluang mati dari selang
pertama sampai selang ke-k, k = 1,2,…,r.
esth <- hazard.km(estS)
esth
par(mfrow=c(2,1))
plot(esth$time,esth$hitilde,type=“s”)
plot(esth$time,esth$hihat,type=“s”)
plot(esth$time,esth$Hhat,type="s”)
plot(esth$time,esth$Htilde,type="s”)
Function SPlus/R hazard.km dapat diperoleh dari:
http://www.mth.pdx.edu/~mara/TK.R.functions.R.txt
hˆt 
time
10
19
30
36
59
75
93
97
107
~
h t 
Hˆ t 
~
H t 
ni di hihat hitilde
Hhat se.Hhat Htilde se.Htilde
18 1 0.0062 0.0556 0.0572 0.0572 0.0556
0.0556
15 1 0.0061 0.0667 0.1262 0.0896 0.1222
0.0868
13 1 0.0128 0.0769 0.2062 0.1202 0.1991
0.1160
12 1 0.0036 0.0833 0.2932 0.1484 0.2825
0.1428
8 1 0.0078 0.1250 0.4267 0.1997 0.4075
0.1898
7 1 0.0079 0.1429 0.5809 0.2524 0.5503
0.2375
6 1 0.0417 0.1667 0.7632 0.3115 0.7170
0.2902
5 1 0.0200 0.2000 0.9864 0.3834 0.9170
0.3524
3 1
NA 0.3333 1.3918 0.5601 1.2503
0.4851
0.2
0.0
htilde
0.4
~
h t 
0
20
40
60
80
100
120
80
100
120
Discontinuation time
0.00 0.03
hhat
0.06
hˆt 
0
20
40
60
Discontinuation time
17
1.0
0.0
Hhat
Hˆ t 
0
20
40
60
80
100
120
80
100
120
Discontinuation time
1.0
0.0
Htilde
~
H t 
0
20
40
60
Discontinuation time