Transcript 下載 - 義守大學
存活分析與臨床應用 義守大學財金系教授 許碧峰 電話:6577711-5717 e-mail:[email protected] 講次大綱 存活函數、危險函數、累積危險函數 存活分析之非參數法- Kaplan-Meier survival curve 存活分析之半參數法- Cox proportional hazard model 存活分析之參數法-假設事件發生前時間的分配符合某一 特定類型,如Weibull分配,指數分配,Loglogist分配, Lognormal分配, Gamma分配等 2 何謂存活分析? 分析事件發生前的”期間”之統計方法 (the length of time until an event occurs) e.x.結婚發生前的 e.x.出院發生前的 時間長度 時間長度 事件發生前 的時間長度 e.x.倒閉發生前的 e.x.復發發生前的 時間長度 時間長度 3 檢定”期間”的差異或影響因素 檢定期間的 差異 •不同學歷在結婚前的時間長度 •不同醫院在出院前的時間長度 •不同處置在復發前的時間長度 •不同產業在倒閉前的時間長度 估計期間的 影響因素 •影響結婚前時間長度的因素 •影響出院前時間長度的因素 •影響復發前時間長度的因素 •影響倒閉前時間長度的因素 4 存活分析中的幾個函數:都可由S(t)函數轉換 • S(t) = 1 − F(t) = Pr(T > t) 存活函數:至少 可以存活至t時 點的機率(至t時點 尚未發生該事件的 機率) 危險函數:至少可以存活 至t時點的前提下,t時點 瞬間發生死亡的機率 累積危險 函數:危 險函數t 時點以下 累加機率 6 Kaplan-Meier Survival Curve Time tj # of risk set nj # of death dj # of censored dj 0 Cj 1 Pr(T>t) S(t) [0,3) 10 [3,5) 9 1 1 S(3)=1*8/9=0.89 [5,7) 7 2 1 S(5)=1*8/9*5/7=0.64 [7,8) 4 2 2 S(7)=1*8/9*5/7*2/4=0.32 KM formula (1958)→ S (t ) S(0)=1 t j t n j d n j j 7 Kaplan-Meier Survival Curve: S(t) 1.00 Kaplan-Meier survival estimates, by drug 0.00 0.25 0.50 0.75 以下累加機率為 0.5發生的時間點 0 10 20 analysis time drug = 0 30 40 drug = 1 中位數存活時間(無用藥)=8個月 中位數存活時間(用藥)=28個月 8 以下累積危險函數 H(t)=-lnS(t) 0.00 0.25 0.50 0.75 1.00 Kaplan-Meier failure estimates, by drug 0 10 20 analysis time drug = 0 30 40 drug = 1 存活期間≤t的以下累加機率 F(t) = Pr(T ≤ t)=1-S(t) 9 危險函數 h(t)=-S’(t)/S(t) 0 .05 .1 .15 Smoothed hazard estimates, by drug 0 10 20 analysis time drug = 0 30 40 drug = 1 危險函數:以存活至時點t的前提下,瞬間發生死亡的機率 h(t)=-S’(t)/S(t) 10 以下累積危險函數 H(t)=-lnS(t) 0.00 1.00 2.00 3.00 4.00 Nelson-Aalen cumulative hazard estimates, by drug 0 10 20 analysis time drug = 0 30 40 drug = 1 累積危險函數:危險函數t時點以下累加機率 H(t)=-lnS(t) 11 存活曲線在癌症病例之應用 定義事件=1 Overall survival Disease free survival t(月) 轉移,復發或死亡=1,反之=0 t(月) 死亡=1, 反之=0 27 0 (alive) 27 0 (alive) 41 0 (alive) 41 0 (alive) 27 0 (alive) 25 1 (復發) 40 1 (死亡) 37 1 (轉移) 8 1 (死亡) 5 1 (轉移) 15 1 (死亡) 12 1 (轉移) 9 1 (死亡) 9 1 (死亡) 37 0 (alive) 37 0 (alive) 12 0.00 0.25 0.50 0.75 1.00 癌症病患之Kaplan-Meier Survival Curve overall survival 0 10 20 30 40 Time (months) disease free survival 50 60 Figure 4 中位數存活時間(disease free survival )=38個月 50%的病患無轉移、復發、死亡的存活期為38個月13 Log-Rank test: 檢定存活曲線間是否有差異 0.00 0.25 0.50 0.75 1.00 Kaplan-Meier survival estimates, by drug 0 10 20 analysis time drug = 0 30 drug = 1 40 • Log-rank test 2 = (1 ) 28 . 27 (p值<0.001) 所以具顯著差異 Note: • 存活曲線不可相交 • 可檢定多條存活曲線 14 哪些因素將影響事件發生的危險率: COX比例危險模型 冠狀動脈繞道手術病患死亡危險率之影響因素 醫師年手術 醫院型態 Carlson 共併症指數 量 住院 天數 死亡 年齡 處置方式 3 1 79 OP3615 5 45 0 20 0 56 OP3614 2 102 1 22 0 60 OP3612 3 88 1 18 0 45 OP3612 1 102 1 16 0 62 OP3613 1 88 1 2 1 77 OP3614 5 38 0 5 1 68 OP8856 4 38 0 15 COX比例危險模型 設有n名病人(i=1,2,…,n),第i名病人的生存時間為ti, xi1 ,xi2 , xi3, …, xip等解釋變數將影響事件發生的危險率: 將t時點發生事件的危險率表示成如下三種型式: ln h(t,X) ln h0 (t ) ( 1 X 1 2 X 2 h(t,X) h0 (t ) exp( 1 X 1 2 X 2 ln h(t,X) h0 (t ) 1 X 1 2 X 2 pX p) pX p) pX p Cox比例危險模型 因H (t)無任何限定函數型式-半參數模型 0 h ( t ) h0 ( t ) exp( 1 X 1 2 X 2 k X k ) 被解釋變數為任何時點t瞬間發生事件的危險率。 h 0 ( t ):時間點t時的基本危險函數(baseline hazard function), 表示當解釋變數均為0時的事件機率。 多增加一單位X將使事件的發生增加 exp( ) 倍,若 exp( ) <1則危險率下降。 17 COX比例危險模型估計結果 冠狀動脈繞道手術病患死亡危險率之影響因素 係數(b) exp(b) z値 P值 0.031 ** 1.032 (10.89) <0.001 -0.193 ** 0.825 -(6.00) <0.001 冠狀動脈繞道一條(3611) 0.541 ** 1.718 (3.20) 0.001 冠狀動脈繞道三條(3613) 0.265 ------ (1.63) 0.102 內乳動脈繞道手術 -0.783 ** 0.457 -(11.70) <0.001 主動脈內氣球幫浦 0.060 ** 1.060 (20.02) <0.001 瓣環成形術 0.982 ** 2.669 (7.13) <0.001 AIC 23528 樣本數 19908 年齡 ln(手術量) 18 COX比例危險模型估計結果 19 COX比例危險模型 .03 .02 0 .01 hazard .04 .05 病2發生死亡的危險率是病1的五倍 0 50 100 150 analy sis time Patient 1 Patient 2 200 COX比例危險模型之假設 Cox假設: 各變 數 對危 險 率 之影響不隨時間 而改變(在任何時 間點都是一樣的) 21 COX比例危險模型 治療組與安慰劑病患發生的死亡危險率在任何時間下並非固定比例 COX比例危險模型之估計 部分概似函數(partial likelihood function,Lp) d (非 删 失 时 点 数 ) Lp h0 ( t i ) e x p ( 1 X d (非 删 失 时 点 数 ) qi i 1 i 1 i1 h0 ( t i ) e x p ( 1 X j1 p X p ip X ) jp ) j Ri d (非 删 失 时 点 数 ) i 1 exp( 1 X i1 exp( 1 X j1 p X p ip X ) jp ) j Ri 分母:j∈Ri表示在ti時點未發生該事件所有樣本危險率和 (包括設限樣本) 分子在ti時點發生該事件樣本的危險率 COX比例危險模型之估計 d (非 删 失 时 点 数 ) Lp h 0 ( t i ) ex p ( 1 X i 1 d (非 删 失 时 点 数 ) qi i 1 i 1 h 0 ( t i ) ex p ( 1 X j1 p X ip ) pX j Ri d (非 删 失 时 点 数 ) ex p ( 1 X i 1 i 1 ex p ( 1 X j1 p X ip ) pX jp ) j Ri n 为 了 计 算 机 计 算 , Lp i 1 ex p ( 1 X i 1 p X ip ) e x p ( 1 X j 1 p X jp ) j Ri 1 其 中 i= 0 第 i个 体 死 亡 第 i个 体 删 失 i jp ) 病人 是否 性别 生存 發生死 處理 (男=1) 天数 亡=1) 危險函數 (因人而異) h(t)=h0(t) e Name x1 x2 t d 病一 1 1 18 1 h0(t) e 病二 0 0 48 1 h0(t) 病三 0 1 70 0 h0(t) e b2 h0(t) e b1 病四 1 0 90 1 條件死亡危險率 q i hi ( t ) h j ( t ) , (第 i 个死亡時點) 部分概似函數 ( 條件死亡危險率 連乘) L p q1q 2 q k , 危險率(每個時點) b1 x 1 b 2 x 2 18 天 b1 b2 48 天 h0(18) e q i: e e Lp b1 b 2 e b1 b2 h0(18) e 0 h0(48) e 0 h0(18) e b2 h0(48) e b2 h0(18) e b1 h0(48) e b1 b1 b 2 e e 0 e b1 b2 90天 b2 e b1 e e e b2 b1 h0(90) e 1 , e e 0 b1 b2 0 + b2 e b1 1 e e e 0 b2 b1 b1 , e b1 e b1 e b1 e b1 COX比例危險模型之估計 对数偏似然函数 d ( x 1 i1 i 1 令 d l( ) d l( ) ln L p d p x ip ) i 1 ln ( 1 x j 1 j Ri 0, 求 解 回 归 参 数 。 ( 求 解 方 法 类 似 Logistic 回 归 ) p x jp ) 當模型不符合COX比例危險模型之假設 27 參數存活模型-指數分配 a. Exponential Distribution The probability density function f (t ) dS ( t ) dt e t 0 , t 0, , t 0 The survivorship function S(t) e -t ,t 0 The hazard function h (t ) ,t 0 0 參數存活模型-Weibull分配 b. Weibull Distribution The probability density function 1 ( t ) dS ( t ) ( t ) e f (t ) dt 0 , t 0, , 0 , t0 The survivorship function S(t) e -( t) ,t 0 The hazard function h ( t ) ( ) 1 ,t 0 參數存活模型-Lognormal 分配 c. Lognormal Distribution The probability density function f (t ) dS ( t ) dt 1 1 exp[ t 2 π 2 0 (ln t ) ] 2 2 , t 0, 0 , t0 The survivorship function S (t ) 1 2π t 1 exp[ x 1 2 (ln x ) ]dx 2 2 The hazard function h (t ) (1 t 2 π ) exp[ (ln at ) 1 G ( ln at ) 2 2 2 ] 參數存活模型-Gamma分配 d. Gamma Distribution The probability density function -1 t ( t ) e dS ( t ) f (t ) ( ) dt 0 , t 0, 0, 0 , t 0 The survivorship function S (t ) t ( ) ( x ) -1 e x dx , t 0, The hazard function h (t ) t -1 t ( t) e ( ) -1 x ( x ) e dx ( ) 0, 0 參數存活模型-log-logistic分配 e. Log-Logistic Distribution The probability density function t 1 dS ( t ) f (t ) (1 t ) 2 dt 0 , t 0, 0, , t 0 The survivorship function S(t) 1 1 t , t 0, 0, 0 The hazard function h (t ) t 1 1 t , t 0, 0, 0 0 參數存活模型之估計-概似函數 概似函數可寫為: ln L uncensored ln S ( t ) ln f ( t ) observatio ns censored observatio ns 因f(t)=h(t)S(t) ln L uncensored observatio ns ln S ( t ) ln h ( t ) all observatio ns 謝謝聆聽!