POWERプロシジャによる 症例数設計

Download Report

Transcript POWERプロシジャによる 症例数設計

POWERプロシジャによる
症例数設計
*
○ 浜田知久馬* ,安藤英一*
東京理科大学 工学部 経営工学科
1
内容
POWERプロシジャのコンセプト
POWERプロシジャの使用例
POWERプロシジャの機能
POWERプロシジャの症例数設計の例
最大対比法
生物学的同等性試験
生存時間解析
2
Richard Feynman (1918-1988)
物理学者
Scientific knowledge
is a body of statements
of varying degrees of uncertainty,
some mostly unsure,
some nearly sure,
none absolutely certain.
3
医学研究における科学的進展
4
What if situations
Castelloe, J.M. and O’Brien, R.G. (2001)
5
症例数設計を行う際に必要な条件
2群の平均値の差のt検定
a 検定の有意水準
( 通常は5% )
b 差を見逃す確率
( 通常は20% )
SD 個体間のばらつきの大きさ
D 予想される平均値の差
(デルタ) ( 生物学的に検出したい差 )
6
症例数設計の式
2 {za / 2  zb } SD
N
2
D
2
2
ex) a  0.05, b  0.20, SD  20, D  10
N  2{1.96  0.84}  20 10
 62.8
2
2
2
7
プログラム
2標本の平均値の
差の検定
proc power;
twosamplemeans test=diff
meandiff
=10 ←Δ
stddev
=20 ←SD
alpha
=0.05←α
power
=0.8 ←1-β
ntotal
= .;
8
POWERプロシジャの出力
Fixed Scenario Elements
Distribution
Method
Alpha
Mean Difference
Standard Deviation
Nominal Power
Number of Sides
Normal
Exact
0.05
10
20
0.8
2
Computed N Total
Actual
N
Power Total
0.801
128
9
What if situations
SD
22
Δ
8
10
12
pessimistic
10
20
20
optimistic
18
10
What if situations
proc power;
twosamplemeans test=diff
meandiff =8,10,12
stddev
=18,20,22
alpha
=0.05
power
=0.8
ntotal
= .;
11
必要な症例数
Computed N Total
Mean Std
Index Diff Dev
1
8
18
2
8
20
3
8
22
4
10
18
5
10
20
6
10
22
7
12
18
8
12
20
9
12
22
Actual
Power
0.803
0.804
0.801
0.801
0.801
0.800
0.808
0.804
0.802
N
Total
162
200
240
104
128
154
74
90
108
12
What if situations
SD
22
20
Δ
8
10
12
240
154
108
200
128
90
162
104
74
18
13
200症例数のときの検出力
proc power;
twosamplemeans test=diff
meandiff =8,10,12
stddev
=18,20,22
alpha
=0.05
power
=.
ntotal
=200;
14
200症例数のときの検出力
Computed Power
Mean
Std
Index Diff
Dev
1
8
18
2
8
20
3
8
22
4
10
18
5
10
20
6
10
22
7
12
18
8
12
20
9
12
22
Power
0.878
0.804
0.725
0.974
0.940
0.892
0.997
0.988
0.970
15
What if situations
SD
22
20
8
Δ
10
12
0.725 0.892 0.970
0.804 0.940 0.988
0.878 0.974 0.997
18
16
検出力曲線の作成
proc power;
twosamplemeans test=diff
meandiff =8,10,12
stddev
=18,20,22
alpha
=0.05
power
=.
ntotal
=200;
plot min=100 max=240;
17
18
POWERプロシジャの構文
PROC POWER;
MULTREG;
重回帰分析
ONECORR;
相関係数
ONESAMPLEFREQ;
一標本比率の検定
ONESAMPLEMEANS; 一標本平均値の検定
ONEWAYANOVA;
一元配置分散分析
PAIREDFREQ;
対応有りの比率の検定
PAIREDMEANS;
対応有りの平均値の検定
TWOSAMPLEFREQ;
二標本比率の検定
TWOSAMPLEMEANS;
二標本平均値の検定
TWOSAMPLESURVIVAL; 二標本生存時間の検定
19
Response
最大対比法による症例数設計
yij~ i.i.d N(mi,s2)
1
3
2
dose
4
20
海外の臨床試験の成績
20.6
25.2
20.9
2.9
P
L
M
H
Miyamoto et al.(2000)
Journal of Clinical Therapeutics & Medicines, 16,1143–1179.
21
C1 y1  C2 y 2  C3 y3  C4 y 4
対比(contrast)
対比統計量
k
C
Z 
i 1
i
yi
2
Ci s 2

ni
i 1
k
k
Ci : 対比の係数Ci  0
i 1
y i : i群の平均値
ni : i群のサンプルサイズ
 y
k

2
s2  s

i 1
ni
j 1
k
ij
 n
i 1
i

2
 yi
 1
22
最大対比法
a)linear
-3 -1 1 3
P
L
M
b) M-end
-5 -1 3 3
c) L-end
-3 1 1 1
H
23
最大対比法の症例数設計手順
1. 解析に用いる対比を決定し,棄却限界値
を求める( 西山(2004) )
2. 棄却限界値から有意水準を決める
3. 対立仮説の下で想定される用量反応関
係の検出力をPOWERプロシジャで算出
24
最大対比法の症例数設計手順
1. 直線的な用量反応関係 -3 -1 1 3
中用量で飽和
-5 -1 3 3
低用量で飽和
-3 1 1 1
棄却限界値:2.203(片側2.5%)
2. 1-probnorm(2.203)=0.013797
3. P
L
M H
2.9 20.6 25.2 20.9
2.9 20.6 25.2 25.2
25
西山のプログラム
PROC IML;
Alpha = 0.025;VARIANCE=1 ;
Contrast = {-3 -1 1 3,
-5 -1 3 3,
-3 1 1 1} ;
Expect = {0 0 0 0} ;
N1 = 1000; N_ALLOC = {1 1 1 1 } ;
Switch=1;
Eps1=0.0001; ABSEPS=0.0001;
RUN ESTPOWER(Switch,Alpha,N1,Eps1,ABSEPS,Expect,
VARIANCE,CONTRAST,N_ALLOC,N,Power,CriVal);
CRIVAL
2.20312
26
最大対比法の症例数設計
proc power;
onewayanova
groupmeans = 2.9 | 20.6 | 25.2 | 20.9,25.2
sides =1
stddev =47.6
alpha =0.013797
ntotal =.
power =0.80
contrast = (-3 -1 1 3) (-5 -1 3 3) (-3 1 1 1);
27
最大対比法の症例数設計
1群 123例
Computed N Total
Index
1
2
3
4
5
6
-Contrast-3 -1 1 3
-3 -1 1 3
-5 -1 3 3
-5 -1 3 3
-3 1 1 1
-3 1 1 1
---Means-------2.9 20.6 25.2 20.9
2.9 20.6 25.2 25.2
2.9 20.6 25.2 20.9
2.9 20.6 25.2 25.2
2.9 20.6 25.2 20.9
2.9 20.6 25.2 25.2
Actual
N
Power Total
0.800 492
0.801 332
0.803 352
0.805 280
0.803 304
0.803 264
1群 66例
28
-3 1 1 1
-3 -1 1 3
29
不均等割付1
proc power;
onewayanova
groupmeans = 2.9 | 20.6 | 25.2 | 20.9,25.2
groupweights = (1 2 2 2)
sides =1
stddev =47.6
alpha =0.014424
ntotal =.
power =0.80
contrast = (-3 -1 1 3) (-5 -1 3 3) (-3 1 1 1);
30
不均等割付1
Computed N Total
Actual
N
Index -Contrast- -------Means------ Power Total
1 -3 -1 1 3 2.9 20.6 25.2 20.9 0.805
623
2 -3 -1 1 3 2.9 20.6 25.2 25.2 0.805
420
3 -5 -1 3 3 2.9 20.6 25.2 20.9 0.802
476
4 -5 -1 3 3 2.9 20.6 25.2 25.2 0.804
378
5 -3 1 1 1
2.9 20.6 25.2 20.9 0.805
462
6 -3 1 1 1
2.9 20.6 25.2 25.2 0.804
399
66×4=264
57 104 104 104
31
不均等割付1
proc power;
onewayanova
groupmeans = 2.9 | 20.6 | 25.2 | 20.9,25.2
groupweights = (3 1 1 1)
sides =1
stddev =47.6
alpha = 0.014297
ntotal =.
power =0.80
contrast = (-3 -1 1 3) (-5 -1 3 3) (-3 1 1 1);
32
不均等割付2
Computed N Total
Actual
N
Index -Contrast- -------Means------ Power Total
1 -3 -1 1 3 2.9 20.6 25.2 20.9 0.805
516
2 -3 -1 1 3 2.9 20.6 25.2 25.2 0.805
348
3 -5 -1 3 3 2.9 20.6 25.2 20.9 0.802
324
4 -5 -1 3 3 2.9 20.6 25.2 25.2 0.804
258
5 -3 1 1 1
2.9 20.6 25.2 20.9 0.805
228
6 -3 1 1 1
2.9 20.6 25.2 25.2 0.804
198
66×4=264
99 33 33 33
33
生物学的同等性試験の
症例数設計
標準製剤
A 標準製剤 → 試験製剤
B 試験製剤 → 標準製剤
血
中
濃
度
試験製剤
時間
34
後発医薬品の生物学的同等性
試験ガイドライン
1.AUCとCmaxをパラメータ
2.対数変換して解析
3.90%信頼区間で評価, あるいは有意水準5%
の2つの片側検定(two one-sided tests)で評価
4.試験製剤と標準製剤の対数値の平均値の差
の90%信頼区間が、log(0.8)~log(1.25)の範
囲にあるとき,同等と判定
35
症例数設計
予備試験の結果に基づいて
1)対数変換後の平均値の差
(幾何平均の比)
2)対数変換後の個人内SD
(生データの変動係数)
同等という結論が得られる確率がある値
以上となる例数
36
変動係数の算出
V:対数変換後の個人内分散
CV:生データの変動係数(SD/平均)
V  log(CV  1) ≒CV
2
2
CV  e 1
v
V ≒CV
37
同等性の検証
proc power;
pairedmeans test=equiv_ratio dist=lognormal
meanratio = 1.05127
幾何平均の比
alpha
= 0.05
対数変換後の個人内分散
cv
= 0.17451
(変動係数)
corr
= 0
lower
= 0.8
upper
= 1.25
npairs
= 2 to 100 by 1
power
=. ;
plot min=2 max=100 ;
38
15
39
同等性検証のために必要なN
proc power;
pairedmeans test=equiv_ratio dist=lognormal
meanratio = 1,1.05,1.10
alpha
= 0.05
cv
= 0.10,0.20,0.30
corr
= 0
lower
= 0.8
upper
= 1.25
npairs
= .
power
= 0.8 ;
plot min=0.2 max=0.9;
40
比
CV
1.1 0.3
1.0 0.1
41
生存時間の症例数設計
生
存
率
時間
42
例題
生存時間解析の症例数設計
α=0.05(両側)
β=0.20
手術単独群(cont)の5年生存率
:0.65
補助化学療法群(drug)の5年生存率:0.80
43
FreedmanとSchoenfeld
Freedman
{za  zb } ( HR  1)
d
2( HR  1) 2
2
Schoenfeld
2
{za  z b }2  2
d
(log( HR))2
d :1群当たりに必要な死亡数
HR(HazardRatio)  2 1 : 2群のハザード比
d
2d
N

2群を併せたイベントの 割合 2  1   2
1 : 群1の最終時点の生存率 ,  2 : 群2の最終時点の生存率
1  1  1   2 2  1   2
2群を併せたイベントの 割合 
2

2
44
ハザード比の見積もり
1. 指数分布を前提に時点tでの 2群の生存率
log S2 (t )
S(t)から
HR 
logS 1(t )
2. メディアン生存時間(M)に基づいて
 M1
HR  
 M2

 : 指数分布 HR   M 1
M

 2


 :ワイブル分布

3. 人年法によるハザードの推定
総イベント数
ハザード 
総観察時間
45
指数分布の生存関数とハザード関数
h(t )  , S (t )  exp(t )
t , S (t )     log S (t ) / t
 log S (5)
S (5)  exp( 5)   
5
 log(0.65)
cont : hc 
 0.0862
5
 log(0.80)
drug : hd 
 0.0446
5
46
試験期間を5年,Sc(5)=0.65, Sd(5)=0.80,
α=0.05,β=0.20の必要例数
1. 各群のハザードの計算
2. ハザード比の計算
hd log Sd (t ) 0.0446
HR  

 0.52
hc log Sc (t ) 0.0862
3. Zα=1.96, Zβ=0.84
4. サンプルサイズNの計算
( za  zb ) 2 ( HR  1)2 (1.96  0.84)2 (0.52  1) 2
d

 38.9
2
2
2( HR 1)
2(0.52 1)
d 2
38.9  2
N

 141.5
2  1   2 2  0.80  0.65
47
SASのプログラム 症例数
data samplesize;
alpha=0.05;beta=0.20;
t=5;pc=0.65;pd=0.80;
h2=-log(pd)/t;h1=-log(pc)/t;hr=h2/h1;
za=probit(1-alpha/2);zb=probit(1-beta);
ef=(za+zb)**2*(hr+1)**2/(2*(hr-1)**2);
nf=2*ef/(2-pd-pc);
es=2*(za+zb)**2/((log(hr))**2);
ns=2*es/(2-pd-pc);
48
実行結果 症例数
T PC PD
H2
H1
ALPHA BETA
5 0.65 0.8 0.044629 0.086157 0.05 0.2
HR
ZA
ZB EF
NF
ES NS
0.518 1.96 0.84 38.9 141.5 36.3 131.9
NF:Freedman公式
NS:Schoenfeld公式
*割合の差で例数設計を行うとN=151
49
プログラム例
proc power;
twosamplesurvival test=logrank
curve("Control") = (5):(0.65)
curve("Treatment") = (5):(0.80)
groupsurvival =
"Control" | "Treatment"
accrualtime = 0.001
followuptime =5
npergroup =.
power =0.80;
50
Fixed Scenario Elements
Method
normal approximation
Accrual Time
Follow-up Time
Nominal Power
Number of Sides
Number of Time Sub-Intervals
Group 1 Loss Exponential Hazard
Group 2 Loss Exponential Hazard
Alpha
Computed N Per Group
Actual Power N Per Group
0.802
138
Lakatos
0.001
5
0.8
2
12
0
0
0.05
142:Freedman
132:Schoenfeld
51
生存関数の指定方法
CURVE=
GROUPMEDSURVTIMES=
GROUPSURVEXPHAZARDS=
GROUPSURVIVAL=
HAZARDRATIO=
REFSURVEXPHAZARD=
REFSURVIVAL=
各時点の生存率
メディアンの指定
ハザードの指定
2つの群名の指定
ハザード比の指定
比較ハザードの指定
比較群の指定
TEST=LOGRANK (ログランク検定)
TEST=TARONWARE(タローン・ウエア検定)
TEST=GEHAN(一般化ウイルコクソン検定)
52
CURVE=オプション
生存率の指定方法
CURVE("label")=points
0.9
0.7
0.6
=1:0.9 2:0.7 3:0.6
=(1 to 3 by 1):(0.9 0.7 0.6)
=1:0.9 2:0.8
(3 to 6 by 1):(0.7 0.65 0.6 0.55)
0.7
0.55
53
ハザードによる例数設計
proc power;
twosamplesurvival test=logrank
groupsurvexphazards=(0.0862 0.0446)
accrualtime = 0.001
followuptime =5
npergroup =.
power =0.50 to 0.90 by 0.05;
plot ;
54
ハザードとハザード比による例数設計
proc power;
twosamplesurvival test=logrank
refsurvexphazard=0.0862
hazardratio=0.52
accrualtime = 0.001
followuptime =5
npergroup =.
power =0.50 to 0.90 by 0.05;
plot ;
55
メディアンによる症例数設計
proc power;
twosamplesurvival test=logrank
groupmedsurvtimes=(8.0 15.5)
accrualtime = 0.001
followuptime =5
npergroup =.
power =0.50 to 0.90 by 0.05;
plot ;
56
生存時間解析の症例数設計で
影響を与える要因
①
②
③
④
⑤
ハザード
登録期間,登録パターン
フォローアップ期間
症例の脱落
症例の追加
57
登録期間を考慮した検出力の評価
累積発症率
登録期間R年
フォローアップ期間T年
1-S(T+R)
1-S(T+Δ)
1-S(T)
Δ
生存率
累積登録
一様分布
人数
指数分布
時間
時間
58
登録期間の考慮
proc power;
twosamplesurvival test=logrank
curve("Control")
= (5):(0.65)
curve("Treatment") = (5):(0.80)
groupsurvival =
"Control" | "Treatment"
accrualtime = 0.001,1 to 3
followuptime =5
npergroup =138
power =.;
plot min=100 max=200;
59
R
F
F
60
途中脱落の考慮
proc power;
twosamplesurvival test=logrank
curve("Control")
= (5):(0.65)
curve("Treatment") = (5):(0.80)
groupsurvival = "Control" | "Treatment"
grouplossexphazards=0 0.05|0 0.05
accrualtime =0.001
followuptime =5
npergroup =138
power =.;
plot min=100 max=200;
61
62
ISEL=IRESSA Survival
Evaluation in Lung cancer)
I.
イレッサ(250mg/日)vsプラセボ(偽薬)
比較第Ⅲ相臨床試験
標準化学療法が効かなくなった非小細胞肺がん
患者への第2次または第3次治療
II. 試験期間:2003.7.15~2004.8.2
III. 対象患者:1692例
(1129例:イレッサ、563例プラセボ),
210施設, 28カ国(日本は除く)
IV. 主要評価項目:生存時間
63
http://www.astrazeneca.co.jp/activity/press/04_12_20.html
64
65
指数分布
proc power;
twosamplesurvival test=logrank
curve("Control")
= (12):(0.20)
curve("Treatment") = (12):(0.25)
groupsurvival = "Control" | "Treatment"
groupweights=1|2
accrualtime = 0.001
followuptime = 11.999
ntotal=.
power =.80;
plot min=0.20 max=0.90;
66
ISEL試験の対象患者:1692例
2022
67
68
区分指数モデル
proc power;
twosamplesurvival test=logrank
curve("Control") = (4 7 12):(.6 .40 .20)
curve("Treatment")= (4 7 12):(.6 .425 .25)
groupsurvival = "Control" | "Treatment"
groupweights=1|2
accrualtime = 0.001
followuptime = 11.999
ntotal=.
power =.80;
69
ISEL試験の対象患者:1692例
4524
70
抗潰瘍薬の臨床試験
エンドポイント: 内視鏡による潰瘍の治癒時間
非治癒率
プラセボ
新薬
差
4週
0.9
0.7
0.2
8週
0.7
0.55
0.15
12週
0.5
0.4
0.10
プライマリーな解析:一般化ウイルコクソン
症例数設計は?
1
プラセボ
非
治
癒
率
新薬
時間
71
各検定の重みのイメージ
一般化ウイルコクソン(ni)
ログランク(1)
重
み
Tarone-Ware( ni )
時間
72
一般化ウイルコクソン検定の例数設計
proc power;
twosamplesurvival test=gehan
curve("Control")
= (4 8 12):(0.9 0.7 0.5)
curve("Treatment") = (4 8 12):(0.7 0.55 0.4)
groupsurvival = "Control" | "Treatment"
accrualtime = 0.001
followuptime = 11.999
npergroup=100 to 200 by 10
power =.;
plot;
73
132
158
200
74
症例数設計のソフトウエアの機能比較
SASV8
SASV9
Nquery5
UnifyP
一標本t検定
○
●
○
○
○
対応あるt検定
○
●
○
○
○
二標本t検定
○
●
○
○
○
●
○
●
○
○
○
カイ2乗検定
●
○
○
○
McNemars検定
●
○
○
方法
StatXact
Sampsize
検定ベース
Welch検定
一標本2項検定
○
CMH検定
○
CA検定
○
○
○
○
●
○
○
二元配置分散分析
●
○
○
多元配置分散分析
●
○
○
経時測定分散分析
●
○
○
単回帰分析
●
○
○
重回帰分析
●
○
○
一元配置分散分析
○
○
75
症例数設計のソフトウエアの機能比較
SASV9
Nquery5
ログランク検定
●
○
一般化ウイルコクソン検定
●
Tarone-Ware検定
●
方法
SASV8
UnifyP
StatXact
Sampsize
同等性検証
一標本(計量値)
○
●
○
○
二標本(計量値)
○
●
○
○
一標本(2値)
○
●
○
○
二標本(2値)
○
●
○
○
一標本(計量値)
○
●
○
○
二標本(計量値)
○
●
○
○
一標本(2値割合)
○
●
○
○
二標本(2値割合)
○
●
○
○
対応なし(オッズ比)
○
○
対応あり(オッズ比)
○
○
○
○
○
信頼区間
76
終わりに
1. SASの症例数設計の機能は,Nqueryと
並んで最強力
2. What if situationsのコンセプトの下,
様々な条件の組み合わせで症例数設計
が可能
3. In conclusion
PPTファイルは
http://www.rs.kagu.tus.ac.jp/hamada/gakkai.html
からダウンロードできます.
77