Transcript 2 +5

保健統計学第4回
「3群以上のデータ解析」
2007.05.11
前回の復習(1) ~データの種類と検定手法~
2群の検定
量的データ
・Welchのt検定(正規分布か?)
・Studentのt検定(等分散・正規分布か?)
これらは2標本がそれぞれ「正規分布」に従うものと仮定し
た手法→パラメトリック検定
質的データ(一般に「計数データ」と呼ばれます)
・Mann-Whitney検定(Wilcoxonの順位和検定)
これらは標本の分布にはよらない手法→ノンパラメトリック
検定
本日のテーマ ~3群以上の比較~
まずはデータの種類を確認(2群と同様)!
量的データ
・連続量 or 離散量?
・平均、最大・最小・中央値、分散(標準偏差)は?
・データの分布(グラフの形)は?
・比較しようと思う群の関係は?(独立 or 出所は同じ?)
質的データ?
・順位データ or 単なるカテゴリデータ?
・比較しようと思う群の関係は?(独立 or 出所は同じ?)
ここまでは全く2群の比較と同様でございます。
1-(1) 分散分析(1)
XA  XB
T  2
2
/
n

S A A S B / nB
XA:A群の平均値
XB:B群の平均値
SA:A群の標準偏差
SB:B群の標準偏差
nA:A群の例数
nB:B群の例数
これは「2群の平均値の比較を行う」t検定でしたが・・・3群以上
の場合はどうしましょうか?
とりあえず・・・?
T1 
XA  XB
S 2A / nA  S 2B / nB
T2 
X B  XC
S 2B / nB  S C2 / nC
T3 
XC  X A
S C2 / nC  S 2A / nA
の、全ての組み合わせでt検定してみましょうか・・・?
有意水準をα=5%とした場合、上記の組み合わせからは最大で15%、もし
も7群だったら21通りの組み合わせ・・・ほぼ100%(以上?)有意差が出てく
ることになりますけど・・・?
1-(2) 分散分析(2)
検定とは「偶然の発生する度合い」を考えるという行為であり、有意
水準5%とは、20回に1回は偶然が発生するということです。そして、
それは非常に稀なことであるから、そうなるという仮説自体が間違っ
ていたとすることでした。ですが・・・
3群以上の全ての組み合わせについて、有意水準5%で検定すると
いうことは、「5%×組み合わせ数」の偶然を発生させてしまうことに
なります。稀な事象でも回数が増加すれば発生しやすくなります
下手な鉄砲も数打ちゃ当たる・・・ってか?
このような行為を防ぐために、3群以上の平均値の比較
には分散分析(Analysis of Variance : ANOVA)を用い
るのです。
1-(3) 分散分析(3)
①問題意識:「A群とB群とC群には差があるのではないか?」
②検定統計量を求める(分散分析表の作成。分散比(F)を算出する)
③帰無仮説(H0):各群間に差がないのだから、分散比(F)≒1になるはず?
④帰無仮説から分散比(F)≒1となるのであれば、その(F)の値は十分に起こり
得るものなのか?(=単なる偶然ではないのか?)
⑤F分布表から、あらかじめ定めた有意水準(通常α=0.05)よりも大きければ、
帰無仮説(H0)を否定できない。逆に小さければ帰無仮説(H0)を否定し、対立
仮説(H1)を採択する。
では、実際に例題を解くことで原理を学びましょう。ここでの統計量は「分散比
(F)」であります!
1-(4) 分散分析(4)
分散分析表の見方(これを知らなければダメです!)
変動要因
群間変動
偏差平方和
k
S A   ni ( x i  x) 2
i 1
群内変動
k
SE  
i 1
総変動
ni
 (x  x )
j 1
ST=SA+SE
ii
j
2
自由度
分散
分散比
dfA=群数-1
(例えば、3群なら
3-1=2)
sA2=SA/dfA
F=sA2/sE2
dfE=全データ数群数(例えば、
n=15、3群なら
15-3=12)
sE2=SE/dfE
dfT=N-1
(もしくはdfA+dfE)
これだけでは辛い人・・・?ならば、次の例題を解いてみましょう!
1-(5) 分散分析(5)
例題:出産までの週数によって新生児を3群に分け、新生児期黄疸の強さを調べ
たところ、以下のようなデータになった。出産までの週数によって、黄疸の強さに差
があると言えるか?
週数
-36週まで
13
11
6
36-38週
11
10
7
7
5
38-40週
8
7
5
5
4
3
3
データ数
各群の平均値(xi)
分散(si2)
3
10
13
5
8
6
7
5
11/3
群間変動=SA=3×(10-7)2+5×(8-7)2+7×(5-7)2=60 *データ数×(群の平均-全体平均)2の和
群内平均=SE={(13-10)2+(11-10)2+(6-10)2}+{(11-8)2+(10-8)2+(7-8)2×2+(5-8)2}+{(8-5)2+
(7-5)2+(5-5)2×2+(4-5)2+(3-5)2×2}=72 *(各値-各群の平均値)2の和
変動要因
偏差平方和
自由度
分散
分散比
群間変動
60
3-1=2
60/2=30
30/6=5
群内変動
72
3+5+7-3=12
72/12=6
総変動
132
14
自由度12、α=0.05のときのF値は
3.89。分散比F=5>3.89となり、出
産までの週数と黄疸の強さは差
があると言える!
2-(1) Kruskal-Wallis検定(1)
分散分析はt検定同様、「厳密には」等分散の群同士に用いられるも
のですが、t検定同様標本が少数の場合は、等分散の検定が通りや
すくなります。ですが・・・
明らかに等分散とは思えない標本や、単なる順位データ」等の検定
には、どのように対応しましょうか?T検定に対応する、Wilcoxonの
ような存在はあるのでしょうか?
勿論あります。実際には分散分析以上に出番の多い検
定で、Kruskal-Wallis検定と呼ばれるものです。分散分
析が正規分布を前提としたパラメトリック検定であるなら
ば、当然ですがこちらはノンパラメトリック検定です。統計
量も予想通り、順位を基準としたものとなります。
2-(2) Kruskal-Wallis検定(2)
①問題意識:「A群とB群とC群には差があるのではないか?」
帰無仮説(H0): A群とB群とC群には差がない
対立仮説(H1): A群とB群とC群には差がある
②検定統計量を求める
12 k Ri2
H
 3(n  1)

n(n  1) i 1 ni
(詳細は省略しますが、上記の12/n(n+1)及び-3(n+1)に関しては、Hが近似的に自由
度k-1のχ2分布に従うので、χ2分布に近似させるための補正を行っている部分です。実
際に群間の偏りを示している部分は、ここだけです)
③Kluskal-Wallis検定表から、あらかじめ定めた有意水準(通常α=0.05)の値
Hαと検定統計量Hの値を比較する。H>Hαとなれば、 A群とB群とC群間には差
があるとする。
2-(3) Kruskal-Wallis検定(3)
例題:集団検診で肥満者14名を抜き出し、体重によって3群に分けて血中の中性
脂肪の濃度を調べた。各群間で中性脂肪濃度に差があると言えるか?
体重
データ数
80-90kg
192
256
166
122
202
5
90-100kg
164
248
264
270
230
5
100kg-
224
298
332
294
各群の平均値(xi)
分散(si2)
4
これも前回同様、順位と順位和で考えてみましょう
体重
順位
順位和
期待順位和
80-90kg
4
9
3
1
5
22
37.5
90-100kg
2
8
10
11
7
38
37.5
100kg-
6
13
14
12
45
30
実際の順位和と、期待
順位和の差に注目!
解答:
Kluskal-Wallis統計量 H=12/14(14+1)×{(22)2/5+(38)2/5+(45)2/4}3(14+1)=5.96。α=0.05のときHα=5.666<Hとなるので、各群間で差があるとい
える。
本日のまとめと次回予告
「パラメトリック検定」による3群以上の検定方法は分散分析
といいます。基本は計量データで、等分散性が認められると
きに用います。
「ノンパラメトリック検定」による3群以上の検定方法は、
Kluskal-Wallis検定といいます。分布によらず、順序性さえ
あればどのようなデータに用いることもできます。
検出力は決して分散分析より高くありませんが、サンプル数
が小さいときなど有効です。
次回は「生存時間解析」について学びましょう。Log-rank検
定、Kaplan-Meier曲線等々出て参ります。
誤植などはご遠慮なくこちらまで
[email protected]
実習の部
2006.05.12
EGを使って解析してみよう!
今日の予定
– 独立な2群の比較
Student の t検定
– 独立な2群の割合の比較
Fisherの正確検定
カイ2乗検定
– 3群以上の比較
分散分析
– 回帰分析
独立な2群の比較
独立な2群の比較の例
– ぜん息患者21名に対し、
Active群とPlacebo群にランダムに割付け、0週目と
6週目にFEV1を測定し、変化量を測定した.
– みたいもの
「Active群とPlacebo群で、 FEV1の変化量に差が
あるか?」
この例に対し、
EGを使って t 検定を実行しよう.
FEV1データを読み込む
[ファイル]
→[開く]
→FEV.sas
7bdat
◆確認◆
FEV.sas7bdatは、
・PATNO:患者ID
・TRTGRP:治療
(A or P)
・FEV0:0週目のFEV1
・FEV6:6週目のFEV1
・CHG:0週目と6週目の
FEV1変化量
PRINTで確認してみる
1.[分析]
→[リスト]
2.[リスト変数]に
TRTGRPとCHGをリストする
→[完了]
PRINTの結果
◆確認◆
SASでPRINT
PROCEDUREをやっ
ていることと同じ
まず、要約統計量を算出しよう
[分析]
→[記述統計
量]
→[要約統計
量]
◆変数
CHGを[分析変数]、
TRTGRPを[グループ変数]
にリスト
◆統計量
[小数点以下の桁数]を3にする
(ここで統計量を選択したりできる)
要約統計量のアウトプット
t 検定の実行
[分析]
→[分散分析]
→[ t 検定]
t 検定のアウトプット
要約統計量
t 検定の結果
等分散性の検定
の結果
以上の結果より、、、
t検定を行った結果、
– 帰無仮説「Active群とPlacebo群で、 FEV1変化
量に差がない」は棄却されず、
– Active群とPlacebo群で、 FEV1変化量に差があ
るとはいえなかった.
補足
EGでは、順位情報に基づくWilcoxon順位和
検定も実行することが可能.
EGでは、ある値と平均値の比較を行う1標本
の t 検定や、同じ人の前後の値を比較する
対応のある2群のt 検定も実行することが可
能.
独立な2群の割合の比較
独立な2群の割合の比較の例
– あるランダム化試験の結果より、
治療(薬剤1、薬剤2)と治癒(YES、NO)からなる
2×2表が得られた.
この例に対し、EGを用いて、
– カイ2乗検定
– Fisherの正確な検定
を実行しよう.
ADRデータを読み込む
[ファイル]
→[開く]
→ADR.sas7bdat
◆確認◆
このデータは、
・GRP:治療(1,2)
・RESP:反応(YES、NO)
・CNT:度数
からなる.
分割表の作成
1.[分析]
→[表分析]
2.表の定義
GRPとRESPを
右のプレビューに
リストする
3.変数
[度数変数]に
CNTをリストする
4.セル統計量
セルの度数のみ
チェックする
5.表に関する統計量
χ2乗検定のみチェックする
→[完了]
2×2表のアウトプット
ピアソンのΧ2乗検定のアウトプット
ピアソンのχ2乗
検定の結果
以上より、、、
「行と列は独立とはいえない」、
つまり、
「治療と治癒には関連がない
とはいえない」
ということとなった.
Fisherの正確な検定のアウトプット
Fisherの正確な
検定の結果
Fisherの正確な検定において
も、前頁と同様の結果が
得られ、
「治療と治癒には関連がない
とはいえない」
ということが示唆された.
多群の比較
多群の比較の例
– 全般性不安障害の患者52名に対する、
対照群を含めた3群のランダム化試験.
– 3群はPlacebo群、Low-Dose群、High-Dose群と
し、10週間追跡を行い、ハミルトンの評価尺度の
スコア(HAM-A test score)を測定.
– みたいもの
「3群でHAM-A test scoreに差があるか?」
この例に対し、
EGを使って、分散分析を実行しよう
GADデータを読み込もう
[ファイル]
→[開く]
→GAD.sas7bdat
◆確認◆
このデータは、
・PATNO:患者ID
・DOSEGRP:薬剤群(Placebo,
Low, High)
・HAMA: HAM-A test score
からなる
箱ひげ図を描いてみよう
1.[グラフ]
→[散布図]
2.グラフギャラリー
[2D散布図]をクリック
3.変数
X変数にDOSEGRPを、
Y変数にHAMAをリスト
→[完了]
箱ひげ図のアウトプット
分散分析の実行
1.[分析]
→[分散分析]
→[線形モデル]
2.変数
[従属変数]にHAMA、
[分類変数]にDOSEGRPを
リストする.
3.モデルのオプション
仮説検定はタイプ I のみ
チェックする
分散分析のアウトプット
用いたデータの情報
(水準の数、標本の大きさ)
分散分析表
モデルのあてはまり
に関する情報
主効果の検定
の結果
・以上の結果より、、、
「3群のうちどこかで差がある」
ということとなった.
多重比較
・「3群のどこかに差がある」ことが分かったが、どこの
群で差がみられるのだろうか?
・t検定を3回繰り返してはいけない.
・例として、Dunnettの多重比較を行う
1.Post-Hoc検定
[最小二乗]の[効果の追加]
をクリック
2.使用する効果の選択
DOSEGRPを右側にリストし、
[OK]
3.[多重比較]をクリックし、
[Dunnettの多重比較]
を選択する.
→[完了]