Transcript 疫学初級統計応用
疫学初級者研修
~精度 と バイアス~
平成12年2月15日(火)
13:00~
岡山理科大学情報処理センター
①推定と検定(復習)
②精度
③バイアス
①推定と検定
(昨日の復習)
2×2表
(疾病の有無)
有症
(
曝 食べた
露
の
有
食べない
無
)
健康
a
b
c
d
①推定と検定
推定:ある数値を定量的に
推測すること
検定:ある仮説の正しさを
検証すること
推定の例:
オッズ比を求める
検定の例:
χ 検定 , t 検定
2
推定・検定の違い
・推定では、信頼区間によって
影響の大きさと、その推定に
固有のばらつきを評価できる。
・検定では、データと帰無仮説の
整合性をチェックする。
※オッズ比とχ2値の違い
有症 健康
食べた
7 2
食べない
1 3
8 5
オッズ比=10.5
χ2=3.26(P=0.07)
9
4
13
有症 健康
食べた
42 12
食べない
6 18
48 30
54
24
78
オッズ比=10.5
χ2=19.55(P=0.0000098)
※精度とバイアス
精度とバイアス
正確度 = 精度
誤差
+
妥当性
=偶然誤差 + 系統的な誤差
(バイアス)
:的
:射撃の跡
妥当性
ライフル銃の
銃身が正しい
精
度
狙優
撃秀
手な
狙普
撃通
手の
銃身が右に
ずれている
誤差=偶然誤差+系統的な誤差
偶然誤差:必然的に起こる誤差
・調査対象者の記憶の不確かさなどによるもの
・通常は分析に重要な影響は与えない
系統的な誤差(バイアス)
:調査する側、調査される側の意図により
生じる誤差
・一方的な思いこみなどにより生じる
・分析に重要な影響を与えることがある
②精度
有症 健康 計
有症 健康 計
食べた
食べない
計
157
42
199
19
20
39
176
62
238
オッズ比=3.93
95%信頼区間:
95%信頼区間:
1.82<OR<8.54
1.82<OR<8.54
χ2値=15.41
P値=0.00008
食べた
食べない
計
40
10
50
5
5
10
45
15
60
オッズ比=4.00
95%信頼区間:
0.79<OR<20.73
χ2値=4.00
P値=0.045
オッズ比=3.93
95%信頼区間:
95%信頼区間:
1.82<OR<8.54
1.82<OR<8.54
χ2値=15.41
P値=0.00008
オッズ比=4.00
95%信頼区間:
0.79<OR<20.73
χ2値=4.00
P値=0.045
オッズ比:ほとんど変わらない。
信頼区間:幅が広がり、1をはさんでしまった。
データ数が減ったことで、ばらつきが大きくなった
↓
「精度」が悪くなった
データ数が少ないとき
「はっきりと」言うことは難しい。
断定することはできない。
それは、「精度」が悪いため。
精度
オッズ比
データ数
が多い
データ数
が少ない
信頼区間の幅
狭い
ほぼ
変わらない
広い
精度
χ2 値
P値
データ数
が多い
大きい
小さい
データ数
が少ない
小さい
大きい
精度
オッズ比 信頼区間 χ2
データ
多
データ
少
値
P値
精度
狭い
大きい
小さい
よい
広い
小さい
大きい
悪い
ほぼ
変わら
ない
③バイアス
誤差=偶然誤差+系統的な誤差
偶然誤差:必然的に起こる誤差
・調査対象者の記憶の不確かさなどによるもの
・通常は分析に重要な影響は与えない
系統的な誤差(バイアス)
:調査する側、調査される側の意図により
生じる誤差
・一方的な思いこみなどにより生じる
・分析に重要な影響を与えることがある
バイアス=系統的な誤差、偏り
ある一定の方向性をもっている誤差
この偏り(例:発症している人を
意図的に「食べた」と見なすなど)が
分析結果に影響を及ぼすことがある
バイアスの例 その1
「自己選択バイアス」
食中毒の報道がされた後に、
「自分もその店を利用し、調子が悪い」
などの電話が増える事例
有症 健康 計
食べた
21 6 27
食べない 3 18 21
計
24 24 48
その情報を鵜呑みにすると
「食べた」「有症」の人のみが
増えて
(2×2表のaの数値が増え)
オッズ比が高くなる
バイアスの例 その2
情報バイアス①(「質問者バイアス」)
原因物質が「腸炎ビブリオ」で
メニューに刺身が入っている場合
有症者に対して「刺身は食べましたね?」
と質問し関連づけようとしてしまう事例
有症 健康 計
食べた
21 6 27
食べない 3 18 21
計
24 24 48
有症者であれば「食べた」、
健康であれば「食べていな
い」、
と見なしがちになり、
2×2表のa、dの数値が増
え)オッズ比が高くなる
バイアスの例 その3
情報バイアス ②
実際には食べていなかったが記憶していない
ため「食べた」としたり、食べたのに「食べなかっ
た」とする場合
有症 健康 計
食べた
21 6 27
食べない 3 18 21
計
24 24 48
食べていないのに「食べた」
→a,bが増える
食べたのに「食べていない」
→c、dが増える
これらが混ざると
結局オッズ比は低くなる
バイアスの例 その4
情報バイアス ③
健康な人を「有症者」としたり、症状がある人を
「健康な人」とする場合
有症 健康 計
食べた
21 6 27
食べない 3 18 21
計
24 24 48
健康な人を「有症者」
→a,cが増える
有症者を「健康な人」
→b、dが増える
これらが混ざると
結局オッズ比は低くなる
本当は患者でないのに「患者」と
診断されたり、
本当は食べていないのに「食べた」
と思いこむことで、真の値が歪む
この場合、原因食品のオッズ比は
過小評価される。
※交絡バイアス
※交絡バイアス
ランチバイキングで食中毒が発生
→オッズ比を計算すると…
「ケーキ」と「コーヒー」の2つのオッズ比が
高いことが判明
今までの考え方
「コーヒーで食中毒が発生することはまずない
ので原因食品はおそらくケーキだろう」
※交絡バイアス
交絡バイアスとは…
喫食(曝露)の有無と発症との関係に
影響を与える別の曝露因子を
「交絡因子」という。
この「交絡因子」により、見かけ上
オッズ比が上昇することを
「交絡バイアス」という。
コーヒー
食中毒
ケーキ
実際には原因食品はケーキであるにもかかわらず
ケーキを食べたほとんどの人がコーヒーも飲んだので
見かけ上コーヒーのオッズ比が上昇してしまう
「層別分析」により影響の程度を分析できる
※バイアスに対する考え方
◆自己選択バイアスを避けるには、報道前の患者群を症例の
定義とするなど、症例の定義を工夫する。
◆質問者バイアスを避けるには、調査者が先入観をもたず
調査者全員が等しく質問できるような念入な打ち合わせが
必要である。
◆情報バイアス(本当は患者でないのに「患者」としたり、本当
は食べていないのに「食べた」とする場合)は、結果的にオッ
ズ比が過小評価される。
◆本来の原因食品と同じように見かけ上オッズ比が高くなって
しまう食品がある。(交絡バイアス)