保健統計学第二回

Download Report

Transcript 保健統計学第二回

保健統計学第3回
「計数データの解析」
2007.04.20
STAT WARS(?)
“Too many people use statistics as a drunken man sues a
lamppost ,for support but not for illumination!”
統計学の役割とはどういうものだろうか?
酔っ払いが灯りを求めるためではなく、身体を支えるため
に街灯に寄りかかるかのように、統計学を用いる人間が多
過ぎる!本来は、実験結果の見通しを良くするために用い
るものなのですが・・・?
実際の現場では如何に?
実験デザインのまずさ、解析計画の杜撰さが実験結果を
支えきれなくなって、最後に統計学に頼りに来るパターン
が多いです。
前回の復習(1)
Statistics has been described as the science which tells you
that if you lie with your head in the oven and your feet in the
refrigerator, on average you’ll be comfortably warm.
平均が基準値/理論値に近いからOK!
統計学とは得てしてそのような学問なのだろうか?
平均よければ全てよしとしていいのかね?
平均は確かにデータの特徴を示しやすいけど・・・。
しかしそれだけでは、頭はオーブンに、足は冷蔵庫に入っ
ていても、身体全体で平均すれば「心地よい暖かさだ!」っ
てことになります。
せめてヒストグラム(=分布の形)と基本統計量(平均、標準
偏差、最大・最小・中央値)ぐらいは見ましょうね!
前回の復習(2)
先々週の授業で、田中教授の一言とは?
統計的推測の仕組み
標本_
平均(x)
標準偏差(S)
母集団
μ(平均値),σ(標準偏差)
標本抽出
これら標本のデータから統計量(検定統計量:test statistic)を求
め、統計量の「偏り度」を確率(P値)で示す。つまり・・・
統計量の差は確率的に偶然によるものか、それとも偶然ではな
かなかお目に掛かれないものか・・・を調べるのです。
中にはこんな標本抽出法も?
中学生の2人に1人がナイフを持ち歩く?
本社の独自調査により、中学生の約50%がナイフを携帯し
ている事実が判明した。T県U市の中学校における、生徒
による教師刺殺事件で揺れる教育現場だが・・・実際には
何処の教室でも発生しかねない事件であることが浮き彫り
にされた。(A新聞見出し、1998年2月)
ざわざわざわざわ・・・「大変だ」「どうしましょう」「早急な対策
が必要ですね・・・」 by N教組、教育現場、TG大学教授?
調査方法を確認の結果とんでもない事実が・・・
2月○日(月)~2月×日(水)の昼過ぎに、原宿、渋谷、亀
戸、北千住、池袋駅前で座り込んでいた中学生を「無作為
に」抽出して聞き取り調査を行った結果だそうです。
そのために注意すべき点 →バイアスの除去!
標本抽出における基本的原則
単純無作為抽出法:乱数表・くじびきなどでランダムに抽出
2段階抽出・多段抽出法:母集団をいくつかのグループ(例
えば居住地・男女等々)に分け、その後は無作為抽出
層化抽出法:母集団の構成比率が既知の場合、それを反
映されるようにあらかじめ定められた割合で、それぞれの群
から標本を抽出する
標本は母集団の特徴を示すもの、母集団を代表しているもので
なければならないということである!つまり・・・
先の例で言うならば、標本は中学生全体を代表していなければ
ならない!平日に学校にも行かず、繁華街の駅前で座り込んで
いる中学生は、明らかに「全体の代表」とは言えません!
演習1 Selection Bias?
サッカーくじ 77%が反対!
私たちS日本Fの会は4月21日サッカーくじの反対集会を開
催、渋谷で道行く314名の人々と対話した結果、サッカーくじ
反対が77%、賛成が22%となりました。このように国民世論
としても、サッカーくじは認められていないのです!(1998年2
月 国会討論より)
データでも科学的に証明されているではないか!
断固導入反対!
by CF連合、ZS連合、NS協会、NP連盟・・・他
反対集会に立ち止まる人々だけの意見を徴収していませ
んかね?「反対だから立ち止まった」という可能性(この方
が高いと思われる)は全く無視されていないか?(時間を浪
費までして賛成を訴えた22%は何だろうか?)
演習2 希少ゆえ・・・?
理系の女子大生は製薬企業が大好き?
理系大学生の人気企業に関するアンケートで、男子学生は
T薬品工業が10位に入っていたのみですが、女子学生はT
薬品が1位、3位にもT、5位~8位まで全て製薬会社が占め
る結果となりました。男女とも1000人以上の学生にアンケー
トを行っているのですが?
決して間違ってはいないと思うのですが・・・そうかね?
これは調査設計はともかく、実施段階における調査実施者
の手抜き、もしくは(サンプリング数はともかく)集団のBias
が考えられます。理系の女子学生の意見を素早く徴集する
には、女子学生の割合が多い薬学部の学生に尋ねるのが
一番でしょう!
本日のテーマ ~データ解析の基礎~
データの種類
量的と質的の違
いはバッチリにし
ておきましょう!
量的データの例
・血圧値
・血清コレステロール値
・その他検査値等
質的データの例 (一般に「計数データ」と呼ばれます)
・性別(単なる名義尺度)
・薬効の有効、無効、著効等
・「1.悪い」「2.普通」「3.良い」 などの順序データ
・確率分布の種類
連続型分布
・正規分布等 (今週はこれだけ覚えて下さい!)
離散型分布
・二項分布
・ポアソン分布等
離散 連続とは?
縦軸(y軸)は確率、横軸(x軸)は取りうる値
Μが平均値で、σが大きい
と幅が広がる。つまり、そ
の集団の取りうる範囲が
広い
0.3
出現確率
0.25
0.2
0.15
0.1
0.05
0
0
1
2
3
4
5
11
6
7 8
9 10
連続型分布(正規分布等)
→この範囲内のどの値も取り
得る分布。
離散型分布 (二項分布・ポアソ
ン分布等)→この範囲内におい
て、決まった値を取り得る分布。
例:身長・血圧などの連続量
例:さいころの出目と出現確率
本日は 「計数データの解析」
・検定の原理
・2群間に「差がある」「差がない」?
(帰無仮説・対立仮説)
・検定の手順・流れ
・具体的な分布の種類
・正規分布
・t分布 (次週やります)
・χ2分布
・二項分布
・ポアソン分布
統計的推測の考え方
平均値の推定
・点推定:母集団の平均値を、標本の平均値から推定す
るやり方。ピンポイントゆえ、基本的に誤差を伴います。
標本平均のサンプル数を増やしていくと分散はゼロに近
づいていきます(=バラツキが減少します)。
・区間推定:標本の抽出には誤差が付き物ですが、その
誤差の程度がわからないと、得られた推定値の信頼度
がわかりません。そこで、通常は「信頼度(1-α)%におけ
る母平均μの信頼区間は(μ-a, μ+ a)となる」のように表現
します。
ちょっと2ページ前まで戻ってみましょう!
1-(1) 検定の原理 (差がある?)
2群間に「差がある」ことを証明する方法とは?
Q:どのぐらいの大きさならば「差がある」のか?
A:その大きさがわからないから検定するのです!
「差がある」ことはそのままでは検定できないので、
まずは「差がない」ことを調べましょう。
「差がある?な
い?」を確かめた
い!!!
→「差がない」と仮
定する
→その仮定は「間
違い」
→「差がある」
「差がない」という仮説は「帰無仮説(H0)」
「差がある」という仮説は「対立仮説(H1)」
と呼びます。つまり、H0を否定することにより、H1を
肯定すればよいのです!
1-(2) 検定の原理 (証明の仕方)
①問題意識:「A群とB群には差があるのではないか?」
②A群の統計量XA(前回の復習(2)を参照)とB群の統計量XBを求める
③帰無仮説(H0):A群とB群に差がないのだからX=XA-XB=0
④帰無仮説から統計量Xの期待値は0であるが、実際のXはある大きさを持っ
ている。その差は十分に起こり得るものなのか?(=単なる偶然ではないの
か?)
⑤統計量Xの起こる確率が、あらかじめ定めた有意水準(通常α=0.05)よりも
大きければ、帰無仮説(H0)を否定できない。逆に小さければ帰無仮説(H0)を
否定し、対立仮説(H1)を採択する。(これらの確率は分布から判断します)
(この場合、「滅多に起きない偶然が起きてしまった」と考えるのではなく、「差
がないとした仮説が間違っていた」と判断するのです)→重要!
2-(1) 分布の種類 ~正規分布~
これは全ての分布の基本であります!
 ( x μ) 2 
1
f ( x) 
exp 

2
2σ 
2σ 
ここ、テストで
ます!
標準化の過
程を理解して
おきましょう。
*f(x)=ex のとき、f(x)=exp(x)
(母平均を μ,母分散 をσ2とする)
(ここで、μ=0,σ=1とすると)
1
 1 2
f ( x) 
exp  z 
2
 2 
z
x μ
*(x-平均)/標準偏差
σ
これを「標準化する」といいます!
(標準正規分布)・・・色々なところで使われます!
色々なところ・・・それはT検定、信頼区間推定・・・詳細は
次回ということで!
2-(2) 分布の種類 ~二項分布~
「効く⇔効かない」「起こる⇔起こらない」「当たる
⇔当たらない」「表⇔裏」「男」⇔「女」・・・
2つの事象しか発生し得ない場合、片方の事象の発生確率をpと
すると、もう片方は(1-p)で表される。n回の試行のうちx回発生す
る確率は
P  nCxp (1  p)
x
n x
で示される。
例:コインを10回投げたときに表が3回出る確率は、P=10C3×0.5×(1-0.5)10-3 =
(10×9×8)÷(3×2×1)×(0.5)3×(0.5)7≒0.117
縦軸に確率、横軸にnを取ってグラフを書きますと、nが大きくな
ればなるほど正規分布に近い形(正規近似)になります。
2-(3) (参考) ~ポアソン分布~
「表⇔裏」「男」⇔「女」はほぼp=0.5ですが、pが0
(もしくは1)に近いときには・・・
まれなことがおきてしま
先程の二項分布はポアソン分布に近似できます。
う可能性を推測する場
合に使う。たとえば、戦
m x
争に行って馬に蹴られ
て死んでしまう可能性と
(m=np)
か。
e m
P
x!
先程の「効く⇔効かない」「起こる⇔起こらない」「当たる⇔当た
らない」は、p≒0.5とは限らない。実際には交通事故の件数や稀
な疾患の場合に用います(基本的にx=0とみなします)。
2-(4)χ2検定(かいじじょうけんてい)その1 「適合度検定」
サイコロを60回振ったところ、こんな結果になってしまった。
出目
1
2
3
4
5
6
観察度数
18
8
11
7
9
7
理論値
(期待度数)
10
10
10
10
10
10
帰無仮説:偏ってない
(H0:各理論値=10)
対立仮説:偏っている
(H1:各理論値≠10)
(期待通りのものは一つもないけど・・・?)
χ2統計量=各{(観測度数-期待度数)2/期待度数}の和
={(18-10)2+(8-10)2+(11-10)2+(7-10)2+(9-10)2+(7-10)2}/10=8.8
これを、自由度5のχ2分布に当てはめると、
分布表より有意水準α=0.05(5%)の値は
11.07となる。
自由度5のχ2統計量=8.8<11.07のため、帰
無仮説を棄却できない。
=出目は偏っていると言えない!
11.07
2-(5) χ2検定 その2 「独立性の検定」
新薬の効果は本当にあると言えるのだろうか?
薬品/効果
効果あり
効果なし 合計
新薬
(期待度数)
68
(59.5)
22
(30.5)
90
プラセボ
(期待度数)
51
(59.5)
39
(30.5)
90
合計
119
61
180
帰無仮説:薬の種類と効果は関連
がない( H0:効果なし)
対立仮説:薬の種類と効果は関連
がある( H1:効果あり)
割合的には効きそう
に見えなくもない?
効果ありの合計は119人、効果なしの合計は61人なので、薬品による差がな
覚えま
いとすれば期待度数はそれぞれ 119/2=59.5、61/2=30.5となる。
しょう!
χ2統計量=各{(観測度数-期待度数)2/期待度数}の和
={(68-59.5)2+(51-59.5)2}/59.5+{(22-30.5)2+(39-30.5)2}/30.5=7.17
自由度1 のχ2分布、有意点α=0.05の値は3.84<7.17となり、新薬は有効で
あったと言える。(=薬の種類と効果は関連がある)
2-(6)χ2検定 追加・発展
さっきから「自由度」って何?
degrees of freedom(自由の度合い)と申しまして、一般にl×mの分割表
では、自由度=(l-1)×(m-1)で示される。
例:2×2分割表ならば、(2-1)×(2-1)で、自由度は1になります。
Yates(イェーツ)の補正
観測度数が少ないときには、χ2分布に当てはめるために補正を行うことがあ
ります。この場合、
χ2統計量=各{(観察度数-期待度数-0.5)2/期待度数}の和
となります。観察度数が大きければ特に補正の必要はなく、さらに有意でな
ければ補正の必要はありません。(理由:なおさら有意でなくなるから)
2-(7) 演習
Q1(二項分布による検定)
コインを8回投げて表が出たのは1回だけであった。このようなことは十分あり
得るのか?十分あり得る=有意確率(α=0.05)で考えて下さい。
A1:P=po+p1=8C0(1/2)0+8C1(1/2)1×(1/2)7=0.035となるので、P<0.05(片側
検定)となり、答は「あり得ない」。
*ただし両側検定ではP=0.070>0.05となり、「十分にあり得る」。
Q2(ポアソン分布による検定)
クレチン症の発生率は全国統計によれば1/7000である。ある地域で20000人
を選出したところ、クレチン症は発見されていない。このようなことは十分あり
得るのか?
*十分あり得る=有意確率(α=0.05)で考えて下さい。
A2:m=np=20000×1/7000≒2.86。よって、P=(e-mmx)/x!で、x=0とすると、
P=e-2.86=0.057>0.05となるので、答は「十分にあり得る」。
*検定の原理 (追加1)
片側検定・両側検定
先程の帰無仮説(H0)は、「A群とB群の統計量に差がない」としており
ました。復習ですが、「差がない」ことを否定して「差がある」という対
立仮説(H1)を採択するのはよろしいですね?
医学における検定では、A群とB群のどちらが大きいのかが判ってい
ないことが多いので、圧倒的に両側検定を用います。
が・・・もしもA群の方が大きい(小さい)ことが事実として判っているこ
とであり、それだけを確かめたいのであれば、片側検定を用います。
(当然、両側の2倍有意差が出易くなります。くれぐれも実験終了後に
有意差を出すために用いるようなことはいけません!)
*検定の原理 (追加2)
第一種の過誤(αエラー)・第二種の過誤(βエラー)
事実 差がない
差がある
検定結果
有意差なし
正しい
βエラー(第二種の過誤)
有意差あり
αエラー(第一種の過誤)
正しい
本当はダメな薬なのに
「効果あり」としてしまう
本当は良い薬なのに
「効果なし」としてしまう
αは通常0.05(5%)に設定することで、実は効かない薬が偶然に世に出てし
まうことを20分の1に抑えられます。αとβは両方同時に小さくすることは出来
ないので、通常はαを5%に設定しつつ、なるべくβエラーを小さくするような方
式が取られている・・・ようです。
2-(8) 演習
Q1(χ2検定)
好きな球団と居住地域をクロス集計したら下記のようになった。居住地域と好
きな球団は関係あると言えるのか?①検定のための帰無仮説・対立仮説、②
及び各球団の期待度数、③自由度を求め、有意水準を0.05として検定しましょう。
広島
中日
巨人
ヤクルト
阪神
横浜
計
東京
14
9
54
22
24
14
137
大阪
14
16
19
9
39
8
105
広島
38
11
16
7
21
8
101
福岡
22
10
34
6
17
9
98
計
88
46
123
44
101
39
441
私の計算によれば、χ2統計量は67.067、自由度15の場合p<0.001となりまし
た・・・と申しますか、これは極端な事例です。慣れてくればですが、地域別の期待度数
と値を比較すれば関係の有無は見えてきます。