決断するための情報 法医学会 2013年6月26日 京都大学(医)統計遺伝

Download Report

Transcript 決断するための情報 法医学会 2013年6月26日 京都大学(医)統計遺伝

決断するための情報
法医学会
2013年6月26日
京都大学(医)統計遺伝学
山田 亮
DNA鑑定と決断
DNA鑑定と決断
• 決断とは?
どちらにしようかな 天の神様の言うとおり
婚活
こっちにしようかな?
こっちにしようかな?
こっちにしようかな?
~決断理論~
~決断理論~
イントロダクション
だけど
328ページ
~決断理論~
哲学
経済学
心理学
数学
『最適な決断戦略』
• 「情報がないなら、ないなりに、あるなら、ある
なりに」
• 「確率的に決断」しよう
• それが「長い目」で見たときの、『最適戦略』
• 生物進化、ギャンブル…
Multi-armed bandit problem,
Thompson sampling
裏を返すと…
情報があっても
確率的に決断するしかない
最後の決断は
個人に任せて
個人によって決断が割れてもよい
決断するための情報
法数学の役割
決断するための情報
法数学の役割
決断したい人の
役に立つような情報を
使い方指南も含め
利用しやすい形で
情報提供
×
決断
事前●●
情報
事後●●
×
決断
事前●●
データ
×
解釈
事後●●
法数学勉強会@京都大学
2010年~
• 2010年8月 仮説空間について
• 2011年2月 DNA鑑定における尤度比と仮説検定
• 2011年5月 複雑な家系図でのDNA鑑定用尤度計算法について
– (東日本大震災を受けて)
•
•
•
•
•
•
2011年9月 多人数一括DNAプロファイリング手法の開発
2011年11月 DNA鑑定とそれ以外の情報の組合せのための基礎
2012年3月 犯人である確率を正確に計算する
2012年9月 事前確率と共役事前分布
2013年1月 事前確率の推定その2
2013年4月 不確かな情報と確かな情報の違いを可視化する
×
決断
事前●●
データ
×
解釈
事後●●
どのくらいの「事後●●」が必要か?
『確実』でなくても決断できる(こともある)
世界でこれまでに11人しか罹ったこと
のない病気に罹ってしまいました!
•
•
•
•
治療法は2つ、AとB、とがあります
AとBとは、片方しか受けられません
AとBとは、どちらも安全です
AとBとのどちらを選びますか?
治療法 AとB
• 過去の11人は、AとBとのどちらを受けたの
か?
• その結果、治ったのか、治らなかったのか?
• あなたはどちらの治療法を選びますか?
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
何を考慮した?
何を考慮した?
• どちらの治療法を選ぶと「治りやすい?」
– 治る確率の「期待値」が高いのはどちら?
• どちらの治療法が「より良い」?
– Aの治癒率>Bの治癒率なのか。その確率
は?
何を考慮した?
• どちらの治療法を選ぶと「治りやすい?」
– 治る確率の「期待値」が高いのはどちら?
• どちらの治療法が「より良い」?
– Aの治癒率>Bの治癒率なのか。その確率
は?
この問に答えるために必要なのは
ベイズ推定
共役事前分布
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
二項の観察から
A、Bの成功率を
ベータ分布として
推定する
二項分布・ベータ分布
• 成功 s 回、失敗 f 回、計 n 回
• 背後にある成功率 p はいくつ?
確率・尤度 二項分布
• 成功確率 p のとき、n
回中 s 回成功して f
回失敗する確率は
p = 0.8 の場合
確率・尤度 二項分布
• n=10 回中 s=6 回成
功して f=4 回失敗し
たという。
• 成功確率 p である尤
度は?
p = 0.8 の場合
• n=10 回中 s=6 回成功して f=4 回失敗したという。
• 成功確率 p である尤度は?
p = 0.6 の場合
p = 0.8 の場合
• n=10 回中 s 回成功して f 回失敗したという。
• 成功確率 p = 0,0.1,0.2,…,0.9,1 である尤度は?
p=0
p=1
p=0.1
p=0.9
p=0.3 p=0.5 p=0.7
p=0.2 p=0.4 p=0.6 p=0.8
• n=10 回中 s=6 回成功して f=4 回失敗したという。
• 成功確率 p = 0,0.1,0.2,…,0.9,1 である尤度は?
p=0
p=1
p=0.1
p=0.9
p=0.3 p=0.5 p=0.7
p=0.2 p=0.4 p=0.6 p=0.8
• n=10 回中 s=6 回成功して f=4 回失敗したという。
• 成功確率 p = 0.15, 0.275,0.825である尤度は?
この形を
ベータ分布
と呼ぶ
ベータ分布
• n=10 回中 s=6 回成功して f=4 回失敗したとき
の成功確率の分布
最もありそうなの(最尤推定値)
pL = s/n = 0.6
成功確率の平均(期待値)は
pM = (s+1)/(n+2) = 0.5833…
何を考慮した?
• どちらの治療法を選ぶと「治りやすい?」
– 治る確率の「期待値」が高いのはどちら?
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
Aを選択して治る確率の期待値
(2+1)/ ((2+1)+(1+1)) = 0.6
Bを選択して治る確率の期待値
(5+1)/ ((5+1)+(3+1)) = 0.6
どちらの治療法の成功率がい?
治療B
治療A
どちらの治療法の成功率がい?
• 治療Aの成功率は
0.6かもしれない
治療B
• 治療Bの成功率は
0.5かもしれない
• このときは治療法A
の方がBより成功
率がよい
治療A
どちらの治療法の成功率がい?
• 治療Aの成功率は
0.4かもしれない
治療B
• 治療Bの成功率は
0.8かもしれない
• このときは治療法B
の方がAより成功
率がよい
治療A
どちらの治療法の成功率がい?
• 治療Aの成功率は
0.6かもしれない
治療B
• 治療Bの成功率は
0.5かもしれない
• このときは治療法A
の方がBより成功
率がよい
治療A
どちらの治療法の成功率がい?
• (A,B) = (0.4, 0.8)
• (A,B) = (0.6, 0.5)
• どちらの可能性が
高い?
(A, B)=(0.4,0.8)
治療A
治療B
どちらの治療法の成功率がい?
• (A,B) = (0.4, 0.8)
• (A,B) = (0.6, 0.5)
• どちらの可能性が
高い?
(A, B)=(0.6,0.5)
治療A
治療B
どちらの治療法の成功率がい?
• (A,B) = (0.4, 0.8)
• (A,B) = (0.6, 0.5)
• どちらの可能性が
高い?
治療B
治療A
(A, B)=(0.4,0.8)
(A, B)=(0.6,0.5)
(A, B)=(0.4,0.8)
(A, B)=(0.6,0.5)
どちらの可能性が高い?
等高線から…
何を考慮した?
二項の観察から
A、Bの成功率を
ベータ分布として
推定する
• どちらの治療法が「より良い」?
– Aの治癒率>Bの治癒率なのか。その確率
は?
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
治療法
治った
治らな
かった
計
A
B
240
120
360
160
90
250
400
210
610
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
Aを選択して治る確率
の期待値 0.6
Bを選択して治る確率
の期待値 0.57
Aの方が治療成績が良
い確率 0.75
Aを選択して治る確率
の期待値 0.6
Bを選択して治る確率
の期待値 0.6
Aの方が治療成績が良
い確率 0.51
治療法
治った
治らな
かった
計
A
B
240
120
360
160
90
250
400
210
610
治療法
治った
治らな
かった
計
A
B
2
2
3
0
1
2
2
3
5
?十分?
Aを選択して治る確率
の期待値 0.6
Bを選択して治る確率
の期待値 0.57
Aの方が治療成績が良
い確率 0.75
治療法
治った
治らな
かった
計
A
B
200
100
300
200
50
250
400
150
550
?十分?
Aを選択して治る確率
の期待値 0.6
Bを選択して治る確率
の期待値 0.57
Aの方が治療成績が良
い確率 0.75
事後●●を何にするか?
「AとBとのそれぞれの『期待値』」
「AとBとを比べて『Aがより良い』確率?
事後●●の値はいくつが十分か?
最後の決断は
個人に任せて
個人によって決断が割れてもよい
事後●●を何にするか?
「AとBとのそれぞれの『期待値』」
「AとBとを比べて『Aがより良い』確率?
事後●●の値はいくつが十分か?
どのくらいの「事前●●」が必要か?
どのくらいの「事前●●」が必要か?
事前●●を何にするかは決まった。
「AとBとのそれぞれの『期待値』」
「AとBとを比べて『Aがより良い』確率?
事前●●の値はいくつが不十分なのか?
「事前●●」に関する問題
「犯人か」「犯人でないか」の2択
「犯人でない」=「別の誰かが犯人だ」
『別の誰?』
無関係な人?
血縁者?
近縁関係の強弱と地域差
「事前●●」に関する問題
「犯人か」「犯人でないか」の2択
「犯人でない」=「別の誰かが犯人だ」
『別の誰?』
1人、2人、…、たくさん
「事前●●」に関する問題
「犯人か」「犯人でないか」の2択
「犯人でない」=「別の誰かが犯人だ」
『別の誰?』
1人、2人、…、たくさん
「事前●●」に関する問題
「犯人か」「犯人でないか」の2択
「犯人でない」=「別の誰かが犯人だ」
『別の誰?』
1人、2人、…、たくさん
「事前●●」に関する問題
「犯人か」「犯人でないか」の2択
「犯人でない」=「別の誰かが犯人だ」
『別の誰?』
1人、2人、…、たくさん
『複数の候補が居る』
「事前●●」に関する問題
「犯人か」「犯人でないか」の2択
「犯人でない」=「別の誰かが犯人だ」
『別の誰?』
1人、2人、…、たくさん
『複数の候補が居る』
平均を取る
「事前●●」に関する問題
「犯人か」「犯人でないか」の2択
「犯人でない」=「別の誰かが犯人だ」
『別の誰?』
1人、2人、…、たくさん
『複数の候補が居る』
平均を取る
平均だけでは、まずいこともある
「事前●●」に関する問題
『複数の候補が居る』
平均を取る
平均だけでは、まずいこともある
たとえば:バースデイ・パラドクス
『パーティの出席者に同じ誕生日の人がいるだろうか?』
『この人と同じDNAジェノタイプの人がいるだろうか?』
誕生日:すべての日の確率を1/365と揃えて計算する。簡単
DNAタイプ:タイプ別の確率は不均一。簡単じゃない
全員が違う確率
均一な場合
ばらばらな場合
パーティの人数
全員が違う確率
均一な場合
ばらばらな場合の一例
パーティの人数
どんな試料?
どんな実験?マーカー数?
実験精度?計算手法?
課題、たくさん
試料
• 1人 複数人混合
• 十分量 希少量
• 質の良否
多型
• 多型種類
• 多型箇所数
• 集団のアレル頻度推定値
実験
• 実験成否
• 実験精度
統計計算
• 実験データのクオリティコントロールと外れ値
• 推定を含む処理
• 同一事項の推定に複数手法の提案、その異
同
• ベイズ流の判定
入口と出口が違えば
データ×解釈に求められる
情報力は変わる
入口と出口が違えば
データ×解釈に求められる
情報力は変わる
場合の整理とそれ
に応じた情報力の
確認
今日のまとめ
• 事後●●(事後確率など)
– 人によって変わる、場合に
よって変わる、事後情報の強
さ
– 個人の意見があってよい…D
NA鑑定でも?
• 事前●●(事前確率など)
– 事後●●に影響を与える事前
●●は、どこまで精度を保っ
ているか?
• データと解釈
– 事前●●と事後●●をつなぐ
部分
– いろいろな課題
• 試料の量と混合・マーカー種類と
数・実験精度・解釈手法