事前確率をどう考えるか ~島の子ザル次元~ 法数学勉強会(京大法

Download Report

Transcript 事前確率をどう考えるか ~島の子ザル次元~ 法数学勉強会(京大法

事前確率をどう考えるか
~島の子ザル次元~
法数学勉強会(京大法医学講座)
2012/09/29
京都大学 統計遺伝学
山田
事前確率をどう考えるか
~島の子ザル次元~
法数学勉強会(京大法医学講座)
2012/09/29
京都大学 統計遺伝学
山田
事前確率をどう考えるか
~島の子ザル次元~
法数学勉強会(京大法医学講座)
2012/09/29
京都大学 統計遺伝学
山田
事前確率
事前確率・事前分布
プライア Prior
京都市 2013年8月16日
8月16日 朝
日差しとセミの鳴き声が
予想のニュアンスの違いを生んだ
ここで、いったん
ラジオ体操のこと
日差し
セミの声
は
忘れます
• 京都市 2013年8月16日
• 最高気温を予想しよう
25
30
35
40
• 京都市 2013年8月16日
• 最高気温を予想しよう
予想温度を分布で描いてみよう
25
30
35
40
• 『過去5年間の最高気温の平均は34.4度』
25
30
35
40
• 『過去5年間の最高気温の平均は34.4度』
25
30
35
40
• 『過去5年間の最高気温の平均は34.4度』
25
30
35
40
事前分布
• 不確かさをもった「予想最高気温」は分布を
持っていた
せっかく
「事前分布」
の話題が出たので
少し
補強を
ベイジアン関連の論文にも出てくる用語などのためにも
ベイズ推定
事前分布・共役事前分布
袋の中の赤玉の割合を予想せよ
• 大きな袋にたくさんの玉が入っていて、赤玉
か白玉かのどちらかだ、という
0
1
袋の中の赤玉の割合を予想せよ
• 玉を出しては入れ、を繰り返したところ
• 赤35回、白65回だったという
0
1
袋の中の赤玉の割合を予想せよ
• 玉を出しては入れ、を繰り返したところ
• 赤35000回、白65000回だったという
0
1
袋の中の赤玉の割合を予想せよ
• 玉を出しては入れ、を繰り返したところ
• 赤1回だったという
0
1
尤度と確率
• 尤度
– 赤玉35個、白玉65個の観測のとき、赤玉の割合
が0,0.01,0.02,…,0.99,1である尤度はいくつか?
• 確率
– 赤玉の割合が0.3のとき、1000回の抜き取りで
赤玉が出る個数が、0,1,…,1000個である確率は
いくつか?
尤度と確率
• 尤度
– 赤玉35個、白玉65個の観測のとき、赤玉の割
合が0,0.01,0.02,…,0.99,1である尤度はいくつか?
• 確率
– 赤玉の割合が0.3のとき、100回の抜き取りで赤
玉が出る個数が、0,1,…,100個である確率はいく
つか?
100回のうち赤玉が出る回数を予想
せよ
• 割合が0.3で
• 赤玉 a個、白玉 100-a個を抜き出す確率は?
0
100
100回のうち赤玉が出る回数を予想
せよ
• 割合が0.3で
• 赤玉 a個、白玉 100-a個を抜き出す確率は?
100回のうち赤玉が出る回数を予想
せよ
• 割合が0.3で
• 赤玉 a個、白玉 100-a個を抜き出す確率は?
a個とb個の並べ方の場合の数
赤の割合が0.3のときに、
20回取り出すと
赤玉の個数は0,1,…,20
のどれになるか
二項分布
赤の割合が0.3のときに、
20回取り出すと
赤玉の個数は0,1,…,20
のどれになるか
二項分布
条件(pの値)が固定されて、結果(aの値)が
いろいろ
尤度と確率
• 尤度
– 赤玉35個、白玉65個の観測のとき、赤玉の割
合が0,0.01,0.02,…,0.99,1である尤度はいくつか?
• 確率
– 赤玉の割合が0.3のとき、100回の抜き取りで赤
玉が出る個数が、0,1,…,100個である確率はいく
つか?
尤度と確率
• 尤度
– 赤玉35個、白玉65個の観測のとき、赤玉の割
合が0,0.01,0.02,…,0.99,1である尤度はいくつか?
• 確率
– 赤玉の割合が0.3のとき、100回の抜き取りで赤
玉が出る個数が、0,1,…,100個である確率はいく
つか?
尤度と確率
• 尤度
– 赤玉35個、白玉65個の観測のとき、赤玉の割
合が0,0.01,0.02,…,0.99,1である尤度はいくつか?
• 確率
– 赤玉の割合が0.3のとき、100回の抜き取りで赤
玉が出る個数が、0,1,…,100個である確率はいく
つか?
尤度
• 確率
– 赤玉の割合が0.3のとき、100回の抜き取りで赤
赤35個、白65個が取り
玉が出る個数が、0,1,…,100個である確率はいく
出されたときに、赤の割
つか?
合がいくつであるかの尤
度
ただし、グラフの下面積
は1
尤度
• 確率
– 赤玉の割合が0.3のとき、100回の抜き取りで赤
赤35個、白65個が取り
玉が出る個数が、0,1,…,100個である確率はいく
出されたときに、赤の割
つか?
合がいくつであるかの尤
度
ただし、グラフの下面積
は1
ベータ分布
赤玉の個数ごとの確率
赤玉の割合
赤玉の個数
赤玉の割合ごとの尤度
二項分布
赤玉の個数ごとの確率
赤玉の割合
赤玉の個数
赤玉の割合ごとの尤度
ベータ分布
二項分布
お互い様の関係
赤玉の割合
共役分布
Conjugate distribution
ベータ分布
赤玉の個数
お互い様の関係
共役分布
Conjugate distribution
• メリット1
– お互いに「数式化された分布」なので、「予測」作
業 → パラメタ推定になる(これは簡単)
• メリット2
– 事前分布を「いい感じ」に持ち込める
お互い様の関係
共役分布
Conjugate distribution
• メリット1
– お互いに「数式化された分布」なので、「予測」作
業 → パラメタ推定になる(これは簡単)
• メリット2
– 事前分布を「いい感じ」に持ち込める
表の出る割合を予想せよ
画鋲の場合
表の出る割合を予想せよ
画鋲の場合
裏
表
裏
表の出る割合を予想せよ
0
1
袋の中の赤玉の割合予想と比較せよ
• 大きな袋にたくさんの玉が入っていて、赤玉
か白玉かのどちらかだ、という
先ほど、どんな事前分布を描いていましたか?
0
1
事前分布が違う
事後予測も違う
• 100回繰り返したところ
– 赤35回、白65回だったという
– 表35回、裏65回だったという
画鋲の場合
表35回、裏65回だったという
さて・・・
0
1
0
1
画鋲の場合
• 事前分布をベータ分布で「想定」しておけば、
ベータ分布・二項分布の「共役」な関係の輪
から出ずに済む
0
1
0
1
画鋲の場合
• 事前分布をベータ分布で「想定」しておけば、
ベータ分布・二項分布の「共役」な関係の輪
から出ずに済む
• 事前分布として
– 「記憶をたどれば、画鋲を5個こぼしたときに、表
が1回、裏が4回だったかなー」
– ならば
事前の予想
事前の予想
観測そのままのベータ分布
+
事前の予想
観測そのままのベータ分布
+
事後の予想
事後の予想
観測そのままのベータ分布
事前の予想
都合のよい事前分布としての
共役事前分布
•
•
•
•
•
•
二項分布
多項分布
正規分布
多変量正規分布
ベータ分布
ディリクレ分布
正規分布
または、ガンマ分布
多変量正規分布
または逆Wishart分布
お互い様の関係
共役分布
Conjugate distribution
事前・事後分布を使った
シミュレーションや繰り返し計算で重宝する
• メリット1
– お互いに「数式化された分布」なので、「予測」作
業 → パラメタ推定になる(これは簡単)
• メリット2
– 事前分布を「いい感じ」に持ち込める
事前確率をどう考えるか
~島の子ザル次元~
法数学勉強会(京大法医学講座)
2012/09/29
京都大学 統計遺伝学
山田
事前確率
島の子ザル
• 絶海の孤島
– ボス(雄)ザルが倒れ序列が崩壊
– N頭の雄ザル
• 1頭だけ、『血統書付き』
– 1頭の雌ザルから1頭の子ザルが生まれた
– 父ザルは『血統書付き』か『否か』!
島の子ザル
• 絶海の孤島
– ボス(雄)ザルが倒れ序列が崩壊
– N頭の雄ザル
• 1頭だけ、『血統書付き』
– 1頭の雌ザルから1頭の子ザルが生まれた
– 父ザルは『血統書付き』か『否か』!
島の子ザル
• 絶海の孤島
– ボス(雄)ザルが倒れ序列が崩壊
– N頭の雄ザル
• 1頭だけ、『血統書付き』
– 1頭の雌ザルから1頭の子ザルが生まれた
– 父ザルは『血統書付き』か『否か』!
島の子ザル
• 絶海の孤島
– ボス(雄)ザルが倒れ序列が崩壊
– N頭の雄ザル
• 1頭だけ、『血統書付き』
– 1頭の雌ザルから1頭の子ザルが生まれた
– 父ザルは『血統書付き』か『否か』!
島の子ザル
• 絶海の孤島
– ボス(雄)ザルが倒れ序列が崩壊
– N頭の雄ザル
• 1頭だけ、『血統書付き』
– 1頭の雌ザルから1頭の子ザルが生まれた
– 父ザルは『血統書付き』か『否か』!
島の子ザル
• 雄ザルのDNA
– 『血統書付き』の雄ザルのDNAはある
– それ以外は島のサルのマーカーの『頻度』だけ
• 父親候補の数は?
– 島のすべての雄ザル?
島の子ザル
• 雄ザルのDNA
– 『血統書付き』の雄ザルのDNAはある
– それ以外は島のサルのマーカーの『頻度』だけ
• 父親候補の数は?
– 島のすべての雄ザル?
島の子ザル
• 雄ザルのDNA
– 『血統書付き』の雄ザルのDNAはある
– それ以外は島のサルのマーカーの『頻度』だけ
• 父親候補の数は?
– 島の雄ザルN-1頭 vs. 『血統書付き雄ザル』
– 島のすべての雄ザル?
島の子ザル
• 雄ザル
– S1,S2,...,SN
– S1:血統書付き
– 尤度比
• p(1) : (N-1)p(2)
雄ザル
子ザルのジェノタイプの子
が産まれる確率
S1
p(1)
S2
p(2)
S3
P(3) = P(2)
...
...
SN
P(N) = P(2)
島の子ザル
• 雄ザル
– 個体別の尤度比
• p(1) : p(2)
– 個体別の尤度比として、どれくらいの大きさで納
得するか
雄ザル
子ザルのジェノタイプの子
が産まれる確率
S1
p(1)
S2
p(2)
S3
P(3) = P(2)
...
...
SN
P(N) = P(2)
父親候補の数
• 「秩序崩壊期間」が1分のとき
– 1頭
父親候補の数
• 父親はあくまでも1頭
• 父親候補の数はメイティングした雄ザルの数
「秩序崩壊期間」が1分のとき
– 1頭
父親候補の数
• 「秩序崩壊期間」が10年間のとき
– N=50頭
• 「秩序崩壊期間」が1分のとき
– 1頭
父親候補の数
• 「秩序崩壊期間」が10年間のとき
– N=50頭
• 「秩序崩壊期間」が1分のとき
– 1頭
父親候補の数
• 「秩序崩壊期間」が10年間のとき
– N=50頭
• 「秩序崩壊期間」が1分のとき
– 1頭
• 「秩序崩壊期間」が32時間15分のとき
– ?頭
父親候補の数
• 「秩序崩壊期間」が10年間のとき
– N=50頭
• 「秩序崩壊期間」が1分のとき
– 1頭
• 「秩序崩壊期間」が32時間15分のとき
– ?頭
– これは問題になる?
「秩序崩壊期間」が32時間15分のとき
• 候補者数 N頭
– 問題になる場合
– 問題にならない場合
• 『血統書付き雄ザル』が、「候補N頭」に入って
いることがわかっているか、否か
「秩序崩壊期間」
「秩序崩壊期間」
• 『物理的 実現可能性』の考慮
『物理的 実現可能性』
• 実は
– すべての雄ザルと雌ザルには「GPS」がつけられ
ていて、「近くに居た時間」が計測されていた!
– 近くに居た時間に比例して『事前確率』を変更し
よう!
GPS搭載のウミガメ
『物理的 実現可能性』
• 実は
– すべての雄ザルと雌ザルには「GPS」がつけられ
ていて、「近くに居た時間」が計測されていた!
– 近くに居た時間に比例して『事前確率』を変更し
よう!
『物理的 実現可能性』
• 実は
– すべての雄ザルと雌ザルには「GPS」がつけられ
ていて、「近くに居た時間」が計測されていた!
– 近くに居た時間に比例して『事前確率』を変更し
よう!
『物理的 実現可能性』
• 実は
– すべての雄ザルと雌ザルには「GPS」がつけられ
ていて、「近くに居た時間」が計測されていた!
– 近くに居た時間に比例して『事前確率』を変更し
よう!
GPS搭載のウミガメ
父親鑑定
島の子ザル
• 絶海の孤島
– ボス(雄)ザルが倒れ序列が崩壊
– N頭の雄ザル
• 1頭だけ、『血統書付き』
– 1頭の雌ザルから1頭の子ザルが生まれた
– 父ザルは『血統書付き』か否か!
日本列島の子
• 絶海の孤島
– N人の候補者
• 1人だけ、『お墨(戸籍)付き』
– 父親は『お墨付き』か否か!
日本列島の子
• 候補者のDNA
– 『お墨付き』候補者のDNAはある
– それ以外はマーカーの『頻度』だけ
• 事前確率
– すべての候補者が 1/N ???
–N
• ~5000万(半数) ?
• ~4000万(成人男性) ?
日本列島の子
• 実は
– すべての候補者と母親には「GPS」がつけられて
いて、「近くに居た時間」が計測されていた!!!
• 近くに居た時間に比例して『事前確率』を変更
しよう!
日本列島の子
• 候補者個体別の尤度比は計算できる
– p(1) : p(2)
• さすがに、GPS記録はないけれども・・・
• それに準じて、事前確率の重みはつけられる
か・・・
GPS記録はないけれども・・・
• 事前確率
– 妊娠時期の見積もりずれが30-60日??とし
て
• N~30-60?? (単位は『日』)
• N~30-60 x 24 (単位は『時間』)
• N~30-60 x 24 x 60 (単位は『分』)
– 『近くに居た時間』という重みづけは、もう少し、考
えられそう
GPS記録はないけれども・・・
• N~30-60??
GPS記録はないけれども・・・
• N~30-60??
• これが問題になるのは、
– 『お墨付き』が候補者に入っていることに関する
情報があるか否か、で変わってくる
『物理的 実現可能性』
• 他に考慮しているのは?
– 物理的に候補たりえる
– 動機的に候補たりえる
– 証拠的に候補たりえる
『物理的 実現可能性』
• 他に考慮しているのは?
– 物理的に候補たりえる
– 動機的に候補たりえる
– 証拠的に候補たりえる
事前確率を与えよう
• 物理的に候補たりえる
• 動機的に候補たりえる
• 証拠的に候補たりえる
• 三者のどれも一緒に扱いたい
– 合算する(掛け算する)
– かなりの幅がある情報
– その計算方法を…