確率的情報処理における 確率伝搬型アルゴリズムと クラスター変分法

Download Report

Transcript 確率的情報処理における 確率伝搬型アルゴリズムと クラスター変分法

確率推論に対する統計力学的アプローチ
---クラスター変分法と信念伝搬アルゴリズム---
東北大学大学院情報科学研究科
情報基礎科学専攻
田中 和之
Kazuyuki Tanaka
[email protected]
1
目次
1.
2.
3.
4.
5.
6.
7.
序論
確率推論
クラスター変分法
確率伝搬アルゴリズム
線形応答理論
数値実験
まとめ
2
序論
確率推論と確率伝搬アルゴリズム
ベイズの公式
確率推論
確率モデル
信念 (Belief)
周辺確率分布
ループのある
(木構造を持たない)
確率モデルでは
厳密ではないが
結果はでる.
Belief
Propagation
ループのない
(木構造を持つ)
確率モデルでは
厳密
一般論の必要性
3
序論
統計力学と確率伝搬型アルゴリズム
Belief Propagation
(Lauritzen, Pearl)
ループのない確率モデルでは厳密
ループのある確率モデルでも使える
ループのない確率モデル
転送行列法と
Belief Propagation
とは等価
転送行列法
周辺確率分布に対する漸化式
ループのある確率モデル
ベーテ近似,菊池近似
クラスター変分法
4
序論
本講演の目的
•グラフィカルモデルを用いた確率推
論機構におけるクラスター変分法を
用いた確率伝搬アルゴリズムの構
成法の概説.
•線形応答定理を用いた相関関数の
計算法への発展.
5
確率推論
確率推論とベイジアンネット
6
確率推論
確率推論と確率モデル
X1
X
2
V 24
V 13

1
Z
X3
X
V 25
4
V 346
V 67
V 568 ( X 8 | X 5 , X 6 )
 V 346 ( X 6 | X 3 , X 4 )
 V 67 ( X 7 | X 6 )V 25 ( X 5 | X 2 )
X6
X7
P ( X 1, X 2 , X 3 , X 4 , X 5 , X 6 , X 7 , X 8 )
X5
V 568
 V 24 ( X 4 | X 2 )V13 ( X 3 | X 1 )
 V1 ( X 1 )V 2 ( X 2 )
X8
7
確率推論
確率モデルと信念(Belief)
 P(X 1, X 2 , X 3, X 4 , X 5 , X 6 , X 7 , X 8 )
Pi ( X i ) 
X \Xi
X1
X
2
V 24
V 13
X3
X
確率・統計:周辺確率分布
V 25
4
V 346
X
V 67
X
( i  1, 2 ,3 , 4 ,5 , 6 , 7 ,8 )
7
X5
6
V 568
X8
統計力学:1体分布関数
確率推論:信念(Belief)
8
クラスター変分法
確率推論と確率モデル
D f P 

X
 f X 

f ( X ) ln 
 PX  
 f X   0



  f ( X )  1
 X

X1
X3
X
V 25
4
V 346
X
X \X
X5
6
V 568
V 67
f ( X 1, X 2 , X 3, X 4 , X 5 , X 6 , X 7 , X 8 )

2
V 24
V 13
 P ( X ) :周辺確率分布
P ( X  ) 
X
X
X8
7
P568 ( X 5 , X 6 , X 8 ) P346 ( X 3 , X 4 , X 5 ) P67 ( X 6 , X 7 )
2
P6 ( X 6 ) P5 ( X 5 ) P4 ( X 4 )
X1
X
V 24
V 13

P25 ( X 2 , X 5 ) P24 ( X 2 , X 4 ) P13 ( X 1 , X 3 )
P3 ( X 3 ) P2 ( X 2 )
D  f P   D 13  D 346  D 24  D 25  D 67  D 568
 D 3  D 4  D 5  2 D 6  ln Z
X
3
X
3
X
X
X
2
4
X
X
3
4
X
X
6
X
6
X
6
V 67
5
X
6
5
V 568
X
7
5
X
V 346
X
2
V 25
4
X
X
2
8
9
クラスター変分法
クラスター変分法の戦略
•確率分布を少数ノードからなるクラスターに
対する周辺確率分布の積の形に近似する.そ
の近似形と元々の確率分布の間のKL情報量の
表式を考える.
D  f P   D 13  D 346  D 24  D 25  D 67  D 568
 D 3  D 4  D 5  2 D 6  ln Z
X1
X
2
V 24
V 13
X3
X
V 25
4
V 346
X6
V 67
X7
X5
V 568
X8
•各クラスターγに対する周辺確率分布Pγ(Xγ)P2 ( X 2 )   P24 ( X 2 , X 4 )
X4
を その規格化条件とReducibility を拘束条
  P25 ( X 2 , X 5 )
件として D[P|f] を最小にするように変分原
X5
理によって決定する.(注意:f(X) の規格化条件
ΣX f(X)=1 は要請しない変分で得られた f(X) が
D[P|f]≧0 を満たす保証はなくなる.)

10
確率伝搬型アルゴリズム
クラスター変分法における
KL情報量の極値条件
Z6
m 6  346 ( x 6 ) 
X1
X
X3
X
X
6

Z 346
4
x3 x 4
2
V ( x6 | x3 , x 4 )






m
(
x
)
m
(
x
)
3  13
3
4  24
4 

m 113 ( x1 )
m 4  24 ( x 4 )
m 6  346 ( x 6 )
統計力学:有効場
確率的推論:Message
11
確率伝搬型アルゴリズム
Message による周辺確率分布の表現
P346 ( x 3 , x 4 , x 6 ) 
1
V ( x 6 | x 3 , x 4 ) m 3  13 ( x 3 )
Z 346
 m 4  24 ( x 4 ) m 6  67 ( x 6 ) m 6  568 ( x 6 )
X1
X
X3
X
2
4
V 346
X
X
7
X5
6
X8
12
確率伝搬型アルゴリズム
ここまでで何が得られた
か?
P13 ( x1 , x 3 )
X1
X
V 24
V 13
X3
X
V 25
4
V 346
X
V 67
X
P24 ( x 2 , x 4 )
2
7
P346 ( x 3 , x 4 , x 6 )
P25 ( x 2 , x 5 )
X5
6
V 568
X8
P568 ( x 5 , x 6 , x 8 )
P67 ( x 6 , x 7 )
Reducibility により各ノードごとの Belief を
計算できる.
13
線形応答理論
線形応答理論とクラスター変分法
XiX
j
 Xi
XiX
j

X
j

 
 lim 
hi  0  h
 i

 X i X j P( X )
X j exp  h i X i  P ( X )  

X

 exp hi X i P ( X )  
X


Xi 

X iP(X )
X
X
確率モデル exp  hX





i
P  X 
に対して X
j
の期待値
をクラスター変分法により計算することにより右辺の計算
が可能.
14
数値実験
周辺確率分布
P3 (  1)  0 . 9896
P3 (  1)  0 . 0104
P5 (  1)  0 . 5500
P5 (  1)  0 . 4500
P8 (  1)  0 . 5607
P8 (  1)  0 . 4393
P3 (  1)  0 . 9896
P3 (  1)  0 . 0104
P5 (  1)  0 . 5500
P5 (  1)  0 . 4500
P8 (  1)  0 . 5640
P8 (  1)  0 . 4360
Cluster Variation
Method
Exact
X1
X
V 24
V 13
X3
X
V 25
4
V 346
X6
V 67
X7
2
X5
V 568
X8
15
数値実験
相関関数
X 1 X 6  0 . 8544
X 2 X 6  0 . 0890
X 2 X 7  0 . 0828
X 3 X 8  0 . 1334
X 1 X 6  0 . 8544
X 2 X 6  0 . 0890
X 2 X 7  0 . 0828
X 3 X 8  0 . 1402
Cluster Variation
Method
Exact
X1
X
V 24
V 13
X3
X
V 25
4
V 346
X6
V 67
X7
2
X5
V 568
X8
16
まとめ
要約
確率的情報処理に対する確率伝搬アルゴリ
ズムをクラスター変分法により構成し,更
に線形応答理論を用いて相関関数の計算手
法の定式化へと発展させた.
今後の課題
1. 機械学習等への応用
2. プログラム構成の完全自動化
17