Transcript PPT
物理フラクチュオマティクス論
Physical Fluctuomatics
第10回 確率伝搬法
10th Belief propagation
東北大学 大学院情報科学研究科 応用情報科学専攻
田中 和之(Kazuyuki Tanaka)
[email protected]
http://www.smapip.is.tohoku.ac.jp/~kazu/
本講義のWebpage:
http://www.smapip.is.tohoku.ac.jp/~kazu/PhysicalFluctuomatics/2007/
12 June, 2007
物理フラクチュオマティクス論(東北大)
1
今回の講義の講義ノート
田中和之著:確率モデルによる画像処理技術入門,
第8章,森北出版,2006.
参考文献
J. Pearl: Probabilistic Reasoning in Intelligent Systems:
Networks of Plausible Inference, Morgan Kaufmann,
1988.
汪金芳, 田栗正章, 手塚集, 樺島祥介, 上田修功: 統計
科学のフロンティア/計算統計 I ---確率計算の新しい手
法, 岩波書店, 2003.
12 June, 2007
物理フラクチュオマティクス論(東北大)
2
計算困難のポイントは何か
2L 通りの和が計算できるか?
x 1 T, F x 2 T, F
f x1 , x 2 , , x L
a 0;
for( x1 T or F){
for( x 2 T or F){
x L T, F
for( x L T or F){
a a f x1 , x 2 , , x L ;
このプログラムでは
L=10個のノードで1秒かかるとしたら
L=20個で約17分,
L=30個で約12日,
L=40個で約34年かかる.
厳密に計算するのは一部の特殊な例を
除いて難しい.
マルコフ連鎖モンテカルロ法
確率伝搬法
12 June, 2007
}
}
}
L 重ループ
今回
次回
物理フラクチュオマティクス論(東北大)
3
確率モデルと確率伝搬法
ベイジアンネットワーク
ベイズの公式
確率モデル
確率的情報処理
確率伝搬法
(Belief Propagation)
J. Pearl: Probabilistic Reasoning in Intelligent Systems:
Networks of Plausible Inference (Morgan Kaufmann, 1988).
C. Berrou and A. Glavieux: Near optimum error correcting
coding and decoding: Turbo-codes, IEEE Trans. Comm., 44
(1996).
12 June, 2007
物理フラクチュオマティクス論(東北大)
4
確率伝搬法の定式化
確率伝搬法と平均場理論の類似性の指摘
Y. Kabashima and D. Saad, Belief propagation vs. TAP for decoding
corrupted messages, Europhys. Lett. 44 (1998).
M. Opper and D. Saad (eds), Advanced Mean Field Methods
---Theory and Practice (MIT Press, 2001).
一般化された確率伝搬法の提案
S. Yedidia, W. T. Freeman and Y. Weiss: Constructing free-energy
approximations and generalized belief propagation algorithms,
IEEE Transactions on Information Theory, 51 (2005).
確率伝搬法の情報幾何的解釈
S. Ikeda, T. Tanaka and S. Amari: Stochastic reasoning, free energy,
and information geometry, Neural Computation, 16 (2004).
12 June, 2007
物理フラクチュオマティクス論(東北大)
5
統計物理学による確率伝搬法の一般化
一般化された確率伝搬法
J. S. Yedidia, W. T. Freeman and Y. Weiss: Constructing free-energy
approximations and generalized belief propagation algorithms,
IEEE Transactions on Information Theory, 51 (2005).
クラスター変分法という統計物理学の手法
がその一般化の鍵
R. Kikuchi: A theory of cooperative phenomena, Phys. Rev., 81
(1951).
T. Morita: Cluster variation method of cooperative phenomena and
its generalization I, J. Phys. Soc. Jpn, 12 (1957).
12 June, 2007
物理フラクチュオマティクス論(東北大)
6
確率伝搬法の統計物理学的位置付け
木構造を持つグラフィカルモデルではベーテ近似
は転送行列法と等価である.
閉路を持つグラフィカルモデル上のベイジアンネットでの確率伝
搬法はベーテ近似またはその拡張版であるクラスター変分法に
等価である(Yedidia, Weiss and Freeman, NIPS2000).
転送行列法
||(木構造)
もともとの確率伝搬法
ベーテ近似
クラスター変分法
(菊池近似)
一般化された確率伝搬法
12 June, 2007
物理フラクチュオマティクス論(東北大)
7
一般化された確率伝搬法の応用範囲
Image Processing
K. Tanaka: Statistical-mechanical approach to image processing (Topical Review), J.
Phys. A, 35 (2002).
A. S. Willsky: Multiresolution Markov Models for Signal and Image Processing,
Proceedings of IEEE, 90 (2002).
Low Density Parity Check Codes
Y. Kabashima and D. Saad: Statistical mechanics of low-density parity-check codes
(Topical Review), J. Phys. A, 37 (2004).
S. Ikeda, T. Tanaka and S. Amari: Information geometry of turbo and low-density paritycheck codes, IEEE Transactions on Information Theory, 50 (2004).
CDMA Multiuser Detection Algorithm
Y. Kabashima: A CDMA multiuser detection algorithm on the basis of belief propagation,
J. Phys. A, 36 (2003).
T. Tanaka and M. Okada: Approximate Belief propagation, density evolution, and
statistical neurodynamics for CDMA multiuser detection, IEEE Transactions on
Information Theory, 51 (2005).
Satisfability Problem
O. C. Martin, R. Monasson, R. Zecchina: Statistical mechanics methods and phase
transitions in optimization problems, Theoretical Computer Science, 265 (2001).
M. Mezard, G. Parisi, R. Zecchina: Analytic and algorithmic solution of random
satisfability problems, Science, 297 (2002).
12 June, 2007
物理フラクチュオマティクス論(東北大)
8
確率的情報処理における計算困難の打破の戦略
P1 x1
x 2 T, F x 3 T, F
P x , x
1
2
, , xL
x L T, F
を厳密に計算するのは一部の特殊な例を除いて難しい.
一部の特殊な例とは何か?
一部の特殊な例に適用できるアルゴリズムを一般
の場合に近似アルゴリズムとして適用できるか.
→ アルゴリズム化できるか?動くか?
精度はどの程度か?
12 June, 2007
物理フラクチュオマティクス論(東北大)
9
確率伝搬法 (Belief Propagation)
閉路のないグラフ上の確率モデル
どの枝もそれぞれで独立に和がとれる.
A a , x B ( b , x ) C ( c , x ) D ( d , x )
a
b
x
a
b
c
d
A (a , x ) B (b , x ) C (c , x ) D (d , x )
a
b
c
d
c
d
閉路のあるグラフ上の確率モデル
それぞれで独立に和をとることが困難.
a
b
x
c
W a , b , c , d , x
a
b
c
d
d
12 June, 2007
物理フラクチュオマティクス論(東北大)
10
確率伝搬法 (Belief Propagation)
閉路のないグラフ上の確率モデル
P a , b , c , d , x1 , x 2
W A a , x1 W B b , x1 W 12 x1 , x 2 W C c , x 2 W d , x 2
a
4b
3
2
1
6
d
12 June, 2007
5
x3 a
x4 b
x5 c
x6 d
c
物理フラクチュオマティクス論(東北大)
11
確率伝搬法 (Belief Propagation)
閉路のないグラフ上の確率モデル
W A a , x1
a
W B b , x1
a
3
1
6
d
W C c , x 2
12 June, 2007
4b
1 1
2
5
2
1
6
W 12 x1 , x 2
2
2
4b
3
c
d
5
c
P a , b , c , d , x1 , x 2
W A a , x1 W B b , x1
W D d , x 2 W x , x W c , x W d , x
12
1
2
C
2
2
物理フラクチュオマティクス論(東北大)
12
閉路のないグラフ上の確率モデル
P12 x1 , x 2
P a , b , c , d , x , x
1
2
a, b, c, d
M 3 1 x1 M 4 1 x1 W 12 x1 , x 2 M 6 2 x 2 M 5 2 x 2
M 3 1 x1
a
W a , x
A
1
a
4b
3
M 5 2 x 2
6
d
12 June, 2007
1
5
c
W b , x
B
1
b
W c , x
C
2
c
2
M 4 1 x1
M 6 2 x2
W d , x
D
2
d
ノード1と2の周辺確率分布は
それぞれ隣接するノードから伝搬され
るメッセージの積により表される.
物理フラクチュオマティクス論(東北大)
13
確率伝搬法 (Belief Propagation)
閉路のないグラフ上の確率モデル
M 1 2 x 2
W x , x W a , x W b , x
12
1
2
W x , x M
31
x1
4b
3
2
6
d
12 June, 2007
1
5
c
1
B
1
b
12
x1
a
a
A
1
2
x1 M 4 1 x1
ノード1から隣接ノード2に伝搬するメッセージは(ノー
ド2を除く)ノード1の隣接ノードからノード1に伝搬され
るメッセージの積により表される.
M M
メッセージに対する固定点方程式
(Message Passing Rule)
物理フラクチュオマティクス論(東北大)
14
転送行列法=確率伝搬法(1)
1次元鎖
N 1
1
Pr X x
W i,i 1 xi , xi 1
Z
i 1
k 1
L k 1 k x k W i,i 1 xi , xi 1
x1 x 2
x k 1 i 1
R k 1 k x k
x k 1
12 June, 2007
N 1
W i , i 1 x i , x i 1
xk2
x N 1 i k
物理フラクチュオマティクス論(東北大)
L k 1 k x k
k
R k 1 k x k
k
15
転送行列法=確率伝搬法(2)
パスはひ
とつ
漸化式
Lk k 1 x k 1
L k 1 k x k
L k 1 k x k W k , k 1 x k , x k 1
k
xk
R k k 1 x k 1
Lk k 1 x k 1
k 1
W k 1, k x k 1 , x k R k 1 k x k
k 1
xk
k
R k k 1 x k 1 R k 1 k x k
Pr X m x m
x1 x 2
x m 1 x m 1 x m 2
Pr X x
x N 1
L m 1 m x m R m 1 m x m
L m 1 m x m R m 1 m x m
xm
12 June, 2007
物理フラクチュオマティクス論(東北大)
16
閉路のないグラフ上の確率伝搬法
N 1
1
Pr X x
W i,i 1 xi , xi 1
Z
i 1
X1
X2
X3
X k 1
X k 3
Xk
閉路が無い
ことが重要!!
X k 1
X k 2
同じノードは2度通らない
k
M k k 1 x k 1 W i,i 1 xi , xi 1
x1 x 2
x k i 1
M k 1 k x k M k 2 k x k M k 3 k x k W k , k 1 x k , x k 1
xk
12 June, 2007
物理フラクチュオマティクス論(東北大)
17
確率伝搬法
閉路のあるグラフ上の確率モデル
P x P x1 , x 2 , , x L
ij x i , x j
ij B
B:すべてのリンクの集合
P1 x1
P x , x
1
x2
3
4
1
2
x3
2
, x3 , , x L
xL
x1 M 3 1 x1 M 4 1 x1 M 5 1 x1
M 2 1 z 1 M 3 1 z 1 M 4 1 z 1 M 5 1 z 1
M
21
z1
5
12 June, 2007
物理フラクチュオマティクス論(東北大)
18
閉路のあるグラフ上の確率モデル
W 12 z1 , x 2 M 3 1 z1 M 4 1 z1 M 5 1 z1
M 1 2 x 2
z1
W 12 z1 , z 2 M 3 1 z1 M 4 1 z1 M 5 1 z1
z1 z 2
3
4
1
5
2
閉路のあるグラフ上でも局所的な
構造だけに着目してアルゴリムを
構成することは可能.
ただし,得られる結果は厳密では
なく近似アルゴリズム
M M
12 June, 2007
メッセージに対する固
定点方程式
物理フラクチュオマティクス論(東北大)
19
固定点方程式と反復法
M
固定点方程式
反復法
*
M
*
繰り返し出力を入力に入れることにより,
固定点方程式の解が数値的に得られる.
M1 M0
M 2 M1
M3 M2
y x
y
M1
0
y ( x)
M
*
M1
M0
x
12 June, 2007
物理フラクチュオマティクス論(東北大)
20
確率伝搬法の情報論的解釈(1)
Kullback-Leibler Divergence
Qx
0
D Q P Q ( x ) ln
x
Px
Q x P x D Q P 0
D [Q | P ]
Q x 0 ,
Q ( x ) 1
x
P x1 , x 2 , , x L
1
Z
W x , x
ij
i
j
ij N
Q ( x ) ln W x , x Q ( x ) ln Q x ln
ij
i
j
ij N
x
x
F [Q ]
F [ Q ] ln Z
Free Energy
Z
W x , x
ij
x
i
j
ij N
min F [ Q ] Q x 1 F [ P ] ln Z
Q
x
12 June, 2007
物理フラクチュオマティクス論(東北大)
21
Z
確率伝搬法の情報論的解釈(2)
Qx
0
D Q P Q ( x ) ln
x
Px
Px
1
Z
W ij x i , x j
ij B
Free Energy
KL Divergence
D Q P F Q ln Z
F Q
Q ( x ) ln W ij x i , x j Q ( x ) ln Q x
x
ij B
x
Q ( x ) ln W ij x i , x j Q ( x ) ln Q x
ij B x i x j x \ x i , x j
x
Q ij ( x i , x j )
Q(x)
x \ xi , x j
12 June, 2007
Q ij x i , x j ln W ij x i , x j Q ( x ) ln Q x
ij B x i x j
物理フラクチュオマティクス論(東北大)
x
22
確率伝搬法の情報論的解釈(3)
Free Energy
KL Divergence
D Q P F Q ln Z
F Q
Q ij , ln W ij ,
ij B
Q ( x ) ln Q x
Q i ( xi )
Z
W ij x i , x j
ij B
Q(x)
x \ xi
Q ij ( x i , x j )
x
Px
1
Q ij , ln W ij ,
Q i ln Q i
Q( x)
x \ xi , x j
ij B
i
Bethe Free
Energy
Q ij , ln Q ij , Q i ln Q i Q j ln Q j
ij B
12 June, 2007
物理フラクチュオマティクス論(東北大)
23
確率伝搬法の情報論的解釈(4)
D Q P F Bethe
F Bethe
Q , Q ln Z
i
ij
Q i , Q ij Q ij , ln W ij , Q i ln Q i
ij B
i
arg min D Q P arg min F
Q
Q
Q ij , ln Q ij , Q i ln Q i Q j ln Q j
ij B
arg min D Q P arg min F Bethe Q i , Q ij
Q i , Q ij
Q
Q Q , 1
i
12 June, 2007
ij
Q i
Q ,
ij
物理フラクチュオマティクス論(東北大)
24
確率伝搬法の情報論的解釈(5)
arg min FBethe Q i , Q ij Q i
Q i , Q ij
Q , , Q
ij
i
Q ij , 1
Lagrange Multipliers to ensure the constraints
L Bethe
Q i , Q ij F Bethe Q i , Q ij
i , j Q i Q ij ,
i j B i
i Q i 1 ij Q ij , 1
i
ij B
12 June, 2007
物理フラクチュオマティクス論(東北大)
25
確率伝搬法の情報論的解釈(6)
L Bethe
Q i , Q ij F Bethe Q i , Q ij
i , j Q i Q ij ,
i j B i
i Q i 1 ij Q ij , 1
i
ij B
Q ij , ln W ij , Q i ln Q i
ij B
i
Q ij , ln Q ij , Q i ln Q i Q j ln Q j
ij B
i , j Q i Q ij ,
i j B i
i Q i 1 ij Q ij , 1
i
ij B
Extremum Condition
Q i xi
12 June, 2007
L Bethe Q i , Q ij 0
Q ij x i , x j
物理フラクチュオマティクス論(東北大)
L Bethe Q i , Q ij 0
26
確率伝搬法の情報論的解釈(7)
Q i xi
L Bethe Q i , Q ij 0
M 3 1
4
M 4 1
Q ij x i , x j
3
1
M 3 1
M 2 1
2
4
M 4 1
1
5
1
Z1
M
M 2 1 x1 M 3 1 x1
41
12 June, 2007
3
W 12
x1 M 5 1 x1
1
Z 12
2
Condition
8 2
M 7 2
7
M 6 2
5
Q 12 x1 , x 2
8M
M 5 1
M 5 1
Q 1 x1
L Bethe Q i , Q ij 0
Extremum
6
M 3 1 x1 M 4 1 x1 M 5 1 x1
W 12 x1 , x 2 M 6 2 x 2 M 7 2 x 2 M 8 2 x 2
物理フラクチュオマティクス論(東北大)
27
確率伝搬法の情報論的解釈(8)
Q 1
Q 12 ,
M 1 2
W , M
12
31
M
41
M 5 1
Message Update Rule
M 3 1
4
M 4 1
3
M 3 1
M 2 1
1
2
4
M 4 1
1
Z1
M
M 2 1 x1 M 3 1 x1
41
12 June, 2007
W 12
x1 M 5 1 x1
Q 12 x1 , x 2
1
Z 12
2
8 2
M 7 2
7
M 6 2
5
5
1
8M
M 5 1
M 5 1
Q 1 x1
3
6
M 3 1 x1 M 4 1 x1 M 5 1 x1
W 12 x1 , x 2 M 6 2 x 2 M 7 2 x 2 M 8 2 x 2
物理フラクチュオマティクス論(東北大)
28
確率伝搬法の情報論的解釈(9)
M 1 2
W12 , M 3 1 M 4 1 M 5 1
W12 , M 3 1 M 4 1 M 5 1
Message Passing Rule of
Belief Propagation
M 3 1
4
M 4 1
M 1 2
2
1
2
5
6
7
3
M 5 1
5
これはクラスター変分法のなかでも
ベーテ近似になる.
12 June, 2007
8
a2
4
3
1
3
=
4
物理フラクチュオマティクス論(東北大)
1
2
5
29
イジング模型の確率変数の期待値
P (a )
N
lim
N
N
1
exp
(
a
a
a
a
)
x , y x 1, y
x, y x, y 1
T
x 1 y 1
N
N
1
exp
( a x , y a x 1, y a x , y a x , y 1 )
T
a
x
1
y
1
(a)
(b)
(c)
(d)
a x, y P (a )
a
平均場近似(ワイス近似)
ベーテ近似
クラスター変分法(菊池近似)
厳密解(L. Onsager)
a x, y 1
T
12 June, 2007
物理フラクチュオマティクス論(東北大)
30
本日のまとめ
確率伝搬法
転送行列法
ベーテ近似・クラスター変分法
反復法
次回
第11回 物理モデルから見た確率的画像処理
第12回 物理モデルから見た確率推論 ---ベイジアンネット
12 June, 2007
物理フラクチュオマティクス論(東北大)
31
演習問題10-1
確率変数 a, b, c, d, x, y の確率分布 P(a,b,c,d,x,y) を考える.
P a,b,c,d,x , x W A a , x W B b , x W XY x , y W C c , y W D d , y
確率変数 x, y の周辺確率分布 PXY(x,y) が次のように与え
られることを示せ.
P XY x , y
P a,b,c,d,x
a
b
c
, y
d
M A X x M B X x W XY x , y M C 2 y M D 2 y
M A X x
W A a , x
M B X x
a
M C Y y
W C c , y
b
M D Y y
c
12 June, 2007
W B b , x
W D d , y
d
物理フラクチュオマティクス論(東北大)
32
演習問題10-2
以下の形に与えられる2つの周辺確率分布
Q 1 x1
1
Z1
M 2 1 x1 M 3 1 x 1 M 4 1 x1 M 5 1 x1
Q12 x1 , x 2
を
1
Z 12
Q 1 x1
M 3 1 x1 M 4 1 x1 M 5 1 x1 W 12 x1 , x 2 M 6 2 x 2 M 7 2 x 2 M 8 2 x 2
Q12 x1 , x 2 に代入することにより次の等式
x2
を導出せよ.
M 1 2 x 2
12 June, 2007
Z1
Z 12
W12 x1 , x 2 M 3 1 x1 M 4 1 x1 M 5 1 x1
x1
物理フラクチュオマティクス論(東北大)
33