poster

Transcript poster

P039
領域ベースの隠れ変数を用いた
決定論的画像領域分割
三好誠司
岡田真人
関西大
東大，理研
あらまし
マルコフ確率場（MRF）とベイズ推定に基づく画
像処理においてエッジを保存・再現するために
は隠れ変数の導入が効果的である．領域ベー
スのポッツスピン型隠れ変数を導入したうえで，
原画像も隠れ変数として，変分推論法により画
像修復と領域分割を行うアルゴリズムを導出す
る．ガウス雑音が重畳した人工画像を用いた実
験により，このアルゴリズムが有効であり頑健
であることを明らかにする．
2
背景１
• 多数の変数とその変数間の無向性相互作用からな
る系はマルコフ確率場（MRF）と呼ばれ，画像の確率
モデルとして広く利用されている．
• MRFに基づく画像処理においては，ベイズの定理で
計算される事後分布を用いる推定（＝ベイズ推定）が
よく用いられるが，計算量的困難に直面することが多
い．
• MRFとベイズ推定に基づいた画像処理を行う場合，
画像の事前分布を素朴なガウス分布とすると画像中
のエッジの表現が難しい．
• エッジを表現するためには事前分布に隠れ変数を導
入することが有効．
3
背景２
• 隠れ変数には境界ベースと領域ベースがある．
• 境界ベースは画素と画素の間に，そこがエッジで
あるかどうかを表す隠れ変数を置いてゆく．
• 領域ベースは各画素がどの領域に属するかを示
す隠れ変数を画素ごとに貼り付ける．
• 境界ベースの隠れ変数 → 多くの拘束条件が必要
• 領域ベースの隠れ変数 → 境界が自然に閉じた
ループになるなど好ましい性質を多く持つ．ただし，
局所解に陥りやすいという欠点があるため，あまり
使われていない．
4
背景３
• 画像をある一定の特徴を持つ小領域ごと
に分割する問題は領域分割（セグメンテー
ション）と呼ばれる
– 画像に含まれる対象物を抽出する手法
– 画像の認識や理解のための第一次画像処理
として重要
– 網膜という2次元センサーの信号から3次元の
現実世界を再構成するための第一歩でもある
ことから視覚の計算論の基礎としても重要
5
先行研究
D. Geman, S. Geman, Graffigne and Dong,
Boundary detection by constrained optimization,
IEEE trans. PAMI (1990)
MRFに領域ベースの隠れ変数を導入し，シミュレーテッドアニーリングを用いたモンテカルロ法
により画像領域分割を行った．
Bratsolis and Sigelle,
Image relaxation by use of the Potts model with a fast deterministic
method,
J. Opt. Soc. Am. A (1997)
ポッツスピンを領域ベースの隠れ変数（ラベル）に用いて平均場近似に基づく決定論的な手法
で画像領域分割を行った．画素値をラベルの初期値として用いた．
Chen, Tanaka and Horiguchi,
Image segmentation based on Bethe approximation for Gaussian
mixture model,
Interdisciplinary Information Sciences (2005)
ポッツスピンを領域ベースの隠れ変数（ラベル）に用いて確率伝搬法（ベーテ近似）による決定
論的な手法で画像領域分割を行った．混合ガウスモデルを仮定し，そのハイパーパラメータ推
定も行った．隠れ変数はラベルのみであり，同一ラベル領域内は画素値一様として推定．
6
目的
• ポッツスピン型ラベルKと原画像sの両方を隠
れ変数とし，変分法に基づく推論により画像
修復と領域分割を行う決定論的アルゴリズム
を導出する．
• ガウス雑音を重畳した人工画像に適用した結
果について報告する．
7
アルゴリズム導出の概略
同時事前分布p(x,s,K)から事後分布p(s,K|x)を求める
１．同時事前分布p(x,s,K)
２．因子化仮定
を満たす試験分布q
の中からp(s,K|x)にもっとも近いものを探す（変分推論）
8
アルゴリズム導出の詳細
観測画像
Nは画素数
原画像
領域ベースの
隠れ変数
Dはポッツスピン
の次元
ポッツスピン
xi は観測データ，siとki は隠れ変数
9
同時事前分布p(x,s,K)
ボルツマン分布
隣接する画素lとmの隠れ変数が
異なるなら定数λ，
等しいなら隣接画素の差が小さいほどエネルギー小
エネルギー関数
画素すべて
に関する和
隣り合う画素対
すべてに関する和
観測画像xと原画像sが
近いほどエネルギー小
10
式を整理すると・・・
ガウス分布
ガウス分布
ベルヌーイ分布
画素 i に隣接する画素の集合
11
変分法を用いてp(s,K|x)を近似的に求める
とおくと一般に
s,Kに関して定数
∴ KL距離が最小という意味で事後分布p(s,K|x)に
もっとも近い試験分布q(s,K)を求めるためには，
L(q(s,K))を最大化するようなq(s,K)を見つければよい！
12
一般のq(s,K)のままでは計算が困難なので因子化仮定をおく
L(q(s,K))を最大にするq(s), qi(ki)を変分法を用いて求めると
13
q*(s), qi*(ki)を具体的に計算すると，
ポッツスピンの平均値に関するself-consistentな方程式
反復法
で解く
反
復
14
ガウスノイズ
原画像s
観測画像x
（PSNR=18dB）
実験結果１
x の画素値ヒストグラム
（閾値だけでは領域分割不可）
(ε=0.5, ρ=130, λ=0.2)
修復画像
大きなオーバーラップがあり，閾値だけでは領域分割不可な画像に対して
15
良好な領域分割 → このアルゴリズムは有効であり頑健である
ガウスノイズ
原画像s
（グラデーション有り）
観測画像x
（PSNR=18dB）
実験結果２
x の画素値ヒストグラム
（閾値だけでは領域分割不可）
(ε=0.5, ρ=130, λ=0.1)
修復画像
原画像のグラデーション再現と領域分割を同時に実現！
16
まとめ
• 領域ベースのポッツスピン型ラベルと原画像の両方を
隠れ変数とし，変分法に基づく推論により画像修復と
画像領域分割を行う決定論的アルゴリズムを導出した．
• 雑音を重畳した人工画像に適用し，良好な画像修復と
領域分割が行えることを示した．
今後の課題
• ポッツスピンの次元Dやハイパーパラメータε，ρ，λの自
動設定
17

poster

Transcript poster

Directory