ppt

Transcript ppt

６．混合分布
『分布を混ぜる．』とはどんな考えだろうか？
例えば，血が混じる，混血とはどう違うのだろうか？
混合分布モデルの説明は意外と難しい．この困難さを乗り越
えて７章，８章で展開されるパタン認識の問題の理解の
ひとつの礎になることを目指す。
江口真透
要論Ｂ講義日程
１２/１８
１２/１９
１２/２０
１２/２１
１． Overview，ニューラルネット
（福水）
２．グラフィカルモデル
（土谷）
３．主成分分析
（南）
４．独立成分分析
（南）
５．射影追跡法、層別逆回帰分析
（栗木）
６．混合分布
（江口）
７．サポートベクター，ロジスティック（江口）
８．Ｂｏｏｓｔｉｎｇ
（福水）
混合分布
確率モデルとして，分布が混合されることのクリアな説明を試みる．
○ 潜在変量＝グループ・ラベルの理解
○ 最尤推定値を求める EM アルゴリズムの紹介
○ 例題として，神経回路の量子解析のシナプス可塑性
サポートベクター
分類の問題を考えるとき，確率モデルを考える必要性をする．
確率モデルは混合分布モデルの類似性から導入する．
○ ベイズルールの最適性を示す．
○ パラメトリックモデル，特に線形モデルを仮定して，プラグインルールの説明をする．
このフレイムワークの下でロジスティック判別は自然に導入されることを示す．
○ トレーニング・ロス，汎化誤差の説明をする．
○ サポートベクター・マシンの説明
○ VC次元の説明
○ カーネル法の説明
混合分布モデル
混合比
成分分布
混合分布
パラメーター
の次元は，d R + ( R－1) である。ここで d はの次元を表す．
分布を混ぜるって何？
1-成分
・
・
・・
r-成分
・
・
・
R-成分
次の設定で，正規分布を混ぜてみよう
パラメータの次元は 7
0.175
0.15
0.125
0.1
0.075
0.05
0.025
-6
-4
-2
１
24 412343344
2
２
３
4
6
４
8
前の設定で，２次元正規分布を混ぜてみよう
パラメータの次元は 11
0.06
0.04
0.02
5
0
0
-5
0
5
-5
0.06
0.04
5
0.02
0
0
-5
0
5
-5
混合分布モデル
混合比
成分分布
混合分布
ダミー（潜在）変数 Z の導入
x が与えられた時の Z = r の条件付密度は，
ＥＭアルゴリズムはこの性質を利用して作られる．
最尤推定
パラメータ
データ
が得られたら
の最尤推定が実行できる
EM アルゴリズム
初期点:
E- ステップ:
M- ステップ:
, データ
２次元正規混合（ガウシアンミクスチヤ－）
２次元ガウス分布
n(x, μ,V ) 
1
d
2
2  det V 
1
2
 1

exp  x  μ T V 1 x  μ , (d  2)
 2

３成分ミクスチュアー分布
p(x,  )  p1n(x, μ1 ,V1 )  p2 n(x, μ 2 ,V2 )  p3n(x, μ3 ,V3 )
 p1   0.2 
   
 p2    0.3 
 p   0.5 
 3  




 μ1 ,V  


μ
,
V
 2 
 μ ,V  
 3 3 



1
  2
0
  2 ,

 
0
 1.98
0 , 
 
 0.36
 2 ,
1.25
2 
 1 .2
 





 0.36 


1 

1.2  
2.21 

0
1
0.08
0.08
0.08
0.06
0.06
0.06
0.04
4
0.02
2
0.04
4 0.04
0.02
0.02
0
2
0
0
-5
-2.5
2.5
2
0
0
-5
-2.5
-2
0
4
2.5
-4
-2.5
-2
0
0
-5
2.5
-4
5
-2
0
-4
5
5
0.08
0.08
0.06
5
0.04
0.02
2.5
0
0
-5
-2.5
0
5
-5
0.06
0.04
4
0.02
2
0
0
-5
-2.5
-2
0
2.5
-4
5
３成分ミクスチュアー
条件付き分布
1
1
1
0.75
0.75
0.5
4
0.25
0
2
0
-5
-2.5
-2
0
2.5
-4
5
0.75
0.5
0.5
0.25
0
2
0
-5
-2.5
-2
0
4
4 0.25
0
2
0
-5
-2.5
-2
0
2.5
2.5
-4
5
-4
5
4
2
-6
-4
-2
2
-2
-4
4
6
1
0.8
0.6
0.4
0.2
20
40
60
80
100
カーネル型密度推定
1
K h (x) 
h
x

f 
h
1
pˆ h ( x ) 
n
n

i 1
1
h

 x  xi
f
 h
1
f (t) 
d
2
 
h：バンド幅

,

(
exp 
( 2 ) det( S )
n
x i i 1
カーネル関数
1 T 1
t S t
2
)
～ p( x )
pˆ h (x )  p(x ) a.e. x
if
n  , h  0
2
1.5
4
1
0.5
2
0
0
-5
-2.5
-2
0
2.5
-4
5
カーネル型密度推定
1 n 1  x  xi 
pˆ h (x )   f 

n i1 h  h 
EMアルゴリズム
１．初期値




0  




２．条件付き確率
p ( Z  r | x, θ 0 ) 

を計算する




,





pr n(x, μ r ( 0) ,Vr (0) )
pr det(Vr

s

 0.33


 0.33


 0.34


pmix (x, θ0 )
1
( 0)  2
)
p s det(Vs









( r  1, 2, 3 )
1
( x  μ r ( 0) )Vr ( 0) 1 ( x  μ r ( 0) )
2
1
exp  ( x  μ s ( 0) )Vs ( 0) 1 ( x  μ s ( 0) )
2
(
exp 
1
( 0)  2
)
0
0
 
0
1
 
1
0
 
(
)
)
３
更新値
 p1(1)   μ1 ,V 

 (1)  
θ1   p2 ,  μ2 ,V 
 p3(1)   μ3 ,V3 



を
n

1
p( Z  r | x i , θ 0 )
 pr (1) 
n i 1


n
1

(1)
μ

x i p( Z  r | x i , θ 0 )

r
(1)
npr i 1


n
(1)
(1)
 V (1)  1
p
(
Z

r
|
x
,
θ
)
x

μ
x

μ
i 0
i
r
i
r
(1)
 r
npr i 1




4 反復
θ0  θ1


とおいて，ステップ２に戻る

T











計算する
0.1
0.075
0.05
0.025
0.08
0.06
0.04
0.02
0
4
2
0
0
-5
2
0
-5
-2.5
-2.5
-2
0
2.5
0.08
0.06
0.04
0.02
0
4
-2.5
2.5
-4
0
-5
-2
0
4
2
-4
-2
0
5
5
2.5
-4
5
反復数１１
反復数１
0.08
0.06
0.04
0.02
0
0.08
0.06
0.04
0.02
0
4
2
0
-5
-2.5
2.5
4
2
0.08
0.06
0.04
0.02
0
0
-5
-2
0
反復数２１
-2.5
2.5
5
0
-5
-2.5
-2
0
-4
4
2
-2
0
2.5
-4
5
反復数３１
反復数４１
0.075
-4
5
反復数５１
0.1
0.05
4
0.025
2
0
0
-5
-2.5
-2
0
2.5
-4
5
反復数６１
0.075
0.075
4
0.05
0.025
2
0
0.05
4
0.025
2
0
0
-5
-2.5
-2
0
2.5
-4
5
反復数７１
0
-5
-2.5
-2
0
2.5
-4
5
反復数８１
同時モデル
ミクスチュアーモデル
次元
スコア‐
-600
-500
-400
-300
-200
-100 0 100
共同研究
吉岡耕一氏（東京医科歯科大学）
シナプス
受容体
まんが
日経２０００
『夢の技術展』@東京ビッグサイト
parallel fiber
Molecular
Layer
GABA
GABA
Basket
Cell
Granule
Cell
mossy fiber
b -agonists
5-HT
Glutamate
Purkinje Cell
Layer
Purkinje
Cell
Granular
Layer
climbing fiber
シナプチィック伝達の量子解析
p
N個
N
: 反応ユニットの総数
p
: 励起確率
q
: 量子反応サイズ
q
Nonparametric
Structural MLE (m=3.3, q=-53.1, sq2=54.5, sn2=103.0)
MPLE (R=9, l = 0.86; EDF = 6.1)
0.006
ACV
Components
1050
1045
1040
7
Density
0.005
8
9 10 11 12 13
R
0.004
0.003
0.002
0.001
0
0
-100
-200
-300
-400
-500
0
-100
-200
-300
-400
-500
Nonparametric
Structural MLE (m=3.3, q=-53.1, sq2=54.5, sn2=103.0)
MPLE (R=8, l = 0.72; EDF = 8.0)
ACV
Components
1050
0.006
1045
1040
7
Density
0.005
8
9 10 11 12 13
R
0.004
0.003
0.002
0.001
0
0
-100
-200
-300
-400
-500
0
-100
-200
-300
-400
-500
KLダイバージェンスの等高線
0
0.8
0.8
0.6
0.6
。
0
0.4
。
0.4
0.2
0.2
-1
-0.5

0
0.5
同時層別 D
(J)
1
-1
-0.5
0.5
 ミクスチュアー D
識別不能
 0
0
1
(M)
ＥＭの収束性
Ｗｕの十分条件：レベル集合
{    :  ( M ) ( )  c} が任意の c に対してコンパクト集合
の非成立．
正規混合モデル
 r st s r 2  0
In M- ステップ:
MLE density
  0 1  2 

1 2 
 02
2
2
 s 0 s 1 s 2 
0.2
0.15
E
0.1
0.05
-2
2
4
6
8
( 0)
M
  0 1  2 

1 2 
 02
2
2
 s 0 s 1 s 2 
(1)
s 02
true 0.5
mle 0.06
参考文献
[1] D.M. Titterington, A.F.M. Smith, U.E. Makov,
STATISTICAL ANALYSIS OF FINITE MIXTURE
DISTRIBUTIONS (1995) Wiley.
ISBN 0471907634
[2] J.W. Kay, D.M. Titterington, Statistics and Neural
Networks (1999) Oxford University Press.
ISBN
0198524226
[3] G. J. McLachlan, T. Krishnan,
The EM Algorithm and (1997) Wiley.
ISBN 0471123587
ISBN
0471006262
混合分布
確率モデルとして，分布が混合されることのクリアな説明を試みる．
○ 潜在変量＝属性ラベルの理解
○ 最尤推定値を求める EM アルゴリズムの紹介
○ 例題として，神経回路の量子解析のシナプス可塑性
混合分布から
分類の問題へ

ppt

Transcript ppt

Directory