Transcript konno4
「わかりやすいパターン認識」
第6章:特徴空間の変換
6・4:線形判別法
〔2クラスに対する線形判別法〕
線形判別法
• 特徴空間をより次元の小さい部分空間に
変換する方法。
• 2クラスに対する線系判別
→フィッシャーの線形判別法
・最適な1次元軸を求める
クラス内変動・クラス間変動
クラス i の変動を表す行列=変動行列
def
Si
Si
t
(
x
m
)(
x
m
)
i
i
xi
※
クラス内変動行列SW
def
mi クラスのパターン平均
ni クラスのパターン数
SW S1 S2 ( x mi )(x mi )
i 1, 2 xi
t
全クラスのパターン平均
m
クラス間変動行列 SB
n 全パターン数
def
n1n2
t
SB ni (mi m)(mi m)
(m1 m2 )(m1 m2 )t
n
i 1, 2
※
1次元空間への変換
d次元空間から1次元空間への変換行列をA(d、1)とし
yAx
t
と書く。
~は
変換後の平均 m
i
1
~
mi
ni
1
y
ni
y i
t
t
A
x
A
mi
xi
これより変換後のクラス内・間変動行列は以下のようになる
~ ~ ~
2
t
~
SW S1 S2 ( y m1 ) A SW A
11, 2 y i
n1n2 ~ ~ 2
~
2
t
~
~
SB ni (mi m)
(m1 m2 ) A SB A
n
i 1, 2
1次元空間での表記
~
変換後の変動行列 Si は
~ def
~ )2
Si ( y m
i
y i
~ と分散~2を用いてクラス
1次元空間におけるクラス平均 m
i
i
内・間変動行列を表すと以下のようになる。
~
2
2
~
~
SW n11 n2 2
n1n2 ~ ~ 2
~
2
2
~
~
~
~
SB n1 (m1 m) n2 (m2 m)
(m1 m2 )
n
フィッシャーの評価基準
2クラスがよく分離している時の条件
クラス間変動のクラス間変動に対する比が最大
↓
~
~ が大きい
SWが小さく S
B
クラス内変動・クラス間変動比 J s (A)
~
t
~ m
~ )2
SB
n1n2 (m
A
SB A
1
2
J s ( A) ~
t
~2 n
~2
n n1
A
SW A
SW
1
2 2
def
J s (A) →フィッシャーの評価基準
評価基準の最大化問題(1)
J S を最大にする A を求める問題は
~
SW At SW A I
という制約条件の下で
~
SB At SB A
を最大化する問題に帰着する。
評価基準の最大化問題(2)
def
J ( A) At SB A ( At SW A I )
をAで偏微分して0と置くと( はラグランジェ乗数)
SB A SW A
SWが正則ならば
(SW 1SB I ) A 0
SW 1S B の最大固有値を 1 とすると。
max{J S ( A)} 1
J S を最大にする Aは最大固有値 に対応
1
する固有ベクトルとしてもとまる。
nn
SW A SB A 1 2 (m1 m2 )(m1 m2 )t A
n
t
(m1 m2 ) A がスカラー量であることに注意すると
A SW1 (m1 m2 )
フィッシャーの法則の一般化(1)
変動行列の変わりに共分散行列 iと事前確率 P( i ) を用いる。
def
1
1
t
i
( x mi )(x mi ) Si
ni xi
ni
クラス内共分散行列 W とクラス間共分散行列 B
def
W
P( ) i
i 1, 2
i
1
P( i )
ni
i 1, 2
def
B
( x mi )(x mi )
x i
t
P( )(m m)(m m)
i 1, 2
i
i
t
i
P(1 ) P(2 )(m1 m2 )(m1 m2 )t
フィッシャーの法則の一般化(2)
~ ~
1次元空間に変換した後ので W , B は以下のようになる
~
~ 2 P( )
~2
W P(1 )
1
2
2
1
~
P( i) ( y mi )
ni y i
i 1, 2
At W A
~
~ m
~ )2
B P(1 ) P(2 )(m
1
2
P(1 ) P(2 ) At (m1 m2 )(m1 m2 )t A
At B A
評価関数
これも評価関数を J と置いて以下のように表せる。
~
t ~
def
A A
J ( A) ~ B t ~ B
W
A W A
これより残かいとまったく同じ手続きによって J (A) の最大値は
1
1
1
W
B
の最大固有値
に等しくその固有ベクトルが
を最大にする
A
となる。すなわち
max{J ( A)} 1
1
A W
(m1 m2 )
また全共分散行列 T W B を用いて以下のように表せる。
A T1 (m1 m2 )
マハラノビス汎距離
マハラノビス汎距離(DM (m1, m2 ) )は共分散行列の等しい2つの分
布の平均距離を表す量であり、以下のように表す
def
DM2 (m1, m2 ) (m1 m2 )t 1 (m1 m2 )
これの 1を W で置き換えることにより共分散行列異なる分
布の平均間距離に拡張することが出来る
1
マハラノビス汎距離
これに対して J S (A) と J (A) に以下の関係が成立する
n
~ m
~ )2
max{J S ( A)} DM2 (m1 , m2 ) (m
1
2
n1n2
max{J ( A)} 1 P(1 ) DM2 (m1 , m) P(2 ) DM2 (m2 , m)
となるので各クラスがそのクラスの事前確率を表していると仮
定した場合、つまり以下の式
n1
n2
P(1 ) , P(2 )
が成り立つ場合
n
n
1
1
W SW , B SB となるので
n
n
J ( A) J S ( A)