PCAからICAへ?

Download Report

Transcript PCAからICAへ?

1
PCAからICAへ?
狩野裕+清水昌平
(大阪大学人間科学部)
日本行動計量学会:東京大学 平成12年10月
2
ICAとは (1)
• Independent Component Analysis
(独立成分分析)
• Jutten-Herault(1991):2つの音声を分離
• 情報検索によると
日本 海外
ICA:PCA=1:8(日本)
ICA:PCA=1:4(海外) ICA
23 2877
PCA
日本行動計量学会:東京大学 平成12年10月
176 11514
3
ICAとは (2)
• 成分が独立な多次元信号sを線型混合した
観測値 v から,s を再生するための方法
v(t )  A s(t )
(t  1,2,)
 s(t )  [s1 (t ),, sn (t )]T
 v(t )  [v1 (t ),, vm (t )]T
 A : m  n 混合行列
• v からAを推定し,s を再生する
日本行動計量学会:東京大学 平成12年10月
4
BSS と ICA
独立
• BSS
– Blind Source Separation
v(t )  A s(t )
音源S1

(t  1,2,)
音源Sn
aij
 s(t )  [s1 (t ),, sn (t )]T
 v(t )  [v1 (t ),, vm (t )]T
 A : m  n 混合行列
観測V1
日本行動計量学会:東京大学 平成12年10月

観測Vm
5
カクテルパーティー効果
周りの雑音に関係なく、会話できる。
♪
♪
♪
日本行動計量学会:東京大学 平成12年10月
6
カクテルパーティー効果とICA
• 音源の物理的な位置・音響
路の差異などの特性が違う
• 観測される信号の重なり方
が左右の耳で違う
• その違いから,ふたつの
信号を復元する
• ICAでは独立性を利用
障害物
音源1
日本行動計量学会:東京大学 平成12年10月
音源2
左
耳
人間
右
耳
7
実際のカクテルパーティー効果は
• 選択的注意
– ある情報を選択的に自覚した意識状態
• 話のコンテックスト
• 欠落音の補完
– 音の冗長性を利用
– 断片情報から全体を復元
日本行動計量学会:東京大学 平成12年10月
8
ICAの仮定
• 正規分布に従う独立成分は高々1つ
– s が正規分布だと分離不可能
– 非正規性に依拠する方法
• m≧n
– 観測変数の次元の方が大きい
– そうでないモデルもある
• 混合行列 A は full column rank
• その他
– E(s) = 0, V(s) = In, モーメント存在の条件
これらの下で A を一意に決定できる
日本行動計量学会:東京大学 平成12年10月
9
主成分の回転
V (v)  V ( As)  AAT
AATから Aを決定することはでき ない(回転の自由度)
• PCA....分散の大きな成分を抽出
• ICA....非正規性を最大にする成分を抽出
• ICAは高次統計量を用いた因子回転の一種
• なぜ,独立成分の抽出と非正規性最大化が
対応するのか?
日本行動計量学会:東京大学 平成12年10月
観測変数を球状化by PCA
10
非独
正立
max kurt(wT Mv)  max kurt(wT MAs) 規 成
w: w 1
w: w 1
性分
m
最
の
T
4
 max kurt(z s)  max  zi kurt(si )
z: z 1
z: z 1
大抽
i 1
化出
kurt(s1 )  ...  kurt(sm )とすると
と
T
最大化はz  [1,0,...,0] で達せられる.即ち
V (Mv)  MAAT M T  I n
尖度の最大化
max kurt(wT Mv)  s1
w: w 1
日本行動計量学会:東京大学 平成12年10月
11
独立成分の抽出と射影追跡
• 尖度の最大化 => 非正規独立成分の同定

4
4
max{kurt(s1 ), kurt(s2 )}  2max
kurt
(
z
s

z
1 1
2 s2 )
2
z1  z2 1
• 独立成分の和は非正規性を小さくする
• この同値性が独立成分抽出と非正規性
最大化を結ぶ
• ICAとPP(射影追跡)を結ぶ
日本行動計量学会:東京大学 平成12年10月

12
射影追跡(PP)
• データの興味深さ・面白さ
(interestingness)を表す軸(超平面 wTv)を
同定
• Interestingness を非正規性として捉える
• Freedman の指標・Hallの指標が有名
• 岩崎(1991)を参照
日本行動計量学会:東京大学 平成12年10月
13
ICAのプロセス
• ICAでは,非正規性の尺度を定めると,
それを最大化する wTMv によって独立
成分を同定することができる
• 2番目の独立成分は,s を取り除いてから
同プロセスを繰り返す
Mx  ws1  MAs  MAe1s1  MA[0, s2 ,..., sm ]T
日本行動計量学会:東京大学 平成12年10月
14
非正規性の尺度
• 尖度や高次キュムラント
– 外れ値に弱い
• Entropy 最小化
• Mutual Information 最小化
• PPで提案されている非正規性の尺度
日本行動計量学会:東京大学 平成12年10月
15
Entropy 最小化
y  wT Mv
 w  1
pdf of y ..... f ( y)
z~N (0,1)

entropy of y ..... H ( y)   f ( y) log f ( y)dy
negentropyof y ..... J ( y)  H ( z)  H ( y)
max J ( y)
w
日本行動計量学会:東京大学 平成12年10月
 0
16
Negentropy の近似
Jones  Sibson(1987)
1
1
3 2
2
J ( y) 
E[ y ]  kurt( y)
12
48
Hyvarinen(1998)

J ( y) 

p
k E[G ( y)]  E[G (z)]
2
i
i
i 1
日本行動計量学会:東京大学 平成12年10月
i
17
Mutual Information 最小化
y  WMv, W  O(m)
Mutual Information :


I (y ) 
H ( yi )  H (y)    f (y) log

i 1

m

 const


m
f (y )
i 1 i i
f (y )
m
J (y )
i
i 1
min I (y)
W
日本行動計量学会:東京大学 平成12年10月


dy  0


18
Noisy ICA (IFA)
• 測定に誤差が伴う場合
v(t )  A s(t )  u(t )
(t  1,2,)
 s(t )  [s1 (t ),, sn (t )]T
 v(t )  [v1 (t ),, vm (t )]T
 u(t )  [u1 (t ),, um (t )]T
 A : m  n 混合行列
日本行動計量学会:東京大学 平成12年10月
19
セミパラメトリックモデル
• Amari-Cardoso(1997), 川鍋-村田(2000)
v(t )  A s(t )  u(t )
(t  1,2,)
 si (t )~ i (si )
 u(t )~N (0, )

m
 (s )ds
f (v | A, , i )  N (v | As, )
i
i 1
日本行動計量学会:東京大学 平成12年10月
i
20
モデル間の関係
noisy モデル
v = As+u
非正規データ
高次統計量
正規データ
2次統計量
noisy ICA
IFA
FA
noise-free モデル
PP
v = As
noise-free ICA
川鍋-村田(1999)より
日本行動計量学会:東京大学 平成12年10月
PCA
21
ICA と PP
• 両者とも観測変数の線型結合の中で
非正規性を最大にするものを探す
• ICAにおける指標とPPにおける指標は
相互乗入れ可能と思われる
• データが独立な信号(潜在変数)の線型和
ならば,ICAやPPは独立成分を同定.そう
でない場合は,興味ある軸を同定
• ICAはPPの一つの特徴づけ
日本行動計量学会:東京大学 平成12年10月
22
例1.一様分布
PPがICAになる場合
V2
S2
S1
V1
球状化した観測変数の分布
ICA or PPによって変換した
変数の分布
日本行動計量学会:東京大学 平成12年10月
23
例2.混合正規分布
PPがICAにならない場合
V2
S2
V1
球状化した観測変数の分布
S1
ICA or PPによって変換した
変数の分布
  b b2 0  
 b b2 0  
  a 
 a  
   2 N   , 

1N  ,     2 N  ,  
1N  , 


2
2
  0   0 2b  
 0  0 2b  
 a 
 a  
 日本行動計量学会:東京大学




 平成12年10月

24
応用
• BSS
• 脳磁図・脳電図の分析
• いままでPCAないしはFAで分析していた
対象をICAで分析してみたという例が多い
• 社会科学への応用は今から
日本行動計量学会:東京大学 平成12年10月
25
まとめ
• (noise-free or noisy) ICAは軸の変換である
– PCAは分散が大きくなるよう軸を変換
– ICAは独立成分を同定するよう軸を変換
• 独立成分同定 ⇔ 非正規性最大化
– ICA ⇔ PP
– ICA・PPは独立成分が隠れているとそれを同定
• FAとの関連では,ICAは新しい直交回転解を
与える
– 独立性が一番大きくなるように回転
日本行動計量学会:東京大学 平成12年10月
26
PCAからICAへ?
• PCAとICAはまったく異なり,一方が他方を
凌駕するというものではない
– 目的によって使い分ける
– 分散最大化 vs 非正規性最大化(独立成分の同定)
– 2次統計量 vs 高次統計量
• 方法論の研究に関しては,ICAが“燃えている”
• ICAの社会科学での適用可能性は未知
日本行動計量学会:東京大学 平成12年10月