主因子法などの基礎数学

Download Report

Transcript 主因子法などの基礎数学

データ解析
http://coconut.sys.eng.shizuoka.ac.jp/data/
第4章 Excelで学ぶ因子分析
4-1
4-2
4-3
4-4
4-5
4-6
1因子モデルから学ぶ因子分析の考え方
1因子モデルから学ぶ主因子法
SMCモデルで共通性を推定
1因子モデルから学ぶ反復主因子法
2因子モデルから学ぶ主因子法
2因子モデルから学ぶ反復主因子法
4-5 2因子モデルから学ぶ主因子法
因子分析のデータ
(変数が5個の場合)
No
変数 x 変数 y 変数 z 変数 u 変数 v
1
x1
y1
z1
u1
v1
2
x2
y2
z2
u2
v2
…
…
…
…
…
…
i
xi
yi
zi
ui
vi
…
…
…
…
…
…
n
xn
yn
zn
un
vn
因子分析法のパス図(2因子5変数)
共通因子
F
ax
a y az
bx
av
by
au
共通因子
G
bz bu
bv
x
y
z
u
v
ex
ey
ez
eu
ev
因子分析のモデル(5変数2因子)
x
y
z
u
v





ax F  bxG  ex
a y F  byG  ey
az F  bzG  ez
au F  buG  eu
av F  bvG  ev
仮定1
1因子ときの同様に,「共通因子と独自因子は,互
いに無相関(⇒p.19)である」と仮定する.
sFex  sFey  sFez  sFeu  sFev  sFG  0,
sGex  sGey  sGez  sGeu  sGev  0,
sexey  sexez  sexeu  sexev  0,
seyez  seyeu  seyev  0,
sezeu  sezev  0
seuev  0 (2)
仮定2
1因子のときと同様に, x, y, z, u, v, F, G は標準化
されていると仮定する.
2
sF
2
 sG
2
 sx
2
 sy
2
 sz
2
 su
2
 sv
 1 ,
sxy  rxy , sxz  rxz , sxu  rxu , sxv  rxv ,
s yz  ryz , s yu  ryu , s yv  ryv ,
szu  rzu , szv  rzv ,
suv  ruv
基本方程式の導出(1)
1
2
sx
2 2
 a x sF
2 2
 bx sG
2
 sex
0
 2ax sFe  2bx sGe  2axbx sFG
x
x
2
2
2
1  ax  bx  sex
基本方程式の導出(2)
rxy
1
=
0
2
sxy  ax a y sF
 axby sFG  ax sFey
2
 bx a y sFG  bxby sG
 bx sGey
 a y sFex  by sGex  sexey
rxy  axay  bxby
因子分析の基本方程式
(5変数2因子の場合)
1 
1 
1 
1 
1 
2
2
2
ax  bx  sex ,
2
2
2
a y  by  sey ,
2
2
2 (3)
az  bz  sez ,
2
2
2
au  bu  seu ,
2
2
2
av  bv  sev ,
因子分析の基本方程式(続き)
(5変数2因子の場合)
rxy
rxz
rxu
rxv
ryz





ax a y  bxby , ryu
ax az  bxbz , ryv
ax au  bxbu , rzu
ax av  bxbv , rzv
a y az  bybz , ruv





a y au  bybu ,
a y av  bybv ,
az au  bzbu ,
az av  bzbv ,
au av  bubv .
因子分析の基本方程式
未知変数の数が15であるのに対して,方程式の数
は15個である.
1因子モデルのときと同様に行列で表現して解く.
因子分析の基本方程式
 1 rxy
r
 xy 1
 rxz ryz

rxu ryu
rxv ryv

rxz rxu
ryz ryu
1 rzu
rzu 1
rzv ruv
rxv 
ryv 
rzv  

ruv 
1 
基本方程式(3)は行列
を用いて,以下のよう
に表すことができる.
ax2  bx2  se2 ax a y  bxby ax az  bxbz
x

2
2
2
 ax a y  bxby a y  by  sey a y az  bybz

2
2
2
a
a

b
b
a
a

b
b
a

b

s
y z
y z
z
z
ez
 x z x z
 a a b b
a y au  bybu az au  bzbu
 x u x u
 ax av  bxbv a y av  bybv az av  bzbv

ax av  bxbv 

a y au  bybu a y av  bybv 

az au  bzbu az av  bzbv 
au2  bu2  se2u au av  bubv 

2
2
2 
au av  bubv av  bv  sev 
(4)
ax au  bxbu
共通性
2
2
2
ax  bx  sex
1
2
xの分散 s x = 1
2
sex
2
bx
2
ax
2
hx
xのもつ情報量のうちで共通因
子が説明する情報の量
xの共通性と呼ばれる.
独自因子の分散
hx2


ax2  bx2
2
1  sex
共通性
xの共通性
yの共通性
zの共通性
uの共通性
vの共通性
2
hx
2
hy
2
hz
2
hu
2
hv
2
2
 ax  bx
2
2
 ay  by
2
2
 az  bz
2
2
 au  bu
2
2
 av  bv
2
 1 sex
2
 1 sey
2
 1 sez
2
 1 seu
2
 1 sev
共通性の推定
11 se2 r rrxy r rxz r  rxu

r
xv
左辺の対角成分
x
xy
xz
xu
xv


2
ryv 
rxyrxy 1 1 rsyzey ryuryz ryv  ryu
を,適当な数

2 2 2 2 2
rxzrxz ryz ryz1 r1zu se2rzv  rzu
hx , hy , hz , hu , hv
rzv  
z


で推定する.
r
r
r
1
r
rzu uv 1  se2u
ruv 
 xurxu yu ryuzu

rxv ryv rzv ruv 1 
2 
ryv
rzv  ruv 1  sev 
 rxv
ax2 2bx2 2 se2 ax a y  bxby ax az  bxbz ax au  bxbu ax av  b xbv 
 ax  bx x ax 2a y  2bxby 2 ax az  bxbz ax au  bxbu ax av  bxbv 

aaxxaayy bbxxbbyy aay 2ybby y2 sey a y aazy azbybbzybz a y aau yabu ybubybua y avay bavybv b ybv 


22
22
2

 aaxxaazz bbxxbbzz a yaayzazbybbyzbz azz  bzz  sezaz auazabu zbubzbuaz av az bazvbv b zbv 
 a a  b b

22  b22  s 2

a
a

b
b
a
a

b
b
a
a
a

b
b
a
a

b
b
a
a

b
b
a

b
b
a

b
a
a

b
b
 xx uu xx uu y yu u y yu u z uz u z uz u uu uu eu u v u uv v u v 
 aaxxaavv bbxxbbvv a yaayvavbybbyvbv az avz avbzbbvzbv au aav uabvubvbubv av2av2 bv2bv2  se2 

 v
共通性の推定
 hx2 rxy

2
rxy hy
r
 xz ryz
rxu ryu

rxv ryv
rxz rxu
ryz ryu
hz2 rzu
rzu hu2
rzv ruv
rxv 

ryv 
rzv  
ruv 
2
hv 
左辺の対角成分
を,適当な数
hx2 , hy2 , hz2 , hu2 , hv2
で推定する.
 ax2  bx2
ax a y  bxby ax az  bxbz ax au  bxbu ax av  bxbv 


2
2
a y  by
a y az  bybz a y au  bybu a y av  bybv 
ax a y  bxby
a a  b b a a  b b

2
2
a

b
a
a

b
b
a
a

b
b
y z
y z
z
z
z u
z u
z v
z v
 x z x z
 ax au  bxbu a y au  bybu az au  bzbu
au2  bu2
au av  bubv 

2
2 
av  bv 
 ax av  bxbv a y av  bybv az av  bzbv au av  bubv
(6)
因子決定行列
 hx2 rxy

2
rxy hy

RF   rxz ryz
rxu ryu

rxv ryv
rxz rxu
ryz ryu
2
hz rzu
2
rzu hu
rzv ruv
を因子決定行列と呼ぶ.
rxv 

ryv 

rzv 
ruv 
2
hv 
対称行列のスペクトル分解(先週と同じ)
RF の固有値をλ1>λ2 > λ3 > λ4 > λ5 とし, w1, w2,
w3, w4, w5をそれぞれの固有値に属する固有ベクト
ルで長さが1のものとする.すると, は以下のよう
RF
に書ける.(⇒付録Hを見よ.)
RF  1w1 w1  2w2 w2  3w3 w3  4w4 w4  5w5 w5
t
t
t
(ここで,tw1はw1の転置を表す.)
t
t
因子決定行列の近似
RF  1w1t w1  2w2 t w2  3w3 t w3  4w4 t w4  5w5 t w5
仮に,λ1とλ2が他の固有値に比べて十分大きいと
すれば,上式の第3項以降を無視して,
RF ≒1w1 w1  2w2 w2
t
と書ける.
t
因子決定行列の近似
 w1x 
 w2 x 
w 
w 
 1y 
 2y 
w1   w1z , w2   w2 z ,
 


 w1u 
 w2u 
 w1v 
 w2v 
のとき,直前の近似式は
以下の(7)のように書ける.
w1x 
w2 x 
w 
w 
 1y 
 2y 
RF ≒1  w1z [w1x w1y w1z w1u w1v ]  2  w2 z [w2 x w2 y w2 z w2u w2v ]
 
 
w
 1u 
w2u 
 w1v 
 w2v 
(7)
(6)式の右辺
(6)式の右辺は,以下のよう書けることに注意しよう.
 ax2  bx2
ax a y  bxby ax az  bxbz ax au  bxbu ax av  bxbv 


2
2
a y  by
a y az  bybz a y au  bybu a y av  bybv 
ax a y  bxby
a a  b b a a  b b

2
2
a

b
a
a

b
b
a
a

b
b
y z
y z
z
z
z u
z u
z v
z v
 x z x z
 ax au  bxbu a y au  bybu az au  bzbu
au2  bu2
au av  bubv 

2
2 
av  bv 
 ax av  bxbv a y av  bybv az av  bzbv au av  bubv
 ax 
bx 
a 
b 
 y
 y
  az  ax a y az au av  bz  bx by bz bu bv (8)
 
 
a
 u
bu 
 av 
bv 




主因子法
 ax 
 w1x 
a 
w 
 y
 1y 
 az   1  w1z ,
 
 
a
 u
 w1u 
 av 
 w1v 
bx 
 w2 x 
b 
w 
 y
 2y 
bz   2  w2 z 
 


b
w
 u
 2u 
bv 
 w2v 
とすれば,
主因子法
 ax 
bx 
a 
b 
 y
 y
 az  ax a y az au av  bz  bx by bz bu bv
 
 
a
 u
bu 
 av 
bv 
 w1x 
 w2 x 
w 
w 
 1y 
 2y 
 1  w1z  w1x w1y w1z w1u w1v  2  w2 z  w2 x w2 y w2 z
 
 
w
 1u 
 w2u 
 w1v 
 w2v 
≒ RF







w2u w2v
を得る.以上が主因子法と呼ばれる手法である.

因子負荷行列
ax
a
 y
A   az

au
 av
bx 

by 
bz 

bu 
bv 
を因子負荷行列と呼ぶ.
因子負荷行列を使うと(6)の右辺は以下のように書ける.
(6)の右辺 At A
寄与率と総共通性
1
x
y
2
ax
2
ay
2
bx
2
by
2
sex
2
sey
全
情
報
量
=
v
2
av
因子Fの情報量 
因子Gの情報量 
2
bv
2
sev
5
2
2
2
2
2
ax  a y  az  au  av
bx2  by2  bz2  bu2  bv2
寄与率と総共通性
因子Fの情報量 
因子Gの情報量 
2
2
2
2
2
ax  a y  az  au  av
bx2  by2  bz2  bu2  bv2
総共通性 h2  (ax2  a2y  az2  au2  av2 )
 (bx2  by2  bz2  bu2  bv2 )
ax2  a2y  az2  au2  av2
因子Fの寄与率CF 
5
総共通性
因子全体の寄与率 
5
4-6 2因子モデルから学ぶ反復主因
子法
反復主因子法
START
SMC法で推定
主因子法で計算
YES
推定値=計算値?
NO
END
推定値←計算値
Excelで学ぼう
ファイル:第4章/4_5, 4_6
まとめ
• 因子分析のモデル(2因子の場合)を理解した.
• 因子分析の基本方程式の導出(2因子の場合)を
理解した.
• 寄与率と総共通性の意味を理解した.
• 反復主因子法によって,因子負荷量を求める方法
を理解した.
• 反復主因子法による因子負荷量を, Excelを用い
て,計算する方法を理解した.