Transcript 主因子法などの基礎数学
データ解析
http://coconut.sys.eng.shizuoka.ac.jp/data/
第4章 Excelで学ぶ因子分析
4-1
4-2
4-3
4-4
4-5
4-6
1因子モデルから学ぶ因子分析の考え方
1因子モデルから学ぶ主因子法
SMCモデルで共通性を推定
1因子モデルから学ぶ反復主因子法
2因子モデルから学ぶ主因子法
2因子モデルから学ぶ反復主因子法
4-5 2因子モデルから学ぶ主因子法
因子分析のデータ
(変数が5個の場合)
No
変数 x 変数 y 変数 z 変数 u 変数 v
1
x1
y1
z1
u1
v1
2
x2
y2
z2
u2
v2
…
…
…
…
…
…
i
xi
yi
zi
ui
vi
…
…
…
…
…
…
n
xn
yn
zn
un
vn
因子分析法のパス図(2因子5変数)
共通因子
F
ax
a y az
bx
av
by
au
共通因子
G
bz bu
bv
x
y
z
u
v
ex
ey
ez
eu
ev
因子分析のモデル(5変数2因子)
x
y
z
u
v
ax F bxG ex
a y F byG ey
az F bzG ez
au F buG eu
av F bvG ev
仮定1
1因子ときの同様に,「共通因子と独自因子は,互
いに無相関(⇒p.19)である」と仮定する.
sFex sFey sFez sFeu sFev sFG 0,
sGex sGey sGez sGeu sGev 0,
sexey sexez sexeu sexev 0,
seyez seyeu seyev 0,
sezeu sezev 0
seuev 0 (2)
仮定2
1因子のときと同様に, x, y, z, u, v, F, G は標準化
されていると仮定する.
2
sF
2
sG
2
sx
2
sy
2
sz
2
su
2
sv
1 ,
sxy rxy , sxz rxz , sxu rxu , sxv rxv ,
s yz ryz , s yu ryu , s yv ryv ,
szu rzu , szv rzv ,
suv ruv
基本方程式の導出(1)
1
2
sx
2 2
a x sF
2 2
bx sG
2
sex
0
2ax sFe 2bx sGe 2axbx sFG
x
x
2
2
2
1 ax bx sex
基本方程式の導出(2)
rxy
1
=
0
2
sxy ax a y sF
axby sFG ax sFey
2
bx a y sFG bxby sG
bx sGey
a y sFex by sGex sexey
rxy axay bxby
因子分析の基本方程式
(5変数2因子の場合)
1
1
1
1
1
2
2
2
ax bx sex ,
2
2
2
a y by sey ,
2
2
2 (3)
az bz sez ,
2
2
2
au bu seu ,
2
2
2
av bv sev ,
因子分析の基本方程式(続き)
(5変数2因子の場合)
rxy
rxz
rxu
rxv
ryz
ax a y bxby , ryu
ax az bxbz , ryv
ax au bxbu , rzu
ax av bxbv , rzv
a y az bybz , ruv
a y au bybu ,
a y av bybv ,
az au bzbu ,
az av bzbv ,
au av bubv .
因子分析の基本方程式
未知変数の数が15であるのに対して,方程式の数
は15個である.
1因子モデルのときと同様に行列で表現して解く.
因子分析の基本方程式
1 rxy
r
xy 1
rxz ryz
rxu ryu
rxv ryv
rxz rxu
ryz ryu
1 rzu
rzu 1
rzv ruv
rxv
ryv
rzv
ruv
1
基本方程式(3)は行列
を用いて,以下のよう
に表すことができる.
ax2 bx2 se2 ax a y bxby ax az bxbz
x
2
2
2
ax a y bxby a y by sey a y az bybz
2
2
2
a
a
b
b
a
a
b
b
a
b
s
y z
y z
z
z
ez
x z x z
a a b b
a y au bybu az au bzbu
x u x u
ax av bxbv a y av bybv az av bzbv
ax av bxbv
a y au bybu a y av bybv
az au bzbu az av bzbv
au2 bu2 se2u au av bubv
2
2
2
au av bubv av bv sev
(4)
ax au bxbu
共通性
2
2
2
ax bx sex
1
2
xの分散 s x = 1
2
sex
2
bx
2
ax
2
hx
xのもつ情報量のうちで共通因
子が説明する情報の量
xの共通性と呼ばれる.
独自因子の分散
hx2
ax2 bx2
2
1 sex
共通性
xの共通性
yの共通性
zの共通性
uの共通性
vの共通性
2
hx
2
hy
2
hz
2
hu
2
hv
2
2
ax bx
2
2
ay by
2
2
az bz
2
2
au bu
2
2
av bv
2
1 sex
2
1 sey
2
1 sez
2
1 seu
2
1 sev
共通性の推定
11 se2 r rrxy r rxz r rxu
r
xv
左辺の対角成分
x
xy
xz
xu
xv
2
ryv
rxyrxy 1 1 rsyzey ryuryz ryv ryu
を,適当な数
2 2 2 2 2
rxzrxz ryz ryz1 r1zu se2rzv rzu
hx , hy , hz , hu , hv
rzv
z
で推定する.
r
r
r
1
r
rzu uv 1 se2u
ruv
xurxu yu ryuzu
rxv ryv rzv ruv 1
2
ryv
rzv ruv 1 sev
rxv
ax2 2bx2 2 se2 ax a y bxby ax az bxbz ax au bxbu ax av b xbv
ax bx x ax 2a y 2bxby 2 ax az bxbz ax au bxbu ax av bxbv
aaxxaayy bbxxbbyy aay 2ybby y2 sey a y aazy azbybbzybz a y aau yabu ybubybua y avay bavybv b ybv
22
22
2
aaxxaazz bbxxbbzz a yaayzazbybbyzbz azz bzz sezaz auazabu zbubzbuaz av az bazvbv b zbv
a a b b
22 b22 s 2
a
a
b
b
a
a
b
b
a
a
a
b
b
a
a
b
b
a
a
b
b
a
b
b
a
b
a
a
b
b
xx uu xx uu y yu u y yu u z uz u z uz u uu uu eu u v u uv v u v
aaxxaavv bbxxbbvv a yaayvavbybbyvbv az avz avbzbbvzbv au aav uabvubvbubv av2av2 bv2bv2 se2
v
共通性の推定
hx2 rxy
2
rxy hy
r
xz ryz
rxu ryu
rxv ryv
rxz rxu
ryz ryu
hz2 rzu
rzu hu2
rzv ruv
rxv
ryv
rzv
ruv
2
hv
左辺の対角成分
を,適当な数
hx2 , hy2 , hz2 , hu2 , hv2
で推定する.
ax2 bx2
ax a y bxby ax az bxbz ax au bxbu ax av bxbv
2
2
a y by
a y az bybz a y au bybu a y av bybv
ax a y bxby
a a b b a a b b
2
2
a
b
a
a
b
b
a
a
b
b
y z
y z
z
z
z u
z u
z v
z v
x z x z
ax au bxbu a y au bybu az au bzbu
au2 bu2
au av bubv
2
2
av bv
ax av bxbv a y av bybv az av bzbv au av bubv
(6)
因子決定行列
hx2 rxy
2
rxy hy
RF rxz ryz
rxu ryu
rxv ryv
rxz rxu
ryz ryu
2
hz rzu
2
rzu hu
rzv ruv
を因子決定行列と呼ぶ.
rxv
ryv
rzv
ruv
2
hv
対称行列のスペクトル分解(先週と同じ)
RF の固有値をλ1>λ2 > λ3 > λ4 > λ5 とし, w1, w2,
w3, w4, w5をそれぞれの固有値に属する固有ベクト
ルで長さが1のものとする.すると, は以下のよう
RF
に書ける.(⇒付録Hを見よ.)
RF 1w1 w1 2w2 w2 3w3 w3 4w4 w4 5w5 w5
t
t
t
(ここで,tw1はw1の転置を表す.)
t
t
因子決定行列の近似
RF 1w1t w1 2w2 t w2 3w3 t w3 4w4 t w4 5w5 t w5
仮に,λ1とλ2が他の固有値に比べて十分大きいと
すれば,上式の第3項以降を無視して,
RF ≒1w1 w1 2w2 w2
t
と書ける.
t
因子決定行列の近似
w1x
w2 x
w
w
1y
2y
w1 w1z , w2 w2 z ,
w1u
w2u
w1v
w2v
のとき,直前の近似式は
以下の(7)のように書ける.
w1x
w2 x
w
w
1y
2y
RF ≒1 w1z [w1x w1y w1z w1u w1v ] 2 w2 z [w2 x w2 y w2 z w2u w2v ]
w
1u
w2u
w1v
w2v
(7)
(6)式の右辺
(6)式の右辺は,以下のよう書けることに注意しよう.
ax2 bx2
ax a y bxby ax az bxbz ax au bxbu ax av bxbv
2
2
a y by
a y az bybz a y au bybu a y av bybv
ax a y bxby
a a b b a a b b
2
2
a
b
a
a
b
b
a
a
b
b
y z
y z
z
z
z u
z u
z v
z v
x z x z
ax au bxbu a y au bybu az au bzbu
au2 bu2
au av bubv
2
2
av bv
ax av bxbv a y av bybv az av bzbv au av bubv
ax
bx
a
b
y
y
az ax a y az au av bz bx by bz bu bv (8)
a
u
bu
av
bv
主因子法
ax
w1x
a
w
y
1y
az 1 w1z ,
a
u
w1u
av
w1v
bx
w2 x
b
w
y
2y
bz 2 w2 z
b
w
u
2u
bv
w2v
とすれば,
主因子法
ax
bx
a
b
y
y
az ax a y az au av bz bx by bz bu bv
a
u
bu
av
bv
w1x
w2 x
w
w
1y
2y
1 w1z w1x w1y w1z w1u w1v 2 w2 z w2 x w2 y w2 z
w
1u
w2u
w1v
w2v
≒ RF
w2u w2v
を得る.以上が主因子法と呼ばれる手法である.
因子負荷行列
ax
a
y
A az
au
av
bx
by
bz
bu
bv
を因子負荷行列と呼ぶ.
因子負荷行列を使うと(6)の右辺は以下のように書ける.
(6)の右辺 At A
寄与率と総共通性
1
x
y
2
ax
2
ay
2
bx
2
by
2
sex
2
sey
全
情
報
量
=
v
2
av
因子Fの情報量
因子Gの情報量
2
bv
2
sev
5
2
2
2
2
2
ax a y az au av
bx2 by2 bz2 bu2 bv2
寄与率と総共通性
因子Fの情報量
因子Gの情報量
2
2
2
2
2
ax a y az au av
bx2 by2 bz2 bu2 bv2
総共通性 h2 (ax2 a2y az2 au2 av2 )
(bx2 by2 bz2 bu2 bv2 )
ax2 a2y az2 au2 av2
因子Fの寄与率CF
5
総共通性
因子全体の寄与率
5
4-6 2因子モデルから学ぶ反復主因
子法
反復主因子法
START
SMC法で推定
主因子法で計算
YES
推定値=計算値?
NO
END
推定値←計算値
Excelで学ぼう
ファイル:第4章/4_5, 4_6
まとめ
• 因子分析のモデル(2因子の場合)を理解した.
• 因子分析の基本方程式の導出(2因子の場合)を
理解した.
• 寄与率と総共通性の意味を理解した.
• 反復主因子法によって,因子負荷量を求める方法
を理解した.
• 反復主因子法による因子負荷量を, Excelを用い
て,計算する方法を理解した.