Transcript 主因子法などの基礎数学
データ解析 http://coconut.sys.eng.shizuoka.ac.jp/data/ 第4章 Excelで学ぶ因子分析 4-1 4-2 4-3 4-4 4-5 4-6 1因子モデルから学ぶ因子分析の考え方 1因子モデルから学ぶ主因子法 SMCモデルで共通性を推定 1因子モデルから学ぶ反復主因子法 2因子モデルから学ぶ主因子法 2因子モデルから学ぶ反復主因子法 4-5 2因子モデルから学ぶ主因子法 因子分析のデータ (変数が5個の場合) No 変数 x 変数 y 変数 z 変数 u 変数 v 1 x1 y1 z1 u1 v1 2 x2 y2 z2 u2 v2 … … … … … … i xi yi zi ui vi … … … … … … n xn yn zn un vn 因子分析法のパス図(2因子5変数) 共通因子 F ax a y az bx av by au 共通因子 G bz bu bv x y z u v ex ey ez eu ev 因子分析のモデル(5変数2因子) x y z u v ax F bxG ex a y F byG ey az F bzG ez au F buG eu av F bvG ev 仮定1 1因子ときの同様に,「共通因子と独自因子は,互 いに無相関(⇒p.19)である」と仮定する. sFex sFey sFez sFeu sFev sFG 0, sGex sGey sGez sGeu sGev 0, sexey sexez sexeu sexev 0, seyez seyeu seyev 0, sezeu sezev 0 seuev 0 (2) 仮定2 1因子のときと同様に, x, y, z, u, v, F, G は標準化 されていると仮定する. 2 sF 2 sG 2 sx 2 sy 2 sz 2 su 2 sv 1 , sxy rxy , sxz rxz , sxu rxu , sxv rxv , s yz ryz , s yu ryu , s yv ryv , szu rzu , szv rzv , suv ruv 基本方程式の導出(1) 1 2 sx 2 2 a x sF 2 2 bx sG 2 sex 0 2ax sFe 2bx sGe 2axbx sFG x x 2 2 2 1 ax bx sex 基本方程式の導出(2) rxy 1 = 0 2 sxy ax a y sF axby sFG ax sFey 2 bx a y sFG bxby sG bx sGey a y sFex by sGex sexey rxy axay bxby 因子分析の基本方程式 (5変数2因子の場合) 1 1 1 1 1 2 2 2 ax bx sex , 2 2 2 a y by sey , 2 2 2 (3) az bz sez , 2 2 2 au bu seu , 2 2 2 av bv sev , 因子分析の基本方程式(続き) (5変数2因子の場合) rxy rxz rxu rxv ryz ax a y bxby , ryu ax az bxbz , ryv ax au bxbu , rzu ax av bxbv , rzv a y az bybz , ruv a y au bybu , a y av bybv , az au bzbu , az av bzbv , au av bubv . 因子分析の基本方程式 未知変数の数が15であるのに対して,方程式の数 は15個である. 1因子モデルのときと同様に行列で表現して解く. 因子分析の基本方程式 1 rxy r xy 1 rxz ryz rxu ryu rxv ryv rxz rxu ryz ryu 1 rzu rzu 1 rzv ruv rxv ryv rzv ruv 1 基本方程式(3)は行列 を用いて,以下のよう に表すことができる. ax2 bx2 se2 ax a y bxby ax az bxbz x 2 2 2 ax a y bxby a y by sey a y az bybz 2 2 2 a a b b a a b b a b s y z y z z z ez x z x z a a b b a y au bybu az au bzbu x u x u ax av bxbv a y av bybv az av bzbv ax av bxbv a y au bybu a y av bybv az au bzbu az av bzbv au2 bu2 se2u au av bubv 2 2 2 au av bubv av bv sev (4) ax au bxbu 共通性 2 2 2 ax bx sex 1 2 xの分散 s x = 1 2 sex 2 bx 2 ax 2 hx xのもつ情報量のうちで共通因 子が説明する情報の量 xの共通性と呼ばれる. 独自因子の分散 hx2 ax2 bx2 2 1 sex 共通性 xの共通性 yの共通性 zの共通性 uの共通性 vの共通性 2 hx 2 hy 2 hz 2 hu 2 hv 2 2 ax bx 2 2 ay by 2 2 az bz 2 2 au bu 2 2 av bv 2 1 sex 2 1 sey 2 1 sez 2 1 seu 2 1 sev 共通性の推定 11 se2 r rrxy r rxz r rxu r xv 左辺の対角成分 x xy xz xu xv 2 ryv rxyrxy 1 1 rsyzey ryuryz ryv ryu を,適当な数 2 2 2 2 2 rxzrxz ryz ryz1 r1zu se2rzv rzu hx , hy , hz , hu , hv rzv z で推定する. r r r 1 r rzu uv 1 se2u ruv xurxu yu ryuzu rxv ryv rzv ruv 1 2 ryv rzv ruv 1 sev rxv ax2 2bx2 2 se2 ax a y bxby ax az bxbz ax au bxbu ax av b xbv ax bx x ax 2a y 2bxby 2 ax az bxbz ax au bxbu ax av bxbv aaxxaayy bbxxbbyy aay 2ybby y2 sey a y aazy azbybbzybz a y aau yabu ybubybua y avay bavybv b ybv 22 22 2 aaxxaazz bbxxbbzz a yaayzazbybbyzbz azz bzz sezaz auazabu zbubzbuaz av az bazvbv b zbv a a b b 22 b22 s 2 a a b b a a b b a a a b b a a b b a a b b a b b a b a a b b xx uu xx uu y yu u y yu u z uz u z uz u uu uu eu u v u uv v u v aaxxaavv bbxxbbvv a yaayvavbybbyvbv az avz avbzbbvzbv au aav uabvubvbubv av2av2 bv2bv2 se2 v 共通性の推定 hx2 rxy 2 rxy hy r xz ryz rxu ryu rxv ryv rxz rxu ryz ryu hz2 rzu rzu hu2 rzv ruv rxv ryv rzv ruv 2 hv 左辺の対角成分 を,適当な数 hx2 , hy2 , hz2 , hu2 , hv2 で推定する. ax2 bx2 ax a y bxby ax az bxbz ax au bxbu ax av bxbv 2 2 a y by a y az bybz a y au bybu a y av bybv ax a y bxby a a b b a a b b 2 2 a b a a b b a a b b y z y z z z z u z u z v z v x z x z ax au bxbu a y au bybu az au bzbu au2 bu2 au av bubv 2 2 av bv ax av bxbv a y av bybv az av bzbv au av bubv (6) 因子決定行列 hx2 rxy 2 rxy hy RF rxz ryz rxu ryu rxv ryv rxz rxu ryz ryu 2 hz rzu 2 rzu hu rzv ruv を因子決定行列と呼ぶ. rxv ryv rzv ruv 2 hv 対称行列のスペクトル分解(先週と同じ) RF の固有値をλ1>λ2 > λ3 > λ4 > λ5 とし, w1, w2, w3, w4, w5をそれぞれの固有値に属する固有ベクト ルで長さが1のものとする.すると, は以下のよう RF に書ける.(⇒付録Hを見よ.) RF 1w1 w1 2w2 w2 3w3 w3 4w4 w4 5w5 w5 t t t (ここで,tw1はw1の転置を表す.) t t 因子決定行列の近似 RF 1w1t w1 2w2 t w2 3w3 t w3 4w4 t w4 5w5 t w5 仮に,λ1とλ2が他の固有値に比べて十分大きいと すれば,上式の第3項以降を無視して, RF ≒1w1 w1 2w2 w2 t と書ける. t 因子決定行列の近似 w1x w2 x w w 1y 2y w1 w1z , w2 w2 z , w1u w2u w1v w2v のとき,直前の近似式は 以下の(7)のように書ける. w1x w2 x w w 1y 2y RF ≒1 w1z [w1x w1y w1z w1u w1v ] 2 w2 z [w2 x w2 y w2 z w2u w2v ] w 1u w2u w1v w2v (7) (6)式の右辺 (6)式の右辺は,以下のよう書けることに注意しよう. ax2 bx2 ax a y bxby ax az bxbz ax au bxbu ax av bxbv 2 2 a y by a y az bybz a y au bybu a y av bybv ax a y bxby a a b b a a b b 2 2 a b a a b b a a b b y z y z z z z u z u z v z v x z x z ax au bxbu a y au bybu az au bzbu au2 bu2 au av bubv 2 2 av bv ax av bxbv a y av bybv az av bzbv au av bubv ax bx a b y y az ax a y az au av bz bx by bz bu bv (8) a u bu av bv 主因子法 ax w1x a w y 1y az 1 w1z , a u w1u av w1v bx w2 x b w y 2y bz 2 w2 z b w u 2u bv w2v とすれば, 主因子法 ax bx a b y y az ax a y az au av bz bx by bz bu bv a u bu av bv w1x w2 x w w 1y 2y 1 w1z w1x w1y w1z w1u w1v 2 w2 z w2 x w2 y w2 z w 1u w2u w1v w2v ≒ RF w2u w2v を得る.以上が主因子法と呼ばれる手法である. 因子負荷行列 ax a y A az au av bx by bz bu bv を因子負荷行列と呼ぶ. 因子負荷行列を使うと(6)の右辺は以下のように書ける. (6)の右辺 At A 寄与率と総共通性 1 x y 2 ax 2 ay 2 bx 2 by 2 sex 2 sey 全 情 報 量 = v 2 av 因子Fの情報量 因子Gの情報量 2 bv 2 sev 5 2 2 2 2 2 ax a y az au av bx2 by2 bz2 bu2 bv2 寄与率と総共通性 因子Fの情報量 因子Gの情報量 2 2 2 2 2 ax a y az au av bx2 by2 bz2 bu2 bv2 総共通性 h2 (ax2 a2y az2 au2 av2 ) (bx2 by2 bz2 bu2 bv2 ) ax2 a2y az2 au2 av2 因子Fの寄与率CF 5 総共通性 因子全体の寄与率 5 4-6 2因子モデルから学ぶ反復主因 子法 反復主因子法 START SMC法で推定 主因子法で計算 YES 推定値=計算値? NO END 推定値←計算値 Excelで学ぼう ファイル:第4章/4_5, 4_6 まとめ • 因子分析のモデル(2因子の場合)を理解した. • 因子分析の基本方程式の導出(2因子の場合)を 理解した. • 寄与率と総共通性の意味を理解した. • 反復主因子法によって,因子負荷量を求める方法 を理解した. • 反復主因子法による因子負荷量を, Excelを用い て,計算する方法を理解した.