PPT - 静岡大学

Download Report

Transcript PPT - 静岡大学

データ解析
http://coconut.sys.eng.shizuoka.ac.jp/data/
静岡大学工学部
安藤和敏
2006.01.11
第4章 Excelで学ぶ因子分析
4-1 1因子モデルから学ぶ因子分析の考え
方
4-2 1因子モデルから学ぶ主因子法
4-3 SMCモデルで共通性を推定
4-1 1因子モデルから学ぶ因子分析
の考え方
因子分析とは
我々は,複雑な現象を単純な原因(すなわち因子)
で理解することがよくある.
例) 「彼は理系の才能があるので理科が得意であ
るが文型の才能がないので国語が苦手である.」
複雑な人間の能力を「理系的才能」と「文系的才能」
という2つの因子で単純に説明.
例) 「K君はO型だからいいかげんである.Lさんは,
A型だから真面目である.」
複雑な人間の性格を「血液型」という1つの因子で単
純に説明.
因子分析とは
因子分析とは,複雑な現象を単純な因子で説明す
るための,統計学的な手法である.
因子分析のデータ(変数が3個の場合)
No
国語(x)
英語(y)
数学(z)
1
x1
y1
z1
2
x2
y2
z2
…
…
…
…
i
xi
yi
zi
…
…
…
…
n
xn
yn
zn
この多変量データに対して,「学力」という1つの共
通因子を仮定して,因子分析を行う.
この多変量データは標準化されていると仮定する.
標準化(第3回のスライドから)
x 'i 
xi  x
sx
i  1,  , n 
標準化された変数の平均は0,分散は1になる.(証明せよ.)
x '  0, s x '  1
因子分析の記法
「学力」という共通因子を変数Fで表してみる.
No
因子(F) 国語(x) 英語(y) 数学(z)
1
F1
x1
y1
z1
2
F2
x2
y2
z2
…
…
…
…
…
n
Fn
xn
yn
zn
学籍番号iの学生の学力はFiである.これをi番目の
学生の因子得点と呼ぶ.
共通因子と独自因子
各科目の得点が共通因子Fだけで説明できることは
ありえない.
変数 x は,共通因子で説明できる部分と,共通因子
で説明できない部分に分けることができると考える.
共通因子で説
明できる部分
変数x
共通因子で説
明できない部分
因子分析のモデル
x  a x F  e x   (1)
因子負荷量
共通因子
独自因子
因子分析のモデル
(3変数の場合)
x

a x F  ex

(1)
y

ayF  ey

(2)
z

a z F  ez

(3)
因子分析法のパス図
ax
共通因子
F
az
ay
国語 x
英語 y
数学 z
ex
ey
ez
因子分析のデータ(変数が3個の場合)
No F
x
y
z
1
F1 x1= ax F1 +ex1 y1= ay F1 +ey1 z1= az F1 +ez1
2
F2 x2= ax F2 +ex2 y2= ay F2 +ey2 z2= az F2 +ez2
…
…
…
…
…
i
Fi
xi= ax Fi +exi
yi= ay Fi +eyi
zi= az Fi +ezi
…
…
…
…
…
n
Fn xn= ax Fn +exn yn= ay Fn +eyn zn= az Fn +ezn
因子分析の基本方程式(⇒WB)
2
2 2
2
sx

a x s F  2 a x s Fe  s e
2

a y s F  2 a y s Fe
2
sz

2 2
a z sF
s xy

a x a y s F  a x s Fe

2
a y a z sF
 a y s Fe  a z s Fe
 se
yez

2
a z a x sF
 a z s Fe  a x s Fe  s e
zex
sy
s yz
s zx
x
2 2
2
y
 se
 2 a z s Fe 
z
2
y
z
x
x
y
2
se
z
 a y s Fe  s e
x
y
z
xe y





  (5 )





重要な仮定
「共通因子と独自因子は,互いに無相関(⇒p.19)
である」と仮定する.
つまり,以下の式を仮定する.
x
 s Fe
xe y
 se
s Fe
se
y
yez
 s Fe
 se
z
 0,
zex
 0   (6) 因子分析の基本方程式
2
2 2
2
sx

a x s F  2 a x s Fe  s e
2

a y s F  2 a y s Fe
2
sz

2 2
a z sF
s xy

a x a y s F  a x s Fe

2
a y a z sF
 a y s Fe  a z s Fe
 se
yez

2
a z a x sF
 a z s Fe  a x s Fe  s e
zex
sy
s yz
s zx
x
2 2
2
y
 se
 2 a z s Fe 
z
2
y
z
x
x
y
2
se
z
 a y s Fe  s e
x
y
z
xe y





  (5 )





因子分析の基本方程式
sx
2

2
sy

2
sz

s xy

s yz

s zx

2 2
2
a x s F  se 
x

2 2
2
a y s F  se 
y
2 2
2 
a z s F  se 
z   (7 )

2
axa y sF 
2 
a ya z sF 
2
a z a x s F 
最初の仮定
x, y, z は標準化されていると仮定した.
つまり,以下を仮定する.
2
sx

2
sy

2
sz
 1 ,
s xy  rxy , s yz  r yz , s zx  rzx
さらに,F も標準化されていると仮定する.
2
sF
 1 因子分析の基本方程式
sx
2

2
sy

2
sz

rxy  s xy

r yz  s yz

rzx  s zx

2 2
2
a x s F  se 
x

2 2
2
a y s F  se 
y
2 2
2 
a z s F  se 
z   (7 )

2
axa y sF 
2 
a ya z sF 
2
a z a x s F 
1
因子分析の基本方程式
(3変数の場合)
1

1

2
ax
2
ay
1

2
az
rxy

axa y
r yz

ayaz
rzx

azax



2
se
x
2
se
y
2
se
z





   ( 8 ), ( 9 )




因子分析の基本方程式
 1

 rxy
r
 zx
rxy
1
r yz
2
2

a x  se
rzx 
x


r yz    a x a y


1
  a x a z
axa y
2
ay

2
se
y
ayaz
axaz 

ayaz 
2
2 
a z  se 
z 
因子分析の基本方程式を解く
(9)式より, rxy  r yz  rzx 
 ax  ay  az 
2
ax
2
ay
2
 az
rxy  r yz  rzx   (10 )
因子分析の基本方程式を解く
(10)式の両辺を(9)の各式で割ると,
ax

ay

az

rxy  r yz  rzx 

r yz


rxy  r yz  rzx 
   (11 )
rzx

rxy  r yz  rzx 

rxy


因子分析の基本方程式を解く
(11)の各式を(8)の各式に代入すると,
2
se
x
2
se
y
2
se
z
 1
 1
 1
2
ax

1
rxy  rzx
r yz
2
ay

2
az

1
1
rxy  r yz
rzx
r yz  rzx
rxy
共通性と独自性
x  a x F  e x   (1)
因子負荷量
共通因子
独自因子
共通性と独自性
2
sx

2
ax

2
se
x
 1   (12 )
変数xの分散 = 1
2
ax
共通因子が説明する情報
2
(共通性 h x )
2
se
x
独自因子が説明する情報
(独自性)
総共通性と寄与率
1
変数 x
2
ax
2
se
x
変数 y
2
ay
2
se
y
変数 z
2
az
2
se
z
2
総共通性 = a x

2
ay

2
az
全情報量
=3
  (13 )
総共通性と寄与率
寄与率 

総共通性
全情報量
2
ax

2
ay

2
az
変数の個数
Excelで学ぼう
ファイル:第4章/4_1
本日のまとめ
• 因子分析の考え方を理解した.
• 因子分析で用いられる言葉(因子負荷量,共
通因子,独自因子,因子得点,寄与率など)の
意味を理解した.
• 3変数の場合に,因子負荷量をExcelを用いて,
計算する方法を理解した.