因子分析と共分散構造分析

Download Report

Transcript 因子分析と共分散構造分析

1998.4.2 version
日本行動計量学会
春の合宿セミナー
1998.3.28-30 東京大学検見川セミナーハウス
因子分析と共分散構造分析
狩野 裕
大阪大学人間科学部
[email protected]
http://koko15.hus.osaka-u.ac.jp/~kano/research/tutorial.html
1
「春の合宿セミナー」紹介パンフ
より
各方面に広く使われている計量的方法を基礎からわ
かりやすく教えるコースがいくつか用意されている合
宿セミナーが下記のように計画されています。学部生、
大学院生、また、この機会に基礎を固めようとする研
究者、会員、非会員どなたでも参加できます。アットホ
ームな雰囲気で計量的な手法について学び、討論す
る機会としたいと思いますので、気楽にご参加ください。
各講師の方にはやさしく教えていただく予定ですので、
特に必要な予備知識はありません。
2
本コースの構成
1
2
準備:回帰分析
因子分析編
– 検証的因子分析
– 探索的因子分析
3 共分散構造分析編
3
因子分析と共分散構造分析
---- 準備:回帰分析----
Factor Analysis
and
Covariance Structure Analysis
4
中古車価格のデータ
価格
89
99
128
98
52
47
40
39
38
48
27
23
走行距離 乗車年数
4.3
5
1.9
4
5.2
2
5.1
3
4
6
4.8
8
8.7
7
8.2
7
3.3
10
3.9
6
8.2
8
7.2
8
車検
24
18
13
4
15
24
3
6
14
0
24
24
5
中古車価格
データの散布
図行列
6
乗車年数と価格の散布図 (r=-0.91)
7
走行距離と価格の散布図 (r=-0.49)
8
中古車価格のデータの相関行
列S
価格
走行距離
乗車年数
車検
価格
走行距離 乗車年数
1.00
-0.49
-0.91
-0.49
1.00
0.28
-0.91
0.28
1.00
-0.08
-0.10
0.25
車検
-0.08
-0.10
0.25
1.00
9
中古車価格の単回帰分析
PRICE = α+β× YEAR + E1
回帰係数
10
標準解(単回帰分析)
---- 分散をすべて1に標準化 ---標準回帰係数
誤差分散
の平方根
(0.91)2  (0.41)2  1
重相関係数( MC)  1  誤差分散  1  (0.41)2
 0.91 | 相関係数|
SMC  ( 重相関係数)2  決定係数  1  (0.41)2  083
.
11
重回帰分析
PRICE  0  1 KM  2 YEAR  3 SHAKEN  e
独立変数間の
共分散
偏回帰係数
12
標準解(重回帰分析)
---- 分散をすべて1に基準化 ---独立変数間
の相関
標準偏回帰係数
重相関係数( MC)  1  誤差分散  1  (0.32)2  0.95
SMC  ( 重相関係数)2  決定係数  1  誤差分散  0.90
13
SMC:事前共通性の推定値
(探索的因子分析)
1 1
SMC  I p  [Diag(S )]
価格
走行距離
乗車年数
車検
価格
1.00
-0.49
-0.91
-0.08
① 相関行列 S
走行距離 乗車年数
-0.49
-0.91
1.00
0.28
0.28
1.00
-0.10
0.25
10.0088
2.342
8.740
-1.150
② 逆行列 S^{-1}
2.342
8.740
1.671
1.680
1.680
8.817
-0.066
-1.337
車検
-0.08
-0.10
0.25
1.00
③ 対角行列化 Diag(S^{-1})
10.0088
0
0
0
0
1.671
0
0
0
0
8.817
0
0
0
0
1.236
-1.150
-0.066
-1.337
1.236
④ 逆行列 [Diag(S^{-1})]^{-1}
0.09991
0
0
0
0
0.59854
0
0
0
0.11342
0
0
0
0
0.80925
⑤ SMC: I-[Diag(S^{-1})]^{-1}
0.90009
0
0
0
0
0.40146
0
0
0
0
0.88658
0
0
0
0
0.19075
14
死亡率と婚姻率は負に相関す
る?
---- 偏相関係数の考え方 ---X1婚姻率 X2死亡率 X3
X1婚姻率 X2死亡率
北海道
6.86.8
5.95.9
北海道
青森
6.56.5
6.76.7
青森
……
……
……
千葉
6.36.3
4.94.9
千葉
……
……
……
大阪
6.96.9
5.55.5
大阪
……
……
……
…
20-34歳の割合
0.243
0.228
…
0.224
…
0.247
相関係数=-0.683
X2
死
亡
率
X1,X2 は人口千人あたり(昭和55年)
出展:人文・社会科学の統計学
東大出版 48ページ
X1 婚姻率
15
偏相関のパス図による表現
marriage
death
youth
marriage
1
-0.683
0.795
death
-0.683
1
-0.879
youth
0.795
-0.879
1
16
偏相関係数推定結果
標準化しない解
標準解
偏共分散
偏相関
s123  r12  r13r23
r123 
r12  r13r23
2
2
1  r13
1  r23
17
Path Tracing Rule
ーーーー パスをたどって共分散 ーーーー
. Y  E1
 M  080

. Y  E2
D  088
Cov( M , D)  080
.  (088
. )Var (Y )
Var (Y )  1なら ば「 パス をかけて共分散」
さ ら にVar ( M )  Var ( D)  1なら ば
「 パス をかけて相関係数」
誤差相関がある 場合も 同様:
Cov( M , D)  080
.  (088
. )Var (Y )  Cov
(
E1
, E
2)



0.02
18
日本行動計量学会
春の合宿セミナー
1998.3.28-30 東京大学検見川セミナーハウス
因子分析と共分散構造分析
狩野 裕
大阪大学人間科学部
[email protected]
19
因子分析編プログラム
• 因子分析とは
– 潜在変数による相関
• 検証的因子分析(CFA)
– 入力ファイル,適合度の指標
• 探索的因子分析(EFA)
– 因子数の選定
– 推定方法
– 因子回転
• CFA versus EFA
– CFAは実行できるがEFAがだめな場合
– 相互比較
20
観測変数
潜在変数による相関
---- コンセプト ----
誤差変数
相関
因果
潜在変数
(共通因子)
21
潜在変数による相関
---- 具体例 ----
22
データ
ゲール語
英語
歴史
計算
代数
幾何
6科目のデータ(相関行列 R)
X1
X2
X3
X4
X5
X6
1
0.439
1
0.410 0.351
1
0.288 0.354 0.164
1
0.329 0.320 0.190 0.595
1
0.248 0.329 0.181 0.470 0.464
1
出展:Lawley and Maxwell (1971) 66ページ
23
検証的因子分析
Confirmatory Factor Analysis
(CFA)
24
(検証的)因子分析とは
----文科的能力と数学的能力----
25
因子分析とは
• 相関関係の背後に潜む構造を研究するため
の統計的分析方法
• 相関関係を潜在変数(共通因子)で説明する
• 潜在変数からの因果の結果として相関が生
じるというモデル
• 探索的因子分析と検証的因子分析
– データから構造を探る...区間推定
– 構造に関する仮説をデータと照らし合わせて検
証する...仮説検定
26
構造式で表す
★因果を表す方程式
X1  11 f1
 u1
X 2  21 f1
 u2
X 3  31 f1
 u3
X4 
42 f 2  u4
X5 
52 f 2  u5
X6 
62 f 2  u6
★独立変数の分散共分散
 Var( f1)  Var( f 2 )  1

 Cov( f1, f 2 )  12
潜在変数の尺度は自由にとれる
 Var(ui )  i (i  1,,6)

 Cov(ui , u j )  0 (i  j )
Cov( fi , u j )  0
27
分析結果の解釈
• 因子負荷量は±1
に近いほど因子の
影響が大きい
• 幾何の変動
=F2の変動
+幾何固有の変動
2
2
1  0
.
62
 0
.
79
共通性
因子負荷量
パス係数
独自性
独自性の
平方根
28
分析結果の解釈
• F2の影響の方が
やや大きい
• 数学の中では
「計算」と「代数」
が,文科の中で
は「ゲール語」と
「英語」への因子
負荷が大きい
• F1とF2の相関は
0.6
因子負荷量
パス係数
独自性の
平方根
29
適合度の吟味
適合度指標
 2  値  7.953(df  8)
P  値  0.438
GFI  0.988


NNFI (TLI )  1000
. 

CFI  1000
.

0.05 以上であ
ればOK
1.000 に近けれ
ばOK
30
入力ファイル
---- SAS ---数学的能力(F2)から英語(X2)
へパスを引くモデル
LINEQS
X1=L_11
X2=L_21
X3=L_31
X4=
X5=
X6=
STD
E1-E6 =
F1-F2 =
COV
F1 F2 =
F1
F1+L_22 F2
F1
L_42 F2
L_52 F2
L_62 F2
DEL1-DEL6,
2*1.00;
PHI12;
+
+
+
+
+
+
E1,
E2,
E3,
E4,
E5,
E6;
DATA SCHOOL(TYPE=CORR);
_TYPE_ ='CORR'; INPUT _NAME_ $ X1-X6;
LABEL
X1='Gaelic' X2='English' X3='History' X4='Arithmet'
X5='Algebra' X6='Geometry';
CARDS;
X1 1.000
.
.
.
.
.
X2 0.439 1.000
.
.
.
.
X3 0.410 0.351 1.000
.
.
.
X4 0.288 0.354 0.164 1.000
.
.
X5 0.329 0.320 0.190 0.595 1.000
.
X6 0.248 0.329 0.181 0.470 0.464 1.000
;
PROC CALIS DATA=SCHOOLE M=ML DF=219 ALL;
LINEQS
X1=L_11 F1
+ E1,
X2=L_21 F1
+ E2,
X3=L_31 F1
+ E3,
X4=
L_42 F2 + E4,
X5=
L_52 F2 + E5,
X6=
L_62 F2 + E6;
STD
E1-E6 = DEL1-DEL6,
F1-F2 = 2*1.00;
COV
F1 F2 = PHI12;
RUN;
31
入力ファイル
---- EQS ---数学的能力(F2)から英語(V2)
へパスを引くモデル
/EQUATIONS
V1 = *F1
+ E1;
V2 = *F1+ *F2 + E2;
V3 = *F1
+ E3;
V4 =
*F2 + E4;
V5 =
*F2 + E5;
V6 =
*F2 + E6;
/VARIANCES
F1 = 1.00;
F2 = 1.00;
E1 TO E6 = *;
/COVARIANCES
F2 , F1 = *;
/TITLE
cfa with two factors
/SPECIFICATIONS
VARIABLES=6; CASES=220;
METHODS=ML;
MATRIX=COVARIANCE;
/LABELS
V1=Gaelic; V2=English; V3=History; V4=Arithmet;
V5=Algebra; V6=Geometry;
/EQUATIONS
V1 = *F1
+ E1;
V2 = *F1
+ E2;
V3 = *F1
+ E3;
V4 =
*F2 + E4;
V5 =
*F2 + E5;
V6 =
*F2 + E6;
/VARIANCES
F1 = 1.00;
F2 = 1.00;
E1 TO E6 = *;
/COVARIANCES
F2 , F1 = *;
/MATRIX
1.000
0.439 1.000
0.410 0.351 1.000
0.288 0.354 0.164 1.000
0.329 0.320 0.190 0.595 1.000
0.248 0.329 0.181 0.470 0.464 1.000
/OUTPUT
PARAMETERS;
STANDARD ERRORS;
LISTING;
/END
32
検証的因子分析チャート
仮
説
の
設
定
パ
ス
図
描
画
入
力
フ
ァ
イ
ル
作
成
適モ
合デ
お
Yes
ル
度
わ
の
の
り
検吟
討味
No
仮説の修正
LM 検定・ワルド検定
修正指標
33
適合度の考え方
ゲール語
英語
歴史
計算
代数
幾何
相関行列 S
X1
X2
X3
X4
X5
X6
1
0.439
1
0.410 0.351
1
0.288 0.354 0.164
1
0.329 0.320 0.190 0.595
1
0.248 0.329 0.181 0.470 0.464
1
モデルによる(推定された)相関行列 Σ^
1
0.462
0.366
0.314
0.315
0.252
1
0.358
0.307
0.308
0.247
1
0.244
0.244
0.196
1
0.589
0.472
1
0.473
1
0
-0.023
0
0.044 -0.007
0
-0.026 0.047 -0.08
0
0.014 0.012 -0.054 0.006
0
-0.004 0.082 -0.015 -0.002 -0.009
0
残差行列 S-Σ^
34
推定・適合度の考え方
ゲール語
英語
歴史
計算
代数
幾何
相関行列 S
X1
X2
X3
X4
X5
X6
1
0.439
1
0.410 0.351
1
0.288 0.354 0.164
1
0.329 0.320 0.190 0.595
1
0.248 0.329 0.181 0.470 0.464
1
モデルによる(推定された)相関行列 Σ^
1
0.462
0.366
0.314
0.315
0.252
1
0.358
0.307
0.308
0.247
1
0.244
0.244
0.196
1
0.589
0.472
1
0.473
1
0
-0.023
0
0.044 -0.007
0
-0.026 0.047 -0.08
0
0.014 0.012 -0.054 0.006
0
-0.004 0.082 -0.015 -0.002 -0.009
0
残差行列 S-Σ^
0.462  0.69 0.67
0.252  0.69 0.6  0.62
35
いくつかの適合度の指標 (1)
記号: ˆ はモデルによって推定 された相関行列(前スライド参照 )
適合度検定[標本数nが300~400程度以下のとき]
仮説H0 : 考えたモデルが正しい, H1 : 正しくない
 2  カイ2乗値  (n 1)[log | ˆ |  log | S |  tr[ˆ 1 (S  ˆ )]
受容域:  2   d2 ( )
自由度: d  p( p  1) / 2  q( 分散共分散の数 推定する母数の数)
p : 観測変数の数
適合度指標(1)[標本数nが300~400程度以上のとき;0.9~095以上が目安]
tr[{(S  ˆ )ˆ 1}2 ]
GFI  1 
.........回帰分析でのSMCに対応
1 2
ˆ
tr[(S ) ]
36
いくつかの適合度の指標 (2-1)
S
現在のモデル

独立モデル

 2  (n 1) log | ˆ |  log | S |  tr[ˆ 1 (S  ˆ )]
データから
の距離
観測変数間に相関
がないという最も
制約的なモデル
d  p( p  1) / 2  q
 I2  独立モデルのカイ2乗 値  (n 1)[log | Diag(S ) |  log | S |]
d I  p( p  1) / 2  p  p( p 1) / 2 : 独立モデルの(カイ2乗値の )自由度
37
いくつかの適合度の指標 (2-2)
適合度指標 (2)
[ 標本数nが 300~400程度以上のと き ; 0.9~095以上が目安]
2 / d 1
NNFI  TLI  1  2
I / dI  1
max(  2  d , 0)
CFI  1 
max(  2  d ,  I2  d I , 0)
† TLI  Tucker  Lewis の指標
( SASの探索的因子分析標準出力)
38
いくつかの適合度の指標 (3)
AIC   2  2( p( p  1) / 2  q)   2  2d ....... 小さ い方が良いモデル
( AIC   2  2q)
p( p  1)(1  GFI )
....... 大き い方が良いモデル
p( p  1)  2q
† AGFI は回帰分析における 自由度調整済み寄与率に対応
AGFI  1 
39
探索的因子分析
Exploratory Factor Analysis
(EFA)
40
探索的因子分析(EFA)
• 共通因子の数,共通因子が何を示すかが未知
• どの因子がどの変数に影響するかが分からない.
41
探索的因子分析の表現
---- パス図より行列 ---因子負荷行列
因子パ ターン行列
F1 F2 F3
X1 11
X 2 21
X 3 31

X 4 41
X5 51

X 6 61
12
22
32
42
52
62
因子相関行列
13 
F1 F2 F3

23 
F 1 12 13 
33  1 

 F2 21 1 23 
43 
F3 31 32 1 

53

63 
42
直交モデルと斜交モデル
因子相関行列
直交モデル
F1  1
0
0
F2  0
1
0
F3  0
0
1




斜交モデル
F1  1 12 13 
F2 21 1 23 
F3 31 32 1 
F1
F2
F3
43
探索的因子分析と検証的因子分析
11

 21
31

41
51

61
11

 21
 0
( )  
 0
 0

 0
12
22
32
42
52
62
13 
23 
33 

43 
53 

63 
0






53 

63 
22
32
42
52
0
0
0
0
0
44
行列での表現
11

 21
31

41
51

61
★因果を表す方程式
X1  11 f1  12 f 2  13 f 3  u1
 X1  11
 X  
X 2  21 f1  22 f 2  23 f 3  u2
 2   21
 X 3  31
X 3  31 f1  32 f 2  33 f 3  u3
 
X 4  41 f1  42 f 2  43 f 3  u4  X 4  41
 X5  51
X5  51 f1  52 f 2  53 f 3  u5
  
X 6  61 f1  62 f 2  63 f 3  u6
 X 6  61
12
22
32
42
52
62
12
22
32
42
52
62
13 
23 
33 

43 
53 

63 
13 
u1 
u 
23 
2
 f1   
33   u3 
 f 2    
43 
u4 

 f 3 
u5 
53 

 
63 
u6 
45
因子モデルの表現
★因果を表す方程式
 X1  11 12 13 
u1 
 X  

u 


2
21
22
23
  
 f1   2 
 X 3  31 32 33   u3 
X  ( )f  u

f



  
 2   
X



u
X  f  u
 4   41 42 43  f   4 
 X5  51 52 53  3  u5 
  

 
X



u6 
6  61
62
63





 u
X

f
★仮定
Var(f )  
Var(u)  : 対角行列
Cov(f, u)  O
★共分散構造
Var( f  u)   '
Var( X)  

Var(f  u)
 '
検証的モデル
探索的モデル
'
直交モデル

' 斜交モデル
46
探索的因子分析チャート
は
じ
め
因を
子決
数め
kる
kに
因よ
子り
モ推
デ定
ル
適共
合 通 Yes 因
度性
子
回
のの
検検
転
討討
No
データ
解
釈 Yes お
わ
可
り
能
か
No
因子数の変更
項目の吟味等
47
探索的因子分析結果
探索的因子分析結果(ML,斜交解) 事前共通性
数学的能力文科的能力
共通性
(SMC)
ゲール語
0.06
0.67
0.49
0.30
英語
0.19
0.52
0.41
0.30
歴史
-0.09
0.64
0.36
0.21
計算
0.81
-0.05
0.62
0.42
代数
0.75
0.01
0.57
0.42
幾何
0.58
0.06
0.37
0.30
48
因子数k の選定法
---- 以下の客観的ルールと解釈可能性を
考慮して総合的に判断する ---• Guttman ルール関連
– 相関行列の固有値で値が1以上のものの個数(SPS
S)
– 相関行列の対角部分を事前共通性(多くはSMC)で置
き換えた行列にもとづく方法
• Scree 法
– 相関行列の固有値プロットにもとづく方法
• 適合度の吟味
– 共通性の割合(累積寄与率)
– 適合度検定,AIC
49
Guttman ルール関連
• 相関行列 S の固有値で,値が1以上のものの個数
(SPSS)
• 相関行列 S の対角部分を事前共通性(多くの場合,
SMC)で置き換えた行列 S* にもとづく方法
– S*の固有値で,値が0以上のものの個数
– S*の固有値の大きいものからの和が初めて tr(S*) [事前
共通性の和]を超えたときの固有値番号(SAS;prinit)
– DS*Dの固有値の大きいものからの和が初めて tr[DS*D]
を超えたときの固有値番号.ここで,Dは独自性の平方根
の逆数からなる対角行列(SAS;ml)
50
6科目の例
6科目のデータ(相関行列 S)
X1
X2
X3
X4
X5
X6
ゲール語 1.000
英語 0.439 1.000
歴史 0.410 0.351 1.000
計算 0.288 0.354 0.164 1.000
代数 0.329 0.320 0.190 0.595 1.000
幾何 0.248 0.329 0.181 0.470 0.464 1.000
6科目のデータ(事前共通性を代入 S*)
X1
X2
X3
X4
X5
X6
0.300
0.439 0.297
0.410 0.351 0.206
0.288 0.354 0.164 0.420
0.329 0.320 0.190 0.595 0.418
0.248 0.329 0.181 0.470 0.464 0.295
固有値番号1
2
3
4
55
6
固有値 2.73 1.13 0.62 0.60 0.52 0.40
Preliminary Eigenvalues: Total = 6 Average = 1
1
2
3
4
5
6
2.07 0.43 -0.07 -0.12 -0.17 -0.21
Preliminary Eigenvalues: Total = 1.9354749 Average = 0.322
Psi^{-1/2}S*Psi^{-1/2}
3.20 0.63 -0.11 -0.17 -0.25 -0.33
Preliminary Eigenvalues: Total = 2.96966246 Average = 0.49
51
SASの出力(最尤法ML)
★ Initial Factor Method: Maximum Likelihood
Prior Communality Estimates: SMC
X1
X2
X3
X4
X5
X6
0.300104 0.296586 0.206095 0.419698 0.417752 0.295240
Preliminary Eigenvalues: Total = 2.96966246 Average = 0.49494374
1
2
3
Eigenvalue
3.1973
0.6268
-0.1084
Difference
2.5705
0.7352
0.0589
Proportion
1.0767
0.2111
-0.0365
Cumulative
1.0767
1.2877
1.2512
4
5
6
Eigenvalue
-0.1673
-0.2468
-0.3319
Difference
0.0795
0.0851
Proportion
-0.0563
-0.0831
-0.1118
Cumulative
1.1949
1.1118
1.0000
1 factors will be retained by the PROPORTION criterion.
52
SASの出力(反復主因子法 prinit)
★ Initial Factor Method: Iterated Principal Factor Analysis
Prior Communality Estimates: SMC
X1
X2
X3
X4
X5
X6
0.300104 0.296586 0.206095 0.419698 0.417752 0.295240
Preliminary Eigenvalues: Total = 1.9354749 Average = 0.32257915
1
2
3
Eigenvalue
2.0729
0.4327
-0.0731
Difference
1.6402
0.5058
0.0466
Proportion
1.0710
0.2236
-0.0378
Cumulative
1.0710
1.2946
1.2568
4
5
6
Eigenvalue
-0.1197
-0.1723
-0.2051
Difference
0.0526
0.0329
Proportion
-0.0618
-0.0890
-0.1060
Cumulative
1.1950
1.1060
1.0000
1 factors will be retained by the PROPORTION criterion.
53
Scree 法
固有値プロットにおい
て,固有値の減少量
がなだらかになる直前
の固有値番号を因子
数とする
54
モデルの吟味
• 共通性の吟味
– 各変数の共通性
– 共通因子が説明する
割合(累積寄与率)
• 適合度検定
• Tucker-Lewis の指標
55
モデルの吟味(SAS) 2因子モデル
1因子モデル
Convergence criterion satisfied.
Convergence criterion satisfied.
Significance tests based on 220 observations:
Significance tests based on 220 observations:
Test of H0: No common factors.
vs HA: At least one common factor.
Test of H0: No common factors.
vs HA: At least one common factor.
Chi-square = 310.841
Chi-square = 310.841
df = 15
Prob>chi**2 = 0.0001
df = 15
Prob>chi**2 = 0.0001
Test of H0: 1 Factors are sufficient.
vs HA: More factors are needed.
Test of H0: 2 Factors are sufficient.
vs HA: More factors are needed.
Chi-square = 51.996
Chi-square = 2.335
df = 9
Prob>chi**2 = 0.0001
Chi-square without Bartlett's correction = 52.840208721
Akaike's Information Criterion = 34.840208721
Schwarz's Bayesian Criterion = 4.2975608035
Tucker and Lewis's Reliability Coefficient = 0.7577767173
Prob>chi**2 = 0.6745
Chi-square without Bartlett's correction = 2.3799173231
Akaike's Information Criterion = -5.620082677
Schwarz's Bayesian Criterion = -19.19459286
Tucker and Lewis's Reliability Coefficient = 1.0211096922
Variance explained by each factor
Variance explained by each factor
FACTOR1
Weighted
3.790389
Unweighted 2.105587
Final Communality Estimates and Variable Weights
Total Communality: Weighted = 3.790389
Unweighted = 2.105587
df = 4
FACTOR1 FACTOR2
Weighted
4.614155 1.142786
Unweighted 2.209431 0.605674
Final Communality Estimates and Variable Weights
Total Communality: Weighted = 5.756941
Unweighted = 2.815105
X1
X2
X3
Comm. 0.244586 0.288007 0.121284
Weight 1.324012 1.404759 1.138185
X1
X2
X3
Comm. 0.489826 0.405929 0.356272
Weight 1.960113 1.683306 1.553451
X4
X5
X6
Comm. 0.534302 0.538613 0.378794
Weight 2.146855 2.166915 1.609663
Comm.
Weight
X4
X5
X6
0.622633 0.568649 0.371796
2.649925 2.318306 1.591840
56
種々の推定方法
主成分分析法
主因子法
反復主因子法
(主軸法 PAF)
最小2乗法
(ULS, Minres)
最尤法(ML)
事前
共通性
1
SMC
1
SMC
反復の方法
1回
1回
遅い反復
(SMC)
速い反復
SMC
速い反復
†多くの場合,PAF と ULS同じ解を与える
† †モデルが適切であれば,ULSとMLは非常に近い解を与える
57
簡便因子抽出法
非反復
反復
プロ グラ ム 事前共通性 事前共通性 事前共通性 事前共通性
1
S MC
1
S MC
主成分分析 主因子法 反復主因子法 反復主因子法
S AS
M=PRIN
M=PRIN
PRIORS
=SMC
M=PRINIT
主成分分析 主成分分析 主因子法
SPSS
/EXTRACTION
PC
Statistica 主成分分析
/EXTRACTION
PAF
/CRITERIA
ITERATE(1)
共通性=SMC
/DIAGONAL
(1,1,....,1)
/EXTRACTION
PAF
M=PRINIT
PRIORS
=SMC
主軸法
/EXTRACTION
PAF
主軸法
PAF: Principal Axis Factoring
58
オススメの推定方法
• 因子分析の初級者は(反復)主因子法
– 質の良いデータでは推定結果は大きく違わない
– 最尤法は sensitive 過ぎて使いにくい
• 因子分析の中級者以上は「反復主因子法+
最尤法」
– 解析の初期では反復主因子法,その後,最尤法に移行
する
– 細かい解釈をするときは最尤解でないと不安がある.とい
うのは,反復主因子法は反復が遅いため収束に不安が
あるから.
– モデルの適合に関する情報は最尤法でのみ出力される
59
推定方法の比較
(バリマックス回転)
ゲール語
英 語
歴 史
計 算
代 数
幾 何
最尤法
0.23
0.66
0.32
0.55
0.09
0.59
0.77
0.17
0.72
0.22
0.57
0.21
主成分分析法
0.23
0.76
0.35
0.66
0.00
0.82
0.83
0.15
0.81
0.18
0.75
0.15
反復主因子法
0.23
0.66
0.32
0.55
0.09
0.59
0.77
0.17
0.72
0.21
0.57
0.21
60
最尤解(MLE)と主成分分析法(PCA)
(回転方法:バリマックス法)
因子負荷推定値:ML 基準化バリマックス解
因子負荷推定値:PCA 基準化バリマックス解
0.8
歴史
0.8
ゲール語
ゲール語
0.6
歴史
英語
0.6
英語
0.4
代数
幾何
0.2
F2: 第2因子
F2: 第2因子
0.4
計算
0
-0.2
代数
0.2
幾何
計算
0.0
0
0.2
0.4
0.6
0.8
1
-0.2
0.0
-0.2
-0.2
-0.4
-0.4
F1: 第1因子
0.2
0.4
0.6
0.8
1.0
F1: 第1因子
61
最尤解(MLE)と反復主因子法
(PAF)
(回転方法:バリマックス法)
因子負荷推定値:PFA 基準化バリマックス解
因子負荷推定値:ML 基準化バリマックス解
0.8
0.8
ゲール語
0.6
歴史
ゲール語
0.6
英語
代数
幾何
0.2
計算
代数
幾何
0.2
計算
0.0
0
-0.2
英語
0.4
F2: 第2因子
F2: 第2因子
0.4
歴史
0
0.2
0.4
0.6
0.8
1
-0.2
0.0
-0.2
-0.2
-0.4
-0.4
F1: 第1因子
0.2
0.4
0.6
0.8
1.0
F1: 第1因子
62
因子回転の方法
SAS
EQUAMAX
ORTHOMAX
QUARTIMAX
直交回転
BIQUARTIMAX
PARSIMAX
VARIMAX
HARRIS-KAISER
PROMAX
斜交回転 PROCRUSTES
OBLIMIN
階層因子分析
E
ORTHOMAX
Q
PARSIMAX
V
HK
P
PROCRUSTES
SPSS
STATISTICA
EQUAMAX
E
QUARTIMAX
Q
B
VARIMAX
V
PROMAX
OBLIMIN
階層因子分析
63
オススメの因子回転の手順
• 直交回転か斜交回転かを決める
– 固有技術的観点から決定する.回転結果からは
斜交・直交を定めにくい
– 一般的に言って因子が直交していることは希で
ある.また,今後の発展(検証的因子分析,共
分散構造分析)のことを考えるならば斜交解
• 直交回転ならば (基準化)VARIMAX 法
斜交回転ならば PROMAX法 or OBLIMIN
法をおこなう
64
オススメの因子回転の手順(続)
• 思うような結果が得られないときの一つの解
決法は,プロクラテス回転を行うことである
– 「思うような結果が得られない」ということは因子
に関する「仮説」があることが多い.それを活かす
回転がプロクラテス法である
– プロクラテス回転でもうまくいかないときは,「仮
説」がデータにあっていないということだから,そ
の他のどんな回転を用いても「仮説」にあう解は
得られない
– 問題点:プロクラテス回転は SAS しかサポートし
ていない.SAS でも斜交回転しかない.
前川(1997, 262ページ) にSASで直交プロクラテ
ス回転を行うIMLによるプログラムリストがある.
65
DATA SCHOOL(TYPE=CORR);
_TYPE_ ='CORR'; INPUT _TYPE_ $ _NAME_ $ X1-X6;
LABEL
X1='Gaelic'
X2='English'
X3='History'
X4='Arithmet'
X5='Algebra',
X6='Geometry';
CARDS;
N
. 220
220
220
220
220
220
CORR X1 1.000
.
.
.
.
.
CORR X2 0.439 1.000
.
.
.
.
CORR X3 0.410 0.351 1.000
.
.
.
CORR X4 0.288 0.354 0.164 1.000
.
.
CORR X5 0.329 0.320 0.190 0.595 1.000
.
CORR X6 0.248 0.329 0.181 0.470 0.464 1.000
;
DATA TARGET1;
INPUT X1-X6;
CARDS;
000111
111000
;
PROC FACTOR DATA=SCHOOL NFACTORS=2 METHOD=ML
ROTATE=PROCRUSTES TARGET=TARGET1;
RUN;
プロクラテス
回転のSAS
入力ファイル
66
因子回転の意味
0.7 0 
0.7 0 


0.7 0 
1  

 0 0.7
 0 0.7


 0 0.7
. .5
05
05

.

.
5


05
. .5
2  

. 05
. 
05
05
. 05
. 


. 05
. 
05
67
データ(相関係数)から
Λ1とΛ2 (or F と F’)
のどちらが良いかを決定できない
'
0.7 0 0.7 0 
1
0.7 0 0.7 0 
.5




0.7 0 0.7 0 
.5
1  11'1  

  1  
0
0
.
7
0
0
.
7



0
 0 0.7 0 0.7
0




0
0
.
7
0
0
.
7



0
.5
1
.5
0
0
0
.5
.5
1
0
0
0
0
0
0
1
.5
.5
0
0
0
.5
1
.5
0
0
0

.5
.5

1
.5'
1
.5
.5

.5
.5




2 
05
. 
0
0
05
. 


05
. 
0
.5
1
.5
0
0
0
.5
.5
1
0
0
0
0
0
0
1
.5
.5
0
0
0
.5
1
.5
0
0
0

.5
.5

1
.
05
05
 .
05
.
2  2 2 '2  
.
05
05
.

.
05
.505
.
.505
.
.505
.

05
. 05
.
05
. 05
.

05
. 05
.
1  2
68
.
0.7 0  05
0.7 0  05

 .
0.7 0  05
.


.
 0 0.7 05
 0 0.7 05
.

 
.
 0 0.7 05
Λ1と Λ2の関係
.5
.5
.5 cos(45 ) sin(45 ) 




05
.  sin(45 ) cos(45 )
05
.

2
05
.
(0.0,0.7)
(0.5,0.5)
(0.7,0.0)
1
(0.5,-.5)
69
.
05
05
.
05
.

.
05
05
.

.
05
F と G の関係
.5 0.7 0 
.5 0.7 0 
.5 0.7 0 


05
.   0 0.7
05
.   0 0.7
 

05
.   0 0.7
 F1'  ( F1  F 2) / 0.7

F 2'  ( F1  F 2) / 0.7
 F1'  cos(45 )  sin(45 ) F1
 F 2'  

  F 2
   sin(45 ) cos(45 )  
F2
G2
(0.0,0.7)
(0.5,0.5)
F1
(0.5,-.5)
(0.7,0.0)
G1
70
因子回転の意味
0.7 0 
0.7 0 


0.7 0 
1  

 0 0.7
 0 0.7


 0 0.7
. .5
05
05

.

.
5


05
. .5
2  

. 05
. 
05
05
. 05
. 


. 05
. 
05
71
因子回転の数学的説明
★ 因子モデル(構造方程式)
X  1f  u
Var(f )  I k , Cov(f,u)  O, Var(u)  
因子回転する と ( P: k次直交行列, PP'  P' P  I k )
X  (1P')(
Pf )  u  2g  u

2
g
Var(g)  Var( Pf )  P Var(f ) P'  PP'  I k
Var(u)  , Cov(g, u)  P Cov(f , u)  O, Var(u)  
★ 因子モデル( 共分散構造)
Var( X)  Var(1f  u)  11'
 1P' P1'  (1P')( 1P')'
  2  2 ' 
72
なぜ因子回転が必要なのか
原因:因子を定めるための情報が不足している
処置:主観的に同定するしかない
現象1
⇔
因子 f
データ
X1,…,X2
Var( X )  11 ' 
∥
現象 2
⇔
因子 g
∥
Var(Y )   2  2 ' 
データ
Y1,…,Y2
73
たとえ話をすると
---- 真実はどっち ----
先生への厳しい目
真剣に話しているのに
私の気持ち
笑って流すあなたは教師
(井本有希子17歳)
先生への恋慕の情
学生百人一首より
(98/2/12朝日新聞)
74
回転方法の比較
(最尤解 MLE)
ゲール語
英 語
歴 史
計 算
代 数
幾 何
初期解
0.55
0.43
0.57
0.29
0.39
0.45
0.74 -0.27
0.72 -0.21
0.60 -0.13
バリマックス解
0.23
0.66
0.32
0.55
0.09
0.59
0.77
0.17
0.72
0.22
0.57
0.21
オブリミン解
0.06
0.67
0.19
0.52
-0.09
0.64
0.81 -0.05
0.75
0.01
0.58
0.06
75
因子回転
初期解とバリマックス解
因子負荷推定値: ML 基準化バリマックス解
因子負荷推定値:ML 初期解
0.8
0.8
ゲール語
0.6
0.6
歴史
0.4
F2: 第2因子
F2: 第2因子
英語
ゲール語
0.4
英語
0.2
0
-0.2
歴史
0
0.2
0.4
-0.2
0.6
0.8
幾何
代数
1
代数
幾何
0.2
計算
0
-0.2
0
0.2
0.4
0.6
0.8
1
-0.2
計算
-0.4
F1:第1因子
-0.4
F1: 第1因子
76
因子回転
バリマックス解と直接オブリミン解
因子負荷推定値:ML 直接オブリミン解
因子負荷推定値:ML 基準化バリマックス解
0.8
0.8
0.6
歴史
英語
0.4
代数
幾何
0.2
F2: 第2因子
F2: 第2因子
0.6
英語
0.4
計算
0.2
幾何
代数
0
0
-0.2
ゲール語
歴史
ゲール語
0
0.2
0.4
0.6
0.8
1
-0.2
0
-0.2
-0.2
-0.4
-0.4
F1: 第1因子
0.2
0.4
0.6
0.8
計算
1
F1: 第1因子
77
探索的vs検証的 or 直交vs斜交
ゲール語
英 語
歴 史
計 算
代 数
幾 何
探索的分析
最尤法バリマックス
最尤法オブリミン
0.23
0.66
0.06
0.67
0.32
0.55
0.19
0.52
0.09
0.59
-0.09
0.64
0.77
0.17
0.81 -0.05
0.72
0.22
0.75
0.01
0.57
0.21
0.58
0.06
因子相関
0
x^2 df 2.335
4
P-値
0.674
-AIC
-5.665
0.52
2.335
4
0.674
-5.665
検証的分析
0
0
0
0.77
0.77
0.62
0.69
0.67
0.53
0
0
0
0.60
7.953
8
0.438
-8.047
78
質の良いデータは何で解
析しても同じような結果が
得られるが...
• 最終的には目的による
• 因子に関する仮説がな
いとEFAしかできない
• CFAしかできない場合が
ある
79
検証的因子分析 vs 探索的因子分析
それぞれの特徴
80
探索的因子分析できないが検
証的因子分析可能な場合


• Ledermann の限界: k  2 p  1  8 p  1 / 2
観測変数の数 p
2 3 4 5 6 7 8 9 10 …
因子数 k の最大値 0 1 1 2 3 3 4 5 6 …
• 識別性....2つの観測変数にしか関わらない
因子を抽出できない
• 因子負荷に関するさまざまな仮定の検証
• 多母集団・因子平均の解析....今回は紹介し
ない
81
I.Ledermann の限界:例1
マルコフ(ワイナー)
シンプレックスモデル
6歳時 7歳時 8歳時 9歳時
1
0.809
1
0.806 0.850
1
0.765 0.831 0.867
1
WISC-R知能検査
註:本モデルでは多くの場合
スケールファクターを入れる
82
Ledermann の限界:例1
観測変数の数 p
2 3 4 5 6 7 8 9 10 …
因子数 k の最大値 0 1 1 2 3 3 4 5 6 …
上記境界
条件を
満たさない
X1 
X2 
X3 
X4 
f1
f1 
f1 
f1 
 e1
 X1  1
 X  1
f2
 e2
or  2   
 X 3  1
f2  f3
 e3
  
f 2  f 3  f 4  e4
 X 4  1
0
1
1
1
0
0
1
1
0 f1   e1 
0 f 2  e2 

0 f 3  e3 
   
1 f 4  e4 
83
蛇足
---- シンプレックス構造モデルでの解析 ----
84
Ledermann の限界:例2
円環モデル
X1
組合せ
1
単語完成 0.4
掛算
0.3
ドットパターン 0.2
ABC
0.2
方向課題 0.4
X2 X3 X4 X5 X6
1
0.4 1
0.3 0.4 1
0.2 0.3 0.4 1
0.3 0.3 0.2 0.3
1
6つの能力テスト(Guttman 1954)
註:円環モデルでは多くの場合
スケールファクターを入れる
85
Ledermann の限界:例2 (続)
観測変数の数 p
2 3 4 5 6 7 8 9 10 …
因子数 k の最大値 0 1 1 2 3 3 4 5 6 …
X1 
X2 
X3 
X4 
X5 
X6 
f1 
f1 
f2
 f 6  e1
 X1  1
 X  1
f2  f3
 e2
 2 
 X 3  0
f2  f3  f4
 e3
or    
f 3  f 4  f5
 e4
 X 4  0
 X5  0
f 4  f5  f 6  e5
  
f1
 f5  f 6  e6
 X 6  1
1
1
1
0
0
0
0
1
1
1
0
0
0
0
1
1
1
0
0
0
0
1
1
1
1 f1   e1 
0 f 2  e2 
0 f 3  e3 
    
0 f 4  e4 
1 f5  e5 
   
1 f 6  e6 
上記境界条件を満たさない
86
Ⅱ.識別性の問題
----探索的因子分析では,2つの観測変数にしか
関わらない因子を抽出できない ---6科目のデータ(相関行列)
X1
X2
X3
X4
X5
X6
ゲール語 1.000
英語 0.439 1.000
歴史 0.410 0.351 1.000
計算 0.288 0.354 0.164 1.000
代数 0.329 0.320 0.190 0.595 1.000
幾何 0.248 0.329 0.181 0.470 0.464 1.000
探索的因子分析結果(ML,斜交解)
数学的能力文科的能力
共通性
0.06
0.67
0.49
0.19
0.52
0.41
-0.09
0.64
0.36
0.81
-0.05
0.62
0.75
0.01
0.57
0.58
0.06
0.37
• X3 を除いて探索的因子分析すると,以下のメッセージが出力さ
れ,プログラムが停止する[事前共通性は PRIORS=SMC.反復
回数(ML,2:ULS,3;PRINIT;281)]
– ERROR: Communality greater than 1.0
• 事前共通性を PRIORS=ONEとし,反復主因子法(PRINIT)で分
析すると収束する(反復回数=9)
87
さらに詳しく調べてみる
反復が停止するまでの
反復回数
事前共通性
収束基準
1 SMC
10^-3
9 281
10^-6
423 281
収束基準
反復回数
因子
ゲール語
英語
計算
代数
幾何
因子相関
10^-3
10^-6
9
30
F1
F2
F1
F2
-0.03 0.78 -0.03 0.77
0.20 0.47 0.19 0.48
0.79 -0.01 0.79 -0.01
0.73 0.05 0.72 0.05
0.58 0.06 0.58 0.07
0.52
0.53
10^-6
200
F1
F2
0.12 0.49
0.00 0.79
0.75 0.03
0.77 0.01
0.54 0.11
0.54
10^-6
400
F1
F2
0.24 0.34
0.00 0.99
0.74 0.05
0.78 0.01
0.56 0.10
0.42
88
検証的因
子分析で
は...
89
なぜ検証的分析でうまく解析で
きるのか
• 2つの観測変数にしか関わらない潜在変
数があっても,それが他の(潜在)変数と相
関があれば解析できる
• 因子負荷を0とおく事前情報が効いている
90
Ⅲ.因子負荷に関するさまざ
まな仮定の検証
1 . 同族テス ト
1 因子モデル( 左図)
2 . τ等価テス ト
1  6
3 . 信頼性が等し いテス ト
12
26
 2
2
1  1
6  6
4 . 平行テス ト
1  6, 1  6
参考: 豊田(1992 / 10.4節)
91
探索的分析 versus 検証的分析
•
•
•
•
•
因子数
潜在構造に関する仮説
パス図
因子回転
モデルの評価
•
•
•
•
推定値の標準誤差
検定の多重性
恣意性
扱えるモデル
探索的因子分析
検証的因子分析
未知
なし,探索すべきもの
分析後に描く
必要
既知
あり,検証すべきもの
分析前に描く
不必要
(共通性の高低)
カイ2乗値,適合度指標
難しい
罪は軽い
低い
やや狭い
カイ2乗値,適合度指標
残差
標準出力
罪は重い
高い
かなり広い
92
まとめ
• 因子分析は,観測変数間の相関関係を潜
在変数である共通因子が説明するモデル
である.
• 検証的因子分析(EFA)・探索的因子分析
(CFA)の互いの relative advantage を良く
理解して使い分けることが必要.
• モデルの評価は最終的には適合度でみる.
因子分析モデルがデータに適合しないこと
もある.
93
参考文献
• 芝祐順(1978). 因子分析法 第2版.東京大学出版会
• 柳井・繁桝・前川・市川 (1990) 因子分析 --- その理
論と方法 --- 朝倉書店
• 豊田(1992).SASによる共分散構造分析.東京大学
出版会
• 前川(1994).SASによる多変量データの解析.東京
大学出版会
• 狩野(1997) AMOS EQS LISREL によるグラフィカル
多変量解析 -- 目で見る共分散構造分析 --- 現代
数学社
94
日本行動計量学会
春の合宿セミナー
1998.3.28-30 東京大学検見川セミナーハウス
因子分析と共分散構造分析
狩野 裕
大阪大学人間科学部
[email protected]
95
共分散構造分析編プログラム
• 共分散構造分析とは
• 中古車価格の解析:パス解析
– 標準解と標準化しない解
– 効果の分解:間接・直接・総合効果
• 自然食品店での購買行動の解析:多重指
標分析
– 共分散構造分析の典型的手順
– 潜在変数導入の意義
• 一つの実例
• 簡単なまとめ
96
共分散構造分析とは
直接観測できない潜在変数を導入し,潜在変
数と観測変数との間の因果関係を同定するこ
とにより社会現象や自然現象を理解するため
の統計的アプローチ.基本的に非実験多変量
データの分析方法で,因子分析と多重回帰分
析(パス解析)の拡張.
97
潜在変数による相関
98
中古車価格のデータ
相関行列
価格
走行距離
乗車年数
車検
価格
走行距離 乗車年数
1.00
-0.49
-0.91
-0.49
1.00
0.28
-0.91
0.28
1.00
-0.08
-0.10
0.25
車検
-0.08
-0.10
0.25
1.00
99
中古車価格の共分散構造分析
---- パス解析モデル ----
100
中古車価格の解析
---- 標準解と適合度指標 ----
101
中古車価格の解析
---- 不適切なモデルでは ----
102
/TITLE
dai2 no moderu
/SPECIFICATIONS
DATA='D:¥eqs¥chukosha.dat';
VARIABLES= 4; CASES= 12;
METHODS=ML;
MATRIX=RAW;
/LABELS
V1=price; V2=km;
V3=year; V4=shaken;
/EQUATIONS
V1 = *V2 + *V3 + *V4 + E1;
V2 = *V3 + E2;
/VARIANCES
V3 = *;
V4 = *;
E1 = *;
E2 = *;
/COVARIANCES
/OUTPUT
parameters;
standard errors;
listing;
/END
入力ファイル
Chukosha.dat ファイル
PRICE KM YEAR SHAKEN
89
99
128
98
52
47
40
39
38
48
27
23
4.3 5
1.9 4
5.2 2
5.1 3
4.0 6
4.8 8
8.7 7
8.2 7
3.3 10
3.9 6
8.2 8
7.2 8
24
18
13
4
15
24
3
6
14
0
24
24
標準解と普通の解
---- コンセプト ---• 標準解(standardized solution) :すべての変
数の分散を1に標準化した解
– パス係数は相関係数(偏相関係数)になり,因
果(影響)の強さを表す
• 普通の解(標準化しない解)
– 因果(影響)の大きさを表す
104
標準解と普通の解
---- 具体例 ----
105
効果(相関)の分解
---- 総合効果=直接効果+間接効果 ----
 1323
.  
12.67  0
.26

(

361
.
)




直接効果
間接効果


総合効果
106
効果(相関)の分解:標準解
----総合効果=直接効果+間接効果----
 0.91  
086
.  0
.28

(

0
.
23
)




直接効果
間接効果


総合効果
107
効果(相関)の分解2:標準解
----総合効果=直接効果+間接効果----
 0.91  
088
.  0
.28

(

0
.
23
)

0
.
25

011
.


直接効果
間接効果


総合効果
註:YEAR から SHEKEN へのパスの実質
的な意味はない.解説のための例題
108
効果(相関)の分解3:標準解
----総合効果=直接効果+間接効果----
 0.91  
088
.  0
.28

(
0.23
.25

011
.




)  0
直接効果
擬相関
間接効果


総合効果
註:YEAR と SHEKEN の相関の実質的な
意味はない.解説のための例題
109
回帰分析の繰り返しとの比較
• モデルが適切なときには,推定値間に大きな差はない
ことが多い
• 「回帰分析の繰返し」の欠点
– 一部のデータで一部の母数を推定するので推定効
率が落ちる
– モデルの良さがチェックできない
– 独立変数間相関=0などの情報が使えない
110
自然食品店での購買行動
---- アンケートデータの解析 ----
111
潜在変数のある
共分散構造分析チャート
目
的
潜に仮
在関説
変すの
数る構
築
指
標
の
選
定
ga
解
析
モの
デ修
ル正
適が
合O
K
度か
パ入
ス力
図フ
のァ
描イ
画ル
作
成
デ
ー
タ
の
収
集
Yes
解の
析解
結釈
果
お
わ
り
No
112
自然食品店での購買行動
---- アンケートデータの解析 ---仮説を潜在変数で表す
測定モデル:指標の作成
113
自然食品店での購買行動
---- データの収集 ---X1:
X2:
X3:
X4:
X1
X2
X3
X4
食品添加物に気を使う
栄養のバランスに気を使う
自然食料品店での購買額
自然食料品店での購買回数
X1
1
0.301
0.168
0.257
X2
X3
X4
1
0.188
0.328
1
0.53
1
114
解析結果
---- 多重指標モデル(標準解) ----
115
自然食品店での購買行動
---- 不適切なモデルでは ----
116
入力ファイル作成の要点
•
•
•
•
推定方法のデフォルトは最尤法(ML)
従属変数には方程式を作成
独立変数には分散・共分散を設定
潜在変数の尺度を固定する
– 潜在変数からのパス係数を一つ1に固定
– 独立潜在変数は分散を1に固定してもよい
† 矢印を1本も受けていない変数を独立変数
,1本でも受けていれば従属変数となる
117
/TITLE
Multiple Indicator Model
/SPECIFICATIONS
DATA='D:\EQS\HOMER41.COV';
VARIABLES= 4; CASES= 831;
METHODS=ML;
MATRIX=COVARIANCE;
/LABELS
V1=tenka; V2=baransu;
V3=kaisu; V4=gaku;
/EQUATIONS
V1 = *F1 + E1;
V2 = *F1 + E2;
V3 =1.0F2 + E3;
V4 = *F2 + E4;
F2 = *F1 + D2;
/VARIANCES
F1 = 1.00;
E1 TO E4 = *;
D2 = *;
/COVARIANCES
/OUTPUT
parameters;
standard errors;
listing;
/END
HOMER41.COV ファイル
TENKA BARANSU GAKU KAISU
1.000
0.301
0.168
0.257
0.301
1.000
0.188
0.328
0.168
0.188
1.000
0.530
0.257
0.328
0.530
1.000
入力ファイル
潜在変数の導入の意義
• (心理学などでの)構成概念の数理モデル
• 次元縮小
• 誤差を伴ってしか測定できない状況
– 測定道具(コスト)の問題
– 低い相関の補正…..アンケートデータの相関はな
ぜ低いか
119
構成概念と次元縮小
120
誤差を伴ってしか測定できない
---- 窒素含有量とトウモロコシの生産高 ---★単回帰モデル
Y=73.15+0.34X
★変量内誤差モデル
Y=67.56+0.42F1
121
変量内誤差モデル
★方程式
X= F1+E1
Y=*F1+E2
122
アンケートデータの相関はなぜ低いか
---- 被験者の信頼性が低い ---あるスーパーマーケットの印象評価
SD
Likert
SD
Likert
見映え
見映え
品揃え
品揃え
SD_見
1.00
0.68
0.64
0.52
LI_見
SD_品
LI_品
1.00
0.54
0.59
1.00
0.72
1.00
SD 法
非常に かなり やや
やや かなり 非常に
良い見映え -------- --------- --------- --------- --------- --------- 悪い見映え
良い品揃え -------- --------- --------- --------- --------- --------- 悪い品揃え
Statel 法
見映えの良さ +3
品揃えの良さ +3
Likert 法
大いに
賛成
見映えが良い -------品揃えが良い --------
+2
+2
+1
+1
一般的に
いって賛成
-----------------
-1
-1
-2
-2
-3
-3
どちらかと どちらかと
いえば賛成 いえば反対
---------------------------------
一般的に
いって反対
-----------------
大いに
反対
----------------123
低い相関を補正する
---- 希薄化の修正 ----
124
方法因子を入れた解析
---- 誤差間相関と等式制約の応用 ----
/TITLE
Correction for attenuation
/SPECIFICATIONS
DATA='DATA4NEW.ESS';
VARIABLES= 4; CASES= 250
METHODS=ML;
MATRIX=COVARIANCE;
/LABELS
V1=SD_APP; V2=LI_APP;
V3=SD_PRO; V4=LI_PR;
/EQUATIONS
V1 = *F1 + E1;
V2 = *F1 + E2;
V3 = *F2 + E3;
V4 = *F2 + E4;
/VARIANCES
F1 = 1.00;
F2 = 1.00;
E1 = *;
E2 = *;
E3 = *;
E4 = *;
/COVARIANCES
F2 , F1 = *;
E3 , E1 = *;
E4 , E2 = *;
/CONSTRAINTS
(V1,F1)=(V2,F1);
(V3,F2)=(V4,F2);
/OUTPUT
parameters;
standard errors;
listing;
125
/END
共分散構造分析はなぜ難しいと
言われるか?
• 潜在変数に関する仮説が練られていない
• 指標(観測変数)が適切でない
• モデル規定の自由度が大きい
– EFAでは因子数と回転の自由度のみ
• モデルの適合度が上がらない
– EFAでは適合度の吟味をしていない.共通性を中心
に観る傾向がある
• 分散やパスを固定するといったテクニカルなことが多い
– EFAではデフォルトで共通因子の分散=1を設定し
てある
126
指標(観測変数)の
収束・弁別妥当性
• (収束妥当性)
項目=>構成概念を予想
• (弁別妥当性)
構成概念=>項目を選択
127
一つの実例
多母集団の解析と欠測値データ
128
日経プリズム:企業評価システム
PRISM(1996年) 全社ランキング
最終決定版 (日付:28FEB97)
順位 社名
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
総合 社会性
得点 透明性
花王(株)
1000
ローム(株)
961
シャープ(株)
957
NEC(株)
932
大日本印刷(株)
916
アイワ(株)
913
キヤノン(株)
903
大塚製薬(株)
900
トヨタ自動車(株)
898
松下電工(株)
895
ユニ・チャーム(株) 892
(株)リコー
891
オムロン(株)
887
武田薬品工業(株)
886
京セラ(株)
882
松下電器産業(株)
880
エーザイ(株)
879
日清食品(株)
877
(株)セブンーイレブ 873
(株)村田製作所
872
89(
75(
89(
100(
83(
79(
90(
77(
95(
91(
67(
82(
90(
85(
73(
98(
73(
80(
88(
68(
14)
83)
14)
1)
37)
54)
10)
64)
3)
7)
179)
40)
10)
28)
104)
2)
104)
46)
20)
164)
1
環境対応
研究開発
収益
成長力
90(
88(
93(
90(
70(
92(
64(
67(
76(
90(
65(
88(
76(
78(
67(
77(
82(
65(
40(
96(
80(
86(
61(
52(
75(
76(
69(
76(
60(
54(
85(
61(
44(
77(
81(
44(
83(
75(
80(
82(
15)
23)
9)
15)
247)
13)
368)
308)
142)
15)
354)
23)
142)
105)
308)
123)
56)
354)
724)
4)
95)
29)
385)
563)
162)
144)
250)
144)
411)
527)
38)
385)
682)
134)
85)
682)
56)
162)
95)
72)
若さ
56(
71(
59(
39(
62(
54(
54(
74(
42(
45(
86(
59(
65(
43(
72(
44(
57(
61(
55(
57(
338)
109)
266)
846)
220)
390)
390)
82)
745)
649)
10)
266)
179)
708)
96)
677)
313)
232)
362)
313)
129
潜在変数に関する仮説
社
会
性
・
透
明
性
.53
環
境
・
研
究
.27
.35
収
益
・
成
長
力
.25
優
れ
た
会
社
このデータは限定
100社程度しかない
.97
.96
.72
企業の総合評価( 識者)
教育
企業の総合評価( 記者)
教育
経営者力量評価( 記者)
教育
優
れ
た
会
社
.97
.96
.72
企業の総合評価( 識者)
教育
企業の総合評価( 記者)
教育
経営者力量評価( 記者)
教育
若
さ
130
日経PRISM:項目とモデル
日経 PRISM の評価モデル図
社会( メセナ,ボ ランティア,障害者)
社会(メセナ,ボランティア,障害者)
危機管理への取組み
GFI = 0.86
RMSEA = 0.04
R-square = 0.54
( variables = 33 + 3 )
顧客満足・ 消費者対応
法務部門担当役員の任命
社内公募・ ベンチャ ー制度
春期以外の定期採用
危機管理への取組み
顧客満足・消費者対応
女性役職者の地位
社員間の名称の使い方
法務部門担当役員の任命
社
会
性
・
透
明
性
決裁権限・ インサイダ ー規定
人事考課の公開制度
男性平均月額給与
国際化の状況
社内公募・ベンチャー制度
春期以外の定期採用
社内電子メ ール構築
.53
I R 活動・ 決算発表日
独禁法順守への社員教育
特許出願数( PB 数)
環境問題・ PL 法への取組み
ISO14000 認証の取得
環
境
・
研
究
女性役職者の地位
.27
研究開発出身者の地位
研究開発従業員比率
)
所定外労働時間割増比率
有給休暇取得率
経常利益
1 人当経常利益額
.35
収
益
・
成
長
力
優
れ
た
会
社
.97
.96
.72
企業の総合評価( 識者)
教育
企業の総合評価( 記者)
教育
経営者力量評価( 記者)
教育
社員間の名称の使い方
決裁権限・インサイダー規定
人事考課の公開制度
.25
男性平均月額給与
経常利益成長力
自己資本利益率
国際化の状況
部課長昇格時年齢
取締役の平均年齢
社長就任時年齢
若
さ
社内電子メール構築
中途採用者比率
IR活動・決算発表日
取締役の学閥度
非同族度
監査役の常務会への出席
† 点線矢印は負の関係を示す
独禁法順守への社員教育
131
多母集団による欠測値データの解析手順
• 「評価」のデータがあるグループとないグルー
プに分ける.
• 2つの母集団間の対応するパス係数に等式制
約を入れて推定する.
132
多母集団による欠測値データの解析例
社会( メセナ,ボ ランティア,障害者)
社会( メセナ,ボ ランティア,障害者)
危機管理への取組み
顧客満足・ 消費者対応
法務部門担当役員の任命
社内公募・ ベンチャ ー制度
「評価」がある
グループ
顧客満足・ 消費者対応
法務部門担当役員の任命
社内公募・ ベンチャ ー制度
春期以外の定期採用
春期以外の定期採用
女性役職者の地位
女性役職者の地位
社員間の名称の使い方
社員間の名称の使い方
決裁権限・ インサイダ ー規定
人事考課の公開制度
男性平均月額給与
国際化の状況
社
会
性
・
透
明
性
決裁権限・ インサイダ ー規定
人事考課の公開制度
男性平均月額給与
国際化の状況
.53
I R 活動・ 決算発表日
I R 活動・ 決算発表日
独禁法順守への社員教育
独禁法順守への社員教育
環境問題・ PL 法への取組み
ISO14000 認証の取得
環
境
・
研
究
.27
研究開発出身者の地位
研究開発従業員比率
)
所定外労働時間割増比率
有給休暇取得率
経常利益
1 人当経常利益額
.35
収
益
・
成
長
力
優
れ
た
会
社
特許出願数( PB 数)
環境問題・ PL 法への取組み
.97
.96
.72
企業の総合評価( 識者)
教育
ISO14000 認証の取得
企業の総合評価( 記者)
教育
研究開発出身者の地位
経営者力量評価( 記者)
教育
研究開発従業員比率
)
所定外労働時間割増比率
有給休暇取得率
.25
経常利益
1 人当経常利益額
経常利益成長力
経常利益成長力
自己資本利益率
自己資本利益率
部課長昇格時年齢
部課長昇格時年齢
環
境
・
研
究
収
益
・
成
長
力
取締役の平均年齢
取締役の平均年齢
社長就任時年齢
社
会
性
・
透
明
性
社内電子メ ール構築
社内電子メ ール構築
特許出願数( PB 数)
「評価」がない
グループ
危機管理への取組み
若
さ
社長就任時年齢
中途採用者比率
中途採用者比率
取締役の学閥度
取締役の学閥度
非同族度
非同族度
監査役の常務会への出席
監査役の常務会への出席
若
さ
133
因果と相関
---- 相関は因果の必要条件! ---•
•
•
•
•
時間的先行性
関連性の強さ
直接的関係
関連の一致性(普遍性 consistency)
関連の整合性(coherence)
134
簡単なまとめ
直接観測できない潜在変数を導入し,潜在変数と
観測変数との間の因果関係を同定することにより
社会現象や自然現象を理解するための統計的ア
プローチ.
特 徴
• データから因果関係に関する情報を得る.
• 現象をシンプルに記述できる.
• 柔軟なモデル構成,因果関係の修正,因果モデ
ルの比較,希薄化の修正,多母集団の同時分析
135
参考図書
• 豊田(1992).SASによる共分散構造分析.東京
大学出版会.
• 豊田+前田+柳井(1992).原因をさぐる統計学.
講談社ブルーバックス.
• Bollen (1989). Structural Equations with Latent
Variables,Wiley.
• 狩野(1997).Amos, Eqs, Lisrel によるグラフィカ
ル多変量解析 --- 目で見る共分散構造分析 --.現代数学社.
• 以下の URL に共分散構造分析に関する
洋書が紹介されている:
http://www.gsm.uci.edu/~joelwest/SEM/S
EMBooks.html
136
ソフトウェア
AMOS: SmallWaters Corporation
1507 E. 53rd Street, #452, Chicago,
IL 60615-4509, USA
Email: [email protected]
Web: http://www.smallwaters.com/
Phone: +1 773-667-8635
Fax: +1 773-955-6252
〒150 東京都渋谷区広尾 1-1-39
エス・ピー・エス・エス株式会社
Email: [email protected]
Web: http://www.spss.co.jp/
Phone: 03-5466-5511
Fax: 03-5466-5621
SAS(CALIS):
SASインスティチュートジャパン
〒104-0054 東京都中央区勝どき1-13-1
イヌイビル・カチドキ8F
http://www.sas.com/japan/
TEL:03-3533-6921
FAX:03-3533-6927
EQS: Multivariate Software, Inc.
4924 Balboa Blvd. #368 Encino,
CA 91316, USA
Email: [email protected]
Web: http://www.mvsoft.com/
Phone: +1 818-906-0740
Fax: +1 818-906-8205
LISREL: Scientific Software
International
Email: [email protected]
Web: http://www.ssicentral.com/
1525 East 53rd Street, Suite 906
Chicago, IL 60615-4530, USA
Phone: +1 312-684-4920
Fax: +1 312-684-4979
137