因子数決定法,斜交回転法, 階層因子分析

Download Report

Transcript 因子数決定法,斜交回転法, 階層因子分析

因子数決定法,斜交回転法,
階層因子分析
香川大学経済学部
堀 啓造
2004.2.14
好み研
女子栄養大学
v.2
1
因子分析の歴史
• 1904 Spearman の論文
• The proof and measurement of association
between two things. American Journal of
Psychology, 15, 72-101
• General intelligence, objectively determined and
measured. American Journal of Psychology, 15,
201-293
• ->因子分析100年
2
1901 Pearson 主成分分析(Burtによって言及,論文への
言及は1947 Thurstone)
1904 Spearman 因子分析。一般因子(gは1914に命名)2
因子(一般因子と独自因子)
四価差法で求める
1920s Burt Pearsonへの言及し,Spearman はたいしたこ
とがない。 Thompson 数学 >>不定性
1920-50 知能に関する論争活発
1932 Thurstone 多因子説,単純構造, 主軸法,共通性
1933, 35 Hotelling 主成分分析を精錬
1935 Thurstone “Vectors of mind”.セントロイド法
1937 Holzinger bi-factor モデル
1941 Holzinger & Harman "Factor analysis"
Thurstone & Thurstone 斜交回転 電算機使用
1944 Thurstone 2次因子
1947 Thurstone "Multiple-factor analysis"
3
1949 Burt 階層因子説、1950 Vernon 階層因子説
1954 Guttman 因子数の下限(対角1 ,対角SMC)
1958 Kaiser Varimax 回転
1959 Guilford (秋重監訳)『精神測定法』 セントロイド法
1960 Harman "Modern factor analysis“
Kaiser 基準
1962 三好稔(編)『心理学と因子分析』
1963 Lawley & Maxwell 最尤法
1965 Horn 平行分析(因子数決定法)
1967 Joreskog 最尤法の計算
1969 Joreskog 確証的最尤法
1972 芝祐順 『因子分析法』東京大学出版会(1979 2版)
Mulaik "The foundations of factor analysis"
1976 Burt(1883-1971)の知能データねつ造発覚
Harman "Modern factor analysis(3rd ed.)"
1983 Gorsuch "Factor analysis(2nd ed.)" (初版 1974)
1989 Bollen SEM本
4
歴史文献
• Cowles, M. (2001). Statistics in psychology: An
historical perspective.(2nd ed.). LEA.
• Mulaik, S. A. (1987). A brief history of the
philosophical foundations of exploratory factor
analysis. Multivariate Behavioral Research, 22,
267-305.
– ギリシャ時代の哲学から近代哲学までの因子分析的考え。
Pearson からの因子分析に関する論争をまとめる。g因
子,因子分析の不定性の問題など。
• Thurstone, L.L. (1940) Current issues in factor
analysis. Psychological Bulletin, 37, 189-236.
• Lovie
5
(2)因子分析の前に
(a)サンプル数と相関係数の誤差
心理データの信頼性 0.6-0.7
人間の意識の場合200人以上必要
個人の信頼性は低いが構造は安定 ・・・SD法
(b)変数サンプリング Gorsuch
ランダム、系統 偏りがあると問題
(c)因子当たりの項目数 5以上ある
(d)因子分析をするのに適切であるか?
正規分布・歪み・外れ値
外れ値には敏感である必要がある。
極端な歪みがある場合も要注意->自尊心データ
順序尺度・間隔尺度・2値データ
KaiserのMSA(KMO) Measuremsnt of Sampling
Adequecy
6
相関係数95%信頼区間
7
自尊心データヒストグラム(n=207)
20
0.1
1
2
3
4
T2001
5
0.0
6
2
3
4
T2002
5
0.0
6
0.2
20
0.1
1
2
3
4
T2005
5
Count
40
0.0
6
40
0.2
20
0.1
0
0
1
2
3
4
T2003
5
0.0
6
0.4
60
0.3
40
0.2
20
0.1
1
2
3
4
T2006
5
0.0
6
60
0.3
40
0.2
20
0.1
1
2
3
4
T2004
5
0.0
6
100
80
0.4
60
0.3
40
0.2
20
0.1
0
0
0.4
0
0
100
80
0
0
0.3
80
1
2
3
4
T2007
5
0.0
6
80
0.4
60
0.3
40
0.2
20
0.1
0
0
1
2
3
4
T2008
5
Proportion per Bar
0.3
60
Proportion per Bar
Count
1
Proportion per Bar
60
Proportion per Bar
0.4
0.0
6
100
60
0.3
40
0.2
20
0.1
1
2
3
4
T2009
5
0.0
6
80
0.4
60
0.3
40
0.2
20
0.1
0
0
1
2
3
4
T2010
5
0.0
6
Proportion per Bar
0.4
Proportion per Bar
80
Count
100
Count
0.1
100
80
0
0
20
0
0
100
0
0
0.2
Count
0
0
40
0.4
Count
0.2
0.3
80
Count
40
60
Count
0.3
0.4
Proportion per Bar
60
80
100
Proportion per Bar
0.4
100
Proportion per Bar
80
Count
100
Proportion per Bar
Count
100
分布がゆがんでいる
8
豊田外向性データ(n=434)3値データ
0.2
0.1
0.1
0.0
3
0
0
1
A
2
0.2
1
2
0.0
3
0
0
1
2
0.0
3
0
0
1
2
Count
Count
0.3
100
0.2
0
0
1
2
300
200
0.4
0.3
100
0.2
0.1
0.0
3
0
0
1
2
0.0
3
0
0
1
2
0.2
0.1
0.0
3
Count
Count
100
0.4
0.3
100
0.2
0.1
0
0
1
2
Q
0.0
3
200
0.4
0.3
100
0.2
0.1
0
0
1
2
R
0.0
3
Count
0.5
200
0.4
0.3
100
0.2
9
0.1
0
0
0.0
3
1
2
S
0.0
3
0.1
0
0
1
2
T
0.0
3
Proportion per Bar
0.2
200
2
0.6
Proportion per Bar
0.5
Proportion per Bar
0.5
Proportion per Bar
0.5
Proportion per Bar
0.5
0.3
1
300
0.6
0.3
0.2
0.1
0
0
300
0.6
0.4
0.3
O
0.6
200
0.4
100
0.0
3
0.6
0.4
0.5
200
N
300
0.0
3
0.6
0.1
M
300
2
Proportion per Bar
0.4
0.1
0.0
3
1
300
Proportion per Bar
200
Proportion per Bar
Proportion per Bar
0.2
0.2
0.1
0
0
300
0.5
100
0.3
100
J
0.5
0.3
0.4
I
0.5
0.4
0.5
200
0.0
3
0.5
200
0.6
0.1
0.6
Proportion per Bar
Count
0.2
0.1
L
Count
100
300
K
2
0.3
H
0.1
100
0.4
0.6
0.2
200
200
Count
Count
Count
Count
100
0.0
3
300
0.6
0.3
P
0.3
2
Proportion per Bar
0
0
1
E
0.6
0.4
1
0.4
0.1
0.0
3
0
0
Proportion per Bar
0.2
200
Proportion per Bar
100
Proportion per Bar
0.3
0.2
D
0.5
0.4
0.3
0.1
0.0
3
0.5
300
2
2
0.5
300
1
1
0.5
200
0.4
100
300
G
100
0
0
300
F
200
0.0
3
0.6
Proportion per Bar
2
2
0.6
0.2
1
1
C
0.1
0
0
0
0
0.5
200
0.1
0.6
0.3
100
0.2
0.6
0.4
0
0
0.0
3
300
200
100
0.1
B
300
0
0
0.2
0.3
Count
2
100
0.4
Count
1
0.3
200
Count
100
0.4
Count
0.3
200
Count
0.4
Count
Count
0.2
200
0.6
Proportion per Bar
0.5
Proportion per Bar
0.5
Proportion per Bar
0.5
Proportion per Bar
0.5
0.3
0
0
300
0.6
0.4
100
300
0.6
Proportion per Bar
200
300
0.6
Count
300
0.6
Count
300
(3)因子分析
(a)抽出法
(b)因子数を決めないと分析できない
(c)回転
(d)階層因子分析・高次因子分析
10
(a)因子抽出法
• 共通性を反復推定しないときはおおきな問題
だった。SMC、最大相関(絶対値)
•
•
•
•
何を最小にするのか->適合度
主因子法(主軸法、主因子法)
最小2乗法
最尤法
11
適合度関数 F
• χ2値を求める前の距離(乖離度)つまり適合度関数(F)を
Loehlin(1998)に従って示す。
1
F  trace((S  C)V )2 ・・・ (1) 2
• S は測定されたデータの相関行列(R)または共分散行
列(S) ここではS
C は推測されたモデルから再生された相関行列または
共分散行列 Σ,Σ(θ^)などと表される。
12
復元相関行列 C
• ここでは簡単のため相関行列で考える。
因子分析の因子パタン行列をAとすると
• 復元相関行列
C=(AA’の対角に1を入れる) ……(2)
• ('は転置を示す SPSSではT)
13
重みづけ V
• 最小2乗法
OLS のときは V=I
…(3)
• 重み付き最小2乗法
GLS のときは V=S-1 …(4)
• 最尤法
ML のときは V=C-1 …(5)
14
• (1)式により3つの方法を統一して理解できることを
示している。S-Cつまり残差行列に重みをつける付
け方が、OLS,GLS、mlによって違う。OLSは単位行
列をかけているのでそのまま。そのtrace なので、
残差行列の非対角要素の2乗和÷2つまり、下三角
の非対角要素の2乗和となる。GLSは標本相関行
列によって重みをつけている。(5)の方法はRLS
(Reweighted Least Squares)と呼ばれている。
MLの場合実際は
F=ln|C|-ln|S|+trace(SV-1) …(6)
• 。(1)式は独立モデルのときに使われる。また、(1)の
式と(6)式は値は多少異なるが、比例関係にある。
• 適合度が変化しなくなれば収束したとする。
15
χ2値
• χ2=F*(N-1)
…(7)
N=サンプルサイズ
としてχ2値が求められる。
• 共通性を代入してもF値が一定以上変化しな
ければ収束
16
各抽出法の特徴
• 最尤法ー統計学からみていい性質、いろんな
適合度指標をもっている。多変量正規分布を
仮定している。ただし、正規分布に関して多
少頑健。不適解が起こりやすい。これは短所
でもあり長所でもある。
• 最小2乗法ー正規分布の仮定がない。ゆが
んだデータにもいいfit をする。収束が速い。
• 主因子法ー不適解になりにくい。収束が遅い。
17
抽出法の選択
狩野さんの発言を追いかければ
(1)最尤法と最小2乗法をやってみる。
(2)同じ結果なら最尤法を採用
(3)気になるほど異なる結果なら最小2乗法を採用
(4)初心者は反復主因子解のほうがいいかもしれ
ない。不適解が少ない。
(5)ただし,解が収束すれば,最小2乗法と反復主
因子法とは同じ
((5)は日心での服部さんのfprワークショップ)
ということになる。
18
(b)因子数決定
• 因子数を決めないと分析できない
・固有値1以上 基準がよく使われる。
・スクリー法
・寄与率
・因子に有効な項目数2以上
・MAP
・平行分析 PA 95%
・解釈可能性
1因子の決定が難しい。両極性問題
少なすぎる因子数、多すぎる因子数の問題
19
推奨する因子数決定法
• MAPを最小因子数、対角SMC平行分析
95%(PA-SMC95)を最大因子数とし、解釈可
能性を軸としながら因子数を決定する。
• Holzinger and Swineford(1939)の知能デー
タ は両方とも4となり、4因子に確定する。
• Thurstone & Thurstone 60変数の知能デー
タはMAP 8, PA-SMC95 10。8~10
20
固有値1以上の基準
• Kaiser 基準、Guttman-Kaiser 基準
• 相関行列の固有値が1以上となる数が因子
数である。
• Guttman は「因子数の下限」
• Kaiser の1960,1970の論文などから広く用い
られている。-> 因子分析の自動処理
• 主成分分析において、1変数分以上の寄与を
する。信頼性との関連も語られている。
21
Kaiser 基準の問題(1)
• 平行分析の論文 Horn(1965)
• カイザー基準は母相関行列に対してあてはま
るが、標本相関行列では誤差によって固有値
が変動する。乱数の相関行列の固有値よりも
大きくて、固有値としての意味をもつ。
• =>因子数を多目に推論してしまう。
22
Kaiser 基準の問題(2)
• 平行分析への批判から
• 一つ目の固有値に関しては意味のある結果がでて
いるが、因子間に相関がある、第1固有値が大きい
と第2固有値以降は小さくても意味のある因子であ
る。
• =>因子数を少な目に推測してしまう。
• 両方あわせると、カイザー基準では因子数を
多くも、少なくとも、正しくも推測することがあ
る。
• =>カイザー基準は大雑把。
23
スクリー基準
•
•
•
•
Cattell (1966)
簡単にわかる
->機械的処理への試み
SE-scree
24
因子のス ク リ ー フ ゚ ロ ッ ト
8
6
判断は簡単
固
有4
値
2
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20
因子の番号
25
共通性wide マイナー因子あり
MacCallum et al. (1999)
26
因子のス ク リ ー フ ゚ ロ ッ ト
8
Thurstone and Thurstone(1941)の知能データ
6
判断が難しい例
固
有4
値
2
0
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21
因子の番号
27
説明された分散の合計
回転後の
初期の固有値
抽出後の負荷量平方和
負荷量平
因子
合計
分散の %
累積 %
合計
分散の %
累積 %
合計a
方和
1
7.366
35.078
35.078
6.798
32.374
32.374
4.615
2
2.378
11.323
46.401
2.127
10.129
42.503
3.038
3
1.571
7.480
53.881
1.265
6.023
48.526
2.935
4
1.256
5.983
59.865
.919
4.378
52.905
4.168
5
1.182
5.631
65.495
.685
3.263
56.168
4.697
6
.941
4.479
69.974
.621
2.955
59.123
2.819
7
.852
4.057
74.031
.445
2.120
61.243
2.994
8
.711
3.385
77.416
9
.593
2.824
80.240
10
.495
2.356
82.596
11
.482
2.293
84.889
12
.462
2.201
87.090
13
.429
2.041
89.131
14
.379
1.806
90.938
15
.365
1.738
92.676
16
.327
1.556
94.232
17
.318
1.515
95.747
18
.300
1.427
97.174
19
.259
1.233
98.406
20
.189
.901
99.307
21
.145
.693
100.000
因子抽出法: 最尤法
a. 因子が相関する場合は、負荷量平方和を加算しても総分散を得ることはできません。
28
大きさに注目
平行分析(parallel analysis)
Horn, J. L. (1965). A rationale and test of the
number of factors in factor analysis.
Psychometrika, 30, 179-185
• 同じ変数の数、同じサンプルの数の正規乱数行列
の相関行列の固有値を推定し、対応する固有値を
比較し、乱数データの相関行列の固有値のほうが
大きくなる前の因子までをとることを提案した。
• 乱数の相関行列を多数生成し、それぞれの第1固
有値の平均と、対象相関行列の第1固有値とを比
較する。次に第2固有値、第3固有値と比較していく。
Spss、SASのマクロや服部さんのプログラムがある。
29
Holzinger & Swineford(1939) data
平行分析の例1 対角1
30
平行分析2
• 対角SMCの相関行列の固有値を求める。
• 固有値の平均値の95%上限を採用する
• Humphreys and Ilgen(1969)において、対角1のPAに加え、対
角にSMC、最大相関を入れるPAと最尤法のχ2テストとの関係
を調べている。最大相関のPAはよくない。対角SMCのPAの結
果が最尤法のχ2の結果とよく一致することを示した。
Humphreys and Montanelli(1975) では対角SMCのPA がML
のχ2よりも優れていることを示した。最尤法の基準だと、小サン
プルで低共通性のときに必ず過小推定してしまう。サンプル数
が増えるにつれ、過大推定をしてしまう。PA は共通性が広い範
囲であっても、狭い範囲であっても正しく因子数を推定する。た
だし、単一の心理データと単一のランダムデータから推定すると、
過大、過小推定とも起こりうる。また、共通因子モデルがデータ
への適合が貧弱な場合は、過大推定しやすい。
31
平行分析の例2 対角SMC
32
対角要素1の相関行列の固有値のスクリー・プロットと平行分析(対角1平均値)
8.0
7.0
Thurstone and Thurstone(1941)の
知能データ
6.0
固有値
5.0
4.0
3.0
2.0
1.0
0.0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 2033 21
対角要素SMCの相関行列の固有値のスクリー・プロットと平行分析(95%)
8.0
7.0
Thurstone and Thurstone(1941)の知能データ
6.0
固有値
5.0
4.0
3.0
2.0
1.0
0.0
-1.0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21
34
MAP
(minimum average partial)
• Velicer, W. F. (1976). Determining the
number of components from the matrix of
partial correlations. Psychometrika, 41,
321-327.
• 主成分を統制変数とする観測変数間の偏相
関係数を求める.そして,その2 乗平均を最
小とする主成分の数を抽出因子数とする.
(服部, 2002)
35
• 主成分を統制したときの偏相関係数行列
R∗は次式によって定義される.
1
2
R*  D R  AAD
D  diagR  AA
Rは相関行列
Aは因子パタン


1
2
36
因子数決定法の評価
• Zwick and Velicer(1986)の人工データによ
る実験。
• MAP がよい。次に平行分析(PA-M)
• MAP はごくまれに少なく推定することがある。
• 平行分析は多目に推定することがある。
37
• 最尤法のχ2テストーサンプルがある程度大き
くなると過大因子数
• AICーサンプルが大きくなると過大因子数。
• BICーサンプルが少ないと過小因子数。
• 最小2乗法での適合度指標は当てにならな
い。
38
(1) MAPは常に正しいか、少ない因子数を推定
する。
(2) PA-SMC95 は正しいか、多い因子数を推
定する。
(3) MAP、PA-SMC95は安定した推定数をだ
す(堀, 2003)
以上から、MAPとPA-SMC95の推定因子数の
間に正しい因子数があると考える。
39
MAPがうまくいかない場合
• Thurstone & Thurstone(1941)の60変数
データ、21変数データ
40
Thurstone & Thurstone 60変数
41
42
43
44
対角要素1の相関行列の固有値のスクリー・プロットと平行分析(対角1平均値)
16.0
14.0
12.0
8.0
6.0
4.0
2.0
58
55
52
49
46
43
40
37
34
31
28
25
22
19
16
13
10
7
4
0.0
1
固有値
10.0
45
対角要素SMCの相関行列の固有値のスクリー・プロットと平行分析(95%)
16.0
14.0
12.0
8.0
6.0
4.0
2.0
58
55
52
49
46
43
40
37
34
31
28
25
22
19
16
13
7
10
-2.0
4
0.0
1
固有値
10.0
46
Thurstone & Thurstone 21変数
47
48
49
対角要素1の相関行列の固有値のスクリー・プロットと平行分析(対角1平均値)
8.0
7.0
6.0
固有値
5.0
4.0
3.0
2.0
1.0
0.0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21
50
対角要素SMCの相関行列の固有値のスクリー・プロットと平行分析(95%)
8.0
7.0
6.0
固有値
5.0
4.0
3.0
2.0
1.0
0.0
-1.0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21
51
マイナー因子の影響
• 因子分析においてマイナー因子の影響は重
要である。平行分析においてランダム効果に
ついては考慮しているが、マイナー因子につ
いては考慮していない。マイナー因子の問題
を検討したのはTucker et al.(1969)である。
MacCallum et al.(2001) はTucker らの相関
行列作成法から母相関行列を作成し、その
行列を公開している。この行列を利用して因
子数決定法の検討をする。
52
MacCallumらデータ
(1)因子決定性
(1因子あたりの項目数。20項目、3因子or 7因子)
(2)共通性の大きさ
( high (.6 to .8),low (.2 to .4), wide(.2to .8))
(3)マイナー因子の大きさ
(RMSEAの大きさ, 0.065, 0.090, 0.020)
このうち(1)の操作には問題がある。20項目7因子の複数の場
合に7因子を再現できなかった。つまり、7因子の場合に一つの
因子に1項目しか負荷しないことが複数生じた。3因子の場合は
このようなことがなかったので3因子の母相関行列を分析するこ
とにする。
300ケースのデータとして処理する。
53
54
55
• PA-SMC95はマイナー因子の影響に弱い。
• MAPはマイナー因子の影響はない。逆にマ
イナー因子がほとんどないRMSEA =0.025
の低共通性のときに因子数を少なく見積もっ
ている。
56
過大、過小因子数
• どちらのほうが問題が大きいか?
57
少ない因子数の例
58
59
5因子解
60
4因子解
61
3因子解
62
2因子解
63
1因子解
64
1次元であること
•
•
•
•
•
確定された方式はない。
最低限MAPにおいて1次元となる。
2因子であっても因子間相関が高い
階層因子分析で一般因子の寄与が高い
第1固有値が飛び抜けて高い
• などが考えられる。
65
豊田外向性データ
au1 色々な人と知り合いになるのが楽し
い
bu2 (逆)知らない人と話すときはかたくな
る
cu3 (逆)こちらから進んで友達を作ること
が少ない
du4 (逆)人目に立つようなことは好まな
い
eu5 (逆)異性(男なら女)の友達はほとん
どできない
fu6 人と広くつきあうのが好きである
gu7 誰とでもよく話す
hu8 (逆)新しい友達はなかなかできない
iu9 (逆)無口である
ju10 人中にでてもまごつかない
ku11 話し好きである
lu12 人と広く付き合うほうだ
mu13 (逆)無口である
nu14 自分はわりと人気者だ
ou15 生き生きしていると人に言われる
pu16 陽気である
qu17 初対面のひとは自分ほうから話し
かける
ru18 よく人から相談を持ちかけられる
su19 話題には事欠かないほうだ
tu20 誰とでも気さくに話せる
66
スクリープロット
対角要素1の相関行列の固有値のスクリー・プロットと平行分析(対角1平均値)
8.0
7.0
6.0
固有値
5.0
4.0
3.0
2.0
1.0
0.0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
67
20
68
69
70
全変数4因子解
71
20変数の相関行列
72
3因子解の順序->崩れている
73
変数削除
• iu9 (逆)無口である ---X
• mu13 (逆)無口である
• tu20 誰とでも気さくに話せる---X
• gu7 誰とでもよく話す
• 2変数を落として再分析
74
18変数
75
76
18変数4因子解
77
因子間相関
78
18変数1因子解
79
1因子解と信頼性分析
• ju10 人中にでてもまごつかない
• du4 (逆)人目に立つようなことは好まない
• 信頼性分析から落ちる。項目を削除した時の
クロンバックのα係数が同じかよくなる。
80
両極性問題
• 性格や感情語の反対語が同一次元にならば
ないということが頻繁に起こる。
• これについて2次元であるとする考えと1次元
であるとする考えが対立している。
• SEMを使う必要がある。
81
(c)因子の回転法
• 回転法は大きく分けて、直交回転と斜交回転
がある。
• 直交回転はVarimax 回転が広く行われてい
る。
• 斜交回転にも様々ある。代表的なのが
– 直接オブリミン
– プロマックス
– Harris-Kaiser (ORTHOBLIQUE)
82
単純構造 (Thurstone)
(1)回転後の因子行列の各行には,0の因子負荷量が
少なくとも1つは含まれていること
(2)回転後の因子行列の各列には,0の因子負荷量が
r個含まれていること
(3)回転後の因子行列から,2列ずつを対にしてとりだ
したとき,一方の列では0であるが,他方では0でな
い変数がr個含まれていること
(4)共通因子の数が4~5個以上の場合には,2列ず
つ対にした両列において,因子負荷量が0であるテ
ストがかなり多く含まれていること
(5)2列ずつとりだした対の両列において,因子負荷量
83
がかなり大きいテストは少数であること
直接オブリミン
• 間接オブリミン Carroll(1960)
• 直接オブリミン Jennrich and Sampson (1966)
– ->Harman 命名?
•
•
•
•
•
•
•
間接オブリミン(γ), 直接オブリミン(δ-Harman)
δ<0
小さい因子間相関 直交解に近くなる
δ=0
中程度の相関 (direct quartimin)
δ>0
大きい相関 (1=direct covarimin)
Systat のヘルプ(訳が間違っていてわからない)
Harman δ=0, -5, 0.1, 0.2, … 0.5 までをチェックする
Gorsuch δ=1~-4 システマティックに変化させる。
84
δ 2 2
F (P)   (b b  bjp bjq )
n j1 j1
pq1 j 1
m
n
n
n
2 2
jp jq
•
•
•
•
F(P)を最小化する。bjpは因子パタン
n 変数の数
m 因子数
δ=0 の時は直接quartimin
85
プロマックス
• Hendrickson, A. E. and White, P.O. (1964)
• Varimax 回転解をもとに回転する。
• Varimax回転の因子負荷量を2乗、3乗、4乗とする。
偶数乗のときは符号をつける。
• これをターゲット行列として回転させる。
• 計算が速い。かならず収束する。
• 因子間相関は高い。
• k=3,k=4が一般に使われる。k=4のほうが因子
間相関が高い
• 理論モデルを正しく再現できない。
86
Harris-Kaiser (1964)
• 独立解(power=0)と比例解(power=0.5)があ
る。
• 独立解は高い因子間相関
• 比例解は直交に近い
• 比例解は単純なモデルを再現できないことが
ある。
• SASしかサポートしていない。But 小笠原さ
んのfortran program
87
自尊心データ
• Rosenbergの翻訳(山本真理子ほか)
• 10項目
88
89
90
自尊心
初期解の
プロット
(2因子解)
91
varimax回転解
92
プロマックス
回転解(k=3)
r=-0.493
93
プロマックス
回転解(k=4)
r=-0.539
94
直接オブリミン
回転解(δ=0)
r=-0.186
95
ハリス・カイザー回転
解
(power= 0 独立解)
r=-0.497
96
ハリス・カイ
ザー回転解
(power= 0.5
proportional
解)(2因子解)
r=-0.234
97
斜交回転の評価
• どれを使っても因子パタンはそれほど変わら
ない。ただし、因子間相関は変わる。
• 実用性ではpromax が優れている。
• 理論的には直接オブリミン
• ハリス・カイザーはSASだけだという欠点があ
る。しかし、限界値がはっきりしているのでわ
かりやすい。
98
(d)階層因子分析
(1)Spearman(1904) のg因子
(2)Thurstone の単純構造(1931)->斜交解
知能のg因子説と多因子説のデータ分析による論争
(3)Holzinger, J.J(1937)または(1939) bi-factor モデル
Spearman のみ名前を挙げている。
(4)Thurstone の2次因子(1944)->高次因子
(5)Burt(1949), Vernon(1950)の知能の階層因子説
(6)Schmidt and Leiman(1957)の階層因子解(特に
Vernon に影響される。Holzinger も挙げる)
99
(7)Gorsuch, R. L. (1983). Factor analysis (2nd ed.).
Hillsdale, NJ: Lawrence Erlbaum.行列による説明
(8)Wherry, R. J. (1984). Contributions to correlational
analysis. New York: Academic Press. fortran
progam list付き
(9)Mulaik, S. and Quartetti, D.A. (1997). First order or
higher order genreral factor? Structural Equation
Modeling, 4, 193-211.
->同じ? この論文ではhigher order のほうを
hierarchical factors, g から直接項目に負荷するモデ
ルを nested factor model と呼んでいる。
100
プログラム
(1)Statistica のプログラム
(2)Johnson, W. L., & Johnson, A. M. (2000). Using
spss/pc for higher order factoring. Educational &
Psychological Measurement, 60(4), 648-649
(3)堀 啓造 SPSS ときど記(132) 2003/03/18
因子分析 拡張因子分析・高次因子分析 extension
script
http://www.ec.kagawau.ac.jp/~hori/spss/tokidoki13.html#132
101
階層因子モデル
102
高次因子モデル
103
高次因子の例
104
直交解
• 主因子法 因子行列
1
2
共通性
T2001
.740
.173
.578
T2002
.690
.421
.654
T2003 -.454
.447
.406
T2004
.563
.185
.351
T2005 -.674 -.142
.475
T2006
.609
.111
.384
T2007
.540
.061
.295
T2008
.082
.215
.053
T2009 -.626
.625
.782
T2010 -.803
.178
.676
• バリマックス回転 因子負荷量
1
2
T2001
.719 -.247
T2002
.808 -.010
T2003 -.146
.620
T2004
.575 -.143
T2005 -.646
.238
T2006
.575 -.230
T2007
.489 -.235
T2008
.184
.138
T2009 -.198
.862
T2010 -.585
.578
• 2乗和
• 2乗和
3.707
0.946
2.926
1.727
105
1次因子・2次因子
• プロマックス法 因子パタン行列
1
2
T2001
.718 -.078
T2002
.891
.210
T2003
.032
.652
T2004
.591 -.002
T2005 -.641
.089
T2006
.564 -.099
T2007
.468 -.129
T2008
.247
.205
T2009
.050
.908
T2010 -.467
.484
•
2乗和 2.891 1.611
• 因子間相関
1
1 1.000
2 -.493
2
-.493
1.000
• 主因子法 因子行列
•
F1
F2
1 共通性
-.702
.493
.702
.493
106
階層因子分析 因子パタン
• 階層因子分析 因子パタン
•
HO 1
F1
F2
T2001 -.678
.512 -.176
T2002 -.575
.575 -.007
T2003
.538 -.104
.441
T2004 -.504
.409 -.102
T2005
.621 -.460
.170
T2006 -.565
.409 -.164
T2007 -.509
.348 -.168
T2008 -.032
.131
.099
T2009
.745 -.141
.614
T2010
.817 -.417
.411
• 2乗和
3.522
1.482
.875
• プロマックス法 因子パタン行列
1
2
T2001
.718 -.078
T2002
.891
.210
T2003
.032
.652
T2004
.591 -.002
T2005 -.641
.089
T2006
.564 -.099
T2007
.468 -.129
T2008
.247
.205
T2009
.050
.908
T2010 -.467
.484
•
2乗和 2.891 1.611
107
AMOSによる高次因子
108
AMOSの標準化総合効果-
109
110
Amos による階層因子分析=nested factor model
標準化直接効果
111
階層因子分析の評価
• 尺度をつくるときはたいてい一般因子を想定した尺
度を作っている。その下位尺度を因子分析の結果と
してある。bi-factor
– ただし、性格検査など通常、直交解を想定している。
• 高次因子分析のように相関だけではわかりにくい。
モデル的把握は高次因子分析のほうがいい。
• 3次以上の複雑なモデルになるとSEMで行った方
がいいだろう。
112
プログラム
• ○FACCON.EXE 服部環氏@筑波大学
http://www.human.tsukuba.ac.jp/~hattori/faccon/f
accon.html
• ○ excel vba program for faccon.exe コバンザメア
プリ (愛称:忍者ハットリ君)堀 啓造@香川大学
http://www.ec.kagawau.ac.jp/~hori/delphistat/hattori.html
• ○階層因子分析 macro & script
• http://www.ec.kagawau.ac.jp/~hori/spss/spss.html#hfactor
113
参考サイト
•
調査データ分析
http://www.ec.kagawa-u.ac.jp/~hori/chosadata/index.html
•
parallel analysis (因子分析の因子決定法)(2001/8/31)
http://www.ec.kagawa-u.ac.jp/~hori/yomimono/pa.html
•
因子数決定法の検討-Holzinger and Swineford(1939)の知能データをもとにして
(2003/3/23)
http://www.ec.kagawa-u.ac.jp/~hori/yomimono/pa2.html
•
因子分析練習帳1 Gorsuch(1983)変数サンプリング
http://www.ec.kagawa-u.ac.jp/~hori/yomimono/fanote1.html
•
因子数決定におけるマイナー因子の影響の検討
http://www.ec.kagawa-u.ac.jp/~hori/yomimono/MacCallum.html
•
日心2000ワークショップ 心理学の基礎(6) 因子分析の基本問題(2000/11/11)
http://www.ec.kagawa-u.ac.jp/~hori/spss/pwork.html
•
探索的因子分析リンク集(日本語中心)
http://www.ec.kagawa-u.ac.jp/~hori/spss/factorlink.html
114
データ
• Thurstone 知能データ
– L.L. Thurstone(1887-1955) のPrimary Mental Abilities
– http://www.ec.kagawau.ac.jp/~hori/yomimono/Thurstone.html
• 自尊心データ
– http://www.ec.kagawau.ac.jp/~hori/chosadata/fashion02.sav
• 外向性データ
– 豊田秀樹『項目反応理論[入門編]』朝倉書店
115