文献紹介IV(3相主成分分析関係)
Download
Report
Transcript 文献紹介IV(3相主成分分析関係)
文献紹介IV
行動データ科学研究分野 B4
里村 裕紀
文献
3相に対して3次以上のcross-productsを適用したら
どうなるか、考えてみるために読んでみた文献を紹
介
以下から部分部分を紹介
Bloxom, B. A note on invariance in three-mode factor
analysis. Psychometrika, 1968, 33, 347-350
→ほぼ全部
Kroonenberg, P. M., & Oort, F.J. Three-mode analysis of
multimode covariance matrices. British Journal of
Mathematical and Statistical Psychology, 2003, 56, 305335→具体例省略
Tucker3モデル
X(I×J×K)なる3次元配列を考える
I
X
K
J
こいつを成分に分解したい
前額面でスライス→I×Jの行列XkがK個
X={X1…XK} とすると以下のように分解できる
X AG(C B) E
X:I×JK
A:I×P
G:P×QR
B:J×Q
以下記号はKroonenbergに倣う
E:I×JK
C:K×R
Tucker3モデルの解釈
G:P×QR
G:P×Q×R なる核配列をXのように並べたもの
A, B, Cの各相がXにどれほど寄与しているかを示す重み
or
理想的個体の理想的変数による理想的条件の下での測定値
(X:個体×変数×条件の場合)
A:I×P
B:J×Q
C:K×R
GをXに変換するためのパターン行列
Cf , 2相のPCA, FA
X=FA’+E
A note on invariance in three-mode
factor analysis
Tucker3を因子分析モデルとして見てみよう
x (C B)Gξ ε
A(個体×因子の相)が因子得点と見なされる
分散共分散行列は
Σ (C B)GΦG(C B) Θ
不定性アリ
x = (C*⊗B*)G*’ξ* + ε
ξ*=Uξ
B*=BS
C*=CT
G*= U-1’G(T-1’ ⊗S-1’)
Three-mode analysis of multimode
covariance matrices
3.Factor models から紹介を始めます
3.1 Tucker-Bloxom models
モデル:前スライド参照
パラメータの推定
(C⊗B)G’=Λとすると
Σ=ΛΦΛ+Θ
負荷量に制約のある因子分析モデル
→SEMの枠組みで推定できる
因子1
Cf, SEM : 構造方程式モデリング
因子2
項目1 項目2 項目3 項目4
右のようなパス図を
自由にモデル化可能
誤差1 誤差2 誤差3 誤差4
確認的因子分析等を下位モデルとして包含
共分散構造に基づきモデルのパラメータを推定する
平均構造や3次の積率構造も用いることは出来るけれど
3.2 Restrictions
三相因子分析モデルは識別されない
→識別されるためには制約を課さねばならない
※方程式の数を増やすことに対応
具体的に…
因子負荷量にクロネッカーな構造を考える
(C⊗B)G’=Λ
ΦとΘにも同様の構造を考える
Θ=ΘC⊗ΘB
→これらは自由度を保つ
けどパラメータを増やすことが必要とされるときも
同じ変数に対する独自因子がacross occasionで相関している
自己相関に対するlagが含まれている 等
これらの場合も他の制約で何とかなる
ΘC:symmetric ΘB :diagonalとか
反復測定の場合の方法
自己回帰構造を課す
Θ=(IΘ-BΘ)-1ΨΘ(IΘ-B’Θ)-1
BΘ自己回帰効果パラメータの副対角行列
ΨΘ :残差分散の対角行列
Identification
識別される必要条件
ξ:have a scale
G:自由母数が存在しないと仮定すると
B, Cの各列から一つずつ, 非ゼロなQ+R個の負荷量を固定
P個の因子の分散を固定
のどちらかにより, ξはscaleを持つ
探索的な文脈では…
仮説ナシでcomponentは決定されねばならない
一般的には因子(ξ)は直交→Φ:diagonal
B, C:echelon form(階段行列)
G:diagonal であるか echelon form
→解釈にあたっては変換される
3.4 Estimation
最尤法で推定
xが正規分布 + モデルが識別されている という条件の下で
F ( S , ˆ ) ln ˆ ln(S ) tr ( Sˆ 1 ) JK
hat{Σ}:モデル共分散行列
S:観測共分散行列
を最小化するパラメータを求める
漸近標準誤差が出力される
→適合度の検定が可能
非正規の元では
→推定は出来るけど標準誤差はアテにならない
→RMSEA, AICは利用可能
RMSEA={(χ2/df-1)/(N-1)}-1/2
AIC=χ2-2df=df{(χ2/df)-2}
Component versus factor model
成分モデル
標本
因子モデル
母集団
最尤法で推定
標本の要約(縮約)表現
最小二乗法で推定
分散を最大化する射影
:いつでも可能で妥当
確認的分析の初期値
成分数を限定→節約の原理
残差はモデル化されない
標準誤差, χ2値が出力される
最小二乗法でも推定可能
適合の良い時のみ解釈可能
探索的に用いることも可能
大幅なパラメータの増加無しに
因子数を増やせる(確認的)
独自因子もモデル化される
Model Comparison
Measures of fit
RMR for 共分散行列の非対角要素
分散説明率 V = tr(ΛΦΛ’) / tr S
RMSEA, AIC
自由度
2相PCAにおけるスクリープロットのアナロジー
共分散行列の独立した値の数 と パラメータの数 の差
S=P+Q+Rで difs=Vs-Vs-1 を比べる
salience value : bs = difs / difs* (difs* : difs以降で最大の値 )
Model selection
最良モデルの探し方:常にあるわけじゃない
Discussion
数値的問題
成分モデル:代数的操作 + 逆行列を用いない →いつでも計算可能
因子モデル:時間かかるかも
具体例のオリジナルデータ(390×12×20)だとものっそい時間かかるらしいです
他のモデル
Oortによる平均構造を含むもの
Bloxomのモデル,Bentler & Leeのモデル, Browoneによる直積モデル
はSpecial Case
経時データに適する
McDonald’s による invariant factors model