文献紹介IV(3相主成分分析関係)

Download Report

Transcript 文献紹介IV(3相主成分分析関係)

文献紹介IV
行動データ科学研究分野 B4
里村 裕紀
文献

3相に対して3次以上のcross-productsを適用したら
どうなるか、考えてみるために読んでみた文献を紹
介

以下から部分部分を紹介
 Bloxom, B. A note on invariance in three-mode factor
analysis. Psychometrika, 1968, 33, 347-350
→ほぼ全部
 Kroonenberg, P. M., & Oort, F.J. Three-mode analysis of
multimode covariance matrices. British Journal of
Mathematical and Statistical Psychology, 2003, 56, 305335→具体例省略
Tucker3モデル

X(I×J×K)なる3次元配列を考える
I
X
K



J
こいつを成分に分解したい
前額面でスライス→I×Jの行列XkがK個
X={X1…XK} とすると以下のように分解できる
X  AG(C  B)  E
X:I×JK
A:I×P

G:P×QR
B:J×Q
以下記号はKroonenbergに倣う
E:I×JK
C:K×R
Tucker3モデルの解釈

G:P×QR
G:P×Q×R なる核配列をXのように並べたもの
 A, B, Cの各相がXにどれほど寄与しているかを示す重み
or
 理想的個体の理想的変数による理想的条件の下での測定値
(X:個体×変数×条件の場合)


A:I×P
B:J×Q

C:K×R
GをXに変換するためのパターン行列
 Cf , 2相のPCA, FA

X=FA’+E
A note on invariance in three-mode
factor analysis

Tucker3を因子分析モデルとして見てみよう
x  (C  B)Gξ  ε


A(個体×因子の相)が因子得点と見なされる
分散共分散行列は
Σ  (C  B)GΦG(C  B)  Θ

不定性アリ
 x = (C*⊗B*)G*’ξ* + ε

ξ*=Uξ
B*=BS
C*=CT
G*= U-1’G(T-1’ ⊗S-1’)
Three-mode analysis of multimode
covariance matrices


3.Factor models から紹介を始めます
3.1 Tucker-Bloxom models


モデル:前スライド参照
パラメータの推定



(C⊗B)G’=Λとすると
Σ=ΛΦΛ+Θ
負荷量に制約のある因子分析モデル
→SEMの枠組みで推定できる
因子1
Cf, SEM : 構造方程式モデリング



因子2
項目1 項目2 項目3 項目4
右のようなパス図を
自由にモデル化可能
誤差1 誤差2 誤差3 誤差4
確認的因子分析等を下位モデルとして包含
共分散構造に基づきモデルのパラメータを推定する

平均構造や3次の積率構造も用いることは出来るけれど
3.2 Restrictions

三相因子分析モデルは識別されない

→識別されるためには制約を課さねばならない


※方程式の数を増やすことに対応
具体的に…

因子負荷量にクロネッカーな構造を考える


(C⊗B)G’=Λ
ΦとΘにも同様の構造を考える

Θ=ΘC⊗ΘB
→これらは自由度を保つ
 けどパラメータを増やすことが必要とされるときも


同じ変数に対する独自因子がacross occasionで相関している
自己相関に対するlagが含まれている 等
これらの場合も他の制約で何とかなる


ΘC:symmetric ΘB :diagonalとか
反復測定の場合の方法

自己回帰構造を課す



Θ=(IΘ-BΘ)-1ΨΘ(IΘ-B’Θ)-1
BΘ自己回帰効果パラメータの副対角行列
ΨΘ :残差分散の対角行列
Identification

識別される必要条件

ξ:have a scale

G:自由母数が存在しないと仮定すると


B, Cの各列から一つずつ, 非ゼロなQ+R個の負荷量を固定
P個の因子の分散を固定
のどちらかにより, ξはscaleを持つ

探索的な文脈では…
仮説ナシでcomponentは決定されねばならない
 一般的には因子(ξ)は直交→Φ:diagonal
B, C:echelon form(階段行列)
G:diagonal であるか echelon form
→解釈にあたっては変換される

3.4 Estimation

最尤法で推定

xが正規分布 + モデルが識別されている という条件の下で
F ( S , ˆ )  ln ˆ  ln(S )  tr ( Sˆ 1 )  JK
hat{Σ}:モデル共分散行列


S:観測共分散行列
を最小化するパラメータを求める
漸近標準誤差が出力される
→適合度の検定が可能
非正規の元では
→推定は出来るけど標準誤差はアテにならない
→RMSEA, AICは利用可能
 RMSEA={(χ2/df-1)/(N-1)}-1/2
 AIC=χ2-2df=df{(χ2/df)-2}
Component versus factor model

成分モデル

標本


因子モデル

母集団

最尤法で推定
標本の要約(縮約)表現
最小二乗法で推定
分散を最大化する射影
:いつでも可能で妥当
 確認的分析の初期値
 成分数を限定→節約の原理



残差はモデル化されない


標準誤差, χ2値が出力される

最小二乗法でも推定可能
適合の良い時のみ解釈可能
探索的に用いることも可能
 大幅なパラメータの増加無しに
因子数を増やせる(確認的)
 独自因子もモデル化される

Model Comparison

Measures of fit
RMR for 共分散行列の非対角要素
 分散説明率 V = tr(ΛΦΛ’) / tr S
 RMSEA, AIC
 自由度



2相PCAにおけるスクリープロットのアナロジー



共分散行列の独立した値の数 と パラメータの数 の差
S=P+Q+Rで difs=Vs-Vs-1 を比べる
salience value : bs = difs / difs* (difs* : difs以降で最大の値 )
Model selection

最良モデルの探し方:常にあるわけじゃない
Discussion

数値的問題
成分モデル:代数的操作 + 逆行列を用いない →いつでも計算可能
 因子モデル:時間かかるかも



具体例のオリジナルデータ(390×12×20)だとものっそい時間かかるらしいです
他のモデル

Oortによる平均構造を含むもの



Bloxomのモデル,Bentler & Leeのモデル, Browoneによる直積モデル
はSpecial Case
経時データに適する
McDonald’s による invariant factors model