ppt - 行動統計科学研究分野

Download Report

Transcript ppt - 行動統計科学研究分野

非線形多変量解析法に関する研究
非線形因子分析への
ノンパラメトリック回帰によるアプローチ
大阪大学人間科学部人間科学科
行動生態学講座行動計量学研究分野
B4 山本倫生
卒論発表
1
卒論発表の前に・・・

自己紹介


名前:山本倫生
出身地:京都


プロ野球:東京ヤクルトスワローズ


関西人と呼ばないで
でも阪神は好きです(念のため)
研究内容の変遷
犯罪
心理
紆
余
曲
折
ノンパラメトリック回帰
&
卒論発表
非線形因子分析2
非線形多変量解析法の必要性

線形性を仮定することの限界



変数間の関係が線形であるとは限らない
その場合線形手法では有用な情報が得られない
様々な非線形モデル

例えば主成分分析では

カーネル主成分分析,ニューラルネット,etc…
卒論発表
3
因子分析の問題点

因子分析とは



多くの変数の相関関係を,観測できない少数の潜在
変数によって説明する手法
行動・社会科学で良く用いられる手法の一つ
観測変数-潜在変数間は線形という仮定

実際のデータがそのようになっているとは限らない
非線形因子分析モデルが必要
卒論発表
決定的なモデルは
まだない
4
本研究の目的

非線形因子モデルとして二つのモデルを提案


各モデルの性質を検討


多項式モデル,スプラインモデル
シミュレーション
応用場面への適用可能性の探索

適用例1,適用例2
卒論発表
5
非線形因子分析モデル

1枚目/5枚中
因子分析モデル

本研究では共通因子の数は一つとする
x:観測変数ベクトル
f:因子得点

ε:誤差ベクトル
多項式モデル

上記の関数g(・)を単純な多項式で表す
ex:2次多項式モデル

パラメータの推定には最尤法を用いる
卒論発表
観
測
変
数
因子得点
6
非線形因子分析モデル

2枚目/5枚中
スプラインモデル

g(・)をBスプライン基底を用いて表現 観
測
変
数
因子得点

通常の最尤法では,推定値の形状が不自然に歪む
形状に制約が必要
ペナルティ付き最尤法を用いる
卒論発表
7
ペナルティ付き最尤法

3枚目/5枚中
以下の値を最大にするパラメータを求める
対数尤度
卒論発表
平滑化ペナルティ
8
ペナルティの効果
通常の最尤法
4枚目/5枚中
ペナルティ付き(η=1)
卒論発表
9
ペナルティの効果
ペナルティ付き(η=0.01)
5枚目/5枚中
ペナルティ付き
(η=0.001)
卒論発表
10
シミュレーション
~目的・方法~

目的


1枚目/6枚中
非線形モデルの性質の検討
方法

潜在‐観測変数間に4つの異なる状態を仮定


線形,2次,3次,非多項式
各モデルを適用し,その適合度指標を見る

各情報量基準,真値との相関係数,RMSE
卒論発表
11
シミュレーション
~結果:(ex)2次の関係にある場合~
2枚目/6枚中
2次多項式モデル
線形モデル
卒論発表
12
シミュレーション
~結果:(ex)2次の関係にある場合~
3次多項式モデル
3枚目/6枚中
スプラインモデル(η=0.001)
卒論発表
13
シミュレーション
~結果:(ex)2次の関係にある場合~
4枚目/6枚中
情報量基準
相関係数
RMSE
卒論発表
14
シミュレーション
~結果・考察~

5枚目/6枚中
多項式モデル



潜在‐観測変数間が多項式で表せる場合,それに
合った次数を用いたモデルが最良のモデルとなった
EX:3次の関係に対する3次多項式モデル
潜在‐観測変数間がどの多項式で表せるかがわかっ
ている場合に有効
卒論発表
15
シミュレーション
~結果・考察~

6枚目/6枚中
スプラインモデル



どのようなデータに対しても相関係数とRMSEの値は
良かった
多項式モデルほど真の構造に依存しない,柔軟性を
持つ
ただし,情報量基準の値は他と比べて悪い
卒論発表
16
適用例1
~性格検査データ~
データ

「温和」「親切」「協力的」「素直」の4つの尺度に対し
て7件法で回答を得た


1枚目/2枚中
分析方法
1.
2.
3.
スプラインモデルによって潜在‐観測変数間の関係
を推測
非線形関係が見られた場合,それに合った次数の
多項式モデルを当てはめる
適合度を用いて最良のモデルを探索
卒論発表
17
適用例1
~性格検査データ~

2枚目/2枚中
結果と考察

因子と「親切」,「協力的」の尺度の間に,同様の緩
やかな2次関数的な関係が見られた


因子得点の高低によって,尺度に対する傾向が異なる
変数間は線形でも,潜在変数との関係が非線形な
親
場合があることがわかった 切
(
協
力
的
)
卒論発表
人の良さ
18
本研究から得られた知見

各非線形モデルの性質

多項式モデル



スプラインモデル



事前知識がある場合に有効
表せる形状に制限がある
柔軟なモデル
節点などの値をうまく設定しなければならない
非線形因子分析モデルの有用性

応用場面でも非線形関係が見られたため,非線形モ
デルの有用性は高いと言える
卒論発表
19
今後の展望

新たな適合度指標の利用


計算速度の向上


GICを用いれば,スプラインモデルと線形因子分析
の比較が行える可能性がある
特にスプラインモデルではパラメータ数が多いので,
線形モデルに比べて速度が遅い
多因子モデルへの拡張

さらに非線形SEMへの拡張も考えられる
卒論発表
20
今後の方向性

非線形因子分析をやってみたいなと


スプラインを用いたものに限らず
探索的よりかは検証的なものを目指す

探索的なものはしんどい

因子数,回転の不定性
卒論発表
21
終
卒論発表
22
「非線形+非線形=線形」の例
観
測
変
数
1
+
観
測
変
数
2
因子得点
=
因子得点
観
測
変
数
2
卒論発表
観測変数1
23
モデルの尤度
線形因子分析の場合
卒論発表
24
潜在変数の分布の離散化
卒論発表
25