相関行列に基づく非計量多次元尺度法に関する研究
Download
Report
Transcript 相関行列に基づく非計量多次元尺度法に関する研究
平成14年2月8日
卒業研究報告
相関行列に基づく非計量多次元尺度法
に関する研究
原 康暢
畜産経営管理講座
(統計研究室)
1
1.はじめに
MDS:多次元尺度構成法
類似度データ
非類似度データ
背後の構造を視覚化
MDSの特徴
似ているものは近く
似てないものは遠く
2
MDSの種類
計量MDS
データが間隔尺度・比尺度の場合
トーガソンの方法
非計量MDS
データが順位尺度の場合
クラスカルの方法
3
研究目的
非計量MDS
適
用
可
能
非類似度
類似度
研究目的
変量間
類似度
相関行列で定義
クラスカルの方法
・適用 ・分析
有効性?
4
2.クラスカルの方法
対象i,j間の類似度 ij (データの値)とn次元空間上の距
離 の順位を適合させる。
ij
単調回帰法
d
類似度
非類似度
d ij
ij と単調関係
f( )
f ( ij )
単調減少関数
単調増加関数
空間上の距離と単調変換の値の誤差を
dij d ij eij
d ij
単調変換
=
空間上の距離
eij とする
(a)
5
ストレス(Stress)
すべての誤差
eijの二乗和
データと、空間上の距離の
適合度
S
(
d
d
)
ij
ij
i j
d
i j
2
2
ij
この値が最も小さくなるような
単調関数と対象の布置を求める。
(1)
6
3.モンテカルロシミュレーション実験
変量1・2・3
変量4・5
第1ブロック
第2ブロック
変量6・7・8
変量9~13
変量14~20
第3ブロック
第4ブロック
第5ブロック
となるよう相関係数を定め
乱数を用いそれぞれを
1000組発生させる。
変量間の相関行列を算出
相関行列を入力データとし、
クラスカルの方法へ適用
7
実験結果
1.4
2次元選択
VAR4
(Stress;0.183)
VAR3
VAR1
VAR2
VAR11
0.6
次元 2
視覚的に見やす
いことを前提
VAR5
1.0
VAR6 VAR7
0.2
-0.2
VAR20
VAR18
VAR19
-1.0
-1.2
VAR13
VAR15
VAR14
VAR16
VAR17
-0.6
Stressの値
高いが無視
VAR8
-0.8
-0.4
VAR12
VAR10
VAR9
0.0
0.4
0.8
1.2
次元 1
(図3)最終布置 2D散布図
5個のブロックを形成
相関行列で定義された類似度
クラスカルの方法適用
相関行列を正確に反映
有効な分析可能!
8
4.実際のデータへの適用
中学生166人の12教科の評点
12教科の相関行列を算出
(表2)中学2年生166人 2学期 12教科の評点
生徒番号
国語
社会
数学
理科
音楽
美術
体育
技家
英語
小4配当漢字
小5配当漢字
小6配当漢字
1
32
41
50
64
64
66
37
43
22
62
68
52
2
38
23
46
60
69
72
54
66
12
48
46
32
3
30
30
25
59
68
72
36
54
10
28
36
42
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
166
60
85
88
82
59
78
85
47
83
79
84
74
9
(表3)12教科の相関行列
国語
社会
数学
・
・
・
小5配当
小6配当
国語
1
0.7825
0.735
・
・
・
0.7819
0.7595
社会
0.7825
1
0.7873
・
・
・
0.6757
0.696
数学
0.735
0.7873
1
・
・
・
0.6076
0.5651
・・・
・・・
・・・
・・・
・・・
・・・
小5配当
0.7819
0.6757
0.6076
・
・
・
1
0.8842
小6配当
0.7595
0.696
0.5651
・
・
・
0.8842
1
入力データとしクラスカルの方法
へ適用・分析
10
分析結果
2次元選択
(Stress;0.0113)
0.2
小4配当 小6配当
小5配当
0.1
次元 2
0.0
他のすべての教科と
国語
美術
英語
社会
数学
音楽
理科
体育
相関の低い体育
-0.1
2次元最終布置退化
-0.2
-0.3
-4
技家
-3
-2
-1
次元 1
(図4)最終布置 2次元選択 中学生 成績
0
1
3次元を選択し、計算
をやり直す。
11
3次元選択
(Stress;0.023)
散布図中の科目間距離
科目の組 と
単調関数
4.0
f( )
3.5
3.0
.
d ij
2.5
2.0
.
1.5
=
.
eij
0.0
.
d ij
-0.5
0.0
単調関数は右下がり
・ (i, j)
1.0
0.5
相関係数は類似度
0.2
0.4
.
0.6
0.8
1.0
ij データ(相関係数)
(図5)シェパード・ダイアグラム
シェパード・ダイアグラム
データ
単調関数と科目の組を比較
ij と散布図中の距離 d ij の当てはまりの良さを示す。
12
3次元選択した場合の最終布
置
美術 音楽
数学理科
次
元
3
・小6配生徒の持つ体力
当 小5配当
社会
・ 手先の器用さ
英語
体育
国語
小4配当
・ 感性の強さ に左右される。
感
性
技家
次元2 器用
次元1 体力
(図6)最終布置 3次元選択 中学生 成績
解釈
中学2年生の12教科の成績の評点
13
5.おわりに
結論
相関行列により定義されたの変量間の類似度を、クラスカル
の方法へ適用する分析方法は、データの特性を知るうえでた
いへん有効であることがわかった。
応用分野
経営
管理
経営
診断
生物学
MDSと相関ルールの関連性
心理学
14
スーパーの経営管理
コスメ
タバコ
お菓子
お茶
弁当
パン
牛乳
雑誌
つまみ
酒
パンツ
MDS による(仮想的)商品配置図
15
酪農経営 経営診断
16
主成分分析の結果
因子負荷量 , 因子 1 vs 因子 2 vs 因子 3
回転法: バリマックス 法
抽出法: 主成分分析
小6配当
小
5配当
小4配
当
国語
英語 社会
音
楽
美術
数学理科
技家
体育
17