クリック - ODN

Download Report

Transcript クリック - ODN

データ分析入門(13)
第13章 主成分分析
廣野元久
1
本章の概要

多数の量的変量(多次元)の関連について,少数個
の合成変量(回転操作)を作り見通しを立てる方法と
して主成分分析がある

合成変量について何か特徴的なことが分かれば,複
雑な現象をより明確に把握することができる

JMP INを使って,グラフィカルに主成分分析の考え
方や,その解釈を理解する
第13章 主成分分析
廣野元久 &高橋行雄
2/23
1.3次元プロット
3次元プロットを作ろう
 使用するデータは犯罪.JMP
 色々回転させて,プロットの様子を探ろう

第13章 主成分分析
廣野元久 &高橋行雄
3/23
1.3次元プロットの操作(1)
DA Sample の犯罪.JMPをロードする
メニューのグラフから回転プロットをクリック
第13章 主成分分析
廣野元久 &高橋行雄
4/23
頻度の高い州にラベルの付与
第13章 主成分分析
廣野元久 &高橋行雄
5/23
合衆国の地図
http://www.usatourist.com/japanese/tips/maps.html#map
第13章 主成分分析
廣野元久 &高橋行雄
6/23
よりみち散布図行列
ЋU•zђ}Ќs—с
NEVADA
LOUISIANA
15
MISSISSIPPI
LOUISIANA NEVADA
MISSISSIPPI
CALIFORNIA
ALASKA
CALIFORNIA
ALASKA
10
ЋEђl
5
MASSACHUSETTS
RHODEISLAND
RHODEISLAND
MASSACHUSETTS
IOWA
SOUTHDAKOTA
VERMONT
NORTHDAKOTA
ALASKA
CALIFORNIA
50
IOWA
SOUTHDAKOTA
VERMONT
NORTHDAKOTA
ALASKA
CALIFORNIA
NEVADA
NEVADA
40
LOUISIANA
•wЏ—–\Ќs
30
20
10
LOUISIANA
MASSACHUSETTS
MISSISSIPPI
MASSACHUSETTS
MISSISSIPPI
VERMONT
SOUTHDAKOTA
IOWARHODEISLAND
NORTHDAKOTA
VERMONT
SOUTHDAKOTA
IOWA
NORTHDAKOTA
RHODEISLAND
1200
1100
MASSACHUSETTS
MASSACHUSETTS
1000
900
800
RHODEISLAND
RHODEISLAND
ALASKA
700
ALASKA
CALIFORNIA
CALIFORNIA
600
NEVADA
Ћ©“®ЋФ“ђ
NEVADA
500
400
300
200
LOUISIANA
VERMONT
IOWA
LOUISIANA
VERMONT
MISSISSIPPI
NORTHDAKOTA
SOUTHDAKOTA
5
10
15
IOWA
NORTHDAKOTA
SOUTHDAKOTA
MISSISSIPPI
10
20
30
40
第13章 主成分分析
廣野元久 &高橋行雄
50
200
300
400
500
600
700
800
900 1000 1100 1200
7/23
1. 3次元プロットの操作(2)
3.OKを
クリック
2.変量の役割の指定でY,列をクリック
1.殺人,婦女暴行,自動車盗をそれぞれクリック
第13章 主成分分析
廣野元久 &高橋行雄
8/23

1. 3次元プロットの操作(3)
ここをクリック
背景を白にする
回転のツール
プロットをクリックすると
州名が表示される
第13章 主成分分析
廣野元久 &高橋行雄
9/23
1. 3次元プロットの操作(4)
ポインタを
手のマークにする
手の位置を変えると
その位置に従って
回転する
第13章 主成分分析
廣野元久 &高橋行雄
10/23
相関行列に合わせるように回転
NEVADA
LOUISIANA
MISSISSIPPI
x
CALIFORNIA
ALASKA
z
y
RHODEISLAND
MASSACHUSETTS
IOWA
SOUTHDAKOTA
VERMONT
NORTHDAKOTA
第13章 主成分分析
廣野元久 &高橋行雄
11/23
2 主成分分析






2.1 主成分分析とは
2.2 主成分分析の実行と結果
2.3 主成分の解釈
2.4 軸の回転(バリマックス回転)
2.5 主成分得点とその保存方法
おまけ
第13章 主成分分析
廣野元久 &高橋行雄
12/23
2.1 主成分分析とは(1)
体格の軸は
体格
=a*体重
+b*身長
という合成を
考えたときに
合成変量の
ばらつきが最大に
なるように回転し
新しい軸を作る
体格
体型
第13章 主成分分析
廣野元久 &高橋行雄
13/23
2.1 主成分分析とは(2)
めのこ
回帰直線
y
y
主成分
70
残差は,垂直方向最小
残差は,直線の方向最小
x
x
XでYを予測する回帰
‘МЏd
60
50
主成分
40
YでXを予測する回帰
第13章 主成分分析
廣野元久 &高橋行雄
160
170
ђg’·
14/23
2.2 主成分分析の実行と結果
ここをクリック
主成分分析を実行
ђ¬•Є:
X: ЋEђl
Y: •wЏ—–\Ќs
Z: Ћ©“®ЋФ“ђ
Ћеђ¬•Є1
Ћеђ¬•Є2
Ћеђ¬•Є3
固有値 成分寄与率
累積寄与率
y
P1
P2 z
x
P3
主成分分析の結果
Ћеђ¬•Є•ЄђН
ЊЕ—L’l
1.7264
0.9404
0.3332
Љс—^—¦
57.5471 31.3466 11.1063
—ЭђПЉс—^—¦ 57.5471 88.8937 100.0000
ЊЕ—LѓxѓNѓgѓ‹
ЋEђl
0.60885 -0.49761 0.61781
•wЏ—–\Ќs
0.69104 -0.04979 -0.72110
Ћ©“®ЋФ“ђ
0.38959 0.86597 0.31355
第13章 主成分分析
廣野元久 &高橋行雄
成分に対する固有
ベクトル
15/23
2.3 主成分の解釈
Ћеђ¬•Є•ЄђН
第二主成分
ЊЕ—L’l
1.7264
0.9404
0.3332 自動車盗対殺人
Љс—^—¦
57.5471 31.3466 11.1063
—ЭђПЉс—^—¦ 57.5471 88.8937 100.0000 ・婦女暴行
ЊЕ—LѓxѓNѓgѓ‹
犯罪の特徴
ЋEђl
0.60885 -0.49761 0.61781
•wЏ—–\Ќs
0.69104 -0.04979 -0.72110
Ћ©“®ЋФ“ђ
0.38959 0.86597 0.31355
第3主成分は,寄与率も小さく
意味つけも困難なので,誤差と考える
全ての主成分を解釈すると次元の縮約に
第一主成分
ならないから,適当な成分で解釈をやめる
全ての変量が正だから
総合的な指標,全般的な犯罪の起こりやすさ
第13章 主成分分析
廣野元久 &高橋行雄
16/23
2.4 軸の回転(1)
解釈する主成分が決まったら,より解釈しや
すいように,成分を回転する
 回転の方法は沢山あるが,個々では,バリ
マックス回転と呼ばれる方法で回転する

ここをクリック
軸の回転をクリックする
第13章 主成分分析
廣野元久 &高橋行雄
17/23
2.4 軸の回転(2)
€цЋq‰с“]
‰с“]€цЋq‚Мѓpѓ^Ѓ[ѓ“
ЋEђl
0.931125
•wЏ—–\Ќs 0.834683
Ћ©“®ЋФ“ђ0.084935
回転に使う主成分の
数を指定する
‰с“]Ќs—с
0.89563
-0.44480
結果が返される
-0.076356
0.360623
0.979811
0.44480
0.89563
‹¤’Кђ«
ЋEђl
0.87282
•wЏ—–\Ќs 0.82675
Ћ©“®ЋФ“ђ 0.96724
•WЏЂ“ѕ“_ЊWђ”
ЋEђl
0.643256
•wЏ—–\Ќs 0.493875
Ћ©“®ЋФ“ђ-0.131644
回転後は,
凶悪犯と窃盗犯の
因子に分かれる
共通性は,2つの因子で
もとの変量を
どれくらい説明できるか
を示したもの
-0.253469
0.187951
0.931677
•ЄЋU Љс—^—¦
—ЭђПЉс—^—¦
1.5709
52.363
52.363
1.0959
36.530
88.894
第13章 主成分分析
廣野元久 &高橋行雄
18/23
2.5 主成分得点とその保存方法(1)
ここをクリック
主成分の保存をクリックする
保存する主成分数を決める
第13章 主成分分析
廣野元久 &高橋行雄
19/23
2.5 主成分得点とその保存方法(2)
データテーブルに
主成分得点が
追加される
犯罪多発
窃盗
凶悪犯
主成分得点で散布図を描くと
各州の特徴がはっきりする
第13章 主成分分析
廣野元久 &高橋行雄
20/23
回転後の主成分
第13章 主成分分析
廣野元久 &高橋行雄
21/23
臨床試験の質問紙の作成
http://www.mainichi.co.jp/life/life/pdf/4-0.pdf
第13章 主成分分析
廣野元久 &高橋行雄
22/23
http://www.mainichi.co.jp/life/life/mokuji.html









QOL評価の研究
(1)
(2)
(3)
(4)
(5)
(6)
(7)
癌医療になぜQOL評価が必要か
評価すべきQOLの範囲
測定尺度に求められる条件
測定尺度に求められる信頼性と妥当性
測定尺度の種類と特徴
標準的な翻訳手順と交差文化的適応
QOL評価を成功させるための課題
QOL調査票の役割と意義
第13章 主成分分析
廣野元久 &高橋行雄
23/23