Transcript クリック - ODN
データ分析入門(13) 第13章 主成分分析 廣野元久 1 本章の概要 多数の量的変量(多次元)の関連について,少数個 の合成変量(回転操作)を作り見通しを立てる方法と して主成分分析がある 合成変量について何か特徴的なことが分かれば,複 雑な現象をより明確に把握することができる JMP INを使って,グラフィカルに主成分分析の考え 方や,その解釈を理解する 第13章 主成分分析 廣野元久 &高橋行雄 2/23 1.3次元プロット 3次元プロットを作ろう 使用するデータは犯罪.JMP 色々回転させて,プロットの様子を探ろう 第13章 主成分分析 廣野元久 &高橋行雄 3/23 1.3次元プロットの操作(1) DA Sample の犯罪.JMPをロードする メニューのグラフから回転プロットをクリック 第13章 主成分分析 廣野元久 &高橋行雄 4/23 頻度の高い州にラベルの付与 第13章 主成分分析 廣野元久 &高橋行雄 5/23 合衆国の地図 http://www.usatourist.com/japanese/tips/maps.html#map 第13章 主成分分析 廣野元久 &高橋行雄 6/23 よりみち散布図行列 ЋU•zђ}Ќs—с NEVADA LOUISIANA 15 MISSISSIPPI LOUISIANA NEVADA MISSISSIPPI CALIFORNIA ALASKA CALIFORNIA ALASKA 10 ЋEђl 5 MASSACHUSETTS RHODEISLAND RHODEISLAND MASSACHUSETTS IOWA SOUTHDAKOTA VERMONT NORTHDAKOTA ALASKA CALIFORNIA 50 IOWA SOUTHDAKOTA VERMONT NORTHDAKOTA ALASKA CALIFORNIA NEVADA NEVADA 40 LOUISIANA •wЏ—–\Ќs 30 20 10 LOUISIANA MASSACHUSETTS MISSISSIPPI MASSACHUSETTS MISSISSIPPI VERMONT SOUTHDAKOTA IOWARHODEISLAND NORTHDAKOTA VERMONT SOUTHDAKOTA IOWA NORTHDAKOTA RHODEISLAND 1200 1100 MASSACHUSETTS MASSACHUSETTS 1000 900 800 RHODEISLAND RHODEISLAND ALASKA 700 ALASKA CALIFORNIA CALIFORNIA 600 NEVADA Ћ©“®ЋФ“ђ NEVADA 500 400 300 200 LOUISIANA VERMONT IOWA LOUISIANA VERMONT MISSISSIPPI NORTHDAKOTA SOUTHDAKOTA 5 10 15 IOWA NORTHDAKOTA SOUTHDAKOTA MISSISSIPPI 10 20 30 40 第13章 主成分分析 廣野元久 &高橋行雄 50 200 300 400 500 600 700 800 900 1000 1100 1200 7/23 1. 3次元プロットの操作(2) 3.OKを クリック 2.変量の役割の指定でY,列をクリック 1.殺人,婦女暴行,自動車盗をそれぞれクリック 第13章 主成分分析 廣野元久 &高橋行雄 8/23 1. 3次元プロットの操作(3) ここをクリック 背景を白にする 回転のツール プロットをクリックすると 州名が表示される 第13章 主成分分析 廣野元久 &高橋行雄 9/23 1. 3次元プロットの操作(4) ポインタを 手のマークにする 手の位置を変えると その位置に従って 回転する 第13章 主成分分析 廣野元久 &高橋行雄 10/23 相関行列に合わせるように回転 NEVADA LOUISIANA MISSISSIPPI x CALIFORNIA ALASKA z y RHODEISLAND MASSACHUSETTS IOWA SOUTHDAKOTA VERMONT NORTHDAKOTA 第13章 主成分分析 廣野元久 &高橋行雄 11/23 2 主成分分析 2.1 主成分分析とは 2.2 主成分分析の実行と結果 2.3 主成分の解釈 2.4 軸の回転(バリマックス回転) 2.5 主成分得点とその保存方法 おまけ 第13章 主成分分析 廣野元久 &高橋行雄 12/23 2.1 主成分分析とは(1) 体格の軸は 体格 =a*体重 +b*身長 という合成を 考えたときに 合成変量の ばらつきが最大に なるように回転し 新しい軸を作る 体格 体型 第13章 主成分分析 廣野元久 &高橋行雄 13/23 2.1 主成分分析とは(2) めのこ 回帰直線 y y 主成分 70 残差は,垂直方向最小 残差は,直線の方向最小 x x XでYを予測する回帰 ‘МЏd 60 50 主成分 40 YでXを予測する回帰 第13章 主成分分析 廣野元久 &高橋行雄 160 170 ђg’· 14/23 2.2 主成分分析の実行と結果 ここをクリック 主成分分析を実行 ђ¬•Є: X: ЋEђl Y: •wЏ—–\Ќs Z: Ћ©“®ЋФ“ђ Ћеђ¬•Є1 Ћеђ¬•Є2 Ћеђ¬•Є3 固有値 成分寄与率 累積寄与率 y P1 P2 z x P3 主成分分析の結果 Ћеђ¬•Є•ЄђН ЊЕ—L’l 1.7264 0.9404 0.3332 Љс—^—¦ 57.5471 31.3466 11.1063 —ЭђПЉс—^—¦ 57.5471 88.8937 100.0000 ЊЕ—LѓxѓNѓgѓ‹ ЋEђl 0.60885 -0.49761 0.61781 •wЏ—–\Ќs 0.69104 -0.04979 -0.72110 Ћ©“®ЋФ“ђ 0.38959 0.86597 0.31355 第13章 主成分分析 廣野元久 &高橋行雄 成分に対する固有 ベクトル 15/23 2.3 主成分の解釈 Ћеђ¬•Є•ЄђН 第二主成分 ЊЕ—L’l 1.7264 0.9404 0.3332 自動車盗対殺人 Љс—^—¦ 57.5471 31.3466 11.1063 —ЭђПЉс—^—¦ 57.5471 88.8937 100.0000 ・婦女暴行 ЊЕ—LѓxѓNѓgѓ‹ 犯罪の特徴 ЋEђl 0.60885 -0.49761 0.61781 •wЏ—–\Ќs 0.69104 -0.04979 -0.72110 Ћ©“®ЋФ“ђ 0.38959 0.86597 0.31355 第3主成分は,寄与率も小さく 意味つけも困難なので,誤差と考える 全ての主成分を解釈すると次元の縮約に 第一主成分 ならないから,適当な成分で解釈をやめる 全ての変量が正だから 総合的な指標,全般的な犯罪の起こりやすさ 第13章 主成分分析 廣野元久 &高橋行雄 16/23 2.4 軸の回転(1) 解釈する主成分が決まったら,より解釈しや すいように,成分を回転する 回転の方法は沢山あるが,個々では,バリ マックス回転と呼ばれる方法で回転する ここをクリック 軸の回転をクリックする 第13章 主成分分析 廣野元久 &高橋行雄 17/23 2.4 軸の回転(2) €цЋq‰с“] ‰с“]€цЋq‚Мѓpѓ^Ѓ[ѓ“ ЋEђl 0.931125 •wЏ—–\Ќs 0.834683 Ћ©“®ЋФ“ђ0.084935 回転に使う主成分の 数を指定する ‰с“]Ќs—с 0.89563 -0.44480 結果が返される -0.076356 0.360623 0.979811 0.44480 0.89563 ‹¤’Кђ« ЋEђl 0.87282 •wЏ—–\Ќs 0.82675 Ћ©“®ЋФ“ђ 0.96724 •WЏЂ“ѕ“_ЊWђ” ЋEђl 0.643256 •wЏ—–\Ќs 0.493875 Ћ©“®ЋФ“ђ-0.131644 回転後は, 凶悪犯と窃盗犯の 因子に分かれる 共通性は,2つの因子で もとの変量を どれくらい説明できるか を示したもの -0.253469 0.187951 0.931677 •ЄЋU Љс—^—¦ —ЭђПЉс—^—¦ 1.5709 52.363 52.363 1.0959 36.530 88.894 第13章 主成分分析 廣野元久 &高橋行雄 18/23 2.5 主成分得点とその保存方法(1) ここをクリック 主成分の保存をクリックする 保存する主成分数を決める 第13章 主成分分析 廣野元久 &高橋行雄 19/23 2.5 主成分得点とその保存方法(2) データテーブルに 主成分得点が 追加される 犯罪多発 窃盗 凶悪犯 主成分得点で散布図を描くと 各州の特徴がはっきりする 第13章 主成分分析 廣野元久 &高橋行雄 20/23 回転後の主成分 第13章 主成分分析 廣野元久 &高橋行雄 21/23 臨床試験の質問紙の作成 http://www.mainichi.co.jp/life/life/pdf/4-0.pdf 第13章 主成分分析 廣野元久 &高橋行雄 22/23 http://www.mainichi.co.jp/life/life/mokuji.html QOL評価の研究 (1) (2) (3) (4) (5) (6) (7) 癌医療になぜQOL評価が必要か 評価すべきQOLの範囲 測定尺度に求められる条件 測定尺度に求められる信頼性と妥当性 測定尺度の種類と特徴 標準的な翻訳手順と交差文化的適応 QOL評価を成功させるための課題 QOL調査票の役割と意義 第13章 主成分分析 廣野元久 &高橋行雄 23/23