主成分の導出

Download Report

Transcript 主成分の導出

主成分分析
主成分分析は
多くの変数の中を軸を取り直すことで
より低い次元で表現できるようにする。
データがばらついている方向ほど
多くの情報を含んでいると考える。
相関係数(分散と共分散)を元に計算する。
[テーマ] 講義の構成
主成分分析のイメージ
主成分の導出
Rでの計算
まとめ
主成分分析のイメージ
主成分分析とは
主成分分析とは
主成分分析とは
主成分分析とは
主成分分析とは
主成分の導出
主成分分析の導出
中心化
標準化
主成分分析の導出
中心化(または、標準化)
主成分分析の導出
中心化(または、標準化)
主成分分析の導出
主成分分析の導出(1)
主成分分析の導出(1)
主成分分析の導出(1)
主成分分析の導出(1)
主成分分析の導出(2)
主成分分析の導出(2)
主成分分析の導出(2)
主成分分析の導出(2)
+
N (または N - 1 )で割る
中心化した場合
主成分分析の導出(2)
+
N (または N - 1 )で割る
標準化した場合
ラグランジュの未定乗数法
中心化されたデータの場合
という条件のもとで
が最大となるような
,
を求める
ラグランジュの未定乗数法
中心化されたデータの場合
という条件のもとで
が最大となるような
,
を求める
ラグランジュの未定乗数法
ラグランジュの未定乗数法
中心化されたデータの場合
で偏微分
で偏微分
で偏微分
という条件のもとで
が最大となるような
,
を求める
ラグランジュの未定乗数法
ラグランジュの未定乗数法
中心化されたデータの場合
で偏微分
で偏微分
で偏微分
という条件のもとで
が最大となるような
,
を求める
ラグランジュの未定乗数法
これをまとめると
ラグランジュの未定乗数法
中心化されたデータの場合
で偏微分
で偏微分
で偏微分
という条件のもとで
が最大となるような
,
これをまとめると
を求める
ラグランジュの未定乗数法
分散共分散行列の
固有値,固有ベクトルを求める
ラグランジュの未定乗数法
中心化されたデータの場合
で偏微分
で偏微分
で偏微分
という条件のもとで
が最大となるような
,
これをまとめると
を求める
ラグランジュの未定乗数法
分散共分散行列の
固有値,固有ベクトルを求める
ラグランジュの未定乗数法
標準化されたデータの場合
で偏微分
で偏微分
で偏微分
という条件のもとで
が最大となるような
,
これをまとめると
を求める
ラグランジュの未定乗数法
相関行列の
固有値,固有ベクトルを求める
固有値と寄与率
中心化後のデータの場合
標準化後のデータの場合
固有値と寄与率
中心化後のデータの場合
標準化後のデータの場合
・値の大きい固有値
から順に考える。
・値の大きい固有値に
対応した軸(主成分)
を順に
第1主成分、第2主成分
という。
・固有ベクトルが
互いに直交する。
主成分分析の導出(寄与率,累積寄与率)
一般(r 次元)
中心化後のデータの場合
寄与率
累積寄与率
,
分散共分散行列の固有値・固有ベクトル
主成分分析の導出(寄与率,累積寄与率)
一般(r 次元)
標準化後のデータの場合
寄与率
累積寄与率
,
相関行列の固有値・固有ベクトル
主成分分析のまとめ
一般(r 次元)
中心化後のデータの場合
累積寄与率
m 個の固有値・固有ベクトルを計算し
,
を求める。
主成分分析のまとめ
一般(r 次元)
標準化後のデータの場合
累積寄与率
m 個の固有値・固有ベクトルを計算し
,
を求める。
Rでのシミュレーション
Rによる主成分分析の計算
> w1 <- read.table (“w0.dat”,header=TRUE, row.names=1)
> w2 <- prcomp(w1,center=TRUE, scale=TRUE)
> summary(w2)
>plot(w2$x,type=“n”)
>text(w2$x,rownames(w2$x))
データについて
体格データ
標準化後
Rによる主成分分析の計算
> w1 <- read.table(“w0.dat”,header=TRUE, row.names=1)
> w2 <- prcomp(w1,center=TRUE, scale=TRUE)
> summary(w2)
>plot(w2$x,type=“n”)
>text(w2$x,rownames(w2$x))
Rによる主成分分析の計算
> w1 <- read.table(“w0.dat”,header=TRUE, row.names=1)
> w2 <- prcomp(w1,center=TRUE, scale=TRUE)
> summary(w2)
>plot(w2$x,type=“n”)
>text(w2$x,rownames(w2$x))
まとめ
まとめ
主成分分析のイメージ
データのばらつき,主成分
主成分の導出
中心化,標準化
分散,
共分散,相関係数
固有値,固有ベクトル,寄与率