相関分析

Download Report

Transcript 相関分析

相関分析の応用
散布図
共分散
相関係数
順位相関係数
散布図(Scatter-gram,正の関
係)
GDPとMS(兆円)
MS
700
600
500
400
300
300
400
500
GDP
600
散布図(負の相関関係)
貯蓄と世帯数の関係
世帯数
1000
800
600
400
200
0
0
500
1000 1500 2000 2500 3000
貯蓄
無相関の例
統計学の前期と後期の試験点数(n=10)
後期
90
80
70
60
50
40
30
20
10
0
0
20
40
前期
60
80
Xの分散とYの分散
変数 x1 , x 2 ,   x n と変数 y1 , y 2 ,   y n の
それぞれの分散が次のように定義される。
n
S xx 
 (x
n
i
i 1
n
 x)
2
S yy 
 (y
i
i 1
n
 y)
2
共分散(Covariance)
x i と y i について
n
S xy 
 (x
i
 x )( y i  y )
i 1
n
で定義される S xy を x i と y i の共分散
といい、Cov(x, y)と書く。
Xとyの変動と共分散の符号
Xとyの増減変化の方向が一致であれば、
S xy の値がプラスになり、xとyが正の相関
関係が存在する。
Xとyの増減変化の方向が逆であれば、
S xy の値がマイナスになり、xとyが負の相
関関係をもつ。
相関係数
相関係数は次式で定義される。
 xy 
S xy
S xx  S yy

S xy
Sx Sy
n
 (x

i
 x )( y i  y ) / n
i 1
 (x
 x) / n
2
i
 (y
 y) / n
2
i
共分散と相関係数の関係
相関係数はxとyの共分散 S xy を標準偏差
Sで基準化したものである。
x , S y
 xy 
 (x
 x )( y i  y )
i
nS x S y
n


i 1
(
xi  x
Sx
)(
yi  y
Sy
n
)
相関係数の性質
相関係数  xy は共分散 S xy と同じ符号をもち、
常に  1   xy  1 の範囲にある。

xy

xy

xy
=1ならば、すべての観測値が正の傾きを持つ
同一直線上に並ぶ。
=-1ならば、すべての観測値が負の傾きを持つ
同一直線上に並ぶ。
は0に近ければ、XとYの間に相関はない。
相関係数の計算式
 xy 
n  x
n  x i y i   x iΣ y i
2
i
 (  xi )
2
n  y
2
i
 ( yi )
2

順位相関係数
2つの変数を質的基準によって順位づけて、
2変数の質的基準による順位相関関係を
示す指標。
n

6 d
s
 1
i 1
2
n(n
2
 1)
 は2変数の質的基準による順位にお
ける差の平方和を意味する。
d
2