第4回授業(8月31日第4時限)
Download
Report
Transcript 第4回授業(8月31日第4時限)
第1日目第4時限の学習目標
基本的な2変量統計量-2
(ピアソンの)相関係数について学
ぶ。
(1)相関係数の定義とその特性
(2)相関係数の計算方法
基本的な2変量統計量-2
(ピアソンの)相関係数(1)
例えば、10名の生
徒の数学の成績を横
軸に、国語の成績を
縦軸にとると、右の
図のよう な散布図
(scat-ter diagram)が
描けたとしよう。
この図から、国語と
数学の間には、およ
そどんな関係が読め
るか。
国語
Y
●
●
●
●
●
●
●
●
●
数学
X
基本的な2変量統計量-2
(ピアソンの)相関係数(2)
ピアソンの相関係数に限らず、一般に定量的2変
量間の任意の関係を調べるための最も単純な方法
は、既に午前中にホームページで紹介したような
散布図を描くことである。
一般に、定量的2変量(間隔尺度レベル以上の尺
度)間には直線的な関係から、複雑な曲線的な関
係まで、いろいろな関係があり得る。
次の例は、それらのうちの幾つかを示したもので
ある。
基本的な2変量統計量-2
(ピアソンの)相関係数(3)
U 字型の曲線的関係
複雑な曲線的関係
基本的な2変量統計量-2
(ピアソンの)相関係数(4)
右下がりの直線的関係
右上がりの直線的関係
基本的な2変量統計量-2
(ピアソンの)相関係数(5)
2変数間に直線的な関係があるかどうかを
簡単に数値で表すのが、相関係数
(Pearson’s product-moment coefficient of
correlation、略して correlation) であり、
つぎのように定義される:
共分散
rxy
s xy
sx s y
2つの標準偏差の
積
基本的な2変量統計量-2
(ピアソンの)相関係数(6)
ここで、共分散の定義は、つぎのようにな
る:
1
s xy ( x1 x )( y1 y ) ( xN x )( y N y )
N
1 N
( xi x )( yi y )
N i 1
基本的な2変量統計量-2
(ピアソンの)相関係数(7)
ただし、上記共分散のミスの少ない(手計算
による)計算方法は、つぎの関係を利用するこ
とである:
1 N
s xy ( xi x)( yi y ),
N i 1
1
x1 y1 x2 y2 xN y N x y.
N
基本的な2変量統計量-2
(ピアソンの)相関係数(8)
つぎに、共分散の性質を調べてみよう。定義より、
共分散は個々のサンプル i について
( xi x )( yi y )
なる量をすべて足して平均したものである。
そこで、この量が正となるサンプルが多け
れば、共分散も正となり、この量が負になる
サンプルが多ければ、共分散は負となる。
基本的な2変量統計量-2
(ピアソンの)相関係数(9)
y
( xi x )( yi y ) 0
y
●
●
●
●
● i●
●
●
( xi x )( yi y ) 0
x
( xi x )( yi y ) 0
● ●
●
( xi x )( yi y ) 0
x
基本的な2変量統計量-2
(ピアソンの)相関係数(10)
(1) 相関係数は、マイナス 1 の値からプラス
1 の値
までの範囲の値を取る:
1 rxy 1
(2)相関係数の符合と共分散の符号は同一である。
rxy
s xy
sx s y
分母は常に正
基本的な2変量統計量-2
(ピアソンの)相関係数(11)
相関係数が、負の場合負の相関、ゼロの場合無
相関、正の場合正の相関がある、という。
・・ 。
・
・
・
・
・
・
負の相関
・
・
・
・
・
・
・
・
・
・
無相関
・ ・
・
・
・
・
・ ・
・
正の相関
基本的な2変量統計量-2
(ピアソンの)相関係数(12)
定量的2変数データが、つぎの5名の
被験者の (x, y)=(抑うつ性、気分の
変化)の得点であるとする:
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7)
基本的な2変量統計量-2
(ピアソンの)相関係数(13)
上記5名の(抑うつ性、気分の変化)データ
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7) で、
まず、抑うつ性の平均値は、
x (18 3 10 12 8) / 5 10.2
また、気分の変化の平均値は、
y (15 5 13 8 7) / 5 9.6
基本的な2変量統計量-2
(ピアソンの)相関係数(14)
抑うつ性の得点の分散は、
s x2 (182 32 10 2 12 2 82 ) / 5 10.2 2 ,
128.2 104.04,
24.16
そこで、標準偏差は、
sx
24.16 4.92
基本的な2変量統計量-2
(ピアソンの)相関係数(15)
気分の変化の得点の分散は、
s (15 5 13 8 7 ) / 5 9.6 ,
2
y
2
2
2
106.4 92.16,
14.24
そこで、標準偏差は、
s y 14.24 3.77
2
2
2
基本的な2変量統計量-2
(ピアソンの)相関係数(16)
最後に、両変数の共分散は、上記データ
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7)
から、まず得点の積和の平均を計算すると、
1
x1 y1 x2 y2 xN y N
N
1
(18 15 3 5 10 13 12 8 8 7)
5
1
(576) 113.4
5
基本的な2変量統計量-2
(ピアソンの)相関係数(17)
つぎに、2変数の平均値の積を計算すると、
x y 10.2 9.6 97.92
そこで、2変数の共分散は、
s xy
1
x1 y1 x2 y2 xN y N x y
N
113.4 97.92
15.48
基本的な2変量統計量-2
(ピアソンの)相関係数(18)
そこで、相関係数は、2変数の標準偏差が
s x 4.92,
s y 3.77
であったことに注意すれば、
rxy
s xy
sx s y
15.48
15.48
0.83
4.92 3.77 18.55
演習(4)
つぎの10名の2変量データセットに1つを用
いて、相関係数を計算してみよう。また、散布
図を描いてみよう:
(データセット1):
(41,38)、(24,24)、(2
0,15)、(21,26)、
(15,10)、(26,22)、(1
9,14)、(23,29)、
(40,37)、(26,29)
演習(4)続き
(データセット2):
(22,18)、(14,9)、(29,
26)、(37,34)、
(29,34)、(26,29)、(2
2,20)、(32,32)、
(7,8)、(16,12)