第4回授業(8月31日第4時限)

Download Report

Transcript 第4回授業(8月31日第4時限)

第1日目第4時限の学習目標
 基本的な2変量統計量-2
(ピアソンの)相関係数について学
ぶ。
(1)相関係数の定義とその特性
(2)相関係数の計算方法
基本的な2変量統計量-2
(ピアソンの)相関係数(1)
 例えば、10名の生
徒の数学の成績を横
軸に、国語の成績を
縦軸にとると、右の
図のよう な散布図
(scat-ter diagram)が
描けたとしよう。
 この図から、国語と
数学の間には、およ
そどんな関係が読め
るか。
国語
Y
●
●
●
●
●
●
●
●
●
数学
X
基本的な2変量統計量-2
(ピアソンの)相関係数(2)
 ピアソンの相関係数に限らず、一般に定量的2変
量間の任意の関係を調べるための最も単純な方法
は、既に午前中にホームページで紹介したような
散布図を描くことである。
 一般に、定量的2変量(間隔尺度レベル以上の尺
度)間には直線的な関係から、複雑な曲線的な関
係まで、いろいろな関係があり得る。
 次の例は、それらのうちの幾つかを示したもので
ある。
基本的な2変量統計量-2
(ピアソンの)相関係数(3)
U 字型の曲線的関係
複雑な曲線的関係
基本的な2変量統計量-2
(ピアソンの)相関係数(4)
右下がりの直線的関係
右上がりの直線的関係
基本的な2変量統計量-2
(ピアソンの)相関係数(5)
 2変数間に直線的な関係があるかどうかを
簡単に数値で表すのが、相関係数
(Pearson’s product-moment coefficient of
correlation、略して correlation) であり、
つぎのように定義される:
共分散
rxy 
s xy
sx s y
2つの標準偏差の
積
基本的な2変量統計量-2
(ピアソンの)相関係数(6)
 ここで、共分散の定義は、つぎのようにな
る:
1
s xy  ( x1  x )( y1  y )    ( xN  x )( y N  y )
N
1 N
  ( xi  x )( yi  y )
N i 1
基本的な2変量統計量-2
(ピアソンの)相関係数(7)
ただし、上記共分散のミスの少ない(手計算
による)計算方法は、つぎの関係を利用するこ
とである:
1 N
s xy   ( xi  x)( yi  y ),
N i 1
1
 x1 y1  x2 y2    xN y N   x y.
N
基本的な2変量統計量-2
(ピアソンの)相関係数(8)
つぎに、共分散の性質を調べてみよう。定義より、
共分散は個々のサンプル i について
( xi  x )( yi  y )
なる量をすべて足して平均したものである。
そこで、この量が正となるサンプルが多け
れば、共分散も正となり、この量が負になる
サンプルが多ければ、共分散は負となる。
基本的な2変量統計量-2
(ピアソンの)相関係数(9)
y
( xi  x )( yi  y )  0
y
●
●
●
●
● i●
●
●
( xi  x )( yi  y )  0
x
( xi  x )( yi  y )  0
● ●
●
( xi  x )( yi  y )  0
x
基本的な2変量統計量-2
(ピアソンの)相関係数(10)
(1) 相関係数は、マイナス 1 の値からプラス
1 の値
までの範囲の値を取る:
 1  rxy  1
(2)相関係数の符合と共分散の符号は同一である。
rxy 
s xy
sx s y
分母は常に正
基本的な2変量統計量-2
(ピアソンの)相関係数(11)
 相関係数が、負の場合負の相関、ゼロの場合無
相関、正の場合正の相関がある、という。
・・ 。
・
・
・
・
・
・
負の相関
・
・
・
・
・
・
・
・
・
・
無相関
・ ・
・
・
・
・
・ ・
・
正の相関
基本的な2変量統計量-2
(ピアソンの)相関係数(12)
 定量的2変数データが、つぎの5名の
被験者の (x, y)=(抑うつ性、気分の
変化)の得点であるとする:
 (18, 15), (3, 5), (10, 13), (12, 8), (8, 7)
基本的な2変量統計量-2
(ピアソンの)相関係数(13)
上記5名の(抑うつ性、気分の変化)データ
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7) で、
まず、抑うつ性の平均値は、
x  (18  3  10  12  8) / 5  10.2
また、気分の変化の平均値は、
y  (15  5  13  8  7) / 5  9.6
基本的な2変量統計量-2
(ピアソンの)相関係数(14)
抑うつ性の得点の分散は、
s x2  (182  32  10 2  12 2  82 ) / 5  10.2 2 ,
 128.2  104.04,
 24.16
そこで、標準偏差は、
sx 
24.16  4.92
基本的な2変量統計量-2
(ピアソンの)相関係数(15)
気分の変化の得点の分散は、
s  (15  5  13  8  7 ) / 5  9.6 ,
2
y
2
2
2
 106.4  92.16,
 14.24
そこで、標準偏差は、
s y  14.24  3.77
2
2
2
基本的な2変量統計量-2
(ピアソンの)相関係数(16)
最後に、両変数の共分散は、上記データ
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7)
から、まず得点の積和の平均を計算すると、
1
x1 y1  x2 y2    xN y N 
N
1
 (18 15  3  5  10 13  12  8  8  7)
5
1
 (576)  113.4
5
基本的な2変量統計量-2
(ピアソンの)相関係数(17)
つぎに、2変数の平均値の積を計算すると、
x  y  10.2  9.6  97.92
そこで、2変数の共分散は、
s xy
1
x1 y1  x2 y2    xN y N   x y

N
 113.4  97.92
 15.48
基本的な2変量統計量-2
(ピアソンの)相関係数(18)
そこで、相関係数は、2変数の標準偏差が
s x  4.92,
s y  3.77
であったことに注意すれば、
rxy 
s xy
sx s y
15.48
15.48


 0.83
4.92  3.77 18.55
演習(4)
 つぎの10名の2変量データセットに1つを用
いて、相関係数を計算してみよう。また、散布
図を描いてみよう:
(データセット1):
(41,38)、(24,24)、(2
0,15)、(21,26)、
(15,10)、(26,22)、(1
9,14)、(23,29)、
(40,37)、(26,29)
演習(4)続き
(データセット2):
(22,18)、(14,9)、(29,
26)、(37,34)、
(29,34)、(26,29)、(2
2,20)、(32,32)、
(7,8)、(16,12)