Transcript 相関係数は有意でない
第4回 (10/16) 授業の学習目標
先輩の卒論の調査に協力する。
2つの定量的変数間の関係を調べる最も簡単な
方法は?
2つの定量的変数の間には、どんな関係があり
得るか?
2つの定量的変数間に直線的な関係があるかど
うかを簡単な数値で表す方法は?
相関係数の定義は?
相関係数の計算方法は?
定量的変数間の関係
を調べる最も簡単な方法
例えば、10名
の生徒の数学の
成績を横軸に、国
語の成績を縦軸に
とり、右の図のよう
な散布図 (scatter
diagram) を描く
方法がある。
国語 Y
●
●
●
●
●
●
●
●
●
数学 X
定量的変数の間には、
どんな関係があり得るか (1)
U 字型の曲線的関係
複雑な曲線的関係
定量的変数の間には、
どんな関係があり得るか (2)
右下がりの直線的関係
右上がりの直線的関係
2変数間の直線的な関係の有無
を簡単に数値で表す方法
2変数間に直線的な関係がある
かどうかを簡単に数値で表すの
が、第6章で学ぶ相関係数
(Pearson’s product-moment
coefficient of correlation、略して
correlation) である。
相関係数の性質-1
(1) 2つの変数 x と y の相関係数は、しばしば、
つぎのように書かれる:
rxy
(2) 相関係数は、マイナス1の値からプラス1の値
までの範囲の値を取る:
1 rxy 1
相関係数の性質-2
相関係数が、負の場合負の相関、ゼロの
場合無相関、正の場合正の相関がある、
という。
・ ・
。
・
・
・
・
・
・
負の相関
・
・
・
・
・
・
・
・
・
・
・
無相関
・
・
・
・
・
・
・
・
正の相関
散布図の具体例(卒論データ)
ここでは、散布図の例を、実際の適用例
で見てみよう。このデータは、千野のホー
ムページの講義テキスト「データ解析/基
礎と応用 I」の2.1 節にある、ある卒論ゼミ
の13名の学生の卒論の成績と3年間の
成績、とりわけ、卒論と各年次の成績間
の関係を散布図に表したものである。
相関係数の定義とその性質
ピアソンの相関係数は、テキスト
p.29
の(6.1)式に示したように、共分散と2
つの変量それぞれの標準偏差を用い
て表される
共分散
sxy
rxy
sx s y
標準偏差の積
共分散の定義と計算式
共分散は、テキスト p.29 の (6.2) 式に
示したように、次式で定義される:
N
1
sxy ( xi x)( yi y),
N i 1
1
x1 y1 x2 y2 xN yN x y.
N
相関係数の性質-1(既出)
(1) 2つの変数 x と y の相関係数は、しばしば、
つぎのように書かれる:
rxy
(2) 相関係数は、マイナス1の値からプラス1の値
までの範囲の値を取る:
1 rxy 1
相関係数の計算の手順-その1
定量的2変数データが、つぎの5名の被
験者の (x, y)=(抑うつ性、気分の変化)
の得点であるとする:
(18,
15), (3, 5), (10, 13), (12, 8), (8, 7)
相関係数の計算の手順-その2
上記5名の(抑うつ性、気分の変化)データ
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7) で、
まず、抑うつ性の平均値は、
x (18 3 10 12 8) / 5 10.2
また、気分の変化の平均値は、
y (15 5 13 8 7) / 5 9.6
相関係数の計算の手順-その3
抑うつ性の得点の分散は、
s (18 3 10 12 8 ) / 5 10.2 ,
128.2 104.04,
24.16
2
x
2
2
2
そこで、標準偏差は、
sx 24.16 4.92
2
2
2
相関係数の計算の手順-その4
気分の変化の得点の分散は、
s (15 5 13 8 7 ) / 5 9.6 ,
2
y
2
2
2
106.4 92.16,
14.24
そこで、標準偏差は、
sy 14.24 3.77
2
2
2
相関係数の計算の手順-その5
最後に、両変数の共分散は、上記データ
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7)
から、まず得点の積和の平均を計算すると、
1
x1 y1 x2 y2 xN yN
N
1
(1815 3 5 1013 12 8 8 7)
5
1
(576) 113.4
5
相関係数の計算の手順-その6
つぎに、2変数の平均値の積を計算すると、
x y 10.2 9.6 97.92
そこで、2変数の共分散は、
1
sxy x1 y1 x2 y2 xN yN x y
N
113.4 97.92
15.48
相関係数の計算の手順-その7
そこで、相関係数は、2変数の標準偏差が
sx 4.92, sy 3.77 であったことに注意すれば、
sxy
rxy
sx s y
15.48
15.48
0.83
4.92 3.77 18.55
相関係数の有意性検定の方法(1)
ここで得られた相関関係は、あくまでも上記5名
の標本についての抑うつ性と気分の変化の2変
数間のデータ
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7)
に関するものでしかない。
一方、多くの場合我々の関心はこの特定の5名
の標本に関する当該2変量間の相関関係にある
のではなく、この5名の標本が得られたもとの集
団、すなわち母集団における相関関係にある。
相関係数の有意性検定の方法(2)
通常、われわれの母集団における相関関係に対する
関心は、「母集団での相関係数、即ち母相関係数がゼ
ロ(無相関)かどうか」にある。
これに関する帰無仮説(母相関係数がゼロ)は、テキス
ト p.29 の最後の行にあるもので、つぎのように書く:
H0 : 0
この帰無仮説が正しいかどうかを、標本で計算された
標本相関係数をもとに検定するのが、相関係数の有意
性検定と呼ばれるものである。
相関係数の有意性検定の方法(3)
相関係数を計算したら、テキスト p.30 の (6.3)
式、すなわち
t
r N 2
1 r
2
,
に、相関係数 r およびサンプル数 N を代入し
t を求める。
相関係数の有意性検定の方法(4)
これを、うえの具体例の場合に当てはめると、
R=0.83, N=5 なので、
0.83 5 2
0.831.732
t
,
2
1 0.6889
1 0.83
1.4376
2.58
0.3111
相関係数の有意性検定の方法(5)
検定には、うえの t が、母相関係数が
ゼロなる帰無仮説のもとで、自由度
ν=N-2 なる t 分布に従うことを利用する
(テキスト p.30)。
うえの例では、t-分布の自由度は、
ν= N – 2 = 5 – 2 = 3
相関係数の有意性検定の方法(6)
つぎに、岩原テキストの p.434 の t 分布
表のν=3, P=0.05 に対応する棄却点の値
3.182 を読み取る。
一方、先程計算した t =2.58 を思い出そう。
この時、t=2.58 < 3.182 なので、このよう
な場合、我々は、帰無仮説(母相関係数
がゼロ)を採択する。
相関係数の有意性検定の方法(7)
相関係数についての帰無仮説が採択される
時、われわれは「相関係数は有意でない」とい
う。
一方、もし標本から計算された t 値が、棄却
点の値 3.182 以上ならば、我々は帰無仮説
(母相関係数がゼロ)を棄却する。
この時われわれは、「相関係数は5%水準で
有意である」という。