相関係数は有意でない

Download Report

Transcript 相関係数は有意でない

第4回 (10/16) 授業の学習目標






先輩の卒論の調査に協力する。
2つの定量的変数間の関係を調べる最も簡単な
方法は?
2つの定量的変数の間には、どんな関係があり
得るか?
2つの定量的変数間に直線的な関係があるかど
うかを簡単な数値で表す方法は?
相関係数の定義は?
相関係数の計算方法は?
定量的変数間の関係
を調べる最も簡単な方法

 例えば、10名
の生徒の数学の
成績を横軸に、国
語の成績を縦軸に
とり、右の図のよう
な散布図 (scatter
diagram) を描く
方法がある。
国語 Y
●
●
●
●
●
●
●
●
●
数学 X
定量的変数の間には、
どんな関係があり得るか (1)
U 字型の曲線的関係
複雑な曲線的関係
定量的変数の間には、
どんな関係があり得るか (2)
右下がりの直線的関係
右上がりの直線的関係
2変数間の直線的な関係の有無
を簡単に数値で表す方法
 2変数間に直線的な関係がある
かどうかを簡単に数値で表すの
が、第6章で学ぶ相関係数
(Pearson’s product-moment
coefficient of correlation、略して
correlation) である。
相関係数の性質-1
(1) 2つの変数 x と y の相関係数は、しばしば、
つぎのように書かれる:
rxy
(2) 相関係数は、マイナス1の値からプラス1の値
までの範囲の値を取る:
1  rxy  1
相関係数の性質-2

相関係数が、負の場合負の相関、ゼロの
場合無相関、正の場合正の相関がある、
という。
・ ・
。
・
・
・
・
・
・
負の相関
・
・
・
・
・
・
・
・
・
・
・
無相関
・
・
・
・
・
・
・
・
正の相関
散布図の具体例(卒論データ)

ここでは、散布図の例を、実際の適用例
で見てみよう。このデータは、千野のホー
ムページの講義テキスト「データ解析/基
礎と応用 I」の2.1 節にある、ある卒論ゼミ
の13名の学生の卒論の成績と3年間の
成績、とりわけ、卒論と各年次の成績間
の関係を散布図に表したものである。
相関係数の定義とその性質
 ピアソンの相関係数は、テキスト
p.29
の(6.1)式に示したように、共分散と2
つの変量それぞれの標準偏差を用い
て表される
共分散
sxy
rxy 
sx s y
標準偏差の積
共分散の定義と計算式
共分散は、テキスト p.29 の (6.2) 式に
示したように、次式で定義される:
N
1
sxy   ( xi  x)( yi  y),
N i 1
1
 x1 y1  x2 y2   xN yN   x y.
N
相関係数の性質-1(既出)
(1) 2つの変数 x と y の相関係数は、しばしば、
つぎのように書かれる:
rxy
(2) 相関係数は、マイナス1の値からプラス1の値
までの範囲の値を取る:
1  rxy  1
相関係数の計算の手順-その1
 定量的2変数データが、つぎの5名の被
験者の (x, y)=(抑うつ性、気分の変化)
の得点であるとする:
 (18,
15), (3, 5), (10, 13), (12, 8), (8, 7)
相関係数の計算の手順-その2
上記5名の(抑うつ性、気分の変化)データ
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7) で、
まず、抑うつ性の平均値は、
x  (18  3 10 12  8) / 5  10.2
また、気分の変化の平均値は、
y  (15  5 13  8  7) / 5  9.6
相関係数の計算の手順-その3
抑うつ性の得点の分散は、
s  (18  3  10  12  8 ) / 5 10.2 ,
 128.2 104.04,
 24.16
2
x
2
2
2
そこで、標準偏差は、
sx  24.16  4.92
2
2
2
相関係数の計算の手順-その4
気分の変化の得点の分散は、
s  (15  5  13  8  7 ) / 5  9.6 ,
2
y
2
2
2
 106.4  92.16,
 14.24
そこで、標準偏差は、
sy  14.24  3.77
2
2
2
相関係数の計算の手順-その5
最後に、両変数の共分散は、上記データ
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7)
から、まず得点の積和の平均を計算すると、
1
x1 y1  x2 y2   xN yN 
N
1
 (1815  3 5  1013  12 8  8  7)
5
1
 (576)  113.4
5
相関係数の計算の手順-その6
つぎに、2変数の平均値の積を計算すると、
x  y  10.2 9.6  97.92
そこで、2変数の共分散は、
1
sxy  x1 y1  x2 y2   xN yN   x y
N
 113.4  97.92
 15.48
相関係数の計算の手順-その7
そこで、相関係数は、2変数の標準偏差が
sx  4.92, sy  3.77 であったことに注意すれば、
sxy
rxy 
sx s y
15.48
15.48


 0.83
4.92 3.77 18.55
相関係数の有意性検定の方法(1)


ここで得られた相関関係は、あくまでも上記5名
の標本についての抑うつ性と気分の変化の2変
数間のデータ
(18, 15), (3, 5), (10, 13), (12, 8), (8, 7)
に関するものでしかない。
一方、多くの場合我々の関心はこの特定の5名
の標本に関する当該2変量間の相関関係にある
のではなく、この5名の標本が得られたもとの集
団、すなわち母集団における相関関係にある。
相関係数の有意性検定の方法(2)


通常、われわれの母集団における相関関係に対する
関心は、「母集団での相関係数、即ち母相関係数がゼ
ロ(無相関)かどうか」にある。
これに関する帰無仮説(母相関係数がゼロ)は、テキス
ト p.29 の最後の行にあるもので、つぎのように書く:
H0 :   0

この帰無仮説が正しいかどうかを、標本で計算された
標本相関係数をもとに検定するのが、相関係数の有意
性検定と呼ばれるものである。
相関係数の有意性検定の方法(3)
相関係数を計算したら、テキスト p.30 の (6.3)
式、すなわち
t
r N 2
1 r
2
,
に、相関係数 r およびサンプル数 N を代入し
t を求める。
相関係数の有意性検定の方法(4)
これを、うえの具体例の場合に当てはめると、
R=0.83, N=5 なので、
0.83 5  2
0.831.732
t

,
2
1  0.6889
1  0.83
1.4376

 2.58
0.3111
相関係数の有意性検定の方法(5)
検定には、うえの t が、母相関係数が
ゼロなる帰無仮説のもとで、自由度
ν=N-2 なる t 分布に従うことを利用する
(テキスト p.30)。
 うえの例では、t-分布の自由度は、
ν= N – 2 = 5 – 2 = 3

相関係数の有意性検定の方法(6)
つぎに、岩原テキストの p.434 の t 分布
表のν=3, P=0.05 に対応する棄却点の値
3.182 を読み取る。
 一方、先程計算した t =2.58 を思い出そう。
 この時、t=2.58 < 3.182 なので、このよう
な場合、我々は、帰無仮説(母相関係数
がゼロ)を採択する。

相関係数の有意性検定の方法(7)
相関係数についての帰無仮説が採択される
時、われわれは「相関係数は有意でない」とい
う。
 一方、もし標本から計算された t 値が、棄却
点の値 3.182 以上ならば、我々は帰無仮説
(母相関係数がゼロ)を棄却する。
 この時われわれは、「相関係数は5%水準で
有意である」という。
