決定係数

Transcript 決定係数

統計学講義第11回
相関係数、回帰直線
決定係数
決定係数
Coefficient of Determination:
被説明変数ｙが説明変数ｘからどの程度決
定されるかを判断する数値基準。
Ｘがｙを決定する強弱の度合いを測る係数。
復習：最小２乗残差
ei  yi  yˆ i  yi  a  bxi
n
1
e   ei  y  a  bx  0
n i 1
1
1
2
2
S ee   (ei  e )   ei
n
n
1
  ( y i  a  bxi ) 2
n
y
yˆ  a  bxi
x
決定係数の意味
y
( xi , yi )
yˆ  a  bxi
( yi  yˆ )
( yi  y )
( yˆ  y )
y
xi
x
Ｙの平均偏差の分解
yi  y  ( yi  yˆ i )  ( yˆ i  y )  ei  ( yˆ i  y )
上の式を2乗して和をとると、交差項
 e ( yˆ  y)  0
i
i
となるので、 yi の平均値からの偏差2乗和は
2
2
2
ˆ
(
y

y
)

e

(
y

y
)
 i
i  i
Ｙの全変動に対する比
( y
 y )   e   ( yˆ i  y )
2
i
2
i
2
（Yの全変動）＝（残差平方和）+（回帰変動）
式の両方にYの全変動で割ると、Ｙの全変
動に対する比として、
1
e
2
i
 ( y  y)
i
( yˆ  y )


 ( y  y)
2
i
2
i
2
決定係数は回帰式で説明される比重
 ( yˆ i  y )
2
e
 i
2
S ee
R 
 1
 1
2
2
S yy
 ( yi  y )
 ( yi  y )
2
n
e
i 1
n
2
i
e  (y
i 1
i 1
n
i 1
i 1
2
2
e
/
(
y

y
)
 0;
 i  i
 0,
n
n
2
i
n
 y) ,
2
i
n
e / (y
i 1
2
i
 y )  1;
2
i
R2  1
R 0
2
i
残差分散が小さければ、決定係数は大きくなり、回帰
直線のあてはまりはよいことになる。
決定係数の取りうる数値の範囲
0  R 1
2
決定係数
０
決定係数
１
決定係数は１に近いほど、推計値 ŷi は実際値 yi との
当てはまりがよいことになり、回帰モデルの説明力は高い。
決定係数の計算式
2
e
 i
S ee
2
R  1
 1
  xy
2
S yy
 ( yi  y )
2
S ee ：最小2乗残差の分散
：ｙの分散
ei ：最小2乗残差
S yy
2変数に限り、決定係数は相関係数の2乗となる
証明：
相関係数、共分散と回帰係数ｂ
の関係
正の相関
正の傾き
 xy  0  S xy  0  b  0
無相関
 xy  0  S xy  0  b  0
負の相関
負の傾き
 xy  0  S xy  0  b  0
相関係数、回帰係数ｂと決定係
数の関係
b   xy 

2
xy
Sy
Sx
See
2
 1
R
S yy
２変数の場合に限り、相関係数の2乗は決定係
数である。
次回の予習：pp.64～75

決定係数

Transcript 決定係数

Directory