Transcript 測定値の分布
最小二乗法
CS 2003 狩野
最小二乗法
1
正規分布(normal distribution)
測定値の分布
y
0.4
測定値xが得られる確率P(x)
頻度分布→確率分布
この分布曲線を描くには無限個の
測定値が必要
有限個の測定値から推定
中心極限定理(central limit
theorem)
互いに無関係かつランダムに生じる小
さな値の総和は正規分布(ガウス分布)
になる
平均値 m、標準偏差σ
区間[m-σ,m+σ]内に入る確率が
0.683≒2/3
CS 2003 狩野
最小二乗法
その測定値が
出現する確率
0.3
0.2
0.1
-3
-2
-1
1
2
3
x
測定値(σで割ったもの)
P( x ; m, )
1
2 2
e
( x m )2
2 2
2
分散:測定の精度を推定する
仮定
どの測定値も同じ信頼度
標本(sample)
標本平均
(sample mean)
不偏分散
N個の測定値の集合
(adjusted variance)
分散が大きい→ばらつく
N=1のとき0/0
測定精度の推定
N 個の測定値:
x1 , x2 ,
, xN
標本平均
N
1
N
x1 x2
xN
1
N
x
i 1, N
i
不偏分散
1
2
(
x
)
i N
N 1
2
N
不偏分散の平方根 σN
CS 2003 狩野
最小二乗法
3
真値の信頼性
測定値(平均値)からの推定
標本のとり方で異なる
標本平均
非常に大きな N の場
合には
分布が決定し
平均値が決定する
x1 , x2 ,
N
1
N
x
「標本平均μN を真の
値 mとする」ことの信
頼性(=測定値の信頼
性)は N に依存する
i
1
2
(
x
)
i N
N 1
N
N
, xN
N
N
m N
N
N
2/3の確率で言える m の範囲
(天下り)
m N N
N
95%の信頼区間→ x 1.96
CS 2003 狩野
最小二乗法
4
いかにして、もっともらしい直線をひくか?
量(x,y)の間に
y = a0 + a1x
という関係がある
測定により a0 と a1 を決める
測定値 (x1,y1), (x2,y2),…
どの測定も互いに影響しあわな
い(独立)
測定値のばらつきは正規分布
(ランダム)
CS 2003 狩野
最小二乗法
5
測定値の組を得る確率
σ
しじ狭確
や測く率が
す定。分小
い値い布さ
け
がつ
ものれ
再同幅
現 がば
確率の総和
=全面積=1
1個の観測値(xi,yi)を得る確率
正規分布
P[( xi , yi )]
1
2 i2
e
( yi a0 a1xi )2
2 i2
0.1
-4
-2
2
, ( xN , y N )] P[( x1 , y1 )] P[( x2 , y2 )]
CS 2003 狩野
0.3
変数xiに対して
真にあるべき
y = a0 + a1xi
0.2
N個の観測値の組{(xi,yi), i=1,…,N}
を得る確率(独立事象の積)
P[( x1 , y1 ), ( x2 , y2 ),
0.4
1
(2 ) N i2
最小二乗法
4
P[( xN , y N )]
2
1
yi a0 a1 x1
2
2
i 1, N
i
e
6
最小二乗法のアイデア
パラメータの決定法
測定結果は、起こるべくして起きた P[( x , y ), ( x , y ),
1
1
2
2
測定結果を与える確率が最大と
なっていた
2
(2 )
2
1
yi a0 a1 x1
2
2
i 1, N
i
1
N
, ( xN , y N )]
2
i
e
( yi a0 a1 xi )2
i 1, N
i2
が最小値を と る よ う な(a0 , a1 ) 残差の二乗に信頼度の重みをつけて
和をとり、これを最小にすることで、
最適なパラメータを得る方法が
最小二乗法である
CS 2003 狩野
最小二乗法
7
パラメータの決定:偏微分
極小をあたえる
パラメータの条件
2
i 1, N
( yi a0 a1 xi ) 2
i2
y a a x
2
2 i 0 2 1 i 0
a0
i
i 1, N
yi a0 a1 xi xi
2
2
0
2
a1
i 1, N
i
1
1
1
1
a
x
a
y
i 2 1 i 2
2 0
i
i 1, N
i
i 1, N
i 1, N i
この連立方程式
1
1
1 (正規方程式という)
2
x
a
x
a
x
y
i 2 0 i
i i 2
2 1
i を満たすパラメータ
i 1, N
i
i
i 1, N
i 1, N
を求める
CS 2003 狩野
最小二乗法
8
どの測定値も等く信頼できるとき
1
1
1
1
a
x
a
y
i 2 1 i 2
2 0
i
i 1, N
i
i 1, N
i 1, N i
1
1
1
2
x
a
x
a
x
y
i 2 0 i
i i 2
2 1
i
i 1, N
i
i
i 1, N
i 1, N
i 一定
N a0 xi a1 yi
N xi yi xi yi
i
1,
N
i
1,
N
a1
2
2
N xi
xi
2
xi a0 xi a1 xi yi
i 1, N
i 1, N
i 1, N
a 1
yi a1 xi
0
N
CS 2003 狩野
最小二乗法
2
x
i yi xi xi yi
N xi2 xi
2
9
用語
a1
a0
平均( 期待値) :
分散:
共分散:
N xi yi xi yi
N xi2 xi
2
1
yi a1 xi
N
xi2 yi xi xi yi
1
xi mx
N
2
1
N xi2 xi
E[ y ] yi my
N
1
S x2 ( xi mx )2 E[( x mx ) 2 ] E[ x 2 mx x mx 2 ] E[ x 2 ] E[ x]2
N
1
S y2 ( yi my )2 E[( y my ) 2 ] E[ y 2 ] E[ y ]2
S xy
N
a1 2
1
Sx
S xy ( xi mx )( yi my )
N
E[( x mx ) ( y my )] E[ xy ] mx E[ y ] my E[ x] mx my
E[ x]
E[ xy ] E[ x]E[ y ]
相関係数: R
CS 2003 狩野
最小二乗法
S xy
Sx S y
10
直線回帰の相関係数
R~0
a1
R
CS 2003 狩野
R~1
S xy
S x2
R~-1
S xy
Sx S y
a1
Sy
Sx
最小二乗法
11
非線形モデル
MP次元のパラメータ空間内を
探索して最小値を見いだす
yi f ( xi ,{am })
2
i 1
i
N
2
2
MP個の非線形連立方程式を解く
N
yi f ( xi ,{am }) f
2
0
0, m 1, 2,
2
am
i
i 1
am
CS 2003 狩野
最小二乗法
,MP
12