Transcript PowerPoint

第2回 統計的推定
教科書p32-35
母数を推定する
母数:母集団の分布を特定するパラメータ
理論値、自然法則、モデルで決まる
例:物の長さ:真値μ
母集団:全ての測定値(無限にある)
測定:誤差の3公理
①絶対値の等しい正の誤差と負の誤差の起こる度数は等しい
②絶対値の小さい誤差の現れる度数は大きい誤差のそれより大きい
③ある程度以上の大きい誤差は事実上起こらない
理論分布:ガウス分布(Gaussian Distribution、正規分布)
1
f ( x) 
e
2 

x   2

2 2
μ:平均値
σ:標準偏差
σ2:分散
母数
n
母集団

 x   2
1
2
f ( x) 
e 2
2 
μ:平均値
σ:標準偏差
σ2:分散
x
i 1
lim
i

n
n 
X:確率変数の集合
fX(x):確率密度関数
g(X):Xの関数とする量
E[g(X)]=∫g(x)fX(x)dx
:期待値
EX    xf x   


n
 x   
i 1
lim
2
i
n
n 

2

E X     
2

2

x    f x    2

測定
標本の数は有限
標本
点推定
m
m:標本平均値
ss:仮標本標準偏差
ss2:仮標本分散
標本平均m1
n
n
 xi
i 1
標本平均m2
n
ss 
2
2


x

m
 i
i 1
n
標本平均m3
測定値のばらつき
標本数:n
標本値:x1, x2,・・・xn
n
x  x    xn
標本平均:m  1 2

n
x
i
i 1
バラツク
n
n
2
偏差平方和: S   xi  m
mはバラツク変数
i 1
n
分散の推定値: s 2 
 x   
i 1
2
i
n
n
μは未知
?
仮μ≒m
ss 
2
 x  m 
i 1
2
i
n
母平均μの正規分布からn個の標本を取り、平均mを求め、
分散を推定するには
n
分散の推定値
s2 
2


x


 i
i 1
n
母平均が未知の場合
n
n
ns   xi      xi  m  m   
2
2
i 1
n
2
i 1
n
  xi  m   2m    xi  m   nm   
2
i 1
i 1
n


  xi

2
 S  2m    n  i 1  nm   nm   


n




ns  S  nm   
2
2
2
ns 2  S  nm   
2
2
m   2
 x      x   x
n

2
 n
  n
  n

  xi
   x i  n    xi    
   i 1

  i 1      i 1
 n
 
 

n
n

 
 


 
 

i 1
n
2
i
n
j  i i 1
2
i
j
 
n
2
n

2


x


 i
i 1
n2
s2

n
ns  S  nm     S  s 2
2
2
n
S
2
s 

n 1
 x m 
i 1
2
i
n 1
:分散の推定値=不偏分散
標本平均のばらつき
母分散σ2の母集団からn個の標本を
取り出し、平均値を求める操作をN回
繰り返す。
測定値:
x1, x2,・・・, xn
x1, x2,・・・, xn
・
x1, x2,・・・, xn
平均値
m1
m2
・
mN
標本平均mj
2
 n

x



ji
N
 i 1


 n

j 1



 

N
2
 n

 n



x

n

x








ji
ji
N
N
 i 1

 i 1



N




2
n
n
j 1
j 1


m



i




2
j 1




sm 

N
N
N
n
n
 n

 n
2
2 







x



x


x


x









ji
ji
jk
ji
N
N
k  i i 1
 i 1

 i 1



2
2

 j 1 

n
n
j 1










N
N
N s 2 
 j 


 s 2  s 2  s 2 s2
j 1  n 
2
N

 1

N
nN
n
2
標本平均mは母平均μと一致しない =>幅を持たせて推定する
区間推定
m-μは分散sm2の正規分布
m  

1
m
f ( m) 
e 2s
2
 1.96 
 1.96
m
2 sm
sm
 1.96sm  m    1.96s m m
m  1.96sm    m  1.96s m
sm
2
s2

n
95%
μ-1.96sm μ
μ+1.96sm
s
s
   m  1.96 
:母平均の95%信頼区間
n
n
母平均がこの区間に存在する確率は95%である。
測定値では約68%信頼区間(1標準偏差間)を用いる
s
s
m  1
   m  1
n
n
m  1.96 
2
標準偏差と標準誤差
標準偏差(SD)
Standard Deviation
標準誤差(SE)
Standard Error of Mean)
測定値:Mean±SD
母集団分布の広がり
SD2≒s2
標本数に依存しない
分布の広がりに関心がある
測定値:Mean±SE
標本平均分布の広がり
SE2≒s2/n
標本数nの平方根に反比例
平均値そのものに関心がある
n
s 
2
n
 xi   
2
i 1
sm
n
標本平均mj
2
s2
S
 

n nn  1
2


x

m
 i
i 1
nn  1
系列1
3.6
5.0
5.2
5.3
5.5
5.3
5.1
5.7
3.9
7.0
2.8
4.3
3.5
4.3
4.4
5.0
4.3
6.8
3.8
5.9
系列2
4.5
5.6
4.4
5.7
6.2
5.7
5.4
6.8
4.1
4.2
5.9
5.1
7.4
5.8
3.1
6.0
3.8
3.3
5.1
6.5
演習2.1 同じ母集団からの標本系列が2つある
それぞれの平均と標準偏差と標準誤差
を求めなさい。
演習2.2 2系列が1連の標本として標準偏差と
標準誤差を求め、演習2.1と比較しなさい。
参考:誤差の3公理と正規分布
誤差の3公理
①絶対値の等しい正の誤差と負の誤差の起こる度数は等しい
②絶対値の小さい誤差の現れる度数は大きい誤差のそれより大きい
③ある程度以上の大きい誤差は事実上起こらない
根源誤差:誤差を引き起こす原因で、誤差の最小単位a
正負の符号を取る確率はそれぞれ1/2である
ある測定では1回の測定にn個の根源誤差が重なって生じ、
そのうちp個が負の値をとった結果であるとする。
1回の測定の誤差をεとする。
誤差εとなる場合の数はnCp
ε=((n-p)a-pa=(n-2p)a
1回の測定で、n個の根源誤差中p-1個が負の値をとった結果である
誤差をε’とする。
ε’=((n-(p-1))a-(p-1)a=(n-2(p-1))a=(n-2p)a+2a=ε+2a
誤差ε’となる場合の数はnCp-1
n Cp 
n!
n  p ! p!
n!
n C p 1 
n  p  1! p  1!
誤差の分布関数をf(ε)ならば、 f(ε’): f(ε)=nCp-1:nCp
f ( ' ) f (  2a)
n!
(n  p)! p!



n  p  1! p  1!
f ( )
f ( )
n!
f (  2a)
p

f ( )
n  p 1
f (  2a)
p
n  2 p 1
1 
1  
f ( )
n  p 1
n  p 1
f (  2a)
p
n 1
1 
1 
f ( )
n  p 1
n  p 1
f (  2a)  f ( )
n  2 p 1
n2p




f (  2a)  f ( )
n 1
n
na
テーラー展開
df ( )
1 d2 f
2
f (  2a)  f ( ) 
( 2a ) 
(
2
a
)

2
d
2! d
df
f (  2a)  f ( )
d   

f (  2a)  f ( )
2f
na
2a
df ( )
d
 2
f ( )
na
log f ( )  
確率密度関数の条件




A
2
2
C
2na
 2 

f ( )  A exp  
2 
 2na 
na2=σ2が分散
正規分布(ガウス分布)
f ( )d  1
1
2na 2
 2 

f ( ) 
exp  
2
2na 2
 2na 
1
 2 
1
f ( ) 
exp   2 
2 
 2 