第8回(6月11日)

Download Report

Transcript 第8回(6月11日)

統計学
西 山
【まとめ】サンプル平均について
平均がμ、分散がσ2 である集団から無作為に取り出した n 個のデータを X 1 , X 2 ,  X n と
し、データから求められる標本平均を X とおく。このとき、 X の標本分布の平均と分散は
それぞれ
E X   
V X  

2
n
第3章の定理8が
基本じゃが、
ここまで
定理10までは落
5/28
とせんな
となる。
合計値は平均値×個数
分布の形は常に
正規分布
<中心極限定理>
<ルートNの法則>とは?
1個ずつにわけて値を確認すると、平均がμ、標準偏差がσ
N個のサンプルをとると
ゲタの公式
合計値
期待値  N  
標準偏差

N 
平均値=合計÷N
期待値  
標準偏差 

N
例題【1】40回の平均値
サイコロを40回振って出る目の数の平
均値は、最大でいくらまでを考えておけ
ばよいか?
確率的に意味のないことを答えても駄目
(無意味な例)最大は6じゃないだろうか
平均値=合計値÷40
1000回の実験結果をみる
正規分布が
あてはまる!
標本平均の分布
350
300
250
200
150
100
50
0
<サンプル誤差>ともいいます
定理8から
E  X   3 .5
サンプルの数は?
V  X   2 . 92
母集団の特徴
データはどんな値か?
SD  X   1 . 71
E  X   3 .5
V X  
2 . 92
SD  X  
 0 . 073
40
0 . 073 
1 . 71
 0 . 27
40
加えて、分布は正規分布を当てはめてよい
練習問題【1】
日本人の体重分布には正規分布N(55,225)が
当てはまっているとする。11人のサンプルをとる
として・・・
1.サンプル平均の値が60Kg以上になるのは、
どの位の確率ですか?
2. サンプル平均の値が50Kg台になるのは、
どの位の確率ですか?
解答(1)のみ;
母集団の特徴: 平均=55Kg、標準偏差=15Kg
11個のサンプル平均
E  X     55 Kg

15
SD  X  

N
 4 . 52 Kg
11
 X  55 60  55 
P  X  60   P 

  P  Z  1 . 11 
4 . 52 
 4 . 52
練習問題【2】<合計の問題>
旅客機利用客の体重は、全体として平均55Kg、標準
偏差10Kgで正規分布していると言われる。では、定
員400人が満席の時の旅客総ウェイトの最大値をいく
らと見込むとよいか?
次回この問題から
6/11
合計値と平均値
は本質的に同じ問
題
総ウェイト= 400 
(400人の平均体重 )
今回の標本分布
母集団
どんな400人が
多いか
定理8―母集団の確認から
  55

2
 10
2
正規分布の
3シグマの法則
400人がサンプル
E  X   55
V X  
100
 0 . 25
平均56.5Kgを
超えないはず!
400
SD  X  
10
400
 0 .5
合計は
22600Kg
-5
3.
53
.83 83
-5
4.
54
.14 14
-5
4.
54
.44 44
-5
4.
54
.75 75
-5
5.0
55
5
.05
-5
5.
55
.35 35
-5
5.
55
.66 66
-5
5.
55
.96 96
-5
6.
56
.26 26
-5
6.5
7
53
.53
解答 400人の平均体重では
コンピューター実験で解答しましょう・・・400人のデータ抽出を1000回反
復
標本平均の分布
250
200
150
100
50
0
最大値
最小値
平均値
分散
56.56709
53.53117
55.00031
0.256368
合計を直接予測する<ルートN法則>
1人ずつを見ると、平均55Kg、標準偏差10Kg
400人の合計は?
平均値= 400  55  22000
標準偏差 
400  10  200
正規分布を当てはめて、最大22000+3×200、22600Kgまで