モジュール1のまとめ

Download Report

Transcript モジュール1のまとめ

統計学
第10回
西山
要点① <確率分布>
目の数の確率分布
目の数の平均値(20回)の分布
要点② 正規分布
数値表は右端の
部分
0.16
第9回目のまとめ
サンプルの結果から母集団の平均
信頼係数
 P ①  Z  ①
を推定する方法


X


① 


P

①
標準誤差
サンプルの平均は母集団の平均を
2



n


中心にまとまる傾向 2
2



 P X  ① 
   X  ①
サンプルの平均のばらつきを求める

n
n

のが鍵です




再確認
前回の練習問題【1‘】
ある高校の1年生からランダムに5名を選ん
で100メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。次の解答を完成させなさい。
X  13.75
ˆ 2  1.205
解答
 P 1  Z  1
・
・
・
 P    
X  13.75
ˆ 2  1.205
解答
0.68
 P 1  Z  1

 P13.75 

・
1.205
・5    13.75 
・
1.205 

5 
 P    
13.26
X  13.75
ˆ 2  1.205
14.24
点推定は極端な区間推定
標準値で○○から××まで
と割り切るべし!
2


サンプル平均
1.645

 1.205
  13.75  

1
5


0

誤差の目安
(サンプル平均のばらつき)
幅をつけない推定法を点推定といいます
宿 題
1限目のみ
正規母集団から無作為にとった5個のデータ
171、179、164、174、170
を得た.このデータから母集団の平均値を推定しなさ
い.信頼係数は95%とする.
ヒント:
標本平均=171.6
不偏分散=30.3
前提
不偏分散は母集団の
分散に一致している
今日の目標
• 正規分布は使うのはまずい
• T分布の使い方
• T値は標準値とほぼ同じ
教科書:
T分布の定義→128頁
T値を使った推定→156頁
いままでの方法の何が問題か?
不偏分散はあくまでサンプルの結果
全体を調べて出したわけではない
あてにならない
不偏分散は信用できるか!?
母集団が分散100としても
<=
0
700
600
500
400
300
200
100
0
これはカイ二
乗分布の形で
す
25
-5
0
75
-1
00
12
515
0
17
520
0
22
525
0
27
530
0
32
535
0
37
540
0
42
545
0
47
550
0
頻度
標本分散の分布
不偏分散の確率分布
データの分散の値
全体分散σ2
分布の中心が正しいとい
うだけです
10人の結果ですから、当然、誤差が混じっています
それは正規分布ではない


X


0.90  P 1.645  Z  1.645  P  1.645 
 1.645
2
ˆ / n


不偏分散には誤差がある
正しい標準化ではない!
標準化のように見えて
T値と呼んでいま
す
正規分布の変数 その平均値
カイ二乗分布の変数/ データ数
実は、この値の確率法則が分かっています。ステューデントのT分布!
T値の発見
T
X 
ˆ
2
n
Gosset, W. S.
サンプルから求めた不偏分散を、母集団の分散
の代わりに使う
1906年にペンネームStudentでT分布の存在を発見しました
たとえて言えば
2個のサイコロを振って出た目を
割り算する
6、2
1個目のサイコロの目
2個目のサイコロの目
6

 4.25
2
この値の確率分布はわかりますか?
正規分布÷カイ二乗→T分布
T分布は正規分布とカイ二乗分布の
子どもです。フィッシャーが1920年
までに数学的基礎を与えました。
Fisher, R.A.
T
Z

2
k
Tの値は自由度kのT分布
k
T値は標準値(Z)とほぼ同じです
データ値
右のボタンを押してから分布の種類と
毎回のデータ数、抽出反復回数を指
定してください。
実験開始!
N(170,102)
176.47  170
Z
 1.45
100
5
1回目
2回目
3回目
4回目
5回目
母集団は
データ1 データ2 データ3 データ4 データ5 標本平均
173.68
175.80
162.41
172.88
170.54
171.06
166.14
167.60
173.54
156.80
176.06
168.03
174.63
174.21
179.96
165.47
162.86
171.43
168.56
178.42
156.45
166.28
183.43
170.63
185.21
185.46
174.02
159.31
178.34
176.47
Z
176.47  170
100
5
 1.45
T
分散不偏
推定
26.93
56.14
49.90
112.18
115.29
176.47  170
 1.35
115.29
5
現実には、標準化するとは<T値>にすることです
T値
0.46
-0.59
0.45
0.13
1.35
T分布の概略
T値の標本分布
1200
1000
データ:5個
800
平均値
分散
標準偏差
最大値
最小値
600
400
200
0
~
1
2
~
3
4
~
5
6
~
7
8
~
9
-1
~
-3
2
~
-5
4
~
6
~
-7
0
8
頻度
R.A.Fisher
T値
0.0166
1.9796
1.4070
9.2665
-7.5530
標準正規分布に似ている
平均はゼロ
分散が大きい!
2シグマ、3シグマの法則は通
じない.極端な値になりやすい.
N-1が鍵になること.自由度.
となると、T値の数値表がいる
90%圏95%圏
これは自由度
例題
正規母集団から無作為にとった5個のデータ
171、179、164、174、170
を得た.このデータから母集団の平均値を推定しなさ
い.信頼係数は95%とする.
ヒント:
標本平均=171.6
不偏分散=30.3
前提
不偏分散は母集団の
分散に一致している
例題の解答
T分布を使って回答する: 自由度=データ数-1
0.95  P 2.776  T  2.776
自由度=4


X 

 2.776
 P  2.776 
2


ˆ
n



2 
2

ˆ
ˆ



   X  2.776
 P X  2.776

n 
n


30.3 
30.3

   171.6  2.776
 P171.6  2.776
式は同じ
5 
5

 P164.8    178.4
データ数が10個以下のときはT分布を必ず使うべし
練習問題【1】
ある大学の学生を対象に10名をランダムにと
り身長のデータをとると結果は
X  167.2
ˆ 2  10 2  100
全学生の平均はいくら位か90%信頼区間を
求めなさい.
データ数が10個以下のときはT分布を必ず使うべし
【1】の解答―はじめが大事です
0.90
0.90
自由度=10-1
 P 1.833  T  1.833T値を使うときは自由度
 P -①  T  ① 
がいくらになるかが鍵!


X



 P 1.833 
 1.833

2
X 
ˆ / n 


 P-① 
 ①
2 

ˆ 2 ˆ 2 
ˆ


   X  1.833 
 P X  1.833 

n n 


n


 あとはデータの結果を 代入して同じように・
・・

100
100 

 P167.2  1.833 
   167.2  1.833 

10
10


 P161.4    173.0