Transcript 統計学

統計学入門(2)
標本と母集団
標本分布
統計学入門(2) - 後期 第4回 -
1
今日の内容

母集団と標本

標本分布

標本平均の場合の標本分布
統計学入門(2) - 後期 第4回 -
2
調査の例

世論調査


視聴率調査


野球中継の視聴率、人気ドラマの...
マーケティングリサーチ


内閣支持率、政策に対する意見...
人気のある商品は...、 理由は...
...
統計学入門(2) - 後期 第4回 -
3
全数調査と標本調査

研究対象となる集団全体(母集団)を
対象とした調査
全数調査(Census Survey)

母集団の一部(標本)に対してのみ
行う調査
標本調査(Sample Survey)
統計学入門(2) - 後期 第4回 -
4
全数調査と標本調査の特徴

全数調査




標本調査
標本誤差がない

調査終了まで時間が
かかる

膨大な費用
統計学入門(2) - 後期 第4回 -
時間と調査費用の節
約
標本抽出の方法如何
では、標本誤差が推
定可能
5
母集団と標本(調査の場合)

母集団


調査の対象となる個体すべてからなる集合
標 本

実際に調査を行う個体の集合
統計学入門(2) - 後期 第4回 -
6
標本抽出
(Sampling)
標本
母集団
統計学入門(2) - 後期 第4回 -
7
データの収集
標本
x1
x2

xn
母集団
統計学入門(2) - 後期 第4回 -
8
標本
x1
x2

xn
標
本
の
集
団
の
母集団 母
特
性
値
特
性
値
統計的推測
統計学入門(2) - 後期 第4回 -
9
標本
母集団
母集団平均の推定
x1
x2

xn
1 n
x   xi
n i 1
統計学入門(2) - 後期 第4回 -
10
統計的推測 - 推定・検定 

標本から得られる情報を基に、母集団に
関する結論を導き出すこと
標本に関する結論を出すことが目的では
ない!
統計学入門(2) - 後期 第4回 -
11
標本分布


標本を繰り返し作成したと想定した場合に
得られる統計量の分布
仮想的な分布
統計学入門(2) - 後期 第4回 -
12
標本分布とは…
x
標本
母集団
統計学入門(2) - 後期 第4回 -
13
標本分布とは…
x
x
標本
x
母集団
統計学入門(2) - 後期 第4回 -
14
標本分布とは…



標本ごとに1つの標本平均
数多くの標本があると想定して、標本平均
の分布を考えることができる
実際の調査では、その中の1つの標本が
作成され、1つの標本平均の実現値が得
られる
統計学入門(2) - 後期 第4回 -
15
標本調査と推測統計の概念図:平均の推定の場合
標本抽出
データ収集
x1
x2

xn
標本
集計
母集団
母集団の平均:μ
標本の平均:
2つの値は同じではない
推測統計の理論が架け橋となる
x
平均の標本分布
(1)
(2)
m
x の平均は、母集団の平均
2
x の分散は、  / n
(3a) n が大きいとき、 x の分布は正規分布
(3b) 母集団分布が正規分布であれば、x の
分布は正規分布
統計学入門(2) - 後期 第4回 -
17
標本調査と推測統計の概念図:比率の推定の場合
標本抽出
データ収集
標本
x1
x2

xn
集計
母集団
母集団の比率: P
標本の比率: p
2つの値は同じではない
推測統計の理論が架け橋となる
比率の標本分布
(1) p の平均は、母集団での比率P
(2) p の分散は、 P(1-P)/n
(3) n が大きいとき、p の分布は正規分布
1
x
0
if Q = YES
とおいて考えてみよう…
if Q = NO
統計学入門(2) - 後期 第4回 -
19
比率は平均である!
1
x
0
if Q = YES
Y
e
s
の
数
if Q = NO
x1  x 2    x n
x 
n
中心極限定理
母集団分布の形状が何であろうとも,
標本サイズが大きくなるに連れて,
標本平均の分布は正規分布に近づく.
平均の分布は正規分布に…
比率の分布も正規分布に…
比率の標本分布
標本比率
(1) p の平均は、母集団での比率P
(2) p の分散は、 P(1-P)/n
標準偏差は、
P(1  P)
n
(3) n が大きいとき、p の分布は正規分布
母比率
平均の標本分布
練習問題
(1)
(2)
m
x の平均は、母集団の平均
2
x の分散は、  / n
(3a) n が大きいとき、 x の分布は正規分布
(3b) 母集団分布が正規分布であれば、x の
分布は正規分布
問題
 標本平均の標本分布についての右の結果
を参考に次の問いに答えなさい。
 1月当りの世帯消費支出額の調査で、ある
母集団での分布が、平均20万円、標準偏
差6万円であるとする。
統計学 - 後期 第1回 -
統計学入門(2) - 後期 第4回 -
19
21
練習問題(続き)
(a) その母集団から大きさ100の無作為標本を作
成したときの、標本平均の分布は?

平均20万円、標準偏差0.6万円の正規分布
(b) 大きさ400の無作為標本を作成した場合の、標
本平均の分布は?

平均20万円、標準偏差0.3万円の正規分布
統計学入門(2) - 後期 第4回 -
22
練習問題(続き)
(c) 大きさ400の無作為標本から計算された標本平均の値が20.6万
円を超える確率はどの程度か?次の図を参考に答えなさい。
 標本平均の標本分布が、平均20万円、標準偏差が0.3万円の正
規分布となる。上の図にあてはめて考えると、2.5%となる
(d) 1月当りの世帯消費支出額の調査で、ある母集団での平均が不明
で、標準偏差が6万円であるとする。平均が20万円であるかどうかを
検討したい。いま、大きさ400の無作為標本から計算された標本平
均の値が22万円であったとする。どのような判断をするか?

母集団の平均が20万円であるとしたとき、(c)の結果から、標本
の平均が22万円になるということがほとんどおこりえないこととな
る。よって、平均は20万円ではないと考えるのが妥当であろう。
統計学入門(2) - 後期 第4回 -
23