stat02_08final

Download Report

Transcript stat02_08final

統計学入門2
第8回:統計的検定
統計学入門2 後期 第8回
1
今日の内容

検定

仮説





帰無仮説・対立仮説
第1種の過誤、第2種の過誤
有意水準
平均値の検定
練習問題
統計学入門2 後期 第8回
2
問題1

一世帯あたりの一ヶ月あたりの平均支出
金額が20万円であるかどうかを調べたい
と思った。いまある母集団が設定してあり、
その母集団から大きさ1600の標本を抽出
したところ、平均が22万円で、標準偏差が
5万円だったとする。このとき、平均支出金
額が20万円でないと結論付けられるか。
統計学入門2 後期 第8回
3
問題2

ある番組の視聴率調査を行うことになった。
無作為に抽出された400人に調査を行った
とき、200人がその番組を見ていた。母集
団の視聴率が40%以上であると結論付け
られるか。
統計学入門2 後期 第8回
4
問題3

ある病気に対する3種類の治療薬があったとき、
無作為に患者を選び3種類の治療薬を投与して
調べたところ、有効率の信頼区間は次のように
なった:
A:(35%,60%)
B:(30%,50%)
C:(55%,73%)
3種類の治療薬について有効性の差異を論じな
さい。
統計学入門2 後期 第8回
5
仮説




統計的に調べたいと思っている命題
平均が×××である
視聴率が○○○である
A薬とB薬は同じ有効率である
統計学入門2 後期 第8回
6
2種類の過誤

第1種の過誤


仮説が正しいときに仮説が正しくないという結
論を出すこと
第2種の過誤

仮説が正しくないときに仮説が正しいという結
論を出すこと
統計学入門2 後期 第8回
7
2種類の過誤
検定結果
仮
説
仮説は真
仮説は偽
真
○
第1種の過誤
偽
第2種の過誤
○
統計学入門2 後期 第8回
8
2種類の過誤



過誤の可能性は小さい方が望ましい
2種類の過誤を(ある限界を超えて)同時に
小さくすることは不可能
過誤を一定水準まで認める立場をとる
統計学入門2 後期 第8回
9
有意水準

第1種の過誤の確率を
一定水準に設定する
有意水準

慣例では、5% や 1%
統計学入門2 後期 第8回
10
問題1

一世帯あたりの一ヶ月あたりの平均支出
金額が20万円であるかどうかを調べたい
と思った。いまある母集団が設定してあり、
その母集団から大きさ1600の標本を抽出
したところ、平均が22万円で、標準偏差が
5万円だったとする。このとき、平均支出金
額が20万円でないと結論付けられるか。
統計学入門2 後期 第8回
11
帰無仮説と対立仮説

帰無仮説


母平均 = 20万円
対立仮説

母平均 ≠ 20万円
統計学入門2 後期 第8回
12
検定統計量と有意水準

検定統計量



検定を行う場合に使用する統計量
帰無仮説の下での(標本)分布を基に、有
意水準に対応する棄却域を設定
検定統計量の実現値に対応する p値を求
め、有意水準と比較
統計学入門2 後期 第8回
13
平均の標本分布
(1) x の平均は、母集団の平均m
2
(2) x の分散は、  / n
(3a) n が大きいとき、 x の分布は正規分布
(3b) 母集団分布が正規分布であれば、x の
分布は正規分布
統計学入門2 後期 第8回
14
帰無仮説と対立仮説

帰無仮説


母平均 = 20万円
対立仮説

母平均 ≠ 20万円
統計学入門2 後期 第8回
15
平均の標本分布
(1) x の平均は、母集団の平均20万
2
(2) x の分散は、  / n
(3a) n が大きいとき、 x の分布は正規分布
(3b) 母集団分布が正規分布であれば、x の
分布は正規分布
統計学入門2 後期 第8回
16
検定統計量

平均の検定の場合
Z 
x  m0
s/
n
m 0 は帰無仮説での母平均
統計学入門2 後期 第8回
17
検定統計量

平均の検定の場合(大きな標本の場合)
Z 
x  m0
s/
n
帰無仮説の下で、
平均0、分散1の正規分布
統計学入門2 後期 第8回
18
検定統計量

平均の検定の場合(大きな標本の場合)
Z 
x  m0
s/
n
帰無仮説が正しくなければ、
平均が0でなく、分散1の正規分布
統計学入門2 後期 第8回
19
検定統計量の分布
対立仮説の
下での分布
帰無仮説の
下での分布
-3
-2
-1
0
1
2
3
統計学入門2 後期 第8回
4
5
6
20
検定統計量の分布


帰無仮説の下での分布が母集団の分散
に依存しない
母集団の平均が帰無仮説と異なれば、
違った分布となる
統計学入門2 後期 第8回
21
棄却域の設定


有意水準(α%)と整合する棄却域を設定
する
帰無仮説の下での分布の両側α%点を棄
却域とする
統計学入門2 後期 第8回
22
検定統計量

平均の検定の場合(大きな標本の場合)
Z 
x  m0
s/
n
帰無仮説の下で、
平均0、分散1の正規分布
統計学入門2 後期 第8回
23
棄却域

有意水準が5%の場合

平均0, 分散1の正規分布の両側5%点
±1.96
統計学入門2 後期 第8回
24
検定統計量の分布
対立仮説の
下での分布
帰無仮説の
下での分布
-3
-2
-1
0
1
2
3
統計学入門2 後期 第8回
4
5
6
25
p 値( p - value ; 有意確率)


帰無仮説の下での分布における、検定統
計量の実現値のパーセント点
あらかじめ決められた有意水準と比較を行
い、検定の結論を下す
統計学入門2 後期 第8回
26
検定の手順





仮説の設定
検定方法(統計量)の決定
有意水準の設定
検定統計量の計算
棄却域との比較(p値の算出)
統計学入門2 後期 第8回
27
練習問題
ある母集団において、番組Aの視聴率が30%であるかどうかの検定を行う。い
ま、
帰無仮説:視聴率が30%以下である
対立仮説:視聴率が30%を超えている
とする。このとき、次の問題に答えなさい。
(1) この場合に第1種の過誤は、どのような状況でどのような結論を下すときに
生じるか。
視聴率が30%以下である場合に、30%を越しているという判断をする場合
(2) 同様に、第2種の過誤は、どのような状況でどのような結論を下すときに生
じるか。
視聴率が30%を越している場合に、30%以下であるという判断をする場合
統計学入門2 後期 第8回
28
練習問題(つづき)
(3) 視聴率が30%を越えていれば広告を出したいということを考え、実際に調査を行った。
そこで有意水準5%で検定を行い、「帰無仮説を棄却」という結論を得た。このとき、次
の文章についてそれぞれコメントせよ。
(a) 帰無仮説が棄却されたので、視聴率は30%を越えていることが証明された。

標本調査によるものであり、厳密な意味での証明ではない
(b) 帰無仮説が棄却されたので、視聴率は30%を超えていると判断し広告を出すことに
した。

妥当な判断である
(c) 帰無仮説が棄却されたが、5%誤りの可能性があるので、広告を出すかどうかの判断
を保留した。

5%の誤りを前提として検定を行った判断であるので、5%に妥当性があれば、保留
する必要はない。
統計学入門2 後期 第8回
29