Transcript Chapter 20
第16章
假設檢定
© The McGraw-Hill Companies, Inc., 2009
16-2
學習目標
讀完本章你應該了解:
1.
2.
3.
4.
5.
6.
假設檢定的特性與邏輯。
統計上顯著差異代表的意思。
假設檢定程序的六個步驟。
母數與無母數檢定的差異及其使用時機。
選擇適當之統計顯著性檢定的影響要素。
如何解釋不同的檢定統計量。
© The McGraw-Hill Companies, Inc., 2009
16-3
以假設檢定發現真相
「發現真相的第一步是建立假設,再
以觀察結果和所建立的假設進行比
較。」
羅徹斯特大學(University of
Rochester)
物理學家David Douglass
© The McGraw-Hill Companies, Inc., 2009
16-4
假設檢定
歸納推理
演繹推理
© The McGraw-Hill Companies, Inc., 2009
16-5
統計程序
推論統計
敘述統計
© The McGraw-Hill Companies, Inc., 2009
16-6
假設檢定與研究流程
© The McGraw-Hill Companies, Inc., 2009
16-7
當資料呈現出清楚的圖像
研究人員以假設檢定發掘真
相。正如Abacus在左圖的
廣告中所傳達的,當研究人
員從「一片混亂」中「找出
真相 」時,他們都會有
「啊哈!原來如此!」的感
受。
© The McGraw-Hill Companies, Inc., 2009
16-8
假設檢定方法
古典統計學
•客觀的機率觀點
•根據樣本資料決定拒
絕或無法拒絕研究假
設
•以抽樣資料為分析基
礎
貝氏統計學
• 古典統計方法的延伸
• 以抽樣資料為分析基
礎
• 也考慮已建立的主觀
機率估計值
© The McGraw-Hill Companies, Inc., 2009
16-9
統計顯著性
© The McGraw-Hill Companies, Inc., 2009
16-10
假設型態
• 虛無假設(Null)
– H0: = 60 mpg
– H0: < 60 mpg
– H0: > 60 mpg
• 對立假設
(Alternate)
– HA: = 60 mpg
– HA: > 60 mpg
– HA: < 60 mpg
© The McGraw-Hill Companies, Inc., 2009
16-11
雙尾顯著性檢定
© The McGraw-Hill Companies, Inc., 2009
16-12
單尾顯著性檢定
© The McGraw-Hill Companies, Inc., 2009
16-13
決策規則
若分析結果顯示無法拒絕虛無假設則
不採取矯正行動
© The McGraw-Hill Companies, Inc., 2009
16-14
比較統計決策與司法審判
© The McGraw-Hill Companies, Inc., 2009
16-15
H0為真的型一誤差機率
© The McGraw-Hill Companies, Inc., 2009
16-16
臨界值
© The McGraw-Hill Companies, Inc., 2009
16-17
圖表16-4 H0為真的型一誤差機率
© The McGraw-Hill Companies, Inc., 2009
16-18
影響型二誤差的因素
母數的真實值
我們選取的α水準
以單尾或雙尾檢定評量假設
樣本標準差
樣本大小
© The McGraw-Hill Companies, Inc., 2009
16-19
犯型二誤差的機率
© The McGraw-Hill Companies, Inc., 2009
16-20
統計檢定程序
建立虛無假設
解釋檢定結果
階段
獲得檢定臨界
值
選擇統計檢定
的方法
選擇顯著水準
計算推估的統
計量
© The McGraw-Hill Companies, Inc., 2009
16-21
顯著性檢定
母數
無母數
© The McGraw-Hill Companies, Inc., 2009
16-22
母數檢定應符合的假設
觀察值必須獨立
常態分配
母體的變異數一致
區間或比例尺度
© The McGraw-Hill Companies, Inc., 2009
16-23
機率圖1
© The McGraw-Hill Companies, Inc., 2009
16-24
機率圖2
© The McGraw-Hill Companies, Inc., 2009
16-25
機率圖3
© The McGraw-Hill Companies, Inc., 2009
16-26
無母數檢定的優點
容易了解與應用
可用於檢定名目尺度資料
適用於檢定順序尺度資料
適用於非常態分配之母體
© The McGraw-Hill Companies, Inc., 2009
16-27
如何選擇檢定方法
檢定對象包含多少個樣本?
如果包含二個或k個樣本,那
樣本之間是獨立或相關呢?
測量尺度屬於名目、順序、
區間,還是比率尺度?
© The McGraw-Hill Companies, Inc., 2009
16-28
建議採用的統計技術
© The McGraw-Hill Companies, Inc., 2009
16-29
單一樣本檢定所回答的問題
•觀測值次數和基於某理論計算得到的期望
值次數之間是否有差異?
•觀測值比例和期望值比例之間是否有差
異?
•「資料來自特定機率分配(常態分配、卜
瓦松分配等)之母體」這個結論是否合
理?
•樣本平均數和母體平均數(μ)之間是否
有顯著差異?
© The McGraw-Hill Companies, Inc., 2009
16-30
母數檢定
Z檢定
t檢定
© The McGraw-Hill Companies, Inc., 2009
16-31
單一樣本t檢定範例
虛無假設
H0: = 50 mpg
統計檢定
t檢定
顯著水準
0.05, n = 100
計算統計量
1.786
臨界檢定值
1.66
(見附錄A,圖表A-2)
© The McGraw-Hill Companies, Inc., 2009
16-32
單一樣本卡方檢定範例
© The McGraw-Hill Companies, Inc., 2009
16-33
單一樣本卡方檢定範例(續)
虛無假設
H0: 0 = E
統計檢定
單一樣本卡方
顯著水準
0.05
計算統計量
9.89
臨界檢定值
7.82
(見附錄A,圖表A-3)
© The McGraw-Hill Companies, Inc., 2009
16-34
二獨立樣本檢定
© The McGraw-Hill Companies, Inc., 2009
16-35
二獨立樣本t檢定範例
平均每小時
銷售額
標準差
A組
B組
X1 = $1,500
X2 = $1,300
s1 = 225
s2 = 251
© The McGraw-Hill Companies, Inc., 2009
16-36
二獨立樣本t檢定範例(續)
虛無假設
H0: A組銷售額 = B組銷售額
統計檢定
t檢定
顯著水準
0.05(單尾)
計算統計量
1.97, d.f. = 20
臨界檢定值
1.725
(from Appendix C, Exhibit C-2)
© The McGraw-Hill Companies, Inc., 2009
16-37
二樣本無母數檢定:卡方
工作中發生意外
格編碼
次數
期望值
是
否
列總和
重度
1,1
12,
8.24
1,2
4
7.75
16
中度
2,1
9
7.73
2,2
6
7.27
15
不抽菸
3,1
13
18.03
3,2
22
16.97
35
行總和
34
32
66
吸菸者
© The McGraw-Hill Companies, Inc., 2009
16-38
二樣本卡方檢定範例
虛無假設
工作意外和抽菸與否無關
統計檢定
卡方
顯著水準
0.05
計算統計量
6.86, d.f. = 2
臨界檢定值
5.99
(見附錄A,圖表A-3)
© The McGraw-Hill Companies, Inc., 2009
16-39
SPSS輸出的交叉列表
© The McGraw-Hill Companies, Inc., 2009
16-40
二相關樣本的檢定
母數
無母數
© The McGraw-Hill Companies, Inc., 2009
16-41
銷售資料配對樣本的t檢定
© The McGraw-Hill Companies, Inc., 2009
16-42
配對樣本t檢定範例
虛無假設
第一年銷售額 = 第二年銷售額
統計檢定
配對樣本t檢定
顯著性檢定
0.01
計算統計量
6.28, d.f. = 9
臨界檢定值
3.25
(見附錄A,圖表A-2)
© The McGraw-Hill Companies, Inc., 2009
16-43
配對樣本t檢定的SPSS輸出報表
© The McGraw-Hill Companies, Inc., 2009
16-44
相關樣本無母數檢定:McNemar檢定1
© The McGraw-Hill Companies, Inc., 2009
16-45
相關樣本無母數檢定:McNemar檢定2
© The McGraw-Hill Companies, Inc., 2009
16-46
k個獨立樣本的檢定:ANOVA
• 虛無假設檢定三或多母體的平均值是否相
等。
• 單因子:使用單一因子、固定效果模式比
較一配方或因子對連續型因變數的效果。
© The McGraw-Hill Companies, Inc., 2009
16-47
ANOVA範例
所有的資料都是假設的
© The McGraw-Hill Companies, Inc., 2009
16-48
ANOVA範例(續)
虛無假設
A1 = A2 = A3
統計檢定
ANOVA和F檢定
顯著水準
0.05
計算統計量
28.304, d.f. = 2, 57
臨界檢定值
3.16
(見附錄A,圖表A-8)
© The McGraw-Hill Companies, Inc., 2009
16-49
Post Hoc:Scheffe’s多重比較程序
© The McGraw-Hill Companies, Inc., 2009
16-50
多重比較程序
© The McGraw-Hill Companies, Inc., 2009
16-51
單因子變異數分析圖
漢莎商務艙鳥瞰
© The McGraw-Hill Companies, Inc., 2009
16-52
二因子變異數分析範例
所有的資料都是假設的
© The McGraw-Hill Companies, Inc., 2009
16-53
k個相關樣本的檢定
分組因子的水準數要大於二水準
觀察值必須是配對資料
資料為區間或比例尺度
© The McGraw-Hill Companies, Inc., 2009
16-54
重複測量的變異數分析範例
© The McGraw-Hill Companies, Inc., 2009
16-55
關鍵詞
•
•
•
•
•
•
•
•
•
先驗對比(a priori contrasts) •
對立假設(alternative
•
hypothesis, HA)
•
變異數分析(analysis of
•
variance, ANOVA)
•
貝氏統計法(Bayesian
statistics)
•
卡方檢定(chi-square test)
•
古典統計法(classical statistics)
•
臨界值(critical value)
•
F值(F ratio)
推論統計(inferential statistics) •
•
•
k個獨立樣本檢定(k-independentsamples tests)
K-related-samples tests
顯著水準(level of significance)
均方和(mean square)
多重比較檢定,範圍檢定(multiple
comparison test s, range test)
Nonparametric tests
常態機率圖(normal probability plot)
虛無假設(null hypothesis, H0)
觀察值的顯著水準(observed
significant level)
單一樣本檢定(one-sample tests)
單尾檢定(one-tailed test)
p值(p value)
© The McGraw-Hill Companies, Inc., 2009
16-56
關鍵詞
•
•
•
•
•
•
•
•
•
•
母數檢定(parametric tests)
檢定力(power of the test)
實務上的顯著性(practical
significance)
接受域(region of acceptance)
拒絕域(Region of rejection )
統計顯著性(statistical
significance)
t分配(t distribution)
試驗(trials)
t檢定(t- test)
二獨立樣本的檢定(twoindependent-samples test s)
• 二相關樣本的檢定(two-relatedsamples test s)
• 雙尾檢定(two-tailed test)
• 型一誤差(Type I error, α)
• 型二誤差(Type II error, β)
• Z分配(Z distributation)
• Z檢定(Z test)
© The McGraw-Hill Companies, Inc., 2009