Transcript Chapter 20
第16章 假設檢定 © The McGraw-Hill Companies, Inc., 2009 16-2 學習目標 讀完本章你應該了解: 1. 2. 3. 4. 5. 6. 假設檢定的特性與邏輯。 統計上顯著差異代表的意思。 假設檢定程序的六個步驟。 母數與無母數檢定的差異及其使用時機。 選擇適當之統計顯著性檢定的影響要素。 如何解釋不同的檢定統計量。 © The McGraw-Hill Companies, Inc., 2009 16-3 以假設檢定發現真相 「發現真相的第一步是建立假設,再 以觀察結果和所建立的假設進行比 較。」 羅徹斯特大學(University of Rochester) 物理學家David Douglass © The McGraw-Hill Companies, Inc., 2009 16-4 假設檢定 歸納推理 演繹推理 © The McGraw-Hill Companies, Inc., 2009 16-5 統計程序 推論統計 敘述統計 © The McGraw-Hill Companies, Inc., 2009 16-6 假設檢定與研究流程 © The McGraw-Hill Companies, Inc., 2009 16-7 當資料呈現出清楚的圖像 研究人員以假設檢定發掘真 相。正如Abacus在左圖的 廣告中所傳達的,當研究人 員從「一片混亂」中「找出 真相 」時,他們都會有 「啊哈!原來如此!」的感 受。 © The McGraw-Hill Companies, Inc., 2009 16-8 假設檢定方法 古典統計學 •客觀的機率觀點 •根據樣本資料決定拒 絕或無法拒絕研究假 設 •以抽樣資料為分析基 礎 貝氏統計學 • 古典統計方法的延伸 • 以抽樣資料為分析基 礎 • 也考慮已建立的主觀 機率估計值 © The McGraw-Hill Companies, Inc., 2009 16-9 統計顯著性 © The McGraw-Hill Companies, Inc., 2009 16-10 假設型態 • 虛無假設(Null) – H0: = 60 mpg – H0: < 60 mpg – H0: > 60 mpg • 對立假設 (Alternate) – HA: = 60 mpg – HA: > 60 mpg – HA: < 60 mpg © The McGraw-Hill Companies, Inc., 2009 16-11 雙尾顯著性檢定 © The McGraw-Hill Companies, Inc., 2009 16-12 單尾顯著性檢定 © The McGraw-Hill Companies, Inc., 2009 16-13 決策規則 若分析結果顯示無法拒絕虛無假設則 不採取矯正行動 © The McGraw-Hill Companies, Inc., 2009 16-14 比較統計決策與司法審判 © The McGraw-Hill Companies, Inc., 2009 16-15 H0為真的型一誤差機率 © The McGraw-Hill Companies, Inc., 2009 16-16 臨界值 © The McGraw-Hill Companies, Inc., 2009 16-17 圖表16-4 H0為真的型一誤差機率 © The McGraw-Hill Companies, Inc., 2009 16-18 影響型二誤差的因素 母數的真實值 我們選取的α水準 以單尾或雙尾檢定評量假設 樣本標準差 樣本大小 © The McGraw-Hill Companies, Inc., 2009 16-19 犯型二誤差的機率 © The McGraw-Hill Companies, Inc., 2009 16-20 統計檢定程序 建立虛無假設 解釋檢定結果 階段 獲得檢定臨界 值 選擇統計檢定 的方法 選擇顯著水準 計算推估的統 計量 © The McGraw-Hill Companies, Inc., 2009 16-21 顯著性檢定 母數 無母數 © The McGraw-Hill Companies, Inc., 2009 16-22 母數檢定應符合的假設 觀察值必須獨立 常態分配 母體的變異數一致 區間或比例尺度 © The McGraw-Hill Companies, Inc., 2009 16-23 機率圖1 © The McGraw-Hill Companies, Inc., 2009 16-24 機率圖2 © The McGraw-Hill Companies, Inc., 2009 16-25 機率圖3 © The McGraw-Hill Companies, Inc., 2009 16-26 無母數檢定的優點 容易了解與應用 可用於檢定名目尺度資料 適用於檢定順序尺度資料 適用於非常態分配之母體 © The McGraw-Hill Companies, Inc., 2009 16-27 如何選擇檢定方法 檢定對象包含多少個樣本? 如果包含二個或k個樣本,那 樣本之間是獨立或相關呢? 測量尺度屬於名目、順序、 區間,還是比率尺度? © The McGraw-Hill Companies, Inc., 2009 16-28 建議採用的統計技術 © The McGraw-Hill Companies, Inc., 2009 16-29 單一樣本檢定所回答的問題 •觀測值次數和基於某理論計算得到的期望 值次數之間是否有差異? •觀測值比例和期望值比例之間是否有差 異? •「資料來自特定機率分配(常態分配、卜 瓦松分配等)之母體」這個結論是否合 理? •樣本平均數和母體平均數(μ)之間是否 有顯著差異? © The McGraw-Hill Companies, Inc., 2009 16-30 母數檢定 Z檢定 t檢定 © The McGraw-Hill Companies, Inc., 2009 16-31 單一樣本t檢定範例 虛無假設 H0: = 50 mpg 統計檢定 t檢定 顯著水準 0.05, n = 100 計算統計量 1.786 臨界檢定值 1.66 (見附錄A,圖表A-2) © The McGraw-Hill Companies, Inc., 2009 16-32 單一樣本卡方檢定範例 © The McGraw-Hill Companies, Inc., 2009 16-33 單一樣本卡方檢定範例(續) 虛無假設 H0: 0 = E 統計檢定 單一樣本卡方 顯著水準 0.05 計算統計量 9.89 臨界檢定值 7.82 (見附錄A,圖表A-3) © The McGraw-Hill Companies, Inc., 2009 16-34 二獨立樣本檢定 © The McGraw-Hill Companies, Inc., 2009 16-35 二獨立樣本t檢定範例 平均每小時 銷售額 標準差 A組 B組 X1 = $1,500 X2 = $1,300 s1 = 225 s2 = 251 © The McGraw-Hill Companies, Inc., 2009 16-36 二獨立樣本t檢定範例(續) 虛無假設 H0: A組銷售額 = B組銷售額 統計檢定 t檢定 顯著水準 0.05(單尾) 計算統計量 1.97, d.f. = 20 臨界檢定值 1.725 (from Appendix C, Exhibit C-2) © The McGraw-Hill Companies, Inc., 2009 16-37 二樣本無母數檢定:卡方 工作中發生意外 格編碼 次數 期望值 是 否 列總和 重度 1,1 12, 8.24 1,2 4 7.75 16 中度 2,1 9 7.73 2,2 6 7.27 15 不抽菸 3,1 13 18.03 3,2 22 16.97 35 行總和 34 32 66 吸菸者 © The McGraw-Hill Companies, Inc., 2009 16-38 二樣本卡方檢定範例 虛無假設 工作意外和抽菸與否無關 統計檢定 卡方 顯著水準 0.05 計算統計量 6.86, d.f. = 2 臨界檢定值 5.99 (見附錄A,圖表A-3) © The McGraw-Hill Companies, Inc., 2009 16-39 SPSS輸出的交叉列表 © The McGraw-Hill Companies, Inc., 2009 16-40 二相關樣本的檢定 母數 無母數 © The McGraw-Hill Companies, Inc., 2009 16-41 銷售資料配對樣本的t檢定 © The McGraw-Hill Companies, Inc., 2009 16-42 配對樣本t檢定範例 虛無假設 第一年銷售額 = 第二年銷售額 統計檢定 配對樣本t檢定 顯著性檢定 0.01 計算統計量 6.28, d.f. = 9 臨界檢定值 3.25 (見附錄A,圖表A-2) © The McGraw-Hill Companies, Inc., 2009 16-43 配對樣本t檢定的SPSS輸出報表 © The McGraw-Hill Companies, Inc., 2009 16-44 相關樣本無母數檢定:McNemar檢定1 © The McGraw-Hill Companies, Inc., 2009 16-45 相關樣本無母數檢定:McNemar檢定2 © The McGraw-Hill Companies, Inc., 2009 16-46 k個獨立樣本的檢定:ANOVA • 虛無假設檢定三或多母體的平均值是否相 等。 • 單因子:使用單一因子、固定效果模式比 較一配方或因子對連續型因變數的效果。 © The McGraw-Hill Companies, Inc., 2009 16-47 ANOVA範例 所有的資料都是假設的 © The McGraw-Hill Companies, Inc., 2009 16-48 ANOVA範例(續) 虛無假設 A1 = A2 = A3 統計檢定 ANOVA和F檢定 顯著水準 0.05 計算統計量 28.304, d.f. = 2, 57 臨界檢定值 3.16 (見附錄A,圖表A-8) © The McGraw-Hill Companies, Inc., 2009 16-49 Post Hoc:Scheffe’s多重比較程序 © The McGraw-Hill Companies, Inc., 2009 16-50 多重比較程序 © The McGraw-Hill Companies, Inc., 2009 16-51 單因子變異數分析圖 漢莎商務艙鳥瞰 © The McGraw-Hill Companies, Inc., 2009 16-52 二因子變異數分析範例 所有的資料都是假設的 © The McGraw-Hill Companies, Inc., 2009 16-53 k個相關樣本的檢定 分組因子的水準數要大於二水準 觀察值必須是配對資料 資料為區間或比例尺度 © The McGraw-Hill Companies, Inc., 2009 16-54 重複測量的變異數分析範例 © The McGraw-Hill Companies, Inc., 2009 16-55 關鍵詞 • • • • • • • • • 先驗對比(a priori contrasts) • 對立假設(alternative • hypothesis, HA) • 變異數分析(analysis of • variance, ANOVA) • 貝氏統計法(Bayesian statistics) • 卡方檢定(chi-square test) • 古典統計法(classical statistics) • 臨界值(critical value) • F值(F ratio) 推論統計(inferential statistics) • • • k個獨立樣本檢定(k-independentsamples tests) K-related-samples tests 顯著水準(level of significance) 均方和(mean square) 多重比較檢定,範圍檢定(multiple comparison test s, range test) Nonparametric tests 常態機率圖(normal probability plot) 虛無假設(null hypothesis, H0) 觀察值的顯著水準(observed significant level) 單一樣本檢定(one-sample tests) 單尾檢定(one-tailed test) p值(p value) © The McGraw-Hill Companies, Inc., 2009 16-56 關鍵詞 • • • • • • • • • • 母數檢定(parametric tests) 檢定力(power of the test) 實務上的顯著性(practical significance) 接受域(region of acceptance) 拒絕域(Region of rejection ) 統計顯著性(statistical significance) t分配(t distribution) 試驗(trials) t檢定(t- test) 二獨立樣本的檢定(twoindependent-samples test s) • 二相關樣本的檢定(two-relatedsamples test s) • 雙尾檢定(two-tailed test) • 型一誤差(Type I error, α) • 型二誤差(Type II error, β) • Z分配(Z distributation) • Z檢定(Z test) © The McGraw-Hill Companies, Inc., 2009