Transcript 兩因子ANOVA之理論
銘傳應用統計系 變異數分析(二) Analysis of Variance (二) 15 - 1 學習目標 銘傳應用統計系 1. 因子實驗設計(factorial design) 2. 解說因子間的交互作用項 3. 兩因子變異數分析analysis of variance (ANOVA) 4. ANOVA假設之檢驗 常態分配之檢驗 變異數一致性之檢驗 15 - 2 實驗設計與資料分析 銘傳應用統計系 實驗設計: 由研究者設定條件後, 執行實驗以觀 察結果是否受該條件之影響 設定條件稱為「處理」方式(treatments) 同類型處理方式稱為一個「因子」(factor) 每因子內之處理方式亦稱為「水準」(levels) 變異數分析: 檢定不同處理對實驗結果產生的 差異或效應 15 - 3 各種實驗設計 銘傳應用統計系 Experimental Designs Completely Randomized Factorial One-Way ANOVA Two-Way ANOVA 15 - 4 Other 實驗設計專有名詞 銘傳應用統計系 1. 實驗單位(experimental units/subjects) 2. 處理(treatments): 實驗中所設定或選取之條 件 3. 控制因子(factors): 由數種處理或水準組成 4. 處理效應(effect): 每一種處理對實驗結果產 生之影嚮 5. 觀測結果(observations) 15 - 5 實驗設計三原則 銘傳應用統計系 1. 隨機(randomization)取樣 不同實驗模型,設計不同隨機方式取得樣本 2. 複製(replications)樣本 在相同處理下, 重複實驗以取得的重複樣本 3. 區集(blocking)技巧 在不同處理下選取同質性高之實驗單位 實驗中,僅處理方式不同外,其它因素無法影嚮 實驗結果 15 - 6 多因子實驗設計 銘傳應用統計系 1.實驗中使用兩個或以上的因子(factors) 每一個因子有2個以上的水準(levels) 2. 實驗單位隨機指派到不同處理 任何水準之組合(level combination)成為一個處理 3. 主效應(main effect)﹕各別因子之效應 4. 交互(interact)效應﹕因子之間交互效應 5. 使用ANOVA分析檢定交互效應及主效應之不同 與否 15 - 7 多因子實驗設計的優點 銘傳應用統計系 1. 節省時間並可了解每單一因子的主要影響 或主要效應(main effects) 2. 引進多因子變數模型,可控制混淆影響 (confounding effects) 3. 可檢測各個因子之間的交互作用 (interaction effects) 15 - 8 兩因子實驗設計範例 銘傳應用統計系 因子 水準 因子2 ( 訓練方式) Level 1 Level 2 Level 3 J (高) 11 hr.J Level 2 27 hr.L (低) 29 hr.L Level 1 19 hr. 因子 1 ( 動機 ) 15 - 9 J 17 hr.J 25 hr.L 30 hr.L 20 hr. J 31 hr.J 31 hr.L 49 hr.L 22 hr. 銘傳應用統計系 兩因子變異數分析 Two-Way ANOVA 15 - 10 圖示兩因子反應變數圖 銘傳應用統計系 第一種狀況 兩條反應線重疊且平行 於X軸 A因子對於反應變數無 效應 B因子對於反應變數無 效應 12 10 8 A1 6 A2 4 2 0 B1 15 - 11 B2 B3 圖示兩因子反應變數圖(續) 銘傳應用統計系 第二種狀況 兩條反應線平行且平行 於X軸 A因子對於反應變數有 效應 B因子對於反應變數無 效應 16 14 12 10 A1 8 A2 6 4 2 0 B1 15 - 12 B2 B3 圖示兩因子反應變數圖(續) 銘傳應用統計系 第三種狀況 兩條反應線重疊但不平 行於X軸 A因子對於反應變數無 效應 B因子對於反應變數有 效應 16 14 12 10 A1 8 A2 6 4 2 0 B1 15 - 13 B2 B3 圖示兩因子反應變數圖(續) 銘傳應用統計系 第四種狀況 兩條反應線平行但不平 行於X軸 A因子對於反應變數有 效應 B因子對於反應變數有 效應 25 20 15 A1 A2 10 5 0 B1 15 - 14 B2 B3 圖示兩因子反應變數圖(續) 銘傳應用統計系 第四種狀況 兩條反應線平行但不平 行於X軸 A因子對於反應變數有 效應 B因子對於反應變數有 效應 16 14 12 10 A1 8 A2 6 4 2 0 B1 15 - 15 B2 B3 圖示兩因子反應變數圖(續) 銘傳應用統計系 第四種狀況 兩條反應線平行但不平 行於X軸 A因子對於反應變數有 效應 B因子對於反應變數有 效應 25 20 15 A1 A2 10 5 0 B1 15 - 16 B2 B3 圖示兩因子反應變數圖(續) 銘傳應用統計系 第五種狀況 兩條反應線不平行 A B兩因子間有交互作 用 A因子對於反應變數有 效應 B因子對於反應變數有 效應 15 - 17 25 20 15 A1 A2 10 5 0 B1 B2 B3 什麼是交互作用項? 銘傳應用統計系 欲解釋A因子的效應需透過 B因子的水準 如:在B1下A2-A1=2 在B2下A2-A1=5 在B3下A2-A1=8 或欲解釋B因子的效應需透 過A因子的水準 如:在A1下B2-B1=5 在A2下B2-B1=8 在A1下B3-B1=10 在A2下B3-B1=16等 15 - 18 25 20 15 A1 A2 10 5 0 B1 B2 B3 圖示兩因子反應變數圖(續) 銘傳應用統計系 第五種狀況 兩條反應線不平行 A B兩因子間有交互作 用 A因子對於反應變數有 效應 B因子對於反應變數有 效應 15 - 19 25 20 15 A1 A2 10 5 0 B1 B2 B3 圖示兩因子反應變數圖(續) 銘傳應用統計系 第五種狀況 兩條反應線不平行 A B兩因子間有交互作 用 A因子對於反應變數有 效應 B因子對於反應變數有 效應 15 - 20 25 20 15 A1 A2 10 5 0 B1 B2 B3 圖示兩因子反應變數圖(續) 銘傳應用統計系 第五種狀況 兩條反應線不平行 A B兩因子間有交互作 用 A因子對於反應變數有 效應 B因子對於反應變數有 效應 15 - 21 25 20 15 A1 A2 10 5 0 B1 B2 B3 兩因子實驗資料列表 銘傳應用統計系 因素A 1 2 : r 15 - 22 1 X111 X112 X211 X212 : Xr11 Xr12 因素 B 2 ... X121 ... X122 ... X221 ... X222 ... : : Xr21 ... Xr22 ... 第k個觀察值 c X1c1 X1c2 X2c1 X2c2 : Xrc1 Xrc2 Xijk 因素A 之水準 i 因素B 之水準 j 水準組合稱為Cell 兩因子ANOVA之理論 銘傳應用統計系 1. 模式(model) ﹕ xijk代表觀測值必須是連續變數 x值=總平均+A因素主效應+B因素主效應+ 交互效應+誤差項 xijk = µ + Ai + Bj + ABij + Ijk (A因子水準 i=1, …,r ﹔B因子水準 j=1, …, c ; 樣本數 k=1, …,n’ ) 15 - 23 兩因子實驗資料列表 銘傳應用統計系 因素A 1 2 : r 15 - 24 1 X111 X112 X211 X212 : Xr11 Xr12 因素 B 2 ... X121 ... X122 ... X221 ... X222 ... : : Xr21 ... Xr22 ... 第k個觀察值 c X1c1 X1c2 X2c1 X2c2 : Xrc1 Xrc2 Xijk 因素A 之水準 i 因素B 之水準 j 水準組合稱為Cell 兩因子ANOVA之理論(續) 銘傳應用統計系 2. 假設條件(assumptions)﹕ 誤差項為常態機率分配,期望值為0 ﹔誤差 值之間獨立 ijk ~ N(0, 2) , ijk independent ijk 2須要估計 誤差項以上的假設條件, 必須正式以統計量 檢定, 或以殘差分析檢查其是否符合 15 - 25 銘傳應用統計系 兩因子變異數分析 總變異量的分割 Total Variation 總變異量SS(Total) 因為A因子水準間差 異所產生的變異量 Variation due to Treatment A (SSA) 因為A、B因子水準間交互 所產生的變異量 Variation due to AB Interaction (SSAB) 15 - 26 因為B因子水準間差 異所產生的變異量 Variation due to Treatment B(SSB) 因為隨機樣本取樣間差異 所產生的變異量Variation due to Random Sampling (SSE) Two-Way ANOVA Total Variation Partitioning 銘傳應用統計系 r the number of levels of factor A c the number of levels of factor B n the number of values (replications) for each cell ' n the total number of observations in the experiment X ijk the value of the k -th observation for level i of factor A and level j of factor B 15 - 27 Total Variation 銘傳應用統計系 r c n' SST X ijk X i 1 j 1 k 1 2 Sum of Squares Total = total variation among all observations around the grand mean r X c n' X i 1 j 1 k 1 ' r ijk c n' X i 1 j 1 k 1 rcn n the overall or grand mean 15 - 28 ijk Factor A Variation 銘傳應用統計系 r SSA cn X i X ' i 1 2 Sum of Squares Due to Factor A = the difference among the various levels of factor A and the grand mean 15 - 29 Factor B Variation 銘傳應用統計系 c SSB rn X j X ' j 1 2 Sum of Squares Due to Factor B = the difference among the various levels of factor B and the grand mean 15 - 30 Interaction Variation 銘傳應用統計系 r c SSAB n X ij X i X j X ' i 1 j 1 2 Sum of Squares Due to Interaction between A and B = the effect of the combinations of factor A and factor B 15 - 31 Random Error 銘傳應用統計系 r c n' SSE X ijk X ij i 1 j 1 k 1 2 Sum of Squares Error = the differences among the observations within each cell and the corresponding cell means 15 - 32 兩因子ANOVA表 銘傳應用統計系 Source of Degrees of Sum of Variation Freedom Squares Mean Square F A 因子 (Row) r-1 SS(A) MS(A) MS(A) MSE B 因子 (Column) c-1 SS(B) MS(B) MS(B) MSE AB 交互作用 (r-1)(c-1) (Interaction) SS(AB) Error 誤差 N - rc SSE C. Total 總和 N-1 SS(Total) 15 - 33 MS(AB) MS(AB) MSE MSE Same as other designs 兩因子變異數分析檢定假設 銘傳應用統計系 1. A和B因素間無交互作用 H0: ABij = 0 for any (i, j) 2. 因素A各水準間平均數無差異 H0: m1.. = m2.. =... = mr.. 3. 因素B各水準間平均數無差異 H0: m.1. = m.2. =... = m.c. 15 - 34 銘傳應用統計系 Two-Way ANOVA: The F Test Statistic H0: m1 .= m2 . = ••• = mr . F Test for Factor A Main Effect MSA H1: Not all mi . are equal F MSE SSA MSA r 1 Reject if F > FU H0: m 1 = m. 2 = ••• = m c F Test for Factor B Main Effect MSB H1: Not all m. j are equal F MSE SSB MSB c 1 Reject if F > FU H0: ij = 0 (for all i and j) F Test for Interaction Effect H1: ij 0 15 - 35 MSAB F MSE SSAB MSAB r 1 c 1 Reject if F > FU 銘傳應用統計系 F-檢定 統計量之臨界值 若是各處理母體間平 均數差異大, 則F = MST / MSE 1. Reject H0 Do Not Reject H0 0 15 - 36 a Fa ( p1, n p) 總是使用單尾檢定呦 Always One-Tail! F 15 - 37 Alone Group Class SUAVE SUAVE VO-5 PERT PERT VO-5 VO-5 你是銘傳行銷公司的分析 師,你想要了解產品在架 上不同位置會對產品的銷 售產生何種的影響。今隨 機抽選了三種大小的店面 、配合了四種不同的架位 。並選取架位配合店面大 小各重複兩店。使用 a = .05,檢定所有各種效應 並下結論。 PERT 銘傳應用統計系 例題﹕店面大小和架上位置 的周銷售額 例題 (續二) - 資料展示 銘傳應用統計系 店的大小 (A) 1 小型 45 50 57 65 70 78 中型 大型 15 - 38 架上位置 (B) 2 3 56 63 69 78 75 82 65 71 73 80 82 89 4 48 53 60 57 71 75 平均銷售量之交互作用圖 銘傳應用統計系 90 80 70 60 50 40 30 20 10 0 A1 A2 A3 B1 15 - 39 B2 B3 B4 銘傳應用統計系 例題 (續三) - ANOVA表(僅 展示部份) Source of Degrees of Sum of Variation Freedom Squares A (店面大小) AB (交互作用) C. Total 15 - 40 F 367.447 17.09 1,828.09 B (擺設位置) Error(誤差) Mean Square 88.91 12 21.500 3,277.34 例題 (續四) - ANOVA表 銘傳應用統計系 Source of Degrees of Sum of Variation Freedom Squares Mean Square F A (Store size) 3-1=2 1,828.09 914.045 42.51 B (Shelf loc.) 4-1=3 1,102.34 367.447 17.09 0.69 AB (Interaction) 6 88.91 14.818 Error 12 258.00 21.500 C. Total 23 3,277.34 15 - 41 銘傳應用統計系 例題 (續五) - 交互作用(店面 與架位) 1. H0: ABij = 0 (交互效應) 2. Ha: ABij 0 3 a = .05 n1 = 6 n2 = 12 4. Critical Value(s): a = .05 0 3.00 15 - 42 F 5. 在Ho的 test statistic: F* MS(AB) MSE 0.69 6. Decision: 在 a = .05下 不拒絕Ho 結論:並無證據顯示店面 與架位有交互作用 例題 (續六) - 主效應(店面) 銘傳應用統計系 1. H0: m1.. = m2.. = m3.. 2. Ha: Not all equal 3 a = .05 n1 = 2 n2 = 12 4. Critical Value(s): a = .05 0 3.89 15 - 43 F 5. 在Ho的 test statistic: F* MS(A) MSE 42.51 6. Decision: 在 a = .05下 拒絕Ho 結論:有充分證據顯示店面 大小會影響銷售額 例題 (續七) - 主效應(架位) 銘傳應用統計系 1. H0: m.1. = m.2. = m.3. 2. Ha: Not all equal 3 a = .05 n1 = 3 n2 = 12 4. Critical Value(s): a = .05 0 3.49 15 - 44 F 5. 在Ho的 test statistic: F* MS(B) MSE 17.09 6. Decision: 在 a = .05下 拒絕Ho 結論:有充分證據顯示架位 不同會影響銷售額 銘傳應用統計系 兩因子ANOVA分析 利用EXCEL 工具 | 資料分析 | 雙因子變異數分析:重複 試驗 Example in excel spreadsheet 15 - 45 銘傳應用統計系 15 - 46 銘傳應用統計系 15 - 47 銘傳應用統計系 15 - 48 銘傳應用統計系 15 - 49 銘傳應用統計系 15 - 50 銘傳應用統計系 15 - 51 銘傳應用統計系 15 - 52 例題二 銘傳應用統計系 因子 水準 因子2 ( 訓練方式) Level 1 Level 2 Level 3 J (高) 11 hr.J Level 2 27 hr.L (低) 29 hr.L Level 1 19 hr. 因子 1 ( 動機 ) 15 - 53 J 17 hr.J 25 hr.L 30 hr.L 20 hr. J 31 hr.J 31 hr.L 49 hr.L 22 hr. 銘傳應用統計系 兩因子ANOVA分析 利用EXCEL 工具 | 資料分析 | 雙因子變異數分析:重複 試驗 Example in excel spreadsheet 15 - 54 銘傳應用統計系 15 - 55 銘傳應用統計系 15 - 56 銘傳應用統計系 變異數分析假設之檢定— 殘差分析 Residual analysis 15 - 57 變異數分析的假設 銘傳應用統計系 1. 常態假設 (normality) 各母體均為常態分配 2. 變異數為同質(homogeneity) 各母體的變異數皆相等 3. 觀測值及誤差項為隨機且獨立的 隨機樣本抽選時亦為獨立 15 - 58 The Normal Distribution 銘傳應用統計系 “Bell shaped” Symmetrical Mean, median and mode are equal Interquartile range equals 1.33 Random variable has infinite range 15 - 59 f(X) m Mean Median Mode X The Mathematical Model 銘傳應用統計系 f X 1 e 1 2 2 X m 2 f X : density of random variable X 2 3.14159; e 2.71828 m : population mean : population standard deviation X : value of random variable X 15 - 60 Many Normal Distributions 銘傳應用統計系 There are an infinite number of normal distributions By varying the parameters and m, we obtain different normal distributions 15 - 61 常態分配之評估 銘傳應用統計系 Not all continuous random variables are normally distributed It is important to evaluate how well the data set seems to be adequately approximated by a normal distribution 15 - 62 常態分配之評估(續) 銘傳應用統計系 (continued) 利用圖表 小中樣本:莖葉圖, 箱型圖 大樣本:直方圖, 折線圖 最常用:常態機率繪圖 15 - 63 常態分配之評估(續) 銘傳應用統計系 (continued) 常態機率繪圖 先將資料排序 計算相對應的標準常態分配的 quantile 值 將相對應的值畫散佈圖 評估是否為一條直線 15 - 64 常態分配之評估(續) 銘傳應用統計系 (continued) Normal Probability Plot for Normal Distribution 90 X 60 Z 30 -2 -1 0 1 2 15 - 65 Look for Straight Line! 常態機率繪圖之狀況 銘傳應用統計系 Left-Skewed Right-Skewed 90 90 X 60 X 60 Z 30 -2 -1 0 1 2 -2 -1 0 1 2 Rectangular U-Shaped 90 90 X 60 X 60 Z 30 -2 -1 0 1 2 15 - 66 Z 30 Z 30 -2 -1 0 1 2 例題 (續八) – 殘差資料 銘傳應用統計系 店的大小 (A) 小型 中型 大型 15 - 67 1 -2.5 +2.5 -3.5 +3.5 -4.0 +4.0 架上位置 (B) 2 3 -3.5 +3.5 -4.5 +4.5 -3.5 +3.5 -3.0 +3.0 -3.5 +3.5 -3.5 +3.5 4 -2.5 +2.5 +1.5 -1.5 -3.0 +3.0 例題 (續九) – 殘差排序 銘傳應用統計系 -4.5, -4.0, -3.5, -3.5, -3.5, -3.5, -3.5, -3.0, -3.0, -2.5, -2.5, -1.5, +1.5, +2.5, +2.5, +3.0 +3.0, +3.5, +3.5, +3.5, +3.5, +3.5, +4.0, +4.5 15 - 68 例題 (續十) – quantile 值 銘傳應用統計系 求p(N(0,1)<Qi)=i/(N+1) 之Qi 值 -1.7, -1.4, -1.175, -0.95, -0.84, -0.705, -0.58, -0.47, -0.2, -0.1, 0, 0.1, 0.2, 0.47, 0.58, 0.705, 0.84, 0.95, 1.175, 1.4,1.7 15 - 69 例題 (續十一) – 相對應值 銘傳應用統計系 -4.5, -4.0, -3.5, -3.5, -3.5, -3.5, -3.5, -3.0, -3.0, -2.5, -2.5, -1.5, +1.5, +2.5, +2.5, +3.0 +3.0, +3.5, +3.5, +3.5, +3.5, +3.5, +4.0, +4.5 -1.7, -1.4, -1.175, -0.95, -0.84, -0.705, -0.58, -0.47, -0.2, -0.1, 0, 0.1, 0.2, 0.47, 0.58, 0.705, 0.84, 0.95, 1.175, 1.4,1.7 15 - 70 例題 (續十二) – 繪圖 0 -4 -2 x 2 4 銘傳應用統計系 -2 -1 0 Quantiles of Standard N ormal 15 - 71 1 2 銘傳應用統計系 常態機率繪圖 利用EXCEL PHStat | Probability Distributions | Normal Probability Plot… Example in excel spreadsheet 15 - 72 銘傳應用統計系 15 - 73 銘傳應用統計系 15 - 74 銘傳應用統計系 15 - 75 銘傳應用統計系 15 - 76 例題二 銘傳應用統計系 因子 水準 因子2 ( 訓練方式) Level 1 Level 2 Level 3 J (高) 11 hr.J Level 2 27 hr.L (低) 29 hr.L Level 1 19 hr. 因子 1 ( 動機 ) 15 - 77 J 17 hr.J 25 hr.L 30 hr.L 20 hr. J 31 hr.J 31 hr.L 49 hr.L 22 hr. 例題二:殘差 銘傳應用統計系 15 - 78 銘傳應用統計系 15 - 79 變異數分析的假設 銘傳應用統計系 1. 常態假設 (normality) 各母體均為常態分配 2. 變異數為同質(一致性homogeneity) 各母體的變異數皆相等 3. 觀測值及誤差項為隨機且獨立的 隨機樣本抽選時亦為獨立 15 - 80 變異數為同質之檢定 銘傳應用統計系 Hartley F-max test Battlet’s test Box subsample test Levene’s test 15 - 81 Hartley F-max test 銘傳應用統計系 2 2 Fmax=Smax/Smin 2 Smax 最大的樣本變異數 2 Smin 最小的樣本變異數 F-max分配, 第一自由度 c (處理數) , 第二 自由度 n-1(樣本數) 15 - 82 F-max 分配之部份表格 銘傳應用統計系 n-1/c 2 3 4 5 6 7 8 2 39.0 87.5 142 202 266 3 15.4 27.8 39.2 50.7 62.0 72.9 83.5 93.9 4 9.60 15.5 20.6 25.2 29.5 33.6 37.5 41.1 5 7.15 10.8 13.7 16.3 18.7 20.8 22.9 24.7 6 5.82 8.38 10.4 12.1 13.7 15.0 16.3 17.5 15 - 83 333 403 9 475 機器裝填的例子 銘傳應用統計系 請檢定各個機 器的變異數是 否相同? 15 - 84 Machine1 Machine2 Machine3 25.40 26.31 24.10 23.74 25.10 23.40 21.80 23.50 22.75 21.60 20.00 22.20 19.75 20.60 20.40 機器裝填的例子(續) 銘傳應用統計系 計算結果 機器一之樣本變異數 1.0648 機器二之樣本變異數 0.778 機器三之樣本變異數 0.9205 Fmax=1.0648/0.778=1.1568 C=3, n=5, 查表 Fmax(0.05,3,4)=15.5 ∵1.1568<15.5 ∴不拒絕 H0 15 - 85 變異數分析的假設 銘傳應用統計系 1. 常態假設 (normality) 各母體均為常態分配 2. 變異數為同質(一致性homogeneity) 各母體的變異數皆相等 3. 觀測值及誤差項為隨機且獨立的 隨機樣本抽選時亦為獨立 15 - 86 獨立性之檢定 銘傳應用統計系 必須知道資料觀察的先後順序 用時間序列的方式檢查殘差是否有自我相 關性或偏自我相關性 最常用Durbin Watson’s test 無母數方法—利用 Run test 來檢驗獨立性 請參考更深入的變異數分析方法之書籍 15 - 87 違背ANOVA假設之處理 銘傳應用統計系 當違背ANOVA假設時 通常會將反應變數做轉換 經常使用的轉換函數為 √, ln, 1/x 或 Box-Cox 轉換 牽涉較深的統計方法 不多述 15 - 88 結論 銘傳應用統計系 1. 因子實驗設計(factorial design) 2. 解說因子間的交互作用項 3. 兩因子變異數分析analysis of variance (ANOVA) 4. ANOVA假設之檢驗 常態分配之檢驗 變異數一致性之檢驗 15 - 89 關於本課程... 銘傳應用統計系 請你靜下來想一想並回答下列問題: 1. 你此堂課學到的最重要的觀念為何? 2. 是否還有相關問題與疑問? 3. 如何改善今後的學習? 15 - 90