Transcript 統計學CH14
第 14 章 變異數分析 LOGO 14.1 變異數分析 統計實作人員比較兩個或更多個區間資料的母體, 這個方法稱為變異數分析(analysis of variance)。 變異數分析: 極為有用和普及的程序 決定母體平均數之間是否存在著差異 這個程序的運作是藉由分析樣本的變異數 Copyright ©2010 Cengage Learning 第14章 變異數分析 第532頁 14.2 一因子變異數分析 下圖說明獨立樣本的抽樣過程: 注意:這些母體被稱為處理平均數,並非n1 = n2 = … = nk的必要條件。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第533頁 圖4.1 14.3 一因子變異數分析 新的專有名詞: 變數X 稱為反應變數,其數值稱為反應值。 xij = 第j 個樣本的第i 個觀測值 例如:x35 為第3個樣本的第5個觀測值。 k nj x j 1 i 1 = 所有觀測值的總平均數= n n2 +…+ nk 且 k 為母體的個數。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第534頁 ij ,其中n = n1 + 14.4 一因子變異數分析 新的專有名詞: 用來區分母體的標準差稱為因子(factor)。 每一個母體皆稱為一個因子水準(factor level) 。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第535頁 14.5 範例14.1 在過去10 年間,證券經紀商做生意的方法已經有了 極大的改變。 這些改變產生哪些影響? 為了協助回答此問題,一位財務分析師隨機抽樣366 個美國家庭,並且要求每一個家庭報告家中戶長的 年齡以及他們的金融資產投資在股票市場的比例。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第533頁 14.6 範例14.1 年齡的類別為 年輕人(35 歲以下) 中年初期(35 到49 歲) 中年後期(50 到65 歲) 年長者(65 歲以上) 該分析師特別感興趣的是決定股票的擁有是否因年 齡而異。Xm14-01 這些資料是否允許分析師決定股票的擁有在四個年 齡群之間存有差異? Copyright ©2010 Cengage Learning 第14章 變異數分析 第533頁 14.7 專有名詞 範例14.1 總資產投資於股市的百分比稱為反應變數;實際百分比稱為 反應值。 用來區分母體的標準差稱為因子(factor)。 年齡類別是我們感興趣的,這是需要考慮的唯一類別 (因此, 有“一因子”變異數分析的名稱)。 每一個母體皆稱為一個因子水準。 在本範例中有四個因子水準:年輕人、中年初期、中年後期 與年長者。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第533-535頁 14.8 辨識方法 範例14.1 虛無假設: H0:µ1 = µ2 = µ3 = µ4 這些母體平均數之間沒有差異。 對立假設: H1: 至少兩個平均數不等 下一個步驟是決定統計檢定量。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第534頁 14.9 檢定統計量 因為µ1 = µ2 = µ3 = µ4 是我們所感興趣的假設, 因此 各樣本平均數之間近似性的測量我們也會感興趣。 測量樣本平均數之間彼此近似程度的統計量被稱為 處理間變異(between-treatments variation) ,以SST 表示,其代表處理平方和(sum of squares for treatments)。表示為: 所有觀測值的總平均數 母體的個數 假如樣本平均數之問存在著大的差異,至少有一些樣本平均數與總平均數非常的不同, 產生一個大的 SST 數值。則拒絕虛無假設,傾向對立假設是合理的。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第535-536頁 14.10 檢定統計量 我們利用在13章討論過的方法,來估計母體變異數 是相等的情況 2 2 ( n 1 ) s ( n 1 ) s 1 2 2 s 2p 1 n1 n 2 2 其中 t ( x1 x 2 ) 2 s p 1 1 n1 n 2 分子測量樣本平均數之間的差異,分母測量樣本之 間的變異。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第537頁 14.11 檢定統計量 處理間變異(between-treatments variation) 以SST表示, 處理內差異(within-treatments variation)記作SSE。 誤差平方和: 從第二個公式可以很輕易地看出,它提供了一個處 理平方和,讓我們可以預期已經觀察到的隨機變量。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第535-536頁 14.12 計算 範例14.1 根據: 如果: x1 x 2 x 3 x 4 則 SST = 0 值支持虛無假設。 在這個檢定中(如同在其他所有統計檢定中)要回 答的關鍵問題是,檢定統計量必須多大,我們才能 判定拒絕虛無假設? Copyright ©2010 Cengage Learning 第14章 變異數分析 第535-536頁 14.13 計算 範例14.1 我們計算樣本平均數與總平均數為: x1 44.40 x 2 52.47 x 3 51.14 x 4 51.84 x 50.18 Copyright ©2010 Cengage Learning 第14章 變異數分析 第535-536頁 14.14 計算 範例14.1 因此,代表處理平方和的處理間變異為: k SST n j ( x j x ) 2 j 1 84(44.40 50.18) 2 131(52.47 50.18) 2 93(51.14 50.18) 2 58(51.84 50.18) 2 3,738.8 SST = 3,738.8這個值是不是夠大去指出母體平均數 不同? Copyright ©2010 Cengage Learning 第14章 變異數分析 第536頁 14.15 計算 範例14.1 我們計算樣本變異數如下: s12 386.55, s22 469.44, s32 471.82, s42 444.79 因此,誤差平方和為: SSE (n1 1) s12 (n 2 1) s22 (n3 1) s32 (n4 1) s42 (84 1)(386.55) (131 1)(469.44) (93 1)(471.82) (58 1)(444.79) 161,871.3 我們需要檢定統計量來證明SST和SSE的相關性。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第537頁 14.16 均方 處理的均方: 誤差的均方: 檢定統計量: 在反應變數是常態分配的條件下,檢定統計量服從 自由度為 k-1 和 n-k 的F 分配。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第538頁 14.17 計算 範例14.1 在我們的範例中,可發現 SST 3,738.8 MST 1,246.27 k 1 3 SSE 161,871 .3 MSE 447 .16 nk 362 MST 1,24 6.27 F 2.79 MSE 447 .16 F = 2.79 是否在拒絕域中? p- 值是多少? Copyright ©2010 Cengage Learning 第14章 變異數分析 第539頁 14.18 詮釋 範例14.1 計算 F- 統計量(F-statistic)的目的是決定SST的值是 否夠大去拒絕虛無假設。假如SST是大的,F 將會很 大。 p- 值 = P(F > Fstat) Copyright ©2010 Cengage Learning 第14章 變異數分析 第539頁 14.19 計算 範例14.1 點選Data、Data Analysis,與Anova: Single Factor。 Copyright ©2010 Cengage Learning 第14章 變異數分析 14.20 計算 範例14.1 Copyright ©2010 Cengage Learning 第14章 變異數分析 第541頁 14.21 詮釋 範例14.1 p- 值為.0405 夠小的,所以我們拒絕虛無假設 (H0:µ1 = µ2 = µ3 = µ4) 偏好對立假設 (H1: 至少兩個母體平均 數不同) 。 意即存在著證據可以推論總資產投資於股票的百分 比至少在兩個年齡類別是不等的。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第541頁 14.22 變異數分析(ANOVA) 表 變異數分析(ANOVA) 表(analysis of variance) 。 F- 統計量=MST/MSE Copyright ©2010 Cengage Learning 第14章 變異數分析 第539-540頁 14.23 檢查必要的條件 變異數分析的F- 檢定要求隨機變數是具有相等變異 數的常態分配。只要對每一個樣本繪製直方圖,就 可以容易地用圖形檢查常態性的條件。 變異數的同質性可由列印樣本標準差或變異數檢視 之。樣本變異數的相似性讓我們能夠假設母體變異 數是相等的。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第542頁 14.24 必要條件的違背 假如資料不是呈常態分配,我們能夠以等同於一因 子變異數分析的無母數方法取代,它是KruskalWallis 檢定。 假如母體變異數不相等,我們能夠使用幾種方法去 校正這個問題。 但是,這些校正的測量方法超出本書的程度範圍。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第542頁 14.25 辨識因素 辨識一因子變異數分析的因素 1.問題目的:比較兩個或更多個母體。 2.資料類型:區間。 3.實驗設計:獨立樣本。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第546頁 14.26 多重比較 我們從一因子變異數分析得到結論:至少有兩個處 理平均數不同,我們經常需要知道哪幾個處理平均 數造成這些差異性。 我們將會提出三種方法來決定哪些母體平均數是不 同的: • Fisher的最小顯著法 • Bonferroni 校正 • Tukey的多重比較方法 Copyright ©2010 Cengage Learning 第14章 變異數分析 第548.550頁 14.27 多重比較 兩個平均數被認為是不同的,假設它們樣本平均數 間的差異是大於一個臨界值。對此,一般的通式是, 假設 然後我們推斷 和 不同。 我們相信較大的樣本平均數差與一個較大的母體平 均數差是有關聯的。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第頁 14.28 Fisher 的最小顯著法 什麼是關鍵數字 NCritical ? 在第13章,我們介紹信賴區間估計 量是: 2 s p 1 1 n1 n 2 (x1 x 2 ) t / 2 假設區間不包括 0 ,我們可以推斷母體平均數不同。所以另 一個引導雙尾檢定的方式為測定是否 x1 x2 大於 t / 2 Copyright ©2010 Cengage Learning 1 1 s n1 n 2 2 p 第14章 變異數分析 第551頁 14.29 Fisher 的最小顯著法 因為MSE 將會是一個比sp2 更佳的估計量。因此,以MSE 取 代前述的檢定統計量和信賴區間估計量公式中的sp2 。因此我 們定義最小顯著差異(least significant difference, LSD) 為一個 決定每一對母體平均數間是否存在著差異的簡單辦法,是將 兩樣本平均數間差異的絕對值與LSD 做比較: 自由度是v = n - k 如果所有k 個樣本大小皆相等,則LSD 對所有成對的平均數 都是相同的。如果有一些樣本大小不同,對每一個組合都必 須計算LSD。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第551-552頁 14.30 範例14.2 因為外國的競爭,北美汽車製造商已經變得更關心 品質。 品質的一個面向是因意外所造成損毀的修復成本。 一位製造商考慮數種新型的保險桿。 為了測試他們對低速撞擊的反應,四種不同類型、 每種各10個保險桿分別被裝置在中型汽車上,然後 以每小時5哩的速度撞擊牆壁。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第549頁 14.31 範例14.2 每一個事件的修復成本被估價。Xm14-02 a.在5%的顯著水準下,是否有足夠的證據推論這些 保險桿對低速撞擊的反應是有差異的? b .如果存在差異,哪些保險桿是不同的? Copyright ©2010 Cengage Learning 第14章 變異數分析 第549頁 14.32 範例14.2 問題的目的是比較四個母體,資料是區間的,並且 樣本是獨立的。正確的統計方法是一因子變異數分 析。 檢定統計量為F = 4.06 以及p- 值= .0139。有足夠的 統計證據推論有些保險桿之間存在著差異。現在的 問題是,哪些保險桿是不同的? Copyright ©2010 Cengage Learning 第14章 變異數分析 第550頁 14.33 範例14.2 四個樣本平均數是 x1 380.0 x 2 485.9 x 3 483.8 x 4 348.2 MSE = 12,399,因此 LSD t / 2 Copyright ©2010 Cengage Learning 1 1 MSE 2.030 12,399 1 1 101.09 ni n j 10 10 第14章 變異數分析 第553頁 14.34 範例14.2 我們計算平均數之間的差異絕對值並且將計算結果 與LSD = 101.09相比較。 | x1 x 2 | | 380.0 485.9 | | 105.9 | 105.9 | x1 x 3 | | 380.0 483.8 | | 103.8 | 103.8 | x1 x 4 | | 380.0 348.2 | | 31.8 | 31.8 | x 2 x 3 | | 485.9 483.8 | | 2.1 | 2.1 | x 2 x 4 | | 485.9 348.2 | | 137.7 | 137.7 | x 3 x 4 | | 483.8 348.2 | | 135.6 | 135.6 因此,µ1和 µ2、µ1和 µ3、µ2和 µ4、以及 µ3 和 µ4有 差異。 其他兩對µ1和µ4以及µ2和 µ3 則沒有差異。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第553頁 14.35 範例14.2 點選Add-Ins、Data Analysis Plus,與Multiple Comparisons。 Copyright ©2010 Cengage Learning 第14章 變異數分析 14.36 範例14.2 因此,µ1和 µ2、µ1和 µ3、µ2和 µ4、以及 µ3 和 µ4有 差異。 其他兩對µ1和µ4以及µ2和 µ3 則沒有差異。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第553.556頁 14.37 LSD 方法的Bonferroni校正 LSD程序的缺點是我們加大了犯一個型 I 錯誤的機 率。 Bonferroni校正(Bonferroni adjustment)修正了這個 問題。 其中我們先前使用alpha( ) ,譬如說.05,現在我們 將使用調整後的alpha: E C 其中 Copyright ©2010 Cengage Learning 第14章 變異數分析 第552頁 14.38 範例14.2 假如我們執行LSD程序再加上Bonferroni校正,成對 比較的組數是6(以 C = k(k − 1)/2 = 4(3)/2計算得 到)。 我們設α = .05/6 = .0083。因此,tα/2,n-k = tα/2,36 = 2.794 (可由Excel得到,用手算近似則較困難)且 Copyright ©2010 Cengage Learning 第14章 變異數分析 第553頁 14.39 範例14.2 點選Add-Ins、Data Analysis Plus,與 Multiple Comparisons。 Copyright ©2010 Cengage Learning 第14章 變異數分析 14.40 範例14.2 現在並非六對樣本平均數皆不同。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第556頁 14.41 Tukey 的多重比較方法 一如往常,我們尋找關鍵數字NCritical ,以比較樣本 平均數之間的差異。在此案例中它是: 學生化全距的臨界值 在k個樣本中每一個樣本的觀測值個數 注意:ω為希臘字母omega,不是 “w” 。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第554頁 14.42 範例14.2 k = 處理的個數 n = 觀測值的個數 ( n = n1+ n2 + . . . + nk ) ν = 與MSE相關的自由度(v = n - k) ng = 在k 個樣本中每一個樣本的觀測值個數 α = 顯著水準 q ( k , ) = 學生化全距的臨界值 Copyright ©2010 Cengage Learning 第14章 變異數分析 第554頁 14.43 範例14.2 因此, Copyright ©2010 Cengage Learning 第14章 變異數分析 第555頁 14.44 範例14.1-Tukey 的多重比較方法 因此我們結論 µ2 和 µ4,以及 µ3 和µ4 不同。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第555頁 14.45 該使用哪一個多重比較方法? 假如你在執行變異數分析之前已經辨識到你想要進 行的兩或三個成對比較,使用Bonferroni 方法。 假如你計畫比較所有可能的組合,使用Tukey 方法。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第556頁 14.46 變異數分析的實驗設計 實驗設計已經成為我們決定使用哪一種方法的因素 之一。 在範例14.1 描述的實驗是一個單因子設計,因為我 們只有一個處理──家庭戶長的年齡。 一因子變異數分析僅僅是變異數分析許多不同實驗 設計中的一種。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第557.558頁 14.47 變異數分析的實驗設計 一個多因子實驗(multifactor experiment) 是以兩個 或多個因子定義處理(treatments)。 假如在另一個研究中,我們也能夠觀察家庭戶長的 性別。我們將發展兩因子變異數分析。 其中第一個因子──年齡,有四個水準;而第二個因 子──性別,有兩個水準。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第558頁 14.48 獨立樣本和區集 在13.3 節,我們介紹解決配對實驗資料的統計方法。這類的 實驗設計降低樣本內的變異性,使得偵查母體間的差異更加 地容易。當問題的目的是比較兩個以上的母體,與配對實驗 等同的實驗設計被稱為隨機化區集設計(randomized block design)。 區集(block)這個名詞指的是一個來自每一個母體觀測值的配 對群組。 我們也能夠對每一個處理使用相同的物件( 人、工廠和商店) 來執行區集實驗。如此的實驗被稱為重複量測(repeated measures) 設計。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第558頁 14.49 獨立樣本和區集 隨機區集實驗也被稱為二因子變異數分析(two-way analysis of variance), 不要與二因子變異數分析(two-factor analysis of varianc)混淆。我們以下列流程圖與標題來說明… 比較兩個或更多個母體 區間 資料類型 實驗設計? 獨立樣本 區集樣本 一因子變異數分析 隨機區集變異數分析 也可被視為 二因子變異數分析 二因子變異數分析 Copyright ©2010 Cengage Learning 第14章 變異數分析 第559頁 我們將 會先說 明這項 14.50 隨機區集( 二因子) 變異數分析 設計一個隨機區集實驗的目的是為了降低處理內變 異,以便更容易地偵測出處理平均數之間的差異。 在變異數分析的隨機化區集設計中,我們把總變異 分解成三個變異的來源: SS(Total) = SST + SSB + SSE 其中SSB,即區集的平方和(sum of squares for blocks),測量區集之間的變異。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第559-560頁 14.51 隨機區集( 二因子) 變異數分析 下表彙整我們使用於這項實驗設計的符號。 第1個區集中觀測值的平均數 第2個處理中觀測值的平均數 Copyright ©2010 Cengage Learning 第14章 變異數分析 第560頁 表14.4 14.52 隨機區集實驗的平方和 將所有觀測值的總平均數平方之後,會得到以下的 公式: 處理平均數的檢定統計量 隨機集區的檢定量統計 Copyright ©2010 Cengage Learning 第14章 變異數分析 第561頁 14.53 ANOVA 表 如同一因子實驗,由隨機區集實驗產生的統計量可 以彙整於一個ANOVA 表,它的一般式展示於下表 中: Copyright ©2010 Cengage Learning 第14章 變異數分析 第562頁 表14.2 14.54 範例14.3 許多北美洲的民眾有高膽固醇的毛病,它可能導致 心臟病。對於那些膽固醇水準非常高的人(超過 280 ) ,醫生開處方箋藥物以降低膽固醇水準。一問 製藥公司最近研發了四種這類的新藥。為了決定它 們的效果是否存有任何差異,於是籌組一項實驗。 這家公司選取 25 組的人,每組斗位男性,每一個人 的膽固醇水準皆超過 280 。在每一個分組中,男性 的年齡與體重相近。新藥物被控制服用超過兩個月 的期問,並且記錄降低的膽固醇水準。(Xm14-03) 這 些結果是否允許該公司結論這四種新藥之問存有差 異? Copyright ©2010 Cengage Learning 第14章 變異數分析 第562頁 14.55 辨識方法 範例14.3 要被檢定的假設如下: H0:µ1 = µ2 = µ3 = µ4 H1: 至少兩個平均數不等 Copyright ©2010 Cengage Learning 第14章 變異數分析 第563頁 14.56 辨識方法 範例14.3 反應變數是降低的膽固醇,處理是這四種新藥。 區集為這 25個類似的男性群組。 藉由建立實驗設計,可以消除與年齡和體重不同組 合相關的膽固醇降低的變異。這可以幫助我們檢測 由這四種新藥所造成的平均膽固醇降低是否有存有 差異。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第563頁 14.57 資料 範例14.3 處理 區集 範例中有 b = 25 個區集,與 k = 4 個處理。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第562頁 14.58 計算 範例14.3 點選Data、Data Analysis..., 與 Anova: Two-Factor Without Replication a.k.a. Randomized Block Copyright ©2010 Cengage Learning 第14章 變異數分析 14.59 計算 範例14.3 Copyright ©2010 Cengage Learning 第14章 變異數分析 第563頁 14.60 檢查必要的條件 變異數分析隨機化區集設計的F- 檢定與獨立樣本 設計有相同的條件。 也就是,隨機變數必須服從常態分配,且母體變 異數必須相等。 直方圖( 沒有在此展示) 顯示支持我們結果的適用 性;膽固醇的降低呈現常態分配。 變異數相等的需求也呈現出符合的狀態。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第564頁 14.61 必要條件的違背 當反應變量不服從常態分配,我們可以用 Friedman 檢定取代隨機區集變異數分析。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第564頁 14.62 發展對統計觀念的了解 如同我們先前解釋的,隨機區集實驗是13.3 節配 對實驗的一個推廣。 在配對實驗,我們簡單地移除由實驗單位間差異 所造成變異的影響。 這移除的影響可以由減小的標準誤值( 與獨立樣本 檢定統計量產生的標準誤值做比較) 和增大的t- 統 計量值看出。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第565頁 14.63 區集化的準則 在變異數分析的隨機區集實驗,我們以計算SSB 實際測量了區集之間的變異性。 誤差平方和(SSE) 因為SSB 而減小,使得偵測處理 間的差異更加地容易。 此外,我們能夠檢定區集是否不同 ─ 這是我們無 法在配對實驗執行的程序。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第565頁 14.64 辨識隨機區集變異數分析的要素 辨識隨機區集變異數分析的要素: 1.問題目的:比較兩個或更多的母體。 2.資料類型:區間。 3.實驗設計:區集樣本。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第567頁 14.65 二因子變異數分析 在14.1 節中,我們探討資料來自於一因子實驗的 問題。 在範例14.1中,處理為四個不同的年齡類別。因此, 有一個四個水準的單因子。這一節中,我們著重 於具有兩個因子的實驗問題。 資料蒐集程序的一般名稱是因子實驗(factorial experiment)。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第568頁 14.66 二因子變異數分析 因子實驗中,我們可以檢視兩個或更多個因子對 反應變數的影響,然而在本書中我們僅討論兩因 子的問題。 我們可以使用變異數分析來決定每一個因子的水 準是否彼此不同 Copyright ©2010 Cengage Learning 第14章 變異數分析 第568頁 14.67 範例14.4 評估國家經濟健康的一個方式是測量其創造工作的 速度。 此議題的一個層面是個人所持有的工作數。 一項工作任期研究的一部分,是對年齡介於37 到45 歲之間的美國人進行訪談,詢問他們一生中曾經持 有的工作數。也記錄了他們的性別與教育成就。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第569頁 14.68 範例14.4 教育成就的類別是 高中以下(E1) 高中(E2) 專科大學肄業(E3) 至少一個大學學位(E4) 資料是以八種性別和教育類別一一列出。Xm14-04 我們是否可以推論性別與教育水準之間存有差異? Copyright ©2010 Cengage Learning 第14章 變異數分析 第569頁 14.69 範例14.4 Copyright ©2010 Cengage Learning 第14章 變異數分析 第569頁 14.70 辨識方法 範例14.4 我們開始先將這個範例視為一個一因子變異數分析。 注意此處有八個處理。 這些處理是被兩個不同的因子所定義 一個因子是性別,有兩個水準。第二個因子是教育 成就,有四個水準。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第569頁 14.71 辨識方法 範例14.4 我們可以使用14.1 節中相同的方法來解決此一問題, 也就是,我們檢定下列的假設: H 0 : 1 2 3 4 5 6 7 8 H1: 至少兩個平均數是不等的 Copyright ©2010 Cengage Learning 第14章 變異數分析 第569-570頁 14.72 計算 範例14.4 Copyright ©2010 Cengage Learning 第14章 變異數分析 第570頁 14.73 詮釋 範例14.4 檢定統計量的值是F = 2.17,p- 值為.0467。 我們結論八種處理之間的工作數存有差異。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第570頁 14.74 範例14.4 這項統計的結果產生更多的問題。 也就是,我們是否可以結論平均工作數的差異是由 男性與女性之間的差異所造成? 或者它們是由教育水準之間的差異所造成? 或者,也許是否有某些性別和教育的組合稱為交互 作用(interactions) 會導致特別高或低的工作數? Copyright ©2010 Cengage Learning 第14章 變異數分析 第570頁 14.75 專業術語 一個完全因子實驗(complete factorial experiment) 是一種 蒐集各因子水準所有可能組合的實驗。二因子分類(twoway classification)是完全因子實驗的另一個名稱。 通常,我們將其中一個因子視為因子A ( 任意選取)。這個 因子的水準數以a 表示。另外一個因子則被稱為因子B, 而它的水準數以b 表示。 每一種組合的觀測值個數被稱為一個反覆(replicate)。反覆 數以r 表示。這類的設計被稱為平衡(balanced) 設計。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第570-572頁 14.76 專業術語 Copyright ©2010 Cengage Learning Xm14-04a 第14章 變異數分析 第571頁 表14.6 14.77 專業術語 因此,我們使用一個完全因子實驗,其中處理數 是ab 而每一種處理具有r 個反覆數。 在範例14.4 中,a = 2、b = 4,和r = 10。 結果八種處理中的每一個都有10 個觀測值。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第572頁 14.78 範例14.4 如果你檢驗ANOVA 表, 你可以看到總變異數是 SS(Total) =879.55,處理的平方和是SST = 153.35, 以及誤差的平方和是SSE =726.20。 由處理所造成的變異是以SST 來測量。 為了決定是否差異是由於因子A、因子B,或一些兩 因子間的交互作用,我們需要將SST 分解成三個來 源。 分別是 SS(A)、SS(B)和 SS(AB)。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第572頁 14.79 二因子實驗的ANOVA 表 Copyright ©2010 Cengage Learning 第14章 變異數分析 第575頁 表14.8 表14.8 14.80 範例14.4 檢定男性與女性之間工作數的差異 H0: 因子A的2個水準平均數是相同的 H1: 至少兩個平均數不同 檢定統計量: 範例14.4:我們是否可以結論平均工作數的差異是 由男性與女性之間的差異所造成? H0: µmen = µwomen H1: 至少兩個平均數不同 Copyright ©2010 Cengage Learning 第14章 變異數分析 第570.577頁 14.81 範例14.4 檢定不同教育水準之間工作數的差異 H0: 因子B的4個水準平均數是相同的 H1: 至少兩個平均數不同 檢定統計量: 範例14.4:我們是否可以結論平均工作數的差異是 由教育水準之間的差異所造成? H 0 : E1 E 2 E3 E 4 H1: 至少兩個平均數不同 Copyright ©2010 Cengage Learning 第14章 變異數分析 第570.577頁 14.82 範例14.4 檢定因子A 與B 之間的交互作用 H0: 因子A 與B 不交互影響平均工作數 H1: 因子A 與B 交互影響平均工作數 檢定F-統計量: 範例14.4:我們是否可以結論平均工作數的差異也 許是否有某些性別和教育的組合稱為交互作用 (interactions) 會導致特別高或低的工作數? Copyright ©2010 Cengage Learning 第14章 變異數分析 第570.577頁 14.83 計算 範例14.4 點選 Data, Data Analysis,與 Anova: Two Factor With Replication Copyright ©2010 Cengage Learning 第14章 變異數分析 14.84 計算 範例14.4 下表為部份的ANOVA表。 在ANOVA 表中,Sample 是指因子B ( 教育水準) 並且 Columns 是指因子A ( 性別)。因此,MS(B) = 45.28,MS(A) = 11.25,MS(AB) =2.08 以及MSE = 10.09。F- 統計量為 4.49 ( 教育水準)、1.12 ( 性別),與.21 ( 交互作用)。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第576.578頁 14.85 詮釋 範例14.4 具不同教育背景的男性和女性之間有顯著的差異。 在男性和女性之間的差異是小的( 並不顯著)。 而最後,沒有交互作用。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第577頁 14.86 二因子變異數分析檢定 在範例14.4 的兩個版本中,我們對每一個因子進 行檢定,然後檢定交互作用。 但是,如果有交互作用存在的證據,則個別因子 的檢定是不適用的。 因子A水準與因子B水準之間可能有或可能沒有存 在差異。 因此我們改變執行F- 檢定的順序。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第579-580頁 14.87 二因子變異數分析檢定 首先檢定交互作用。 如果有充分的證據去推論有交互作用的存在,則 不必進行其他的檢定。 如果沒有足夠的證據去結論交互作用的存在,對 因子A 與因子B 進行F- 檢定。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第580頁 14.88 辨識獨立樣本二因子變異數分析的要素 辨識獨立樣本二因子變異數分析的要素 1. 問題目的:比較兩個或更多個母體(母體被定義為 兩個因子各水準的組合)。 2. 資料類型:區間。 3. 實驗設計:獨立樣本。 Copyright ©2010 Cengage Learning 第14章 變異數分析 第581頁 14.89