統計學CH14

Download Report

Transcript 統計學CH14

第 14 章
變異數分析
LOGO
14.1
變異數分析
統計實作人員比較兩個或更多個區間資料的母體,
這個方法稱為變異數分析(analysis of variance)。
變異數分析:
 極為有用和普及的程序
 決定母體平均數之間是否存在著差異
 這個程序的運作是藉由分析樣本的變異數
Copyright ©2010 Cengage Learning
第14章 變異數分析 第532頁
14.2
一因子變異數分析
下圖說明獨立樣本的抽樣過程:
注意:這些母體被稱為處理平均數,並非n1 = n2 = …
= nk的必要條件。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第533頁 圖4.1
14.3
一因子變異數分析
新的專有名詞:
變數X 稱為反應變數,其數值稱為反應值。
xij = 第j 個樣本的第i 個觀測值
例如:x35 為第3個樣本的第5個觀測值。
k
nj
 x
j 1
i 1
= 所有觀測值的總平均數=
n
n2 +…+ nk 且 k 為母體的個數。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第534頁
ij
,其中n = n1 +
14.4
一因子變異數分析
新的專有名詞:
用來區分母體的標準差稱為因子(factor)。
每一個母體皆稱為一個因子水準(factor level) 。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第535頁
14.5
範例14.1
在過去10 年間,證券經紀商做生意的方法已經有了
極大的改變。
這些改變產生哪些影響?
為了協助回答此問題,一位財務分析師隨機抽樣366
個美國家庭,並且要求每一個家庭報告家中戶長的
年齡以及他們的金融資產投資在股票市場的比例。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第533頁
14.6
範例14.1
年齡的類別為
年輕人(35 歲以下)
中年初期(35 到49 歲)
中年後期(50 到65 歲)
年長者(65 歲以上)
該分析師特別感興趣的是決定股票的擁有是否因年
齡而異。Xm14-01
這些資料是否允許分析師決定股票的擁有在四個年
齡群之間存有差異?
Copyright ©2010 Cengage Learning
第14章 變異數分析 第533頁
14.7
專有名詞
範例14.1
總資產投資於股市的百分比稱為反應變數;實際百分比稱為
反應值。
用來區分母體的標準差稱為因子(factor)。
年齡類別是我們感興趣的,這是需要考慮的唯一類別 (因此,
有“一因子”變異數分析的名稱)。
每一個母體皆稱為一個因子水準。
在本範例中有四個因子水準:年輕人、中年初期、中年後期
與年長者。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第533-535頁
14.8
辨識方法
範例14.1
虛無假設:
H0:µ1 = µ2 = µ3 = µ4
這些母體平均數之間沒有差異。
對立假設:
H1: 至少兩個平均數不等
下一個步驟是決定統計檢定量。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第534頁
14.9
檢定統計量
因為µ1 = µ2 = µ3 = µ4 是我們所感興趣的假設, 因此
各樣本平均數之間近似性的測量我們也會感興趣。
測量樣本平均數之間彼此近似程度的統計量被稱為
處理間變異(between-treatments variation) ,以SST
表示,其代表處理平方和(sum of squares for
treatments)。表示為:
所有觀測值的總平均數
母體的個數
假如樣本平均數之問存在著大的差異,至少有一些樣本平均數與總平均數非常的不同,
產生一個大的 SST 數值。則拒絕虛無假設,傾向對立假設是合理的。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第535-536頁
14.10
檢定統計量
我們利用在13章討論過的方法,來估計母體變異數
是相等的情況
2
2
(
n

1
)
s

(
n

1
)
s
1
2
2
s 2p  1
n1  n 2  2
其中
t
( x1  x 2 )
2
s p 
1
1 


 n1 n 2 
分子測量樣本平均數之間的差異,分母測量樣本之
間的變異。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第537頁
14.11
檢定統計量
處理間變異(between-treatments variation) 以SST表示,
處理內差異(within-treatments variation)記作SSE。
誤差平方和:
從第二個公式可以很輕易地看出,它提供了一個處
理平方和,讓我們可以預期已經觀察到的隨機變量。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第535-536頁
14.12
計算
範例14.1
根據:
如果:
x1  x 2  x 3  x 4
則 SST = 0 值支持虛無假設。
在這個檢定中(如同在其他所有統計檢定中)要回
答的關鍵問題是,檢定統計量必須多大,我們才能
判定拒絕虛無假設?
Copyright ©2010 Cengage Learning
第14章 變異數分析 第535-536頁
14.13
計算
範例14.1
我們計算樣本平均數與總平均數為:
x1  44.40
x 2  52.47
x 3  51.14
x 4  51.84
x  50.18
Copyright ©2010 Cengage Learning
第14章 變異數分析 第535-536頁
14.14
計算
範例14.1
因此,代表處理平方和的處理間變異為:
k
SST   n j ( x j  x ) 2
j 1
 84(44.40  50.18) 2  131(52.47  50.18) 2
 93(51.14  50.18) 2  58(51.84  50.18) 2
 3,738.8
SST = 3,738.8這個值是不是夠大去指出母體平均數
不同?
Copyright ©2010 Cengage Learning
第14章 變異數分析 第536頁
14.15
計算
範例14.1
我們計算樣本變異數如下:
s12  386.55, s22  469.44, s32  471.82, s42  444.79
因此,誤差平方和為:
SSE  (n1  1) s12  (n 2 1) s22  (n3  1) s32  (n4  1) s42
 (84  1)(386.55)  (131 1)(469.44)  (93  1)(471.82)
 (58  1)(444.79)
 161,871.3
我們需要檢定統計量來證明SST和SSE的相關性。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第537頁
14.16
均方
處理的均方:
誤差的均方:
檢定統計量:
在反應變數是常態分配的條件下,檢定統計量服從
自由度為 k-1 和 n-k 的F 分配。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第538頁
14.17
計算
範例14.1
在我們的範例中,可發現
SST 3,738.8
MST 

 1,246.27
k 1
3
SSE 161,871 .3
MSE 

 447 .16
nk
362
MST 1,24 6.27
F

 2.79
MSE
447 .16
F = 2.79 是否在拒絕域中? p- 值是多少?
Copyright ©2010 Cengage Learning
第14章 變異數分析 第539頁
14.18
詮釋
範例14.1
計算 F- 統計量(F-statistic)的目的是決定SST的值是
否夠大去拒絕虛無假設。假如SST是大的,F 將會很
大。
p- 值 = P(F > Fstat)
Copyright ©2010 Cengage Learning
第14章 變異數分析 第539頁
14.19
計算
範例14.1
點選Data、Data Analysis,與Anova: Single Factor。
Copyright ©2010 Cengage Learning
第14章 變異數分析
14.20
計算
範例14.1
Copyright ©2010 Cengage Learning
第14章 變異數分析 第541頁
14.21
詮釋
範例14.1
p- 值為.0405 夠小的,所以我們拒絕虛無假設 (H0:µ1
= µ2 = µ3 = µ4) 偏好對立假設 (H1: 至少兩個母體平均
數不同) 。
意即存在著證據可以推論總資產投資於股票的百分
比至少在兩個年齡類別是不等的。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第541頁
14.22
變異數分析(ANOVA) 表
變異數分析(ANOVA) 表(analysis of variance) 。
F- 統計量=MST/MSE
Copyright ©2010 Cengage Learning
第14章 變異數分析 第539-540頁
14.23
檢查必要的條件
變異數分析的F- 檢定要求隨機變數是具有相等變異
數的常態分配。只要對每一個樣本繪製直方圖,就
可以容易地用圖形檢查常態性的條件。
變異數的同質性可由列印樣本標準差或變異數檢視
之。樣本變異數的相似性讓我們能夠假設母體變異
數是相等的。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第542頁
14.24
必要條件的違背
假如資料不是呈常態分配,我們能夠以等同於一因
子變異數分析的無母數方法取代,它是KruskalWallis 檢定。
假如母體變異數不相等,我們能夠使用幾種方法去
校正這個問題。
但是,這些校正的測量方法超出本書的程度範圍。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第542頁
14.25
辨識因素
辨識一因子變異數分析的因素
1.問題目的:比較兩個或更多個母體。
2.資料類型:區間。
3.實驗設計:獨立樣本。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第546頁
14.26
多重比較
我們從一因子變異數分析得到結論:至少有兩個處
理平均數不同,我們經常需要知道哪幾個處理平均
數造成這些差異性。
我們將會提出三種方法來決定哪些母體平均數是不
同的:
• Fisher的最小顯著法
• Bonferroni 校正
• Tukey的多重比較方法
Copyright ©2010 Cengage Learning
第14章 變異數分析 第548.550頁
14.27
多重比較
兩個平均數被認為是不同的,假設它們樣本平均數
間的差異是大於一個臨界值。對此,一般的通式是,
假設
然後我們推斷
和
不同。
我們相信較大的樣本平均數差與一個較大的母體平
均數差是有關聯的。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第頁
14.28
Fisher 的最小顯著法
什麼是關鍵數字 NCritical ? 在第13章,我們介紹信賴區間估計
量是:
2
s p 
1
1 


 n1 n 2 
(x1  x 2 )  t  / 2
假設區間不包括 0 ,我們可以推斷母體平均數不同。所以另
一個引導雙尾檢定的方式為測定是否
x1  x2
大於
t / 2
Copyright ©2010 Cengage Learning
1 1 
s   
 n1 n 2 
2
p
第14章 變異數分析 第551頁
14.29
Fisher 的最小顯著法
因為MSE 將會是一個比sp2 更佳的估計量。因此,以MSE 取
代前述的檢定統計量和信賴區間估計量公式中的sp2 。因此我
們定義最小顯著差異(least significant difference, LSD) 為一個
決定每一對母體平均數間是否存在著差異的簡單辦法,是將
兩樣本平均數間差異的絕對值與LSD 做比較:
自由度是v = n - k
如果所有k 個樣本大小皆相等,則LSD 對所有成對的平均數
都是相同的。如果有一些樣本大小不同,對每一個組合都必
須計算LSD。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第551-552頁
14.30
範例14.2
因為外國的競爭,北美汽車製造商已經變得更關心
品質。
品質的一個面向是因意外所造成損毀的修復成本。
一位製造商考慮數種新型的保險桿。
為了測試他們對低速撞擊的反應,四種不同類型、
每種各10個保險桿分別被裝置在中型汽車上,然後
以每小時5哩的速度撞擊牆壁。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第549頁
14.31
範例14.2
每一個事件的修復成本被估價。Xm14-02
a.在5%的顯著水準下,是否有足夠的證據推論這些
保險桿對低速撞擊的反應是有差異的?
b .如果存在差異,哪些保險桿是不同的?
Copyright ©2010 Cengage Learning
第14章 變異數分析 第549頁
14.32
範例14.2
問題的目的是比較四個母體,資料是區間的,並且
樣本是獨立的。正確的統計方法是一因子變異數分
析。
檢定統計量為F = 4.06 以及p- 值= .0139。有足夠的
統計證據推論有些保險桿之間存在著差異。現在的
問題是,哪些保險桿是不同的?
Copyright ©2010 Cengage Learning
第14章 變異數分析 第550頁
14.33
範例14.2
四個樣本平均數是
x1  380.0
x 2  485.9
x 3  483.8
x 4  348.2
MSE = 12,399,因此
LSD  t  / 2
Copyright ©2010 Cengage Learning
 1

1
MSE    2.030 12,399 1  1   101.09
 ni n j 


 10 10 
第14章 變異數分析 第553頁
14.34
範例14.2
我們計算平均數之間的差異絕對值並且將計算結果
與LSD = 101.09相比較。
| x1  x 2 |  | 380.0  485.9 |  | 105.9 |  105.9
| x1  x 3 |  | 380.0  483.8 |  | 103.8 |  103.8
| x1  x 4 |  | 380.0  348.2 |  | 31.8 |  31.8
| x 2  x 3 | | 485.9  483.8 |  | 2.1 |  2.1
| x 2  x 4 |  | 485.9  348.2 |  | 137.7 |  137.7
| x 3  x 4 |  | 483.8  348.2 |  | 135.6 |  135.6
因此,µ1和 µ2、µ1和 µ3、µ2和 µ4、以及 µ3 和 µ4有
差異。
其他兩對µ1和µ4以及µ2和 µ3 則沒有差異。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第553頁
14.35
範例14.2
點選Add-Ins、Data Analysis Plus,與Multiple
Comparisons。
Copyright ©2010 Cengage Learning
第14章 變異數分析
14.36
範例14.2
因此,µ1和 µ2、µ1和 µ3、µ2和 µ4、以及 µ3 和 µ4有
差異。
其他兩對µ1和µ4以及µ2和 µ3 則沒有差異。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第553.556頁
14.37
LSD 方法的Bonferroni校正
LSD程序的缺點是我們加大了犯一個型 I 錯誤的機
率。
Bonferroni校正(Bonferroni adjustment)修正了這個
問題。
其中我們先前使用alpha( ) ,譬如說.05,現在我們
將使用調整後的alpha:
E

C
其中
Copyright ©2010 Cengage Learning
第14章 變異數分析 第552頁
14.38
範例14.2
假如我們執行LSD程序再加上Bonferroni校正,成對
比較的組數是6(以 C = k(k − 1)/2 = 4(3)/2計算得
到)。
我們設α = .05/6 = .0083。因此,tα/2,n-k = tα/2,36 = 2.794
(可由Excel得到,用手算近似則較困難)且
Copyright ©2010 Cengage Learning
第14章 變異數分析 第553頁
14.39
範例14.2
點選Add-Ins、Data Analysis Plus,與 Multiple
Comparisons。
Copyright ©2010 Cengage Learning
第14章 變異數分析
14.40
範例14.2
現在並非六對樣本平均數皆不同。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第556頁
14.41
Tukey 的多重比較方法
一如往常,我們尋找關鍵數字NCritical ,以比較樣本
平均數之間的差異。在此案例中它是:
學生化全距的臨界值
在k個樣本中每一個樣本的觀測值個數
注意:ω為希臘字母omega,不是 “w” 。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第554頁
14.42
範例14.2
k = 處理的個數
n = 觀測值的個數 ( n = n1+ n2 + . . . + nk )
ν = 與MSE相關的自由度(v = n - k)
ng = 在k 個樣本中每一個樣本的觀測值個數
α = 顯著水準
q  ( k ,  ) = 學生化全距的臨界值
Copyright ©2010 Cengage Learning
第14章 變異數分析 第554頁
14.43
範例14.2
因此,
Copyright ©2010 Cengage Learning
第14章 變異數分析 第555頁
14.44
範例14.1-Tukey 的多重比較方法
因此我們結論 µ2 和 µ4,以及 µ3 和µ4 不同。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第555頁
14.45
該使用哪一個多重比較方法?
假如你在執行變異數分析之前已經辨識到你想要進
行的兩或三個成對比較,使用Bonferroni 方法。
假如你計畫比較所有可能的組合,使用Tukey 方法。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第556頁
14.46
變異數分析的實驗設計
實驗設計已經成為我們決定使用哪一種方法的因素
之一。
在範例14.1 描述的實驗是一個單因子設計,因為我
們只有一個處理──家庭戶長的年齡。
一因子變異數分析僅僅是變異數分析許多不同實驗
設計中的一種。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第557.558頁
14.47
變異數分析的實驗設計
一個多因子實驗(multifactor experiment) 是以兩個
或多個因子定義處理(treatments)。
假如在另一個研究中,我們也能夠觀察家庭戶長的
性別。我們將發展兩因子變異數分析。
其中第一個因子──年齡,有四個水準;而第二個因
子──性別,有兩個水準。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第558頁
14.48
獨立樣本和區集
在13.3 節,我們介紹解決配對實驗資料的統計方法。這類的
實驗設計降低樣本內的變異性,使得偵查母體間的差異更加
地容易。當問題的目的是比較兩個以上的母體,與配對實驗
等同的實驗設計被稱為隨機化區集設計(randomized block
design)。
區集(block)這個名詞指的是一個來自每一個母體觀測值的配
對群組。
我們也能夠對每一個處理使用相同的物件( 人、工廠和商店)
來執行區集實驗。如此的實驗被稱為重複量測(repeated
measures) 設計。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第558頁
14.49
獨立樣本和區集
隨機區集實驗也被稱為二因子變異數分析(two-way analysis
of variance), 不要與二因子變異數分析(two-factor analysis of
varianc)混淆。我們以下列流程圖與標題來說明…
比較兩個或更多個母體
區間
資料類型
實驗設計?
獨立樣本
區集樣本
一因子變異數分析
隨機區集變異數分析
也可被視為
二因子變異數分析
二因子變異數分析
Copyright ©2010 Cengage Learning
第14章 變異數分析 第559頁
我們將
會先說
明這項
14.50
隨機區集( 二因子) 變異數分析
設計一個隨機區集實驗的目的是為了降低處理內變
異,以便更容易地偵測出處理平均數之間的差異。
在變異數分析的隨機化區集設計中,我們把總變異
分解成三個變異的來源:
SS(Total) = SST + SSB + SSE
其中SSB,即區集的平方和(sum of squares for
blocks),測量區集之間的變異。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第559-560頁
14.51
隨機區集( 二因子) 變異數分析
下表彙整我們使用於這項實驗設計的符號。
第1個區集中觀測值的平均數
第2個處理中觀測值的平均數
Copyright ©2010 Cengage Learning
第14章 變異數分析 第560頁 表14.4
14.52
隨機區集實驗的平方和
將所有觀測值的總平均數平方之後,會得到以下的
公式:
處理平均數的檢定統計量
隨機集區的檢定量統計
Copyright ©2010 Cengage Learning
第14章 變異數分析 第561頁
14.53
ANOVA 表
如同一因子實驗,由隨機區集實驗產生的統計量可
以彙整於一個ANOVA 表,它的一般式展示於下表
中:
Copyright ©2010 Cengage Learning
第14章 變異數分析 第562頁 表14.2
14.54
範例14.3
許多北美洲的民眾有高膽固醇的毛病,它可能導致
心臟病。對於那些膽固醇水準非常高的人(超過
280 ) ,醫生開處方箋藥物以降低膽固醇水準。一問
製藥公司最近研發了四種這類的新藥。為了決定它
們的效果是否存有任何差異,於是籌組一項實驗。
這家公司選取 25 組的人,每組斗位男性,每一個人
的膽固醇水準皆超過 280 。在每一個分組中,男性
的年齡與體重相近。新藥物被控制服用超過兩個月
的期問,並且記錄降低的膽固醇水準。(Xm14-03) 這
些結果是否允許該公司結論這四種新藥之問存有差
異?
Copyright ©2010 Cengage Learning
第14章 變異數分析 第562頁
14.55
辨識方法
範例14.3
要被檢定的假設如下:
H0:µ1 = µ2 = µ3 = µ4
H1: 至少兩個平均數不等
Copyright ©2010 Cengage Learning
第14章 變異數分析 第563頁
14.56
辨識方法
範例14.3
反應變數是降低的膽固醇,處理是這四種新藥。
區集為這 25個類似的男性群組。
藉由建立實驗設計,可以消除與年齡和體重不同組
合相關的膽固醇降低的變異。這可以幫助我們檢測
由這四種新藥所造成的平均膽固醇降低是否有存有
差異。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第563頁
14.57
資料
範例14.3
處理
區集
範例中有 b = 25 個區集,與 k = 4
個處理。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第562頁
14.58
計算
範例14.3
點選Data、Data Analysis..., 與
Anova: Two-Factor Without Replication
a.k.a. Randomized Block
Copyright ©2010 Cengage Learning
第14章 變異數分析
14.59
計算
範例14.3
Copyright ©2010 Cengage Learning
第14章 變異數分析 第563頁
14.60
檢查必要的條件
 變異數分析隨機化區集設計的F- 檢定與獨立樣本
設計有相同的條件。
也就是,隨機變數必須服從常態分配,且母體變
異數必須相等。
 直方圖( 沒有在此展示) 顯示支持我們結果的適用
性;膽固醇的降低呈現常態分配。
 變異數相等的需求也呈現出符合的狀態。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第564頁
14.61
必要條件的違背
 當反應變量不服從常態分配,我們可以用
Friedman 檢定取代隨機區集變異數分析。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第564頁
14.62
發展對統計觀念的了解
 如同我們先前解釋的,隨機區集實驗是13.3 節配
對實驗的一個推廣。
 在配對實驗,我們簡單地移除由實驗單位間差異
所造成變異的影響。
 這移除的影響可以由減小的標準誤值( 與獨立樣本
檢定統計量產生的標準誤值做比較) 和增大的t- 統
計量值看出。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第565頁
14.63
區集化的準則
 在變異數分析的隨機區集實驗,我們以計算SSB
實際測量了區集之間的變異性。
 誤差平方和(SSE) 因為SSB 而減小,使得偵測處理
間的差異更加地容易。
 此外,我們能夠檢定區集是否不同 ─ 這是我們無
法在配對實驗執行的程序。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第565頁
14.64
辨識隨機區集變異數分析的要素
辨識隨機區集變異數分析的要素:
1.問題目的:比較兩個或更多的母體。
2.資料類型:區間。
3.實驗設計:區集樣本。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第567頁
14.65
二因子變異數分析
 在14.1 節中,我們探討資料來自於一因子實驗的
問題。
 在範例14.1中,處理為四個不同的年齡類別。因此,
有一個四個水準的單因子。這一節中,我們著重
於具有兩個因子的實驗問題。
 資料蒐集程序的一般名稱是因子實驗(factorial
experiment)。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第568頁
14.66
二因子變異數分析
 因子實驗中,我們可以檢視兩個或更多個因子對
反應變數的影響,然而在本書中我們僅討論兩因
子的問題。
 我們可以使用變異數分析來決定每一個因子的水
準是否彼此不同
Copyright ©2010 Cengage Learning
第14章 變異數分析 第568頁
14.67
範例14.4
評估國家經濟健康的一個方式是測量其創造工作的
速度。
此議題的一個層面是個人所持有的工作數。
一項工作任期研究的一部分,是對年齡介於37 到45
歲之間的美國人進行訪談,詢問他們一生中曾經持
有的工作數。也記錄了他們的性別與教育成就。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第569頁
14.68
範例14.4
教育成就的類別是
高中以下(E1)
高中(E2)
專科大學肄業(E3)
至少一個大學學位(E4)
資料是以八種性別和教育類別一一列出。Xm14-04
我們是否可以推論性別與教育水準之間存有差異?
Copyright ©2010 Cengage Learning
第14章 變異數分析 第569頁
14.69
範例14.4
Copyright ©2010 Cengage Learning
第14章 變異數分析 第569頁
14.70
辨識方法
範例14.4
我們開始先將這個範例視為一個一因子變異數分析。
注意此處有八個處理。
這些處理是被兩個不同的因子所定義
一個因子是性別,有兩個水準。第二個因子是教育
成就,有四個水準。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第569頁
14.71
辨識方法
範例14.4
我們可以使用14.1 節中相同的方法來解決此一問題,
也就是,我們檢定下列的假設:
H 0 : 1   2   3   4   5   6   7   8
H1: 至少兩個平均數是不等的
Copyright ©2010 Cengage Learning
第14章 變異數分析 第569-570頁
14.72
計算
範例14.4
Copyright ©2010 Cengage Learning
第14章 變異數分析 第570頁
14.73
詮釋
範例14.4
檢定統計量的值是F = 2.17,p- 值為.0467。
我們結論八種處理之間的工作數存有差異。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第570頁
14.74
範例14.4
這項統計的結果產生更多的問題。
也就是,我們是否可以結論平均工作數的差異是由
男性與女性之間的差異所造成?
或者它們是由教育水準之間的差異所造成?
或者,也許是否有某些性別和教育的組合稱為交互
作用(interactions) 會導致特別高或低的工作數?
Copyright ©2010 Cengage Learning
第14章 變異數分析 第570頁
14.75
專業術語
 一個完全因子實驗(complete factorial experiment) 是一種
蒐集各因子水準所有可能組合的實驗。二因子分類(twoway classification)是完全因子實驗的另一個名稱。
 通常,我們將其中一個因子視為因子A ( 任意選取)。這個
因子的水準數以a 表示。另外一個因子則被稱為因子B,
而它的水準數以b 表示。
 每一種組合的觀測值個數被稱為一個反覆(replicate)。反覆
數以r 表示。這類的設計被稱為平衡(balanced) 設計。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第570-572頁
14.76
專業術語
Copyright ©2010 Cengage Learning
Xm14-04a
第14章 變異數分析 第571頁 表14.6
14.77
專業術語
 因此,我們使用一個完全因子實驗,其中處理數
是ab 而每一種處理具有r 個反覆數。
在範例14.4 中,a = 2、b = 4,和r = 10。
 結果八種處理中的每一個都有10 個觀測值。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第572頁
14.78
範例14.4
如果你檢驗ANOVA 表, 你可以看到總變異數是
SS(Total) =879.55,處理的平方和是SST = 153.35,
以及誤差的平方和是SSE =726.20。
由處理所造成的變異是以SST 來測量。
為了決定是否差異是由於因子A、因子B,或一些兩
因子間的交互作用,我們需要將SST 分解成三個來
源。
分別是 SS(A)、SS(B)和 SS(AB)。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第572頁
14.79
二因子實驗的ANOVA 表
Copyright ©2010 Cengage Learning
第14章 變異數分析 第575頁 表14.8
表14.8
14.80
範例14.4
檢定男性與女性之間工作數的差異
H0: 因子A的2個水準平均數是相同的
H1: 至少兩個平均數不同
檢定統計量:
範例14.4:我們是否可以結論平均工作數的差異是
由男性與女性之間的差異所造成?
H0: µmen = µwomen
H1: 至少兩個平均數不同
Copyright ©2010 Cengage Learning
第14章 變異數分析 第570.577頁
14.81
範例14.4
檢定不同教育水準之間工作數的差異
H0: 因子B的4個水準平均數是相同的
H1: 至少兩個平均數不同
檢定統計量:
範例14.4:我們是否可以結論平均工作數的差異是
由教育水準之間的差異所造成?
H 0 :  E1   E 2   E3   E 4
H1: 至少兩個平均數不同
Copyright ©2010 Cengage Learning
第14章 變異數分析 第570.577頁
14.82
範例14.4
檢定因子A 與B 之間的交互作用
H0: 因子A 與B 不交互影響平均工作數
H1: 因子A 與B 交互影響平均工作數
檢定F-統計量:
範例14.4:我們是否可以結論平均工作數的差異也
許是否有某些性別和教育的組合稱為交互作用
(interactions) 會導致特別高或低的工作數?
Copyright ©2010 Cengage Learning
第14章 變異數分析 第570.577頁
14.83
計算
範例14.4
點選 Data, Data Analysis,與 Anova: Two Factor
With Replication
Copyright ©2010 Cengage Learning
第14章 變異數分析
14.84
計算
範例14.4
下表為部份的ANOVA表。
在ANOVA 表中,Sample 是指因子B ( 教育水準) 並且
Columns 是指因子A ( 性別)。因此,MS(B) = 45.28,MS(A)
= 11.25,MS(AB) =2.08 以及MSE = 10.09。F- 統計量為
4.49 ( 教育水準)、1.12 ( 性別),與.21 ( 交互作用)。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第576.578頁
14.85
詮釋
範例14.4
具不同教育背景的男性和女性之間有顯著的差異。
在男性和女性之間的差異是小的( 並不顯著)。
而最後,沒有交互作用。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第577頁
14.86
二因子變異數分析檢定
 在範例14.4 的兩個版本中,我們對每一個因子進
行檢定,然後檢定交互作用。
但是,如果有交互作用存在的證據,則個別因子
的檢定是不適用的。
 因子A水準與因子B水準之間可能有或可能沒有存
在差異。
因此我們改變執行F- 檢定的順序。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第579-580頁
14.87
二因子變異數分析檢定
 首先檢定交互作用。
 如果有充分的證據去推論有交互作用的存在,則
不必進行其他的檢定。
 如果沒有足夠的證據去結論交互作用的存在,對
因子A 與因子B 進行F- 檢定。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第580頁
14.88
辨識獨立樣本二因子變異數分析的要素
 辨識獨立樣本二因子變異數分析的要素
1. 問題目的:比較兩個或更多個母體(母體被定義為
兩個因子各水準的組合)。
2. 資料類型:區間。
3. 實驗設計:獨立樣本。
Copyright ©2010 Cengage Learning
第14章 變異數分析 第581頁
14.89