變異數分析 AN O VA

Download Report

Transcript 變異數分析 AN O VA

變異數分析
ANalysis Of VAriance
ANOVA
謝寶煖
台灣大學圖書資訊學系
[email protected]
自變數
依變數
統計分析方法
類別
類別
交叉表
類別
連續
t-test:1~2個樣本
ANOVA:2個(含)以上樣本
連續
連續
相關分析
連續
類別
迴歸分析
基本概念
 ANOVA的目的
檢定平均數之間是否有顯著差異
(significant differences)
 如果只比較兩組平均數,那麼ANOVA的結果
和獨立樣本 t檢定(比較兩個不同群體)或是
成對樣本t檢定(比較一組觀察值的兩個變數),
是一樣的

 T檢定可以用來檢驗兩個獨立樣本的平均數
差異是否達到所謂的「顯著水準」。那麼,
超過兩個以上的獨立樣本需要比較其間的
平均數差異時,該如何進行呢?
兩兩比較
 1923年R.A. Fisher創用了變異數分析(analysis
of variance, ANOVA)來檢驗兩個以上獨立樣
本的平均數間的差異情形是達到預設的顯著水
準
 是社會科學研究最常用的統計分析方法之一

您是怎麼泡茶的?
牛奶加進茶裏?
茶加進牛奶裏?
淑女與下午茶




「把茶倒進牛奶中」和「把牛奶倒進茶中」,喝起來是不
一樣的?!
1920年代40歲的小鬍子Sir Ronald A. Fisher, (1890-1962,
英國統計學家)的實驗
The Design of Experiments, 1935
變異數分析(analysis of vairance)是在費雪的<作物收成變
化研究II>論文(1942)中首次出現




3種不同的人工肥料
10種馬鈴薯
4塊土地/土壤
<作物收成變化研究IV>共變分析(analysis of covariance)
為什麼叫ANOVA
 明明是比較平均數的統計程序,為什麼要
取名變異數分析(analysis of variance)

因為,事實上檢定平均數的統計顯著性時,我
們真正比較(或分析)的是變異數
( variances )
變異數的拆解
 同時處理多個平均數的比較時,主要原理
是將全體樣本在依變項的得分的變異情形,
就「源自於自變項影響的變異」和「源自
於誤差的變異」兩個部份分別計算。
 也就是把總變異量拆解成自變項效果(組
間效果)和誤差效果,兩個部份,再加以
比較。
Group 1
Observation 1
Observation 2
Observation 3
Mean
Sums of Squares (SS)
2
3
1
2
2
2
(2-2) + (3-2) + (1-2) =2
6
7
5
2
2
Overall Mean
Total Sums of Squares
total SS (28) 可以分成
兩部份
一為組內變異(withingroup variability)
(2+2=4)
二為平均數不同所造
成的變異 (28(2+2)=24).
Group 2
(2-4)2+ (3-4)2+ (14)2+ (6-4)2+ (7-4)2+
(5-4)2=28
6
2
4
28
MAIN EFFECT
SS
Effect
Error
24.0
4.0
df
MS
1
4
24.0
1.0
F
24.0
p
.008
SS Error and SS Effect
• the within-group variability (SS) is usually referred to
as Error variance. This term denotes the fact that we
cannot readily explain or account for it in the current
design.
• the SS Effect we can explain. Namely, it is due to the
differences in means between the groups. Put another
way, group membership explains this variability
because we know that it is due to the differences in
means.
ANOVA

comparison of the variance




between- groups variability (called Mean Square Effect,
or MSeffect)
within- group variability (called Mean Square Error, or
Mserror)
the null hypothesis:that there are no mean differences
between groups in the population
compare those two estimates of variance via the F test,
which tests whether the ratio of the two variance
estimates is significantly greater than 1.
T test vs. anova
Experimental Experimental
Group 1
Group 2
Males
Mean
2
3
1
2
Females
Mean


6
8
9
7
8
total variance

6
7
5
4
5
3
4




error (within-group)
variability
variability due to
experimental group
membership
variability due to gender
T test: experiment or gender
Anova: experiment x gender
interaction
Main effects, two-way interaction
Achievement- Achievementoriented
avoiders
Challenging Test
Easy Test
10
5
5
10
challenging tests make students work harder?
 achievement-oriented students work harder than
achievement- avoiders?
Main Effects
 challenging tests make only achievement-oriented
students work harder, while easy tests make only
achievement- avoiders work harder Interaction Effects

Higher order interactions
Females
Challenging Test
Easy Test
Males
Challenging Test
Easy Test
Achievementoriented
10
5
Achievementoriented
1
6
Achievementavoiders
5
10
Achievementavoiders
6
1
檢定平均數間之差異顯著性
 因自變項(類別變項)和水準(level)的多
寡,而有不同型式之平均數檢定
所謂「因子」指的是自變項
 因子內含的可能數值稱為水準(level)

 例如:「性別」是一個因子,有2個level,1代表男
生,2代表女生
 又如:「考試區域」為一個因子,有4個level,北區、
中區、南區、東區
變異數分析家族

自變項的多寡(因子數)



如果研究者所關的是一個自變項(類別變項)對依變
項平均數的影響時,所進行的是單因子變異數分析,
不管該因子的內含水準有多少個,仍舊稱為單因子變
異數分析(one way ANOVA)
如果研究者同時考慮兩個自變項(類別變項),檢定
平均數的差異,則稱為二因子變異數分析(two way
ANOVA)
如果研究者同時考慮多個自變項(類別變項),同時
檢定多個平均數的差異,則稱為多因子變異數分析
(factorial analysis of ANOVA)
變異數分析家族
 樣本設計
獨立樣本
 相依樣本

研究設計
自變項
變異數分析方法
單因子設計 one way ANOVA
獨立樣本
1個
One way ANOVA
相依樣本
1個
One way ANOVA
(配對樣本或重複量數)
完全獨立樣本
2個
two way ANOVA
完全相依樣本
2個
two way ANOVA
二因子設計 two way ANOVA
相依與獨立混合
1個獨立,1個相依
two way ANOVA mixed
design
多因子變異數分析
研究設計
自變項
變異數分析方法
多因子設計 Factorial ANOVA
完全獨立樣本
3個
3 way ANOVA
完全相依樣本
3個
3 way ANOVA
相依與獨立混合
多個獨立,1個相依
3 way ANOVA mixed
design
共變分析 ANCOVA
Analysis of Covariance
 研究者控制某一個連續變項,去除第三變項的混
淆效果,以了解自變項對特定連續變項的效果
 同樣考慮


自變項多寡(類別變項)



單因子
多因子
樣本設計


獨立
相依
研究設計
自變項
變異數分析方法
單因子共變設計 one way ANCOVA
獨立樣本
1個自變項
1個或多個共變項
One way ANCOVA
相依樣本
1個
1個或多個共變項
One way ANCOVA
(配對樣本或重複量數)
多因子共變設計 Factorial ANCOVA
完全獨立樣本
多個自變項
1個或多個共變項
factorial ANCOVA
完全相依樣本
多個自變項
1個或多個共變項
factorial ANCOVA
相依與獨立混合
1個自變項
1個或多個共變項
factorial ANCOVA
mixed design
多變量變異數分析,MANOVA
 Multivariate
analysis of variance
 依變項數目增加時
一個自變項(類別變項),單因子多變量分析
 多個自變項(類別變項),多因子多變量分析

研究設計
自變項
變異數分析方法
單因子多變量設計 one way MANOVA
獨立樣本
1個
One way MANOVA
相依樣本
1個
One way MANOVA
(配對樣本或重複量數)
二因子多變量設計 two way MANOVA
完全獨立樣本
2個
two way MANOVA
完全相依樣本
2個
two way MANOVA
研究設計
自變項
變異數分析方法
多因子多變量設計 Factorial MANOVA
完全獨立樣本
3個
Factorial MANOVA
完全相依樣本
3個
Factorial MANOVA
多變項共變分析 MANCOVA
 Multivariate Analysis
of Covariance
單因子變異數分析
one-Way ANOVA
單因子變異數分析
 檢定數個獨立群體之平均數是否相等的統
計方法
 單因子變異數分析(one-way ANOVA),
是指只有一個自變項的變異數分析。

例如:利用web、email、DM三種廣告方法分
析進行新產品的促銷,而分析三種廣告方法的
差異(response rate)
 廣告方法:自變項,操縱因素

例:甜甜圈在調理過程中,使用不同的食用油,是否
會使甜甜圈吸收不等量的油脂?

食用油:花生油、葵花油、豬油(類別)
 不飽和脂肪(花生油、葵花油)
 飽和脂肪(豬油)


油脂吸收量(連續)
例2:不同學域的學生對資訊素養目標之看法(Q10)

學域:人文、社會、自然、工程、醫學(5 level 類別)

資訊素養目標(量尺 連續)
單因子變異數分析

變異數分析所檢驗的虛無假設是:所有樣本所來
自之母群體之平均數都相等。

虛無假設: H0:1=2=3=……=k

對立假設: 1、2 、 3 、 …… 、 k
至少有一個不等

拒絕虛無假設,則表示對立假設可以成立,換句
話說,至少有一個平均數是和其他平均數有顯著
差異。至於顯著差異狀況到底存在於那些平均數
之間,這是變異數分析完成之後,需要進一步進
行事後追蹤的。
組間變異 vs. 組內變異

變異數分析的根據是將實驗處理中所獲得的資料的變異狀
況,分為兩個來源

組間的變化




組內的變化



Variance between/among groups的
組間變異數:組與組之間有系統差異,是可以用實驗處理效果來解釋
的
Web組與DM組對廣告效果的影響
Variance within groups
組內變異數:是個體之間的隨機差異,是與實驗處理無關的,而且事
實上一定會存在的,即使完全沒有做任何實驗處理,隨機取樣所得到
的組內單位個體之間仍然會有差異存在。
樣本組間變異數愈大大(相對於組內變異數),拒絕虛無假設的
機率也愈高。所以變異數分析是利用樣本組間與組內的變異數的
比值來做為拒絕虛無假設與否的根據。

Xij= +j+ij

每個觀察值Xij可分成3個來源

Xij :在第j組內的第I個人的資料數值

:所有觀察值Xij的總平均,代表共同擁有的部份

j:是Xij所在j組的平均數與全體平均數之差異部份,即j= j- ,
代表組與全體之間的平均數之差異量,一般通稱為特殊效果
(special effect)或是實驗處理效果( treatment effect),凡在該
組內的個體都有接受到此項效果。但是,並不是所有接受到該組
特殊效果的個體所得到的觀察值都完全相同,在同一組內的個體
仍有實驗處理效果所無法完全解釋的個別差異因素存在,即為第3
部分:
 ij:該組內的隨機個別差異,亦即Xij異於j的
部份,即ij = Xij - j
 因此,

Xij的總變異來源可以分割為兩部份:
各組平均數與總平均數之間的變異組內隨機差
異的變異
單因子ANOVA的類型
 獨立樣本
 相依樣本
 統計檢定時需考慮是否為平衡設計
平衡設計:各組觀察值均相等
 例:web、email、DM各找100位受試者

ANOVA的假設
 在線性模式中的ij為常態分配
殘差(residual )分配
 可用下列方式判斷殘差值是否為一常態分配中
所得之樣本

 將殘差值歸類,使用2適合度檢定
 SAS
PROC Univariate之plot和normal兩個選項
 各組之ij所來自之母群體中變異數均相等

變異數同質性檢定
 輕微至中等程度地違反常態分配假設並無
顯著影響,但會影響統計檢定力。
 在平衡設計中,變異數不同,也不會顯著
影響統計推論
 若樣本數目有顯著差別時,違反變異數同
質性的檢定,對實驗處理結果會有重大的
影響
單因子變異數分析
 程序1
分析 比較平均數法單因子變異數分析(oneway ANOV)
 單因子變異數分析

 程序2
分析一般線性模式單變量
 單因子變異數分析 +多因子變數分析、迴歸分
析、共變量分析

受試者間效應 項的檢定
依變數: DESIGN
來源
型 III 平方和
自由度
a
校正後的模式
234.930
16
截距
233422.636
1
GRADE1
234.930
16
誤差
26204.618
1814
總和
1623616.000
1831
校正後的總數
26439.548
1830
a. R 平方 = .009 (調過後的 R 平方 = .000)
平均平方和
14.683
233422.636
14.683
14.446
F 檢定
1.016
16158.551
1.016
顯著性
.435
.000
.435
上述ANOVA表顯示,檢定組別平均數之p-value=.435,因此
在=.05下不拒絕(接受)虛無假設,表示使用者的身份對
網站設計的評估的平均數並無顯著差異。
上述ANOVA表顯示,檢定組別平均數之p-value=.435,因此
在顯著水準為.05的情形下,顯著性為.435>.05,故不拒絕
虛無假設,表示使用者的身份對網站設計評估的並無顯著差
異。
學院 vs. 利用圖書館網站頻率
 分析比較平均數單因子變數分析
描述性統計量
利用圖書館網站頻率
文學院
理學院
工學院
農學院
社會科學院
管理學院
醫學院
公共衛生學院
電機資訊學院
法律學院
進修推廣部
其他
總和
個數
136
214
296
296
220
130
221
33
151
81
19
38
1835
平均數
1.91
2.02
2.08
1.99
2.22
2.38
2.15
1.91
2.11
2.20
2.32
1.74
2.09
標準差
.77
.76
.75
.72
.72
.65
.83
.84
.78
.75
.67
.86
.76
標準誤
6.64E-02
5.17E-02
4.36E-02
4.17E-02
4.82E-02
5.71E-02
5.56E-02
.15
6.34E-02
8.32E-02
.15
.14
1.78E-02
平均數的 95% 信賴區間
下界
上界
1.78
2.04
1.92
2.12
2.00
2.17
1.90
2.07
2.13
2.32
2.27
2.50
2.04
2.26
1.61
2.21
1.99
2.24
2.03
2.36
1.99
2.64
1.45
2.02
2.06
2.13
最小值
最大值
1
1
1
1
1
1
1
1
1
1
1
1
1
3
4
4
4
3
3
4
4
4
3
3
3
4
變異數同質性檢定
利用圖書館網站頻率
Levene 統計量 分子自由度
3.021
11
分母自由度
1823
顯著性
.001
變異數分析的每個組別都是取自常態母群體的獨立隨機樣
本。雖然資料應該是對稱的,但是變異數分析不受偏離常
態性的影響。但是各組別應該來自具相等變異數的母群體。
若要檢定這個設設,可使用 Levene 的變異數同質性檢定。
顯著,表示變異數不同質,後續Post-hoc 檢定時,應選擇
適當的分析程序
變異數分析
利用圖書館網站頻率
平方和
組間
32.330
組內
1031.921
總和
1064.251
自由度
11
1823
1834
平均平方和
2.939
.566
F 檢定
5.192
顯著性
.000
上述變異數分析表顯示,檢定組別平均數之F值為5.192, p值
為.000,因此在顯著水準為.05的情形下,顯著性為.000
<.05,故拒絕虛無假設,表示使用者的學院別對圖書館網站
利用頻率有顯著差異。
使用者的學院別對圖書館網站利用頻率有顯著差異
(F=5.192, df=11, p<.001)
顯著檢視平均數,了解變異來源
 Post-hoc
test
變異數同質:假設相同的變異數
 變異數不同質:未假設相同的變異數

Post-hoc test
 當變異數分析,判斷平均數之間的確存有
差異之後,post hoc 全距檢定和成對多重比
較可以決定到底是那些平均數不一樣。
全距檢定:判斷那些是等值平均數的均勻子集
 成對多重比較:檢定每對平均數之間的差異,
並且產生一個矩陣。 該矩陣以星號代表顯著不
同的組別平均數,其 alpha 水準為 .05。

Post-hoc多重比較檢定方法

Tukey



Bonferroni t procedure



是最誠實顯著性差異檢定
僅適用於各組樣本數均相等時
各組樣本數相等或不相等時,均可使用
又稱Dunn’s procedure
Scheffe檢驗法




極端保守,一般咸信,只要經過Scheffe法檢驗出的顯著效果,這
樣的效果一定存在。
社會科學的研究經常使用
各組樣本數相等或不相等時,均可使用
由於此法極度保守(統計檢定力極低),一般僅在比較數目龐大
時使用,若僅為二、三個平均數比較,使用Scheffe法來做檢驗並
非明智之舉
Post-hoc多重比較檢定方法
 Dunnett
事前比較法
 研究目的是要將各種不同的實驗處理組與控制
組做配對比較,例web、email、DM三種廣告
方法和控制組,若欲將控制組以外的三種廣告
方法兩兩比較

描述性統計量
利用圖書館網站頻率
文學院
理學院
工學院
農學院
社會科學院
管理學院
醫學院
公共衛生學院
電機資訊學院
法律學院
進修推廣部
其他
總和

個數
136
214
296
296
220
130
221
33
151
81
19
38
1835
平均數
1.91
2.02
2.08
1.99
2.22
2.38
2.15
1.91
2.11
2.20
2.32
1.74
2.09
標準差
.77
.76
.75
.72
.72
.65
.83
.84
.78
.75
.67
.86
.76
標準誤
6.64E-02
5.17E-02
4.36E-02
4.17E-02
4.82E-02
5.71E-02
5.56E-02
.15
6.34E-02
8.32E-02
.15
.14
1.78E-02
平均數的 95% 信賴區間
下界
上界
1.78
2.04
1.92
2.12
2.00
2.17
1.90
2.07
2.13
2.32
2.27
2.50
2.04
2.26
1.61
2.21
1.99
2.24
2.03
2.36
1.99
2.64
1.45
2.02
2.06
2.13
最小值
最大值
1
1
1
1
1
1
1
1
1
1
1
1
1
由事後檢定可知,文學院與社科院和管院有顯著
差異,到底差在那裏呢?由描述性統計量可知,
社科院和管院之平均數均比文院高,顯示社科院
和管院學生利用圖書館網站頻率顯著高於文院。
3
4
4
4
3
3
4
4
4
3
3
3
4
網
站
頻
率
平均數圖
2.6
2.4
2.2
2.0
1.8
1.6
他
其
院
部
廣
推
修
進
院
學
訊
學
律
法
院
學
生
資
機
電
衛
院
共
公
院
院
學
學
學
醫
理
管
科
院
會
社
院
學
農
學
工
院
院
學
理
學
文
學院別
ANOVA
多組類別變數與連續變數之平均數差異
 程序:分析比較平均數單因子變異數分析
選項:描述性統計量+變異數同質性檢定
 顯著事後檢定




視變異數同質性顯著與否,選用不同檢定方法
界定顯著組別
顯著描述統計量之平均數顯著趨勢
平均數有顯著差異差在那裏(事後檢定組別)
差多少(描述性統計)
ANOVA結果呈現
 如果只要呈現單一變項的分析,不需要製
作統計表,只要在正文中說明平均數、標
準差和ANOVA檢定結果即可。
 One-way ANOVA同時檢定多項自變項時,
始需製作表格
 “Play It Safe” Table
Degree of freedom
 Sums of squares
 Mean squares
 F ratios

Example 1

Independent variable




Dependent variable


Coworker program:由同事上3天課,加上手冊
Consultant program:由外聘講師上3天課,加上手冊
Self-program:給手冊自學3天
Job performance:7點量表,由員工上司評分
每組各40名員工
表中畫底線的部分,應該用斜體
受試者間效應 項的檢定
依變數: 利用圖書館頻率
來源
型 III 平方和
自由度
校正後的模式
9.885a
3
Intercept
3636.294
1
STATUS
9.885
3
誤差
970.957
1831
總和
9372.000
1835
校正後的總數
980.841
1834
a. R 平方 = .010 (調過後的 R 平方 = .008)
平均平方和
3.295
3636.294
3.295
.530
F 檢定
6.213
6857.210
6.213
顯著性
.000
.000
.000
Example 2

Independent variable





Coworker program:由同事上3天課,加上手冊
Consultant program:由外聘上3天課,加上手冊
Self-program:給手冊自學3天
每組各3000名員工
Dependent variable:7







Job performance:7點量表,由員工上司評分
Organizational commitment
Job commitment
Job satisfaction
Turnover intention
Job stress
Role ambiguity
先呈現平均數和標準差
彙整7項ANOVA檢
定
是”Play It Safe”
table
與前一張表之差
異在:省略自由
度一欄,與F值
合併呈現
彙整7項ANOVA檢
定
是”Play It Safe”
table
結合描述性統計與ANOVA F ratios