用迴歸進行變異數分析 - Sites@Duke

Download Report

Transcript 用迴歸進行變異數分析 - Sites@Duke

主題八、複迴歸-類別自變數
主講人
陳陸輝 特聘研究員兼主任
政治大學選舉研究中心
美國密西根州立大學博士
1
2015/4/13
政治學研究方法班
主題
前言
一、用迴歸進行變異數分析
二、包含數字與類別自變數的複迴歸分析一
三、比較平均數與比較迴歸線
四、包含數字與類別自變數的複迴歸分析
五、包含交互作用的複迴歸分析
六、包含數字與類別自變數的複迴歸模型之推論
七、結論
2
政治學研究方法班
2015/4/13
前言
上一次的主題在說明運用迴歸進行的控制與比較
本週主要在說明迴歸與變異數分析的相同之處
進一步說明模型中放入類別變數的方法
以及同時放入兩種類別變數
或是類別變數與數字變數的方式
甚至討論到交互作用
3
政治學研究方法班
2015/4/13
一、用迴歸進行變異數分析
變異數分析(analysis of variance, ANOVA):
當我們要對幾組(組別>2)平均數進行比較
稱為變異數分析
例如:
比較不同政黨認同者(泛藍、中立、泛綠)
在政治信任上是否具有顯著差異
4
政治學研究方法班
2015/4/13
變異數分析:三組平均數的比較圖
5
政治學研究方法班
2015/4/13
變異數分析組間差的各種事後檢定



6
Tukey’s Honestly Significant Difference
(HSD) test
Scheffe method
LSD(Least Significant Difference)
政治學研究方法班
2015/4/13
對執政黨好惡與政治信任
研究問題:
從政治社會化的角度出發,本研究認為:民眾對於執
政黨的好惡,會影響其政治信任。
研究假設:
民眾的政治信任,會因為自己黨派立場而變化。當自
己認同政黨執政後,政治信任立刻提升。本研究假
設:泛藍認同者的政治信任最高,而泛綠認同者的
政治信任最低。
統計虛無假設: H :     
0
1
2
3
統計對立假設: H :    OR   OR  
a
7
1
政治學研究方法班
2
1
3
2
3
2015/4/13
ANOVA的SPSS操作
運用SPSS2009T82MRegrssion…語法
建構政治信任指標
重新編碼政黨偏好(N1B)成為泛綠、無傾向、泛藍
Analyze Compare Means One-Way ANOVA
Dependent(依變數):D7NS4
Factor(因子):N1BN
Post Hoc(事後比較):LSD、Scheffe、Tukey
Options(選項):Descriptive
8
政治學研究方法班
2015/4/13
單因子變異數分析結果
F  test : H 0 : 1  2  3
表一、不同政黨傾向政治信任差異的單因子變異數分析
平均數
標準差
樣本數
F 檢定結果
1.傾向泛綠
2.03
0.46
539
2.無傾向
2.15
0.43
616 F2,1844  56.84
3.傾向泛藍
2.29
0.41
693
0.44
1847
小計
2.17
資料來源:游清鑫,(2009)。
Scheffe 比較
3>2;
3>1:
p<0.001
2>1
說明:政治信任係由四個變數建構而成,詳細情況請參閱附錄。
9
政治學研究方法班
2015/4/13
政黨認同與政治信任的模型解釋
統計解釋:
從表一中可以發現:不同政黨偏好的民眾,在
政治信任上具有顯著差異。
10
政治學研究方法班
2015/4/13
政黨偏好與政治信任的模型解釋
研究論文:本研究運用四個變數建構的政治信
任量表,並進一步分析不同政黨偏好在政治
信任上的差異。表一中發現:政黨偏好不同
的民眾間,其政治信任具有顯著差異。進一
步檢視發現:泛藍認同者其政治信任最高,
達到2.29,顯著高於無政黨偏好的2.15,也高
於泛綠認同者的2.03。無傾向的民眾政治支
持的平均分數,也顯著高於泛綠的認同者。
從政治信任的理論觀察,……
11
政治學研究方法班
2015/4/13
一、用迴歸進行變異數分析
Y   0  1 Z1   2 Z 2   (12.1)
Z1=1 and Z2=0:認同泛藍
Z1=0 and Z2=1:無政黨傾向
Z1=0 and Z2=0:認同泛綠
12
Z1
Z2
認同泛藍
1
0
無傾向
0
1
認同泛綠
0
0
政治學研究方法班
2015/4/13
虛擬變數(dummy variable)
在統計分析中,我們將原先的類別資料重新編碼
以1代表具有特定屬性,0代表沒有
通常類別變數原先的類別數目減1(G-1)
是可以重新編碼的最多虛擬變數數目
因為政黨認同只有三類
所以可重新編碼成(至多)兩個虛擬變數
Why?
13
政治學研究方法班
2015/4/13
虛擬變數、F檢定與迴歸模型
Y   0  1 Z1   2 Z 2   (12.1)
當Z1=0 and Z2=0時(12.1)為 Y   0  1 * 0   2 * 0   0
當Z1=1 and Z2=0時(12.1)為 Y   0  1 *1   2 * 0   0  1
當Z1=0 and Z2=1時(12.1)為 Y   0  1 * 0   2 *1   0   2
F  test : H 0 : 1  2  3
可否找出μi與βi之間的對應關係?
μ1=?; μ2=?; μ3=?
14
政治學研究方法班
2015/4/13
各組平均數與迴歸係數的解釋
Y   0  1 Z1   2 Z 2   (12.1)
15
Z1
Z2
認同泛藍
1
0
無傾向
0
1
認同泛綠
0
0
政治學研究方法班
Mean of Y
1   0  1
βi之解釋
1  1   3
2  0  2
3   0
 2   2  3
2015/4/13
SPSS的操作
政黨認同需重新編碼為兩個虛擬變數(dummy
variable)
 編碼要訣:將分數最低者當作對照組
 語法
Recode N1BN (1 2=0) (3=1) (ELSE=SYSMIS) INTO
N1BNB/ N1BN (1 3=0) (2=1) (ELSE=SYSMIS)
INTO N1BNI.

16
政治學研究方法班
2015/4/13
迴歸模型的操作
Analyze Regression Linear
先放入依變數:D7NS4
自變數:N1BNK、N1BNI
17
政治學研究方法班
2015/4/13
SPSS輸出結果
18
政治學研究方法班
2015/4/13
政黨偏好與政治信任的因素
研究問題:
從政治社會化的角度出發,本研究認為:民眾
對於政黨的偏好,會影響其政治信任。
研究假設:參考前面所述
統計虛無假設:
統計對立假設:
19
政治學研究方法班
2015/4/13
對執政黨好惡與政治信任的估計結果
20
政治學研究方法班
2015/4/13
政治信任的解釋模型解釋
統計解釋:
從表一中可以發現:民眾的政黨偏好,對其政
治信任具有顯著影響力。
21
政治學研究方法班
2015/4/13
政治信任的模型解釋
研究論文:
本研究運用四個變數建構的政治信任量表,並
進一步分析不同政黨偏好民眾在其政治信任
上是否具備顯著差異。表二中發現:相對於
泛綠政黨者,泛藍認同者的信任分數高出
0.266個單位,且兩者差異達到統計上的顯著
程度。此外,無偏好者的政治信任,也高出
泛綠認同者達0.126個單位。此一趨勢與2004
年的發現不同,顯示政黨輪替對於不同政黨
偏好民眾的政治信任,具有重要影響。
22
政治學研究方法班
2015/4/13
迴歸估計結果與ANOVA比較
Z1
Z2
認同泛藍
1
0
無傾向
0
1
認同泛綠
0
0
Mean of Y
1   0  1
βi之解釋
1  1   3
2  0  2
3   0
 2   2  3
表一、不同政黨傾向政治信任差異的單因子變異數分析
平均數
標準差
樣本數
F 檢定結果
1.傾向泛綠
2.03
0.46
539
2.無傾向
2.15
0.43
616 F2,1844  56.84
3.傾向泛藍
2.29
0.41
693
0.44
1847
小計
2.17
資料來源:游清鑫,(2009)。
Scheffe 比較
3>2;
3>1:
p<0.001
2>1
說明:政治信任係由四個變數建構而成,詳細情況請參閱附錄。
23
政治學研究方法班
2015/4/13
用迴歸估計還是用ANOVA?哪个好?
1.ANOVA的分析,迴歸都可以涵蓋
2.迴歸還可以同時包括類別與數字自變數:用得更
多
24
政治學研究方法班
2015/4/13
二、結合類別與數字自變數的複迴歸分析一
依變數:政治信任
主要解釋變數群
 社會化:政黨認同
 執政者表現:對馬英九的好惡
25
政治學研究方法班
2015/4/13
統計分析結果
26
政治學研究方法班
2015/4/13
三、比較平均數與比較迴歸線:例一
房屋售價---Y
房屋大小---X
是否新成屋---Z
27
政治學研究方法班
2015/4/13
三、比較平均數與比較迴歸線:例二
28
政治學研究方法班
2015/4/13
四、包含數字與類別自變數的複迴歸分析
在複迴歸中
自變數可以同時使用類別變數與數字變數
對馬英九的滿意度
=對國民黨喜好度(X1)與性別(G1)
Y   0  1 X 1   2 G1   (12.4)
29
政治學研究方法班
2015/4/13
解釋對馬英九的喜好度:黨性還是女性
Y   0  1 X 1   2 G1   (12.4)
M od e l Su m m ar y
Adjusted R
Std. Error of
Model
R
R Square
Square
the Estimate
a
1
.711
.505
.504
1.84896
a. Predictors: (Constant), LIKEKMT 對國民黨喜好程度,
GENDER 性別
Co e f f i ci en t sa
Model
1
Unstandardized
Coefficients
B
Std. Error
2.106
.108
.232
.090
(Constant)
GENDER 性別
LIKEKMT 對國
.733
.018
民黨喜好程度
a. Depende nt Variable: LIKEMA 對馬英九喜好度
30
Standardized
Coefficients
Beta
.044
t
19.562
2.587
Sig.
.000
.010
.707
41.475
.000
Yˆ  2.11  0.73 * X 1  0.23 * G1 (12.4)
政治學研究方法班
2015/4/13
解釋對馬英九的喜好度:黨性還是女性
Yˆ  2.11  0.73 * X 1  0.23 * G1 (12.4)
女性: Yˆ  2.11  0.73 * X 1  0.23 *1  2.34  0.73 X 1
男性: Yˆ  2.11  0.73 * X 1  0.23 * 0  2.11  0.73 X 1
31
政治學研究方法班
2015/4/13
五、包含交互作用的複迴歸分析
Y   0  1 X 1   2 G1   3 X 1 *G1   (12.5)
32
政治學研究方法班
2015/4/13
五、包含交互作用的複迴歸分析
Y   0  1 X 1   2 G1   3 X 1 *G1   (12.5)
Yˆ  2.35  0.68 * X 1  0.30 * G1  0.10 * X 1 * G1 (12.5)
女性: Yˆ  2.35  0.68 * X 1  0.30 *1  0.10 * X 1 *1  2.05  0.78 X 1
男性: Yˆ  2.35  0.68 * X 1  0.30 * 0  0.10 * X 1 * 0  2.35  0.68 X 1
33
政治學研究方法班
2015/4/13
五、包含交互作用的複迴歸分析
34
政治學研究方法班
2015/4/13
六、複迴歸模型之推論
1.模型比較
Fdf 1,df 2
( R  R ) / df1

2
(1  Rc ) / df2
2
c
2
r
df1:完整模型中增加的解釋變數的數目
df2:完整模型中的n-(k+1)
2.控制特定變數後對自變數的解釋
35
政治學研究方法班
2015/4/13
七、結論
1.迴歸與變異數分析
2.虛擬變數
3.比較不同「組別」間的差異
4.加入交互作用項目
5.當理論與模型相遇
36
政治學研究方法班
2015/4/13