Transcript R 2

統計3-7
閻自安 講授
目錄
統計檢定表
基本假設
基本架構
檢定步驟
基本理念
SPSS操作
SPSS複習
SPSS練習
統計檢定表
檢定變項的相關 or 變項的差異?
檢定變項的相關
檢定變項的差異
接受多次測驗?
2個
以上X
分析
幾個變項?
2個
是
1個Y
2以上
迴歸
相關係數
t檢定 典型或因素
分析
幾個群體?
2個
2以上
相依樣本 相依樣本
ANOVA
t檢定
否
分析
幾個群體?
2個
2以上
獨立樣本 獨立樣本
ANOVA
t檢定
多元迴歸分析的適用
架構
分析
原有樣本400位學生
依變項
自變項
筆試成績
口試成績
連續變項
預測
多元迴歸
大一成績
連續變項
適用
兩個以上
X變項
來預測
一個Y變項
Y  b1 X 1  b2 X 2  a
Y  .704 X 1  .719 X 2  .548
得知某高中生
成績
預測其
大一成績
Y '  .704  2.8  .719  3.6  .548
多元迴歸分析的適用
架構
抽取樣本300位學生
依變項
自變項
數學成績
肢體測驗
連續變項
預測
節奏成績
連續變項
Y  b1 X 1  b2 X 2  a
Y '  .52 X 1  .74 X 2  .024
X2 預測係數較高
多元迴歸分析的適用
架構
抽取樣本300位學生
依變項
自變項
數學成績
肢體測驗
連續變項
預測
節奏成績
連續變項
Y  b1 X 1  b2 X 2  a
Y '  .52 X 1  .74 X 2  .024
X2 預測係數較高
多元迴歸分析的適用
架構
抽取樣本300位教師
自變項
依變項
工作投入
組織承諾
工作滿足
組織認同
預測
組織效能
連續變項
連續變項
看那個自變項最
能預測依變項?
迴歸方程式與迴歸係數
迴歸方程式的斜率與截距
簡單迴歸
之
方程式
Y   bX  a
b
cov( x, y )
sx
2
( X  X )(Y  Y )  XY   X  Y/n 


2
2   X 2 /n 
( X  X )
X

 

 Y  b X
a  Y  bX 
n
Y '  bX
b
 b
sx
sy
迴歸誤差
觀察值 Y = bX + a + e
迴歸方程式之預測值為 Y’ = bX + a
Y   b y.x X  a y . x
迴歸離均差
原始離均差
Xi
實際值-
預測值
誤差為兩者之差:e = Y - Y’
誤差
誤差=
迴歸解釋變異量(決定係數)
迴歸解釋變異量(R2)

用X去預測Y時的預測解釋力(自變項對於依變項的解釋力)

Y變項被X變項所削減的誤差百分比
R2
值
愈
大
e  (Yi  Y )  (Yi  Y )  Yi  Yi
SSt  (Yi  Y ) 2  (Y   Y ) 2  (Yi  Y ) 2  SSreg  SSe
SSe (Yi  Y ) 2 (Yi  Yi) 2
1



2
SSt
SSt (Yi  Y )
(Yi  Y ) 2
SSreg
SSe SS reg
R  1

SSt
SSt
2
SPSS
會算出來
迴
歸
方
程
式
的
解
釋
力
調整迴歸解釋變異量
R2 無法反應模型的複雜度(或簡效性)
簡效性( parsimony )問題

研究者為了提高模型的解釋力,
不斷的投入自變項,每增加一個自變項,
損失一個自由度,
最後模型中無關的自變項過多,自由度變項,
失去了簡效性
調整迴歸解釋變異量
調整後 R2 (adjusted R2)

為了處罰增加自變項所損失的簡效性,將自由度
的變化作為分子與分母項的除項加以控制,可以
反應因為自變項數目變動的簡效性損失的影響
SSe / dfe
SSe /( N  p  1)
adjR  1 
1
SSt / dft
SSt /( N  1)
2
SPSS
會算
出來

當自變項數目(p)越多,adjR2 越小

當樣本數越大,對於簡效性處罰的作用越不明顯
迴歸模型的F考驗
R2 的基本原理是變異數,因此對於R2的檢定
可利用F考驗來進行
F( p , N  p 1) 
MSreg
MSe

SSreg / dfreg
SSe / dfe

SSreg / p
SSe / N  p  1
變異來源
SS
df
MS
F
迴歸效果
SSr
p
SSr/dfr
MSr/MSe
誤差
SSe
N-p-1
SSe/dfe
SSt
N-1
全
體
SPSS
會算
出來
估計標準誤
預測誤差e是一個呈現常態分配的隨機變數,
平均數為0,標準差為se
估計標準誤的計量性質是標準差,因此可用以反應誤差
分配的離散情形

標準誤越大,估計誤差越大

標準誤越小,估計誤差越小
se 
估計標準誤

(Y  Y ) 2

N  k 1
SPSS
會算
出來
SSe
dfe
誤差變異的平方和除以自由度(N-k-1)的開方,亦即
F考驗當中的誤差均方(MSe)的開方
迴歸模型的t考驗
個別的迴歸係數 b 或 b 可以用以說明
預測變項對於依變項的解釋力
迴歸係數數值的統計意義需經過假設考驗來檢驗

R2 的顯著性考驗是迴歸分析的整體考驗(overall
test)

迴歸係數的考驗可視為事後考驗(post hoc test)
迴歸係數的考驗

H0:b = 0

利用t檢定,自由度為N-p-1:
b
t

sb
b
se2
SSx
SPSS
會算
出來
迴歸係數的區間估計
b係數為未標準化係數,用以反應自變項對於
依變項的影響程度
b係數可以得知自變項的變動在依變項的變動
情形
利用模型的迴歸係數標準誤,b係數的區間估
計可用來推估母數出現的範圍
利用b係數的95%信心估計區間是否涵蓋0,
來檢驗b係數是否顯著不等於0
(1   )CI  b  t( / 2, df ) sb
SPSS
會算
出來
SPSS複習
收入與教育的相關 (範例)
流程:
分析—迴歸方法—線性
將「教育」選入「自變數」欄位內
「收入」選入「依變數」欄位內
觀察:
R、R2、F值、 p值、b值、 a值、β值、t值、p值
SPSS操作
SPSS報表
模 式 摘要
模式
R
R 平方
1
.574 a
.330
a. 預測變數:(常數), 教育
調過後的
R 平方
.293
估計的標準誤
13489.4137
R=.574 R2=.330 33%解釋力
變 異 數分 析b
模式
1
平方和
迴歸
1.613E+09
殘差
3.275E+09
總和
4.888E+09
a. 預測變數:(常數), 教育
b. 依變數\:收入
自由度
1
18
19
平均平方和
1613105122
181964282
F 檢定
8.865
顯著性
.008 a
R=.574 R2=.330 33%解釋力
F=8.865 P<.05
SPSS報表
係 數a
未標準化係數
模式
B 之估計值
標準誤
1
(常數) -14240.369 18953.543
教育
4741.551
1592.510
a. 依變數\:收入
標準化係
數
Beta 分配
.574
t
-.751
2.977
β = .574
P<.05
Y’=.574 X 成立
顯著性
.462
.008
迴歸係數 B 的 95% 信賴
區間
下限
上限
-54060.285 25579.548
1395.812
8087.290
APA表格
迴歸分析摘要表
表4-4:教育程度預測收入之迴歸分析摘要表
變項
標準化
迴歸係數
T值
F值
R2
教育程度
.574
2.98**
8.87**
.33
基本假設
Y = bX + a
固定自變項假設(fixed variable)

特定自變數的特定數值應可以被重複獲得,然後得以
此一特定的 Xi 代入方程式而得到預測值。
線性關係假設(linear relationship)

當 X 與 Y 的關係被納入研究之後,迴歸分析必須
建立在變項之間具有線性關係的假設上。
常態性假設(normality)

迴歸分析中的所有觀察值Y 是一個常態分配,即
Y 來自於一個呈常態分配的母群體。
基本假設
Cov (ei , ej)
=0
誤差獨立性假設(independence)

誤差項除了應呈隨機化的常態分配,不同的X 所產生
的誤差之間應相互獨立,無相關存在,也就是無自我
相關(non-autocorrelation)。
誤差等分散性假設(homoscedasticity)多元共
線性假設

V (ej) = σ2
特定X 水準的誤差項,除了應呈隨機化的常態分配,
且其變異量應相等,稱為誤差等分散性
等分散性假設圖示
Xa條件下的
Y變異量=
Xb條件下的
Y變異量
多元迴歸分析之步驟
迴歸分析公式
最佳配適線
兩個自變項為例
Y   b1 X 1  b2 X 2  ...  a
Z y  b1 X 1  b 2 X 2  ...
'
例如:
創新接受度=β1善用科技 + β2包容錯誤 + …
多元迴歸分析之步驟
選擇運算方式
1.強迫進入法(enter)
如果分階段投入,
則稱為階層式迴歸
(Hierarchical Regression)
所有X變項皆投入,以決定變項的重要性排序
適合X變項已有理論基礎。
2.逐步迴歸法(stepwise)
先「順向選擇」再「反向剔除」,留下重要變項
適合探索性研究(理論尚在探究中)
多元迴歸分析之步驟
選擇運算方式
2-1.順向選擇法(forward)
逐步迴歸
=
順向與反向交
互使用
首先,選X變項與Y變項最大相關者進入模式,
接者,再選取其他X變項與Y變項淨相關最大者進
入,其餘依此類推。
2-2.反向剔除法( backward)
所有X變項皆進入模式,再逐一將貢獻最小的
X變項剔除,直到所有X變項達顯著標準為止(
SPSS內定 F=2.71 P=0.1)
多元迴歸分析之步驟
Y=β1X1+β2X2+…
X1與X2相關太大
則共線性嚴重
檢查多元共線性問題
1.共線性(Collinarity)
X變項之間相關太大,造成迴歸分析嚴重誤差。
X1
X1
X2
Y
X3
有多元共線性
X2
Y
X3
沒有多元共線性
多元迴歸分析之步驟
檢查多元共線性問題
2.判斷方式:
R2愈大,1-R2愈小
共線性愈嚴重
2-1.容忍度(tolerance):1 - R2 (R:X變項與其他
變項的相關),容忍度太小或0代表共線性嚴重。
2-2.變異數膨脹因素(Variance Inflation Factor, VIF)
VIF=1/(1-R2),VIF值愈大,共線性愈嚴重。
2-3.條件指標(Condition Index, CI):
CI值愈大,共線性愈嚴重。
CI<30尚可,CI>100嚴重
CI 
max
i
SPSS
會算出
多元迴歸分析之步驟
模式之F檢定、係數之t檢定
觀察β值之顯著性,並做決定
P<.05 拒絕 H0
接受 H1:β ≠ 0
P>.05 接受 H0
β=0
迴歸方程式成立:
Y = .683 X1+.525X2+…..
觀察哪個X變項
最能預測Y?
做出結論與建議
SPSS操作
數學成就之迴歸預測 (範例)
操作(強迫進入法):
分析—迴歸方法—線性—強迫進入法
X—數學焦慮、投入動機、數學態度
Y—數學成就
統計量—共線性診斷
觀察
R、R2、F值、β值、t值、P值、VIF
SPSS操作
SPSS操作
SPSS報表
模 式 摘要
調過後的
模式
R
R 平方
R 平方
估計的標準誤
1
.417 a
.174
.166
9.67
a. 預測變數:(常數), 投入動機, 數學焦慮, 數學態度
變 異 數分 析b
模式
1
平方和
自由度
平均平方和
迴歸
5824.921
3
1941.640
殘差
27663.116
296
93.456
總和
33488.037
299
a. 預測變數:(常數), 投入動機, 數學焦慮, 數學態度
b. 依變數\:數學成就
F 檢定
20.776
顯著性
.000 a
迴
歸
模
式
達
顯
著
SPSS報表
係數a
未標準化係數
B 之估計值 標準誤
模式
(常數)
1
5.602
2.339
數學焦慮 -9.958E-03
.028
數學態度
.044
.268
投入動機
.088
-.104
a. 依變數\:數學成就
標準化係
數
Beta 分配
數學態度預測力高
-.022
.443
-.076
t
.418
-.360
6.147
-1.190
顯著性
.677
.719
.000
.235
共線性統計量
VIF
允差
.719
.537
.680
1.392
1.862
1.471
容忍度不宜接近0
VIF愈小愈好
SPSS報表
共線性診斷a
模式
1
維度
特徵值 條件指標
1
3.884
1.000
2
9.377E-02
6.436
3
1.600E-02
15.580
4
6.632E-03
24.199
a. 依變數\:數學成就
(常數)
.00
.00
.08
.92
變異數比例
數學焦慮 數學態度 投入動機
.00
.00
.00
.39
.03
.04
.03
.24
.96
.58
.73
.00
多元共線性CI指標<30
APA表格
多元迴歸分析摘要表
有變項未達顯著
可試--逐步迴歸
表1:三種變項預測數學成就之迴歸分析摘要表
變項
標準化迴歸
係數
T值
數學焦慮
-.02
-3.6
數學態度
.44
6.15***
投入動機
-.076
-1.19
F值
R2
VIF
1.39
20.78***
.17 1.86
1.47
SPSS操作
數學成就之迴歸預測 (範例)
操作(逐步迴歸法):
分析—迴歸方法—線性—逐步迴歸法
X—數學焦慮、投入動機、數學態度
Y—數學成就
統計量—R2改變量、共線性診斷
觀察
R、R2、F值、淨F值、β值、t值、P值、VIF
SPSS操作
SPSS報表
僅數學態度保留下來
選 入 / 刪 除 的 變 數a
模式
1
選入的變數
刪除的變數
數學態度
.
方法
逐步迴歸
分析法
(準則\:F選入的機
率 <= .05 0
, F-刪除
的機率 >=
.1 00 )。
a. 依變數\:數學成就
淨 F 改變量
模式摘要
調過後的
模式
R
R 平方
R 平方 估計的標準誤 R 平方改變量
a
1
.412
.170
.167
9.66
.170
a. 預測變數:(常數), 數學態度
變更統計量
F 改變 分子自由度 分母自由度 顯著性 F 改變
60.877
1
298
.000
SPSS報表
迴歸模式達顯著
變 異 數分 析b
模式
1
平方和
自由度
迴歸
5680.605
1
殘差
27807.431
298
總和
33488.037
299
a. 預測變數:(常數), 數學態度
b. 依變數\:數學成就
平均平方和
5680.605
93.314
F 檢定
60.877
顯著性
.000 a
容忍度不宜接近0
VIF愈小愈好
係數a
未標準化係數
模式
B 之估計值 標準誤
1
(常數)
-.668
3.302
數學態度
.249
.032
a. 依變數\:數學成就
標準化係
數
Beta 分配
.412
t
-.202
7.802
數學態度預測力高
顯著性
.840
.000
共線性統計量
允差
VIF
1.000
1.000
SPSS報表
共 線 性診 斷a
模式
1
維度
特徵值
1
1.986
2
1.437E-02
a. 依變數\:數學成就
條件指標
1.000
11.755
多元共線性CI指標<30
變異數比例
(常數)
數學態度
.01
.01
.99
.99
APA表格
多元迴歸分析摘要表
表1:三種變項預測數學成就之逐步迴歸分析摘要表
變項
標準化迴歸
係數
T值
F值
R2
VIF
數學態度
.412
7.80***
60.88***
.17
1.0
比較一下:
與強迫進入法有何差異?
SPSS練習
音樂智慧問卷 (範例)
操作(強迫進入法):
分析—迴歸方法—線性—強迫進入法
X—六種音樂智慧
Y—音樂喜好
統計量—共線性診斷
觀察:
R、R2、F值、淨F值、β值、t值、P值、VIF
SPSS報表
模 式 摘要
調過後的
模式
R
R 平方
R 平方
估計的標準誤
1
.857 a
.734
.733
.4040
a. 預測變數:(常數), 創作, 曲調, 演奏唱, 節奏, 音感
變 異 數分 析b
模式
1
平方和
自由度
平均平方和
迴歸
419.053
5
83.811
殘差
151.477
928
.163
總和
570.530
933
a. 預測變數:(常數), 創作, 曲調, 演奏唱, 節奏, 音感
b. 依變數\:喜好
F 檢定
513.452
顯著性
.000 a
迴
歸
模
式
達
顯
著
SPSS報表
係數a
未標準化係數
模式
B 之估計值 標準誤
1
(常數)
.411
.072
節奏
.177
.029
曲調
.473
.027
演奏唱 7.115E-02
.024
音感
6.823E-02
.029
創作
.163
.030
a. 依變數\:喜好
標準化係
數
Beta 分配
曲調智慧預測力高
.169
.471
.083
.068
.173
t
5.693
6.127
17.843
2.913
2.382
5.393
顯著性
.000
.000
.000
.004
.017
.000
共線性統計量
允差
VIF
.374
.411
.351
.347
.279
2.674
2.435
2.849
2.878
3.580
容忍度不宜接近0
VIF愈小愈好
SPSS報表
共線性診斷a
模式
1
維度 特徵值 條件指標
1
5.890
1.000
2
4.799E-02
11.078
3
2.195E-02
16.381
4
1.491E-02
19.877
5
1.293E-02
21.346
6
1.235E-02
21.840
a. 依變數\:喜好
(常數)
.00
.38
.18
.16
.27
.01
節奏
.00
.00
.31
.19
.15
.35
變異數比例
曲調
演奏唱
.00
.00
.01
.23
.00
.42
.04
.34
.41
.01
.54
.00
多元共線性CI指標<30
音感
.00
.00
.03
.65
.00
.32
創作
.00
.03
.15
.02
.64
.17
APA表格
多元迴歸分析摘要表
表1:五種音樂智慧預測音樂喜好之迴歸分析摘要表
變項
標準化迴歸
係數
T值
節奏
.17
6.13***
2.67
曲調
.47
17.84***
2.44
演奏唱
.08
2.91**
513.45*** .73 2.85
音感
.07
2.38*
2.88
創作
.17
5.39***
3.58
F值
R2
VIF
多元迴歸分析
• 試試看
逐步迴歸分析的
結果為何?
模式摘要
變更統計量
調過後的
R 平方 估計的標準誤 R 平方改變量 F 改變 分子自由度 分母自由度 顯著性 F 改變
.652
.4611
.653 1751.012
1
932
.000
.714
.4183
.062 201.908
1
931
.000
.727
.4082
.014 47.200
1
930
.000
.732
.4050
.005 15.817
1
929
.000
.733
.4040
.002
5.674
1
928
.017
模式
R
R 平方
1
.808 a
.653
2
.845 b
.715
3
.853 c
.728
4
.856 d
.733
5
.857 e
.734
a. 預測變數:(常數), 曲調
b. 預測變數:(常數), 曲調, 創作
c. 預測變數:(常數), 曲調, 創作, 節奏
d. 預測變數:(常數), 曲調, 創作, 節奏, 演奏唱
e. 預測變數:(常數), 曲調, 創作, 節奏, 演奏唱, 音感
每增加一個變項
的R2 增加量
係 數a
未標準化係數
模式
B 之估計值
標準誤
1
(常數)
.617
.077
曲調
.812
.019
2
(常數)
.541
.070
曲調
.567
.025
創作
.330
.023
3
(常數)
.430
.070
曲調
.511
.025
創作
.231
.027
節奏
.199
.029
4
(常數)
.453
.070
曲調
.488
.026
創作
.179
.030
節奏
.184
.029
演奏唱
9.134E -02
.023
5
(常數)
.411
.072
曲調
.473
.027
創作
.163
.030
節奏
.177
.029
演奏唱
7.115E -02
.024
音感
6.823E -02
.029
a. 依變數\:喜好
曲調智慧預測力高
標準化係
數
Beta 分配
.808
.564
.348
.508
.244
.190
.486
.190
.176
.107
.471
.173
.169
.083
.068
t
7.991
41.845
7.702
23.002
14.209
6.108
20.109
8.607
6.870
6.465
18.929
6.065
6.375
3.977
5.693
17.843
5.393
6.127
2.913
2.382
顯著性
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.000
.004
.017
共線性統計量
允差
VIF
1.000
1.000
.510
.510
1.961
1.961
.457
.363
.384
2.186
2.751
2.607
.436
.294
.378
.399
2.294
3.401
2.649
2.506
.411
.279
.374
.351
.347
2.435
3.580
2.674
2.849
2.878
APA表格
多元迴歸分析摘要表
表1:五種音樂智慧預測音樂喜好之逐步迴歸分析摘要表
曲
調
智
慧
預
測
力
高
變項
標準化迴歸
係數
T值
曲調
.47
17.84***
2.44
創作
.17
5.39***
3.58
節奏
.169
6.13***
513.45*** .73 2.67
演奏唱
.08
2.91**
2.85
音感
.07
2.38*
2.88
F值
R2
VIF
SPSS作業
學習經驗問卷 (範例)
案例(採用逐步迴歸分析):
1.自變項—壓力懼怕、情緒擔憂、考試焦慮、課堂焦慮
學習信心、有用性、成功態度、探究動機
工作投入、自我投入(10個)
2.依變項—數學成績
考驗:R、R2、F值、淨F值、β值、t值、P值、VIF
多元迴歸分析
• 多元迴歸分析的自變項與依變
項為何種量尺的資料?
• 自變項幾個?依變項幾個?
• 何謂多元共線性?
延伸閱讀資料
余民寧(1995)。心裡與教育統計學。
台北:三民。
吳明隆、涂金堂(2005)。SPSS與統計應用分析 ,
第11章。台北:五南。
預告下星期課程???