Transcript R 2
統計3-7 閻自安 講授 目錄 統計檢定表 基本假設 基本架構 檢定步驟 基本理念 SPSS操作 SPSS複習 SPSS練習 統計檢定表 檢定變項的相關 or 變項的差異? 檢定變項的相關 檢定變項的差異 接受多次測驗? 2個 以上X 分析 幾個變項? 2個 是 1個Y 2以上 迴歸 相關係數 t檢定 典型或因素 分析 幾個群體? 2個 2以上 相依樣本 相依樣本 ANOVA t檢定 否 分析 幾個群體? 2個 2以上 獨立樣本 獨立樣本 ANOVA t檢定 多元迴歸分析的適用 架構 分析 原有樣本400位學生 依變項 自變項 筆試成績 口試成績 連續變項 預測 多元迴歸 大一成績 連續變項 適用 兩個以上 X變項 來預測 一個Y變項 Y b1 X 1 b2 X 2 a Y .704 X 1 .719 X 2 .548 得知某高中生 成績 預測其 大一成績 Y ' .704 2.8 .719 3.6 .548 多元迴歸分析的適用 架構 抽取樣本300位學生 依變項 自變項 數學成績 肢體測驗 連續變項 預測 節奏成績 連續變項 Y b1 X 1 b2 X 2 a Y ' .52 X 1 .74 X 2 .024 X2 預測係數較高 多元迴歸分析的適用 架構 抽取樣本300位學生 依變項 自變項 數學成績 肢體測驗 連續變項 預測 節奏成績 連續變項 Y b1 X 1 b2 X 2 a Y ' .52 X 1 .74 X 2 .024 X2 預測係數較高 多元迴歸分析的適用 架構 抽取樣本300位教師 自變項 依變項 工作投入 組織承諾 工作滿足 組織認同 預測 組織效能 連續變項 連續變項 看那個自變項最 能預測依變項? 迴歸方程式與迴歸係數 迴歸方程式的斜率與截距 簡單迴歸 之 方程式 Y bX a b cov( x, y ) sx 2 ( X X )(Y Y ) XY X Y/n 2 2 X 2 /n ( X X ) X Y b X a Y bX n Y ' bX b b sx sy 迴歸誤差 觀察值 Y = bX + a + e 迴歸方程式之預測值為 Y’ = bX + a Y b y.x X a y . x 迴歸離均差 原始離均差 Xi 實際值- 預測值 誤差為兩者之差:e = Y - Y’ 誤差 誤差= 迴歸解釋變異量(決定係數) 迴歸解釋變異量(R2) 用X去預測Y時的預測解釋力(自變項對於依變項的解釋力) Y變項被X變項所削減的誤差百分比 R2 值 愈 大 e (Yi Y ) (Yi Y ) Yi Yi SSt (Yi Y ) 2 (Y Y ) 2 (Yi Y ) 2 SSreg SSe SSe (Yi Y ) 2 (Yi Yi) 2 1 2 SSt SSt (Yi Y ) (Yi Y ) 2 SSreg SSe SS reg R 1 SSt SSt 2 SPSS 會算出來 迴 歸 方 程 式 的 解 釋 力 調整迴歸解釋變異量 R2 無法反應模型的複雜度(或簡效性) 簡效性( parsimony )問題 研究者為了提高模型的解釋力, 不斷的投入自變項,每增加一個自變項, 損失一個自由度, 最後模型中無關的自變項過多,自由度變項, 失去了簡效性 調整迴歸解釋變異量 調整後 R2 (adjusted R2) 為了處罰增加自變項所損失的簡效性,將自由度 的變化作為分子與分母項的除項加以控制,可以 反應因為自變項數目變動的簡效性損失的影響 SSe / dfe SSe /( N p 1) adjR 1 1 SSt / dft SSt /( N 1) 2 SPSS 會算 出來 當自變項數目(p)越多,adjR2 越小 當樣本數越大,對於簡效性處罰的作用越不明顯 迴歸模型的F考驗 R2 的基本原理是變異數,因此對於R2的檢定 可利用F考驗來進行 F( p , N p 1) MSreg MSe SSreg / dfreg SSe / dfe SSreg / p SSe / N p 1 變異來源 SS df MS F 迴歸效果 SSr p SSr/dfr MSr/MSe 誤差 SSe N-p-1 SSe/dfe SSt N-1 全 體 SPSS 會算 出來 估計標準誤 預測誤差e是一個呈現常態分配的隨機變數, 平均數為0,標準差為se 估計標準誤的計量性質是標準差,因此可用以反應誤差 分配的離散情形 標準誤越大,估計誤差越大 標準誤越小,估計誤差越小 se 估計標準誤 (Y Y ) 2 N k 1 SPSS 會算 出來 SSe dfe 誤差變異的平方和除以自由度(N-k-1)的開方,亦即 F考驗當中的誤差均方(MSe)的開方 迴歸模型的t考驗 個別的迴歸係數 b 或 b 可以用以說明 預測變項對於依變項的解釋力 迴歸係數數值的統計意義需經過假設考驗來檢驗 R2 的顯著性考驗是迴歸分析的整體考驗(overall test) 迴歸係數的考驗可視為事後考驗(post hoc test) 迴歸係數的考驗 H0:b = 0 利用t檢定,自由度為N-p-1: b t sb b se2 SSx SPSS 會算 出來 迴歸係數的區間估計 b係數為未標準化係數,用以反應自變項對於 依變項的影響程度 b係數可以得知自變項的變動在依變項的變動 情形 利用模型的迴歸係數標準誤,b係數的區間估 計可用來推估母數出現的範圍 利用b係數的95%信心估計區間是否涵蓋0, 來檢驗b係數是否顯著不等於0 (1 )CI b t( / 2, df ) sb SPSS 會算 出來 SPSS複習 收入與教育的相關 (範例) 流程: 分析—迴歸方法—線性 將「教育」選入「自變數」欄位內 「收入」選入「依變數」欄位內 觀察: R、R2、F值、 p值、b值、 a值、β值、t值、p值 SPSS操作 SPSS報表 模 式 摘要 模式 R R 平方 1 .574 a .330 a. 預測變數:(常數), 教育 調過後的 R 平方 .293 估計的標準誤 13489.4137 R=.574 R2=.330 33%解釋力 變 異 數分 析b 模式 1 平方和 迴歸 1.613E+09 殘差 3.275E+09 總和 4.888E+09 a. 預測變數:(常數), 教育 b. 依變數\:收入 自由度 1 18 19 平均平方和 1613105122 181964282 F 檢定 8.865 顯著性 .008 a R=.574 R2=.330 33%解釋力 F=8.865 P<.05 SPSS報表 係 數a 未標準化係數 模式 B 之估計值 標準誤 1 (常數) -14240.369 18953.543 教育 4741.551 1592.510 a. 依變數\:收入 標準化係 數 Beta 分配 .574 t -.751 2.977 β = .574 P<.05 Y’=.574 X 成立 顯著性 .462 .008 迴歸係數 B 的 95% 信賴 區間 下限 上限 -54060.285 25579.548 1395.812 8087.290 APA表格 迴歸分析摘要表 表4-4:教育程度預測收入之迴歸分析摘要表 變項 標準化 迴歸係數 T值 F值 R2 教育程度 .574 2.98** 8.87** .33 基本假設 Y = bX + a 固定自變項假設(fixed variable) 特定自變數的特定數值應可以被重複獲得,然後得以 此一特定的 Xi 代入方程式而得到預測值。 線性關係假設(linear relationship) 當 X 與 Y 的關係被納入研究之後,迴歸分析必須 建立在變項之間具有線性關係的假設上。 常態性假設(normality) 迴歸分析中的所有觀察值Y 是一個常態分配,即 Y 來自於一個呈常態分配的母群體。 基本假設 Cov (ei , ej) =0 誤差獨立性假設(independence) 誤差項除了應呈隨機化的常態分配,不同的X 所產生 的誤差之間應相互獨立,無相關存在,也就是無自我 相關(non-autocorrelation)。 誤差等分散性假設(homoscedasticity)多元共 線性假設 V (ej) = σ2 特定X 水準的誤差項,除了應呈隨機化的常態分配, 且其變異量應相等,稱為誤差等分散性 等分散性假設圖示 Xa條件下的 Y變異量= Xb條件下的 Y變異量 多元迴歸分析之步驟 迴歸分析公式 最佳配適線 兩個自變項為例 Y b1 X 1 b2 X 2 ... a Z y b1 X 1 b 2 X 2 ... ' 例如: 創新接受度=β1善用科技 + β2包容錯誤 + … 多元迴歸分析之步驟 選擇運算方式 1.強迫進入法(enter) 如果分階段投入, 則稱為階層式迴歸 (Hierarchical Regression) 所有X變項皆投入,以決定變項的重要性排序 適合X變項已有理論基礎。 2.逐步迴歸法(stepwise) 先「順向選擇」再「反向剔除」,留下重要變項 適合探索性研究(理論尚在探究中) 多元迴歸分析之步驟 選擇運算方式 2-1.順向選擇法(forward) 逐步迴歸 = 順向與反向交 互使用 首先,選X變項與Y變項最大相關者進入模式, 接者,再選取其他X變項與Y變項淨相關最大者進 入,其餘依此類推。 2-2.反向剔除法( backward) 所有X變項皆進入模式,再逐一將貢獻最小的 X變項剔除,直到所有X變項達顯著標準為止( SPSS內定 F=2.71 P=0.1) 多元迴歸分析之步驟 Y=β1X1+β2X2+… X1與X2相關太大 則共線性嚴重 檢查多元共線性問題 1.共線性(Collinarity) X變項之間相關太大,造成迴歸分析嚴重誤差。 X1 X1 X2 Y X3 有多元共線性 X2 Y X3 沒有多元共線性 多元迴歸分析之步驟 檢查多元共線性問題 2.判斷方式: R2愈大,1-R2愈小 共線性愈嚴重 2-1.容忍度(tolerance):1 - R2 (R:X變項與其他 變項的相關),容忍度太小或0代表共線性嚴重。 2-2.變異數膨脹因素(Variance Inflation Factor, VIF) VIF=1/(1-R2),VIF值愈大,共線性愈嚴重。 2-3.條件指標(Condition Index, CI): CI值愈大,共線性愈嚴重。 CI<30尚可,CI>100嚴重 CI max i SPSS 會算出 多元迴歸分析之步驟 模式之F檢定、係數之t檢定 觀察β值之顯著性,並做決定 P<.05 拒絕 H0 接受 H1:β ≠ 0 P>.05 接受 H0 β=0 迴歸方程式成立: Y = .683 X1+.525X2+….. 觀察哪個X變項 最能預測Y? 做出結論與建議 SPSS操作 數學成就之迴歸預測 (範例) 操作(強迫進入法): 分析—迴歸方法—線性—強迫進入法 X—數學焦慮、投入動機、數學態度 Y—數學成就 統計量—共線性診斷 觀察 R、R2、F值、β值、t值、P值、VIF SPSS操作 SPSS操作 SPSS報表 模 式 摘要 調過後的 模式 R R 平方 R 平方 估計的標準誤 1 .417 a .174 .166 9.67 a. 預測變數:(常數), 投入動機, 數學焦慮, 數學態度 變 異 數分 析b 模式 1 平方和 自由度 平均平方和 迴歸 5824.921 3 1941.640 殘差 27663.116 296 93.456 總和 33488.037 299 a. 預測變數:(常數), 投入動機, 數學焦慮, 數學態度 b. 依變數\:數學成就 F 檢定 20.776 顯著性 .000 a 迴 歸 模 式 達 顯 著 SPSS報表 係數a 未標準化係數 B 之估計值 標準誤 模式 (常數) 1 5.602 2.339 數學焦慮 -9.958E-03 .028 數學態度 .044 .268 投入動機 .088 -.104 a. 依變數\:數學成就 標準化係 數 Beta 分配 數學態度預測力高 -.022 .443 -.076 t .418 -.360 6.147 -1.190 顯著性 .677 .719 .000 .235 共線性統計量 VIF 允差 .719 .537 .680 1.392 1.862 1.471 容忍度不宜接近0 VIF愈小愈好 SPSS報表 共線性診斷a 模式 1 維度 特徵值 條件指標 1 3.884 1.000 2 9.377E-02 6.436 3 1.600E-02 15.580 4 6.632E-03 24.199 a. 依變數\:數學成就 (常數) .00 .00 .08 .92 變異數比例 數學焦慮 數學態度 投入動機 .00 .00 .00 .39 .03 .04 .03 .24 .96 .58 .73 .00 多元共線性CI指標<30 APA表格 多元迴歸分析摘要表 有變項未達顯著 可試--逐步迴歸 表1:三種變項預測數學成就之迴歸分析摘要表 變項 標準化迴歸 係數 T值 數學焦慮 -.02 -3.6 數學態度 .44 6.15*** 投入動機 -.076 -1.19 F值 R2 VIF 1.39 20.78*** .17 1.86 1.47 SPSS操作 數學成就之迴歸預測 (範例) 操作(逐步迴歸法): 分析—迴歸方法—線性—逐步迴歸法 X—數學焦慮、投入動機、數學態度 Y—數學成就 統計量—R2改變量、共線性診斷 觀察 R、R2、F值、淨F值、β值、t值、P值、VIF SPSS操作 SPSS報表 僅數學態度保留下來 選 入 / 刪 除 的 變 數a 模式 1 選入的變數 刪除的變數 數學態度 . 方法 逐步迴歸 分析法 (準則\:F選入的機 率 <= .05 0 , F-刪除 的機率 >= .1 00 )。 a. 依變數\:數學成就 淨 F 改變量 模式摘要 調過後的 模式 R R 平方 R 平方 估計的標準誤 R 平方改變量 a 1 .412 .170 .167 9.66 .170 a. 預測變數:(常數), 數學態度 變更統計量 F 改變 分子自由度 分母自由度 顯著性 F 改變 60.877 1 298 .000 SPSS報表 迴歸模式達顯著 變 異 數分 析b 模式 1 平方和 自由度 迴歸 5680.605 1 殘差 27807.431 298 總和 33488.037 299 a. 預測變數:(常數), 數學態度 b. 依變數\:數學成就 平均平方和 5680.605 93.314 F 檢定 60.877 顯著性 .000 a 容忍度不宜接近0 VIF愈小愈好 係數a 未標準化係數 模式 B 之估計值 標準誤 1 (常數) -.668 3.302 數學態度 .249 .032 a. 依變數\:數學成就 標準化係 數 Beta 分配 .412 t -.202 7.802 數學態度預測力高 顯著性 .840 .000 共線性統計量 允差 VIF 1.000 1.000 SPSS報表 共 線 性診 斷a 模式 1 維度 特徵值 1 1.986 2 1.437E-02 a. 依變數\:數學成就 條件指標 1.000 11.755 多元共線性CI指標<30 變異數比例 (常數) 數學態度 .01 .01 .99 .99 APA表格 多元迴歸分析摘要表 表1:三種變項預測數學成就之逐步迴歸分析摘要表 變項 標準化迴歸 係數 T值 F值 R2 VIF 數學態度 .412 7.80*** 60.88*** .17 1.0 比較一下: 與強迫進入法有何差異? SPSS練習 音樂智慧問卷 (範例) 操作(強迫進入法): 分析—迴歸方法—線性—強迫進入法 X—六種音樂智慧 Y—音樂喜好 統計量—共線性診斷 觀察: R、R2、F值、淨F值、β值、t值、P值、VIF SPSS報表 模 式 摘要 調過後的 模式 R R 平方 R 平方 估計的標準誤 1 .857 a .734 .733 .4040 a. 預測變數:(常數), 創作, 曲調, 演奏唱, 節奏, 音感 變 異 數分 析b 模式 1 平方和 自由度 平均平方和 迴歸 419.053 5 83.811 殘差 151.477 928 .163 總和 570.530 933 a. 預測變數:(常數), 創作, 曲調, 演奏唱, 節奏, 音感 b. 依變數\:喜好 F 檢定 513.452 顯著性 .000 a 迴 歸 模 式 達 顯 著 SPSS報表 係數a 未標準化係數 模式 B 之估計值 標準誤 1 (常數) .411 .072 節奏 .177 .029 曲調 .473 .027 演奏唱 7.115E-02 .024 音感 6.823E-02 .029 創作 .163 .030 a. 依變數\:喜好 標準化係 數 Beta 分配 曲調智慧預測力高 .169 .471 .083 .068 .173 t 5.693 6.127 17.843 2.913 2.382 5.393 顯著性 .000 .000 .000 .004 .017 .000 共線性統計量 允差 VIF .374 .411 .351 .347 .279 2.674 2.435 2.849 2.878 3.580 容忍度不宜接近0 VIF愈小愈好 SPSS報表 共線性診斷a 模式 1 維度 特徵值 條件指標 1 5.890 1.000 2 4.799E-02 11.078 3 2.195E-02 16.381 4 1.491E-02 19.877 5 1.293E-02 21.346 6 1.235E-02 21.840 a. 依變數\:喜好 (常數) .00 .38 .18 .16 .27 .01 節奏 .00 .00 .31 .19 .15 .35 變異數比例 曲調 演奏唱 .00 .00 .01 .23 .00 .42 .04 .34 .41 .01 .54 .00 多元共線性CI指標<30 音感 .00 .00 .03 .65 .00 .32 創作 .00 .03 .15 .02 .64 .17 APA表格 多元迴歸分析摘要表 表1:五種音樂智慧預測音樂喜好之迴歸分析摘要表 變項 標準化迴歸 係數 T值 節奏 .17 6.13*** 2.67 曲調 .47 17.84*** 2.44 演奏唱 .08 2.91** 513.45*** .73 2.85 音感 .07 2.38* 2.88 創作 .17 5.39*** 3.58 F值 R2 VIF 多元迴歸分析 • 試試看 逐步迴歸分析的 結果為何? 模式摘要 變更統計量 調過後的 R 平方 估計的標準誤 R 平方改變量 F 改變 分子自由度 分母自由度 顯著性 F 改變 .652 .4611 .653 1751.012 1 932 .000 .714 .4183 .062 201.908 1 931 .000 .727 .4082 .014 47.200 1 930 .000 .732 .4050 .005 15.817 1 929 .000 .733 .4040 .002 5.674 1 928 .017 模式 R R 平方 1 .808 a .653 2 .845 b .715 3 .853 c .728 4 .856 d .733 5 .857 e .734 a. 預測變數:(常數), 曲調 b. 預測變數:(常數), 曲調, 創作 c. 預測變數:(常數), 曲調, 創作, 節奏 d. 預測變數:(常數), 曲調, 創作, 節奏, 演奏唱 e. 預測變數:(常數), 曲調, 創作, 節奏, 演奏唱, 音感 每增加一個變項 的R2 增加量 係 數a 未標準化係數 模式 B 之估計值 標準誤 1 (常數) .617 .077 曲調 .812 .019 2 (常數) .541 .070 曲調 .567 .025 創作 .330 .023 3 (常數) .430 .070 曲調 .511 .025 創作 .231 .027 節奏 .199 .029 4 (常數) .453 .070 曲調 .488 .026 創作 .179 .030 節奏 .184 .029 演奏唱 9.134E -02 .023 5 (常數) .411 .072 曲調 .473 .027 創作 .163 .030 節奏 .177 .029 演奏唱 7.115E -02 .024 音感 6.823E -02 .029 a. 依變數\:喜好 曲調智慧預測力高 標準化係 數 Beta 分配 .808 .564 .348 .508 .244 .190 .486 .190 .176 .107 .471 .173 .169 .083 .068 t 7.991 41.845 7.702 23.002 14.209 6.108 20.109 8.607 6.870 6.465 18.929 6.065 6.375 3.977 5.693 17.843 5.393 6.127 2.913 2.382 顯著性 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .004 .017 共線性統計量 允差 VIF 1.000 1.000 .510 .510 1.961 1.961 .457 .363 .384 2.186 2.751 2.607 .436 .294 .378 .399 2.294 3.401 2.649 2.506 .411 .279 .374 .351 .347 2.435 3.580 2.674 2.849 2.878 APA表格 多元迴歸分析摘要表 表1:五種音樂智慧預測音樂喜好之逐步迴歸分析摘要表 曲 調 智 慧 預 測 力 高 變項 標準化迴歸 係數 T值 曲調 .47 17.84*** 2.44 創作 .17 5.39*** 3.58 節奏 .169 6.13*** 513.45*** .73 2.67 演奏唱 .08 2.91** 2.85 音感 .07 2.38* 2.88 F值 R2 VIF SPSS作業 學習經驗問卷 (範例) 案例(採用逐步迴歸分析): 1.自變項—壓力懼怕、情緒擔憂、考試焦慮、課堂焦慮 學習信心、有用性、成功態度、探究動機 工作投入、自我投入(10個) 2.依變項—數學成績 考驗:R、R2、F值、淨F值、β值、t值、P值、VIF 多元迴歸分析 • 多元迴歸分析的自變項與依變 項為何種量尺的資料? • 自變項幾個?依變項幾個? • 何謂多元共線性? 延伸閱讀資料 余民寧(1995)。心裡與教育統計學。 台北:三民。 吳明隆、涂金堂(2005)。SPSS與統計應用分析 , 第11章。台北:五南。 預告下星期課程???