簡單相關與廻歸

Download Report

Transcript 簡單相關與廻歸

簡單相關與廻歸
簡單相關的意義和種類
• 是否智力測驗得高分的學生,他們的學業
成績也愈好?
• 家庭收入高者,是否其子女為資優的比率
也較高?
• 正相關 VS. 負相關VS.零相關
相關係數(r)
•
•
•
•
相關係數值介於-1至+1之間
+1為完全正相關
-1為完全負相關
0為完全零相關
不同r值散佈圖
皮爾遜積差相關系數(The
Pearson-moment
correlation coefficient)
r
ZxZy

N
r= 積差相關系數 Zx=X變數的Z分數 Zy=Y變數的Z分數 N=總人數
練習題
• 數學與自然分數約呈左下角到右上角的分
佈趨勢
相關係數的解釋和應用
• 注意:如果取樣人數太少時,即時求得很高的相關
係數也不一定可以推論兩個變數之間有高相關存
在。
積差相關係數值的解釋
• 相關係數是一個指標值,它表示兩變項的
關係程度。但是,它不是等距的測量值
(r=0.50 並不是r=0.25的兩倍).
• 相關的意義並不一定隱含有因果關係存在。
• 相關係數最大的用途在於協助預測的工作
(迴歸分析)。
簡單回歸分析
• Why regression?
– 根據某變項預測另一個變項
• 假設某研究者想要知道數學成績分數70的
學生,他的自然分數可能是多少
– 數學分數:預測變項 or自變項
– 自然分數:效標變項 or 依變項
廻歸線
• 由一變項預測另一變項所使用的數學函數
是一次方函數線,畫出的函數線是直線,
稱之為廻歸線。
How to find best fitting
line
• 以最小平方法找出一條直線,讓這條直線能
夠通這些資料點所構成的重心,使各點至此
線平行於Y軸的距離的平方和最小。
Y  bX  a
Y為預測值,b為斜率,a為截距
Best fitting line
SSt, SSreg, SSres
•
總離均差平方和=迴歸離均差平方和+殘差平方和
 Y  Y 
2
•
•

  Yˆ  Y
SSt=SSreg+SSres

2

  Y  Yˆ
總變異=被解釋變異+非被解釋變異(公式 8-15)

2
決定係數
• r2 稱為決定係數(Coefficient of determination)
表示Y變數的變異數能由X變數決定或正確預測
的部份。『在依變項Y的總變異量中,被自變
項X所解釋到的變異量百分比』。
SSreg
r 
SSt
2
範例
• r2= 0.5694
– 可解釋為可被回歸離君差平方和解是得到的百
分比約為 57%
– 若以前述自然與數學分數之範例,可解釋為
「以數學分數建立起來的預測公式預測自然分
數時,預測正確的部份高達57%」
– 自變項與依變項的相關係數愈高,預測正確的
程度便愈大。
離間係數
• 1- r2
– 在依變項的總變異量中,無法被自變項解釋到
的部份所佔的百分比。