Transcript 簡單相關與廻歸
簡單相關與廻歸 簡單相關的意義和種類 • 是否智力測驗得高分的學生,他們的學業 成績也愈好? • 家庭收入高者,是否其子女為資優的比率 也較高? • 正相關 VS. 負相關VS.零相關 相關係數(r) • • • • 相關係數值介於-1至+1之間 +1為完全正相關 -1為完全負相關 0為完全零相關 不同r值散佈圖 皮爾遜積差相關系數(The Pearson-moment correlation coefficient) r ZxZy N r= 積差相關系數 Zx=X變數的Z分數 Zy=Y變數的Z分數 N=總人數 練習題 • 數學與自然分數約呈左下角到右上角的分 佈趨勢 相關係數的解釋和應用 • 注意:如果取樣人數太少時,即時求得很高的相關 係數也不一定可以推論兩個變數之間有高相關存 在。 積差相關係數值的解釋 • 相關係數是一個指標值,它表示兩變項的 關係程度。但是,它不是等距的測量值 (r=0.50 並不是r=0.25的兩倍). • 相關的意義並不一定隱含有因果關係存在。 • 相關係數最大的用途在於協助預測的工作 (迴歸分析)。 簡單回歸分析 • Why regression? – 根據某變項預測另一個變項 • 假設某研究者想要知道數學成績分數70的 學生,他的自然分數可能是多少 – 數學分數:預測變項 or自變項 – 自然分數:效標變項 or 依變項 廻歸線 • 由一變項預測另一變項所使用的數學函數 是一次方函數線,畫出的函數線是直線, 稱之為廻歸線。 How to find best fitting line • 以最小平方法找出一條直線,讓這條直線能 夠通這些資料點所構成的重心,使各點至此 線平行於Y軸的距離的平方和最小。 Y bX a Y為預測值,b為斜率,a為截距 Best fitting line SSt, SSreg, SSres • 總離均差平方和=迴歸離均差平方和+殘差平方和 Y Y 2 • • Yˆ Y SSt=SSreg+SSres 2 Y Yˆ 總變異=被解釋變異+非被解釋變異(公式 8-15) 2 決定係數 • r2 稱為決定係數(Coefficient of determination) 表示Y變數的變異數能由X變數決定或正確預測 的部份。『在依變項Y的總變異量中,被自變 項X所解釋到的變異量百分比』。 SSreg r SSt 2 範例 • r2= 0.5694 – 可解釋為可被回歸離君差平方和解是得到的百 分比約為 57% – 若以前述自然與數學分數之範例,可解釋為 「以數學分數建立起來的預測公式預測自然分 數時,預測正確的部份高達57%」 – 自變項與依變項的相關係數愈高,預測正確的 程度便愈大。 離間係數 • 1- r2 – 在依變項的總變異量中,無法被自變項解釋到 的部份所佔的百分比。