線性回歸分析

Download Report

Transcript 線性回歸分析

第8章 回歸分析
8.1
8.2
8.3
8.4
8.5
線性回歸分析的基本原理
圖表分析與回歸函數分析
Excel回歸分析工具
多元回歸分析
非線性回歸分析
本章學習目標
u 回歸分析的基本思想
u 利用Excel圖表進行線性回歸分析
u利用Excel回歸分析工作表函數進行線性
回歸分析
u利用Excel回歸分析工具進行一元及多元
線性回歸分析
u 非線性回歸分析的基本思路
8.1 線性回歸分析的基本原理
8.1.1 回歸分析的概念
8.1.2 回歸分析的主要內容
返回首頁
8.1.1 回歸分析的概念
首先要區分兩種主要類型的變量︰一種變量相
當于通常函數關係中的自變量,對這樣的變量
能夠賦予一個需要的值(如室內的溫度、施肥
量)或者能夠取到一個可觀測但不能人為控制
的值(如室外的溫度),這樣的變量稱為自變
量;自變量的變化能引起另一些變量(如水稻
畝產量)的變化,這樣的變量稱為因變量。
由一個或一組非隨機變量來估計或預測某一個
隨機變量的觀測值時,所建立的數學模型及所
進行的統計分析,稱為回歸分析。因此,回歸
分析是研究隨機變量與非隨機變量之間的數量
關係的一種數學方法。如果所建立的模型是線
性的就稱為線性回歸分析。線性回歸分析不僅
告訴我們怎樣建立變量間的數學表達式,即經
驗公式,而且還利用機率統計知識進行分析討
論,判斷出所建立的經驗公式的有效性,從而
可以進行預測或估計。
返回本節
8.1.2 回歸分析的主要內容
回歸分析的內容包括如何確定因變量與自變量
之間的回歸模型;如何根據樣本觀測數據,估
計並檢驗回歸模型及未知參數;在眾多的自變
量中,判斷哪些變量對因變量的影響是顯著的,
哪些變量的影響是不顯著的;根據自變量的已
知值或給定值來估計和預測因變量的值。
Excel提供了許多回歸分析的方法與工具,它
們可用于不同的分析目的。
返回本節
8.2 圖表分析與回歸函數分析
8.2.1 利用圖表進行分析
8.2.2 Excel中的回歸分析工作表函數
8.2.3 利用工作表函數進行回歸分析
返回首頁
8.2.1 利用圖表進行分析
例8-1 某種合成纖維的強度與其拉伸倍數之間
存在一定關係,圖8-1所示(“線性回歸分析”
工作表)是實測12個纖維樣品的強度y與相應
的拉伸倍數x的數據記錄。試求出它們之間的
關係。
(1)打開“線性回歸分析”工作表。
(2)在工具欄上選擇“圖表向導”按鈕,單
擊打開圖表向導對話框,如圖8-2所示,在
“圖表類型”列表框中選擇“XY散點圖”,
單擊“下一步”按鈕進入圖表向導步驟2。
(3)在圖表向導步驟2對話框的“數據區域”中輸入
“B2:C13”,選擇“系列產生在”為“列”,如圖8-3
所示,單擊“下一步”按鈕進入步驟3。
(4)在圖表向導步驟3的對話框中,打開“圖例”頁
面,取消“顯示圖例”,省略標題,如圖8-4所示。
(5)單擊“完成”按鈕,得到XY散點圖如圖8-5所示。
(6)在散點圖中,把鼠標放在任一數據點上,右擊,
在快捷菜單中選擇“添加趨勢線”,打開趨勢線對話
框。
(7)在“添加趨勢線”對話框中打開“類型”頁面,
選擇“線性”選項,在“選項”頁面中選擇“顯示公
式”和“顯示R平方”選項,單擊“確定”按鈕,得
到趨勢回歸圖,如圖8-6所示。
圖8-1 “線性回歸分析.xls”工作表
圖8-2 圖表向導(步驟1)
圖8-3 圖表向導(步驟2)
圖8-4 圖表向導(步驟3)
圖8-5 XY散點圖
圖8-6 趨勢回歸直線
返回本節
8.2.2 Excel中的回歸分析工作表函數
Excel提供的回歸分析工作表函數主要有以下
幾個︰
(1)截距函數。
(2)斜率函數。
(3)測定系數函數。
(4)估計標準誤差函數。
(1)截距函數。
其功能是利用現有的x值與y值計算直線與y軸
的 截 距 。 截 距 為 穿 過 已 知 的 known_x's 和
known_y's數據點的線性回歸線與y軸的交點。
當自變量為0時,使用INTERCEPT函數可以
決定因變量的值。例如,當所有的數據點都是
在室溫或更高的溫度下取得的,可以用
INTERCEPT函數預測在0°C時金屬的電阻。
語法︰INTERCEPT(known_y's,known_x's)
圖8-7 x、y數據
圖8-8 計算截距
(2)斜率函數。
該函數返回根據known_y's和known_x's中的數
據點擬合的線性回歸直線的斜率。斜率為直線
上任意兩點的垂直距離與水準距離的比值,也
就是回歸直線的變化率。
語法︰SLOPE (known_y's,known_x's)
其中︰Known_y's為數字型因變量數據點數組
或單元格區域;Known_x's為自變量數據點集
合。
(3)測定系數函數。
(3)測定系數函數。
該函數返回根據known_y's和known_x's中數據
點計算得出的乘積矩相關係數的平方。R平方
值可以解釋為y方差與x方差的比例。
語法︰RSQ(known_y's,known_x's)
回歸直線的斜率計算公式如下︰
b
n



x
y

 
n  x   x 
xy 
2
2
圖8-9 計算斜率
(4)估計標準誤差函數。
該函數返回透過線性回歸法計算每個x的y預測
值時所產生的標準誤差。標準誤差用來度量根
據單個x變量計算出的y預測值的誤差量。
語法︰STEYX(known_y's,known_x's)
其中︰Known_y's為因變量數據點數組或區域,
Known_x's為自變量數據點數組或區域。
預測值y的標準誤差計算公式如下︰
S yx 



1


 n
 n n  2   

n  xy   x  y  
 y   y  

n  x   x 

2
2
2
2
2
返回本節
8.2.3 利用工作表函數進行回歸分析
例8-4 在某大學一年級新生體檢表中隨機抽取10張,得到10名大
學生的身高(x)和體重(y)的數據,如圖8-10(“身高體重”
工作表)所示。
用Excel提供的工作表函數進行相關計算。
(1)在單元格A12~A15中分別輸入“截距”、“斜率”、“測
定系數”、“估計標準誤差”。
(2)在單元格B12中輸入公式
“=INTERCEPT(C2:C11,B2:B11)”,返回后顯示-79.42015。
(3)在單元格B13中輸入公式“=SLOPE(C2:C11,B2:B11)”,
返回后顯示0.8041825。
(4)在單元格B14中輸入公式“=RSQ(C2:C11,B2:B11)”,返回
后顯示0.6817018。
(5)在單元格B15中輸入公式“=STEYX(C2:C11,B2:B11)”,
返回后顯示2.8180738。計算結果如圖8-8所示。
圖8-10 “身高體重”工作表
圖8-11 “身高體重”回歸計算結果
返回本節
8.3 Excel回歸分析工具
8.3.1 回歸分析工具的主要內容
8.3.2 回歸分析工具的應用
8.3.3 回歸分析工具的輸出解釋
返回首頁
8.3.1 回歸分析工具的主要內容
回歸分析工具是透過對一組觀察值使用“最小
平方法”進行直線擬合,以分析一個或多個自
變量對單個因變量的影響方向與影響程度的方
法。它是Excel中數據分析工具的一個內容。
在“工具”菜單中選擇“數據分析”選項,會出
現“數據分析”對話框,在分析工具中選擇“回
歸”,單擊“確定”按鈕就會進入“回歸”對話
框,如圖8-12所示。在此對話框中主要包括以下
內容︰
Y值輸入區域︰
X值輸入區域︰
標誌︰
置信度︰
常數為零︰
輸出區域︰
新工作表組︰
新工作簿︰
殘差︰
標準殘差︰
殘差圖︰
線形擬合圖︰
正態機率圖︰
返回本節
8.3.2 回歸分析工具的應用
例8-5 以例8-4資料為例,利用回歸分析工具進行回歸分
析。
(1)打開“身高體重”工作表。
(2)在“工具”菜單中選擇“數據分析”選項,在“分
析工具”列表中選擇“回歸”,單擊“確定”按鈕,
打開“回歸”對話框。
(3)在“Y值輸入區域”中輸入“$C$1: $C$11”,在
“X值輸入區域”中輸入“$B$1: $B$11”;選擇“標
誌”,置信度默認;在“輸出選項”中選擇“輸出區
域”,在其右邊輸入“$D$1”,如圖8-13所示,單擊
“確定”按鈕輸出結果,如圖8-14所示。
圖8-13 “回歸”對話框
圖8-14 回歸分析結果
返回本節
8.3.3 回歸分析工具的輸出解釋
Excel回歸分析工具的輸出結果包括3個部分︰
1.回歸統計表
2.方差分析表
3.回歸參數表
回歸統計表包括以下幾部分內容︰
(1)Multiple R(複相關係數R)︰
(2)R Square(複測定系數R2)︰
(3)Adjusted R Square(調整複測定系數
R2)︰
(4)標準誤差︰
(5)觀測值︰
返回本節
8.4 多元回歸分析
例8-6 有一個工廠會計部門在估計每月管理費
y時,用工人的勞動日數x1與機器的開工台數
x2作自變量,現將當年10個月的數據搜集起來,
如圖8-15(“多元回歸分析”工作表)所示,
估計y對x1與x2的線性回歸方程(α=0.05)。
返回首頁
(1)在“工具”菜單中選擇“數據分析”選
項,在“分析工具”列表中選擇“回歸”,單
擊“確定”按鈕,打開“回歸”對話框。
(2)在“Y值輸入區域”中輸入“D1:D11”,
在“X值輸入區域”中輸入“B1:C11”;選擇
“標誌”,置信度默認;在“輸出選項”中選
擇“輸出區域”,在其右邊輸入“A12”,單擊
“確定”按鈕輸出結果,如圖8-16所示。
圖8-15 “多元回歸分析”工作表
圖8-16 二元線性回歸分析計算結果
返回本節
8.5 非線性回歸分析
以最小平方法分析非線性關係資料在數量變化
上的規律叫做非線性回歸分析。從非線性回歸
的角度看,線性回歸僅是其中的一個特例。一
個恰當的非線性回歸方程的確定不是很容易的,
一般要經過變量轉換,將非線性問題轉化為線
性問題解決。下面討論幾種非線性方程線性化
的情況。
返回首頁
1. y  a  b lg x
(1)添加趨勢線。
(2)利用回歸分析工具。
表8-1 微量元素超標量與患病患數
圖8-17 添加對數趨勢線結果
圖8-18 “回歸”工具獲得的對數曲線模型擬合結果
2.
y  ab
x
表8-2 氰化物濃度數據
圖8-19 添加指數趨勢線結果
8-20 “回歸”工具獲得的指數曲線模型擬合結果
3.
y  axe
bx
返回本節