Transcript 線性回歸分析
第8章 回歸分析 8.1 8.2 8.3 8.4 8.5 線性回歸分析的基本原理 圖表分析與回歸函數分析 Excel回歸分析工具 多元回歸分析 非線性回歸分析 本章學習目標 u 回歸分析的基本思想 u 利用Excel圖表進行線性回歸分析 u利用Excel回歸分析工作表函數進行線性 回歸分析 u利用Excel回歸分析工具進行一元及多元 線性回歸分析 u 非線性回歸分析的基本思路 8.1 線性回歸分析的基本原理 8.1.1 回歸分析的概念 8.1.2 回歸分析的主要內容 返回首頁 8.1.1 回歸分析的概念 首先要區分兩種主要類型的變量︰一種變量相 當于通常函數關係中的自變量,對這樣的變量 能夠賦予一個需要的值(如室內的溫度、施肥 量)或者能夠取到一個可觀測但不能人為控制 的值(如室外的溫度),這樣的變量稱為自變 量;自變量的變化能引起另一些變量(如水稻 畝產量)的變化,這樣的變量稱為因變量。 由一個或一組非隨機變量來估計或預測某一個 隨機變量的觀測值時,所建立的數學模型及所 進行的統計分析,稱為回歸分析。因此,回歸 分析是研究隨機變量與非隨機變量之間的數量 關係的一種數學方法。如果所建立的模型是線 性的就稱為線性回歸分析。線性回歸分析不僅 告訴我們怎樣建立變量間的數學表達式,即經 驗公式,而且還利用機率統計知識進行分析討 論,判斷出所建立的經驗公式的有效性,從而 可以進行預測或估計。 返回本節 8.1.2 回歸分析的主要內容 回歸分析的內容包括如何確定因變量與自變量 之間的回歸模型;如何根據樣本觀測數據,估 計並檢驗回歸模型及未知參數;在眾多的自變 量中,判斷哪些變量對因變量的影響是顯著的, 哪些變量的影響是不顯著的;根據自變量的已 知值或給定值來估計和預測因變量的值。 Excel提供了許多回歸分析的方法與工具,它 們可用于不同的分析目的。 返回本節 8.2 圖表分析與回歸函數分析 8.2.1 利用圖表進行分析 8.2.2 Excel中的回歸分析工作表函數 8.2.3 利用工作表函數進行回歸分析 返回首頁 8.2.1 利用圖表進行分析 例8-1 某種合成纖維的強度與其拉伸倍數之間 存在一定關係,圖8-1所示(“線性回歸分析” 工作表)是實測12個纖維樣品的強度y與相應 的拉伸倍數x的數據記錄。試求出它們之間的 關係。 (1)打開“線性回歸分析”工作表。 (2)在工具欄上選擇“圖表向導”按鈕,單 擊打開圖表向導對話框,如圖8-2所示,在 “圖表類型”列表框中選擇“XY散點圖”, 單擊“下一步”按鈕進入圖表向導步驟2。 (3)在圖表向導步驟2對話框的“數據區域”中輸入 “B2:C13”,選擇“系列產生在”為“列”,如圖8-3 所示,單擊“下一步”按鈕進入步驟3。 (4)在圖表向導步驟3的對話框中,打開“圖例”頁 面,取消“顯示圖例”,省略標題,如圖8-4所示。 (5)單擊“完成”按鈕,得到XY散點圖如圖8-5所示。 (6)在散點圖中,把鼠標放在任一數據點上,右擊, 在快捷菜單中選擇“添加趨勢線”,打開趨勢線對話 框。 (7)在“添加趨勢線”對話框中打開“類型”頁面, 選擇“線性”選項,在“選項”頁面中選擇“顯示公 式”和“顯示R平方”選項,單擊“確定”按鈕,得 到趨勢回歸圖,如圖8-6所示。 圖8-1 “線性回歸分析.xls”工作表 圖8-2 圖表向導(步驟1) 圖8-3 圖表向導(步驟2) 圖8-4 圖表向導(步驟3) 圖8-5 XY散點圖 圖8-6 趨勢回歸直線 返回本節 8.2.2 Excel中的回歸分析工作表函數 Excel提供的回歸分析工作表函數主要有以下 幾個︰ (1)截距函數。 (2)斜率函數。 (3)測定系數函數。 (4)估計標準誤差函數。 (1)截距函數。 其功能是利用現有的x值與y值計算直線與y軸 的 截 距 。 截 距 為 穿 過 已 知 的 known_x's 和 known_y's數據點的線性回歸線與y軸的交點。 當自變量為0時,使用INTERCEPT函數可以 決定因變量的值。例如,當所有的數據點都是 在室溫或更高的溫度下取得的,可以用 INTERCEPT函數預測在0°C時金屬的電阻。 語法︰INTERCEPT(known_y's,known_x's) 圖8-7 x、y數據 圖8-8 計算截距 (2)斜率函數。 該函數返回根據known_y's和known_x's中的數 據點擬合的線性回歸直線的斜率。斜率為直線 上任意兩點的垂直距離與水準距離的比值,也 就是回歸直線的變化率。 語法︰SLOPE (known_y's,known_x's) 其中︰Known_y's為數字型因變量數據點數組 或單元格區域;Known_x's為自變量數據點集 合。 (3)測定系數函數。 (3)測定系數函數。 該函數返回根據known_y's和known_x's中數據 點計算得出的乘積矩相關係數的平方。R平方 值可以解釋為y方差與x方差的比例。 語法︰RSQ(known_y's,known_x's) 回歸直線的斜率計算公式如下︰ b n x y n x x xy 2 2 圖8-9 計算斜率 (4)估計標準誤差函數。 該函數返回透過線性回歸法計算每個x的y預測 值時所產生的標準誤差。標準誤差用來度量根 據單個x變量計算出的y預測值的誤差量。 語法︰STEYX(known_y's,known_x's) 其中︰Known_y's為因變量數據點數組或區域, Known_x's為自變量數據點數組或區域。 預測值y的標準誤差計算公式如下︰ S yx 1 n n n 2 n xy x y y y n x x 2 2 2 2 2 返回本節 8.2.3 利用工作表函數進行回歸分析 例8-4 在某大學一年級新生體檢表中隨機抽取10張,得到10名大 學生的身高(x)和體重(y)的數據,如圖8-10(“身高體重” 工作表)所示。 用Excel提供的工作表函數進行相關計算。 (1)在單元格A12~A15中分別輸入“截距”、“斜率”、“測 定系數”、“估計標準誤差”。 (2)在單元格B12中輸入公式 “=INTERCEPT(C2:C11,B2:B11)”,返回后顯示-79.42015。 (3)在單元格B13中輸入公式“=SLOPE(C2:C11,B2:B11)”, 返回后顯示0.8041825。 (4)在單元格B14中輸入公式“=RSQ(C2:C11,B2:B11)”,返回 后顯示0.6817018。 (5)在單元格B15中輸入公式“=STEYX(C2:C11,B2:B11)”, 返回后顯示2.8180738。計算結果如圖8-8所示。 圖8-10 “身高體重”工作表 圖8-11 “身高體重”回歸計算結果 返回本節 8.3 Excel回歸分析工具 8.3.1 回歸分析工具的主要內容 8.3.2 回歸分析工具的應用 8.3.3 回歸分析工具的輸出解釋 返回首頁 8.3.1 回歸分析工具的主要內容 回歸分析工具是透過對一組觀察值使用“最小 平方法”進行直線擬合,以分析一個或多個自 變量對單個因變量的影響方向與影響程度的方 法。它是Excel中數據分析工具的一個內容。 在“工具”菜單中選擇“數據分析”選項,會出 現“數據分析”對話框,在分析工具中選擇“回 歸”,單擊“確定”按鈕就會進入“回歸”對話 框,如圖8-12所示。在此對話框中主要包括以下 內容︰ Y值輸入區域︰ X值輸入區域︰ 標誌︰ 置信度︰ 常數為零︰ 輸出區域︰ 新工作表組︰ 新工作簿︰ 殘差︰ 標準殘差︰ 殘差圖︰ 線形擬合圖︰ 正態機率圖︰ 返回本節 8.3.2 回歸分析工具的應用 例8-5 以例8-4資料為例,利用回歸分析工具進行回歸分 析。 (1)打開“身高體重”工作表。 (2)在“工具”菜單中選擇“數據分析”選項,在“分 析工具”列表中選擇“回歸”,單擊“確定”按鈕, 打開“回歸”對話框。 (3)在“Y值輸入區域”中輸入“$C$1: $C$11”,在 “X值輸入區域”中輸入“$B$1: $B$11”;選擇“標 誌”,置信度默認;在“輸出選項”中選擇“輸出區 域”,在其右邊輸入“$D$1”,如圖8-13所示,單擊 “確定”按鈕輸出結果,如圖8-14所示。 圖8-13 “回歸”對話框 圖8-14 回歸分析結果 返回本節 8.3.3 回歸分析工具的輸出解釋 Excel回歸分析工具的輸出結果包括3個部分︰ 1.回歸統計表 2.方差分析表 3.回歸參數表 回歸統計表包括以下幾部分內容︰ (1)Multiple R(複相關係數R)︰ (2)R Square(複測定系數R2)︰ (3)Adjusted R Square(調整複測定系數 R2)︰ (4)標準誤差︰ (5)觀測值︰ 返回本節 8.4 多元回歸分析 例8-6 有一個工廠會計部門在估計每月管理費 y時,用工人的勞動日數x1與機器的開工台數 x2作自變量,現將當年10個月的數據搜集起來, 如圖8-15(“多元回歸分析”工作表)所示, 估計y對x1與x2的線性回歸方程(α=0.05)。 返回首頁 (1)在“工具”菜單中選擇“數據分析”選 項,在“分析工具”列表中選擇“回歸”,單 擊“確定”按鈕,打開“回歸”對話框。 (2)在“Y值輸入區域”中輸入“D1:D11”, 在“X值輸入區域”中輸入“B1:C11”;選擇 “標誌”,置信度默認;在“輸出選項”中選 擇“輸出區域”,在其右邊輸入“A12”,單擊 “確定”按鈕輸出結果,如圖8-16所示。 圖8-15 “多元回歸分析”工作表 圖8-16 二元線性回歸分析計算結果 返回本節 8.5 非線性回歸分析 以最小平方法分析非線性關係資料在數量變化 上的規律叫做非線性回歸分析。從非線性回歸 的角度看,線性回歸僅是其中的一個特例。一 個恰當的非線性回歸方程的確定不是很容易的, 一般要經過變量轉換,將非線性問題轉化為線 性問題解決。下面討論幾種非線性方程線性化 的情況。 返回首頁 1. y a b lg x (1)添加趨勢線。 (2)利用回歸分析工具。 表8-1 微量元素超標量與患病患數 圖8-17 添加對數趨勢線結果 圖8-18 “回歸”工具獲得的對數曲線模型擬合結果 2. y ab x 表8-2 氰化物濃度數據 圖8-19 添加指數趨勢線結果 8-20 “回歸”工具獲得的指數曲線模型擬合結果 3. y axe bx 返回本節