统计学原理第九章3-4节

Download Report

Transcript 统计学原理第九章3-4节

第三节
回归分析的一般问题
一、回归分析的概念与特点
(一)回归分析的概念
现象之间的相关关系,虽然不是严格
的函数关系,但现象之间的一般关系值,
可以通过函数关系的近似表达式来反映,
这种表达式根据相关现象的实际对应资料,
运用数学的方法来建立,这类数学方法称
回归分析。
(二)回归分析的特点
与相关分析相比,回归分析的特点有:
1.回归分析的两个变量是非对等关系。
2.回归分析中,因变量是随机变量,自变
量是可控制变量。
二、回归分析的内容
(一)确定现象之间相关关系的数学模型
(二)测定数学模型的拟合精度
三、相关分析和回归分析的区别与联系
相关分析与回归分析既相互区别又密切联系,
是相辅相成的。相关分析是研究两个或两个以上变
量之间相关关系及其密切程度的分析。判断相关关
系及其密切程度,一般可通过进行定性与定量分析、
编制相关图表、计算相关系数等,来反映相关方向
和密切程度。回归分析是指将相关现象的关系转变
为函数关系,并建立变量关系的数学表达式,来研
究变量之间数量变动关系的统计分析方法。
相关分析和回归分析是研究现象之间互相依存
关系的不可分割的两个方面。一般先进行相关分析,
测定相关现象之间相关程度大小,进而决定是否需
要进行回归分析,并拟合相应的回归方程,以便进
行推算和预测等,因而可以说相关分析是进行回归
分析的基础,回归分析是把变量的相关关系转变为
函数关系的手段。但须指出,相关分析可以不分自
变量和因变量,而进行回归分析时,则必须明确自
变量和因变量,当自变量与因变量位置互换时所得
到的回归方程则不同。
第四节
回归模型的建立与检测
一、一元线性回归模型
一元线性回归模型是用来进行两个变量间
回归分析的。回归分析的重要内容之一,就
是根据变量观测值构建回归直线方程,对现
象间存在的一般数量关系进行描述。
(一)构建回归模型应具备的条件
1.现象间确实存在数量上的相互依存
关系。
2.现象间存在直线相关关系。
3.具备一定数量的变量观测值。
(二)直线回归方程的求法
直线回归方程又称一元一次线性回归方程,若以x
表示自变量,y表示因变量,则其基本形式为:
yˆ  a  bx
模型中的参数a,b与直线趋势方程相同,通常用
最小平方法来求。最小平方法的数学出发点是:
2
ˆ


y

y

 最小值
  y  a  bx 
2
 最小值
根据高等数学中求极值的原理:
G
a
 0,
G
b
 0

  2  y  a  bx


  2  y  a  bx
  1  
0
  1  
0
  y  na  b  x

即
2
xy

a
x

b
x




[公式9—6]
这就是求解参数a,b的二元一次方程组。解之即
得求a,b的公式如下:
b
a 
n  xy 
 x y
n  x   x 
 y  b  x  y  bx
2
2
n
n
[公式9—7]
[例9—2]
根据相关系数的简捷公式计算有:
r 
n  xy 
n  x   x 
2
2

 x
y
n y 
2
 y 
2
7  2180  185  80
7  5003  185

2
7  954  80 
 0 . 978
2
再求回归直线方程:
yˆ  a  bx
b
a 
n  xy 
 x  y  7  2180  185  80 0 . 578
7  5003  185
n  x   x 
 y  b  x  80  0 . 578  185   3 . 844
2
2
n
n
yˆ   3 . 844  0 . 578 x
2
7
7
二、估计标准误差
(一)估计标准误差的概念与计算
估计标准误差是用来说明回归直线方程
代表性大小的统计分析指标。其计算公式为:
S yx 
  y  yˆ 
2
n
[公式9—8]
实践中,在已知直线回归方程的情况下,
通常用下面的简便公式计算估计标准误差:
S yx 

y  a  y  b  xy
2
n
[公式9—9]
(二)估计标准误差与相关系数的关系
估计标准误差与相关系数存在着密切的关系,
二者的关系可由如下表达式描述:
r   1
S

2
yx
2
y
[公式9—10]
根号前面的正负号表明正相关或负相关,具体
取舍由回归系数的符号来确定:回归系数为正,则
取正;回归系数为负,则取负。
在给定相关系数的情况下,估计标准误差
的计算公式又为:
S yx  
y
1 r
2
[公式9—11]
(三)相关系数与回归系数的关系
r  b


或b  r 
x
[公式9—12]
y


y
x
[公式9—13]
(四)回归方程的变形形式
y  yˆ  r

y
x
 x  xˆ 
[公式9—14]
[例9—3]
(1)先求直线回归方程
yˆ  a  bx
由[公式9—13]:
b  r

y

x
 0 .8 
4
5
 0 . 64
由[公式9—7]:
a  y  b x  124  0 . 64  165  18 . 4
故所求直线回归方程为:
yˆ  18 . 4  0 . 64 x
(2)求估计标准误差
由公式[9—11]有:
S yx  
y
1 r
2
 4 1  0 .8
2
 2 .(万元)
4
三、应用相关分析与回归分析应注意的问题
(一)注意定性分析与定量分析的结合
(二)注意客观现象质的规定性
(三)注意社会经济现象的复杂性
(四)注意对相关系数和回归直线方程的
有效性进行检验
END