统计学原理第九章1-2节

Download Report

Transcript 统计学原理第九章1-2节

统计学原理
第九章
相关与回归分析
第九章
相关与回归分析
内容提要
第一节
相关分析的一般问题
第二节
相关关系的判断
第三节
回归分析的一般问题
第四节 回归模型的建立与检测
本章习题
下一章
内容提要
相关分析与回归分析是两种既有区别又有联
系的统计分析方法。本章阐述了相关关系的概念
与特点;相关关系与函数关系的区别与联系;相
关关系的种类;相关关系的测定方法(直线相关
系数的含义、计算方法与运用);回归分析的概
念与特点;直线回归方程的求解及其精确度的评
价;估计标准误差的计算。
返回
第一节
相关分析的一般问题
一、相关关系的概念与特点
(一)相关关系的概念
相关关系是指现象之间客观存在的,在数
量变化上受随机因素的影响,非确定性的相互
依存关系。
(二)相关关系的主要特点
1.相关关系表现为数量相互依存关系。
2.相关关系在数量上表现为非确定性
的相互依存关系。
二、相关关系的种类
(一)相关关系按变量的多少,可分为单相
关和复相关
单相关是指两个变量间的相关关系,如
自变量x和因变量y的关系。
复相关是指多个自变量与因变量间的相关
关系。
(二)相关关系从表现形态上划分,可分为
直线相关和曲线相关
直线相关是指两个变量的对应取值在坐标
图中大致呈一条直线。
曲线相关是指两个变量的对应取值在坐
标图中大致呈一条曲线,如抛物线、指数曲线、
双曲线等。
(三)相关关系从变动方向上划分,可
分为正相关和负相关
正相关是指直线相关中,两个变量的变动
方向相同,即变量x增加,变量y也相应增加;
变量x减少,变量y也相应减少。
负相关是指直线相关中,两个变量的变动
方向相反,即变量x增加,变量y反而减少;变
量x减少,变量y反而增多。
(四)按相关的密切程度分,有完全相关、
不完全相关和不相关
完全相关是两个变量之间有确定的函数关系。
若两个变量之间有一定联系,当一个变量变化
时,另一个变量也会因此发生变化,但不存在严
格的函数关系,称为不完全相关。
若两个变量之间各自独立,当一个变量变化,
另一个变量不变化,或呈不规则变化,两者没有
依存关系,称为不相关。
三、相关分析的内容
(一)判别现象间有无相关关系
(二)判定相关关系的表现形态和密切程度
第二节
相关关系的判断
一、相关关系的一般判断
(一)定性分析
对现象进行定性分析,就是根据现
象质的规定性,运用理论知识、专业知
识、实际经验来进行判断和分析。
(二)相关表
相关表就是把被研究现象的观察值
对应排列所形成的统计表格。
表9—1
某地区工业劳动者数与工业增加值相关表
工业劳动者数(万人)
工业增加值(亿元)
1373
1501
1400
1375
2416
2881
2979
2224
1705
156
174
179
212
257
401
527
565
345
303
相关表中的两列数据叫相关数列,它有
别于变量数列。相关表中的数值是变量的观
测值,是实际资料,是样本数据,它是判别
相关关系的基础。在相关表中,如果观测值
的分布呈现一定的规律性,则表明现象间存
在相关关系。
相关表可分为简单相关表和分组相关表。
(三)相关图
相关图也叫相关散点图,它是根据相
关表中的观测数据在坐标图中所绘制的点
状图形。用x和y分别代表两个变量,把相
关表中的对应观测值一一描绘在坐标图中,
则形成了反映相关点分布状况的图形,据
此就可以观测现象间相关关系的情况。
图9—1
图9—2 商品销售额与流通费用率相关图
二、相关系数
(一)相关系数的含义
相关系数是指直线相关条件下,说明两现
象之间相关关系密切程度的统计分析指标,用
r表示。其定义公式为:
r 

  x  x  y  y 
2
xy
 y

y
n
 x  x 
n
2
[公式9—1]


y

y

2
n
式中




2
xy
 ( x  x)
为协方差;
n
( x - x)
2
x

为 自 变 量 x数 列 的 标 准 差 ;
n
( y - y)
2
y

n
为 因 变 量 y数 列 的 标 准 差
依相关系数的定义公式可知相关系数的含
义如下:
(1)r的取值范围为-1≤r≤1。因为协方差
的绝对值最小为0,最大为σx和σy的乘积。
(2)r的绝对值越接近于1,表明相关关系越
密切;越接近于0,表明相关关系越不密切。
(3)r=+1或r=-1,表明两现象完全相关。
(4)r=0,表明两变量无直线相关关系。
(5)r>0,表明现象呈正直线相关;r<0,
表明现象呈负直线相关。实际中|r|<0.3,
视为无相关;0.3≤|r|<0.5,为低
度相关;0.5|r|<0.8,为显著相
关;|r|≥0.8,一般称为高度相关。
(二)相关系数的计算
1.根据相关系数的定义公式可直接计
算相关系数。
【例9-1】已知某地生产总值和社会零
售总额的历史资料见表9-4

表9-4
某地生产总值和社会零售后总额资料
年份(序号)
生产总值
社会商品零售总额
1
39
20
2
45
22
3
52
26
4
63
34
5
70
36
6
80
39
7
85
40
相
关
系
数
计
算
表
现根据9-4的资料,用定义公式计算相关
系数,其计算结果列于表9-5中

表9-5

根据表9-5的数据得
  x  x  y  y 
r 
n
2
2




x

x
y

y


n
n
850
7

 0 . 985
1836
406
7
7
2.相关系数的简捷计算法
按照定义公式计算相关系数r运算量较大,
过程繁琐,实践中多采用由定义公式推导出的
简捷公式计算相关系数。简捷计算公式为:
r 
n  xy 
n  x   x 
2
2
 x
y
n  y   y 
2
2
[公式9—2]
用简捷公式计算相关系数为
r
n  xy   x  y
n  x   x 
2

n  y   y 
2
2
2
7  14304  434  217
7  28744   434 
2
7  7133   217 
 0 . 985
2
3.相关系数的其他公式
r 
  x  x  y  y 
 x  x    y  y 
2
r 
[公式9—3]
2
 xy  n  x y
x
2
 nx 
r 

2
xy  n  x y
 x
y
y  n y 
2
2
[公式9—4]
[公式9—5]