第六章 平均指标

Download Report

Transcript 第六章 平均指标

可变的数量标志
标志值
静态平均数
变量
平
均
数
变量值
可变的统计指标
指标值
动态平均数
平均指标又称平均数,包括
• 平均指标作用:
静态平均数和动态平均数两
– 便于对同类现象在不同时间、不同
种。这里所说的平均数是指
静态平均数,它是将总体内
空间上进行比较分析。
各单位某一数量标志值的数
量差异抽象化,用来反映现
– 用来综合测定工作质量和工作效率。
象总体在一定时间、地点条
件下所达到的一般水平的综
– 是制订各项定额的依据之一。
合指标。
– 平均指标可用来估计、推算其他有关指标。
一、平均指标概述
平均指标的概念和特点
概念:平均指标反映同类现象的一般水平,是总体内各
单位参差不齐的标志值的代表值,也是对变量分布集中趋
势的测定。
所以平均数就是在同质总体内将各单位数量差异抽象化,
用以反映总体的集中趋势
特点:
• (1) 同质性
• (2)平均指标是一个代表性的数值,说明总体各单位某一
数量标志值的一般水平。
• (3)平均指标是一个抽象化的数值,把总体单位某一数量
标志上的差异抽象掉。
平均指标的作用
• (1)利用平均指标可以对不同空间的
发展水平进行比较。
• (2)利用平均指标可以对某一现象总
体在不同时间上的发展水平进行比较,
以说明这种现象发展变化的依存关系。
• (3)利用平均指标可以进行数量上的
推算。
平均指标的种类
• 1.按所计算的对象性质分类
• 可以分为数值平均数和位置平均数两种。
• 2.按计算和确定的方法分类
• 可以分为算术平均数、调和平均数、几何
平均数、众数和中位数五种。
二、算术平均数
概
念
计算 公 式
1. 算术平均数 标志总量
与总体单
(x )
位总数的
比值
简单:
x=
∑
xi
n
加权:
∑
x
i fi
x= ∑
fi
注意:
平均指标的分子与分母
总体和范围相同
特
点
优点:①容易理解
便于计算
②灵敏度高
③稳定性好
2
④ ∑(x - x) = 最小
和 ∑ (x - x )= 0
缺点:①易受极值
影响
②在偏斜分
布和U形分布中,
不具有代表性
例
• 某村民小组有10户农民,每户人口分别为2
人、3人、5人、7人、6人、5人、4人、6人、
8人、4人,则平均每户人口数为:
x=
x =
n
235 7 65 4 68 4
= 5(人/户)
10
【单向式分组例】
• 某车间工人按日产量分组资料如表6-1所示。
表6-1
某车间工人日产量
按日产量分组(件) x
工人人数(人) f
19
20
21
22
23
5
15
17
11
2
95
300
357
242
46
合计
50
1 040
xf

x
f

各组产量(件)xf
1040
19  5  20  15  21 17  22  11  23  2
 20.8 (件/人)
=
5  15  17  11  2
50
【多项式分组例】某储蓄所某年年末为120个贷
款户贷款情况
某储蓄所某年贷款情况表
贷款额(万元)
20万元以下
20~40
40~60
60~80
80~100
合计
xf

x
f
组中值
贷款户数(户) 各组贷款额(万元)
f
x
xf
10
16
160
30
28
840
50
45
2 250
70
21
1 470
90
10
900
—
120
5 620
5 620

 46.83
120
(万元)
注意点
(1)算术平均数的大小,不仅取决于研究对
象的变量值(x),而且受各变量值重复出现的
频数(f)或频率 (f/∑f)大小的影响,
频数或频率较大,该组数据的大小对算术平
均数的影响就大,反之则小。
(2)权数的表现形式问题
xf

x
f


f

  x 
 f 


3.算术平均数的数学性质
(1)各变量值与其算术平均数的离
差之和等于零.
(2)各变量值与其算术平均数的
离差平方和最小.
(3)两个独立的同性质变量代数和的
平均数等于各变量平均数的代数和.
(4)两个独立的同性质变量乘积的
平均数等于各变量平均数的乘积.
 x  x   0
 x  x   最小值
2
x y  x y
x y  x y
4.算术平均数的优缺点
• 优点
1、可用于推算总体标志总量。
2、代表性强。
3、可以进行代数运算。
4、在抽样中具有良好的稳定性和可靠性。
• 缺点
1、当总体中个别单位标志值特别大或特别小时,会
导致算术平均数偏大或偏小。
2、当组距数列有开口组时,组中值有较大假定性。
三、调和平均数
概 念
2. 调和平均数 标志值倒
( x H)
数平均数
的倒数
计算 公 式
简单:
xH 
n
S1 / xi
加权:
Smi
xH 
Smi / Xi
可理解为已知多个平均数或相
对数,再求它们的平均数。
特
点
优点:①灵敏度高
②在某种不能计算
的条件下,可以代
替
缺点:①不易理解
②易受极值影响
③有“ 0”值时不能
计算
例
• 早市上某种蔬菜的价格为0.5元/斤,中午市
场价格为0.4元/斤,晚上市场价格为0.25元/
斤,现在市场上早、中、晚各买1元钱的菜,
求平均价格。
3
3
H

 0.35
1
1
1
8.5


0.5 0.4 0.25
(元/斤)
【例】 工人日产量资料说明如表
表 某车间工人日产量
按日产量分组(件) x
19
20
21
22
23
合计
H
m
m
x
各组产量(件) m
95
300
357
242
46
1 040
1040

 20 .8
50
(件/人)
m
工人人数(人) x
5
15
17
11
2
50
相对指标和平均指标平均数的计算
1.由相对指标计算平均数
【例】 设某公司下属三个企业的产值资料如表6-7所示。
表6-7 某公司所属企业计划完成情况
实际产值(万元) xf
企业 计划完成程度(%) x 计划产值(万元)f
甲
乙
丙
110
105
94
70
100
50
77
105
47
合计
—
220
229
xf

x
f
229

 104.09%
220
【例】 设某公司下属3个企业的产值资料如
表
表6-8 某公司所属企业计划完成情况
计划产值(万元)
企业
甲
乙
丙
计划完成程度(%) x
实际产值(万元) m
110
105
94
77
105
47
70
100
50
合计
—
229
220
m 229

H

 104.09%
m 220
x
m
x
在社会经济统计学中经常用到的仅是一种特定
权数的加权调和平均数。即有以下数学关系式成立:
Xf

X 
f
Xf


1
 X Xf
式中:m  Xf ,f 
m


m
X
 Xh
m
X
m是一种特定权数,它不是各组变量值出现的次
数,而是各组标志值总量。
由平均指标计算平均数
• 【例6.12】 某企业两车间生产同种产品产
量和成本资料如表6-9所示。
表6-9
车间
甲
乙
合计
xf

x
f
某企业车间产品成本
单位成本(元)x
产量(吨) f
总成本(元) xf
600
700
1 200
1 800
720 000
1 260 000
—
3 000
1 980 000
(元/
1 980 000

 660 吨)
3 000
【例6.13】 某企业两车间生产同种产品产量
和成本资料如表6-10所示。
• 表6-10
车间
某企业车间产品成本
单位成本(元)x
总成本(元)m
产量(吨)
m
x
甲
乙
600
700
720 000
1 260 000
1 200
1 800
合计
—
1 980 000
3 000
m 1980 000

H

 660
m
3 000
x
(元/吨)
调和平均数的应用
实际中,调和平均数常用来作为算术平均数的变形
使用(m=xf),尤其是求相对数或平均数的平均数时,
如果不能直接用加权算术平均数的计算公式,就需
要采用其变形形式的调和平均数公式。二者在本质
上是相同的,唯一的区别是计算时使用了不同的数
据。
原来只是计
算时使用了
不同的数据
返回
调和平均数——例题分析
甲、乙两农贸市场某农产品价格及成交量、成交额资料如下:
品种
价格 甲市场成
乙市场成
(元/千 交额 (元) 交量(千
m
克) f
克) x
m/x
xf
一
二
三
1.2
1.4
1.5
12000
28000
15000
20000
10000
10000
10000 24000
20000 14000
10000 15000
合计
——
55000
40000
40000 53000
试问该农产品哪一个市场的平均价格比较高?并说明
原因。
例题分析
解:甲市场已知的是成交额(m)数据,需要求出成交量(m/x)
数据,因此计算平均价格在形式上应采用加权调和平均数公
式,即:
(元/千克)
而乙市场以知的是成交量(f)数据,需要求出成交额(xf)
数据,因此,计算平均价格在形式上应采用加权算术平均数
公式,即:
•
(元/千克)
由此可知农产品在甲市场的平均价格高于乙市场。主要原因
是甲市场价格高的农产品成交量所占比重比乙市场大。这体
现了权数对加权平均数的影响。
第五,调和平均的特点
• 1.调和平均数易受极端值的影响,且受
极小值的影响比受极大值的影响更大。
• 2.只要有一个变量值为零,就不能计算
调和平均数。
• 3.当组距数列有开口组时,其组中值即
使按相邻组距计算了,假定性也很大,
这时,调和平均数的代表性就很不可靠。
• 4.调和平均数应用的范围较小。
例题
• 例一
水果甲级每元1公斤,乙级每元1。5公斤,丙级每
元2公斤。问:
• (1)若各买1公斤,平均每元可买多少公斤?
• (2)题例各买6.5公斤,平均每元可买多少公斤?
• (3)甲级3公斤,乙级2公斤,丙级1公斤,平均每元可买
几公斤?
• (4)甲乙丙三级各买1元,每元可买几公斤?
• 例二
自行车赛时速:甲30公里,乙28公里,丙20公里,
全程200公里,问三人平均时速是多少?若甲乙丙三人各骑
车2小时,平均时速是多少?
f

H
1
xf

200 200 200
600

 25.2(公里/小时)
1
1
1
 200  200  200 23.81
30
28
20
xf 30 2  28 2  20 2 156

x


 26(公里/小时)
222
6
f
第四节 几何平均数
概 念
3. 几何平均数 几个变量
( xG)
值连乘积
的几次根
计算 公 式
特
简单:
xG  n p xi
加权:
Sfi
xG  pxi
一般适用于各变量值之间存在
环比关系的事物。如:银行平
均利率、各年平均发展速度。
fi
点
优点:灵敏度高
②受极值影响小
于 和
③适宜于各比率
之积为总比率的变
量求平均
缺点:①有“ 0”或负
值时不能计算
②偶数项数列只
能用正根
简单几何平均【例】
• 某企业有5个流水作业的车间,1月份第一
车间产品合格率为98%,第二车间产品合
格率为96%,第三车间产品合格率为95%,
第四车间产品合格率为94%,第五车间产
品合格率为92%。试求该厂1月份平均产品
合格率。
G  n  x  5 98%  96%  95%  94%  92%  94.98%
加权几何平均【例】
• 某企业一笔长期贷款按复利计算利息,10
年间年利率为9%的有3年,年利率为11%的
有4年,年利率为12%的有2年,年利率为
13%的有1年。试计算10年间该笔贷款的平
均年利率。
G
3 4 21
1.093 1.114 1.122 1.131
 10 2.786 672  110.79%
110.79%-1=10.79%
△ 几何平均数的特点
如果数列中有一个标志值等于零或负值,就无法
计算 X ;
受极端值的影响较 X 和 X h小;
它适用于反映特定现象的平均水平,即现象的总
标志值是各单位标志值的连乘积。
•
(几何平均法主要用于动态平均数的计算。)
G
第五节 众数和中位数
概 念
5. 众数
(Mo)
分配数列
中出现次
数最多的
标志值位
置平均数
计算 公 式
上限公式:
Mo U 
d2
´i
d1  d 2
下限公式:
Mo  L 
d1
´i
d1  d 2
d1-众数所在组与前一组频数的差。
d2-众数所在组与下一组频数的差。
特
点
优点:
①容易理解,
②不受极值影
响
缺点:
①灵敏度和计
算功能差
②稳定性差
③具有不唯一
性
2.众数的计算(众数的不唯一性)
无众数
原始数据: 10
一个众数
原始数据: 6
5
5
9
9
多于一个众数
原始数据:
25 28
12
8
5
6
8
5
28 36 42 42
【例】
• 某地区2006年调查工业企业工人人均收入情况,
共抽查1 000人,取得平均月收入资料如表6-12所
示。 表6-12
某地区工业企业工人收入情况
平均月收入(元)
人数
800以下
800-1000
1000-1200
1200-1400
1400-1600
1600以上
60
110
150
500
130
50
合计
1000
1
350
M0  L 
d  1200 
 200  1297 .22 (元)
1   2
350  370
• 众数特点
• 1.众数不受分布数列的极大或极小值的影响.
• 2.当分组数列没有任何一组的次数占多数,
而是近似于均匀分布时,则该次数分配数列无
众数。若将无众数的分布数列重新分组或各组
频数依序合并,又会使分配数列再现出明显的
集中趋势。
• 3.如果与众数组相比邻的上下两组的次数相
等,则众数组的组中值就是众数值;如果与
众数组比邻的上一组的次数较多,而下一组
的次数较少,则众数在众数组内会偏向该组
下限;如果与众数组比邻的上一组的次数较
少,而下一组的次数较多,则众数在众数组
内会偏向该组上限。
• 4.缺乏敏感性。这是由于众数的计算只利用
了众数组的数据信息,不象数值平均数那样
利用了全部数据信息。
概 念
4. 中位数
(Me)
标志值由
小到大顺
序排列中
居中间位
置的标志
值位置平
均数
计算 公 式
上限公式:
Me  U 
下限公式:
Me  L 
Sm–1-中位数所在组以下的
累计次数。
Sm+1-中位数所在组以上的
累计次数。
Sf / 2  Sm  1
´i
fm
Sf / 2  Sm  1
´i
fm
特
点
优点:①容易
理解,
②不受极值
影响
③适宜于开口
组资料和些不
能用数字测定
的事物
缺点:①灵敏
度和计算功能
差
②间断数Me
2.中位数的计算
• 确定中位数,必须将总体各单位的标志值按大小
顺序排列,最好是编制出变量数列。这里有两种
情况:
• 对于未分组的原始资料,首先必须将标志值按大
小排序。设排序的结果为:
x1  x 2  x3    x n

 x n 1
 2

Me  
 xn  xn
1
 2
2

2

(n为奇数)
(n为偶数)
例1:24名IT从业人员年薪资料表如下所示,计算该24名
IT人员的中位数
4910 4860 4995 4880 4720 4990 5135 5460
0
0
0
0
0
0
0
0
4930 5120 5100 4940 5140 5180 4960 5340
0
0
0
0
0
0
0
0
4870 5030 4900 4980 4890 4865 5130 5190
排序得:
0
0
0
0
0
0
0
0
47200 48600 48650 48700 48800 48900 49000 49100
49300 49400 49600 49800 49900 49950 50300 51000
51200 51300 51350 51400 51800 51900 53400 54600
中位数的位置在(24+1)/2 = 12.5,中位数在第12个数值
(49800)和第13个数值(49900)之间,即
Me = (49800+49900)/2=49850(元)。
【分组数据例】某地2006年粮食产量资料如表,试
确定中位数。
表 某第2006年粮食产量
按单位面积产量分
播种面积(公顷)
组(公斤/公顷)
向上累计次数
向下累计次数
3000以下
3000-4000
4000-5000
5000-6000
6000以上
30
78
110
90
42
30
108
218
308
350
350
320
242
132
42
合计
350
—
—
中位数位次=
f
Me  L 
2
f
2
 S m1
fm

350
 175
2
350
 108
d
 4000 2
 1000  4609.09 (公斤/公顷)
110
• 中位数特点
• A.中位数是以它在所有标志值中所处的位置确定
的全体单位标志值的代表值,不受分布数列的极
大或极小值影响,从而在一定程度上提高了中位
数对分布数列的代表性。
• B.有些离散型变量的单项式数列,当次数分布偏
态时,中位数的代表性会受到影响。
• C.缺乏敏感性。
六、各种平均数之间的相互关系
• 一、 算术平均数、几何平均数和调和平均数
三者之间的关系
H≤
例
G≤
x
变量值 4,8,10,12
X  8.5
X h  7.16
X G  7.87
二、 算术平均数与众数、中位数之
间的关系
• 在对称分布(即正态)时x  M e  M o
• 在右偏时
Mo  Me  x
• 在左偏时
x  Me  Mo
• 适度偏态时
M o  x  3(M e  x)
众数与算术平均数的距离约为中
位数与算术平均数距离的3倍
对称分布
右偏分布
x
M1
M0
M 0 M1 x
左偏分布
x M1 M 0
例:
一组工人的月收入众数为700元,月收入的算术平
均数为1000元,则月收入的中位数近似值是:
1
1
M e  ( M 0  2 X )  (700  2  1000)  900(元)
3
3
 X  M e  M 0 , 所以分布右偏。