Transcript 第六章 平均指标
可变的数量标志 标志值 静态平均数 变量 平 均 数 变量值 可变的统计指标 指标值 动态平均数 平均指标又称平均数,包括 • 平均指标作用: 静态平均数和动态平均数两 – 便于对同类现象在不同时间、不同 种。这里所说的平均数是指 静态平均数,它是将总体内 空间上进行比较分析。 各单位某一数量标志值的数 量差异抽象化,用来反映现 – 用来综合测定工作质量和工作效率。 象总体在一定时间、地点条 件下所达到的一般水平的综 – 是制订各项定额的依据之一。 合指标。 – 平均指标可用来估计、推算其他有关指标。 一、平均指标概述 平均指标的概念和特点 概念:平均指标反映同类现象的一般水平,是总体内各 单位参差不齐的标志值的代表值,也是对变量分布集中趋 势的测定。 所以平均数就是在同质总体内将各单位数量差异抽象化, 用以反映总体的集中趋势 特点: • (1) 同质性 • (2)平均指标是一个代表性的数值,说明总体各单位某一 数量标志值的一般水平。 • (3)平均指标是一个抽象化的数值,把总体单位某一数量 标志上的差异抽象掉。 平均指标的作用 • (1)利用平均指标可以对不同空间的 发展水平进行比较。 • (2)利用平均指标可以对某一现象总 体在不同时间上的发展水平进行比较, 以说明这种现象发展变化的依存关系。 • (3)利用平均指标可以进行数量上的 推算。 平均指标的种类 • 1.按所计算的对象性质分类 • 可以分为数值平均数和位置平均数两种。 • 2.按计算和确定的方法分类 • 可以分为算术平均数、调和平均数、几何 平均数、众数和中位数五种。 二、算术平均数 概 念 计算 公 式 1. 算术平均数 标志总量 与总体单 (x ) 位总数的 比值 简单: x= ∑ xi n 加权: ∑ x i fi x= ∑ fi 注意: 平均指标的分子与分母 总体和范围相同 特 点 优点:①容易理解 便于计算 ②灵敏度高 ③稳定性好 2 ④ ∑(x - x) = 最小 和 ∑ (x - x )= 0 缺点:①易受极值 影响 ②在偏斜分 布和U形分布中, 不具有代表性 例 • 某村民小组有10户农民,每户人口分别为2 人、3人、5人、7人、6人、5人、4人、6人、 8人、4人,则平均每户人口数为: x= x = n 235 7 65 4 68 4 = 5(人/户) 10 【单向式分组例】 • 某车间工人按日产量分组资料如表6-1所示。 表6-1 某车间工人日产量 按日产量分组(件) x 工人人数(人) f 19 20 21 22 23 5 15 17 11 2 95 300 357 242 46 合计 50 1 040 xf x f 各组产量(件)xf 1040 19 5 20 15 21 17 22 11 23 2 20.8 (件/人) = 5 15 17 11 2 50 【多项式分组例】某储蓄所某年年末为120个贷 款户贷款情况 某储蓄所某年贷款情况表 贷款额(万元) 20万元以下 20~40 40~60 60~80 80~100 合计 xf x f 组中值 贷款户数(户) 各组贷款额(万元) f x xf 10 16 160 30 28 840 50 45 2 250 70 21 1 470 90 10 900 — 120 5 620 5 620 46.83 120 (万元) 注意点 (1)算术平均数的大小,不仅取决于研究对 象的变量值(x),而且受各变量值重复出现的 频数(f)或频率 (f/∑f)大小的影响, 频数或频率较大,该组数据的大小对算术平 均数的影响就大,反之则小。 (2)权数的表现形式问题 xf x f f x f 3.算术平均数的数学性质 (1)各变量值与其算术平均数的离 差之和等于零. (2)各变量值与其算术平均数的 离差平方和最小. (3)两个独立的同性质变量代数和的 平均数等于各变量平均数的代数和. (4)两个独立的同性质变量乘积的 平均数等于各变量平均数的乘积. x x 0 x x 最小值 2 x y x y x y x y 4.算术平均数的优缺点 • 优点 1、可用于推算总体标志总量。 2、代表性强。 3、可以进行代数运算。 4、在抽样中具有良好的稳定性和可靠性。 • 缺点 1、当总体中个别单位标志值特别大或特别小时,会 导致算术平均数偏大或偏小。 2、当组距数列有开口组时,组中值有较大假定性。 三、调和平均数 概 念 2. 调和平均数 标志值倒 ( x H) 数平均数 的倒数 计算 公 式 简单: xH n S1 / xi 加权: Smi xH Smi / Xi 可理解为已知多个平均数或相 对数,再求它们的平均数。 特 点 优点:①灵敏度高 ②在某种不能计算 的条件下,可以代 替 缺点:①不易理解 ②易受极值影响 ③有“ 0”值时不能 计算 例 • 早市上某种蔬菜的价格为0.5元/斤,中午市 场价格为0.4元/斤,晚上市场价格为0.25元/ 斤,现在市场上早、中、晚各买1元钱的菜, 求平均价格。 3 3 H 0.35 1 1 1 8.5 0.5 0.4 0.25 (元/斤) 【例】 工人日产量资料说明如表 表 某车间工人日产量 按日产量分组(件) x 19 20 21 22 23 合计 H m m x 各组产量(件) m 95 300 357 242 46 1 040 1040 20 .8 50 (件/人) m 工人人数(人) x 5 15 17 11 2 50 相对指标和平均指标平均数的计算 1.由相对指标计算平均数 【例】 设某公司下属三个企业的产值资料如表6-7所示。 表6-7 某公司所属企业计划完成情况 实际产值(万元) xf 企业 计划完成程度(%) x 计划产值(万元)f 甲 乙 丙 110 105 94 70 100 50 77 105 47 合计 — 220 229 xf x f 229 104.09% 220 【例】 设某公司下属3个企业的产值资料如 表 表6-8 某公司所属企业计划完成情况 计划产值(万元) 企业 甲 乙 丙 计划完成程度(%) x 实际产值(万元) m 110 105 94 77 105 47 70 100 50 合计 — 229 220 m 229 H 104.09% m 220 x m x 在社会经济统计学中经常用到的仅是一种特定 权数的加权调和平均数。即有以下数学关系式成立: Xf X f Xf 1 X Xf 式中:m Xf ,f m m X Xh m X m是一种特定权数,它不是各组变量值出现的次 数,而是各组标志值总量。 由平均指标计算平均数 • 【例6.12】 某企业两车间生产同种产品产 量和成本资料如表6-9所示。 表6-9 车间 甲 乙 合计 xf x f 某企业车间产品成本 单位成本(元)x 产量(吨) f 总成本(元) xf 600 700 1 200 1 800 720 000 1 260 000 — 3 000 1 980 000 (元/ 1 980 000 660 吨) 3 000 【例6.13】 某企业两车间生产同种产品产量 和成本资料如表6-10所示。 • 表6-10 车间 某企业车间产品成本 单位成本(元)x 总成本(元)m 产量(吨) m x 甲 乙 600 700 720 000 1 260 000 1 200 1 800 合计 — 1 980 000 3 000 m 1980 000 H 660 m 3 000 x (元/吨) 调和平均数的应用 实际中,调和平均数常用来作为算术平均数的变形 使用(m=xf),尤其是求相对数或平均数的平均数时, 如果不能直接用加权算术平均数的计算公式,就需 要采用其变形形式的调和平均数公式。二者在本质 上是相同的,唯一的区别是计算时使用了不同的数 据。 原来只是计 算时使用了 不同的数据 返回 调和平均数——例题分析 甲、乙两农贸市场某农产品价格及成交量、成交额资料如下: 品种 价格 甲市场成 乙市场成 (元/千 交额 (元) 交量(千 m 克) f 克) x m/x xf 一 二 三 1.2 1.4 1.5 12000 28000 15000 20000 10000 10000 10000 24000 20000 14000 10000 15000 合计 —— 55000 40000 40000 53000 试问该农产品哪一个市场的平均价格比较高?并说明 原因。 例题分析 解:甲市场已知的是成交额(m)数据,需要求出成交量(m/x) 数据,因此计算平均价格在形式上应采用加权调和平均数公 式,即: (元/千克) 而乙市场以知的是成交量(f)数据,需要求出成交额(xf) 数据,因此,计算平均价格在形式上应采用加权算术平均数 公式,即: • (元/千克) 由此可知农产品在甲市场的平均价格高于乙市场。主要原因 是甲市场价格高的农产品成交量所占比重比乙市场大。这体 现了权数对加权平均数的影响。 第五,调和平均的特点 • 1.调和平均数易受极端值的影响,且受 极小值的影响比受极大值的影响更大。 • 2.只要有一个变量值为零,就不能计算 调和平均数。 • 3.当组距数列有开口组时,其组中值即 使按相邻组距计算了,假定性也很大, 这时,调和平均数的代表性就很不可靠。 • 4.调和平均数应用的范围较小。 例题 • 例一 水果甲级每元1公斤,乙级每元1。5公斤,丙级每 元2公斤。问: • (1)若各买1公斤,平均每元可买多少公斤? • (2)题例各买6.5公斤,平均每元可买多少公斤? • (3)甲级3公斤,乙级2公斤,丙级1公斤,平均每元可买 几公斤? • (4)甲乙丙三级各买1元,每元可买几公斤? • 例二 自行车赛时速:甲30公里,乙28公里,丙20公里, 全程200公里,问三人平均时速是多少?若甲乙丙三人各骑 车2小时,平均时速是多少? f H 1 xf 200 200 200 600 25.2(公里/小时) 1 1 1 200 200 200 23.81 30 28 20 xf 30 2 28 2 20 2 156 x 26(公里/小时) 222 6 f 第四节 几何平均数 概 念 3. 几何平均数 几个变量 ( xG) 值连乘积 的几次根 计算 公 式 特 简单: xG n p xi 加权: Sfi xG pxi 一般适用于各变量值之间存在 环比关系的事物。如:银行平 均利率、各年平均发展速度。 fi 点 优点:灵敏度高 ②受极值影响小 于 和 ③适宜于各比率 之积为总比率的变 量求平均 缺点:①有“ 0”或负 值时不能计算 ②偶数项数列只 能用正根 简单几何平均【例】 • 某企业有5个流水作业的车间,1月份第一 车间产品合格率为98%,第二车间产品合 格率为96%,第三车间产品合格率为95%, 第四车间产品合格率为94%,第五车间产 品合格率为92%。试求该厂1月份平均产品 合格率。 G n x 5 98% 96% 95% 94% 92% 94.98% 加权几何平均【例】 • 某企业一笔长期贷款按复利计算利息,10 年间年利率为9%的有3年,年利率为11%的 有4年,年利率为12%的有2年,年利率为 13%的有1年。试计算10年间该笔贷款的平 均年利率。 G 3 4 21 1.093 1.114 1.122 1.131 10 2.786 672 110.79% 110.79%-1=10.79% △ 几何平均数的特点 如果数列中有一个标志值等于零或负值,就无法 计算 X ; 受极端值的影响较 X 和 X h小; 它适用于反映特定现象的平均水平,即现象的总 标志值是各单位标志值的连乘积。 • (几何平均法主要用于动态平均数的计算。) G 第五节 众数和中位数 概 念 5. 众数 (Mo) 分配数列 中出现次 数最多的 标志值位 置平均数 计算 公 式 上限公式: Mo U d2 ´i d1 d 2 下限公式: Mo L d1 ´i d1 d 2 d1-众数所在组与前一组频数的差。 d2-众数所在组与下一组频数的差。 特 点 优点: ①容易理解, ②不受极值影 响 缺点: ①灵敏度和计 算功能差 ②稳定性差 ③具有不唯一 性 2.众数的计算(众数的不唯一性) 无众数 原始数据: 10 一个众数 原始数据: 6 5 5 9 9 多于一个众数 原始数据: 25 28 12 8 5 6 8 5 28 36 42 42 【例】 • 某地区2006年调查工业企业工人人均收入情况, 共抽查1 000人,取得平均月收入资料如表6-12所 示。 表6-12 某地区工业企业工人收入情况 平均月收入(元) 人数 800以下 800-1000 1000-1200 1200-1400 1400-1600 1600以上 60 110 150 500 130 50 合计 1000 1 350 M0 L d 1200 200 1297 .22 (元) 1 2 350 370 • 众数特点 • 1.众数不受分布数列的极大或极小值的影响. • 2.当分组数列没有任何一组的次数占多数, 而是近似于均匀分布时,则该次数分配数列无 众数。若将无众数的分布数列重新分组或各组 频数依序合并,又会使分配数列再现出明显的 集中趋势。 • 3.如果与众数组相比邻的上下两组的次数相 等,则众数组的组中值就是众数值;如果与 众数组比邻的上一组的次数较多,而下一组 的次数较少,则众数在众数组内会偏向该组 下限;如果与众数组比邻的上一组的次数较 少,而下一组的次数较多,则众数在众数组 内会偏向该组上限。 • 4.缺乏敏感性。这是由于众数的计算只利用 了众数组的数据信息,不象数值平均数那样 利用了全部数据信息。 概 念 4. 中位数 (Me) 标志值由 小到大顺 序排列中 居中间位 置的标志 值位置平 均数 计算 公 式 上限公式: Me U 下限公式: Me L Sm–1-中位数所在组以下的 累计次数。 Sm+1-中位数所在组以上的 累计次数。 Sf / 2 Sm 1 ´i fm Sf / 2 Sm 1 ´i fm 特 点 优点:①容易 理解, ②不受极值 影响 ③适宜于开口 组资料和些不 能用数字测定 的事物 缺点:①灵敏 度和计算功能 差 ②间断数Me 2.中位数的计算 • 确定中位数,必须将总体各单位的标志值按大小 顺序排列,最好是编制出变量数列。这里有两种 情况: • 对于未分组的原始资料,首先必须将标志值按大 小排序。设排序的结果为: x1 x 2 x3 x n x n 1 2 Me xn xn 1 2 2 2 (n为奇数) (n为偶数) 例1:24名IT从业人员年薪资料表如下所示,计算该24名 IT人员的中位数 4910 4860 4995 4880 4720 4990 5135 5460 0 0 0 0 0 0 0 0 4930 5120 5100 4940 5140 5180 4960 5340 0 0 0 0 0 0 0 0 4870 5030 4900 4980 4890 4865 5130 5190 排序得: 0 0 0 0 0 0 0 0 47200 48600 48650 48700 48800 48900 49000 49100 49300 49400 49600 49800 49900 49950 50300 51000 51200 51300 51350 51400 51800 51900 53400 54600 中位数的位置在(24+1)/2 = 12.5,中位数在第12个数值 (49800)和第13个数值(49900)之间,即 Me = (49800+49900)/2=49850(元)。 【分组数据例】某地2006年粮食产量资料如表,试 确定中位数。 表 某第2006年粮食产量 按单位面积产量分 播种面积(公顷) 组(公斤/公顷) 向上累计次数 向下累计次数 3000以下 3000-4000 4000-5000 5000-6000 6000以上 30 78 110 90 42 30 108 218 308 350 350 320 242 132 42 合计 350 — — 中位数位次= f Me L 2 f 2 S m1 fm 350 175 2 350 108 d 4000 2 1000 4609.09 (公斤/公顷) 110 • 中位数特点 • A.中位数是以它在所有标志值中所处的位置确定 的全体单位标志值的代表值,不受分布数列的极 大或极小值影响,从而在一定程度上提高了中位 数对分布数列的代表性。 • B.有些离散型变量的单项式数列,当次数分布偏 态时,中位数的代表性会受到影响。 • C.缺乏敏感性。 六、各种平均数之间的相互关系 • 一、 算术平均数、几何平均数和调和平均数 三者之间的关系 H≤ 例 G≤ x 变量值 4,8,10,12 X 8.5 X h 7.16 X G 7.87 二、 算术平均数与众数、中位数之 间的关系 • 在对称分布(即正态)时x M e M o • 在右偏时 Mo Me x • 在左偏时 x Me Mo • 适度偏态时 M o x 3(M e x) 众数与算术平均数的距离约为中 位数与算术平均数距离的3倍 对称分布 右偏分布 x M1 M0 M 0 M1 x 左偏分布 x M1 M 0 例: 一组工人的月收入众数为700元,月收入的算术平 均数为1000元,则月收入的中位数近似值是: 1 1 M e ( M 0 2 X ) (700 2 1000) 900(元) 3 3 X M e M 0 , 所以分布右偏。