余根钱——使用统计数据应注意的常见问题

Download Report

Transcript 余根钱——使用统计数据应注意的常见问题

使用统计数据应
注意的常见问题
国家统计局统计科学研究所
余根钱
© 2009年10月17日
电 话:68783972 E-mail:[email protected]
核心观点
做现实经济问题研究,需要大量地使用各种统计
数据。但数据不是拿来就能用,有很多具体的问题需
要处理,某些看上去和我们需要数据完全一样指标,
但实际上却有较大差异。如果不注意这些问题,那么
分析结果就会出错。
提 纲
一、准确理解统计数据的含义
二、注意数据之间的可比性
三、注意随机因素的影响
四、注意统计数据的质量
五、注意数据异常
六、注意春节和节假日因素
七、注意季节因素
一、准确理解统计数据的含义
使用统计数据,当然希望数据的内涵与我们的
要求完全一样,但这实际上很难。要把一个通常所
说的概念转化成可统计的指标就必须作各种各样的
限定,否则没有办法统计。
准确理解统计数据的含义,首先要搞清楚数据是
怎么统计的,这样才能准确地把握指标的含义;其
次要搞清楚能反映问题,在分析中能起什么作用。
失业的统计问题
有一天,与一书摊的摊主聊天,我问:“下岗
了?”他马上说:“什么下岗?失业了!”
按我的理解,失业怎么也不可能是一个这样的概
念。因此每个人对失业的理解是不一样,假大家都自
己的理解来使用失业的数据,那么结果肯定会出错。
按通常的理解,失业就是没有工作,但这是没法
统计的。现实中不参加工作的人很多,失业只是其中
的一种情况。
失业的统计问题
统计中关于失业人员规定是:
有劳动能力
有工作愿意——正在找工作
在规定的期限没有从事有报酬的劳动
人口范围
各国失业统计的具体规定是不一样,我国也有登
记失业率和调查失业率等概念,但含义和作用都不一
样。
失业率能起什么作用
有了失业人员的统计数据,就可以计算出失业率。
失业率能准确地反映失业程度吗?失业率高就是失业
更严重吗?两个国家之间,谁的失业率就失业更严重
吗?失业率到多高可称为失业问题严重,失业率降到
多少以下可以称为充分就业?
▲ 1998年的减员增效和下岗
▲ 金融危机后美国17个州推行“工作共享” 计
划
▲ 各国的失业率差异很大
产成品库存和产销率能否反映供求状况
30
2004年,工业产
成品库存增长率
不断上升,有人
认为这是一个突
出问题,有可能
意味着需求不足。
25
20
15
10
5
0
00.12 01.09 02.06 03.03 03.12 04.09 05.06
工业产成品库存增长率的变动情况
产成品库存和产销率能否反映供求状况
2008年四季度,金融危机造成需求严重不足,但企业库存
不是增加了,而是大幅减少。据测算,虽然今年一季度全社会
固定资产投资增长28.8%,但受库存下降的拖累,资本形成总
额实际仅增长7%左右。
这一事实说明,需求不足不会造成库存增加,因此不会从
产销率或产成品库存中反映出来。为什么会这样呢?这是由企
业以销定产的行为决定的。传统体制时期,企业可以为库存而
生产,但在市场经济条件下,这样做是要破产,企业不可能自
寻死路。
2004年产成品库存增长率上升是价格上升和销售收入增长
加快的结果,而不是需求不足的表现。
统计必须考虑现实可行性
统计指标为什么往往会与理论概念有一定差异呢?原因
之一就在于统计必须考虑现实可行性,严格按理论概念进行
统计往往是不可行的。
统计过程是很复杂的,一个统计数据往往涉及几十万个
调查单位。报表设计可以由专业人员进行,但牵涉的填报人
员这么多,水平差距很大。博士设计的表,让初中生去填,
必须考虑能否理解的问题,还要考虑填报工作量和难易程度。
如果填报人员理解不了,或者工作量过大,那么再好的概念
也是没有用的,因此统计只能统计那些可行的指标。实例:
GDP和国民收入
个体户调查
全社会的数据
统计数据的三维定义
我们经常会问:北京的人均收入是多少,和上
海比,谁更高?
从统计角度看,这一提问不够严格,就是没有明
确的时间,不过可以按习惯来理解,就是指最新的
收入,比如指2008年或今年上半年。只有加上时间
维以后,统计数据的含义才是确切的。任何一个统
计数据,除指标内涵以外,还需要有三个维度,即:
统计数据=指标内涵+范围、口径、时间
统计数据的三维定义
问题中的人均收入就是指标内涵;北京和上海
就是范围;另外人口还需要明确是全部人口、城镇
人口还 是农村人口,这就是统计口径。
拿到统计数据后,不仅要搞清楚它的含义,还
必须把另外三个维度都搞清楚才能使用。
有时,各种统计口径之间差异很小,很容易搞
错。如居民可支配收入有城镇和城市之间,工业增
加值有乡及乡以上工业、独立核算工业、规模以上
工业、国有独立核算工业等等。
二、注意数据之间的可比性
1.历史数据的可比性
2.关联数据的可比性
3.数据调整引起的问题
4.指标内涵的可比性
1.历史数据的可比性
为了考察经济变动规律,需要把很长时期的数
据放在一起使用,这时候会遇到统计口径变动的困
扰。统计口径变动有几种情况呢?如何应对?
统计口径变化的三种情况
第一种情况是统计调查制度变化。如固定资
产投资统计定报制度,1992年及以前的统计范围
为全民所有制单位;1993-2003年为国有及其他
单位;2004年以后为城镇规模以上投资项目。又
如月度工业增加值,1996年以前没有统计,只能
用相近的乡及乡以上工业企业总产值代替,1996
年为乡及乡以上工业,1997年以后为规模以上工
业企业。
统计口径变化的三种情况
第二种情况是政策因素引起的变动。如2000年,
国有银行剥离不良贷款,造成贷款余额不可比。
2004年6月份,中国银行和建设银行股份制改造,
又一次剥离不良贷款,引发了同样的问题。
银行剥离不良贷款以后,存贷差必然会扩大,
存贷款还有意义?
统计口径变化的三种情况
第三种情况是调整计算范围。如2001年把证
券保证金纳入M2的统计范围。1993年,金融统计
口径由国有银行调整为金融机构时,M1、M2的统
计范围都变了。需要注意的是,这种统计口径变
动往往只有调整时有说明,而在一些公开出版的
统计数据中则没有说明,因此使用数据时必须特
别注意。
两种口径下的货币流通速度可比吗?
统计口径变化的处理方法
统计口径不同的数据是不可比,但同一口径的数据
往往很短,时间序列过短,会造成很多分析无法进行,
怎么办法呢?
●研究变化趋势时可用增长率进行联接
●建立回归模型可用虚拟变量
●研究指标之间关系,特别是平衡关系时,则没有
统一的方法可用
不同口径仍可比的实例
工业增加值率:把现在规模以上的统计数据与
以前独立核算工业进行比较,是有意义。
城乡居民收入比较:收入水平可比性较差,但
增长率的可比性较强,比较增长率还要考虑两者价
格指数的差异。
注意事项:若要把口径不同的数据放在一起使
用,那么就必须要说明为什么可比。
2.关联数据的可比性
▲估计粮食生产函数面临的问题。播种面
积、劳动力、其他投入。
▲投资、工业、劳动力、科技等
▲规模以上工业和规模以上能源工业
3.数据调整引起的问题
刚到统计局的时候,领导让我查数,数很快查到
来,但领导告诉我错了。我说数是从统计年鉴上查的,
怎么可能错呢?领导说,GDP的年度数据在公布后有两
次常规调整,也就是说2008年GDP在2009、2010和2011
年的年鉴中都会不一样,并且必须用最新的。GDP常规
调整的一个主要原因是核算GDP所需的财政支出决算数
据要在几年后才能取得。
3.数据调整引起的问题
另一种常见的数据调整就是普查的数据调整。我
国作过的普查有:人口普查、农业普查、三产普查、
工业普查、经济普查。每一次普查都动用大量的人力
和物力,调查面更宽,工作更细致,因此当普查数据
与常规调查数据不一致时,一般会对常规调查的历史
数据作调整。比如第五次人口普查后,调高普查前5
年的城镇化率,工业普查后不再公布工业总产值的数
据,第一次经济普查后全国GDP总量上调了2万亿,
1993年以后的GDP总量和增长率都上调 了。
3.数据调整引起的问题
人们在使用数据时,往往把调整后的数据与未调整的数
据放在一起使用。比如,有人说,GDP调整了,我国经济结
构就更加合理了,投资率就下来了。但我觉得这一说法的问
题很大,经济结构是否合理是客观事实,不会因GDP调整而
改变。投资率能否下来的疑问更大,GDP调了,投资规模就
不用上调吗?否则GDP总量与各项支出之间就不可能平衡。
普查后的数据调整往往限于几个核心指标,大多数指标没
有调。调了的指标和未调的指标还可比吗?不论是可比还是
不可比,都有很大麻烦。
3.数据调整引起的问题
假如是可比的,那么调整前的数据就是不可比的,可是
在经济普查前用的都是未调整数据,我们用这些数据进行了
整整十年的研究,这些成果就都有问题,这个太残酷了。
假如是不可比的,那么相关的研究工作又该如何开展呢?
这个问题没有简单的结论,总之要格外小心,使用前要作可
比分性分析。有一个不成熟的规则是:
可比的指标:那些统计结果不受经济普查影响的指标,如
现金流通量,学生人数等等
不可比的指标:那些与GDP有直接关系的指标就必须作调
整,否则不可比,如投资规模、就业人数等。
4.指标内涵的可比性
指标名称完全相同的指标,内涵有可能发生变化,这时
就仍是不可比的。
财政收入:债务收入、国有企业亏损
预算外收入
各国失业率:定义各不相同
差异大到不可比的程度吗?
三、注意随机因素的影响
随机因素是广泛存在的现象,宏观经济变动也
受该因素影响。这种影响使得经济走势捉摸不定,
增加了判断经济形势的难度。若对该因素的影响认
识不足,则有可能造成对经济形势的错误判断。
1.随机因素对经济形势分析的影响
当我们观察到某一方面的经济状况发生变化
时,要区分是经济走势的改变还是随机因素的影响
往往会相当困难。但作这种区分又是非常重要的,
若是随机因素的影响,那么这种变化就没有意义,
也就不必关注,更没有必要去强调是上升还是下降,
但若是趋势性的变化,那么就必须要引起充分的重
视,有可能意味着调控政策需要作适当的调整。
以价格上升走势来说,在随机因素作用下就会出
现1、 2个月的涨幅回落。
2006年7月至2008年2月,
我国居民消费价格涨幅不
断走高,但2007年1月、4
月、9月和12月的涨幅均
比前一个月低。尽管从事
后来看,这些月份的涨幅
回落没有什么意义,但在
获得后续数据之前,要作
出这种判断是很难的,因
为涨幅刚开始转降时也是
这样的。
有时会造成难以看清经济走势
2003年初至2004年底,
我国各月出口总额的同
比增长率波动很大,高
的时候到了50%,低的时
候降到30%以下,高低相
差20多个百分点,有时
连续几个月走低,有时
连续几个月走低。从当
月增长率很难看清真实
的走势。
有时会造成某些数据不可用
规模以上工业企业增加值环比增长率
2.随机因素影响大小的估计
为了估计某一序列中随机因素影响的大小,关键是把
随机因素和其他因素分离开。原始数据序列中包括的因素
有:长期趋势因素、循环波动因素、季节因素、随机因素、
春节因素、节假日因素、突发事件的影响、数据异常等等。
分离这些因素均需专门的方法,如季节因素有各种各样的
季节因素调整模型,假如其他因素的影响能有效地分离出
去,那么剩余序列就是随机因素的影响。若剩余序列满足
同分布的假设,那么该序列的方差可用于衡量随机因素影
响的大小。
2.随机因素影响大小的估计
对于同比增长率序列,由于不含长期趋势和
季节因素,因此可以采用简化的方法估计随机因素
影响大小。
第一种方法是计算增长率的一阶差分,从而
消除循环因素;
第二种方法是计算增长率的中心化移动平均,
然后计算增长率与平均值的差值。
以上两个序列的方差均可以作为随机因素影
响大小的度量。
随机因素的特征
▲各指标随机因素大小差异很大,有的指标取值很
稳定,随机因素的影响很小,如居民消费价格指数,
也有的指标取值大幅震荡,随机因素的影响很大,
如进口总额和出口总额。
▲分项数的随机因素大于总体。如投资的波动大于
GDP波动,全国波动小于某一地区或行业的波动
▲月度数的随机因素大于季度数
3.应对随机因素影响的策略
(1)消除随机因素后观察经济走势
(2)延长分析期长度
(3)正确地看待增长率升降
(1)消除随机因素后观察经济走势
从当月增长率只
能看到大幅波动,
但从不含随机因
素的平滑增长率
则可以看出稳定
走势。
(2)延长分析期长度
分析期的长度是指分析对象的月份数,如作进度分析
时可以用月度数、季度数和半年度数,分析期长度分别是1
个月、3个月和6个月。延长分析期长度,可以有效地降低
随机因素影响的大小,如出口总额的当月增长率波动很大,
但季度增长率则比较稳定。
分析期的长度不是可以任意取的,对于那些月度数大幅
震荡的指标,月度数是不可用的,分析期长度就不能取1个
月,而应以季度数作为分析对象。若季度数仍大幅震荡,
则应进一步延长分析期。
出口增长率的分析期长度应取3个月
(3)正确地看待增长率升降
受随机因素影响,增长往往时而上升,时而下降,若对
每次增长率的上升和下降都予以强调,那么结论就会一个
月这样、另一个月那样,来来回回地变。要避免这种情况,
可按以下面规则对待增长率升降:
一是当无法判定增长率升降是随机因素影响还是趋势变
动时,可避而不谈;
二是只有增长率变化量超过随机因素的影响幅度时才有
意义,如增长率升降0.1个百分点通常是没有意义的,对于
大幅波动的指标,升降1个百分点或2个百分点也可能没有
意义;
(3)正确地看待增长率升降
三是遵循123规则,即1个月升降没有意义,连续2个上升
或下降予以关注,3个月连续上升或下降重点分析,一般可
看作是趋势性变化;四是绝对量占全年比重很小的月份,
随机因素影响较大,增速变动较大是正常现象,不必过多
地关注,如2、3月的固定资产投资增长率。
尽管我们强调一个月的变动和小幅变动意义不大,但对
于那些有确切原因的变动则要另当别论。只要变动原因是
可持续的,那么经济变动就是趋势性的。2008年9、10月份,
我国经济下滑、价格转降,主要原因在于美国爆发金融危
机,虽然有些变化才刚刚出现,但均是趋势性的。
四、注意统计数据的质量
统计分析是以可靠数据为前提的,但这一前提并
不总是成立。现实中的数据是有偏差的,有的数据甚
至偏差很大,如全国数据与各地区数据之和差距很大。
有人可能会认为,数据有偏差就是不可用的,但实际
上没有这么简单。
例:人体重量和超重
如何用有偏差的数据作分析呢?
1.要对数据偏差做到心中有数
只有对统计数据质量做到心中有数,才有可能在
使用过程中采取相应的防范措施,从而避免使用质量
不合要求的数据。如何做到这一点,一是要了解数据
偏误的基本特征;二是要对偏误大小进行评价。
数据偏误的基本特征
偏误的大小
偏误的稳定性
偏误的方向
推算数据的可靠性不如直接调查的数据
全社会的数据往往可靠性较差
从数据采集过程中判断偏差的大小
▲填报单位的原始记录是否健全
▲填报人员能否准确理解填表内容的含义和要求
▲填报人员是否认真填报
▲填报单位是否愿意如实填报
▲抽样调查方案是否得严重执行
▲原始数据的审核是否严格
从数据加工过程判断偏差大小
把原始数据加工成可发布的统计数据是很
复杂的过程,决不是简单的加加减减。如果数据
处理方法不当,那么数据加工过程中的每一个环
节都会产生误差。
从数据加工过程判断偏差大小
以工业增加值为例来说,规模以上和规模以
下的企业分别采用不同方法进行统计,规模以上
企业同时上报当年数和上年基数,并据此计算增
长率;规模以下是抽样调查,用当年调查数和上
年调查数计算增长率。习惯的思维是把两种增长
率加权平均就可计算出全部工业增长率,但那些
刚成长起来的规模以上企业却在分母中计算了两
次。
从数据加工过程判断偏差大小
统计推算在数据处理过程中有重要的作用,如交
通运输为增加值用运输量进行推算。然而,统计推算
必须在一定的假定、方法和依据下进行,如果所采用
假定不当、方法不合理、依据不充分,那么推算结果
就会出现严重问题,甚至成为弄虚作假的工具。
从政府干预的角度判断偏差的大小
政府干预是由功利主义动机决定的,造成的数据
偏差往往具有方向性。干预的对象就是政绩指标和考
核指标及与之密切关联的指标。以固定资产投资为例,
在经济过热的时期,控制投资过快增长是调控目标,
政府干预的结果会造成其增长率低估,但低估的幅度
不易估计。2004年1-5月,××省的城镇规模以上固定
资产投资增长25.4%,累计增幅在两个月内回落了40.8
个百分点,这种变动只能用政府干预来解释。在经济
过冷时,刺激投资是政府的目标,干预的结果会造成
投资增长率高估。
从政府干预的角度判断偏差的大小
分析政府干预对统计数据的影响,必须考虑以下
几个因素:一是政府的考核目标和评价标准,这两个
因素在不同时不同时期和不同的经济运行状态是不一
样的,因此到底会产生什么样的影响需作具体分析;
二是政府干预的可能性,对于不同的指标是不一样的,
网上直报和超级汇总,如第一次经济普查,所有的数
据都是超级汇总,干预的可能性就较小。
政府干预并不等于政府授意,而更有可能是政府
部门的暗示,或者统计部门主动迎合。
通过逻辑检查判断数据质量状况
统计数据间必须保持一些基本数量关系,否则就
是数据有问题的表现。由于这种数量关系很多,因此
只能举例说明。
累计数和当月数之间的换算关系
对于绝对额类或准绝对额指标,累计数等于当月
数与上月累计数之和。如果这个关系不成立,就是数
据出了问题。由于数据调整或其他原因的影响,该关
系式在个别月份不成立是可以的,但必须要有原因的
解释。在90年代前期或更早以前,这一关系式基本上
得到遵守。但在2000年以后,这一关系式不成立的指
标越来越多,甚至差距巨大,如某一产品产量,2003
年12月份,由累计数推算的当月产量比公布的当月产
量高9.5%,2004年12月高17%。
2.有选择地使用数据
统计数据有偏差肯定会造成数据可用性下
降,但不能简单地说数据不可用。只要偏差不
是太大,很多分析就可以照常进行。
数据有偏差不等于数据不可用
以分行业统计数据来说,一个企业有可能从事
多个行业的经济活动,但大多数情况下仍作为一个
行业进行统计,因此分行业的统计数据与纯行业的
数据有一定差距,然而,在作行业结构分析时,人
们并不在乎这种差距。
数据有偏差不等于数据不可用
全国固定资产投资增长率为例,第一情况是增长
率很高,如达到70%以上,那么不论偏误大小,均可
作出增长速度过快的结论;第二种情况是投资增长
率达到30%以上时为过快,实际增长率为27%,只要
最大偏差不会超过2个百分点或增长率是高估了,那
么就可以作出投资增长没有过快的判断;若最大偏
差有可可能达到5个百分点,这时将无法作出是否过
快的判断。
选取可靠性能满足要求的数据
数据有偏差,会造成某些数据不可,因此在选
取某一问题的分析指标时,必须考虑各项的数据质
量状况,只有那些可靠性能满足分析问题要求的数
据才是可用的。有些在理论上最合适的指标,如果
数据质量不能满足要求,那么就只能放弃。以经济
增长速度为例,理论上最适合的指标是国内生产总
值增长率,但若该指标严重失实,那么就不能用,
而只能用工业增加值增长率、能源消耗总量增长率
等指标替代。
使用替代数据
为了分析某一经济问题,可用的指标是很多的。如分析经
济运行状况,就可从生产环节、流通环节、运输环节、消费
环节、税收状况、金融状况等角度进行。若某一指标因偏差
过大而不可用,就可以用其他指标替代。
使用替代指标会引起替代误差。如分析国内需求状况,
消费需求一般用用零售总额替代,投资需求用规模以上城镇
固定资产投资完成额替代,但零售额没有包括服务消费,固
定资产投资完成额没有包括存货投资,并且与资本形成也有
较大差异。
3.分析方法的选择
不同的分析方法对数据完整性和可靠性的要求差异很大
绝对量恒等式 Y=C+I+G+X
要求绝对量可靠,各指标必须与标准定义一致
总供求
状况分
析的三
种方法
增长率恒等式:%Y=%Cs1+%I s2+%G s2 +%X s4
仅需增长率可靠,可以使用替代指标
增长率差分恒等式
 %Y= %Cs1+ %I s2+ %G s2 +  %X s4
偏差在相邻两年不发生大的变化
4.多方验证提高结论的可靠性
对于同一经济问题,可以从多种不同的角度进行
分析,可使用的分析方法不只一种。通过多方验证,
可以提高分析结论的可靠性,弥补数据偏差引起的问
题。假如要判断经济增长速度是否偏高,若统计的增
长速度有高估的可能,那么就会难以作出结论,这时
就可以从通货膨胀变动情况等角度进行考察,若也支
持偏高的判断,那么结论就比较可靠。但这时也可能
出现多方得出结论相互矛盾的情况,这时就必须找出
不一致的原因,否则任何结论都没有说服力。
2004年1季度固定资产投资增长47.8%,是否过高?
若数据没有问题,很可靠,那么只要做些简单的历史对比和相关指标对
比就可以知道,投资的增长速度明显过快。但数据可靠吗?有人认为一季度
的投资增长率可能有问题,理由有三个,一是2003年的增长率仅为28%,12
月份仅为23.5%,能在短时间内上升这么多吗?二是2004年的投资统计制度
进行了改革,统计口径由国有单位改为城镇规模以上,增长率高是否是由统
计口径变动引起的,1993年统计口径由全民改为国有单位就是如此;三是一
季度投资额占全年的比重很低,不一定能代表全年情况。如果数据有问题,
结论的可靠性也就有疑问,因此需要寻找进一步证据。支持投资增长过快的
证据还有很多,一是全国各地电力供应非常紧张,当时拉闸限电的省份已经
超过20个,并且程度越来越严重;二是运输能力高度紧张,铁路运输的主要
中转站的车皮申请满足率大幅下降,降到了40%;三是原材料价格上涨速度
很快,钢材、水泥和原油等价格大幅上涨。这些都是历次经济过热的典型特
征。
5.谨慎地使用分析结论
数据失真会造成分析结论不可靠,使用替代
数据会引起的替代误差,因此数据有偏差,分析
结论的可靠性就会下降,使用分析结论也应保守
一点,而不要绝对化。
人口性别比为52:48,偏差从0不断增大,偏差
达到2个百分点以上时,男性人口多于女性的结论
就不再有100%的把握。
五、注意数据异常
异常值是指某些月份的数据特别大或特别小,超出正
常取值的范围,可分为多种不同的情况,如基数异常、重
大事件引发的异常等等。导致数据异常的原因有可能是机
理性的,也有可能是录入错误。
1.基数异常
2.连续两个月异常,一高一低
3.重大事件的影响
4.年末的异常变动
1.基数异常
基数异常是指因上年绝对额严重高于或低于正
常水平而导致本年增长率异常地低或高。基数异
常的特征是:
▲基期和报告期的增长率均异常,为一年高
一年低或反之
▲绝对额仅基期异常
▲把基期绝对额调整到正常水平后,报告期
和基期的增长率均恢复到正常水平
水泥产量2008年3月异常
2008年3月
2009年3月
消除基数异常因素后,2009年3月份增长率由10%提高至15%
左右。
2005年11和12月出口增长速度异常低
2005年11-12月
2004年11月,我国出口总额同比增长45.7%,增幅高于正常
水平10个百分点以上。2003年12月增长50.7%。
处理方法
为了消除基数异常对报告期增长率的影响,可以在季
节调整后对期绝对额作移动平均,然后再计算增长率。只
要基期异常不太严重,这一方法的处理效果很好。
也可以用手工的方法把基期绝对额调整为正值常后再
计算增长率。
注意事项
由于基数异常会造成报告期增长率异常,因此当观察到增长
率明显上升或下降时,必须先排除基数异常的可能性,否则
变动就是没有意义的。
2.连续两个月异常,一高一低
一高一低的连续两个月异常是指一个月的绝对额异常
地低,而另一个月异常地高,但两个月的绝对额合在一起
是正常的。引发这种异常的常见原因是某个月多统计了几
天,而另一个月少统计了几天。
2007年3月出口异常低
2007年3月
2008年2月
2007年3月,据传出口退税率下调,提前出口,导致2、3月
出口异常。08年一季度增长率为21.4%,处于正常水平。
3.重大事件的影响
重大事件特指会在短时间对经济产生重大冲击
的事件,这种事件不会改变经济的长期走势。当
重大事件发生时,那些受影响的统计指标就会取
值异常。从单个指标的表现来看,这种异常与基
数异常很相似,差别在于是否有明确的原因。重
大事件的影响一般会涉及多个指标,但对不同指
标的影响程度是不一样的。
重大事件影响实例
18
16
14
12
10
8
6
4
03.03
2003年SARS对我国
交通运行业、居民
服务业、零售贸易
业等行业影响巨大。
名义值
实际值
03.07
03.11
04.03
04.07
04.11
社会消费品零售额增长率的变动情况
2003年和2004年的5
月份社会消费品零
售额增长率严重异
常,一个重大事件
会造成两年增长率
异常。
重大事件影响处理方法
可用前后月份的增长率平均加趋势进行调
整,绝对额可根据增长率推算,调整好受影
响的年份,下一年增长重新计算即可。
4.年末的异常变动
知道前11个月增长率,就可以大致地判断全
年增长率,这是作进度分析的假设前提。然而这
一假定有时并不成立。
财政收入的进度数和年度数
财政收入累计增长率
1-10月 1-11月 1-12月
12月
根据1-10月份或111月份的财政收入
2000 21.6
21.2
16.9
-9.2
增长率,往往难以
2001 23.8
23.1
22.4
16.1
判断全年的财政收
2002 12.1
12.4
15.5
42.4
入增长率。
2003 21.1
19.9
14.7
-21.0
进度统计数据不能
2004 24.6
23.6
21.5
0.4
反映经济其真实趋
2005 17.9
18.3
20.0
42.2
势。
房地产开发投资的进度数和年度数
房地产开发投资累计增长率
1-10月 1-11月 1-12月
房地产开发投
12月
资的全年增长率明
24.1
19.5
6.7
显低于前11个月累
2001 31.2 29.7
25.3
12.0
计增长率。
2002 29.8
21.9
1.3
2000 24.6
2003 31.3
28.2
32.5
29.7
18.3
2004 28.9 29.2
28.1
23.4
2005 21.6
19.8
8.6
22.2
这时就必须进行
换算,把进度增长
率折算成全年增长
率。但这种换算有
一定的风险。
六、注意春节和节假日因素
▲春节因素是指由于春节的阳历时间变动,使得很多经济指
标的1、2月数据在不同年份之间不可比。
▲对产出、零售、货币供应量、进出口和价格涨幅均有明显
影响,但影响方式不同
▲有些指标会波及至3月份和12月份。春节因素主要是对1、2
月份产生影响,但对于某些指标,春节因素的影响有可能
还会涉及到12月份和3月份。比如工业品产销率,因商业
进货有一定的提前期,所以12月份的数据也与春节因素有
关。为了判断春节因素对其他月份是否有影响,必须在作
分析以后才能确定。
影响实例:社会消费品零售额
各年1、2月份
影响实例:居民消费价格
2005年2月上涨3.9%,
涨幅比1月上升2个百
分点
影响的识别
▲把1、2月的涨幅合并进行观察就可以消除该因素的
影响。1-2月份的平均涨幅为2.9%,仅比上年12月份
的涨幅高0.5个百分点,而与11月份的涨幅相当,因
此变动幅度不大。
▲从内部结构进行分。2月份,食品价格同比上涨
8.8%,涨幅比1月份增大4.4个百分点,是导致居民
消费价格上升的主要因素。
▲从其他年进行观察,如2006年,春节在1月份,价
格涨幅高于2月份1个百分点。
春节因素影响的简易调整方法
2009年1月份,我国进出口总额下降17.5%,进
口总额下降43.1%。春节因素是造成大幅下降的重
要原因,影响程度与2001年有一定的相似性,当时
的1-2月进、出口增长率分别为17.6%和14.4%,1月
份增长率为1.8%和0.7%。据此推算,扣除春节因素
后,1月份的出口约下降6%,进口的下降幅度仍超
过30%。
计算过程解析
第一步,找出相似的年份
第二步,计算相似年份的1
月与1-2月发展速度比值
2001年的比值:
1.007/1.144 = 0.8802
年份
春节日期
2000
2001
2008
2009
2.05
1.25
2.06
1.26
第三步,消除春节因素后的增长速度等于当年发展速
度除以比值再减去1,即
0.825/0.8802-1 = -6.3%
计算过程中的假定
(1)相似年份比值中的随机因素和其他不可比因素。
这些因素将会对分析结果产生影响。若能找出更多
相似的年份,则可以减少随机因素的影响。
(2)需假定春节因素的影响始终保持不变,但这一假
定并不一定成立。在90年代前期及以前,春节因素
对居民消费价格没有影响,但2000年以后,影响开
始显现。主要是受经济运行机制变化的影响。
七、注意季节因素
▲据中央电视台报道,……,同二月份相比,三月份用电量上
海增长了13.8%;江苏增长了20%;浙江增长了30%,广东
增长了26%。
▲3月,汽车生产109.54万辆,环比增长35.59%,同比增长
5.55%;销售110.98万辆,环比增长34.10%,同比增长
5.01%。 (工信部网站)
▲ 2009年2月末产成品库存比去年11月末下降14.3%
▲ 2003年,前11个月份,每个月均是财政收入均大于支出,累
计盈余将近3000亿元,据此推测全年财政盈余很大
▲有人用上半年投资额与同期GDP进行比较,得出投资率很低
的结论
环比增长率
季节因素可用专业软件进行消除,否则不同月份
之间是不可比的。消除季节因素后,任意两个月可以
计算变化率,可以更快地反映经济变化。
r(t)=FA(t)/FA(t-n)
n=1环比
12次方折年率
n=3季率
4次方折年率
n=6半年率 平方折年率
环比增长率受随机因素影响较大,可用性较差,很
难看清经济走势,折衷的方法是计算季率和半年率。
谢谢!
电 话:68783972 E-mail:[email protected]