下载此文件

Download Report

Transcript 下载此文件

计量经济学模型方法论的若干问题

清华大学经济管理学院 李子奈

一、问题的提出 二、关于计量经济学模型方法论的几个问题 三、关于总体模型设定的几个问题 四、关于应用研究中的几个常见问题 五、关于现代计量经济学的发展导向问题

一、问题的提出

1

、实证经济研究与经验实证研究

实证经济研究等同于经验实证研究吗? –

经济学

规范经济学(

Normative Economics

实证经济学(

Positive Economics

理论实证(

Theoretical

经验实证(

Empirical

目前国内的许多文献将“实证”等同于“经验”,凡 是经验研究都被称为“实证研究”,其实是不准确的, 但已经是约定俗成。

经济学模型方法是最重要的经验实证研究方法 –

计量经济学模型方法已成为我国经济学理论研究和实 际经济分析的主流方法。 • 《经济研究》发表的论文中,以计量经济学模型方法作为主要 研究方法的论文占全部论文的比例,

1984

年为

0

1992

年为

5%

1998

年为

11%

2004

年为

40%

2005

56%

,近年达到

80%

计量经济学应用研究向社会学、管理学等领域迅速扩 张,也已经成为一种趋势。 • 《管理世界》在

2000

年全年刊发的

210

余篇论文中,采用计量 经济学模型作为主要研究方法的论文为

0

;但在近年已达到

60%

以上。

实证经济研究的步骤是什么? –

回答“是什么”

观察(已经发生的)

抽象(理论假设、模型,演绎推理)

检验(实验、回归,归纳推理)

发现(一般规律) – 目前存在的主要问题:忽视观察和抽象,直接从经验开 始研究。或者套用国外的理论假设和者模型,或者随意 提出理论假设和设定模型。

实证经济研究的原则是什么? –

三原则

研究重要问题

采用正确方法

争取有所发现

既不要“自娱自乐”,更不要“自欺欺人”。

《经济研究》、《管理世界》等刊物的论文中, “自娱自乐”和“自欺欺人”现象十分严重。

产生错误或者问题的原因是什么? –

最重要的是对于所采用的模型方法的方法论基础缺少 研究和正确的认识。

国际理论计量经济学研究的一个普遍倾向是重视方法 而忽视方法论。

2

、计量经济学课程教学

传统计量经济学教科书 经济学研究 观察 抽象 检验 发现 计量经济学模型研究 模型设定 样本采集 模型估计 模型检验 模型应用 计量经济学课程内容 模型估计 模型检验

传统的计量经济学教科书认为,从观察到抽象,即模型的 设定,是理论经济学家(包括数理经济学家)的任务,而 有关数据的问题则是统计学的任务。作为计量经济学,研 究的重点就是模型的估计方法和检验方法,统称为计量经 济学理论方法。不断地创新和发展计量经济学理论方法, 则是计量经济学家的任务。

Basic Econometrics

》(

Damodar N.Gujarati

) : “计量经济学家的主要兴趣在于经济理论的经验论 证”,“计量经济学家常常采用数理经济学家所提出 的数学方程式,将这些方程式改造成适合于经验检验 的形式”,“收集、加工经济数据,是统计学家的工 作”,“这些数据构成了计量经济模型的原始资料”。 而且正是在这个意义上,“计量经济学才成为一个独 立的学科”。

Introductory Econometrics

》(

M. Wooldridge

): “在多数情况下,计量经济分析是从一个已经设定的 模型开始的,而没有考虑模型构造的细节”。

• 后果

对计量经济学模型方法的性质和功能的片面理解。

只懂模型的估计和检验,不知道如何正确地设定模型。

应用研究的问题和错误。

• 必须将模型方法论问题贯串于课程教学始终

教师必须有清楚的认识。

改革课程教学内容体系 • • • • 李子奈,关于计量经济学课程教学的创新与思考,《中国大学 教学》,

2010

年第

1

期。 李子奈,计量经济学课程教学中的一个突出问题,《经济学教 育的历史使命与改革创新》,高等教育出版社,

2013

1

月。 李子奈、潘文卿,《计量经济学(第

3

版)》 版社,

2010

3

月。 , 高等教育出 李子奈,《计量经济学模型方法论》,清华大学出版社,

2011

6

月。

加强应用研究和实验教学的指导。

二、关于计量经济学模型方法论 的几个问题

1

、计量经济学模型方法论的基础问题是什么?

计量经济学的定义

– 弗里希 :“经验表明,统计学、经济理论和数学这三 者对于真正了解现代经济生活的数量关系来说,都是 必要的,但本身并非是充分条件。三者结合起来,就 是力量,这种结合便构成了计量经济学。” – 萨缪尔森 :“计量经济学可以定义为实际经济现象的 数量分析。这种分析基于理论与观测的并行发展,而 理论与观测又是通过适当的推断方法得以联系。” – 戈登伯格 :“计量经济学可以定义为这样的社会科学: 它把经济理论、数学和统计推断作为工具,应用于经 济现象的分析。”

计量经济学模型方法论的基础问题 –

计量经济学模型方法论的基础问题是如何实现经济理 论、数学和统计学的科学的结合。

理论计量经济学应该将该基础问题作为其研究对象之 一。

计量经济学的发展与异化:理论计量经济学离经济学 越来越远。

经济学 •

一个简单的例题:对我国城镇居民消费进行经验实证研究

– 第一步:对我国城镇居民的消费行为进行观察与分析。 – 第二步:进行演绎推理和理论抽象,提出理论假设。例如:我国 城镇居民的消费水平主要决定于收入水平,并且为线性关系。

C

   

Y

– 第三步:根据理论假设,建立计量经济学总体回归模型。

C i Y i

 

i

,

i

 1, 2, L ,

n

– 第四步:采集样本数据。 – 统计学 第四步:估计和检验模型。

C i

 346 

Y i i

 1, 2, L ,

n

– 第五步:模型应用。 数学、统计学

2

、计量经济学模型是否“只能检验,不能发现”?

• • • 产生该问题的原因:传统计量经济学教科书的误导。 计量经济学模型方法论的完整框架 是:关于经济活动的观 察(即行为分析)

关于经济理论的抽象(即理论假说)

建立总体回归模型

获取样本观测数据

估计模型

检 验模型

应用模型。我们不妨称之为“完整的计量经济学 模型理论与方法”。 这样的实证研究,就不是“只能检验,不能发现”,而是 一个完整的科学发现的研究。

3

、计量经济学模型是否“只是归纳,不是演绎”? •

在早期经济学研究方法史上,演绎法一直是经济学的基本 研究方法论,归纳法在经济学中几乎没有位置。 – 西尼尔 :“这门科学依靠的主要是推理而不是观测, 其主要困难不是在于事实的调查而是在于术语的使 用”。 – 穆勒 :作为一门抽象科学,经济学必须使用先验方法, 即抽象演绎法。

20

世纪

20

年代以后,随着现代逻辑实证主义哲学的诞生, 归纳法在主流经济学研究中的重要性上升。 –

J·N·

凯恩斯 :经济学的研究方法应当是演绎和归纳的 结合。 – 哈奇森 认为,所有命题可以划分为两类:重复命题和 经验命题。科学的经济学命题应当能够被经验地检验, 而已有的经济学命题深陷于限制条件或“其他条件不 变”的围护之中,无法被检验,也不能提供信息。

20

世纪

20

年代末

30

年代初计量经济学诞生,确立了归纳 法的地位。 –毫无疑问,计量经济学的产生和迅速发展,集中体现 了归纳法或者说经验检验在经济学研究中的兴起。 –但是,不应由此而简单地断言,计量经济学仅仅是经 验归纳法。

计量经济学应用研究包含两大基本步骤:设定模型和检验 模型。前者属于演绎法的范畴;后者属于归纳法的范畴。 演绎法和归纳法是紧密结合在一起的,这种结合不仅意味 着彼此补充,也导致了彼此限制。由于计量经济研究中归 纳法的作用在于检验演绎法得出的理论假说,故而演绎阶 段对归纳阶段形成了根本性的限制。 • 计量经济学模型设定阶段的演绎与模型检验阶段的归纳相 结合,构成了完整的、辨证的计量经济学模型方法论。

4

、计量经济学是否“只能证伪”,不能证实”? •

证伪主义极大地影响了

20

世纪经济学的研究方法论。

据统计,

20

世纪

70-80

年代的

20

年间,经济学界出版了

50

多本经济学方法论的著作,几乎都和证伪主义有一 定的联系;

1991

年总结的当代经济学家达成的

13

点共识中,有

7

个和证伪主义有直接联系;

布劳格在《经济学方法论》中将

20

世纪经济学方法演 变史归纳为一句话:“证伪主义者,整个

20

世纪的故 事” 。

计量经济学遵循证伪主义?

证伪主义在很大程度上推动了计量经济学的兴起并塑 造了它的形式。计量经济学应用研究在形式上的确符 合证伪主义的要求。

究其实质,计量经济学实际上不是、也不可能是完全 地遵循证伪主义。 • • • 社会科学研究中无法全盘贯彻证伪主义。 实证主义未必像波普尔所说的那样全然不可取。 计量经济学的数理基础决定了它不能是完全证伪主义的,当然 也不能是严格的实证主义。 • 计量经济学的应用功能也使它不能是完全的证伪主义,而是兼 有实证主义的成分。

计量经济学应用研究的实际: – 曾经有研究者统计分析了

1973~1974

年间发表在《美国经济评论》 上的

542

篇经验研究论文,结果发现仅有

3

篇试图证伪接受检验的 假说,其余的都是想证实假说。 – 也有研究者选取了

19

种经济学期刊上的 解和评估。结果发现,有

67% 66

篇与需求理论有关的经 验研究论文,对每篇论文的理论假说和检验方法进行了细致的分 的论文可以全部或部分地归于证伪 主义;其余的论文则是完全属于实证主义的。 理论和实践都表明,在计量经济学研究中,实证主义和证 伪主义两种方法论导向并存,而研究结论对理论假说的证 实和证伪作用又都是不完全的。

5

、设定模型和检验模型孰重孰轻?

• 假设检验的不对称性

从应用的角度可以说,整个计量经济学模型方法就是 假设检验,即对经济行为进行抽象,提出假设,然后 再用经验证据进行检验。

假设检验具有不对称性:

统计意义和经济意义的不对称性,属于经济学范畴;

证伪和证实的不对称性,属于逻辑学范畴;

犯第一类错误和犯第二类错误的不对称性,属于统 计学范畴。

• 模型设定对模型检验形成了根本性的限制。

模型检验实质上是统计学,而不是经济学。

不管模型设定是否正确,都可以完成精确的统计检验。

如果仅仅为了证伪,可以按照研究目的设定模型。

证伪主义在很大程度上推动了计量经济学的兴起并 塑造了它的形式。计量经济学应用研究在形式上的 确符合证伪主义的要求。

实际上,国内外的计量经济学应用研究,其目的经常 是为了证明而不是证伪。

• 模型设定比模型检验更重要。

只有正确地设定模型,才能实现计量经济学模型方法 的“发现”功能,而同时避免“伪发现”。

只有正确地设定模型,才能协调“目的”和“工具” 之间的矛盾,弥补“工具”的缺陷。

6

、对于同一个研究对象,模型是否是唯一的?

• 实质上是模型与数据生成过程(

DGP

)的关系问题。

– D.F.Hendry

:经济学的基础假设前提是:现实经济活 动中存在着某种具有规律性的机制。我们进一步假设 经济机制的某些规律性是可以测度的,并把这种可以 测度的机制称为数据生成过程。也就是说,我们将数 据生成过程视为现实经济生成经济数据的客观机制。 –

DGP

是客观的、唯一的。

– D.F.Hendry

:经济理论模型是经济学家为描述现实经 济规律性所构造的假说。它们往往是对应数据生成过 程而设定的,任何理论模型的构造都要受到经济学家 主观出发点的影响。 – 理论模型可能不唯一。

例如:两要素生产函数模型

Y Y

  

AK L A

(  1

K

     2

L

  )  1 

Y

 1

AK

1 

c

(

L

b

( 1 

c c

1 

c

  1   1 1   

b K L

– D.F.Hendry

:统计机制由概率分布类型与抽样形式两 个要素构成,一般被视为经济理论模型现实运行的对 应体。在应用研究中,统计机制往往由分布复杂的高 维数据生成过程之某种简化模型表示,称为统计模型。 – 统计模型可能不唯一。

例如:对于产出、资本、劳动的数据 • 单独分析产出与资本的关系、产出与劳动关系 • 同时分析产出与资本、劳动关系 • 结论是不同的

从某种意义上说,经济理论模型是从经济行为的角度 对数据生成过程的主观构造,而统计模型是从数据特 征的角度对数据生成过程的主观构造。

计量经济学应用模型是经济理论模型和统计模型的结 合,应该力求描述客观的数据生成过程。 – 不同的研究者、不同的研究目的、不同的数据选择方 法、不同的数据集,会对模型的约化和简化过程产生 影响,会使得最终的应用模型有所不同。但建模起点 应该相同,而且是唯一的。

• 例如: 《经济研究》同一期连续刊登两篇计量经济学应 用研究论文,分析外商直接投资对我国区域经济的影响:

Y

AL

K G

K P

K F

结论:东部发达地区与西 部落后地区

GDP

增长率 的差异,大约有

90%

是由 外商直接投资引起的。

Y

AL

 

K D K N

K F

 结论:FDI区域差距对东 西部GDP增长差异的贡献 度不到20%。

• 例如: 在一篇研究我国财政政策和货币政策对居民消费的 影响的博士论文中分别建立了如下两个模型:

 

t f

(

Y t R t

, 

E t

) 

t C t f Y t

,

M t

, 

C t

 1

) 

t

假定收入、税收、财政 支出决定消费 假定收入、货币供应量、 前期消费决定消费

• 总结: 被解释变量相同,模型不同,认为作为被解释变量 的经济变量具有不同的生成机制和不同的数据生成过程, 是错误的。

对于不同的研究者,可能是对数据生成过程的认识不 同。

对于同一个研究者,只能是对于方法论错误。

7

、如何认识计量经济学模型对数据的依赖性?

• 计量经济学模型与数据的关系。

• 重点问题

模型类型的选择对数据类型的依赖性。

总体模型变量选择的数据关系检验必要性原则。

模型估计对样本数据的完整性、准确性、可比性、一 致性要求。

模型应用想定数据的强外生性和超外生性。

• 数据陷阱

客观性是数据最重要的属性

如何判断数据是否具有客观性?

已有数据诊断理论与方法的问题 – 仍然是基于数据的,主要利用数据的“关联性”属性。即, 用数据的“关联性”诊断数据的“客观性”。

模型研究者必须首先对客观的社会经济活动进行观 察和分析,获得“感觉”。那些不进行任何调查研 究,以通过某种渠道获得的“数据库”作为研究的 起点,是很容易掉入“数据陷阱”之中的。

• 数据陷阱

防止实用主义倾向。

数据是客观的,但是被主观地选择使用。

“如果你反复拷问数据,它总是会招供的”

三、关于总体模型设定的几个问题

以经典线性单方程模型为例

Y i

  0   1

X

1

i

  2

X

2

i

    

k X ki

 

i

总体回归模型

i

=1,2…,n 被解释变量 解释变量 随机扰动项

1

、“从简单到复杂”的建模路线正确吗?

• 在应用研究的总体模型设定中始终存在两条路线之争: “从简单到复杂”和“从一般到简单”,哪一条是正确的?

具体表现:作为研究起点的总体回归模型应该是简单模型 (包含较少的解释变量)还是复杂模型(包含所有的解释 变量)?

国内外应用研究常见的模式:从简单到复杂 c Log(x) Log(p1) Log(p) Adj R 2 F Model 1 5.546*** 0.232*** 0.853 Model 2 6.059*** 0.335*** 0.627 104.72*** 30.20*** Model 3 5.515*** 0.538*** - 0.535*** Model 4 5.561*** 0.558*** - 0.264* - 0.333** 0.975 0.979 334.33*** 252.09***

应用研究的过程是个反复曲折、循序渐进的过程。我们只 有先对可能生成观测数据的随机过程做出假定,才能开展 模型参数估计和推断。如果统计推断结果暴露出模型的问 题,就需要相应地修正原来的假设,再重复进行统计推断, 直到分析结果达到一定的内在一致性和收敛性。这种内在 一致性虽然不是保证模型分析正确的充分条件,却是科学 分析合乎逻辑性的必要条件。

对观测数据设定一可能的生成过程是计量经济分析的必要 起点。

问题是:该起点应该是简单的还是复杂的?

从简单到复杂”和“从一般到简单”,两条不同的路线, 看上去是殊途同归,但是却存在本质区别。 –从逻辑学上讲,一旦总体模型被设定,利用样本数据 进行的经验检验只能发现已经包含其中的哪些变量是不 显著的,而不能发现没有包含其中的显著变量。所以作 为起点的模型必须是“复杂的”。 –从经济学上讲,现实经济活动中变量之间的关系是复 杂的,而且所有变量都是变化的。所以作为起点的模型 必须是“复杂的”。 –从统计学上讲,只有首先建立最一般的模型,才能保 证模型的随机扰动项满足“源生性”和基本假使。 “从一般到简单”的建模路线是合理的,而“从简单到复 杂”的建模路线是不合理的,容易走向实用主义。

2

、能否以研究目的为导向设定模型?

• 实际应用研究中的研究目的导向 –任何应用研究都有特定的研究目的,例如分析某两个 经济变量之间的关系,或者评价某项经济政策的效果。 –按照特定的研究目的进行计量经济学模型总体模型的 设定,成为计量经济学应用研究的普遍现象和最严重的 问题。

• 研究目的导向实例

研究制度变迁对我国经济增长影响的论文:

ln

GDP t

  0

1

ln

ZDI t

t

 ˆ 1  2 .

1

t

 1978,  , 2005

在一篇研究通货膨胀与经济增长的关系的论文中,建 立了如下模型: g g  1  

GDPD

 0.2561

GDPD

 1 

R

2  0.9152,

DW

 1.6642

t

结论:适度的通货膨胀有助于经济增长变动速率较快上升 和国民经济较快增长。

• “唯一性”原则和“从一般到简单”路线的自然要求。 –作为建模起点的总体模型必须能够包容所有经过约化 得到的“简洁”的模型。 –它应该包含所有对被解释变量产生影响的变量,尽管 其中的某些变量会因为显著性不高或者不满足正交性 条件等原因在后来的约化过程中被排除。

3

、能否以先验的经济理论为导向设定模型?

• 经典计量经济学模型的经济理论导向。

• 正统经济学理论导向存在的问题: –第一,正统经济学以经济人假设和理性选择为其理论 体系的基石,任何一种理论都建立在决策主体是理性 的和决策行为是最优的基础之上。而计量经济学模型 描述人们实际观察到的经济活动之中蕴藏着的一般规 律,实际经济活动既不是“理性”的,也不是“最优” 的。 –第二,正统经济学理论强调“简单”,认为只有简单 的理论才能够揭示本本质。而计量经济学模型恰恰相 反,它强调“一般”,必须将经济活动所涉及的所有 因素包含其中。

–对于同一个研究对象,不同的研究者依据不同的先验 理论,就会设定不同的模型。 –破坏了模型随机扰动项的“源生性”,随机扰动项可 能违背Gauss-Markov假设和正态性假设。

• 结论:

计量经济学模型描述的是现实的经济世界,经济学理 论描述的是理想的经济世界。

经济学理论揭示的变量之间的关系以其它因素不变为 假设,现实经济生活中所有因素同时变化。

经济学理论不能作为计量经济学总体模型设定的导向。

• 对计量经济学模型总体设定先验理论导向的批评并不意味 完全否定经济学理论在模型设定中的作用。 –描述理想经济世界的经济学理论可以指导我们正确分 析现实经济世界的动力学关系; –简洁的经济学理论至少揭示了“一般”经济系统中的 一部分经济关系。 –经济学理论将作用于经济关系分析,而不是直接作用 于模型总体设定。

• 例:《经济研究》论文 –在一篇实证研究我国货币—产出非对称影响关系的论 文中,模型系统中包括的变量有表示产出的实际工业 产出指数、表示货币的M1和表示价格的消费价格指数, 而货币流通速度被合理地省略了。 –所依据的是经典的货币需求理论。 –问题: 经典的货币需求理论是否反映我国的实际?以 此作为描述货币—产出关系的总体模型设定的依据是 否可靠?

• 例:《经济研究》论文 –在一篇关于人民币汇率的均衡、失调、波动与调整的 论文中,作者通过理论分析和经验检验,得到描述实 际汇率与相对供给、相对需求之间长期均衡关系的模 型,并在此基础上建立了反映短期变化之间关系的误 差修正模型。 –显然,经典的汇率决定理论在该模型总体设定中起了 导向作用。 –问题: 经典的汇率决定理论是否反映我国的实际?以 此作为选择模型变量的依据是否可靠?

4

、能否以数据关系为导向设定模型?

• 现代时间序列计量经济学的数据关系导向。 –对先验理论导向的批评 –VAR –单位根检验与协整检验 • • 问题的本质 –数据关系是经济关系的必要条件而不是充分条件。 典型错误:

夸大因果关系检验的功能。

夸大协整检验的功能:误将协整方程作为均衡方程。

• 例题: 在一项关于我国城镇居民收入的研究中,作者对城 镇居民人均收入和农村居民人均消费两个时间序列数据进 行了严格的统计分析。 –首先进行单位根检验,发现它们都是2阶单整序列。 –然后进行Granger因果关系检验,发现在5%的显著性水 平上,城镇居民人均收入是农村居民人均消费的 Granger原因。 –最后进行协整检验,发现它们之间存在(2,2)阶协 整。

–于是得到了描述二者之间长期均衡关系的模型:农村 居民人均消费=558.07+0.1817城镇居民人均收入。 –更进一步指出,城镇居民人均收入提高100元,可以使 得农村居民人均消费提高18.17元。 • 这个结论显然是错误的,但是所有统计检验却是严格的。 问题在哪里?

• 正确认识数据关系的作用: –作为必要性条件,对经过观察、分析、抽象得到的假 设进行检验。 –在总体模型设定过程中,虽然经济行为分析是最重要 的,但数据关系分析仍能发挥强大的作用。

5

、总体模型正确设定的依据是什么?

• 模型总体设定的本质 –回答:如何从经历到的过去、特殊、局部,推论到没有 经历到的未来、一般、整体? –关于模型总体设定的讨论,必须首先回答: • 要确定的是经济主体内在的本质意义的属性,还是 经济主体之间的关系意义的属性。 • 要确定的是主体之间的行为关系,还是作为主体经 济活动结果的经济变量之间的数据关系。

• 关系论: –主体的任何行为,都应在主体和其身处的环境之间寻 找原因。都必然由主体与其身处的环境之间的作用引 起。 –经济主体与其身处的环境之间的动力学过程,是真正 的数据生成过程。 –无论先验理论导向,还是数据关系导向,模型总体设 定所忽视的正是经济主体之间的动力学关系。

• 实现先验理论导向和数据关系导向的综合 –以经济主体与环境之间的行为关系分析为基础和前提, 基于该行为过程生成的数据,以数据统计分析为必要 条件,验证并确定经济主体与环境的互动关系,正是 计量经济学总体模型所要界定的因果关系。 –只有行为关系的理论分析,没有基于统计相关性的经 验支持,是无法确认这样的行为关系的。同样,只有 数据关系的统计分析,没有具有良好的公度性的行为 关系理论框架,会使统计分析进入歧途。

• “经济主体行为

(

动力学

)

关系导向”分析框架

6、随机扰动与随机误差等同吗?

• 源生的随机扰动 –随机扰动项在计量经济学模型中占据特别重要的地位 。 –随机扰动项具有源生性。 • 在模型正确设定的前提下,无数不显著因素对被解 释变量的影响的集合。 • 客观存在的。 –在基于随机抽样的截面数据的经典计量经济学模型中, 源生的随机扰动项满足Gauss假设和服从正态分布。

• W.H.Greene: –

在确定性模型中引入随机扰动,并不是为了掩盖确定 性模型的不足之处。” – “如果所谓的未被解释的随机扰动并不是真正的不能 被解释的因素,模型就是不适当的。”

• 衍生的随机误差 –定义为“被解释变量观测值与它的期望值之间的离 差”。 –具体内容的解释 :“无数非显著因素对被解释变量的 影响”、“变量观测值的观测误差的影响”、“模型 关系的设定误差的影响”等。 –

stochastic disturbance term ≠ stochastic error term

• 随机误差项是否满足Gauss假设以及正态性假设? –W.H.Greene(2000) :鉴于我们对随机误差来源的描述, 中心极限定理的条件一般都成立,至少近似成立,因 此正态假定在多数情况下也都是合理的。 –数学证明和模拟检验发现,在大多数情况下,确定性 误差导致随机扰动项对Gauss假设以及正态性假设的违 背。

• 正态性假设的违背:

当存在模型关系误差时,如果解释变量是随机的,随 机误差项的正态性将得不到保证。

当模型遗漏了显著的变量,如果遗漏的变量是非正态 的随机变量,随机误差项将不具有正态性。

如果待估计的模型是原模型经过函数变换得到的,随 机误差项将不再服从正态分布。

• 正态性假设的违背:

当模型存在被解释变量的观测误差,如果观测误差相 对于随机误差项的标准差特别大、样本长度又特别小, 随机误差项的正态性假设会导致显著性水平产生一定 程度的扭曲。

当模型存在解释变量观测误差时,一般情况下,随机 误差项的正态性假设都是不能成立的;只有在回归函 数是线性的,且观测误差分布是正态的特殊情形下, 随机误差项的正态性才成立。

• 怎么办? –最根本的是设定正确的模型和减少观测误差。 –检验是必须的,但却是经常被忽视的。

7

、如何正确选择模型类型?

• 例

1

: 在一篇研究公众核能接受度的博士论文中,调查了

1000

多个个人,选择个人的文化水平、职业、年龄、收 入水平为解释变量,以核能接受度为被解释变量,建立了 经典线性计量经济学模型。核能接受度分为

5

级:接受、 比较接受、无所谓、比较反对、反对;分别以

2

1

0

、 -

1

、-

2

为样本观测值。采用普通最小二乘法估计模型。 • 错误: 将离散选择问题设定为经典计量经济学模型。

• 例

2

: 某单位对我国农户借贷需求进行了较为广泛的调查, 采集了

16

省(自治区)的

72

个县(市)、

440

多个村庄的

5100

家农户的数据。其中,在一年中发生借贷行为的农 户占

55.3%

(包括向亲友借贷),为

2820

户,其余

2280

户没有发生借贷。现已经收集了该

5100

户中每户的一年 中发生的借贷额、家庭总收入、总支出、总收入中农业生 产经营收入所占比例、总支出中生产性支出所占的比例、 户主受教育程度、户主健康状况、家庭人口数等近

100

项 数据。 为了对农户借贷行为进行因素分析,即建立以农户借贷额 为被解释变量,各种影响因素为解释变量的农户借贷因素 分析模型。于是,不同的研究者建立了

4

种不同类型的计 量经济学模型。包括:

– 仅利用

2820

户发生借贷的农户为样本,即以他们的借贷额为被解 释变量,各种影响因素为解释变量,建立经典的回归模型。 – 为了充分利用没有发生借贷的农户的信息,于是利用 户借贷额为

0 5100

农户为 样本,即以他们的借贷额为被解释变量,其中没有发生借贷的农 ,以各种影响因素为解释变量,建立经典的回归模型。 – 进一步分析发现,不应该将没有发生借贷的农户的借贷额统统视 为

0

,而应该视为小于等于

0

≤0

),于是利用

5100

农户为样本, 建立归并(

censoring

)数据模型(

Tobit

模型)。 – 更进一步分析发现,不应该将没有发生借贷的农户的借贷额统统 视为小于等于 后再利用

2820 0

,因为其中一部分农户有借贷需求,只是因为各种 原因(例如提出借贷被拒绝,担心借不到而不敢提出借贷要求等) 而没有发生实际借贷。所以,应该按照

Heckman

两步法建立模型, 即首先利用全部样本信息建立借贷是否发生的二元选择模型,然 户发生借贷的农户为样本,建立借贷额的因素分析 回归模型。 – 最后一种模型是正确的,其它都是不正确的。

• 例

3

: 在一篇实证研究我国收入不平等对经济增长影响的博 士论文中,作者通过理论分析认为,收入不平等将影响固 定资本投资和人力资本投资,而固定资本投资和人力资本 投资直接影响经济增长。为了检验收入差距与经济增长水 平之间呈现倒

U

型关系,作者建立了以我国

GDP

为被解释 变量的计量经济学模型,解释变量包括收入差距(

SRCJ

) 和收入差距的二次方,以及固定资本投资(

GDZB

)、人 力资本投资(

RLZB

)和其它控制变量(

X

):

GDP t

f

(

GDZB t

,

RLZB t

,

SRCJ t

,

SRCJ t

2 ,

X t

)  

t t

 1 , 2 ,  ,

T

正确的方法是建立一个包括

3

个方程的联立方程模型。

• 模型类型选择的原则 –单方程应用模型类型对被解释变量数据类型的依赖性。 –单方程模型和联立方程模型的选择对经济行为的依赖 性。

8、如何正确设计定模型函数关系?

• 例

1

: 在一篇博士论文中设计的多要素

CES

生产函数模 型如下,其中,

Y

为产出量,

K

L

为资本和劳动投入量,

G i

为第

i

种能源投入量,其它为参数。

Y t

A

   0 ( 

K L t t

(1   ) )   

i k

  1 

i G it

     1  错误:资本劳动组合投入、各种能源投入之间不具有相 同的要素替代弹性。应该建立二级

CES

生产函数。

• 模型函数关系设定的指导原则 –经济学理论指导原则 • 经济学理论 • 已有的研究成果 –统计分析指导原则 • 散点图 • 试拟合 • 对数据进行统计分析得到的是单个解释变量与被解 释变量之间的关系 。 –“设定——检验——再设定——再检验”原则。

四、应用研究中其它常见问题

1

、如何正确设定模型变量的内生与外生? •

变量内生性与外生性的相对性

内生或者外生、随机或者确定,并不是变量本身所固 有的绝对的属性,而是相对于模型的研究对象、模型 系统,甚至模型中的参数而言的。

经济变量,如果一定要给出它们的固有属性,只能说 它们都是内生的和随机的,因为它们都是在社会经济 系统中,在互相影响和作用的过程中生成的。

同一个经济变量,相对于不同的研究对象、不同的模 型系统,甚至不同的关注参数,可能有不同的设定。 – 解释变量的内生性问题是应用研究中一个最重要的问 题。

• 同一个经济变量,相对于不同的研究对象,可能有不同的 设定。 –例如:需求=f(价格

) • 对于个体模型,价格是外生的; • 对于总量模型,价格不能设定为外生。 –例如:消费=f(收入

) • 对于个体模型,收入是外生的; • 对于总量模型,收入不能设定为外生。

• 相对于模型的应用目的,可能有不同的设定。

预测模型:“外生”不仅不受当期被解释变量的影响, 而且不受滞后被解释变量的影响。 –政策评价模型:“外生”不受当期被解释变量的影响, 但可以受滞后被解释变量的影响。

• 相对于不同的关注参数,可能有不同的设定。

例如:在简单的粮食供求模型中:

如果我们关注的参数是价格的需求弹性,即价格与 需求量之间的关系,需求量具有外生性。

如果我们关注的参数是描述该供求系统的稳定性的 参数,需求量不具有外生性。   

q t p t

 

0

0  

1

q t

1

p t

 1  

t

t

t

t

~ ~

N N

( 0 ,

( 0 ,

2   2 ) )

p t

 0

 1  0

 1  1

p t

 1

t

• 实际应用研究中,主要需要考虑三种原因引起的解释变量 的内生性。

解释变量影响被解释变量,反过来也受被解释变量的 影响。 • 例:消费对

GDP

的影响。

解释变量本身受到其它解释变量的影响。

解释变量对被解释变量没有直接影响。 • 例:收入不平等对经济增长影响。

• 解释变量的内生性的检验

经济行为分析是最重要的。

解释变量内生性带来的主要问题:解释变量与随机项 相关。

主要检验解释变量与随机项相关。

2

、如何正确解读计量经济学应用研究的结论? • • •

应用计量经济学模型只能得到相对的结论。相对于模型赖 以建立的、表征已经发生的经济活动的样本、样本观测值 以及选择这些样本的抽样方法,相对于关于模型统计性质 的假定,也相对于关于规律的理论抽象,最后集中表现于 带有置信水平和置信区间的强调随机性的结论陈述。 试图得到绝对的结论,是计量经济学模型方法论所不能够 的,也是不科学的。 目前的计量经济学应用研究论文中,充满着对研究结论的 绝对化陈述,研究者为自己制造了陷阱,带来了被动,也 是没有正确理解计量经济学模型方法的哲学基础的表现。

3

、如何正确认识时间序列模型中的必要性与充分 性条件问题?

• 误将必要性条件作为充分性条件,是时间序列计量经济学 应用研究中的一个普遍问题。

从经济分析开始,提出假设,然后进行统计分析,以 检验假设。将统计检验作为必要性检验,是正确的。 而从统计分析开始,然后对结论进行经济解释,将统 计检验作为充分性条件,是错误的。

Gujarati

: “从逻辑上说,一个统计关系式,不管多 强或多么有启发性,本身不可能意味着任何因果关系。 要谈因果关系,必须来自统计学之外,诉诸先验的或 者理论上的思考。”

• 例如:对Granger因果检验的过度依赖 – Granger因果检验是统计检验,属于必要性检验。经济 行为上存在因果关系,统计上的因果关系一定存在;统 计上存在因果关系,并不能断言经济行为上一定存在因 果关系。

模拟试验表明,即使经济行为上既不存在直接影响也不 存在间接影响的平稳时间序列之间,统计检验仍然有显 示存在因果关系的可能。(

5%

的显著性水平下,

4.6 %

) – 不能完全依赖Granger因果检验确定序列之间的关系, 必须首先进行经济行为分析。

• 例如:协整方程≠均衡方程 –协整方程具有统计意义,而均衡方程具有经济意义。 时间序列之间在经济上存在均衡关系,在统计上一定 存在协整关系;反之,在统计上存在协整关系的时间 序列之间,在经济上并不一定存在均衡关系。协整关 系是均衡关系的必要条件,而不是充分条件。 –均衡方程中应该包含均衡系统中的所有时间序列,而 协整方程中可以只包含其中的一部分时间序列。 – 不能由协整导出均衡,只能用协整检验均衡。

4

、动态模型揭示的是统计关系还是经济关系?

• • • 例:中国居民总消费模型

静态模型:

Y t =2091.29+0.4375X

t

总收入的边际消费倾向为

0.4375

动态模型

:Y t =384.18+0.8566Y

t-1 +0.0938X

t

总收入的边际消费倾向为

0.0938

动态模型揭示的是统计关系,不是经济关系。 动态模型可以用于预测,但不能用于结构分析。

5

、如何看待微观计量经济学模型的拟合优度?

• 微观计量经济学结构模型依赖于微观数据,由于样本量巨 大,估计得到的样本回归函数一般具有较低的拟合优度, 甚至出现拟合优度不到

0.01

情况。如何评价这样的模型? 它们是否能够用于进行变量间关系的结构分析?

在模型总体显著性水平相同的情况下,随着样本容量 增加,拟合优度降低,是必然现象。

在模型设定正确的情况下,不必看重拟合优度,关键 是模型总体是否显著成立,变量是否显著。

这里的前提是“模型设定正确”,核心是模型解释变 量中包含了对被解释变量具有显著影响的所有变量。 – 模型的功能受到限制。只能用于检验某个(些)因素 (事件)的有效性。

五、关于现代计量经济学模型 发展导向问题

1

、现代时间序列计量经济学的发展导向是什么? •

一般认识:伪回归。表面现象。 • 其实质是时间序列的非平稳性与经典计量经济学模型数学 基础之间的矛盾。

经典计量经济学模型的数学基础是极限法则,即大数 定律和中心极限定理。

以独立随机抽样的截面数据为样本,如果模型设定是 正确的,模型随机扰动项满足极限法则和由极限法则 导出的基本假设,继而进行的参数估计和统计推断是 可靠的。

• –

以时间序列数据为样本,时间序列性破坏了随机抽样 的假定,但是如果模型设定是正确的,并且所有时间 序列是平稳的,时间序列的平稳性替代了随机抽样假 定,模型随机扰动项仍然满足极限法则。

问题在于,用统计数据构造的时间序列大都是非平稳 的,那么采用经典计量经济学模型方法的数学基础被 破坏。 于是,如何以非平稳时间序列为样本,构建揭示宏观经济 变量之间结构关系的计量经济学模型,以此为导向,现代 时间序列计量经济学应运而生。

2

、微观计量经济学的发展导向是什么?

• 基于研究对象和数据特征而发展。

随着经济、社会的发展,人们越来越关注家庭、个人 等微观主体的决策问题,计量经济学由宏观领域向微 观领域扩张,是一个必然趋势。

微观计量经济学模型依赖于微观数据,微观数据的来 源主要不是统计,而是调查。

微观数据表征家庭、个人等微观主体的决策行为,问 题多种多样,数据的特征也各不相同,很难满足经典 计量经济学模型对数据的要求。

微观主体数量众多,只有依赖于大样本建立的计量经 济学模型才能够揭示微观主体决策行为的一般规律, 而大样本对计算技术和计算机的运算能力提出了新的 要求。

3

、面板数据计量经济学的发展导向是什么?

• 基于充分利用数据信息而发展。

任何计量经济学模型研究,都将经验信息的充分利用作 为一个基本原则。

面板数据综合了横截面数据和时间序列数据,同时反映 了空间和时间两个维度的经验信息。

面板数据模型(

Panel Data

)不同于混合数据 (

Pooled Data

)样本用以估计经典的计量经济学模型。

面板数据模型的设定检验理论是面板数据计量经济学模 型理论体系的基础。

4

、非参数计量经济学的发展导向是什么?

• 基于非设定的结构关系而发展的非参数计量经济学。

经典模型的常参数假设与实际经济现象经常产生冲突, 也成为引起人们批评的一个主要问题。

参数模型虽然简明而易于处理,用途广泛,但是普遍 存在设定误差问题,且估计效果经常不理想。

解决设定误差问题的方法之一就是不先验地设定模型 的结构,而是要通过估计才能得到某种结构关系,即 所谓非参数方法。

5

、如何描述现代计量经济学与经典计量经济学 的关系?

6

、如何把握现代计量经济学的理论前沿?

欢迎批评指正! 谢谢!