导读:跟随世界主流经济学的研究范式,数量化研究已经成为了中国经济研究的主流。经济学,作为社会科学中数量化程度非常高的一门学科,其本身还是脱离不了社会科学本身的限制,经济学的主要使命是帮助我们认识复杂的经济世界,更多时候是对经济现象提出合理解释。
一篇严谨的经济学论文,一般需要三个基本的要素:视点(Perspective),参照(Benchmark),以及分析方法(AnalyticalTool)(钱颖一,2002)。学习计量经济学的目的是为了进行实证研究,对于学习计量经济学的人而言,要写一篇有实证研究的计量经济学论文或报告时,选题、建立计量模型、选择计量方法等至关重要。今日为您带来一篇关于计量经济学实证论文写作的全面解析。
1
什么是论文
究竟什么是论文?简单地说,论文就是对新的研究成果的汇报。为什么一位成绩优秀的学生,在撰写毕业论文时可能一筹莫展?这主要是因为,平时上课做题,主要学习已有知识,只需被动消化吸收即可,有固定模式可循;而做研究写论文,则需主动创造(哪怕是一点点)新知识。因此,刚起步研究的学生,面临着从学习知识(学生)到创造知识(研究者)的转型。
▲已有知识与新研究的关系
一般来说,规范的实证研究包括以下几个步骤,即准备阶段、选题、探索性研究、收集数据、建立计量模型、选择计量方法、解释回归结果、论文写作、与同行交流、提交论文或投稿,下面分别进行介绍。
2
准备阶段
如果以为今天想做研究,明天就可开始,或许不现实。要开始真正的研究,需要一系列的准备工作。首先,必须掌握一定的经济理论,以获得观察经济现象的必要视角(perspective)、参照系(reference或benchmark)与分析工具(analyticaltools)。否则,即使看到经济现象,也可能无从下手分析。正如钱颖一(2002,p.2)所指出:
我在哈佛大学做博士生的时候,韦茨曼(MartinWeitzman)教授问我,受过现代经济学系统训练的经济学家和没有经过这种训练的经济学家究竟有什么区别?他研究比较经济制度,经常去苏联访问,问这个问题是从与苏联经济学家交往中有感而发的。韦茨曼的回答是,受过现代经济学系统训练的经济学家的头脑中总有几个参照系,这样,分析经济问题时就有一致性,不会零敲碎打,就事论事。
这正是经济学界常说的“像经济学家那样思考”(Thinklikeaneconomist)。当然,爱因斯坦更早就说过类似的话,甚至更为深刻:
你能不能观察到眼前的现象取决于你运用什么样的理论,理论决定着你到底能观察到什么。
显然,那种认为可以不需要任何理论指导而直接去“看真实世界”的想法或许过于天真了。这些经济理论的学习,主要体现在微观经济学、宏观经济学以及经济学的各专业课程上,比如金融学、财政学、发展经济学、产业经济学、劳动经济学等。
3
选题
实证研究的第一步就是选题,即选择研究的题目。对于刚起步的研究者,常常不知如何选题。研究者通常知道自己想要研究的领域(比如,经济增长),但这还不是一个具体的“研究问题”(researchquestion)。
对实证分析而言,研究问题通常是有关“X对Y有何作用”之类的因果关系。如果想研究“家庭联产承包责任制对农业经济增长的作用”,就更具体了,此处X指“家庭联产承包责任制”,而Y指“农业经济增长”。当然,实证研究也可以只有Y而没有X,比如对于某个统计指标Y的测算;但纯粹描述性的研究已比较少见。
浏览这些期刊中的论文(通常技术性较强,故未必从头读到尾),可大致知道当前的经济学者都在研究哪些前沿问题,取得了哪些成果,还有哪些未解之谜;进一步,可以评估他(她)们的研究方法是否可靠,以及可能的改善空间。
如果能提出好的研究问题,也许你的研究就成功了一半。什么是好的研究问题呢?总的来说,研究问题越具体、越有趣、越新颖、越有可行性,则越好!
(1)具体:简单来说,在以上“X对Y有何作用”的句型中,应能明确X与Y具体是什么。
(2)有趣:你的研究问题为什么重要?别人会感兴趣吗?为什么我们要在乎你的问题(Whyshouldwecare)?知道问题的答案后,能影响人们对世界某方面的看法吗?
(3)新颖:论文的核心价值在于其创新性,即做出了文献中所没有的边际贡献。这种边际贡献可以是研究了新的现象、使用了新的(更好的)计量方法,或者使用了新的数据集。做研究的过程是创造新知识的过程,在本质上不同于学习已有(旧)知识的过程。
(4)可行:即使你的研究问题很具体、很有趣、很新颖,如果找不到相应的数据,则不可行。
对于刚开始选题的学生而言,似乎自己能想到的题目,都已被别人做过了。其实未必。要想做出新的边际贡献,当然可在前人的基础上,继续拓展与改进(改进计量方法,增加变量,使用新数据等)。
另一方面,也可以完全撇开前人,去研究全新的现象。比如,20世纪70年代末中国农村实行了家庭联产承包责任制改革,这是史无前例的。到了1990年左右,就涌现出一批研究农村改革对中国农业产出影响的论文(比如,Lin,1992)。又比如,2014年11月开始实行上交所与港交所之间的“沪港通”。假以时日(有了足够的数据后),就可以研究沪港通对中国证券市场的影响。
即使是前人已经研究过的现象(太阳底下没有新的事物),也可用新眼光、新视角去观察。重要的是,要有敏锐的观察力,并“像经济学家那样去思考”(Thinklikeaneconomist)。当然,对于刚起步的新手,应尽量避免已经被研究得很烂、或过于富有挑战性的题目。显然,备选的研究问题越多越好,因为能“存活”下来的研究想法通常不多。
4
探索性研究
有了潜在的研究问题后,首先需要进行初步的“探索性研究”(exploratorystudy),看看它是否具有新颖性与可行性。比如,通过查找文献,考察别人是否已经做过类似研究,并大致了解数据是否可得。
(1)通过文献回顾评估选题的新颖性
论文贵在有新意。假设你找到了一个具体、有趣而可行的研究问题,但它究竟有多少新颖性,这就不可避免地需要查阅文献,看看文献中是否已有类似研究。如果别人已做过很相似的研究,则通常须更换题目;除非另辟蹊径,找到很不相同的方法或数据。
对于中文论文,可在CNKI(ChinaNationalKnowledgeInfrastructure)中搜索。对于英文论文,可在JSTOR(JournalStorage)或EconLitwithFullText(美国经济学会)输入关键字进行搜索;二者均全文收录了许多经济类英文期刊,但前者有几年滞后。对于二者未覆盖的经济类期刊,可通过一些主要出版社(集团)搜索,比如ElsevierScienceDirect,SpringerLink,Taylor&Francis,Wiley等。某些工作论文则可通过百度或谷歌搜索。
以山东大学图书馆为例,其电子资源的第一页提供了如下资源(参见下图):
▲山东大学图书馆电子资源首页
什么时候开始看文献,即看文献的时机,也很重要。如果从一开始就大量地阅读文献,则可能被文献所淹没,望洋兴叹,自觉渺小。更好的方法是,当自己有了一定的想法之后,再去系统地看文献。这样,才会知道自己究竟要看什么,也更能带着批判的眼光去看。
另外,阅读文献的态度也十分重要。虚心地从经典论文中汲取营养,才能站在巨人的肩膀上,但仍应带着某种批判性的眼光。事实上,由于经济现象的复杂性(经济学还只是软科学),任何论文都有一定缺点(比如,忽略了某些可能重要的因素),也都有可以改进的空间(甚至可能推翻作者的结论),故不必太迷信“权威”。
既然经济学还不是科学,获得诺贝尔奖的经济学家可能持有相反的观点,那么又哪来的权威呢?重要的是,使用逻辑与实证的方法对不同的观点进行甄别与质疑。如果认为前人所做的研究已经十全十美,你都赞同,那么,你怎么可能做出新的边际贡献呢?
(2)确定所需数据是否可得
5
收集与整理数据
总之,在察看数据的过程中,主要观察数据中是否存在不一致(inconsistent)的地方;比如,出现了不可能、不现实或可疑的取值。如果发现,则要进行处理(比如,可能是数据输入错误),这被称为“数据清理”(datacleaning)。
对于大多数从事应用研究的学者而言,主要是使用别人(比如统计局、世界银行)提供的数据。即便如此,也应该对数据的质量有一个清醒的判断,并使用相应的计量方法(至少在做出实证研究的结论时,应考虑数据质量的影响)。在使用别人提供的数据时,还应注意其定义及统计口径,是否是与理论模型中的变量相对应。比如,中国的失业率指的是“城镇登记失业率”,其统计口径与标准教科书中以及西方国家的失业率概念有很大不同。
对于计量的初学者来说,与真实数据打交道也是加深对计量经济学理解的重要途径。只有弄脏你的手(getyourhandsdirty),才能真正学会做实证研究。
6
建立计量模型
对于回归函数的具体形式,可以考虑线性、对数(变量只取正数且有指数增长趋势)、双对数、非线性(边际效应不是常数)等。在进行模型设定时,应尽量使用常识(commonsense)与经济理论(economictheory)。
另外,模型既不能过于简单(解释变量过少),也不宜过于复杂,而应当保持适当的简洁(keepitsensiblysimple)。在选择解释变量时,“从小到大”(specific-to-general)的建模方法简单易行,但可能偏差较大(因为存在遗漏变量);而“从大到小”(general-to-specific)的建模方法偏差小,但不易执行。实践中,常采用折衷方案,即选择简单而有解释力的模型。
7
选择计量方法
总之,在这部分应该说明,为什么所用的计量方法是最恰当的。计量经济学的理论总是建立于一些理想化的假定基础之上,而现实的经济数据通常或多或少地不符合这些假定。因此,尽管计量理论是可以严格证明的一门科学,但实证研究在一定程度上却是一门艺术,常需要在理论与现实之间找到适当的妥协(bepreparedtocompromise)。
8
解释回归结果
使用计量方法估计模型后,计算机软件(比如Stata)将输出相应的计量结果。此结果可能较长,包含密密麻麻的表格与数字。如果你尝试了各种不同的计量方法与解释变量(alternativespecifications),则结果就会更复杂。
如何看这些结果?简单地说,只能用一个字一个字地看,直到看明白为止。当然,也有诀窍。计量结果可能很复杂,但真正重要的信息通常不多,比如回归系数(含符号)、p值,以及样本容量、拟合优度等。以一元回归为例(工资对数对教育年限回归),回归结果参见下图。
▲工资对数对教育年限的回归结果
在上图的回归结果中,变量s(教育年限)的回归系数符号为正(与经济理论相符),系数估计值为0.0966245,p值为0.000(在1%水平上具有统计显著性),样本容量为758,而拟合优度为0.2527(教育年限可解释工资对数约四分之一的变动)。在上图中,左上角的残差平方和、右下角的置信区间,乃至常数项等信息,基本可以不关心(除非有需要)。
在解释回归系数时,还应注意区分统计显著性与经济显著性。“统计显著性”(statisticalsignificance)主要通过p值来考察。如果p值小于或等于0.05,则意味着该系数在统计上显著地不等于零;反之,则在统计上不显著,在统计上可将此系数视为零(不存在)。
“经济显著性”(economicsignificance)主要通过系数的绝对值来考察,须特别注意变量的取值单位。在上例中,解释变量教育年限s的单位为年,而被解释变量工资对数lnw可解释为工资的百分比变化,故s的回归系数为0.0966245意味着,每增加一年教育,未来工资收入将提高9.66%,具有很高的经济显著性(可能过高了)。反之,假如s的回归系数为0.01或0.001,则意味着每增加一年教育,未来工资收入只会上升1%或0.1%,显然在经济意义上很不显著。此时,统计上显著而经济上不显著,则意味着解释变量对被解释变量的影响很小(经济上不显著),尽管这种影响被估计得很精确(统计上显著)。
但有时,所得计量结果未必尽如人意,比如关键解释变量不显著,甚至符号与预期相反。此时应怎么办呢?大致来说,出现这种情况,可能有如下三种原因。
(1)使用计量方法不当。比如,在上述一元回归中,显然遗漏了许多变量,可能存在遗漏变量偏差,导致OLS估计不一致。更一般地,如果存在内生性而未加以处理,将导致不一致的估计,使得本应显著的变量变得不显著。
(2)数据质量有问题。如果数据存在较大的度量误差,所用代理变量与真实变量相差较远(由于真实变量不可观测),或者数据输入中的人为错误,都有可能影响估计的一致性。
(3)经济理论有问题。在排除了以上两种可能性之后,最后一种可能性是,经济理论不正确。经济理论所预期的某种效应可能不存在;或者同时存在其他作用机制,使得净效应的符号相反。实证研究的目的之一就是检验经济理论。如果发现已有理论与经验证据不符,则说明此理论尚有改进空间,甚至需要放弃。正如林毅夫(2001,p.75)所指出:
如果发现理论推论和我国经验事实不一致,要坚持的不是现有的理论,而是进一步去了解我国的经验现象,然后,根据经验现象构建一个可以解释这个现象的理论。所以,当发现这种不一致时,不要死抱理论,成为现有理论的俘虏,也不要在巨人的面前而感到自己渺小。其实,这正是对理论发展做出贡献的绝好机会。
在计量实践中,研究者经常根据计量结果而调整模型,以期得到更为理想的结果,并且只在论文中汇报最佳的结果,而将寻找此结果的过程隐去。这实际上是“数据挖掘”(datamining)的一种形式。
数据挖掘既有成本(缺点),也有收益(优点)。数据挖掘的优点是,可对数据进行各种“实验”,以期揭示数据中的某种规律性,发现模型设定的错误,以此改进理论或计量模型。数据挖掘的缺点则是,由于它根据数据特征来设定计量模型,故模型设定由数据产生,如果再用此数据去检验由它产生的模型,就不是客观的检验,由此导致偏差。
事实上,一定程度的数据挖掘是不可避免的,而这两种形式的数据挖掘的界限并不清晰,正如Heckman(2000)指出,“尽管使用数据来检验受到该数据启发的理论存在严重的问题,但如果拒绝从数据中学习并修改理论,则会导致更严重的问题”。解决数据挖掘所带来的偏差的方法之一是进行稳健性检验,而不是仅汇报最佳的结果。
9
诊断性检验
任何计量方法都有其适用的前提条件;如果前提不成立,则无法使用此计量方法(可能导致不一致的估计)。因此,在估计完模型后,应对计量方法的前提条件进行“诊断性检验”(diagnosticchecking)或作出定性说明。
比如,使用工具变量法进行2SLS估计后,应进行弱工具变量检验、过度识别检验(假设存在过度识别)、解释变量内生性检验;并从定性的角度说明“排他性约束”(exclusionrestriction)为什么成立。
10
稳健性检验
在计量实践中,研究者通常会通过数据挖掘,找到“最佳”的计量模型。如果仅汇报此最佳模型,则会导致偏差。因此,有必要适当地改变模型的设定,比较其主要结果的变化。显然,只有稳健的结果才有说服力,故稳健性检验已成为高质量实证论文不可或缺的一部分。
11
论文写作
得到较为理想的实证结果之后,即可开始写论文。简单地说,论文就是对研究成果的汇报。为了便于读者更快地从论文中获取信息,经济学论文通常有一定的结构,而论文写作本身也是一门精益求精的艺术。经济学家曼昆曾问过加尔布雷斯(JohnK.Galbraith)写作成功的秘密;加尔布雷斯回答说,他写的所有东西都会修改很多次,通常直到第五稿时才会基本满意。下面分别介绍论文的各个部分。
(1)标题、关键字、摘要
论文的首页通常包括标题、作者、摘要、关键字等信息。标题(title)是论文的标签,正如商品的商标或名称。一般应选择简洁而有吸引力的标题,并能让读者知道该文主要做什么。在论文写作乃至成文之后,都有可能修改论文题目,使之更为贴切有趣。
在题目与作者之下,一般为摘要(abstract),通常在100字左右。摘要需突出论文的重要意义、研究方法与主要结论。一般读者会先看摘要,再决定是否看全文。因此,论文摘要应字斟句酌,凸显本文的主要贡献,并激起读者进一步阅读的兴趣。摘要通常在论文主体完成后才撰写,因为此时作者对于论文的主要内容会有更清晰的概念。
在摘要的下面,通常还需提供几个关键字(keywords),以便读者能很快地根据关键字搜索到此文。关键字常常来自论文的题目。另外,在关键字之下,还可能提供JEL分类号,这是美国经济学会主办的JournalofEconomicLiterature杂志所用的经济学各领域的分类编号。
经济学实证论文的正文一般依次包括以下部分:引言、文献回顾(可归入引言)、理论框架或背景介绍(可省略)、数据说明、计量模型与估计方法、回归结果、稳健性检验(可归入回归结果)、结论。下面分别进行说明。
(2)引言(Introduction)
引言虽是全文的第一部分,却经常最后写。原因之一,引言集中了全文的卖点(sellingpoints),最难撰写,须反复修改;原因之二,引言概括了全文的内容,只有在全文大体完工后,才能准确地总结与提炼。
现代的套路是,提出问题之后,马上直奔主题,介绍本文的研究方法与主要结论,然后再回头介绍本研究与现有文献的关系。这两种套路各有优缺点,适合不同的论文,但直奔主题的现代套路似乎日益流行。
另外,引言的最后一段通常提供全文的路标(roadmap),告诉读者本文的其余部分在结构上如何安排,以便于读者阅读。
(3)文献回顾(LiteratureReview)
文献回顾的写作切忌只是堆砌罗列一些文献,而未进行深入分析。事实上,文献回顾的根本目的是为了厘清本文的研究与已有文献的关系,以凸显本文的边际贡献及其在文献中的地位。
为此,在肯定现有文献的原创贡献外,难免会指出其不足之处(或被忽略的方面)。此时,应注意语气委婉,因为这些文献的作者有可能正是未来的审稿人或编辑。另一方面,你又希望突出本文的独特贡献(当然必须实事求是)。因此,在指出现有文献的不足与突出本文的贡献之间,需要找到措辞与语调上的平衡。
(4)背景介绍(BackgroundInformation)或理论框架(TheoreticalFramework)
实证论文并非仅仅是找一堆数据,然后汇报回归结果。只有告诉读者有关经济现象的背景,完整地述说一个经济故事,才能使得计量结果更有说服力。
如果可能,在此部分可引入一个简单的理论模型(theoreticalmodel)或思想框架(conceptualframework),为后续的实证研究提供理论基础。但对于实证论文而言,其理论部分不宜太过复杂,以致喧宾夺主。另外,如果经济现象过于复杂,没有现成的理论,也可根据常识(commonsense)直接写下计量模型或回归方程。
(5)数据说明(Datadescription)
如果对原始数据进行了一些处理或加工,也应一一说明。如果学术界对于数据的质量有质疑,则应说明这些潜在的数据质量问题,对于你的研究有何影响。比如,GDP的绝对水平可能被夸大了,而你仅使用GDP的增长率,故可能影响不大。如果数据来自问卷调查,则应说明随机抽样如何进行,问卷如何发放与执行等,并在附录中附上具体的问卷。
(6)计量模型与估计方法(Econometricmodelandestimation)
在此部分,需要结合所研究的问题以及已有数据,给出具体的计量模型,即回归方程。通常会有一个基准(baseline或benchmark)的计量模型,然后在此基础上对模型设定(modelspecification)有所变化,比如增加或替换变量。
此部分着重需说明论文的估计策略(estimationstrategy),即究竟应使用什么计量方法来识别主要变量之间的因果关系。初学者易犯的错误是,在论文中直接使用某计量方法,而未说明为什么这是最合适的计量方法。任何计量方法都有适用的前提条件,需要研究者仔细甄别与判断。如果有两个计量方法,各有优缺点,则可二者都用,然后作为稳健性检验,比较二者的结果。
(7)回归结果(Regressionresults)
(8)稳健性检验(Robustnesschecks)
在实证论文中仅仅汇报一个回归结果显然是不够的,因为变量的显著性可能在不同的模型设定下变化。只有在不同的模型设定下,都能得到类似的结果,才是稳健与可信的。对于稳健性检验的结果汇报,如果篇幅比较短,可归入上一部分的“回归结果”;反之,如果做了较多的稳健性检验,则可单独作为论文的一个部分。
(9)结论(Conclusion)
结论是论文的最后部分,对全文所作工作进行总结,并给读者留下最后的印象。结论部分通常概要地回顾本文的研究问题、计量方法与主要结论,也可重申本文的独特贡献。由于任何论文都有局限性,故也可指出未来的改进空间与研究方向。许多读者会先看引言与结论,再决定是否看正文,故结论部分也十分重要。
(10)参考文献(References)
几乎所有研究都建立在前人成果之上,故必然会在文中引用他人的论文或著作。这些论著的详细出处,则一般收集于文末的参考文献。需要特别注意的是,文中所有引用的论著,都应包括在参考文献中;反之,所有参考文献中的论著,都应在正文中被引用。
参考文献的顺序一般按照作者姓氏的字母(拼音)进行排列,对于同一作者的作品则按发表年代排序。另外,不同期刊对于参考文献的具体格式也有不同要求;在投稿前需按所投期刊的要求进行修改。
(11)附录(Appendix)
(12)写作风格
经济学论文属于科学类的论文,并不需要过于华丽的词藻,而应首先注意行文的简洁与逻辑性。另一方面,优美流畅的文笔对于提高论文可读性、吸引读者注意力十分重要。
对于论文中的方程式,可使用Word文档中的“insert”→“object”→“MicrosoftEquations”进行编辑,使得方程更为美观。论文中所有单独成行的方程式,都应按顺序编号,以(1)、(2)、(3)等表示,以便于检索。
12
结语
如何才能做出高水平的实证研究?如何才能写出高质量的经济学论文?更进一步,如何才能成为好的经济学家或经济工作者?显然,要达到这些目的,绝非单一学科(比如,计量经济学)就能胜任,而需要全方位的学识与素养。在此,引用凯恩斯的一段话作为结束语,并与大家共勉(曼昆,2009,p.39):
经济学研究似乎并不需要任何极高的特殊天赋。与更高深的哲学或纯科学相比,经济学不是……一门极其容易的学科吗?一门容易的学科,但这个学科中很少有人能出类拔萃!这个悖论的解释也许在于杰出的经济学家应该具有各种天赋的罕见的结合。在某种程度上,他应该是数学家、历史学家、政治家和哲学家。他必须了解符号并用文字表达出来。他必须根据一般性来深入思考特殊性,并在思绪奔放的同时触及抽象与具体。他必须根据过去、为着未来而研究现在。他必须考虑到人性或人的制度的每一部分。他必须同时保持果断而客观的情绪,像艺术家一样冷漠而不流俗,但有时又要像政治家一样脚踏实地。
参考文献
Heckman,James,2000.“CausalParametersandPolicyAnalysisinEconomics:ATwentieth-CenturyRetrospective,”QuarterlyJournalofEconomics,115,45-97.
Lin,JustinYifu,1992.“RuralReformsandAgriculturalGrowthinChina,”AmericanEconomicReview,82,34-51.
TheModernLanguageAssociationofAmerica,2009.MLAHandbookforWritersofResearchPapers,9thedition,NewYork.
Nunn,Nathan,andNancyQian,2011.“ThePotato'sContributiontoPopulationandUrbanization:EvidencefromaHistoricalExperiment,”QuarterlyJournalofEconomics,126,593-650.
林毅夫,《经济学研究方法和中国经济学科发展》,《经济研究》,2001年,第4期。
[美]曼昆,《经济学原理:微观经济学分册》,第5版,梁小民、梁砾译,北京大学出版社,2009年。
钱颖一,《理解现代经济学》,《经济社会体制比较》,2002年,第2期。