当前位置: 测量装置 >> 测量装置优势 >> 以赛亚安德鲁斯对理论计量经济学的贡献
原标题:以赛亚·安德鲁斯对理论计量经济学的贡献——年度约翰·贝茨·克拉克奖得主学术贡献评介
以赛亚·安德鲁斯(IsaiahAndrews),哈佛大学经济学教授来源
中国经济学教育科研网、经济学动态
摘要:哈佛大学经济学教授以赛亚·安德鲁斯由于在理论计量经济学领域的突出贡献而荣获年度约翰·贝茨·克拉克奖。他在结构模型的参数估计和检验等方面取得了丰硕的研究成果:在完善结构模型参数估计的稳健性检验方面,提出了测度和提升模型透明度、参数估计敏感度和信息度的方法;在识别和纠正参数估计偏误方面,提出了纠正发表偏倚和“赢家诅咒”问题的新方法;在结构模型弱识别条件和弱工具变量方面,构建了新的检验和修正方法。安德鲁斯旨在解决结构模型参数估计的稳健性检验和可信度提升问题,使得实证研究更加规范和完善,促进了理论计量经济学的发展和应用。关键词:以赛亚·安德鲁斯克拉克奖结构模型参数估计年的约翰·贝茨·克拉克奖颁发给了哈佛大学经济学教授以赛亚·安德鲁斯(IsaiahAndrews),以表彰其为理论计量经济学做出的突出贡献。美国经济学联合会认为安德鲁斯对计量经济学理论和实证研究的贡献提高了经济学定量研究的质量,在改进计量经济学一些重要实证研究方法中发挥了关键作用,使研究结果更为可靠,也更便于交流。安德鲁斯现年35岁,是克拉克奖获奖年龄偏小的经济学家,获耶鲁大学经济学和数学学士学位,年获麻省理工学院经济学博士学位,之后就职于哈佛大学,年晋升为正教授,年当选为计量经济学会会士。近年来,安德鲁斯在理论计量经济学领域成果丰硕,与合作者的论文大多发表在《美国经济评论》(AER)等经济学领域的顶级期刊上。本文从完善结构模型参数估计的稳健性、识别和修正估计偏误、弱识别条件的检验和参数推断、弱工具变量的识别和检验以及改进最优决策规则五个方面来梳理分析安德鲁斯近年来的研究成果。一、完善参数估计的稳健性检验安德鲁斯通过构建结构模型透明度、参数估计敏感度和信息度的测度方法,在检验和有效提升模型参数估计的稳健性方面做出了创新,从而有助于更好解读模型的实证研究结果。(一)测度和提升模型透明度一般而言,构建计量经济学模型都需要设定各种前提假设,然后才能对总体参数进行估计。由于设置模型的假设条件往往取决于研究者以及样本数据的各种矩条件特征,这可能会导致模型设置和参数估计的差异。在广泛应用的线性回归模型中,参数估计量是因变量和自变量的线性组合,依据方差和协方差等矩条件可以构建统计量,从而对参数进行检验和推断,可以较直观地发现这些数据的矩特征变化如何影响参数估计值。而结构模型的最大挑战就是,随着模型复杂程度的提升,关键参数的估计变得越来越不明确。可以认为,传统的结构型实证研究就像一个黑箱,一篇论文可能从一个包含众多前提假设的复杂模型开始,再提出极其复杂的估计方法,然后给出模型的估计结果和反事实推断。如果读者认可模型的全部假设条件,也就会接受该实证分析结果。反之,如果读者不认可模型的假设条件,或者提出了其他的假设条件,则对研究结论就会有不同的解读。因此,许多人非常重视对数据重要特征和变量关系的描述性统计分析,并考察它们与结构模型估计结果之间的关系。将具体数据特征与关键参数估计联系起来,有可能使估计结果更加透明,帮助对模型假设存疑的读者更好地了解模型及其估计结果。在《结构化研究的透明度》(Andrewsetal,a)一文中,安德鲁斯等假定,研究者在原假设条件得到的参数估计,读者基于不同假设条件得到不同的参数估计,定义两个参数估计离差平方的条件最小期望为估计风险。对于完整观测数据而言,可以把两个参数估计风险的降低之比定义为透明度,取值范围为0~1,其值越接近于1,则说明读者能够较容易地在其假设条件下得到与原作者较为相同的推断结果。那么,模型在某种程度上透明度较高,不容易受到各种假设条件的影响,这是一种有别于模型有效性和稳健性的重要特征。在结构模型的实证研究中,如何提高模型透明度?安德鲁斯等把结构化参数估计设定为数据统计量的函数并加上误差项,而误差项也取决于反映两者关系的函数形式。提高模型透明度的一种办法就是合理估计参数使这个误差项为0,那么参数估计值仅取决于数据的描述统计量。如果参数估计不能使这个误差项为0的话,也要使之最小化,使参数估计接近于数据统计量的函数。此外,他们还设计了如何减少工作量来测度模型透明度的办法,以方便读者分析不同假设下参数估计的潜在偏误。这些设计的贡献在于,读者可以根据安德鲁斯等提出的这几种测度方法来测出模型透明度,这样就将参数估计与具体数据特征联系起来,使得估计结果更加透明,以便更好地理解模型及其估计结果,进而对研究结论的解释更加精准。(二)测度和应用参数估计敏感度对于如何判定非线性模型参数估计是否具有稳健性,比如在遗漏变量情况下如何分析参数估计可能存在的估计偏误,在《测度参数估计对估计矩的敏感度》(Andrewsetal,)一文中,安德鲁斯等提出的解决方法可用来测量非线性模型中参数估计对模型假设条件的敏感度,而这些假设条件决定了参数估计与数据特征之间的关系。如果能够知道模型存在设定偏误,比如遗漏重要变量,或者存在其他违反经典假设的情况,就能据此测度参数估计值的变化及偏误大小。他们推导出的敏感度矩阵是矩条件到参数估计映射的局部逼近,可以渐进地将模型备择假设下的矩转化为参数估计的偏误,可以用其来反映不同假设条件对参数估计的影响。为了进一步说明参数估计敏感度,安德鲁斯等应用该方法研究了一些早期发表的案例。比如,DellaVignaetal()通过一场社会实验来分析慈善捐款的驱动力是来源于利他动机还是社会压力,发现社会压力是捐款的一个重要驱动力,而且普通家庭受这种驱动力的影响后更容易在上门拜访的律师劝说下捐款。模型原假设一是:如果家庭捐款少于10美元,那么该家庭将承受社会压力,如果家庭捐款超过10美元,就没有这方面的压力;原假设二是:如果没有这种社会压力,就不会捐款。对此,安德鲁斯等计算了社会压力参数估计的敏感度,发现捐款额集中在10美元,与模型假设一致。对于第二个假设,如果部分家庭捐款10美元只是因为捐赠纸币更方便,那么用敏感度测量函数可以发现社会压力影响捐款的参数估计值是偏高的。再比如,GourinchasParker()通过其生命周期消费模型研究发现,预防性动机在年轻时占主导地位,而生命周期动机在晚年占主导地位,这为观察到的驼峰型消费模式和年轻时高边际消费倾向并存提供了理论依据。而安德鲁斯等的研究表明,参数估计敏感度测量能够为消费周期的平滑和预防性动机所表现的特征提供直观的说明,并且举例说明在违背模型中消费和休闲的效用可分、不存在未观察到的收入来源两个假设条件时,如何分析参数估计的敏感度。他们发现假设条件是否成立对参数估计值会产生实质性影响。例如,不同的购物强度意味着消费和休闲的效用可分假设条件不成立,将会低估预防动机相对于生命周期储蓄的重要性;如果存在家庭内部收入转移,那么就违背了“不存在未观察到的收入来源”这个假设条件,也会产生明显的估计偏误。测度和提升参数估计敏感度的方法主要有两方面的贡献:一方面,得出了最小二乘估计对估计矩扰动的有限样本导数,并证明了该导数的极限值为敏感度矩阵;另一方面,研究人员可以在结构模型估计中报告敏感矩阵,以此增加模型的透明度,让读者更容易了解和量化违反假设条件对参数估计偏误和渐近性的影响。可见,安德鲁斯等提出这种方法的最大贡献在于:可以直观地将一个复杂的经济学现象进行解释和说明,并且使测度出的结果可以很容易地识别出估计偏误。当然,该方法也有一定的局限性:其一,敏感度测度矩阵只是一个局部近似,对于偏离原假设条件不明显的情况,可以提供较为准确的敏感度测量;而在偏离原假设较明显的情况下,仍然能够提供有价值的判断,但受限于线性逼近的局限性;而对于特别显著的假设条件偏差,则适用性较差。其二,敏感度矩阵的单位取决于矩条件的微分函数,虽然不会影响对特定备择假设条件下估计偏误的判断,但会影响对不同矩条件相对重要性的比较分析。(三)界定和应用参数估计信息度结构模型由于假设条件以及其高度复杂性而缺乏透明度,使得读者很难判断在模型设定偏误下估计结果如何变化。研究人员往往先估计普通回归系数或者相关系数,用以描述变量之间的关系,再将普通回归与结构估计结果联系起来,并将其作为识别分析的辅助条件,使结构模型的估计结果更容易理解。但是,我们通常很难知道研究人员所做的这些比较分析能否为模型估计提供有效信息,以便进行反事实推断和预测。如果由普通回归估计可以推导得到特定的结构估计结果,研究人员就可以集中精力评估将两种估计结果联系起来的前提假设是否合适。在《论结构估计中描述性统计的信息度》(Andrewsetal,b)一文中,安德鲁斯等提出了参数估计值信息度的概念和测度方法,通过测度信息度来量化结构估计最大可能偏误的下降程度。这种方法有两方面的贡献:一方面,让读者清楚地了解估计偏误可以修正的难易程度,这样读者可以选择合适的修正方法;另一方面,这种方法可以应用于各种模型,有望在模型实证分析中改进表达研究结果和政策评估的方式,特别是有利于对一项或几项政策的经济效应分析。假如研究人员构建了一个基准模型,基于数据的分布函数(比如随机实验中数据的联合分布)推导出目标参数的一个完全或者渐进无偏估计量。但读者可能不会接受基准模型的所有前提假设,因此可能会担心参数估计的无偏性。研究人员还报告了描述性统计向量的估计,这些信息也取决于数据的分布函数。由于基准模型设定了无偏估计和分布函数的关系,也反映了无偏估计和统计量的关系,但是否正确有待验证。如果研究人员能够让读者相信两者的关系,那么是否可以减少其对参数估计有偏性的疑虑呢?安德鲁斯定义了研究者的基准模型和读者更少假设条件的局部模型,分别测度两者估计的最大偏误,那么在满足一定条件下,1减去两个最大偏误比重的平方就被安德鲁斯等称其为结构模型参数估计的描述统计量的信息度。如果参数估计和描述性统计服从相同的联合分布,对两者回归得到的拟合优度就是信息度。与其他研究识别和测度模型设定偏误的方法相比,这种方法专注于描述普通回归和结构估计之间的关系,目的是让读者对研究结论的可靠性有更清晰的认识。根据信息度大小,就可以判断降低参数估计最大偏误的可能性,并且通过恰当的设计可以识别出估计偏误的来源,从而提高模型的透明度。而且即使对于计算复杂的模型,信息度的测量也相对较为容易。安德鲁斯等提出信息度的贡献在于:当参数估计出现偏误时,通过测算信息度的大小就可以得知这种偏误的程度,并且通过一些方法找到估计偏误的根源,进而修正这种偏误,提高研究结果的准确度。对于信息度测量和分析方法的应用,安德鲁斯等也做了很多案例研究,比较典型的案例是发行报纸网络版对印刷版的影响。比如,Gentzkow()使用调查的个人截面数据来估计华盛顿特区对报纸印刷版和网络版的需求,论文的核心目标是估计网络版在多大程度上对印刷版产生挤出效应,这在很大程度上取决于网络版和印刷版之间的替代性。为了分析网络版和印刷版的替代关系,该论文在数据方面做了特别的设置:其一是设置一组工具变量,用来反映网络阅读效用的改变,但不会影响印刷版阅读的效用,比如工作中的上网方式;其二是建立近似面板数据,分别统计最近一天和最近5个工作日的报纸消费量,从而可以分析印刷版与网络版的消费量随时间变化的关系。安德鲁斯等对此做了进一步的研究。假设报社没有提供在线阅读选项,那么印刷版读者变化可以用参数估计c来反映。他们为此定义了三个向量:第一个向量是工具变量的系数向量,是2SLS估计中用最近5个工作日印刷版读者数量对网络版读者数量的回归系数;第二个向量是面板回归系数向量,是最近一天印刷版读者数量对网络版读者数量的回归系数,用以控制最近5个工作日印刷版读者和网络版读者之间交互作用;第三个向量包括前述工具变量系数和面板回归系数。研究结果发现,工具变量系数的信息度非常低,模型总体信息度主要由面板回归系数的信息度构成,因此,要降低参数估计c最大可能偏误主要依赖于面板数据回归而不是工具变量。二、估计偏误问题的识别和纠正针对研究成果发表偏倚和政策评估“赢家诅咒”等引起的估计偏误问题,安德鲁斯提出了识别研究成果发表可能性的条件概率函数和纠正选择性发表偏倚的方法,并设计了混合推断方法以削弱政策评估存在的估计偏倚。(一)识别和纠正发表偏倚问题计量模型的实证研究结果难保正确无误,对已发表成果进行重复验证就会发现,尽管遵循了相同的方案和实验过程,但与初始研究相比,参数估计的显著性往往更小,甚至出现参数估计的系数符号相反的情况。由于期刊编辑和审稿人可能更倾向于发表统计检验显著的结果,研究人员相应地就会有更巨大的动机根据最终发表的可能性来选择性地撰写和提交研究结论,这些行为被统称为选择性发表或“发表偏倚”(publicationbias),极有可能会导致有偏估计和误导性推断。在《发表偏倚的识别和纠正》(AndrewsKasy,)一文中,安德鲁斯等讨论了容易产生发表偏倚的原因及其严重后果,设计了识别研究成果发表可能性的条件概率函数,并基于条件发表概率提出了如何纠正发表偏倚的方法。读者也可以运用安德鲁斯等所提出的方法对发表偏倚进行修正。安德鲁斯等提出的识别条件发表概率的方法是,对原始研究进行系统性重复研究,采用与原始研究相同的方案,针对其总体的不同样本进行分析。当发表的成果没有选择性偏倚且原始研究和重复研究具有相同的样本量时,估计结果的联合分布是对称的,即交换原始研究和重复研究的样本,结论应该是一致的。如果发表决策仅依赖于原始研究的估计结果,即存在选择性偏倚,就可以用这种联合分布的不对称性确定条件发表概率。尽管重复研究的样本大小往往不同,但非参数方法识别的条件发表概率都是适用的。安德鲁斯等进一步讨论了如何修正发表偏倚的问题。假设对同一问题有不同的估计结果并进行标准化处理,每个结果发表的概率服从一定的分布,如果期刊编辑或者审稿人偏好发表那些通过显著性检验的估计结果,则选择性发表扰乱了发表概率的正常分布,可以视为服从截断分布。已知某一项估计的条件发表概率,则可以构建截断样本密度函数及其分布函数,据此他们推导出了测度选择性发表的估计偏倚并提出如何纠正的方法。安德鲁斯等用该方法对已经发表的大量实证研究成果进行了分析,证实了发表偏倚问题的存在。他们对发表于-年间《美国经济评论》和《经济学季刊》的18篇跨学科实证研究论文的数据做了重复实验,从每篇论文中选择原作者所强调的最重要的具有显著统计意义的研究结果进行验证,发现调整后的参数估计虽然与原始研究的参数估计有一致性,但显著性普遍偏小,以95%的置信区间做参数区间估计,有12%的案例调整后的参数估计值的区间估计覆盖0值,但原始研究报告结果只有2%的案例的参数区间估计覆盖0值。安德鲁斯等的研究结论对期刊编辑和审稿人的启示是:可以采用其方法来评估待发表成果是否存在选择性,以及对参数估计结果、显著性检验和置信区间进行适当修正。这一方法尽管不能完全纠正所有可能存在的发表偏倚,但有助于了解偏倚程度,改进对研究结果的解释。(二)解决政策评估“赢家诅咒”问题传统模型的政策评估是在多种备选方案下通过最优目标来实现的,比如研究人员可能通过随机试验发现最佳方案,或者基于历史数据选择最佳投资策略等。但是由于只考虑特定方案而忽略了一般情况下的平均效应,目标参数估计结果可能存在严重偏误,特别是有很多研究对象或者可选方案时更是如此。传统的基于t检验的置信区间也可能会严重偏离,这种只反映优胜个体而忽略普通个体造成的估计偏倚现象被称为“赢家诅咒”,已经引起广泛