无条件分位数回归文献综述与应用实例上学习资料

无条件分位数回归文献综述与应用实例上学习资料
无条件分位数回归文献综述与应用实例上学习资料

无条件分位数回归:文献综述与应用实例(上)

朱平芳张征宇

2013-1-7 11:17:39 来源:《统计研究》(京)2012年3期第88~96页

内容提要:条件分位数回归(conditional quantile regression,CQR)方法已成为经济学实证研究的常用方法之一。由于CQR 结果的经济学阐释基于过多甚至是不必要的控制变量,这与人们所关心的问题有可能并不一致。例如,在劳动经济学对教育回报的研究中,无论个体的年龄,性别与家庭特征如何,教育程度对于个人收入的异质性影响是人们关注的重点,即人们想了解收入关于教育程度的无条件分位数估计。本文旨在介绍近年来发展起来的无条件分位数回归(unconditional quantile regression,UQR)技术并梳理相关文献。特别地,本文介绍三种重要的无条件分位数回归模型:Firpo,Fortin和Lemieux(2009)提出的再中心化影响函数(recentered influence function,RIF)回归,Frolich和Melly(2010)提出的无条件分位数处理效应模型与Powell(2010)提出的一般无条件分位数回归。另外,论文还运用一个研究居民收入分配格局变化对其医疗支出影响的实例详细说明了新方法的应用。

关键词:条件分位数回归无条件分位数回归 RIF回归处理效应模型

作者简介:朱平芳(1961-),男,浙江兰溪人,1987年毕业于上海财经大学应用统计专业,获经济学硕士学位,2005年毕业于上海社会科学院经济研究所,获经济学博士学位,现为上海社会科学院数量经济研究中心主任,研究员,博士生导师,兼任中国数量

经济学会常务理事,上海市数量经济学会副理事长兼秘书长,研究方向为科技政策与科技进步;张征宇(1981-),男,浙江宁波人,2006年毕业于复旦大学数学系数学专业,获理学硕士学位,2009年毕业于上海财经大学经济学院数量经济学专业,获经济学博士学位,现为上海社会科学院数量经济研究中心副研究员,兼任上海市数量经济学会理事,研究方向为微观计量经济学。

一、引言

自从Koenker和Bassett(1978)提出分位数回归(quantile regression,QR)方法以来,其已发展成为经济学实证研究的常用方法之一。最初,QR方法仅被看作是用来替代最小二乘(OLS)估计的一种稳健(robust)估计。事实上,经济学家们在如今的实证研究,特别是基于微观数据的研究中青睐QR方法,并不在于它的稳健特性,而是可以借此方法了解解释变量对于被解释变量在扰动项的不同分位点上的异质性影响。通常,人们在评估一项经济政策对受众群体的影响时,不但希望了解政策对任一参与者的平均影响,更希望知道政策对位于特征分布不同位置(分布末端或顶端)人群的异质性作用。例如,教育对于人们收入的影响作用是劳动经济学中极具争议的问题之一。由于人的能力不可直接观测,且普遍被认为与个人的收入水平密切相关,因此,工资方程的扰动项很大意义上就是用来包含不可观测的个人能力。在这种设定下,通过分位点回归,人们可以了解对于不同能力水平的个人,可观测的个体特征

如何影响他们的收入。

从以上例子不难理解,Koenker和Bassett(1978)提出的只是条件分位数回归方法。条件分位数(CQR)方法的结果实际上只告诉我们对于具有相同观测特征的个人(例如,具有某一特定年龄,家庭背景的女性),不可观测的能力差异对于收入的异质性影响。由于CQR的经济学意义阐释基于过多甚至是不必要的个体特征,其结果与政策制定者所关心的问题很有可能并不一致。例如,人们可能只想了解教育年限对于个人收入的一般边际影响,而无论个体的年龄,性别与家庭背景如何,这就是所谓收入关于教育程度的无条件分位数估计问题。解决这个问题的一个直觉想法是在计算中抛弃除了教育年限外的其他解释变量,直接用收入对教育年限进行分位数回归,但这种做法得到的无条件分位数不是一致估计。这一点类似于在最小二乘法中即使研究者只想了解某一解释变量对被解释变量的偏影响系数,遗漏剩余解释变量仍会导致所有系数估计的不一致性,除非遗失变量与所剩变量是正交的。

无条件分位数回归(unconditional quantile regression,UQR)技术正是对于CQR技术的补充和拓展,在基于微观数据的实证研究中,特别是在劳动经济学与经济政策评估中具有十分重要的意义。在这一前沿领域,国外学者的研究也只是刚刚开始,并且有关无条件分位数回归的理论与方法正在逐渐完善之中。本文旨在介绍UQR技术并梳理相关文献。特别地,我们介绍三种重要的无条件分位数回归模型:Firpo、Fortin和Lemieux(2009)的再中心化影响函数(recentered influence function,RIF)回归,Frolich和Melly(2010)的无条件分位数处理效应模型与Powell(2010)的无条件分位数回归。有关UQR与CQR的差别,本文将在第二部分“无

条件分位数回归的最新进展”中详细说明。

另外,本文试图用一个研究居民收入分配格局变化对其医疗支出影响的实例说明新方法的应用。该实例将说明居民总体收入分配格局的变化如何影响其医疗支出的分布,而已有基于条件分位数回归技术的文献无法对这一问题做出全面的回答。运用新方法的实证结果表明:在控制了疾病严重程度与城乡差异等因素后,由收入引起的居民医疗消费不平等显著存在;居民收入的按量(by amount)增长无法改善这种不平等,而收入的按比例(by proportion)增长对医疗高消费人群的拉动作用远大于对低消费人群的作用,因而进一步加剧了这种不平等性。

二、无条件分位数回归的最新进展

(一)RIF回归

假设已经获得了被解释变量Y以及可能影响Y的k维解释变量X的观测值。我们关心的是X的变动对Y的影响。例如研究者时常关心以下条件分位数偏效应(conditional quantile partial effects,CQPE)的估计值:

问题1:仅当收入发生微小改变时,引起所有具备特征X=x的个体组成群体的Y分布τ-条件分位数的变化量①。

CQPE尽管可以帮助我们回答问题1,但是却无法回答下面虽与问题1密切相关,但有明显区别的另一问题:

问题2:当整个人群的收入分布发生微小变化时,他们的Y分布的τ-分位数将产生何种变化?

问题2与问题1的相似之处在于两者都是关心X的边际变动对Y分布的影响;两者的显著不同是:问题1只是针对整个人群中的某一(具有特征X=x)子人群而言,而问题2是针对整个人群整体而言。

一般地,我们需要了解X分布的微小变化对于被解释变量Y无条件分布τ-分位数的影响。这等价于计算以下无条件分位数偏效应(unconditional quantile partial effects,UQPE):

来获得UQPE的估计。为应对这一难题,Firpo,Fortin和Lemieux(FFL,2009)借用稳健估计(robust estimation)中影响函数(influence function)的基本概念,建立了估计UQPE的一般步骤。该方法的基本思想如下:利用统计学中稳健估计的若干知识,可得以下恒等式:

将式(6)与式(5)右边相减,除以增量Δx并令Δx趋向于零,可以得到X的单位平移变换对Y的τ-无条件分位数的边际影响,即无条件分位数偏效应:

最后,FFL建议从式(7)出发,通过以下三步获得UQPE的一致估计:

来获得UQPE(τ)的一致估计。(二)无条件分位数处理效应

相关主题
相关文档
最新文档