RD方法(regression-discontinuity-design)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

RD方法(regression discontinuity design)

●什么是regression discontinuity design?下面将用一篇文章来介绍:

如何理解「由于使用燃煤取暖,中国 5 亿北方居民预期寿命将缩短 5.5 年」?

7月8日发表在《美国国家科学院院刊》(PNAS)的一篇论文,向已经逐渐意识到空气污染危害的中国民众再次展现了残酷的现实:以淮河为界,烧煤供暖的中国北方地区空气污染水平高于中国南方,北方5亿居民因严重的空气污染,平均每人失去5年寿命。

这篇文章由清华大学的李宏彬、北京大学的陈玉宇和另外两位作者共同完成。前两位完成了这篇论文的主要部分。这个回答首先介绍他们的研究方法,再谈一谈研究者和媒体对这篇文章的引申。

●科学家如何得出「使用燃煤取暖中国5亿北方居民预期寿命将缩短5.5年」这个结论的?

首先要说的是这篇文章使用的RD方法(regression discontinuity design),即断点回归方法。断点回归方法是最近的政策评估中非常重要的一个方法,他可以在没有随机性的情况下识别出政策的效果。

在早期的研究中,要识别一个处理(Treatment)的效果,我们必须拥有随机性,比如两组随机分开的小白鼠,一组加上某种处理,一组没有处理,最后观察两者的区别。为什么我们那么需要随机性呢?因为研究的基础需要几组十分类似的群体,他们的任何特征都服从一个相同的分布,无论是性别、年龄、教育、健康程度……这样,我们才能确定几组对象之间出现的差别是来自于实验处理的差异,而非某些个人特征。从一个大样本中严格随机抽取的样本,正好满足这样的同分布假设。

但对于政策研究来说,我们不可能找到这样随机分开的两组人,而且也无法用实验的方法来获得结果——你能将随机分开的100人放在干净空气中,将另外100人放在肮脏空气中并观察一段时间吗?

一些研究者面对这种缺乏随机性的情况,采用了增加控制变量的方式。比如,把性别年龄教育健康程度全部放进回归式中,然后声称,两组人之间由于性别年龄教育健康的不同而造成的差别都已经去掉了,剩下的就是这个政策的效果了。

可是,这很容易遭到批评,而且是没完没了的批评。为什么不控制工资高低?婚姻状况?从事行业?只要没有随机分开,任何特征变量的差异造成的结果,都可能混淆在政策结果中,你不控制这个变量,政策的效果就仍然没有识别干净。遭到批评的研究者只能继续加变量,没完没了的加变量。

更关键的是,前面说的还是可以量化的东西,努力程度?性格特征?甚至,智商?这些不可观测的变量可能影响更大。举一个例子,科学家想知道上了“一本”大学对学生未来的工资有什么影响。上了一本和没上一本的大学生,显然不是随机分开的两个群体。当然也没法用控制变量的方法来消除“一本”之外的影响,因为肯定有一些不可观测的变量是你控制不了的。控制变量法至此完败。

但科学家并没有束手无策,他们找到了RD方法。所谓RD方法,就是观察那些在一本线上下2分的学生,看“上一本”和“没上一本”的学生的未来工资差异。这个想法的天才之处在于,高考的上下5分,实在是一件随机性非常大的事情。让这批学生重新考一次,不少学生的情况可能就要逆转。对于这5分区间内的学生来说,一条一本线,就像一个天然的分割线,将两组人随机分开了。

退一步说,即使我们将高考视为一项没有随机性的考试,RD方法还有另外一个假设——连续性假设。那些刚好上了一本的学生,比起差几分没上一本的学生,可能要聪明一点;也可能家庭环境好一点,请了好一点的家庭教师;也可能更努力一些,多做了几道习题。但注意,如果我们将智商、努力程度、家庭环境等等变量都视为连续的变量,那么上了一本的学生,比起没上一本的,也只是多了那么“一点点”。

于是,我们可以开始观察这批学生的工资了。RD方法的所有目光,都聚焦在了那个“间断点”上。首先看一本线下1分的学生,和线下2分的学生,线上2分的学生和线上1分的学生,是否有工资差别?直观上想,可能没有,可能前者比后者高10块,这说明在没有其他显著差别时,各种连续变量产出的工资,也应该是一个连续变量。但我们再看线上0分的学生,和线下1分的学生时,显著的工资差异出现了,乖乖,差1000块。

线上0分的学生,和线下1分的学生,各种特征都应该是差不多的,即便有差别,在连续性假设下也应该是很小很小的差别,那么产生这样显著的工资差异,只能由前者上了一本,而后者没上一本来解释了,因为这是两者间唯一的区别。于是,科学家们说,“上一本”这个事情,可以增加大学生大约1000元工资。

我们回到这篇论文上,作者正是观察到了这样一条天然的分割线:淮河以北地区,政府提供了暖气,用烧煤的方式进行,而淮河以南则没有。那么,淮河两岸十分接近的两个地区,理论上来说也应该服从这样的“连续性”假设,也就是各种变量都差不多,唯一的区别就是有没有烧煤。于是作者发现,由于烧煤,淮河以北的空气总悬浮物比淮河以南多了

而空气污染造成的结果,淮河两岸的人均寿命差异则是惊人的5年。

同时,不考虑空气污染,用其他变量预测出来的人均寿命则几乎没有差别。这说明了连续性假设是成立的,淮河两岸的两个十分接近的地区几乎拥有相同的特征。作者还发现,淮河以北的超额死亡率,正是由和空气污染相关的心肺疾病相关,并进而与空气总悬浮物相关,而与谋杀、自杀等因素无关。

至此,作者终于给出结论:烧煤将使空气总悬浮物大幅度上升,并使中国北方地区的居民人均寿命降低5年。

Regression Discontinuity Design的局限性

「由于使用燃煤取暖,中国5亿北方居民预期寿命将缩短5.5年」这个结论有什么问题?

如果看完上面那段,你感到心服口服,感叹科学家真聪明,RD方法真奇妙,进而相信了这个结论,那……你可能不是从事学术工作的。

这项研究主要存在以下三个问题。

第一个问题:连续性假设是否对所有变量都成立?

淮河分界线两边的城市,真的在所有变量上都是连续的吗?作者在Figure4中控制了许多变量,并验证他们都是连续的,但那些没有控制的变量呢?我们可能可以说说高考差5分的学生没有什么显著差别,但一条河流两旁的城市,我们就很难说他没有显著差别。由于河流两侧的流速不同,地势不同,我们常常能发现一条河两侧的气候特征相差较大,甚至作物种植

相关文档
最新文档