使用地理边界进行断点回归设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

使用地理边界进行断点回归设计

断点回归设计(Regression Discontinuity Design)是近年来十分流行的一种因果识别方法,被广泛地应用于社会科学研究的诸多领域。使用地理边界作为断点回归设计中断点的文章近年来也屡屡有佳作涌现,本期推送的是PennState University政治系副教授Luke J. Keele和密歇根大学政治系助理教授Rocio Titiunik发表在Political Analysis上的综述性文章Geographic boundaries as regression discontinuities。

题外话,推文作者注意到,其实早在Hahn等(2001)发表在Econometrica 上的经典文章之前,他们三位1999年就已经在一篇很古老的NBER工作论文中给出了断点回归设计的基本估计方法(NBER working paper No. 7131),可惜当时并未引起重视。

回到我们推送的文章,作者认为,地理断点回归(Geographic Regression Discontinuity,GRD)虽然其基本思想和估计方法与Hahn等(2001)给出的方法类似,但也有其自身独有的一些特点。作者将其归纳为以下三个主要的方面:第一,地理断点作为一种多维度处理效应,对结果变量的影响也是多维度的,很容易同时引起其他变量的跳跃,从而使研究者比其他类型的断点回归设计更容易遭遇联立性偏误的问题。第二,在GRD中,选用不同的距离度量方法将会影响断点回归中的处置变量(forcing variable或者assignment variable),进而对结果产生十分重大的影响。第三,任何使用GRD的研究都将无法回避空间相关性的问题,而现有的研究通常没有加以考虑。

地理边界对样本的处理效应实际上是高维的,其是否受到处置由经度、维度(有时可能还包括海拔)共同决定。地球上两点之间的距离是两点经度、维度和该点与地心距离的一个函数,通常我们不考虑地球是个不规则球体这一事实,并且认为相对于地球平均半径(6371千米),任何两点间的海拔差异都小得可以忽略不计。上述函数可以近似地简化为只包含两点的经纬度,但仍然是由两个参数决定的。

为了将GRD与经典RDD文献中的估计方法联系起来,文献中一个十分常见的方法是使用与政策边界最短距离作为处置变量。这一方法实际上是将高维处置效应化为低维处置效应,其背后隐含的一个加强后的假定是,沿着与政策边界最短距离相同的线移动时处理效应的大小不变,作者认为这一假定很大程度上是天真的。Chen et al. (2013)发表于PNAS使用“秦岭-淮河”断点的著名文章采用了同样的处理方式,但这样处理可能会遭遇到较为严重的偏差,当政策边界越长时这一问题越严重。

当时MIT经济系(现在任教于哈佛经济系)助理教授萌妹Melissa Dell在她2010年发表于Econometrica的文章Mita中使用了另外一种方法来解决这一问

题,她在小样本中直接控制不同点的经度和维度;在更大的样本中,进一步控制经度的平方、维度的平方以及经度×维度。为了解决长边界线时处置效应的异质性问题,Dell(2010)控制了许多沿政策线两侧分布区域的固定效应,从而使得其所估计的treatment effect被限定在一个较小的可比范围内。作者认为这一方法

是不严谨的,同时批评了Dell使用某个地区地理位置(通常是某个区域的中心

点经纬度)来匹配个体层面数据的做法,认为这样会导致潜在的问题。

为此,作者开发了一套基于非参数方法的GRD估计策略和识别方法,其技

术细节详见原文。由于地理断点通常是地理边界这一断点的特殊性,原则上可以在边界的每个点估计一个单独的处理效应(treatment effect),将每个点处的处理效应沿整条边界积分后,便可以得到我们想要估计的整条边界的处理效应。这一方法与ImbensandZajonc (2011)提出的多元RDD方法相似,但又不完全相同,从而使得我们能够捕捉政策边界上任意一点的处理效应或者任何一段的加权平均。

作者在文章最后给读者提供了关于进行此类研究的一些建议。首先,一定要确认研究设计尽量满足“个体无法准确操纵自身相对于政策边界位置”的条件。为了防止联立性偏误的发生,尽量保证可能与政策边界不与其他一些重要的地理边界(比如行政区域边界、学区等)重合。一旦重合,就要检验另外一些政策是否引发了与之直接相关的变量在边界两侧处置组和对照组间的跳跃。为了解决空间相关性问题,研究者应当对政策之前的因变量在政策边界两侧的空间相关程度进行估计,正常情况下应有较高的正的空间相关系数。处置效应本身显然会降低两侧的空间相关程度,如果数据支持这一预测,那么我们对空间相关性影响估计结果的担心将会大大减轻。

参考文献:

Chen, Y., Ebenstein, A., Greenstone, M., & Li, H. 2013. Evidence onthe impact of sustained exposure to air pollution on life expectancy fromChina’sHuai River policy. Proceedings of the National Academy of Sciences,

110(32),12936-12941.

Hahn, J., Todd, P., & Van der Klaauw, W. 1999. Evaluating the effectof an antidiscrimination law using a regression-discontinuity design (No.w7131). National bureau of economic research.

Hahn, J., Todd, P., & Van der Klaauw, W. 2001. Identification andestimation of treatment effects with a regression‐discontinuity design. Econometrica,69(1),

201-209.

Keele, Luke J., and Rocio Titiunik. 2014. “Geographic boundaries asregression discontinuities.” Political Analysis. mpu014.

相关文档
最新文档