DID双重差分法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

双重差分法的平行趋势假定

双重差分法是估计处理效应的常见方法,但也有被滥用的倾向,因为有些应用者对于双重差分法的优点与局限缺乏了解,特别是其潜在的平行趋势(parallel trend)假定……

差分法的局限

经济学家常关心某政策实施后的效应,比如对于收入( y )的作用。最简单(天真)的做法是比较处理组(即受政策影响的地区或个体)的前后差异,比如

这称为“差分估计量”(difference estimator),即将处理组(treatment group)政策实施后的样本均值,减去政策实施前的样本均值。然而,由于宏观经济环境也随时间而变(时间效应),故政策实施地区的前后差异未必就是处理效应(treatment effects)。

双重差分法的反事实逻辑

为了解决差分法的局限性,常用方法是寻找适当的控制组(control group),即未实施政策的地区(或未参加项目的个体),作为处理组的反事实(counterfactual)参照系。具体来说,可将未受政策影响的控制组之前后变化视为纯粹的时间效应,即

综合以上两个差分,即将处理组的前后变化减去控制组的前后变化,可得到对于政策处理效应更为可靠的估计:

(1)

这就是所谓的双重差分估计量(Difference in Differences,简记DD或DID),因为它是处理组差分与控制组差分之差。该法最早由 Ashenfelter(1978)引入经济学,而国内最早的应用或为周黎安、陈烨(2005)。

从以上推理可知,DID的反事实逻辑能够成立,其基本前提是,处理组如果未受到政策干预,其时间效应或趋势应与控制组一样(故可以后者来控制时间效应),这就是所谓的“平行趋势”(parallel trend)或“共同趋势”(mon trend)假定。下图直观地展示了DID的思想与平行趋势假定。

其中,t = 1 表示政策实施前(before),而 t = 2 表示政策实施后(after)。然而,通过双重差分得到的DID估计量并不易计算其标准误,无法加入控制变量,也不易推广到多期数据。故在实践中,一般通过回归的方法来得到DID估计量。

双重差分法的回归模型

考虑以下面板模型:

(2)

其中,Gi 为分组虚拟变量(处理组=1,控制组=0),表示处理组与控制组的固有差异(无论是否实施政策都存在);Dt 为分期虚拟变量(政策实施后=1,政策实施前=0,允许使用多期数据),表示政策实施前后的时间效应(即使不实施政策也存在);而交互项Gi · Dt 才真正表示处理组在政策实施后的效应,即处理效应。这是因为,处理组在政策干预之后的期望值为:

而处理组在政策干预之前的期望值为:

故处理组期望值的前后变化为:

(3)

另一方面,控制组在政策干预之后的期望值为:

而控制组在政策干预之前的期望值为:

故控制组期望值的前后变化为:

(4)

将(3)式减去(4)式可知,双重差分的结果正好是回归方程(2)中交互项Gi · Dt 之系数β。进一步可以证明,用OLS估计面板模型(2),所得交互项Gi · Dt 之系数β 的估计值,正好等于双重差分法(1)的计算结果(陈强,2014,第335、339页)。

一般的双重差分回归

更一般地,可在面板模型中加入个体固定效应、时间固定效应,以及其它控制变量:

(5)

其中,ui 为个体固定效应(取代了更为粗糙的分组虚拟变量 Gi ,若同时二者包括将导致严格多重共线性),λt 为时间固定效应(取代了更为粗糙的分期虚拟变量 Dt ,若同时包括二者将导致严格多重共线性),zit 为一系列控制变量(影响结果变量 y 的其它因素),而εit 为暂时性冲击(transitory shock)。

不难看出,上式其实就是“双向固定效应模型”(two-way fixed effects),因为它既包括个体固定效应(ui ),也包括时间固定效应(λt );只不过多了双重差分法的关键变量,即交互项Gi · Dt (也称为“政策虚拟变量”,policy dummy)。在具体回归中,个体固定效应 ui 可通过加入个体虚拟变量来实现(即LSDV法,或进行组内离差变换,within transformation);而时间效应λt 可通过加入每期的时间虚拟变量(time dummies)来实现。

双重差分法的假定

为了使用OLS一致地估计方程(5),需要作以下两个假定。

假定1、此模型设定正确。特别地,无论处理组还是控制组,其时间趋势项都是λt 。此假定即上文的“平行趋势假定”(parallel trend assumption)。此假定比较隐蔽(有人称为“hidden assumption”),因为只要写下方程(5),就已默认了平行趋势假定。

假定2、暂时性冲击εit 与政策虚拟变量Gi · Dt 不相关。这是保证双向固定效应为一致估计量(consistent estimator)的重要条件。

在此,可以允许个体固定效应 ui 与政策虚拟变量Gi · Dt 相关(可通过双重差分或组内变换消去 ui ,或通过LSDV法控制 ui )。DID允许根据个体特征(ui )进行选择,只要此特征不随时间而变;这是DID的最大优点,即可以部分地缓解因“选择偏差”(selection bias)而导致的内生性(endogeneity)。

如果违背假定1(平行趋势假定),会有什么后果?假设真实模型为:

则处理组(Gi =1)的时间趋势为(λt + ηt ),而控制组(Gi =0)的时间趋势为λt,故为非平行趋势。如果将此模型误设为平行趋势,则实际估计的模型为

其中,Gi ηt 被纳入扰动项中,导致扰动项(Gi ηt + εit )与政策虚拟变量(Gi · Dt )相关,使得OLS不一致,也违背了上述假定2。

阿森费尔特沉降(Ashenfelte r’s dip)

在使用个体或企业层面的微观数据时,有些人认为因个体无法影响宏观政策(或培训项目)的推出,故为外生。但事实上,个体依然可以自我选择是否参加项目,从而导致内生性。

比如,Ashenfelter (1978) 在研究就业培训的效应时发现,参加就业培训者在参加培训之年 (1964) 以及之前的那年 (1963),其平均收入不仅相对于控制组下降,而且绝对地下降,称为“阿森费尔特沉降”(Ashenfelter’s dip),参见下图。

在上图中,实线为参加项目者的平均收入,而虚线为未参加项目者的平均收入(二者均为男性白人,该现象也存在于女性白人、男性黑人、女性黑人,在此从略)。上图表明,在1963年与1964年收入下降的不走运者(εit 为很大的负向冲击),很多人自我选择参加就业培训。

如果因为εit 或εi,t-1 特别低而参加培训,则通常εi,t+1 与εi,t+2 会恢复到正常值,导致高估培训项目的效应。而{εit } 也可能存在自相关。这使得暂时性冲击εit 与政策虚拟变量Gi · Dt 相关,导致不一致的估计(也意味着非平行的时间趋势,违背假定1,参见上图)。

非平行趋势的检验与处理方法

方法一、画时间趋势图

如果在政策干预前有多期数据,则可分别画处理组与控制组的时间趋势图(类似于上图),并直观判断这两组的时间趋势是否平行(比如,考察是否存在Ashenfelter's dip)。如果二者大致平行,则可增强对平行趋势假定的信心。然而,即使在政策干预前两组的时间趋势相同,也无法保证二者在干预后的时间

相关文档
最新文档