DID双重差分法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
双重差分法的平行趋势假定
双重差分法是估计处理效应的常见方法,但也有被滥用的倾向,因为有些应用者对于双重差分法的优点与局限缺乏了解,特别是其潜在的平行趋势(parallel trend)假定……
差分法的局限
经济学家常关心某政策实施后的效应,比如对于收入( y )的作用。
最简单(天真)的做法是比较处理组(即受政策影响的地区或个体)的前后差异,比如
这称为“差分估计量”(difference estimator),即将处理组(treatment group)政策实施后的样本均值,减去政策实施前的样本均值。
然而,由于宏观经济环境也随时间而变(时间效应),故政策实施地区的前后差异未必就是处理效应(treatment effects)。
双重差分法的反事实逻辑
为了解决差分法的局限性,常用方法是寻找适当的控制组(control group),即未实施政策的地区(或未参加项目的个体),作为处理组的反事实(counterfactual)参照系。
具体来说,可将未受政策影响的控制组之前后变化视为纯粹的时间效应,即
综合以上两个差分,即将处理组的前后变化减去控制组的前后变化,可得到对于政策处理效应更为可靠的估计:
(1)
这就是所谓的双重差分估计量(Difference in Differences,简记DD或DID),因为它是处理组差分与控制组差分之差。
该法最早由 Ashenfelter(1978)引入经济学,而国内最早的应用或为周黎安、陈烨(2005)。
从以上推理可知,DID的反事实逻辑能够成立,其基本前提是,处理组如果未受到政策干预,其时间效应或趋势应与控制组一样(故可以后者来控制时间效应),这就是所谓的“平行趋势”(parallel trend)或“共同趋势”(mon trend)假定。
下图直观地展示了DID的思想与平行趋势假定。
其中,t = 1 表示政策实施前(before),而 t = 2 表示政策实施后(after)。
然而,通过双重差分得到的DID估计量并不易计算其标准误,无法加入控制变量,也不易推广到多期数据。
故在实践中,一般通过回归的方法来得到DID估计量。
双重差分法的回归模型
考虑以下面板模型:
(2)
其中,Gi 为分组虚拟变量(处理组=1,控制组=0),表示处理组与控制组的固有差异(无论是否实施政策都存在);Dt 为分期虚拟变量(政策实施后=1,政策实施前=0,允许使用多期数据),表示政策实施前后的时间效应(即使不实施政策也存在);而交互项Gi · Dt 才真正表示处理组在政策实施后的效应,即处理效应。
这是因为,处理组在政策干预之后的期望值为:
而处理组在政策干预之前的期望值为:
故处理组期望值的前后变化为:
(3)
另一方面,控制组在政策干预之后的期望值为:
而控制组在政策干预之前的期望值为:
故控制组期望值的前后变化为:
(4)
将(3)式减去(4)式可知,双重差分的结果正好是回归方程(2)中交互项Gi · Dt 之系数β。
进一步可以证明,用OLS估计面板模型(2),所得交互项Gi · Dt 之系数β 的估计值,正好等于双重差分法(1)的计算结果(陈强,2014,第335、339页)。
一般的双重差分回归
更一般地,可在面板模型中加入个体固定效应、时间固定效应,以及其它控制变量:
(5)
其中,ui 为个体固定效应(取代了更为粗糙的分组虚拟变量 Gi ,若同时二者包括将导致严格多重共线性),λt 为时间固定效应(取代了更为粗糙的分期虚拟变量 Dt ,若同时包括二者将导致严格多重共线性),zit 为一系列控制变量(影响结果变量 y 的其它因素),而εit 为暂时性冲击(transitory shock)。
不难看出,上式其实就是“双向固定效应模型”(two-way fixed effects),因为它既包括个体固定效应(ui ),也包括时间固定效应(λt );只不过多了双重差分法的关键变量,即交互项Gi · Dt (也称为“政策虚拟变量”,policy dummy)。
在具体回归中,个体固定效应 ui 可通过加入个体虚拟变量来实现(即LSDV法,或进行组内离差变换,within transformation);而时间效应λt 可通过加入每期的时间虚拟变量(time dummies)来实现。
双重差分法的假定
为了使用OLS一致地估计方程(5),需要作以下两个假定。
假定1、此模型设定正确。
特别地,无论处理组还是控制组,其时间趋势项都是λt 。
此假定即上文的“平行趋势假定”(parallel trend assumption)。
此假定比较隐蔽(有人称为“hidden assumption”),因为只要写下方程(5),就已默认了平行趋势假定。
假定2、暂时性冲击εit 与政策虚拟变量Gi · Dt 不相关。
这是保证双向固定效应为一致估计量(consistent estimator)的重要条件。
在此,可以允许个体固定效应 ui 与政策虚拟变量Gi · Dt 相关(可通过双重差分或组内变换消去 ui ,或通过LSDV法控制 ui )。
DID允许根据个体特征(ui )进行选择,只要此特征不随时间而变;这是DID的最大优点,即可以部分地缓解因“选择偏差”(selection bias)而导致的内生性(endogeneity)。
如果违背假定1(平行趋势假定),会有什么后果?假设真实模型为:
则处理组(Gi =1)的时间趋势为(λt + ηt ),而控制组(Gi =0)的时间趋势为λt,故为非平行趋势。
如果将此模型误设为平行趋势,则实际估计的模型为
其中,Gi ηt 被纳入扰动项中,导致扰动项(Gi ηt + εit )与政策虚拟变量(Gi · Dt )相关,使得OLS不一致,也违背了上述假定2。
阿森费尔特沉降(Ashenfelte r’s dip)
在使用个体或企业层面的微观数据时,有些人认为因个体无法影响宏观政策(或培训项目)的推出,故为外生。
但事实上,个体依然可以自我选择是否参加项目,从而导致内生性。
比如,Ashenfelter (1978) 在研究就业培训的效应时发现,参加就业培训者在参加培训之年 (1964) 以及之前的那年 (1963),其平均收入不仅相对于控制组下降,而且绝对地下降,称为“阿森费尔特沉降”(Ashenfelter’s dip),参见下图。
在上图中,实线为参加项目者的平均收入,而虚线为未参加项目者的平均收入(二者均为男性白人,该现象也存在于女性白人、男性黑人、女性黑人,在此从略)。
上图表明,在1963年与1964年收入下降的不走运者(εit 为很大的负向冲击),很多人自我选择参加就业培训。
如果因为εit 或εi,t-1 特别低而参加培训,则通常εi,t+1 与εi,t+2 会恢复到正常值,导致高估培训项目的效应。
而{εit } 也可能存在自相关。
这使得暂时性冲击εit 与政策虚拟变量Gi · Dt 相关,导致不一致的估计(也意味着非平行的时间趋势,违背假定1,参见上图)。
非平行趋势的检验与处理方法
方法一、画时间趋势图
如果在政策干预前有多期数据,则可分别画处理组与控制组的时间趋势图(类似于上图),并直观判断这两组的时间趋势是否平行(比如,考察是否存在Ashenfelter's dip)。
如果二者大致平行,则可增强对平行趋势假定的信心。
然而,即使在政策干预前两组的时间趋势相同,也无法保证二者在干预后的时间
趋势也相同(后者本质上不可观测,因为时间效应已与处理效应混合在一起)。
另外,如果只有两期数据,则无法使用此法。
方法二、加入更多的控制变量
从上文的讨论可知,非平行趋势可能由于遗漏变量所导致,故在 zit 中加入更多控制变量,或可缓解内生性。
但此法在实践中不易实施。
方法三、假设线性时间趋势
如果假设时间趋势为线性函数,则可加入每位个体的时间趋势项:
在具体回归时,加入个体虚拟变量与时间趋势项 t = 1, 2, ... , T 的交互项即可。
然而,线性时间趋势毕竟是较强的假定,不一定能成立。
故此法也不完全解决问题,但可作为稳健性检验。
方法四、三重差分法
在一定条件下,可通过引入两个控制组,进行三次差分,称为“三重差分法”(difference-in-differences-in-differences,简记DDD),这样可以更好地控制时间趋势的差异,使得平行趋势假定更易成立。
有关DDD的进一步介绍,参见陈强(2014,第343页)。