DID双重差分法

合集下载

相关主题

双重差分模型介绍

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

双重差分法的平行趋势假定
双重差分法是估计处理效应的常见方法，但也有被滥用的倾向，因为有些应用者对于双重差分法的优点与局限缺乏了解，特别是其潜在的平行趋势（parallel trend）假定……
差分法的局限
经济学家常关心某政策实施后的效应，比如对于收入（ y ）的作用。

最简单（天真）的做法是比较处理组（即受政策影响的地区或个体）的前后差异，比如
这称为“差分估计量”（difference estimator），即将处理组（treatment group）政策实施后的样本均值，减去政策实施前的样本均值。

然而，由于宏观经济环境也随时间而变（时间效应），故政策实施地区的前后差异未必就是处理效应（treatment effects）。

双重差分法的反事实逻辑
为了解决差分法的局限性，常用方法是寻找适当的控制组（control group），即未实施政策的地区（或未参加项目的个体），作为处理组的反事实（counterfactual）参照系。

具体来说，可将未受政策影响的控制组之前后变化视为纯粹的时间效应，即
综合以上两个差分，即将处理组的前后变化减去控制组的前后变化，可得到对于政策处理效应更为可靠的估计：
(1)
这就是所谓的双重差分估计量（Difference in Differences，简记DD或DID），因为它是处理组差分与控制组差分之差。

该法最早由 Ashenfelter（1978）引入经济学，而国内最早的应用或为周黎安、陈烨（2005）。

从以上推理可知，DID的反事实逻辑能够成立，其基本前提是，处理组如果未受到政策干预，其时间效应或趋势应与控制组一样（故可以后者来控制时间效应），这就是所谓的“平行趋势”（parallel trend）或“共同趋势”（mon trend）假定。

下图直观地展示了DID的思想与平行趋势假定。

其中，t = 1 表示政策实施前（before），而 t = 2 表示政策实施后（after）。

然而，通过双重差分得到的DID估计量并不易计算其标准误，无法加入控制变量，也不易推广到多期数据。

故在实践中，一般通过回归的方法来得到DID估计量。

双重差分法的回归模型
考虑以下面板模型：
(2)
其中，Gi 为分组虚拟变量（处理组=1，控制组=0），表示处理组与控制组的固有差异（无论是否实施政策都存在）；Dt 为分期虚拟变量（政策实施后=1，政策实施前=0，允许使用多期数据），表示政策实施前后的时间效应（即使不实施政策也存在）；而交互项Gi · Dt 才真正表示处理组在政策实施后的效应，即处理效应。

这是因为，处理组在政策干预之后的期望值为：
而处理组在政策干预之前的期望值为：
故处理组期望值的前后变化为：
(3)
另一方面，控制组在政策干预之后的期望值为：
而控制组在政策干预之前的期望值为：
故控制组期望值的前后变化为：
(4)
将(3)式减去(4)式可知，双重差分的结果正好是回归方程(2)中交互项Gi · Dt 之系数β。

进一步可以证明，用OLS估计面板模型(2)，所得交互项Gi · Dt 之系数β 的估计值，正好等于双重差分法(1)的计算结果（陈强，2014，第335、339页）。

一般的双重差分回归
更一般地，可在面板模型中加入个体固定效应、时间固定效应，以及其它控制变量：
(5)
其中，ui 为个体固定效应（取代了更为粗糙的分组虚拟变量 Gi ，若同时二者包括将导致严格多重共线性），λt 为时间固定效应（取代了更为粗糙的分期虚拟变量 Dt ，若同时包括二者将导致严格多重共线性），zit 为一系列控制变量（影响结果变量 y 的其它因素），而εit 为暂时性冲击（transitory shock）。

不难看出，上式其实就是“双向固定效应模型”（two-way fixed effects），因为它既包括个体固定效应（ui ），也包括时间固定效应（λt ）；只不过多了双重差分法的关键变量，即交互项Gi · Dt （也称为“政策虚拟变量”，policy dummy）。

在具体回归中，个体固定效应 ui 可通过加入个体虚拟变量来实现（即LSDV法，或进行组内离差变换，within transformation）；而时间效应λt 可通过加入每期的时间虚拟变量（time dummies）来实现。

双重差分法的假定
为了使用OLS一致地估计方程(5)，需要作以下两个假定。

假定1、此模型设定正确。

特别地，无论处理组还是控制组，其时间趋势项都是λt 。

此假定即上文的“平行趋势假定”（parallel trend assumption）。

此假定比较隐蔽（有人称为“hidden assumption”），因为只要写下方程(5)，就已默认了平行趋势假定。

假定2、暂时性冲击εit 与政策虚拟变量Gi · Dt 不相关。

这是保证双向固定效应为一致估计量（consistent estimator）的重要条件。

在此，可以允许个体固定效应 ui 与政策虚拟变量Gi · Dt 相关（可通过双重差分或组内变换消去 ui ，或通过LSDV法控制 ui ）。

DID允许根据个体特征（ui ）进行选择，只要此特征不随时间而变；这是DID的最大优点，即可以部分地缓解因“选择偏差”（selection bias）而导致的内生性（endogeneity）。

如果违背假定1（平行趋势假定），会有什么后果？假设真实模型为：
则处理组（Gi =1）的时间趋势为(λt + ηt )，而控制组（Gi =0）的时间趋势为λt，故为非平行趋势。

如果将此模型误设为平行趋势，则实际估计的模型为
其中，Gi ηt 被纳入扰动项中，导致扰动项（Gi ηt + εit ）与政策虚拟变量（Gi · Dt ）相关，使得OLS不一致，也违背了上述假定2。

阿森费尔特沉降（Ashenfelte r’s dip）
在使用个体或企业层面的微观数据时，有些人认为因个体无法影响宏观政策（或培训项目）的推出，故为外生。

但事实上，个体依然可以自我选择是否参加项目，从而导致内生性。

比如，Ashenfelter (1978) 在研究就业培训的效应时发现，参加就业培训者在参加培训之年 (1964) 以及之前的那年 (1963)，其平均收入不仅相对于控制组下降，而且绝对地下降，称为“阿森费尔特沉降”（Ashenfelter’s dip），参见下图。

在上图中，实线为参加项目者的平均收入，而虚线为未参加项目者的平均收入（二者均为男性白人，该现象也存在于女性白人、男性黑人、女性黑人，在此从略）。

上图表明，在1963年与1964年收入下降的不走运者（εit 为很大的负向冲击），很多人自我选择参加就业培训。

如果因为εit 或εi,t-1 特别低而参加培训，则通常εi,t+1 与εi,t+2 会恢复到正常值，导致高估培训项目的效应。

而{εit } 也可能存在自相关。

这使得暂时性冲击εit 与政策虚拟变量Gi · Dt 相关，导致不一致的估计（也意味着非平行的时间趋势，违背假定1，参见上图）。

非平行趋势的检验与处理方法
方法一、画时间趋势图
如果在政策干预前有多期数据，则可分别画处理组与控制组的时间趋势图（类似于上图），并直观判断这两组的时间趋势是否平行（比如，考察是否存在Ashenfelter's dip）。

如果二者大致平行，则可增强对平行趋势假定的信心。

然而，即使在政策干预前两组的时间趋势相同，也无法保证二者在干预后的时间
趋势也相同（后者本质上不可观测，因为时间效应已与处理效应混合在一起）。

另外，如果只有两期数据，则无法使用此法。

方法二、加入更多的控制变量
从上文的讨论可知，非平行趋势可能由于遗漏变量所导致，故在 zit 中加入更多控制变量，或可缓解内生性。

但此法在实践中不易实施。

方法三、假设线性时间趋势
如果假设时间趋势为线性函数，则可加入每位个体的时间趋势项：
在具体回归时，加入个体虚拟变量与时间趋势项 t = 1, 2, ... , T 的交互项即可。

然而，线性时间趋势毕竟是较强的假定，不一定能成立。

故此法也不完全解决问题，但可作为稳健性检验。

方法四、三重差分法
在一定条件下，可通过引入两个控制组，进行三次差分，称为“三重差分法”（difference-in-differences-in-differences，简记DDD），这样可以更好地控制时间趋势的差异，使得平行趋势假定更易成立。

有关DDD的进一步介绍，参见陈强（2014，第343页）。