(完整word版)DID双重差分法
DID双重差分回归课件
3
Y
Yt1 Ya Yb Yt2
True effect = Yb-Ya Estimated effect =Yt2-Yt1
t1
ti
t2
time
DID双重差分回归
4
• Intervention occurs at time period t1 • True effect of law
• Tit =1 if obs i belongs in the state that will eventually be treated • Ait =1 in the periods when treatment occurs • TitAit -- interaction term, treatment states after the intervention
DID双重差分回归
9
Y Yc1
Yc2 Yt1
Yt2
Treatment effect= (Yt2-Yt1) – (Yc2-Yc1)
control Treatment Effect
treatment
t1
t2
time
DID双重差分回归
10
• In contrast, what is key is that the time trends in the absence of the intervention are the same in both groups
• What assumptions must be true in order for the model to provide and unbiased estimate of β3?
• Do the authors provide any evidence supporting these assumptions?
双重差分法(DID)平行趋势检验的Stata操作
双重差分法(DID)平行趋势检验的Stata操作双重差分法(DID)有一个重要的前提假设——平行趋势假定,即处理组如果没有受到政策干预,其时间趋势应与控制组一样。
很多人不重视平行趋势检验,认为随便跑几个DID回归就完事了,事实上,平行趋势检验是DID的规定动作,规范地对平行趋势假定进行检验是一篇DID论文中至关重要的部分。
如果不满足平行趋势假定,那么两次差分得出的政策效应就不完全是真实的政策效应,其中有一部分是由处理组和控制组本身的差异所带来的。
数据来源石大千老师等(2018)发表在《中国工业经济》的论文《智慧城市建设能否降低环境污染》使用DID方法评估了智慧城市建设对城市环境污染的影响,《中国工业经济》期刊官网公布了这篇论文使用的数据和代码。
接下来,我就使用这篇论文的数据,给大家分享一下双重差分法(DID)平行趋势检验的Stata操作。
原文信息石大千,丁海,卫平,刘建江.智慧城市建设能否降低环境污染[J].中国工业经济,2018(06):117-135.时间趋势图平行趋势检验的第一种方法是绘制时间趋势图。
通过绘制处理组和控制组的被解释变量随时间变化的平均值,我们可以粗糙地判断处理组和控制组的时间趋势是否存在差异。
egen mean_y=mean(lnrso), by(year du)graph twoway (connect mean_y year if du==1,sort msize(s mall)) (connect mean_y year if du==0,sort lpattern(dash) msize( small)), ///xline(2012,lpattern(dash) lcolor(gray)) ///ytitle('lnrso') xtitle('Year') ///ylabel(,angle(0) labsize(*0.75)) xlabel(,labsize(*0.75)) ///legend(label(1 '处理组') label( 2 '控制组')) ///图例xlabel(2005(1)2015) graphregion(color(white)) //白底在Stata 17中,我们可以使用xtdidregress + estat trendplots 命令轻松绘制出处理组和控制组的时间趋势图,这方便了许多。
双重差分法(DID)安慰剂检验的做法:随机抽取500次?
双重差分法(DID)安慰剂检验的做法:随机抽取500次?“安慰剂”(placebo)⼀词来⾃医学上的随机实验,⽐如要检验某种新药的疗效。
此时,可将参加实验的⼈群随机分为两组,其中⼀组为实验组,服⽤真药;⽽另⼀组为控制组,服⽤安慰剂(⽐如,⽆⽤的糖丸),并且不让参与者知道⾃⼰服⽤的究竟是真药还是安慰剂,以避免由于主观⼼理作⽤⽽影响实验效果。
双重差分法(DID)安慰剂检验的核⼼思想就是虚构处理组或者虚构政策时间进⾏估计,如果虚构情况下“伪政策虚拟变量”的系数依然显著,那么就说明原来的估计结果很有可能出现了偏误,我们的被解释变量y的变动很有可能是受到了其他政策或者随机性因素的影响。
说到虚构,那么⾃然是可以随机虚构,也可以不随机虚构(作者⾃⼰设定)。
当然,我更推荐的还是随机虚构处理组或者是政策时间的⽅法。
由于我们使⽤的数据基本都是“⼤N⼩T”型的短⾯板数据,所以随机虚构政策时间没什么意义,⽂献⼀般做法都是将政策年份统⼀提前2年或3年重新进⾏回归,看看政策虚拟变量系数是否依然显著。
我们更多地还是随机虚构处理组,具体做法就是随机选取个体作为处理组,重复500次或者1000次,看看“伪政策虚拟变量”的系数是否显著。
数据来源⽯⼤千等(2018)发表在《中国⼯业经济》的论⽂《智慧城市建设能否降低环境污染》使⽤DID⽅法评估了智慧城市建设对城市环境污染的影响,《中国⼯业经济》期刊官⽹公布了这篇论⽂使⽤的数据和代码。
接下来,我就使⽤这篇论⽂的数据,给⼤家分享⼀下双重差分法(DID)安慰剂检验中随机虚构处理组这种⽅法的Stata操作。
原⽂信息⽯⼤千,丁海,卫平,刘建江.智慧城市建设能否降低环境污染[J].中国⼯业经济,2018(06):117-135.随机虚构处理组的Stata操作双重差分法(DID)安慰剂检验的⼀般做法就是随机选取个体作为处理组,重复500次或者1000次,看看“伪政策虚拟变量”的系数是否显著。
在⽯⼤千等(2018)这篇论⽂中,处理组有32个城市,控制组有165个城市,所以我们需要从197个城市中随机选取32个城市作为“伪处理组”,假设这32个城市是智慧城市试点,其他城市为控制组,然后⽣成“伪政策虚拟变量”(交互项)进⾏回归。
多期双重差分法(DID)的Stata操作
多期双重差分法(DID)的Stata操作如果政策实施时点⼀致的话,那么我们就可以使⽤标准DID愉快地玩耍了。
但是,更多情况下,政策实施时点是不⼀致的,这时候就该多期DID粉墨登场了。
在多期DID模型中,因为不同个体实施政策的时点(period)不同,所以政策分期变量会变成(注意下标)。
与标准DID⼀样,我们需要⽣成地区维度的政策分组变量treat和时间维度的政策分期变量period,交互项treat×period的系数反映的就是经过政策实施前后、处理组和控制组两次差分后所得到的政策效应。
那么,如何在Stata中实现多期DID的操作呢?让我们看⼀个经典的案例!数据说明贾瑞雪⽼师(2014)的论⽂《The Legacies of Forced Freedom: China’s Treaty Ports》是⼀篇经典的计量史学论⽂,《Review of Economics and Statistics》官⽹上公布了这篇论⽂的数据和代码,接下来我就使⽤作者公布的数据和代码跟⼤家分享⼀下多期DID的Stata操作。
Replication Data for: Ruixue Jia . The Legacies of Forced Freedom: China's Treaty Ports[J]. Review ofEconomics and Statistics, 2014, 96(4):596-608.建议⼤家在看下⾯的内容之前,最好先看⼀下“殖民的遗产:通商⼝岸给近现代中国带来了什么?”这篇推⽂,这样可能理解起来更加顺畅。
识别策略清朝末期,清政府与西⽅列强签订了⼀系列不平等条约,开放沿江沿海等城市作为通商⼝岸即是不平等条约的主要内容之⼀。
贾瑞雪⽼师(2014)将近代通商⼝岸的设置作为⼀项准⾃然实验,评估了通商⼝岸对中国近现代⼈⼝和经济发展的长期影响。
从1840年⾄1910年,中国⼀共被迫开放了40多个通商⼝岸。
双重差分模型(DID)介绍及其应用
双重差分模型(DID)介绍及其应用双重差分模型(Difference-in-Differences, DID)是一种在计量经济学中常用的分析方法,用于评估政策或干预措施对一些群体或区域的影响。
DID模型通过比较处理组和对照组在干预前后的差异,来估计干预的效果,同时控制其他可能影响结果的因素。
DID模型的基本假设是处理组和对照组在干预前是相似的,且在干预后相似的变化也受到相似的影响。
该模型可以消除时间不变的固定效应和圈定效应的影响,从而能够更准确地评估政策或干预措施的效果。
DID模型的应用非常广泛,包括评估政策的影响、估计政府干预措施的效果、评估教育或健康项目的成效等。
以下是一些具体的应用案例:1.教育政策评估:研究者可以使用DID模型来比较实施教育前后学生的学业成绩、学生的参与度和教育资源分配情况等,以评估政策的影响。
2.劳动力市场政策评估:DID模型可以用于评估各类劳动力市场政策对就业率、工资水平以及职业发展的影响,例如最低工资政策、就业培训计划等。
3.健康政策评估:研究人员可以使用DID模型来比较实施健康政策前后人们的健康状况、医疗资源利用情况以及医疗费用等,以评估政策的效果。
4.环境政策评估:DID模型可以用于评估环境政策对环境污染的影响,例如排放限制政策、废弃物管理政策等。
在应用DID模型时,需要满足一些前提条件。
首先,时间上的变化应是外生的,即处理组和对照组没有受到其他干预的影响。
其次,处理组和对照组在干预前应是相似的,没有系统性的差异。
最后,DID模型的结果只能反映干预的平均效应,对个体或次群体的效应不能直接解释。
总体来说,DID模型是一种强大的工具,可以帮助我们评估政策或干预措施的效果,为政策制定者提供决策依据。
然而,使用DID模型时需要慎重考虑前提条件,并适当控制其他可能影响结果的因素,以增加研究的可靠性和准确性。
DID双重差分法的原理和方法
DID双重差分法的原理和方法双重差分法(DID)是一种在计量经济学中常用的估计因果效应的方法。
它能够在实证研究中有效地处理因果推断中的内生性问题,尤其在面板数据的分析中得到广泛应用。
本文将详细介绍DID方法的原理和应用方法。
一、DID方法的原理DID方法的核心原理是利用面板数据的时间和处理组别维度,通过比较处理组和对照组的差异来估计因果效应。
简而言之,DID方法通过比较处理组在政策干预前后的变化,和同期对照组的变化差异,来估计政策对处理组的因果效应。
为了更好地理解DID方法的原理,我们以一个实际案例为例进行说明。
假设地区实施了一项新的政策措施(如教育),我们想要评估这项政策对学生学习成绩的影响。
我们需要一个对照组和一个处理组,对照组是未接受教育的地区,处理组是接受教育的地区。
在DID方法中,我们同时比较了政策干预前后两个组别的差异。
具体地,我们比较了两个时间点的学生成绩差异:政策实施前的学生成绩差异(处理组与对照组),以及政策实施后的学生成绩差异(处理组与对照组)。
通过比较这两个时间点的差异,我们可以估计政策对学生成绩的因果效应。
二、DID方法的应用方法在实际应用中,DID方法的步骤可以总结如下:1.确定处理组和对照组:根据研究问题和数据可用性,选择合适的处理组和对照组。
处理组是接受政策的群体,对照组是未接受政策的群体。
2.选择合适的时期:确定政策实施的时间点,并选择合适的时间段进行分析。
通常我们需要在政策实施前后收集足够的数据,以便比较两个时期的差异。
3. 建立DID回归模型:为了估计因果效应,我们需要建立DID回归模型。
基本的DID模型可以表示为:Y_it = α + β*T_t + γ*D_i +δ*(T_t * D_i) + ε_i t。
其中,Y_it是观测单位i在时间t的因变量;T_t是时间指标,取1表示政策实施后,取0表示政策实施前;D_i是处理组指标,取1表示处理组,取0表示对照组;α是截距项;β、γ、δ分别是政策效应、处理组效应和DID效应的系数;ε_it是误差项。
DID双重差分回归课件
(return to this in the regression equation)
• Cross section and time fixed effects
• Use time series of untreated group to establish what would have occurred in the absence of the intervention
• Key concept: can control for the fact that the intervention is more likely in some types of states
• If the intervention occurs in an area with a different trend, will under/over state the treatment effect
• In this example, suppose intervention occurs in area with faster falling Y
Difference in Difference Models
DID双重差分回归
1
What is DID
• How can we estimate the effects of higher education reform in China?
• Yang and Chen (2009)
双重差分法有效分离时间效应
双重差分法有效分离时间效应
双重差分法是一种有效的统计分析方法,用于分离时间效应。
时间效应是指在不同的时间点,数据之间存在的相关性。
这种相关性可能会导致误差的累积,从而影响数据分析的准确性。
因此,分离时间效应是数据分析中非常重要的一步。
双重差分法的基本思想是对数据进行两次差分。
第一次差分是为了消除数据中的趋势效应,第二次差分是为了消除数据中的季节效应。
通过这样的处理,可以得到一个相对稳定的时间序列,从而更好地进行统计分析。
具体来说,双重差分法的步骤如下:
1. 对原始数据进行一次差分,得到一阶差分序列。
2. 对一阶差分序列进行一次差分,得到二阶差分序列。
3. 对二阶差分序列进行统计分析,得到稳定的时间序列。
需要注意的是,在进行双重差分法之前,需要对原始数据进行一些预处理。
例如,需要检查数据是否存在缺失值或异常值,并进行相应的处理。
双重差分法在实际应用中具有广泛的应用。
例如,在经济学中,双重差分法可以用于消除季节性因素对经济数据的影响,从而更好地研究经济趋势。
在医学研究中,双重差分法可以用于消除季节性因素对疾病发病率的影响,从而更好地研究疾病的传播规律。
总之,双重差分法是一种非常有效的统计分析方法,可以帮助我们更好地理解数据中的时间效应,并消除这些效应对数据分析的影响。
在实际应用中,我们需要根据具体情况选择合适的方法,并进行适当的数据预处理,以确保结果的准确性和可靠性。
DID双重差分回归
Y
Estimated treatment Yc1
Yt1
Yc2
True treatment effect
control
Yt2 treatment t1 t2
True Treatment Effect
time
12
Basic Econometric Model
• Data varies by
– state (i) – time (t) – Outcome is Yit
• This is captured by the inclusion of the state/time effects – allows covariance between
– ui and TitAit – λt and TitAit
18
• Group effects
– Capture differences across groups that are constant over time
Difference in Difference Models
1
What is DID
• How can we estimate the effects of higher education reform in China? • Yang and Chen (2009)
2
Problem set up
• Yit = β0 + β1Tit + β2Ait + β3TitAit + εit
14
Yit = β0 + β1Tit + β2Ait + β3TitAit + εit
Before Change
Group 1 (Treat) Group 2 (Control) Difference β0 + β1 β0
DID双重差分法的原理和方法
DID双重差分法的原理和方法
DID (Difference-in-Differences)双重差分法是一种常用的计量经
济学方法,用于评估政策、项目或者干预措施对于个体、群体或者地区的
影响。
双重差分法的原理:
双重差分法的核心原理是通过比较干预的组群的差异与未干预的组群
的差异,来分析干预的效果。
在具体实践中,双重差分法一般利用带有两
个时间点的数据,将被干预组群和未干预组群的差异以及两个时间点的差
异相减,从而得到干预效果的估计。
方法步骤:
二、选择对照组:在使用双重差分法时,我们需要找到一个对照组,
也就是未受到干预的组群。
这个对照组需要与被干预组群具有相似的特征,以确保比较的准确性。
三、进行前后测量:在实施干预之前和之后,对被干预组群和对照组
的相关变量进行测量。
这些变量可能包括人口统计学数据、经济指标等。
四、计算双重差分:双重差分的计算是通过以下公式进行的:
DID=(被干预组群后测量-被干预组群前测量)-(对照组群后测量-对照
组群前测量)
五、进行统计分析:使用双重差分方法得到的差异值作为干预效果的
估计量,然后进行假设检验或者置信区间估计,以确定差异是否显著。
六、进行结果诠释:对结果进行诠释时,需要考虑其他可能的干扰因素,例如外部环境变化或者样本选择偏差等。
在结果诠释中,需要准确理解干预效果的大小和统计显著性水平。
优点:
1.双重差分法可以有效控制时间固定效应和个体固定效应,减少内生性问题。
2.双重差分法不需要对个体特征进行匹配,更加简单易行。
《因果推断实用计量方法》大学教学课件--第9章-双重差分法
方法1:从横向差异理解
•
第二重差分:
处置组在事件发生的年前后的差异 − 控制组在事件发生的年前后的差异
= T − − C −
= 实施新税法造成的差异(处置效应) +
其它因素造成的处置组在2014年前后的差异 − 其它因素造成的控制组在2014前后的差异
• 处置组2014年前后的业绩均值差异为:
= 1 − = 0
= 1 + = 1 − = 0
时间序列单重差分法偏差
时间序列单重差分偏差
• 这个模型回归得到的 系数መ1 是1 的无偏估计条件是E = 1 −
−ሾE = 0, = 1
− E = 0, = 0 ሿ
= 0 + 1 + 2 + 3 − 0 + 1
− 0 + 2 − 0
= ሾ2 +3 ሿ − ሾ2 ሿ
= 3
双重差分法回归模型系数
•
方法2:从纵向差异理解:处置组和控制
组处置后 的均值差异 B − D − 处置组
和控制组处置前 的均值差异 A − C 等
于:
(B − D) − A − C
= ሾE = 1, = 1
− E = 0, = 1 ሿ
−ሾE = 1, = 0
进一步提高这个模型的精度。
• 我们可以把处置组和控制组的固定效应(0 ,1 )细化为个体效应 ,并且把事件前后的时期
固定效应(β2 )细化为每年的固定效应( )。
使用个体和时间固定效应
• 细化后的模型为:
= 3 ∗ + + +
•
控制组在处置事件发生前 的均值(图9.2中C点)为:
二重差分法分析(DID)
⼆重差分法分析(DID)双重差分模型(difference-in-differences)主要被⽤于社会学中的政策效果评估。
其原理是基于⼀个反事实的框架来评估政策发⽣和不发⽣这两种情况下被观测因素y的变化。
如果⼀个外⽣的政策冲击将样本分为两组—受政策⼲预的Treat组和未受政策⼲预的Control组,且在政策冲击前,Treat组和Control组的y没有显著差异,那么我们就可以将Control组在政策发⽣前后y的变化看作Treat组未受政策冲击时的状况(反事实的结果)。
通过⽐较Treat组y的变化(D1)以及Control组y的变化(D2),我们就可以得到政策冲击的实际效果(DD=D1-D2)。
双重差分法,英⽂名Differences-in-Differences,别名“倍差法”,⼩名“差中差”。
作为政策效应评估⽅法中的⼀⼤利器,双重差分法受到越来越多⼈的青睐,概括起来有如下⼏个⽅⾯的原因:(1)可以很⼤程度上避免内⽣性问题的困扰:政策相对于微观经济主体⽽⾔⼀般是外⽣的,因⽽不存在逆向因果问题。
此外,使⽤固定效应估计⼀定程度上也缓解了遗漏变量偏误问题。
(2)传统⽅法下评估政策效应,主要是通过设置⼀个政策发⽣与否的虚拟变量然后进⾏回归,相较⽽⾔,双重差分法的模型设置更加科学,能更加准确地估计出政策效应。
(3)双重差分法的原理和模型设置很简单,容易理解和运⽤,并不像空间计量等⽅法⼀样让⼈望⽽⽣畏。
(4)尽管双重差分法估计的本质就是⾯板数据固定效应估计,但是DID听上去或多或少也要⽐OLS、FE之流更加“时尚⾼端”,因⽽DID的使⽤⼀定程度上可以满⾜“虚荣⼼”。
在细致介绍DID之前⾸先强调⼀点,⼀般⽽⾔,DID仅适⽤于⾯板数据,因此在只有截⾯数据时,还是不要浪费⼼思在DID上了。
不过,事⽆绝对,在某些特殊的情景下,截⾯数据通过巧妙的构造也是可以运⽤DID的,⼤神Duflo曾经就使⽤截⾯数据和DID研究了南⾮的养⽼⾦计划项⽬对学前⼉童健康的影响,感兴趣的可以去搜搜⼤神的⽂章。
如何设计双重差分法DID:各种政策研究的最佳指南!
如何设计双重差分法DID:各种政策研究的最佳指南!邮箱:***********************所有计量经济圈⽅法论丛的do⽂件, 微观数据库和各种软件都放在社群⾥.欢迎到计量经济圈社群交流访问.正⽂关于下⽅⽂字内容,作者:李松泽,中央财经⼤学中国经济与管理研究院,通信邮箱:****************作者之前的⽂章:①实证应⽤经济学中的稳健性检验是什么? 怎么做?哪些策略呢?②中介效应分析新进展和检验⽅法!③谁嫁(娶)给了谁?基于CHIP的DID⽅法发现, 与岳⽗母的教育有关!④重新思考BK中介模型, 关于中介效应分析的神话与事实!⑤JEEM上关于中国环境领域下载量最⾼的⽂章很有意思!⑥男神⽑咕噜最新Top5⼤作, 另外, 有序因变量依然使⽤OLS回归!⑦万字长⽂述'家庭经济学'进展, 诺奖得主贝克尔长耕于此!⑧最全利⽤⼯具变量控制内⽣性的步骤和代码—在经管研究中的应⽤Designing Difference in Difference Studies: Best Practices for Public Health PolicyResearch Coady Wing, Kosali Simon, Ricardo A. Bello-Gomez Annual Review ofPublic Health 2018 39:1, 453-469The difference in difference (DID) design is a quasi-experimental research designthat researchers often use to study causal relationships in public health settingswhere randomized controlled trials (RCTs) are infeasible or unethical. However,causal inference poses many challenges in DID designs. In this article, we reviewkey features of DID designs with an emphasis on public health policy research.Contemporary researchers should take an active approach to the design of DIDstudies, seeking to construct comparison groups, sensitivity analyses, androbustness checks that help validate the method's assumptions. We explain the keyassumptions of the design and discuss analytic tactics, supplementary analysis,and approaches to statistical inference that are often important in applied research.The DID design is not a perfect substitute for randomized experiments, but it oftenrepresents a feasible way to learn about casual relationships. We conclude bynoting that combining elements from multiple quasi-experimental techniques maybe important in the next wave of innovations to the DID approach.在研究公共卫⽣领域的因果关系时,随机控制实验(RCTs)往往会受到可⾏性与伦理的约束。
DID双重差分法的原理和方法PPT学习教案
DID双重差分法的原理和方法
。
• 其中,t = 1 表示政策实施前(before),而 t = 2 表示政策实施后(after)。然而,通 过双重差分得到的DI践中,一般通过回归的方法来得 到DID估计量
感谢您的欣赏!
第5页/共5页
第3页/共5页
2.第二次差分。这一步就把两类城市在
双重差分回归模型
第4页/共5页
• DID的反事实逻辑能够成立,其基本前提是, 处理组如果未受到政策干预,其时间效应或趋 势应与控制组一样(故可以后者来控制时间效 应),这就是所谓的 “平行趋势” 或 “共 同趋势”假定。
• 左图直观地展示了DID的思想与平行趋势假定
会计学
1
双重差分法
第1页/共5页
现在要修一条铁路,铁路是条线,所以必然会有穿过的城市和没 有被穿过的城市。记Di=1 如果城市i被穿过,Di=0 如果城市i没 有被穿过。现在要比较铁路修好以后,被铁路穿过的城市是不是 经济增长更快了?
一开始的想法是,我们把Di=1的城市的GDP加总,减去Di=0的城 市的GDP加总,然后两者一减,即E(Yi|Di=1)-E(Yi|Di=0),这样 我们就算出了两类城市的GDP的平均之差。
但是这样做肯定有问题。万一被铁路穿过的城市在建铁路之前 GDP就高呢?
第2页/共5页
为了解决这个问题,我们需要观察到至 少两期,第一期是建铁路之前,第二期 是建铁路之后。我们先把两类城市的GDP 做两期之差,即:
双重差分法(DID)平行趋势检验绘图的相关操作
双重差分法(DID)平⾏趋势检验绘图的相关操作DID是近年来的“学术明星”,常⽤于政策评估领域。
DID有⼀个重要的前提假设——平⾏趋势假定,规范地对平⾏趋势假定进⾏检验是⼀篇DID论⽂中⾄关重要的部分,很多⼈都不重视这⼀检验,或者对平⾏趋势假定有些错误的认识(诸如PSM 之后就不⽤做平⾏趋势检验)。
平⾏趋势检验的⼀般做法借鉴的是事件研究法的思想,我们⾸先需要⽣成年份虚拟变量与处理组虚拟变量的交互项,将这些交互项作为解释变量进⾏回归(特别注意要丢掉⼀期,作为基准组)。
交互项的系数反映的就是特定年份处理组和控制组之间的差异(与基准组相⽐),我们特别希望看到的就是政策时点前的虚拟变量与处理组虚拟变量的交互项的系数不显著,这样才说明在政策时点前处理组和控制组不存在异质性的时间趋势。
关于这⼀部分的更详细内容⼤家可以去看“中国式DID:不做平⾏趋势检验的DID不是好DID”和“DID⼤法:如何⽤Stata做平⾏趋势检验”这两篇推⽂。
当然,直接看回归系数可能不够直观,所以我们⼀般都会根据回归结果绘制出回归系数的取值和置信区间,对政策在不同年份的动态经济效应进⾏呈现,今天想跟⼤家分享的就是DID平⾏趋势检验绘图的Stata操作。
数据来源Nathan Nunn和Nancy Qian两位⼤神(2011)关于⼟⾖对旧⼤陆⼈⼝增长和城市化进程贡献的QJE论⽂是⼀篇相当经典的DID论⽂,作者在其个⼈主页上(https:///nunn/home)公布了这篇论⽂的数据和代码,接下来我就使⽤作者提供的部分数据和代码给⼤家分享⼀下DID平⾏趋势检验绘图的Stata操作。
Replication Data for: Nathan Nunn, Nancy Qian. The potato's contribution to population and urbanization:evidence from a historical experiment[J]. The Quarterly Journal of Economics, 2011, 126(2):593-650.建议⼤家在看下⾯这部分内容之前,最好先看⼀下“⼟⾖的魔⼒:⼟⾖对旧⼤陆⼈⼝增长和城市化进程的贡献”这篇推⽂,这样可能理解起来更加顺畅。
双重差分法的步骤
双重差分法的步骤双重差分法(Difference-in-Differences,DiD)是一种用于评估政策或项目实施效果的统计方法。
通过比较处理组和对照组在政策实施前后的变化,双重差分法能够控制其他因素的影响,从而更准确地估计政策效果。
以下是双重差分法的步骤:1.选取研究样本2.首先,需要选择一个适当的样本进行研究。
样本应包括受到政策或项目影响的处理组以及未受影响的对照组。
处理组和对照组应具有相似的特征和属性,以便更好地进行比较。
3.确定处理组和对照组4.在选择样本之后,需要确定哪些个体或观察值属于处理组和对照组。
处理组是受到政策或项目影响的组别,而对照组是没有受到影响的组别。
确定处理组和对照组是双重差分法的关键步骤之一。
5.估计基期差异6.在确定了处理组和对照组之后,需要估计基期差异。
基期差异是指处理组和对照组在政策或项目实施之前的差异。
这一步骤的目的是为了了解两组在政策实施前的状况,以便更好地比较政策实施后的变化。
7.估计处理效应8.在控制基期差异之后,需要估计处理效应。
处理效应是指政策或项目实施后,处理组相对于对照组的变化。
这一步骤是通过双重差分模型的第一个差分运算完成的。
9.估计时期效应10.时期效应是指所有观察值(包括处理组和对照组)在政策或项目实施期间的变化。
这一步骤是为了控制时间趋势和其他系统性变化的影响。
时期效应是在双重差分模型的第二个差分运算中估计的。
11.估计处理和时期的交互效应12.最后,需要估计处理和时期的交互效应。
交互效应是指政策或项目实施后,处理组相对于对照组的变化率。
这一步骤是通过将处理效应和时期效应相结合来完成的,以获得政策或项目的净效果。
通过以上步骤,双重差分法能够有效地控制其他因素的影响,从而更准确地评估政策或项目实施效果。
在进行实际研究时,还需要注意数据的收集和处理、模型的假设检验、结果的解释和讨论等方面的问题,以确保研究结果的可信度和有效性。
(完整word版)DID双重差分法(20210203013002)
双重差分法的平行趋势假定双重差分法是估计处理效应的常见方法,但也有被滥用的倾向,因为有些应用者对于双重差分法的优 点与局限缺乏了解,特别是其潜在的平行趋势( parallel trend )假定 ....差分法的局限经济学家常关心某政策实施后的效应,比如对于收入(y )的作用。
最简单(天真)的做法是比较处理组(即受政策影响的地区或个体)的前后差异,比如 这称为 差分估计量"(difference estimator ),即将处理组(treatment group )政策实施后的样本均值, 减去政策实施前的样本均值。
然而,由于宏观经济环境也随时间而变(时间效应),故政策实施地区的前 后差异未必就是处理效应(treatment effects )。
双重差分法的反事实逻辑为了解决差分法的局限性, 常用方法是寻找适当的控制组 (cont ⑹group ),即未实施政策的地区(或 未参加项目的个体),作为处理组的反事实( counterfactual )参照系。
具体来说,可将未受政策影响的控 制组之前后变化视为纯粹的时间效应,即V control — ^ctwiirof, before综合以上两个差分,即将处理组的前后变化减去控制组的前后变化,可得到对于政策处理效应更为可 靠的估计:这就是所谓的双重差分估计量( Difference in Differences ,简记DD 或DID ),因为它是处理组差分与控制组差分之差。
该法最早由Ashenfelter (1978 )引入经济学,而国内最早的应用或为周黎安、陈烨(2005 ) 从以上推理可知,DID 的反事实逻辑能够成立,其基本前提是,处理组如果未受到政策干预,其时间效应或趋势应与控制组一样(故可以后者来控制时间效应),这就是所谓的或 共同趋势”(common trend )假定。
下图直观地展示了 DID 的思想与平行趋势假定。
平行趋势"(parallel trend )E 伽G = = 1) = a + d其中,t = 1表示政策实施前(before ),而t = 2表示政策实施后(after )。
双重差分模型的基本流程
双重差分模型的基本流程下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor.I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!双重差分模型:基本流程与应用理解双重差分模型(DID,Difference-in-Differences)是一种在经济学和政策评估中广泛使用的估计方法,主要用于识别和量化处理效应。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
双重差分法的平行趋势假定
双重差分法是估计处理效应的常见方法,但也有被滥用的倾向,因为有些应用者对于双重差分法的优点与局限缺乏了解,特别是其潜在的平行趋势(parallel trend)假定……
差分法的局限
经济学家常关心某政策实施后的效应,比如对于收入(y )的作用。
最简单(天真)的做法是比较处理组(即受政策影响的地区或个体)的前后差异,比如
这称为“差分估计量”(difference estimator),即将处理组(treatment group)政策实施后的样本均值,减去政策实施前的样本均值。
然而,由于宏观经济环境也随时间而变(时间效应),故政策实施地区的前后差异未必就是处理效应(treatment effects)。
双重差分法的反事实逻辑
为了解决差分法的局限性,常用方法是寻找适当的控制组(control group),即未实施政策的地区(或未参加项目的个体),作为处理组的反事实(counterfactual)参照系。
具体来说,可将未受政策影响的控制组之前后变化视为纯粹的时间效应,即
综合以上两个差分,即将处理组的前后变化减去控制组的前后变化,可得到对于政策处理效应更为可靠的估计:
(1)
这就是所谓的双重差分估计量(Difference in Differences,简记DD或DID),因为它是处理组差分与控制组差分之差。
该法最早由Ashenfelter(1978)引入经济学,而国内最早的应用或为周黎安、陈烨(2005)。
从以上推理可知,DID的反事实逻辑能够成立,其基本前提是,处理组如果未受到政策干预,其时间效应或趋势应与控制组一样(故可以后者来控制时间效应),这就是所谓的“平行趋势”(parallel trend)或“共同趋势”(common trend)假定。
下图直观地展示了DID的思想与平行趋势假定。
其中,t = 1 表示政策实施前(before),而t = 2 表示政策实施后(after)。
然而,通过双重差分得到的DID估计量并不易计算其标准误,无法加入控制变量,也不易推广到多期数据。
故在实践中,一般通过回归的方法来得到DID估计量。
双重差分法的回归模型
考虑以下面板模型:
(2)
其中,G i 为分组虚拟变量(处理组=1,控制组=0),表示处理组与控制组的固有差异(无论是否实施政策都存在);D t 为分期虚拟变量(政策实施后=1,政策实施前=0,允许使用多期数据),表示政策实施前后的时间效应(即使不实施政策也存在);而交互项G i ·D t 才真正表示处理组在政策实施后的效应,即处理效应。
这是因为,处理组在政策干预之后的期望值为:
而处理组在政策干预之前的期望值为:
故处理组期望值的前后变化为:
(3)
另一方面,控制组在政策干预之后的期望值为:
而控制组在政策干预之前的期望值为:
故控制组期望值的前后变化为:
(4)
将(3)式减去(4)式可知,双重差分的结果正好是回归方程(2)中交互项G i · D t 之系数β。
进一步可以证明,用OLS估计面板模型(2),所得交互项G i · D t 之系数β的估计值,正好等于双重差分法(1)的计算结果(陈强,2014,第335、339页)。
一般的双重差分回归
更一般地,可在面板模型中加入个体固定效应、时间固定效应,以及其它控制变量:
(5)
其中,u i 为个体固定效应(取代了更为粗糙的分组虚拟变量G i ,若同时二者包括将导致严格多重共线性),λt 为时间固定效应(取代了更为粗糙的分期虚拟变量D t ,若同时包括二者将导致严格多重共线性),z it为一系列控制变量(影响结果变量y 的其它因素),而εit为暂时性冲击(transitory shock)。
不难看出,上式其实就是“双向固定效应模型”(two-way fixed effects),因为它既包括个体固定效应(u i ),也包括时间固定效应(λt );只不过多了双重差分法的关键变量,即交互项G i · D t (也称为“政策虚拟变量”,policy dummy)。
在具体回归中,个体固定效应u i 可通过加入个体虚拟变量来实现(即LSDV 法,或进行组内离差变换,within transformation);而时间效应λt可通过加入每期的时间虚拟变量(time dummies)来实现。
双重差分法的假定
为了使用OLS一致地估计方程(5),需要作以下两个假定。
假定1、此模型设定正确。
特别地,无论处理组还是控制组,其时间趋势项都是λt。
此假定即上文的“平行趋势假定”(parallel trend assumption)。
此假定比较隐蔽(有人称为“hidden assumption”),因为只要写下方程(5),就已默认了平行趋势假定。
假定2、暂时性冲击εit 与政策虚拟变量G i ·D t 不相关。
这是保证双向固定效应为一致估计量(consistent estimator)的重要条件。
在此,可以允许个体固定效应u i 与政策虚拟变量G i · D t 相关(可通过双重差分或组内变换消去u i ,或通过LSDV法控制u i )。
DID允许根据个体特征(u i )进行选择,只要此特征不随时间而变;这是DID 的最大优点,即可以部分地缓解因“选择偏差”(selection bias)而导致的内生性(endogeneity)。
如果违背假定1(平行趋势假定),会有什么后果?假设真实模型为:
则处理组(G i =1)的时间趋势为(λt +ηt ),而控制组(G i =0)的时间趋势为λt,故为非平行趋势。
如果将此模型误设为平行趋势,则实际估计的模型为
其中,G i ηt 被纳入扰动项中,导致扰动项(G i ηt + εit )与政策虚拟变量(G i · D t )相关,使得OLS 不一致,也违背了上述假定2。
阿森费尔特沉降(Ashenfelter’s dip)
在使用个体或企业层面的微观数据时,有些人认为因个体无法影响宏观政策(或培训项目)的推出,故为外生。
但事实上,个体依然可以自我选择是否参加项目,从而导致内生性。
比如,Ashenfelter (1978) 在研究就业培训的效应时发现,参加就业培训者在参加培训之年(1964) 以及之前的那年(1963),其平均收入不仅相对于控制组下降,而且绝对地下降,称为“阿森费尔特沉降”(Ashenfelter’s dip),参见下图。
在上图中,实线为参加项目者的平均收入,而虚线为未参加项目者的平均收入(二者均为男性白人,该现象也存在于女性白人、男性黑人、女性黑人,在此从略)。
上图表明,在1963年与1964年收入下降的不走运者(εit 为很大的负向冲击),很多人自我选择参加就业培训。
如果因为εit 或εi,t-1 特别低而参加培训,则通常εi,t+1与εi,t+2 会恢复到正常值,导致高估培训项目的效应。
而{εit } 也可能存在自相关。
这使得暂时性冲击εit 与政策虚拟变量G i ·D t 相关,导致不一致的估计(也意味着非平行的时间趋势,违背假定1,参见上图)。
非平行趋势的检验与处理方法
方法一、画时间趋势图
如果在政策干预前有多期数据,则可分别画处理组与控制组的时间趋势图(类似于上图),并直观判断这两组的时间趋势是否平行(比如,考察是否存在Ashenfelter's dip)。
如果二者大致平行,则可增强对平行趋势假定的信心。
然而,即使在政策干预前两组的时间趋势相同,也无法保证二者在干预后的时间趋势也相同(后者本质上不可观测,因为时间效应已与处理效应混合在一起)。
另外,如果只有两期数据,则无法使用此法。
方法二、加入更多的控制变量
从上文的讨论可知,非平行趋势可能由于遗漏变量所导致,故在z it中加入更多控制变量,或可缓解内生性。
但此法在实践中不易实施。
方法三、假设线性时间趋势
如果假设时间趋势为线性函数,则可加入每位个体的时间趋势项:
在具体回归时,加入个体虚拟变量与时间趋势项t = 1, 2, ... , T的交互项即可。
然而,线性时间趋势毕竟是较强的假定,不一定能成立。
故此法也不完全解决问题,但可作为稳健性检验。
方法四、三重差分法
在一定条件下,可通过引入两个控制组,进行三次差分,称为“三重差分法”(difference-in-differences-in-differences,简记DDD),这样可以更好地控制时间趋势的差异,使得平行趋势假定更易成立。
有关DDD的进一步介绍,参见陈强(2014,第343页)。