第10讲_Treatment Effect 模型1-基本模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 实验组,又称处理组,treatment group,是指 实验对象受到了某种处理、干预或影响
– 控制组,又称对比组,control group,是指实 验对象保持原状,没有收到任何处理、干预或 影响
随机实验好在哪里
• 实验组与对照组中的对象在个人特征上没 有系统上的不同
– 因为实验对象在组间是随机分配的
– 某种药物的治疗效果如何 – 某项职业培训对培训者找工作是否有帮助 – 某项考前辅导能使参加者提分多少 – 某项环境管制措施能减少多少排污量
• 在研究中,我们所感兴趣的变量称为结果 或效果变量(outcome/effect variable)
– 效果变量分别为病人的病理指标
– 参加职业培训者的就业率
• 选择效应(selection effect)
S.E. = E( y0 | w = 1) − E( y0 | w = 0)
选择偏差
• 当S.E.=0时 ATE=ATT=ATUT • 当S.E.≠0时 ATE≠ATT
– 出现了Self-selection以及选择偏差
• 讨论:什么时候不存在Self-selection?
– 对同一个i,我们只能观测到y0i和y1i中的一个结 果,而不可能同时观察到两种结果
– 没有观察到的潜在结果称为反事实
• 所观察到的yi可以写为: yi = y0i *(1-wi) + y1i *wi
= y0i + (y1i - y0i)*wi = y0i + αi*wi • 稳定的单位处理价值 (stable unit treatment value)
ATE
• 定义
ATE = E( y1 − y0 ) = E( y1i − y0i )
• 写成样本形式为:
ATE 1
n
n i
(
y1i
y0i )
1 n
n i
y1i
1 nΒιβλιοθήκη n iy0i• 含义
– 总体的处理效应 – 总体包括实验组和控制组对象 – 从总体中随机抽取个人的期望处理效应
ATT
• 定义
案例:沙漠蚂蚁如何测算回家的距离?
截短1mm
正常腿
加长1mm
➢ 实验组二:当蚂蚁找到食物后,给蚂蚁的脚上粘 了一段猪鬃毛,让脚增长1毫米,然后再让它带着 食物往回走。
➢ 实验组三:当蚂蚁找到食物后,将蚂蚁的小腿削 掉一段,让脚缩短1毫米,然后再让它带着食物往 回走。
案例:沙漠蚂蚁如何测算回家的距离?
• 分析
– 不能直接度量种族歧视状况; – 仅衡量“听起来像黑人”的名字的求职效应; – 所得结果可能有其他含义
• 但是,名字是随机分配,与简历中的其他 内容和结构均不相关
简单的OLS回归及其后果
• 令虚拟变量w=1(处理组),简单的回归模型 为:
• 简单的OLS结果实际上是处理组的均值与 控制组的均值之差
• 这篇文章最后得出结论, 撒哈拉蚂蚁很可能带着一个天然的计步器(Pedom eter)。
示例:
• “Are Emily and Greg More Employable Than Lakishaand Jamal”, American Economic Review, 2004
“Emily与Greg是否比Lakishaand Jamal更容易找到工作?”, 《美国经济评论》, 2004
– 考前辅导班学生的考试成绩
– 排污量
• 要得到处理效应的真实估计结果,我们必 须遵循因果关系的分析思路,来观察在给定 其它变量不变时,仅仅当某项处理发生时, 效果变量的实际改变了多少,这个改变量才 是处理效应的真实大小
随机化实验
• 随机化实验是指,实验对象在实验组和控 制组之间的分配是按照随机原则进行的
➢ 以撒哈拉蚂蚁为研究对象,在离蚂蚁巢穴10米处放置食物。 ➢ 对照组:不做任何干预的情况下,发现蚂蚁找到食物后,沿着正
确的方向往回走了10米,顺利回家。 ➢ 实验组一:当蚂蚁找到食物后,在食物处抓住蚂蚁, 放到另一个地
点, 给它一块食物, 让它“回家”。 结果发现,蚂蚁从新地点沿着正确的方向一直“向回”走10米, 然后在那来回转着找家。
– i对j没有影响,i的treatment不会影响j的结果 – 不存在一般均衡效应、攀比效应、溢出效应
Treatment Effect
• 我们研究中所感兴趣的参数 • 不同的研究对不同类型的处理效应感兴趣
– Average Treatment Effect,ATE – ATE on the treated,ATT – ATE on the untreated,ATUT – Marginal treatment effect,MTE – Local ATE,LATE
– 当E(y0|w=1)=E(y0|w=0)时不存在Self-selection – 参与项目的群体如果不参与项目,他们的结果
与那些没有参与项目的群体结果一样 – 反之,则会存在选择偏差
• 在随机化试验中,参加试验与不参加试验 是随机决定的时候,满足E(y|w)=E(y)
– 这个假定很强,其中还包含了
• 但是严格来讲,只有在"反事实缺失 (Counterfactual Missing)"的背景下,讨论 处理效果估计的模型,才被称之为处理效 应模型。
• 处理效应(Treatment Effect)又称处置效应 ,它本身是来自医学领域的一个名词,指 的是药物或治疗方案对某种疾病的治疗效 果
• 随着在应用计量经济学对政策评价和项目 评估的研究,处理效应也被用来指代政策 或项目的实施效果
科学家发现,蚂蚁有种奇特的 本领:从巢穴出来,转来转去 的找到食物之后, 它们能以近乎 直线的方式回到巢穴里,即使 在没有任何路标、也很难留下 什么痕迹和气味的沙漠中也是 如此。
案例:沙漠蚂蚁如何测算回家的距离?
科学家曾经提出两种假设: • 能量测量法:可以根据走一段路程消耗的体力估计距离,节肢
动物普遍采用这种方法。但这不适用于蚂蚁,因为即使蚂蚁带 着不同重量的食物, 它们还能很准确的估计出距离。 • 视觉感受法:蜜蜂用眼睛看自己飞过的路,等下次再有同样长 度的路从眼前掠过, 就知道走了多远。不过这还不适用于蚂蚁 ,研究者让蚂蚁在黑暗中训练,它们还能记住路的长度。
• 在对这类处理效应的研究中,计量经济学 家特别强调对因果关系的揭示和"反事实缺 失"的分析框架
处理效应模型的产生背景
• 什么是处理效应 • 处理效应的理想估计方法:随机化实验 • 简单的OLS回归及其后果
什么是处理效应
• 研究者通常非常关心这样一个问题:某一 项处理(treatment)、干预(invention)、项目 (program)、政策(policy)、行动(action)会对 我们所感兴趣的变量带来怎样的改变
•在非随机化实验的条件下,上式不等于0
处理模型的基本框架
• 符号表示 • 处理效应的数学定义 • OLS偏差 • 解决办法
符号表示
• i=1,…,n • yi:结果变量,第i个观测值的结果
– 总是能够被观察到的
• wi:Treatment indicator
– wi=1,处理组 – wi=0,控制组
• 我们所得到的观察数据一般都是非随机化 实验的数据
– 实验对象的分组过程与影响结果的变量相关
案例:沙漠蚂蚁如何测算回家的距离?
• Matthias Wittlinger, et al. (2006), “The Ant Odometer: Stepping on Stilts and Stumps”, Science, 312:1965-1967
德国Ulm大学的Matthias Wittlinger提出理论假设: • 蚂蚁是靠测算出回家的步数来找到家的。根据离开巢穴后走过
的步数及在何时转弯,通过类似于积分计算的方法得出距离巢 穴的方向和步数,顺利到家的。
案例:沙漠蚂蚁如何测算回家的距离?
➢ 对蚂蚁的步长进行了几十次统计,发现同一只蚂蚁每一次的步长 非常均匀一致。
• 结果发现,"长腿"蚂蚁走过家门口仍不停留,到了15米左右才开始四处找 家, "短腿"蚂蚁只走5米左右就开始找家了。
• 因此认为,蚂蚁很可能是通过计算走过的步数来控制距离。
• 稳健性检验(robust test):研究者把这些改造过的蚂蚁放回窝里, 观察它们 再出来觅食的行为,发现无论是长腿蚂蚁还是短腿蚂蚁, 都精确的走了10 米就开始找家, 因为它们已经记住新的"回家步数"了. 这进一步证明它们靠 步数测量距离的结论。
E(y1|w=1)=E(y1|w=0)这个假定 – 实际上,我们只需要下面的假定:
E(y0|w=1)=y0 ,E(y0|w=0) =y0 , 就可以保证E(y₀|w=1)=E(y₀|w=0)
参加的异质性
• 记y1=μ1+v1, y0=μ0+v0 ,E(v1)=E(v0)=0 • 则ATE=μ1-μ0
• 可以认为他们具有相同的个人特征,所不 同的仅仅是实验状态的不同
– 因此两组结果变量之间的差别可以认为由于实 验或处理造成的
– 这是一个因果关系 – 这个差别用于估计处理效应
• 随机化实验不存在差异性偏差(Difference Bias)
– 差异性偏差是指,实验组与控制组结果变量之 间的差别不是由实验引起的,但是引起差别的原 因却与实验相关,例如:
ATT=E(y1-y0|w=1) =ATE+E(v1-v0|w=1)
• 称E(v1-v0|w=1)为参加的异质性 • 如果该项式不等于零的话,表明项目的参
加者拥有额外的收益(或损失),从而产 生自选择
OLS偏差
• 已知 y=wy1+(1-w)y0 =y0+w(y1-y0) =μ0+v0+w[E(y1-y0)]+w(v1-v0) =μ0+w⋅ATE+[v0+w(v1-v0)]
第10讲
Treatment Effect 模型1: 基本模型
主要内容
• 导论 • 处理效应模型的产生背景 • 处理效应模型的基本框架 • Treatment Ignorability假设 • 回归的方法
导论
• 在计量经济学中,广义上凡是用来估计某 一种处理的效果,包括政策的推行、改变, 项目的实施,都可以称之为处理效应模型
ATT = E( y1 − y0|w = 1) = E( y1i − y0i|wi= 1) = E( ATE | wi= 1)
• 含义
– 干预组的平均处理效果
• 在实际中接受干预的对象的期望处理效应
– 具有政策分析的价值
• 我们不会关心富人享受扶贫优惠会产生什么效果
ATE与ATT
• 关系
ATE = E( y1 - y0 ) = E( y | w = 1) − E( y | w = 0) = E( y1 | w = 1) − E( y0 | w = 0) = E( y1 − y0 | w = 1) +[E( y0 | w = 1) − E( y0 | w = 0)] = ATT +[E( y0 | w = 1) − E( y0 | w = 0)]
• 选修微观计量经济学课程的同学与之后较高的概率 成绩
• 大学毕业生与较高的收入水平 • 吸烟母亲与较低的新生儿体重 • 好的经济制度与高的经济发展水平
– 差异性偏差通常是由处理的选择过程造成的
• 在非随机化的实验中,直接比较实验组与 对比组的结果差异,无法得到处理效应的 因果关系的估计
• 但是受到成本和伦理的限制,随机化实验 非常少见
作者: Bertrand and Mullainathan
• 编造虚假求职简历,按照波士顿和芝加哥的报纸上 的招聘广告投送简历求职。
• 在简历上随机地分配以下求职者名字:
– 听起来像黑人的名字:Lakishaand,Jamal – 听起来像白人的名字: Emily,Greg
• 因变量:用人单位的回信概率
• 这个结果只有当样本为随机实验的样本时, 是一个一致估计量
• 当w与u相关时,如存在self-selection时,β 是不一致的
– 即使加入其他的控制变量,不一定会消除选择偏 差
– 例如:学习成绩较差的同学会参加考前辅导,成 绩好的则不会
• 后面可以看到直接比较两组的均值之差估 计平均处理效应的偏差为:
• xi:i所具有的其他性质
– 总是可以被观察到 – 不受treatment的影响
• 理论或潜在的结果: y1,y0,w1,w0
– y0i:表示如果i 没有被干预时的可能结果 – y1i:表示如果i 被干预时的可能结果
– w0i=0
– w1i=1
• 反事实缺失(the missing counterfactual)
– 控制组,又称对比组,control group,是指实 验对象保持原状,没有收到任何处理、干预或 影响
随机实验好在哪里
• 实验组与对照组中的对象在个人特征上没 有系统上的不同
– 因为实验对象在组间是随机分配的
– 某种药物的治疗效果如何 – 某项职业培训对培训者找工作是否有帮助 – 某项考前辅导能使参加者提分多少 – 某项环境管制措施能减少多少排污量
• 在研究中,我们所感兴趣的变量称为结果 或效果变量(outcome/effect variable)
– 效果变量分别为病人的病理指标
– 参加职业培训者的就业率
• 选择效应(selection effect)
S.E. = E( y0 | w = 1) − E( y0 | w = 0)
选择偏差
• 当S.E.=0时 ATE=ATT=ATUT • 当S.E.≠0时 ATE≠ATT
– 出现了Self-selection以及选择偏差
• 讨论:什么时候不存在Self-selection?
– 对同一个i,我们只能观测到y0i和y1i中的一个结 果,而不可能同时观察到两种结果
– 没有观察到的潜在结果称为反事实
• 所观察到的yi可以写为: yi = y0i *(1-wi) + y1i *wi
= y0i + (y1i - y0i)*wi = y0i + αi*wi • 稳定的单位处理价值 (stable unit treatment value)
ATE
• 定义
ATE = E( y1 − y0 ) = E( y1i − y0i )
• 写成样本形式为:
ATE 1
n
n i
(
y1i
y0i )
1 n
n i
y1i
1 nΒιβλιοθήκη n iy0i• 含义
– 总体的处理效应 – 总体包括实验组和控制组对象 – 从总体中随机抽取个人的期望处理效应
ATT
• 定义
案例:沙漠蚂蚁如何测算回家的距离?
截短1mm
正常腿
加长1mm
➢ 实验组二:当蚂蚁找到食物后,给蚂蚁的脚上粘 了一段猪鬃毛,让脚增长1毫米,然后再让它带着 食物往回走。
➢ 实验组三:当蚂蚁找到食物后,将蚂蚁的小腿削 掉一段,让脚缩短1毫米,然后再让它带着食物往 回走。
案例:沙漠蚂蚁如何测算回家的距离?
• 分析
– 不能直接度量种族歧视状况; – 仅衡量“听起来像黑人”的名字的求职效应; – 所得结果可能有其他含义
• 但是,名字是随机分配,与简历中的其他 内容和结构均不相关
简单的OLS回归及其后果
• 令虚拟变量w=1(处理组),简单的回归模型 为:
• 简单的OLS结果实际上是处理组的均值与 控制组的均值之差
• 这篇文章最后得出结论, 撒哈拉蚂蚁很可能带着一个天然的计步器(Pedom eter)。
示例:
• “Are Emily and Greg More Employable Than Lakishaand Jamal”, American Economic Review, 2004
“Emily与Greg是否比Lakishaand Jamal更容易找到工作?”, 《美国经济评论》, 2004
– 考前辅导班学生的考试成绩
– 排污量
• 要得到处理效应的真实估计结果,我们必 须遵循因果关系的分析思路,来观察在给定 其它变量不变时,仅仅当某项处理发生时, 效果变量的实际改变了多少,这个改变量才 是处理效应的真实大小
随机化实验
• 随机化实验是指,实验对象在实验组和控 制组之间的分配是按照随机原则进行的
➢ 以撒哈拉蚂蚁为研究对象,在离蚂蚁巢穴10米处放置食物。 ➢ 对照组:不做任何干预的情况下,发现蚂蚁找到食物后,沿着正
确的方向往回走了10米,顺利回家。 ➢ 实验组一:当蚂蚁找到食物后,在食物处抓住蚂蚁, 放到另一个地
点, 给它一块食物, 让它“回家”。 结果发现,蚂蚁从新地点沿着正确的方向一直“向回”走10米, 然后在那来回转着找家。
– i对j没有影响,i的treatment不会影响j的结果 – 不存在一般均衡效应、攀比效应、溢出效应
Treatment Effect
• 我们研究中所感兴趣的参数 • 不同的研究对不同类型的处理效应感兴趣
– Average Treatment Effect,ATE – ATE on the treated,ATT – ATE on the untreated,ATUT – Marginal treatment effect,MTE – Local ATE,LATE
– 当E(y0|w=1)=E(y0|w=0)时不存在Self-selection – 参与项目的群体如果不参与项目,他们的结果
与那些没有参与项目的群体结果一样 – 反之,则会存在选择偏差
• 在随机化试验中,参加试验与不参加试验 是随机决定的时候,满足E(y|w)=E(y)
– 这个假定很强,其中还包含了
• 但是严格来讲,只有在"反事实缺失 (Counterfactual Missing)"的背景下,讨论 处理效果估计的模型,才被称之为处理效 应模型。
• 处理效应(Treatment Effect)又称处置效应 ,它本身是来自医学领域的一个名词,指 的是药物或治疗方案对某种疾病的治疗效 果
• 随着在应用计量经济学对政策评价和项目 评估的研究,处理效应也被用来指代政策 或项目的实施效果
科学家发现,蚂蚁有种奇特的 本领:从巢穴出来,转来转去 的找到食物之后, 它们能以近乎 直线的方式回到巢穴里,即使 在没有任何路标、也很难留下 什么痕迹和气味的沙漠中也是 如此。
案例:沙漠蚂蚁如何测算回家的距离?
科学家曾经提出两种假设: • 能量测量法:可以根据走一段路程消耗的体力估计距离,节肢
动物普遍采用这种方法。但这不适用于蚂蚁,因为即使蚂蚁带 着不同重量的食物, 它们还能很准确的估计出距离。 • 视觉感受法:蜜蜂用眼睛看自己飞过的路,等下次再有同样长 度的路从眼前掠过, 就知道走了多远。不过这还不适用于蚂蚁 ,研究者让蚂蚁在黑暗中训练,它们还能记住路的长度。
• 在对这类处理效应的研究中,计量经济学 家特别强调对因果关系的揭示和"反事实缺 失"的分析框架
处理效应模型的产生背景
• 什么是处理效应 • 处理效应的理想估计方法:随机化实验 • 简单的OLS回归及其后果
什么是处理效应
• 研究者通常非常关心这样一个问题:某一 项处理(treatment)、干预(invention)、项目 (program)、政策(policy)、行动(action)会对 我们所感兴趣的变量带来怎样的改变
•在非随机化实验的条件下,上式不等于0
处理模型的基本框架
• 符号表示 • 处理效应的数学定义 • OLS偏差 • 解决办法
符号表示
• i=1,…,n • yi:结果变量,第i个观测值的结果
– 总是能够被观察到的
• wi:Treatment indicator
– wi=1,处理组 – wi=0,控制组
• 我们所得到的观察数据一般都是非随机化 实验的数据
– 实验对象的分组过程与影响结果的变量相关
案例:沙漠蚂蚁如何测算回家的距离?
• Matthias Wittlinger, et al. (2006), “The Ant Odometer: Stepping on Stilts and Stumps”, Science, 312:1965-1967
德国Ulm大学的Matthias Wittlinger提出理论假设: • 蚂蚁是靠测算出回家的步数来找到家的。根据离开巢穴后走过
的步数及在何时转弯,通过类似于积分计算的方法得出距离巢 穴的方向和步数,顺利到家的。
案例:沙漠蚂蚁如何测算回家的距离?
➢ 对蚂蚁的步长进行了几十次统计,发现同一只蚂蚁每一次的步长 非常均匀一致。
• 结果发现,"长腿"蚂蚁走过家门口仍不停留,到了15米左右才开始四处找 家, "短腿"蚂蚁只走5米左右就开始找家了。
• 因此认为,蚂蚁很可能是通过计算走过的步数来控制距离。
• 稳健性检验(robust test):研究者把这些改造过的蚂蚁放回窝里, 观察它们 再出来觅食的行为,发现无论是长腿蚂蚁还是短腿蚂蚁, 都精确的走了10 米就开始找家, 因为它们已经记住新的"回家步数"了. 这进一步证明它们靠 步数测量距离的结论。
E(y1|w=1)=E(y1|w=0)这个假定 – 实际上,我们只需要下面的假定:
E(y0|w=1)=y0 ,E(y0|w=0) =y0 , 就可以保证E(y₀|w=1)=E(y₀|w=0)
参加的异质性
• 记y1=μ1+v1, y0=μ0+v0 ,E(v1)=E(v0)=0 • 则ATE=μ1-μ0
• 可以认为他们具有相同的个人特征,所不 同的仅仅是实验状态的不同
– 因此两组结果变量之间的差别可以认为由于实 验或处理造成的
– 这是一个因果关系 – 这个差别用于估计处理效应
• 随机化实验不存在差异性偏差(Difference Bias)
– 差异性偏差是指,实验组与控制组结果变量之 间的差别不是由实验引起的,但是引起差别的原 因却与实验相关,例如:
ATT=E(y1-y0|w=1) =ATE+E(v1-v0|w=1)
• 称E(v1-v0|w=1)为参加的异质性 • 如果该项式不等于零的话,表明项目的参
加者拥有额外的收益(或损失),从而产 生自选择
OLS偏差
• 已知 y=wy1+(1-w)y0 =y0+w(y1-y0) =μ0+v0+w[E(y1-y0)]+w(v1-v0) =μ0+w⋅ATE+[v0+w(v1-v0)]
第10讲
Treatment Effect 模型1: 基本模型
主要内容
• 导论 • 处理效应模型的产生背景 • 处理效应模型的基本框架 • Treatment Ignorability假设 • 回归的方法
导论
• 在计量经济学中,广义上凡是用来估计某 一种处理的效果,包括政策的推行、改变, 项目的实施,都可以称之为处理效应模型
ATT = E( y1 − y0|w = 1) = E( y1i − y0i|wi= 1) = E( ATE | wi= 1)
• 含义
– 干预组的平均处理效果
• 在实际中接受干预的对象的期望处理效应
– 具有政策分析的价值
• 我们不会关心富人享受扶贫优惠会产生什么效果
ATE与ATT
• 关系
ATE = E( y1 - y0 ) = E( y | w = 1) − E( y | w = 0) = E( y1 | w = 1) − E( y0 | w = 0) = E( y1 − y0 | w = 1) +[E( y0 | w = 1) − E( y0 | w = 0)] = ATT +[E( y0 | w = 1) − E( y0 | w = 0)]
• 选修微观计量经济学课程的同学与之后较高的概率 成绩
• 大学毕业生与较高的收入水平 • 吸烟母亲与较低的新生儿体重 • 好的经济制度与高的经济发展水平
– 差异性偏差通常是由处理的选择过程造成的
• 在非随机化的实验中,直接比较实验组与 对比组的结果差异,无法得到处理效应的 因果关系的估计
• 但是受到成本和伦理的限制,随机化实验 非常少见
作者: Bertrand and Mullainathan
• 编造虚假求职简历,按照波士顿和芝加哥的报纸上 的招聘广告投送简历求职。
• 在简历上随机地分配以下求职者名字:
– 听起来像黑人的名字:Lakishaand,Jamal – 听起来像白人的名字: Emily,Greg
• 因变量:用人单位的回信概率
• 这个结果只有当样本为随机实验的样本时, 是一个一致估计量
• 当w与u相关时,如存在self-selection时,β 是不一致的
– 即使加入其他的控制变量,不一定会消除选择偏 差
– 例如:学习成绩较差的同学会参加考前辅导,成 绩好的则不会
• 后面可以看到直接比较两组的均值之差估 计平均处理效应的偏差为:
• xi:i所具有的其他性质
– 总是可以被观察到 – 不受treatment的影响
• 理论或潜在的结果: y1,y0,w1,w0
– y0i:表示如果i 没有被干预时的可能结果 – y1i:表示如果i 被干预时的可能结果
– w0i=0
– w1i=1
• 反事实缺失(the missing counterfactual)