清华大学劳动经济学-非实验数据的因果推断
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
28
Popper 1963
VI. Confirming evidence should not count except when it is the result of a genuine test of the theory (a serious but unsuccessful attempt to falsify the theory)
27
Popper 1963
IV. A theory which is not refutable by any conceivable event is non‐scientific. Irrefutability is not a virtue of a theory (as often people think), but a vice. V. Every genuine test of a theory is an attempt to falsify it, or to refute it. Testability is falsifiability (some theories are more testable)
霍乱
• 19世纪初抵达欧洲 • 一波一波的流行疾病,突然袭击受害者,结果往 往是致命的 • 早期症状:呕吐,急性腹泻
34
33
Snow的猜想
• 起作用的媒介是一种活的有机体,随食物 或饮料进入消化道,在身体内部繁殖,产 生某种毒素,使人体排出水分 • 有机体排出体外之后,再次进入供水系统 , 感染新的受害者
(i) yi = Xi’β + εi • Xi – 可观测的变量 • εi – 研究者观测不到的变量 • β –“因果”影响 • 回归系数 = 偏相关系数
• 把OLS应用到 (i), 仅仅是一个统计工具,必 须阐明
1. 2. 3. 4. 系统中的变量 它们的因果关系 关系的函数形式 εi的统计特性(独立性,外生性,等等)
– 例如:E(Y1i ‐ Y0i | Ti = 1), 受到干预的人群的平均 干预效果
15
评估问题
• 观测性研究的潜在缺陷 • 根据 Ti 比较 Yi 的均值 • E(Yi | Ti = 1) ‐ E(Yi | Ti = 0) = 观察到的差异 E(Y1i ‐ Y0i | Ti = 1)
• 劳动经济学家用这些数据都做些什么 • 关于劳动力的实证研究大致可以分为两类
1. 描述性分析:可以确认劳动力市场的相关事实 ,并对经济发展趋势产生新的见解 2. 因果推断
3
4
因果推断
• 因果推断,旨在确定某些特定干预或政策 的影响,估计经济理论所提出的行为关系 的特征 • 因果推断与描述性分析是互补的 • 因果推断通常更难 • yi = 感兴趣的结果
9 10
评估问题
• 例如:yi = α + θTi + εi • 在许多假设,平均干预效果 ≡ E(y1i ‐ y0i) ≡ ATE (Average Treatment Effect) • 因果推理的根本问题
– 对i,无法同时观察到 y1i & y0i
• 例如:线性可加模型
•
Yi Ti Z i ' i
7
8
• 线性回归 ≡ 因果关系 iff.
i. 影响是线性可加的 ii. 变量是可靠测量的 iii. 没有遗漏变量偏差
例如对照实验
• 例如:线性回归模型(线性,可加) & E(Xi∙εi) = 0 ⇒ cov(Xi, εi) = 0 (正交)
• 给定模型假设,OLS工具才适合估计 β
⇒ 一致(因果)推断 • 假设合理吗? • 治疗组和对照组的可信度 • 二元干预 – 如果受到干预Ti = 1 ; 其他情况 = 0 • i有2个可能的结果 – Ti = 0: y0i; Ti = 1: y1i
感染理论的“支持性”证据
• 霍乱沿着人类的商业轨迹传播:如果一条 来自没有霍乱国家的船,来到一个受到霍 乱侵袭的港口,那么水手们只有在上岸获 取补给之后才会得这种病 • 穷人受到该疾病的影响最大,他们往往生 活在最拥挤的住房里,卫生情况也最差
35
36
6
4/11/2014
更多关于感染理论的证据
• 在英国最早的一次霍乱流行时期,他确认 了第一个病例,一个来自汉堡的海员,汉 堡当时正在流行霍乱 • 他还发现了第二个病例,一个住在该海员 曾经住过的房间的人
– 工资,就业,健康状况
• 什么会影响/造成 yi ,其机制是怎样的?
– Xi = (x1i, x2i, …, xki) – 在数据中,观测到相互关联的 (yi, Xi) :更多教 育⇒ 赚更多钱 – 是因果关系吗? – 相关性 ≠ 因果关系
5 6
1
4/11/2014
• 构建简单的模型 • 例如:线性回归模型
受到干预的人群的平均干预效果
+ [E(Y0i | Ti = 1) ‐ E(Y0i | Ti = 0)] 偏差项/遗漏变量偏差
16
评估问题
• 通常 [E(Y0i | Ti = 1) ‐ E(Y0i | Ti = 0)] ≠ 0 • 例如:喝红酒会让你更健康吗? • 把喝红酒考虑为一个二元决策 • 喝红酒和未来的健康状况之间的因果关系, 可以用我们之前使用过的潜在结果符号来 描述 • 在这个例子里,如果喝红酒,i 的健康状况 是Y1i ,如果不喝红酒,i 的健康状况是 Y0i • 我们想知道 Y0i 和 Y1i 之间的差距,这就是喝 红酒对个体 i 的因果影响 • 假如我们能回到过去,把 i 引向他没有选择 的道路上,才能衡量到这个差距
– Yi : 感兴趣的结果 – Ti : 治疗 / 干预 – Zi : 控制变量
• 观察不到的反事实 ≡ 缺失数据 • 反事实 ≡ 在没有干预的情况下会发生什么
11
12
2
4/11/2014
评估问题
• 专注于二元/二分(0‐1)干预,同质化的干 预效果
1 if treated Ti 0 otherwise
21 22
随机试验的几个问题
• 伦理问题:很多人们能够想到的随机实验 是不道德的或者不符合伦理的
– 我们不可能运行所有我们想做的实验,因为它 们可能会对干预组产生重大的经济和社会影响
非实验方法
1. 令人信服的研究设计
– 准(自然)实验,以消除竞争性的假说
• 现实原因:做实验非常昂贵(财务成本和 管理成本)
评估问题
• 因果推断的根本问题
– 观察不到的反事实
i i
• 潜在变量: Yi* = (Y0i , Y1i ) • 观察到: Yi = (1 ‐ Ti) Y0i + Ti Y1i
• i有2个可能的结果
– Y0i if Ti=0 – Y1i if Ti=1
13
14
评估问题
• 要找出:“因果影响” 平均干预效果 • 理想情况: ATE ≡ E(Y1i ‐ Y0i) = θ • 典型情况: Y1i ‐ Y0i 在某个(子)总体上的均 值
19
• 似乎那些喝红酒的人无论怎样都会更健康 • 喝红酒的人即使不喝红酒,也会比不喝红酒的人 更健康 – 更好的教育,更健康的生活习惯,等等 – 偏差项 [E(Y0i | Ti = 1) ‐ E(Y0i | Ti = 0)] > 0 • 因此,这种简单的比较会夸大红酒的好处
20
“黄金标准解决方案”
• 持怀疑态度。不要再轻信从观测研究(通 常是由大众媒体引述)得出的结论! • 你能想出一个用来推断红酒消费和健康之 间因果影响的自然实验吗?
17
18
3
4/11/2014
• 然而在现实中,我们只能观察到 Y0i 或 Y1i,却不能 同时观察到两者 • 因此,我们希望测量 Y1i ‐ Y0i的均值,或它在某个 组别,如那些规律地喝红酒的人当中的均值。这 就是 E(Y1i ‐ Y0i | Ti = 1),受到干预的人群的平均干 预效果 • 一般来说,直接比较喝红酒和不喝红酒的人,会 得到一个很差的对红酒消费影响的估计值
4/11/2014
导论
• 劳动经济学当中,实证分析的使用比其他 经济学领域要多
用非实验数据进行因果推断
– 最近发表的劳动经济学文章近80%都包含了一 些实证的工作,其中2/3分析了微观数据
1
2
数据分析
• 劳动经济学也因为使用尖端的计量和统计 模型和其他领域相区别
– 自上世纪70年代以来,许多,也许是大部分在 微观计量经济学方法和风格上的创新的动机都 主要是通过研究劳动相关的主题 – 样本选择模型,分量回归,工具变量,等等
2. 获得可靠的数据 3. 运用适当的统计工具 4. 在现实中的多种情况下对预测进行检验
23
24
4
4/11/2014
Popper 1963
• ≡ 证明统计上的假设是有道理的 • ≡ 可反驳性 • ≡ “高风险”检验:把自己的观点,或理论, 以最“严厉”的方式进行检验 • 应该意识到使用统计工具(例如,OLS)来 支持因果推断上的局限 • 工具 ≠ 研究设计 • Karl Popper, Conjectures and Refutations (London: Routledge and Kegan Paul, 1963) • 划界标准:任何研究领域要想有资格成为 真正的科学,所必须具备的特点 • 关键点:一个科学的理论必须乐于接受驳 斥,为此它必须做出可以被检验的预测
30
29
5
4/11/2014
总结
• 理论的科学地位的标准是它的可证伪性, 或可反驳性,或可检验性 • 而不是它的解释能力
wenku.baidu.com
Snow 1855
• 来自流行病学的文献 • 一个好的实证工作的例子,不涉及回归 • 一个基于观察性数据(非实验)的真正的 科学研究的范例
31
32
Snow 1855
• 研究问题:霍乱是通过水传播的传染病吗? • 在那个年代(19世纪50年代),已经有了 显微镜,但分辨率还很低 • 大多数人类的病原体不能被观测到 • 大多数研究者认为,疾病是由“miasmas” 带来的:在空气中的细小的无生命的毒性 颗粒
25
26
Popper 1963
I. It is easy to obtain confirmations, or verifications, for nearly every theory – if we look for confirmations II. Confirmation should count only if they are the result of risky predictions III. Every “good” scientific theory is a prohibition: it forbids certain things to happen. The more a theory forbids, the better it is.
• 随机分配 Ti • 随机分配保证当 N → ∞ 时,治疗组和对照组平均 来说完全一致 • i Ti E ( i | Ti ) 0 cov( X i , i ) 0 • 观测到的数据给出了正确的反事实 p E ( y1i y0i ) ATE • y1 y0 • “科学方法”:对照组 ≈ 反事实 • 实际问题:社会科学中,实验常常是有违伦理的, 或不可能的
Popper 1963
• VII. Some genuinely testable theories, when found to be false, are still upheld by their admirers – for example by introducing ad hoc some auxiliary assumptions, or by re‐ interpreting the theory ad hoc in such a way that it escapes refutation. Such a procedure is always possible, but it rescues the theory from refutation only at the price of destroying, or at least lowering, its scientific status.