第十三讲 工具变量回归

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因此我们就必须寻找一种新的方法。
工具变量(instrumental variable, IV)回 归是当回归变量X与误差项u相关时获得总体 回归方程未知系数一致估计量的一般方法。 我们经常称其为IV估计。 其基本思想是:假设方程是:
我们假设ui与Xi相关,则OLS估计量一定是 有偏的和非一致的。工具变量估计是利用另 一个“工具”变量Z将Xi分离成与ui相关和 不相关的两部分。
第一阶段把X分解成两部分:即与回归误差项 相关的一部分以及与误差项无关的一部分。
第二阶段是利用与误差项无关的那部分进行估 计。
具体来说:
第一阶段:将X分解成与X高度相关的外生变量Z 以及与干扰项ui相关的部分vi。
工具变量回归
谁开创了工具变量回归? 1928年的著作的“The Tariff on Animal and Vegetable Oils”的附录B。 作者是谁? Philip Wright 还是他的儿子 Sewall Wright 文体计量学的分析
为什么IV回归是有效的?
例1: Philip Wright的问题
Philip Wright关心的是那个时期的一个重要 经济问题:即如何对诸如黄油,大豆油这样的 动植物油和食用动物设置进口关税。在20世 纪20年代,进口关税是美国主要的税收收入 来源。而理解关税的经济效应的关键在于要有 商品需求和供给曲线的定量估计。由前知供给 弹性为价格上涨1%引起的供给量变化的百分 率,而需求弹性为价格上涨1%引起的需求量 的百分率变化。
因此,由于这些点是由需求和供给两者的变化 确定的,因此用OLS拟合这些点的直线既不是 需求曲线也不是供给曲线的估计。
Wright的解决办法:
1。找到第三个变量,这个变量影响供给但不 影响需求。这样,所有的均衡价格和均衡量对 都落在这条稳定的需求曲线上,此时很容易估 计出它的斜率。
2。可见,这第三个变量,也就是工具变量, 它与价格相关(它使供给曲线移动,于是导致 价格发生变化),但与u无关(需求曲线保持不 变)。
工具变量回归提供了解决这一问题的一 种思路。考虑下面的假想例子:由于夏 天发生了地震,为了进行灾后修复工作, 必须关闭某些加利福尼亚州的学校。而 最靠近震中的地区受到的影响最严重。 于是有学校关闭的地区需要把学生“挤 在一起”,因此暂时扩大了班级规模。
这意味着到震中的距离与班级规模相关, 故它满足工具变最相关性的条件但如果 到震中的距离与其他影响学生成绩的因 素无关(如学生是否还在学习英语),则 由于它与误差项无关因此是外生的。于 是到震中的距离这个工具变量可以用来 避免遗漏变量偏差和估计班级规模对测 试成绩的效应。
遗漏变量变量
变量有测量误差
双向因果关系。
遗漏变量偏差可采用在多元回归中加入遗漏变 量的方法加以解决,但前提是只有当你有遗漏 变量数据时上述方法才可行。
双向因果关系偏差是指如果有时因果关系是从 X到Y又从Y到X时,此时仅用多元回归无法消 除这一偏差。同样,
变量有测量误差也无法用我们前面学过的方法 解决。
上图表明若某个变量使供给曲线移动而使需求保待不 变时会发生什么样的情况。现在所有的均衡价格和均 衡量对都落在这条稳定的需求曲线
例Hale Waihona Puke Baidu:班级模型对测试成缓的效应估计
尽管控制了学生和地区特征,但由于受诸如校 外学习机会或教师质量等不可测变量的影响,第 二篇中给出的班级规模对测试成绩的效应估计中 仍然可能存在着遗漏变量偏差。若这些变量的数 据不可得,则不能通过在多元回归中加入这些变 量的方法来处理遗漏变量偏差。
我们的工作就是要寻找相应的工具变量将解 释变量分解成内生变量和外生变量,然后利 用两阶段最小二乘法(TSLS)进行估计。
一个例子:考虑货币政策对宏观经济的影响。 由于货币政策的制定者会根据宏观经济的运 行情况来调整货币政策,故货币政策是个内 生变量(双向因果关系)。Romer (2004) 通过阅读历史文献将货币政策的变动分解为 “内生”(对经济的反应)与“外生”(货 币当局的自主调整)的两部分。
在经济学中:
(1)内生变量:由模型内的变量所决定 的变量称作内生变量。
(2)外生变量:由模型外的变量所决定 的变量称作外生变量。
重要概念:内生变量和外生变量
在计量经济学中,把所有与扰动项相关 的解释变量都称为“内生变量”。这与 一般经济学理论中的定义有所不同。
1。与误差项相关的变量称为内生变量 (endogenous variable)。 2。与误差项不相关的变量称为外生变量 (exogenous variable)。
例如具休考虑黄油的需求弹性估计问题:
根据11个均衡样本点估计的方程究竟是需求函数还是 供给函数?两者都不是。由于这些点是由需求和供给 两者的变化确定的,因此用OLS拟合这些点的直线既 不是需求曲线也不是供给曲线的估计。
利用这些样本点估计出来的OLS拟合线是需求曲 线还是供给曲线,都不是!两个极端的情况如图:
工具变量回归
经典假设4 所有的解释变量Xi与随机误差
项彼此之间不相关。
Cov(ui, Xi) 0
若解释变量Xi和ui相关,则OLS估计量是非 一致的,也就是即使当样本容量很大时, OLS估计量也不会接近回归系数的真值。
造成误差项与回归变量相关(内生性)的原 因很多,但我们主要考虑如下几个方面:
工具变量的选取
一个有效的工具变量必须满足称为工具变量相关 性和工具变量外生性两个条件:即
(1)工具变量相关性:工具变量与所替代 的随机解释变量高度相关;
Cov(Zi, Xi) 0
(2)工具变量外生性:工具变量与随机误差 项不相关;
Cov(ui, Zi) 0
两阶段最小二乘估计量
若工具变量Z满足工具变量相关性和外生性的 条件,则可用称为两阶段最小二乘(TSLS)的 IV估计量估计系数ß1。 两阶段最小二乘估计量分两阶段计算:
3。Wright考虑了几个可能的工具变量; 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 衡价格上升),因此牧场地区降雨量满足工 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响,因此牧场地区降 雨量与ui的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。
相关文档
最新文档