第十三讲工具变量回归

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在经济学中:
(1)内生变量:由模型内的变量所决定 的变量称作内生变量。
(2)外生变量:由模型外的变量所决定 的变量称作外生变量。
重要概念:内生变量和外生变量
在计量经济学中,把所有与扰动项相关 的解释变量都称为“内生变量”。这与 一般经济学理论中的定义有所不同。
1。与误差项相关的变量称为内生变量 (endogenous variable)。 2。与误差项不相关的变量称为外生变量 (exogenous variable)。
工具变量的选取
一个有效的工具变量必须满足称为工具变量相关 性和工具变量外生性两个条件:即
(1)工具变量相关性:工具变量与所替代 的随机解释变量高度相关;
Cov(Zi, Xi) 0
(2)工具变量外生性:工具变量与随机误差 项不相关;
Cov(ui, Zi) 0
两阶段最小二乘估计量
若工具变量Z满足工具变量相关性和外生性的 条件,则可用称为两阶段最小二乘(TSLS)的 IV估计量估计系数ß1。 两阶段最小二乘估计量分两阶段计算:
第十三讲工具变量回归
经典假设4 所有的解释变量Xi与随机误差
项彼此之间不相关。
Cov(ui, Xi) 0
若解释变量Xi和ui相关,则OLS估计量是非 一致的,也就是即使当样本容量很大时, OLS估计量也不会接近回归系数的真值。
造成误差项与回归变量相关(内生性)的原 因很多,但我们主要考虑如下几个方面:
我们的工作就是要寻找相应的工具变量将解 释变量分解成内生变量和外生变量,然后利 用两阶段最小二乘法(TSLS)进行估计。
一个例子:考虑货币政策对宏观经济的影响。 由于货币政策的制定者会根据宏观经济的运 行情况来调整货币政策,故货币政策是个内 生变量(双向因果关系)。Romer (2004) 通过阅读历史文献将货币政策的变动分解为 “内生”(对经济的反应)与“外生”(货 币当局的自主调整)的两部分。
例如具休考虑黄油的需求弹性估计问题:
根据11个均衡样本点估计的方程究竟是需求函数还是 供给函数?两者都不是。由于这些点是由需求和供给 两者的变化确定的,因此用OLS拟合这些点的直线既 不是需求曲线也不是供给曲线的估计。
利用这些样本点估计出来的OLS拟合线是需求曲 线还是供给曲线,都不是!两个极端的情况如图:
遗漏变量变量
变量有测量误差
双向因果关系。
遗漏变量偏差可采用在多元回归中加入遗漏变 量的方法加以解决,但前提是只有当你有遗漏 变量数据时上述方法才可行。
双向因果关系偏差是指如果有时因果关系是从 X到Y又从Y到X时,此时仅用多元回归无法消 除这一偏差。同样,
变量有测量误差也无法用我们前面学过的方法 解决。
第一阶段把X分解成两部分:即与回归误差项 相关的一部分以及与误差项无关的一部分。
第二阶段是利用与误差项无关的那部分进行估 计。
具体来说:
第一阶段:将X分解成与X高度相关的外生变量Z 以及与干扰项ui相关的部分vi。
工具变量回归
谁开创了工具变量回归? 1928年的著作的“The Tariff on Animal and Vegetable Oils”的附录B。 作者是谁? Philip Wright 还是他的儿子 Sewall Wright 文体计量学的分析
Байду номын сангаас
3。Wright考虑了几个可能的工具变量; 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 衡价格上升),因此牧场地区降雨量满足工 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响,因此牧场地区降 雨量与ui的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。
为什么IV回归是有效的?
例1: Philip Wright的问题
Philip Wright关心的是那个时期的一个重要 经济问题:即如何对诸如黄油,大豆油这样的 动植物油和食用动物设置进口关税。在20世 纪20年代,进口关税是美国主要的税收收入 来源。而理解关税的经济效应的关键在于要有 商品需求和供给曲线的定量估计。由前知供给 弹性为价格上涨1%引起的供给量变化的百分 率,而需求弹性为价格上涨1%引起的需求量 的百分率变化。
因此我们就必须寻找一种新的方法。
工具变量(instrumental variable, IV)回 归是当回归变量X与误差项u相关时获得总体 回归方程未知系数一致估计量的一般方法。 我们经常称其为IV估计。 其基本思想是:假设方程是:
我们假设ui与Xi相关,则OLS估计量一定是 有偏的和非一致的。工具变量估计是利用另 一个“工具”变量Z将Xi分离成与ui相关和 不相关的两部分。
因此,由于这些点是由需求和供给两者的变化 确定的,因此用OLS拟合这些点的直线既不是 需求曲线也不是供给曲线的估计。
Wright的解决办法:
1。找到第三个变量,这个变量影响供给但不 影响需求。这样,所有的均衡价格和均衡量对 都落在这条稳定的需求曲线上,此时很容易估 计出它的斜率。
2。可见,这第三个变量,也就是工具变量, 它与价格相关(它使供给曲线移动,于是导致 价格发生变化),但与u无关(需求曲线保持不 变)。
工具变量回归提供了解决这一问题的一 种思路。考虑下面的假想例子:由于夏 天发生了地震,为了进行灾后修复工作, 必须关闭某些加利福尼亚州的学校。而 最靠近震中的地区受到的影响最严重。 于是有学校关闭的地区需要把学生“挤 在一起”,因此暂时扩大了班级规模。
这意味着到震中的距离与班级规模相关, 故它满足工具变最相关性的条件但如果 到震中的距离与其他影响学生成绩的因 素无关(如学生是否还在学习英语),则 由于它与误差项无关因此是外生的。于 是到震中的距离这个工具变量可以用来 避免遗漏变量偏差和估计班级规模对测 试成绩的效应。
上图表明若某个变量使供给曲线移动而使需求保待不 变时会发生什么样的情况。现在所有的均衡价格和均 衡量对都落在这条稳定的需求曲线
例2:班级模型对测试成缓的效应估计
尽管控制了学生和地区特征,但由于受诸如校 外学习机会或教师质量等不可测变量的影响,第 二篇中给出的班级规模对测试成绩的效应估计中 仍然可能存在着遗漏变量偏差。若这些变量的数 据不可得,则不能通过在多元回归中加入这些变 量的方法来处理遗漏变量偏差。
相关文档
最新文档