工具变量回归

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

遗漏变量偏差可采用在多元回归中加入遗漏变 量的方法加以解决,但前提是只有当你有遗漏 变量数据时上述方法才可行。 双向因果关系偏差是指如果有时因果关系是从 X到Y又从Y到X时,此时仅用多元回归无法消 除这一偏差。同样, 变量有测量误差也无法用我们前面学过的方法 解决。 因此我们就必须寻找一种新的方法。
若需求弹性为-1,使价格上涨20%就能达到 减少20%消费量的目标。若弹性为-0.5,则 价格必须上涨40%才能使消费下降20%。
同philip Wright对黄油的研究一样。我们无 法通过数量对数关于价格对数的OLS回归得到 香烟需求弹性的一致估计。 我们利用TSLS和1985-1995年美国48个大 陆州的年度数据估计了香烟的需求弹性。
3。Wright考虑了几个可能的工具变量; 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 衡价格上升),因此牧场地区降雨量满足工 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响,因此牧场地区降 雨量与ui的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。
模型假定: 被解释变量:香烟消费,即为州内每人购买 的香烟包数。 内生解释变量:包含所有税收的每包香烟的 实际平均价格。 工具变量:由一般销售税征收的香烟税收。
这个工具变量设定是否合理? 工具变量的相关性:由于高销售税增加了总的 销售价格 ,因此每包香烟的销售税满 足工具变量相关性的条件。 工具变量的外生性:若销售税是外生的,则必 须与需求方程中的误差无关;即销售税必然只 是通过价格间接影响香烟的需求。这看上去是 合理的:主要是因为不同州选择了不同的销售 额、收入、财产和其他公共财政事业的混合税 收,所以不同州的一般销售税是不同的。其中 关于公共财政的选择受到政治考量的驱使而不 是受香烟需求有关的因素影响。
-----------------------------------------------------------------------------| Robust lpackpc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lravphat | -1.083586 .3336949 -3.25 0.002 -1.755279 -.4118932 _cons | 9.719875 1.597119 6.09 0.000 6.505042 12.93471 ------------------------------------------------------------------------------
在经济学中: (1)内生变量:由模型内的变量所决定 的变量称作内生变量。 (2)外生变量:由模型外的变量所决定 的变量称作外生变量。
重要概念:内生变量和外生变量
在计量经济学中,把所有与扰动项相关 的解释变量都称为“内生变量”。这与 一般经济学理论中的定义有所不同。 1。与误差项相关的变量称为内生变量 (endogenous variable)。 2。与误差项不相关的变量称为外生变量 (exogenous variable)。
结论:这种工具变量的设置方法是合理的。 因此我们利用两阶段最小二乘法(TSLS): 第一阶段结果:
第二阶段结果:
香烟需求 (续)
现在, 只用 1995 年的数据. 第一阶段 OLS 回归:
ln( Pi cigarettes ) = 4.63 + .031SalesTaxi, n = 48
第二阶段 OLS 回归:
32
STATA 实例: 香烟需求,第一阶段
工具 = Z = rtaxso = 一般销售税 (实际 $/pack)
X Z . reg lravgprs rtaxso if year==1995, r; Regression with robust standard errors Number of obs = F( 1, 46) = Prob > F = R-squared = Root MSE = 48 40.39 0.0000 0.4710 .09394
例如具休考虑黄油的需求弹性估计问题:
根据11个均衡样本点估计的方程究竟是需求函数还是 供给函数?两者都不是。由于这些点是由需求和供给 两者的变化确定的,因此用OLS拟合这些点的直线既 不是需求曲线也不是供给曲线的估计。
利用这些样本点估计出来的OLS拟合线是需求曲 线还是供给曲线,都不是!两个极端的情况如图:
我们的工作就是要寻找相应的工具变量将解 释变量分解成内生变量和外生变量,然后利 用两阶段最小二乘法(TSLS)进行估计。 一个例子:考虑货币政策对宏观经济的影响。 由于货币政策的制定者会根据宏观经济的运 行情况来调整货币政策,故货币政策是个内 生变量(双向因果关系)。Romer (2004) 通过阅读历史文献将货币政策的变动分解为 “内生”(对经济的反应)与“外生”(货 币当局的自主调整)的两部分。
上图表明若某个变量使供给曲线移动而使需求保待不 变时会发生什么样的情况。现在所有的均衡价格和均 衡量对都落在这条稳定的需求曲线
例2:班级模型对测试成缓的效应估计
尽管控制了学生和地区特征,但由于受诸如校 外学习机会或教师质量等不可测变量的影响,第 二篇中给出的班级规模对测试成绩的效应估计中 仍然可能存在着遗漏变量偏差。若这些变量的数 据不可得,则不能通过在多元回归中加入这些变 量的方法来处理遗漏变量偏差。
现在我们有了来自 1st 阶段的预测值
33
第二阶段
Y X-hat . reg lpackpc lravphat if year==1995, r; Regression with robust standard errors Number of obs = F( 1, 46) = Prob > F = R-squared = Root MSE = 48 10.54 0.0022 0.1525 .22645
工具变量(instrumental variable, IV)回 归是当回归变量X与误差项u相关时获得总体 回归方程未知系数一致估计量的一般方法。 我们经常称其为IV估计。 其基本思想是:假设方程是:
我们假设ui与Xi相关,则OLS估计量一定是 有偏的和非一致的。工具变量估计是利用另 一个“工具”变量Z将Xi分离成与ui相关和 不相关的两部分。
-----------------------------------------------------------------------------| Robust lravgprs | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------rtaxso | .0307289 .0048354 6.35 0.000 .0209956 .0404621 _cons | 4.616546 .0289177 159.64 0.000 4.558338 4.674755 -----------------------------------------------------------------------------X-hat . predict lravphat;
ln(Qicigarettes ) = 9.72 – 1.08 ln( Pi cigarettes ) , n = 48
具有正确异方差稳健标准误差的两个回归结合的结果为:
ln(Qicigarettes ) = 9.72 – 1.08 ln( Pi cigarettes ) , n = 48 (1.53) (0.32)
TSLS估计量的抽样分布
为了简单起见,我们仅考虑只有一个回归变 量X和一个工具变量Z的情况。
即,参数的 TSLS估计量 为Z和Y的样 本协方差与Z 和X的样本协 方差之比。
假设原方程为:
即总体系数为Z和Y的总体 协方差与Z和X的总体协方 差之比。
在香烟需求中的应用
为了减少由于吸烟导致的疾病和死亡,以及 这些生病的人对社会其他成员产生的成本或 外部性,一种方法是对香烟征收重税从而减 少吸烟同时阻止潜在的新吸烟者。但具体需 要增加多大幅度的税收来削减香烟的消费呢? 例如,若要使香烟消费减少20%则香烟的税 后售价应该是多少?
工具变量回归提供了解决这一问题的一 种思路。考虑下面的假想例子:由于夏 天发生了地震,为了进行灾后修复工作, 必须关闭某些加利福尼亚州的学校。而 最靠近震中的地区受到的影响最严重。 于是有学校关闭的地区需要把学生“挤 在一起”,因此暂时扩大了班级规模。
这意味着到震中的距离与班级规模相关, 故它满足工具变最相关性的条件但如果 到震中的距离与其他影响学生成绩的因 素无关(如学生是否还在学习英语),则 由于它与误差项无关因此是外生的。于 是到震中的距离这个工具变量可以用来 避免遗漏变量偏差和估计班级规模对测 试成绩的效应。
这些系数是 TSLS 估计值 标准误差是错误的,因为它们忽略了第一阶段是估计的 事实
34
结合到一个命令中
因此,由于这些点是由需求和供给两者的变化 确定的,因此用OLS拟合这些点的直线既不是 需求曲线也不是供给曲线的估计。
Wright的解决办法: 1。找到第三个变量,这个变量影响供给但不 影响需求。这样,所有的均衡价格和均衡量对 都落在这条稳定的需求曲线上,此时很容易估 计出它的斜率。 2。可见,这第三个变量,也就是工具变量, 它与价格相关(它使供给曲线移动,于是导致 价格发生变化),但与u无关(需求曲线保持不 变)。
பைடு நூலகம்
工具变量的选取
一个有效的工具变量必须满足称为工具变量相关 性和工具变量外生性两个条件:即
(1)工具变量相关性:工具变量与所替代 的随机解释变量高度相关;
Cov( Zi, Xi ) 0
(2)工具变量外生性:工具变量与随机误差 项不相关;
Cov(ui, Zi ) 0
两阶段最小二乘估计量
若工具变量Z满足工具变量相关性和外生性的 条件,则可用称为两阶段最小二乘(TSLS)的 IV估计量估计系数ß1。 两阶段最小二乘估计量分两阶段计算: 第一阶段把X分解成两部分:即与回归误差项 相关的一部分以及与误差项无关的一部分。 第二阶段是利用与误差项无关的那部分进行估 计。
为什么IV回归是有效的?
例1: Philip Wright的问题 Philip Wright关心的是那个时期的一个重要 经济问题:即如何对诸如黄油,大豆油这样的 动植物油和食用动物设置进口关税。在20世 纪20年代,进口关税是美国主要的税收收入 来源。而理解关税的经济效应的关键在于要有 商品需求和供给曲线的定量估计。由前知供给 弹性为价格上涨1%引起的供给量变化的百分 率,而需求弹性为价格上涨1%引起的需求量 的百分率变化。
工具变量回归
彼此之间不相关。
经典假设 所有的解释变量Xi与随机误差项
Cov(ui, Xi ) 0
若解释变量Xi和ui相关,则OLS估计量是非 一致的,也就是即使当样本容量很大时, OLS估计量也不会接近回归系数的真值。
造成误差项与回归变量相关(内生性)的原 因很多,但我们主要考虑如下几个方面: 遗漏变量变量 变量有测量误差 双向因果关系。
具体来说: 第一阶段:将X分解成与X高度相关的外生变量Z 以及与干扰项ui相关的部分vi。
工具变量回归
谁开创了工具变量回归? 1928年的著作的“The Tariff on Animal and Vegetable Oils”的附录B。 作者是谁? Philip Wright 还是他的儿子 Sewall Wright 文体计量学的分析
相关文档
最新文档