第15章 工具变量估计与两阶段最小二乘法
工具变量与两阶段最小二乘法
工具变量与两阶段最小二乘法在经济学和统计学中,工具变量(Instrumental Variable,简称IV)与两阶段最小二乘法(Two-stage Least Squares,简称2SLS)是重要的分析方法。
本文将介绍工具变量的基本概念及其应用,然后详细探讨两阶段最小二乘法的原理和使用场景。
一、工具变量的概念和应用工具变量是一种用来解决内生性问题的工具,即解决因果分析中存在的内生性偏误。
在观察数据中,变量之间可能存在内生性关系,即某个解释变量与误差项相关,从而导致我们无法准确估计变量之间的真实关系。
举个例子,假设我们想研究教育对收入的影响,但教育水平很可能与个体的能力有关,这样教育水平就与误差项相关,无法得到准确的估计。
为了解决这个问题,我们可以引入一个工具变量,它与教育水平相关,但与个体能力无关。
通过使用工具变量,我们可以消除这种内生性问题,得到更加准确的估计结果。
二、两阶段最小二乘法的原理两阶段最小二乘法是一种常用的解决内生性问题的方法。
它将原始模型的内生变量替换为工具变量,通过两个阶段的回归来进行估计。
第一阶段,我们使用工具变量回归原始内生变量,得到预测值。
这个预测值不受内生性问题的影响,可以作为第二阶段的新解释变量。
第二阶段,我们将第一阶段得到的预测值作为新的解释变量,与其他变量一起回归目标变量。
这样可以得到消除内生性偏误后的估计结果。
三、两阶段最小二乘法的使用场景两阶段最小二乘法主要用于解决内生性问题,特别是在实证经济学中的因果推断中常见的内生性问题。
常见的使用场景包括但不限于:1. 自然实验:在某些情况下,自然条件的改变可以提供有效的工具变量。
比如,研究教育对收入的影响时,某个教育政策的实施可以被视为一个自然实验,政策的实施对教育水平有影响,但与个体能力无关。
2. 父母教育对子女教育的影响:父母的教育水平很可能同时与遗传因素有关,这样就存在内生性问题。
通过引入工具变量,比如父母的出生地和教育机会,可以解决这个问题。
工具变量估计与两阶段最小二乘法
2 0.014 n 428, R 0.118
edu 10.24 0.269 fatheduc n 428, R 2 0.173 n 428, R 2 0.093 log wage 0.441 0.059educ
0.446 0.035
ˆ u2 SSTx Rx2, z
ˆ 的方差越小; n,或 ,或 越大, 1
2 x 2 x,z
在高斯-马尔科夫假定下,OLS估计量的方差:
ˆ Var 1 SSTx
2
例1 估计已婚女性的教育回报
log wage 0.185 0.109educ
0.185 0.28 0.029
IV 0.132 (0.055) 0.108 (0.024) -0.0023 (0.0003)
Black
Smsa South 观测数 R2
-0.199 (0.018)
0.136 (0.02) -0.148 (0.026) 3010 0.300
-0.147 (0.054)
ˆ ˆ y ˆ z 0 1 i 2 2 i1 0
i1
z y
i 1 i2
ˆ ˆ y ˆ z 0 1 i 2 2 i1 0 ˆ ˆ y ˆ z 0 1 i 2 2 i1 0
z y
题目什么是工具变量请简要解释两阶段最小二乘法的原理
题目什么是工具变量请简要解释两阶段最小二乘法的原理工具变量是经济学研究中常用的一种样本选择技术,在解决内生性问题时发挥重要的作用。
而两阶段最小二乘法(Two-stage Least Squares, 2SLS)则是一种通过工具变量解决内生性问题的统计方法。
本文将简要解释什么是工具变量,并介绍两阶段最小二乘法的原理。
一、什么是工具变量?工具变量是一种被用来估计因果效应的技术。
在经济学研究中,我们通常希望通过观察变量之间的关系来推断因果关系。
然而,当我们的解释变量与误差项存在内生性的时候,观察到的关系可能是虚假的。
内生性指的是解释变量与误差项之间存在相关性,从而导致回归结果的偏误。
例如,假设我们想要研究教育对收入的影响,但教育水平与个体的天赋能力存在相关性,那么在简单的回归模型中,教育水平的系数可能是被天赋能力所驱动的,而隐藏了教育对收入的真实影响。
为了解决内生性问题,我们需要引入工具变量。
工具变量是与解释变量相关但与误差项无关的变量。
通过利用工具变量的性质,我们可以有效地分离出解释变量与误差项之间的关系。
二、两阶段最小二乘法的原理两阶段最小二乘法是一种使用工具变量估计内生变量系数的方法。
它将估计过程分为两个阶段,通过两个回归模型来实现。
第一阶段:通过工具变量来解决内生性问题。
首先,选择一个与内生变量相关的工具变量。
然后,利用工具变量进行回归,得到内生变量的预测值。
这个预测值具有以下性质:它与误差项无关,并且与内生变量存在相关性。
第二阶段:根据第一阶段得到的内生变量的预测值,再次进行回归。
这一次回归的目的是估计解释变量对因变量的影响,并控制了内生性的影响。
通过这两个阶段的回归,我们可以得到内生变量系数的一致估计。
两阶段最小二乘法的核心思想是利用工具变量来消除内生性问题,进而获得内生变量系数的一致估计。
通过第一阶段的回归得到的预测值,我们可以将内生变量视为无误差的外生变量,并在第二阶段的回归中进行计算。
北大计量经济学讲义-工具变量与两阶段最小二乘法
nehS naY ,scirtemonocE etaidemretnI
计估SLO的1b到得们我�时x=z当 . 1b
计估�时在存VI当 noitamitsE :elbaliavA si VI na nehW
91
nehS naY ,scirtemonocE etaidemretnI
计估�时在存VI当 noitamitsE :elbaliavA si VI na nehW
�量变具工用使何为 ?selbairaV latnemurtsnI esU yhW
7
nehS naY ,scirtemonocE etaidemretnI
题问差误量测的典经决解来用可VI�且而 melborp selbairav-ni-srorre cissalc eht evlos ot desu eb nac VI ,yllanoitiddA � 差偏量变漏遗决解来用以可VI�以所 saib elbairav dettimo fo melborp eht sserdda ot desu eb nac VI ,suhT �
�
定决资工�子例 noitanimreted egaw :elpmaxE
41
nehS naY ,scirtemonocE etaidemretnI
。关相项差误和育教与时同它。不 .mret rorre eht dna noitacude htob htiw setalerroc tI .oN � �吗量变具工的好是QI ?tnemurtsni doog a QI sI �
。计估致一的1b是计估VI明证律定数 大用应以可�时立成 )5.51(和 )4.51(定假当 .srebmun egral fo wal eht gniylppa retfa ,1b rof tnetsisnoc si rotamitse VI eht taht wohs nac eno ,dloh )5.51( dna )4.51( snoitpmussa nehW �
第15章 工具变量估计与两阶段最小二乘法
Eu 0, Ez1u 0,L , E zk1u 0, E zku 0
15.3 两阶段最小二乘法
如果一个内生解释变量有多个工具变量,如 何有效运用多个工具变量?以下面结构模 型为例: y1 0 1y2 2z1 u1
则称z是x的工具变量(IV)。工具变量可得 能够用于一致估计回归方程的参数。
15.1 动机:简单回归模型中的遗漏变量
借助于工具变量,回归方程的参数是可识别 (identification),即参数可用总体矩表示, 而总体矩可用样本矩来估计。用工具变量z 对回归方程两边协方差:
cov z, y 1 cov z, x cov z,u
对此也没有合理的解释。
15.2 多元回归模型中的IV估计
简单回归模型IV估计很容易延伸到多元回归
y1 0 1 y2 2 z1 L k zk1 u1
借用联立方程模型的形式和术语,此方程称 为结构方程(structural equation)。 z1, z2 ,L , zk1是外生变量,y2 被怀疑是内生的, 即可能与u相关。需要找到其工具变量
有效的工具变量 zk 需满足:(1)是未包含的 外生变量,即它不在结构方程中且与u不相 关。
15.2 多元回归模型中的IV估计
(2)zk 与 y2 存在某种偏相关,即约简型方程
y2 0 1z1 L k1zk1 k zk v
的系数满足: k 0
同样要求(1)不能检验,只能寄希望于经济 逻辑和反思。要求(2)可对约简型方程估 计后直接检验。
第十五章 工具变量估计与两阶段 最小二乘法
本章研究多元回归模型中的内生解释变 量问题。解释变量的内生性常来自遗漏 变量问题,这使OLS估计不一致。尽管 代理变量法和面板数据的固定效应法可 在某些情况下解决内生性问题,但远未 完善。本章讨论另一解决解释变量内生 性问题的方法:工具变量法(IV)。其 受欢迎程度仅次于OLS。
第15章-工具变量讲解
这样一来 , 我们便把 abil 放人误差项中,而 只留下简单回归模型: Log(wage) =β 0+β 1educ+u (15.1 ) 其中,u 包含 abil。当然,如果用 OLS 估计 方程 (15.1) ,若 educ 与 abil 相关,则得到 的结果将是 1 的有偏而又不一致估计量。
第15章 工具变量估计与两阶段最小二乘法
在本章中,我们进一步研究多元回归模型中的 内生解释变量 (endogenous explanatory Variables) 问题。在第 3 章中,我们推导出遗漏一个重要变 量时 OLS 估计量的偏误,在第 5 章中,我们说明 了在遗漏变量(omitted variables)的情况下,OLS 通 常是不一致的。
举例来说,考虑成年劳动者的工资方程中存 在无法观测之能力因素的问题。一个简单的 模型为: log(wage)=β 0+β 1educ+β 2abil+e 其中,e 是误差项。
在第 9 章中,我们证明了在某些假定下,如 何用诸如 IQ 的代理变量代替能力,从而通过 以下回归可得到一致估计量 log(wage)对 educ,IQ 回归 然而假定不能得到适当的代理变量(或它不 具备足以获取 1 一致估计量所需的性质)。
我们一开始先说明,在存在遗漏变量的情况 下,如何用 IV 法获得一致估计量。此外, IV 至少能在某些假定下用于解决变量误差 (errors-in-variables)问题。下一章将证明运 用 IV 法如何估计联立方程模型。
我们对工具变量估计的论述严格遵照我们在 第 1 篇中对普通最小二乘的推导,其中假定 我们有一个来自潜在总体的随机样本。这个 起点很合人意,因为除了简化符号之外,它 还强调用潜在总体来表述对 IV 估计所做的重 要假定 (正如用 OLS 时一样)。
第十五章工具变量法
内生性的检验
• 因为如果不存在内生性的问题,普通最小 二乘(OLS)比工具(IV)变量更好, 所以 我们希望能够检验内生性是否存在 • 如果不存在内生性, 普通最小二乘和工具变 量都是一致的 • Hausman 检验的想法是观察普通最小二乘 估计和工具变量是否有差别
内生性的检验 (续)
• 尽管比较普通最小二乘和工具变量的结果 是个好主意, 用回归来检验内生性则更简单 • 如果 y2 是内生的, 那么 v2 (来自诱导型方 程) 和来自结构型方程的 u1 将会相关 • 检验时基于这样的观察
关于 2SLS
• 尽管相关系数是相同的,通过手工进行两阶 段最小二乘 2SLS 获得的标准误并不是准 确的。 • 把这种方法推广到多个外生变量的情形– 需 要确定我们至少有和结构型方程中的外生 变量一样多的排他性外生变量(工具变 量)
用工具变量估计解决含误差的变 量的问题
• 回忆传统的含误差的变量的问题, 我们观 察到的是 x1 而非 x1* • 其中 x1 = x1* + e1, 并且 e1 与x1* 和 x2是不 相关的 • 如果存在 z, 满足 Corr(z,u) = 0 并且 Corr(z,x1) ≠ 0, 那么 • 工具变量将消除衰减偏误
不好的工具变量的影响
• 如果我们的假设 Cov(z,u) = 0 是错误的会怎样? • 工具变量 IV 的估计量将会是不一致的 • 可以比较普通最小二乘 OLS 和工具变量 IV的渐 近偏误 • 当 Corr(z,u)/Corr(z,x) < Corr(x,u)时,工具变量更 可取 ˆ = β + Corr( z, u) • σ u IV : plimβ1 1 Corr( z, x) σ x
检验序列相关
两阶段最小二乘法步骤
两阶段最小二乘法步骤
两阶段最小二乘法是一种分离策略,将内生变量分离为可以被工具变量线性表出的部分,以及随机干扰部分。
其具体步骤如下:
1. 第一阶段:让工具变量z对内生x进行回归,得到估计值$x^$。
2. 第二阶段:利用$x^$对y做回归,得到系数估计值。
这种方法通过将估计分成两个步骤(阶段)回归,因此得名“两阶段最小二乘法”。
对于联立方程组,可以采用三阶段最小二乘法。
如果存在弱工具变量问题,可以采取对信息不太敏感的有限信息极大似然估计法。
c15 工具变量估计与两阶段最小二乘法
第15章工具变量估计与两阶段最小二乘法摘要: 本章继续讨论如何解决模型中的内生解释变量(endogenous explanatory variables )问题。
遗漏变量(omitted variables )是导致内生性问题的一个原因。
本章采用工具变量法(method of instrumental variables,IV )来解决模型中的一个或多个解释变量的内生性问题。
所采用的估计方法被称为两阶段最小二乘估计(method of two stage least squares ,2SLS or TSLS),其受欢迎程度仅次于OLS. IV 也能在某些特定的情形下解决变量带误差(errorsin-variables )的问题.15.1 动机: 简单回归中的遗漏变量如何处理可能发生的变量遗漏带来的偏误,已有三种选择: 1)直接忽略,讨论偏误的方向;2)寻找一个合适的代理变量;3)如果该遗漏变量不随时间变化时,采用FE 或FD 方法。
工具变量法的思路:不是考虑如何处理遗漏变量(此时遗漏变量在误差项中),而是寻找被遗漏的解释变量的替代变量,使得替代变量和误差项不再存在相关性。
y =β0+β1x +u ,此时该模型不满足MLR.4,从而不能保证Cov (x,u )=0,特别地,假定Cov (x,u )≠0. 如果x 的替代变量z 同时满足下面两个条件:1) 工具外生性(instrument exogeneity )条件:Cov (z,u )=0,2) 工具相关性(instrument relevance )条件:Cov (z,x )≠0,则称z 为x 的工具变量(instrumental variable ),或简称工具(instrumental ). 几点说明:1) 工具变量的外生性意味着z 对y 没有偏效应(当x 和u 中遗漏变量被控制时),同时也和其它被遗漏变量不相关;2) 工具外生性检验在多数情况下只能通过经济行为或反思来判断;3) 工具相关性检验借助t 和F 检验就行;外生性和相关性假设足以帮助我们识别(Identification )出β1=COv(z,y)Cov(z,x),那么β1的工具变量估计(instrumental variables (IV) estimator )为:β̂1=∑(z i −z ̅)(y i −y ̅)n i=1∑(z i −z ̅)(x i −x ̅)n i=1, 其是β1的一致但有偏的估计;4)β̂1显然当z=x,该估计就是OLS 估计,但这要以x 和u 无关为条件,也即工具变量法适于u 和x 无关的情形。
工具变量 两阶段最小二乘
n−2
∑
n
i =1 i n
ˆ Z ,X = ρ
∑
i =1
( X i − X )(Z i − Z )
2 ( Z − Z ) ∑i=1 i n
2 ( X − X ) ∑i=1 i
ˆ −β ˆ X ˆi = Yi − β u 0 IV 1IV i
工具变量估计法
一元线性回归模型
Y = β0 + β1 X + u
内生性影响图示:
X
Y
u
dY / dX = β + du / dX
ˆ 是对 β + du / dX 的估计。 β
6.1 内生性
6.1.2 内生性产生的原因
模型设定错误、测量误差和联立性
• 模型设定错误是导致内生性最常见的原因,模型 设定错误往往表现为相关变量的缺失,缺失变量 成为错误设定模型误差项的一部分,当缺失变量 和模型中其他变量相关时,就会导致这些变量的 内生性。(工资与教育、能力)、 • 不相干变量引入不会影响参数估计的无偏性和一 致性,但是会影响参数估计的有效性。
??模型设定错误是导致内生性最常见的原因模型设定错误往往表现为相关变量的缺失缺失变量成为错误设定模型误差项的一部分当缺失变量和模型中其他变量相关时就会导致这些变量的内生性
第6章
内生性和工具变量估计方法
内生性和工具变量估计方法
6.1 内生性
6.1.1 OLS估计的不一致性 6.1.2 内生性产生的原因
fathedu 作工具变量:
ln(wage) = − 0.441+ 0.059 educ
( 0.989 ) (1.686 )
工具变量估计法
多元线性回归模型
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章工具变量估计与两阶段最小二乘法【圣
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章工具变量估计与两阶段最小二乘法【圣第15章工具变量估计与两阶段最小二乘法15.1复习笔记一、动机:简单回归模型中的遗漏变量1.面对可能发生的遗漏变量偏误(或无法观测异质性)的四种选择(1)忽略遗漏变量问题,承受有偏而又不一致估计量,若能把估计值与关键参数的偏误方向一同给出,则该方法便令人满意。
(2)试图为无法观测变量寻找并使用一个适宜的代理变量,该方法试图通过用代理变量取代无法观测变量来解决遗漏变量的问题,但并不是总可以找到一个好的代理。
(3)假定遗漏变量不随时间变化,运用固定效应或一阶差分方法。
(4)将无法观测变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法,工具变量法。
2.工具变量法简单回归模型01y x uββ=++其中x 与u 相关:()Cov 0,x u ≠(1)为了在x 和u 相关时得到0β和1β的一致估计量,需要有一个可观测到的变量z,z 满足两个假定:①z 与u 不相关,即Cov(z,u)=0;②z 与x 相关,即Cov(z,x)≠0。
满足这两个条件,则z 称为x 的工具变量,简称为x 的工具。
z 满足①式称为工具外生性条件,工具外生性意味着,z 应当对y 无偏效应(一旦x 和u 中的遗漏变量被控制),也不应当与其他影响y 的无法观测因素相关。
z 满足②式意味着z 必然与内生解释变量x 有着或正或负的关系。
这个条件被称为工具相关性。
(2)工具变量的两个要求之间的差别①Cov(z,u)是z 与无法观测误差u 的协方差,通常无法对它进行检验:在绝大多数情形中,必须借助于经济行为或反思来维持这一假定。
②给定一个来自总体的随机样本,z 与x(在总体中)相关的条件则可加以检验。
最容易的方法是估计一个x 与z 之间的简单回归。
在总体中,有01x z vππ=++从而,由于()()1Cov /ar V ,x z z π=所以式Cov(z,x)≠0中的假定当且仅当10π≠时成立。
伍德里奇计量经济学导论第5版笔记和课后习题详解
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解目录第1章计量经济学的性质与经济数据1.1复习笔记1.2课后习题详解第一篇横截面数据的回归分析第2章简单回归模型2.1复习笔记2.2课后习题详解第3章多元回归分析:估计3.1复习笔记3.2课后习题详解第4章多元回归分析:推断4.1复习笔记4.2课后习题详解第5章多元回归分析:OLS的渐近性5.1复习笔记5.2课后习题详解第6章多元回归分析:深入专题6.1复习笔记6.2课后习题详解第7章含有定性信息的多元回归分析:二值(或虚拟)变量7.1复习笔记7.2课后习题详解第8章异方差性8.1复习笔记8.2课后习题详解第9章模型设定和数据问题的深入探讨9.1复习笔记9.2课后习题详解第二篇时间序列数据的回归分析第10章时间序列数据的基本回归分析10.1复习笔记10.2课后习题详解第11章OLS用于时间序列数据的其他问题11.1复习笔记11.2课后习题详解第12章时间序列回归中的序列相关和异方差性12.1复习笔记12.2课后习题详解第三篇高级专题讨论第13章跨时横截面的混合:简单面板数据方法13.1复习笔记13.2课后习题详解第14章高级的面板数据方法14.2课后习题详解第15章工具变量估计与两阶段最小二乘法15.1复习笔记15.2课后习题详解第16章联立方程模型16.1复习笔记16.2课后习题详解第17章限值因变量模型和样本选择纠正17.1复习笔记17.2课后习题详解第18章时间序列高级专题18.1复习笔记18.2课后习题详解第19章一个经验项目的实施19.2课后习题详解本书是伍德里奇《计量经济学导论》(第5版)教材的学习辅导书,主要包括以下内容:(1)整理名校笔记,浓缩内容精华。
每章的复习笔记以伍德里奇所著的《计量经济学导论》(第5版)为主,并结合国内外其他计量经济学经典教材对各章的重难点进行了整理,因此,本书的内容几乎浓缩了经典教材的知识精华。
(2)解析课后习题,提供详尽答案。
第15章 工具变量估计与两阶段最小二乘法
Eu 0, Ez1u 0,L , E zk1u 0, E zku 0
15.3 两阶段最小二乘法
如果一个内生解释变量有多个工具变量,如 何有效运用多个工具变量?以下面结构模 型为例: y1 0 1y2 2z1 u1
如果内生解释变量 y2有两个被排斥的外生变 量 z2 , z3,且都与 y2相关,则不仅其中任何 一个可作为IV,而且它们的任何线性组合也 是有效的IV。为了找到最好的IV,需选择与 y2
最高度相关的线性组合,这要求估计约简型 方程: y2 0 1z1 2 z2 3z3 v2
第十五章 工具变量估计与两阶段 最小二乘法
本章研究多元回归模型中的内生解释变 量问题。解释变量的内生性常来自遗漏 变量问题,这使OLS估计不一致。尽管 代理变量法和面板数据的固定效应法可 在某些情况下解决内生性问题,但远未 完善。本章讨论另一解决解释变量内生 性问题的方法:工具变量法(IV)。其 受欢迎程度仅次于OLS。
大样本下IV估计量近似服从正态分布,常用的推断 方法均适用,但IV估计的方差总是大于OLS方差, 特别当z与x的线性相关度很弱时,IV方差会比 OLS方差大很多。由此当x外生时,OLS估计比IV 估计有效得多。
IV估计的关键是找到好的工具变量,工具变量的两 个要求具有很大差别,要求(1)涉及无法观测的 误差项,通常无法对其进行检验,在绝大多数情 况下,我们必须借助于经济行为或反思来维持此 假定。
15.3 两阶段最小二乘法
在对 2 , 3 的联合显著性检验之后,使用估计值作
为 y2的IV: yˆ2 ˆ0 ˆ1z1 ˆ2 z2 ˆ3 z3
在多个工具条件下IV估计量称为两阶段最小二乘估 计量(2SLS)。原因是当用以上估计值作为IV时, 参数的IV估计值等同于 y1 yˆ2 , z1回归的OLS估 计值。但标准误和检验统计量不相同。
工具变量与两阶段最小二乘法课件
对模型进行异方差性和自相关性检验,以确 保模型设定和估计的准确性。
04
CHAPTER
工具变量与两阶段最小二乘 法的应用实例
实证应用案例
案例名称
研究企业资本结构与经营绩效 关系
案例描述
利用工具变量和两阶段最小二 乘法,控制内生性问题,探讨 企业资本结构对经营绩效的影 响。
数据来源
跨学科合作
不同领域的学者合作,共同探讨工具变量与两阶段最小二乘法的理 论和应用问题。
计算机模拟和实验研究
利用计算机模拟和实验方法,模拟不同情境下工具变量与两阶段最 小二乘法的表现。
未来研究方向与展望
01
工具变量的识别与选择
未来研究将进一步探索如何更有效地识别和选择工具变量,以提高估计
的准确性和稳健性。
假设条件
在使用工具变量和两阶段最小二乘法时,需要满足一些假设条件,如工具变量 的外生性、与内生解释变量的相关性等。这些假设条件是保证估计结果有效性 和一致性的基础。
02
CHAPTER
工具变量的选择与检验
工具变量的定义与特性
工具变量的定义
工具变量是一种用于估计参数的中间 变量,它与内生解释变量相关,但与 误差项无关。
上市公司财务数据
分析结果
资本结构与企业经营绩效之间 存在负相关关系,融资约束对
企业经营绩效有显著影响。
模拟实验案例
案例名称:模拟市场供需关系对价格的影响 数据来源:模拟数据
案例描述:利用工具变量和两阶段最小二乘法,模拟市 场供需关系对价格的影响,并检验模型的有效性。
分析结果:供需关系对价格具有显著影响,两阶段最小 二乘法能够有效地估计模型参数。
工具变量与两阶段最小二乘 法概述
工具变量与两阶段最小二乘法
? Testing for endogeneity… 检验内生性
Intermediate Econometrics,
Yan Shen
2
Lecture Outline 本课提要
? Motivation: Why using IV? 出发点:为何用工具变量?
Intermediate Econometrics,
Yan Shen
5
Why Use Instrumental Variables? 为何使用工具变量?
? Instrumental Variables (IV) estimation is used when your model has endogenous x's 当模型解释变量具有内生性时,使用工具 变量估计
? In this context, identification means that we can
write b1 in terms of population moments that can
be estimated in samples.
这里,识别 是指我们可以将 b1表示为总体矩的函
数,并且这些矩可以通过样本估计。
consistent for b1, after applying the law of
large numbers. 当假定(15.4) 和(15.5) 成立时,可以应用大
? When z=x we obtain the OLS estimator of
b1 . 当z=x时,我们得到b1的OLS估计
? This means when x is exogenous, it can be used as its own IV, and the IV estimator is identical to OLS in this case.
二阶段最小二乘法的基本步骤
二阶段最小二乘法的基本步骤
二阶段最小二乘法是为了解决内生解释变量导致的对严格外生性假定的破坏,需要为内生解释变量找到有效的工具变量,使用工具变量的估计方法。
其基本步骤如下:
1. 第一步:让工具变量$z$对内生变量$x$进行回归,得到估计值$x^$。
2. 第二步:利用$x^$对$y$做回归,得到系数估计值。
工具变量法相对于一种分离策略,即将内生变量$x$分离为可以被工具变量$z$线性表出的部分,以及随机干扰部分。
最后将与$z$相对的外生变量部分拿出来与$y$做回归,从而满足严格外生性假定。
二阶段最小二乘法就是用了两次OLS,因此得名。
对于联立方程组可以采用三阶段最小二乘法3SLS。
如果存在弱工具变量问题,可以采取对信息不太敏感的有限信息极大似然估计法。
第15章 工具变量与两阶段最小二乘
第15章 工具变量估计与两阶段最小二乘法在本章中,我们进一步研究多元回归模型中的内生解释变量(endogenous explanatory variable )问题。
在第3章中,我们推导出,遗漏一个重要变量时OLS 估计量的偏误;在第5章中,我们说明了在遗漏变量(omitted variable )的情况下,OLS 通常是非一致性的。
第9章则证明了,对未观测到的解释变量给出适宜的代理变量,能消除(或至少减轻)遗漏变量偏误。
不幸的是,我们不是总能得到适宜的代理变量。
在前两章中,我们解释了存在不随时间变化的遗漏变量的情况下,对综列数据如何用固定效应估计或一阶差分来估计随时间变化的自变量的影响。
尽管这些方法非常有用,可我们不是总能获得综列数据的。
即使能获得,如果我们的兴趣在于变量的影响,而该变量不随时间变化,它对于我们也几无用处:一阶差分或固定效应估计排除了不随时间变化的变量。
此外,迄今为止我们已研究出的综列数据法还不能解决与解释变量相关的随时间而变化的遗漏变量的问题。
在本章中,我们对内生性问题采用了一个不同的方法。
你将看到如何用工具变量法(IV )来解决一个或多个解释变量的内生性问题。
就应用计量经济学中线性方程的估计而言,两阶段最小二乘法(2SLS 或TSLS )是第二受人欢迎的,仅次于普通最小二乘。
我们一开始先说明,在存在遗漏变量的情况下,如何用IV 法来获得一致性估计量。
此外,IV 能用于解决含误差变量(errors-in-variable )的问题,至少是在某些假定下。
下一章将证明运用IV 法如何估计联立方程模型。
我们对工具变量估计的论述严格遵照我们在第1篇中对普通最小二乘的推导,其中假定我们有一个来自基本总体的随机样本。
这个起点很合人意,因为除了简化符号之外,它还强调了应根据基本总体来表述对IV 估计所做的重要的假定(正如用OLS 时一样)。
如我们在第2篇中所示,OLS 可以应用于时间序列数据,而工具变量法也一样可以。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
15.1 动机:简单回归模型中的遗漏变量
要求(2)容易检验,只需x对z简单回归,检 验斜率系数的显著性。 内生解释变量和工具变量也可以是二值变量 如果现在的工具变量是低劣的,即z可能与u 相关,此时IV估计也是不一致的。OLS估计 也是不一致的,但IV估计的偏误要大很多。 2 R 与OLS估计不同,IV估计中的 可能为负, 对此也没有合理的解释。
15.2 多元回归模型中的IV估计
zk 与 y2 存在某种偏相关,即约简型方程 (2) y2 0 1z1 k 1zk 1 k zk v 的系数满足: k 0
同样要求(1)不能检验,只能寄希望于经济 逻辑和反思。要求(2)可对约简型方程估 计后直接检验。 具体的IV估计量可从k+1个矩条件对应的样本 方程求出: E u 0, E z1u 0, , E zk 1u 0, E zku 0
15.3 两阶段最小二乘法
如果一个内生解释变量有多个工具变量,如 何有效运用多个工具变量?以下面结构模 型为例: y1 0 1 y2 2 z1 u1 如果内生解释变量 y2有两个被排斥的外生变 量 z2 , z3 ,且都与 y 相关,则不仅其中任何 一个可作为IV,而且它们的任何线性组合也 是有效的IV。为了找到最好的IV,需选择与 y2 最高度相关的线性组合,这要求估计约简型 方程: y2 0 1z1 2 z2 3 z3 v2
n
ˆ 1
z
i 1
i 1 n
i
i
i
z
xi
Байду номын сангаасx
15.1 动机:简单回归模型中的遗漏变量
参数的IV估计量是一致估计量。IV估计往往在大样 本下使用。x外生时,它可用作自身的IV,此时的 IV估计量等同于OLS估计量。 大样本下IV估计量近似服从正态分布,常用的推断 方法均适用,但IV估计的方差总是大于OLS方差, 特别当z与x的线性相关度很弱时,IV方差会比 OLS方差大很多。由此当x外生时,OLS估计比IV 估计有效得多。 IV估计的关键是找到好的工具变量,工具变量的两 个要求具有很大差别,要求(1)涉及无法观测的 误差项,通常无法对其进行检验,在绝大多数情 况下,我们必须借助于经济行为或反思来维持此 假定。
15.1 动机:简单回归模型中的遗漏变量
以简单回归模型来讨论工具变量估计的思想 y 0 1 x u
解释变量的内生性意味着 cov x, u 0 如果存在一个可观察的变量z,满足两个假定 (1)z与u不相关,即 cov z, u 0 (2)z与x相关,即 cov z, u 0 则称z是x的工具变量(IV)。工具变量可得 能够用于一致估计回归方程的参数。
2
15.3 两阶段最小二乘法
2SLS可用于多个内生解释变量的模型中,但 工具变量必须满足一定的条件方程才能识 别。 方程识别的阶条件:被排斥的外生变量的个 数至少与结构方程中包含的解释变量一样 多。 阶条件仅是必要条件,方程识别的充分条件 是秩条件,需要用矩阵代数来表述。
2
15.3 两阶段最小二乘法
在对 2 , 3 的联合显著性检验之后,使用估计值作 ˆ2 ˆ0 ˆ1 z1 ˆ2 z2 ˆ3 z3 为 y2 的IV: y 在多个工具条件下IV估计量称为两阶段最小二乘估 计量(2SLS)。原因是当用以上估计值作为IV时, ˆ 2 , z1回归的OLS估 参数的IV估计值等同于 y1 y 计值。但标准误和检验统计量不相同。 增加更多的外生变量,方法上没有什么变化。 2SLS中多重共线性会比较严重,2SLS估计量的方 ˆ2 比 y2 的变异 差会大于OLS,原因有二,一是 y y2 ˆ 2与外生变量之间的相关程度比 ˆ y 要小,二是 y 与这些变量的相关程度大得多。
15.2 多元回归模型中的IV估计
简单回归模型IV估计很容易延伸到多元回归
y1 0 1 y2 2 z1 k zk 1 u1
借用联立方程模型的形式和术语,此方程称 为结构方程(structural equation)。 y2 z1 , z2 , , zk 1是外生变量, 被怀疑是内生的, 即可能与u相关。需要找到其工具变量 有效的工具变量 zk 需满足:(1)是未包含的 外生变量,即它不在结构方程中且与u不相 关。
第十五章 工具变量估计与两阶段 最小二乘法
本章研究多元回归模型中的内生解释变 量问题。解释变量的内生性常来自遗漏 变量问题,这使OLS估计不一致。尽管 代理变量法和面板数据的固定效应法可 在某些情况下解决内生性问题,但远未 完善。本章讨论另一解决解释变量内生 性问题的方法:工具变量法(IV)。其 受欢迎程度仅次于OLS。
15.1 动机:简单回归模型中的遗漏变量
借助于工具变量,回归方程的参数是可识别 (identification),即参数可用总体矩表示, 而总体矩可用样本矩来估计。用工具变量z 对回归方程两边协方差:
cov z, y 1 cov z, x cov z, u
解出: 1 cov z, y / cov z, x 由此得到工具变量估计量: z z y y