第十五章工具变量估计与TSLS-3

合集下载

计量经济学-工具变量

计量经济学-工具变量

利用E(zii)=0,在大样本下可得到:
~1
zi yi zi xi
关于0 的估计,仍用~0 Y ~1X 完成。
这种求模型参数估计量的方法称为工具变 量法(instrumental variable method),相应的估 计 量 称 为 工 具 变 量 法 估 计 量 ( instrumental variable (IV) estimator)。
CONSP 0 1GDPP 由于:居民人均消费支出(CONSP)与人 均国内生产总值(GDPP)相互影响,因此,
容易判断GDPP与同期相关(往往是 正相关),OLS估计量有偏并且是非一致的
(低估截距项而高估计斜率项 )。
OLS估计结果:
(13.51) (53.47) R2=0.9927 F=2859.23 DW=0.5503 SSR=23240.7
用OLS估计模型,相当于用xi去乘模型两边、对i求 和、再略去xii项后得到正规方程:
xi yi 1 xi2
解得:
ˆ1
xi yi xi2
(*)
由于Cov(Xi,i)=E(Xii)=0,意味着大样本下: (xii)/n0
表明大样本下:
ˆ1
xi yi xi2
2. 工具变量并没有替代模型中的解释变量, 只是在估计过程中作为“工具”被使用。
上述工具变量法估计过程可等价地分解成下 面的两步OLS回归:
第一步,用OLS法进行X关于工具变量Z的回归:
Xˆ i ˆ0 ˆ1Zi
Yˆi ~0 ~1 Xˆ i
容易验证仍有:
~1
zi yi zi xi
如果用GDPPt-1为工具变量,可得如下工具 变量法估计结果:

第15章-工具变量

第15章-工具变量

Cov( z, y) 1Cov( z, x) Cov( z, u)
现在,在式 (15.4) 中 Cov(z,u)=0 与式(15.5) 中 Cov(z,x)≠0 的假定下 ,我们可以解出 1 为:
Cov( z, y ) 1 Cov( z, x)
(15.9)
[注意到,若 z 与 x 不相关,即 Cov(z,x)=0,这 个简单的代数关系便不成立。]方程 (15.9)表 明, 1 是 z 和 y 之间的总体协方差除以 z 和 x 之间的总体协方差,这说明 1 被识别了。 给定一个随机样本,我们用对应样本量来估 计总体量。
score 0 1skipped u
(15.8)
其中,score 是期末考试成绩, skipped 是该 学期逃课的总次数。
当然,我们可能担心 skipped 与 u 中其他因素 相关:越有能力而又积极的学生可能逃课也越 少。因而 score 对 skipped 的简单回归,可能 不会给出逃课之因果效应的可靠估计。
这样一来 , 我们便把 abil 放人误差项中,而 只留下简单回归模型: Log(wage) =β 0+β 1educ+u (15.1 ) 其中,u 包含 abil。当然,如果用 OLS 估计 方程 (15.1) ,若 educ 与 abil 相关,则得到 的结果将是 1 的有偏而又不一致估计量。
即使能获得,如果我们的兴趣在于变量的影响, 而该变量又不随时间而变化,它对于我们也几 无用处:一阶差分或固定效应估计排除了不随 时间而变化的变量。 此外,迄今为止我们所研 究的面板数据方法,还不能解决与解释变量相 关的时变(即随着时间而不断变化的)遗漏变 量问题。
在本章,我们对内生性问题采用了一种不同的 方法。你将看到如何用工具变量法 (IV)来解决 一个或多个解释变量的内生性问题。就应用计 量经济学中线性方程的估计而言,两阶段最小 二乘法 (2SLS 或 TSLS)的受欢迎程度仅次于普 通最小二乘。

工具变量(IV):估计与检验

工具变量(IV):估计与检验



用到 i E zi x 为对称矩阵
-1
秩条件r i E zi x =k意味着工具变量w i与内生解释 变量x i相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量 根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数 2 恰好识别:工具变量个数等于内生解释变量个数 3 过度识别:工具变量个数多于内生解释变量个数
解释变量内生性检验
Hausman 检验
寻找工具变量的方法:几个实例
方法 例子
由来
经典假设 所有的解释变量Xi与随机误差项彼此 之间不相关。
Cov (u i , X i ) 0
若解释变量Xi和ui相关,则OLS估计量是非一致 的,也就是即使当样本容量很大时,OLS估计量 也不会接近回归系数的真值。 造成误差项与回归变量相关(内生性)的原因 很多,但我们主要考虑如下几个方面: • 遗漏变量变量 • 变量有测量误差 • 双向因果关系。
1、矩估计(Method of Moments,MM)
首先以一个例子来说明矩估计方法:假设随机变量 x N , 2 ,其中, 2为待估参数。因为有两 个待估参数,故需要使用以下两个总体矩条件: 一阶中心矩:E x =
2 2 二阶中心矩:E x =Var x + E x = + 2 2
可以引入工具变量w t 来解决内生变量问题。一个有 效的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关,即 Cov w t,p t 0,p t为内生解释变量 (2)外生性:工具变量与扰动项不相关,即 Cov w t, t =0
二、工具变量法作为一种矩估计

09_模型设定偏差、随机解释变量和工具变量

09_模型设定偏差、随机解释变量和工具变量
Y = Xβ +ε
回归系数的 OLS 估计量为:
β = ( X ' X )−1 X 'Y = ( X ' X )−1 X ' ( X β + ε ) = β + ( X ' X )−1 X 'ε
当 X 与扰动项不相关时,
p lim 1 X 'ε = 0 N
假设
p lim
1 N
X
'X
=
ΣX
存在,并且非奇异(逆矩阵存在),
估计也依然是无偏的,因此所建立的假设检验(t 和 F 检验)依然 有效。
加入多余变量的模型的参数的估计值为:
将 Y 的实际模型代入得:
两边取期望得:
厦门大学国际经济与贸易系 胡朝霞
6
2) 但是,回归系数的 OLS 估计量的方差不是最小方差的(大于 真实模型相应估计量的方差),因此 OLS 估计量是非有效的估计 量,即非 BLUE 估计量。它将导致回归系数估计量的精度下降, 并可能拒绝显著的解释变量。
ห้องสมุดไป่ตู้
E

* 2
)
=
β2
+
β3 iβ32
=
β2
+
β3
cov( X 2 , X3 ) var( X 2 )

β2
E(β 1*) = β1 + β3 i( X3 − β32 X 2 ) ≠ β1
β*
当β3 与 cov(X2,X3)的符号相同时, 2 将平均上偏;异号时,将
平均下偏。
2)如果被省略了变量 X3 与真实模型中的变量 X2 的相关系数为 0(即
1.残差的分析
残差的分析不仅可以用于自相关和异方差的鉴别,还可用于遗漏 变量和不正确的函数形式的诊查。

工具变量(IV):估计与检验_图文_图文

工具变量(IV):估计与检验_图文_图文

• 3。Wright考虑了几个可能的工具变量; 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 衡价格上升),因此牧场地区降雨量满足工 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响,因此牧场地区降 雨量与ui的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。
• 例如具休考虑黄油的需求弹性估计问题 :
根据11个均衡样本点估计的方程究竟是需求函数还是 供给函数?两者都不是。由于这些点是由需求和供给 两者的变化确定的,因此用OLS拟合这些点的直线既 不是需求曲线也不是供给曲线的估计。
利用这些样本点估计出来的OLS拟合线是需求曲 线还是供给曲线,都不是!两个极端的情况如图 :
• 工具变量的外生性:若销售税是外生的,则必 须与需求方程中的误差无关;即销售税必然只 是通过价格间接影响香烟的需求。这看上去是 合理的:主要是因为不同州选择了不同的销售 额、收入、财产和其他公共财政事业的混合税 收,所以不同州的一般销售税是不同的。其中 关于公共财政的选择受到政治考量的驱使而不 是受香烟需求有关的因素影响。
工具变量(IV):估计与检验_图文_图文.ppt
• 由来
• 估计
– 矩估计(不好)
– 2SLS (最常用) – GMM(异方差自相关);LIML(若IV)
• 工具变量有效imum eigenvalue statistic,最小特征值统计量,用于多内 生解释变量
• 相关性条件:
• 1. 当包含一个内生变量但有多个工具变量时,工具 变量相关性的条件为给定W时至少有一个Z对预测X 是有用的(相关的)。
• 2. 当包含多个内生变量时,不但要排除完全多重共 线性问题,而且工具变量必须提供关于这些变量外生 性变动的足够信息,以分离出它们各自对Y的效应。

第15章-工具变量讲解

第15章-工具变量讲解

这样一来 , 我们便把 abil 放人误差项中,而 只留下简单回归模型: Log(wage) =β 0+β 1educ+u (15.1 ) 其中,u 包含 abil。当然,如果用 OLS 估计 方程 (15.1) ,若 educ 与 abil 相关,则得到 的结果将是 1 的有偏而又不一致估计量。
第15章 工具变量估计与两阶段最小二乘法
在本章中,我们进一步研究多元回归模型中的 内生解释变量 (endogenous explanatory Variables) 问题。在第 3 章中,我们推导出遗漏一个重要变 量时 OLS 估计量的偏误,在第 5 章中,我们说明 了在遗漏变量(omitted variables)的情况下,OLS 通 常是不一致的。
举例来说,考虑成年劳动者的工资方程中存 在无法观测之能力因素的问题。一个简单的 模型为: log(wage)=β 0+β 1educ+β 2abil+e 其中,e 是误差项。
在第 9 章中,我们证明了在某些假定下,如 何用诸如 IQ 的代理变量代替能力,从而通过 以下回归可得到一致估计量 log(wage)对 educ,IQ 回归 然而假定不能得到适当的代理变量(或它不 具备足以获取 1 一致估计量所需的性质)。
我们一开始先说明,在存在遗漏变量的情况 下,如何用 IV 法获得一致估计量。此外, IV 至少能在某些假定下用于解决变量误差 (errors-in-variables)问题。下一章将证明运 用 IV 法如何估计联立方程模型。
我们对工具变量估计的论述严格遵照我们在 第 1 篇中对普通最小二乘的推导,其中假定 我们有一个来自潜在总体的随机样本。这个 起点很合人意,因为除了简化符号之外,它 还强调用潜在总体来表述对 IV 估计所做的重 要假定 (正如用 OLS 时一样)。

内生性与工具变量估计方法

内生性与工具变量估计方法

内生性与工具变量估计方法一 一元模型的IV 估计采用MROZ 数据,进行练习。

估计教育对工资收入的回报:01log()wage educ ββμ=++为了便于比较首先得到OLS 估计结果,在命令窗口输入smpl 1 428equation eq01.ls log(wage) c educ教育的系数估计值表明,每多接受一年教育可得到月11%的回报。

接下来,我们用父亲的受教育程度(fatheduc )作为educ 的工具变量。

我们必须认为fatheduc 与u 不相关;第二个要求是educ 与fatheduc 相关。

为了验证第二点,作一个educ 对fatheduc 的回归。

equation eq02.ls educ c fatheduc可以看出,educ 与fatheduc 之间存在统计显著的正相关。

采用fatheduc 作为educ 的工具变量,进行工具变量回归。

equation eq03.tsls log(wage) c educ @ fatheducIV 估计量的标准误是OLS 标准误的2.5倍,这在我们的意料之中。

二 多元模型的IV 估计 采用card 数据,进行练习。

估计教育对工资收入的回报:012log()var wage educ Control iables βββμ=+++为了便于对照,先做OLS 回归 Smpl 1 3010Equation eq01.ls log(wage) c educ exper expersq black smsa south smsa66 reg662 reg663 reg664 reg665 reg666 reg667 reg668 reg669在这个例子中,受教育程度的工具变量是标志着一个人是否在一所四年制大学附近成长的虚拟变量(nearc4)。

为了验证受教育程度与该虚拟变量的偏相关性,先做educ对nearc4以及其他所有外生变量的回归:Equation eq02.ls educ c nearc4 exper expersq black smsa south smsa66 reg662 reg663 reg664 reg665 reg666 reg667 reg668 reg669Nearc4的系数估计值意味着,在其他因素固定的情况下,曾住在大学附近的人所受的教育比不在大学附近长大的人平均多出约1/3年。

工具变量法~

工具变量法~

工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。

在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。

经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (1.1); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)(1.2);部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) (1.3)。

t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。

在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。

那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -?在这里,一个可行的估计方法就是工具变量法。

在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。

一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。

内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y -。

外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。

实证研究中常见的5种工具变量(好用)

实证研究中常见的5种工具变量(好用)

实证研究中常见的5种工具变量(好用)/ 工具变量(instrumental variable)是社会科学定量分析中解决内生性问题的重要手段,是基于调查数据进行因果推断的前沿方法。

本文在简要介绍工具变量的定义、原理及估算方法的基础上,对实证分析中较为常见的五类工具变量进行回顾梳理,为今后研究寻找工具变量提供了参考。

同时,对工具变量估计量的权重性特征进行了阐述,并结合实例展示了使用工具变量进行因果推断的基本步骤和要点。

最后,就工具变量方法的潜力和局限性进行了剖析。

因果推断的圣杯在反事实因果的框架之下,基于调查数据的社会学定量分析要进行因果推断,难度极大。

其主要原因在于,社会学家一旦要证明某个他们所感兴趣的“因”会带来一定的“果”,就必须面对一个永恒挑战:“内生性”问题( endogeneity) 。

也即: 如果某个潜在的、无法观测的干扰项,既影响“因”,又影响“果”,那么,利用最小二乘法模型( 简称OLS模型) 进行回归分析所得到的估计量就会是有偏误的,而不具有因果推断力。

在实证分析中,无论是经典的教育回报研究( Card,1999),还是我国学界非常关注的关系网、社会资本研究( Mouw, 2003, 2006; 陈云松、范晓光,2010,2011) ,内生性问题都极为重要且亟待解决。

解决内生性问题的常见方法,主要包括工具变量( instrumental variable,简称IV) 、固定效应模型( fixed effects model,简称FE) 、倾向值匹配( propensity score matching,简称PSM) 、实验以及准实验( experimentsand quasi-experiments) 等等。

近年来,其中不少方法已经逐步在我国社会学界得到评述和应用( 梁玉成, 2010; 陈云松、范晓光, 2010, 2011; 陈云松, 2012; 胡安宁,2012; 魏万青,2012) 。

第15章-工具变量

第15章-工具变量

假定我们有一个可观测到的变量 z,它满足 两个假定 : (1)z 与 u 不相关,即 Cov(z,u)=0 (2) z 与 x 相关,即 Cov(z,x)≠0 (15.4) (15.5)
我们则称 z 是 x 的工具变量 (instrumental variable),有时也简称 x 的工具(instrument) 。
因而我们就能够在充分小的显著水平 (比如 5 %或 1%)上,相对双侧对立假设 H1:π 1≠0 而拒绝虚拟假设
H0 : 0 0
(15.7)
如果真是这样,我们能相当有把握地肯定式 (15.5)是成立的。
对于式 (15.1)中的 log(wage)方程,educ 的 工具变量 z 必须: (1)与能力(以及其他影响工资的无法观测因 素)不相关; (2)与教育相关。
最终,假如我们能为 educ 找到一个工具变 量,我们仍可以根据方程 (15. 1)来进行估 计,为描述该方法,将简单回归模型写成: y=β 0+β 1x+u (15.2)
其中我们认为 x 与 u 相关: Cov(x,u)≠0 (15.3)
无论 x 与 u 是否相关,工具变量法都行得通, 但出于后面将会看到的原因, 若 x 与 u 不相 关,我们还是应该使用 OLS。 为了在 x 与 u 相关时得到 0 和 1 的一致估 计量,我们还需要一些额外信息。这些信息 由一个满足某些性质的新变量给出。
即使能获得,如果我们的兴趣在于变量的影响, 而该变量又不随时间而变化,它对于我们也几 无用处:一阶差分或固定效应估计排除了不随 时间而变化的变量。 此外,迄今为止我们所研 究的面板数据方法,还不能解决与解释变量相 关的时变(即随着时间而不断变化的)遗漏变 量问题。
在本章,我们对内生性问题采用了一种不同的 方法。你将看到如何用工具变量法 (IV)来解决 一个或多个解释变量的内生性问题。就应用计 量经济学中线性方程的估计而言,两阶段最小 二乘法 (2SLS 或 TSLS)的受欢迎程度仅次于普 通最小二乘。

工具变量法

工具变量法
下面来推导 IV 估计量。
Z 'y Z ' X Z ' ε Z ' X plim = plim β + plim = plim β n n n n
= ε − X (Z ' X) Z 'ε
−1
s2 =
e 'e n
−1 −1 −1
ε 'ε ε ' Z X ' Z X ' X Z ' X Z 'ε ε ' X Z ' X Z 'ε = + − 2 n n n n n n n n n
这里假定 Z 和 X 的变量数相同,因此 Z ' X 是方阵,由于假定其秩为 K,所以 Z ' X 也是满 秩的,则
Z ' X Z 'y plim n plim n = β
因此推出 IV 估计量为
-1
b IV = ( Z ' X ) Z ' y
ቤተ መጻሕፍቲ ባይዱ
∑e = ∑( y − b e )
2 i i 1 b2 xi
2
3. Hausman’s Specification Test 这实际上就是基于 OLS 和 IV 来检验解释变量的严格外生性假定。 零假设:解释变量与干扰项不相关。或
H 0 : plim (1/ n ) X ' ε = 0 。
通 过 (1/ n ) X ' e 考 察 X 和 ε 的 协 方 差 是 没 有 结 果 的 , 因 为 正 规 方 程 组 总 是 生 成

两阶段最小二乘法TSLS案例分析

两阶段最小二乘法TSLS案例分析

两阶段最小二乘回归Contents1背景 (3)2理论 (4)3操作 (4)4 SPSSAU输出结果 (5)5文字分析 (6)6剖析 (9)TSLS是用于解决内生性问题的一种方法,除TSLS外还可使用GMM估计。

内生变量是指与误差项相关的解释变量。

对应还有一个术语叫‘外生变量’,其指与误差项不相关的解释变量。

产生内生性的原因通常在三类,分别说明如下:内生性问题的判断上,通常是使用Durbin-Wu-Hausman检验(SPSSAU在两阶段最小二乘回归结果中默认输出),当然很多时候会结合自身理论知识和直观专业性判断是否存在内生性问题。

如果假定存在内生性问题时,直接使用两阶段最小二乘回归或者GMM估计即可。

一般不建议完全依照检验进行判断是否存在内生性,结合检验和专业理论知识综合判断较为可取。

内生性问题的解决上,通常使用工具变量法,其基本思想在于选取这样一类变量(工具变量),它们的特征为:工具变量与内生变量有着相关(如果相关性很低则称为弱工具变量),但是工具变量与被解释变量基本没有相关关系。

寻找适合的工具变量是一件困难的事情,解决内生性问题时,大量的工作用于寻找适合的工具变量。

关于引入工具变量的个数上,有如下说明:过度识别和恰好识别是可以接受的,但不可识别这种情况无法进行建模,似想用一个工具变量去标识两个内生变量,这是不可以的。

另需要提示,如果是恰好识别状态下是无法进行Durbin-Wu-Hausman检验。

工具变量引入时,有时还需要对工具变量外生性进行检验(过度识别检验),针对工具变量外生性检验上,SPSSAU默认提供Sargan检验和Basmann检验。

特别提示,只有过度识别时才会输出此两个检验指标。

关于两阶段最小二乘法的原理上,其将估计分成两个步骤(阶段)回归。

如下表格说明:第一阶段回归结果为中间过程值,SPSSAU默认没有输出;第二阶段回归结果为最终结果值。

特别提示:●内生性问题涉及以下几点,分别是内生变量判断(Durbin-Wu-Hausman检验和理论判断),内生性问题的解决(两阶段最小二乘回归TSLS或GMM),工具变量引入后过度识别检验(Sargan检验和Basmann检验)等。

工具变量法代码

工具变量法代码

工具变量法代码工具变量法(Instrumental Variables,简称IV)是一种常用的估计因果效应的方法。

它主要针对的是存在内生性问题的经济学模型,如回归分析中的自变量与误差项存在相关关系。

下文将介绍工具变量法的基本原理,以及其在实践中的使用方法和代码实现。

一、基本原理工具变量法的基本思想是利用一个或多个与内生性自变量相关但不受误差项影响的外生性变量(即工具变量)来代替内生性自变量,在保证模型符合经济学意义的前提下,得到更精确的因果效应估计。

具体来说,对于回归模型:y = α + βx + u其中,x为内生性自变量,u为误差项,我们考虑引入一个外生变量z作为工具变量,那么可以构建如下两个求解方程:x = δ + ρz + vy = α + β(δ + ρz + v) + u其中,δ和ρ是未知的系数。

第一个方程是用工具变量估计内生性自变量的回归式,第二个方程则是运用估计出的内生性自变量对y进行回归。

对于外生性工具变量z,我们可以假定它只会通过自变量x对y产生影响,而不会通过误差项u对y产生影响,即:Cov(z,u) = 0而通过IV估计,我们可以得到内生性自变量x在z上的部分效应(partial effect),从而得出因果效应的估计。

二、实践应用在实践中,工具变量法常常被用来研究各种经济学问题。

例如,研究教育水平对收入的影响、研究医疗保险对医疗消费的影响等。

下面以一个简单的例子来说明如何使用工具变量法。

假设我们想研究家庭收入对孩子的大学入学率的影响,但是我们发现家庭收入存在内生性问题,因为它与其他一些难以观测的因素(如家庭背景、社会阶层等)存在相关关系。

我们考虑使用父母的教育水平和收入作为工具变量,来估计家庭收入与大学入学率之间的因果关系。

代码实现在工具变量法的实现中,常常需要用到Python中的statsmodels(回归模型和统计测试)和pandas(数据处理)两个库。

我们假设有如下数据集:- family_income:家庭收入(千元) - education:父母教育水平(0-未受过教育,1-小学,2-初中,3-高中,4-大学) - college:是否考入本科(0-否,1-是)- random_var:随机变量,用于混淆我们首先看一下家庭收入与大学入学率是否存在内生性问题,可以通过构建回归模型来检验:import statsmodels.api as sm import pandas as pddf = pd.read_csv('data.csv')x = df[['family_income']] y = df[['college']] x = sm.add_constant(x) results = sm.OLS(y, x).fit() print(results.summary())运行上述代码后,我们可以得到回归模型的结果,其中P值可以判断内生性是否显著。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章工具变量估计与两阶段最小二乘法【圣

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章工具变量估计与两阶段最小二乘法【圣

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章工具变量估计与两阶段最小二乘法【圣第15章工具变量估计与两阶段最小二乘法15.1复习笔记一、动机:简单回归模型中的遗漏变量1.面对可能发生的遗漏变量偏误(或无法观测异质性)的四种选择(1)忽略遗漏变量问题,承受有偏而又不一致估计量,若能把估计值与关键参数的偏误方向一同给出,则该方法便令人满意。

(2)试图为无法观测变量寻找并使用一个适宜的代理变量,该方法试图通过用代理变量取代无法观测变量来解决遗漏变量的问题,但并不是总可以找到一个好的代理。

(3)假定遗漏变量不随时间变化,运用固定效应或一阶差分方法。

(4)将无法观测变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法,工具变量法。

2.工具变量法简单回归模型01y x uββ=++其中x 与u 相关:()Cov 0,x u ≠(1)为了在x 和u 相关时得到0β和1β的一致估计量,需要有一个可观测到的变量z,z 满足两个假定:①z 与u 不相关,即Cov(z,u)=0;②z 与x 相关,即Cov(z,x)≠0。

满足这两个条件,则z 称为x 的工具变量,简称为x 的工具。

z 满足①式称为工具外生性条件,工具外生性意味着,z 应当对y 无偏效应(一旦x 和u 中的遗漏变量被控制),也不应当与其他影响y 的无法观测因素相关。

z 满足②式意味着z 必然与内生解释变量x 有着或正或负的关系。

这个条件被称为工具相关性。

(2)工具变量的两个要求之间的差别①Cov(z,u)是z 与无法观测误差u 的协方差,通常无法对它进行检验:在绝大多数情形中,必须借助于经济行为或反思来维持这一假定。

②给定一个来自总体的随机样本,z 与x(在总体中)相关的条件则可加以检验。

最容易的方法是估计一个x 与z 之间的简单回归。

在总体中,有01x z vππ=++从而,由于()()1Cov /ar V ,x z z π=所以式Cov(z,x)≠0中的假定当且仅当10π≠时成立。

工具变量法工具变量法具体步骤

工具变量法工具变量法具体步骤

工具变量法工具变量法具体步骤工具变量法目录概念某一个变量与模型随机解释变量高度相关,但却不与为丛藓科扭口藓项相关,那么就可以用此变量与模型中相应回归系数的一个一致估计量,这个变量就称为方法变量,这种估计方法就叫工具基本原理变量法。

缺点工具变量法的关键是选择一个有效的优先选择工具变量,由于工具自变量变量可以选择中的困难,工具变量法本身存在两方面不足:一是由于工具变量不是惟一的,因而工具变量估计量有一定的任意性;其二由于误差项实际上是不可观测的,因而要寻找严格意义上与误差项无关的与所替代而随机解释变量高度相关的变量总的来说事实上是困难的。

工具变量法与内生解释变量可持续性解释变量会造成解读严重的后果:不一致性inconstent 和有偏biased ,因为频域不满足误差以解释线性为条件的期望值为0。

产生解释变量招盛纯一般有三个原因:一、遗漏变量二、测量误差三、联立性第三种情况是无法逐步解决的,前两种可以采用工具变量(IV )法。

IV 会带来的唯一坏处是估计方差的增大,也就是说同时采用OLS 和IV 估计,则前者的方差小于后者。

但IV 的应用是有前提条件的:1.IV 与内生解释函数相关,2.IV 与u 不相关。

在小样本情况下,一般用内生解释变量对IV 进行回归,如果R -sq 值很小的话,一般t值也很小,所以对IV 质量的评价没有大的风险问题,但是当采用大样本时,情况则相反,往往是t 值很大,而R -sq 很小,这时如果采用t 值进行关键问题评价则可能出现出现问题。

这时IV 与内生解释变量之间的若干程度不是阐释太大,但是如果与u 之间有轻微的相关机构的话,则:1、导致很小的不一致性;2、有偏性,并且这种有偏性随着R -sq趋于0而趋于OLS 的有偏性。

所以现在在采用IV 时最好采用R -sq 或F -sta 作为评价标准,另外为了观测IV 与u 的关系,可以将IV 作为解释变量放入方程进行回归,如果没有其他的系数没有多的变化,则说明IV 满足第二个条件。

工具变量法 GMM估计

工具变量法  GMM估计

工具变量法 GMM估计1 OverviewModel过程可以分析线性、非线性(对参数或者对变量)的单方程和方程组。

使用的估计方法有:OLS, 2SLS, SUR, ITSUR, 3SLS, IT3SLS,GMM ,FIML。

MODEL过程分析的模型如下:这里,Y是内生变量,X是外生变量,TEHTA是参数。

观测到的变量要么是内生变量,要么是外生变量。

上面的方程组可以简写为:这个形式称为一般形式。

还可以写成标准形式:标准形式把内生变量放在方程的一边。

两种形式的方程(组)都可以使用MODEL过程估计。

经常用当前外生变量、滞后的外生变量、滞后的内生变量来解释当前内生变量。

这就构成了一个动态模型。

滞后变量不论内生还是外生都看作外生变量。

以上并不要求扰动项独立同分布。

自相关、异方差甚至不同的分布都有可能。

对于异方差可以使用加权估计,GARCH模型也可以修正异方差。

如果难以确定异方差的来源和形式,难以确定权重变量的话,可以使用GMM方法得到比OLS方法更加有效的估计。

方程组一个常见的问题就是联立偏倚。

考虑:这个方程组对参数是非线性的,不能使用线性回归估计。

同时这里Y1和Y2是同时决定的,普通非线性最小二乘方法的结果也是有偏和非一致的。

这称为联立性偏倚。

在线性模型中,处理联立性偏倚的可以把出现在方程右边的内生变量换成其预测值。

预测值与扰动项无关从而消除了联立性偏倚。

预测值是通过工具变量法估计得到的,这称为第一步回归。

利用预测值进行第二次回归称为两段最小二乘。

在非线性模型中,使用线性近似,把非线性方程组线性化后使用工具变量法,反复迭代。

在方程组中,方程之间的扰动项可能相关。

对于大样本情况,可以使用系统方法考虑到方程内和方程之间关系得到更有效的估计。

如果不存在联立性问题,即不存在内生变量作为解释变量的话,可以使用SUR估计。

SUR方法需要估计方程之间扰动项的协方差矩阵∑。

估计步骤为先使用OLS估计方程组,从残差得到∧∑,然后使用SUR。

工具变量法的系数

工具变量法的系数

工具变量法(Instrumental Variables Method)是一种用于解决因果关系分析中的内生性问题(Endogeneity Problem)的方法。

在工具变量法中,我们使用一个或多个与内生解释变量相关,但与误差项无关的工具变量来估计因果效应。

关于工具变量法的系数,这里以二阶段最小二乘法(Two-Stage Least Squares)为例进行说明。

在二阶段最小二乘法中,我们首先使用工具变量和内生解释变量来预测内生解释变量的值,然后使用这个预测值和工具变量以及其他外生解释变量来进行回归分析,以估计因果效应。

假设我们的模型是:Y = β0 + β1*X + ε。

其中,X是内生解释变量,Y是因变量,ε是误差项。

我们选择了一个工具变量Z,它与X相关,但与误差项无关。

首先,我们使用Z和其他外生解释变量来预测X的值,得到预测值X_hat。

然后,我们在第二阶段进行回归分析,使用Y对X_hat和其他外生解释变量进行回归。

这个回归的系数就是我们想要估计的因果效应。

需要注意的是,工具变量必须满足与内生解释变量相关,但与误差项无关的条件。

否则,工具变量法将无法准确估计因果效应。

同时,
工具变量的选择也需要有一定的理论依据和实际背景的支持。

eviews教程时间序列回归

eviews教程时间序列回归

eviews教程时间序列回归
17
§15.3.5 含有AR项模型的估计输出
当估计某个含有AR项的模型时,在解释结果时一定要小心。在用通常的方 法解释估计系数,系数标准误差和t-统计量时,涉及残差的结果会不同于OLS的 估计结果。
要理解这些差别,记住一个含有AR项的模型有两种残差: 第一种是无条件残差
对于含有AR项的模型,基于残差的回归统计量,如R2 (回归标准误差)和 D-W值都是以一期向前预测误差为基础的。含有AR项的模型独有的统计量是
估计的AR系数ˆ i。对于简单AR(1)模型,ˆ 是无条件残差的序列相关系数。
对于平稳AR(1)模型, 在-1(极端负序列相关)和+1(极端正序列相关)之
间。一般AR(p)平稳条件是:滞后算子多项式的根的倒数在单位圆内。
平稳性定义: 如果随机过程 Yt {, y1, y0 , y1, y2 ,, yT , yT1,} 的均值和方 差、自协方差都不取决于 t,则称 Y t 是协方差平稳的或弱平稳的:
E(Yt )
对所有的 t
Var(Yt ) 2
对所有的 t
eviews教程时间序列回归
7
§15.2.2 相关图和Q-统计量
在方程工具栏选择View/Residual Tests/correlogram-Q-statistics 。 EViews将显示残差的自相关和偏自相关函数以及对应于高阶序列相关的 Ljung-Box Q统计量。如果残差不存在序列相关,在各阶滞后的自相关和 偏自相关值都接近于零。所有的Q-统计量不显著,并且有大的P值。
k 阶滞后的Q-统计量是原假设为序列没有k 阶自相关的统计量。计算
式如下
QLB
T
T 2
k rj2 j1 T

stata学习笔记

stata学习笔记

经济数据的特点与类型。

1、横截面数据:多个经济个体的变量在同一时间点上的取值,如2012年中国各省的GDP2、时间数列数据:指的是某个经济个体的变量在不同时点上的取值,如1978-2012年山东省每年的GDP3、面板数据:多个经济个体的变量在不同时点上的取值,如1978-2012年中国各省的GDP 小样本OLS(最小二乘法):单一方程线性回归最常见方法条件:解释变量与扰动项正交、扰动项无自相关、同方差。

拟合优度:衡量线性回归模型对样本数据的拟合程度(R2),越高说明模型拟合程度越好。

单系数T检验:对回归方程扰动项的具体概率进行假设显著性水平进行检验F检验:整个回归方程是否显著STATA操作简介:如果数据中包含1949-10-01或1949/10/01的时间变量,导入stata后可能会被视为字符串,因此对于日度数据,可以使用命令gen newvar=date(varname,YMD),将其转换为整数日期变量,其中YMD说明原始数据的格式为年月日,如果原始数据的格式为月日年则使用MDY;对于月度数据则gen newvar=monthly(varname,YM)。

.describe:数据的概貌.drop keep:删除和保留.su:统计特征Pwcorr:变量之间相关系数Star(.05):5%显著性水平gen:产生g intc=log(tc):取自然对数. reg:OLS回归.Vce:协方差矩阵reg。

,noc表示在进行回归时不要常数项大样本OLS:只要求解释变量与同期的扰动项正交即可Robust:稳健标准误,如果存在异方差,则应使用稳健标准误最大似然估计法:如果回归方程存在非线性,则使用最大似然估计法(MLE )或非线性最小二乘法(NLS )三类在大样本下渐进等价的统计检验:Wald test LR (似然比检验) LM操作步骤如下:sysuse auto (调用数据集)Hist mpg ,normal (画变量mpg 的直方图,并与正态密度比较)直方图显示,变量mpg 的分布于正态分布有一定差距。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

y=b0+b1x+u 正确方程估计: ^ ˆ 2 ˆ AVar(b1 ) 2
SSTx Rx, z
n
ˆ
2

n
i 1
ˆ ˆ ( yi b0 b1, IV x1 ) n2

TSLS中第二阶段的方差估计:
ˆ
2

i 1
ˆ ˆ ˆ ( yi b0 b1, IV x1 ) n2

可以根据第一种度量写出模型 用test2作为test1的工具变量估计 同样可以用test2作为能力度量构建模型,用test1 作为工具变量进行估计。 两种方式g(wage)=b0+b1educ+b2exper+b3exper2+(b4/g1) test1+(u-e1/g1)
ŷ2相当于把y2中与z1不相关的部分e已经剔除了。 TSLS估计量的方差通常较大!【爱】核心用户 By微0渺 上传
多个内生变量(阶条件和秩条件)

y1=b0+b1y2+b2y3+b3z1+b4z2+b5z3+u 阶条件:


除z1, z2和z3外,至少还应存在两个外生变量,分别 作为内生解释变量y2和y3的工具变量。 被排斥的外生变量至少与结构方程中包含的内生解 释变量一样多。【爱】核心用户 By微0渺 上传
多重共线性与TSLS

TSLS中共线性问题更加严重:
结构方程: y1=b0+b1y2+b2z1+u TSLS中第二阶段的方程: y1=b0+b1ŷ2+b2z1+v ŷ2和z1的相关程度一定大于y2和z1的相关程度

ˆ ˆ ˆ ˆ y2 0 1z1 2 z2 e y2 e
n ˆ ˆ ˆ ( y1i b 0 b1 y2i b 2 z1i ) 0 i 1 n ˆ ˆ ˆ z1i ( y1i b 0 b1 y2i b 2 z1i ) 0 i 1 n ˆ ˆ ˆ ˆ y2i ( y1i b 0 b1 y2i b 2 z1i ) 0 i 1

第一阶段回归为:
ˆ ˆ ˆ ˆ ˆ y2 0 1z1 2 z2 3 z3
工具变量的相关性检验: H0: 2=3=0 第二阶段,用ŷ2代替内生变量y2【爱】核心用户 By微0渺 上传
多重工具变量时的IV估计

矩条件:

E(u)=0;E(z1u)=0;E(z2u)=0; E(z3u)=0 四个方程,三个未知参数 ŷ2是z1, z2和z3的线性组合: E(ŷ2 u)=0
ˆ ˆ ˆ ˆ y2 0 1z1 2 z2 e y2 e【爱】核心用户 By微0渺 上传
多重工具变量



对于一个内生解释变量,有不止一个外生变量 可作为工具变量 结构方程: y1=b0+b1y2+b2z1+u y2的工具变量有两个:z2和z3 TSLS方法:

秩条件(工具变量的相关性)【爱】核心用户 By微0渺 上传测量误差问题的IV解决办法

考虑模型:

y=b0+b1x1*+b2x2+u 假定:Cov(x1*, u) = 0; Cov(x2, u) = 0 x1*不可观测,一种可观测度量为x1 :
x1 = x1*+e1

测量误差问题: y=b0+b1x1+b2x2+(u-b1e1)


内生性检验与过度识别约束检验

内生性检验



考虑模型: y1=b0+b1y2+b2z1+b2z2+u 检验y2的内生性,外生变量z1, z2, z3, z4 基本思想:

Biblioteka 若y2内生,OLS估计量不一致,TSLS估计量一致 若y2外生,OLS估计量和TSLS估计量都一致 比较OLS估计值和TSLS估计值的差异:

TSLS的理论解释


用 ŷ2代替内生变量y2意味着: y1=b0+b1(ŷ2+e)+b2z1+u =b0+b1ŷ2+b2z1+(b1e+u) 第二阶段回归得到b0和b1一致估计量的条件:

Cov(z1, b1e+u) = 0 Cov(ŷ2, b1e+u) = 0

为什么满足?


外生变量:Cov(z1, u) = 0; Cov(z2, u) =0 第一阶段回归: Cov(z1, e) = 0; Cov(z2, e) =0

若差异小,两者都具有一致性,外生 若差异大,内生【爱】核心用户 By微0渺 上传
用 ŷ2作为y2的工具变量


IV估计量与TSLS估计量等同【爱】核心用户 By微0渺 上传
应用中的注意事项:



对于估计值,利用Eviews的TSLS选项和分别作两阶 段OLS回归等同; 对于标准差,应该使用TSLS选项,若分别作两阶段 的OLS回归,第二阶段的标准差不准确。 以简单回归为例:

两个例子:


调查工人收入时,雇主可以提供第二种度量 调查家庭收入时,夫妻双方可以给出两种度量【爱】核心用户 By微0渺 上传
关于个人能力的处理:
log(wage)=b0+b1educ+b2exper+b3exper2+b4abil+u 若有两种测试指标作为能力的度量:

test1=g1abil+e1 test2=d1abil+e2

Cov(x1, u-b1e1) 0 OLS估计量是不一致的。【爱】核心用户 By微0渺 上传
y=b0+b1x1+b2x2+(u-b1e1) 若存在x1*的另一种可观测度量z1

z1 = x1*+a1 z1 可以作为x1的工具变量:

Cov(z1, x1) = Cov(x1*+a1, x1*+e1) 0 Cov(z1, u-b1e1) = Cov(x1*+a1, u-b1e1) = 0
相关文档
最新文档