第三章-工具变量估计
工具变量法及其应用
工具变量法及其应用一、工具变量法简介工具变量法是一种在统计分析中常用的技术,主要用于解决回归分析中的内生性问题。
内生性问题通常出现在一个或多个解释变量与误差项相关的情况下,这会导致回归模型的估计结果有偏且不一致。
为了解决这个问题,工具变量法通过引入一个或多个与内生解释变量相关,但与误差项无关的工具变量,来替代内生解释变量。
二、工具变量的选择工具变量的选择是工具变量法的关键步骤。
理想的工具变量应满足与内生解释变量相关,但与误差项无关的条件。
在实践中,通常需要根据研究问题的具体情况和理论依据来选择工具变量。
一些常见的选择方法包括使用先前的研究、使用相关行业的平均值、使用其他相关变量的滞后值等。
三、工具变量法的优缺点工具变量法的优点主要包括:可以解决内生性问题,提高回归模型的估计精度和一致性;可以扩大解释变量的范围,使得模型更全面地反映被解释变量的影响因素;可以降低误差项的相关性,从而降低模型的标准误,提高模型的置信度。
但是,工具变量法也存在一些缺点,如工具变量的选择困难、可能导致过度拟合和模型过度设定等问题。
四、工具变量法在经济学中的应用工具变量法在经济学中有着广泛的应用。
例如,在研究货币政策时,工具变量法可以用来解决货币供应量与通货膨胀之间的内生性问题,从而提高模型的预测精度;在研究劳动市场时,工具变量法可以用来解决工资与就业之间的内生性问题,从而更准确地估计模型的参数。
五、工具变量法在金融学中的应用工具变量法在金融学中也有着广泛的应用。
例如,在研究股票市场时,工具变量法可以用来解决市场收益率与风险之间的内生性问题,从而提高模型的预测能力和风险管理水平;在研究信贷市场时,工具变量法可以用来解决利率与信贷风险之间的内生性问题,从而更准确地估计模型的参数。
六、工具变量法在其他领域的应用工具变量法在其他领域也有着广泛的应用。
例如,在环境科学中,工具变量法可以用来解决环境污染与经济增长之间的内生性问题,从而更准确地估计模型的参数;在医学研究中,工具变量法可以用来解决吸烟与健康之间的内生性问题,从而更准确地估计模型的参数。
计量经济学-工具变量
利用E(zii)=0,在大样本下可得到:
~1
zi yi zi xi
关于0 的估计,仍用~0 Y ~1X 完成。
这种求模型参数估计量的方法称为工具变 量法(instrumental variable method),相应的估 计 量 称 为 工 具 变 量 法 估 计 量 ( instrumental variable (IV) estimator)。
CONSP 0 1GDPP 由于:居民人均消费支出(CONSP)与人 均国内生产总值(GDPP)相互影响,因此,
容易判断GDPP与同期相关(往往是 正相关),OLS估计量有偏并且是非一致的
(低估截距项而高估计斜率项 )。
OLS估计结果:
(13.51) (53.47) R2=0.9927 F=2859.23 DW=0.5503 SSR=23240.7
用OLS估计模型,相当于用xi去乘模型两边、对i求 和、再略去xii项后得到正规方程:
xi yi 1 xi2
解得:
ˆ1
xi yi xi2
(*)
由于Cov(Xi,i)=E(Xii)=0,意味着大样本下: (xii)/n0
表明大样本下:
ˆ1
xi yi xi2
2. 工具变量并没有替代模型中的解释变量, 只是在估计过程中作为“工具”被使用。
上述工具变量法估计过程可等价地分解成下 面的两步OLS回归:
第一步,用OLS法进行X关于工具变量Z的回归:
Xˆ i ˆ0 ˆ1Zi
Yˆi ~0 ~1 Xˆ i
容易验证仍有:
~1
zi yi zi xi
如果用GDPPt-1为工具变量,可得如下工具 变量法估计结果:
工具变量(IV):估计与检验
用到 i E zi x 为对称矩阵
-1
秩条件r i E zi x =k意味着工具变量w i与内生解释 变量x i相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量 根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数 2 恰好识别:工具变量个数等于内生解释变量个数 3 过度识别:工具变量个数多于内生解释变量个数
解释变量内生性检验
Hausman 检验
寻找工具变量的方法:几个实例
方法 例子
由来
经典假设 所有的解释变量Xi与随机误差项彼此 之间不相关。
Cov (u i , X i ) 0
若解释变量Xi和ui相关,则OLS估计量是非一致 的,也就是即使当样本容量很大时,OLS估计量 也不会接近回归系数的真值。 造成误差项与回归变量相关(内生性)的原因 很多,但我们主要考虑如下几个方面: • 遗漏变量变量 • 变量有测量误差 • 双向因果关系。
1、矩估计(Method of Moments,MM)
首先以一个例子来说明矩估计方法:假设随机变量 x N , 2 ,其中, 2为待估参数。因为有两 个待估参数,故需要使用以下两个总体矩条件: 一阶中心矩:E x =
2 2 二阶中心矩:E x =Var x + E x = + 2 2
可以引入工具变量w t 来解决内生变量问题。一个有 效的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关,即 Cov w t,p t 0,p t为内生解释变量 (2)外生性:工具变量与扰动项不相关,即 Cov w t, t =0
二、工具变量法作为一种矩估计
工具变量法工具变量法具体步骤
工具变量法工具变量法具体步骤工具变量法(Instrumental Variable Method)是一种用于处理内生性问题的统计方法,它通过引入一个“工具变量”来解决内生性问题。
工具变量是一个有着良好相关性但不会受到内生性干扰的变量,它可以用来代替内生变量,从而解决内生性的影响。
1.确定内生变量和工具变量:首先,需要确定研究中存在的内生变量和可能的工具变量。
内生变量是对所研究问题有影响的变量,而工具变量是与内生变量具有相关性但不会受到内生性干扰的变量。
内生性问题是由于内生变量的存在而导致的因果关系估计偏倚。
2.检验工具变量的相关性:接下来,需要检验所选取的工具变量与内生变量之间的相关性。
这可以通过计算相关系数或进行统计检验来实现。
如果工具变量与内生变量存在显著相关性,那么它可能是一个有效的工具变量。
3.确定工具变量的外生性:除了相关性外,工具变量还需要满足外生性的要求,即工具变量对因变量的影响是通过内生变量而不是其他方式引起的。
这可以通过进行实证分析来判断,例如通过回归模型来检验工具变量对因变量的影响是否通过内生变量进行中介。
如果工具变量的影响仅通过内生变量介导,则可以认为工具变量满足外生性的要求。
4.估计工具变量模型:一旦确定了有效的工具变量,可以使用工具变量法来估计因果关系。
工具变量法的核心思想是通过回归模型来解释内生变量对因变量的影响,并利用工具变量对内生变量进行替代。
通过将工具变量引入估计方程中,可以消除内生性的影响,从而得到无偏的因果关系估计。
5.进行统计推断:在估计了工具变量模型之后,可以进行统计推断来评估估计结果的显著性。
这可以通过计算标准误差、置信区间和假设检验等来实现。
统计推断可以帮助判断估计结果的可靠性,并验证因果关系的存在与否。
总结而言,工具变量法是一种用于解决内生性问题的统计方法。
它通过引入一个有效的工具变量来代替内生变量,消除内生性的干扰,从而得到无偏的因果关系估计。
工具变量法的具体步骤包括确定内生变量和工具变量、检验工具变量的相关性和外生性、估计工具变量模型,并进行统计推断。
工具变量法
工具变量法一、工具变量法得主要思想在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。
经过变换,新得模型中,随机扰动项得表达式为:考伊克模型: ( ,为衰减率) (1、1);适应性期望模型:(,为期望系数)(1、2);部分调整模型:( ,为调整系数) (1、3)。
为原无限分布滞后模型中得扰动项,为变换后得扰动项。
在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。
那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。
一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。
内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。
外生解释变量:回归模型中得解释变量与随机扰动项无关;内生解释变量:回归模型中得解释变量与随机扰动项无关;了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。
工具变量,顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量(即内生变量)。
工具变量估计算法
工具变量估计算法
工具变量估计算法是一种统计方法,用于处理回归分析中的内生性问题。
在回归分析中,如果解释变量与误差项相关,会导致估计结果有
偏误。
工具变量估计算法通过使用一个或多个与内生解释变量相关,
但与误差项无关的变量作为工具变量,来估计回归系数的一致性估计量。
工具变量的选择必须满足一定条件:
1. 与所替代的内生解释变量高度相关;
2. 与误差项不相关;
3. 与模型中其他解释变量不相关;
4. 在同一模型中引入多个工具变量时,这些工具变量之间不相关。
工具变量估计算法的步骤包括:
1. 对一阶段回归的残差进行 IID 检验,检验结果显示扰动项非 IID;
2. 进行不可识别检验,P 值(K-P LM)均为 0.000,拒绝不可识别的
原假设;
3. 进行弱工具变量检验,F 值(K-P Wald)分别为 547.812 及
386.131,远大于 16.38 的临界值,说明不存在弱工具变量问题;
4. 进行过度识别检验,Sargan 检验的 P 值为 0.3096,接受工具变
量与结构方程扰动项不相关的原假设;
5. 进行冗余检验,P 值均为 0.000,说明工具变量不冗余;
6. 进行内生性检验,P 值为 0.000,需要返回第四步,将 IV 估计改为 GMM 估计,Sargan 统计量改为 Hansen 统计量,再次检验显示Hansen-J 检验估计结果与前文一致。
通过以上步骤,可以使用工具变量估计算法对回归分析中的内生性问题进行处理,并获得一致性估计量。
工具变量法
工具变量法Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y 。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
工具变量法结果解读
工具变量法结果解读一、引言工具变量法是计量经济学中一种重要的估计方法,主要用于解决内生性问题。
通过引入工具变量,工具变量法能够有效地减少误差,提高估计的准确性和可靠性。
然而,对于初学者来说,如何正确解读工具变量法的结果可能是一个挑战。
本文将详细解读工具变量法的理论基础、工具变量的选择、结果解读以及结论,以期帮助读者更好地理解和应用工具变量法。
二、工具变量法的理论基础工具变量法源于经济理论,特别是当一个或多个解释变量与误差项相关时,就会产生内生性问题。
在这种情况下,普通最小二乘法(OLS)的估计结果是有偏的。
为了解决这个问题,我们引入一个或多个与内生解释变量相关,但与误差项无关的工具变量。
这些工具变量通过与内生解释变量的线性组合来“工具化”内生解释变量,从而在估计中起到减少误差和偏误的作用。
三、工具变量的选择选择合适的工具变量是工具变量法的关键步骤。
理想情况下,一个好的工具变量应该与内生解释变量高度相关,同时与误差项无关。
在实践中,我们通常选择那些与内生解释变量相关,同时又遵循随机扰动的因素作为工具变量。
此外,工具变量的数量应该足够多,以便能够充分地“工具化”内生解释变量。
四、结果解读在应用工具变量法后,我们得到了一组估计结果。
这些结果应该如何解读呢?首先,我们需要关注估计系数的符号。
如果估计系数的符号与预期相符,那么我们可以初步认为估计结果是可靠的。
其次,我们需要检验估计结果的显著性。
常用的方法是观察估计系数的p值。
如果p值较小(通常小于0.05),则表明估计结果是显著的。
最后,我们需要检验工具变量的有效性。
这可以通过观察工具变量的系数是否接近于1来初步判断。
如果工具变量的系数接近于1,并且显著,那么我们可以认为工具变量是有效的。
此外,我们还可以使用诸如弱工具检验、过度识别检验等统计方法来进一步检验工具变量的有效性。
五、结论本文对工具变量法的结果解读进行了详细阐述。
通过关注估计系数的符号、显著性以及工具变量的有效性等方面,我们可以更好地理解和应用工具变量法。
工具变量方法原理
工具变量方法原理工具变量方法(Instrumental Variable Method)是一种常用的实证研究方法,用于解决因果关系中的内生性问题。
当研究主变量与随机抽样原则(即不相关性假设)无关时,内生性问题会出现。
在这种情况下,使用传统的OLS(Ordinary Least Squares)回归模型估计将导致参数估计的无效性。
工具变量方法通过利用一个或多个工具变量,来解决内生性问题,并得到一致的估计结果。
工具变量是一个满足两个条件的变量:首先,工具变量与内生变量相关。
其次,工具变量与干扰项不相关。
这样,可以通过回归工具变量来消除内生性问题,从而得到因果关系的一致估计。
工具变量方法的基本思想是在原始模型中引入一个工具变量,在回归分析中用工具变量代替内生变量。
这样,内生变量与工具变量的回归关系就代替了内生变量与因变量的直接关系。
通过估计工具变量与因变量的关系,就可以得到一致的因果关系估计。
Y=α+βX+ε其中,Y是因变量,X是内生变量,α和β是参数,ε是误差项。
由于X与ε存在内生性问题,参数估计将变得无效。
为了解决内生性问题,引入一个工具变量Z。
使用工具变量方法得到的回归方程为:X=α+γZ+ε'其中,γ是工具变量与被解释变量的关系。
将工具变量引入原始模型,得到:Y=α+β(α+γZ+ε')+ε化简后可以得到:Y=α+βα+βγZ+βε'+ε由于内生性问题,βγ≠0,OLS估计将无效。
但是,由于工具变量与ε无相关性,βε'=0。
因此,使用工具变量方法可以得到一致的估计结果,即β的一致估计。
工具变量方法中的关键问题是选择合适的工具变量。
一个好的工具变量要满足两个条件:首先,与内生变量相关,以确保能够消除内生性问题;其次,与干扰项不相关,以确保工具变量不会引入新的内生性问题。
如果工具变量不满足这两个条件,工具变量方法仍然会产生一致的估计结果,但结果可能存在偏误。
要选择合适的工具变量,需要根据研究问题及具体情境进行判断。
证明工具变量估计法的渐进方程
一、概述工具变量估计法是一种在计量经济学中常用的方法,用于解决内生性问题。
内生性问题是指自变量与误差项之间存在相关性,这会导致普通最小二乘法(OLS)估计出现偏误,从而影响结果的准确性。
为了解决这一问题,研究者引入了工具变量估计法,其基本思想是利用外生的工具变量来代替内生的自变量,从而消除内生性。
二、工具变量估计法的基本模型1. 基本假设在介绍工具变量估计法的基本模型之前,我们首先来说明其基本假设。
工具变量估计法的基本假设包括两部分:(1)内生性假设:自变量与误差项之间存在相关性,即自变量不满足外生性假设。
(2)工具变量假设:工具变量与自变量相关,但与误差项不相关,即工具变量满足外生性假设。
2. 简单的工具变量模型工具变量估计法的基本模型可以表示为:Y = β1X + u (1)其中,Y 表示因变量,X 表示内生的自变量,β1 表示自变量 X 对因变量 Y 的影响。
由于 X 存在内生性问题,因此我们引入工具变量 Z 来代替 X,得到以下两个方程:X = γ1Z + v (2)Y = β2Z + e (3)其中,Z 表示外生的工具变量,γ1 和β2 分别表示 Z 对 X 和 Y 的影响,v 和 e 分别表示方程(2)和方程(3)的误差项。
根据方程(2)和方程(3),我们可以得到工具变量估计法的渐进方程。
三、工具变量估计法的渐进方程1. 渐进方程的基本形式工具变量估计法的渐进方程可以表示为:β2slim = [(∑zi*zi)^(-1) * (∑zi*yi)] / [(∑zi*zi)^(-1) * (∑zi*xi)] (4)其中,β2slim 表示工具变量估计法的渐进系数估计值,zi 表示工具变量,yi 和 xi 分别表示因变量和内生自变量的观测值。
2. 渐进方程的意义通过渐进方程(4)可以得到工具变量估计法的渐进系数估计值。
工具变量估计法的渐进方程引入了工具变量 Z,并利用 Z 来代替内生自变量 X,从而消除内生性问题。
工具变量法工具变量法具体步骤
工具变量法工具变量法具体步骤工具变量法目录概念某一个变量与模型随机解释变量高度相关,但却不与为丛藓科扭口藓项相关,那么就可以用此变量与模型中相应回归系数的一个一致估计量,这个变量就称为方法变量,这种估计方法就叫工具基本原理变量法。
缺点工具变量法的关键是选择一个有效的优先选择工具变量,由于工具自变量变量可以选择中的困难,工具变量法本身存在两方面不足:一是由于工具变量不是惟一的,因而工具变量估计量有一定的任意性;其二由于误差项实际上是不可观测的,因而要寻找严格意义上与误差项无关的与所替代而随机解释变量高度相关的变量总的来说事实上是困难的。
工具变量法与内生解释变量可持续性解释变量会造成解读严重的后果:不一致性inconstent 和有偏biased ,因为频域不满足误差以解释线性为条件的期望值为0。
产生解释变量招盛纯一般有三个原因:一、遗漏变量二、测量误差三、联立性第三种情况是无法逐步解决的,前两种可以采用工具变量(IV )法。
IV 会带来的唯一坏处是估计方差的增大,也就是说同时采用OLS 和IV 估计,则前者的方差小于后者。
但IV 的应用是有前提条件的:1.IV 与内生解释函数相关,2.IV 与u 不相关。
在小样本情况下,一般用内生解释变量对IV 进行回归,如果R -sq 值很小的话,一般t值也很小,所以对IV 质量的评价没有大的风险问题,但是当采用大样本时,情况则相反,往往是t 值很大,而R -sq 很小,这时如果采用t 值进行关键问题评价则可能出现出现问题。
这时IV 与内生解释变量之间的若干程度不是阐释太大,但是如果与u 之间有轻微的相关机构的话,则:1、导致很小的不一致性;2、有偏性,并且这种有偏性随着R -sq趋于0而趋于OLS 的有偏性。
所以现在在采用IV 时最好采用R -sq 或F -sta 作为评价标准,另外为了观测IV 与u 的关系,可以将IV 作为解释变量放入方程进行回归,如果没有其他的系数没有多的变化,则说明IV 满足第二个条件。
工具变量法
工具变量法一.为什么需要使用工具变量法?当模型存在内生解释变量问题,一般为以下三种情形:(1)遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。
否则,就会造成解释变量与残差项相关,从而引起内生性问题。
(2)解释变量与被解释变量相互影响(3)度量误差 (measurement error ):由于在关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。
Ex :i 01122Y i i k ik i X X X ββββμ=+++⋅⋅⋅++ 其中:X 2为内生解释变量 当22Cov(X ,)=E[X ]0i i i i μμ≠时,内生解释变量与随机干扰项同期相关。
此时会导致回归参数估计量是有偏的且不一致,需要用工具变量法进行回归。
二.如何使用工具变量? (一)判断是否需要用工具变量当存在内生性变量时,则需使用工具变量,所以需要对内生性变量进行检验。
在实践中,往往是通过经济学理论先说明是否存在内生性变量,最后再通过检验证明确实存在内生变量。
(1)豪斯曼检验(Hausman )原假设H 0:所有解释变量均为外生变量将内生解释变量关于工具变量与外生变量进行OLS 回归估计 记录残差序列(^^IV OLS ββ−),加入原模型后进行OLS 估计 结果:若差值依概率收敛于0,接受原假设;反之,拒绝。
(2)杜宾-吴-豪斯曼检验(DWH )注:存在异方差的情况下传统豪斯曼检验不适用。
回归模型:'1122y x x ββε=++ z=(x 1,z 2) 第一阶段回归:''21x x z v γδ=++ 检验扰动项v 与ε相关性模型:=v+ερξ 其中:ρ为ε对v 回归系数,ε与v 不相关则ρ=0. 对 ^'''1122y=x x v e ββρ+++ 回归 对原假设H 0:ρ=0. 进行t 检验。
4.工具变量估计
。
IV 估计的实践问题 • IV 估计量:一致性;比 OLS 估计量无效 • 弱工具变量的信号 偏 R2 很低 偏 F 统计量很低:<10 比较有问题;<5 很严重 • IV 估计量的非一致性
IV 的外生性通常依赖于主观判断,取决于研究者对理论 和实际问题的认识和理解 函数形式约束:线性形式 排除性约束(Exclusion restrictions) 不合理的工具变量所产生的估计结果也是非一致性的, 并且比 OLS 的问题更严重 • Huasman 检验:确认内生性是否真的严重 无论是否有内生性,IV 的结果是一致的;如果没有内生
内生变量:Cov(x,u) ≠ 0 IV可用于解决
遗漏变量偏差:找不到适当的度量变量,不得不被当作误差 项处理 度量误差(error-in-variable) 联立性偏差:识别因果联系
4
• • •
OLS 估计量的问题 考虑模型:������ = ������0 + ������1 ������1 + ������2 ������2 + ������ ������2 有内生性,cov ������2 , ������ ≠ 0 ������1 没有内生性,cov ������1 , ������ = 0 (注意������1,������������������ 也是非一致性。 如果回归模型中存在内生 变量,则外生变量的估计系数也是非一致的)
������������2 ������2 ������1
2
������2 ������1 +
������������1
������2
2
������1 −
2
2
+
工具变量法GMM估计
工具变量法 GMM估计1 OverviewModel过程可以分析线性、非线性(对参数或者对变量)的单方程和方程组。
使用的估计方法有:OLS, 2SLS, SUR, ITSUR, 3SLS, IT3SLS,GMM ,FIML。
MODEL过程分析的模型如下:这里,Y是内生变量,X是外生变量,TEHTA是参数。
观测到的变量要么是内生变量,要么是外生变量。
上面的方程组可以简写为:这个形式称为一般形式。
还可以写成标准形式:标准形式把内生变量放在方程的一边。
两种形式的方程(组)都可以使用MODEL过程估计。
经常用当前外生变量、滞后的外生变量、滞后的内生变量来解释当前内生变量。
这就构成了一个动态模型。
滞后变量不论内生还是外生都看作外生变量。
以上并不要求扰动项独立同分布。
自相关、异方差甚至不同的分布都有可能。
对于异方差可以使用加权估计,GARCH模型也可以修正异方差。
如果难以确定异方差的来源和形式,难以确定权重变量的话,可以使用GMM方法得到比OLS方法更加有效的估计。
方程组一个常见的问题就是联立偏倚。
考虑:这个方程组对参数是非线性的,不能使用线性回归估计。
同时这里Y1和Y2是同时决定的,普通非线性最小二乘方法的结果也是有偏和非一致的。
这称为联立性偏倚。
在线性模型中,处理联立性偏倚的可以把出现在方程右边的内生变量换成其预测值。
预测值与扰动项无关从而消除了联立性偏倚。
预测值是通过工具变量法估计得到的,这称为第一步回归。
利用预测值进行第二次回归称为两段最小二乘。
在非线性模型中,使用线性近似,把非线性方程组线性化后使用工具变量法,反复迭代。
在方程组中,方程之间的扰动项可能相关。
对于大样本情况,可以使用系统方法考虑到方程内和方程之间关系得到更有效的估计。
如果不存在联立性问题,即不存在内生变量作为解释变量的话,可以使用SUR估计。
SUR方法需要估计方程之间扰动项的协方差矩阵∑。
估计步骤为先使用OLS估计方程组,从残差得到∧∑,然后使用SUR。
工具变量
= 0 + 1X1 + 2X2 + . . . kXk + u
• 定义: u = y − E(y|X),则假设1意味E(u|X)=0,这 又成为X严格外生性的假设
– 如果E(u|X)=0成立,线性模型就能够解释x与y之间的因 果关系,并成为结构模型
– 同时E(u|X)= 0是E(X’u)=0的充分条件,E(X‘u)=0是 OLS估计的依据。
模型的设定错误
• 遗漏变量
– 被遗漏的变量q进入到随机扰动项中, u=rq+v,OLS估计不一致,教材P63例
• 解决的办法
– 代理变量 – 工具变量法
– panel data
• 教育回报的例子
– 正确的模型设定 log(wage)= 0+ 1exp+ 2exp²+ 3edu+abil+v
– 能力ability通常观察不到,成为遗漏变量,模型 成为 log(wage)= 0+ 1exp+ 2exp²+ 3edu+u
• 直观上讲,2SLS就是首先构造出与XK相关 程度最强的工具变量的线性组合 Xˆ,然 后 再用y对 Xˆ进行回归,从而得到的一 致估计
• Xˆ 被认为是内生解释变量的外生变化部分
2SLS具体步骤
• 以XK为因变量,对 X1, X 2 ,… , X K −1ˆ
无条件方差 – 该假设等价于Var(u|X)= ²,即同方差
Var(ui)= ²,无序列相关Cov(ui,uj)=0
假设4
• (yi, xi)为随机样本,i=1,2,⋯,n
对模型假设的讨论
• 线性条件期望不成立的情形 E(y|X)≠X’,E(u|X)≠0
工具变量法
工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y -。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
第三章-工具变量估计
的有限
假定 3-1 和假定 3-2 保留了经典线性回归下的假定形式,由于此时解释变量 X 不一定满 足外生性,这两个假定改用工具变量 Z 作为条件。同样的,由于 IV 关注的是估计量大样本 性质,此时经典线性回归中的正态假定不再需要。
3.2.2 MM 估计的思路
由假定 3-1 可有如下样本矩条件:
展开可得
根据识别检验的结果,如果检验被拒绝,则逐步删除较差的工具变量(以删除不同的工
具变量 后第一步估计得到的 R2 作为比较的依据),再进行识别检验,直至
或检
验接受。
3.4 弱工具变量
在 IV 估计中,通常假定选取的工具变量是好工具变量,即它与回归方程的误差无关且 与解释变量强相关。但是,实际应用中有时候找到的工具变量可能并没有这么良好的性质, 它可能与解释变量只有弱相关,即相关系数随着样本长度 n 的增大而趋于 0,我们把这类工 具变量称为弱工具变量。
其中, 为有限对称幂等矩阵,且
。
所以有,
。
证明完毕。
式(3-22)定义的
可作为工具变量 Z 的识别检验(Sargen 识别检验),
即判断 Z 是否为好的工具变量。更明确的说,这里的识别检验同时检验了两方面的内容:(1)
除了参数可识别所必需的 K 个工具变量外,我们是否有必要再使用其它的
个工具
变量;(2) 工具变量 Z 是否满足外生性。
3.2 估计与性质
3.2.1 基本假定
线性模型设定如下:
其中, 为被解释变量, 为 K 维的解释变量。
定义 L 维的工具变量 ,其中
,
。
工具变量估计的基本假定有如下 3 点:
假定 3-1(外生假定):
。
假定 3-2(球形假定):
工具变量(IV):估计与检验
与内生解释
i
变量xi相关,若不相关,则秩条件无法满足。证略
阶条件:zi中至少包含k个变量
根据是否满足阶条件可分为三种情况:
1 不可识别:工具变量个数少于内生解释变量个数
2 恰好识别:工具变量个数等于内生解释变量个数
3 过度识别:工具变量个数多于内生解释变量个数
以上介绍的矩估计法仅适用于恰好识别的情况。
3。Wright考虑了几个可能的工具变量; 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 衡价格上升),因此牧场地区降雨量满足工 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响,因此牧场地区降 雨量与ui的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。
谁开创了工具变量回归?
1928年的著作的“The Tariff on Animal and Vegetable Oils”的附录B。 作者是谁? Philip Wright 还是他的儿子 Sewall Wright 文体计量学的分析
为什么IV回归是有效的?
例1: Philip Wright的问题
• 遗漏变量变量 • 变量有测量误差 • 双向因果关系。
遗漏变量偏差可采用在多元回归中加入遗漏变量 的方法加以解决,但前提是只有当你有遗漏变量 数据时上述方法才可行。
双向因果关系偏差是指如果有时因果关系是从X 到Y又从Y到X时,此时仅用多元回归无法消除这 一偏差。同样,
变量有测量误差也无法用我们前面学过的方法解 决。
因此,由于这些点是由需求和供给两者的变化 确定的,因此用OLS拟合这些点的直线既不是 需求曲线也不是供给曲线的估计。
Wright的解决办法:
工具变量法~
工具变量法~工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率)(1.1);适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)(1.2);部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数)(1.3)。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -?在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y -。
外生解释变量:回归模型中的解释变量与随机扰动项无关;内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其中,
; 为实际 GDP 的对数,其差分表示增长率; 为
衡量地区资源禀赋条件的变量; 为个体固定效应。
对模型进行再次差分消除固定效应,可得
假定新生 注意到,有
,解释变量 X 满足严格外生。
可知此时滞后因变量 对于这种情形,一般使用
不满足外生性。
作为
的工具变量。
CASE-2:联立方程偏误 在关于收入不平等与经济增长两者关系的分析中,经济学者发现,收入不平等的情况会 影响经济增长,而经济增长也会影响到收入不平等。 模型简单设定如下:
2SLS 估计的计算如下:
以下根据参数 和 的不同取值划分不同的情形,分析各个情形下 LS 估计与 2SLS 估计的一致性。
CASE-1: 此时,LS 估计和 2SLS 估计可简化如下:
即 LS 估计不是一致估计,但 2SLS 估计是一致估计。 事实上,通常意义上使用的 2SLS 估计关注的是 CASE-2: 此时,LS 估计和 2SLS 估计可简化如下:
其中, 为有限对称幂等矩阵,且
。
所以有,
。
证明完毕。
式(3-22)定义的
可作为工具变量 Z 的识别检验(Sargen 识别检验),
即判断 Z 是否为好的工具变量。更明确的说,这里的识别检验同时检验了两方面的内容:(1)
除了参数可识别所必需的 K 个工具变量外,我们是否有必要再使用其它的
个工具
变量;(2) 工具变量 Z 是否满足外生性。
3.3 设定与识别检验
3.3.1 设定检验
7 / 16
第三章 工具变量估计
如果解释变量 X 满足外生假定,LS 估计与 2SLS 估计都是一致估计,但 LS 估计更有效; 反之,则 LS 估计不是一致估计,而 2SLS 估计仍然是一致估计。因此,我们有必要检验解 释变量是否满足外生假定以确定使用哪种估计方法。
为了更进一步理解 IV 估计的内在思想,我们从 MM 估计最原始的定义出发来考察其构 造过程。
MM 估计:寻找参数的某个估计使得工具变量 Z 与残差正交。
此处,工具变量 Z 满足
。
假设已知方程的估计结果如下:
(3-7)
注意到
,利用
解得的 LS 估计
并不满足
上述 MM 估计的定义,因此,它不是我们要找的解。 幸运的是,虽然 X 与残差 e 不相互正交,但我们总可以把 X 中与 e 正交的那一部分提
根据识别检验的结果,如果检验被拒绝,则逐步删除较差的工具变量(以删除不同的工
具变量 后第一步估计得到的 R2 作为比较的依据),再进行识别检验,直至
或检
验接受。
3.4 弱工具变量
在 IV 估计中,通常假定选取的工具变量是好工具变量,即它与回归方程的误差无关且 与解释变量强相关。但是,实际应用中有时候找到的工具变量可能并没有这么良好的性质, 它可能与解释变量只有弱相关,即相关系数随着样本长度 n 的增大而趋于 0,我们把这类工 具变量称为弱工具变量。
,则由 2SLS 估计的定义可有如下两点性 (3-22)
(2). 如果 X 满足外生假定,且误差项
,则有
其中,此处的 R2 为 e 对 Z 线性回归的非中心化 R2。
(3-23)
证明:
其中,
为对称幂等矩阵;
。
所以有,
。
记
,
,则有
由中心极限定理有, 由大数定律有,
;
11 / 16
第三章 工具变量估计
2.Wu-Hausman 检验
回归模型设定如(3-15),其中变量 可能不满足外生假定。Wu-Hausman 检验对应
的零假设与备则假设如下:
:
,和
都是一致估计。
:
,只有
是一致估计。
取
为工具变量,构造检验模型如下:
(3-20)
则上述的零假设与备则假设可转化为对参数 的显著性检验。
此时,Wu-Hausman 检验对应式(3-20)中对参数 的 Wald 检验。 同样的,也可证明式(3-20)对应的 Wu-Hausman 检验与 Hausman 检验等价。
记 为使得
可逆的任意矩阵,则有
(3-4)
对应的渐近协方差阵为:
(3-5)
容易证明,当
时,上式的渐近方差达到最小:
至此,我们将
时的估计量定义为工具变量估计:
(3-6)
其中,
。
为了便于记忆,我们将式(3-3)称为狭义的 IV 估计,而式(3-6)称为广义的 IV 估计,
或两步 LS 估计(2SLS)。
3.2.3 理解 IV 估计
第三章 工具变量估计
第三章 工具变量估计
1 / 16
第三章 工具变量估计
3.1 例子
在经验分析中,经典线性回归模型的几个假定并不总能得到满足;特别是当外生假定不 满足时,普通的 LS 估计不再是无偏估计,甚至可能不再是一致估计。工具变量估计的提出 能克服普通 LS 估计在外生假定不满足时所引发的偏差问题。
统计量中估计系数之差的协方差阵奇异。
不妨记
,
,其中
为外生解释变量, 为 J 维的内生
解释变量, 为其它工具变量。
回归方程分块表示如下:
(3-15)
上式消除 的影响,可得 以 Z 作为 的工具变量,上式的 LS 估计与 2SLS 估计可计算如下:
令
,构造 Hausman 检验统计量如下:
(3-16)
(3-17) (3-18)
证明: 已知有
则 Wu-Hausman 检验统计量可计算如下:
证明完毕。
10 / 16
第三章 工具变量估计
另外,式(3-20)也可以使用如下形式: 同样的,Wu-Hausman 检验对应参数 的 Wald 检验。
(3-21)
3.3.2 识别检验
不妨记 2SLS 估计的残差为 质:
(1). 无论 X 是否满足外生假定,都有
如果
,即
为可逆方阵,则可解得估计量如下:
4 / 16
(3-1) (3-2) (3-3)
第三章 工具变量估计
如果
,即
不是方阵,不妨对式(3-2)两边同时乘以
的,可解得估计量如下:
再求逆。同样
由上式的计算过程可知,当利用的工具变量比解释变量多时,利用工具变量来计算估计
量的方法非常多,因此,我们有必要向 LS 估计一样找出其中最有效的一种估计。
3.2 估计与性质
3.2.1 基本假定
线性模型设定如下:
其中, 为被解释变量, 为 K 维的解释变量。
定义 L 维的工具变量 ,其中
,
。
工具变量估计的基本假定有如下 3 点:
假定 3-1(外生假定):
。
假定 3-2(球形假定):
。
假定 3-3:
为 i.i.d. 的随机样本向量序列;
为
正定矩阵,
为
的有限满秩矩阵。
以下介绍几个外生性假定被破坏的情形。
CASE-1:滞后因变量与自相关 正常情况下,一个地区的资源越多越有利于其经济的发展。但是,经济学家发现事实经 常是反过来的,丰富的自然资源对经济增长产生了限制作用,自然资源丰裕的地区反而呈现 出令人失望的经济发展绩效的现象,经济学家将这种情况称为“资源的诅咒”。 模型简单设定如下:
(3-19)
其中,
。
注意到,
,即
可逆,所以
有 可逆。
容易证明,在 下有:
。
实际上,也可证明式(3-14)与(3-19)构造的 Hausman 检验统计量等价。
证明:
其中,
。
式(3-14)和(3-19)的 Hausman 检验统计量可变形为:
9 / 16
其中,
第三章 工具变量估计
,
所以,两种方法下构造的 Hausman 检验统计量等价。 证明完毕。
允许工具变量个数 L 也可以非常大,我们假定 L 可表示为
,其中 为某个有
限常数,且有
;易知,参数
对应工具变量个数非常多的情形。另外,为
了保证解释变量 X 中的每个元素为有限常数,我们还需要约束条件
。
基于上述定义,我们有如下结论:
12 / 16
第三章 工具变量估计
其中, 为
的有限正定矩阵。
LS 估计的计算如下:
定义
,则有
Hausman 检验统计量:
注意到,
所以有,
则式(3-13)的 Hausman 检验可变换如下:
其中,
。
8 / 16
。构造如下 (3-13)
(3-14)
第三章 工具变量估计
如果解释变量和工具变量之间包含有共同变量(至少都包含常数项),矩阵 不可逆, 实际使用时可采用其 MP 广义逆。注意到,通常并不是回归方程中的所有解释变量都不满足
的有限
假定 3-1 和假定 3-2 保留了经典线性回归下的假定形式,由于此时解释变量 X 不一定满 足外生性,这两个假定改用工具变量 Z 作为条件。同样的,由于 IV 关注的是估计量大样本 性质,此时经典线性回归中的正态假定不再需要。
3.2.2 MM 估计的思路
由假定 3-1 可有如下样本矩条件:
展开可得
不满足外
假定
可逆,即
,则可对矩阵
联立方程组转化为普通的方程组,再使用普通的 LS 估计。
求逆,将上述的
CASE-3:样本选择性偏差 在研究大学毕业生的工资决定因素时,我们想要了解大学生的毕业工资与其专业或成绩 等原因是否有关,但是,我们并不能获得所有毕业生的数据,而只能获得那些找到工作的毕 业生的资料。 模型简单设定如下:
外生假定,很多解释变量仍然具有外生性,它们可以作为工具变量使用(此时这些变量也应
该作为工具变量使用,因为它们是最好的工具变量),因此,解释变量和工具变量之间通常