第2讲_工具变量法
工具变量法及其应用
![工具变量法及其应用](https://img.taocdn.com/s3/m/2c156b9bd05abe23482fb4daa58da0116c171f88.png)
工具变量法及其应用一、工具变量法简介工具变量法是一种在统计分析中常用的技术,主要用于解决回归分析中的内生性问题。
内生性问题通常出现在一个或多个解释变量与误差项相关的情况下,这会导致回归模型的估计结果有偏且不一致。
为了解决这个问题,工具变量法通过引入一个或多个与内生解释变量相关,但与误差项无关的工具变量,来替代内生解释变量。
二、工具变量的选择工具变量的选择是工具变量法的关键步骤。
理想的工具变量应满足与内生解释变量相关,但与误差项无关的条件。
在实践中,通常需要根据研究问题的具体情况和理论依据来选择工具变量。
一些常见的选择方法包括使用先前的研究、使用相关行业的平均值、使用其他相关变量的滞后值等。
三、工具变量法的优缺点工具变量法的优点主要包括:可以解决内生性问题,提高回归模型的估计精度和一致性;可以扩大解释变量的范围,使得模型更全面地反映被解释变量的影响因素;可以降低误差项的相关性,从而降低模型的标准误,提高模型的置信度。
但是,工具变量法也存在一些缺点,如工具变量的选择困难、可能导致过度拟合和模型过度设定等问题。
四、工具变量法在经济学中的应用工具变量法在经济学中有着广泛的应用。
例如,在研究货币政策时,工具变量法可以用来解决货币供应量与通货膨胀之间的内生性问题,从而提高模型的预测精度;在研究劳动市场时,工具变量法可以用来解决工资与就业之间的内生性问题,从而更准确地估计模型的参数。
五、工具变量法在金融学中的应用工具变量法在金融学中也有着广泛的应用。
例如,在研究股票市场时,工具变量法可以用来解决市场收益率与风险之间的内生性问题,从而提高模型的预测能力和风险管理水平;在研究信贷市场时,工具变量法可以用来解决利率与信贷风险之间的内生性问题,从而更准确地估计模型的参数。
六、工具变量法在其他领域的应用工具变量法在其他领域也有着广泛的应用。
例如,在环境科学中,工具变量法可以用来解决环境污染与经济增长之间的内生性问题,从而更准确地估计模型的参数;在医学研究中,工具变量法可以用来解决吸烟与健康之间的内生性问题,从而更准确地估计模型的参数。
工具变量法工具变量法具体步骤
![工具变量法工具变量法具体步骤](https://img.taocdn.com/s3/m/49153b2426d3240c844769eae009581b6bd9bdf3.png)
工具变量法工具变量法具体步骤工具变量法(Instrumental Variable Method)是一种用于处理内生性问题的统计方法,它通过引入一个“工具变量”来解决内生性问题。
工具变量是一个有着良好相关性但不会受到内生性干扰的变量,它可以用来代替内生变量,从而解决内生性的影响。
1.确定内生变量和工具变量:首先,需要确定研究中存在的内生变量和可能的工具变量。
内生变量是对所研究问题有影响的变量,而工具变量是与内生变量具有相关性但不会受到内生性干扰的变量。
内生性问题是由于内生变量的存在而导致的因果关系估计偏倚。
2.检验工具变量的相关性:接下来,需要检验所选取的工具变量与内生变量之间的相关性。
这可以通过计算相关系数或进行统计检验来实现。
如果工具变量与内生变量存在显著相关性,那么它可能是一个有效的工具变量。
3.确定工具变量的外生性:除了相关性外,工具变量还需要满足外生性的要求,即工具变量对因变量的影响是通过内生变量而不是其他方式引起的。
这可以通过进行实证分析来判断,例如通过回归模型来检验工具变量对因变量的影响是否通过内生变量进行中介。
如果工具变量的影响仅通过内生变量介导,则可以认为工具变量满足外生性的要求。
4.估计工具变量模型:一旦确定了有效的工具变量,可以使用工具变量法来估计因果关系。
工具变量法的核心思想是通过回归模型来解释内生变量对因变量的影响,并利用工具变量对内生变量进行替代。
通过将工具变量引入估计方程中,可以消除内生性的影响,从而得到无偏的因果关系估计。
5.进行统计推断:在估计了工具变量模型之后,可以进行统计推断来评估估计结果的显著性。
这可以通过计算标准误差、置信区间和假设检验等来实现。
统计推断可以帮助判断估计结果的可靠性,并验证因果关系的存在与否。
总结而言,工具变量法是一种用于解决内生性问题的统计方法。
它通过引入一个有效的工具变量来代替内生变量,消除内生性的干扰,从而得到无偏的因果关系估计。
工具变量法的具体步骤包括确定内生变量和工具变量、检验工具变量的相关性和外生性、估计工具变量模型,并进行统计推断。
工具变量法
![工具变量法](https://img.taocdn.com/s3/m/054b8c597c1cfad6185fa757.png)
ut )
1
ztut zt xt
(9.8.7)
(9.8.7)两边取期望值:
(ˆ1)
1
(
ztut zt xt
)
1
所以,ˆ1 不是1 的无偏估计量。
(9.8.7)两边取概率极限:
P lim
ˆ1
1
P lim P lim
1
n 1
n
ztut zt xt
1
COV COV
(zt ,ut) (zt , xt)
1
即
P lim ˆ1 1
表明 ˆ1 是1 的一致估计量。
(9.8.8) (9.8.9)
工具变量法是一种单方程估计方法,每次只适用于 模型中的一个结构方程。 显然,对于多个解释变量的单方程也是适用的。 三、工具变量法的有效性
y1 10 12 y2 1g1 y g1 11 x1 12 x2
第二步,分别用工具变量去乘结构方程,并对所有 的样本观测值求和,得到与未知参数一样多的线性 方程组成的方程组。解方程组就得到结构参数的估
二、工具变量法的应用举例 1.设有一个解释变量的结构方程:
yt 0 1 xt ut
(9.8Байду номын сангаас1)
其中xt是该方程所在模型中的内生变量,因而 COV(xt,ut) ≠ 0。在模型的其他结构方程中可找到这 样的外生变量zt,zt与xt高度相关,但zt与ut不相关即 COV(zt,ut)=0,即zt
1k1 xk1 u1
(9.8.20)
模型(9.8.20)共有(g1-1)个内生说明变量和k1个前定
变量
1.若方程(9.8.20)
由阶条件知
K1 G1* G 1
或
工具变量法
![工具变量法](https://img.taocdn.com/s3/m/bd041d7d192e45361066f586.png)
工具变量法Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y 。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
工具变量法结果解读
![工具变量法结果解读](https://img.taocdn.com/s3/m/04b4719477a20029bd64783e0912a21614797f2a.png)
工具变量法结果解读一、引言工具变量法是计量经济学中一种重要的估计方法,主要用于解决内生性问题。
通过引入工具变量,工具变量法能够有效地减少误差,提高估计的准确性和可靠性。
然而,对于初学者来说,如何正确解读工具变量法的结果可能是一个挑战。
本文将详细解读工具变量法的理论基础、工具变量的选择、结果解读以及结论,以期帮助读者更好地理解和应用工具变量法。
二、工具变量法的理论基础工具变量法源于经济理论,特别是当一个或多个解释变量与误差项相关时,就会产生内生性问题。
在这种情况下,普通最小二乘法(OLS)的估计结果是有偏的。
为了解决这个问题,我们引入一个或多个与内生解释变量相关,但与误差项无关的工具变量。
这些工具变量通过与内生解释变量的线性组合来“工具化”内生解释变量,从而在估计中起到减少误差和偏误的作用。
三、工具变量的选择选择合适的工具变量是工具变量法的关键步骤。
理想情况下,一个好的工具变量应该与内生解释变量高度相关,同时与误差项无关。
在实践中,我们通常选择那些与内生解释变量相关,同时又遵循随机扰动的因素作为工具变量。
此外,工具变量的数量应该足够多,以便能够充分地“工具化”内生解释变量。
四、结果解读在应用工具变量法后,我们得到了一组估计结果。
这些结果应该如何解读呢?首先,我们需要关注估计系数的符号。
如果估计系数的符号与预期相符,那么我们可以初步认为估计结果是可靠的。
其次,我们需要检验估计结果的显著性。
常用的方法是观察估计系数的p值。
如果p值较小(通常小于0.05),则表明估计结果是显著的。
最后,我们需要检验工具变量的有效性。
这可以通过观察工具变量的系数是否接近于1来初步判断。
如果工具变量的系数接近于1,并且显著,那么我们可以认为工具变量是有效的。
此外,我们还可以使用诸如弱工具检验、过度识别检验等统计方法来进一步检验工具变量的有效性。
五、结论本文对工具变量法的结果解读进行了详细阐述。
通过关注估计系数的符号、显著性以及工具变量的有效性等方面,我们可以更好地理解和应用工具变量法。
工具变量法(二):弱工具变量
![工具变量法(二):弱工具变量](https://img.taocdn.com/s3/m/62638e230812a21614791711cc7931b765ce7b74.png)
工具变量法(二):弱工具变量世上没有完美的计量方法,因为所有的计量方法与模型均依赖于一定的前提假设。
因此,在估计完计量模型后,通常需要对模型的前提假设进行检验,称为“诊断性检验”(diagnostic checking)或“模型检验”(model checking)。
工具变量法也不例外。
工具变量法的成立依赖于有效的工具变量(valid instruments),即所使用的工具变量须满足相关性(与内生解释变量相关)与外生性(与扰动项不相关)。
工具变量的相关性(Instrument Relevance)在大样本下,2SLS为一致估计。
但对于大多数实践中的有限样本(finite sample),2SLS估计量依然存在偏差(bias),并不以真实参数为其分布的中心,即而且,如果工具变量与内生变量的相关性较弱,则 2SLS 的偏差会变得更为严重。
直观来看,2SLS 的基本思想是通过外生的工具变量,从内生变量中分离出一部分外生变动(exogenous variations),以获得一致估计。
如果工具变量与内生变量的相关性很弱,则通过工具变量分离出的内生变量之外生变动仅包含很少的信息。
因此,利用这些少量信息进行的工具变量法估计就不准确,即使样本容量很大也很难收敛到真实的参数值。
这种工具变量称为“弱工具变量”(weak instruments)。
弱工具变量的后果弱工具变量的后果类似于样本容量过小,会导致 2SLS 的小样本性质变得很差,而 2SLS 的大样本分布也可能离正态分布相去甚远,致使基于大样本理论的统计推断失效。
下面通过蒙特卡洛模拟(Monte Carlo simulation)来直观地考察弱工具变量的后果。
考虑最简单的一元回归模型,假设其数据生成过程(data generating process)为:其中,为内生变量,与扰动项相关;而的真实系数为 2。
假设样本容量为10,000,并使用工具变量进行2SLS 回归。
工具变量法
![工具变量法](https://img.taocdn.com/s3/m/a4f2823f6bd97f192379e925.png)
工具变量法一.为什么需要使用工具变量法?当模型存在内生解释变量问题,一般为以下三种情形:(1)遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。
否则,就会造成解释变量与残差项相关,从而引起内生性问题。
(2)解释变量与被解释变量相互影响(3)度量误差 (measurement error ):由于在关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。
Ex :i 01122Y i i k ik i X X X ββββμ=+++⋅⋅⋅++ 其中:X 2为内生解释变量 当22Cov(X ,)=E[X ]0i i i i μμ≠时,内生解释变量与随机干扰项同期相关。
此时会导致回归参数估计量是有偏的且不一致,需要用工具变量法进行回归。
二.如何使用工具变量? (一)判断是否需要用工具变量当存在内生性变量时,则需使用工具变量,所以需要对内生性变量进行检验。
在实践中,往往是通过经济学理论先说明是否存在内生性变量,最后再通过检验证明确实存在内生变量。
(1)豪斯曼检验(Hausman )原假设H 0:所有解释变量均为外生变量将内生解释变量关于工具变量与外生变量进行OLS 回归估计 记录残差序列(^^IV OLS ββ−),加入原模型后进行OLS 估计 结果:若差值依概率收敛于0,接受原假设;反之,拒绝。
(2)杜宾-吴-豪斯曼检验(DWH )注:存在异方差的情况下传统豪斯曼检验不适用。
回归模型:'1122y x x ββε=++ z=(x 1,z 2) 第一阶段回归:''21x x z v γδ=++ 检验扰动项v 与ε相关性模型:=v+ερξ 其中:ρ为ε对v 回归系数,ε与v 不相关则ρ=0. 对 ^'''1122y=x x v e ββρ+++ 回归 对原假设H 0:ρ=0. 进行t 检验。
工具变量法回归符号相反
![工具变量法回归符号相反](https://img.taocdn.com/s3/m/5534372211a6f524ccbff121dd36a32d7275c749.png)
工具变量法回归符号相反1. 引言工具变量法(Instrumental Variable, IV)是一种经济计量学中常用的方法,用于解决因果推断中的内生性问题。
在回归分析中,内生性是指自变量与误差项之间存在相关性,导致OLS估计结果偏误。
为了解决这一问题,可以使用工具变量法来进行估计。
本文将详细介绍工具变量法的原理、步骤以及应用,并讨论使用工具变量法时出现回归符号相反的情况。
2. 工具变量法原理工具变量法的基本原理是利用一个或多个与内生变量相关但与误差项不相关的工具变量,将内生变量替换为工具变量进行回归分析。
通过工具变量的使用,可以实现对内生性的控制,从而得到一致且有效的估计结果。
为了有效使用工具变量,需要满足两个关键假设:•工具变量的相关性:工具变量与内生变量之间存在相关性,即工具变量对内生变量产生影响。
•工具变量的无直接效应:工具变量对因变量的影响只通过内生变量来传导,不存在直接效应。
在满足上述假设的情况下,可以使用两阶段最小二乘法(Two-Stage Least Squares, 2SLS)来进行工具变量回归分析。
3. 工具变量法步骤工具变量法的步骤可以分为两个阶段:第一阶段第一阶段是利用工具变量对内生变量进行回归,得到内生变量的预测值。
具体步骤如下:1.确定内生变量:首先需要明确研究中的内生变量,即与误差项相关的自变量。
2.选择合适的工具变量:根据相关性的要求,选择与内生变量相关但与误差项不相关的工具变量。
3.进行第一阶段回归:使用工具变量对内生变量进行回归,得到内生变量的预测值。
第二阶段第二阶段是利用内生变量的预测值进行回归,得到最终的估计结果。
具体步骤如下:1.构建结构方程:根据研究问题,构建包含内生变量和其他自变量的结构方程。
2.进行第二阶段回归:将内生变量的预测值与其他自变量一起,进行回归分析,得到最终的估计结果。
4. 工具变量法回归符号相反的情况在使用工具变量法进行回归分析时,有时会出现回归符号相反的情况。
工具变量法例子及解析
![工具变量法例子及解析](https://img.taocdn.com/s3/m/20d4be3fba68a98271fe910ef12d2af90242a80f.png)
工具变量法例子及解析工具变量法是经济学中常用的一种回归分析方法,它的作用是削弱内生性问题对回归结果的影响。
本文将通过具体例子和分析,介绍工具变量法的原理、应用和重要性。
一、工具变量法原理工具变量法的核心思想是利用一个与内生变量有关的外生变量来代替内生变量,既能够在一定程度上削弱内生性问题,又能够保留回归模型的一般结构。
其原理可以简单归纳为以下几个步骤:1. 利用可靠性高的工具变量代替内生变量2. 使用工具变量回归得到内生变量的估计值3. 将内生变量的估计值代入原始回归模型,得出正确的回归效果。
通过以上三个步骤,工具变量法可以尽可能地消除内生性问题对回归分析的干扰,从而得到准确的分析结果。
二、工具变量法应用在实际经济研究中,工具变量法的应用非常广泛,以下是几个常见的应用:1. 教育和收入的关系分析这是一个非常经典的实证研究,研究者发现,教育与收入之间存在内生性问题,即教育水平可能受到家庭收入的影响。
为了解决这个问题,研究者使用父母教育程度作为工具变量,用它来代替受教育程度对收入的内生性影响,最终得出正确的研究结果。
2. 运动员收入与绩效的关系分析在研究运动员收入与绩效关系的时候,由于运动员自身的能力或健康状况等因素可能会影响分析结果,因此需要使用工具变量来解决内生性问题。
例如,研究者可以使用运动员所属的地理区域作为工具变量,用它来代替个人因素对收入和绩效的影响,从而得出更加准确的研究结果。
3. 货币政策与经济增长的关系分析在研究货币政策对经济增长的影响时,通常会使用实际利率作为工具变量来解决内生性问题。
由于实际利率受银行制度、资本市场以及政府债券利率等多种因素的影响,因此能够代替内生性较强的利率变量,得出更加准确的研究结果。
三、工具变量法的重要性工具变量法在经济学研究中具有非常重要的地位,它的主要作用在于解决内生性问题,从而得出更加准确的研究结果。
由于内生性问题可能会导致回归结果的偏误,因此如果不进行工具变量法处理,可能得出的结论会与实际情况有较大差距,这对于政策的制定和实施将会带来严重影响。
工具变量法检验流程
![工具变量法检验流程](https://img.taocdn.com/s3/m/b9613ea8a0c7aa00b52acfc789eb172ded6399d7.png)
工具变量法检验流程一、啥是工具变量法。
工具变量法呀,就像是我们在解决一个复杂谜题时找到的一个小帮手。
比如说,我们想知道一个因素X对结果Y的影响,但是呢,这里面可能存在一些隐藏的混淆因素,就像捣蛋鬼一样干扰我们的判断。
这时候,工具变量就闪亮登场啦。
它是一个和因素X有关系,但是和那些混淆因素没有关系的变量哦。
就好比我们要找到真正影响花朵生长(Y)的肥料(X),但是有很多其他乱七八糟的东西在捣乱,这时候我们找到一个小助手,这个小助手只和肥料有关,和其他捣乱的东西没关系,这个小助手就是工具变量啦。
二、找工具变量。
找工具变量可不是一件轻松的事儿呢,就像在茫茫人海中找一个特定的小伙伴。
这个变量得满足两个超级重要的条件哦。
1. 相关性。
它得和我们想要研究的那个自变量(就是前面说的X)有一定的关系。
如果没有关系的话,那这个小帮手可就帮不上忙啦。
比如说,如果我们想研究学习时间(X)对成绩(Y)的影响,我们找的工具变量要是和学习时间一点关系都没有,那就完全没有意义了呀。
这个相关性就像是它们之间有一条小绳子连着,虽然不是特别紧密,但得有这么个联系。
2. 外生性。
这是个有点复杂的概念呢。
简单说就是这个工具变量不能和那些混淆因素有瓜葛。
还拿学习时间和成绩来说,如果我们找的工具变量是每天喝的咖啡杯数,但是这个咖啡杯数又和家里的学习环境(这是个混淆因素)有关系,那就不行啦。
它必须是那种很纯粹的,只和学习时间有关,和其他可能干扰成绩的因素都无关的变量。
三、估计过程。
找到合适的工具变量后,就开始估计啦。
这个过程有点像在调配一杯特别的饮料。
我们会用一些统计方法来做这件事哦。
一般来说,我们会先建立一些方程。
就像搭积木一样,把各个变量按照它们之间的关系摆好。
比如说,我们有一个方程是关于Y和X的,还有一个方程是关于X和工具变量的。
然后呢,通过一些巧妙的数学变换,就像魔法一样,我们可以得到一个新的表达式,这个表达式就能让我们算出X对Y的影响啦。
工具变量法2SLS与GMM
![工具变量法2SLS与GMM](https://img.taocdn.com/s3/m/477a3bde05a1b0717fd5360cba1aa81144318fe6.png)
工具变量法2SLS与GMM1第 10 章工具变量,2SLS 与 GMM10.1 解释变量与扰动项相关的例子例农产品市场均衡模型q d = α + α p + u (需求)t 0 1 t t ? q s = β + β p + v(供给) t ? q d 0 1 t t = q s(均衡)tt令q ≡q d=q s,可得t t tq t =α0+α1 p t +u tq =β+βp +vt 0 1 t t两个方程中的被解释变量与解释变量完全一样。
如直接作回归q ?O?LS?→p,估计的是需求函数还是供给函数?t t2图10.1 需求与供给决定市场均衡341 1 1 11 1把线性方程组中的( p t , q t )看成是未知数(内生变量),把(u t , v t ) 看作已知,可求解( p t , q t )为(u t , v t ) 的函数:p = p (u ,v ) = β0 - α0 + v t - u t ? t t t t α - β α - β ? 1 1 1 1 ?q = q (u ,v ) = α1β0 - α0 β1 + α1v t - β1u t ?? t t t t α - β α - β由于 p t 为(u t , v t ) 的函数,故Cov( p t , u t ) ≠ 0,Cov( p t , v t ) ≠ 0。
OLS 估计值α?1, β? 不是α , β 的一致估计量。
称这种偏差为“联立方程偏差”(simultaneity bias)或“内生变量偏差”(endogen eity bias)。
1如能将内生变量分成两部分,一部分与扰动项相关,另一部分与扰动项不相关,可用与扰动项不相关的那部分得到一致估计。
这种分离常借助另一“工具变量”来实现。
假设在图10.1 中,存在某个因素(变量)使得供给曲线经常移动,而需求曲线基本不动,则可估计需求曲线,参见图10.2。
这个使得供给曲线移动的变量就是工具变量。
工具变量法工具变量法具体步骤
![工具变量法工具变量法具体步骤](https://img.taocdn.com/s3/m/910234ada417866fb94a8e02.png)
工具变量法工具变量法具体步骤工具变量法目录概念某一个变量与模型随机解释变量高度相关,但却不与为丛藓科扭口藓项相关,那么就可以用此变量与模型中相应回归系数的一个一致估计量,这个变量就称为方法变量,这种估计方法就叫工具基本原理变量法。
缺点工具变量法的关键是选择一个有效的优先选择工具变量,由于工具自变量变量可以选择中的困难,工具变量法本身存在两方面不足:一是由于工具变量不是惟一的,因而工具变量估计量有一定的任意性;其二由于误差项实际上是不可观测的,因而要寻找严格意义上与误差项无关的与所替代而随机解释变量高度相关的变量总的来说事实上是困难的。
工具变量法与内生解释变量可持续性解释变量会造成解读严重的后果:不一致性inconstent 和有偏biased ,因为频域不满足误差以解释线性为条件的期望值为0。
产生解释变量招盛纯一般有三个原因:一、遗漏变量二、测量误差三、联立性第三种情况是无法逐步解决的,前两种可以采用工具变量(IV )法。
IV 会带来的唯一坏处是估计方差的增大,也就是说同时采用OLS 和IV 估计,则前者的方差小于后者。
但IV 的应用是有前提条件的:1.IV 与内生解释函数相关,2.IV 与u 不相关。
在小样本情况下,一般用内生解释变量对IV 进行回归,如果R -sq 值很小的话,一般t值也很小,所以对IV 质量的评价没有大的风险问题,但是当采用大样本时,情况则相反,往往是t 值很大,而R -sq 很小,这时如果采用t 值进行关键问题评价则可能出现出现问题。
这时IV 与内生解释变量之间的若干程度不是阐释太大,但是如果与u 之间有轻微的相关机构的话,则:1、导致很小的不一致性;2、有偏性,并且这种有偏性随着R -sq趋于0而趋于OLS 的有偏性。
所以现在在采用IV 时最好采用R -sq 或F -sta 作为评价标准,另外为了观测IV 与u 的关系,可以将IV 作为解释变量放入方程进行回归,如果没有其他的系数没有多的变化,则说明IV 满足第二个条件。
(9)12.8工具变量法(IV法)
![(9)12.8工具变量法(IV法)](https://img.taocdn.com/s3/m/6fc656d528ea81c758f57846.png)
(3)前定变量多于一个时,要求它们之间又要满足不 相关,有时是困难的。 (4)由于u是不可观察的,很难确定它与工具变量无关。 (5)此方法估计出的参数估计值是非无偏,却是一致估 计量。 由于以上原因,在实际中,人们很少直接用工具变量 法对结构参数进行估计,但它为二阶段最小二乘法作 了准备。
(12.8.4)
由于E(ut)=0,所以∑ztut≈0, ,(12.8.2)可改写为
ˆ ˆ ∑ y t z t = β 0 ∑ z t + β 1 ∑ z t xt
将(12.8.4)代入(12.8.5),整理后得到
ˆ & & ∑ z t y t = β 1 ∑ z t xt & &
便有
∑ zt yt & & ˆ β1 = ∑ z t xt & &
2.若方程(12.8.16)过度识别,则有
K > g1 − 1
∗ 1
(12.8.18)
表明在模型中有 x k 1+1 , k1+ 2 ,…,xk,即有K1*个前 x 定变量可选作工具变量。 由于K1*大于g1-1,所以,从K1*个前定变量中选择 g1-1个作为工具变量,就产生了选择的任意性。由于 估计量与所选的工具变量有关,因此就使得估计量 不唯一,这就产生了估计量的优劣问题。
这里应该指出,选择工具变量的个数必须与所估计的 结构方程中作解释变量的内生变量的个数相等。如果 结构方程中含有前定变量,则可选择这些前定变量本 身做自己的工具变量,这样做的目的是,使每一个结 构参数值都能求得估计值。 第二步,分别用工具变量去乘结构方程,并对所有 的样本观测值求和,得到与未知参数一样多的线性 方程组成的方程组。解方程组就得到结构参数的估 计值。
工具变量法
![工具变量法](https://img.taocdn.com/s3/m/a4f2823f6bd97f192379e925.png)
工具变量法一.为什么需要使用工具变量法?当模型存在内生解释变量问题,一般为以下三种情形:(1)遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。
否则,就会造成解释变量与残差项相关,从而引起内生性问题。
(2)解释变量与被解释变量相互影响(3)度量误差 (measurement error ):由于在关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。
Ex :i 01122Y i i k ik i X X X ββββμ=+++⋅⋅⋅++ 其中:X 2为内生解释变量 当22Cov(X ,)=E[X ]0i i i i μμ≠时,内生解释变量与随机干扰项同期相关。
此时会导致回归参数估计量是有偏的且不一致,需要用工具变量法进行回归。
二.如何使用工具变量? (一)判断是否需要用工具变量当存在内生性变量时,则需使用工具变量,所以需要对内生性变量进行检验。
在实践中,往往是通过经济学理论先说明是否存在内生性变量,最后再通过检验证明确实存在内生变量。
(1)豪斯曼检验(Hausman )原假设H 0:所有解释变量均为外生变量将内生解释变量关于工具变量与外生变量进行OLS 回归估计 记录残差序列(^^IV OLS ββ−),加入原模型后进行OLS 估计 结果:若差值依概率收敛于0,接受原假设;反之,拒绝。
(2)杜宾-吴-豪斯曼检验(DWH )注:存在异方差的情况下传统豪斯曼检验不适用。
回归模型:'1122y x x ββε=++ z=(x 1,z 2) 第一阶段回归:''21x x z v γδ=++ 检验扰动项v 与ε相关性模型:=v+ερξ 其中:ρ为ε对v 回归系数,ε与v 不相关则ρ=0. 对 ^'''1122y=x x v e ββρ+++ 回归 对原假设H 0:ρ=0. 进行t 检验。
工具变量法~
![工具变量法~](https://img.taocdn.com/s3/m/de379d73915f804d2a16c154.png)
工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法就是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (1、1); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)(1、2);部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) (1、3)。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至就是有偏的这样严重的问题。
那么,我们就是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -?在这里,一个可行的估计方法就就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y -。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量与外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法与普通最小二乘法就是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计就是非一致的,这时就需要引入工具变量。
(9)8.2工具变量法
![(9)8.2工具变量法](https://img.taocdn.com/s3/m/b4131f1dc281e53a5802ff46.png)
即
ˆ P lim β1 = β1
ˆ 表明 β 1 是 β1 的一致估计量。
ˆ 同样可以证明,0是 β 0 的一致估计量(读者可以自己给出)。 β
ˆ ˆ 其中 β 0 的估计量为:β 0 = y − β 1 x 。
工具变量法是解决随机性解释变量与随机项相关时, 估计模型中参数的一种简单有效方法。但是,在实际 问题中,如何选择工具变量是一个比较困难的问题。
β 关于8.2节工具变量法,ˆ0 是 β 0 的一致估计量。
ˆ 在已证明 β 1 是 β 1 的一致估计量的条件下,证明:
ˆ ˆ β 0 不是 β 0 的无偏估计量,但 β 0 是 β 0 的一致估计量。
ˆ ˆ 由于 β 0 = y − β1x
ˆ ˆ ˆ β 0 = y − β1x = ( β 0 + β 1 x + u ) − β1x ˆ = β 0 + ( β 1 − β 1) x + u
选择工具变量应满足的条件: 1.工具变量必须是真正的外生变量; 2.工具变量与所替代的随机解释变量高度相关; 3.工具变量与模型中的其他解释变量不相关,或相关 性很小,避免出现多重共线性。 4.在同一个模型中采用多个工具变量,这些工具变量 之间也必须不相关,或相关性很小,避免出现多重共 线性。
ቤተ መጻሕፍቲ ባይዱ
二、工具变量法 为了讨论方便我们将(8.1.4)写成离差形式
ˆ ˆ E ( β 0) = β 0 + E[( β 1 − β 1) x ] + E (u ) ˆ = β 0 + E[( β 1 − β 1) x ] ≠ β 0
ˆ 其中 E[( β 1 − β 1) x ] ≠ 0
表明:有偏
ˆ ˆ P lim β 0 = P lim [ β 0 + ( β 1 − β 1) x + u ]
工具变量法
![工具变量法](https://img.taocdn.com/s3/m/ca8760fc941ea76e58fa0487.png)
2、如果X与μ同期不相关,异期相关,得到 的参数估计量有偏、但却是一致的。
x ˆ E ( β 1 ) = β 1 + E (∑ t 2 μ t ) = β 1 + ∑ E ( k t μ t ) ∑ xt
kt的分母中包含不同期的X;由异期相关性 知:kt与μt相关,因此,
ˆ E ( β1 ) ≠ β1
其中
称为工具变量矩阵
3、工具变量法估计量是一致估计量
一元回归中,工具变量法估计量为
~
i 1 i i i i i 1 1 i i i
∑ z (β x + μ ) = β + ∑ z μ β = ∑z x ∑z x 两边取概率极限得:
P lim(β1 ) = β1 + ~
P lim 1 ∑ z i μ i n P lim 1 ∑ z i xi n
例如: (1)耐用品存量调整模型:
耐用品的存量Qt由前一个时期的存量Qt-1和 当期收入It共同决定:
Qt=β0+β1It+β2Qt-1+μt
t=1,…T
这是一个滞后被解释变量作为解释变量的模型。 但是,如果模型不存在随机误差项的序列相关 性,那么随机解释变量Qt-1只与μt-1相关,与μt不相 关,属于上述的第2种情况。
拟合的样本回归线 高估截距项,而低 估斜率项。
对一元线性回归模型:
Yt = β 0 + β 1 X t + μ t
OLS估计量为
ˆ β1 =
∑x y ∑x
t 2 t
t
= β1
∑x μ + ∑x
t 2 t
t
随机解释变量X与随机项μ的关系不同,参 数OLS估计量的统计性质也会不同。 1、如果X与μ相互独立,得到的参数估计量 仍然是无偏、一致估计量。 已经得到证明
工具变量法
![工具变量法](https://img.taocdn.com/s3/m/c9496a6f67ec102de2bd896a.png)
工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y -。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
第2讲_工具变量法
![第2讲_工具变量法](https://img.taocdn.com/s3/m/870919aa0b4e767f5bcfce05.png)
内生解释变量的影响
• 当 E(u|X ) ≠ 0 时,OLS估计量b有偏且不 一致
•
在大样本条件下,当
p
lim(
1 n
X ku)
0
,OLS估
计量b不一致
内生解释变量的探查
• 怎样判断模型的解释变量中出现了与随机扰动 项 相关的情形,并没有现成的检验方法
y = E(y|X)+u
= 0 + 1X1 + 2X2 + . . . kXk + u
• 定义: u = y − E(y|X),则假设1意味E(u|X)=0,这 又成为X严格外生性的假设
– 如果E(u|X)=0成立,线性模型就能够解释x与y之间的因 果关系,并成为结构模型
– 同时E(u|X)= 0是E(X’u)=0的充分条件,E(X’u)=0是 OLS估计的依据。
2SLS具体步骤
• 以XK为因变量,对 X1, X 2 ,… , X K −1, Z1, …, ZM 进行OLS回归,得到拟合值 Xˆ
– Xˆ 是其它外生的解释变量以及M个工具变量的 线性组合
• 经验分析中通常都是以行业/企业产出水平或劳 动生产率作为被解释变量,通过该变量对于FDI的 回归系数的符号、大小以及显著程度,来判断FDI 对于引入外资的行业/企业业绩变化的实际影响
• 由于FDI的进入与外资引入国本身的要素禀赋、 技术水平、劳动力状况以及经济发展水平密切相 关,因此FDI与行业/产出水平相互影响,使之成 为具有内生性的解释变量,人们可能会在溢出效 应并没有发生的情况下,把生产效率的提高归因 于外资企业的溢出作用,从而在单方程的计量分 析中产生联立偏差
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本选择
• 样本选择指的是我们所观察的被解释变量 的结果,部分地受到行为主体对是否参与 某项活动选择的影响,从而导致我们所得 到的样本成为非随机的样本
– 举例而言,在研究个人健康对于医疗保险保费 的影响这一问题中,由于我们只能够观察到投 保人的保费和他们的个人信息,而无法得到没 有投保的消费者相关信息,从而使得个人健康 这一变量具有内生性
• 该假定的基本内容是指扰动项关于解释变 量的条件期望等于零 :
E(u|X ) = 0
– 解释变量X产生机制与随机扰动项u无关
–
–
可以推出:Cov( Xjk , ui ) = 0 和E(x′k u) = 0
大样本条件下的渐进无关性:p lim(
1 n
X ku)
0
一个说明
• E(x′k u) = 0 表示Xk与u在小样本情形下无关
例
• 假定解释变量Xk具有内生性,找到
Z = ( X1, X 2 ,… , X K ,−1 ZK )
只要Cov(ZK , X K ) ≠ 0 ,Cov(ZK ,ε ) = 0 变量Z就满足条件1和2,成为工具变量 • 实际运用中,寻找工具变量的关键就 是要 找到与Xk高度相关而与u无关的Zk
识别
工具变量法
• 工具变量的定义 • 工具变量法 • IV估计量的统计性质 •两阶段最小二乘法 (2 Stage Least Square) • 工具变量的选择 • 对内生性的简单检验
• Xk为内生的解释变量
• 假定我们可以把Xk分解为两个部分,一部 分与随机扰动项u相关,另一部分与u无关
• 如果我们能够找到另一个变量或多个变量 Z,它与Xk相关,但与u无关,就可以通过Z 将Xk中与u无关的部分分离出来,从而识别 出Xk对y的边际影响,这个结果具有一致性 •这种方法称为工具变量法(Instrumental Variables Method,简称IV法)
– 能力ability通常观察不到,成为遗漏变量,模型 成为 log(wage)= 0+ 1exp+ 2exp²+ 3edu+u
– 通常ability受到教育的影响 abil=₀+₃edu+r,
E(r|exp,exp²)=0 – 从而E(b3)= 3+ 3,b3不仅是有偏的,而且在大
样本中也是不一致的。
y = E(y|X)+u
= 0 + 1X1 + 2X2 + . . . kXk + u
• 定义: u = y − E(y|X),则假设1意味E(u|X)=0,这 又成为X严格外生性的假设
– 如果E(u|X)=0成立,线性模型就能够解释x与y之间的因 果关系,并成为结构模型
– 同时E(u|X)= 0是E(X’u)=0的充分条件,E(X’u)=0是 OLS估计的依据。
原方程:
y = 0 + 1X1 + 2X2 + . . . kXk + u
新方程(工具变量):
主回归: y = 0 + 1Xˆ1 + 2X2 + . . . kXk + u
辅助回归: X1= a0 + a1Z + a2X2 + . . . akXk + v
工具变量的定义
• 在K变量线性回归模型中,不妨假定解释变
– E(u|X)= 0还意味着Cov(X,u)=0
假设2
• 样本矩阵满列秩 rank(X)=K<n
• 含义
– 要求有足够多的观测值,n>k
– 变量之间不存在线性组合 – 保证X‘X可逆,满秩,非奇异,从而估计结果
唯一
假设3
• 随机扰动项同方差、无自相关 Var(y|X)=²I
• 含义
– y的条件方差为纯量协方差矩阵 – 由于 ²为常数,与x无关,所以条件方差等价于
• 即使观测误差与随机扰动项无关,新的随 机扰动项仍然会与解释变量相关
联立偏差
• 当X和Y相互作用,相互影响,互为因果 时,我们应该用联立方程组的形式来描述 它们之间的关系
• 但如果我们仍然采用单一线性方程形式, 以Y为被解释变量,X为解释变量,就会导 致与扰动项相关的情况出现,X成为内生的 解释变量
• 恰好识别
– 回归模型中有一个解释变量是内生的,而我们就找到 一个工具变量
– 内生的解释变量个数与工具变量的个数相等
• 不可识别
– 内生的解释变量个数大于工具变量的个数,我们无法 估计回归参数
• 过度识别
– 工具变量的个数更多 – 只有在这种情形下,我们才能够对工具变量的外生性
进行检验
讨论:教育回报率研究中的IV
• 同时,在大样本的条件下,IV估计量的渐进 正态性将不会出现。
条件2.工具外生性
• 该条件要求
E(Z′u) = 0
• 上式表明,Z与u无关,Z具有外生性 • 在大样本条件下,上式还可表述为
p lim(1 Zu) 0 n
• 由于u不可观测,这个条件在理论上是不可 检验的,但在现实中,当满足某些条件 时 ,可以进行事后检验
模型的设定错误
• 函数形式的错误
– 非参数设定来解决
• 包含了多余变量
– 如果多加的变量与其它的解释变量无关,OLS估计仍然 是无偏,一致,但不有效
– 如果多加的变量与其它的解释变量有关,OLS估计有偏 – 例:研究新生儿体重y与母亲在孕期的食品摄入量x的关
系,如果考虑家庭收入z。正确的模型设定为: E(y|x,z)=x。如果加入z,模型变为E(y|x,z)=₀x+γz
量XK具有内生性,即
E(u|X K ) ≠ 0,或
E(x′K u) ≠ 0 ,或
p lim(
1 n
X ku)
0
如果变量Z1, Z2 , …, ZL,L ≥ K ,满足下面两个 条件,则称为工具变量:
条件1:工具相关性
• 该条件要求
r [E(Z ′X )] = K
在大样本条件下,上式还可表述为
p
lim(
• 经验分析中通常都是以行业/企业产出水平或劳 动生产率作为被解释变量,通过该变量对于FDI的 回归系数的符号、大小以及显著程度,来判断FDI 对于引入外资的行业/企业业绩变化的实际影响
• 由于FDI的进入与外资引入国本身的要素禀赋、 技术水平、劳动力状况以及经济发展水平密切相 关,因此FDI与行业/产出水平相互影响,使之成 为具有内生性的解释变量,人们可能会在溢出效 应并没有发生的情况下,把生产效率的提高归因 于外资企业的溢出作用,从而在单方程的计量分 析中产生联立偏差
• 内生的解释变量:教育水平或年限 • 被解释变量:个人收入或工资水平 • 文献中使用的工具变量
– 父母的教育水平 – 家庭收入 – 同胞的教育水平 – 18岁时家庭所在地的蓝领工资、失业率 – 家庭住址距离大学校区的距离 – 相关的义务教育法规
IV估计量bIV的统计性质
• IV估计量在有限样本的条件下表现并不理想
无条件方差 – 该假设等价于Var(u|X)= ²,即同方差
Var(ui)= ²,无序列相关Cov(ui,uj)=0
假设4
• (yi, xi)为随机样本,i=1,2,⋯,n
对模型假设的讨论
• 线性条件期望不成立的情形 E(y|X)≠X’,E(u|X)≠0
• 来源
– 模型设定的错误 misspecification – 变量的误差 – 联立性
一致
• 解释变量的测量误差
• 真实的模型设定 y=X’β+z*+u
– z*含有测量误差,观察到 z=z*+v, E(z|x, z*)=z*,
– 实际的回归方程为: y = X’+z+ (u-v)=X’+z+ε
– 这时,由于 ε =u-v与z=z*+v相关,所以 E(ε|X,z)≠0,假设1不成立
联立性
遗漏变量
• 当被遗漏的变量与引入模型的其他解释变量相 关,被遗漏的变量进入到随机扰动项时,就会 导致解释变量与扰动项相关
• 假定真实的总体模型设定为:Y = X β + Wγ + u • 但是由于不可观察的原因,我们无法得到W的
数据,这样回归模型就成为:
Y = X β + ε ,其中 ε = Wγ + u
– 特别是,如果3>0,b3会高估教育对工资的影响
变量的测量误差
• 被解释变量的测量误差 • 真实的模型设定
y*=X’+u
• y*没有被准确观察到,观察到的是y
– y= y*+v,v为测量误差 – 模型变为:y=X’ +u+v – 如果E(v|X)=0,假设1没有被破坏 – 如果E(v|X)≠0,假设1不成立,OLS有偏且不
– 具体而言,投保人的个人健康状况一般稍差, 并愿意支付更高的保费
内生解释变量的影响
• 当 E(u|X ) ≠ 0 时,OLS估计量b有偏且不 一致
•
在大样本条件下,当
p
lim(
1 n
X ku)
0
,OLS估
计量b不一致
内生解释变量的探查
• 怎样判断模型的解释变量中出现了与随机扰动 项 相关的情形,并没有现成的检验方法
第二讲:
内生的解释变量与工具变量法
单方程线性模型
• 如果我们在经验分析中采用一个单方程线 性模型来研究x 对y 的影响,并得到相关的 政策结论,那么则要求方程
y = 0 + 1X1 + 2X2 + . . . kXk + u
能够反映X与y之间的因果关系,而不是单 纯的统计相关关系
假设1
• 条件期望线性与外生性假设
•