Chapter4-工具变量法

合集下载

Chapter4-工具变量法

Chapter4-工具变量法

Chapter4-⼯具变量法第1章两阶段最⼩⼆乘法在模型的基本假定中,解释变量与误差项正交保证了参数估计量的⽆偏性和⼀致性。

当这⼀假定被违背时,称解释变量是内⽣的。

常见的⼏种情况会导致内⽣问题:忽略重要的解释变量、变量的测量误差、变量的联⽴性。

⼯具变量估计是解决解释变量内⽣问题的基本⽅法。

本章介绍⼯具变量法和两阶段最⼩⼆乘法,以及模型内⽣性检验和过度识别约束检验等问题。

1.1 变量的内⽣性如果模型中的解释变量与误差项出现相关,即(')E =X u 0,称解释变量是内⽣的。

导致解释变量内⽣性的原因有很多,主要的⼏个原因包括:模型中忽略了重要的解释变量、变量因果关系的双向性、变量的测量误差等。

模型中出现内⽣解释变量时,OLS 估计量是不⼀致的。

根据OLS 估计量:11111?(')(')(')(')(')(')N N -----==+=+βX X X y βX X X u βX X X u (1.1) 由假定Rank(X)=K 和⼤数定律,样本均值的概率极限等于总体均值,可得:1Plim(')E(')N -=≡X X X X A , 1Plim(')E(')N -=≠X u X u 0。

(1.2)⼜由Slustky 定理,111Plim(')N ---=X X A 1?Plim E(')-=+≠ββA X u β (1.3)1.2 ⼯具变量估计1.2.1 ⼯具变量在如下模型中,y = X+ u第i 个解释变量x i 为内⽣解释变量。

如果存在变量z ,z 满⾜如下两个条件:正交条件:与u 不相关,即cor(z, u) = 0 相关条件:与x 相关,即cor(z, x i ) 0,也称为识别约束条件。

那么,z 被称作x i 的⼯具变量。

1.2.2 ⼯具变量估计设回归模型为:y =X β+u (1.4) 其中,解释变量为X (1×K )⼯具变量为Z (1×K )。

工具变量法工具变量法具体步骤

工具变量法工具变量法具体步骤

工具变量法工具变量法具体步骤工具变量法(Instrumental Variable Method)是一种用于处理内生性问题的统计方法,它通过引入一个“工具变量”来解决内生性问题。

工具变量是一个有着良好相关性但不会受到内生性干扰的变量,它可以用来代替内生变量,从而解决内生性的影响。

1.确定内生变量和工具变量:首先,需要确定研究中存在的内生变量和可能的工具变量。

内生变量是对所研究问题有影响的变量,而工具变量是与内生变量具有相关性但不会受到内生性干扰的变量。

内生性问题是由于内生变量的存在而导致的因果关系估计偏倚。

2.检验工具变量的相关性:接下来,需要检验所选取的工具变量与内生变量之间的相关性。

这可以通过计算相关系数或进行统计检验来实现。

如果工具变量与内生变量存在显著相关性,那么它可能是一个有效的工具变量。

3.确定工具变量的外生性:除了相关性外,工具变量还需要满足外生性的要求,即工具变量对因变量的影响是通过内生变量而不是其他方式引起的。

这可以通过进行实证分析来判断,例如通过回归模型来检验工具变量对因变量的影响是否通过内生变量进行中介。

如果工具变量的影响仅通过内生变量介导,则可以认为工具变量满足外生性的要求。

4.估计工具变量模型:一旦确定了有效的工具变量,可以使用工具变量法来估计因果关系。

工具变量法的核心思想是通过回归模型来解释内生变量对因变量的影响,并利用工具变量对内生变量进行替代。

通过将工具变量引入估计方程中,可以消除内生性的影响,从而得到无偏的因果关系估计。

5.进行统计推断:在估计了工具变量模型之后,可以进行统计推断来评估估计结果的显著性。

这可以通过计算标准误差、置信区间和假设检验等来实现。

统计推断可以帮助判断估计结果的可靠性,并验证因果关系的存在与否。

总结而言,工具变量法是一种用于解决内生性问题的统计方法。

它通过引入一个有效的工具变量来代替内生变量,消除内生性的干扰,从而得到无偏的因果关系估计。

工具变量法的具体步骤包括确定内生变量和工具变量、检验工具变量的相关性和外生性、估计工具变量模型,并进行统计推断。

工具变量法操作过程

工具变量法操作过程

工具变量法操作过程嘿,咱今儿就来唠唠工具变量法的操作过程哈。

你想啊,这工具变量法就像是一个巧妙的解题钥匙。

咱先得找到一个合适的工具变量,这可不容易哦,就跟找宝藏似的,得有一双火眼金睛。

这个工具变量得和咱关心的那个自变量有关系,还得满足一些特别的条件呢,可不能随随便便找一个。

然后呢,就开始建立模型啦。

这就好比搭积木,得一块一块稳稳地放上去。

把工具变量和其他相关的变量都放进去,看看它们能搭出个啥样的“建筑”来。

接下来就是进行估计啦。

这可不能马虎,得仔细着点儿。

就好像你在走一条不熟悉的路,得小心翼翼地试探着,看看怎么走才最靠谱。

在这过程中,你还得不断地检验呢。

检验啥?检验这个工具变量找得对不对呀,模型建得好不好呀。

这就像是给你的“作品”做个全面“体检”,有啥毛病赶紧找出来改掉。

你说这工具变量法是不是很有意思?它就像是一个魔法棒,能帮我们解决一些看似很难的问题。

比如说,我们想研究一个因素对另一个因素的影响,但中间可能有很多干扰因素。

这时候工具变量法就派上用场啦,它能帮我们把那些干扰因素给“过滤”掉,让我们更清楚地看到真正的关系。

而且哦,这工具变量法可不是随便谁都能玩好的,得有一定的专业知识和经验才行。

就像学骑自行车,一开始可能会摔倒,但多练几次就熟练啦。

你想想,如果没有工具变量法,我们很多研究不就没法进行啦?那得错过多少重要的发现呀!所以说,它可真是我们研究的好帮手呢。

咱再回过头来看看,找工具变量要细心,建模型要认真,估计要谨慎,检验要严格。

每一步都不能马虎,就跟盖大楼一样,根基得打牢了,每一层都得建得稳稳当当的。

总之呢,工具变量法是个很有用的方法,但要用好它可得下点功夫。

别嫌麻烦,等你真正掌握了,你就会发现它的魅力啦!就像学会了一门绝世武功,那感觉,倍儿爽!你还等啥,赶紧去试试吧!。

工具变量法

工具变量法

工具变量法一、工具变量法得主要思想在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。

在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。

经过变换,新得模型中,随机扰动项得表达式为:考伊克模型: ( ,为衰减率) (1、1);适应性期望模型:(,为期望系数)(1、2);部分调整模型:( ,为调整系数) (1、3)。

为原无限分布滞后模型中得扰动项,为变换后得扰动项。

在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。

那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。

在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。

一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。

内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。

外生解释变量:回归模型中得解释变量与随机扰动项无关;内生解释变量:回归模型中得解释变量与随机扰动项无关;了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。

工具变量,顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量(即内生变量)。

工具变量法

工具变量法
zt xt
ut )
1
ztut zt xt
(9.8.7)
(9.8.7)两边取期望值:
(ˆ1)
1
(
ztut zt xt
)
1
所以,ˆ1 不是1 的无偏估计量。
(9.8.7)两边取概率极限:
P lim
ˆ1
1
P lim P lim
1
n 1
n
ztut zt xt
1
COV COV
(zt ,ut) (zt , xt)
1

P lim ˆ1 1
表明 ˆ1 是1 的一致估计量。
(9.8.8) (9.8.9)
工具变量法是一种单方程估计方法,每次只适用于 模型中的一个结构方程。 显然,对于多个解释变量的单方程也是适用的。 三、工具变量法的有效性
y1 10 12 y2 1g1 y g1 11 x1 12 x2
第二步,分别用工具变量去乘结构方程,并对所有 的样本观测值求和,得到与未知参数一样多的线性 方程组成的方程组。解方程组就得到结构参数的估
二、工具变量法的应用举例 1.设有一个解释变量的结构方程:
yt 0 1 xt ut
(9.8Байду номын сангаас1)
其中xt是该方程所在模型中的内生变量,因而 COV(xt,ut) ≠ 0。在模型的其他结构方程中可找到这 样的外生变量zt,zt与xt高度相关,但zt与ut不相关即 COV(zt,ut)=0,即zt
1k1 xk1 u1
(9.8.20)
模型(9.8.20)共有(g1-1)个内生说明变量和k1个前定
变量
1.若方程(9.8.20)
由阶条件知
K1 G1* G 1

工具变量法

工具变量法

工具变量法Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。

在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。

经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。

t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。

在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。

那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法就是工具变量法。

在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。

一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。

内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y 。

外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。

工具变量法例子及解析

工具变量法例子及解析

工具变量法例子及解析工具变量法是经济学中常用的一种回归分析方法,它的作用是削弱内生性问题对回归结果的影响。

本文将通过具体例子和分析,介绍工具变量法的原理、应用和重要性。

一、工具变量法原理工具变量法的核心思想是利用一个与内生变量有关的外生变量来代替内生变量,既能够在一定程度上削弱内生性问题,又能够保留回归模型的一般结构。

其原理可以简单归纳为以下几个步骤:1. 利用可靠性高的工具变量代替内生变量2. 使用工具变量回归得到内生变量的估计值3. 将内生变量的估计值代入原始回归模型,得出正确的回归效果。

通过以上三个步骤,工具变量法可以尽可能地消除内生性问题对回归分析的干扰,从而得到准确的分析结果。

二、工具变量法应用在实际经济研究中,工具变量法的应用非常广泛,以下是几个常见的应用:1. 教育和收入的关系分析这是一个非常经典的实证研究,研究者发现,教育与收入之间存在内生性问题,即教育水平可能受到家庭收入的影响。

为了解决这个问题,研究者使用父母教育程度作为工具变量,用它来代替受教育程度对收入的内生性影响,最终得出正确的研究结果。

2. 运动员收入与绩效的关系分析在研究运动员收入与绩效关系的时候,由于运动员自身的能力或健康状况等因素可能会影响分析结果,因此需要使用工具变量来解决内生性问题。

例如,研究者可以使用运动员所属的地理区域作为工具变量,用它来代替个人因素对收入和绩效的影响,从而得出更加准确的研究结果。

3. 货币政策与经济增长的关系分析在研究货币政策对经济增长的影响时,通常会使用实际利率作为工具变量来解决内生性问题。

由于实际利率受银行制度、资本市场以及政府债券利率等多种因素的影响,因此能够代替内生性较强的利率变量,得出更加准确的研究结果。

三、工具变量法的重要性工具变量法在经济学研究中具有非常重要的地位,它的主要作用在于解决内生性问题,从而得出更加准确的研究结果。

由于内生性问题可能会导致回归结果的偏误,因此如果不进行工具变量法处理,可能得出的结论会与实际情况有较大差距,这对于政策的制定和实施将会带来严重影响。

工具变量法IV两阶段最小二乘法TSLS

工具变量法IV两阶段最小二乘法TSLS

YY12
b12Y2 b23Y3
c11 X1 c12 X 2 c23 X 3 u2
u1
Y3 b31Y1 b32Y2 c33 X 3 u3
其中:Y1,Y2 ,Y3 为内生变量, X1, X 2 , X 3为外生变量。
Dongbei University Of Finance & Economics
2)方程组系统估计法 包括:三阶段最小二乘法(3SLS)、完全信息最
大似然估计法(FIML)等。这些方法是对模型中所有 结构方程的参数同时进行估计,从而获得模型全部参 数的估计值。它利用了模型的全部方程信息,称为完 全信息方法。
Dongbei University Of Finance & Economics
/ ˆ23 bˆ12ˆ21
cˆ12 ˆ12 bˆ12ˆ22
若已知πij,即可解出惟一的cij,第一个结构方程得以 估计。这样,结构方程的参数估计值用传统的OLS就 得到了。
Dongbei University Of Finance & Economics
ILS的步骤
一、先对模型作识别判断,找出恰好识别的方程; 二、利用简约式和结构式参数的关系式 B
Y1 11 X1 12 X 2 13 X 3 v1 Y2 21 X1 22 X 2 23 X 3 v2 Y3 31 X1 32 X 2 33 X 3 v3
Dongbei University Of Finance & Economics
第一阶段是对结构方程右端所包含的所有内生变量(作为解 释变量)所对应的简化式方程进行OLS估计,得到内生变量的估计 (回归)值;

工具变量法

工具变量法

工具变量法一.为什么需要使用工具变量法?当模型存在内生解释变量问题,一般为以下三种情形:(1)遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。

否则,就会造成解释变量与残差项相关,从而引起内生性问题。

(2)解释变量与被解释变量相互影响(3)度量误差 (measurement error ):由于在关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。

Ex :i 01122Y i i k ik i X X X ββββμ=+++⋅⋅⋅++ 其中:X 2为内生解释变量 当22Cov(X ,)=E[X ]0i i i i μμ≠时,内生解释变量与随机干扰项同期相关。

此时会导致回归参数估计量是有偏的且不一致,需要用工具变量法进行回归。

二.如何使用工具变量? (一)判断是否需要用工具变量当存在内生性变量时,则需使用工具变量,所以需要对内生性变量进行检验。

在实践中,往往是通过经济学理论先说明是否存在内生性变量,最后再通过检验证明确实存在内生变量。

(1)豪斯曼检验(Hausman )原假设H 0:所有解释变量均为外生变量将内生解释变量关于工具变量与外生变量进行OLS 回归估计 记录残差序列(^^IV OLS ββ−),加入原模型后进行OLS 估计 结果:若差值依概率收敛于0,接受原假设;反之,拒绝。

(2)杜宾-吴-豪斯曼检验(DWH )注:存在异方差的情况下传统豪斯曼检验不适用。

回归模型:'1122y x x ββε=++ z=(x 1,z 2) 第一阶段回归:''21x x z v γδ=++ 检验扰动项v 与ε相关性模型:=v+ερξ 其中:ρ为ε对v 回归系数,ε与v 不相关则ρ=0. 对 ^'''1122y=x x v e ββρ+++ 回归 对原假设H 0:ρ=0. 进行t 检验。

工具变量法~

工具变量法~

工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法就是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。

在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。

经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (1、1); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)(1、2);部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) (1、3)。

t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。

在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至就是有偏的这样严重的问题。

那么,我们就是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -?在这里,一个可行的估计方法就就是工具变量法。

在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。

一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。

内生解释变量的典型情况之一就就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y -。

外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量与外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法与普通最小二乘法就是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计就是非一致的,这时就需要引入工具变量。

工具变量法代码

工具变量法代码

工具变量法代码工具变量法(Instrumental Variables,简称IV)是一种常用的估计因果效应的方法。

它主要针对的是存在内生性问题的经济学模型,如回归分析中的自变量与误差项存在相关关系。

下文将介绍工具变量法的基本原理,以及其在实践中的使用方法和代码实现。

一、基本原理工具变量法的基本思想是利用一个或多个与内生性自变量相关但不受误差项影响的外生性变量(即工具变量)来代替内生性自变量,在保证模型符合经济学意义的前提下,得到更精确的因果效应估计。

具体来说,对于回归模型:y = α + βx + u其中,x为内生性自变量,u为误差项,我们考虑引入一个外生变量z作为工具变量,那么可以构建如下两个求解方程:x = δ + ρz + vy = α + β(δ + ρz + v) + u其中,δ和ρ是未知的系数。

第一个方程是用工具变量估计内生性自变量的回归式,第二个方程则是运用估计出的内生性自变量对y进行回归。

对于外生性工具变量z,我们可以假定它只会通过自变量x对y产生影响,而不会通过误差项u对y产生影响,即:Cov(z,u) = 0而通过IV估计,我们可以得到内生性自变量x在z上的部分效应(partial effect),从而得出因果效应的估计。

二、实践应用在实践中,工具变量法常常被用来研究各种经济学问题。

例如,研究教育水平对收入的影响、研究医疗保险对医疗消费的影响等。

下面以一个简单的例子来说明如何使用工具变量法。

假设我们想研究家庭收入对孩子的大学入学率的影响,但是我们发现家庭收入存在内生性问题,因为它与其他一些难以观测的因素(如家庭背景、社会阶层等)存在相关关系。

我们考虑使用父母的教育水平和收入作为工具变量,来估计家庭收入与大学入学率之间的因果关系。

代码实现在工具变量法的实现中,常常需要用到Python中的statsmodels(回归模型和统计测试)和pandas(数据处理)两个库。

我们假设有如下数据集:- family_income:家庭收入(千元) - education:父母教育水平(0-未受过教育,1-小学,2-初中,3-高中,4-大学) - college:是否考入本科(0-否,1-是)- random_var:随机变量,用于混淆我们首先看一下家庭收入与大学入学率是否存在内生性问题,可以通过构建回归模型来检验:import statsmodels.api as sm import pandas as pddf = pd.read_csv('data.csv')x = df[['family_income']] y = df[['college']] x = sm.add_constant(x) results = sm.OLS(y, x).fit() print(results.summary())运行上述代码后,我们可以得到回归模型的结果,其中P值可以判断内生性是否显著。

(9)12.8工具变量法(IV法)

(9)12.8工具变量法(IV法)

一、工具变量法的步骤
在联立方程模型中,所选择的工具变量应满足以下条 (1) (2) 它必须是真正的前定变量,因而与结构方程中的
(3) 它必须同结构方程中的其他前定变量相关性很小,
(4) 如果在同一结构方程中使用了一个以上的工具变 量,这些工具变量之间的相关性也须很小,避免产生
人们自然会想到模型中的前定变量一般都能满足上 述条件,所以每一个前定变量都可以作为内生说明
(12.8.16)
模型(12.8.16)共有(g1-1)个内生说明变量和k1 1.若方程(12.8.16)
K1 G1* G 1

K
* 1
G
G1*
1
g1
1

(12.8.17)
(12.8.17)表示方程(12.8.16)中所不包含的前定变量 xk1+1,xk1+2,…,xk的个数恰好等于(12.8.16)中作为 说明变量的内生变量y2, y3,…,的个数,工具变量的选 择是唯一的(同样x1,x2,…,xk1本身作为自己的工 具变量),作拟正规方程组,可求得结构参数唯一的 工具变量法估计值。因此,工具变量法对于恰好识 别的结构方程是一种有效的方法。
(3)前定变量多于一个时,要求它们之间又要满足不 相关,有时是困难的。 (4)由于u是不可观察的,很难确定它与工具变量无关。 (5)此方法估计出的参数估计值是非无偏,却是一致估 计量。 由于以上原因,在实际中,人们很少直接用工具变量 法对结构参数进行估计,但它为二阶段最小二乘法作
由(12.8.1)有
0 y 1x u
(12.8.2)
用zt乘(12.8.1)
yt zt 0 zt 1 zt xt zt ut
(12.8.3)
由于E(ut)=0,所以,(12.8.2)

IV-工具变量法:第一阶段系数符号确定时的小样本无偏估计

IV-工具变量法:第一阶段系数符号确定时的小样本无偏估计

IV-工具变量法:第一阶段系数符号确定时的小样本无偏估计 连享会主页:New!lianxh命令发布了:GIF 动图介绍随时搜索 Stata 推文、教程、手册、论坛,安装命令如下: . ssc install lianxh 连享会 · 最受欢迎的课2021 Stata 寒假班⌚ 2021 年 1.25-2.4主讲:连玉君 (中山大学);江艇 (中国人民大学)作者:甘徐沁 (厦门大学)E-Mail:*****************目录1. 引言2. 理论基础3. Stata 应用4. 总结5. 参考文献6. 相关推文温馨提示:文中链接在微信中无法生效。

请点击底部「阅读原文」。

Source: Andrews, Isaiah, and Timothy B. Armstrong. 'Unbiased instrumentalvariables estimation under known first‐stage sign.' Quantitative Economics 8, no.2 (2017): 479-503. -Link-,-MS-cite-1. 引言工具变量是经济学实证研究中应用最为广泛的几种方法之一。

关于 IV,连享会此前已发布了赌片提问社区有过以下一些资料,感兴趣的小伙伴们可以参考:'IV:可以用内生变量的滞后项做工具变量吗?''Stata: 工具变量法 (IV) 也不难呀!''IV-估计:工具变量不外生时也可以用!''工具变量-IV:排他性约束及经典文献解读'传统工具变量的统计推断基于大样本理论,即在给定工具变量和内生变量强相关关系情况下,样本趋于无穷大时,2SLS 估计量是一致估计。

而在弱工具变量情况下过度识别的模型系数偏误很大。

尽管过去有不少学者尝试使用各种方法来解决这种偏误,但是这些改进的估计量,在有限样本或弱工具情况下仍然是有偏的。

工具变量(IV)详细解说 ppt课件

工具变量(IV)详细解说  ppt课件

PPT课件
5
IV
So where can you find an instrumental variable?
One possible source of instruments for schooling differences in costs due, say, to loan policies or other subsidies that vary independently of ability or earnings potential.
A second source of variation in schooling is institutional constraints.
E.G.
Angrist and Krueger (1991) exploit the variation induced by compulsory schooling laws in a paper that typifies the use of “natural experiments” try to eliminate omitted variables bias.
(4) Solving the problem of omitted variables bias.(most important )
PPT课件
2
IV
4.1 IV and causality
First in a restricted model with constant effects.
causalit y
estimated by
第一步:用 Xi 和 Zi 回归
第二步:用 si 和 Xi 回归 Yi
Yi ' X i si 2i

工具变量法排除焦点的方法

工具变量法排除焦点的方法

工具变量法排除焦点的方法说实话工具变量法排除焦点这事儿,我一开始也是瞎摸索。

我折腾了好久,总算找到点门道。

我刚开始尝试的时候,都不知道从哪儿下手。

我就先去大量地阅读相关的文章和书籍,感觉就像在黑暗里摸东西,抓到啥都想看看是不是能用的。

比如说,我看到一些例子里提到某个变量可能是工具变量,我就立马想着在我的研究里能不能行得通,完全是没头苍蝇似的乱撞。

我试过很多方法,有一次我以为自己找到了一个很好的工具变量,就兴冲冲地开始计算。

结果发现没有排除焦点,当时那个挫败感啊。

后来我仔细分析才发现,这个变量虽然看似满足一些条件,但它和误差项之间还是存在隐匿的关联,这就导致没办法很好地排除焦点。

这就好比你以为你找到一把能开锁的钥匙,结果那是一把和锁芯内部卡住的坏钥匙,根本没法正常用。

我后来就总结了一下经验。

一是要非常仔细地考察变量之间的逻辑关系,不能只看表面。

就拿之前的失败例子来说,我不能光看到这个变量和自变量有相关性,就觉得能当工具变量,还得深挖它和误差项到底有没有潜在联系。

二是要进行假设检验,这一步可不能省略。

我以前总是偷懒,大概看一下就觉得行了。

但是在足够多次的尝试失败后,我知道这是必不可少的步骤。

比如说,假设在某个经济模型里,用收入水平作为一个工具变量去研究消费行为和其他因素的关系。

这时候就得假设在不同的误差项的情况下,收入水平是如何变化的,并且通过数据去验证这种假设是不是合理。

还有一件事我得提醒,我不确定这个是不是所有人都会忽略,但我自己曾经就没太注意这个问题。

就是在选择工具变量的时候,不要只局限在你常用的那些变量的范围里。

有时候需要跳出去,从更宏观或者更微观的角度去找可能的工具变量。

我之前就是在传统的那几个变量里绕圈子,就没得到理想的结果。

有一次偶然看到一个和我的研究主题看似关系不那么紧密,但从逻辑链条推导下来是完全符合要求的变量,这个发现让我恍然大悟啊。

这就像你一直在自己家的小院子里找东西,怎么找都找不到,结果一抬头,发现东西在隔壁院子里呢。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第1章 两阶段最小二乘法在模型的基本假定中,解释变量与误差项正交保证了参数估计量的无偏性和一致性。

当这一假定被违背时,称解释变量是内生的。

常见的几种情况会导致内生问题:忽略重要的解释变量、变量的测量误差、变量的联立性。

工具变量估计是解决解释变量内生问题的基本方法。

本章介绍工具变量法和两阶段最小二乘法,以及模型内生性检验和过度识别约束检验等问题。

1.1 变量的内生性如果模型中的解释变量与误差项出现相关,即(')E =X u 0,称解释变量是内生的。

导致解释变量内生性的原因有很多,主要的几个原因包括:模型中忽略了重要的解释变量、变量因果关系的双向性、变量的测量误差等。

模型中出现内生解释变量时,OLS 估计量是不一致的。

根据OLS 估计量:11111ˆ(')(')(')(')(')(')N N -----==+=+βX X X y βX X X u βX X X u (1.1) 由假定Rank(X)=K 和大数定律,样本均值的概率极限等于总体均值,可得:1Plim(')E(')N -=≡X X X X A , 1Plim(')E(')N -=≠X u X u 0。

(1.2)又由Slustky 定理,111Plim(')N ---=X X A1ˆPlim E(')-=+≠ββA X u β (1.3)1.2 工具变量估计1.2.1 工具变量在如下模型中,y = X β+ u第i 个解释变量x i 为内生解释变量。

如果存在变量z ,z 满足如下两个条件: 正交条件:与u 不相关,即cor(z, u) = 0相关条件:与x 相关,即cor(z, x i ) ≠ 0,也称为识别约束条件。

那么,z 被称作x i 的工具变量。

1.2.2 工具变量估计设回归模型为:y =X β+u (1.4)其中,解释变量为X (1×K )工具变量为Z (1×K )。

Z 作为工具变量满足正交条件和识别约束条件。

在正规方程组ˆ'()-=X y X β0中,用Z 替换X , ˆ'()-=Z y X β0 (1.5) 解此方程组,可得IV 估计量为:1ˆ(')'-=βZ X Z y (1.6) 将y =X β+u 带入估计量中,可得11ˆ(')'()(')'--=+=+βZ X Z X βu βZ X Z u 可以证明,1ˆE()(')'E()-=+=ββZ X Z u β 1121121ˆVar()E[(')''(')](')'(')(')σσ-----==≠βZ X Z uu Z X Z Z X Z Z X Z X X即IV 估计量是无偏的,但不是有效的。

同时,由111111ˆPlim()Plim[(')(')]Plim(')Plim(')E()n n n i i n N N N N ---→∞→∞--→∞-→∞=+===ββZ X Z u Z X AZ u Z u 0可知,IV 估计量是一致的。

1.3 两阶段最小二乘法设模型中存在K 个内生解释变量,存在L=K 个工具变量。

每个工具变量都必须满足正交条件和相关条件。

如果L=K ,称为恰好识别;如果L>K ,称为过度识别。

即利用其中不同的K 个工具变量,都可以得到不同的估计量。

当然,用任何一组工具变量得到的估计量都是一致的。

因此,现在的问题是如何在这L 个工具变量中找到K 个工具变量使其估计量最有效。

这即是两阶段最小二乘法。

1.3.1 TSLS 估计设模型为:=+y X βu (1.7)其中,解释变量为X (1×K )工具变量为Z (1×L )。

用Z 作为工具变量,Z 满足正交条件和识别约束条件。

首先回归模型=+X Z Πv (1.8)可得1ˆ(')-=ΠZ Z ZX ,并提取拟合值1ˆˆ(')-==X Z ΠZ Z Z ZX 。

令1(')'-=ZP Z Z Z Z ,P Z 为对称幂等矩阵,则ˆ=ZX P X 。

然后,利用ˆX 做为工具变量回归模型,可得IV 估计量为: 11ˆˆˆ(')'(')(')--==ZZβX X X y X P X X P y (1.9) 而ˆˆˆ''''()''====Z Z Z Z ZX X X P X X P P X P X P X X X 。

由此可得: 11ˆˆˆˆˆˆ(')'(')'--==βX X X y X X X y (1.10) 而1ˆˆˆ(')'-X X X y 是y 对ˆX 的OLS 回归估计量。

因此,利用ˆX作为工具变量作IV 回归与利用ˆX 替换X 作LS 回归是等价的。

也正因为此,我们称之为两阶段最小二乘法。

估计步骤归纳如下。

Step1:利用X 对Z 作OLS 回归:=+X Z Πv ;提取拟合值ˆX。

Step2:用ˆX替换X ,直接作OLS 回归。

1.3.22SLS 的渐进特征假定1:令X 表示解释变量(包括常数变量1)。

假定存在L 个工具变量构成的(1×L )向量Z ,满足E(Z 'u )=0。

Z 包含模型中的外生解释变量。

如果模型中存在内生变量,则Z 必须包含模型以外的外生变量。

假定2:(A )Rank(Z 'Z )=L ;(B )Rank(Z 'X )=K 。

(A )条件是指L 个向量Z 不存在完全的线性关系;条件(B )是指Z 与X 充分线性相关,即所有工具变量都必须满足识别约束条件。

条件(B )称为秩条件。

秩条件成立的必要条件是L ≥K 。

即,工具变量的个数至少等于解释变量的个数,称之为阶条件。

由X =Z ∏+v (其中,∏为L ×K 矩阵),两侧同时乘Z 并求期望可得:1'''E(')E(')[E(')]E(')-=+⇒=⇒=Z X Z Z ΠZ v Z X Z Z ΠΠZ Z Z X (1.11)令X *=Z ∏ = Z[E(Z 'Z )]-1 E(Z 'X )。

在X β+u =y 两边同时乘以X *可得,X *'X β + X *'u = X *'y (1.12)求期望可得:E(X *'X )β= E(X *'y ) (1.13)而X *'X = X *'Z ∏ + X *'v , E(X *'X ) = E(X *'Z )∏ + E(X *'v ) = E(X *'Z )∏ E(X *'Z )= E[(X -v ) 'Z ] = E[X 'Z - v 'Z ] = E(X 'Z )将∏ = [E(Z 'Z )]-1 E(Z 'X )带入上两个式子中,可得:E(X *'X ) = E(X 'Z ) [E(Z 'Z )]-1 E(Z 'X )= E(X 'Z ) [E(Z 'Z )]-1 E(Z 'X ) (1.14) E(X *'y ) = E(X 'Z ) [E(Z 'Z )]-1 Z ' y注意,上式中Z 是(1×L )阶,X 是(1×K )阶。

因此, X 'Z 是(K ×L )阶,Z 'Z 是(L ×L )阶,Z 'X 是(L ×K )阶。

如果要估计出β,E(X *'X )必须是非奇异的,当且仅当E(Z 'X )的秩为K 。

将其带入β = [E(X *'X )]-1 E(X *'y ),可得β = [E(X *'X )]-1 E(X *'y )= {E(X 'Z ) [E(Z 'Z )]-1 E(Z 'X )} -1{E(X 'Z ) [E(Z 'Z )]-1Z 'y} (1.15)β的TSLS 估计量为:{}{}-1112ˆ'(')(')'(')'SLS--=βX Z Z Z Z X X Z Z Z Z y (1.16) 1.一致性由2SLS 估计量可得:1-1121-111111-11111ˆ['(')(')]['(')'()]['(')(')]['(')'][(')(')(')][(')(')(')]SLS N N N N N N ------------=+ =+ =+βX Z Z Z Z X X Z Z Z Z X βu βX Z Z Z Z X X Z Z Z Z u βX Z Z Z Z X X Z Z Z Z u (1.17)由大数定律和Slustky 定理,可得:2ˆPlim SLS =ββ。

即2SLS 估计量具有一致性。

2.渐进正态性根据1Plim(')E(')i i N -==Z u Z u 0,并由中心极限定理,1/2'~(,)N Normal -Z u 0B 。

同方差假定下,22E(')E(')i i i i u σ==B Z Z Z Z ,2=var()i u σ。

根据Slutsky 定理,1111-11111/22ˆ)[(')(')(')][(')(')(')]SLSN N N N N N ---------=ββX Z Z Z Z X X Z Z Z Z u (1.18)定理:在假定1、22ˆ)SLS -ββ渐进服从正态分布,均值为0,方差矩阵为{}-121E(')E(')E(')σ-X Z Z Z Z X (1.19)其中,1E(')E(')E(')-X Z Z Z Z X 可以用样本进行估计,2σ的估计量公式为:2121ˆˆ()Ni i N K u σ-==-∑ 其中,2ˆˆi i i SLS u y =-x β,而不是第二阶段的残差项。

相关文档
最新文档