第2讲_工具变量法最终版.ppt
Chapter4-工具变量法
Chapter4-⼯具变量法
第1章两阶段最⼩⼆乘法
在模型的基本假定中,解释变量与误差项正交保证了参数估计量的⽆偏性和⼀致性。当这⼀假定被违背时,称解释变量是内⽣的。常见的⼏种情况会导致内⽣问题:忽略重要的解释变量、变量的测量误差、变量的联⽴性。⼯具变量估计是解决解释变量内⽣问题的基本⽅法。本章介绍⼯具变量法和两阶段最⼩⼆乘法,以及模型内⽣性检验和过度识别约束检验等问题。
1.1 变量的内⽣性
如果模型中的解释变量与误差项出现相关,即(')E =X u 0,称解释变量是内⽣的。导致解释变量内⽣性的原因有很多,主要的⼏个原因包括:模型中忽略了重要的解释变量、变量因果关系的双向性、变量的测量误差等。
模型中出现内⽣解释变量时,OLS 估计量是不⼀致的。根据OLS 估计量:
11111?(')(')(')(')(')(')N N -----==+=+β
X X X y βX X X u βX X X u (1.1) 由假定Rank(X)=K 和⼤数定律,样本均值的概率极限等于总体均值,可得:
1Plim(')E(')N -=≡X X X X A , 1Plim(')E(')N -=≠X u X u 0。 (1.2)
⼜由Slustky 定理,
111Plim(')N ---=X X A 1?Plim E(')-=+≠β
βA X u β (1.3)
1.2 ⼯具变量估计
1.2.1 ⼯具变量
在如下模型中,
y = X
+ u
第i 个解释变量x i 为内⽣解释变量。如果存在变量z ,z 满⾜如下两个条件:正交条件:与u 不相关,即cor(z, u) = 0 相关条件:与x 相关,即cor(z, x i ) 0,也称为识别约束条件。
工具变量法工具变量法具体步骤
工具变量法工具变量法具体步骤
工具变量法(Instrumental Variable Method)是一种用于处理内生性问题的统计方法,它通过引入一个“工具变量”来解决内生性问题。工具变量是一个有着良好相关性但不会受到内生性干扰的变量,它可以用来代替内生变量,从而解决内生性的影响。
1.确定内生变量和工具变量:首先,需要确定研究中存在的内生变量和可能的工具变量。内生变量是对所研究问题有影响的变量,而工具变量是与内生变量具有相关性但不会受到内生性干扰的变量。内生性问题是由于内生变量的存在而导致的因果关系估计偏倚。
2.检验工具变量的相关性:接下来,需要检验所选取的工具变量与内生变量之间的相关性。这可以通过计算相关系数或进行统计检验来实现。如果工具变量与内生变量存在显著相关性,那么它可能是一个有效的工具变量。
3.确定工具变量的外生性:除了相关性外,工具变量还需要满足外生性的要求,即工具变量对因变量的影响是通过内生变量而不是其他方式引起的。这可以通过进行实证分析来判断,例如通过回归模型来检验工具变量对因变量的影响是否通过内生变量进行中介。如果工具变量的影响仅通过内生变量介导,则可以认为工具变量满足外生性的要求。
4.估计工具变量模型:一旦确定了有效的工具变量,可以使用工具变量法来估计因果关系。工具变量法的核心思想是通过回归模型来解释内生变量对因变量的影响,并利用工具变量对内生变量进行替代。通过将工具变量引入估计方程中,可以消除内生性的影响,从而得到无偏的因果关系估计。
5.进行统计推断:在估计了工具变量模型之后,可以进行统计推断来评估估计结果的显著性。这可以通过计算标准误差、置信区间和假设检验等来实现。统计推断可以帮助判断估计结果的可靠性,并验证因果关系的存在与否。
工具变量法
工具变量法
一、工具变量法得主要思想
在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。经过变换,新得模型中,随机扰动项得表达式为:
考伊克模型: ( ,为衰减率) (1、1);
适应性期望模型:(,为期望系数)(1、2);
部分调整模型:( ,为调整系数) (1、3)。
为原无限分布滞后模型中得扰动项,为变换后得扰动项。
在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。
一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。
外生解释变量:回归模型中得解释变量与随机扰动项无关;
内生解释变量:回归模型中得解释变量与随机扰动项无关;
了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。
工具变量法
工具变量法
Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】
工具变量法
一、工具变量法的主要思想
在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。经过变换,新的模型中,随机扰动项的表达式为:
考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();
部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。那么,我们是否可以找到一个与
1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法
就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。 一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相
工具变量方法原理
工具变量方法原理
工具变量方法(Instrumental Variable Method)是一种常用的实证研究方法,用于解决因果关系中的内生性问题。当研究主变量与随机抽样原则(即不相关性假设)无关时,内生性问题会出现。在这种情况下,使用传统的OLS(Ordinary Least Squares)回归模型估计将导致参数估计的无效性。工具变量方法通过利用一个或多个工具变量,来解决内生性问题,并得到一致的估计结果。
工具变量是一个满足两个条件的变量:首先,工具变量与内生变量相关。其次,工具变量与干扰项不相关。这样,可以通过回归工具变量来消除内生性问题,从而得到因果关系的一致估计。
工具变量方法的基本思想是在原始模型中引入一个工具变量,在回归分析中用工具变量代替内生变量。这样,内生变量与工具变量的回归关系就代替了内生变量与因变量的直接关系。通过估计工具变量与因变量的关系,就可以得到一致的因果关系估计。
Y=α+βX+ε
其中,Y是因变量,X是内生变量,α和β是参数,ε是误差项。由于X与ε存在内生性问题,参数估计将变得无效。
为了解决内生性问题,引入一个工具变量Z。使用工具变量方法得到的回归方程为:
X=α+γZ+ε'
其中,γ是工具变量与被解释变量的关系。
将工具变量引入原始模型,得到:
Y=α+β(α+γZ+ε')+ε
化简后可以得到:
Y=α+βα+βγZ+βε'+ε
由于内生性问题,βγ≠0,OLS估计将无效。但是,由于工具变量
与ε无相关性,βε'=0。因此,使用工具变量方法可以得到一致的估计
结果,即β的一致估计。
工具变量法2SLS与GMM
1
第 10 章 工具变量,2SLS 与 GMM
10.1 解释变量与扰动项相关的例子
例 农产品市场均衡模型
⎧q d = α + α p + u (需求)
⎪ t 0 1 t t ⎨ q s = β + β p + v
(供给) t ⎪ q d 0 1 t t = q s
(均衡)
⎩ t
t
令q ≡q d=q s,可得
t t t
⎧q t =α0+α1 p t +u t
⎨
q =β+βp +v
⎩t 0 1 t t
两个方程中的被解释变量与解释变量完全一样。
如直接作回归q −O−LS−→p,估计的是需求函数还是供给函数?
t t
2
图10.1 需求与供给决定市场均衡
3
4
1 1 1 1
1 1
把线性方程组中的( p t , q t )看成是未知数(内生变量),把(u t , v t ) 看作已知,可求解( p t , q t )为(u t , v t ) 的函数:
⎧
p = p (u ,v ) = β0 - α0 + v t - u t ⎪ t t t t α - β α - β ⎨ 1 1 1 1 ⎪q = q (u ,v ) = α1β0 - α0 β1 + α1v t - β1u t ⎩⎪ t t t t α - β α - β
由于 p t 为(u t , v t ) 的函数,故Cov( p t , u t ) ≠ 0,Cov( p t , v t ) ≠ 0。
OLS 估计值αˆ1, βˆ 不是α , β 的一致估计量。
称这种偏差为“联立方程偏差”(simultaneity bias)或“内生变量
偏差”(endogeneity bias)。
第2讲_工具变量法
– 父母的教育水平 – 家庭收入 – 同胞的教育水平 – 18岁时家庭所在地的蓝领工资、失业率 – 家庭住址距离大学校区的距离 – 相关的义务教育法规
IV估计量bIV的统计性质
• IV估计量在有限样本的条件下表现并不理想
• 同时,在大样本的条件下,IV估计量的渐进 正态性将不会出现。
条件2.工具外生性
• 该条件要求
E(Z′u) = 0
• 上式表明,Z与u无关,Z具有外生性 • 在大样本条件下,上式还可表述为
p lim(1 Zu) 0 n
• 由于u不可观测,这个条件在理论上是不可 检验的,但在现实中,当满足某些条件 时 ,可以进行事后检验
– 具体而言,投保人的个人健康状况一般稍差, 并愿意支付更高的保费
内生解释变量的影响
• 当 E(u|X ) ≠ 0 时,OLS估计量b有偏且不 一致
•
在大样本条件下,当
p
lim(
1 n
X ku)
0
,OLS估
计量b不一致
内生解释变量的探查
• 怎样判断模型的解释变量中出现了与随机扰动 项 相关的情形,并没有现成的检验方法
• 经验分析中通常都是以行业/企业产出水平或劳 动生产率作为被解释变量,通过该变量对于FDI的 回归系数的符号、大小以及显著程度,来判断FDI 对于引入外资的行业/企业业绩变化的实际影响
工具变量法
工具变量法
一.为什么需要使用工具变量法?
当模型存在内生解释变量问题,一般为以下三种情形:
(1)遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。否则,就会造成解释变量与残差项相关,从而引起内生性问题。 (2)解释变量与被解释变量相互影响
(3)度量误差 (measurement error ):由于在关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。
Ex :i 01122Y i i k ik i X X X ββββμ=+++⋅⋅⋅++ 其中:X 2为内生解释变量 当22Cov(X ,)=E[X ]0i i i i μμ≠时,内生解释变量与随机干扰项同期相关。 此时会导致回归参数估计量是有偏的且不一致,需要用工具变量法进行回归。
二.如何使用工具变量? (一)判断是否需要用工具变量
当存在内生性变量时,则需使用工具变量,所以需要对内生性变量进行检验。在实践中,往往是通过经济学理论先说明是否存在内生性变量,最后再通过检验证明确实存在内生变量。 (1)豪斯曼检验(Hausman )
原假设H 0:所有解释变量均为外生变量
将内生解释变量关于工具变量与外生变量进行OLS 回归估计 记录残差序列(^
^
IV OLS ββ−),加入原模型后进行OLS 估计 结果:若差值依概率收敛于0,接受原假设;反之,拒绝。
(2)杜宾-吴-豪斯曼检验(DWH )
注:存在异方差的情况下传统豪斯曼检验不适用。 回归模型:'1122y x x ββε=++ z=(x 1,z 2) 第一阶段回归:''21x x z v γδ=++ 检验扰动项v 与ε相关性模型:=v+ερξ 其中:ρ为ε对v 回归系数,ε与v 不相关则ρ=0. 对 ^
工具变量法(二):弱工具变量
工具变量法(二):弱工具变量
世上没有完美的计量方法,因为所有的计量方法与模型均依赖于一定的前提假设。因此,在估计完计量模型后,通常需要对模型的前提假设进行检验,称为“诊断性检验”(diagnostic checking)或“模型检验”(model checking)。
工具变量法也不例外。工具变量法的成立依赖于有效的工具变量(valid instruments),即所使用的工具变量须满足相关性(与内生解释变量相关)与外生性(与扰动项不相关)。
工具变量的相关性(Instrument Relevance)
在大样本下,2SLS为一致估计。但对于大多数实践中的有限样本(finite sample),2SLS估计量依然存在偏差(bias),并不以真实参数为其分布的中心,即
而且,如果工具变量与内生变量的相关性较弱,则 2SLS 的偏差会变得更为严重。直观来看,2SLS 的基本思想是通过外生的工具变量,从内生变量中分离出一部分外生变动(exogenous variations),以获得一致估计。
如果工具变量与内生变量的相关性很弱,则通过工具变量分离出的内生变量之外生变动仅包含很少的信息。因此,利用这些少量信息进行的工具变量法估计就不准确,即使样本容量很大也很难收敛到真实的参数值。这种工具变量称为“弱工具变量”(weak instruments)。
弱工具变量的后果
弱工具变量的后果类似于样本容量过小,会导致 2SLS 的小样本性质变得很差,而 2SLS 的大样本分布也可能离正态分布相去甚远,致使基于大样本理论的统计推断失效。
工具变量法
工具变量法
一.为什么需要使用工具变量法?
当模型存在内生解释变量问题,一般为以下三种情形:
(1)遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。否则,就会造成解释变量与残差项相关,从而引起内生性问题。 (2)解释变量与被解释变量相互影响
(3)度量误差 (measurement error ):由于在关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。
Ex :i 01122Y i i k ik i X X X ββββμ=+++⋅⋅⋅++ 其中:X 2为内生解释变量 当22Cov(X ,)=E[X ]0i i i i μμ≠时,内生解释变量与随机干扰项同期相关。 此时会导致回归参数估计量是有偏的且不一致,需要用工具变量法进行回归。
二.如何使用工具变量? (一)判断是否需要用工具变量
当存在内生性变量时,则需使用工具变量,所以需要对内生性变量进行检验。在实践中,往往是通过经济学理论先说明是否存在内生性变量,最后再通过检验证明确实存在内生变量。 (1)豪斯曼检验(Hausman )
原假设H 0:所有解释变量均为外生变量
将内生解释变量关于工具变量与外生变量进行OLS 回归估计 记录残差序列(^
^
IV OLS ββ−),加入原模型后进行OLS 估计 结果:若差值依概率收敛于0,接受原假设;反之,拒绝。
(2)杜宾-吴-豪斯曼检验(DWH )
注:存在异方差的情况下传统豪斯曼检验不适用。 回归模型:'1122y x x ββε=++ z=(x 1,z 2) 第一阶段回归:''21x x z v γδ=++ 检验扰动项v 与ε相关性模型:=v+ερξ 其中:ρ为ε对v 回归系数,ε与v 不相关则ρ=0. 对 ^
工具变量法
ε i . We cannot estimate β consistently by using
OLS. But we can construct a consistent estimator of β by using the assumed relationships among z i , xi and
这里,不需要像以前那样对 s 的自由度进行修正,因为这里所有结果都是渐近的, s 在任 何情况下都不会无偏(但是,许多软件仍然对自由度进行修正) 。经过对上式的处理,会发 现 s 是 σ 的一致估计量,因为上式的第二、三项都收敛于 0。因此 IV 估计量的方差的估
2 2 2 2
计值为
2
Est. Asy.var ( b IV ) =
−1
IV 估计量服从优良的大样本特性,即
a σ2 1 −1 b IV ∼ N β, Q − ZX Q ZZ Q XZ . n
(2.1.1)
如何估计 σ ?
2
e = y − Xb IV = y − X ( Z ' X ) Z ' y
−1 −1 = I − X ( Z ' X ) Z ' y −1 = I − X ( Z ' X ) Z ' ( Xβ + ε ) −1 = I − X ( Z ' X ) Z ' ε
(9)8.2工具变量法
ˆ 其中 E[( β 1 − β 1) x ] ≠ 0
表明:有偏
ˆ ˆ P lim β 0 = P lim [ β 0 + ( β 1 − β 1) x + u ]
即
ˆ P lim β1 = β1
ˆ 表明 β 1 是 β1 的一致估计量。
ˆ 同样可以证明,0是 β 0 的一致估计量(读者可以自己给出)。 β
ˆ ˆ 其中 β 0 的估计量为:β 0 = y − β 1 x 。
工具变量法是解决随机性解释变量与随机项相关时, 估计模型中参数的一种简单有效方法。但是,在实际 问题中,如何选择工具变量是一个比较困难的问题。
β 关于8.2节工具变量法,ˆ0 是 β 0 的一致估计量。
ˆ 在已证明 β 1 是 β 1 的一致估计量的条件下,证明:
ˆ ˆ β 0 不是 β 0 的无偏估计量,但 β 0 是 β 0 的一致估计量。
ˆ ˆ 由于 β 0 = y − β1x
ˆ ˆ ˆ β 0 = y − β1xΒιβλιοθήκη Baidu= ( β 0 + β 1 x + u ) − β1x ˆ = β 0 + ( β 1 − β 1) x + u
工具变量法
遗漏变量
• 当被遗漏的变量与引入模型的其他解释变量相 关,被遗漏的变量进入到随机扰动项时,就会 导致解释变量与扰动项相关
• 假定真实的总体模型设定为:Y = X β + Wγ + u • 但是由于不可观察的原因,我们无法得到W的
数据,这样回归模型就成为:
Y = X β + ε ,其中 ε = Wγ + u
• 即使观测误差与随机扰动项无关,新的随 机扰动项仍然会与解释变量相关
联立偏差
• 当X和Y相互作用,相互影响,互为因果 时,我们应该用联立方程组的形式来描述 它们之间的关系
• 但如果我们仍然采用单一线性方程形式, 以Y为被解释变量,X为解释变量,就会导 致与扰动项相关的情况出现,X成为内生的 解释变量
一致
• 解释变量的测量误差
• 真实的模型设定 y=X’β+z*+u
– z*含有测量误差,观察到 z=z*+v, E(z|x, z*)=z*,
– 实际的回归方程为: y = X’+z+ (u-v)=X’+z+ε
– 这时,由于 ε =u-v与z=z*+v相关,所以 E(ε|X,z)≠0,假设1不成立
联立性
• 如果X中的某个或某几个解释变量,如Xk与W 相关,就将导致Cov(xk ,ε ) ≠ 0 ,从而出现内生的 解释变量问题
工具变量法(一):2SLS
工具变量法(一):2SLS
Give me a lever long enough and a place to stand, and I will move the world. -- Archimedes
实证研究的常见问题之一为“内生性”(endogeneity),即解释变量与扰动项相关。研究者通常要花很大精力来解决内生性问题,而工具变量法则是解决内生性的常用利器。
内生性及其后果
考虑最简单的一元线性回归模型:
其中,为被解释变量,为解释变量,与为待估计的未知参数,下标表示个体(比如,第个企业),为随机扰动项(包含除外影响的所有其他因素),而为样本容量。
内生性意味着解释变量与扰动项相关,即
如果存在内生性,则称解释变量为“内生变量”(endogenous variable);反之,则称为“外生变量”(exogenous variable)。内生性的严重后果是使得OLS估计量不一致(inconsistent),即无论样本容量多大,OLS 估计量也不会收敛至真实的参数值。
工具变量的思想
工具变量的思想其实很简单。虽然内生变量是“坏” 的变量(与扰动项相关),但仍可能有“好” 的部分(与扰动项不相关的部分),正如坏人通常也有好的一面。如果能将内生变量分解为内生部分与外生部分之和,则可能使用其外生部分得到一致估计。
而要实现这种分离,通常需要借助另一变量,比如,称为“工具变量”(Instrumental Variable,简记IV),因为它起着工具性的作用。
显然,并非任何变量都可以作为工具变量。首先,变量要能够帮助内生变量分离出一个外生部分,则变量自身必须是“干净”的,即满足“外生性”(与扰动项不相关):
(9)12.8工具变量法(IV法)
(12.8.16)
模型(12.8.16)共有(g1-1)个内生说明变量和k1 1.若方程(12.8.16)
K1 G1* G 1
或
K
* 1
G
G1*
1
g1
1
(12.8.17)
(12.8.17)表示方程(12.8.16)中所不包含的前定变量 xk1+1,xk1+2,…,xk的个数恰好等于(12.8.16)中作为 说明变量的内生变量y2, y3,…,的个数,工具变量的选 择是唯一的(同样x1,x2,…,xk1本身作为自己的工 具变量),作拟正规方程组,可求得结构参数唯一的 工具变量法估计值。因此,工具变量法对于恰好识 别的结构方程是一种有效的方法。
(3)前定变量多于一个时,要求它们之间又要满足不 相关,有时是困难的。 (4)由于u是不可观察的,很难确定它与工具变量无关。 (5)此方法估计出的参数估计值是非无偏,却是一致估 计量。 由于以上原因,在实际中,人们很少直接用工具变量 法对结构参数进行估计,但它为二阶段最小二乘法作
这里应该指出,选择工具变量的个数必须与所估计的 结构方程中作解释变量的内生变量的个数相等。如果 结构方程中含有前定变量,则可选择这些前定变量本 身做自己的工具变量,这样做的目的是,使每一个结 构参数值都能求得估计值。
第二步,分别用工具变量去乘结构方程,并对所有 的样本观测值求和,得到与未知参数一样多的线性 方程组成的方程组。解方程组就得到结构参数的估
工具变量法工具变量法具体步骤
工具变量法工具变量法具体步骤工具变量法
目录
概念
某一个变量与模型随机解释变量高度相关,但却不与为丛藓科扭
口藓项相关,那么就可以用此变量与模型中相应回归系数的一个一致
估计量,这个变量就称为方法变量,这种估计方法就叫工具基本原理
变量法。缺点
工具变量法的关键是选择一个有效的优先选择工具变量,由于工
具自变量变量可以选择中的困难,工具变量法本身存在两方面不足:
一是由于工具变量不是惟一的,因而工具变量估计量有一定的任
意性;其二由于误差项实际上是不可观测的,因而要寻找严格意义上
与误差项无关的与所替代而随机解释变量高度相关的变量总的来说事
实上是困难的。工具变量法与内生解释变量
可持续性解释变量会造成解读严重的后果:不一致性inconstent 和有偏biased ,因为频域不满足误差以解释线性为条件的期望值为0。产生解释变量招盛纯一般有三个原因:
一、遗漏变量
二、测量误差
三、联立性
第三种情况是无法逐步解决的,前两种可以采用工具变量(IV )法。IV 会带来的唯一坏处是估计方差的增大,也就是说同时采用OLS 和IV 估计,则前者的方差小于后者。但IV 的应用是有前提条件的:1.IV 与内生解释函数相关,2.IV 与u 不相关。在小样本情况下,一
般用内生解释变量对IV 进行回归,如果R -sq 值很小的话,一般t
值也很小,所以对IV 质量的评价没有大的风险问题,但是当采用大样本时,情况则相反,往往是t 值很大,而R -sq 很小,这时如果采
用t 值进行关键问题评价则可能出现出现问题。这时IV 与内生解释
变量之间的若干程度不是阐释太大,但是如果与u 之间有轻微的相关
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据,这样回归模型就成为:
Y = X β + ε ,其中 ε = Wγ + u
• 如果X中的某个或某几个解释变量,如Xk与W 相关,就将导致Cov(xk ,ε ) ≠ 0 ,从而出现内生的 解释变量问题
5
假设4
• (yi, xi)为随机样本,i=1,2,⋯,n
..........
6
对模型假设的讨论
• 线性条件期望不成立的情形 E(y|X)≠X’,E(u|X)≠0
• 来源
– 模型设定的错误 misspecification – 变量的误差 – 联立性
..........
7
模型的设定错误
• 函数形式的错误
– 非参数设定来解决
• 包含了多余变量
– 如果多加的变量与其它的解释变量无关,OLS估计仍然 是无偏,一致,但不有效
– 如果多加的变量与其它的解释变量有关,OLS估计有偏 – 例:研究新生儿体重y与母亲在孕期的食品摄入量x的关
系,如果考虑家庭收入z。正确的模型设定为: E(y|x,z)=x。如果加入z,模型变为E(y|x,z)=₀x+γz
唯一
..........
4
假设3
• 随机扰动项同方差、无自相关 Var(y|X)=²I
• 含义
– y的条件方差为纯量协方差矩阵 – 由于 ²为常数,与x无关,所以条件方差等价于
无条件方差 – 该假设等价于Var(u|X)= ²,即同方差
Var(ui)= ²,无序列相关Cov(ui,uj)=0
..........
样本中也是不一致的。
– 特别是,如果3>0,b3会高估教育对工资的影响
..........
10
变量的测量误差
• 被解释变量的测量误差 • 真实的模型设定
y*=X’+u
• y*没有被准确观察到,观察到的是y
– y= y*+v,v为测量误差 – 模型变为:y=X’ +u+v – 如果E(v|X)=0,假设1没有被破坏 – 如果E(v|X)≠0,假设1不成立,OLS有偏且不
– 同时E(u|X)= 0是E(X’u)=0的充分条件,E(X’u)=0是 OLS估计的依据。
– E(u|X)= 0还意味着Cov(X,u)=0
..........
3
假设2
• 样本矩阵满列秩 rank(X)=K<n
• 含义
– 要求有足够多的观测值,n>k
– 变量之间不存在线性组合 – 保证X‘X可逆,满秩,非奇异,从而估计结果
..........
17
观测误差
• 不论是通过现场调查还是二手数据,我们 都不可能避免“观测误差”问题
• 当观测误差进入到随机扰动项中,并与某 个或某些解释变量相关时,就出现了内生 解释变量
..........
2
假设1
• 条件期望线性与外生性假设
y = E(y|X)+u
= 0 + 1X1 + 2X2 + . . . kXk + u
• 定义: u = y − E(y|X),则假设1意味E(u|X)=0,这 又成为X严格外生性的假设
– 如果E(u|X)=0成立,线性模型就能够解释x与y之间的因 果关系,并成为结构模型
13
解释变量的外生性
• 解释变量外生性是古典线性回归模型的一 个基本假定,也是保证线性模型成为结构 模型的前提
• 该假定的基本内容是指扰动项关于解释变 量的条件期望等于零 :
E(u|X ) = 0
– 解释变量X产生机制与随机扰动项u无关
–
–
可以推出:Cov( Xjk , ui ) = 0 和E(x′k u) = 0
..........
12
联立性
• 所谓联立性是指,两个变量之间的因果关 系不是单方向的,它们之间相互影响
• 在单方程模型中,如果至少一个解释变量 同时由被解释变量y部分决定,模型就出现 了联立性问题
• 联立性问题很多情况下,是由于变量遗漏 造成的。
• 在出现联立性的模型中,E(u|X)≠0
..........
..........
15
内生解释变量的产生
• 内生解释变量产生的原因基本上可以分为 四种:
– 遗漏变量 – 观测误差 – 联立偏差 – 样本选择问题 (sample selection)
..........
16
遗漏变量
• 当被遗漏的变量与引入模型的其他解释变量相 关,被遗漏的变量进入到随机扰动项时,就会 导致解释变量与扰动项相关
一致
..........
11
• 解释变量的测量误差
• 真实的模型设定 y=X’β+z*+u
– z*含有测量误差,观察到 z=z*+v, E(z|x, z*)=z*,
– 实际的回归方程为: y = X’+z+ (u-v)=X’+z+ε
– 这时,由于 ε =u-v与z=z*+v相关,所以 E(ε|X,z)≠0,假设1不成立
大样本条件下的渐Hale Waihona Puke Baidu无关性:p lim(
1 n
X ku)
0
..........
14
一个说明
• E(x′k u) = 0 表示Xk与u在小样本情形下无关
•
但是当
E(x′k u)
≠
0
时,p lim(
1 n
X ku)
0
仍然有
可能成立,即在大样本条件下,Xk与u满足
渐近无关性。此时,OLS估计量仍然能够
保持良好的大样本性质
– 正确的模型设定 log(wage)= 0+ 1exp+ 2exp²+ 3edu+abil+v
– 能力ability通常观察不到,成为遗漏变量,模型 成为 log(wage)= 0+ 1exp+ 2exp²+ 3edu+u
– 通常ability受到教育的影响 abil=₀+₃edu+r,
E(r|exp,exp²)=0 – 从而E(b3)= 3+ 3,b3不仅是有偏的,而且在大
如果z与x无关,则β₀=β ,但通常的情况下,z与x相 关,从而 ₀≠
..........
8
• 遗漏变量
– 被遗漏的变量q进入到随机扰动项中, u=rq+v,OLS估计不一致,教材P63例
• 解决的办法
– 代理变量 – 工具变量法
– panel data
..........
9
• 教育回报的例子
第二讲:
内生的解释变量与工具变量法
..........
1
单方程线性模型
• 如果我们在经验分析中采用一个单方程线 性模型来研究x 对y 的影响,并得到相关的 政策结论,那么则要求方程
y = 0 + 1X1 + 2X2 + . . . kXk + u
能够反映X与y之间的因果关系,而不是单 纯的统计相关关系