第七章 随机性解释变量与工具变量估计
计量经济学-工具变量
利用E(zii)=0,在大样本下可得到:
~1
zi yi zi xi
关于0 的估计,仍用~0 Y ~1X 完成。
这种求模型参数估计量的方法称为工具变 量法(instrumental variable method),相应的估 计 量 称 为 工 具 变 量 法 估 计 量 ( instrumental variable (IV) estimator)。
CONSP 0 1GDPP 由于:居民人均消费支出(CONSP)与人 均国内生产总值(GDPP)相互影响,因此,
容易判断GDPP与同期相关(往往是 正相关),OLS估计量有偏并且是非一致的
(低估截距项而高估计斜率项 )。
OLS估计结果:
(13.51) (53.47) R2=0.9927 F=2859.23 DW=0.5503 SSR=23240.7
用OLS估计模型,相当于用xi去乘模型两边、对i求 和、再略去xii项后得到正规方程:
xi yi 1 xi2
解得:
ˆ1
xi yi xi2
(*)
由于Cov(Xi,i)=E(Xii)=0,意味着大样本下: (xii)/n0
表明大样本下:
ˆ1
xi yi xi2
2. 工具变量并没有替代模型中的解释变量, 只是在估计过程中作为“工具”被使用。
上述工具变量法估计过程可等价地分解成下 面的两步OLS回归:
第一步,用OLS法进行X关于工具变量Z的回归:
Xˆ i ˆ0 ˆ1Zi
Yˆi ~0 ~1 Xˆ i
容易验证仍有:
~1
zi yi zi xi
如果用GDPPt-1为工具变量,可得如下工具 变量法估计结果:
随机解释变量课件
03
随机解释变量的识别与处理
识别方法
观察法
通过观察数据特征,如趋势、季 节性等,判断是否存在随机解释
变量。
统计检验
利用统计检验方法,如ADF检验、 PP检验等,对时间序列数据进行 单位根检验,判断是否存在随机
解释变量。
模型诊断
通过模型诊断工具,如残差图、 自相关图等,判断模型中是否存
在随机解释变量。
随机解释变量课件
• 引言 • 随机解释变量的影响 • 随机解释变量的识别与处理 • 随机解释变量的应用 • 结论
01
引言
定义与概念
定义
随机解释变量是指在回归模型中,作 为自变量的变量,其值是随机的,而 不是人为设定的。
概念
随机解释变量是回归分析中一个重要 的概念,它反映了影响因变量的多个 因素,通过数学模型来描述因变量与 自变量之间的关系。
05
结论
对随机解释变量的认识
随机解释变量是回归分析中常见的问 题,它会对回归模型的估计和推断产 生影响。
随机解释变量的识别和解决需要综合 考虑数据、模型假设和实际情境。
正确理解和处理随机解释变量是保证 回归分析结果准确性和可靠性的关键。
对未来研究的展望
随着大数据和机器学习技术的发 展,对随机解释变量的研究将更
来市场走势进行预测。
02
风险管理
在金融风险管理领域,随机解释变量可用于评估和管理风险。例如,在
投资组合优化中,可以利用随机解释变量来计算不同资产之间的相关性,
从而降低投资组合的风险。
03
资产定价
随机解释变量在资产定价中也有广泛应用。通过分析影响资产价格的各
种因素,可以构建定价模型,从而更准确地评估资产的价值。
计量经济学(第七章 随机解释变量问题)1
多元 线性 模型 的正 规方 程组 X2为 与μ相 关的 随机 变量
ˆ ˆ ˆ ˆ Yi ( 0 1 X 1i 2 X 2i k X ki ) E (i ) 0 ˆ ˆ ˆ ˆ Yi X 1i ( 0 1 X 1i 2 X 2i k X ki ) X 1i E (i X 1i ) 0 ˆ ˆ ˆ ˆ Yi X 2i ( 0 1 X 1i 2i X 2i k X ki ) X 2i E (i X 2i ) 0 Y X ( X X X ) X E ( X ) 0 ˆ ˆ ˆ ˆ 0 1 1i 2 2i k ki ki i ki i ki
• 但是在单方程计量经济学模型中,凡是外生变量都 被认为是确定性的。
• 于是随机解释变量问题主要表现于:用滞后被解释 变量作为模型的解释变量的情况。
• 例如:
(1) 耐用品存量调整模型 耐用品的存量Qt由前一个时期的存量Qt-1和当期 收入It共同决定:
Qt=0+1It+2Qt-1+t
t=1,T
拟合结果
80000 70000 60000 50000 40000 30000 20000 10000 0 1980 1985 1990 1995 2000 2005
JMXF JMXFOLS
JMXFIV JMXFGMM
四、解释变量的内生性检验
Hausman检验
Yi 0 1 X i 2 Z i1 i
(1) 随机解释变量与随机误差项独立 (Independence)
Cov( X 2, ) E( x2 ) E( x2 )E() 0
(2) 随机解释变量与随机误差项同期无关 (contemporaneously uncorrelated),但异期相关。 Cov( X 2i, i ) E( x2i i ) 0
第七章 随机解释变量问题
Ct-1是一随机解释变量,且与 (µt-λµt-1)高度相关 (Why?)。
三、随机解释变量的后果
计量经济学模型一旦出现随机解释变量,如果仍采用 OLS法估计模型参数,不同性质的随机解释变量会产生 不同的后果。 以下分三种情况讨论: 1、x是随机变量但与u互相独立,则OLSE仍然无偏。 2、x是随机变量,与u不独立但不相关,则OLSE在小样 本下有偏、大样本下具有一致性,即在大样本下OLSE 会逐渐逼近真值。 3、 x是随机变量,且与u相关,则OLSE在小样本下有偏、 大样本下也不具有一致性,即在OLS失效。
ˆ β1 =
∑x y ∑x
i 2 i
i
不具有一致性。 在大样本下也不成立,OLS估计量不具有一致性 不具有一致性
如果选择Z为X的工具变量 工具变量,那么在上述估计 工具变量 过程可改为:
∑z y
i
i
= β 1 ∑ z i xi + ∑ z i µ i
利用E(ziµi)=0,在大样本下可得到:
β1
~
四、解决随机解释变量的方法: 解决随机解释变量的方法: 工具变量法
模型中出现随机解释变量且与随机误差项相 关时,OLS估计量是有偏的。 如果随机解释变量与随机误差项不相关,则 可以通过增大样本容量的办法来得到一致的估计 量; 但如果相关,即使增大样本容量也无济于事。 这时,最常用的估计方法是工具变量法 工具变量法 (Instrument variables)。
二、实际经济问题中的随机解释变量问题 随机解释变量出现的原因: (1)在实际经济问题中,经济变量往往都无 法控制,所以其取值无法确定,必然表现出 随机性。 (2)滞后被解释变量作为解释变量时必然是 随机变量。
计量经济学名词解释
名词解释虚假序列相关:虚假序列相关是指山于忽略了重要解释变量而导致模型出现序列相关性无偏性:所谓无偏性是指参数佔计量均值(期望)等于模型参数值。
工具变量:、工具变量是在模型估计过程中被作为丄具使用,以替代模型中及随机误差项相关随机解释变量变量。
结构分析:经济学中所说结构分析是指对经济现象中变量之间关系研究。
虚假回归:如果两列时间序列数据表现出一致变化趋势(非平稳),即它们之间没有任何经济关系,但进行回归也会表现出较高可决系数异方差性:在线性回归模型中,经典假设要求随机误差项具有0均值和同方差。
所谓异方差性是指这些随机误差项服从不同方差正态分布。
过度识别:是指模型方程中有一个或儿个参数有若干个估计值。
恰好识别:是指对联立方程模型,我们能够唯一地估计出模型参数相对资本密集度:假设在生产活动中除了技术以外,只有资本及劳动两种劳动要素, 定义两要素产出弹性之比为相对资本密集度,用W表示。
即W=E L/E K简化式模型:用所有先决变量作为每一个内生变量解释变量,所形成模型称为简化式模型。
中性技术进步:技术进步前后,相对资本密集度不变,即劳动产出弹性及资本产出弹性同步增长行为方程:描述经济系统中变量之间行为关系结构式方程。
先决变量:外生变量和内生变量滞后变量相关分析:主要研究随机变疑间相关形式及相关程度。
回归分析:研究一个变量关于另一个变量依赖关系计算方法和理论。
高斯马尔科夫定理:普通最小二乘估计量具有线性性、无偏性和有效性等优良性质,是最佳线性无偏估计量。
高斯马尔科夫假定:(1)模型设立正确(2)无完全共线性(3)可识別性(4)零均值、同方差。
无序列相关假定(5)解释变量及随机项不相关计量经济学模型:揭示经济活动中各种因素之间左量关系,用随机性数学方程加以描述。
计量经济学模型成功三要素:理论、方法和数据。
完全共线性:对于多元线性回归模型,苴基本假设之一是解释变量,,…,是相互独立,如果存在,1=1, 2,…,n,其中c不全为0,即某一个解释变量可以用英他解释变量线性组合表示,则称为完全共线性。
工具变量法结果解读
工具变量法结果解读一、引言工具变量法是计量经济学中一种重要的估计方法,主要用于解决内生性问题。
通过引入工具变量,工具变量法能够有效地减少误差,提高估计的准确性和可靠性。
然而,对于初学者来说,如何正确解读工具变量法的结果可能是一个挑战。
本文将详细解读工具变量法的理论基础、工具变量的选择、结果解读以及结论,以期帮助读者更好地理解和应用工具变量法。
二、工具变量法的理论基础工具变量法源于经济理论,特别是当一个或多个解释变量与误差项相关时,就会产生内生性问题。
在这种情况下,普通最小二乘法(OLS)的估计结果是有偏的。
为了解决这个问题,我们引入一个或多个与内生解释变量相关,但与误差项无关的工具变量。
这些工具变量通过与内生解释变量的线性组合来“工具化”内生解释变量,从而在估计中起到减少误差和偏误的作用。
三、工具变量的选择选择合适的工具变量是工具变量法的关键步骤。
理想情况下,一个好的工具变量应该与内生解释变量高度相关,同时与误差项无关。
在实践中,我们通常选择那些与内生解释变量相关,同时又遵循随机扰动的因素作为工具变量。
此外,工具变量的数量应该足够多,以便能够充分地“工具化”内生解释变量。
四、结果解读在应用工具变量法后,我们得到了一组估计结果。
这些结果应该如何解读呢?首先,我们需要关注估计系数的符号。
如果估计系数的符号与预期相符,那么我们可以初步认为估计结果是可靠的。
其次,我们需要检验估计结果的显著性。
常用的方法是观察估计系数的p值。
如果p值较小(通常小于0.05),则表明估计结果是显著的。
最后,我们需要检验工具变量的有效性。
这可以通过观察工具变量的系数是否接近于1来初步判断。
如果工具变量的系数接近于1,并且显著,那么我们可以认为工具变量是有效的。
此外,我们还可以使用诸如弱工具检验、过度识别检验等统计方法来进一步检验工具变量的有效性。
五、结论本文对工具变量法的结果解读进行了详细阐述。
通过关注估计系数的符号、显著性以及工具变量的有效性等方面,我们可以更好地理解和应用工具变量法。
工具变量方法原理
工具变量方法原理工具变量方法(Instrumental Variable Method)是一种常用的实证研究方法,用于解决因果关系中的内生性问题。
当研究主变量与随机抽样原则(即不相关性假设)无关时,内生性问题会出现。
在这种情况下,使用传统的OLS(Ordinary Least Squares)回归模型估计将导致参数估计的无效性。
工具变量方法通过利用一个或多个工具变量,来解决内生性问题,并得到一致的估计结果。
工具变量是一个满足两个条件的变量:首先,工具变量与内生变量相关。
其次,工具变量与干扰项不相关。
这样,可以通过回归工具变量来消除内生性问题,从而得到因果关系的一致估计。
工具变量方法的基本思想是在原始模型中引入一个工具变量,在回归分析中用工具变量代替内生变量。
这样,内生变量与工具变量的回归关系就代替了内生变量与因变量的直接关系。
通过估计工具变量与因变量的关系,就可以得到一致的因果关系估计。
Y=α+βX+ε其中,Y是因变量,X是内生变量,α和β是参数,ε是误差项。
由于X与ε存在内生性问题,参数估计将变得无效。
为了解决内生性问题,引入一个工具变量Z。
使用工具变量方法得到的回归方程为:X=α+γZ+ε'其中,γ是工具变量与被解释变量的关系。
将工具变量引入原始模型,得到:Y=α+β(α+γZ+ε')+ε化简后可以得到:Y=α+βα+βγZ+βε'+ε由于内生性问题,βγ≠0,OLS估计将无效。
但是,由于工具变量与ε无相关性,βε'=0。
因此,使用工具变量方法可以得到一致的估计结果,即β的一致估计。
工具变量方法中的关键问题是选择合适的工具变量。
一个好的工具变量要满足两个条件:首先,与内生变量相关,以确保能够消除内生性问题;其次,与干扰项不相关,以确保工具变量不会引入新的内生性问题。
如果工具变量不满足这两个条件,工具变量方法仍然会产生一致的估计结果,但结果可能存在偏误。
要选择合适的工具变量,需要根据研究问题及具体情境进行判断。
第七章 随机性解释变量与工具变量估计
第七章 随机性解释变量与工具变量估计Y X βε=+,古典假定中解释变量X 是非随机的。
如果存在一个或多个随机变量作为解释变量,则原模型出现随机性解释变量的问题。
产生随机性解释变量的情形: 1) 被解释变量的滞后项作为解释变量 1t t t t C Y C γαβε−=+++t2) 双向因果关系(联立方程) 12123t t t t t t Y X X Y Z ββμγγγ=++=+++ν,价格()与需求(t Y t X )互为因果,t Z 可以指收入。
解释变量的随机性在联立方程中不可避免。
3) 测量误差12Y X ββ=++ε,若解释变量X 存在测量误差:*X X ν=+,那么实际使用的解释变量是*X ,显然*X 随机。
一、随机性解释变量的导致的理论问题1ˆ(')'X X X ββε−=+, 1''ˆlim lim()lim()X X X p p p n nεββ−=+, 若X 非随机,有()ˆE ββ=,ˆlim p ββ=; 若X 随机,则?ˆ()E ββ=,?ˆlim p ββ= 注意:若(,)f X Y 是(,)X Y 的联合密度,是(,)h X Y (,)X Y 的函数,则:[(,)]{[(,)]}Y X E h X Y E E h X Y Y =若解释变量随机,则X 是随机矩阵(至少有一列是随机变量)。
设'lim()X Xp Q n=,有限,正定。
球形扰动即为:2(')n E X I εεσ=Case1: X 与ε独立(不相关):(,)0i i Cov X ε=。
则有()E X ε0=,于是11ˆ()[(')'][(')'()]XE E X X X E X X X E X ββεβε−−=+=+=β最小二乘估计仍为无偏估计,其方差阵为:11112ˆˆˆ()[()()'][(')''(')] [(')'(')(')](')X Var E E X X X X X X E X X X E X X X X E X X βββββεεεεσ−−−−=−−===1−如果ε为条件正态分布,则 21ˆ(,('))N E X X ββσ−∼大样本性质:ˆlim p ββ=。
工具变量的定义及应用要求
工具变量的定义及应用要求工具变量是在计量经济学中使用的一种方法,用于解决内生性问题。
内生性问题指的是自变量(解释变量)与误差项之间存在相关性,从而导致回归结果产生偏误。
工具变量的核心思想是通过引入一个外生性足够强的变量,来替代内生性的自变量,从而消除内生性问题。
在本文中,将介绍工具变量的定义、应用要求以及实际应用,以及工具变量方法在实证研究中的重要意义。
首先,工具变量的定义是指在计量经济模型中,利用一个或一组外生性足够强的变量(即工具变量)来替代内生性自变量,从而消除内生性问题。
工具变量需要满足两个基本要求:第一,工具变量与内生性自变量存在显著相关性;第二,工具变量与误差项不存在相关性。
如果工具变量满足这两个要求,那么使用工具变量进行估计就可以得到无偏的一致估计。
其次,工具变量的应用要求包括两个方面:第一,工具变量必须是外生性的。
外生变量指的是与误差项不相关的变量,通常是与内生性自变量相关但与误差项不相关的变量。
工具变量的外生性是工具变量方法有效性的基础,只有外生性的工具变量才能有效地消除内生性问题。
第二,工具变量必须具有强相关性。
强相关性意味着工具变量与内生性自变量之间存在显著的相关性,这样才能有效地替代内生性自变量,从而消除内生性问题。
在实际应用中,工具变量方法通常用于解决内生性问题。
内生性问题在计量经济学中是一个常见且严重的问题,如果不加以解决,将导致回归结果产生偏误,从而影响到结论的准确性和可靠性。
工具变量方法可以有效地解决内生性问题,得到无偏的一致估计。
因此,在许多实证研究中,特别是涉及到内生性问题的情况下,研究者通常会使用工具变量方法来确保估计结果的准确性。
工具变量方法在实证研究中具有重要的意义。
首先,工具变量方法为研究者提供了一种有效的解决内生性问题的方法,使他们能够得到无偏的一致估计。
其次,工具变量方法在一定程度上放宽了对自变量的外生性假设,使得研究者能够在较宽松的条件下进行估计。
随机解释变量
加强应用研究
将随机解释变量的研究应用于 实际问题中,如经济、生物、 医学等领域,以解决实际问题 并促进相关领域的发展。
促进跨学科合作与交流
加强与其他相关学科的合作与 交流,如数学、计算机科学、 物理学等,以促进对随机解释 变量的更深入理解和应用。
THANKS
感谢观看
考虑其他影响因素
样本选择偏差
在处理随机解释变量时,需要考虑样 本选择偏差对模型的影响。可以通过 采用合适的样本选择方法(如 Heckman选择模型等)来纠正偏差 。
多重共线性
在处理随机解释变量时,需要考虑多 重共线性对模型的影响。可以通过采 用特征选择、降维等方法来降低多重 共线性的影响。
04
CATALOGUE
随机解释变量与固定解释变量的区别
固定解释变量是指其值在回归模型中保持不变的变量,而随机解释变量则是指其 值会变动的变量。
固定解释变量通常是可以直接控制的变量,例如实验中的自变量,而随机解释变 量则是无法或不易控制的变量,例如时间、气温等。
随机解释变量的应用场景
01
在经济学中,许多因素都可以作为随机解释变量,例如GDP、利率、 汇率等。
随机解释变量
目录
• 随机解释变量的定义 • 随机解释变量的影响 • 如何处理随机解释变量 • 随机解释变量的实例分析 • 总结与展望
01
CATALOGUE
随机解释变量的定义
什么是随机解释变量
随机解释变量是指在回归分析中,用 来预测因变量的解释变量,其值是随 机的,会受到多种因素的影响。
与固定解释变量不同,随机解释变量 的值是不确定的,可能会随着时间和 外部条件的变化而变化。
工具变量法工具变量法具体步骤
工具变量法工具变量法具体步骤工具变量法目录概念某一个变量与模型随机解释变量高度相关,但却不与为丛藓科扭口藓项相关,那么就可以用此变量与模型中相应回归系数的一个一致估计量,这个变量就称为方法变量,这种估计方法就叫工具基本原理变量法。
缺点工具变量法的关键是选择一个有效的优先选择工具变量,由于工具自变量变量可以选择中的困难,工具变量法本身存在两方面不足:一是由于工具变量不是惟一的,因而工具变量估计量有一定的任意性;其二由于误差项实际上是不可观测的,因而要寻找严格意义上与误差项无关的与所替代而随机解释变量高度相关的变量总的来说事实上是困难的。
工具变量法与内生解释变量可持续性解释变量会造成解读严重的后果:不一致性inconstent 和有偏biased ,因为频域不满足误差以解释线性为条件的期望值为0。
产生解释变量招盛纯一般有三个原因:一、遗漏变量二、测量误差三、联立性第三种情况是无法逐步解决的,前两种可以采用工具变量(IV )法。
IV 会带来的唯一坏处是估计方差的增大,也就是说同时采用OLS 和IV 估计,则前者的方差小于后者。
但IV 的应用是有前提条件的:1.IV 与内生解释函数相关,2.IV 与u 不相关。
在小样本情况下,一般用内生解释变量对IV 进行回归,如果R -sq 值很小的话,一般t值也很小,所以对IV 质量的评价没有大的风险问题,但是当采用大样本时,情况则相反,往往是t 值很大,而R -sq 很小,这时如果采用t 值进行关键问题评价则可能出现出现问题。
这时IV 与内生解释变量之间的若干程度不是阐释太大,但是如果与u 之间有轻微的相关机构的话,则:1、导致很小的不一致性;2、有偏性,并且这种有偏性随着R -sq趋于0而趋于OLS 的有偏性。
所以现在在采用IV 时最好采用R -sq 或F -sta 作为评价标准,另外为了观测IV 与u 的关系,可以将IV 作为解释变量放入方程进行回归,如果没有其他的系数没有多的变化,则说明IV 满足第二个条件。
计量经济学分章习题与答案
第一章 导 论一、名词解释1、截面数据2、时间序列数据3、虚变量数据4、内生变量与外生变量二、单项选择题1、同一统计指标按时间顺序记录的数据序列称为 ( )A 、横截面数据B 、虚变量数据C 、时间序列数据D 、平行数据2、样本数据的质量问题,可以概括为完整性、准确性、可比性和 ( )A 、时效性B 、一致性C 、广泛性D 、系统性3、有人采用全国大中型煤炭企业的截面数据,估计生产函数模型,然后用该模型预测未来煤炭行业的产出量,这是违反了数据的哪一条原则。
( ) A 、一致性 B 、准确性 C 、可比性 D 、完整性4、判断模型参数估计量的符号、大小、相互之间关系的合理性属于什么检验? ( )A 、经济意义检验B 、统计检验C 、计量经济学检验D 、模型的预测检验5、对下列模型进行经济意义检验,哪一个模型通常被认为没有实际价值? ( )A 、i C (消费)5000.8i I =+(收入)B 、di Q (商品需求)100.8i I =+(收入)0.9i P +(价格)C 、si Q (商品供给)200.75i P =+(价格)D 、i Y (产出量)0.60.65i K =(资本)0.4i L (劳动)6、设M 为货币需求量,Y 为收入水平,r 为利率,流动性偏好函数为012M Y r βββμ=+++, 1ˆβ和2ˆβ分别为1β、2β的估计值,根据经济理论有 ( ) A 、1ˆβ应为正值,2ˆβ应为负值 B 、1ˆβ应为正值,2ˆβ应为正值C 、1ˆβ应为负值,2ˆβ应为负值D 、1ˆβ应为负值,2ˆβ应为正值 三、填空题1、在经济变量之间的关系中, 因果关系 、 相互影响关系 最重要,是计量经济分析的重点。
2、从观察单位和时点的角度看,经济数据可分为 时间序列数据 、 截面数据 、 面板数据 。
3、根据包含的方程的数量以及是否反映经济变量与时间变量的关系,经济模型可分为 时间序列模型 、 单方程模型 、 联立方程模型 。
随机效应模型工具变量
随机效应模型工具变量
随机效应模型是一种常用的统计模型,常用于处理多层次数据的
分析问题。
该模型基于固定效应模型,增加了一个随机的成分,可以
更好地表现个体之间的差异。
而工具变量法则是一种解决内生性问题
的方法,它通过引入一个外生变量作为工具变量,可以得出更具可靠
性的估计结果。
随机效应模型具有良好的应用效果,它可以在解决实际问题中使用。
例如,在经济学中,利用随机效应模型研究企业之间的差异,可
以得出更具可信度的结论。
而在医学研究中,该模型也经常应用于对
治疗效果的评估中。
与此同时,用工具变量的方法也可以解决实际问题中的内生性问题,该方法可以帮助研究者避免由于自变量与误差项之间存在内生性
而导致的估计偏误。
例如,在经济学中,如果要研究教育对于劳动力
市场表现的影响效应,就需要考虑教育水平与家庭背景、父母收入等
因素的内生性问题。
在实际应用中,结合随机效应模型和工具变量法,可以更好地解
决复杂的多层次数据分析与内生性问题,从而得出更具可靠性的结论。
因此,研究者在进行数据分析时,那么可以考虑使用这两种方法,以
提高模型的分析效果和精度。
第七章 虚拟变量和随机解释变量 (2)
第七章 虚拟变量和随机解释变量本章将讨论两种不同的模型:虚拟变量模型和随机解释变量模型,以及模型设定的其它问题。
第一节 虚拟变量模型在我们以前考虑的模型中,解释变量都是定量变量(如成本、价格、收入、产出等),但在经济研究中,因变量经常受到一些定性变量的影响(如性别、种族、季节、不同历史时期等),我们把这类定性变量称为虚拟变量。
习惯上用D表示虚拟变量,虚拟变量的取值通常为0和1。
0表示变量具备某种属性,1表示变量不具备某种属性。
一、包含一个虚拟变量的模型如果我们要研究的问题中解释变量只分为两类。
则需引入一个模拟变量。
例9.1建立模型研究中国妇女在工作中是否受到歧视。
令Y=年薪,X=工作年限⎩⎨⎧=,女性,男性101D 可以建立如下模型:i i i i u D B X B B Y +++=210 )1.9( 与一般的回归模型一样,假定0)(=i u E 男性就业者的平均年薪:i i i i X B B D X Y E 10)0,(+== )2.9(女性就业者的平均年薪:210)1,(B X B B D X Y E i i i i ++== )3.9(如果B 2=0则说明不存在性别歧视,如果02<B ,则说明存在性别歧视。
图9.1表明男女就业者的平均年薪对工龄的函数具有相同斜率B 1,即随着工龄的增长男女工资的增长幅度相同;截距不同,说明男女的初始年薪不同。
我们称这种虚拟变量只影响截距不影响斜率的模型为加法模型。
图9.1不同性别就业者的收入(加法模型,B 2<0)如果随着工龄增加,男性与女性的年薪差距也发生变化,则模型(9.1)就变为i i i i i u X D B X B B Y +++=210 )4.9(图9.2描绘了男性年薪增加较快的情况。
我们称虚拟变量只影响斜率而不影响截距的模型为乘法模型如(9.4)如果男性与女性的初始年薪和年薪增加速度都有差异,我们可以将加法模型和乘法模型结合起来,得到如下模型i i i i i i u D B X D B X B B Y ++++=3210 )5.9(模型(9.5)可以用来表示截距和斜率都发生变化的模型。
工具变量法GMM估计
工具变量法 GMM估计1 OverviewModel过程可以分析线性、非线性(对参数或者对变量)的单方程和方程组。
使用的估计方法有:OLS, 2SLS, SUR, ITSUR, 3SLS, IT3SLS,GMM ,FIML。
MODEL过程分析的模型如下:这里,Y是内生变量,X是外生变量,TEHTA是参数。
观测到的变量要么是内生变量,要么是外生变量。
上面的方程组可以简写为:这个形式称为一般形式。
还可以写成标准形式:标准形式把内生变量放在方程的一边。
两种形式的方程(组)都可以使用MODEL过程估计。
经常用当前外生变量、滞后的外生变量、滞后的内生变量来解释当前内生变量。
这就构成了一个动态模型。
滞后变量不论内生还是外生都看作外生变量。
以上并不要求扰动项独立同分布。
自相关、异方差甚至不同的分布都有可能。
对于异方差可以使用加权估计,GARCH模型也可以修正异方差。
如果难以确定异方差的来源和形式,难以确定权重变量的话,可以使用GMM方法得到比OLS方法更加有效的估计。
方程组一个常见的问题就是联立偏倚。
考虑:这个方程组对参数是非线性的,不能使用线性回归估计。
同时这里Y1和Y2是同时决定的,普通非线性最小二乘方法的结果也是有偏和非一致的。
这称为联立性偏倚。
在线性模型中,处理联立性偏倚的可以把出现在方程右边的内生变量换成其预测值。
预测值与扰动项无关从而消除了联立性偏倚。
预测值是通过工具变量法估计得到的,这称为第一步回归。
利用预测值进行第二次回归称为两段最小二乘。
在非线性模型中,使用线性近似,把非线性方程组线性化后使用工具变量法,反复迭代。
在方程组中,方程之间的扰动项可能相关。
对于大样本情况,可以使用系统方法考虑到方程内和方程之间关系得到更有效的估计。
如果不存在联立性问题,即不存在内生变量作为解释变量的话,可以使用SUR估计。
SUR方法需要估计方程之间扰动项的协方差矩阵∑。
估计步骤为先使用OLS估计方程组,从残差得到∧∑,然后使用SUR。
工具变量估计算法
工具变量估计算法
工具变量估计算法是一种统计方法,用于处理回归分析中的内生性问题。
在回归分析中,如果解释变量与误差项相关,会导致估计结果有
偏误。
工具变量估计算法通过使用一个或多个与内生解释变量相关,
但与误差项无关的变量作为工具变量,来估计回归系数的一致性估计量。
工具变量的选择必须满足一定条件:
1. 与所替代的内生解释变量高度相关;
2. 与误差项不相关;
3. 与模型中其他解释变量不相关;
4. 在同一模型中引入多个工具变量时,这些工具变量之间不相关。
工具变量估计算法的步骤包括:
1. 对一阶段回归的残差进行 IID 检验,检验结果显示扰动项非 IID;
2. 进行不可识别检验,P 值(K-P LM)均为 0.000,拒绝不可识别的
原假设;
3. 进行弱工具变量检验,F 值(K-P Wald)分别为 547.812 及
386.131,远大于 16.38 的临界值,说明不存在弱工具变量问题;
4. 进行过度识别检验,Sargan 检验的 P 值为 0.3096,接受工具变
量与结构方程扰动项不相关的原假设;
5. 进行冗余检验,P 值均为 0.000,说明工具变量不冗余;
6. 进行内生性检验,P 值为 0.000,需要返回第四步,将 IV 估计改为 GMM 估计,Sargan 统计量改为 Hansen 统计量,再次检验显示Hansen-J 检验估计结果与前文一致。
通过以上步骤,可以使用工具变量估计算法对回归分析中的内生性问题进行处理,并获得一致性估计量。
工具变量方法原理
工具变量原理教学目的及要求:1、理解引入随机解释变量的目的及产生的影响2、理解估计量的渐进无偏性和一致性3、掌握随机解释变量OLS 的估计特性4、应用工具变量法解决随机解释变量问题第一节 随机解释变量问题一、随机解释变量问题产生的原因多元k 线性回归模型:i ki k i i i U X X X Y ++⋅⋅⋅+++=ββββ22110 8-1其矩阵形式为:U XB Y += 8-2在多元k 线性回归模型中,我们曾经假定,解释变量j X 是非随机的;如果j X 是随机的,则与随机扰动项i U 不相关;即:Cov()i ijU X,0= ),,2,1;,,2,1(n i k j ⋅⋅⋅=⋅⋅⋅=8-3许多经济现象中,这种假定是不符合实际的,因为许多经济变量是不能用控制的方法进行观测的,所以作为模型中的解释变量其取值就不可能在重复抽样中得到相同和确定的数值,其取值很难精确控制,也不易用实验方法进行精确观测,解释变量成为随机变量;又由于随机项U 包含了模型中略去的解释变量,而略去的解释变量往往是同模型中相关的变量,因而就很有可能在X 是随机变量的情况下与随机项U 相关,这样原有的古典假设就不能满足,产生随机解释变量;在联立方程模型以及模型中包含有滞后内生变量等情况下,如果扰动项是序列相关的,那么均有扰动项和解释变量之间的相关性的出现,模型就存在随机解释变量问题;例如,固定资产投资与国民收入的关系满足如下模型:其中,t I 为t 期的固定资产投资,1-t I 为1-t 期的固定资产投资,t Y 为t 期的国民收入,因为1-t I 是随机变量,故模型中存在随机解释变量;再如,消费与收入之间的影响关系模型为其中,t C 为t 期的消费支出,1-t C 为1-t 期的消费支出,t Y 是t 期的收入,因为1-t C 是随机变量,故模型中存在随机解释变量;二、随机解释变量问题的后果模型中,在解释变量为随机变量并且与扰动项相关的情况下,应用普通最小二乘法估计参数可能会出现估计的不一致性,使得估计值产生很大的偏误,造成拟合优度检验的全面失准,F 检验失效,t 检验失去意义;在这种情况下,各种统计检验得到的是虚假的结果,不能作为判别估计式优劣的依据;随机解释变量带来何种结果取决于它与随机误差项是否相关:1随机解释变量与随机误差项不相关2随机解释变量与随机误差项在小样本下相关,在大样本下渐进无关3随机解释变量与随机误差项高度相关4滞后被解释变量与随机误差项相关第二节 随机解释变量模型的估计特性我们讨论的估计量的性质包括无偏性、最小方差性都是在样本容量一定的情况下的统计性质,在数理统计上叫做小样本性质;在某些情况下,小样本时的估计量不具有某种统计性质,但是随着样本容量的增大,一个估计量在小样本时不具有的性质,大样本时就逐渐具有这种统计性质了,这种性质我们叫做大样本性质或叫做估计量的渐近统计性质;常用的渐近统计性质有渐近无偏性和一致性;一、估计量的渐近无偏性记)(ˆn β代表模型中参数β的估计量,其上标n 表示样本容量;一般来说,n 取如下的样本容量,k n n n <⋯<<21,)(ˆn β为一随机变量;随着样本容量n 的增大,估计量)(ˆn β构成一个估计量随机变量序列:{})(ˆn β=)(1ˆn β,)(2ˆn β,…,)(ˆkn β,…8-4所谓渐近理论就是讨论当n 变得很大时,以上这些序列会有怎样的结果;序列{})(ˆn β如果满足: E n ∞→lim )(ˆn β=β8-5则称)(ˆn β为β的渐近无偏估计;也就是说,当样本容量越来越大,n 趋于∞时,)(ˆn β的均值越来越接近参数的真值β;这里需要注意的是,有些估计量在小样本下是有偏的,但在大样本下是无偏的,即是渐近无偏的;例如随机变量X 的样本方差容易证明在数理统计中已有证明其中,2σ为总体方差;很明显,在小样本下,2x S 作为2σ的估计量是有偏的,但随着n 的无限增大,)(2x S E 趋于总体的真正方差2σ,因此是渐近无偏的;可见,通过增加样本容量,可以改善参数估计的精度;二、估计量的一致性如果随着样本容量的增大,估计量)(ˆn β几乎处处趋近于β真值,我们说)(ˆn β为β的一致估计量,或称)(ˆn β依概率收敛于β;如果样本容量无限增大时,)(ˆn β的分布收敛于β,)(ˆn β的方差趋于零,)(ˆn β就是β的一致估计量; 一致估计量可以记为:{}1ˆlim )(==∞→ββn n P 或简记为ββ=∞→)(ˆlim n n P ;式中∞→n P lim 表示概率极限;为简单起见,可略去上标n ,记作ββ=ˆlim P概率极限有下列运算法则:)X lim()X lim(cP c P = c 为常数22112211X lim X lim )X X lim (P c P c c c P ⋅+⋅=+ 21,c c 为常数这里需要弄清楚一点是,无偏性与一致性是两个截然不同的概念,无偏性可以对任何样本容量成立,而一致性则是对大样本而言的,是一种渐近性质;在大样本的条件下,一致估计量具有很高的精度,但在小样本时一致性不起作用;可以证明,)(ˆn β为β的一致估计量,当且仅当 ββ=∞→)ˆ(lim )(n n E0)ˆvar(lim )(=∞→n n β8-6时成立;此充分必要条件说明,βˆ是渐近无偏的,且当样本容量无限增大时βˆ的方差趋于零;上面的讨论是对随机变量而言的,对于随机向量同样有类似的结论;三、随机解释变量模型OLS 估计特性计量经济模型中一旦出现了随机解释变量,如果仍用最小二乘法估计模型参数,不同性质的随机解释变量会出现不同的结果;为了简单起见,我们用一元线性回归模型进行说明;给定一元线性回归模型:i i i U X Y ++=10ββ ),...,2,1(n i = 8-7假设X 为一随机变量,模型满足其他古典假设条件;对式8-7,其离差形式为:ii i u x y +=1β8-8其中,Y Y y i i -= , X X x i i -= , U U u i i-=应用普通最小二乘法,则有21ˆii i x y x ∑∑=β8-9把8-8中的i y 代入8-9,则可以得到∑∑∑∑+=∑+∑==212121)(ˆiii ii i i iii xu x x u x x xyx βββ 8-10而)()()()()()(2222121n in iiu E x x E u E x x E u E x x E ∑++∑+∑= 8-11下面分三种情况讨论:1.X 和U 是独立的因i x 和i u 相互独立,并且0)(=i u E∴0)(2=∑∑ii i x u x E故有ββ=)ˆ(E 2.i x 与i u 小样本下相关,大样本下渐近无关小样本:0)(≠i i u x E所以11)ˆ(ββ≠E ,最小二乘法估计是有偏的; 大样本:0)1(lim =∑∞→i i n u x nP 对式8-10两边取概率极限可有∑∑+=211lim )ˆlim(i i i x u x P P ββ121lim 1i i i x u n P x nβ=+∑∑ 8-12 因此,在假定0)1(lim 2≠∑i x nP 的情况下,有 ββ=)ˆlim(P8-13说明最小二乘估计式也具有一致性特性;3.i x 与i u 高度相关讨论一般情况下回归模型8-8式i i i u x y +=1β ),......2,1(n i = 8-14假设:2)(x i x Var σ=,2)(u i u Var σ=,i x 和i u 之间的相关系数是ρ,如果采用普通最小二乘法估计上式,可以得到:)(),(x Var u x Cov +=βu x σβρσ=+ 8-15因为:()()cov(,)i ix uX X U U x u x u ρσσ--===∑代入上式即可;可见,如果ρ很高,只有当x uσσ是很小的情况下,8-15式的渐近误差才是可以忽略的;否则,最小二乘估计式将存在着很大的偏误;第三节 随机解释变量模型的处理如果模型中存在随机解释变量问题,则一般的随机解释变量与随机误差项之间是相关的,最小二乘估计量有偏且不一致,需要利用其他估计方法对模型参数进行估计;一、工具变量法工具变量Instrument Variable, IV 法就是当随机解释变量与随机误差项相关时,寻找一个与随机解释变量高度相关,但与随机误差项不相关的变量,用该变量替代模型中的随机解释变量,进行模型的参数估计;我们称这一替代随机解释变量的变量为工具变量;一选择工具变量的要求作为工具变量,必须满足以下四个条件:第一,工具变量必须是有明确经济含义的外生变量;第二,工具变量与其替代的随机解释变量高度相关,而又与随机误差项不相关;第三,工具变量与模型中的其他解释变量也不相关,以免出现多重共线性;第四,模型中的多个工具变量之间不相关;二工具变量的应用工具变量对随机解释变量的替代并不是“完全的”替代,即不是用工具变量代换模型中对应的随机解释变量,而是在最小二乘法的正规方程组中用工具变量对随机解释变量进行部分替代;对于一元线性回归模型8-7和8-8i i i u x y +=1β若x 与u 不相关,u 满足所有的统计假定;应用OLS 法,利用微分求极值的办法求出正规方程:2101i i i i ix y βx Y ββX ⎧=⎪⎨=+⎪⎩∑∑8-16现采用另一种方法来导出OLS 正规方程;我们以i x ),,2,1n i ⋅⋅⋅=同乘以1i i i y x u β=+两边,得n 个式子,求和得:21i i ix y x β=∑∑+i ix u ∑8-17因为x 与u 不相关,从而可以略去0i i x u =∑,就可以得OLS 正规方程;如果x 与u 相关,则0i i x u ≠∑,不能用OLS 法来估计参数;现在,我们要寻找一个变量Z ,Z 与X 高度相关而与U 无关,用i z 的离差乘以1i i i y x u β=+的两边,然后求和得到一个类似于OLS 正规方程的方程;在这里,Z 就是工具变量;1i i i i z y z x β=+∑∑∑iiuz8-18由于z 与u 无关,所以得:1i i i i z y z x β=∑∑ 8-19上式称为拟正规方程,从而求得101()(Y Y)ˆ()(X X)ˆˆY X iiii i iii z y Z Z z xZZ βββ⎧--==⎪--⎨⎪=-⎩∑∑∑∑8-20因此,工具变量法的基本原理在于:用工具变量代替随机解释变量X ,从而利用cov(,)0Z U =克服cov(X,)0U ≠产生的对模型参数估计的不利影响,形成有效正规方程组并最终获得模型参数的估计量;从这一原理理解,OLS 法也可以看作是一种工具变量法,即利用模型中的各解释变量作为他们自身的工具变量;容易证明,参数工具变量估计量是有偏的、一致的估计量;在实际经济分析中,对于工具变量的选择,一般的做法是:对于时间序列资料,如果被解释变量i Y 、随机解释变量i X 、随机误差项i u 三者之间的关系有0),X cov(≠i i u ,但0),X cov(1=-i i u ,0),Y cov(1=-i i u ,则可用1X -i 或1Y -i 作为i X 的工具变量;三多元线性回归模型对于k 元线性回归模型:i ki k i i i u ++⋅⋅⋅+++=X X X Y 22110ββββ 8-21其矩阵形式为:U XB Y += 8-22假设i 1X 和ki X 为随机解释变量,且与随机误差项i u 高度相关,i u 满足最小二乘法的其他假定条件,解释变量之间无多重共线性;1寻找工具变量i 1Z 和ki Z ;工具变量满足以下条件:他们是有实际经济意义的变量;与其对应的随机解释变量i 1Z 对应i 1X ,ki X 对应ki Z 高度相关;与随机误差项i u 不相关;工具变量i 1Z 和ki Z 之间不相关;与k 元线性回归模型中其他解释变量不相关;2写出工具变量矩阵;除了t 1X 和kt X 之外,k 元线性回归模型的工具变量矩阵为:⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=kn n nk k X X ...X X 1...............X ......X X 1X .....X X 12122212121118-23 将X 矩阵中的i 1X 和ki X 替换为1Z i 和ki Z ,其他外生变量和常数项均由其自身做工具变量,得Z 矩阵:⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=kn n nk k Z Z ...Z Z 1...............Z ......Z Z 1Z .....Z Z 1212221212111 8-24 3求出工具变量估计量IVB ˆ,沿上述思路,用Z '同乘Y XB U =+两边,由于Z 和U 无关,所以有Y Z X Z B IV ''='-1)( 8-25IVB ˆ是B 的一致估计量; 在EViews 软件中,工具变量法是含在二阶段最小二乘法中,所以必须选择二阶段最小二乘法,在“工具变量”的提示后面,输入所有的工具变量名,即可实现工具变量法估计;四工具变量法的缺陷从理论上分析,工具变量法可以得到渐近无偏、渐近有效的参数估计量,在解释变量为随机变量并与随机误差项相关的情况下,参数估计值达到了渐近一致;但这种方法在实际应用中会遇到一定困难,主要表现在三个方面:1在解释变量X与随机误差项u相关的情况下,要找寻一个既与X高度相关,又与u不相关的工作变量Z十分困难;再加上工具变量Z要具有明确的经济含义,这就更不容易;2在能找到符合要求的工具变量条件下,所选择的工具变量不同,模型参数估计值也不会一致,使参数估计出现随意性;工具变量选择得当,参数估计值的质量会高一点;如果工具变量选择不得当,参数估计值就会出现较大偏误;3由于使用了工具变量,有可能产生较高的标准差,不能保证参数估计值的渐近方差一定能达到最小;基于上述分析,到底选择何种工具变量,还需要通过实践掌握工具变量选择的技巧;二、含有随机解释变量的实例分析见教材及上机操作;本章小结解释变量 是随机变量,叫做随机解释变量,产生随机解释变量的原因主要包括:省略了解释变量,观测误差,滞后的内生变量;随机解释变量按其与随机扰动项的关系可以分为三种不同的情况,如果随机解释变量与随机扰动项相关,我们认为它不满足最小二乘法的古典假设;在三种不同的情况下,得到的最小二乘估计的性质有所不同,随机解释变量使模型参数估计值失去一致性;工具变量法是我们选择解决随机解释变量对模型参数估计影响的方法;。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 随机性解释变量与工具变量估计
Y X βε=+,古典假定中解释变量X 是非随机的。
如果存在一个或多个随机变量作为解释变量,则原模型出现随机性解释变量的问题。
产生随机性解释变量的情形: 1) 被解释变量的滞后项作为解释变量 1t t t t C Y C γαβε−=+++t
2) 双向因果关系(联立方程) 12123t t t t t t Y X X Y Z ββμγγγ=++=+++ν,
价格()与需求(t Y t X )互为因果,t Z 可以指收入。
解释变量的随机性在联立方程中不可避免。
3) 测量误差
12Y X ββ=++ε,若解释变量X 存在测量误差:*X X ν=+,那么实际使用的解释变量是*X ,显然*X 随机。
一、随机性解释变量的导致的理论问题
1ˆ(')'X X X β
βε−=+, 1''ˆlim lim()lim()X X X p p p n n
ε
ββ−=+, 若X 非随机,有()
ˆE β
β=,ˆlim p ββ=; 若X 随机,则?
ˆ()E β
β=,?
ˆlim p ββ= 注意:若(,)f X Y 是(,)X Y 的联合密度,是(,)h X Y (,)X Y 的函数,则:
[(,)]{[(,)]}Y X E h X Y E E h X Y Y =
若解释变量随机,则X 是随机矩阵(至少有一列是随机变量)。
设'lim()X X
p Q n
=,有限,正定。
球形扰动即为:2(')n E X I εεσ=
Case1: X 与ε独立(不相关):(,)0i i Cov X ε=。
则有()E X ε0=,于是
11ˆ()[(')'][(')'()]X
E E X X X E X X X E X ββεβε−−=+=+=β
最小二乘估计仍为无偏估计,其方差阵为:
111
1
2
ˆˆˆ()[()()'][(')''(')] [(')'(')(')](')X Var E E X X X X X X E X X X E X X X X E X X β
ββββεεεεσ−−−−=−−===1
−
如果ε为条件正态分布,则 21ˆ(,('))N E X X ββσ−∼大样本性质:ˆlim p ββ=。
Case2: X 与ε部分独立。
⇒系数的OLS 估计量仍是一致的,但有偏。
部分独立的含义:如1t t t t C Y C αβγε−=+++t ,ε与不独立,但与独立。
即当期消费未来扰动无关。
t C 1t C −Case3: t X 与t ε相关。
则:1ˆ()[(')']E E X X X β
βε−=+≠β 1''ˆlim lim()lim(X X X p p p n n εβ
ββ−=+≠
二、工具变量(Instrumental Variable )估计
若X 与ε同期相关,则ˆβ
有偏且不一致。
这不是一个好的估计量,而且X 与ε的相关程度越大,OLS 估计的偏差也会越大。
解决办法:采用工具变量估计。
工具变量法可以得到参数的一致估计,
但不能保证无偏性。
1工具变量的选取:
工具变量:在模型的估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机性解释变量。
它的选取必须满足以下条件:
1)与替代的随机性解释变量高度相关; 2)与随机误差项不相关;
3)与模型中其他解释变量不相关(避免出现多重共线性); 即为以下条件:
a.'lim(ZZ Z Z
p Q n =,有限正定;
b. 'lim(ZX Z X
p Q n =,有限,秩为;
k c.'lim(0Z p n ε
=,即Z 与ε无关。
2、工具变量估计:
Y X βε=+,n k n L X Z ××⇒
<1>L k =:
IV 估计:Y X βε=+;1ˆ(')'IV
Z X Z Y β−= 111
'''Z Y Z X Z n n n
βε=+ '''lim()lim()lim()lim()Z Y Z X Z Z X p p p p n n n
'n βεβ=+=
11''''(ˆlim lim()lim()lim()lim[]IV
Z X Z Y Z X Z X p p p p p n n n n
)βεββ−−+=== 显然有ˆlim()IV
p ββ= <2>
L k >Y X βε=+
11111
'(')''(')''(')'1X Z Z Z Z Y X Z Z Z Z X X Z Z Z Z n n n
βε−−=+− 1111ˆˆˆˆ['(')']['(')'](')'IV
X Z Z Z Z X X Z Z Z Z Y X X X Y β−−−−==,相当于ˆX 作为X 的IV ,1ˆ(')'X
Z Z Z Z X −=,相当于X 对Z 回归得到的拟合值ˆX 。
注意:ˆIV
β的精度取决与Z 与X 的相关程度。
以一元回归模型为例说明: Y X αβ=++ε,工具变量Z :
ˆi
i
IV
i i
z y
z x
β=∑∑,其中均写成变量Z 与X 的离差形式。
222222
2
2221
1
ˆˆˆˆ..()()
()
i IV
i i i i i
i ZX
i
i
z
Est Asy Var x z x z x x r x z
βσσ
σ
===∑∑∑∑∑∑∑2
) 所以21,ZX r →ˆ..(IV Est AsyVar β越小,20,ZX r →ˆ..(IV
Est Asy Var )β越大。
同学们此时能否说明ˆlim IV
p ββ=? 说明:
1)IV 估计量仍是有偏的,工具变量并没有替代模型中的解释变量,只是在估计过程中作为“工具”使用;
2)IV 估计可以概括为两阶段最小二乘法。
第一阶段:X 对Z 回归,得ˆX
,第二阶段:对Y ˆX 回归得ˆIV
β。
3)一个随机性解释变量可以有多个工具变量。
但在实际中,工具变量的寻找并不是件容易的事情。
有时可以用1t X −作为t X 的工具变量。
三、测量误差
1、被解释变量的测量误差:i i Y X i αβε=++ 若被解释变量存在测量误差,则观测到i Y *i i Y Y u i =+ 设与i u i ε不相关,与i u i X 不相关。
实际采用的回归模型为:
()*i i i Y X αβε=+++i u i
2、解释变量存在测量误差:i i Y X αβε=++ 若被解释变量i X 存在测量误差,则观测到*i i i X X v =+ 设与i v i ε不相关,与i v i X 不相关。
实际采用的回归模型为:
()*i i i Y X i v αβεβ=++−
请思考:这两种情形下模型的OLS 估计会有什么问题?如果解释变量和被解释变量都存在测量误差呢?。