工具变量法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ε i . We cannot estimate β consistently by using
OLS. But we can construct a consistent estimator of β by using the assumed relationships among z i , xi and
这里,不需要像以前那样对 s 的自由度进行修正,因为这里所有结果都是渐近的, s 在任 何情况下都不会无偏(但是,许多软件仍然对自由度进行修正) 。经过对上式的处理,会发 现 s 是 σ 的一致估计量,因为上式的第二、三项都收敛于 0。因此 IV 估计量的方差的估
2 2 2 2
计值为
2
Est. Asy.var ( b IV ) =
−1
IV 估计量服从优良的大样本特性,即
a σ2 1 −1 b IV ∼ N β, Q − ZX Q ZZ Q XZ . n
(2.1.1)
如何估计 σ ?
2
e = y − Xb IV = y − X ( Z ' X ) Z ' y
−1 −1 = I − X ( Z ' X ) Z ' y −1 = I − X ( Z ' X ) Z ' ( Xβ + ε ) −1 = I − X ( Z ' X ) Z ' ε
这里假定 Z 和 X 的变量数相同,因此 Z ' X 是方阵,由于假定其秩为 K,所以 Z ' X 也是满 秩的,则
Z ' X Z 'y plim n plim n = β
因此推出 IV 估计量为
-1
b IV = ( Z ' X ) Z ' y
= ε − X (Z ' X) Z 'ε
−1
s2 =
e 'e n
−1 −1 −1
ε 'ε ε ' Z X ' Z X ' X Z ' X Z 'ε ε ' X Z ' X Z 'ε = + − 2 n n n n n n n n n
εi .
由于解释变量的内生性导致 OLS 方法不合适的模型: 动态回归:比如 AR 模型,误差项与解释变量之间是相关的 解释变量的测量存在误差的模型 下面给出 IV 估计量。 首先,解释变量和误差项不相关的假定调整为新的假定:
E [ε i | x i ] = ηi
这个新的假定意味着解释变量现在为干扰项的期望提供信息, 即解释变量和干扰项相关。 而 且假定 AI3 隐含着
4.1 Intrinsically linear and intrinsically nonlinear regression models 一般计量经济学都着重于线性回归模型(参数间具线性关系或经过转换后参数间具线性关 系,而不管变量间是线性还是非线性的) ,但是有时候我们不得不面对参数间具非线性关系 的非线性模型(这是非线性模型的定义,不管该模型的变量间是线性还是非线性的) ,这就 是本节要讨论的模型,称为 intrinsically nonlinear regression models, or NLRM。 在误差项具有正态分布的假设下,OLS 估计量不仅仅是 BLUE 而且在整个线性或非线性的 估计量族中是 BUE。但是正如 Davidson and MacKinnon 所述,如果抛开正态分布的假设, 有可能获得非线性估计量,它们的表现好于 OLS 估计量。
下面来推导 IV 估计量。
Z 'y Z ' X Z ' ε Z ' X plim = plim β + plim = plim β n n n n
−1
根据豪斯曼的结论有
Asy.var [b IV − bOLS ] = Asy.var [b IV ] − Asy.var [b OLS ]
因此,
H = ( b IV − bOLS ) '{ Est. Asy.var [b IV ] − Est. Asy.var [bOLS ]}
2
−1
( b IV − bOLS )
−1
(2.2.2)
由上式可知,只有 X 是一组工具变量时,则 IV 估计量就是 y 对 X 回归的 OLS 估计量。该 结论意味着 IV 估计量可以通过两个阶段而获得(仅就逻辑而言,并非确实需要计算这两个 阶段) ,第一阶段是计算 X ,第二阶段是计算 OLS 估计量。基于这个理由,IV 估计量也称 为 2SLS(two-stage least squares)估计量。
∑e = ∑( y − b e )
2 i i 1 b2 xi
2
1 e ' e Z ' X Z ' Z X ' Z n n n n n
−1 −1
−1
= s2 ( Z ' X)
( Z ' Z )( X ' Z )
−1
−1 −1
= s 2 ( X ' Z )( Z ' Z )
(1/ n ) X ' e = 0 。
豪斯曼给出了检验方法,其逻辑如下:
检验两个估计量的差异, d = b IV − b OLS 。在零假设下,OLS 估计量和 IV 估计量都是一致 的;在备择假设下,只有 IV 估计量是一致的。正如多次应用一样,可以使用 Wald 统计量 来检验,
H = d '{ Est. Asy.var [d ]} d
yi = β1 + β 2 xi + ε i yi = β1e β2 xi + ε i
14.2.1 14.2.2
Regression 14.2.2 is known as the exponential regression model and is often used to measure the growth of a variable, such as GDP, money supply. 假如我们对线性模型和非线性模型都使用 OLS 进行估计。 对于线性模型 14.2.1 的估计已经熟知, 在正规方程组中, 未知的β系数和已知的 x 和 y 变量 分列方程的两边, 因此可以得到 explicit solutions of the two unknown parameters in terms of the data. 而对于非线性模型 14.2.2 的估计,我们最小化
'
ε i . Suppose as well that there exists a set of L variables z i , where L is at least as large as K, such
that z i is correlated with xi but not with
E [ xiε i ] = γ
刻划工具变量方法的假定还有:
E [ε i | z i ] = 0 .
另外有
plim ( Z ' Z / n ) = Q ZZ , a finite, positive definite (assumed) matrix.
1
plim ( Z ' X / n ) = Q ZX , a finite, L*K matrix with rank K (assumed). plim ( Z ' ε / n ) = 0
X = Z (Z ' Z) Z ' X
−1
利用 X 作为新的工具变量代替 Z ,得到
b IV = X ' X
(
)
−1
X'y
−1 −1 −1
= X ' Z ( Z ' Z ) Z ' X X ' Z ( Z ' Z ) Z ' y
(wk.baidu.com.1.2)
通过替换 X ,我们发现 Est. Asy.var ( b IV ) 的公式并不改变。该估计量的一致性和渐近正态 性的证明与前面完全一样,因为前面的证明就是针对任何有效的工具变量的, X 也完全满 足。
3. Hausman’s Specification Test 这实际上就是基于 OLS 和 IV 来检验解释变量的严格外生性假定。 零假设:解释变量与干扰项不相关。或
H 0 : plim (1/ n ) X ' ε = 0 。
通 过 (1/ n ) X ' e 考 察 X 和 ε 的 协 方 差 是 没 有 结 果 的 , 因 为 正 规 方 程 组 总 是 生 成
(2.2.1)
(
)
−1
X'y
因为 I − M z 是对称幂等矩阵。
3
把 X 代入,有
b IV = X ' Z ( Z ' Z ) Z ' Z ( Z ' Z ) Z ' X X ' Z ( Z ' Z ) Z ' y
−1 −1 −1 −1 −1 = X ' Z ( Z ' Z ) Z ' X X ' Z ( Z ' Z ) Z ' y −1
第九章 工具变量法、两阶段最小二乘与非线性最小二乘 Chapter 9 IV, 2SLS and NLS 1. IV Estimator
xi 和 ε i 不相关的假定, E [ε i | xi ] = 0 ,到目前为止的讨论中都是很重要的。但是在经济学
的许多应用问题中,这个假定并不能成立。没有了这个假定,OLS 估计量 b 不再无偏,因 此高斯马尔可夫定理不再成立,它也不是一致估计量。因此,OLS 估计量也就不再适用。 这时替代的估计方法是工具变量(Instrumental Variables, IV)方法,这是一个更一般的估计 方法,OLS 仅仅是其特例。 古典回归模型中 IV 方法的估计大体是这样的: Suppose that in the classical model yi = xi β + ε i , the K variables xi may be correlated with
( Z ' X )
这里还有一个细节。上述证明过程是假定 Z 和 X 具有相同的变量数目。如果 Z 的变量数目 L 超过 X 的变量数目 K 呢?这时 Z ' X 是 L*K 阶的,其秩 K 小于 L,不再存在逆矩阵。前 面推导的一个重要结论是 plim ( Z ' ε / n ) = 0 ,即 Z 的每一列与 ε 是渐近不相关的,这也意 味着 Z 的列的线性组合与 ε 也不相关。所以,一个显然的处理办法是选择 Z 的列的 K 个线 性组合。如何选择呢?一个较好的选择方法是利用 X 对 Z 回归的拟合值:
2
在零假设下,我们可以使用 σ 的两个不同但是一致的估计量。如果都使用 s ,则统计量为
d' X'X H=
(
)
−1
−1 − ( X ' X) d s2
−1
该统计量服从自由度为 K 的卡方分布。
4
4. Nonlinear Regression Models and NLS In this chapter, we examine regression models that are intrinsically nonlinear in their parameters.
4.2 Estimating nonlinear regression models Estimation of linear and nonlinear regression models Too see the difference in estimating linear and nonlinear regression models, consider the following tow models:
2. 2SLS in the sense of IV 利用映射矩阵和残差生成矩阵的定义,有
X = Z ( Z ' Z ) Z ' X = PX
−1
P = Z (Z ' Z) Z ' = I − Mz
−1
因此,
b IV = X ' X
(
)
−1
X'y
−1
= ( X '(I − M z ) X) X '(I − M z ) y = X'X