内生性问题

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

工具变量和两阶段最小二乘

一、背景

虽然在OLS 的大样本性质中，我们放宽了强外生性的假定，用弱外生条件来进行替代，即()0E x ε'=。但是，在实际的问题中，弱外生性的条件往往也是不容易满足的。也就是说，变量的内生性问题总是不可避免的。内生性引起的问题主要是引起参数估计的不一致。可以说，内生性问题是在实际应用中最经常遇到的问题。这个部分讨论的就是如何解决由内生性问题引起的参数估计的不一致。

二、知识要点

1、引起内生性的原因及其对参数估计的影响

2、代理变量法解决内生性问题

3、工具变量法和2SLS 的性质三、要点细纲

1、引起内生性的原因及其对参数估计的影响（1）模型设定偏误（遗漏变量）

这主要是因为实际的问题中，一个变量往往受到许多变量的影响，在实际建模过程中无法将解释变量全部列出。在这样的情况下，遗漏的变量的影响就被纳入了误差项中，在该遗漏变量与其他解释变量相关的情况下，就引起了内生性问题。即()0E x ε'≠。

（2）测量误差

关于测量误差引起内生性的问题要基于测量误差的假设。测量误差可能是对被解释变量y 的测量误差，也可能是由于对解释变量x 的测量误差。这两种情况引发的结果是不一样的。

A. 被解释变量y 的测量误差。

不妨假设y 的真实值是*y ，测量值为y ，则可以将测量误差表示成：

0e y y =-。假设理论的回归方程为：

011k k y x x βββε=+++

将测量误差方程带入得到：

0110k k y x x e βββε=++++ 011k k x x v βββ=+++

其中0v e ε=+是实际回归方程的残差。显然，由于y 的测量误差0e 是与i x 相互独立的，所以实际回归方程的残差v 也与各解释变量相互独立（无关）。外生性条件满足。

B. 解释变量x 的测量误差

假设在回归式011k k y x x βββε=+++ 中，测量误差产生于k x ，即实际回归式为：

011k k y x x βββε=+++

并有*

k k k e x x =-

如果假设cov(,)0k k x e =，则将测量误差带入方程得到：

011k k k k y x x e βββεβ=++++ 011k k x x v βββ=+++

显然，外生性条件满足。

如果假设**2

cov(,)0cov(,)cov(,)k k k k k k k e x e x e x e e σ=⇒=+=。该假设条件

称为Classical error-in-variables （CEV ）假定。

由上述方程可以看出，此时测量误差会引起内生性问题。 ( 3) 双向交互影响（或者同时受其他变量的影响）

这种情况引起的内生性问题在现实中最为常见。其基本的原理可以阐述为，被解释变量y 和解释变量x 之间存在一个交互影响的过程。x 的数值大小会引起

取值的变换，但同时y 的变换又会反过来对x 构成影响。这样，在如下的回归

方程中：

011k k y x x βββε=+++

如果残差项ε的冲击影响了y 的取值，而这样的影响会通过y 传导到x 上，从而造成了x 和残差项ε的相关。也就是引起了内生性问题。

这里举几个简单、但经常遇到的例子说明。例1：金融发展与经济增长

例2：外商直接投资FDI 与经济增长例3：犯罪率与警备投入

2、代理变量(Proxy)法解决内生性问题考虑如下的回归方程

011k k y x x q βββγε=++++

其中，q 是不可观测的变量（遗漏），假定z 是对q 的一个代理，z 必须满足下列条件：

（1）(|,,)(|,)E y q z E y q =x x （2）(|,)(|)E q z E q z =x

01q z r θθ=++

代理变量的缺点：

A 、当有交互效应时会引起异方差问题

B 、在实际问题中，通常对遗漏的变量是难以意识到的。

C 、约束条件太强。

3、工具变量法和2SLS 的性质

这里先讨论简单工具变量法，两阶段最小二乘2SLS 是简单工具变量法的一个扩展。

关于工具变量的大样本假设

Ⅰ、lim p 'zz Z Z =Q n 是一个有限、可逆的L L ⨯维正定矩阵。 Ⅱ、lim p 'zx Z X

=Q n

是一个有限的L K

⨯的矩阵，并且该矩阵的秩是K 。

Ⅲ、lim p 'Z ε=0n （1）简单工具变量考虑如下一个回归方程：

011k k y x x βββε=++++

现在假设k x 是内生的，也就是说，k x 与残差项ε相关。在这样的情况下，

得到的参数估计值是有偏的。

再次强调，此时参数估计的偏差不仅仅存在于参数k β上，而是所有的参数估计值都会受到影响。看普通最小二乘的结果：

[]

lim ()()()()p b E E E E β--''''==+x x x y x x x ε

其中，不妨设2k =，则有：

()

211121

22221

2x x x x x x x x x x ⎛⎫⎛⎫'== ⎪

⎪⎝⎭⎝⎭x x ，12x x εεε⎛⎫

'= ⎪⎝⎭x []

11121

()lim ()q q X X p E x x n q

--⎛⎫'⎡⎤'== ⎪⎢⎥

⎣⎦

⎝⎭

，11

22lim x X p x n εεε'⎛⎫

⎛⎫=

⎪ ⎪⎝⎭⎝⎭

则可以看出：111211

111122212221

22221122x q x q x q q

x q x q x q q εεεεεε⎛⎫

⎛⎫+⎛⎫= ⎪ ⎪

⎪+⎝⎭⎝⎭⎝⎭ 显然，当

现在回到一般的回归方程：

011k k y x x βββεε=++++=+x β

仍然假设k x 是内生的，如果可以找到一个工具变量1z ，使得1z 满足如下两条假定：

Ⅰ、1()0k E z x ≠ Ⅱ、1()0E z ε=

那么，就可以定义1211(,,,,)k x x x z -=z ，方程两边左乘'z ，同取期望，得到参数估计值，使得：

[]

lim ()()()()p E E E E β--''''==+IV b z x z y z x z ε

但是，这样的简单工具变量得到的估计并不是无偏的（特殊的得到无偏估计的情况是：k x 与其他外生变量无关，只和1z 相关）。正确的做法是，将内生变量k x 对所有的外生变量进行投影（回归），也就是按照如下的公式计算：

011111k k k k x x x z r αααθ--=+++++