工具变量方法原理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
工具变量原理
教学目的及要求:
1、理解引入随机解释变量的目的及产生的影响
2、理解估计量的渐进无偏性和一致性
3、掌握随机解释变量OLS 的估计特性
4、应用工具变量法解决随机解释变量问题
第一节 随机解释变量问题
一、随机解释变量问题产生的原因
多元()线性回归模型:
k
(8-1)
i ki k i i i U X X X Y ++⋅⋅⋅+++=ββββ22110其矩阵形式为:
(8-2)
U XB Y +=在多元()线性回归模型中,我们曾经假定,解释变量是非随机的。如果是随机的,k j X j X 则与随机扰动项不相关。即:
i U
(8-3)
Cov ()i ij U X ,0=),,2,1;,,2,1(n i k j ⋅⋅⋅=⋅⋅⋅=许多经济现象中,这种假定是不符合实际的,因为许多经济变量是不能用控制的方法进行观测的,所以作为模型中的解释变量其取值就不可能在重复抽样中得到相同和确定的数值,其取值很难精确控制,也不易用实验方法进行精确观测,解释变量成为随机变量。又由于随机项包含了模型U 中略去的解释变量,而略去的解释变量往往是同模型中相关的变量,因而就很有可能在是随机变X 量的情况下与随机项相关,这样原有的古典假设就不能满足,产生随机解释变量。
U 在联立方程模型以及模型中包含有滞后内生变量等情况下,如果扰动项是序列相关的,那么均有扰动项和解释变量之间的相关性的出现,模型就存在随机解释变量问题。
例如,固定资产投资与国民收入的关系满足如下模型:
t t t t u I Y I +++=-1210βββ
其中,为期的固定资产投资,为期的固定资产投资,为期的国民收入,因为
t I t 1-t I 1-t t Y t 是随机变量,故模型中存在随机解释变量。
1-t I 再如,消费与收入之间的影响关系模型为
t t t t u C Y C +++=
-1210βββ其中,为期的消费支出,为期的消费支出,是期的收入,因为是随机变t C t 1-t C 1-t t Y t 1-t C 量,故模型中存在随机解释变量。
二、随机解释变量问题的后果
模型中,在解释变量为随机变量并且与扰动项相关的情况下,应用普通最小二乘法估计参数可能会出现估计的不一致性,使得估计值产生很大的偏误,造成拟合优度检验的全面失准,检验失F 效,检验失去意义。在这种情况下,各种统计检验得到的是虚假的结果,不能作为判别估计式优劣t 的依据。
随机解释变量带来何种结果取决于它与随机误差项是否相关: 1)随机解释变量与随机误差项不相关
2)随机解释变量与随机误差项在小样本下相关,在大样本下渐进无关 3)随机解释变量与随机误差项高度相关 4)滞后被解释变量与随机误差项相关
第二节 随机解释变量模型的估计特性
我们讨论的估计量的性质(包括无偏性、最小方差性)都是在样本容量一定的情况下的统计性质,在数理统计上叫做小样本性质。在某些情况下,小样本时的估计量不具有某种统计性质,但是随着样本容量的增大,一个估计量在小样本时不具有的性质,大样本时就逐渐具有这种统计性质了,这种性质我们叫做大样本性质或叫做估计量的渐近统计性质。常用的渐近统计性质有渐近无偏性和一致性。
一、估计量的渐近无偏性
记代表模型中参数的估计量,其上标表示样本容量。一般来说,取如下的样本容量,
)
(ˆn β
βn n
,为一随机变量。随着样本容量的增大,估计量构成一个估计量(随机k n n n <⋯<<21)(ˆn β
n )(ˆn β变量)序列:
=
,,…,
,…
{})
(ˆn β)(1ˆn β
)(2
ˆn β
)(ˆk
n β
(8-4)
所谓渐近理论就是讨论当变得很大时,以上这些序列会有怎样的结果。
n 序列如果满足: {}
)(ˆn β
()= (8-5) E n ∞
→lim )(ˆn β
β则称为的渐近无偏估计。也就是说,当样本容量越来越大,趋于时,的均值越
)
(ˆn β
βn ∞)
(ˆn β
来越接近参数的真值。
β这里需要注意的是,有些估计量在小样本下是有偏的,但在大样本下是无偏的,即是渐近无偏的。例如随机变量的样本方差
X
2
1
2
)(1∑=-=n i i x X X n S 容易证明(在数理统计中已有证明)
1
1()(22n
S E x -=σ其中,为总体方差。很明显,在小样本下,作为的估计量是有偏的,但随着的无限2
σ2
x S 2
σn 增大,趋于总体的真正方差,因此是渐近无偏的。可见,通过增加样本容量,可以改善参)(2
x S E 2
σ数估计的精度。
二、估计量的一致性
如果随着样本容量的增大,估计量几乎处处趋近于真值,我们说为的一致估计量,
)
(ˆn ββ)
(ˆn β
β或称依概率收敛于。如果样本容量无限增大时,的分布收敛于,的方差趋于零,
)
(ˆn β
β)
(ˆn ββ)
(ˆn β
就是的一致估计量。 )(ˆn β
β一致估计量可以记为:或简记为。式中表示概率极限。{
}
1ˆlim )
(==∞
→ββ
n n P ββ
=∞
→)(ˆlim n n P ∞
→n P lim 为简单起见,可略去上标,记作 n ββ
=ˆlim P