计量经济学重点笔记第四讲

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四讲 异方差

一、 同方差与异方差:图形展示

对于模型

12i i i y x ββε=++,在高斯-马尔科夫假定下有:

12222()i

i

i i

y E y x εββδδδ

=+==

其中22i

ε

δδ=意味着同方差假定成立。

为了理解同方差假定,我们先考察图一。在图一中,空心圆点代表(,())i i

x E y ,实心圆点代表观测值(,)i i x y 观测,i y 观测是随机变量

i y 的一个实现(注意,按照假定,i x 是非随机的,即在重复抽样的情况下,给定i 的取值,i

x 不随样本的变化而变化),倾斜的直线代

表总体回归函数:12()i i

E y x ββ=+。图一显示了一个重要特征,

即,尽管1

2

,,...y y

的期望值随着12,,...x x 的不同而随之变化,但由于

假定222i

i

y

εδδδ==,它们的离散程度(方差)是不变的。然而,

假定误差项同方差从而被解释变量同方差可能并不符合经济现实。例如,如果被解释变量y 代表居民储蓄,x 代表收入,那么经常出现的情况是,低收入居民间的储蓄不会有太大的差异,这是因为在满足基本消费后剩余收入已不多。但在高收入居民间,储蓄可能受消费习惯、家庭成员构成等因素的影响而千差万别。图二能够展示这种现象。

图一同方差情况

图二异方差情况

在图二中,依据x1所对应的分布曲线形状,x5所对应的实心圆点看起来是一个异常点(但依据x5所对应的分布曲线形状,它或许称不上是异常点)。异常点的出现是同方差假定被违背情况下的一个典型症状,事实上通过散点图来发现异常点从而初步识别异方差现象在实践中经常被采用,见图三。

浙江工商大学金融学院姚耀军讲义系列

图三异方差情况下的散点图

笔记:

应该注意的是,如果第一个高斯-马尔科夫假定被违背,即模型设定有误,

那么也可能出现异方差症状。例如,正确模型是非线性的,但我们错误地设定为线性,以这个线性模型为参照,散点图也许显示出明显的异方差症状。事实上,在很多情况下,异方差症状被认为是模型错误设定的一个表现。如果产生异方差症状的原因是模型设定有误,那么我们首先应该要做的事情是正确设定模型,而不是基于错误设定的模型寻找有效的估计方法。在本讲中,我们假定其他所有的

高斯-马尔科夫假定成立。

二、异方差的后果

在证明高斯-马尔科夫定理时,我们仅仅在证明OLS估计量具有有效性时涉及到了同方差假定,而在证明线性、无偏性并没有用到该假定,因此违背同方差假定并不影响OLS估计量所具有的线性与无偏性这两个性质(实际上也不影响OLS估计量的一致性,一致性只涉及到高斯-马尔科夫假定一、二、三)。

既然存在异方差,在估计各系数时我们为何不利用这个信息呢?要知道,利用的信息越多,我们获得的估计量其方差将越小,即估计

精度越高。利用OLS 估计法来估计系数时并没有利用异方差这个信息,因此,在存在异方差的情况下,在所有线性无偏估计量中,OLS 估计量并不是最有效的。

另外值得注意的是,当同方差假定被违背时,计量软件包在默认状态下计算出的参数估计量的标准误是无意义的,因为默认状态是同方差假定成立。作为一个复习,下面我们把默认状态下参数估计量的标准差与标准误公式再推导一遍。

真实模型是:

01i i i y x ββε=++,那么有:

1

2

ˆ12

222()()()()(())()()

[()]i i i i i i i i i x x Var x x x x Var x x Var x x x x β

εδβεε-=+---==--∑∑∑∑∑∑ 在重要假定五:(,)0,i j Cov i j εε=≠

下,有:

1

2

2ˆ22

()()[()]i i i x x Var x x βεδ-=

-∑∑ 在重要假定四:22()i

i

Var εε

δδ==下, 1

2

ˆ22

2

22

2

()[()]()i i

i

x x x x x x β

δδδ-=

=

--∑∑∑

计量软件包默认状态下通过公式:

1

ˆ)(se β

=

浙江工商大学金融学院姚耀军讲义系列

来计算

1ˆβ的标准误,其中用22ˆˆ2

i

N δε=-∑来估计误差项的方差。 显然,如果同方差假定不成立,则1

2

ˆ2

2

()i

x x β

δδ≠

-∑,故试图

1

ˆβδ的想法是错误

的。

我们也注意到,只有在高斯-马尔科夫假定成立的前提下,

22ˆˆ2

i

N δε=

-∑才是对误差项方差的一个无偏估计。当误差项具有异方

差性时,即误差项的方差随着i 的变化而变化时,用一个与i 无关的估计量(

2ˆ2

i

N ε-∑的最终结果与i 无关)去估计误差项的方差显然是不

合理的。换句话说,当误差项具有异方差性时,22ˆˆ2

i

N δ

ε=-∑不可能

是对误差方差的一个恰当估计。

笔记:

如果误差项方差已被恰当估计出,如22212,,...,ˆˆˆN δ

δδ,直观来看,我们应该

1

ˆβ的标准差估计。不幸的是,我们无法很好地

估计出各个误差项的方差。误差项是观察不到的,因为我们并不知道参数的真实值。但我们可以获得残差。如果残差是对误差的良好近似,则对误差项性质的任何推断都可以建立在对残差的观察基础上。然而,在异方差情况下,对于每一种不同的误差分布曲线,我们只有一个残差观测值。仅仅依靠一个观察值,我们无法获得对误差方差的一致估计。

应该注意到,

22)2([]()i

i i i E E E εεεεδ-==,既然残差是对误差的近似,难道我们不可以用2ˆi ε

来作为对2i

εδ的估计吗?问题还是在于,我们只能使用一个

相关文档
最新文档