chap4 异方差
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4. 异方差
用OLS 法得到的估计模型通过统计检验后,还要检验模型是否满足假定条件。
只有模型的假定条件都满足时,用OLS 法得到的回归系数估计量才具有最佳线性无偏特性。
当一个或多个假定条件不成立时,OLS 估计量将丧失上述特性。
第5-7章讨论当假定条件不成立时,对参数估计带来的影响以及相应的补救措施。
以下讨论都是在某一个假定条件被违反,而其他假定条件都成立的情况下进行。
分为5个步骤。
(1)回顾假定条件。
(2)假定条件不成立时对模型参数估计带来的影响。
(3)定性分析假定条件是否成立。
(4)检验(定量分析)假定条件是否成立。
(5)假定条件不成立时的补救措施。
本章介绍异方差的检验和修正方法。
4.1 异方差的概念
在随机误差项u 满足同方差和没有序列自相关的假定下,u 的方差协方差矩阵Var(u ) 是一个对角矩阵,
Var(u ) = σ 2I = σ 2⎪⎪⎪⎪⎪⎭⎫
⎝⎛10101
=⎪⎪
⎪⎪
⎪
⎭
⎫
⎝
⎛22
200σσσ 4.1
即Var(u )主对角线上的元素都是常数且相等,每一误差项的方差都是有限的相同值(同方差假定);且非主对角线上的元素为零(非自相关假定)。
当这两个假定不成立时,Var(u ) 不再是一个纯量对角矩阵,表示如下。
Var(u ) = σ 2 Ω = σ 2⎪⎪
⎪⎪⎪
⎭
⎫
⎝⎛TT T T T T σσσ
σσσσσσ (2)
122221112
11≠σ 2
I 4.2 当误差向量u 的方差协方差矩阵主对角线上的元素不相等时,这意味着对应不同的随机变量,方差不同。
此时,称该随机误差系列存在异方差,即误差向量u 中的元素u t 取自不同的分布总体。
非主对角线上的元素表示误差项之间的协方差值。
比如 Ω 中的 σi j ,(i ≠ j )
表示与第i 组和第j 组观测值相对应的u i 与 u j 的协方差。
若 Ω 非主对角线上的部分或全部元素都不为零,误差项就是自相关的。
本章讨论异方差。
第6章讨论自相关。
第7章讨论多重共线性及其他一些违反假定条件的情形。
以两个变量为例,同方差假定如图4.1和4.2所示。
对于每一个x t 值,相应u t 的分布方差都是相同的。
图 4.1 同方差情形 图 4.2 同方差情形
4.2 异方差表现、来源及后果
4.2.1 异方差的表现与来源
异方差通常有三种表现形式,(1)递增型,(2)递减型,(3)条件自回归型。
递增型异方差见图5.3和5.4。
随着解释变量的增加,随机误差项的方差越来越大。
图5.5为递减型异方差,即随着解释变量的增加,随机误差项的方差越来越小。
图5.6为条件自回归型异方差。
经济时间序列中的异方差常表现为递增型异方差。
金融时间序列中的异方差常表现为自回归条件异方差。
时间序列数据和截面数据中都有可能存在异方差。
无论是时间序列数据还是截面数据。
递增型异方差的来源主要是因为随着解释变量值的增大,被解释变量取值的差异性增大。
图 4.3 递增型异方差 图 4.4 递增型异方差 图 4.5 递减型异方差 图 4.6 条件自回归型异方差
4.2.2 异方差的后果
下面以简单线性回归模型为例讨论异方差对参数估计的影响。
对模型
y t = β0 + β1 x t + u t 4.3
当Var(u t ) = σt 2为异方差时(σt 2是一个随时间或序数变化的量),回归参数估计量仍具有无偏性和一致性。
以1
ˆβ为例 1
ˆβ= β1 + ∑ k t u t 其中, k t = ∑--2)
()
(x x x x t t t
4.4
E(1ˆβ| x t )= E[β1 +2
()()
t t t t
x x u x x --∑| x t ]
= β1 +
1
2
1
()(|)
()
T
t
t t t T
t
t x x E u
x x x ==--∑∑= β1
但是回归参数估计量不再具有有效性。
以1
ˆβ为例,由一元线性回归模型的内容可知 Var (1ˆβ| x t ) = E(1
ˆβ-β1| x t )2 = E[2
1
22
1
(()|)(())T
t t t t T
t t x x u x x x ==--∑∑]
=
2
2
1
22
1
()E(|)(())T
t
t
t t T
t t x x u
x x x ==--∑∑
=
∑∑==--T
t t T
t t t x x x x 1
2
21
2
2))(()(σ≠
∑=-T
t t x x 1
2
2
)(σ 4.5
(在上式的推导中)。
上式不等号左侧项分子中的σt 2不是一个常量,不能从累加式中提出,所以不等号左侧项不等于不等号右侧项。
而不等号右侧项是同方差条件下β1的最小二乘估计量1ˆβ的方差。
因此,异方差条件下的1
ˆβ失去有效性。
这时,OLS 估计量不再具有BLUE 性质。
回归参数估计量的t 统计量不再服从t 分布,而且即使是在大样本的情况下也是如此。
回归参数估计量的方差估计量是真实方差的有偏估计量。
F 统计量也不再是F 分布。
下面用矩阵形式讨论异方差。
因为OLS 估计量无偏性的证明只依赖于模型的一阶矩,
所以当Var(u ) 如(5.2)式所示时,OLS 估计量ˆβ
仍具有无偏性和一致性。
E(ˆβ
) = E[ (X 'X )-1 X 'Y ] = E[ (X 'X )-1 X ' (X β + u ) ] = β + (X 'X )-1
X '
E(u ) = β 4.6
但不具有有效性和渐近有效性。
而且ˆβ
的分布将受到影响。
Var(ˆβ
|X ) = E [(ˆβ- β ) (ˆβ- β )' |X ] = E [(X 'X )-1 X ' u u ' X (X 'X )-1|X ] = (X ' X )-1 X ' E (u u ' |X ) X (X ' X )-1
= σ 2
(X
'X )-1
X
' Ω X (X
' X )-1
4.7
不等于σ 2 (X ' X )-1,所以异方差条件下的ˆβ
是非有效估计量。
4.3 异方差稳健推断
4.3.1 异方差稳健标准差
White (1980)提出,对于一元线性回归模型
y t = β0 +β1x 1t + u t
当存在异方差时(不论异方差是什么形式),可以通过如下公式得到参数估计量1
ˆβ的有效方差估计量
2
2
1
1
2
ˆ()ˆvar()T
t
t
t i
x x u
SST β=-=∑。
4.8
对于多元线性回归模型
y t = β0 +β1x 1t + β2x 2t +…+ βk x k t + u t ,
可以通过如下公式计算参数估计量ˆi
β的有效方差估计量 22
1
2
ˆˆˆvar()T
it t
t i
i u
u SST β==∑ 4.9
其中,2ˆit u 表示用第i 个解释变量x i 对所有其他解释变量进行回归得到的残差,SST i 为其
残差平方和。
(4.9)式的平方根被称作ˆi
β的异方差稳健标准差(heteroskedasticity-robust standard error ),也经常被称作Huber/White/sandwich 标准差。
有时,先用自由度对(4.9)
式进行修正,之后再求其平方根作为ˆi
β的异方差稳健标准差。
即, 22
1
2
ˆˆˆvar()1
T
it t t i
i u u n
SST n k β==--∑。
4.10
这时,我们便可以利用异方差稳健标准差构建异方差稳健t 统计量
思考题:既然在很多情况下异方差稳健标准差比OLS 估计量的普通标准差更有效,那么为什么不直接用异方差稳健估计量呢?还需要检验模型中是否存在异方差吗?
Key :1. 如果模型中不存在异方差,那么OLS 估计量的普通标准差具有确切的t 分布,与样本水平没有关系。
而通过异方差稳健标准差构建的异方差稳健t 统计量只是渐进服从t 分布,即只是在大样本下才成立。
2.如果存在异方差,那么OLS 估计量不再具有BLUE 性质,但是如果知道异方差的具体形式,那么可以得到比OLS 估计量更好的估计量。
例:
OLS 估计:
结果为:
异方差稳健标准差为:
4.3.2 异方差稳健LM 检验
如果模型中存在异方差,则参数线性约束的F 检验也不再有效。
这时可以利用异方差稳健LM 检验。
步骤如下。
Step1:回归受约束模型,提取残差项u ;
Step2:用X 2中每个变量对X 2回归,提取残差项,记为12ˆˆˆˆ(,,,)K J r r
r
-=r ; Step3:用u 与ˆr 相乘,得到12ˆˆˆˆ(,,,)K J u ur ur
ur
-=r ; Step4:利用OLS 方法回归方程ˆ1()u =αr
,残差平方和记为SSE 0; Step5:构建LM 统计量20~J LM N SSE χ=-。
例:
对约束的异方差稳健LM 检验: . stata 结果为:
4.4 异方差的检验方法
异方差的基本假定形式
H 0: E(u i 2|x 1, x 2, …, x k ) = E(u i 2|x 1, x 2, …, x k ) = σ2
即,u i 的条件方差是相同的,或者说当u i 与x 1, x 2, …, x k 不相关时,u i 的方差是相同的。
如果u i 存在异方差,那么说明u i 与x 1, x 2, …, x k 存在相关性。
因此,检验异方差的基本思路是考察u i 与x 1, x 2, …, x k 是否存在相关性,以及什么形式的相关性。
对实际问题的分析,有时可以初步判别是否存在异方差。
主要有三种方式。
(1) 当经济变量取值的差别随时间或解释变量的增大而变大时,容易出现异方差。
如在个人支出与收入的关系中,投入与产出的关系中,常会存在异方差。
(2) 利用散点图也可以初步判断是否存在异方差。
如果两个变量的散点图与图4.4相类似时,说明存在异方差。
(3) 也可以利用模型的残差图做初步判断。
如果模型的残差图如图4.7相类似时,说明存在递增型异方差。
注意:对于截面样本,当用残差图观测是否存在异方差时,必须先按解释变量给样本值排序。
否则即使是有异方差,利用残差图也看不出来。
4.4.1 Goldfeld-Quandt 检验
Goldfeld-Quandt 检验由Goldfeld 和Quandt 1965年提出。
这种检验的思想是以引起异
方差的解释变量的大小为顺序,去掉中间若干个值,从而把整个样本分为两个子样本。
用两个子样本分别进行回归,并计算残差平方和。
用两个残差平方和构造检验异方差的统计量。
具体步骤如下。
设回归模型为:
y t = β0 +β1x 1t + β2x 2t +…+ βk x k t + u t Goldfeld-Quandt 检验的零假设和备择假设是 H 0: u t 具有同方差
H 1: u t 具有递增型异方差
①把原样本分成两个子样本。
具体方法是把成对(组)的观测值按解释变量的从小到大顺序排列,略去m 个处于中心位置的观测值(通常T > 30时,取m ≈ T / 4,余下的T - m 个观测值自然分成容量相等的两个子样本,容量各为 (T - m ) / 2。
如下所示。
{x 1, x 2, …, … x i -1, x i , x i +1, …, … x T -1, x T }
n 1 = (T -) / 2 m = T / 4 n 2 = (T -) / 2
② 用两个子样本分别估计回归直线,并计算残差平方和。
相对于n 2 和n 1 的残差平方和分别用SSE 2(对应于x t 值比较大的子样本)和SSE 1(对应于x t 值比较小的子样本)表示。
③构造F 统计量,
F =
222
111
/(1)/(1)SSE n k SSE SSE n k SSE --=-- 4.11
其中n 2 = n 1 为子样本容量,k 为原模型中被估参数个数。
在H 0成立条件下,
F ~ F ( n 2 – k-1, n 1 - k-1)
④ 根据实际情况分析,若不存在异方差,两个子样本对应的残差平方和应该近似相等,即F 值接近1。
若存在递增型异方差,则SSE 2要远远大于SSE 1,即F 值很大。
判别规则如下,
若 F ≤ F α ( n 2 – k-1, n 1 - k-1) , 接受H 0 (u t 具有同方差) 若 F > F α ( n 2 – k-1, n 1 - k-1),拒绝H 0 (具有递增型异方差) 对于Goldfeld-Quandt 检验应该注意如下四点:
① 对于截面样本,计算F 统计量之前,必须先把数据按解释变量的值从小到大排序。
② 此法只适用于递增型异方差。
③ Goldfeld-Quandt 检验依赖于随机误差项服从正态分布。
④ 当模型含有多个解释变量时,应以每一个解释变量为基准检验异方差。
例:农作物种植面积与农作物产出
. sort x, stable
. regress y x in 1/11
. scalar s1=e(rss)
. regress y x in 19/29
. scalar s2=e(rss)
. scalar F=s2/s1
. scalar Fprob=Ftail(11,11,F)
. scalar list
4.4.2Glejser检验
Glejser检验由H. Glejser 1969年提出。
检验原回归式的残差的绝对值|t uˆ|是否与解释变量x t的若干形式存在函数关系。
若有,则说明存在该种形式的异方差;若无,则说明不存在异方差。
通常给出的几种形式是
|t uˆ| = a0 + a1x t
|t uˆ| = a0 + a1x t2
|t uˆ| = a0 + a1
x
t
….
ˆα通过显著性检验,则说明存在该种形式的异方差。
如果哪一种形式的
1
Glejser检验的特点是:
①既可检验递增型异方差,也可检验递减型异方差。
②一旦发现异方差,同时也就发现了异方差的具体表现形式。
③计算量相对较大。
④当原模型含有多个解释变量值时,可以把|
uˆ|拟合成多变量回归形式。
t
例:
. regress y x
. predict res, residual
. gen absres=abs(res)
. regress absres x
得到结果如下。
4.4.3Breusch and Pagan /Cook-Weisberg 检验
根据异方差检验的基本思路,可以考虑这样一种简单的检验方法。
假设相关关系式为u2 = δ0 +δ1x1 +δ2x2 +δk x k + v t
如果原假设H 0: E(u i 2|x 1, x 2, …, x k ) = E(u i |x 1, x 2, …, x k ) = σ2成立,那么上式中每个解释变量的回归系数都不应该具有显著性,即δ 0 =0, δ1 = 0, …, δk = 0。
实际检验步骤如下。
Step1:首先估计方程:y t = β0 +β1x 1t + β2x 2t +…+ βk x k t + u t 。
提取其残差,表示为2ˆt u 。
Step2:估计方程:2ˆt u
= δ0 +δ1x 1 +δ2x 2 +δk x k + v t 。
对整个方程的显著性进行检验。
一般地,利用F 统计量、Wald 统计量或LM 检验来完成。
注:在第二步中,经常采用另外一种形式,用被解释变量的拟合值作为解释变量。
即 然后计算方程显著性的F 统计量。
例:
. estat hettest, normal <Wald 检验> . estat hettest, iid <LM 检验> . estat hettest, fstat <F 检验>
4.4.4 White 检验
White 检验由H. White 1980年提出。
Goldfeld-Quandt 检验必须先把数据按解释变量的值从小到大排序。
Glejser 检验通常要试拟合多个回归式。
White 检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一个辅助回归式构造 χ2 统计量进行异方差检验。
White 检验的具体步骤如下。
以二元回归模型为例,
y t = β0 +β1 x 1t +β2 x 2t + u t 4.12
1.首先对上式进行OLS 回归,求残差t u
ˆ。
2.作如下辅助回归式
2ˆt u
= α0 +α1 x 1t +α2 x 2t + α3 x 1t 2 +α4 x 2t 2 + α5 x 1t x 2t + v t 4.13 或者
2ˆt u
= α0 +α1 x 1t +α2 x 2t + α3 x 1t 2 +α4 x 2t 2 + v t 4.14 即用2ˆt u
对原回归式中的各解释变量、解释变量的平方项、交叉积项进行OLS 回归。
注意,上式中要保留常数项。
求辅助回归式(4.13)或(4.14)的可决系数R 2。
3.White 检验的零假设和备择假设是 H 0: 模型中u t 不存在异方差, H 1: 模型中u t 存在异方差 4.在不存在异方差假设条件下统计量
T R 2
~ χ
2(k )
4.15
其中T 表示样本容量,R 2是辅助回归式(4.13)或(4.14)的OLS 估计式的可决系数,自由度k 表示辅助回归式中解释变量的个数(注意,不包括常数项)。
如果采用(4.13),那么自由度k =5;如果采用(4.14),那么自由度k =4。
5.判别规则
如果检验辅助回归式采用(4.13),若 T R 2 ≤χ2α (5), 接受H 0 (u t 具有同方差);若 TR 2 >
χ2α (5), 拒绝H 0 (u t 具有异方差)。
如果检验辅助回归式采用(4.14),若 TR 2 ≤χ2α (4), 接
受H 0 (u t 具有同方差);若 T R 2 > χ2α (4), 拒绝H 0 (u t 具有异方差)。
例:
. estat imtet, white
4.4.5 自回归条件异方差检验
异方差的另一种检验方法称作自回归条件异方差 (ARCH ) 检验。
这种检验方法不是把原回归模型的随机误差项σt 2 看作是x t 的函数,而是把σt 2 看作随机误差平方项u t -12 及其滞后项, u t -22 , … 的函数。
ARCH 是误差项二阶矩的自回归过程。
恩格尔(Engle 1982)针对ARCH 过程提出LM 检验法。
辅助回归式定义为
2ˆt u
= α0 + α1 21ˆ-t u + … + α n 2ˆn t u - 4.16 LM 统计量定义为
LM = T R 2
~ χ
2
(n )
4.17
其中R 2是辅助回归式(5.12)的可决系数。
在H 0:α1 = … = αn = 0 成立条件下,LM 渐近服从 χ 2(n ) 分布。
其中n 表示2ˆt u
的滞后项个数。
ARCH 检验的最常用形式是一阶自回归模型(n = 1),
2ˆt u
= α0 + α1 21ˆ-t u 在这种情形下,ARCH 渐近服从 χ 2(1) 分布。
4.5 广义最小二乘法
4.5.1 广义最小二乘法
下面以矩阵形式描述克服异方差。
设模型为
Y = X β + u 4.18
其中E(u ) = 0,Var(u ) = E(u u ') = σ 2Ω。
Ω 已知,β 与σ 2未知。
因为 Ω ≠ I ,违反了假定条
件,所以应该对模型进行适当修正。
因为 Ω 是一个T 阶正定矩阵,所以必存在一个非退化T ⨯T 阶矩阵M 使下式成立。
M Ω M ' = I T ⨯T 4.19
从上式得
M 'M = Ω -1
4.20
用M 左乘回归模型(4.18)两侧得
M Y = M X β + M u 4.21
取Y * = M Y, X * = M X, u * = M u , 上式变换为
Y * = X *β + u * 4.22
则 u * 的方差协方差矩阵为
Var(u *) = E(u * u *' ) = E (M u u ' M ' )
= M σ 2
Ω M
' = σ 2
M Ω M
' = σ 2
I 4.23
变换后模型中的Var (u *)是一个纯量对角矩阵。
对变换后模型进行OLS 估计,便可以得到β 的最佳线性无偏估计量。
这种估计方法称作广义最小二乘法。
β 的广义最小二乘 (GLS) 估计量定义为
β
ˆ(GLS) = (X *' X *)-1 X *' Y * = (X 'M ' M X ) -1 X ' M 'M Y
= (X 'Ω -1
X ) -1
X 'Ω -1
Y 4.24
下面以异方差形式Var(u t ) = σ 2 x t 2为例,具体介绍广义最小二乘法变换结果。
σ 2 Ω = σ 2⎪
⎪⎪⎪
⎭
⎫
⎝
⎛22
10...
0T x x 4.25 定义
M = ⎪⎪⎪
⎭
⎫
⎝
⎛T x x /10...0/11 4.26
从而使
Var(M u) = E (M u u ' M ' ) = M σ 2 Ω M ' = σ 2 M Ω M '
= σ 2⎪⎪⎪⎭⎫
⎝
⎛T x x /10...0/11
⎪⎪⎪⎪⎭
⎫
⎝⎛22
1
0...
0T x x '
1/10...0/1⎪⎪⎪⎭
⎫
⎝⎛T x x = σ 2
I (T ⨯T ) 4.27
已消除了异方差。
4.5.2 利用Glejser 检验结果消除异方差
设回归模型为
y t = β0 +β1 x 1t +β2 x 2t + u t 假设Glejser 检验结果是
|t u
ˆ| = 0ˆa +1ˆa x 1t 说明异方差形式是Var(u t ) = (0ˆa
+1ˆa x 1t )2σ2。
用 (0ˆa +1ˆa x 1t ) 除原模型 (5.9) 各项,
011ˆˆt t y a a x += β00111
ˆˆt a a x ++β11011ˆˆt t x a a x ++β22011ˆˆt t x a
a x ++011ˆˆt t u a a x + (5.25)
则 Var(
011ˆˆt t u a a x +) =20111
ˆˆ()t a
a x +Var(u t )
=
2
0111
ˆˆ()t a
a x + (0ˆa +1ˆa x 1t )2σ2 = σ2 (5.26)
说明消除了异方差。
对 (5.25) 式做OLS 估计,把回归参数的估计值代入原模型 (5.9)。
4.5.3 可行的GLS 方法
用广义最小二乘法对异方差进行修正首先必须知道异方差的形式,经验应用中对于异方差的形式有很多不同的设定。
这里我们介绍一种常见的设定形式。
Var (u | x ) = σ2 exp(δ0 +δ1 x 1 +δ2 x 2 +δk x k )
在应用GLS 之前,首先要估计上式中的未知参数δi 。
根据上式可以通过如下计量模型估计δi
u 2 = σ2 exp(δ0 +δ1 x 1 +δ2 x 2 +δk x k ) v
然后用OLS 方法得到的残差平方序列2ˆt u 作为u 2的替代变量估计上述方程。
首先将方程
取自然对数,得到
log (2ˆt u
) = log(σ2) + δ0 +δ1x 1 +δ2x 2 +δk x k + v t = δ0* +δ1x 1 +δ2x 2 +δk x k + v t ,
然后再利用OLS 方法估计上述模型。
具体操作步骤如下。
1.首先估计方程:y t = β0 +β1x 1t + β2x 2t +…+ βk x k t + u t 。
提取其残差平方序列,表示为2ˆt u 。
2.估计方程:log (2ˆt u ) = δ0* +δ1x 1 +δ2x 2 +δk x k + v t ,并计算2ˆt u 的预测值ˆt h 。
3.以
y t = β0 +β1x 1t + β2x 2t +…+ βk x k t + u t 。
对异方差的另外一种更一般的设定形式为,
Var (u | x ) = σ2 exp[(δ0 +δ1 x 1 +δ2 x 2 +δk x k ) + (δ0 +δ1 x 1 +δ2 x 2 +δk x k )2] 对于这种形式的设定,其修正步骤为如下。
1.首先估计方程:y t = β0 +β1x 1t + β2x 2t +…+ βk x k t + u t 。
提取其残差平方序列,表示为2ˆt u ;提取y t 的拟合值,表示为ˆt y。
2.估计方程:log (2ˆt u ) = α0 +α1ˆy +α22ˆy + v tt ,并计算2ˆt u 的预测值ˆt
h 。
3.以y t = β0 +β1x 1t + β2x 2t +…+ βk x k t + u t 。
4.5.4 通过对变量取对数消除异方差
在实际应用中,通过对变量取对数的方法常常能达到消除异方差的目的。
详细请见本章后面的案例。
4.6 案例分析
案例1
取1986年中国29个省市自治区农作物种植业产值y t (亿元)和农作物播种面积x t (万亩)数据(见表5.1)研究二者之间的关系。
得估计的线性模型如下,
y t = -5.6610 + 0.0123 x t (5.27) (12.4) R 2 = 0.85, F = 155.0, T = 29
表5.1 y t 和x t 数据
图5.8 农作物产值y t 和播种面积x t 散点图 图5.9 (5.27)式的残差图
无论是从y t 和x t 观测值的散点图(见图5.8)还是模型的残差图(见图5.9)都可以发
现数据中存在递增型异方差。
1.检验异方差
(1)用Goldfeld-Quandt 方法检验是否存在异方差。
① 首先对成对样本数据(y t ,x t )按x t 取值大小排序。
表5.2 按x t 取值从小到大排序的成对y t 和x t 数据
② 去掉中间7个数据,则按x t 取值大小分成样本容量各为11的两个子样本。
③ 用两个子样本(x 1, …, x 11),(x 19, …, x 29),各自回归得结果如下,
y t = 2.7202 + 0.0106 x t , (t = 1, …, 11) (5.28) (5.8) R 2 = 0.80, F = 33.8, SSE 1 = 1266
y t = 5.8892 + 0.0118 x t , (t = 19, …, 29) (5.29) (3.0) R 2 = 0.50, F = 9.1, SSE 2 = 14174 计算F 统计量, F =
)
211/(1266)
211/(14174-- = 11.2,
因为F = 11.2 > F 0..05 (9, 9) = 3.18,所以检验结果是(5.27)式存在递增型异方差。
注意:如果不对表5.1中成对样本数据(y t ,x t )按x t 取值大小排序。
则残差图中观察不到异方差(见图5.10)。
图5.10 残差图
(2) 用Glejser 法检验异方差
用 (5.27) 式的残差的绝对值对x t 回归得
|t u
ˆ| = 0.0024 x t (5.30) (8.0) R 2 = 0.22
可见误差项的异方差形式是Var(u t ) = E(u t )2 = (0.0024)2 x t 2。
(3)用White 方法检验异方差
首先用(5.27)式中的残差做如下辅助回归
2ˆt u
= α0 +α1 x t + α3 x t 2 + v t OLS 估计结果是
2ˆt u
= -219.7 + 0.1595 x t – 0.000055 x t 2 (5.31) (-0.5) (1.5) (-0.6) R 2
= 0.27, T = 29
注意,主要是利用上式的可决系数计算White 检验统计量,所以不必注重上式中的t 值。
计算统计量
T R 2 = 29 ⨯ 0.2765 = 8.02
因为T R 2 = 8.02 > χ20.05 (2) = 5.99,所以模型(5.27)中存在异方差。
以上三种检验方法的检验结果都认为(5.27)式存在异方差。
2.克服异方差
(1)用取对数的方法消除异方差
对y t 和x t 同取对数。
得两个新变量Lny t 和Lnx t (散点图见图5.11)。
用Lny t 对Lnx t 回归,得
Lny t = - 4.1801 + 0.9625 Lnx t (5.31)
(16.9) R 2
= 0.91, F = 285.6, (t = 1, …, 29)
图5.11 Ln y t 和 Ln x t 图5.12 残差图
用Goldfeld-Quandt 方法检验(5.31)式是否存在异方差。
对数据(Lny t ,Lnx t )按Lnx t 从小到大排序。
去掉中间7个观测值,仍按x t 大小分成两个T = 11的子样本,并回归(结果略)得SSE 1 = 1.17,SSE 2 = 0.65,计算F 统计量的值, F =
17
.165
.0 = 0.56 因为0.56小于F 0..05 (9, 9) = 3.18,所以取对数后,模型中已不存在递增型异方差(残差见图5.12)。
(2)用Glejser 检验结果克服异方差。
因为异方差形式是|t u
ˆ| = 0.0024 x t ,所以克服异方差的方法是用x t 分别除(5.27) 式两侧,得变换变量y t * = y t / x t ,x t * = 1 / x t 。
用y t * 对x t * 回归(见图5.13),得
y t * = 0.0113 + 0.8239 x t * (5.32) (13.8) (0.8) R 2 = 0.63, F = 46.1
图5.13 y t * 和 x t * 图5.14 残差图
注意,回归系数0.8239没有显著性,截距项0.0113却有很强的显著性,而0.0113正是还原后模型的回归系数,所以模型通过检验。
用x t 乘(5.32)式两侧并整理得
y t = 0.8239 + 0.0113 x t(5.33)
(0.8) (13.8)R2 = 0.63, F = 46.1
由(5.33) 式得到的残差见图 5.14。
经检验已不存在异方差。
(5.33) 式,即(5.32) 式中的回归参数具有最佳线性无偏特性。
比较(5.27)和(5.33) 式,虽然0.0113和0.0123相差不多,但从估计原理分析,0.0113有更大的可能性比0.0123离回归参数真值近。
通过这个例子说明,在实际中直接用解释变量除原变量的变换方法克服异方差是可行的。
练习题
1.家庭储蓄模型
Save = β0+β1 income + β2 size+ β3 age +β4 educ + u
其中,save、income、size、educ分别表示储蓄、收入、家庭规模(人口数量)、家长的年龄、家长受教育的年数。
(1)估计上述方程(数据文件:saving.csv)
(2)检验是否存在异方差
(3)试着检验异方差的形式
(4)如果存在异方差,用GLS方法进行修正
2.吸烟模型。