第四讲 异方差性

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第4章 异方差性
4.1 异方差性的含义与产生的原因
4.1.1 异方差性的定义
设线性回归模型为:
t kt k t t t u x b x b x b b y +++++= 22110 (4.1.1)
经典回归中所谓同方差是指不同随机误差项t u (n t ,2,1=)的方差相同,即:
2)var(σ=t u
如果随机误差项的方差不是常数,则称随机项t u 具有异方差性(heteroskedasticity ),即:
2)var(t t u σ=≠常数(t=1,2,…n)
异方差性的几何直观表示形式,可借助观测值的散布图表示。

以一元线性回归为例,在散布图上,就是样本残差平方2
t e 随解释变量的变化而变化。

o
x
图(a) y
图4.1.1 异方差性在散布图上的反映
y
x
o
图(b)
图(d) o
y
y
o
x
x
图(c)
4.1.2 产生异方差性的原因
在计量经济研究中,异方差性的产生原因主要有
1.模型中遗漏了某些解释变量 2.模型函数形式的设定误差 3.样本数据的测量误差 4.随机因素的影响
4.2 异方差性的影响
4.2.1 对模型参数估计值无偏性的影响
以一元线性回归模型为例。

设一元线性回归模型为t t t u x b b y ++=10,随机误差项t
u 的方差随解释变量的变化而变化:2
)var(t t u σ=,其他条件不变。

此时:),0(~2
t t N u σ。

在高斯——马尔可夫定理证明过程中曾经得到:t t u k b b ∑+=11ˆ,因此,111)()ˆ(b u E k b b E t t =∑+=。

这表明1
b 满足无偏性。

同理可以证明0ˆb 也是0b 的无偏估计量。

由此可见,随机误差项存在异方差性,并不影响模型参数最小二乘估计值的无偏性。

4.2.2 对模型参数估计值有效性的影响
在上述假定下参数1b 的估计值1
ˆb 的方差为 )var()var()ˆvar(211t
t t t u k u k b b ∑=∑+= 在随机误差项t u 同方差的假定下,则参数1b 的估计值1
ˆb 的方差为 2
2
22221)
()ˆvar(x x k k b t t
t -∑=∑=∑=σσσ
在随机误差项t u 存在异方差条件下,假设参数估计值为*
1
ˆb ,2
)var(t t u σ==2
σλt (0〉t λ,t=1,2,…n ),此时,
=)ˆvar(*
1
b 22
22t
t t
t
k k λσσ∑=∑2222
t t t t
k k k ∑∑⋅∑=λσ=22
1)ˆvar(t
t t k k b ∑∑⋅λ
比较上式两端,当12
2
〉∑∑t
t t k k λ时,有)ˆvar()ˆvar(1*1b b 〉 从而说明在随机误差项t u 存在异方差条件下,最小二乘估计量1
ˆb 不再具有最小方差。

同理0
ˆb 也有类似的结果。

由此可见,当线性回归模型的随机误差项存在异方差时,参数的最小二乘估计量不是一个有效的估计量。

4.2.3 对模型参数估计值显著性检验的影响
在同方差的情况下,如果以2
σ的无偏估计量2
ˆ22
-=∑
n e
t
σ
估计2
σ,就可以得到系数1
ˆb 的标准误差为
∑-=∑=2
2221)(ˆˆ)ˆ(x x k b s t t
σ
σ
但是,在异方差的情况下,2
t σ是一些不同的数值,只有估计出每一个2
t σ之后才能得到系数的标准误差,这在只有一组样本观测值的情况下是无法做到的。

而且如果设
),2,1,0(ˆ22n t t t t =〉=λσ
λσ,则在异方差的情况下,系数的标准误差: 22*1)ˆ(t t k b s σ∑==222222ˆˆt t t t t
t k k k k ∑∑∑=∑λσσλ=)ˆ(1b s 2
2
t t t k k ∑∑⋅λ
因此,如果仍然用)ˆ(1b s 计算系数的标准误差,将会产生估计偏差,偏差的大小取决于第二个因子值2
2
t
t t k k ∑∑λ的大小,当其大于1时,则会过低估计系数的误差;反之,则做出了过高的估计。

因而,检验的可靠性降低。

在异方差情况下,无法正确估计系数的标准误差)ˆ(1b s ,用t 统计量为)ˆ(ˆ)ˆ(1
11b s b b t =来判断解释变量影响的显著性将失去意义。

4.2.4 对模型估计式应用的影响
4.3 异方差性的检验
4.3.1 图示检验法
1.相关图分析
在回归分析中,常常对拟合回归方程的残差进行分析。

具体作法为将残差对其相应的观
察值作散点图或对一个或多个解释变量作散点图,或是对t y 的估计值t y
ˆ作散点图。

残差图可以为我们判断古典线性回归模型中的同方差假定是否满足提供线索。

图4.3.1 2
e 的的各种形式
例4.3.1 我国制造工业利润函数。

表4.3.1列出了1998年我国主要制造工业销售收入与销售利润的统计资料(单位:亿元)。

现以此数据资料为例,介绍检验异方差性的一些常用方法。

表4.3.1 我国制造工业1998年销售利润与销售收入情况
图(a) 图(b) 图(c)
图(e)
图(f)
图4.3.2我国制造业为销售利润与销售收入的相关图,呈现出递增异方差。

图4.3.2 我国制造业销售利润与销售收入的相关图
2.残差分布图分析
先用最小二乘法估计模型,估计结果为:
t t x y
104394.003349.12ˆ+= s = (19.51809) (0.008442) t = (0.616530) (12.36658)
854694.02=R 849105.02=R 90445.56.=E S 9322.152=F
建立回归模型之后,在方程窗口中点击Resids 按钮可以得到模型的残差分布图,如果残差分布的离散程度有明显扩大的趋势,则表明存在着异方差性。

注意观察之前需要先将数据关于解释变量排序,命令格式为 SORT x
现根据表4.3.1数据资料,可以分别得出模型的残差分布图(图4.3.3)、2
t e 与t x 的散
点图(图4.3.4)、2
t e 与t y ˆ的散点图(图4.3.5),从这些残差分布图可以大致看出随机误差
项存在递增的导方差性。

图4.3.3 残差分布图
图4.3.4 2
t e 与t x 的散点图
图4.3.5 2
t e 与t y
ˆ的散点图 4.3.2 戈德菲尔德——匡特检验(Goldfeld and Quandt test )
检验的具体做法是:
第一,将观察值按解释变量的大小顺序排列,被解释变量与解释变量保持原来对应关系。

第二,将排列在中间的约1/4的观察值删除掉,除去的观察值个数记为c ,则余下的观察值分为两个部分,每部分的观察值个数为(n-c)/2
第三,提出检验假设。

:0H t u 为同方差性;:1H t u 为异方差性。

第四,分别对两部分观察值求回归方程,并计算两部分的残差平方和1RSS 与2RSS ,它们的自由度均为
12
---k c
n ,k 为模型中解释变量的个数。

如果是递增的异方差,则2RSS 〉1RSS ,两者差别较大。

于是构造:
1
2
12]12/)/[(]12/)/[(RSS RSS k c n RSS k c n RSS F =------=
(4.3.1)
则统计量F 服从)12
,12(
------k c
n k c n F 分布。

第五,判断。

当)12
,12(------〉k c
n k c n F F α(给定显著性水平α下的F 临界值),
则表明第二部分的误差项方差大于第一部分误差项方差,即两个子样本的方差水平显著不同,于是否定0H ,接受1H ,即随机误差项存在异方差性。

若αF F 〈,则不存在异方差性。

例 4.3.2 下面我们用德菲尔德——匡特检验法来检验例 4.3.1中模型:
t t t u x b b y ++=10是否存异方差性。

在例4.3.1中,样本数据个数n =28,C=n/4为了使两
个子样本的容量相同,从中间去掉8个数据(即取C=8)。

因此,利用EViews 进行(G —Q)检验的具体步骤为
SORT x 将样本数据关于x 排序
SMPL 1 10 确定子样本1(在命令窗口输入)
LS y c x 求出RSS 1=2579.587 SMPL 19 28 确定子样本2 LS y c x 求出RSS 2=63769.67 计算出F =63769.67/2579.587=24.72
取α=0.05时,查第一自由度和第二自由度均为
8112
8
2812=---=---k c n 的F 分布表得44.3)8,8(=αF ,而F =24.72>44.3)8,8(=αF ,所以存在(递增的)异方差性。

从检验过程可以看出,G-Q 检验适用于检验样本容量较大、异方差性呈递增或递减的情况,而且检验结果与数据剔除个数c 的选取有关。

4.3.3 怀特检验(H.White test )
不访设回归模型为二元线性回归模型:
t t t t u x b x b b y +++=22110 (4.3.2)
White 检验的具体步骤如下:
1.用OLS 法估计模型,并计算出相应的残差平方2
t e ,作辅助回归模型:
t t t t t t t t v x x a x a x a x a x a a e ++++++=2152
24213221102 (4.3.3)
其中t v 为随机误差项。

即求2t e 对t t t t t t x x x x x x 212
22121,,,,的线性回归估计式。

对于一元线性回归模型,则辅助回归模型为t t t t v x a x a a e +++=2
2102。

2.计算统计量2
nR ,其中n 为样本容量,2R 为辅助回归函数中的未调整的决定系数。

3.在0:543210=====a a a a a H 的原假设下,2nR 渐进地服从自由度为5的2
χ分布(对于一元情况,2nR 渐进地服从自由度为2的2χ分布),给定显著性水平α,查2
χ
分布表得临界值)5(2
αχ,比较2nR 与)5(2αχ,如果2nR >)5(2
αχ,则拒绝0H ,接受1H ,表明回归模型中参数至少有一个显著地不为零,即随机误差项t u 存在异方差性。

反之,则认为不存在异方差性。

利用EViews 软件可以直接进行White 检验。

例如对例4.1.1我国制造工业利润函数,White 检验的具体步骤为
(1)建立回归模型: LS y c x (2)检验异方差性:在方程窗口中依次点击
View \Residual Test \White Heteroskedasticity
此时可以选择在辅助回归模型中是否包含交叉乘积项(Crass terms)。

输出结果中obs*R-squared 即White 检验统计量,由其双侧概率可以判断是否拒绝无异方差性的原假设。

例4.3.3 下面我们用White 检验法来检验例4.3.1中模型:t t t u x b b y ++=10是否存异方差。

本例为一元回归模型,辅助回归模型中只有x 和2
x 两项,不存在交叉乘积项。

执行命令之后,屏幕将显示辅助回归模型的估计结果及表4.3.2信息。

表4.3.2 怀特检验结果
其中F 值为辅助回归模型的F 统计量值。

取显著水平
05.0=α,由于
〉=2704.62nR 99.5)2(2
05.0=χ,所以利润函数存在异方差性。

实际上,由输出结果的概率
值(p 值)可以看出,只要取显著性水平α>O.043,就可以认为利润函数存在异方差性。

实际应用中,一般是直接观察p 值的大小,若p 值较小,则拒绝不存在异方差性的假设,认为模型存在异方差性。

4.3.4 戈里瑟检验(Glejser test )和帕克检验(Park test )
其基本原理都是通过建立残差序列对解释变量的(辅助)回归模型,判断随机误差项的方差与解释变量之间是否存在着较强的相关关系。

戈里瑟提出如下的假定函数形式:
t h t t v x a a e ++=10 ,2/1,2,1±±±=h ) (4.3.4)
其中t v 为随机误差项。

例如:
t t t v x a a e ++=10 t t t v x a a e ++=210
t t t v x a a e ++=10
t t t v x a a e ++=1
1
0 t t
t v x a a e ++=11
帕克提出如下的假定函数形式:
t v a t t e x a e 102= (4.3.5)
即:
t t t v x a a e ++=ln ln ln 102 (4.3.6)
或者:
t t t v x a a e ++=102
以Glejser 检验为例,其具体步骤如下:
1.根据样本数据用最小二乘法估计回归模型并求残差t e ; 2.分别建立残差绝对值t e 对每个解释变量的各种回归方程;
3.检验每个回归方程参数的显著性。

如果其参数显著地不为零,则存在异方差性,相反,则认为随机误差项满足同方差假定。

Glejser 检验的特点是:不仅能检验异方差性,而且通过“实验”可以探测异方差的具体形式,这有助于进一步研究如何消除异方差性的影响。

例4.3.4 下面我们用Glejser 检验法来检验例4.3.1中模型:t t t u x b b y ++=10是否存异方差。

利用EViews 软件进行Glejser 检验的步骤为
LS y c x
GENR E=ABS (RESID ) 生成t e 序列
然后利用GENR 命令生成t t t t x x x x /1,,,2
等序列,再分别建立t e 与这些的回归方程。

结果如下:
(1) t t x e 015267.023936.12+=
t = (1.152612) (3.324123)
2R =0.298242 F =11.0498
(2) 26
10
74.205837.27t t x e -⨯+=
t = (3.286763) (2.689852)
2R =0.217699 F =7.2353
(3) t t x e 386178.167683.15+-=
t = (-0.916965) (3.561545)
2R =0.327898 F =12.6846
上述三个回归方程都表明利润函数存在异方差性(只要取显著性水平大于0.012即可)
例4.3.5 下面我们用帕克检验法来检验例4.3.1中模型:t t t u x b b y ++=10是否存异方差。

利用EViews 软件进行Glejser 检验的步骤为
LS y c x
GENR lnE2=log (RESID^2) 生成2ln t e 序列 GENR lnx=log(x) LS lnE2 c lnx
运行结果如下:
表4.3.3 回归结果
回归方程为: t t x e ln 6743.1554862.5ln 2
+-=
t = (-2.148497) (4.758142)
2R =0.46546 F =22.63991
上述回归方程表明利润函数存在异方差性。

以上怀特检验、戈里瑟检验和帕克检验方法统称为残差回归检验法。

4.3.5 ARCH 检验(自回归条件异方差检验)
如果在建模分析中所用样本资料是时间序列数据,当存在异方差性的时候,可考虑用ARCH(autoregressive conditional heteroskedasticity)方法检验,设ARCH 过程为:
t p t p t t t v a a a a +++++=---222221102σσσσ (4.3.7)
并且提出原假设为
:0H 021====p a a a (4.3.8)
其中p 为ARCH 过程的阶数,t v 为随机误差项。

则ARCH 检验的基本步骤如下:
1.运用OLS 方法对模型
t kt k t t t u x b x b x b b y +++++= 22110 (4.3.9)
进行估计。

2.计算残差序列t e ,及2
2
22
12
,,,p t t t t e e e e ---
3.求辅助回归函数:
222221102ˆˆˆˆˆp t p t t t e a e a e a a e
---++++= (4.3.10) 注意样本容量不能少于n-p 个。

4.由辅助回归函数得2R ,计算检验统计量LM =2nR ,在0H 成立的条件下,LM =2
nR
服从自由度为p 的2
χ分布。

比较LM =2
nR 与给定α下的临界值)(2
p αχ,如果LM =2nR >)(2
p α
χ,则拒绝0H ,表明模型中存在异方差性,即存在ARCH 效应。

利用EViews 软件可以进行ARCH 检验。

在方程结果输出窗口选择View \Residual Test \ARCH LM Test ,屏幕提示用户指定2
χ检验的阶数,系统默认为1,点击OK 完成。

4.4 异方差性的解决方法
4.4.1 模型变换法
模型变换法即对存在异方差性的模型进行适当的变量变换,使变换后的模型满足同方差假定。

前提是要合理确定异方差性的具体形式,这可以通过用帕克检验、戈里瑟检验等方法所提供的异方差的具体形式来确定。

设模型为一元线性回归模型:
t t t u x b b y ++=10 (4.4.1)
随机误差项t u 具有异方差性,由Glejser 检验可知,异方差性与t x 变化有关,且
)()var(22t t t x f u σσ== (4.4.2)
式中2
σ为常数,)(t x f 为解释变量t x 的函数,当)(t x f =常数时,t u 为同方差;当)(t x f ≠常数时,t u 具有异方差性。


)(1t x f 去乘式(4.4.1)两端得
=
)
(t t x f y )
(0
t x f b +)
(1
t t x f x b +
)
(t t x f u (4.4.3)
记:
)(*t t
t x f y y =
,)(1
1t t x f x =,)
(2t t
t x f x x =,)
(t t t x f u v =
则有
t
t t t v x b x b y ++=2110*
(4.4.3)
*
此时t v 具有同方差性。

事实上,
=)var(t v ))
(var(
t t x f u =
)
(1
t x f 2)var(σ=t u 此时,原模型变成同方差模型,可以利用OLS 估计模型并得到最佳线性无偏估计量。

函数
)(t x f 可以有不同的形式,Glejser 检验提供了相应的的信息。

一般)(t x f 取如下形式:
t t x x f =)( 2)(t t x x f = 210)()(t t x a a x f +=
4.4.2 加权最小二乘法(WLS)
设一元线性回归模型为t t t u x b b y ++=10,如果2
)var(t t u σ=,则用t σ除以模型得
t
t
t
t
t
t
u x b b y σσσσ+
+=
1
1
(4.4.4)
记:
t
t
t y y σ=
*,t
t x σ1
1=
,t
t
t x x σ=
2,t
t
t u u σ=
*
则:
*2110*t t t t u x b x b y ++= (4.4.5)
此时,1)var(1
)var(
)var(2*
==
=t t
t
t
t u u u σ
σ,原模型变成同方差模型,可以利用最小二乘
法估计模型,并且得到的是最佳线性无偏估计量。

在实际操作过程中,被解释变量和解释变量的每个观测值都以其误差项标准差的倒数1/t σ为权数。

这种加权过程就称为加权最小二乘法(Weighted Least Squares ,简称WLS )。

加权最小二乘估计的EViews 软件实现过程: EViews 软件的具体执行过程为 (1)生成权数变量;
(2)使用加权最小二乘法估计模型;
命令方式: LS(W=权数变量或表达式) y c x
菜单方式: ①在方程窗口中点击Estimate 按钮;②在弹出的方程说明对话框中点击Option 进入参数设置对话框;③在参数设置对话框中选定Weighted LS 方法,并在权数变量栏中输入权数变量,然后点击OK 返回方程说明对话框;④点击OK ,系统将采用WLS 方法估计模型。

(3)对估计后的模型,再使用White 检验判断是否消除了异方差性。

例4.4.1 我国制造工业利润函数中异方差性的调整。

1.先用最小二乘法估计模型,估计结果为:
t t x y
104394.003349.12ˆ+= t = (0.616530) (12.36658)
854694.02=R 849105.02=R S.E =56.90445 F =152.9322
2.生成权数变量: 根据Glejser 检验,得到:
(1)t t x e 015267.023936.12+= (2)26
10
74.205837.27t t x e -⨯+=
(3)t t x e 386178.167683.15+-=
仅以(1)为例,取权数变量为
GENR W1=x /1
3.利用加权最小二乘法估计模型:
依次键入命令:LS (W=W1) y c x 或直接键入命令:LS (W=1/x ) y c x 或在方程窗口中点击Estimate \Options 按钮,并在权数变量栏输入W1,可以得到以下估计结果:
表4.4.1 加权最小二乘法估计结果
)(108605.0988351.5ˆ1w w x y
=+=
t = (0.935141) (13.311659)
96019.003254.022==nr R
为了分析异方差性的校正情况,利用WLS 估计出每个模型之后,还需要利用White 检验再次判断模型是否存在着异方差性,White 检验结果如下:
上述模型中的2
nr (为了区别起见,辅助回归模型的判定系数用2r 表示)和p 值就是White 检验的输出结果。

模型的拟合优度96019.0,03254.02
2
==nr R 99.5)2(2
05.0=〈χ,模型已不存在异方差性。

4.4.3 模型的对数变换
如果在模型t t t u x b b y ++=10中,变量t t x y ,分别用t t x y ln ,ln 取代,则对
t t t u x b b y ++=ln ln 10 (4.4.8)
进行回归,通常可以降低异方差性的影响。

其原因在于:(1)对数变换能使测定变量值的尺度缩小,它可以将两个数值之间原来10倍的差异缩小到只有2倍的差异;(2)经过对数变换后的线性模型,其残差t e 表示为相对误差,而相对误差往往具有较小的差异。

例4.4.2 我国制造工业利润函数中异方差性的调整。

用GENR 生成序列lny 和lnx ,即在光标处键入:
GENR lny=log (y ) GENR lnx=log (x )
然后,用OLS 方法求lny 对lnx 的回归,其结果如下:
表4.4.2 对数变换回归结果
t t x y
ln 938913.0755943.1ˆln +-= t = (-3.755902) (14.7502)
179866.0893329.022==nr R
为了分析异方差性的校正情况,利用WLS 估计出每个模型之后,还需要利用White 检验再次判断模型是否存在异方差性,White 检验结果如下:
上述模型中的2
nr 和p 值就是White 检验的输出结果。

模型的拟合优度
179866.0,
893329.022==nr R 99.5)2(2
05.0=〈χ,模型已不存在异方差性。

从残差图
4.4.1也可以看出不存在异方差性。

-1.0
-0.5
0.0
0.5
1.0
10
20
30
T
R E S I D
图4.4.1 残差图
4.4.4 广义最小二乘法(GLS)
对于多元线性回归模型:
U XB Y += (4.4.9)
其中随机误差项向量U 的数学期望和方差一协方差矩阵分别为E (U )=0
)(U U E '=()
⎥⎥⎥⎥⎦
⎤⎪⎪⎪⎪⎪⎭
⎫ ⎝⎛⎢⎢⎢


⎡n n u u u u u u E 2121=E ⎪⎪
⎪⎪



⎝⎛2
2122
22111
221)n n n n n u u u u u u
u u u u u u u u u
=
= ⎪⎪
⎪⎪⎪



⎛22122
22111221),cov(),cov()
,cov(),cov(),cov()
,cov(n
n n n n u u u u u u u u u u u u σσσ
2
ˆσ=Ω 其中Ω为n 阶实对称矩阵,2
σ为常数。

如果随机误差项的方差相同且等于2
σ,并且非自相关,则I =Ω (I 为单位矩阵)。

古典回归模型中关于同方差和非自相关的假定可以统一表示为
)(U U E '=2σI
如果I ≠Ω,因为Ω为n 阶实对称矩阵,根据线性代数知识,存在n 阶非奇异矩阵P ,使得I P P ='Ω,由此可得:
P P P P P P '=Ω'='=Ω----1111,)()(
用P 左乘式(4.4.9),得:
PU PXB PY +=
令:
PU U PX X PY Y ===***,,
则式(4.4.9)变换成:
***U B X Y += (4.4.10)
随机误差项的方差——协方差矩阵为
I P P P U U PE P U PU E PU PU E U U E 22**)()(])([)(σσ='Ω=''=''='='
这表明变换后的模型满足同方差和非自相关的假定,由于是线性变换,其他假定也显然满足,因此可以应用OLS 法估计模型(4.4.10),参数的OLS 估计量为
)()()]()[(])[()()(ˆ111*1**Y X PX P X PY PX PX PX Y X X X B
----Ω'''=''=''= 即:
)()(ˆ111Y X X X B
---Ω'Ω'= (4.4.11) 称式(4.4.11)为广义最小二乘估计(Generalized Least Square--GLS)。

对(4.4.11)式中的Ω,可以分以下几种情况讨论:
(1)当Ω=I ,即满足基本假定时,Y X X X B
''=-1
)(ˆ,为OLS 估计,可见OLS 估计是
GLS 估计的特例。

(2)当Ω为对角矩阵,即存在异方差性时,
Ω=⎪⎪⎪⎪⎪⎭⎫

⎛22221000000n σσσ ; =Ω-1
⎪⎪⎪
⎪⎪⎭


⎛22
221/10
0/10
00/1n σσσ
广义最小二乘估计就是使
=
∑2
*t
e
='
**
e e )ˆ(**'-B
X Y )ˆ(**B X Y -==-'-)ˆ()ˆ(B PX PY B PX PY )ˆ()ˆ(B X Y P P B
X Y -''- =)ˆ()ˆ(1
B X Y B
X Y -Ω'--=e e 1
-Ω'=221t t
e σ∑=最小
其中,2
/1t t w σ=,即加权最小二乘估计。

所以,在异方差性情况下,GLS 估计即为WLS 估计;或者说,WLS 估计也是GLS 估计的特例。

在实际应用中,由于2
2
t t e ≈σ,因此,权矩阵Ω取为:
Ω=⎪⎪⎪⎪
⎪⎭

⎝⎛22
22
1000000n e e e
4.5 案例分析
我国城镇居民人均可支配收入与人均交通和通讯支出关系分析。

根据表4.5.1分析中国1998年各地区城镇居民平均每人全年家庭可支配收入(x ,单位:元)与交通和通讯支出(y ,单位:元)的关系,以预测随着人们收入的增加,对交通、通讯的需求。

表4.5.1 我国城镇居民平均每人全年家庭可支配收入与交通和通讯支出
由数据可以看出,不同收入家庭的交通、通讯支出表现出很大的差异。

散布图如下:
图4.5.1 散布图
1.用OLS 估计法估计参数
设模型为:t t t u x b b y ++=10 ,运用EViews 软件操作过程如下:
首先建立工作文件,输入样本数据,然后在Quick 菜单中选Estimate Equation 项,在OLS 对话框中键入y c x ,用鼠标点击OK ,即得估计结果(见表4.5.2)。

表4.5.2 回归结果
回归结果如下:
t t x y 058075.091798.56+-=
s = (36.210624) (0.006480) t = (1.572049) (8.962009)
48324.50.741501
.02==E S R
2.异方差检验
(1)图示法——残差的图示检验。

见图4.5.2。

残差图表明存在异方差。

图4.5.2 残差图
在Quick菜单中选Graph项,在图形对话框里键入resid x,可得resid与x的散布图4.5.3,resid与x的散布图表明存在异方差。

图4.5.3 resid与x的散布图
在Quick菜单中选Graph项,在图形对话框里键入2e f y(其中残差平方直接由GENR 命令生成),可得2e与yf的散布图4.5.4,2e与f y的散布图表明存在异方差。

图4.5.4 2
e 与
f y 的散布图
(2)Goldfeld-Quandt 检验
在Procs 菜单里选Sort Series 项,出现排序对话框后,键入x ,点OK 。

或在命令窗口键入命令:
sort x 将样本数据关于x 排序
样本数据个数n=30,C=n/4,从中间去掉8个数据(即取C=8)。

因此,利用Views 进行(C-Q)检验的具体步骤为
SMPL 1 11 确定子样本1
LS y c x 求出RSS 1=5089.783 SMPL 20 30 确定子样本2 LS y c x 求出RSS 2=61122.36 计算出F=61122.36/5089.783=12.0088
取α=0.05时,查F 分布表得18.3)9,9(05.0=F ,而F =12.0088>18.3)9,9(05.0=F ,所以存在(递增的)异方差性。

(3)戈里瑟检验
我们把回归模型中的残差绝对值与x x x /1,,2
作回归模型,结果为
261038.134475.11t t x e -⨯+-=
t = (-1.08849) (4.763249) 2R =0.447606
t t x e 579356.24946.156+-=
t = (-3.569) (4.324) 2R =0.4004
t
t x e 10
.5219817844.133-= t = (4.836) (-3.773) 2R =0.3371
根据048.2)28(025.0=t 可知,上述模型回归系数显著不为0,表示存在异方差。

(4)怀特检验
在方程窗口中依次点击:View \Residual Test \White Heteroskedasticity
其中F 值为辅助回归模型的F 统计量值。

取显著水平
05.0=α,由于
〉=15399.132nR 99.5)2(2
05.0=χ,所以存在异方差性。

实际上,由输出结果的概率值(p
值)可以看出,只要取显著性水平α>O.001392,就可以认为存在异方差。

3.异方差的修正
(1)WLS 估计法。

在OLS 对话框里键入:y c x ,打回车键,记残差序列resid 为e ,然后在方程窗口中点击Estimate \Options 按钮,并在权数对话框里输入权数)(/1e abs ,点击OK (或直接在命令窗口键入命令:LS (W=1/abs(e)) y c x ),输出结果见表4.5.3。

表4.5.3 WLS 估计法回归结果
根据上表得WLS 估计法回归结果:
t t x y
05623.099126.46ˆ+-= t = (-5.086485) (32.74588)
00000.12
=R 10
1067.8⨯=F
为了分析异方差性的校正情况,利用White 检验再次判断模型是否存在着异方差性,在方程窗口中依次点击:View \Residual Test \White Heteroskedasticity ,结果如下:
取显著水平05.0=α,由于〈=924399.02nR 99.5)2(2
05.0=χ,所以不存在异方差性。

(2)用Glejser 检验结果克服异方差。

因为异方差形式是2
61038.134475.11t t x e -⨯+-=,所以克服异方差的方法是用2
t x 分
别除t t t u x b b y ++=10式两侧,得变换变量21/t t t x y y =,21/1t t x x =,t t t t x x x x /1/2
2==用t y 1
对t x 1、t x 2回归,得如下回归结果(表4.5.4)
表4.5.4 用Glejser 检验结果克服异方差的回归结果
根据表4.5.4得回归方程: t t t x x y
211058120.060913.56ˆ+-= t = (-1.611065) (7.734658)
603415.02
=R F =45.12423
用2
t x 乘上式两侧并整理得
t t x y
058120.060913.56ˆ+-= t = (-1.611065) (7.734658)
603415.02
=R F =45.12423
在方程窗口中点击Estimate \Options 按钮,并在权数对话框里输入权数2^/1x ,点击OK ,可得到同样输出结果。

为了分析异方差性的校正情况,可利用White 检验再次判断模型是否存在着异方差性,
在方程窗口中依次点击:View \Residual Test \White Heteroskedasticity ,结果如下:
取显著水平05.0=α,由于〈=719462.22nR 99.5)2(2
05.0=χ,所以不存在异方差性。

从残差图4.5.5也可以看出不存在异方差性。

-0.000004
-0.000002
0.000000
0.000002
0.000004
10
2030
40
T
R E S I D
图4.5.5 残差图
(3)对数变换法。

第二种方法是用GENR 生成序列lny 和lnx ,即在光标处键入
GENR lny=log (y ) GENR lnx=log (x )
然后,用OLS 方法求lny 对lnx 的回归,其结果见表4.5.5。

表4.5.5 lny 对lnx 的回归结果
根据表4.5.5得回归方程:
t t x y
ln 164771.148084.4ˆln +-=
t = (-4.544461) (10.12156)
785352.02=R 148829.0.=E S
利用White 检验再次判断模型是否存在着异方差性,在方程窗口中依次点击:View \Residual Test \White Heteroskedasticity ,结果如下:
由于〈=397937.52nR 99.5)2(2
05.0=χ,所以模型已不存在异方差性。

从lny 与lnx 散布图4.5.6和残差图4.5.7也可以看出不存在异方差性。

4.5
5.05.5
6.06.5
8.2
8.4
8.6
8.8
9.0
9.2
LNX
L N Y
-0.4
-0.2
0.0
0.2
0.4
10
2030
40
T
R E S I D
图4.5.6 lny 与lnx 散布图 图4.5.7 残差图
回归结果表明,在对数模型中,家庭人均交通通讯支出与人均可支配收入显著正相关。

由回归系数可知,人均可支配收入增加1%,家庭人均交通通讯支出会增加1.165%。

思考与练习
1. 什么是异方差性?试举例说明经济现象中的异方差性。

2. 产生异方差性的原因及异方差性对模型的OLS 估计有何影响?
3. 样本分段法检验(即戈德菲尔德——匡特检验)异方差性的基本原理及其适用条件。

4. 戈里瑟检验异方差性的基本原理及优点。

5.检验异方差性的G-Q 检验和White 检验是否相同?试述White 检验、Park 检验和Glejser 检验的异同之处。

6.加权最小二乘法及其基本原理,它与普通最小二乘法有何差异? 7.判断下列说法是否正确,并简要回答为什么:
(1)当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性; (2)当异方差出现时,常用的t 检验和F 检验失效;
(3)在异方差情况下,通常OLS 估计一定高估了估计量的标准差; (4)如果OLS 回归的残差表现出系统性,则说明数据中有异方差性; (5)如果回归模型遗漏一个重要变量,则OLS 残差必定表现出明显的趋势 (6)在异方差情况下,通常预测失效。

8.用横截面资料建立企业利润(π)对企业销售收入(I )的线性回归模型时,可能遇到的主要问题是什么?
9.检验下列模型是否存在异方差性,列出检验步骤,给出结论。

t t t t t t u x b x b x b b y ++++=3322110
样本共40个,本题假设去掉样本点C=12个,假设异方差由1x 引起,数值小的一组残差平方和为RSS1=0.466E-17,1x 数值大的一组残差平方和为RSS2=0.36E-17。

10.建立住房支出模型:t t t u x b b y ++=10,样本数据如表1下(其中:y 是住房支出,
x 是收入,单位:千美元):
表1 住房支出与收入数据
请回答下列问题:
(1)用最小二乘法估计10,b b 的估计值、标准差、拟合优度。

(2)用Goldfeld-Quandt 检验异方差性(假设分组时不去掉任何样本值),取05.0=α。

(3)如果存在异方差性,假设2
2
2
t t x σσ=,用加权最小二乘法重新估计10,b b 的估计值、标准差、拟合优度。

11.试根据表2中消费(y )与收入(x )的数据完成以下问题:
(1)估计回归模型:t t t u x b b y ++=10;(2)检验异方差性(可用怀特检验、戈德菲尔德——匡特检验);(3)选用适当的方法修正异方差性。

表2 消费与收入数据
12.考虑表3中的数据。

(1)估计OLS 回归方程:t t t u x b b y ++=10
表3 样本数据
(2)估计:
t
t
t
t
t
t
t
u x b b y σσσσ+
+=1
1
分析两个回归方程的结果。

你认为哪个回归方程更好?为什么? 13.现有20个家庭的年收入和消费支出资料如表4(单位:千元):
表4 20个家庭年收入和消费支出资料
(1)用普通最小二乘法估计家庭消费函数:t t t u x b b y ++=10; (2)用戈德菲尔特——匡特检验进行异方差性检验; (3)怀特检验、戈里瑟检验和帕克检验进行异方差性检验; (4)用加权最小二乘法估计家庭消费函数。

14.表5列出了1995年北京市规模最大的20家百货零售商店的商品销售收入x和销售利润y的统计资料。

表5 20家百货商店商品销售收入与利润(单位:千万元)
(1)根据y、x的相关图分析异方差性;
(2) 利用White检验、Park检验和Glejser检验进行异方差性检验;
(3)利用WLS方法估计利润函数。

15.表6列出了2000年中国部分省市城镇居民每个家庭平均全年可支配收入x与消费性支出x的统计数据。

(1)OLS法建立人均消费支出与可支配收入的线性模型。

(2)检验模型是否存在异方差。

(3)如果存在异方差,试采用适当的方法加以消除。

表6 2000年中国部分省市城镇居民人均可支配收入与消费性支出(单位:元)。

相关文档
最新文档