第5章 异方差性

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5、计算统计量:
RSS2
F
nc ( k 1) nc nc 2 ~ F( k 1, k 1) RSS1 2 2 nc ( k 1) 2
6、在给定的显著性水平下比较判断。
注意: (1) 当模型含有多个解释变量时,应以每一个解释变 量为基准检验异方差。 (2)对于截面样本,计算F统计量之前,必须先把数据 按解释变量的值从小到大排序。 (3)G—Q检验仅适用于检验递增或递减型异方差。 (4)检验结果与数据剔除个数c的选取有关。 (5) G—Q检验无法判定异方差的具体形式。
以两个变量为例,同方差假定如图 5.1 和 5.2 所示。对于每一个 xt 值,相应 ut 的分布方差都是相同的。
6 Y
4
2
0 0 10 20
X 30
图 5.1
同方差情形
图 5.2
同方差情形
异方差通常有三种表现形式: (1)递增型 (2)递减型 (3)复杂型
递增型
300 Y
200
递增型
100
0 0 5000 10000 15000
5.1异方差性的含义及产生原因
5.1.1异方差性的定义
对于不同的样本点,随机误差项的方差不 再是常数,而互不相同,则认为出现了异方差 性(Heteroskedasticity)。
var(ut ) t2 常数(t 1, 2,, n) 11 0 .. 0 2 I. Var(U) = 2 = 2 0 ... 0 22 . . ... . 0 0 ... nn
c= n/ 4
n2 = (n-c) / 2
G—Q检验步骤:
1、把样本按解释变量X t 观测值大小顺序排列。
2、略去居中的c个样本,把样本分为两头的两个子样本。 3、提出检验假设。H 0:u t为同方差; H1:u t为异方差 4、分别对两个子样本进行OLS回归,并分别计算出RSS:
2 2 RSS1 u1t , RSS1 u2t
注意: (1)时间序列数据和截面数据中都有可能存在异方差,其 中截面样本中更为常见。 (2) 经济时间序列中的异方差常为递增型异方差。金融时 间序列中的异方差常表现为自回归条件异方差。
考虑一下下述回归模型中随机误差项的方差可能为 那种类型:
1、我国各省份的教育支出与GDP之间关系的回归模型。
2、打字出错个数与打字练习时间关系的回归模型。 3、我校工商管理专业77名本科毕业生毕业后的年薪和年 限关系的回归模型。
* 模型可变为: Yt* b0 X 0t b1 X t* ut*,此时
t
b0
b1
Xt

ut
,
Var(u ) E[(
* t
t
ut
) ]
2
1
t
t2 1 2
新模型满足CLRM的同方差性假定。
新模型的估计步骤为:
要使新模型的残差平方和最小,即:
min (et* ) 2 min ˆ * ˆ * (Yt * b0 X 0t b1 X 1t ) 2
5.2.3对模型参数估计值显著性检验的影响
ee ˆ 并非随机误差项 在异方差情况下, n k 1 方差的无偏估计量。
2
ˆ 导致在此基础上估计的 s ( b j ) 也出现偏误。
ˆ bj 而变量的显著性检验中,构造了t统计量 t ˆ s(b j )
变量的显著性检验失去意义。
Байду номын сангаас
5.3异方差性的检验
2、以残差平方作为因变量,以原方程中所有解释变 量以及解释变量的平方项和交叉积项做辅助回归:
2 et2 a0 a1 x1t a2 x2t a3 x1t x2t a4 x12t a5 x2t vt
(*)
3、用卡方检验来检验该方程的总体显著性。
可以证明,在同方差假设下LM 统计量 R2为(*)的可决系数,h为(*)式解释变量的个数,本例为5 表示渐近服从某分布。
5.3.4怀特( H.White test)检验法
怀特检验的前提条件:适用于大样本。
怀特检验的思想:通过建立辅助回归模型的方式来 判断异方差。 即检验残差平方与解释变量可能的组合的显著性。 怀特检验步骤(以二元线性回归模型为例):
yt b0 b1 x1t b2 x2t ut
1、用普通最小二乘法估计模型,求出残差平方序 2 列:et
X 20000
250 Y 200
150
递减型
100
50 X 0 10 20 30
0
6 4 2 0 -2 -4 -6 -8 200 400 600 800 1000 1200 1400 DJPY
复杂型
5.1.2产生异方差的原因
1、解释变量的遗漏。 2、来自不同抽样单元的因变量观察值的差异。 3、异常观测值的出现。 4、时间序列数据中,观测技术的改进引起的观测值的变化。
ARCH检验的步骤: (1)运用OLS对模型进行估计。
(2)计算残差序列e t , 得到e 2 , e21 , , e2 。 t t t-p
2 以e 2 , e 21 , , e 2 作为 t2 , t21 , , t-p的近似估计。 t t t-p
此时,e 2 的样本观测值个数为(n p)个。 t-p
X
(2)用X-Y的散点图进行判断 看是否存在明显的散点扩大、缩小或复杂型趋势 (即不在一个固定的带型域中)
300 Y
200
100
0 0 5000 10000 15000
X 20000
(3)用残差图进行初步判断
80 60 40 20 0 -20 -40 RES -60 2 4 6 8 10 12 14 16 18 20 22 24 26 28
假定相异的方差已知,以一元线性回归模型为例,对于
Yt b0 b1 X t ut , E (u t2 ) t 可以进行变量代换,构造满足CLRM假定的回归方程。
2

Yt b0 b1 X t ut
t
Yt
两边同除以 t :
t t Yt Xt ut 1 * * * * 令Yt ,X 0t ,X t ,ut t t t t
经典线性回归模型的基本假定 ut为正态分布
违背
不服从正态分布
零均值假定
同方差假定 无自相关假定 解释变量是确定性变量,或 者xt是随机的,但与ut不相关。 解释变量间无多重共线性
均值不为零
异方差性 序列相关性
第五章 第六章
随机解释变量
多重共线性
第八章
第七章
第5章 异方差性
本章教学要求: (1)掌握异方差的含义及产生原因。 (2)理解异方差性存在的后果。 (3)掌握检验异方差的方法。 (4)掌握处理和消除异方差的方法。
4、比较判断
怀特检验的判别规则: 若样本计算的nR2值大于给定显著性水平下的临界值 (p值较小),则拒绝同方差假设; 若样本计算的nR2小于等于给定显著性水平下的临界值 ( p值较大),则接受同方差假设。 注意: (1)White检验不需要对观测值排序。 (2) White检验不需要假定异方差的具体形式。 (3)在多元回归中,由于辅助回归方程中可能有太多 解释变量,从而使自由度减少,有时可去掉交叉项。
5.4异方差性的解决办法
5.4.1 存在异方差性的OLS估计 ——广义最小二乘法(GLS) 估计
GLS是对满足普通最小二乘假定的转换变量的OLS, 即先将原始变量转换成满足经典模型假定的转换变量, 然后对其使用OLS程序的估计方法。相应估计量称为 GLS估计量,这些估计量是BLUE。 在异方差条件下,GLS实际上是一种加权最小二乘法: 加权最小二乘法(Weighted Least Squares, WLS)是 对原模型加权,使之变成一个新的不存在异方差性的模型, 然后采用OLS估计其参数。
5.3.3戈里瑟(Glejser)检验 和帕克(Park)检验
基本思想:假设方差与解释变量之间存在着某种幂关 系。由普通最小二乘法得到残差后,取其绝对值或平 方项与某个解释变量回归,根据回归模型的显著性和 拟合优度判断是否存在异方差。
戈里瑟检验步骤:
假定 t2与某一解释变量X tk 有关。可以对以下函数形势作回归: : | et | a0 a1 X tk vt
2 | et | a0 a1 X tk vt
| et | a0 a1 X tk vt | et | a0 a1 | et | a0 a1 进行回归,对a和回归方程作显著性检验。若显著,则存在异方差。 1 vt X tk 1 vt X tk
如果回归结果表明异方差与多个变量有关,可以引入多个变量 进行回归,并进行检验。
划分方法是: 把成对(组)的观测值按解释变量的大小顺序排列, 略去c个处于中心位置的观测值 (通常n 30时,取c n/ 4), 余下的n- c个观测值自然分成容量相等,(n- c) / 2的两 个子样本。
{x1, x2, …, xt-1, xt, xt+1, …, x n-1, xn}
n1 = (n-c) / 2
5.3.5 自回归条件异方差(ARCH)检验
ARCH检验的思想:
ARCH 检验不是把原回归模型的随机误差项t 2 看作是xt 的函 数,而是把t 2 看作误差滞后项ut-12 , u t -22 , … 的函数。将同方差的 原假设转化为假设该自回归过程的总体显著性为零。在此基础上构 造辅助回归式,并进行相应的检验。
5.3.2戈德菲尔德——匡特检验法
G-Q检验的前提条件: G-Q检验适用于大样本。要求观测值的数目至少 是参数的两倍;随机项没有自相关且服从正态分布。 G-Q检验的思想: 先将样本一分为二,对子样①和子样②分别作回归, 然后利用两个子样的残差平方和之比构造统计量进行异 方差检验。 由于该统计量服从F分布,因此假如存在递增的异方 差,则F远大于1;反之就会等于1(同方差)、或小于1 (递减方差)。
可见OLS估计量仍具无偏性。
5.2.2对模型参数估计值最佳性的影响
ˆ 仍以 b1
为例,
kt2 var( yt ) kt2 var(ut ) kt2 t2 2 kt2
ˆ var(b1 ) var( kt yt ) var(kt yt )
但OLS估计量不具有最佳性。
ˆ et yt yt var(ut ) E (ut ) et
2 2 2
即可以用et 来近似代表随机误差项 的方差。
5.3.1图示检验法
(1)用X(或Y的估计值)与残差平方的散点图进 行初步判断
~ ei 2 ~ ei 2
X 同方差 递增异方差
X
~ ei 2
~ ei 2
X 递减异方差 复杂型异方差
检验思路:
由于异方差性就是相对于不同的解释变量观测值, 随机误差项具有不同的方差。那么:
检验异方差性,也就是检验随机误差项的方差与 解释变量观测值之间的相关性及其相关的“形式”。
问题在于用什么来表示随机误差项的方差? 一般的处理方法:
首先用普通最小二乘法估计模型,用残差项作为 随机误差项的近似估计量。于是:
5.2异方差性的后果
5.2.1对模型参数估计值无偏性的影响
以简单线性回归模型为例,对模型 yt = b0 + b1 xt + ut ˆ 当Var(ut) = t 2,为异方差时,以 b1 为例:
ˆ b1
k
t
yt b1 kt ut
ˆ E (b1 ) E (b1 kt ut ) b1
ˆt ˆ ˆ t ˆ t (3)对e 2 a 0 a1e 21 a p e 2 p作辅助回归。
(4)由辅助回归函数的R 2,计算(n p)R 2。 在H 0成立的条件下, p)R ~ (p)。 (n
2 2 2 (5)比较(n p)R 2与给定 下的临界值 (p), 2 若(n p)R 2 (p),则拒绝H 0。
帕克检验形式:
帕克提出的假定函数形式为: e 2 a 0 x a1 e v t t t

ln e2 ln a 0 a1 ln x t v t t
Glejser和park检验的特点是: ① 既可检验递增型异方差,也可检验递减型异方差。 ② 一旦发现异方差,同时也就发现了异方差的具体表现 形式。 ③ 需检验多种回归方程形式,计算量相对较大。 ④ 当原模型含有多个解释变量值时,可以拟合成多变量 回归形式。
相关文档
最新文档