异方差性的概念、类型、后果、检验及其修正方法(含案例)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为
解释变量,建立如下方程:
~ | f ( X ) |e i ji i
i=1,2, „,n i=1,2, „,n
(Gleiser ) (Park)
或
~2 f (X ) e i ji i
Xj 选择关于变量
2 f ( X ) X 的不同的函数形式(如 ji ji 或
vi f ( X ji ) 2 X e ji ) ,对方程进行估计并进行显著性检验;
2 Var(i )
(i=1,2,…,n) (i=1,2,…,n) (i=1,2,…,n)
Var (i ) i2
即对于不同的样本点i ,随机误差项的方差不再是常数,则认 为出现了异方差性。 注意:对于每一个样本点i,随机误差项i都是随机变量,服 从均值为0的正态分布;而方差i2衡量的是随机误差项围绕其 均值0的分散程度。所以,所谓异方差性,是指这些服从正态 分布的随机变量围绕其均值0的分散程度不同。
2 E() I
Var( ) 2 , i 1,2, , n i Cov( , ) 0, i j i j
即同方差和无序列相关条件。
2.变量的显著性检验失去意义
在变量的显著性检验中,t统计量
t ˆ
j j j
ˆ ) Se(
3.实际经济问题中的异方差性
例4.1.1: 在截面资料下研究居民家庭的储蓄行为
Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。 在该模型中, i的同方差假定往往不符合实际情况。对高收 入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律 性(如为某一特定目的而储蓄),差异较小。 因此, i 的方差往往随 Xi的增加而增加,呈单调递增型变化。
Fra Baidu bibliotek引 言
• 在教材P29-32和P64-65,分别对一元和多元线性回归模型
提出了若干基本假设,只有在满足这些基本假设的情况下, 应用普通最小二乘法才能得到无偏的、有效的参数估计量。 • 但是,在实际的计量经济学问题中,完全满足这些基本假 设的情况并不多见。 • 如果违背了某一项基本假设,那么应用普通最小二乘法估 计模型所得参数估计量就可能不具有某些优良特性,这就需 要发展新的方法估计模型。 • 本章正是要讨论违背了某一项基本假设的问题及其估计方 法。
nR2 ~ 2 ( )
显然,辅助回归仍是检验 ei 与解释变量可能的组合的相关性。如果存 在异方差性, 那么 ei 与解释变量的某种组合之间必定存在显著的相关 性,这时往往显示出有较大的可决系数 R 2 ,并且某一参数的 t 检验值 较大。
2 所以,检验准则是:如果 nR2 ≥ ( ) ,则存在异方差;反之,则不存在
~2 来表示随机误差项的方差。 即用e
i
2.图示检验法
(1)用X-Y的散点图进行判断(李子奈P108)
看是否存在明显的散点扩大、缩小或复杂型 趋势(即不在一个固定的带型域中)。
随机误差项的 方差描述的是 取值的离散程 度。而由于被 解释变量Y与随 机误差项有相 同的方差,所 以利用Y与X之 间的相关图形 也可以粗略地 看出的离散程 度与X之间是否 有相关关系。
种组合为解释变量,做如下的辅助回归:
2 2 2 ~ ei 0 1 X1i 2 X 2i 3 X1i 4 X 2i 5 X1i X 2i i
则在同方差性假设下【也即H0:1=…= 5=0 】,该辅助回归 方程的可决系数R2与样本容量n的乘积渐近地服从自由度=辅 助回归方程中解释变量个数【该例= 5】的2分布:
例4.1.2:以绝对收入假设为理论假设、以分组数据 (将居民按照收入等距离分成n组,取组平均数为样 本观测值)作样本建立居民消费函数:
Ci= 0+1Yi+i 一般情况下:居民收入服从正态分布,处于中等收入组中 的人数最多,处于两端收入组中的人数最少。而人数多的组 平均数的误差小,人数少的组平均数的误差大。所以样本观 测值的观测误差随着解释变量观测值的增大而先减后增。 如果样本观测值的观测误差构成随机误差项的主要部分,那 么对于不同的样本点,随机误差项的方差随着解释变量观测值
• 软件输出结果:最上方显示两个检验统计量:F统计 量和White统计量nR2;下方则显示以OLS的残差平 方为被解释变量的辅助回归方程的回归结果。
– 以教材P118的例子为例,包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”的输出结果为 :
分别为两个子样对应的随机项方差。
H0成立,意味着同方差; H1成立,意味着异方差。
⑤构造统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) nc 2 2 2 ~ e ( k 1 ) 1i 2
⑥检验。给定显著性水平,确定F分布表中相应的临界值
本排序,再将排序后的样本一分为二,对子样本①和 子样本②分别进行OLS回归,然后利用两个子样本的 残差平方和之比构造F统计量进行异方差检验。
G-Q检验的步骤:
①将n对样本观察值(Xi1, Xi2, …,Xik,Yi)按某一被认为有 可能引起异方差的解释变量观察值Xij的大小排队。 ②将序列中间的c=n/4个观察值除去,并将剩下的观 察值划分为较小与较大的容量相同的两个子样本, 每个子样本的样本容量均为(n-c)/2 。
• 下面,以二元回归为例,说明怀特检验的基本思想与步骤: 设回归模型为:
Yi 0 1 X1i 2 X 2i i
首先,对该模型做普通最小二乘回归,记残差为:
~ Y (Y ˆ) e
i i
i 0ls
然后,以上述残差的平方为被解释变量,以原模型中各解释 变量的水平项、平方项(还可以有更高次项)、交叉项等各
③对每个子样本分别求回归方程,并计算各自的残差平方
e 2 ,较大的一 和。将两个残差平方和中较小的一个规定为 ~ 1i
nc 2 ~ k 1。 个规定为 e2i 。二者的自由度均为 2
2 2 H0 : 12 2 12 2 ④提出假设: ,H 1 : 2 12 与 2
的增大而先减后增(U形),出现了异方差性。
例4.1.3:以某一行业的企业为样本建立企业生产函数模型
Yi=Ai1 Ki2 Li3ei
产出量为被解释变量,选择资本、劳动、技术等投入要素
为解释变量,那么每个企业所处的外部环境对产出量的影 响被包含在随机误差项中。 由于每个企业所处的外部环境对产出量的影响程度不同, 造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量观测值 的变化而呈规律性变化,为复杂型的一种。
可能无法通过显著性检验,或者使某些原本不显著的解释变量 可能通过显著性检验】。
3.模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
另一方面, 在预测值的置信区间中也包含有随机误差项共
2 同的方差 。 【书上这句话有点问题】
ˆ t SE ˆ ˆ t SE ˆ ) 1 P(Y Y Y 0 0 0 Y Y Y Y
ˆ
j
j
c
jj
2
ˆ
j 2
j
( X X ) 1 jj
(j=0,1,2,…,k)
2 。 包含有随机误差项共同的方差
如果出现了异方差性,而仍按同方差时的公式计算t 统计量,将使t统计量失真【偏大或偏小,见第三版P110补 充说明】,从而使t检验失效【使某些原本显著的解释变量
2 ~ (2)用 X—e 的散点图进行判断
i 看是否形成一条斜率为零的直线。
~2 e i
(教材P111)
~2 e i
X 同方差 递增异方差
X
~2 e i
~2 e i
X 递减异方差 复杂型异方差
X
3.戈里瑟(Gleiser)检验与帕克(Park)检验 • 戈里瑟检验与帕克检验的思想:
~ |或 e ~ 2 为被解释变量,以原模型的某一解释变量 Xj 以 |e i
2 0 0 2 0 0
其中
2 SEYˆ Y 1 X0 (XX) 1 X 0
0 0
所以,当模型出现异方差性时,Y预测区间的建立将发生困 难,它的预测功能失效。
三、异方差性的检验(教材P111)
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值,
随机误差项具有不同的方差,那么: 检验异方差性,也就是检验随机误差项的方差与解 释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
并不随解释变量 Xi的变化而变化,不论解释变量 的观测值是大还是小,每个i的方差保持相同, 即 i2 =常数 (i=1,2,…,n)
• 在异方差的情况下,i2已不是常数,它随Xi的
变化而变化,即
i2 =f(Xi) (i=1,2,…,n)
• 异方差一般可以归结为三种类型:
(1)单调递增型: i2=f(Xi)随Xi的增大而增大; (2)单调递减型: i2=f(Xi )随Xi的增大而减小; (3)复杂型: i2=f(Xi )随Xi的变化呈复杂形式。
异方差性 Heteroscedasticity
一、异方差性的概念及类型 二、异方差性的后果 三、异方差性的检验 四、异方差的修正 五、案例
一、异方差性的概念及类型
1.什么是异方差?
对于模型
Yi 0 1 X i1 2 X i 2 k X ik i
同方差性假设为 如果出现
或者,也可以说,对于每一个样本点i,随机误差项的方差i2衡
量的是被解释变量的观测值Yi围绕回归线E(Yi)=0+1Xi1+…+kXik
的分散程度。而所谓异方差性,是指被解释变量观测值的分散 程度随样本点的不同而不同。 【庞皓P130】
概 率 密 度
异方差性示意图
Y
X
2.异方差的类型 • 同方差性假定是指,每个i围绕其0均值的方差
问题在于:用什么来表示随机误差项的方差?
一般的处理方法:
首先采用 OLS 法估计模型,以求得随机误差项的 估计量 (注意, 该估计量是不严格的) , 我们称之为 “近
~ e 似估计量” ,用 i
i
表示。于是有
i i 0ls
~ Y (Y ˆ) e
~2 Var ( i ) E ( i2 ) e i
~2
~2
异方差。
怀特(White)检验的EViews软件操作要点
• 在OLS的方程对象Equation中,选择View/Residual tests/White Heteroskedasticity。
– 在选项中,EViews提供了包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”和没有交叉项的怀特 检验“White Heteroskedasticity(no cross terms)” 这样 两个选择。
如果存在某一种函数形式,使得方程显著成立,则说明原 模型存在异方差性。 由于f(Xj)的具体形式未知,因此需要选择各种形式进行试验。
4.戈德菲尔德-匡特(Goldfeld-Quandt)检验
G-Q检验以F检验为基础,仅适用于样本容量较大、 异方差为单调递增或单调递减的情况。 G-Q检验的思想:
先按某一被认为有可能引起异方差的解释变量对样
规
律
• 一般经验告诉人们:对于采用截面数据作样本
的计量经济学问题,由于在不同样本点(即不
同空间)上解释变量以外的其他因素的差异较
大,所以往往存在异方差性。
二、异方差性的后果
1.参数估计量非有效
• 当计量经济学模型出现异方差性时,其普通最小二乘法参 数估计量仍然具有无偏性,但不具有有效性。而且,在大样 本情况下,参数估计量仍然不具有渐近有效性。 因为在有效性证明(见教材P70-71)中利用了
F(1,2)。
若F≥F(1,2),则拒绝H0,认为存在异方差; 反之,则不存在异方差。
5.怀特(White)检验
• G-Q检验需按某一被认为有可能引起异方差的解释 变量对样本排序,而且只能检验单调递增或单调递
减型异方差;怀特(White)检验则不需要排序,且对
任何形式的异方差都适用。
怀特(White)检验的基本思想与步骤