第五章_异方差性及检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四节
异方差性的补救措施
主要方法:
● 模型变换法 ● 加权最小二乘法 ● 模型的对数变换
26
一、对模型进行变换
以一元线性回归模型为例 Yi 1 2 X i ui 假定经检验,存在异方差,并且已知
Var(ui ) i2 2 f ( Xi )
其中 2为常数,f(Xi)是Xi的已知函数。 将模型作适当变换,用
那么,
ˆ ) ˆ ( SE 2
*
x i2 X i2 2 x i x i2
11
ˆ2
ˆ 2 t 作为统计量的值,则可能由 若仍用 ˆ ˆ SE ( 2 )
于低估或高估了真实方差,导致夸大 或减小t 统计量 的值,本应接受的原假设可能被错误地拒绝,本应拒
绝的原假设也可能被错误地接受,从而改变了所估计
这样估计的参数称为加权最小二乘估计。
注意:方法前提是方差i2 的函数形式是已知的
30
三、模型的对数变换
当i2 未知时,可采用对数变换,变量Yi和Xi 分别用lnYi和lnXi代替,即
lnYi 1 2 ln X i ui
对数变换后的模型通常可以降低异方差性的影响: ◆运用对数变换能使测定变量值的尺度缩小。 ◆经过对数变换后的线性模型,其残差表示相对误 差,往往比绝对误差有较小的差异。 注意:1、取对数后变量的经济意义。 2、解释变量之间是否呈对数线性关系。
减小。如储蓄函数,假如用的是1980年至2010年的数据,前
些年工资较透明,现在灰色收入较多,测量误差有变化。
7
(四)截面数据中总体各单位的差异
例如利用截面数据研究消费与收入的关系时,不同
地区收入有差距,低收入地区家庭用于生活必需品的比 例较大,消费的分散程度不大,而高收入地区家庭有更 多自由支配的收入,家庭消费有更广泛的选择范围,消 费的分散程度较大,而出现异方差性。 通常认为,截面数据较时间序列数据更容易产生异 方差。这是因为同一时点不同对象的差异,一般说来会 大于同一对象不同时间的差异。不过,在时间序列数据
发生较大变化的情况下,也可能出现比截面数据更严重
的异方差。
8
第二节
异方差性的后果
一、对参数估计统计特性的影响
如果随机误差项具有异方差性,当我们仍用
OLS进行参数估计时,估计式仍具有线性性和无
偏性,但已不再具有最小方差性。 设回归模型为
Yi 1 2 X i ui
9
因为用OLS估计
xi yi xi ˆ 2 kiYi 2 2 xi xi
2i i
ui . f ( Xi )
Y 1 X 2 X u
i
ui 1 Var( u ) Var( ) Var( ui ) 2 . f (Xi ) f (Xi )
可见,随机扰动项已没有异方差了。f(Xi)可以有 不同的形式,Glejser检验提供了相应的信息。
Yi 1 f ( Xi ) 1 2 f ( Xi )
f ( X i ) 去除模型两边,得
Xi f ( Xi )
ui f ( Xi )
27
记 则有 此时
Yi
Yi , X 1i f ( Xi )
i
1 , X2 i f ( Xi )
1i
Xi , ui f ( Xi )
15
图形举例
用1998年四川省各地市州农村居民家庭消费支出与家庭纯
收入的数据,绘制出消费支出对纯收入的散点图,其中用 Y1表示农村家庭消费支出,X1表示家庭纯收入。
16
(二)残差图形分析
虽然随机误差项无法观测,但样本回归的残差一
定程度反映了随机误差的某些分布特征,可通过残差
的图形对异方差进行观察。 对于一元回归模型,绘制出ei2 对Xi的散点图,对 于多元回归模型,绘制出ei2 对Yi的散点图或ei2 与认
31
第五节
案例分析
32
【例1】表1列出了1998年我国主要制造工业销售收入与销售利 润的统计资料,请利用数据资料,检验异方差性。
表1 我国制造工业1998年销售利润与销售收入情况
行业名称 食品加工业 食品制造业 饮料制造业 烟草加工业 纺织业 服装制品业 皮革羽绒制品 木材加工业 家具制造业 销售利润 187.25 111.42 205.42 183.87 316.79 157.7 81.7 35.67 31.06 销售收入 3180.44 1119.88 1489.89 1328.59 3862.9 1779.1 1081.77 443.74 226.78 行业名称 医药制造业 化学纤维制品 橡胶制品业 塑料制品业 非金属矿制品 黑色金属冶炼 有色金属冶炼 金属制品业 普通机械制造 销售利润 238.71 81.57 77.84 144.34 339.26 367.47 144.29 201.42 354.69 销售收入 1264.1 779.46 692.08 1345 2866.14 3868.28 1535.16 1948.12 2351.68
18
(二)检验步骤: 以一个二元线性回归模型为例,设模型为:
Yi 1 2 X 2i 3 X 3i ui
1.用OLS估计上式,计算残差ei; 2.用ei2作为异方差i2的估计,作辅助回归:
2 2 ˆi2 ˆ1 ˆ 2 X 2i ˆ 3 X 3i ˆ4 X2 ˆ ˆ e X i 5 3 i 6 X 2 i X 3 i
这时会导致X3 对Y的影响反映在vi中,而这些影响 具有差异性,从而产生异方差性。 所以在用剔除变量法消除共线性时,又有可能 引起异方差性,应注意。
6
(二)模型的设定误差
模型的设定主要包括变量的选择和模型形式的确定。模 型中略去了重要解释变量常常导致异方差,实际就是模型设 定问题。除此而外,模型的函数形式不正确,如把变量间本 来为非线性的关系设定为线性,也可能导致异方差。 (三)数据的测量误差 样本数据的观测误差有可能随研究范围的扩大而增加,或 随时间的推移逐步积累,也可能随着观测技术的提高而逐步
29
1 通常取权数 wi , 得加权的残差平方和: f ( Xi )
2 ˆ ˆ w e wi (Yi 1 2 X i ) 2 i i
根据最小二乘原理,使得加权的残差平方和最小。
ˆ Y ˆX 1 w 2 w
wi ( X i X w )(Yi Yw ) ˆ 2 2 wi ( X i X w )
3
方差度量的是被解释变量观测值围绕回归 线的分散程度,所以异方差性就是指被解 释变量观测值的分散程度随解释变量的变 化而变化。
在复杂的实际经济现象中异方差性是大量存在的。 例如储蓄函数
Yi 1 2 X i ui
这里Yi表示第i个家庭的储蓄额,Xi为收入。
再如服装需求函数
Qi 1 2Yi 3 Pi 4 P1i ui
多,容易消耗自由度,有时可把交叉项去掉。
21
三、Glejser检验(格莱泽,戈里瑟)
(一)基本思想
寻找残差与某个解释变量之间的显著成立的
关系,将残差的绝对值同时去拟合解释变量的若干
种函数,若其中有显著成立的关系,则认为存在异
方差性。于1969年提出。
22
(二)检验步骤: 1.根据样本数据建立估计模型,计算残差ei;
其中 e ˆ i2 是 e i2 的估计值;
19
3.计算辅助回归函数的可决系数R2;
4.提出假设
H0: 2= 3= 4= 5= 6= 0
H0: 2, 3, 4, 5, 6 不全为 0,
在无异方差的假设下,nR2近似服从自由度等
于辅助回归中回归元个数的2分布,即
nR (m)
2.分别建立残差绝对值对每个解释变量的一系列函
数形式,进行回归,如:
ei X ji vi ei X 2 ji vi
ei X ji v i
1 ei vi X ji
ei
1 vi X ji
23
3.用t检验,若参数,显著地不为零,则认为存在
异方差。
(二)检验的特点 不仅能对异方差的存在作出判断,而且还能得
到异方差的随某个解释变量变化的形式。要求大样
本。缺点是函数形式不易确定,检验量太大。
24
四 帕克检验
运用回归方程: ln e2i B1 B2 ln xi vi
步骤: 1、作普通最小二乘回归,不考虑异方差问题。 2、从原始回归方程中得残差ei,并求其平方,再取对数 形式。 3、利用原始模型中的一个解释变量作形如上式的回归, 如果有多个解释变量,则对每个解释变量都作形如上式的 回归,或者作ei平方对y的估计值的回归。 4、检验零假设B2=0,也即不存在异方差。如果接受零假 设,则回归方程中的B2可以解释为同方差。
2 e i ˆ2 在同方差假定下,作t检验,用无偏估计 n2 ˆ 2 代替 2, t t ( n 2), 这里标准差估计值为 ˆ ) ˆ ( SE 2 2 ˆ ˆ ) ˆ ( SE 2 2 ;在异方差情况下,不妨设: x i
Var( ui ) i2 2 X i2
这里Q为服装的需求量,Y为消费者的收入、 P为服装价格、 P1为其它商品的价格。
5
二、产生异方差的原因
(一)模型中省略了某些重要的解释变量 假设正确的模型是: Yi 1 2 X 2i 3 X 3i ui 假如略去了重要的解释变量X3 ,而采用
Yi 1 2 X 2i vi
第五章 异方差性
1
本章讨论四个问题: ●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
2
第一节
异方差性的概念
一、什么是异方差性
在简单线性回归模型和多元线性回归模型的基 本假定中,有同方差假定:
Var(ui ) , i 1,2,, n
2
如果Var( ui )对不同的解释变量的观测值彼此不 同,则称随机误差项具有异方差性。
2 2
这里m=5,n为样本容量。
20
5.检验 给定显著性水平,查2分布表的临界值2(5),
若nR2> 2(5),则拒绝零假设,接受备择假设,表
明存在异方差;反之,则不存在异方差。 (二)检验的特点 要求变量的取值为大样本;不仅能够检验异方 差的存在性,同时在多变量的情况下,还能判断出 是哪一个变量引起的异方差。缺点是引进回归元太
● park test
14
一、图示检验法
(一)相关图形分析
方差描述的是随机变量取值的(与其均值的)
离散程度。因为被解释变量Y与随机误差项u有相同
的方差,所以分析Y与X的相关图,可以初略地看 到Y的离散程度与X之间是否有相关关系。 如果随着X的增加,Y的离散程度为逐渐增大 (或减小)的变化趋势,则认为存在递增型(或递 减型)的异方差。
参数的显著性wk.baidu.com导致检验失效。
12
三、对预测的影响
当 u 存在异方差时,表明方差与解释变量的
变化有关,虽然参数的估计量仍然无偏,并且基
于此的预测也是无偏的,但是方差会增大,参数
估计量不是有效的,从而对Y的预测也将不是有效
的,Y的预测值的精度会下降。
13
第三节
异方差性的检验
常用检验方法:
●图示检验法 ● White检验 ● Glejser检验
1 ˆ 1 ( Xki )Yi n
k E(u ) 0
i i
线性性及无偏性的推导证明与同方差假定无关, 所以存在异方差时仍能保持线性性及 无偏性,但 异方差的存在会导致OLS的回归基本原则——方 差最小准则的失效,因此回归不再是有效的。
10
二、对参数显著性检验的影响
仍以模型为例 Yi 1 2 X i ui
28
二、加权最小二乘法
仍以一元线性回归模型为例 Yi 1 2 X i ui . 普通最小二乘法的目标,是使残差平方和最小,在 同方差假定下,普通最小二乘法是把每个残差的平 方都同等对待,赋予相同的权数 1。但存在异方差
时,方差越小,其样本值偏离均值程度越小,其观
测值越应受到重视,其作用越大。所以对较小的 ei 给予较大的权数,对较大的 ei 给予较小的权数,从 而使残差平方和更好地反映i2对它的影响。
为和异方差有关的X的散点图。
◆如果ei2不随Xi或Yi而变化,则表明不存在异方差;
◆如果ei2随Xi或Yi而变化,则表明存在异方差。
17
二、White检验
(一)基本思想:
不需要关于异方差的任何先验信息,只需要 在大样本的情况下,将OLS估计后的残差平方对 常数、解释变量、解释变量的平方及其交叉乘积 等构成一个辅助回归,利用辅助回归建立相应的 检验统计量来判断异方差性。