计量经济学 第五章 异方差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ei X i vi (h 1,2,1 2,)
h
24
如果经过检验,模型的斜率参数通过显著性检验,则表
明随机误差项的方差(用残差平方和或残差绝对值来近似估 计)随着自变量的取值不同而发生变化,模型中存在着异方 差。
★特点:这两种方法不仅能检验出异方差,而且可以探测 异方差的具体形式,有助于进一步研究如何消除异方差
对 X i 作回归
ˆ ˆ ˆ h 1 时,i e 2
ˆ ˆ h 1 时,i e ˆ Xi
h
Xi
Xi
3)如果斜率参数通过显著性检验,同样也表明随机误差 项的方差和自变量之间也存在函数关系,原模型中存
在异方差;反之原模型中不存在异方差问题
27
3.怀特(White)检验
13
2.普通最小二乘估计量不再是有效的
前面推导斜率参数的方差时,我们得到下面的公式 当模型满足同方差假定时
ˆ var( b1 )
2
2 2 ˆ var( b1 ) ki
var( i ) 常数
2
k
2 i
2 2
x
(最小方差)
2
i
但当模型中出现异方差时
2 2
var( i ) i 常数, (i 1,2,n )
GLS法 加权最小二乘法 普通最小二乘法 广义最小二乘法 (WLS法) WLS法 (OLS法) (GLS法)
OLS法
18
5.3 异方差的检验
1.图示法 (1)绘制Y-X散点图 由于因变量和随机误差项的方差相同,因此通过观察 因变量和自变量的散点图,可以分析因变量的分散程度 与自变量之间是否存在关系,如果因变量的分散程度随 着自变量的增加呈现增大(减小)的趋势,那么就说明模 型中出现了递增(递减)型的异方差现象。 (2)绘制残差分布图e-x 建立线性回归模型后,以残差平方作为纵坐标,自变量 X作为横坐标,绘制残差分布图,如果残差平方随着自变 量的变化而出现系统变化趋势,也可以判断模型中存在 异方差问题。
6
研究居民家庭储蓄行为
如政策的变动,自然灾害的发生、 金融危机的爆发等。 这些偶然因素本身均会造成随机误 差项的异方差性。
7
研究居民家庭储蓄行为
Y i : 第i个家庭的储蓄额 Xi:
第i个家庭的可支配收入
Y i b 0 b1 X i i
×
ln( Y i ) b 0 b1 ln( X i ) i
2
ei 2
2
对应自变量较大值的Leabharlann Baidu样本的残差平方和
22
(4)提出假设
H 0 : 1 2 , H1 : 1 2
2 2 2
2
(5)构造统计量
F
ei 2
2
( (
nc 2 nc 2
k 1) k 1)
ei 2
2
e
2
i1
e
2
~ F(
nc 2
k 1,
进一步表明残差与自变量之间存在某种函数关系,原模 型中存在异方差;反之,原模型中不存在异方差
26
• (2)格里奇检验的具体步骤
ˆ 1)对原模型作最小二乘估计,得残差 ei Yi Yi
2)用残差绝对值 ei 如 ˆ ˆ ˆ h 1 时,i X i e
ˆ ˆ h 1 时,i e 2 ˆ
23
3.帕克(Park)检验和格里奇(Gleiser) 检验
基本原理:这两种检验方法的都是通过建立残差对自变量的回 归模型,判断随机误差项的方差和自变量之间是否存在着较 强的相关关系。 帕克检验的模型形式为: 常用的是其对数形式 格里奇检验的模型形式为:
ei X i e
2
2
vi
ln ei ln ln X i vi
我们假设对于不同的样本点,随机误差项的分散程度是相同 的;但是如果随机误差项随着自变量的变化而变化,分散程 度不同时,我们说模型中出现了异方差问题。
var( i ) i 常数, (i 1,2,n )
2
Var (Yi ) Var ( i )
4
异方差产生的主要原因
•模型函数形式存在设定误差 •模型中遗漏了一些重要的解释变量 •随机因素本身的影响
满足同方差假定
线性性 无偏性 最具有效性
存在异方差
线性性 无偏性
OLS 估计量
最具有效性
12
1.最小二乘估计量仍旧是线性无偏的
因为此时随机误差项仍旧满足零均值假定 可以证明线性: 无偏性
ˆ b1 b1 ki i
E ( i ) 0
ˆ E (b1 ) E (b1 ki i ) E (b1 ) E ( ki i ) b1
2
二元回归方程Yi b0 b1 X 1i b2 X 2i i 对应的辅助回归方程: ˆ ˆ ˆ ˆ ˆ ˆ ˆ ei 0 1 X 1i 2 X 2i 3 X 1i 4 X 2i 5 X 1i X 2i
2 2 2
28
• 辅助回归方程就是将残差平方和对所有自变量的一次项、 二次项和交叉乘积项进行回归;当然一元线性回归模型 对应的辅助回归方程没有交叉乘积项,多元回归模型的 辅助回归方程可以选择是否包含交叉乘积项。
nc 2
k 1)
i1
(6)给定显著性水平α,查F分布表,得临界值
F (
若F F ( nc 2
nc 2
nc 2
2
k 1,
nc 2
k 1)
k 1,
nc
k 1),接受原假设,模型中不存在异方差
若F F (
k 1,
nc 2
k 1),拒绝原假设,模型中存在异方差
14
由此可见模型中出现异方差时,斜率系数方差公式中多出 了一个因子
x2 i x 2 f ( X i ) i
ˆ 此时如果仍采用 var( b ) x 计算斜率参数的方差,将 会产生估计偏误,偏误的大小取决与因子值的大小。
1 2 i
2
2 x2 i 当 f ( X i ) 1时, b1 ) var( ˆ , 过低估计参数的方差 2 2 xi xi
5.1 异方差问题及其产生原因
对于前面研究的一般线性回归模型
Yi b0 b1 X i b2 X 2 bk X k i
var( i ) i 常数, (i 1,2,n )
2
3
5.1 异方差问题及其产生原因
对于我们所研究的一般线性回归模型:
Yi b0 b1 X 1i b2 X 2i bk X ki i
4.模型的预测误差增大
模型的预测区间和随机误差项的方差有着紧密联系, 随着随机误差项方差的增大,模型的预测区间也随之增 大,模型的预测误差也会相应增加。
16
简而言之:
此时采用普通最小二乘法
估计模型所得到的结果,
其准确性难以保证!!
17
估计模型的数学方法
估计模型的数学方法 估计模型的数学方法 …… 估计模型的数学方法
2 ˆ Yi 15.7647 0.0859 X i , ei1 2579.59
对第二个子样本(19~28)作回归,有下面结果:
2 ˆ Yi 21.4843 0.0094 X i , ei 2 63769.67
基本原理:利用残差平方和,建立残差平方和与自变量的辅
助方程来判断模型中是否存在异方差
具体步骤:
(1)对原模型作最小二乘估计,得残差平方 ei ; (2)估计辅助回归方程
一元回归方程Yi b0 b1 X i i 对应的辅助回归方程:
2 2 ˆ ˆ ˆ ˆ ei 0 1 X 1i 2 X i
设 i f ( X i )
2 2 x2 xi 2 2 2 2 2 2 2 i ˆ) var( b1 k i i k i f ( X i ) ki f ( X i ) ( x 2 ) 2 f ( X i ) x 2 x 2 f ( X i ) i i i
• 2.戈德菲尔德-匡特检验法
基本原理:这种方法又称G-Q检验法,它首先将样本按照 升序排列,然后将样本分成两个部分,再对这两个子样本 分别建立回归模型,并求出各自的残差平方和RSS1和 RSS2。如果这两个部分随机误差项的分散程度相同,那 么RSS1和RSS2应该相差不大;如果RSS1和RSS2相差 较大,在表明两个部分随机误差项的分散程度存在较大差 异,模型中存在异方差。
提出假设:
H 0: 1= 2= = q= 0
H 1 : i 不全为 0 ( i 0 ,1, , q )
29
3)计算辅助回归方程的拟合系数 R 2,可以证明,在同方 差假定下,渐近地有 nR ~ ( q),其中,自由度q为辅助 回归模型中的自变量个数
2 2
4)在给定的显著性水平下,查开方分布表,得临界值
异方差 Y 同方差 Y
样本1
C个 数据
样本2 样本1 C个 数据
样本2
X X
21
具体步骤:
(1)将n对样本观测值按照自变量 (2)将序列中间 容量为 n c
2
Xi
的大小进行升序排列;
c
1 4
n 观测值剔除,剩下的两个子样本
(3)对这两个子样本分别作回归,并求出各自的残差平 方和 设: ei1 对应自变量较小值的子样本的残差平方和
2 x2 i 当 f ( X i ) 1时, b1 ) var( ˆ , 过高估计参数的方差 2 2 xi xi
15
3.t检验的可靠性降低
由于异方差的存在,无法正确估计参数的方差和标志 误差,因此也影响到t检验的效果
ˆ t (bi ) ˆ bi ˆ se(bi )
8
9
年收益额 同年人均可支配收入
时间 年利率 每万元年收益 比重
储蓄热情极高
1993.7 10.98%
1098元
42.6%
2002.2
1.98%
198元
414元 225元
2.57%
3.00% 1.43%
储蓄热情极低
寻求其他投资
2007.12 4.14% 2008.12 2.25%
10
11
5.2异方差对OLS估计量的主要影响
异方差较之 同方差更为 常见
5
横截面数据:对一个或多个变量在同一时点上收集 的数据.
比如我们在研究居民储蓄问题时:
对于低收入家庭,他们满足基本消费以后,所剩无几, 因此各个家庭之间的储蓄不会有很大差异;
而对于高收入家庭,他们满足基本消费后,收入剩余较多, 由于各个家庭在消费习惯、消费心理、家庭成员构成不同, 有的家庭可能储蓄较多,有的家庭可能储蓄少,各个家庭之 间的储蓄就会出现较大差异。此时用线性模型来居民储蓄问 题时就有可能会出现异方差问题
25
(1)帕克检验的具体步骤
ˆ 1)首先对原模型作最小二乘估计,得残差 ei Yi Yi ;
2 ˆ ˆ ˆ 2) 得到残差,作形如 ln ei ln X i 的回归,检 ˆ 验 是否通过显著性检验,
ˆ 如果 通过显著性检验,则表明 ln ei2 与 ln X i ˆ 之间是统计显著的,
nR (q), 拒绝同方差假定,模型中存在异方差;
2 2
nR (q), 接受同方差假定。
2 2
30
例5.1 异方差的检验
1.用戈德菲尔德-匡特检验异方差 (1)先计算出c=n/4=28/4=7个数据,但为了保证剩下两个子 样本容量相同,从原模型中间去除8个样本数据, (2)对第一个子样本(1~10)作线性回归,有下面结果:
19
从Y-X散点图可以看出,随着自变量的增加,因变量 随着增加,但是其分散程度也逐渐增大;同样,从残差 分布图中也可以发现残差的分散程度也随着自变量的增 加而加大。 ★需要指出的是,图示检验法是判断异方差是否存 在比较粗略的一种方法,要精确地检验模型中是否存 在异方差,还要采用其他一些方法。★
20
第五章 异方差
1
图1:我国税收和GDP(p24页)
图2:1998年我国制造工业和利润(p71页)
X-GDP Y-税收
X-销售收入 Y-销售利润
两个散点图有共同的特征,随着自变量增加,因变量 也增加,但是图2中,当X比较小时,数据点相对集中, 随着X增大,数据点变得相对分散。而图1中数据分布 却没有出现这一特征。 2