第五章 异方差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Yi f ( Xi )
1
f ( Xi )
2
Xi f ( Xi )
ui f ( Xi )
(1)
Yi* 1* 2 X i* vi
u 1 1
i ) Var (ui ) 2 f (Xi ) 2 此时随机误差 Var (vi ) Var ( f ( Xi ) f ( Xi ) f ( Xi ) 项的方差
21
obs 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
X 2827.73 3084.17 3462.71 3932.52 5150.79 7153.35 9076.85 10448.21 11575.48 12500.84
Y 1598 2209 2878 3722 5350 8080 11758 15839 18196 20954
例题4 北京市1978-1998年人均储蓄与人均收入
将n对观察值(xi,yi),按解释变量x的大小顺序 排列 将其中间的 c = n / 4=5 个观察值除去,余下前 后两个子样本 每个子样的个数为(n-c)/2=6,各自进行回归, 分别计算残差平方和,自由度=(n-c)/2-k,k是 模型中自变量个数 提出假设:两个子样方差相等 进行F检验,根据结果判断是否有异方差。
3918.6 1595.3 6107.5
13869.9
4487.8 10278.9 8787.3
化工产品
五金 办公设备与计算机
122315.7
141649.9 175025.8
4454.1
3163.9 13210.7
16438.8
9761.4 19774.5
14
美国各行业销售量X与残差平方E2
50,000,000
13
例题3 美国工业行业销售额、研发经费
工业行业
容器和包装
销售量X
6375.3
R&D费用Y
62.5
利润Z
185.1
非银行业金融
服务行业 金属和采矿 住房和建筑
11626.4
14655.1 21869.2 26408.3
92.9
178.3 258.4 494.7
1569.5
276.8 2828.1 225.9
一般制造业
休闲娱乐 纸张和林木产品 食品
32405.6
35107.7 40295.4 70761.6
1083
1620.6 421.7 509.2
3751.9
2884.1 4645.7 5036.4
卫生保健
宇航 消费者用品 电器和电子产品
80552.8
95294 101314.3 116141.3
6620.1
3
储蓄Y与收入X:异方差的图形表示
概 率 密 度
同 方 差
储 蓄 Y
概 率 密 度
储 蓄 Y
异 方 差
1 2 X i 1 2 X i
(A) 收入X (B) 收入X
4
(A)与(B)的比较:
相同点:收入增加,储蓄平均来说也增加。 不同点: (A)储蓄的方差在所有的收入水平上保持不变。 (B)储蓄的方差随收入的增加而增加。
2 其中, (n p)R2服从( p)分布
25
解释:羊群效应
“羊群效应”是指在一个投资群体中,单个投资者总 是根据其他同类投资者的行动而行动,投资者相互模 仿非常普遍,在他人买入时买入,在他人卖出时卖出 班尼杰(Banerjee,1992)指出,羊群效应的存在证 明了在投资者的行为中,个体之间的某种行为存在相 关性,而且这种相关性会作用到整体层面上,形成某 种市场势力
Yi u X 1 2 2 i Xi Xi X2 Xi
新模型的随机误差项为常数 行估计
,可以运用最小二乘法(OLS)进 2
30
假设f(X)=X2
模型变换法的关键是事先对异方差2i = 2 f( xi )的 形式有一个合理的假设 比如 Yi 1 2 X i ui
Var(ui)=σ2f(Xi)= σ2Xi2
模型两边同除以X i,得到
第五章 异方差
1
本章主要介绍
异方差的含义和产生的背景 异方差性对模型的影响 异方差性的检验 异方差性补救措施
2
5.1
异方差的含义
异方差:i的方差随X i的变化而变化,即 var(i ) i f ( X i )
2 2
例1:储蓄与收入的关系的 模型 Y 1 2 X i ui 其中:Yi是储蓄;X i是收入
(高低收入组的消费模式,不同国家间、省份间的经济增长)
6
二、异方差性的后果
1、参数估计量非有效 OLS估计量仍然具有无偏性,但不具有有效性 在大样本情况下,尽管参数估计量具有一致性,但仍 然不能保证估计的方差最小,加权OLS估计具有更小 的方差
2 异方差情况下 VAR( 2 ) E ( 2 E 2 ) ^ ^ ^
24
解析法4:ARCH检验(自回归)
基本思想: 在时间序列数据中认为 存在的异方差为 ARCH (自回归条件异方差 )过程:
t2 0 1 t21 2 t2 2 ... p t2 p vt
因为各个 t2未知,用对原模型 OLS估计的剩余项 ei2 去近似估计。 在此基础上进行假设检 验,判断上述回归是否 成立
由分析表数据得: e 1372.202 (3) 计算统计量值 F e e
2 1j
*
e
2 2j
5811189
2 2j 2 1j
5811189 4234.937 1372.202
若α=0.05,查F分布表, F0.05 (6,6) 4.28
* F 由于 4234.937 F0.05 (6,6) 4.28
20
例题4 北京市1978-1998年人均储蓄与人均收 入的数据如下表
obs 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 X 590.2 664.94 809.5 875.54 991.25 1109.95 1357.87 1682.8 1890.58 2098.25 2499.58 Y 107 123 159 189 233 312 401 522 664 871 1033
11
异方差的检验——图示分析法
e
2 i
. . . . . . . .
.
.
ei2
. . .
.. . . . ..
Xi
Xi
e
2 i
e
Xi
2 i
. . . . . . . . .
. . . . . . .
. . . .
. .
. .
.. . .
Xi
12
怎样通过Eviews作x- e2 散点图
键入 LS y c x 作回归; 键入 GENR E1=resid 调用残差; 键入 GENR E2=E1^2 生成残差平方序列; 键入 SCAT X E2 如果呈现出某种有规律的分布,说明残差中蕴涵 着模型 (1)未提取净的信息 (2)可能存在异方差或自相关
nc nc F ~ F( k, k) 2 2 2 2 e1i /[(n c) / 2] e1i
2 e 2i /[(n c) / 2] 2 e 2i
18
图示: Goldfeld-Quant检验的思路
e
样本1
样本2
n/4 3n/8
3n/8
x
19
G-Q检验具体做法
解释:随收入增长,人们有更多的备用收入,从 而在支配收入以及储蓄时有更大的选择范围
5
5.2 产生异方差的原因
——例题2 我国北方地区农业总产值
模型中缺少某些解释变量: y=β1+ β2X2i+ β3X3i+ui y=β1+ β2X2i+u* u*= β3X3i+ui 样本数据观测误差;规模报酬递增的特征(K,L) 经济结构发生了变化,但模型参数没作相应调整。 (1994年分税制改革,1978年改革开放) 截面数据较时间序列数据更易产生异方差
16
12,000
16,000
5.3.2 解析法
Goldfeld-Quant检验 WHITE检验 ARCH检验 Glejser检验
17
1、Goldfeld-Quant检验的思路
先将样本一分而二,对子样1和子样2分别作回归, 然后利用两个子样残差的方差之比构造检验统计量 F进行异方差检验。这个检验统计量服从F分布 递增异方差,方差之比就会大于1;递减异方差, 方差之比小于1;同方差,方差之比趋近于1
所以认为随机误差项显著地存在异方差性。
22
解析法2:White检验(大样本下) ——例题5 我国制造业销售额与销售利润
基本思路: (以二元回归为例: Yt 1 2 X 2t 3 X 3t ut) 如果有异方差,则 i2与解释变量有关系。如 :
i2= 0 1 X 2i 3 X 3i 2 X 22i 4 X 32i 5 X 2i X 3i+vi
23
解析法3 Glejser(戈里森)检验
——例题5 我国制造业销售额与销售利润
Glejser检验的基本思想:用最小二乘法得到的回归
残差ei,以回归残差的绝对值|ei|为被解释变量, 对某个解释变量Xi作辅助回归,根据模型的显著 性和拟合优度来判断是否存在异方差 常用辅助函数:|ei|=β Xi+vi |ei|=β /Xi+vi |ei|=β √Xi+vi
同方差情况下 VAR( ) 2 ols
^
2 x i
2
x X x x
2
2 i
2 i
2 i
2 i
7
2、变量的显著性检验失去意义
变量的显著性检验中,构造了t统计量
t ˆ 1 1 S ˆ
1
其他检验也是如此
8
3、模型的预测失效
一方面,模型的参数估计不具有良好的统计 性质
但是 i2一般未知,用模型回归 剩余ei2作为 i2的渐进 估计值,进行以上辅助 回归,判断其变化是否 与解 释变量有关 .
2 3 ...6 0 ,计算nR2, nR2服从χ2( 原假设H0: 2 (k k-1)分布,如果nR2> 0.05 (1) 临界值),则拒绝原假设 ,说明存在异方差
28
5.4Βιβλιοθήκη Baidu异方差的补救措施
补救异方差的基本思路 变异方差为同方差 加权最小二乘法 对数变换法
29
(1)模型变换法
假设原来的模型是:
Yi 1 2 X i ui
随机误差项的方差是: Var( X i ) i2 2 f ( X i ) 为消除异方差,两边同 除以 f ( X i ) 模型变形为:
ˆ t S ˆ E (Y | X ) Y ˆ t S ˆ Y 0 0 0 Y Y
2 0 2
0
所以,当模型出现异方差性时,参数OLS 估计值的变异程度增大,从而造成对Y的预测 误差变大,降低预测精度,预测功能失效。
9
5.3 异方差的检验
检验异方差性,也就是检验随机误差项的方差与解 释变量观测值之间的相关性及其相关的“形式”
26
羊群效应:波动的集聚性
27
4、ARCH检验(股票价格的波动):利用OLS方法,
做回归 i2 C 1.229 i21 1.408 i22 1.018 i23
计算(n - p)R2= (21 – 3) ×0.5659 = 10.1862 查表χ20.05(3)=7.81<10.1862 拒绝H0,表明模型中随机误差项存在异方差。
40,000,000
30,000,000
E2
20,000,000 10,000,000
0 0 100,000 X 200,000 300,000
15
美国各个行业R&D费用Y与残差平方E2
50,000,000
40,000,000
30,000,000
E2
20,000,000 10,000,000
0 0 4,000 8,000 Y
Var(ui)=2i = 2 f( xi )
检验方法有 (1)图示法( X _ E2); (2)解析法: Goldfeld-Quandt检验 White检验 ARCH检验 Glejser检验
10
5.3.1 图示法
异方差指u的方差随着x的变化而变化。 故可以根据x-e2的散点图,对异方差是否存在及 其类型作出判断。 异方差大致可分为三种: (1)递增异方差 (2)递减异方差 (3)复杂型异方差
1
f ( Xi )
2
Xi f ( Xi )
ui f ( Xi )
(1)
Yi* 1* 2 X i* vi
u 1 1
i ) Var (ui ) 2 f (Xi ) 2 此时随机误差 Var (vi ) Var ( f ( Xi ) f ( Xi ) f ( Xi ) 项的方差
21
obs 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
X 2827.73 3084.17 3462.71 3932.52 5150.79 7153.35 9076.85 10448.21 11575.48 12500.84
Y 1598 2209 2878 3722 5350 8080 11758 15839 18196 20954
例题4 北京市1978-1998年人均储蓄与人均收入
将n对观察值(xi,yi),按解释变量x的大小顺序 排列 将其中间的 c = n / 4=5 个观察值除去,余下前 后两个子样本 每个子样的个数为(n-c)/2=6,各自进行回归, 分别计算残差平方和,自由度=(n-c)/2-k,k是 模型中自变量个数 提出假设:两个子样方差相等 进行F检验,根据结果判断是否有异方差。
3918.6 1595.3 6107.5
13869.9
4487.8 10278.9 8787.3
化工产品
五金 办公设备与计算机
122315.7
141649.9 175025.8
4454.1
3163.9 13210.7
16438.8
9761.4 19774.5
14
美国各行业销售量X与残差平方E2
50,000,000
13
例题3 美国工业行业销售额、研发经费
工业行业
容器和包装
销售量X
6375.3
R&D费用Y
62.5
利润Z
185.1
非银行业金融
服务行业 金属和采矿 住房和建筑
11626.4
14655.1 21869.2 26408.3
92.9
178.3 258.4 494.7
1569.5
276.8 2828.1 225.9
一般制造业
休闲娱乐 纸张和林木产品 食品
32405.6
35107.7 40295.4 70761.6
1083
1620.6 421.7 509.2
3751.9
2884.1 4645.7 5036.4
卫生保健
宇航 消费者用品 电器和电子产品
80552.8
95294 101314.3 116141.3
6620.1
3
储蓄Y与收入X:异方差的图形表示
概 率 密 度
同 方 差
储 蓄 Y
概 率 密 度
储 蓄 Y
异 方 差
1 2 X i 1 2 X i
(A) 收入X (B) 收入X
4
(A)与(B)的比较:
相同点:收入增加,储蓄平均来说也增加。 不同点: (A)储蓄的方差在所有的收入水平上保持不变。 (B)储蓄的方差随收入的增加而增加。
2 其中, (n p)R2服从( p)分布
25
解释:羊群效应
“羊群效应”是指在一个投资群体中,单个投资者总 是根据其他同类投资者的行动而行动,投资者相互模 仿非常普遍,在他人买入时买入,在他人卖出时卖出 班尼杰(Banerjee,1992)指出,羊群效应的存在证 明了在投资者的行为中,个体之间的某种行为存在相 关性,而且这种相关性会作用到整体层面上,形成某 种市场势力
Yi u X 1 2 2 i Xi Xi X2 Xi
新模型的随机误差项为常数 行估计
,可以运用最小二乘法(OLS)进 2
30
假设f(X)=X2
模型变换法的关键是事先对异方差2i = 2 f( xi )的 形式有一个合理的假设 比如 Yi 1 2 X i ui
Var(ui)=σ2f(Xi)= σ2Xi2
模型两边同除以X i,得到
第五章 异方差
1
本章主要介绍
异方差的含义和产生的背景 异方差性对模型的影响 异方差性的检验 异方差性补救措施
2
5.1
异方差的含义
异方差:i的方差随X i的变化而变化,即 var(i ) i f ( X i )
2 2
例1:储蓄与收入的关系的 模型 Y 1 2 X i ui 其中:Yi是储蓄;X i是收入
(高低收入组的消费模式,不同国家间、省份间的经济增长)
6
二、异方差性的后果
1、参数估计量非有效 OLS估计量仍然具有无偏性,但不具有有效性 在大样本情况下,尽管参数估计量具有一致性,但仍 然不能保证估计的方差最小,加权OLS估计具有更小 的方差
2 异方差情况下 VAR( 2 ) E ( 2 E 2 ) ^ ^ ^
24
解析法4:ARCH检验(自回归)
基本思想: 在时间序列数据中认为 存在的异方差为 ARCH (自回归条件异方差 )过程:
t2 0 1 t21 2 t2 2 ... p t2 p vt
因为各个 t2未知,用对原模型 OLS估计的剩余项 ei2 去近似估计。 在此基础上进行假设检 验,判断上述回归是否 成立
由分析表数据得: e 1372.202 (3) 计算统计量值 F e e
2 1j
*
e
2 2j
5811189
2 2j 2 1j
5811189 4234.937 1372.202
若α=0.05,查F分布表, F0.05 (6,6) 4.28
* F 由于 4234.937 F0.05 (6,6) 4.28
20
例题4 北京市1978-1998年人均储蓄与人均收 入的数据如下表
obs 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 X 590.2 664.94 809.5 875.54 991.25 1109.95 1357.87 1682.8 1890.58 2098.25 2499.58 Y 107 123 159 189 233 312 401 522 664 871 1033
11
异方差的检验——图示分析法
e
2 i
. . . . . . . .
.
.
ei2
. . .
.. . . . ..
Xi
Xi
e
2 i
e
Xi
2 i
. . . . . . . . .
. . . . . . .
. . . .
. .
. .
.. . .
Xi
12
怎样通过Eviews作x- e2 散点图
键入 LS y c x 作回归; 键入 GENR E1=resid 调用残差; 键入 GENR E2=E1^2 生成残差平方序列; 键入 SCAT X E2 如果呈现出某种有规律的分布,说明残差中蕴涵 着模型 (1)未提取净的信息 (2)可能存在异方差或自相关
nc nc F ~ F( k, k) 2 2 2 2 e1i /[(n c) / 2] e1i
2 e 2i /[(n c) / 2] 2 e 2i
18
图示: Goldfeld-Quant检验的思路
e
样本1
样本2
n/4 3n/8
3n/8
x
19
G-Q检验具体做法
解释:随收入增长,人们有更多的备用收入,从 而在支配收入以及储蓄时有更大的选择范围
5
5.2 产生异方差的原因
——例题2 我国北方地区农业总产值
模型中缺少某些解释变量: y=β1+ β2X2i+ β3X3i+ui y=β1+ β2X2i+u* u*= β3X3i+ui 样本数据观测误差;规模报酬递增的特征(K,L) 经济结构发生了变化,但模型参数没作相应调整。 (1994年分税制改革,1978年改革开放) 截面数据较时间序列数据更易产生异方差
16
12,000
16,000
5.3.2 解析法
Goldfeld-Quant检验 WHITE检验 ARCH检验 Glejser检验
17
1、Goldfeld-Quant检验的思路
先将样本一分而二,对子样1和子样2分别作回归, 然后利用两个子样残差的方差之比构造检验统计量 F进行异方差检验。这个检验统计量服从F分布 递增异方差,方差之比就会大于1;递减异方差, 方差之比小于1;同方差,方差之比趋近于1
所以认为随机误差项显著地存在异方差性。
22
解析法2:White检验(大样本下) ——例题5 我国制造业销售额与销售利润
基本思路: (以二元回归为例: Yt 1 2 X 2t 3 X 3t ut) 如果有异方差,则 i2与解释变量有关系。如 :
i2= 0 1 X 2i 3 X 3i 2 X 22i 4 X 32i 5 X 2i X 3i+vi
23
解析法3 Glejser(戈里森)检验
——例题5 我国制造业销售额与销售利润
Glejser检验的基本思想:用最小二乘法得到的回归
残差ei,以回归残差的绝对值|ei|为被解释变量, 对某个解释变量Xi作辅助回归,根据模型的显著 性和拟合优度来判断是否存在异方差 常用辅助函数:|ei|=β Xi+vi |ei|=β /Xi+vi |ei|=β √Xi+vi
同方差情况下 VAR( ) 2 ols
^
2 x i
2
x X x x
2
2 i
2 i
2 i
2 i
7
2、变量的显著性检验失去意义
变量的显著性检验中,构造了t统计量
t ˆ 1 1 S ˆ
1
其他检验也是如此
8
3、模型的预测失效
一方面,模型的参数估计不具有良好的统计 性质
但是 i2一般未知,用模型回归 剩余ei2作为 i2的渐进 估计值,进行以上辅助 回归,判断其变化是否 与解 释变量有关 .
2 3 ...6 0 ,计算nR2, nR2服从χ2( 原假设H0: 2 (k k-1)分布,如果nR2> 0.05 (1) 临界值),则拒绝原假设 ,说明存在异方差
28
5.4Βιβλιοθήκη Baidu异方差的补救措施
补救异方差的基本思路 变异方差为同方差 加权最小二乘法 对数变换法
29
(1)模型变换法
假设原来的模型是:
Yi 1 2 X i ui
随机误差项的方差是: Var( X i ) i2 2 f ( X i ) 为消除异方差,两边同 除以 f ( X i ) 模型变形为:
ˆ t S ˆ E (Y | X ) Y ˆ t S ˆ Y 0 0 0 Y Y
2 0 2
0
所以,当模型出现异方差性时,参数OLS 估计值的变异程度增大,从而造成对Y的预测 误差变大,降低预测精度,预测功能失效。
9
5.3 异方差的检验
检验异方差性,也就是检验随机误差项的方差与解 释变量观测值之间的相关性及其相关的“形式”
26
羊群效应:波动的集聚性
27
4、ARCH检验(股票价格的波动):利用OLS方法,
做回归 i2 C 1.229 i21 1.408 i22 1.018 i23
计算(n - p)R2= (21 – 3) ×0.5659 = 10.1862 查表χ20.05(3)=7.81<10.1862 拒绝H0,表明模型中随机误差项存在异方差。
40,000,000
30,000,000
E2
20,000,000 10,000,000
0 0 100,000 X 200,000 300,000
15
美国各个行业R&D费用Y与残差平方E2
50,000,000
40,000,000
30,000,000
E2
20,000,000 10,000,000
0 0 4,000 8,000 Y
Var(ui)=2i = 2 f( xi )
检验方法有 (1)图示法( X _ E2); (2)解析法: Goldfeld-Quandt检验 White检验 ARCH检验 Glejser检验
10
5.3.1 图示法
异方差指u的方差随着x的变化而变化。 故可以根据x-e2的散点图,对异方差是否存在及 其类型作出判断。 异方差大致可分为三种: (1)递增异方差 (2)递减异方差 (3)复杂型异方差