第五章 异方差
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
21
obs 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
X 2827.73 3084.17 3462.71 3932.52 5150.79 7153.35 9076.85 10448.21 11575.48 12500.84
Y 1598 2209 2878 3722 5350 8080 11758 15839 18196 20954
24
解析法4:ARCH检验(自回归)
基本思想: 在时间序列数据中认为 存在的异方差为 ARCH (自回归条件异方差 )过程:
t2 0 1 t21 2 t2 2 ... p t2 p vt
因为各个 t2未知,用对原模型 OLS估计的剩余项 ei2 去近似估计。 在此基础上进行假设检 验,判断上述回归是否 成立
40,000,000
30,000,000
E2
20,000,000 10,000,000
0 0 100,000 X 200,000 300,000
15
美国各个行业R&D费用Y与残差平方E2
50,000,000
40,000,000
30,000,000
E2
20,000,000 10,000,000
0 0 4,000 8,000 Y
20
例题4 北京市1978-1998年人均储蓄与人均收 入的数据如下表
obs 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 X 590.2 664.94 809.5 875.54 991.25 1109.95 1357.87 1682.8 1890.58 2098.25 2499.58 Y 107 123 159 189 233 312 401 522 664 871 1033
Yi f ( Xi )
1
f ( Xi )
2
Xi f ( Xi )
ui f ( Xi )
(1)
Yi* 1* 2 X i* vi
u 1 1
i ) Var (ui ) 2 f (Xi ) 2 此时随机误差 Var (vi ) Var ( f ( Xi ) f ( Xi ) f ( Xi ) 项的方差
3
储蓄Y与收入X:异方差的图形表示
概 率 密 度
同 方 差
储 蓄 Y
概 率 密 度
储 蓄 Y
异 方 差
1 2 X i 1 2 X i
(A) 收入X (B) 收入X
4
(A)与(B)的比较:
相同点:收入增加,储蓄平均来说也增加。 不同点: (A)储蓄的方差在所有的收入水平上保持不变。 (B)储蓄的方差随收入的增加而增加。
13
例题3 美国工业行业销售额、研发经费
工业行业
容器和包装
销售量X
6375.3
R&D费用Y
62.5
利润Z
185.1
非银行业金融
服务行业 金属和采矿 住房和建筑
11626.4
14655.1 21869.2 26408.3
92.9
178.3 258.4 494.7
1569.5
276.8 2828.1 225.9
(高低收入组的消费模式,不同国家间、省份间的经济增长)
6
二、异方差性的后果
1、参数估计量非有效 OLS估计量仍然具有无偏性,但不具有有效性 在大样本情况下,尽管参数估计量具有一致性,但仍 然不能保证估计的方差最小,加权OLS估计具有更小 的方差
2 异方差情况下 VAR( 2 ) E ( 2 E 2 ) ^ ^ ^
第五章 异方差
1
本章主要介绍
异方差的含义和产生的背景 异方差性对模型的影响 异方差性的检验 异方差性补救措施
2
5.1
异方差的含义
异方差:i的方差随X i的变化而变化,即 var(i ) i f ( X i )
2 2
例1:储蓄与收入的关系的 模型 Y 1 2 X i ui 其中:Yi是储蓄;X i是收入
解释:随收入增长,人们有更多的备用收入,从 而在支配收入以及储蓄时有更大的选择范围
5
5.2 产生异方差的原因
——例题2 我国北方地区农业总产值
模型中缺少某些解释变量: y=β1+ β2X2i+ β3X3i+ui y=β1+ β2X2i+u* u*= β3X3i+ui 样本数据观测误差;规模报酬递增的特征(K,L) 经济结构发生了变化,但模型参数没作相应调整。 (1994年分税制改革,1978年改革开放) 截面数据较时间序列数据更易产生异方差
新模型的随机误差项为常数 行估计
,可以运用最小二乘法(OLS)进 2
30
假设f(X)=X2
模型变换法的关键是事先对异方差2i = 2 f( xi )的 形式有一个合理的假设 比如 Yi 1 2 X i ui
Var(ui)=σ2f(Xi)= σ2Xi2
模型两边同除以X i,得到
3918.6 1595.3 6107.5
13869.9
4487.8 10278.9 8787.3
化工产品
五金 办公设备与计算机
122315.7
141649.9 175025.8
4454.1
3163.9 13210.7
16438.8
9761.4 19774.5
14
美国各行业销售量X与残差平方E2
50,000,000
由分析表数据得: e 1372.202 (3) 计算统计量值 F e e
2 1j
*
e
2 2j
5811189
2 2j 2 1j
5811189 4234.937 1372.202
若α=0.05,查F分布表, F0.05 (6,6) 4.28
* F 由于 4234.937 F0.05 (6,6) 4.28
ˆ t S ˆ E (Y | X ) Y ˆ t S ˆ Y 0 0 0 Y Y
2 0 2
0
所以,当模型出现异方差性时,参数OLS 估计值的变异程度增大,从而造成对Y的预测 误差变大,降低预测精度,预测功能失效。
9
5.3 异方差的检验
检验异方差性,也就是检验随机误差项的方差与解 释变量观测值之间的相关性及其相关的“形式”
但是 i2一般未知,用模型回归 剩余ei2作为 i2的渐进 估计值,进行以上辅助 回归,判断其变化是否 与解 释变量有关 .
2 3 ...6 0 ,计算nR2, nR2服从χ2( 原假设H0: 2 (k k-1)分布,如果nR2> 0.05 (1) 临界值),则拒绝原假设 ,说明存在异方差
2 其中, (n p)R2服从( p)分布
25
解释:羊群效应
“羊群效应”是指在一个投资群体中,单个投资者总 是根据其他同类投资者的行动而行动,投资者相互模 仿非常普遍,在他人买入时买入,在他人卖出时卖出 班尼杰(Banerjee,1992)指出,羊群效应的存在证 明了在投资者的行为中,个体之间的某种行为存在相 关性,而且这种相关性会作用到整体层面上,形成某 种市场势力
16
12,000
16,000
5.3.2 解析法
Goldfeld-Quant检验 WHITE检验 ARCH检验 Glejser检验
17
1、Goldfeld-Quant检验的思路
先将样本一分而二,对子样1和子样2分别作回归, 然后利用两个子样残差的方差之比构造检验统计量 F进行异方差检验。这个检验统计量服从F分布 递增异方差,方差之比就会大于1;递减异方差, 方差之比小于1;同方差,方差之比趋近于1
所以认为随机误差项显著地存在异方差性。
22
解析法2:White检验(大样本下) ——例题5 我国制造业销售额与销售利润
基本思路: (以二元回归为例: Yt 1 2 X 2t 3 X 3t ut) 如果有异方差,则 i2与解释变量有关系。如 :
i2= 0 1 X 2i 3 X 3i 2 X 22i 4 X 32i 5 X 2i X 3i+vi
一般制造业
休闲娱乐 纸张和林木产品 食品
32405.6
35107.7 40295.4 70761.6
1083
1620.6 421.7 509.2
3751.9
2884.1 4645.7 5036.4
卫生保健
宇航 消费者用品 电器和电子产品
80552.8
95294 101314.3 116141.3
6620.1
例题4 北京市1978-1998年人均储蓄与人均收入
将n对观察值(xi,yi),按解释变量x的大小顺序 排列 将其中间的 c = n / 4=5 个观察值除去,余下前 后两个子样本 每个子样的个数为(n-c)/2=6,各自进行回归, 分别计算残差平方和,自由度=(n-c)/2-k,k是 模型中自变量个数 提出假设:两个子样方差相等 进行F检验,根据结果判断是否有异方差。
Yi u X 1 2 2 i Xi Xi X2 Xi
nc nc F ~ F( k, k) 2 2 2 2 e1i /[(n c) / 2] e1i
2 e 2i /[(n c) / 2] 2 e 2i
18
图示: Goldfeld-Quant检验的思路
e
样本1
样本2
n/4 3n/8
3n/8
x
19
G-Q检验具体做法
11
异方差的检验——图示分析法
e
2 i
. . . . . . . .. Nhomakorabea.
ei2
. . .
.. . . . ..
Xi
Xi
e
2 i
e
Xi
2 i
. . . . . . . . .
. . . . . . .
. . . .
. .
. .
.. . .
Xi
12
怎样通过Eviews作x- e2 散点图
键入 LS y c x 作回归; 键入 GENR E1=resid 调用残差; 键入 GENR E2=E1^2 生成残差平方序列; 键入 SCAT X E2 如果呈现出某种有规律的分布,说明残差中蕴涵 着模型 (1)未提取净的信息 (2)可能存在异方差或自相关
同方差情况下 VAR( ) 2 ols
^
2 x i
2
x X x x
2
2 i
2 i
2 i
2 i
7
2、变量的显著性检验失去意义
变量的显著性检验中,构造了t统计量
t ˆ 1 1 S ˆ
1
其他检验也是如此
8
3、模型的预测失效
一方面,模型的参数估计不具有良好的统计 性质
Var(ui)=2i = 2 f( xi )
检验方法有 (1)图示法( X _ E2); (2)解析法: Goldfeld-Quandt检验 White检验 ARCH检验 Glejser检验
10
5.3.1 图示法
异方差指u的方差随着x的变化而变化。 故可以根据x-e2的散点图,对异方差是否存在及 其类型作出判断。 异方差大致可分为三种: (1)递增异方差 (2)递减异方差 (3)复杂型异方差
23
解析法3 Glejser(戈里森)检验
——例题5 我国制造业销售额与销售利润
Glejser检验的基本思想:用最小二乘法得到的回归
残差ei,以回归残差的绝对值|ei|为被解释变量, 对某个解释变量Xi作辅助回归,根据模型的显著 性和拟合优度来判断是否存在异方差 常用辅助函数:|ei|=β Xi+vi |ei|=β /Xi+vi |ei|=β √Xi+vi
28
5.4 异方差的补救措施
补救异方差的基本思路 变异方差为同方差 加权最小二乘法 对数变换法
29
(1)模型变换法
假设原来的模型是:
Yi 1 2 X i ui
随机误差项的方差是: Var( X i ) i2 2 f ( X i ) 为消除异方差,两边同 除以 f ( X i ) 模型变形为:
26
羊群效应:波动的集聚性
27
4、ARCH检验(股票价格的波动):利用OLS方法,
做回归 i2 C 1.229 i21 1.408 i22 1.018 i23
计算(n - p)R2= (21 – 3) ×0.5659 = 10.1862 查表χ20.05(3)=7.81<10.1862 拒绝H0,表明模型中随机误差项存在异方差。
obs 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
X 2827.73 3084.17 3462.71 3932.52 5150.79 7153.35 9076.85 10448.21 11575.48 12500.84
Y 1598 2209 2878 3722 5350 8080 11758 15839 18196 20954
24
解析法4:ARCH检验(自回归)
基本思想: 在时间序列数据中认为 存在的异方差为 ARCH (自回归条件异方差 )过程:
t2 0 1 t21 2 t2 2 ... p t2 p vt
因为各个 t2未知,用对原模型 OLS估计的剩余项 ei2 去近似估计。 在此基础上进行假设检 验,判断上述回归是否 成立
40,000,000
30,000,000
E2
20,000,000 10,000,000
0 0 100,000 X 200,000 300,000
15
美国各个行业R&D费用Y与残差平方E2
50,000,000
40,000,000
30,000,000
E2
20,000,000 10,000,000
0 0 4,000 8,000 Y
20
例题4 北京市1978-1998年人均储蓄与人均收 入的数据如下表
obs 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 X 590.2 664.94 809.5 875.54 991.25 1109.95 1357.87 1682.8 1890.58 2098.25 2499.58 Y 107 123 159 189 233 312 401 522 664 871 1033
Yi f ( Xi )
1
f ( Xi )
2
Xi f ( Xi )
ui f ( Xi )
(1)
Yi* 1* 2 X i* vi
u 1 1
i ) Var (ui ) 2 f (Xi ) 2 此时随机误差 Var (vi ) Var ( f ( Xi ) f ( Xi ) f ( Xi ) 项的方差
3
储蓄Y与收入X:异方差的图形表示
概 率 密 度
同 方 差
储 蓄 Y
概 率 密 度
储 蓄 Y
异 方 差
1 2 X i 1 2 X i
(A) 收入X (B) 收入X
4
(A)与(B)的比较:
相同点:收入增加,储蓄平均来说也增加。 不同点: (A)储蓄的方差在所有的收入水平上保持不变。 (B)储蓄的方差随收入的增加而增加。
13
例题3 美国工业行业销售额、研发经费
工业行业
容器和包装
销售量X
6375.3
R&D费用Y
62.5
利润Z
185.1
非银行业金融
服务行业 金属和采矿 住房和建筑
11626.4
14655.1 21869.2 26408.3
92.9
178.3 258.4 494.7
1569.5
276.8 2828.1 225.9
(高低收入组的消费模式,不同国家间、省份间的经济增长)
6
二、异方差性的后果
1、参数估计量非有效 OLS估计量仍然具有无偏性,但不具有有效性 在大样本情况下,尽管参数估计量具有一致性,但仍 然不能保证估计的方差最小,加权OLS估计具有更小 的方差
2 异方差情况下 VAR( 2 ) E ( 2 E 2 ) ^ ^ ^
第五章 异方差
1
本章主要介绍
异方差的含义和产生的背景 异方差性对模型的影响 异方差性的检验 异方差性补救措施
2
5.1
异方差的含义
异方差:i的方差随X i的变化而变化,即 var(i ) i f ( X i )
2 2
例1:储蓄与收入的关系的 模型 Y 1 2 X i ui 其中:Yi是储蓄;X i是收入
解释:随收入增长,人们有更多的备用收入,从 而在支配收入以及储蓄时有更大的选择范围
5
5.2 产生异方差的原因
——例题2 我国北方地区农业总产值
模型中缺少某些解释变量: y=β1+ β2X2i+ β3X3i+ui y=β1+ β2X2i+u* u*= β3X3i+ui 样本数据观测误差;规模报酬递增的特征(K,L) 经济结构发生了变化,但模型参数没作相应调整。 (1994年分税制改革,1978年改革开放) 截面数据较时间序列数据更易产生异方差
新模型的随机误差项为常数 行估计
,可以运用最小二乘法(OLS)进 2
30
假设f(X)=X2
模型变换法的关键是事先对异方差2i = 2 f( xi )的 形式有一个合理的假设 比如 Yi 1 2 X i ui
Var(ui)=σ2f(Xi)= σ2Xi2
模型两边同除以X i,得到
3918.6 1595.3 6107.5
13869.9
4487.8 10278.9 8787.3
化工产品
五金 办公设备与计算机
122315.7
141649.9 175025.8
4454.1
3163.9 13210.7
16438.8
9761.4 19774.5
14
美国各行业销售量X与残差平方E2
50,000,000
由分析表数据得: e 1372.202 (3) 计算统计量值 F e e
2 1j
*
e
2 2j
5811189
2 2j 2 1j
5811189 4234.937 1372.202
若α=0.05,查F分布表, F0.05 (6,6) 4.28
* F 由于 4234.937 F0.05 (6,6) 4.28
ˆ t S ˆ E (Y | X ) Y ˆ t S ˆ Y 0 0 0 Y Y
2 0 2
0
所以,当模型出现异方差性时,参数OLS 估计值的变异程度增大,从而造成对Y的预测 误差变大,降低预测精度,预测功能失效。
9
5.3 异方差的检验
检验异方差性,也就是检验随机误差项的方差与解 释变量观测值之间的相关性及其相关的“形式”
但是 i2一般未知,用模型回归 剩余ei2作为 i2的渐进 估计值,进行以上辅助 回归,判断其变化是否 与解 释变量有关 .
2 3 ...6 0 ,计算nR2, nR2服从χ2( 原假设H0: 2 (k k-1)分布,如果nR2> 0.05 (1) 临界值),则拒绝原假设 ,说明存在异方差
2 其中, (n p)R2服从( p)分布
25
解释:羊群效应
“羊群效应”是指在一个投资群体中,单个投资者总 是根据其他同类投资者的行动而行动,投资者相互模 仿非常普遍,在他人买入时买入,在他人卖出时卖出 班尼杰(Banerjee,1992)指出,羊群效应的存在证 明了在投资者的行为中,个体之间的某种行为存在相 关性,而且这种相关性会作用到整体层面上,形成某 种市场势力
16
12,000
16,000
5.3.2 解析法
Goldfeld-Quant检验 WHITE检验 ARCH检验 Glejser检验
17
1、Goldfeld-Quant检验的思路
先将样本一分而二,对子样1和子样2分别作回归, 然后利用两个子样残差的方差之比构造检验统计量 F进行异方差检验。这个检验统计量服从F分布 递增异方差,方差之比就会大于1;递减异方差, 方差之比小于1;同方差,方差之比趋近于1
所以认为随机误差项显著地存在异方差性。
22
解析法2:White检验(大样本下) ——例题5 我国制造业销售额与销售利润
基本思路: (以二元回归为例: Yt 1 2 X 2t 3 X 3t ut) 如果有异方差,则 i2与解释变量有关系。如 :
i2= 0 1 X 2i 3 X 3i 2 X 22i 4 X 32i 5 X 2i X 3i+vi
一般制造业
休闲娱乐 纸张和林木产品 食品
32405.6
35107.7 40295.4 70761.6
1083
1620.6 421.7 509.2
3751.9
2884.1 4645.7 5036.4
卫生保健
宇航 消费者用品 电器和电子产品
80552.8
95294 101314.3 116141.3
6620.1
例题4 北京市1978-1998年人均储蓄与人均收入
将n对观察值(xi,yi),按解释变量x的大小顺序 排列 将其中间的 c = n / 4=5 个观察值除去,余下前 后两个子样本 每个子样的个数为(n-c)/2=6,各自进行回归, 分别计算残差平方和,自由度=(n-c)/2-k,k是 模型中自变量个数 提出假设:两个子样方差相等 进行F检验,根据结果判断是否有异方差。
Yi u X 1 2 2 i Xi Xi X2 Xi
nc nc F ~ F( k, k) 2 2 2 2 e1i /[(n c) / 2] e1i
2 e 2i /[(n c) / 2] 2 e 2i
18
图示: Goldfeld-Quant检验的思路
e
样本1
样本2
n/4 3n/8
3n/8
x
19
G-Q检验具体做法
11
异方差的检验——图示分析法
e
2 i
. . . . . . . .. Nhomakorabea.
ei2
. . .
.. . . . ..
Xi
Xi
e
2 i
e
Xi
2 i
. . . . . . . . .
. . . . . . .
. . . .
. .
. .
.. . .
Xi
12
怎样通过Eviews作x- e2 散点图
键入 LS y c x 作回归; 键入 GENR E1=resid 调用残差; 键入 GENR E2=E1^2 生成残差平方序列; 键入 SCAT X E2 如果呈现出某种有规律的分布,说明残差中蕴涵 着模型 (1)未提取净的信息 (2)可能存在异方差或自相关
同方差情况下 VAR( ) 2 ols
^
2 x i
2
x X x x
2
2 i
2 i
2 i
2 i
7
2、变量的显著性检验失去意义
变量的显著性检验中,构造了t统计量
t ˆ 1 1 S ˆ
1
其他检验也是如此
8
3、模型的预测失效
一方面,模型的参数估计不具有良好的统计 性质
Var(ui)=2i = 2 f( xi )
检验方法有 (1)图示法( X _ E2); (2)解析法: Goldfeld-Quandt检验 White检验 ARCH检验 Glejser检验
10
5.3.1 图示法
异方差指u的方差随着x的变化而变化。 故可以根据x-e2的散点图,对异方差是否存在及 其类型作出判断。 异方差大致可分为三种: (1)递增异方差 (2)递减异方差 (3)复杂型异方差
23
解析法3 Glejser(戈里森)检验
——例题5 我国制造业销售额与销售利润
Glejser检验的基本思想:用最小二乘法得到的回归
残差ei,以回归残差的绝对值|ei|为被解释变量, 对某个解释变量Xi作辅助回归,根据模型的显著 性和拟合优度来判断是否存在异方差 常用辅助函数:|ei|=β Xi+vi |ei|=β /Xi+vi |ei|=β √Xi+vi
28
5.4 异方差的补救措施
补救异方差的基本思路 变异方差为同方差 加权最小二乘法 对数变换法
29
(1)模型变换法
假设原来的模型是:
Yi 1 2 X i ui
随机误差项的方差是: Var( X i ) i2 2 f ( X i ) 为消除异方差,两边同 除以 f ( X i ) 模型变形为:
26
羊群效应:波动的集聚性
27
4、ARCH检验(股票价格的波动):利用OLS方法,
做回归 i2 C 1.229 i21 1.408 i22 1.018 i23
计算(n - p)R2= (21 – 3) ×0.5659 = 10.1862 查表χ20.05(3)=7.81<10.1862 拒绝H0,表明模型中随机误差项存在异方差。