第四章4.2异方差
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
步骤: (1)首先用OLS估计经济计量模型的回归系数,求出随机误差项ut的估计值et。 (2)用|ei|与解释变量Xi的不同幂次进行回归。 常用形式有: ei = a0 + a1 Xi ei = a0 + a1Xi2
自回归条件异方差(ARCH)—时间序列的异方差
.04 .03 .02 .01 .00 -.01 -.02 -.03 -.04 -.05 2004 2005 2006 2007 SER01
异方差的来源与后果
异方差的来源
一、模型中省略了某些重要的解释变量 假设正确的计量模型是:
Yi 1 2 X 2i 3 X 3i ui
E[( X ' X )1 X '( X U ) ][( X ' X )1 X '( X U ) ]'
E[( X ' X )1 X 'U ][( X ' X )1 X 'U ]'
( X ' X )1 X ' E(UU ') X ( X ' X )1
2 2
0 1 2 2 0 n
2
0 2 2 Φ Ι n
异方差的表现及分类:
6 Y 4
同方差
2
复杂型异方差
X 0 10 20 30
0
250 Y
6 4 DJPY
200
递增型异方差
2
150
2
n
2
4 X i -1 i n 2 X i -1 i n
Var ( )=
2 X i -1 i
根据常用的OLS方差估计公式得到的结果是错误的
ˆ ) E[ ˆ ][ ˆ ] Var (
E[( X ' X )1 X 'Y ][( X ' X )1 X 'Y ]'
( X ' X )1 X '[ 2] X ( X ' X )1
2 ( X ' X )1 X ' X ( X ' X )1 2 ( X ' X )1
3、变量的显著性检验失去意义
4、区间预测失效
ˆ/s ˆ / 2 ( X ' X )1 t ˆ j +1,j +1
Var(ui)=σ
2
(i=1,2,…,n)
同方差假定不满足时,即存在异方差: 2 Var(ui)=σi ( i=1,2,…,n) 解释变量Xi是确定的,扰动项的异方差性等同于: 2 Var(Yi)=σi ( i=1,2,…,n)
更为具体的形式: 2 2 σi =σ f (X1i, X2i, …, Xki)
如果中间除去c=3个,如何进行检验(假定前面有8个,后面有7个)?
RSS2 / 7 2 ????/ 5 F 290.28 RSS1 / 8 2 412586 /6
v2=5,v1= 6
3、 White检验
White检验由H. White 1980年提出。Goldfeld-Quandt 检验必须先把数据 按解释变量的值从小到大排序。Glejser检验通常要试拟合多个回归式。White 检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一 个辅助回归式构造 2 统计量进行异方差检验。
(3)计算两个回归方差的残差平方和RSS1和RSS2。
自由度
v1=v2=(n-c)/2-k-1
(4)构造统计量:
nc RSS2 / k 1 2 RSS2 F nc RSS1 RSS1 / k 1 2
(5)给定显著性水平α,查找临界值Fα.
H1:上式ui存在异方差
(3)在原假设下(不存在异方差)计算统计量:
nR2 ~ 2 ( p-1)
(5)根据临界值进行判断
2 ( p-1) ,则不能拒绝H0(ui具有同方差) 若 nR2
若 nR2 2 ( p-1) ,则拒绝H0(ui具有异方差)
(其中p为辅助回归中待估参数的系数,上例中p=6) 注意,该检验可以用于检验各种类型的异方差,其检验的准确性依赖于模型是 否被正确设定。由于辅助回归方程中可能有太多的解释变量,从而使自由度减 少,有时可以去掉交叉项。
但由于总体模型是未知的,建立模型时遗漏了X3i,而采用 此时,
Yi 1 2 X 2i ui* ui*= ui+3X3i
当被略去的X3i与X2i有呈同方向或反方向变化的趋势时, X3i随 X2i的有规律变化会体现在ui*中。
异方差的来源
二、模型的设定误差 三、数据的测量误差 四、截面数据中总体各单位的差异
更为接近真实的结论是什么?
四川省2000年21个地市医疗机构数与人口数对应的模型 估计结果如下:
如果是正确的,上述结论:每增加1万人口,平均增加 5.373个医疗机构?可靠吗?
异方差的概念
对于多元线性回归模型:Yi 0 1 X1i ..+k X ki ui
同方差的假定:
销售量和R&D支出(研究了18个行业): R&Di = 1+2Salesi+ui
{ X1, X2, …, X8, X9, X10, X11, …, X17, X18}
(18-4)/2=7 c = 18/44 (18-4)/2=7 v1= v2=7-2=5
nc RSS2 / k 1 2 99803587 241.90 F 412586 nc RSS1 / k 1 2
1 1
( X ' X )1 X ' E(U )
2、参数估计量不再是有效估计量
Yi X i ui
假定扰动项的方差为: 2 Var(ui)=σ Xi2 ( i=1,2,…,n)
估计量 方差为:
Var ( )=
同方差假定时的方差:
n
2
i -1 X i
异方差的检验
定性分析异方差
Goldfeld-Quandt检验
White检验 Glejser检验
2
异方差性检验的基本思路:首先利用OLS法估计参数并计算 ei 2 然后通过研究 ei是否随着观测点的变化而变化来推断 u 是否存在异 i 方差性。
定性分析异方差
(1) 经济变量规模差别很大时容易出现异方差。 如:个人收入与支出关系,投入与产出关系。
以二元回归线性回归模型为例:Yi 0 1 X1i 2 X 2i ui H0:上式ui不存在异方差 检验步骤: (1)首先对上式进行OLS回归,求残差ei (2)做如下辅助回归(注意包括常数项,计算可决系数R2):
2 ei2 0 1 X1i 2 X 2i 3 X12 X i 4 2 i 5 X1i X 2 i vi
(2) 利用散点图做初步判断。 用1998年四川省各地市州农村居民家庭消费支出与家庭纯
收入的数据,绘制出消费支出对纯收入的散点图,其中用 X 1 表示家庭纯收入。 Y1 表示农村家庭消费支出,
(3) 利用残差图做初步判断。
e2 e2 e2
0
Xi
0
Xi
6.0E+07 5.0E+07 4.0E+07
异方差(矩阵形式)
同方差的假定即: Var(ui)=σ
2
i=1,2,…,n
1 0 1
1 2 2 方差-协方差矩阵为:Var (U ) I 0
当假定不满足时:
Var(ui)=σi
2
i=1,2,…,n
方差-协方差矩阵为:
12 Var (U ) 0
Xi
e2
e2
E2
3.0E+07 2.0E+07 1.0E+07 0.0E+00
Xi
Xi
0
50000100000
200000
3000
SALES
戈德菲而德-夸特(Goldfeld-Quandt)检验
该检验常用于检验递增型的异方差,且在大样本容量的前提下使用。
2 2 2 H0: 1 2 ... n 2 2 2 H1: 1 2 ... n
这里使用了20个国家的数据,其中5个低收入国家,5 个中等偏下收入国家,5个中等偏上收入国家,5个高 收入国家。由于样本来自经济条件差异很大的国家, 因而先验的预期存在异方差。
TR2 20(0.230) 4.6
戈里瑟(Glejser)检验
检验 e 是否与解释变量Xt存在函数关系。若有,则说明存在异方差;若无,则 i 说明不存在异方差。 基本思想:假设方差与解释变量直接存在某种幂函数的关系。
4.2 异方差
异方差的概念及形式
异方差的来源与后果
异方差的检验
异方差的修正方法
案例分析
一个例子
消费模型 Ci = 1+2Yi+ui 2 同方差假设:Var(ui)=σ i=1,2,…,n 无论家庭处于哪一种可支配收入水平,其消费水平的分散程 度或波动程度都是相同的。 实际上,与可支配收入低的家庭相比,收入高的家庭消费 的波动程度显然更大一些。 因而,在研究消费问题时,需要假定: 2 Var(ui)=σi 即对于不同收入水平的家庭,其消费水平的波动程度也不 相同,这就是所谓的异方差(heteroscedasticity)。
婴儿死亡率(Y)、人均GDP(X1)和初等教育占人 口比重(X2)的关系(n=20):
Yi = 196.979 - 0.0033X2i - 1.401X3i +ei s.e = (16.12) ( 0.001) (0.2205 ) R2=0.8024 F=34.52 D.W.=2.47 与理论预期一致吗?
4000 2000 0 -2000 -4000 -6000 -8000
0 50000100000 200000 300000
R&D
6000 4000 2000 0 SALES
e
8000
0
50000100000 Sales
200000
300000
上证收益率(2004年4月1日——2008年3月31日):
(1)将观测值按递增的方差排列,根据假设,对于递增的异方差,可以从按解释变
量X的值按升序排列。 (2)略去中间C个值(约为T/4),余下的T-C个分为两组并分别拟合出回归方程
{ X1, X2, …, Xi-1, Xi, Xi+1, …, Xn-1, Xn }
(n-c)/2 c = n/4 (n-c)/2
异方差的后果
1、参数估计量仍具有线性性和无偏性、一致性
ˆ ( X ' X )1 X 'Y AY
ˆ ) E[(X ' X )1 X 'Y ] E(
E[( X ' X )1 X ' ( X U )]
E[( X ' X ) X ' X ] E[( X ' X ) X 'U ]
交易量在0~199 之间的机构投资 者平均每股需付 46.5美分,方差 为32.22; 交易量最大 (10000以上) 的投资者平均每 股付10.1美分, 方差为3.18
销售量和R&D支出:
R&Di = 1+2Salesi+ui
RDEXP vs. SALES 14000
8000 6000
12000 10000
e e
2 2i 2 1i
~ F(
nc nc k 1, k 1) 2 2
若:F> Fα ,则拒绝H0,认为存在递增型的异方差。 F< Fα ,不能拒绝H0,认为随机误差项是同方差分布的。
注:⑴ 该检验的功效取决于c值,c值越大,则大小方差的差异越大,检验功效越 好 ⑵ 两个回归所用的观测值的个数是否相等并不重要,因为可以通过改变自由 度和统计量的计算公式来调整。 ⑶ 该检验只适用于于递增型的异方差,且依赖于观测值是否正确排序。 ⑷ 当模型中包含多个解释变量时,应对每一个解释变量都进行检验。
0 -2 -4
100
50 X 0 0 10 20 30
-6 -8 200 400 600 800 1000 1200 1400
250 Y 200
递减型异方差
150
100
50 X 0 10 20 30
0
异方差的例子
放松管制后,纽约股票交易所(NYSE)的经纪人佣金(美分/每股):
70 60 50 40 30 20 10 0 75Q1 75Q3 76Q1 76Q3 77Q1 77Q3 78Q1 78Q3 0-199 200-999 1000-9999 10000 or more
自回归条件异方差(ARCH)—时间序列的异方差
.04 .03 .02 .01 .00 -.01 -.02 -.03 -.04 -.05 2004 2005 2006 2007 SER01
异方差的来源与后果
异方差的来源
一、模型中省略了某些重要的解释变量 假设正确的计量模型是:
Yi 1 2 X 2i 3 X 3i ui
E[( X ' X )1 X '( X U ) ][( X ' X )1 X '( X U ) ]'
E[( X ' X )1 X 'U ][( X ' X )1 X 'U ]'
( X ' X )1 X ' E(UU ') X ( X ' X )1
2 2
0 1 2 2 0 n
2
0 2 2 Φ Ι n
异方差的表现及分类:
6 Y 4
同方差
2
复杂型异方差
X 0 10 20 30
0
250 Y
6 4 DJPY
200
递增型异方差
2
150
2
n
2
4 X i -1 i n 2 X i -1 i n
Var ( )=
2 X i -1 i
根据常用的OLS方差估计公式得到的结果是错误的
ˆ ) E[ ˆ ][ ˆ ] Var (
E[( X ' X )1 X 'Y ][( X ' X )1 X 'Y ]'
( X ' X )1 X '[ 2] X ( X ' X )1
2 ( X ' X )1 X ' X ( X ' X )1 2 ( X ' X )1
3、变量的显著性检验失去意义
4、区间预测失效
ˆ/s ˆ / 2 ( X ' X )1 t ˆ j +1,j +1
Var(ui)=σ
2
(i=1,2,…,n)
同方差假定不满足时,即存在异方差: 2 Var(ui)=σi ( i=1,2,…,n) 解释变量Xi是确定的,扰动项的异方差性等同于: 2 Var(Yi)=σi ( i=1,2,…,n)
更为具体的形式: 2 2 σi =σ f (X1i, X2i, …, Xki)
如果中间除去c=3个,如何进行检验(假定前面有8个,后面有7个)?
RSS2 / 7 2 ????/ 5 F 290.28 RSS1 / 8 2 412586 /6
v2=5,v1= 6
3、 White检验
White检验由H. White 1980年提出。Goldfeld-Quandt 检验必须先把数据 按解释变量的值从小到大排序。Glejser检验通常要试拟合多个回归式。White 检验不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一 个辅助回归式构造 2 统计量进行异方差检验。
(3)计算两个回归方差的残差平方和RSS1和RSS2。
自由度
v1=v2=(n-c)/2-k-1
(4)构造统计量:
nc RSS2 / k 1 2 RSS2 F nc RSS1 RSS1 / k 1 2
(5)给定显著性水平α,查找临界值Fα.
H1:上式ui存在异方差
(3)在原假设下(不存在异方差)计算统计量:
nR2 ~ 2 ( p-1)
(5)根据临界值进行判断
2 ( p-1) ,则不能拒绝H0(ui具有同方差) 若 nR2
若 nR2 2 ( p-1) ,则拒绝H0(ui具有异方差)
(其中p为辅助回归中待估参数的系数,上例中p=6) 注意,该检验可以用于检验各种类型的异方差,其检验的准确性依赖于模型是 否被正确设定。由于辅助回归方程中可能有太多的解释变量,从而使自由度减 少,有时可以去掉交叉项。
但由于总体模型是未知的,建立模型时遗漏了X3i,而采用 此时,
Yi 1 2 X 2i ui* ui*= ui+3X3i
当被略去的X3i与X2i有呈同方向或反方向变化的趋势时, X3i随 X2i的有规律变化会体现在ui*中。
异方差的来源
二、模型的设定误差 三、数据的测量误差 四、截面数据中总体各单位的差异
更为接近真实的结论是什么?
四川省2000年21个地市医疗机构数与人口数对应的模型 估计结果如下:
如果是正确的,上述结论:每增加1万人口,平均增加 5.373个医疗机构?可靠吗?
异方差的概念
对于多元线性回归模型:Yi 0 1 X1i ..+k X ki ui
同方差的假定:
销售量和R&D支出(研究了18个行业): R&Di = 1+2Salesi+ui
{ X1, X2, …, X8, X9, X10, X11, …, X17, X18}
(18-4)/2=7 c = 18/44 (18-4)/2=7 v1= v2=7-2=5
nc RSS2 / k 1 2 99803587 241.90 F 412586 nc RSS1 / k 1 2
1 1
( X ' X )1 X ' E(U )
2、参数估计量不再是有效估计量
Yi X i ui
假定扰动项的方差为: 2 Var(ui)=σ Xi2 ( i=1,2,…,n)
估计量 方差为:
Var ( )=
同方差假定时的方差:
n
2
i -1 X i
异方差的检验
定性分析异方差
Goldfeld-Quandt检验
White检验 Glejser检验
2
异方差性检验的基本思路:首先利用OLS法估计参数并计算 ei 2 然后通过研究 ei是否随着观测点的变化而变化来推断 u 是否存在异 i 方差性。
定性分析异方差
(1) 经济变量规模差别很大时容易出现异方差。 如:个人收入与支出关系,投入与产出关系。
以二元回归线性回归模型为例:Yi 0 1 X1i 2 X 2i ui H0:上式ui不存在异方差 检验步骤: (1)首先对上式进行OLS回归,求残差ei (2)做如下辅助回归(注意包括常数项,计算可决系数R2):
2 ei2 0 1 X1i 2 X 2i 3 X12 X i 4 2 i 5 X1i X 2 i vi
(2) 利用散点图做初步判断。 用1998年四川省各地市州农村居民家庭消费支出与家庭纯
收入的数据,绘制出消费支出对纯收入的散点图,其中用 X 1 表示家庭纯收入。 Y1 表示农村家庭消费支出,
(3) 利用残差图做初步判断。
e2 e2 e2
0
Xi
0
Xi
6.0E+07 5.0E+07 4.0E+07
异方差(矩阵形式)
同方差的假定即: Var(ui)=σ
2
i=1,2,…,n
1 0 1
1 2 2 方差-协方差矩阵为:Var (U ) I 0
当假定不满足时:
Var(ui)=σi
2
i=1,2,…,n
方差-协方差矩阵为:
12 Var (U ) 0
Xi
e2
e2
E2
3.0E+07 2.0E+07 1.0E+07 0.0E+00
Xi
Xi
0
50000100000
200000
3000
SALES
戈德菲而德-夸特(Goldfeld-Quandt)检验
该检验常用于检验递增型的异方差,且在大样本容量的前提下使用。
2 2 2 H0: 1 2 ... n 2 2 2 H1: 1 2 ... n
这里使用了20个国家的数据,其中5个低收入国家,5 个中等偏下收入国家,5个中等偏上收入国家,5个高 收入国家。由于样本来自经济条件差异很大的国家, 因而先验的预期存在异方差。
TR2 20(0.230) 4.6
戈里瑟(Glejser)检验
检验 e 是否与解释变量Xt存在函数关系。若有,则说明存在异方差;若无,则 i 说明不存在异方差。 基本思想:假设方差与解释变量直接存在某种幂函数的关系。
4.2 异方差
异方差的概念及形式
异方差的来源与后果
异方差的检验
异方差的修正方法
案例分析
一个例子
消费模型 Ci = 1+2Yi+ui 2 同方差假设:Var(ui)=σ i=1,2,…,n 无论家庭处于哪一种可支配收入水平,其消费水平的分散程 度或波动程度都是相同的。 实际上,与可支配收入低的家庭相比,收入高的家庭消费 的波动程度显然更大一些。 因而,在研究消费问题时,需要假定: 2 Var(ui)=σi 即对于不同收入水平的家庭,其消费水平的波动程度也不 相同,这就是所谓的异方差(heteroscedasticity)。
婴儿死亡率(Y)、人均GDP(X1)和初等教育占人 口比重(X2)的关系(n=20):
Yi = 196.979 - 0.0033X2i - 1.401X3i +ei s.e = (16.12) ( 0.001) (0.2205 ) R2=0.8024 F=34.52 D.W.=2.47 与理论预期一致吗?
4000 2000 0 -2000 -4000 -6000 -8000
0 50000100000 200000 300000
R&D
6000 4000 2000 0 SALES
e
8000
0
50000100000 Sales
200000
300000
上证收益率(2004年4月1日——2008年3月31日):
(1)将观测值按递增的方差排列,根据假设,对于递增的异方差,可以从按解释变
量X的值按升序排列。 (2)略去中间C个值(约为T/4),余下的T-C个分为两组并分别拟合出回归方程
{ X1, X2, …, Xi-1, Xi, Xi+1, …, Xn-1, Xn }
(n-c)/2 c = n/4 (n-c)/2
异方差的后果
1、参数估计量仍具有线性性和无偏性、一致性
ˆ ( X ' X )1 X 'Y AY
ˆ ) E[(X ' X )1 X 'Y ] E(
E[( X ' X )1 X ' ( X U )]
E[( X ' X ) X ' X ] E[( X ' X ) X 'U ]
交易量在0~199 之间的机构投资 者平均每股需付 46.5美分,方差 为32.22; 交易量最大 (10000以上) 的投资者平均每 股付10.1美分, 方差为3.18
销售量和R&D支出:
R&Di = 1+2Salesi+ui
RDEXP vs. SALES 14000
8000 6000
12000 10000
e e
2 2i 2 1i
~ F(
nc nc k 1, k 1) 2 2
若:F> Fα ,则拒绝H0,认为存在递增型的异方差。 F< Fα ,不能拒绝H0,认为随机误差项是同方差分布的。
注:⑴ 该检验的功效取决于c值,c值越大,则大小方差的差异越大,检验功效越 好 ⑵ 两个回归所用的观测值的个数是否相等并不重要,因为可以通过改变自由 度和统计量的计算公式来调整。 ⑶ 该检验只适用于于递增型的异方差,且依赖于观测值是否正确排序。 ⑷ 当模型中包含多个解释变量时,应对每一个解释变量都进行检验。
0 -2 -4
100
50 X 0 0 10 20 30
-6 -8 200 400 600 800 1000 1200 1400
250 Y 200
递减型异方差
150
100
50 X 0 10 20 30
0
异方差的例子
放松管制后,纽约股票交易所(NYSE)的经纪人佣金(美分/每股):
70 60 50 40 30 20 10 0 75Q1 75Q3 76Q1 76Q3 77Q1 77Q3 78Q1 78Q3 0-199 200-999 1000-9999 10000 or more