6_广义最小二乘法(GLS)与异方差
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
子样本2: R2=0.7068, RSS1=0.0648 lY ˆ n 0 . 7 0 9 . 1 l1 X 3 n 1 0 . 7 8 lX 7 n 2 6 (0.43) (0.73) (6.53)
R2=0.8339, RSS2=0.2729
计算F统计量:
F= e22 / e12 =0.2792/0.0648=4.31
589.6 814.4
4753.2
652.5 5218.4 云 南
1331.03
614.8 876.0
2374.7
1177.6 2607.2 西 藏
1127.37
621.6 887.0
3479.2
985.8 3596.6 陕 西
1330.45
803.8 753.5
1412.4
1013.1 1006.9 甘 肃
异方差检验
(1)图示法
进一步的统计检验
(2)G-Q检验
将原始数据按X2排成升序,去掉中间的7 个数据,得两个容量为12的子样本。
对两个子样本分别作OLS回归,求各自的
残差平方和 e12 和 e22:
子样本1: lY ˆ n 4 . 0 0 6 . 3 l1 X 4 n 1 0 . 1 3 lX 1 n 2 9 (3.18) (4.13) (0.94)
表
地区 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南
中国 2001 年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)
从事农业经营 其他收入
从事农业经营 其他收入
人均消费
的收入
人均消费
的收入
支出
Y
3552.1
X1
579.1
X2
地区
4446.4 湖 北
bb b b Y i 0 1 X i 1 2 X i2 . .k . X i k u i ( i 1 2 .,,m .,) .
YY1211
X1 1
X2 1
X1 2
X2 2
XX12kk
b0 u1 b1u2
Ym
1 Xm1
Xm2
Xm k
bk
um
Yi n1i
ni
Yij
j1
(i12 , .,..m , )
m =n R2 =31 0.4374=13.56
=5%显著性水平下,临界值 20.05(4)=9.49,拒绝同方差的 原假设。
EViews中,在回归结果输出窗口中点击:View/Residual Tests/White Heteroskedasticity,然后查看Obs*R的伴随概率 P值,如果大于显著性水平就是同方差的,反之是有异方差的。
u2(X1X)1
s 4、
2 u
的估计:
2 e*e* * nk 1
二、异方差
1、含义 Va (uir)u 2f(Xi) i1,2,...n
即:u i 在解释变量取不同值时方差不同,异方差是X 的函数。
可通过散点图观察。 2、异方差的来源——主要存在于横断面资料中
1)被解释变量的测量误差随时间而变化; 2)某些被省略的解释变量进入u中; 3)模型的数学形式错误; 4)分组数据中; 5)人们的经济行为。
1388.79
859.6 963.4
2503.1
1053.0 2327.7 青 海
1350.23
1300.1 410.3
1720.0
1027.8 1203.8 宁 夏
2703.36
1242.9 2526.9
1905.0
1293.0 1511.6 新 疆
1550.62
1068.8 875.6
1375.6
=
σ2 u
I
3、GLSE
1)b ~(X* X*)1X* Y *
= (X' P-1'P-1 X)-1 X' P-1 'P-1 Y
若
Ω
= =
I(,X则' Ωb~-1=Xb)-1
X'
Ω
-1
Y
~ 2) b 的统计特性
线性性、无偏性、最小方差性
Va(b~r)E(b~b)(b~b)
E(X1X)1X11uu1X(X1X)1
1
Va (uir)Eni (ui1ui2.. .uin i)
n1i2(u2u2... u2)
1 ni2
ni
2 u
2 u
ni
1
n
1
Var
(u
)
2 u
1 n2
2 u
1
n m
P P
1
n1
P
1 n2
n1
P -1
1
nm
n2
nm
给模型
Y b0 b1 X u
1
Y1
1554.6
1492.8 480.5 海 南
1497.52
919.3 1067.7
1786.3
1254.3 1303.6 重 庆
1098.39
764.0 647.8
1661.7
1634.6 547.6 四 川
1336.25
889.4 644.3
1604.5
1684.1 596.2 贵 州
1123.71
c. 判断:在Eviews的模型估计结果输出窗口中, 选 View/ Residual Test/ White Heteroskedasticity
4、戈德菲尔特—夸特(Goldfield-quandt)检验(集团 法)
a. 将X顺序排列,并保持与Y 的对应关系;
b. 将数据分为两组(子样本),中间剔除 c ( n/3~
支出
Y
2703.36
X1
1242.9
X2
2526.9
2050.9
1314.6 2633.1 湖 南
1550.62
1068.8 875.6
1429.8
928.8 1674.8 广 东
1357.43
1386.7 839.8
1221.6
609.8 1346.2 广 西
1475.16
883.2 1088.0
(1.47)
似乎没有哪个参数的t检验是显著的 。但 n*R2 =31×0.4638=14.38
=5%下,临界值 20.05(5)=11.07,拒绝同方差性。
去掉交叉项后的辅助回归结果:
(1.36) (-0.64)
(0.64)
(-2.76)
(2.90)
R2 =0.4374 lnX2、(lnX2)2的参数的t检验是显著的,且:
n/4 );
c.
建立两个子方程,得
s
2 1
、
s 2
e
和
1
2 2
、
e22 ;
d.
检验判断:
H0
:
2 1
2 2
H1
:
2 1
2 2
F e12
e22 ~
F(nc2, nc2)
2
2
F F 拒绝 H 0 ,有异方差; F F 接受 H 0 , 无异方差。
五、模型估计—GLS
1、对分组资料情况,已知
2 n
2 u
β的OLSE 特性:线性性、无偏性、方差最小不成立。
2、GLS 原理
Y = X β+ u
Var
(u)
=
σu2Ω=
σ2 u
P
P'
以P-1 左乘原模型:
P-1 Y = P-1 X β+ P-1 u
(P为非奇异阵)
即: Y* = X*β+ u*
则:Var(u*) = Var (P-1 u) = E (P-1 u u' P-1' )
六、案例——中国农村居民人均消费函数
中国农村居民人均消费支出主要由人均纯收 入来决定。
农村人均纯收入包括:(1)从事农业经营的收入;
(2)从事其他产业的经营性收入;(3)工资性收入;(4) 财产收入;(4)转移支付收入。
考察从事农业经营的收入(X1)和其他收入 (X2)对中国农村居民消费支出(Y)增长的影响:
——Yi = f(Xi, b) + ei
——式中f(.)为一个可微分的非线性函数,b为(K+1)×1
未知参数向量,X为 n ×(K+1) 解释变量矩阵,e为服从 某种形式统计分布的误差项(通常用正态分布)。
❖ 此时我们无法将待估计参数表示为由已知的X和Y表 示的线性函数,这种情况被称作参数非线性。
1
——对于非线性方程,我们常常无法确保得到估计参数的解析 解,但通常能够利用数值逼近方法得到方程组的近似解。 此时估计参数可能不是唯一的,并且存在收敛困难。
4
NLS估计技术
求解非线性方程组的常用方法:
——线性化迭代求解法(Iterative linearization method),即从一组参数的初始值开始将非线性 函数线性化,然后求解线性方程组并得到新的估 计值;重复上述步骤直到估计结果达到收敛标准 或达到最大迭代次数时为止。
有 交 叉 项
无 交 叉 项
原模型的加权最小二乘法回归
对原模型进行OLS估计,得到随机误差项的 近似估计量e,以此构成随机干扰项的标准差的
估计量, 即Var(ui) ≈ ei2;
-——以残差平方和最小为标准获得参数估计 ——通常基于误差项满足正态分布的假定 ——一般计量经济软件有标准的指令和算法
3
NLS估计技术
——用最小二乘法估计非线性回归方程的原理与估计线性回归 方程相同,即求解使残差平方和最小的参数;
——对于线性函数,模型参数可以通过求解由一阶条件构成的 方程组估计得出;
关于C-D生产函数的残差加性项形式:
Q b0Lb1Kb2 e e ~ N 0,2
f X,b b0Lb1Kb2
f X,b f X,b f X,b f X,b
b
b0
,
b1
,
b2
Lb1Kb2 , LnL b0Lb1Kb2 , LnK b0Lb1Kb2
2
NLS估计技术
非线性最小二乘法(NLS)
c. 用WLS法消除。
3、怀特(White)检验 a. 建立模型
例如: e 201 X 12 X 23 X 1 24 X 2 25 X 1 X 2
b. 检验统计量: m nR2
n为样本容量,R2为可决系数,m 即LM统计量(朗格 拉日乘子统计量),近似服从自由度为 k (解释变量 的个数) 的 2 分布。
查表: 给定=5%,查得临界值 F0.05(9,9)=2.97 判断: F> F0.05(9,9)
否定两组子样方差相同的假设,从而该总体
随机项存在递增异方差性。
(3)怀特检验 作辅助回归:
(-0.04 (0.10) R2 =0.4638
(0.21)
(-0.12)
0.04 ln X 3 1ln X 2 (-1.11)
nls非线性最小二乘法nls以残差平方和最小为标准获得参数估计通常基于误差项满足正态分布的假定一般计量经济软件有标准的指令和算法用最小二乘法估计非线性回归方程的原理与估计线性回归方程相同即求解使残差平方和最小的参数
参数非线性
❖ 当模型为参数非线性形式时,需要采用非线性估计 技术。
❖ 非线性模型的一般形式为:
5
NLS估计技术
——注意:NLS方法并不能够保证总是收敛到最优解, 可能出现的情况有:收敛速度缓慢、收敛到局部最 优解、估计系数出现发散情况
——收敛到错误结果时,R2可能出现负值。 ——在应用工作中,当遇到上述情况时,一种做法是
改变初始值,然后重新进行迭代求解过程。
6
Chapter 6
广义最小二乘法(GLS) 与
X
2 1
Var
(u )
2 u
2 u
X
2 2
X
2 n
p p
1
X1
p
1
1 X2
1
X
n
b b P 1左Y 乘 01 X u ,得
YYYn21XX21
Xn
1 x1 1 x2
1 xn
1
1
bb10
1
uu21xx12
un
xn
Va(X urii)X1i2u2Xi2u2
1083.8 1014.1
普通最小二乘法的估计结果:
ln Y ˆ 1 .65 0 .5 31 ln 6 X 1 6 0 .50 ln 8 X 24
(1 .8 7 ) (3 .0 2 )
( 1 0 .0 4 )
R 2= 0 .7 8 3 1 R 2= 0 .7 6 7 6D W = 1 .8 9F = 5 0 .5 3 R S S = 0 .8 2 3 2
3、异方差的后果:
1)参数估计量的方差变大;
2)t检验无法进行(
2 u
无法求得);
3)降低预测精度。
三、异方差的检验
1、图示检验法:解释变量与e的散点图。 2、戈里瑟(Glejser)检验:
a. Y OLS X1, X2, … …Xk, 得序列e。 b. 建立方程寻找导致异方差的X:
e 0 1f(Xj)
Xi1n1i jni1Xi1j (i12, .,..m , )
1 ni
Xi2ni
Xij2
j1
(i12, .,..m , )
1 ni
Xikni
Xijk
j1
(i12, .,..m , )
1 E(ui)E [ni (ui1ui2. ..uiin)]0
C(o u i,u vj)E (u iuj)0
2
异方差(Heteroskedasticity)
主要内容
一、GLS法原理 二、异方差的来源及后果 三、异方差的检验 四、消除异方差和估计模型 五、EViews的应用 六、案例
一、广义最小二乘法(GLS)
1、模型:Y = X β+ u
Var
cov(
u)
1122
12
2 2
1n 2n
1n
2n
Y2
1
X
1
X2
b b
0 1
u1
u
2
Hale Waihona Puke Ym 1 X m
u m
左乘 P1
Y1
n1
n1
Y
2
n2
n2
Y
m
nm
nm
n1
X
1
u1
n1
n2
X
2
b b
0 1
u
2
n2
nm
X
m
u
m
nm
Var ( u i
ni )
n
i
.
2 u
ni
2 u
2、 未知,令 f (X)Xi2
R2=0.8339, RSS2=0.2729
计算F统计量:
F= e22 / e12 =0.2792/0.0648=4.31
589.6 814.4
4753.2
652.5 5218.4 云 南
1331.03
614.8 876.0
2374.7
1177.6 2607.2 西 藏
1127.37
621.6 887.0
3479.2
985.8 3596.6 陕 西
1330.45
803.8 753.5
1412.4
1013.1 1006.9 甘 肃
异方差检验
(1)图示法
进一步的统计检验
(2)G-Q检验
将原始数据按X2排成升序,去掉中间的7 个数据,得两个容量为12的子样本。
对两个子样本分别作OLS回归,求各自的
残差平方和 e12 和 e22:
子样本1: lY ˆ n 4 . 0 0 6 . 3 l1 X 4 n 1 0 . 1 3 lX 1 n 2 9 (3.18) (4.13) (0.94)
表
地区 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南
中国 2001 年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)
从事农业经营 其他收入
从事农业经营 其他收入
人均消费
的收入
人均消费
的收入
支出
Y
3552.1
X1
579.1
X2
地区
4446.4 湖 北
bb b b Y i 0 1 X i 1 2 X i2 . .k . X i k u i ( i 1 2 .,,m .,) .
YY1211
X1 1
X2 1
X1 2
X2 2
XX12kk
b0 u1 b1u2
Ym
1 Xm1
Xm2
Xm k
bk
um
Yi n1i
ni
Yij
j1
(i12 , .,..m , )
m =n R2 =31 0.4374=13.56
=5%显著性水平下,临界值 20.05(4)=9.49,拒绝同方差的 原假设。
EViews中,在回归结果输出窗口中点击:View/Residual Tests/White Heteroskedasticity,然后查看Obs*R的伴随概率 P值,如果大于显著性水平就是同方差的,反之是有异方差的。
u2(X1X)1
s 4、
2 u
的估计:
2 e*e* * nk 1
二、异方差
1、含义 Va (uir)u 2f(Xi) i1,2,...n
即:u i 在解释变量取不同值时方差不同,异方差是X 的函数。
可通过散点图观察。 2、异方差的来源——主要存在于横断面资料中
1)被解释变量的测量误差随时间而变化; 2)某些被省略的解释变量进入u中; 3)模型的数学形式错误; 4)分组数据中; 5)人们的经济行为。
1388.79
859.6 963.4
2503.1
1053.0 2327.7 青 海
1350.23
1300.1 410.3
1720.0
1027.8 1203.8 宁 夏
2703.36
1242.9 2526.9
1905.0
1293.0 1511.6 新 疆
1550.62
1068.8 875.6
1375.6
=
σ2 u
I
3、GLSE
1)b ~(X* X*)1X* Y *
= (X' P-1'P-1 X)-1 X' P-1 'P-1 Y
若
Ω
= =
I(,X则' Ωb~-1=Xb)-1
X'
Ω
-1
Y
~ 2) b 的统计特性
线性性、无偏性、最小方差性
Va(b~r)E(b~b)(b~b)
E(X1X)1X11uu1X(X1X)1
1
Va (uir)Eni (ui1ui2.. .uin i)
n1i2(u2u2... u2)
1 ni2
ni
2 u
2 u
ni
1
n
1
Var
(u
)
2 u
1 n2
2 u
1
n m
P P
1
n1
P
1 n2
n1
P -1
1
nm
n2
nm
给模型
Y b0 b1 X u
1
Y1
1554.6
1492.8 480.5 海 南
1497.52
919.3 1067.7
1786.3
1254.3 1303.6 重 庆
1098.39
764.0 647.8
1661.7
1634.6 547.6 四 川
1336.25
889.4 644.3
1604.5
1684.1 596.2 贵 州
1123.71
c. 判断:在Eviews的模型估计结果输出窗口中, 选 View/ Residual Test/ White Heteroskedasticity
4、戈德菲尔特—夸特(Goldfield-quandt)检验(集团 法)
a. 将X顺序排列,并保持与Y 的对应关系;
b. 将数据分为两组(子样本),中间剔除 c ( n/3~
支出
Y
2703.36
X1
1242.9
X2
2526.9
2050.9
1314.6 2633.1 湖 南
1550.62
1068.8 875.6
1429.8
928.8 1674.8 广 东
1357.43
1386.7 839.8
1221.6
609.8 1346.2 广 西
1475.16
883.2 1088.0
(1.47)
似乎没有哪个参数的t检验是显著的 。但 n*R2 =31×0.4638=14.38
=5%下,临界值 20.05(5)=11.07,拒绝同方差性。
去掉交叉项后的辅助回归结果:
(1.36) (-0.64)
(0.64)
(-2.76)
(2.90)
R2 =0.4374 lnX2、(lnX2)2的参数的t检验是显著的,且:
n/4 );
c.
建立两个子方程,得
s
2 1
、
s 2
e
和
1
2 2
、
e22 ;
d.
检验判断:
H0
:
2 1
2 2
H1
:
2 1
2 2
F e12
e22 ~
F(nc2, nc2)
2
2
F F 拒绝 H 0 ,有异方差; F F 接受 H 0 , 无异方差。
五、模型估计—GLS
1、对分组资料情况,已知
2 n
2 u
β的OLSE 特性:线性性、无偏性、方差最小不成立。
2、GLS 原理
Y = X β+ u
Var
(u)
=
σu2Ω=
σ2 u
P
P'
以P-1 左乘原模型:
P-1 Y = P-1 X β+ P-1 u
(P为非奇异阵)
即: Y* = X*β+ u*
则:Var(u*) = Var (P-1 u) = E (P-1 u u' P-1' )
六、案例——中国农村居民人均消费函数
中国农村居民人均消费支出主要由人均纯收 入来决定。
农村人均纯收入包括:(1)从事农业经营的收入;
(2)从事其他产业的经营性收入;(3)工资性收入;(4) 财产收入;(4)转移支付收入。
考察从事农业经营的收入(X1)和其他收入 (X2)对中国农村居民消费支出(Y)增长的影响:
——Yi = f(Xi, b) + ei
——式中f(.)为一个可微分的非线性函数,b为(K+1)×1
未知参数向量,X为 n ×(K+1) 解释变量矩阵,e为服从 某种形式统计分布的误差项(通常用正态分布)。
❖ 此时我们无法将待估计参数表示为由已知的X和Y表 示的线性函数,这种情况被称作参数非线性。
1
——对于非线性方程,我们常常无法确保得到估计参数的解析 解,但通常能够利用数值逼近方法得到方程组的近似解。 此时估计参数可能不是唯一的,并且存在收敛困难。
4
NLS估计技术
求解非线性方程组的常用方法:
——线性化迭代求解法(Iterative linearization method),即从一组参数的初始值开始将非线性 函数线性化,然后求解线性方程组并得到新的估 计值;重复上述步骤直到估计结果达到收敛标准 或达到最大迭代次数时为止。
有 交 叉 项
无 交 叉 项
原模型的加权最小二乘法回归
对原模型进行OLS估计,得到随机误差项的 近似估计量e,以此构成随机干扰项的标准差的
估计量, 即Var(ui) ≈ ei2;
-——以残差平方和最小为标准获得参数估计 ——通常基于误差项满足正态分布的假定 ——一般计量经济软件有标准的指令和算法
3
NLS估计技术
——用最小二乘法估计非线性回归方程的原理与估计线性回归 方程相同,即求解使残差平方和最小的参数;
——对于线性函数,模型参数可以通过求解由一阶条件构成的 方程组估计得出;
关于C-D生产函数的残差加性项形式:
Q b0Lb1Kb2 e e ~ N 0,2
f X,b b0Lb1Kb2
f X,b f X,b f X,b f X,b
b
b0
,
b1
,
b2
Lb1Kb2 , LnL b0Lb1Kb2 , LnK b0Lb1Kb2
2
NLS估计技术
非线性最小二乘法(NLS)
c. 用WLS法消除。
3、怀特(White)检验 a. 建立模型
例如: e 201 X 12 X 23 X 1 24 X 2 25 X 1 X 2
b. 检验统计量: m nR2
n为样本容量,R2为可决系数,m 即LM统计量(朗格 拉日乘子统计量),近似服从自由度为 k (解释变量 的个数) 的 2 分布。
查表: 给定=5%,查得临界值 F0.05(9,9)=2.97 判断: F> F0.05(9,9)
否定两组子样方差相同的假设,从而该总体
随机项存在递增异方差性。
(3)怀特检验 作辅助回归:
(-0.04 (0.10) R2 =0.4638
(0.21)
(-0.12)
0.04 ln X 3 1ln X 2 (-1.11)
nls非线性最小二乘法nls以残差平方和最小为标准获得参数估计通常基于误差项满足正态分布的假定一般计量经济软件有标准的指令和算法用最小二乘法估计非线性回归方程的原理与估计线性回归方程相同即求解使残差平方和最小的参数
参数非线性
❖ 当模型为参数非线性形式时,需要采用非线性估计 技术。
❖ 非线性模型的一般形式为:
5
NLS估计技术
——注意:NLS方法并不能够保证总是收敛到最优解, 可能出现的情况有:收敛速度缓慢、收敛到局部最 优解、估计系数出现发散情况
——收敛到错误结果时,R2可能出现负值。 ——在应用工作中,当遇到上述情况时,一种做法是
改变初始值,然后重新进行迭代求解过程。
6
Chapter 6
广义最小二乘法(GLS) 与
X
2 1
Var
(u )
2 u
2 u
X
2 2
X
2 n
p p
1
X1
p
1
1 X2
1
X
n
b b P 1左Y 乘 01 X u ,得
YYYn21XX21
Xn
1 x1 1 x2
1 xn
1
1
bb10
1
uu21xx12
un
xn
Va(X urii)X1i2u2Xi2u2
1083.8 1014.1
普通最小二乘法的估计结果:
ln Y ˆ 1 .65 0 .5 31 ln 6 X 1 6 0 .50 ln 8 X 24
(1 .8 7 ) (3 .0 2 )
( 1 0 .0 4 )
R 2= 0 .7 8 3 1 R 2= 0 .7 6 7 6D W = 1 .8 9F = 5 0 .5 3 R S S = 0 .8 2 3 2
3、异方差的后果:
1)参数估计量的方差变大;
2)t检验无法进行(
2 u
无法求得);
3)降低预测精度。
三、异方差的检验
1、图示检验法:解释变量与e的散点图。 2、戈里瑟(Glejser)检验:
a. Y OLS X1, X2, … …Xk, 得序列e。 b. 建立方程寻找导致异方差的X:
e 0 1f(Xj)
Xi1n1i jni1Xi1j (i12, .,..m , )
1 ni
Xi2ni
Xij2
j1
(i12, .,..m , )
1 ni
Xikni
Xijk
j1
(i12, .,..m , )
1 E(ui)E [ni (ui1ui2. ..uiin)]0
C(o u i,u vj)E (u iuj)0
2
异方差(Heteroskedasticity)
主要内容
一、GLS法原理 二、异方差的来源及后果 三、异方差的检验 四、消除异方差和估计模型 五、EViews的应用 六、案例
一、广义最小二乘法(GLS)
1、模型:Y = X β+ u
Var
cov(
u)
1122
12
2 2
1n 2n
1n
2n
Y2
1
X
1
X2
b b
0 1
u1
u
2
Hale Waihona Puke Ym 1 X m
u m
左乘 P1
Y1
n1
n1
Y
2
n2
n2
Y
m
nm
nm
n1
X
1
u1
n1
n2
X
2
b b
0 1
u
2
n2
nm
X
m
u
m
nm
Var ( u i
ni )
n
i
.
2 u
ni
2 u
2、 未知,令 f (X)Xi2