计量经济学基础-异方差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
又如:现有1995年北京市规模最大的20个百货零售商店的 商品销售收入和利润总额资料如表前三栏所示。如果用商品销 售收入作为解释变量x,用利润总额作为被解释变量y,则可建 立起利润总额对销售收入的线性回归模型:
yi 0 1 xi i , i 1, 2,L n
表
北京市20家最大百货商店销售资料
D(i
)
2 i
,
i 1, 2,L
n
即对不同的样本点,随机误差项的方差不再是常数,而是各不相同
,则认为出现了异方差。在数学上表现为:
2 i
f (xi ),
i 1, 2,L
n
同方差性
密度
y
x
0 1xi
异方差性
密度
y
x
0 1xi
例如:储蓄函数
研究家庭收入与储蓄之间的关系。用xi表示第i个家庭 的收入量, yi表示第i个家庭的储蓄量。假设这种关系是线性 关系.因而储蓄函数模型可以表示为:
D(ˆ ) 2( XT X )1,
但是如果出现了异方差而一味采用惯常的检验程序,将导致检验及 区间估计的偏误。
3、模型的预测失效
第三节、异方差性的检验
一个重要的问题是:怎样知道在一个具体的情况中是否有异方 差?实际中并不存在侦破异方差性的严明法则,只有少数的经验规 则。我们介绍几种:
1、图解法 如果对异方差性的性质没有任何先验或经验信息,实际上,可 先在无异方差性的假定下作回归分析,以解释变量为横坐标,以残 差平方为纵坐标得出二维散点图,从图中判断二者的相关性。这是 非正式的方法,不够精确。
2 D1 ( D1 )T 2 D1DDT (D1 )T 2 I
这说明新模型具有同方差性。因此对新模型使用OLS法,得
ˆ ( X*T X* )1 X*TY * ( X T ( D1 )T D1 X )1 X T ( D1 )T D1Y
( X T 1 X )1 X T 1Y
该估计量称为加权最小二乘估计量,这里新模型满足了零均值和方 差的经典假设。
E( ) 0, D( ) E( T ) 2
1 0 L
0 L
2
L
L L
0
0
L
1
记
D
0 L
0L
2 L
LL
0
0
L
0
0
L
n
0
0L
n
令 DDT
用D-1左乘 Y X ,得
D1Y D1 X D1
Y* X* *
对于新模型而言 :
E( * *T ) E( D1 T ( D1 )T ) D1E( T )( D1 )T
第4章 异方差
主要内容
第一节 第二节 第三节 第四节
异方差的性质是什么? 它的后果是什么? 怎样去侦察它? 有什么补救措施?
第一节 异方差性
对于模型:
yi 0 1 x1i 2 x2i L k xki i , i 1, 2,L n
或
Y X
同方差假设为:D(i ) 2 , i 1, 2,L n ,如果出现:
E[( X T 1 X )1 X 1( X )]
D(ˆ ) E[(ˆ )(ˆ )T ] E[( X T 1 X )1 X 1 T 1 X ( X T 1 X )1 ] 2 ( X T 1 X )1
可以证明加权后的估计量 ˆ 既是无偏的,也是有效的。另外方差 的估计量为 Dˆ (ˆ ) ˆ 2( XT1X )1
第二节 异方差的后果
当出现异方差而又使用普通的最小而乘法,则会出现如下后果:
1、参数估计量非有效性
若使用OLS法,此时得到的残差向量的方差协方差矩阵为
2 1
D(
)
E(
T
)
0 L
0
2 2
L
L L L
0
0
L
0
0
L
2 n
即 D( ) E( T ) 2
2 i
2 i , i
1, 2,L
n
D(
f
1 (x
ji
)
i
)
E(
f
1 (x ji
)
i
)2
f
1 (x
ji
)
E
(
2 i
)
1 f (x ji )
f (x ji ) 2 2
新模型满足了同方差性,可以用OLS进行估计参数,得到的估计量
是BLUE。 这里 例如:
1 来自百度文库以理解为权。 f (x ji )
下面通过矩阵来分析此方法:
对于模型 Y X
我们采用加权最小二乘法 ,即对模型进行变换。
如果i2 f (xji ) 2,即随机误差项的方差与解释变量xj之间存在相
关性。用 f (xji ) 去除原模型,得:
1 f ( x ji )
yi
0
f
1 ( x ji
)
1
1 f ( x ji )
x1i
L
k
f
1 ( x ji )
xki
f
1 (x
ji
)
i
在新模型中:
(1995年) 单位:干万元
利用普通最小二乘法,根据表中的数据,可估计出该回归方程 为(模型式下括号中的数字为相应估计量的标准误):
yˆ 0.51595 0.06676x
R2 0.7759
(0.6224) (0.0085)
根据此回归方程可计算出各商店利润总额的回归估计值和残差如
表的后两栏。将销售收入xi作为横坐标,残差 ei yi yˆi 作为纵
而 2 的估计量为 ˆ 2 (Y X ˆ )T 1(Y X ˆ )
n k 1
【注】如何得到加权矩阵呢? 可以对原模型首先采用OLS法,得到随机误差项地近似估计量,
以此作为加权矩阵的估计量
2 1
ˆ
0 L
0L
2 2
L
LL
0
0
L
0
0
L
2 n
如果应用软件包,只需要选择加权最小二乘法,将上述权矩阵输入, 估计将自动完成。
1 0 L 0
0 L
2 L
LL
0
L
0
0
L
n
最小二乘估计为: ˆ ( X T X )1 X TY ( X T X )1 X T ( X )
( X T X )1 X T E(ˆ )
Q D(ˆ) E[(ˆ )(ˆ )T ] E[( X T X )1 X T T X ( X T X )1]
可能存在异方差
eˆ
x
eˆ
可能没有异方差
x
2、Goldfeld-Quandt检验法(1965)
这种检验方法仅适用大样本情形(N>30),要求满足条件: ①观测值的数日至少是参数的二倍;②随机项没有自相关并且服从 正态分布。
此检验方法的基本思想是异方差性的常见形式之一是 具有递增方
差。由于 的方差估计为
坐标,可作出残差图(如图所示)。该残差图的形状象一个喇叭, 由此可以看出,销售收入小的商店,其残差一般也较小;而销售
收入大的商店,其残差一般也较大;残差有随着商店规模增大而
增大的倾向。这表明,不同规模的商店,其利润总额的方差是不
相同的,从而模型中随机误差的方差不是常数,这里存在着异方
差现象。
在实际问题中出现异方差性的例子很多.对回归模型 中异方差现象的研究,是经济计量学中的一个重要内容。 为什么会产生这种异方差性呢? 一方面是因为随机项包括 了观察测量误差和模型中被省略的一些因素对被解释变量 (因变量)的影响,另一方面来自不同抽样单元的因变量 观察值之间可能差别很大。因此、异方差性多出现在横断 面样本之中。至于时间序列,则由于因变量观察值来自不 同时期的同一样本单元.通常因变量的不同观察值之间的 差别不是很大。所以异方差性一般不明显。
【注】加权后的残差平方和为
n
Q*
*2 i
( * )2 *
(Y *
X *
)T (Y *
X *
)
i 1
(Y X )T (D1 )T D1(Y X )
T 1
n1
i1 i
2 i
由此可以看出加权后的残差平方和其实就是原残差平方以权重 1 i
后的和 。
【注】加权最小二乘估计 ˆ 的期望与方差 E(ˆ ) E[( XT1X )1 X1Y ]
n
2 i
ˆ 2 i1
n k 1
n
所以判断 是否有递增方差可以通过判断
2 i
是否显著变大来实
现。依据这个简单的想法,提出了F检验的i检1 验方法,其具体步骤
如下:
第一步:建立统计假设:
原假设 H0 : i ,i 1, 2,L n 是同方差,
备择假设 H1 : i ,i 1, 2,L n具有异方差。
( X T X )1 X T E( T ) X ( X T X )1
2 ( X T X )1( X T X ) X ( X T X )1 2 ( X T X )1
因而使用OLS 法,得到的估计量是无偏的,但不是有效的。
2、参数的显著性检验失去意义 因为在前面讨论的t统计量和F统计量都利用到了
本章结束
用所得出的两个子样本的残差平方和构成F统汁量,当H0为真,则
F RSS1 RSS2
(n1 k 1) : (n2 k 1)
F (n1 k 1, n2 k 1)
在显著性水平 下,若F大于临界值 F (n1 k 1, n2 k 1) ,则认
为由异方差存在。
第四节 加权最小二乘法(补救措施)
yi 0 1 xi i , i 1, 2,L n
在这一问题中,收入低的家庭.他们除了必要的支出之外剩余 较少,为了某种目的而储蓄(例如购买高档商品),因此,他们储蓄 较有规律,差异较小。收入高的家庭.除了必要支出之外剩余较多, 随意支配部分就较大,因此.他们的储蓄额的多少随意性也较大.
即储蓄额的差异较大。所以,对于家庭储蓄函数模型.随机项具有 异方差性。
第二步:处理观测值:
将某个解释变量xi的观测值按由小到大的顺序排列.然后将居 中的c个观测数据去掉,关于c的取值Goldfeld和Quandt 认为取样本 容量(n>30)的1/4为佳。再将剩余的n-c个数据分为的二组:数据较 小的为一组子样本,容量为n1,数据较大约为另一组于样本,容量 为n2。
第三步.建立回归方程求残差平方和: 对上述二组子样本观测值分别应用OLS法,建立回归方程。然 后 分 别 计 算 残 差 平 方 和 , xi 值 较 小 的 一 组 子 样 本 的 残 差 平 方 和 为 RSS1,xi值较大的一组子样本的残差平方和RSS2。 第四步.建立统计量: