异方差性的概念、类型、后果、检验及其修正方法含案例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.变量的显著性检验失去意义
在变量的显著性检验中,t统计量
(j=0,1,2,…,k)
如果出现了异方差性,而仍按同方差时的公式计算t
统计量,将使t统计量失真【偏大或偏小,见第三版P110补 充说明】,从而使t检验失效【使某些原本显著的解释变量
可能无法通过显著性检验,或者使某些原本不显著的解释变量
可能通过显著性检验】。
– 以教材P118的例子为例,包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”的输出结果为 :
路漫漫其修远兮, 吾将上下而求索
怀特 检验 的软 件输 出界 面:
路漫漫其修远兮, 吾将上下而求索
可见,怀特统计量nR2=20.55085【=31 ×0.662931】,大于自由度【也即辅 助回归方程中解释变量的个数】为5的 2分布临界值11.07,因此,在5%的显 著性水平下拒绝同方差的原假设。
路漫漫其修远兮, 吾将上下而求索
(教材P111)
看是否形成一条斜率为零的直线。
路漫漫其修远兮, 吾将上下而求索
3.戈里瑟(Gleiser)检验与帕克(Park)检验 • 戈里瑟检验与帕克检验的思想:
如果存在某一种函数形式,使得方程显著成立,则说明原 模型存在异方差性。 由于f(Xj)的具体形式未知,因此需要选择各种形式进行试验。
注意:对于每一个样本点i,随机误差项i都是随机变量,服
从均值为0的正态分布;而方差i2衡量的是随机误差项围绕其 均值0的分散程度。所以,所谓异方差性,是指这些服从正态
分布的随机变量围绕其均值0的分散程度不同。
路漫漫其修远兮, 吾将上下而求索
Fra Baidu bibliotek
概率密度
或者,也可以说,对于每一个样本点i,随机误差项的方差i2衡 量的是被解释变量的观测值Yi围绕回归线E(Yi)=0+1Xi1+…+kXik 的分散程度。而所谓异方差性,是指被解释变量观测值的分散 程度随样本点的不同而不同。 【庞皓P130】
例4.1.1: 在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中,i的同方差假定往往不符合实际情况。对高收 入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律 性(如为某一特定目的而储蓄),差异较小。
因此,i的方差往往随Xi的增加而增加,呈单调递增型变化 。
路漫漫其修远兮, 吾将上下而求索
则在同方差性假设下【也即H0:1=…= 5=0 】,该辅助回归 方程的可决系数R2与样本容量n的乘积渐近地服从自由度=辅 助回归方程中解释变量个数【该例= 5】的2分布:
路漫漫其修远兮, 吾将上下而求索
怀特(White)检验的EViews软件操作要点
• 在OLS的方程对象Equation中,选择View/Residual tests/White Heteroskedasticity。
路漫漫其修远兮, 吾将上下而求索
4.戈德菲尔德-匡特(Goldfeld-Quandt)检验
G-Q检验以F检验为基础,仅适用于样本容量较大、 异方差为单调递增或单调递减的情况。
G-Q检验的思想: 先按某一被认为有可能引起异方差的解释变量对样 本排序,再将排序后的样本一分为二,对子样本①和 子样本②分别进行OLS回归,然后利用两个子样本的 残差平方和之比构造F统计量进行异方差检验。
路漫漫其修远兮, 吾将上下而求索
怀特(White)检验的基本思想与步骤
• 下面,以二元回归为例,说明怀特检验的基本思想与步骤: 设回归模型为:
首先,对该模型做普通最小二乘回归,记残差为:
然后,以上述残差的平方为被解释变量,以原模型中各解释 变量的水平项、平方项(还可以有更高次项)、交叉项等各 种组合为解释变量,做如下的辅助回归:
路漫漫其修远兮, 吾将上下而求索
二、异方差性的后果
1.参数估计量非有效
• 当计量经济学模型出现异方差性时,其普通最小二乘法参 数估计量仍然具有无偏性,但不具有有效性。而且,在大样 本情况下,参数估计量仍然不具有渐近有效性。
因为在有效性证明(见教材P70-71)中利用了
即同方差和无序列相关条件。
路漫漫其修远兮, 吾将上下而求索
i=1,2,…,n
这就是加权最小二乘法。 在这里,权数为
。
注意:将这里的权数平方之后,才是对残差平方加权的权数。
路漫漫其修远兮, 吾将上下而求索
• 【第三版P114补充】可见,实施加权最小二乘法的关 键是寻找适当的“权”,或者说寻找模型中随机干扰项 的方差与解释变量间的适当的函数形式。
• 如果发现
如果样本观测值的观测误差构成随机误差项的主要部分,那 么对于不同的样本点,随机误差项的方差随着解释变量观测值 的增大而先减后增(U形),出现了异方差性。
路漫漫其修远兮, 吾将上下而求索
例4.1.3:以某一行业的企业为样本建立企业生产函数模型
Yi=Ai1 Ki2 Li3ei
产出量为被解释变量,选择资本、劳动、技术等投入要素 为解释变量,那么每个企业所处的外部环境对产出量的影 响被包含在随机误差项中。
– 例如:在递增的异方差下,与较小的Xi对应的Yi离回归线 较近,残差ei较小;而与较大的Xi对应的Yi离回归线较远, 残差ei较大。为了更可靠地估计总体回归函数,我们应该给 那些紧密围绕其(总体)均值的观测值较大的权数,而给 那些远离其均值的观测值较小的权数。——古扎拉蒂P355
路漫漫其修远兮, 吾将上下而求索
路漫漫其修远兮, 吾将上下而求索
例4.1.2:以绝对收入假设为理论假设、以分组数据( 将居民按照收入等距离分成n组,取组平均数为样本观 测值)作样本建立居民消费函数:
Ci= 0+1Yi+i
一般情况下:居民收入服从正态分布,处于中等收入组中 的人数最多,处于两端收入组中的人数最少。而人数多的组 平均数的误差小,人数少的组平均数的误差大。所以样本观 测值的观测误差随着解释变量观测值的增大而先减后增。
– 在选项中,EViews提供了包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”和没有交叉项的怀特检 验“White Heteroskedasticity(no cross terms)” 这样两个 选择。
• 软件输出结果:最上方显示两个检验统计量:F统计 量和White统计量nR2;下方则显示以OLS的残差平 方为被解释变量的辅助回归方程的回归结果。
异方差性的概念、类型 、后果、检验及其修正
方法含案例
路漫漫其修远兮, 吾将上下而求索
2020年4月13日星期一
一、异方差性的概念及类型
1.什么是异方差?
对于模型
(i=1,2,…,n)
同方差性假设为
(i=1,2,…,n)
如果出现
(i=1,2,…,n)
即对于不同的样本点i ,随机误差项的方差不再是常数,则认 为出现了异方差性。
四、异方差的修正
1. 加权最小二乘法(weighted least squares )
2. 异方差稳健标准误法( heteroscedasticity – robust standard error)
路漫漫其修远兮, 吾将上下而求索
(一)加权最小二乘法
1.加权最小二乘法的基本思想
• 加权最小二乘法(Weighted Least Squares ):是对原 模型加权,使之变成一个新的不存在异方差性的模型 ,然后采用普通最小二乘法估计其参数。
吾将上下而求索
3.一般情况(只需了解其思想。第三版已删掉,跳过)
对于模型 Y=XB+N 如果存在
其中
即存在异方差性:Var(i)=2wi (i=1,2,…,n)
补充:设A为一个实系数对称矩阵,如果对任何一个非零实向量 X,都使二次型X’AX正定(也即大于0),那么A称为正定矩阵 。 路漫漫其修远兮,
• 于是,我们可以
对较小的残差平方ei2赋予较大的权数, 对较大的残差平方ei2赋予较小的权数。
• 加权最小二乘法就是对加了权重的残差平方和 实施OLS法:
→ 最小
路漫漫其修远兮, 吾将上下而求索
2.一个例子(重要! )
• 例如:如果在检验过程中已经知道:
路漫漫其修远兮, 吾将上下而求索
在该模型中,存在 即满足同方差性。
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
【书上这句话有点问题】
其中 所以,当模型出现异方差性时,Y预测区间的建立将发生困 难,它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验(教材P111)
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值,
路漫漫其修远兮, 吾将上下而求索
G-Q检验的步骤:
①将n对样本观察值(Xi1, Xi2, …,Xik,Yi)按某一被认为有 可能引起异方差的解释变量观察值Xij的大小排队。
②将序列中间的c=n/4个观察值除去,并将剩下的观 察值划分为较小与较大的容量相同的两个子样本, 每个子样本的样本容量均为(n-c)/2 。
路漫漫其修远兮, 吾将上下而求索
• 异方差一般可以归结为三种类型:
(1)单调递增型: i2=f(Xi)随Xi的增大而增大; (2)单调递减型: i2=f(Xi )随Xi的增大而减小; (3)复杂型: i2=f(Xi )随Xi的变化呈复杂形式。
路漫漫其修远兮, 吾将上下而求索
3.实际经济问题中的异方差性
异方差性示意图
路漫漫其修远兮, 吾将上下而求索
2.异方差的类型
• 同方差性假定是指,每个i围绕其0均值的方差
并不随解释变量Xi的变化而变化,不论解释变量 的观测值是大还是小,每个i的方差保持相同,
即 i2 =常数 (i=1,2,…,n)
• 在异方差的情况下,i2已不是常数,它随Xi的
变化而变化,即 i2 =f(Xi) (i=1,2,…,n)
(1)用X-Y的散点图进行判断(李子奈P108)
看是否存在明显的散点扩大、缩小或复杂型 趋势(即不在一个固定的带型域中)。
随机误差项的 方差描述的是 取值的离散程 度。而由于被 解释变量Y与随 机误差项有相 同的方差,所 以利用Y与X之 间的相关图形 也可以粗略地 看出的离散程 度与X之间是否 有相关关系。
(注意:其中的2完全可以是1)
• 那么,加权最小二乘法的“权”即为
注意:这里的“权”仍然是指用来乘原模型两边的“权”,相当于对 原模型的残差ei加权。将这里的权数平方之后,才是对原模型的 路漫残漫其修差远兮平, 方ei2加权的权数。
吾将上下而求索
补充
• 特别地,如果像教材P111(4.1.4)式那样,近似地有
• 那么,可以用
作为权数,去乘原模型的
两边,得到下面的模型:
• 该模型满足同方差性,可以用普通最小二乘法估计:
路漫漫其修远兮, 吾将上下而求索
i=1,2,…,n
• Eviews软件中的加权最小二乘法(WLS)正是这样 设计的: (★)
所以,Eviews软件中WLS法的“权”,是指对原模型两边加权的 路漫漫其“修权远兮”,,而不是对原模型的残差平方ei2加权的权数。
随机误差项具有不同的方差,那么: 检验异方差性,也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于:用什么来表示随机误差项的方差? 一般的处理方法:
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
H0成立,意味着同方差; H1成立,意味着异方差。
⑥检验。给定显著性水平,确定F分布表中相应的临界值 F(1,2)。
若F≥F(1,2),则拒绝H0,认为存在异方差; 反之,则不存在异方差。
路漫漫其修远兮, 吾将上下而求索
5.怀特(White)检验
• G-Q检验需按某一被认为有可能引起异方差的解释变 量对样本排序,而且只能检验单调递增或单调递减型 异方差;怀特(White)检验则不需要排序,且对任何 形式的异方差都适用。
由于每个企业所处的外部环境对产出量的影响程度不同, 造成了随机误差项的异方差性。
这时,随机误差项的方差并不随某一个解释变量观测值 的变化而呈规律性变化,为复杂型的一种。
路漫漫其修远兮, 吾将上下而求索
规律
• 一般经验告诉人们:对于采用截面数据作样本 的计量经济学问题,由于在不同样本点(即不 同空间)上解释变量以外的其他因素的差异较 大,所以往往存在异方差性。