异方差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所以,当模型出现异方差性时,参数OLS估计值的变 异程度增大,从而造成对Y的预测误差变大,降低预 测精度,预测功能失效。
第三节 异方差性的检验
• 检验思路: 由于异方差性就是相对于不同的解释变量 观测值,随机误差项具有不同的方差。那么: 检验异方差性,也就是检验随机误差项的 方差与解释变量观测值之间的相关性及其相关 的“形式”。
第三节 异方差性的检验
检验步骤: (1)用OLS估计计量经济模型的回归系数,求出随机误差项 i 的估计值 e (t=1,2…T) i (2)用 e i 与解释变量 X i 的不同幂次进行回归模拟。 (因为 e i 与 X i 的真实函数形式并不知道,可以用各种函数形 式去试验,从中选择最佳形式。)Glejser曾经提出一些假定 的函数形式:
(一)参数估计量非有效
OLS估计量仍然具有无偏性,但不具有有效性 因为在有效性证明中利用了 E(’)=2I 而且,在大样本情况下,尽管参数估计量具有一致 性,但仍然不具有渐近有效性。
二、异方差性的后果
以一元线性回归模型为例
在随机误差项同方差的情况下,参数的估计值的方差为
2 ˆ ) Var ( Var( 1 ki i ) ki Var (i ) 1 2 2 2 2 2 ˆ Var( 1 ) ki ki 2
~
~2 V ar ( i ) E ( ) e i
2 i
~ e i y i ( y i ) 0 ls
第三节 异方差性的检验
几种异方差的检验方法: 一、图示法
(1)用X-Y的散点图进行判断 看是否存在明显的散点扩大、缩小或复杂型趋势 (即不在一个固定的带型域中)
第三节 异方差性的检验
一、ห้องสมุดไป่ตู้方差的来源
(三)样本数据的测量误差
• 一方面,样本数据的测量误差常随时间的 推移而逐步积累,从而会引起随机误差项 的方差增加。 • 另一方面,随着时间的推移,抽样技术和 其他收集资料方法的改进,也使得样本的 测量误差逐步减少,因此引起随机误差项 的方差减小。 • 然而,经济问题的异方差性大多是递增型 的。
(X
i
X)
在随机误差项存在异方差的条件下
2 2 2 2 2 2 ˆ* Var( 1 ) ki i i ki ki
i ki k
2 i
2
k ˆ = Var( 1 ) k
i i
2
i
2
二、异方差性的后果
(二)变量的显著性检验失去意义
• 对线性回归模型参数估计值的显著性检验, 一是要通过t统计量的计算,判断参数估计 值在多大程度上代表真实参数;二是通过计 算真实参数的变动区间,用以判断参数估计 值代表真实参数的精确程度和可信度。
④在同方差性假定下,(即H0:ui为同方差; H1:ui 为异方差)构造如下满足F分布的统计量
F
~2 e2i ~2 e1i
( (
nc 2 nc 2
k 1) ~ F( k 1)
nc 2
k 1,
nc 2
k 1)
⑤给定显著性水平,确定临界值F(v1,v2), 若F> F(v1,v2), 则拒绝同方差性假设,表明存在异 方差。 当然,还可根据两个残差平方和对应的子样的顺序 判断是递增型异方差还是递减异型方差。
ki
2
2
二、异方差性的后果
ˆ 在异方差情况下,无法正确估计系数的标准误差 s ( ) i
这直接影响到t统计量值的正确确定,因为在H0 ( =0)成立 1 下, 1 的参数估计量 ˆ1 的t统计量为
其他检验也是如此。
二、异方差性的后果
(三)模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计 性质;
第二节 异方差性的来源与后果
• 一、异方差性的原因 • (一)模型中遗漏了某些解释变量
• 例如,用截面数据研究消费函数,根据绝对收 入消费原理设消费函数为Yi=0+1Xi+i • 其中Yi为家庭消费支出,Xi为家庭可支配收入 。在该模型中,物价水平Pi没有包括在解释变 量中,但它对消费支出是有影响的,该影响因 素缺被放在随机误差项中,如果物价是影响消 费的主要部分,则很可能使得随机误差的方差 变动呈现异方差性。
第一节 异方差的概念
内容提要
一、异方差的概念 二、异方差的类型 三、实际经济问题中的异方差性
第一节 异方差的概念
一、异方差性 对于模型 Y i 0 如果出现
V ar ( i ) i
2
1 X ii 2 X
2i
k X
ki
i
即对于不同的样本点,随机误差项的方差不再 是常数,而互不相同,则认为出现了异方差性 (Heteroskedasticity)。
看是否形成一斜率为零的直线
~2 ( 2 ) X - ei 的 散 点 图 进 行 判 断
~2 ei ~2 ei
X 同方差 递增异方差
X
~2 ei
~2 ei
X 递减异方差 复杂型异方差
X
第三节 异方差性的检验
二、戈德菲尔德-匡特(Goldfeld-Quandt)检验 G-Q检验是1965年提出的,以F检验为基础,适用 于样本容量较大、异方差递增或递减的情况。
二、异方差性的后果
ˆ
2
e
2 i
n2
ˆ s(1 )
ˆ ki
2
2
ˆ2
(Xi X )
2
但是,在异方差的情况下
ˆ* s( i ) ˆ ki i
2 2
ˆ i ki
2 2
ˆ ki
2
2
i ki ki
2
2
=
ˆ s(i )
i ki
第一节 异方差的概念
二、异方差的类型
同方差性假定:i2 = 常数 f(Xi) 异方差时: i2 = f(Xi) 异方差一般可归结为三种类型: (1)单调递增型: i2随X的增大而增大 (2)单调递减型: i2随X的增大而减小 (3)复 杂 型: i2与X的变化呈复杂形式
第一节 异方差的概念
G-Q检验的思想:
先将样本一分为二,对子样①和子样②分别作回归,然后利 用两个子样的残差平方和之比构造统计量进行异方差检验。
由于该统计量服从F分布,因此假如存在递增的异方差,则F 远大于1;反之就会等于1(同方差)、或小于1(递减方差)。
第三节 异方差性的检验
• 假设检验递增型异方差,大样本容量。 2 • G-Q检验的零假设为: H 0 : 12 2 T2 2 2 2 • 备择假设为: H1 :1 2 T • 对于截面样本,样本观测值可以按递增方差排列 ,检验统计量来源于去掉中间几个样本观测值后 ,将剩余观测值分成两组,各自做回归模型估计 产生的残差平方和之比。
第五章 异方差
1、异方差的概念 2、异方差的来源与后果 3、异方差检验 4、异方差的修正方法---加权最小二乘法 5、案例分析
第五章 异方差
基本假定违背:不满足基本假定的情况。主要 包括: (1)随机误差项序列存在异方差性; (2)随机误差项序列存在序列相关性; (3)解释变量之间存在多重共线性; (4)解释变量是随机变量且与随机误差项相关 (随机解释变量); 此外: (5)模型设定有偏误 (6)解释变量的方差不随样本容量的增而收敛 计量经济检验:对模型基本假定的检验
第三节 异方差性的检验
G-Q检验的步骤:
①将n对样本观察值(Xi,Yi)按观察值Xi的大小排队 ②将序列中间的c=n/4个观察值除去,并将剩下的观 察值划分为较小与较大的相同的两个子样本,每个 子样样本容量均为(n-c)/2 ③对每个子样分别进行OLS回归,并计算各自的残差 平方和
第三节 异方差性的检验
ei X i i ; ei ei 1 X
i
X i i ; ei
p
1 Xi
i
i ; e i X i i, 其 中 i 是 误 差 项 , P 是 确 定 的 常 数 。
第三节 异方差性的检验
(3)根据选择的函数形式作 e i 对 X i 的回归,用回 归所得到的 R 2 、t、F等信息判断,若通过检验的 模型,则认为存在异方差性。 (说明:不仅可以用 e i 与认为异方差有关系的一个 解释变量的不同幂次进行回归模拟,而且可以用 e i 与有可能产生异方差的多个解释变量进行回归模拟 ,用可决系数、t统计量、F统计量检验回归式是否 显著。若显著,说明随机误差项存在异方差性。
第三节 异方差性的检验
注意: (1)G-Q检验的功效取决于C的大小,但C的最优选择不明显。C 取大的数值一般F统计量会增大,很可能增加检验的功效,但 自由度的减小又会降低检验的功效。经验告诉我们比较合理的 值是:T=30 时,C=4,T=60时,C=10. (2)两个回归所用的观测值的个数是否相同并不重要,如果两 个观测值个数不同,可以通过改变自由度和统计量计算公式来 调整。 (3)这种检验是否恰当在很大程度上还依赖于我们按递增异方 差排列观测值的能力。如果方差与解释变量之一或者可能未包 含在方程中的某个外生变量直接相关,那么这种排序是合理的 ,此检验很可能证明是有用的。当观测值没有正确排序时,此 检验的功效就值得怀疑。 (4)G-Q检验是一种精确检验,不依赖于渐近特性。
第三节 异方差性的检验
问题:用什么来表示随机误差项的方差? 一般的处理方法:
首 先 采 用 OLS 法 估 计 模 型 , 以 求 得 随 机 误 差 项 的 估 计 量( 注 意 , 估 计 量 是 不 严 格 的 ) 该 ,我 们 称 之 为 近 “ 似 估 计 量 ” 用e i 表 示 。 于 是 有 ,
一、异方差的来源
(二)模型函数形式的设定误差
• 在一般情况下,解释变量与被解释变量之间 的关系是比较复杂的非线性关系。在构造模 型时,为了简化模型,用线性模型代替了非 线性关系,或者用简单的非线性模型代替了 复杂的非线性模型,造成了模型关系不准确 的误差。如将指数曲线模型误设为线性模型 ,则误差有增大的趋势。
一、异方差的来源
(四)随机因素的影响
• 经济变量本身受很多随机因素影响(比如 政策变动、自然灾害、金融危机等),不 具有确定性和重复性,同时,社会经济问 题涉及人的思维和行为,也涉及各阶层的 物质利益,人的行为有很多不确定因素。
一、异方差的来源
• (五)用分组数据来估计经济计量 模型也是产生异方差性的一个重要 来源
第三节 异方差性的检验
三、戈里瑟(Gleiser)检验 1969年戈里瑟提出的,它不但可以检验异方差是 否存在,而且可以近似探测随机误差项的方差是 怎样随解释变量的变化而变化的。 基本思想:由OLS法得到残差 e i ,取 e i 的绝对 值 ,然后将 对某个 X i回归,根据回归模 ei ei 型的显著性和拟合优度来判断是否存在异方差。
第一节 异方差的概念
三、实际经济问题中的异方差性
例:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i Yi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入
高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小 i的方差呈现单调递增型变化
第一节 异方差的概念
例:以绝对收入假设为理论假设、以截面数据为 样本建立居民消费函数: Ci=0+1Yi+I
• 如前例所显示的一般情况下,居民收入服从正 态分布:中等收入组人数多,两端收入组人数 少。而人数多的组平均数的误差小,人数少的 组平均数的误差大。因此,样本观察值的观测 误差随着解释变量的观测值的不同而不同,则 对不同的样本点,随机误差项的方差互不相等 ,从而产生了异方差性。
二、异方差性的后果
计量经济学模型一旦出现异方差性,如果仍采用 OLS估计模型参数,会产生下列不良后果:
将居民按照收入等距离分成n组,取组平均数为样 本观测值。 一般情况下,居民收入服从正态分布:中等收入 组人数多,两端收入组人数少。而人数多的组平均 数的误差小,人数少的组平均数的误差大。 所以样本观测值的观测误差随着解释变量观测值 的不同而不同,往往引起异方差性。
第一节 异方差的概念
例:以某一行业的企业为样本建立企业生产函数模 型 Yi=Ai1 Ki2 Li3ei 被解释变量:产出量Y 解释变量:资本K、劳动L、技术A, 那么:每个企业所处的外部环境对产出量的影响被 包含在随机误差项中。 每个企业所处的外部环境对产出量的影响程度不同 ,造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量观 测值的变化而呈规律性变化,呈现复杂型。