第三章(09异方差)
B09异方差
▪ 以三变量模型 Yi 0 1 X1i 2 X 2i ui 为例。 ▪ (1)做OLS回归得到残差 uˆ i 。 ▪ (2)做辅助回归:
uˆ i2
0
1 X1i
2X2i
3
X
2 1i
4
X
2 2i
5 X1i X 2i
vi
▪ 得到 R2 。也可以加入原始变量的更高次幂。
▪ (3)在无异方差的虚拟假设下, nR2 近似服
9
计量经济学
▪ 2、格莱泽检验(Glejser Test):思想上类似 于帕克检验。
▪ 格莱泽建议,用OLS回归的残差的绝对值对被 认为与密切相关的变量X做回归。
▪ 他使用了如下几种函数形式:
uˆi Xi vi
uˆi Xi vi
uˆi / Xi vi
10
计量经济学
▪ 如果 表现为统计上显著异于0,就表明数据
差的。
▪ (2)非纯异方差:由于错误设定模型的误差项
所导致的异方差。
▪ (3)在对异方差进行检验和补救之前,首先要
确认模型是正确设定的。
2
计量经济学
Y的条件 分布
Y的条件方差 随着X而增大
教材210页图9-5a是另 一种形式的异方差
3
计量经济学
▪ 2、异方差产生的原因: ▪ (1)按照边干边学模型,人们在学习的过程中
计量经济学
第九章 异方差
▪ 第1节 异方差的性质与影响 ▪ 第2节 异方差的诊断 ▪ 第3节 异方差的补救措施
▪ 教学时数:4
1
计量经济学
第1节 异方差的性质与影响
▪ 一、异方差的性质
▪ 1、异方差:误差的条件方差(即因变量的条件
方差)随着自变量的变化而变化,即
第三章异方差和自相关
2
第一节 异方差的介绍
一、异方差的定义及产生原因
▪ 异方差(heteroscedasticy)就是对同方差假设 (assumption of homoscedasticity)的违反。经典 回归中同方差是指随着样本观察点X的变化 i ,线 性模型中随机误差项 的方差并不改变,保持为
▪ 对每一个回归模型,计算残差平方和:记 值较小的一组子样本的残差平方和为 RSS1
= 1i2 ,xi 值较大的一组子样本的残差平
方和为 RSS2 = 2i2 。
13
▪ 第三步,建立统计量。
▪ 用所得出的两个子样本的残差平方和构成F统 计量:
F
2i
2
/(
n
2
d
1i
2
/(
n
2
d
k 1) k 1)
用OLS法。对 进行t检验,如果不显著,则没
有异方差性。否则表明存在异方差。 ▪ Park检验法的优点是不但能确定有无异方差性,
而且还能给出异方差性的具体函数形式。但也有
质疑,认为 仍可vi 能有异方差性,因而结果的真
实性要受到影响。
20
(四)Glejser检验法
▪ 这种方法类似于Park检验。首先从OLS回归取得
7
一、图示法
▪ 图示法是检验异方差的一种直观方法,通常有下 列两种思路:
▪ (一)因变量y与解释变量x的散点图:若随着x 的增加,图中散点分布的区域逐渐变宽或变窄,
或出现了偏离带状区域的复杂变化,则随机项可 能出现了异方差。
▪ (与x二的)散残点差图图,。或残者差在图有即多残个差解平释方变ˆ量i(2 时i2的可估作计残值)
异方差
注意: 辅助回归仍是检验与解释变量可能的组合的 显著性,因此,辅助回归方程中还可引入解释变 量的更高次方。 如果存在异方差性,则表明确与解释变量的 某种组合有显著的相关性,这时往往显示出有较 高的可决系数以及某一参数的t检验值较大。 当然,在多元回归中,由于辅助回归方程中 可能有太多解释变量,从而使自由度减少,有时 可去掉交叉项。
④在同方差性假定下,构造如下满足F分布的 统计量
~ 2 ( n c k 1) e2i 2 nc nc F ~ F( k 1, k 1) 2 2 ~ 2 ( n c k 1) e1i 2
⑤给定显著性水平,确定临界值F(v1,v2), 若F> F(v1,v2), 则拒绝同方差性假设, 表明存在异方差。 当然,还可根据两个残差平方和对应的 子样的顺序判断是递增型异方差还是递减异 型方差。
Example of Heteroskedasticity
f(y|x)
.
x1 x2 x3
.
.
E(y|x) = 0 + 1x
x
二、异方差的类型
同方差:i2 = 常数 f(Xi) 异方差: i2 = f(Xi)
异方差一般可归结为三种类型: (1)单调递增型: i2随X的增大而增大 (2)单调递减型: i2随X的增大而减小 (3)复 杂 型: i2与X的变化呈复杂形式
1
1 f ( X ji )
X 1i 2
1 f ( X ji )
X 2i
k
1 f ( X ji )
X ki
1 f ( X ji )
i
在该模型中,存在
1 Var ( i ) E( i ) E ( i ) 2 2 f ( X ji ) f ( X ji ) f ( X ji )
09_异方差
估计系数的方差也是有偏的。 (6)因此,建立在 t 分布和 F 分布之上的置信区间和假设检验是 不可靠的。 如果仍用传统的假设检验方法, 则有可能得出错误的结论。 总之, 在存在异方差的情况下, 通常所用的假设检验已经不再可 靠,因为有可能得出错误的结论。
ˆ做 对其相应的一个或多个解释变量做图,或是对因变量的拟合值 Y i
图。 我们已看到了图 11-4,该图描绘了从回归方程 (11-3)中所得的残 差与销售的关系。从图中可以看出,残差的(绝对)值随销售量的增 加而增加。因此,数据中可能存在着异方差。 有时我们不是将残差对销售描图, 而是将残差的平方 ei2 对销售做 它经常可以用前者来替代后者, 尤其对大样本。 图。 尽管 ei2 与 ui2 不同,
异方差。 R&D 一例中 ei2 对 X 的散点图:
图 11-7 中图 11-6 (b)很相似,这清楚地表明了残差平方与销售是 系统相关的。该散点图表明在 R&D 回归方程(11-3)中可能存在异方 差问题。 3 帕克检验(Park test) , 帕克检验实际上是要验证以下回归方程是否成立 (对一元回归模 型而言) :
其中,应变 Y 是个人储蓄,解释变量 X 是个人可支配收人或税后收 人(PDI)。 研究人员发现,异方差问题多存在于横截面数据(cross-sectional data)中而非时间序列数据。在横截面数据中,我们通常处理的是一 定时间点上总体单位, 例如个别消费者或是其家庭成员、 公司、 行业, 或者区域上分区、县、州或城市等等。而且,这些单位具有不同的规 模,如小公司、中等公司或者大公司,或是低收人、中等收人或高收 入。换言之,可能存在着规模效应(scale effect) 。而在时间序列数据 中, 变量趋于具有相似的数量等级, 因为我们通常收集某一时期同一
B09 异方差
计量经济学
EViews 6 中的异方 差检验
14
计量经济学
第3节
2 i
异方差的补救措施
一、σ 已知时
1、加权最小二乘法(WLS):对原始变量加权, 、加权最小二乘法 :对原始变量加权, 转换成满足经典假设的转换变量,再使用OLS。 转换成满足经典假设的转换变量,再使用 。 (1)通过加权最小二乘法得到的估计量称为 ) WLS估计量,WLS估计量是 估计量, 估计量是BLUE。 。 估计量 估计量是 (2)存在异方差时,WLS的使用程序:假设 )存在异方差时, 的使用程序: 相异的方差为 σ i2 ,将模型两边除以 σ i ,得
12
计量经济学
(5)怀特检验既可能是对纯异方差的检验,也 )怀特检验既可能是对纯异方差的检验, 可能是对设定偏误的检验,或者二者兼有。 可能是对设定偏误的检验,或者二者兼有。 如果怀特检验中没有出现交叉项,则是对纯异 如果怀特检验中没有出现交叉项,则是对纯异 方差的检验 如果出现交叉项,则既是对异方差 的检验; 异方差的 方差的检验;如果出现交叉项,则既是对异方差的 检验又是对设定偏误的检验。 设定偏误的检验 检验又是对设定偏误的检验。 优点: (6)怀特检验的优点:不要求假定异方差的形 )怀特检验的优点 不依赖于正态性假定,且易于实施。 式,不依赖于正态性假定,且易于实施。 问题: (7)怀特检验存在的问题:辅助回归模型回归 )怀特检验存在的问题 元过多将会消耗许多的自由度。 元过多将会消耗许多的自由度。 EViews 5中的怀特检验:View/Residual 中的怀特检验: 中的怀特检验 Tests/White Heteroskedasticity Test …
20
计量经济学
误差方差 与X的平方 的平方 成比例
异方差
(*)
2011-1-24
中山大学南方学院经济系
10
怀特检验的原假设: 怀特检验的原假设: H0: Var (ε i ) = σ 2 ,所有的方差都相同,不存在 异方差 备择假设: H1:方差不相同,存在异方差。
2011-1-24
中山大学南方学院经济系
11
判断方法: 判断方法:
所对应的p值 比较 n*R-squared所对应的 值,判断 所对应的 方法与t、 检验是一致的 检验是一致的。 方法与 、F检验是一致的。 P值小于允许的误差,则拒绝原假设,方程 存在异方差; P值大于允许的误差,则接受原假设,方程 不存在异方差。
2011-1-24
中山大学南方学院经济系
9
2、怀特(White)检验 怀特( )
怀特检验不需要排序,且适合任何形式的异方差 怀特检验的基本思想与步骤(以二元为例): 怀特检验的基本思想与步骤 Yi = β 0 + β 1 X 1i + β 2 X 2i + µ i 然后做如下辅助回归
2 ~ ei 2 = α 0 + α 1 X 1i + α 2 X 2i + α 3 X 12i + α 4 X 2i + α 5 X 1i X 2i + ε i
2011-1-24
中山大学南方学院经济系
7
五、异方差性的检验
检验思路: 检验思路:
由于异方差性就是相对于不同的解释变 由于异方差性就是相对于不同的解释变 异方差性 量观测值,随机误差项具有不同的方差。 量观测值,随机误差项具有不同的方差。那 么: 检验异方差性,也就是检验随机误差项 检验异方差性, 的方差与解释变量观测值之间的相关性及其 相关的“形式” 相关的“形式”。
9 异方差
假设的 ei2 模式
例9-2中残差(e)平方与各个解释变量之间的散点图:
1400 1200 1000
1400 1200 1000
RES^2
600 400 200 0 0 4 8 12 EDUC 16 20
RES^2
800
800 600 400 200 0 0 10 20 30 EXPER 40 50 60
第九章 异方差
上海立信会计学院
主要内容: 1.异方差的性质 2.异方差的后果 3.异方差的诊断 4.异方差的补救措施
总体回归函数中随着解释变量的变化,随机误差项的方差不变,这
称为同方差性。而如果随着解释变量的变化,随机误差项的取值不同, 则称为异方差性。
一、异方差
不同观测期的随机误差项具有不同的方差称之为异方差。
ln ei2 B1 B2 ln X i vi
2
(3)
(4)检验零假设 B 0 ,即不存在异方差。如果 ln X i 和 ln ei2 之 间是统计显著的,则拒绝零假设,即存在异方差。
例子:利用“工资决定”一例来说明帕克检验。把从该回归方程中得 到的残差用于模型(3),得到如下结果:
异方差用数学公式可表示为:Var (u ) 2 常数 i i
异方差的来源:研究发现,异方差问题多存在于截面数据(crosssectional data)而非时间序列数据。
例如:在一个双变量线性回归模型中,应变量Y是个人储蓄,解释变量X是个人 可支配收入或税后收入(PDI)。画出Y的方差如下图:
ln Yi B1 B2 ln X i ui 这种变换可以在一定程度上消除异方差。因为对数变换压缩 了变量的度量程度,把两个变量值间的10倍差异缩小为2倍 差异。
异方差知识点
异方差知识点异方差是统计学中一个重要的概念,指的是随机变量的方差并不保持恒定,而是随着自变量的变化而变化。
异方差的存在可能会对数据分析和模型建立产生影响,因此了解异方差的知识点是非常重要的。
在统计学中,常常使用方差来衡量随机变量的离散程度。
方差越大,表示数据的离散程度越大,反之,方差越小,表示数据的离散程度越小。
然而,在某些情况下,方差并不是一个常数,而是随着自变量的变化而变化。
这就被称为异方差。
为了更好地理解异方差,我们可以通过以下几个步骤进行思考:1.了解方差:首先,我们需要了解方差的概念。
方差是一种衡量随机变量离散程度的统计量,计算方法是将每个观测值与均值的差平方后求和再除以观测值的个数。
2.理解异方差:异方差表示随机变量的方差并不保持恒定,而是随着自变量的变化而变化。
这意味着随机变量的离散程度可能在不同的自变量取值下有所不同。
3.检测异方差:为了检测数据中是否存在异方差,我们可以使用一些统计方法。
例如,我们可以绘制残差图,检查残差的方差是否随着自变量的变化而变化。
另一种方法是利用统计模型的诊断工具,如BP检验或White检验。
4.处理异方差:如果数据中存在异方差,我们需要采取相应的措施来处理。
常用的方法包括变量转换和加权最小二乘法。
变量转换可以通过对自变量或因变量进行对数化、平方根转换等方式来减小异方差的影响。
加权最小二乘法则是通过给数据赋予不同的权重来在拟合模型时考虑异方差的影响。
5.模型评估:在处理异方差后,我们需要重新评估模型的拟合效果。
通常,我们可以使用修正后的判定系数(如调整R方)来评估模型的拟合效果。
异方差是统计学中一个重要的概念,对于数据分析和模型建立都有一定的影响。
理解异方差的知识点能够帮助我们更好地处理实际问题中的数据,并建立更准确的模型。
在实际应用中,如果我们发现数据中存在异方差,我们应该采取相应的方法来处理,以确保模型的准确性和可靠性。
03第三章 异方差性和自相关PPT课件
10
【例1】按照差错—学习模式,当人们学 习时,动作上出现的差错随时间的增加 而逐渐减少。如在某一时期内测验打字 差错数(Y)与打字实习小时数(X)之 间的关系。随着打字实习小时数的增加 ,打字差错平均字数及它们的方差不是 不变的,而是随之减少的。这个模型中 就出现了异方差。
31.07.2020
11
31.07.2020
19
31.07.2020
20
3.回归方程的应用效果极不理想,或者 说模型的预测失效。
一方面,由于上述后果,使得模型
不具有良好的统计性质;另一方面,在
预测值的置信区间中也包含有随机误差
项共同的方差
2 u
。所以,当模型出现
异方差性时,它的预测功能失效。
31.07.2020
数结果较好,F检验结果明显显著;
表明该模型的估计效果不错,可以认为人口数量
每增加1万人,平均说来医疗机构将增加5.3735个。
然而,这里得出的结论可能是不可靠的,平均说来每 增加1万人口可能并不需要增加这样多的医疗机构, 所得结论并不符合真实情况。
有什么充分的理由说明这一回归结果不可靠呢?更为 接近真实的结论又是什么呢?
31.07.2020
16
当模型中存在异方差时,估计量 ˆ 的方 差将大于在同方差条件下的方差。如果用 普通最小二乘法估计参数,将出现低估 ˆ 的真实方差的情况。进一步将导致回归系 数的检验值高估,可能造成本来不显著的 某些回归系数变成显著。这将给回归方程 的应用效果带来一些影响。
31.07.2020
【例2】在研究城镇居民收入与消费的关 系时,我们知道居民收入与消费水平有着
密切的关系。用 Xi 表示第 i 户的收入,
Yi 表示第 i 户的消费额,那么反映收入与
异方差课件
4 异方差的修正方法(WLS)
(2)利用Glejser检验结果确定异方差形式,消除异方差
假设 Glejser 检验结果是
| uˆt | = aˆ0 + aˆ1 xt
说明异方差形式是 Var(ut) = ( aˆ0 + aˆ1 xt)22。用 ( aˆ0 + aˆ1 xt) 除原模型各项,
SSR2 SSR1
•
n1 n2
k k
,k为模型中被估参数个数
在H0成立条件下,F F(n2 - k, n1 - k)
④ 判别规则如下,
若 F F (n2 - k, n1 - k), 接受H0(ut 具有同方差) 若 F > F(n2 - k, n1 - k), 拒绝H0(递增型异方差) 注意:
异方差通常有三种表现形式,(1)递增型,(2)递减型,(3)条件自回
归型。 7
6
Y 6
4
DJ P Y
5
2
4
0
3
-2
2
-4
1
-6
0 20 40 60 80 100 120 140 160 180 200
-8 400 500 600 700 800 900 1000 1100 1200
2 异方差来源与后果
① 当摸型含有多个解释变量时,应以每一个解释变量为基准检验异方差。
② 此法只适用于递增型异方差。
③ 对于截面样本,计算F统计量之前,必须先把数据按解释变量的值排序。
3 异方差检验
(2) White检验
White检验由H. White 1980年提出。White检验不需要对观测值排序,也不
《异方差性》课件
03
异方差性的后果
模型预测的准确性下降
异方差性会导致模型的预测值偏 离真实值,降低预测的准确性。
在异方差性存在的情况下,模型 的预测结果可能变得不可靠,因 为模型没有充分考虑到数据的不
确定性。
异方差性可能导致模型在预测新 数据时表现不佳,因为模型没有 充分学习到数据的内在结构和变
化规律。
模型推断的可靠性降低
详细描述
社会数据在不同群体之间的分布往往存在显著的差异,这种差异反映了不同群体之间的异方差性。这 种异方差性可能与社会经济地位、文化背景等多种因素有关,需要深入分析其产生的原因和影响。
社会数据的异方差性分析
总结词
异方差性对社会政策制定和实施具有重 要影响。
VS
详细描述
社会政策的制定和实施需要考虑不同群体 的差异和特点,而异方差性的存在为社会 政策的制定提供了重要的参考信息。通过 对异方差性的分析和研究,我们可以更好 地了解不同群体的需求和诉求,制定更为 公正和有效的社会政策。
总结词
金融数据的异方差性分析有助于提高投资策略的有效性。
详细描述
通过对金融数据的异方差性进行分析,投资者可以更好地 理解市场的波动规律和风险特征,从而制定更为有效的投 资策略。这种基于异方差性的投资策略能够更好地适应市 场的变化,提高投资的收益和风险控制能力。
社会数据的异方差性分析
总结词
社会数据在不同群体之间存在显著的异方差性。
平方根变换
当数据分布不均,特别是偏度较大时,平方根变换可以改善数 据的正态性。
Box-Cox变换
是一种通用的数据变换方法,通过选择一个适当的λ值,使数据 达到最佳的正态分布状态。
模型选择和调整
混合效应模型
异方差知识点总结
异方差知识点总结异方差的存在可能会导致回归模型下列问题:1. 预测的不确定性增加:当异方差存在时,回归模型的预测区间可能会变得更宽,因为方差的不稳定性会使得预测更加不确定。
2. 参数估计的失真:在存在异方差的情况下,最小二乘法(OLS)回归的方法可能会导致参数估计的偏误。
3. 统计推断的失真:在存在异方差时,通常使用的标准误差可能被低估或高估,从而影响统计推断的结果。
因此,我们有必要了解异方差的特征、检验方法和处理方法。
本文将从以下几个方面对异方差进行总结。
一、异方差的特征和识别方法二、检验异方差的统计方法三、处理异方差的方法一、异方差的特征和识别方法1. 异方差的特征异方差的特征主要包括两个方面:方差的不稳定性和误差项的相关性。
首先是方差的不稳定性,即随着自变量的变化,因变量的方差也会跟着变化。
这种不稳定性可能出现在回归模型的残差中,表现为残差的离散程度随着自变量的变化而变化。
其次是误差项的相关性,即自变量与误差项之间存在相关性。
这种相关性可能是由于遗漏变量、测量误差或其他未知因素导致的,而这种相关性可能会影响到回归模型的假设前提,从而影响到参数的估计和统计推断的结果。
2. 异方差的识别方法在实际应用中,我们可以通过以下几种方法来识别是否存在异方差:(1)绘制残差图:同时绘制残差与预测值的散点图和残差与自变量的散点图,观察残差的离散程度是否与自变量相关。
(2)利用统计检验:利用统计学中的异方差检验方法,如BP检验、White检验等。
(3)利用经验判断:在经验分析中,我们也可以通过观察实际数据的特征,来判断是否存在异方差。
比如,如果数据中存在明显的带状结构或呈现出明显的异方差现象,那么可能存在异方差问题。
二、检验异方差的统计方法1. BP检验BP检验是一种常用的异方差检验方法,它的原假设是误差的方差是恒定的,备择假设是误差的方差是非恒定的。
BP检验的具体步骤为:(1)先对相关变量进行回归分析,得到残差eˆ2;(2)在残差的平方的基础上,增加自变量的平方和自变量与自变量的乘积,得到新的残差变量;(3)利用新的残差变量进行正态性检验,判断残差是否服从正态分布;(4)最后,利用新的残差变量进行F检验,检验自变量的平方及其交叉项是否显著。
异方差的概念
一、异方差的概念
对于模型
Yi 0 1X1i 2 X 2i k X ki ui
如果出现
Var(ui ) i2
即对于不同的样本点,随机误差项的方差不再 是常数,而互不相同,则认为模型出现了异方 差性(Heteroskedasticity)。
第2页/共9页
概
率
密
Y
度
X1
X2
X3
X
异方差性干扰
第3页/共9页
存在异方差时U的方差 协方差矩阵为:
2 1
Var U E
UU '
0
0
2 2
0
0
0
0
2 T
主对角线上的元素不完全相同。
第4页/共9页
二、异方差的类型
同方
差性
假
定
:
2 i
=Leabharlann 常数f(Xi)异方差时:
2 i
=
f(Xi)
异方差一般可归结为三种类型:
第8页/共9页
感谢您的观看。
第9页/共9页
第7页/共9页
例5.2:截面资料下研究企业的成本函数
Yi 0 1Xi ui
Yi : 第i个企业的生产成本; Xi : 第i个企业的总产值 生产规模较大的企业:生产成本的差异较大 生产规模较小的企业:生产成本的差异较小 生产规模较大企业的随机误差项的方差比生产规 模较小企业的大,模型出现了异方差。
(1)单调递增型: i2随X的增大而增大; (2)单调递减型: i2随X的增大而减小; (3)复 杂 型: i2与X的变化呈复杂形式。
第5页/共9页
图5.1 异方差的类型
第6页/共9页
三、实际经济问题中的异方差性
异方差定义及检验
回归模型的预测
预测精度下降
异方差会导致回归模型的预测精度下降,使得预测值与实际 值之间的差距增大。
预测区间的不准确
异方差会影响预测区间的准确性,使得预测区间不能准确反 映实际结果的分布情况。
回归模型的应用
模型应用的限制
异方差的存在限制了回归模型的应用 范围,使得模型在某些情况下无法适 用。
模型解释性的降低
异方差产生的原因
数据特性
01
数据本身的特性可能导致异方差的出现,如数据异常值、非线
性和非正态分布等。
模型设定不当
02
模型设定不准确或者过于简单可能导致异方差的出现,如线性
回归模型未考虑非线性关系或者遗漏重要解释变量等。
样本误差
03
样本误差也可能导致异方差的出现,如样本选择偏差、测量误
差等。
02
异方差检验方法
异方差会影响回归模型的解释性,使 得模型在解释自变量对因变量的影响 时变得困难。
04
如何处理异方差
方差齐性变换
01
对数变换
将原始数据取对数,可以使得数 据更接近正态分布,从而减少异 方差的影响。
平方根变换
02
03
Box-Cox变换
对原始数据取平方根,也可以在 一定程度上减少异方差。
Box-Cox变换是一种更加通用的 方法,通过选择一个适当的λ值, 使得变换后的数据满足方差齐性。
VS
详细描述
通过对经济增长数据进行异方差检验,可 以了解各国或地区经济增长的非平稳性和 非线性特征,进而为政策制定和经济预测 提供依据。常用的检验方法包括单位根检 验、协整检验和误差修正模型等。
感谢观看
THANKS
异方差定义及检验
异方差
异方差§1 异方差的含义一、异方差的定义设模型为01122i i i k ki i Y X X X u ββββ=+++++如果扰动项的方差随着ji X 的变动而变动,即2()i i Var u σ=则称随机扰动项i u 存在异方差。
二、异方差的两种常见模式⒈方差随着某个解释变量的增加而增加⒉方差随着某个解释变量的增加而下降§2 异方差的产生原因和后果一、异方差的产生原因(一)设定偏误——解释变量的缺失,函数形式不正确 例:真实模型:01122i i i i Y X X u βββ=+++错误模型:011i i i Y X v ββ=++则 22i i i v X u β=+()i Var v 会随着2i X 的变化而变化(二)样本数据的观测误差随着时间的推移 () () i i Var u Var u ⎧↑⎪⎨↓⎪⎩观测误差累积观测技术提高 三、异方差的影响(以一元线性回归为例)(一)参数估计量仍然是线性无偏的(二)参数估计量不再具有最小方差性(OLS 低估真实方差)(三)解释变量显著性检验失效11111ˆˆ ()()ˆt t ˆ ()Var Se t Se ββββ⇒⇒⇒=⇒⇒低估真实方差被低估被低估检验显著性检验被高估被夸大失效 §3 异方差的判断一、直观判断――残差的图形检验222X X X i i i e e e ⎧⎪⎨⎪⎩用对作图与之间存在有规律的变化---异方差与之间不存在有规律的变化--同方差二、残差分段对比――Goldfeld-Quant 检验更正:22222211(1)2[(1),(1)]22(1)2ii i i e k e n c n c F F k k e e n c k -+--==-+-+--+∑∑∑∑三、用残差绝对值或残差平方为因变量作辅助回归(一)Glejser 检验用残差绝对值对解释变量或解释变量的函数回归(二)White 检验用残差平方对解释变量的函数回归(三)ARCH 检验用残差平方对其滞后值回归2112222ˆˆˆˆˆ()()t t t p t p e e e e n p R p ααααχ---=++++-§3 异方差的修正2WLS 2.WLS i i i i e e X e X e w e e ⎧→→⎪⎪⎪⎨⎪→→⎪⎪⎩→⎫⎧→⎨⎬→⎩⎭∑i i i i i 一、异方差的修正(一)加权最小二乘法(,weighted least squares)1.OLS 法的缺陷对每个赋予相同的重要性提供的较小时应加大信息量信息量小提供的较大时应减小信息量信息量大的思路较大的权重较小的使最小化较大的较小的权重i WLS WLS (二)估计量及其性质二、为未知时的变换三、模型的对数变换。
异方差的性质
预测置信区间不准确
在异方差情况下,预测的置信区间可 能不准确,导致对预测结果的信任度 降低。
对统计推断的影响
统计推断有效性下
降
在异方差情况下,常用的统计推 断方法可能不再适用,导致推断 结果的不准确。
假设检验失效
在异方差情况下,假设检验的结 果可能受到影响,导致无法准确 地做出统计决策。
置信水平降低
由于异方差的存在,统计推断的 置信水平可能会受到影响,导致 对推断结果的信任度降低。
03
CATALOGUE
异方差的检验
图示检验法
残差图检验
通过绘制残差与拟合值的图形,观察 残差是否随拟合值的变动而出现系统 性模式,如随拟合值增大而逐渐增大 或减小。
QQ图检验
将残差与标准正态分布的期望值进行 比较,观察其是否落在预期的置信区 间内,判断残差是否服从正态分布。
总结词
医学研究数据中,由于个体差异、病情 进展和治疗方法等因素,常常表现出异 方差性。
VS
详细描述
在医学研究中,由于个体之间的差异、病 情进展的不同阶段以及治疗方法的多样性 等因素,数据分布往往不均匀。例如,不 同患者的生理指标、治疗效果等可能会有 很大的差异,导致数据异方差性的出现。
实例三:社会调查数据
通过计算残差的二次项与解释变量的线性组 合,构建统计量对异方差进行检验。
04
CATALOGUE
异方差的解决方法
数据变换法
平方根变换
通过取平方根的方式减小异方差的影 响,适用于数据分布为正态分布的情 况。
对数变换
通过取对数的方式减小异方差的影响 ,适用于数据分布为偏态分布的情况 。
幂变换
通过取幂的方式减小异方差的影响, 适用于数据分布为幂律分布的情况。
异方差的发现和判断
• 通常拟合的回归模型是 可以在
,其中l 根据图6.3中的分布形态,
中选择。
e
X
l j
l 1,2,1或 1 2
28
第28页/共39页
l 1 • 当 时,先作一个简单变换,然后用最小二乘法估计 和 的估计值, 对 的显著性检验等价于对模型误差项是否存在异方差性的检验。
• 如果 确实存在显著性,说明模型确实存在异方差性。
• 异方差对以最小二乘估计为核心的线性回归分析的作用和价值有严重影响。 • 异方差虽然不会影响最小二乘估计的无偏性,但最小二乘估计量方差的估计
和最小方差性,都是以模型误差项同方差假设为基础的。 • 当线性回归模型的误差项存在异方差问题时,普通最小二乘估计不再是方差
最小的估计,某种形式的加权最小二乘估计才是最小方差的有效估计。
10
第10页/共39页
• 最小二乘估计量方差确定的困难,则会对以参数估计量的统计性质和分布特征为基础的统计推断等分析, 以及区间估计和区间预测等造成严重影响,使这些统计推断失去基础。
11
第11页/共39页
第二节 异方差的发现和判断
一、 残差序列图分析 二、 戈德菲尔德-夸特检验 三、 戈里瑟检验
• 因为方差与误差项的符号无关,因此考察 的分布情况。那么在存在明显异方差性时, 会有明显的随解 释变量变化的趋势。
ei
ei
26
第26页/共39页
图6.3 异方差的戈里瑟检验
e
e
0
a
Xj
0
e
b
Xj
0
Xj
c
27
第27页/共39页
e X • 可以通过回归方法拟合 与 之间的关系。如果经过检验确定两者之间确 实存在显著的函数关系,那么表明异方差确实存在。 j
异方差——笔记
计量笔记第一课异方差在分析截面数据时,由于样本之间的“部分系统差异”(从实际中理解就是说部分样本共有的一些与其他样本不同的差异,比如低收入家庭支出差异显著低于高收入家庭的支出差异;从统计上看就是说各样本之间或部分样本与另一部分样本之间的分散情况不同,不知道这么说对不对,还有就是在随机抽样过程中,比如先抽取一个几个县,然后从每个县里面抽取几个村,这种村内部之间可能存在着cluster )会导致样本方差不一致。
一,异方差的检验在实际建模分析中,我们可以用如下一些方法去检验我们手中的样本是否存在异方差:首先,我们可以通过一些图形初步地对样本的方差齐性进行一些感性的判断;1,图示法(1)x-y图,如果散点图随x的增加,散点分布的区域变宽、变窄或者出现偏离带状区域的复杂变化怎认为随机项可能出现了异方差。
图片:高铁梅,2009. P100(2)x(或y)-残差图画出OLS处理后的残差与x的散点图,如果回归模型存在异方差时,残差图上的点的散步呈现出一定的趋势。
图,何晓群,1999 p138其次,在基本图示的条件下,如果我们认为存在了异方差,我们应该对样本数据进行进一步的正规统计检验。
常用的检验有如下一些:2,Goldfeld-Guandt Test (H0:同方差,H1:22i i cx σ=)即在我们认为方差与x 的大小有关时(需要按照误差项方差增加的顺序或者按照某自变量增加的顺序重新排列观测值),我们可以采用该统计检验方法。
基本思想就是将 样本分为两个部分,然后检验这两个部分拟合出来的残差是否显著不同来判断,样本方差齐性的假设是否能够成立。
具体步骤:(1)将样本从小到大排序;(2)省略中间d 个样本,(d 大约为总样本容量的五分之一);(3)分别对分割出来的两个子样本拟合回归模型;(4)分别计算回归模型的残差平方和(5)如果误差服从正态分布且不存在序列相关,则统计量ESS2/ESS1服从F((n-d-4)/2, (n-d-4)/2)分布,对于给定的显著性水平,如果统计量大于上述F 分布临界值则拒绝原假设,即ESS2/ESS1越大又有可能拒绝原假设。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
异方差性及其产生的原因
第二节
第三节
异方差性产生的后果
异方法
练习题
合肥师范学院经济系
回顾我们应用OLS法所需假设条件,其中大部分 是有关扰动项的统计假设,它们是:
(1)E(ut)=0, t=1,2,…,n. 随机误差项均值为0 (2)Cov(ui,uj) = E(uiuj) =0, i≠j. 随机误差项相互独立 (3)Var(ut) = E(ut² = 2 , t=1,2,…,n. 常数方差 ) (4)ut ~N(0,2). 正态性
然后利用决定系数,选择拟合最佳的函数形式。 (3)对β 1进行显著性检验,若显著异于0,则表明存在 异方差性,否则再试其它形式。
22
戈里瑟(Glejser)检验: 用残差绝对值 ei 对每个解释变量建立各种回归模型,
ei 1 2
X i vi
ei 1 2 X i vi
经济问题的异方差性大多是递增型的。
合肥师范学院经济系
合肥师范学院经济系
二、异方差性产生的主要原因: 1、模型中遗漏了随时间变化影响逐渐增大的因素。
例如,储蓄函数中的证券投资、利息、消费者行为等因素; 成本函数中的管理水平、生产技术条件等因素;消费函 数中的家庭财产、消费心理等因素。 2、模型函数形式的设定误差。 3、随机因素的影响。 4、样本数据的测量误差。
如果随着x值的增加,散布点分布的区域逐渐变宽或变 窄或出现不规则的复杂变化(即不在一个固定的带型域 中) ,表明模型存在异方差性。 在Eviews软件中,可利用“Scat“命令作Y对X 的散点图: 键入命令:Scat X Y 合肥师范学院经济系 操作演示
2、残差分布图分析 建立回归模型之后,在方程窗口中点击Resids按钮可以 得到模型的残差分布图,如果残差分布点不紧紧围绕在 一条水平线变动(既近似为一常数),其散步区域逐渐 变宽或变窄或出现不规则的复杂变化,则表明存在着异 方差性。在EViews软件包中,直接给出了以ei 为纵坐 标,以观测时间或序号为横坐标的残差图。 注意观察之前需要先将数据 关于解释变量排序,命令 格式为: SORT X LS Y C X 例3-1操作演示
模型中存在的异方差,而且把异方差的表现形式找出来便于后面改 进时使用。
帕克检验常用的函数形式:
e
2
i
x e
i
i
或
ln ei ln ln xi i
2
若经检验方程在统计上是显著的,表明存在异方差性。
合肥师范学院经济系
戈里瑟检验法的思路
戈里瑟检验法的思路是假定随机误差项方差与解释 变量之间存在幂次关系,方法是用 et 对被认为与随 机误差项方差有关的解释变量回归,确定 et 和该解 释变量的关系。由于与该解释变量之间关系的实际形 式是未知的,因此需要用该解释变量的不同幂次进行 试验,选择出最佳拟合形式。 具体步骤如下:
合肥师范学院经济系
例:S=α +β Y + u
设
其中:S=储蓄
Y=收入
1951—60年, RSS1=0.01625 1970—79年, RSS2=0.9725 F0 = 0.9725/0.01625=59.9
查表得: d.f.为(8,8)时,5% Fc=3.44
∵F0>Fc 因而拒绝H0。
结论:存在异方差性。
2
i
x e
i
i
或
ln ei ln ln xi i
2
若经检验方程在统计上是显著的,表明存在 异方差性。
合肥师范学院经济系
四、帕克(Park)检验与戈里瑟(Gleiser)检验
基本思想: 尝试建立残差序列对解释变量的辅助回 归模型。 选择关于变量X的不同的函数形式,对方程进行估计并进 行显著性检验,如果存在某一种函数形式,使得方程显著 成立,则说明原模型存在异方差性。这种方法不仅能检验出
合肥师范学院经济系
四、帕克(Park)检验与戈里瑟(Gleiser)检验
基本思想: 尝试建立残差序列对解释变量的辅助回 归模型。
选择关于变量X的不同的函数形式,对方程进行估计并进 行显著性检验,如果存在某一种函数形式,使得方程显著 成立,则说明原模型存在异方差性。 如: 帕克检验常用的函数形式:
e
21
(1)因变量Y对所有解释变量回归,计算残差et (t=1,2,…,n) (2) et 对所选择解释变量的各种幂次形式回归,如 et 0 1 X 2 u t jt
et 0 1 X et 0 1
jt
ut
jt
X
ut
1 et 0 1 ut X jt ................
同方差假定为: D(μi)= σ2 (i=1,2,….n) 即对于不同的样本点,随机误差项的离散程度是相同的; 如果出现: D(μi)= σi2≠常数 (i=1,2,….n)
则称模型出现了异方差性(Heteroskedasticity)
即对于不同的样本点,随机误差项的方差不再是常数, 而是互不相同。
15
为了提高此检验的功效,戈德菲尔德和匡特 曾经建议,将观测样本分成两段时,可将中间的 部分数据删掉。然而,删掉的数据越多,各段中 估计的自由度就越小,从而又会影响检验的功效 。因此,删掉的中间部分数据也不能太多。一般 地,删掉的数据不应多于样本观测数据的1/3。
合肥师范学院经济系
三、怀特(White)检验
合肥师范学院经济系
二、戈德菲尔德-匡特(Goldfeld-Quandt)检验
G-Q检验以F检验为基础,适用于样本容量较大(一般 而言不得低于参数个数的两倍。另外:ui服从正态分 布,且除了异方差外其他假定均满足。)、异方差递 增或递减的情况。检验的功效取决于C,但最优选择 不明显。近年经验:n=30,c=4;n=60,c=10
合肥师范学院经济系
(4)对于给定的显著水平α 若nR2> χ2 α(q) ,模型存在异方差性;反之,则认为不 存在异方差性。(检验步骤类似于t检验和F检验。) 利用EViews软件可以直接进行White检验。 (1)建立回归模型: LS Y C X (2)检验异方差性:在方程窗口中依次点击 View\Residual Test\ White Heteroskedastcity 可以选择在辅助回归模型中是否包含交叉乘积项(Cross terms),本例不存在交叉乘积项。 一般是直接观察p值的大小,若p值 较小,认为模型存在异方差性。
合肥师范学院经济系
第三节
异方差性的检验
检验思路:由于异方差性就是相对于不同的解释变量观 测值,随机误差项具有不同的方差。那么:检验异方差 性,也就是检验随机误差项的方差与解释变量观测值之 间的相关性及其相关的“形式”。人们进行了大量研究, 提出的诊断方法已有10多种,但没有一个公认的最优方 法,下面介绍几种常见的方法: 一、图示检验法 1、相关图分析(用X-Y的散点图进行判断)
渐近有效性,这就是说参数估计量不具有一致性。
2.无法正确估计系数的标准误差。 ˆ 在同方差情况下, b 的标准误差为: ˆ ˆ 2 2 ˆ
S (b) ( xi x )
2
S xx
在异方差的情况下,σ2i是一些不同的数,只有估计出每 一个σ2i之后才能得到系数的标准误差,这在只有一组 样本观察值的情况下是无法做到的。
ˆ b t ˆ S (b )
所以用t 检验来判断解释变量影响的显著性将失去意 4.增大模型的预测误差。
当模型出现异方差性时,参数OLS估计值的变异程度增 大,从而造成对Y的预测误差变大,降低预测精度,在 区间估计时优为明显。预测功能失效。 实际经济问题中经常会出现异方差性,将直接影响回归 模型的估计、检验和应用。因此,在建模过程中应该检 验模型是否存在异方差性。
4
什么情况下可能发生异方差性问题? 解释变量取值变动幅度大时,常数方差的假设往 往难以成立。异方差性主要发生在横截面数据的情况, 时间序列问题中一般不会发生,除非时间跨度过大。
异方差一般可归结为三种类型: (1)单调递增型: i2随X的增大而增大 (2)单调递减型: i2随X的增大而减小 (3)复 杂 型: i2与X的变化呈复杂形式
2
ˆ 因此,如果仍然用 / S xx 计算系数的标准误差,将会 产生估计偏差;偏差的大小取决于第二个因子值的大小, 当其大于1时,则会过低估计系数的误差;反之,则做 出了过高的估计。
合肥师范学院经济系
3.t 检验的可靠性降低。
在异方差情况下,无法正确估计系数的标准误差;这直 接影响到t 统计量值的正确确定,因为:
合肥师范学院经济系
如将指数曲线模型误设成线性模型,则误差有增大的趋势。
如政策变动、自然灾害、金融危机、人的行为不确定性等。
第二节
异方差性产生的后果
1.最小二乘估计不再是有效估计。 即存在其它的参数估计方法,其估计误差将小于OLS估 计的误差 。(注:异方差的存在不影响参数估计式的 无偏性)而且,在大样本情况下,参数估计量也不具有
合肥师范学院经济系
ˆ 设: i i (λi>0, i=1,2,…,n) 则在异方差情况下,系数的标准误差为: ( xi x ) 2 ˆ) k 2 2 k 2 2 ˆ i 2 ˆ S (b 2 i i i i S xx
2 2
2 ˆ2 i ( xi x ) S xx S xx
合肥师范学院经济系
例:Yi = α +β Xi+ ui 其中:Y=指定规模和组成的家庭每月消费支出 X=这样的家庭的每月可支配收入
设X的N个观测值取自一个家庭可支配收入的横截 面样本。某些家庭接近于勉强维持生存的水平,另 一些家庭则有很高的收入。 不难设想,低收入家庭的消费支出不大可能离开他 们的均值E(Y)过远,太高无法支持,太低则消费将 处于维持生存的水平之下。因此,低收入家庭消费 支出额的波动应当较小,因而随机误差项具有较小 的方差。而高收入家庭则没有这种限制,其随机误 差项可能有大得多的方差。这就意味着异方差性。