异方差性的概念、类型、后果、检验及其修正方法(含案例).

合集下载

异方差性在回归分析的影响

异方差性在回归分析的影响在回归分析中，异方差性是一个重要的概念，指的是误差项的方差不是恒定的，而是随着自变量的变化而变化。

异方差性会对回归分析的结果产生影响，导致参数估计不准确甚至失真，从而影响对模型的解释和预测能力。

本文将从异方差性的定义、影响、检验以及处理方法等方面展开讨论。

一、异方差性的定义在回归分析中，我们通常假设误差项具有同方差性，即误差项的方差是恒定的。

然而，在实际应用中，误差项的方差可能会随着自变量的变化而发生变化，这种情况被称为异方差性。

异方差性通常表现为误差项的方差与自变量的水平相关，即方差不是常数。

二、异方差性的影响1. 参数估计的不准确性：异方差性会导致参数估计的不准确性，使得回归系数的估计偏离真实值，从而影响对自变量与因变量之间关系的解释。

2. 统计检验的失真：异方差性会使得回归模型的显著性检验结果失真，可能导致错误的结论，影响对模型整体拟合优度的评估。

3. 预测精度的下降：异方差性会影响对未来观测值的预测精度，使得预测结果不可靠，降低模型的预测能力。

三、异方差性的检验为了检验回归模型是否存在异方差性，可以采用以下方法：1. 图形诊断法：通过残差图、残差与预测值的散点图等图形来观察残差的分布情况，如果残差呈现出明显的异方差性模式，就可以怀疑模型存在异方差性。

2. 统计检验法：利用异方差性检验统计量，如White检验、Goldfeld-Quandt检验、Breusch-Pagan检验等，对模型的异方差性进行显著性检验。

四、处理异方差性的方法当检验结果表明模型存在异方差性时，可以采取以下方法进行处理：1. 加权最小二乘法（Weighted Least Squares, WLS）：通过对残差进行加权，使得残差的方差与自变量的水平相关，从而消除异方差性。

2. 变量转换：对自变量或因变量进行对数变换、平方根变换等，使得变量的方差变化较小，减轻异方差性的影响。

3. 引入干扰项：在模型中引入干扰项，如虚拟变量、交互项等，来控制异方差性的影响。

第五章异方差性

于OLS估计得到的残差 ei 的分析
26
异方差性的检验
问题在于用什么来表示随机误差项的方差一般的处理方法：
Var(ui ) E(uቤተ መጻሕፍቲ ባይዱ2) ei2
图示检验法
图示检验法
（一）相关图形分析方差描述的是随机变量取值的（与其均值的）离散程度。因为被解释
变量Y与随机误差项u有相同的方差，所以分析Y与X的相关图，可以初略地看到Y的离散程度与X之间是否有相关关系。
ui 的某些分布特征，可通过残差 ei 的图形对异方差进行观察。
对于一元回归模型，绘制出ei2 对Xi的散点图,对于多元回归模型，绘制出ei2 对Yi的散点图或ei2 与认为和异方差有关的X的散点图。
31
图示检验法
（二）残差图形分析
e~i 2
e~i 2
X 同方差
e~i 2
X 递增异方差
e~i 2
X 递减异方差
每个企业所处的外部环境对产出量的影响被包含在随机误差项中每个企业所处的外部环境对产出量的影响程度不同，造成了随机
误差项的异方差性
产生异方差性的原因
产生异方差性的原因
（一）模型设定误差
假设正确的模型是：
Yi 1 2 X2i 3 X3i ui
假如略去了重要的解释变量X3 ，而采用 Yi 1 2 X2i vi
排序，再按戈德菲尔德匡特检验方法回归，否则即使存在异方差，也有可能用戈德菲
尔德匡特方法检验不出来。
用 EViews 给截面数据排序的方法：在 Workfile 窗口点击 Procs 键并选 Sort current page
功能，在打开的 Sort Workfile Series 对话窗填写以哪一个序列为标准（基准序列）排

第五章异方差性

Qt

ALt
K

t
eut
• U为随机误差项，它包含了资本K和劳动力L
以外的因素对产出Q的影响，比如能源、环境、
政策等。由于不同的地区这些因素不同造ui 成了对产出的影响出现差异，使得模型中的具有
异方差，并且这种异方差的表现是随资本和劳动力的增加而有规律变化的。
(二）样本数据的观测误差
• 一方面，样本数据的观测误差常随着时间的推移而逐步积累，引起随机误差项的方差增加。另一方面，随着时间的推移，样本观测技术会随之提高，也可能使得样本的观测误差减少，引起随机误差项的方差减小。因此，随着时间的推移，样本数据的观测误差会发生变化，从而引起随机误差项的变化。
Yt 1 2 X 2i 3 X 3i ui (1)
Y 1 2 X 2 3 X 3
(2)
Yt 1' 2 X 2i ui'
(3)
Y 1' 2 X 2
(4)
由(2)、(4)得:1' 1 3 X3 (5)
由(1)、(3)、(5)得:
Var(ui )

2 i

f
(X
ji )
i 1, 2, , n
则称随机误差项存在异方差.
( 即回归模型中随机误差项的方差不是常数 )
例2：使用截面数据研究储蓄函数
假设储蓄函数模型Y i 0 1X i ui
式中：Y i第i个家庭的储蓄额，X i第i个家庭的可支配收入，ui 代表除可支配收入以外影响储蓄额的其它因素，如利率、家庭人口、文化背景等等。这里，同方差假设显然与事实不符。
ui' 1 3 X 3i ui 1'

第六章异方差性

第六章异方差性Chapter 6 异方差性二、异方差的类型同方差：i2 = 常数f(Xi) 异方差：i2 = f(Xi) 四、异方差性的后果总而言之，在异方差情况下，我们建立在高斯马尔科夫定理基础上的用来检验各种假设的统计量都不再是有效的，因而OLS 估计量不再是最佳线性无偏估计量（即不具有BLUE 性质）。

五、异方差性的检验检验思路：辅助回归: 6. 怀特（White ）检验怀特检验不需要排序，且适合任何形式的异方差。

怀特检验的基本思想与步骤（以二元为例）：去掉交互项是一种方法，另一种方法也可以用原来模型OLS 回归得到的Y的拟合值作为辅助回归中的解释变量：在进行怀特异方差检验时，建立如下辅助回归：然后在计算LM 统计量例子6-5 异方差检验的说明性例子P160 图示法G-Q 检验F 检验LM 检验怀特检验一旦获得了异方差稳健标准差，就可以构造异方差稳健t统计量。

稳健标准差的优点在于：不需要知道总体模型是否存在异方差以及是何种形式的异方差。

异方差稳健标准差比普通的OLS 标准差更有效。

在大样本下，截面数据分析中我们可以仅仅报告异方差稳健标准差，一般软件都提供。

例子6-6 P164 运用EViews 报告异方差稳健估计。

打开OLS 估计结果，Estimate, options, 在LS&TSLS 中选择Heteroskedasticity consistent coefficient\white 异方差稳健标准差通常大于OLS 标准差。

STATA ：reg y x1 x2, vce(robust) （一）异方差为已知的解释变量的某一函数形式时的加权最小二乘估计模型检验出存在异方差性，可用加权最小二乘法（Weighted Least Squares, WLS ）进行估计。

如果直接用作为权数，则容易验证变换后模型的随机干扰项的方差等于1，也满足同方差性。

此时加权最小二乘法就是对如下加了权的模型采取OLS 法：指数函数，我们需要估计FWLS 估计量的性质例子6-7 ：FWLS 若以指数函数求权函数fx OLS 回归后，log(resid^2) gene fx=exp(…….) 权数1/sqr(fx) 第五节：案例分析P172 1988 年美国18 个工业群体的研发注意：辅助回归仍是检验与解释变量可能的组合的显著性，因此，辅助回归方程中还可引入解释变量的更高次方。

第五章异方差性(1)

8
第二节异方差性的后果
一、对参数估计统计特性的影响
二、对参数显著性检验的影响
三、对预测的影响
9
一、对参数估计式统计特性的影响
1、仍然具有线性性
2、仍然具有无偏性
参数估计的无偏性仅依赖于基本假定中的零均值假定（即 E(ui ) 0 ）。所以异方差的存在对无偏性的成立没有影响。
3、仍然具有一致性
3
如果把异方差看成是由于某个解释变量的变化而引起的，则
Var(ui ) f ( X i )
2 i 2
异方差一般可归结为三种类型： (1)单调递增型： i 2 随X的增大而增大 (2)单调递减型： i 2 随X的增大而减小 2 (3)复杂型： i 与X的变化呈复杂形式
4
单调递增型异方差例
7
u i*
2、数据的测量误差
样本数据的观测误差有可能随研究范围的扩大而增加，或随时间的推移逐步积累，也可能随着观测技术的提高而逐步减小。
3、截面数据中总体各单位的差异 u*
i
通常认为，截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异，一般说来会大于同一对象不同时间的差异。不过，在时间序列数据发生较大变化的情况下，也可能出现比截面数据更严重的异方差。
34
3、检验的特点
（1）变量的样本值为大样本；（2）数据是时间序列数据；（3）只能判断模型中是否存在异方差，而不能诊断出哪一个变量引起的异方差。
35
五、Glejser检验
1、检验的基本思想
由OLS法得到残差
ei
，取得绝对值，然后将对
某个解释变量回归，根据回归模型的显著性和拟合优度来判断是否存在异方差。

异方差性的概念、类型、后果、检验及其修正方法含案例

例4.1.1：在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中，i的同方差假定往往不符合实际情况。对高收入家庭来说，储蓄的差异较大；低收入家庭的储蓄则更有规律性（如为某一特定目的而储蓄），差异较小。
因此，i的方差往往随Xi的增加而增加，呈单调递增型变化。
– 在选项中，EViews提供了包含交叉项的怀特检验“White Heteroskedasticity（cross terms）”和没有交叉项的怀特检验“White Heteroskedasticity（no cross terms）” 这样两个选择。
• 软件输出结果：最上方显示两个检验统计量：F统计量和White统计量nR2；下方则显示以OLS的残差平方为被解释变量的辅助回归方程的回归结果。
随机误差项具有不同的方差，那么：检验异方差性，也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于：用什么来表示随机误差项的方差？一般的处理方法：
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面，由于上述后果，使得模型不具有良好的统计性质；
【书上这句话有点问题】
其中所以，当模型出现异方差性时，Y预测区间的建立将发生困难，它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验（教材P111）
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值，
（注意：其中的2完全可以是1）

4.2 异方差性

• 其他检验也是如此。
3、模型的预测失效
一方面，由于上述后果，使得模型不具有良好的统计性质；
所以，当模型出现异方差性时，参数OLS 估计值的变异程度增大，从而造成对Y的预测误差变大，降低预测精度，预测功能失效。
四、异方差性的检验 Detection of Heteroscedasticity
OLS估计
ˆ exp( ˆ ˆ1 X i1 ˆ2 X i 2 L ˆk X ik ) ˆi2 ˆi2 f i 0
2、异方差稳健标准误法（Heteroscedasticity-Consistent
Variances and Standard Errors）

应用软件中推荐的一种选择。适合样本容量足够大的情况。
仍然采用OLS，但对OLS估计量的标准差进行修正。与不附加选择的OLS估计比较，参数估计量没有变化，但是参数估计量的方差和标准差变化明显。即使存在异方差、仍然采用OLS估计时，变量的显著性检验有效，预测有效。

六、案例 —中国农村居民人均消费函数模型
~ y (y i ) 0ls e i i
~2 Var ( i ) E ( i2 ) e i
2、图示法
（1）用X-Y的散点图进行判断
看是否存在明显的散点扩大、缩小或复杂型趋势（即不在一个固定的带型域中）。
~ 的散点图进行判断 (2)X- e i
2
看是否形成一斜率为零的直线。
~2 e i
wi 1/
f ( X i1 , X i 2 ,L , X ik )

一种具有应用价值的方法
Var(i | X i1,L , X ik ) 2 exp(0 1 X i1 L k X ik )

异方差性的后果

(*)
可以证明，在同方差假设下： R2为(*)的可决系数，h为(*)式解释变量的个数，表示渐近服从某分布。
注意：辅助回归仍是检验与解释变量可能的组合的显著性，因此，辅助回归方程中还可引入解释变量的更高次方。如果存在异方差性，则表明确与解释变量的某种组合有显著的相关性，这时往往显示出有较高的可决系数以及某一参数的t检验值较大。当然，在多元回归中，由于辅助回归方程中可能有太多解释变量，从而使自由度减少，有时可去掉交叉项。
注意：在实际操作中人们通常采用如下的经验方法：不对原模型进行异方差性检验，而是直接选择加权最小二乘法，尤其是采用截面数据作样本时。如果确实存在异方差，则被有效地消除了；如果不存在异方差性，则加权最小二乘法等价于普通最小二乘法
七、案例--中国农村居民人均消费函数
例1.4 中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入包括(1)从事农业经营的收入， (2)包括从事其他产业的经营性收入(3)工资性收入、(4)财产收入(5)转移支付收入。
④在同方差性假定下，构造如下满足F分布的统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) 2 2 ~ 2 ( n c k 1) e 1i 2
⑤给定显著性水平，确定临界值F(v1,v2)，若F> F(v1,v2)，则拒绝同方差性假设，表明存在异方差。当然，还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。
如：帕克检验常用的函数形式： ~ 2 ) ln 2 ln X ln( e f ( X ji ) 2 X e 或 i ji i ji
i
若在统计上是显著的，表明存在异方差性。

异方差性的概念类型后果检验及其修正方法

异方差性的概念类型后果检验及其修正方法异方差性（heteroscedasticity）是指随着自变量的变化，被解释变量的方差不保持恒定，呈现出不同的分散特征。

异方差性可能会导致线性回归模型的参数估计不精确，误差项的标准误差的估计不准确，常见的检验和修正方法包括Breusch-Pagan检验和White检验，同时，还可以采取加权最小二乘法或者转换变量的方法来修正异方差性。

异方差性可以分为条件异方差和非条件异方差两种类型。

条件异方差是指在给定自变量的情况下，被解释变量方差的大小存在差异；非条件异方差则是指被解释变量的方差在整个样本空间内都存在差异。

异方差性的后果是导致参数估计的不准确性和偏误。

当存在异方差性时，OLS（普通最小二乘法）估计的标准误差会低估真实标准误差，从而使得参数显著性以及模型拟合效果可能出现问题。

此外，在存在异方差性的情况下，t检验、F检验等假设检验的结果也会受到影响。

在进行线性回归模型时，常常需要对异方差性进行检验。

一种常用的检验方法是Breusch-Pagan检验，其基本思想是对残差的平方与自变量进行回归，然后通过F检验来判断异方差的存在与否。

另一种常用的检验方法是White检验，它是在一个包含自变量和交互项的扩展模型中对残差的平方与自变量进行回归，通过Wald检验统计量来判断异方差的存在与否。

异方差性可以通过多种修正方法来处理。

其中，一种常用的方法是采用加权最小二乘法（WLS）来估计参数。

WLS的基本思想是将方差不恒定的观测值加权，使得每个观测值的权重与方差的倒数成正比。

另一种常用的方法是通过转换变量，使得原始数据变换成具有恒定方差的形式，例如对数变换、平方根变换等。

下面以一个案例来说明如何检验和修正异方差性。

假设我们研究了城市的房价（被解释变量）与房屋面积和所在地区（自变量）之间的关系。

我们采集了100个样本数据，并构建了线性回归模型进行分析。

1.检验异方差性：使用Breusch-Pagan检验来检验模型的异方差性。

异方差性的概念、类型、后果、检验及其修正方法(含案例)

分别为两个子样对应的随机项方差。
H0成立，意味着同方差； H1成立，意味着异方差。
⑤构造统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) nc 2 2 2 ~ e ( k 1 ) 1i 2
⑥检验。给定显著性水平，确定F分布表中相应的临界值
例4.1.2：以绝对收入假设为理论假设、以分组数据（将居民按照收入等距离分成n组，取组平均数为样本观测值）作样本建立居民消费函数：
Ci= 0+1Yi+i 一般情况下：居民收入服从正态分布，处于中等收入组中的人数最多，处于两端收入组中的人数最少。而人数多的组平均数的误差小，人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的增大而先减后增。如果样本观测值的观测误差构成随机误差项的主要部分，那么对于不同的样本点，随机误差项的方差随着解释变量观测值
并不随解释变量 Xi的变化而变化，不论解释变量的观测值是大还是小，每个i的方差保持相同，即 i2 =常数（i=1,2,…,n）
• 在异方差的情况下，i2已不是常数，它随Xi的
变化而变化，即
i2 =f(Xi) （i=1,2,…,n）
• 异方差一般可以归结为三种类型：
（1）单调递增型： i2=f(Xi)随Xi的增大而增大；（2）单调递减型： i2=f(Xi )随Xi的增大而减小；（3）复杂型： i2=f(Xi )随Xi的变化呈复杂形式。
③对每个子样本分别求回归方程，并计算各自的残差平方
e 2 ，较大的一和。将两个残差平方和中较小的一个规定为 ~ 1i
nc 2 ~ k 1。个规定为 e2i 。二者的自由度均为 2
2 2 H0 ： 12 2 12 2 ④提出假设：，H 1 ： 2 12 与 2

异方差怀特检验

解释：随收入增长，人们有更多旳备用收入，从而怎样支配他们旳收入有更大旳选择范围。
一、异方差旳概念
对于模型
Yi 0 1 X ii 2 X 2i k X ki i 假如出现
Var(i
)
2 i
即对于不同旳样本点，随机误差项旳方差不再是常数，而互不相同，则以为出现了异方差性 (Heteroskedasticity)。
1331.03
614.8 876.0
江苏
2374.7
六、异方差旳修正
模型检验出存在异方差性，可用加权最小二乘法（Weighted Least Squares, WLS）进行估计。
v 加权最小二乘法旳基本思想：
加权最小二乘法是对原模型加权，使之变成一种新旳不存在异方差性旳模型，然后采用OLS 估计其参数。
Wiei2
Wi [Yi
(ˆ0
ˆ1 X1
F
e~12i
(n (n
1)
~
F
(n
2
c
k
1,
n
2
c
k
1)
2
⑤给定明显性水平，拟定临界值F(v1,v2)，若F> F(v1,v2)，则拒绝同方差性假设，
表白存在异方差。
当然，还可根据两个残差平方和相应旳
子样旳顺序判断是递增型异方差还是递减异
型方差。
4. 怀特（White）检验怀特检验不需要排序，且适合任何形式旳异
注意：
辅助回归仍是检验与解释变量可能旳组合旳明显性，所以，辅助回归方程中还可引入解释变量旳更高次方。
假如存在异方差性，则表白确实与解释变量旳某种组合有明显旳有关性，这时往往显示出有较高旳鉴定系数以及某一参数旳t检验值较大。

《异方差性》课件

03
异方差性的后果
模型预测的准确性下降
异方差性会导致模型的预测值偏离真实值，降低预测的准确性。
在异方差性存在的情况下，模型的预测结果可能变得不可靠，因为模型没有充分考虑到数据的不
确定性。
异方差性可能导致模型在预测新数据时表现不佳，因为模型没有充分学习到数据的内在结构和变
化规律。
模型推断的可靠性降低
详细描述
社会数据在不同群体之间的分布往往存在显著的差异，这种差异反映了不同群体之间的异方差性。这种异方差性可能与社会经济地位、文化背景等多种因素有关，需要深入分析其产生的原因和影响。
社会数据的异方差性分析
总结词
异方差性对社会政策制定和实施具有重要影响。
VS
详细描述
社会政策的制定和实施需要考虑不同群体的差异和特点，而异方差性的存在为社会政策的制定提供了重要的参考信息。通过对异方差性的分析和研究，我们可以更好地了解不同群体的需求和诉求，制定更为公正和有效的社会政策。
总结词
金融数据的异方差性分析有助于提高投资策略的有效性。
详细描述
通过对金融数据的异方差性进行分析，投资者可以更好地理解市场的波动规律和风险特征，从而制定更为有效的投资策略。这种基于异方差性的投资策略能够更好地适应市场的变化，提高投资的收益和风险控制能力。
社会数据的异方差性分析
总结词
社会数据在不同群体之间存在显著的异方差性。
平方根变换
当数据分布不均，特别是偏度较大时，平方根变换可以改善数据的正态性。
Box-Cox变换
是一种通用的数据变换方法，通过选择一个适当的λ值，使数据达到最佳的正态分布状态。
模型选择和调整
混合效应模型

异方差

将居民按照收入等距离分成n组，取组平均数为样本观测值。一般情况下，居民收入服从正态分布：中等收入组人数多，两端收入组人数少。而人数多的组平均数的误差小，人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的不同而不同，往往引起异方差性。
第一节异方差的概念
例：以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3ei 被解释变量：产出量Y 解释变量：资本K、劳动L、技术A，那么：每个企业所处的外部环境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同，造成了随机误差项的异方差性。这时，随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化，呈现复杂型。
第三节异方差性的检验
三、戈里瑟(Gleiser)检验 1969年戈里瑟提出的，它不但可以检验异方差是否存在，而且可以近似探测随机误差项的方差是怎样随解释变量的变化而变化的。基本思想：由OLS法得到残差 e i ,取 e i 的绝对值，然后将对某个 X i回归，根据回归模 ei ei 型的显著性和拟合优度来判断是否存在异方差。
二、异方差性的后果
ˆ
2
e
2 i
n2
ˆ s(1 )

ˆ ki
2
2

ˆ2

(Xi X )
2
但是，在异方差的情况下
ˆ* s( i ) ˆ ki i
2 2
ˆ i ki
2 2
ˆ ki
2
2
i ki ki
2
2
＝
ˆ s(i )
i Байду номын сангаасi
第三节异方差性的检验

异方差性的概念、类型、后果、检验及其修正方法(含案例).

2 0 0 2 0 0
其中
2 SEYˆ Y 1 X0 (XX) 1 X 0
0 0

所以，当模型出现异方差性时，Y预测区间的建立将发生困难，它的预测功能失效。
三、异方差性的检验（教材P111）
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值，
随机误差项具有不同的方差，那么：检验异方差性，也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
分别为两个子样对应的随机项方差。
H0成立，意味着同方差； H1成立，意味着异方差。
⑤构造统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) nc 2 2 2 ~ e ( k 1 ) 1i 2
⑥检验。给定显著性水平，确定F分布表中相应的临界值
2 E() I

Var( ) 2 , i 1,2, , n i Cov( , ) 0, i j i j
即同方差和无序列相关条件。
2.变量的显著性检验失去意义
在变量的显著性检验中，t统计量
t ˆ
j j j
ˆ ) Se(
~2 来表示随机误差项的方差。即用e
i
2.图示检验法
（1）用X-Y的散点图进行判断（李子奈P108）
看是否存在明显的散点扩大、缩小或复杂型趋势（即不在一个固定的带型域中）。
随机误差项的方差描述的是取值的离散程度。而由于被解释变量Y与随机误差项有相同的方差，所以利用Y与X之间的相关图形也可以粗略地看出的离散程度与X之间是否有相关关系。

什么是异方差性如何进行异方差性的检验与处理

什么是异方差性如何进行异方差性的检验与处理异方差性，它是统计学中一种常见的现象，指的是观测值的方差在不同的条件下不相等。

在数据分析和建模过程中，异方差性可能会导致模型参数估计不准确，假设检验无效以及预测效果下降等问题。

因此，了解异方差性并进行检验和处理是非常重要的。

1. 异方差性的表征异方差性通常表现为残差的方差与预测值的关系不稳定。

在回归分析中，当残差的方差与预测值的关系呈现出一定的模式时，可以初步判断存在异方差性。

常见的异方差性模式有以下几种：（1）线性模式：残差的方差与预测值呈线性关系，即残差的方差随着预测值的增大而增大或减小。

（2）指数模式：残差的方差与预测值呈指数关系，即残差的方差随着预测值的增大呈指数级别增大或减小。

（3）对数模式：残差的方差与预测值呈对数关系，即残差的方差随着预测值的增大呈对数级别增大或减小。

（4）多重峰值模式：残差的方差具有多个峰值，表示不同分组或条件之间存在不同的方差水平。

2. 异方差性的检验针对上述异方差性模式，可以进行一些统计检验来验证异方差性的存在。

常用的异方差性检验方法包括帕金森-斯皮尔曼检验（Park test）、布劳什-帕甘检验（Breusch-Pagan test）和韦斯特曼检验（White test）等。

这些检验方法都是基于残差的方差与预测值之间的关系建立的。

以布劳什-帕甘检验为例，该检验的原假设是残差的方差与预测变量之间不存在显著相关关系，即不存在异方差性。

在进行检验时，首先需要对模型进行拟合，并获得残差。

然后，根据拟合残差和预测变量的关系构建辅助回归模型，并进行显著性检验。

如果辅助回归模型的显著性检验结果小于设定的显著性水平（通常为0.05），则可以拒绝原假设，认为存在异方差性。

3. 异方差性的处理在实际数据分析中，如果检验结果表明存在异方差性，需要对数据进行处理以减小或消除其影响。

常用的异方差性处理方法包括以下几种：（1）对数或平方根变换：通过对原始数据进行对数或平方根变换，可以降低数据的异方差性。

异方差性及后果

预测稳定性下降
异方差性可能导致预测结果在不同时间或不同样本上波动较大，影响预测的稳定性。
预测置信度降低
由于异方差性的存在，使得预测结果的置信度降低，难以确定预测结果的可靠性。
对决策的影响
决策失误风险增加
01
由于异方差性导致模型预测结果的不准确和不稳定，可能导致
决策失误的风险增加。
资源分配不合理
使用异方差性检验方法，如White检验、 Goldfeld-Quandt检验等，对模型进行检验，如果检验结果显著，则说明存在异方差性。
通过比较不同预测变量对应的残差大小，如果不同预测变量对应的残差大小差异较大，那么可能存在异方差性。
02
异方差性的来源
数据来源
异常值
数据中的异常值可能导致异方差性，因为异常值可能与其他数据点存在较大差异，从而影响方差估计。
加权最小二乘法（WLS）
WLS也是一种异方差性稳健的模型，它通过对不同的观测值赋予不同的权重来纠正异方差性。WLS的优点是可以处理非线性和非正态的异方差性。
05
异方差性的检验
图示检验法
残差图检验
通过绘制实际观测值与预测值的残差，判断是否存在异方差性。如果残差随预测值的增加或减少而变化，则可能存在异方差性。
02
异方差性可能导致决策者在资源分配上出现偏差，使得资源未
能得到有效利用。
战略规划受阻
03
异方差性可能影响战略规划的制定和实施，使得企业或组织的
发展受到限制。
04
异方差性的处理方法
变换数据
1 2
对数变换
对数变换可以减少异方差性，特别是当数据具有较大的方差时。对数变换的公式是$y = log(x)$。

计量经济学4-异方差性

注意：在实际操作中人们通常采用如下的经验方法：不对原模型进行异方差性检验，而是直接选择加权最小二乘法，尤其是采用截面数据作样本时。如果确实存在异方差，则被有效地消除了；如果不存在异方差性，则加权最小二乘法等价于普通最小二乘法
第四章异方差性
4.1 异方差性的概念 4.2 实际经济问题中的异方差性 4.3 异方差性的后果
i j i, j 1,2,, n
假设3，解释变量与随机项不相关
Cov ( X ji , i ) 0
j 1,2, k
假设4，随机项满足正态分布
i ~ N ( 0, 2 )
基本假定违背：不满足基本假定的情况。主要包括：（1）随机误差项序列存在异方差性；（2）随机误差项序列存在序列相关性；（3）解释变量之间存在多重共线性；（4）解释变量是随机变量且与随机误差项相关（随机解释变量）。
④在同方差性假定下，构造如下满足F分布的统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) nc 2 2 2 ~ e ( k 1 ) 1i 2
⑤给定显著性水平，确定临界值F(v1,v2)，若F> F(v1,v2)，则拒绝同方差性假设，表明存在异方差。当然，还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。
首先采用 OLS 法估计模型，以求得随机误差项的估计量（注意，该估计量是不严格的），我们称之为 “近
~ e 似估计量” ，用 i
表示。于是有
2 i
2 ~ Var ( i ) E ( ) ei
~ y (y i ) 0ls 法
异方差性的后果

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

规
律
• 一般经验告诉人们：对于采用截面数据作样本
的计量经济学问题，由于在不同样本点（即不
同空间）上解释变量以外的其他因素的差异较
大，所以往往存在异方差性。
二、异方差性的后果
1.参数估计量非有效
• 当计量经济学模型出现异方差性时，其普通最小二乘法参数估计量仍然具有无偏性，但不具有有效性。而且，在大样本情况下，参数估计量仍然不具有渐近有效性。因为在有效性证明（见教材P70-7异方差。
怀特(White)检验的EViews软件操作要点
• 在OLS的方程对象Equation中，选择View/Residual tests/White Heteroskedasticity。
– 在选项中，EViews提供了包含交叉项的怀特检验“White Heteroskedasticity（cross terms）”和没有交叉项的怀特检验“White Heteroskedasticity（no cross terms）” 这样两个选择。
③对每个子样本分别求回归方程，并计算各自的残差平方
e 2 ，较大的一和。将两个残差平方和中较小的一个规定为 ~ 1i
nc 2 ~ k 1。个规定为 e2i 。二者的自由度均为 2
2 2 H0 ： 12 2 12 2 ④提出假设：，H 1 ： 2 12 与 2
或者，也可以说，对于每一个样本点i，随机误差项的方差i2衡
量的是被解释变量的观测值Yi围绕回归线E(Yi)=0+1Xi1+…+kXik
的分散程度。而所谓异方差性，是指被解释变量观测值的分散程度随样本点的不同而不同。【庞皓P130】
概率密度
异方差性示意图
Y
X
2.异方差的类型 • 同方差性假定是指，每个i围绕其0均值的方差
并不随解释变量 Xi的变化而变化，不论解释变量的观测值是大还是小，每个i的方差保持相同，即 i2 =常数（i=1,2,…,n）
• 在异方差的情况下，i2已不是常数，它随Xi的
变化而变化，即
i2 =f(Xi) （i=1,2,…,n）
• 异方差一般可以归结为三种类型：
（1）单调递增型： i2=f(Xi)随Xi的增大而增大；（2）单调递减型： i2=f(Xi )随Xi的增大而减小；（3）复杂型： i2=f(Xi )随Xi的变化呈复杂形式。
异方差性 Heteroscedasticity
一、异方差性的概念及类型二、异方差性的后果三、异方差性的检验四、异方差的修正五、案例
一、异方差性的概念及类型
1.什么是异方差？
对于模型
Yi 0 1 X i1 2 X i 2 k X ik i
同方差性假设为如果出现
• 软件输出结果：最上方显示两个检验统计量：F统计量和White统计量nR2；下方则显示以OLS的残差平方为被解释变量的辅助回归方程的回归结果。
– 以教材P118的例子为例，包含交叉项的怀特检验“White Heteroskedasticity（cross terms）”的输出结果为：

ˆ
j
j
c
jj
2

ˆ
j 2
j
( X X ) 1 jj
（j=0,1,2,…,k）
2 。包含有随机误差项共同的方差
如果出现了异方差性，而仍按同方差时的公式计算t 统计量，将使t统计量失真【偏大或偏小，见第三版P110补充说明】，从而使t检验失效【使某些原本显著的解释变量
3.实际经济问题中的异方差性
例4.1.1：在截面资料下研究居民家庭的储蓄行为
Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。在该模型中， i的同方差假定往往不符合实际情况。对高收入家庭来说，储蓄的差异较大；低收入家庭的储蓄则更有规律性（如为某一特定目的而储蓄），差异较小。因此， i 的方差往往随 Xi的增加而增加，呈单调递增型变化。
如果存在某一种函数形式，使得方程显著成立，则说明原模型存在异方差性。由于f(Xj)的具体形式未知，因此需要选择各种形式进行试验。
4.戈德菲尔德-匡特（Goldfeld-Quandt）检验
G-Q检验以F检验为基础，仅适用于样本容量较大、异方差为单调递增或单调递减的情况。 G-Q检验的思想：
先按某一被认为有可能引起异方差的解释变量对样
可能无法通过显著性检验，或者使某些原本不显著的解释变量可能通过显著性检验】。
3.模型的预测失效
一方面，由于上述后果，使得模型不具有良好的统计性质；
另一方面，在预测值的置信区间中也包含有随机误差项共
2 同的方差。【书上这句话有点问题】
ˆ t SE ˆ ˆ t SE ˆ ) 1 P(Y Y Y 0 0 0 Y Y Y Y
~2 来表示随机误差项的方差。即用e
i
2.图示检验法
（1）用X-Y的散点图进行判断（李子奈P108）
看是否存在明显的散点扩大、缩小或复杂型趋势（即不在一个固定的带型域中）。
随机误差项的方差描述的是取值的离散程度。而由于被解释变量Y与随机误差项有相同的方差，所以利用Y与X之间的相关图形也可以粗略地看出的离散程度与X之间是否有相关关系。
2 ~ （2）用 X—e 的散点图进行判断
i 看是否形成一条斜率为零的直线。
~2 e i
（教材P111）
~2 e i
X 同方差递增异方差
X
~2 e i
~2 e i
X 递减异方差复杂型异方差
X
3.戈里瑟（Gleiser）检验与帕克（Park）检验 • 戈里瑟检验与帕克检验的思想：
~ |或 e ~ 2 为被解释变量，以原模型的某一解释变量 Xj 以 |e i
分别为两个子样对应的随机项方差。
H0成立，意味着同方差； H1成立，意味着异方差。
⑤构造统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) nc 2 2 2 ~ e ( k 1 ) 1i 2
⑥检验。给定显著性水平，确定F分布表中相应的临界值
• 下面，以二元回归为例，说明怀特检验的基本思想与步骤：设回归模型为：
Yi 0 1 X1i 2 X 2i i
首先，对该模型做普通最小二乘回归，记残差为：
~ Y (Y ˆ) e
i i
i 0ls
然后，以上述残差的平方为被解释变量，以原模型中各解释变量的水平项、平方项（还可以有更高次项）、交叉项等各
问题在于：用什么来表示随机误差项的方差？
一般的处理方法：
首先采用 OLS 法估计模型，以求得随机误差项的估计量（注意，该估计量是不严格的），我们称之为 “近
~ e 似估计量” ，用 i
i
表示。于是有
i i 0ls
~ Y (Y ˆ) e
~2 Var ( i ) E ( i2 ) e i
2 Var(i )
（i=1,2,…,n）（i=1,2,…,n）（i=1,2,…,n）
Var (i ) i2
即对于不同的样本点i ，随机误差项的方差不再是常数，则认为出现了异方差性。注意：对于每一个样本点i，随机误差项i都是随机变量，服从均值为0的正态分布；而方差i2衡量的是随机误差项围绕其均值0的分散程度。所以，所谓异方差性，是指这些服从正态分布的随机变量围绕其均值0的分散程度不同。
种组合为解释变量，做如下的辅助回归：
2 2 2 ~ ei 0 1 X1i 2 X 2i 3 X1i 4 X 2i 5 X1i X 2i i
则在同方差性假设下【也即H0：1=…= 5=0 】，该辅助回归方程的可决系数R2与样本容量n的乘积渐近地服从自由度=辅助回归方程中解释变量个数【该例= 5】的2分布：
2 0 0 2 0 0
其中
2 SEYˆ Y 1 X0 (XX) 1 X 0
0 0

所以，当模型出现异方差性时，Y预测区间的建立将发生困难，它的预测功能失效。
三、异方差性的检验（教材P111）
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值，
随机误差项具有不同的方差，那么：检验异方差性，也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
引言
• 在教材P29-32和P64-65，分别对一元和多元线性回归模型
提出了若干基本假设，只有在满足这些基本假设的情况下，应用普通最小二乘法才能得到无偏的、有效的参数估计量。 • 但是，在实际的计量经济学问题中，完全满足这些基本假设的情况并不多见。 • 如果违背了某一项基本假设，那么应用普通最小二乘法估计模型所得参数估计量就可能不具有某些优良特性，这就需要发展新的方法估计模型。 • 本章正是要讨论违背了某一项基本假设的问题及其估计方法。
本排序，再将排序后的样本一分为二，对子样本①和子样本②分别进行OLS回归，然后利用两个子样本的残差平方和之比构造F统计量进行异方差检验。
G-Q检验的步骤：
①将n对样本观察值(Xi1, Xi2, …,Xik,Yi)按某一被认为有可能引起异方差的解释变量观察值Xij的大小排队。 ②将序列中间的c=n/4个观察值除去，并将剩下的观察值划分为较小与较大的容量相同的两个子样本，每个子样本的样本容量均为(n-c)/2 。
的增大而先减后增（U形），出现了异方差性。
例4.1.3：以某一行业的企业为样本建立企业生产函数模型
Yi=Ai1 Ki2 Li3ei
产出量为被解释变量，选择资本、劳动、技术等投入要素

异方差性的概念、类型、后果、检验及其修正方法(含案例).

异方差性在回归分析的影响

第五章 异方差性

第五章 异方差性

第六章异方差性

第五章 异方差性(1)

异方差性的概念、类型、后果、检验及其修正方法含案例

4.2 异方差性

异方差性的后果

异方差性的概念类型后果检验及其修正方法

异方差性的概念、类型、后果、检验及其修正方法(含案例)

异方差怀特检验

《异方差性》课件

异方差

异方差性的概念、类型、后果、检验及其修正方法(含案例).

什么是异方差性如何进行异方差性的检验与处理

异方差性及后果

计量经济学4-异方差性

第五章异方差性

第五章异方差性

第五章异方差性(1)