异方差性
第六章异方差性
n
xi2
2 i
Var(ˆ1)
i 1 n
( xi2 )2
i 1
(6-3)
3.基于OLS估计的各种统计检验非有效
1)t统计量 不再服从t分布; 3)F 统计量也不再服从F分布;
4)LM(拉格朗日乘数检验)统计量也不再有渐近 2 分布。
总而言之,在异方差情况下,我们建立在高斯马尔科夫定理 基础上的用来检验各种假设的统计量都不再是有效的, OLS估计量不再是最佳线性无偏估计量。
图形表示
概
率
密
Y
度
X
异方差性是指模型违反古典假定中的同方差性, 即各残差项的方差并非相等。
一般地,由于数据观测质量、数据异常值、某些 经济变化的特性、模型设定形式的偏误等原因, 导致了异方差的出现。
主要原因往往是重要变量的遗漏,所以很多情况 下,异方差表现为残差方差随着某个(未纳入模 型的)解释变量的变化而变化。
一、图示检验法 二、帕克(Park)检验与戈里瑟(Gleiser)检验 三、G-Q(Goldfeld-Quandt)检验 四、F检验 五、拉格朗日乘子检验 六、怀特检验
一、图示检验法
(一)相关图形分析
方差描述的是随机变量取值的(与其均值的)离散程度。
u 因为被解释变量 Y与随机误差项 有相同的方差,所以利用
Var(i
|
X
i
)
2 i
这一异方差取决于 X i 的值。
该模型参数的OLS估计量可以写为
ˆ1
xi yi xi 2
在上述给定的异方差情况下,
容易证明 ˆ1的方差为
n
xi2
2 i
Var(ˆ1)
i 1 n
第五章 异方差性
26
异方差性的检验
问题在于用什么来表示随机误差项的方差 一般的处理方法:
Var(ui ) E(uቤተ መጻሕፍቲ ባይዱ2) ei2
图示检验法
图示检验法
(一)相关图形分析 方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释
变量Y与随机误差项u有相同的方差,所以分析Y与X的相关图,可以初 略地看到Y的离散程度与X之间是否有相关关系。
ui 的某些分布特征,可通过残差 ei 的图形对异方差进行观察。
对于一元回归模型,绘制出ei2 对Xi的散点图,对于多元回归模型,绘制出ei2 对Yi的散点图或ei2 与认为和异方差有关的X的散点图。
31
图示检验法
(二)残差图形分析
e~i 2
e~i 2
X 同方差
e~i 2
X 递增异方差
e~i 2
X 递减异方差
每个企业所处的外部环境对产出量的影响被包含在随机误差项中 每个企业所处的外部环境对产出量的影响程度不同,造成了随机
误差项的异方差性
产生异方差性的原因
产生异方差性的原因
(一)模型设定误差
假设正确的模型是:
Yi 1 2 X2i 3 X3i ui
假如略去了重要的解释变量X3 ,而采用 Yi 1 2 X2i vi
排序,再按戈德菲尔德匡特检验方法回归,否则即使存在异方差,也有可能用戈德菲
尔德匡特方法检验不出来。
用 EViews 给截面数据排序的方法:在 Workfile 窗口点击 Procs 键并选 Sort current page
功能,在打开的 Sort Workfile Series 对话窗填写以哪一个序列为标准(基准序列)排
第六章异方差性
第六章异方差性Chapter 6 异方差性二、异方差的类型同方差:i2 = 常数f(Xi) 异方差:i2 = f(Xi) 四、异方差性的后果总而言之,在异方差情况下,我们建立在高斯马尔科夫定理基础上的用来检验各种假设的统计量都不再是有效的,因而OLS 估计量不再是最佳线性无偏估计量(即不具有BLUE 性质)。
五、异方差性的检验检验思路:辅助回归: 6. 怀特(White )检验怀特检验不需要排序,且适合任何形式的异方差。
怀特检验的基本思想与步骤(以二元为例):去掉交互项是一种方法,另一种方法也可以用原来模型OLS 回归得到的Y的拟合值作为辅助回归中的解释变量:在进行怀特异方差检验时,建立如下辅助回归:然后在计算LM 统计量例子6-5 异方差检验的说明性例子P160 图示法G-Q 检验F 检验LM 检验怀特检验一旦获得了异方差稳健标准差,就可以构造异方差稳健t统计量。
稳健标准差的优点在于:不需要知道总体模型是否存在异方差以及是何种形式的异方差。
异方差稳健标准差比普通的OLS 标准差更有效。
在大样本下,截面数据分析中我们可以仅仅报告异方差稳健标准差,一般软件都提供。
例子6-6 P164 运用EViews 报告异方差稳健估计。
打开OLS 估计结果,Estimate, options, 在LS&TSLS 中选择Heteroskedasticity consistent coefficient\white 异方差稳健标准差通常大于OLS 标准差。
STATA :reg y x1 x2, vce(robust) (一)异方差为已知的解释变量的某一函数形式时的加权最小二乘估计模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Squares, WLS )进行估计。
如果直接用作为权数,则容易验证变换后模型的随机干扰项的方差等于1,也满足同方差性。
此时加权最小二乘法就是对如下加了权的模型采取OLS 法:指数函数,我们需要估计FWLS 估计量的性质例子6-7 :FWLS 若以指数函数求权函数fx OLS 回归后,log(resid^2) gene fx=exp(…….) 权数1/sqr(fx) 第五节:案例分析P172 1988 年美国18 个工业群体的研发注意:辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。
异方差性的概念、类型、后果、检验及其修正方法含案例
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中,i的同方差假定往往不符合实际情况。对高收 入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律 性(如为某一特定目的而储蓄),差异较小。
因此,i的方差往往随Xi的增加而增加,呈单调递增型变化 。
– 在选项中,EViews提供了包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”和没有交叉项的怀特检 验“White Heteroskedasticity(no cross terms)” 这样两个 选择。
• 软件输出结果:最上方显示两个检验统计量:F统计 量和White统计量nR2;下方则显示以OLS的残差平 方为被解释变量的辅助回归方程的回归结果。
随机误差项具有不同的方差,那么: 检验异方差性,也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于:用什么来表示随机误差项的方差? 一般的处理方法:
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
【书上这句话有点问题】
其中 所以,当模型出现异方差性时,Y预测区间的建立将发生困 难,它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验(教材P111)
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值,
(注意:其中的2完全可以是1)
第七章 异方差性
=1
መ1 =
•
•
•
σ=1( − )ҧ
2
[σ=1 − ҧ ]
White(1980)给出了异方差性的调整方法:
σ=1( − )ҧ
ෝ
ො መ1 =
2
[σ=1 − ҧ ]
其中ො 是y对所有自变量做回归所得到的OLS残差。
=1
加权最小二乘估计
已知异方差形式
• 实践中,很少知道ℎ()的形式。但有一种情况,WLS所需要的
权数会自然来自潜在的计量模型。
• 例:研究工人参加养老金计划参与情况
, = 0 + 1 , + 2 , + 3 + ,
– 其中,i表示第i个企业,e表示第e个工人,共有 个工人。
log 2 = 0 + 1 1 + 2 2 + ⋯ + +
– 其中, = , = 0
加权最小二乘估计
已知异方差形式
• 假定 = 2 ℎ
– ℎ 是解释变量的某种函数(已知其形式),
并决定着异方差性, ℎ > 0。
• 对于总体中的随机样本,有 2 =
= 2 ℎ = 2 ℎ
– 例:储蓄函数 = 0 + 1 +
2
~ 0, ℎ ֜
~ 0, 2 ֜
ℎ
Τ ℎ
= 0 Τ ℎ + 1 1 Τ ℎ +2 2 Τ ℎ + ⋯ + Τ ℎ + Τ ℎ
•
•
•
•
也就是 ∗ = 0 ∗ + 1 1 ∗ + 2 2 ∗ + ⋯ + ∗ + ∗ ,其中,0 ∗ =0 Τ ℎ
第5章 异方差性
5、计算统计量:
RSS2
F
nc ( k 1) nc nc 2 ~ F( k 1, k 1) RSS1 2 2 nc ( k 1) 2
6、在给定的显著性水平下比较判断。
注意: (1) 当模型含有多个解释变量时,应以每一个解释变 量为基准检验异方差。 (2)对于截面样本,计算F统计量之前,必须先把数据 按解释变量的值从小到大排序。 (3)G—Q检验仅适用于检验递增或递减型异方差。 (4)检验结果与数据剔除个数c的选取有关。 (5) G—Q检验无法判定异方差的具体形式。
5.2异方差性的后果
5.2.1对模型参数估计值无偏性的影响
以简单线性回归模型为例,对模型 yt = b0 + b1 xt + ut ˆ 当Var(ut) = t 2,为异方差时,以 b1 为例:
ˆ b1
k
t
yt b1 kt ut
ˆ E (b1 ) E (b1 kt ut ) b1
划分方法是: 把成对(组)的观测值按解释变量的大小顺序排列, 略去c个处于中心位置的观测值 (通常n 30时,取c n/ 4), 余下的n- c个观测值自然分成容量相等,(n- c) / 2的两 个子样本。
{x1, x2, …, xt-1, xt, xt+1, …, x n-1, xn}
n1 = (n-c) / 2
5.2.3对模型参数估计值显著性检验的影响
ee ˆ 并非随机误差项 在异方差情况下, n k 1 方差的无偏估计量。
2
ˆ 导致在此基础上估计的 s ( b j ) 也出现偏误。
ˆ bj 而变量的显著性检验中,构造了t统计量 t ˆ s(b j )
变量的显著性检验失去意义。
计量经济学第五章异方差性
计量经济学第五章异⽅差性第五章异⽅差性本章教学要求:根据类型,异⽅差性是违背古典假定情况下线性回归模型建⽴的另⼀问题。
通过本章的学习应达到,掌握异⽅差的基本概念包括经济学解释,异⽅差的出现对模型的不良影响,诊断异⽅差的⽅法和修正异⽅差的若⼲⽅法。
经过学习能够处理模型中出现的异⽅差问题。
第⼀节异⽅差性的概念⼀、⼆个例⼦例1,研究我国制造业利润函数,选取销售收⼊作为解释变量,数据为1998年的⾷品年制造业、饮料制造业等28个截⾯数据(即n=28)。
数据如下表,其中y表⽰制造业利润函数,x表⽰销售收⼊(单位为亿元)。
Y对X的散点图为从散点图可以看出,在线性的基础上,有的点分散幅度较⼩,有的点分散幅度较⼤。
因此,这种分散幅度的⼤⼩不⼀致,可以认为是由于销售收⼊的影响,使得制造业利润偏离均值的程度发⽣变化,⽽偏离均值的程度⼤⼩的不同,就是所谓的随机误差的⽅差存在变异,即异⽅差。
如果⾮线性,则属于哪类⾮线性,从图形所反映的特征看,并不明显。
下⾯给出制造业利润对销售收⼊的回归估计。
模型的书写格式为212.03350.1044(0.6165)(12.3666)0.8547,..56.9046,152.9322213.4639,146.4905Y Y X R S E F Y s =+=====通过变量的散点图、参数估计、残差图,可以看到模型中(随机误差)很有可能存在异⽅差性。
例2,改⾰开放以来,各地区的医疗机构都有了较快发展,不仅政府建⽴了⼀批医疗机构,还建⽴了不少民营医疗机构。
各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服务的需求量,⽽医疗服务需求与⼈⼝数量有关。
为了给制定医疗机构的规划提供依据,分析⽐较医疗机构与⼈⼝数量的关系,建⽴卫⽣医疗机构数与⼈⼝数的回归模型。
根据四川省2000年21个地市州医疗机构数与⼈⼝数资料对模型估计的结果如下:i iX Y 3735.50548.563?+-= (291.5778) (0.644284) t =(-1.931062) (8.340265)785456.02=R 774146.02=R 56003.69=F式中Y 表⽰卫⽣医疗机构数(个),X 表⽰⼈⼝数量(万⼈)。
第二章六计量经济学-异方差性
i=1,2,…,n
(Park)
选择关于变量 X j
的不同的函数形 式(如
f
(X
ji )
X
2 ji
或
f
(X
ji
)
2
X
e vi
ji
),对方程进行估计并进行显著性检验;
如果存在某一种函数形式,使得方程显著成立, 则说明原模型存在异方差性。
如 Park 检验法中,对一般的方程形式:
f
(X
ji
)
看是否形成一斜率为零的直线
e~i 2
e~i 2
X 同方差
X 递增异方差
e~i 2
e~i 2
X 递减异方差
X 复杂型异方差
3、解析法
(1)戈德菲尔德-匡特(Goldfeld-Quandt)检验 G-Q检验以F检验为基础,适用于样本容量较大、
异方差递增或递减的情况。
G-Q检验的思想:
先将样本一分为二,对子样①和子样②分别作回 归,然后利用两个子样的残差之比构造统计量进行 异方差检验。
xi xi2
E(i
)
1
(2.4.2)
(2)不具备最小方差性
由于
var(ˆ1 ) E(ˆ1 1)2 E(
xi xi2
i
)
2
E( (
xi i )2
xi2 ) 2
xi2
E
(
2 i
)
( xi2 )2
(注:交叉项 i, j (xi i )(x j j ) 的期望为零) i j
§2.6 异方差性 Heteroskedasticity
计量经济学第五章 异方差性
●异方差性的概念 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
1
第一节 异方差性的概念
一、异方差性的实质 二、异方差产生的原因
2
一、异方差性的实质
设模型为
Yi 1 2 X 2i 3 X3i ... k X ki ui
如果对于模型中随机误差项,有:
8
第二节 异方差性的后果
一、对参数估计统计特性的影响 二、对参数显著性检验的影响 三、对预测的影响
9
一、对参数估计式统计特性的影响
1、仍然具有线性性 2、仍然具有无偏性
参数估计的无偏性仅依赖于基本假定中的零 均值 假定(即 E(ui ) 0 )。所以异方差的存在对 无偏性的成立没有影响。
3、仍然具有一致性 4、不再具有最小方差性
24
4、检验的特点
(1)适用于大样本; (2)检验递增型或递减型异方差; (3)只能判断异方差是否存在,在多个解释变 量的情下,对哪一个变量引起异方差的判断存在局 限; (4)该检验的功效取决于C,C值越大,检验功 效越好; Continued
25
Continued (5)两个子样回归所用的观测值个数如果不 相等时,也可以用该检验,需要通过改变自由度 和统计量的计算公式来调整; (6)当模型中包含多个解释变量时,应对每 个可能引起异方差的解释变量都进行检验。
26
三、White检验
1、基本思想:
构造残差平方序列与解释变量之间的辅助函 数,通过判断辅助函数的显著性来判断原方程是 否存在异方差。 一般而言,辅助回归的解释变量包括常数项、 原模型中的解释变量、解释变量平方、其交叉乘 积。
27
2、检验的基本步骤:
原模型为
异方差性名词解释
异方差性名词解释异方差性是指在数据集中出现的变量间存在不同变差差异的现象,并且这种差异存在于不同群体或者分类之间。
它是数据分析中常见的一种统计现象,主要表现为数据集中成员之间的变量有着显著的差异性。
异方差性一词主要指的是在不同群体中测量的样本变量之间的方差不相同,而在相同组中的变量的方差相同,因此这是在不同群体中可以有差异性的变量间差异。
异方差性是建立在统计假设及其检验基础上的,它的检验主要是检查两组(或多组)数据的方差差异,以证明两组(或多组)数据具有显著差异性。
而检验方法可以使用 F 检验或卡方检验,或其他统计检验技术。
异方差性在很多领域都得到了广泛的应用,可以说它是统计分析最重要的基础部分之一,在检验不同群体的差异性时,检验的重点往往便放在异方差性上。
例如在进行社会科学研究时,受某种区别考虑的不同群体间存在着差异,则需要使用异方差性检验,以监测不同群体之间差异的显著性。
同样,当分析多组实验数据时,使用异方差性去判断实验组间有无显著差异也是很重要的。
例如,在药学和医学研究中,药物或治疗疾病时,需要对实验组与对照组进行对比,此时可以使用一项工具来检验实验组和对照组的方差之间的差异,即异方差性检验。
异方差性也可以用于评估投资策略的有效性,当有多个独立的投资策略时,可以使用异方差性检验来判断这些策略的有效性。
如果它们之间差异可用,就可以说明这些策略之间是有益的。
总而言之,异方差性是一种重要的统计分析技术,它可以用来检测变量之间的差异性,在很多领域都有重要的应用,例如在社会科学研究和药物研究中检测两组(或多组)样本之间差异;在投资策略评估中评估多个策略的有效性。
因此,异方差性在变量方差分析中有着重要的意义。
异方差性的概念类型后果检验及其修正方法
异方差性的概念类型后果检验及其修正方法异方差性(heteroscedasticity)是指随着自变量的变化,被解释变量的方差不保持恒定,呈现出不同的分散特征。
异方差性可能会导致线性回归模型的参数估计不精确,误差项的标准误差的估计不准确,常见的检验和修正方法包括Breusch-Pagan检验和White检验,同时,还可以采取加权最小二乘法或者转换变量的方法来修正异方差性。
异方差性可以分为条件异方差和非条件异方差两种类型。
条件异方差是指在给定自变量的情况下,被解释变量方差的大小存在差异;非条件异方差则是指被解释变量的方差在整个样本空间内都存在差异。
异方差性的后果是导致参数估计的不准确性和偏误。
当存在异方差性时,OLS(普通最小二乘法)估计的标准误差会低估真实标准误差,从而使得参数显著性以及模型拟合效果可能出现问题。
此外,在存在异方差性的情况下,t检验、F检验等假设检验的结果也会受到影响。
在进行线性回归模型时,常常需要对异方差性进行检验。
一种常用的检验方法是Breusch-Pagan检验,其基本思想是对残差的平方与自变量进行回归,然后通过F检验来判断异方差的存在与否。
另一种常用的检验方法是White检验,它是在一个包含自变量和交互项的扩展模型中对残差的平方与自变量进行回归,通过Wald检验统计量来判断异方差的存在与否。
异方差性可以通过多种修正方法来处理。
其中,一种常用的方法是采用加权最小二乘法(WLS)来估计参数。
WLS的基本思想是将方差不恒定的观测值加权,使得每个观测值的权重与方差的倒数成正比。
另一种常用的方法是通过转换变量,使得原始数据变换成具有恒定方差的形式,例如对数变换、平方根变换等。
下面以一个案例来说明如何检验和修正异方差性。
假设我们研究了城市的房价(被解释变量)与房屋面积和所在地区(自变量)之间的关系。
我们采集了100个样本数据,并构建了线性回归模型进行分析。
1.检验异方差性:使用Breusch-Pagan检验来检验模型的异方差性。
计量经济学第六章异方差性
构建统一的异方差 性处理框架
未来可以构建一个统一的异方 差性处理框架,整合现有的处 理方法和技巧,为实际应用提 供更为全面和系统的指导。同 时,该框架还可以为计量经济 学的教学和研究提供便利。
THANK YOU
感谢聆听
03
异方差性对假设检验 的影响
异方差性可能导致假设检验中的t统计 量和F统计量失效,从而影响假设检 验的结论。
异方差性下的模型选择和评价
异方差性检验
在进行模型选择和评价之前,需要对异方差性进行检验。常用 的异方差性检验方法有怀特检验、布雷施-帕甘检验等。
模型选择
在存在异方差性的情况下,应选择能够处理异方差性的模型, 如加权最小二乘法(WLS)、广义最小二乘法(GLS)等。
性质
异方差性违反了经典线性回归模型的同方差假设,可能导致参数 估计量的无偏性、有效性和一致性受到影响。
产生原因及影响
模型设定误差
模型遗漏了重要变量或函数形式设定错误。
数据采集问题
观测数据的误差或异常值。
产生原因及影响
• 经济现象本身:某些经济变量之间的关系可能随时间和空间的变化而变化,导致异方差性。
等级相关系数法
计算残差绝对值与解释变量之间的等 级相关系数,若显著则表明存在异方 差性。
Goldfeld-Quandt检验法
假设条件
该检验假设异方差性以解释变量的某个值为界,将样本分为两组,且两组的方差不同。
检验步骤
首先根据假设条件将样本分组,然后分别计算两组的残差平方和,最后构造F统计量进行假设检验。
05
异方差性在计量经济学模型中的应用
异方差性对模型设定的影响
01
异方差性可能导致参 数估计量的偏误
当存在异方差性时,普通最小二乘法 (OLS)的参数估计量可能不再具有无 偏性和一致性,从而导致估计结果的偏 误。
异方差性的概念、类型、后果、检验及其修正方法(含案例)
分别为两个子样对应的随机项方差。
H0成立,意味着同方差; H1成立,意味着异方差。
⑤构造统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) nc 2 2 2 ~ e ( k 1 ) 1i 2
⑥检验。给定显著性水平,确定F分布表中相应的临界值
例4.1.2:以绝对收入假设为理论假设、以分组数据 (将居民按照收入等距离分成n组,取组平均数为样 本观测值)作样本建立居民消费函数:
Ci= 0+1Yi+i 一般情况下:居民收入服从正态分布,处于中等收入组中 的人数最多,处于两端收入组中的人数最少。而人数多的组 平均数的误差小,人数少的组平均数的误差大。所以样本观 测值的观测误差随着解释变量观测值的增大而先减后增。 如果样本观测值的观测误差构成随机误差项的主要部分,那 么对于不同的样本点,随机误差项的方差随着解释变量观测值
并不随解释变量 Xi的变化而变化,不论解释变量 的观测值是大还是小,每个i的方差保持相同, 即 i2 =常数 (i=1,2,…,n)
• 在异方差的情况下,i2已不是常数,它随Xi的
变化而变化,即
i2 =f(Xi) (i=1,2,…,n)
• 异方差一般可以归结为三种类型:
(1)单调递增型: i2=f(Xi)随Xi的增大而增大; (2)单调递减型: i2=f(Xi )随Xi的增大而减小; (3)复杂型: i2=f(Xi )随Xi的变化呈复杂形式。
③对每个子样本分别求回归方程,并计算各自的残差平方
e 2 ,较大的一 和。将两个残差平方和中较小的一个规定为 ~ 1i
nc 2 ~ k 1。 个规定为 e2i 。二者的自由度均为 2
2 2 H0 : 12 2 12 2 ④提出假设: ,H 1 : 2 12 与 2
《异方差性》课件
03
异方差性的后果
模型预测的准确性下降
异方差性会导致模型的预测值偏 离真实值,降低预测的准确性。
在异方差性存在的情况下,模型 的预测结果可能变得不可靠,因 为模型没有充分考虑到数据的不
确定性。
异方差性可能导致模型在预测新 数据时表现不佳,因为模型没有 充分学习到数据的内在结构和变
化规律。
模型推断的可靠性降低
详细描述
社会数据在不同群体之间的分布往往存在显著的差异,这种差异反映了不同群体之间的异方差性。这 种异方差性可能与社会经济地位、文化背景等多种因素有关,需要深入分析其产生的原因和影响。
社会数据的异方差性分析
总结词
异方差性对社会政策制定和实施具有重 要影响。
VS
详细描述
社会政策的制定和实施需要考虑不同群体 的差异和特点,而异方差性的存在为社会 政策的制定提供了重要的参考信息。通过 对异方差性的分析和研究,我们可以更好 地了解不同群体的需求和诉求,制定更为 公正和有效的社会政策。
总结词
金融数据的异方差性分析有助于提高投资策略的有效性。
详细描述
通过对金融数据的异方差性进行分析,投资者可以更好地 理解市场的波动规律和风险特征,从而制定更为有效的投 资策略。这种基于异方差性的投资策略能够更好地适应市 场的变化,提高投资的收益和风险控制能力。
社会数据的异方差性分析
总结词
社会数据在不同群体之间存在显著的异方差性。
平方根变换
当数据分布不均,特别是偏度较大时,平方根变换可以改善数 据的正态性。
Box-Cox变换
是一种通用的数据变换方法,通过选择一个适当的λ值,使数据 达到最佳的正态分布状态。
模型选择和调整
混合效应模型
异方差性
:FGLS)法
o 在一般情况下,我们并不知道异方差的具体形式,需要 对异方差的函数形式做出估计,然后再进行加权最小二 乘估计,这种方法属于FGLS法 (伍德里奇,2000;赵国
庆,2001)
可行的广义最小二乘估计 对 yi B1 B2 x 2i B3 x 3i Bk x ki u i 。假定
同方差性
X:受教育年限
概 率 密 度
Y:工资
Y
X
异方差性
X:收入
概 率 密 度
Y:消费支出
Y
X
异方差性
X:时间
概 率 密 度
Y:打字错误
Y
X
产生异方差性的原因
原因 被解释变量:消费支出 解释变量:收入 解释变量与误差项相关 随着收入的增加,支出差异性更大
有重要的解释是影响支出的因素,物价上
对(1) ,各误差项方差相等
误差项方差未知 对 yi B1 B2 x 2i u i , i2 未知 If E(u i2 ) = σ 2 x 2i ,则
yi x 2i B1. u 1 B2 . x 2i i x 2i x 2i
模型无截距项
令
* y* = B1.x1i + B2 .x * + u * i 2i i
一般地
对 yi B1 B2 x 2i B3 x 3i Bk x ki u i 2 ˆ 用OLS方法估计模型参数,计算得 e i 和 y i
构建模型
ˆ ˆ ei2 A1 A 2 yi A3 yi2 vi
计算得判定系数R 2 构造统计量 s nR 2 2 (2) 对原假设 H0 : σ12 = σ2 = = σ 2 = σ2 2 n 如果 s -统计量显著,则拒绝原假设,认为误差项异方差
经典单方程计量经济学模型(异方差性)
80%
适用范围
对数变换法适用于存在异方差性 的模型,尤其适用于解释变量和 被解释变量之间存在非线性关系 的情况。
04
异方差性与模型选择
异方差性与模型适用性
异方差性是指模型中误差项的 方差不为常数,而是随解释变 量的变化而变化。
在异方差性存在的情况下,经 典的单方程计量经济学模型可 能不再适用,因为模型假设误 差项的方差是恒定的。
为了使模型具有适用性,需要 选择能够处理异方差性的模型 ,例如广义最小二乘法、加权 最小二乘法等。
异方差性与模型预测能力
异方差性的存在会影响模型的预测能力,因为异方差性会导致模 型的残差不再独立同分布,从而影响模型的预测精度。
为了提高模型的预测能力,需要采取措施处理异方差性,例如使 用稳健的标准误、对误差项进行变换等。
在实践中,应该充分考虑异方差性的影响,采取适当 的措施进行修正,以提高模型的预测和推断能力。
02
异方差性的检验
图示检验法
残差图检验
通过绘制残差与拟合值的图形,观察残差的分布情况,判断是否 存在异方差性。如果残差随着拟合值的增加或减少而呈现有规律 的变化,则可能存在异方差性。
杠杆值图检验
将数据按照杠杆值(leverage)进行排序,并绘制杠杆值与残差的 图形。如果图形显示高杠杆值对应的点有异常的残差分布,则可能 存在异方差性。
经典单方程计量经济学模型(异 方差性)
目
CONTENCT
录
• 异方差性简介 • 异方差性的检验 • 异方差性的处理方法 • 异方差性与模型选择 • 经典单方程计量经济学模型中的异
方差性
01
异方差性简介
定义与特性
异方差性是指模型残差的方差不为常数,随着解释 变量的变化而变化。
第4章 异方差性
表4.4.2 对数变换回归结果
4.4.4 广义最小二乘法(GLS)
对于多元线性回归模型:
4.5
案例分析——中国农村居民人均消费函数
中国农村居民人均消费支出主要由人均纯收入来决定。农村人 均纯收入除了从事农业经营的收入外,还包括从事其他产业的经
营性收入及工资性收入、财产收入和转移支付收入等。试根据表
4.2.4 对模型估计式应用的影响
4.3 异方差性的检验
4.3.1 图示检验法
1.相关图分析
例4.3.1
我国制造业利润函数。表4.3.1列出了1998年我国
制造业销售收入与销售利润的统计资料 (单位:亿元)。现以此数 据资料为例,介绍检验异方差性的一些常用方法。 表4.3.1 我国制造业1998年销售利润与销售收入情况
第4章 异方差性
4.1 异方差性及其产生的原因
4.1.1 异方差性的定义
设线性回归模型为:
图4.1.1 异方差性在散布图上的反映
4.1.2 产生异方差性的原因
在计量经济研究中,异方差性的产生原因主要有 1.模型中遗漏了某些解释变量 2.模型函数形式的设定误差
3.样本数据的测量误差
4.随机因素的影响
例4.4.1
我国制造业利润函数中异方差性的调整。
1.先用最小二乘法估计模型,估计结果为:
(3)利用加权最小二乘法估计模型。在命令窗口 键入命令:“LS(W=1/x) y c x”或在方程窗口中点击 Estimate\Options按钮,并在权数变量栏输入W=1/x,可 以得到表4.4.1估计结果。 表4.4.1 加权最小二乘法估计结果
帕克提出如下的假定函数形式:
3.检验每个回归方程参数的显著性。如果其参数显著地不为零,则存在异 方差性,相反,则认为随机误差项满足同方差假定。 Glejser检验的特点是:不仅能检验异方差性,而且通过“实验”可以探测 异方差的具体形式,这有助于进一步研究如何消除异方差性的影响。
什么是异方差性如何进行异方差性的检验与处理
什么是异方差性如何进行异方差性的检验与处理异方差性,它是统计学中一种常见的现象,指的是观测值的方差在不同的条件下不相等。
在数据分析和建模过程中,异方差性可能会导致模型参数估计不准确,假设检验无效以及预测效果下降等问题。
因此,了解异方差性并进行检验和处理是非常重要的。
1. 异方差性的表征异方差性通常表现为残差的方差与预测值的关系不稳定。
在回归分析中,当残差的方差与预测值的关系呈现出一定的模式时,可以初步判断存在异方差性。
常见的异方差性模式有以下几种:(1)线性模式:残差的方差与预测值呈线性关系,即残差的方差随着预测值的增大而增大或减小。
(2)指数模式:残差的方差与预测值呈指数关系,即残差的方差随着预测值的增大呈指数级别增大或减小。
(3)对数模式:残差的方差与预测值呈对数关系,即残差的方差随着预测值的增大呈对数级别增大或减小。
(4)多重峰值模式:残差的方差具有多个峰值,表示不同分组或条件之间存在不同的方差水平。
2. 异方差性的检验针对上述异方差性模式,可以进行一些统计检验来验证异方差性的存在。
常用的异方差性检验方法包括帕金森-斯皮尔曼检验(Park test)、布劳什-帕甘检验(Breusch-Pagan test)和韦斯特曼检验(White test)等。
这些检验方法都是基于残差的方差与预测值之间的关系建立的。
以布劳什-帕甘检验为例,该检验的原假设是残差的方差与预测变量之间不存在显著相关关系,即不存在异方差性。
在进行检验时,首先需要对模型进行拟合,并获得残差。
然后,根据拟合残差和预测变量的关系构建辅助回归模型,并进行显著性检验。
如果辅助回归模型的显著性检验结果小于设定的显著性水平(通常为0.05),则可以拒绝原假设,认为存在异方差性。
3. 异方差性的处理在实际数据分析中,如果检验结果表明存在异方差性,需要对数据进行处理以减小或消除其影响。
常用的异方差性处理方法包括以下几种:(1)对数或平方根变换:通过对原始数据进行对数或平方根变换,可以降低数据的异方差性。
第8讲 异方差性
Ru2
0.1601, LM
88 0.1601 14.09
2 0.05
(
3
)
5.99
可以拒绝原假设,即认为存在异方差性
lprice β0 β1llotsize β2lsqrft β3bdrms u F (3,84) 1.41,p 0.245
显 著 的 ,说 明 可 以 拒 绝 原 假 设 ,即 存 在 异 方 差 性
怀特检验(White test)
例题8_4 :住房价格(课本p261,例8.5)
lprice β0 β1llotsize β2lsqrft β3bdrm s u 一般检验:
F (9,78) 1.05,p 0.4053
3) t统计量不服从t分布,F统计量也不服从F分布,从而无法进 行假设检验和区间估计,也无法进行区间预测
如何解决可能存在的异方差性?
两种方法
o 其一,异方差性不影响OLS估计量的无偏性和一致性,只影 响OLS估计量的方差估计,因此,如果能找到一种方法(不 同于OLS估计)正确地估计出OLS估计量的方差,那么同样 可以进行假设检验。这种方法称为稳健性检验
稳健性t检验
o 一旦得到了稳健性标准误,就可以在此基础上构造稳健性t 统计量(robust t statistics) ,进而进行稳健性t检验。 稳健t统 性计量 OL 稳 估 S健 计性 值 假标 设准 值误
稳健性t检验
例题8_1:工资方程(课本p253,例8.1)
lwage
married_male married_female single_female educ exper expersq tenure tenursq _cons
异方差性及后果
异方差性可能导致预测结果在不同时间或不同样本上 波动较大,影响预测的稳定性。
预测置信度降低
由于异方差性的存在,使得预测结果的置信度降低, 难以确定预测结果的可靠性。
对决策的影响
决策失误风险增加
01
由于异方差性导致模型预测结果的不准确和不稳定,可能导致
决策失误的风险增加。
资源分配不合理
使用异方差性检验方法,如White检验、 Goldfeld-Quandt检验等,对模型进行检验, 如果检验结果显著,则说明存在异方差性。
通过比较不同预测变量对应的残差大小,如果 不同预测变量对应的残差大小差异较大,那么 可能存在异方差性。
02
异方差性的来源
数据来源
异常值
数据中的异常值可能导致异方差 性,因为异常值可能与其他数据 点存在较大差异,从而影响方差 估计。
加权最小二乘法(WLS)
WLS也是一种异方差性稳健的模型,它通过对不同的观测值赋予不同的权重来纠正异 方差性。WLS的优点是可以处理非线性和非正态的异方差性。
05
异方差性的检验
图示检验法
残差图检验
通过绘制实际观测值与预测值的残差, 判断是否存在异方差性。如果残差随 预测值的增加或减少而变化,则可能 存在异方差性。
02
异方差性可能导致决策者在资源分配上出现偏差,使得资源未
能得到有效利用。
战略规划受阻
03
异方差性可能影响战略规划的制定和实施,使得企业或组织的
发展受到限制。
04
异方差性的处理方法
变换数据
1 2
对数变换
对数变换可以减少异方差性,特别是当数据具有 较大的方差时。对数变换的公式是$y = log(x)$。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差
xi2 E (ui2 ) 2 xi x j E (ui u j ) ( x )
i j 2 2 i
Cov(ui , u j ) E[ui E (ui )][u j E (u j )]
协方差
E (ui u j )
( xi2 )2
或
xi2 i2
( xi2 ) 2
2
其中的 i2 未知,且不再是常数,也就不能再用OLS中的方法:
ˆ (ei2 ) (n k ) 2 ˆ* ˆ* 去估计,因此事实上 Var( 2 ) 已难以确定, SE(2 ) 也将难
如 以确定。
ˆ (ei2 ) (n 2) 2
(当有K个解释变量时,可作类似的辅助回归)
检验的基本步骤:
例如,对于
Yt = β1 + β2 X 2t + β3 X 3t +ut
et2 1.估计原模型并计算
ˆ 用OLS法估计原模型,计算残差 et Yt - Yt ,并求残差 2 。生成新变量 e2 的平方 et t
2 t2 1 2 X 2t 3 X 3t 4 X 2t 5 X 32t 6 X 2t X 3t vt 3.三个解释变量的模型 Yt = 1 + 2 X 2t + 3 X 3t + 4 X 4t +ut
2 辅助回归为: et2 = α1 +α2 X 2t +α3 X 3t +α4 X 4t +α5 X 22t +α6 X 32t +α7 X 4t (注意:此时有交叉项) +α8 X 2t X 3t α9 X 2t X 4t α10 X 3t X 4t vt
同一对象不同时间的差异)
注意:在经济高速增长,经济结构发生较大变化时,时 间序列也常出现异方差
8
第二节 异方差性的后果
一、对OLS估计量的影响
1. 存在异方差时,OLS估计仍然是无偏估计(无偏性证明 中,只用到 Cov( X i , ui ) E( xiui ) 0 的条件,不涉及异方差) 2. OLS估计量不再具有有效性 ●最小方差性的证明条件之一——同方差性已不成立
尽管参数的OLS估计量仍然无偏,并且基于此的预 测也是无偏的,但是
●由于
2 i
难以确定,Y的方差也难以确定,Y置信
区间的确定事实上会出现困难
● 由于异方差的存在, ˆ 的方差会增大或缩小,Y的预 k 测区间会偏大或偏小。
2 ˆ ●存在异方差性,使得用 2 ei2 n k 对 的估计
2. 如果方差随X递减 对递减型异方差,可构造统计量
F
e
2 1i
e 2i 2
nc ( k) 2 nc ( k) 2
也就是将第一段样本作为分子,将第二段样本作为分母。 然后F检验检验原假设,检验方法相同。
三、 White检验
基本思想:
i2与某解释变量有关系。可通 如果存在异方差,其方差 i2 是否与解释变量有关系去检验异方差。 过检验 i2 未知。可用原模型回归剩余平方 ei2 作 (1)一般 2 为 i 的估计值作辅助回归。
同方差性的图示
当只有一个解释变量时 Yi 1 2 X i ui
概 率 分 布 密 度
Y
· · · · · · · · · ·· · · · ·· · · ·
Xi
注意: 随 X i 的变化, Y 的条件期望 E (Yi X i ) 是变化的 随 X i 的变化, u i 或 Y 的条件方差是不变的常数
可以看出,仍然用不存在异方差性时的OLS方式估计其 ˆ 方差,即用 Var ( 2 ) 2 xi2
所估计的方差是可能会低估或高估存在异方差时的的真 实方差。
ˆ 后果: 低估或高估 Var ( 2 ) ,也就会高估或低估 t 统计 量,用t检验对参数统计显著性的检验失去意义。
三、对预测和区间预测的影响
(有效性证明用到 Var (ui ) Var (Yi ) 2 的条件)
9
异方差对参数估计量方差的影响
(以一元回归为例)
第二章证明过对于 有 xi ui ˆ
2 2
Yi 1 2 X i ui
(见教材P38)
ˆ ) E ( )2 E[( xi ui ) ]2 ˆ Var ( 2 2 2 2 2 xi2 E[
异方差性
异方差性
●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
第一节 异方差性的概念
一、 异方差的实质
对于
Yi 1 2 X 2i 3 X 3i k X ki ui
同方差的含义
同方差性:对所有的 i (i 1,2,..., n) 有:
X
异方差性含义
随机扰动的方差可能随 X i 的变化而变化,这种情
况称为存在异方差性,以 Yi 1 2 X i ui 为例,
表现为
Var (ui X i )
2 i
(i 1,2, n)
Var (ui X i ) 2 对比同方差时为
异方差可看成是由于某个解释变量的变化而引起的,
(c)
X
(d )
X
Y与X之间图形举例:
用1998年四川省各地市州农村居民家庭消费支出与家 庭纯收入的数据,绘制出消费支出对纯收入的散点图, Y1 其中用 表示农村家庭消费支出, 表示家庭纯收 X1 入。
二、 Goldfeld-Quandt 检验(GQ检验)
作用:检验递增性(或递减性)异方差。 基本思想:
则可写为
Var(ui X i ) f ( X i )
2 i 2
异方差性的图示
当只有一个解释变量时 Yi 1 2 X i ui
概 率 分 布 密 度
储蓄Y
· · · · · · · · · · · · · · · · · ·
Xi
收入X
的变化
随着
Xi
ui
或 Y 的条件方差也随着变化
ui
服从正态分布,并除异方差外满足其他基本假定
具体步骤:
●排序: 将观测值按解释变量X的大小顺序排列 ●数据分组:去掉中间的C个观测值,分别进行前后 ( 两部分n c) 2 个观测值的回归
●提出假设:分别进行前后两部分回归的基础上,提 出检验假设:
H o : ui 是同方差 H0 : i2 2 即
x
]2
2 i
xiui x
2 i
用到: ( a b) 2 a 2 2ab b 2 ( ai ) 2 ai2 2 ai a j
i j
E[
( xi ui ) 2 2 xi ui x j u j ( x )
i j 2 2 i
]
注意: 因为 E(ui ) 0
H1 : ui 是异方差(方差随X递增或递减)
如为递增 如为递减
2 2 2 H1 : 1 2 n 2 2 2 H1 : 1 2 n
●构造F统计量:
1. 若方差随X递增
nc e ( 2 k) F 统计量 nc 2 e 1i ( 2 k ) F服从第一、二自由度均为 [(n c) 2] k 的F 分布。
2、 仍用OLS法去估计参数的方差,会高估或低估参
数估计量的方差。
12
如果异方差为
* 2
i2 2 f ( X i )
2
2 i i 2 i i 2 i 2 i 2 2 i
x f ( X ) Var( ˆ ) x f ( X ) ˆ ) Var ( x x x
7
Y
●把非线性模型设定为线性,可
能导致异方差(如图)
2. 统计测量误差导致的异方差
X
因为测量误差有可能随解释变量X的增大而增大
3. 截面数据中总体各单位的差异通常较明显
一般说异方差性在截面数据中可能比在时间序列数据 中更常出现(原因:同一时点不同对象的差异一般会大于
(本章讨论)
ˆ Var ( 2 )
xi2 E (ui2 ) ( x )
2 2 i
( xi2 )2
二、解释变量的显著性检验的影响
1. 参数估计量方差的确定会面临困难 例如一元回归中,可证明异方差时
对比:无异方差时
ˆ Var ( 2 ) xi2
2 xi2
ˆ* Var ( 2 )
●将观测值按
X i 的大小顺序排列
Yi
C个
●去掉中间位置的一部分观测
值,从而把观测值分为前后两
部分 (目的是提高分辨性)
Xi
●将前后两部分观测值分别作回归,分别计算出各部分
的剩余
ei
,
● 比较前后两个回归的扰动项方差
前提条件: ●样本容量较大 ●
是有偏的,在此基础上的区间估计和假设检验都将 不可靠。
ˆ (在 2 ei2 n k 是 2 无偏估计的证明中用到了同方差性假定)
第三节 异方差性的检验
一. 图形分析法
基本思想:
异方差性的表现是 u i 的方差随某个解释变量的变 化而变化,或Y的分散程度随X的变化而变化。 具体方法: (两种图形) ●假定不存在异方差,进行回归,并计算剩余平方e 2 ,描绘
Var(ui X i ) Var(Yi X i ) 2
因为方差是度量被解释变量 Y 的观测值围绕条件期望 E(Yi X 2 , X 3, X k ) 1 2 X 2i 3 X 3i ... k X ki 的分散程度,因此同方差性指的是所有观测值围绕回