计量经济学课件:第五章-异方差性汇总

合集下载

计量经济学第五章

计量经济学第五章
• 首先估计出一般方程 • View/Coefficient Tests/Redundant
Variables-Likelihood Ratio • 出现对话框时,写入删除变量名--OK • 对比删除前后的AIC与SC信息值,信息
值小的结论是应采纳的。
9
用Eviews的误设定检验3
• 第一,估计出简单(单纯)方程 • 第二,在命令窗口上写入genr v_hat=resid 或者 Procs/Generate Series中 v_hat=resid 发现 v_hat • 第三,估计出新的回归方程
无约束模型(U)
有约束模型(K) (general to simple)
计算统计量F
F=(RSSK-RSSu)/J RSSu/(n-k-1)
~F(J, n-k)
J 为表示约束条件数, K 为表示自变量数 或者 应估计的参数数, n 为表示样本数(obs)
4
2. LM检验(Lagrange Multiplier
多重共线性多出现在横截面资料上。
16
三、异方差性的检验及对策
Var(ℇi)≠Var(ℇj) (i≠j)时, ℇi中存在异方差性(Herteroskedasticity)。 即随机项中包含着对因变量的影响因素。 异方差性多发生在横截面资料上。
17
异方差性的检验
1.图示检验法 如模型为Yi=0+1X1i+2X2i+…+ℇi 时,
7
用Eviews的误设定检验1
• 首先估计出简单(单纯)方程 • View/Coefficient Tests/Omitted
Variables-Likelihood Ratio • 出现对话框时,写入新变量名 OK • 检验结果出现在上端,如果P值很小时, 拒

庞浩 计量经济学5第五章 异方差性

庞浩 计量经济学5第五章  异方差性

同方差
递增型异方差
递减型异方差
复杂型异方差
18
2.借助X-e2散点图进行判断 观察散点的纵坐标是否随解释变量Xi的变化而 变化。
~2 e2e i ei e2 ~2
X 同方差 递增异方差
X
e2
~2 e i
~2 e 2 e i
X 递减异方差 复杂型异方差
X
19
二、戈德菲尔德—夸特 (Goldfeld-Quanadt)检验
3
说明1
矩阵表示: Y X u 随机扰动项向量 其方差—协 u1 u 方差矩阵不 2 u 再是: un n1 而是:
2 2 Var Cov ( ui ) 2 nn
ei X i v i
ei
1 vi Xi
ei X i v i 1 ei vi Xi
③利用上述回归的R2、t统计量、F统计量等判断,R2 好、t统计量和F统计量显著,即可判定存在异方差。 28
说明: 1.也可以用 e i 与可能产生异方差的多个解释变 量进行回归模拟; 2.戈里瑟检验的优点在于不仅检验了异方差是否 存在,同时也给出了异方差存在时的具体表现 形式,为克服异方差提供了方便。 3.试验模型选得不好,也可能导致检验不出是否 存在异方差性。
12 2 2 Var Cov ( ui ) 2 n nn
4
说明2
随机扰动项 ui具有异方差性,可理解释为被解释变量 的条件分散程度随解释变量的变化而变化,如下图所 示:var( ui ) i2 2 f ( X i)(i 1,2,, n)
10
第二节 异方差性的后果

异方差性的概念、类型、后果、检验及其修正方法含案例

异方差性的概念、类型、后果、检验及其修正方法含案例
例4.1.1: 在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中,i的同方差假定往往不符合实际情况。对高收 入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律 性(如为某一特定目的而储蓄),差异较小。
因此,i的方差往往随Xi的增加而增加,呈单调递增型变化 。
– 在选项中,EViews提供了包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”和没有交叉项的怀特检 验“White Heteroskedasticity(no cross terms)” 这样两个 选择。
• 软件输出结果:最上方显示两个检验统计量:F统计 量和White统计量nR2;下方则显示以OLS的残差平 方为被解释变量的辅助回归方程的回归结果。
随机误差项具有不同的方差,那么: 检验异方差性,也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于:用什么来表示随机误差项的方差? 一般的处理方法:
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
【书上这句话有点问题】
其中 所以,当模型出现异方差性时,Y预测区间的建立将发生困 难,它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验(教材P111)
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值,
(注意:其中的2完全可以是1)

计量经济学课件第五章 异方差性

计量经济学课件第五章 异方差性

计量经济学课件第五章异方差性第五章异方差性1 / 80计量经济学课件第五章 异方差性 2 / 80引子:更为接近真实的结论是什么?根据四川省2000年21个地市州医疗机构数及人口数资料,分析医疗机构及人口数量的关系,建立卫生医疗机构数及人口数的回归模型。

对模型估计的结果如下:ˆ Yi -563.0548 5.3735 X i(291.5778) (0.644284) t (-1.931062) (8.340265) R2 0.785456 R 2 0.774146 F 69.56003式中 Y 表示卫生医疗机构数(个), X 表示人口数量(万人)。

计量经济学课件第五章 异方差性3 / 80模型显示的结果和问题 ●人口数量对应参数的标准误差较小;● t 统计量远大于临界值,可决系数和修正的可决系数结果较好,F 检验结果明显显著;表明该模型的估计效果不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735人。

然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。

有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?计量经济学课件第五章 异方差性4 / 80第五章 异 方 差 性 本章讨论四个问题:●异方差的实质和产生的原因●异方差产生的后果●异方差的检测方法●异方差的补救计量经济学课件第五章 异方差性5 / 80第一节 异方差性的概念 本节基本内容:●异方差性的实质●异方差产生的原因计量经济学课件第五章 异方差性6 / 80一、异方差性的实质 同方差的含义同方差性:对所有的 i (i1,2,..., n)有: Var(ui ) = 2 (5.1) 因为方差是度量被解释变量 Y 的观测值围绕回归线 E(Yi ) 1 2 X 2i 3 X 3i ... k X ki (5.2) 的分散程度,因此同方差性指的是所有观测值的分散程度相同。

计量经济学课件:第五章-异方差性汇总

计量经济学课件:第五章-异方差性汇总

第五章异方差性本章教学要求:根据类型,异方差性是违背古典假定情况下线性回归模型建立的另一问题。

通过本章的学习应达到,掌握异方差的基本概念包括经济学解释,异方差的出现对模型的不良影响,诊断异方差的方法和修正异方差的方法。

经过学习能够处理模型中出现的异方差问题。

第一节异方差性的概念一、例子例1,研究我国制造业利润函数,选取销售收入作为解释变量,数据为1998年的食品年制造业、饮料制造业等28个截面数据(即n=28)。

数据如下表,其中y表示制造业利润函数,x表示销售收入(单位为亿元)。

Y对X的散点图为从散点图可以看出,在线性的基础上,有的点分散幅度较小,有的点分散幅度较大。

因此,这种分散幅度的大小不一致,可以认为是由于销售收入的影响,使得制造业利润偏离均值的程度发生了变化,而这种偏离均值的程度大小不同是一种什么现象?如何定义?如果非线性,则属于哪类非线性,从图形所反映的特征看并不明显。

下面给出制造业利润对销售收入的回归估计。

模型的书写格式为2ˆ12.03350.1044(0.6165)(12.3666)0.8547,..84191.34,152.9322213.4639,146.4905Y YX R S E FY s =+=====通过变量的散点图、参数估计、残差图,可以看到模型中(随机误差)很有可能存在一种系统性的表现。

例2,改革开放以来,各地区的医疗机构都有了较快发展,不仅政府建立了一批医疗机构,还建立了不少民营医疗机构。

各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服务的需求量,而医疗服务需求与人口数量有关。

为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。

根据四川省2000年21个地市州医疗机构数与人口数资料对模型估计的结果如下:i iX Y 3735.50548.563ˆ+-= (291.5778) (0.644284) t =(-1.931062) (8.340265)785456.02=R 774146.02=R 56003.69=F式中Y 表示卫生医疗机构数(个),X 表示人口数量(万人)。

第五章第四节 异方差的解决方法

第五章第四节  异方差的解决方法

(5)权数的选择(**)
• 一般地,Wi=1/2i。问题在于:2i一般是未知的 • 关键:找出ui随着Xi的变化而变化的规律,对异方差
Var(ui)= 2i = 2 f( Xi )( i=1,2,…,n)的具体形式作出 合理假设。
• 怎样才能提出合理的假设呢? (1)通过对具体经济问题的经验分析,或 (2)考察OLS的ei2与Xi的关系,或 (3)通过White等检验的结果提供的信息 • 粗略做法: Wi =1/|ei|或1/ ei2 ,ei是OLS估计的残差 • 所以,利用WLS的思路是:寻找合适的“权数”,
4.WLS法在eviews中的实现
1.创建文件:File/New/Workfile/输入数据频率/Ok 2.输入数据:在主菜单,点quick / empty group/输入变量
名称和数值/ 3.产生新序列:在eviews栏,点quick/generate series/输
入w=1/sqr(x),点ok(假设w=1/sqr(x) 4.作回归:在eviews栏,点quick/ estimate equation/键入
变量和常数[如y c x],同时点右下方的option,选择 Weighted LS/TLS,键入w,点ok
同质性 权数序列名
二、对原模型变换的方法
1、模型变换法的定义
模型变换法是对存在异方差的总体回归模型作适当的代数变换,使之成为满足同方 差假定的模型 , 进而运用OLS方法估计参数。
2、模型变换法的关键是: 通过对具体经济问题的经验分析,事先对异方差
往往有较小的差异。
利用EViews对模型进行对数变换
例 ln Yi 1 2 ln Xi ui 在eviews栏,点quick/generate series/输入 LY=LOG(Y) 在eviews栏,点quick/generate series/输入 LX=LOG(X)

第五章-异方差性-答案说课讲解

第五章-异方差性-答案说课讲解

第五章-异方差性-答案第五章 异方差性一、判断题1. 在异方差的情况下,通常预测失效。

( T )2. 当模型存在异方差时,普通最小二乘法是有偏的。

( F )3. 存在异方差时,可以用广义差分法进行补救。

(F )4. 存在异方差时,普通最小二乘法会低估参数估计量的方差。

(F )5. 如果回归模型遗漏一个重要变量,则OLS 残差必定表现出明显的趋势。

( T )二、单项选择题1.Goldfeld-Quandt 方法用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性2.在异方差性情况下,常用的估计方法是( D )A.一阶差分法B.广义差分法C.工具变量法D.加权最小二乘法3.White 检验方法主要用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性4.下列哪种方法不是检验异方差的方法( D )A.戈德菲尔特——匡特检验B.怀特检验C.戈里瑟检验D.方差膨胀因子检验5.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即( B )A.重视大误差的作用,轻视小误差的作用B.重视小误差的作用,轻视大误差的作用C.重视小误差和大误差的作用D.轻视小误差和大误差的作用6.如果戈里瑟检验表明,普通最小二乘估计结果的残差与有显著的形式的相关关系(满足线性模型的全部经典假设),则用加权最小二乘法估计模型参数时,权数应为( B )A. B. C. D. 7.设回归模型为,其中()2i2i x u Var σ=,则b 的最有效估计量为( D )i e i x i i i v x e +=28715.0i v i x 21i x i x 1ix 1i i i u bx y +=A. B. C. D. ∑=i i x y n 1b ˆ 8.容易产生异方差的数据是( C )A. 时间序列数据B.平均数据C.横截面数据D.年度数据9.假设回归模型为i i i u X Y ++=βα,其中()2i 2i X u Var σ=,则使用加权最小二乘法估计模型时,应将模型变换为( C )。

计量经济学--异方差性讲解

计量经济学--异方差性讲解

图1:我国税收和GDP
图2:1998年我国制造工业和利润
X-GDP Y-税收
X-销售收入 Y-销售利润
两个散点图有共同的特征,随着自变量增加,因变量也 增加,但是图2中,当X比较小时,数据点相对集中,随 着X增大,数据点变得相对分散。而图1中数据分布却没 有出现这一特征。
异方差的性质
➢经典线形回归模型的一个重要假定是同方差性:
PRF的干扰项 u i 是同方差的(homoscedastic)
即: E(ui2) 2
i 1, 2, , n (3.3.1)
➢异方差性是指,ui 的条件方差(= Yi 的条件方差)
随着X的变化而变化,用符号表示为:
E (ui2
)
2 i
(3.3.2)
Var(Yi ) Var(ui )
异方差产生的主要原因
——这就是GLS方法,得到的是GLS估计量
•模型函数形式存在设定误差 •模型中遗漏了一些重要的解释变量 •随机因素本身的影响
异方差较之 同方差更为
常见
7
异方差的具体理由
➢按照边错边改学习模型(error—learning models),人 们的行为误差随时间而减少。
➢随着收入的增长,人们在支出和储蓄中有更大的灵活
性。在做储蓄对收入的回归中, i2与收入俱增
此时如果仍采用
计算斜率参数的方差,将会
产生估计偏误,偏误的大小取决与因子值的大小。
17
3.t检验的可靠性降低
由于异方差的存在,无法正确估计参数的方差和标 志误差,因此也影响到t检验的效果
4.模型的预测误差增大
模型的预测区间和随机误差项的方差有着紧密联 系,随着随机误差项方差的增大,模型的预测区 间也随之增大,模型的预测误差也会相应增加。

计量经济学第五章 异方差

计量经济学第五章 异方差

X 20000
5.3异方差的侦查
利用残差图——绘制残差平方与X散点图
(一般把异方差看成是由于解释变量的变化而引起的)
5.1异方差的概念
三、异方差产生的原因 模型设定误差:省略了重要的解释变量
例:真实模型 Yi 1 2 X 2i 3 X 3i i 采用模型 Yi 1 2 X 2i i
如果X3随着X2的不同而对Y产生不同的影响,则 该影响体现在扰动项中。
测量误差: 一方面,测量误差常常在一定时间内逐渐增加,如X 越大,测量误差就会趋于增大 另一方面,测量误差随时间变化趋于减少,如抽样技 术的改进使得测量误差减少。
)


2 i
5.1异方差的概念
6 Y
4
300 Y
200
2
100
0 0
X
0
X
10
20
30
0
5000
10000
15000
20000
250
Y
二、常见的异方差类型: 200
递增型异方差:
150
100
递减型异方差:
50
条件异方差(略):
0 0
X
10
20
30
时间序列数据和截面数据中都有可能存在异方差。
经济时间序列中的异方差常为递增型异方差。
ˆ 2 ei2 (Yi ˆX i )2 (( ˆ) X i i )2
n 1
n 1
n 1
5.2异方差的后果
E (vaˆr(ˆ ))

E(
ˆ 2

X
2 i
)

E(

(( ˆ)X
(n 1)

计量经济学第五章 异方差性

计量经济学第五章 异方差性
第五章 异 方 差 性
●异方差性的概念 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
1
第一节 异方差性的概念
一、异方差性的实质 二、异方差产生的原因
2
一、异方差性的实质
设模型为
Yi 1 2 X 2i 3 X3i ... k X ki ui
如果对于模型中随机误差项,有:
8
第二节 异方差性的后果
一、对参数估计统计特性的影响 二、对参数显著性检验的影响 三、对预测的影响
9
一、对参数估计式统计特性的影响
1、仍然具有线性性 2、仍然具有无偏性
参数估计的无偏性仅依赖于基本假定中的零 均值 假定(即 E(ui ) 0 )。所以异方差的存在对 无偏性的成立没有影响。
3、仍然具有一致性 4、不再具有最小方差性
24
4、检验的特点
(1)适用于大样本; (2)检验递增型或递减型异方差; (3)只能判断异方差是否存在,在多个解释变 量的情下,对哪一个变量引起异方差的判断存在局 限; (4)该检验的功效取决于C,C值越大,检验功 效越好; Continued
25
Continued (5)两个子样回归所用的观测值个数如果不 相等时,也可以用该检验,需要通过改变自由度 和统计量的计算公式来调整; (6)当模型中包含多个解释变量时,应对每 个可能引起异方差的解释变量都进行检验。
26
三、White检验
1、基本思想:
构造残差平方序列与解释变量之间的辅助函 数,通过判断辅助函数的显著性来判断原方程是 否存在异方差。 一般而言,辅助回归的解释变量包括常数项、 原模型中的解释变量、解释变量平方、其交叉乘 积。
27
2、检验的基本步骤:
原模型为

《异方差性》PPT课件 (2)

《异方差性》PPT课件 (2)
• scalar lm1 = e(N)*e(r2)display _n "LM statistic : " %6.3f lm1 /*
• 通常的LM=3.54 • 异方差—稳健LM=4.00 • 仍然不能拒绝H0 • 问题:语句的意思,有没有直接计算LM的命令〔robust LM statistic已有,那么前面的计
?
• predict ubar1, resid • quite reg avgsen pcnv ptime86 qemp86 inc86 black hispan • predict r1, r • quite reg avgsensq pcnv ptime86 qemp86 inc86 black hispan • predict r2, r • quite gen ur1 = ubar1*r1 • quite gen ur2 = ubar1*r2 • gen iota = 1 • reg iota ur1 ur2, noconstant • scalar hetlm = e(N)-e(rss) • scalar pval = chi2tail(2,hetlm) • display _n "Robust LM statistic : " %6.3f hetlm /* • > */ _n "Under H0, distrib Chi2(2), p-value: " %5.3f pval
异方差-稳健的F统计量
例8.2 P255 GPA3.DTA
例8.2 P255 GPA3.DTA
• 1.异方差-稳健回归得R-square=0.4006 • 〔注意是春季学期,所以有条件项〕
2.联合显著性检验—约束方程回归 求R-squared=0.3983

【总结】计量经济学异方差性、多重共线性、自相关的联系与区别知识总结

【总结】计量经济学异方差性、多重共线性、自相关的联系与区别知识总结

《计量经济学》中多重共线性、异方差性、自相关三者之间的联系与区别首先我们先来回顾一下经典线性回归模型的基本假设:1、为什么会出现异方差性我们可以从一下两方面来分析:第一,因为随即误差项包括了测量误差和模型中被省略的一些因素对因变量的影响;第二,来自不同抽样单元的因变量观察值之间可能差别很大。

因此,异方差性多出现在截面样本之中。

至于时间序列,则由于因变量观察值来自不同时期的同一样本单元,通常因变量的不同观察值之间的差别不是很大,所以异方差性一般不明显。

含义及影响:y=X β+ε,var(εi )var(εj ), ij ,E(ε)=0,或者记为212200['|]0000n E X σεεσσ⎛⎫⎪=Ω= ⎪ ⎪⎝⎭即违背假设3。

用OLS 估计,所得b 是无偏的,但不是有效的。

111(')'(')'()(')'b X X X y X X X X X X X βεβε---==+=+由于E(ε)=0,所以有E(b )=β。

即满足无偏性。

但是,b 的方差为1111121var(|)[()()'][(')''(')|] (')'['|](') (')'()(')b X E b b E X X X X X X X X X X E X X X X X X X X X X ββεεεεσ------=--===Ω其中212200['|]0000n E X σεεσσ⎛⎫⎪=Ω= ⎪ ⎪⎝⎭2、自相关产生的原因:(1)、经济数据的固有的惯性带来的相关 (2)、模型设定误差带来的相关 (3)、数据的加工带来的相关 含义及影响:cov(,)0,i j i j εε≠≠影响:和异方差一样,系数的ls 估计是无偏的,但不是有效的。

D -W 检验(Durbin -Watson )221212222121212222112112122211221122121()()()2()()222222(1)n i i i n i i n n n i i i i i i i n i i n n n i i i i i i i n n i i n i i i nn n i i i i nn i ie e d e e e e e e e e e e e e e e e e e e e e e e ρρ=-===-=-====-==-===∑-=∑∑+∑-∑=∑∑+∑-∑--=∑∑+=--∑∑+=--∑≈-其中2121n i i i n i ie e e ρ=-=∑=∑是样本一阶自相关函数。

计量经济学第五章-异方差

计量经济学第五章-异方差
由于异方差,会使得OLS估计的方差增大, 从而造成预测误差变大,降低预测精度。
可编辑ppt
5
一、参数的OLS估计仍然是线性无偏的,但不 是最小方差的估计量
1、线性性
bˆ1
= xi yi xi 2
= b1
+ xi ui xi 2
一元线性回归模型为例
2、无偏性
E( bˆ1 )=E(
b1
+
xi ui xi 2
在同方差的假定下才被证明是服从 t 分布的。 分母变大,t 值变小,t 检验也就失去意义。
三、降低预测精度
由于存在异方差,参数的OLS估计的方差增大,参数 估计值的变异程度增大,从而造成对 Y 的预测误差变大, 降低预测的精度。
可编辑ppt
7
第二节 异方差的检验
• 1、图解法 • 2、戈德菲尔德—匡特法(双变量模型) • 3、怀特检验(White) • 4、戈里瑟(Glejser)检验 • 5、帕克(Park)检验
• 二、随着收入的增长,人们有更多的备用收入,从而如何支配 他们的收入有更大的选择范围。因此,在做储蓄对收入的回归 时,很可能发现,由于人们对其储蓄行为有更多的选择,与收 入俱增。
• 三、个体户收入随时间变化。
• 四、异方差还会因为异常值的出现而产生。一个超越正常值范 围的观测值或称异常值是指和其它观测值相比相差很多(非常 小或非常大)的观测值。
)= b1+
xi E(ui xi 2
)
=
b1
3、方差
该形式不具有最小方差
Var( bˆ1 ) =
i 2
xi 2
在同方差时,
xi2 Xi2 xi 2
该形式具有最小方差
Var(

异方差性的概念、类型、后果、检验及其修正方法(含案例)

异方差性的概念、类型、后果、检验及其修正方法(含案例)
引 言
• 在教材P29-32和P64-65,分别对一元和多元线性回归模型
提出了若干基本假设,只有在满足这些基本假设的情况下, 应用普通最小二乘法才能得到无偏的、有效的参数估计量。 • 但是,在实际的计量经济学问题中,完全满足这些基本假 设的情况并不多见。 • 如果违背了某一项基本假设,那么应用普通最小二乘法估 计模型所得参数估计量就可能不具有某些优良特性,这就需 要发展新的方法估计模型。 • 本章正是要讨论违背了某一项基本假设的问题及其估计方 法。

ˆ
j
j
c
jj
2

ˆ
j 2
j
( X X ) 1 jj
(j=0,1,2,…,k)
2 。 包含有随机误差项共同的方差
如果出现了异方差性,而仍按同方差时的公式计算t 统计量,将使t统计量失真【偏大或偏小,见第三版P110补 充说明】,从而使t检验失效【使某些原本显著的解释变量
2 E() I

Var( ) 2 , i 1,2, , n i Cov( , ) 0, i j i j
即同方差和无序列相关条件。
2.变量的显著性检验失去意义
在变量的显著性检验中,t统计量
t ˆ
j j j
ˆ ) Se(


• 一般经验告诉人们:对于采用截面数据作样本
的计量经济学问题,由于在不同样本点(即不
同空间)上解释变量以外的其他因素的差异较
大,所以往往存在异方差性。
二、异方差性的后果
1.参数估计量非有效
• 当计量经济学模型出现异方差性时,其普通最小二乘法参 数估计量仍然具有无偏性,但不具有有效性。而且,在大样 本情况下,参数估计量仍然不具有渐近有效性。 因为在有效性证明(见教材P70-71)中利用了

异方差

异方差
将居民按照收入等距离分成n组,取组平均数为样 本观测值。 一般情况下,居民收入服从正态分布:中等收入 组人数多,两端收入组人数少。而人数多的组平均 数的误差小,人数少的组平均数的误差大。 所以样本观测值的观测误差随着解释变量观测值 的不同而不同,往往引起异方差性。
第一节 异方差的概念
例:以某一行业的企业为样本建立企业生产函数模 型 Yi=Ai1 Ki2 Li3ei 被解释变量:产出量Y 解释变量:资本K、劳动L、技术A, 那么:每个企业所处的外部环境对产出量的影响被 包含在随机误差项中。 每个企业所处的外部环境对产出量的影响程度不同 ,造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量观 测值的变化而呈规律性变化,呈现复杂型。
第三节 异方差性的检验
三、戈里瑟(Gleiser)检验 1969年戈里瑟提出的,它不但可以检验异方差是 否存在,而且可以近似探测随机误差项的方差是 怎样随解释变量的变化而变化的。 基本思想:由OLS法得到残差 e i ,取 e i 的绝对 值 ,然后将 对某个 X i回归,根据回归模 ei ei 型的显著性和拟合优度来判断是否存在异方差。
二、异方差性的后果
ˆ
2
e
2 i
n2
ˆ s(1 )

ˆ ki
2
2

ˆ2

(Xi X )
2
但是,在异方差的情况下
ˆ* s( i ) ˆ ki i
2 2
ˆ i ki
2 2
ˆ ki
2
2
i ki ki
2
2

ˆ s(i )
i Байду номын сангаасi
第三节 异方差性的检验

计量经济学异方差精品PPT资料

计量经济学异方差精品PPT资料
随机误差项的方差并不随某一个解释变量观测值 的变化而呈规律性变化,呈现复杂型。
• 一般经验,对于采用截面数据作样本的 计量经济学问题,由于不同样本点上解
释变量以外的其他因素的差异较大,所 以往往存在异方差。
二、异方差性的后果 Consequences of Using OLS in the
Presence of Heteroskedasticity
V ar(i)E(i2)e ~ i2 最 好 在 大 样 本 条 件 下 (使 2用 .4 .7)
即 用 e ~ i2来 表 示 随 机 误 差 项 的 方 差 。
从而可进一步考察其与X的相关性及其具体的形式。
( 2 1 ) X - e ~ i 2 的 散 点 图 进 行 判 断
看是否形成一斜率为零的直线
问题在于如何获得随机误差项 (从总体带来的)的方差
• 问题在于如何获得随机误差项 (从总体带 WLS估计的Eviews软件的实现
以案例1为例:由于不知ei与Xi之间具体的函数关系。
i
来的)的方差 从而可进一步考察其与X的相关性及其具体的形式。
White1980年提出。 假设6:随机项满足正态分布
一般的处理方法:
2 任 意 选 择 c 个 中 间 观 测 值 略 去 . 经 验 表 明 , 略 去 数 目 c 的 大 小 , 大 约 相 当 于
样 本 观 测 值 个 数 的 1 .剩 下 的 n c 个 观 测 值 平 均 分 成 两 组 , 每 组 观 测 值 的 个 数 为 n c.
4
2
(3)对每个子样本分别进行OLS,并分别计算各自的残差平方和。
E
X
X
1
X
X
X
X

计量经济学解析ppt课件

计量经济学解析ppt课件
571图示检验法1相关图分析看是否存在明显的散点扩大缩小或复杂型趋势即不在一个固定的带型域中同方差递增异方差递减异方差先减后增同方差递增异方差递减异方差复杂型异方差594重复操作生成新变量e2令e2resid2残差的平方并与x以组群辅助族群的形式打开结果如左图所示
计量经济学解析
经济学院 邓嘉纬
编辑版pppt
编辑版pppt
37
6、共有样本38个,查T统计量分布表,自由度n=35,α=0.025, 得t=2.0301。可知x3,x4的t-statistic值不具有显著性,舍去。由 此得出下图结果。
编辑版pppt
38
(二)、残差分析(Residual )
1、以第三大点的国内消费函数为例,重复基础操作创建工作文件,命名 为“残差分析”,显示如左图所示。 2、如下创建方程,工具栏view→actual fitted residual(实际拟合残差分析) →actual fitted residual table(实际拟合残差分析表),显示如右图所示。
编辑版pppt
7
选择相应数据文件。在此,我们选择中国国家统计局2016年统计年鉴的313“支出法或内生产总值”作为本例数据,数据如右图所示。
编辑版pppt
8
数据导入后,按照相关变量关系设置变量x与y,在本例中,根据凯 恩斯消费函数y=α+βx,我们将消费设置为y,国内生产总值设置为x。
编辑版pppt
2
2.6093>2.093,所以数据显著存在。
编辑版pppt
53
由此可得辅助回归结果,如上图所示。所以一定存在正相关, 且递增的异方差。
编辑版pppt
54
(二)、异方差综合练习: (地区)可支配收入与交通通讯支出
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章异方差性本章教学要求:根据类型,异方差性是违背古典假定情况下线性回归模型建立的另一问题。

通过本章的学习应达到,掌握异方差的基本概念包括经济学解释,异方差的出现对模型的不良影响,诊断异方差的方法和修正异方差的方法。

经过学习能够处理模型中出现的异方差问题。

第一节异方差性的概念一、例子例1,研究我国制造业利润函数,选取销售收入作为解释变量,数据为1998年的食品年制造业、饮料制造业等28个截面数据(即n=28)。

数据如下表,其中y表示制造业利润函数,x表示销售收入(单位为亿元)。

Y对X的散点图为从散点图可以看出,在线性的基础上,有的点分散幅度较小,有的点分散幅度较大。

因此,这种分散幅度的大小不一致,可以认为是由于销售收入的影响,使得制造业利润偏离均值的程度发生了变化,而这种偏离均值的程度大小不同是一种什么现象?如何定义?如果非线性,则属于哪类非线性,从图形所反映的特征看并不明显。

下面给出制造业利润对销售收入的回归估计。

模型的书写格式为2ˆ12.03350.1044(0.6165)(12.3666)0.8547,..84191.34,152.9322213.4639,146.4905Y YX R S E FY s =+=====通过变量的散点图、参数估计、残差图,可以看到模型中(随机误差)很有可能存在一种系统性的表现。

例2,改革开放以来,各地区的医疗机构都有了较快发展,不仅政府建立了一批医疗机构,还建立了不少民营医疗机构。

各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服务的需求量,而医疗服务需求与人口数量有关。

为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。

根据四川省2000年21个地市州医疗机构数与人口数资料对模型估计的结果如下:i iX Y 3735.50548.563ˆ+-= (291.5778) (0.644284) t =(-1.931062) (8.340265)785456.02=R 774146.02=R 56003.69=F式中Y 表示卫生医疗机构数(个),X 表示人口数量(万人)。

从回归模型估计的结果看,人口数量对应参数的标准误差较小,t 统计量远大于临界值,说明人口数量对医疗机构确有显著影响,可决系数和修正的可决系数还可以,F 检验结果也明显显著。

表明该模型的估计效果还不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735个。

然而,这里得出的结论可能是不可靠的,按照四川省的经济水平和实际情况看,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。

那末,有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢? 二、异方差的定义设模型为122331,2,,i i i k ki iY X X X u i n ββββ=+++++=L L如果对于模型中随机误差项i u ,有22(|)(|),1,2,3,,.i i i i i Var u X E u X i n σ===L (()0i E u =)则称i u 具有异方差性。

进一步,把异方差看成是由于某个解释变量的变化而引起的,则22(|)()i i i i Var u X f X σσ==例1,一个食品支出与收入的关系。

表明异方差的产生与人们的收入状况有关。

设食品支出与收入之间的关系为 2123t t t t Y X X u βββ=+++式中,Y 为食品支出,X 为收入,X 2为收入的平方,并且230,0ββ><。

在食品支出与收入这种假定关系下,当X 很大的时候,Y 与均值2123()E Y X X βββ=++的偏差有可能比当X 很小时大。

这是由于低收入住户的食品支出几乎全部由收入来解释,而高收入住户的食品支出在很大程度上取决于其它因素,这样就出现了高收入住户的食品支出有一部分没有得到其收入的解释,而这一部分可能会相当大。

例2,研究浙江省农业总产值与农业劳动力人数、耕地面积之间的关系。

选取该省17个县市1992年的数据资料(截面数据),为了研究的方便,将各县市按农业总产值从小到大进行了排列。

通过EViews的操作可以看到该问题中的农业总产值与其均值之间差异程度的变化现象。

例3,根据美国一项制造业调查的资料,可以看到企业规模越大,平均生产力会越高,但生产力的波动也变大了(用标准差反映),数据见下表。

表明生产力的波动随着企业人数的增加而变大。

三、产生异方差的背景1、由于模型中缺失了某些重要解释变量,或者是随着时间的推移有可能成为重要影响因素的变量,但也应注意设定误差问题。

2、截面数据更易引起异方差(时间序列数据也要引起异方差,比如人们的打字技术随时间推移而出现的差异)。

3、由于样本数据的观测误差。

4、异方差的出现与某个解释变量的变动有关。

5、模型的设定误差。

在实际经济问题中,人们很难得到总体u的信息,因此,我们只能够通过对残差e的认识和处理,来实现对总体随机误差是否存在异方差的推断和分析。

第二节异方差性对模型的影响一、在异方差存在的前提下,参数估计值的特性1、参数估计值仍是无偏的。

设模型为n i U X Y i i i ,,2,1,21Λ=++=ββ对于参数2β的估计量2ˆβ用如下离差形式表示 ∑∑=22ˆiii xyx β式中Y Y y X X x i i i i -=-=,。

则i i i u x y +=2β U U u i i -=222222222222222)()()ˆ()(ˆββββββββ=+=+=+=+=+==∑∑∑∑∑∑∑∑∑∑∑∑∑ii i iii iii iiiiiii iiiix u x E x u x E E xux xu x x x u x x xy x在证明中用了假定0)(=i i u x E 。

2、参数估计值的方差不再是最小。

在异方差下[]())()ˆ()()()()()()(2)()(2ˆ)ˆ(ˆ)ˆ(22222222222222222222222222222222b x Var a x x x u E x x u u E x x uE x x u u x x u x E x u x E x u x E E E E Var ii j i i i iji ii iji j i j i j i ii i ji ji j i j i i i i i i i i i ∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑===+=⎪⎪⎪⎭⎫⎝⎛+=⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛-+=-=-====≠=≠σβσβββββββ同方差下有同理在上述推导中用了假定j i u u E j i ≠=,0)(。

在上述讨论的过程中,用到了边际分析的思想。

比较上述(a )式与(b )式的结果,可以看到只有当对每个i 都有22i σσ=时,才能相等。

因此,在同方差假定下,有参数估计值的方差最小,而在异方差下,参数估计值的方差就不再最小了。

二、参数显著性检验失效在参数估计中,如果忽略上述差异,仍然用(b )作为参数估计方差去衡量,可能会使得参数估计值的方差低估其真实方差。

同时,当出现异方差时,)ˆ(ˆ2βe s 与X i 的变化有关,它不再为一固定值。

从而t 统计量不确定,这时参数(如2β)的置信区间将会无意义。

三、预测精度降低由于受上述差异的影响,这时kn e i-=∑22ˆσ不再是2σ的无偏估计,从而置信区间将受到严重的误导,并且预测区间也会随着方差的变动而变化,从而使Y 的预测区间的精度会降低。

第三节 异方差性的检验对异方差性的检验主要有以下一些方法, 1、图形法。

2、Goldfeld-Quandt 方法。

3、Glejser 方法。

4、White 方法。

5、ARCH 方法。

6、Park 检验。

7、Spearman 等级相关检验。

8、Breusch-Pagan-Godfrey 检验。

9、Koenker-Bassett 检验。

等等。

下面只介绍前1-5检验方法。

1、图形法。

由残差ˆe Y Y =-,得到2e 。

以2e 为纵轴,某个解释变量jX 为横轴,画出散点图,由此可粗略判断异方差的存在。

利用前面制造业利润与销售收入之间短系的例子,由残差平方与解释变量的散点图说明异方差存在。

2、Goldfeld-Quandt 方法。

(1)前提条件。

●样本容量要充分的大(为什么?);●随机误差项~i u 正态分布,除异方差以外,其它基本假定成立。

(2)检验的基本步骤。

●将解释变量的取值按从小到大排序(也可从大到小,但F 统计量的分子于分母需要交换,为什么?)。

●将排列在中间的约1/4的观察值删除掉,记为c ,再将剩余的分为两个部分,每部分观察值的个数为(n-c)/2(根据Goldfeld 和Quandt 的证实,一元线性模型里当样本容量大于60时,c 可取16,而当n=30时,取c 为4)。

Jack Johnston ,John DiNardo (2002)指出,在除去其它因素之外,该检验功效有赖于剔除的c 的多少。

如果c 太大,∑∑2221i i e e 和的自由度会很小,检验功效自然会很低;如果c 太小,将会减弱∑∑2221i i e e 和之间的对比,检验供销也会很低。

因此,按照经验,一般c 的选取大致在n 左右。

●提出假设。

即222211220:;,,2,1,:n i H n i H σσσσσ≤≤≤==ΛΛ●构造F 统计量。

分别对上述两个部分的观察值求回归模型,由此得到的两个部分的残差平方和为∑∑2221i i e e 和,它们的自由度均为[(n-c)/2]-k ,其中k 为参数的个数。

(这里如果假定u 服从正态分布,并且同方差性假定是真实的,则可证明下式成立)于是在原假设成立的前提下,有)2,2(~]2/[]2/[2122*k c n k c n F k c n e k cn e F i i --------=∑∑●判断。

给定显著性水平α,查F 分布表,得临界值)()2,2(αk cn k cn F ----,如果F *>)()2,2(αk cn k cn F ----则拒绝原假设,接受备择假设,即模型中的随机误差存在异方差。

例如,分析某地区家庭消费与收入之间的关系,n=30。

下面是在EViews 上运用G-Q 检验的操作过程。

3、Glejser 方法。

Glejser 检验的基本思想是,由OLS 法得到残差i e ,取i e 的绝对值i e ,然后将i e 对某个解释变量i X 回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。

该检验的特点是不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。

该检验要求变量的观测值为大样本。

相关文档
最新文档