5 第五章异方差性(第二版)
计量经济学庞皓课件(第五章 异方差性)
绘制出
ei2
对
X
的散点图
i
◆如果 ui 不随 Xi 而变化,则表明不存在异方差;
◆如果 ui 随 Xi 而变化,则表明存在异方差。
19
二、Goldfeld-Quanadt检验
作用:检验递增性(或递减性)异方差。
基本思想:将样本分为两部分,然后分别对两个样 本进行回归,并计算两个子样的残差平方和所构成 的比,以此为统计量来判断是否存在异方差。
E(Yi ) 1 2 X 2i 3X3i ... k X ki (5.2)
的分散程度,因此同方差性指的是所有观测值的
分散程度相同。
6
异方差性的含义
设模型为
Yi 1 2 X2i 3 X3i ... k X ki ui i 1, 2,..., n
如果对于模型中随机误差项 ui 有:
即认为存在异方差性。
38
第四节 异方差性的补救措施
主要方法:
●模型变换法 ●加权最小二乘法 ●模型的对数变换
39
一、模型变换法
以一元线性回归模型为例:
Yi 1 2 X i ui
经检验 ui 存在异方差,且
var(ui )
2 i
2
f
(Xi)
其中 σ 2是常数,f (Xi ) 是 X i的某种函数。
40
变换模型时,用 f (Xi) 除以模型的两端得:
Yi = f(Xi )
β1 f(X i
)
+
β2
Xi + f(Xi )
ui f(Xi )
记 Yi* 则有:
Yi f (Xi)
;
X
* i
Xi f (Xi)
; 1*
Yi*
第五章 异方差性
26
异方差性的检验
问题在于用什么来表示随机误差项的方差 一般的处理方法:
Var(ui ) E(uቤተ መጻሕፍቲ ባይዱ2) ei2
图示检验法
图示检验法
(一)相关图形分析 方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释
变量Y与随机误差项u有相同的方差,所以分析Y与X的相关图,可以初 略地看到Y的离散程度与X之间是否有相关关系。
ui 的某些分布特征,可通过残差 ei 的图形对异方差进行观察。
对于一元回归模型,绘制出ei2 对Xi的散点图,对于多元回归模型,绘制出ei2 对Yi的散点图或ei2 与认为和异方差有关的X的散点图。
31
图示检验法
(二)残差图形分析
e~i 2
e~i 2
X 同方差
e~i 2
X 递增异方差
e~i 2
X 递减异方差
每个企业所处的外部环境对产出量的影响被包含在随机误差项中 每个企业所处的外部环境对产出量的影响程度不同,造成了随机
误差项的异方差性
产生异方差性的原因
产生异方差性的原因
(一)模型设定误差
假设正确的模型是:
Yi 1 2 X2i 3 X3i ui
假如略去了重要的解释变量X3 ,而采用 Yi 1 2 X2i vi
排序,再按戈德菲尔德匡特检验方法回归,否则即使存在异方差,也有可能用戈德菲
尔德匡特方法检验不出来。
用 EViews 给截面数据排序的方法:在 Workfile 窗口点击 Procs 键并选 Sort current page
功能,在打开的 Sort Workfile Series 对话窗填写以哪一个序列为标准(基准序列)排
第五章 异方差性
Qt
ALt
K
t
eut
• U为随机误差项,它包含了资本K和劳动力L
以外的因素对产出Q的影响,比如能源、环境、
政策等。由于不同的地区这些因素不同造ui 成了 对产出的影响出现差异,使得模型中的 具有
异方差,并且这种异方差的表现是随资本和劳 动力的增加而有规律变化的。
(二)样本数据的观测误差
• 一方面,样本数据的观测误差常随着时间的 推移而逐步积累,引起随机误差项的方差增 加。另一方面,随着时间的推移,样本观测 技术会随之提高,也可能使得样本的观测误 差减少,引起随机误差项的方差减小。因此, 随着时间的推移,样本数据的观测误差会发 生变化,从而引起随机误差项的变化。
Yt 1 2 X 2i 3 X 3i ui (1)
Y 1 2 X 2 3 X 3
(2)
Yt 1' 2 X 2i ui'
(3)
Y 1' 2 X 2
(4)
由(2)、(4)得:1' 1 3 X3 (5)
由(1)、(3)、(5)得:
Var(ui )
2 i
f
(X
ji )
i 1, 2, , n
则称随机误差项存在异方差.
( 即回归模型中随机误差项的方差不是常数 )
例2:使用截面数据研究储蓄函数
假设 储蓄函数模型Y i 0 1X i ui
式中:Y i第i个家庭的储蓄额,X i第i个家庭的可支配收入,ui 代表除可支配收入以外影响储蓄额的其它因素,如利率、家庭 人口、文化背景等等。这里,同方差假设显然与事实不符。
ui' 1 3 X 3i ui 1'
5异方差性
钱还很多,这些余钱可用于购买奢侈消费品,也可用于储蓄或投资,其消费支出的方差 将会很大。显然,这里存在异方差现象。
又例如,使用截面资料建立储蓄模型(可能存在异方差)
Yi 1 2 X i ui
Yi : 第i个家庭的储蓄额; X i : 第i个家庭的可支配收入 ui : 除可支配收入之外的其它因素(如 : 利息、家庭人口、文化背景等)
销售收入 利润总额
商店名称
X
Y
回归值
残差
1、百货大楼 2、城乡贸易中心
… 19.新街口百货商场 20.星座商厦
160.0
12.8
10.2
2.634705
151.8
8.9
9.6
-0.717881
…
…
…
…
22.2
1.0
1.0
0.033928
20.7
0.5
0.9
-0.365935
资料来源:《北京统计年鉴》1997年卷 利润总额对销售收入的线性回归, Kt增大),观测误差降低, 引起ui偏离均值的程度不同,会产生异方差。
又例如,边学边改学习模型(人们在学习过程中,其行为误差随时间而减少)。
在给定的一段时间内,打字出错个数与用于打字练习的小时数的关系。随着打字练 习时间的增加,平均打错个数及打错个数的方差都有所下降。
E(2
xi u i xi2
2)2
E(
xi u i xi2
)2
xi2
u
2 i
E(
2
i j
xi x juiu j
)
E(
xi2
u
2 i
)
(xi2 ) 2
(xi2 ) 2
xi2
庞浩 计量经济学5第五章 异方差性
同方差
递增型异方差
递减型异方差
复杂型异方差
18
2.借助X-e2散点图进行判断 观察散点的纵坐标是否随解释变量Xi的变化而 变化。
~2 e2e i ei e2 ~2
X 同方差 递增异方差
X
e2
~2 e i
~2 e 2 e i
X 递减异方差 复杂型异方差
X
19
二、戈德菲尔德—夸特 (Goldfeld-Quanadt)检验
3
说明1
矩阵表示: Y X u 随机扰动项向量 其方差—协 u1 u 方差矩阵不 2 u 再是: un n1 而是:
2 2 Var Cov ( ui ) 2 nn
ei X i v i
ei
1 vi Xi
ei X i v i 1 ei vi Xi
③利用上述回归的R2、t统计量、F统计量等判断,R2 好、t统计量和F统计量显著,即可判定存在异方差。 28
说明: 1.也可以用 e i 与可能产生异方差的多个解释变 量进行回归模拟; 2.戈里瑟检验的优点在于不仅检验了异方差是否 存在,同时也给出了异方差存在时的具体表现 形式,为克服异方差提供了方便。 3.试验模型选得不好,也可能导致检验不出是否 存在异方差性。
12 2 2 Var Cov ( ui ) 2 n nn
4
说明2
随机扰动项 ui具有异方差性,可理解释为被解释变量 的条件分散程度随解释变量的变化而变化,如下图所 示:var( ui ) i2 2 f ( X i)(i 1,2,, n)
10
第二节 异方差性的后果
第五章异方差ppt课件
f
ˆ 2
2
w i (Yˆ ( ˆ1 ˆ2 X i ))( X i ) 0
ˆ2
wi xi* yi*
w
i
x
* i
2
ˆ1 Y * ˆ 2 X *
其中, X * w i X i , Y * w iYi
wi
wi
xi*
Xi
X
* i
,
yi*
Yi
Yi*
Econometrics 2005
将是不可靠的。
Econometrics 2005
13
5.3 异方差的检验
方法有 (1)图示法( X _ e2); (2)解析法:
戈德菲尔德-匡特检验 怀特检验 ARCH检验
Econometrics 2005
14
5.3.1 图示法及其类型
1. 异方差指u的方差随着x的变化而变化。 2. 故可以根据x-e2的散点图,对异方差是否
Y的预测值的精度降低;
2
(2)由于 i 难以确定, Y的方差也就难以确定, Y
的预测区间的确定也出 现困难;
2
(3)在 = ei2 /( n k )是 2的无偏的证明中用到了
2
同方差的假定,由于异 方差性,使得 = ei2 /( n k )
是有偏的。在此区间估 计基础上区间估计和假 设检验
基本思路:
(以二元回归为例Y:t 1 2 X2t 3X3t ut)
如果有异方差,则i2与解释变量有关系。:如
i2=0
1X2i
3 X3i
2
X
2 2i
4 X32i
5 X2i
X3i+vi
但是i2一般未知,用模型回剩归余ei2作为i2的渐进
第5章 异方差性
5、计算统计量:
RSS2
F
nc ( k 1) nc nc 2 ~ F( k 1, k 1) RSS1 2 2 nc ( k 1) 2
6、在给定的显著性水平下比较判断。
注意: (1) 当模型含有多个解释变量时,应以每一个解释变 量为基准检验异方差。 (2)对于截面样本,计算F统计量之前,必须先把数据 按解释变量的值从小到大排序。 (3)G—Q检验仅适用于检验递增或递减型异方差。 (4)检验结果与数据剔除个数c的选取有关。 (5) G—Q检验无法判定异方差的具体形式。
5.2异方差性的后果
5.2.1对模型参数估计值无偏性的影响
以简单线性回归模型为例,对模型 yt = b0 + b1 xt + ut ˆ 当Var(ut) = t 2,为异方差时,以 b1 为例:
ˆ b1
k
t
yt b1 kt ut
ˆ E (b1 ) E (b1 kt ut ) b1
划分方法是: 把成对(组)的观测值按解释变量的大小顺序排列, 略去c个处于中心位置的观测值 (通常n 30时,取c n/ 4), 余下的n- c个观测值自然分成容量相等,(n- c) / 2的两 个子样本。
{x1, x2, …, xt-1, xt, xt+1, …, x n-1, xn}
n1 = (n-c) / 2
5.2.3对模型参数估计值显著性检验的影响
ee ˆ 并非随机误差项 在异方差情况下, n k 1 方差的无偏估计量。
2
ˆ 导致在此基础上估计的 s ( b j ) 也出现偏误。
ˆ bj 而变量的显著性检验中,构造了t统计量 t ˆ s(b j )
变量的显著性检验失去意义。
计量经济学第五章异方差性
计量经济学第五章异⽅差性第五章异⽅差性本章教学要求:根据类型,异⽅差性是违背古典假定情况下线性回归模型建⽴的另⼀问题。
通过本章的学习应达到,掌握异⽅差的基本概念包括经济学解释,异⽅差的出现对模型的不良影响,诊断异⽅差的⽅法和修正异⽅差的若⼲⽅法。
经过学习能够处理模型中出现的异⽅差问题。
第⼀节异⽅差性的概念⼀、⼆个例⼦例1,研究我国制造业利润函数,选取销售收⼊作为解释变量,数据为1998年的⾷品年制造业、饮料制造业等28个截⾯数据(即n=28)。
数据如下表,其中y表⽰制造业利润函数,x表⽰销售收⼊(单位为亿元)。
Y对X的散点图为从散点图可以看出,在线性的基础上,有的点分散幅度较⼩,有的点分散幅度较⼤。
因此,这种分散幅度的⼤⼩不⼀致,可以认为是由于销售收⼊的影响,使得制造业利润偏离均值的程度发⽣变化,⽽偏离均值的程度⼤⼩的不同,就是所谓的随机误差的⽅差存在变异,即异⽅差。
如果⾮线性,则属于哪类⾮线性,从图形所反映的特征看,并不明显。
下⾯给出制造业利润对销售收⼊的回归估计。
模型的书写格式为212.03350.1044(0.6165)(12.3666)0.8547,..56.9046,152.9322213.4639,146.4905Y Y X R S E F Y s =+=====通过变量的散点图、参数估计、残差图,可以看到模型中(随机误差)很有可能存在异⽅差性。
例2,改⾰开放以来,各地区的医疗机构都有了较快发展,不仅政府建⽴了⼀批医疗机构,还建⽴了不少民营医疗机构。
各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服务的需求量,⽽医疗服务需求与⼈⼝数量有关。
为了给制定医疗机构的规划提供依据,分析⽐较医疗机构与⼈⼝数量的关系,建⽴卫⽣医疗机构数与⼈⼝数的回归模型。
根据四川省2000年21个地市州医疗机构数与⼈⼝数资料对模型估计的结果如下:i iX Y 3735.50548.563?+-= (291.5778) (0.644284) t =(-1.931062) (8.340265)785456.02=R 774146.02=R 56003.69=F式中Y 表⽰卫⽣医疗机构数(个),X 表⽰⼈⼝数量(万⼈)。
第五章异方差性
第五章异方差性u模型违反五项基本假定之三——误差项的同方差性假定的情形,称为异方差性。
u此时,OLS估计量失去BLUE优良性。
需要发展估计模型参数的补救方法。
u本节内容:Ø异方差的定义及其产生的背景与后果Ø异方差性的检验Ø加权最小二乘法(WLS)Ø异方差的处理同方差:x t 1234收入xx1x2x3x ty t ..............................................收入n异方差是相对于同方差而言的。
异方差在横截面数据中比时间序列数据更为常见n同方差:在经典线性回归模型的基本假定3中,随机扰动项ut 的对每一个样本点的方差是一个等于su2的常数,即:Var(ut )=su2=常数t=1,2,…,nn异方差:是指随机扰动项u t随着解释变量X t的变化而变化,即:Var(ut )= s2t= su2f(Xt)t=1,2,…,n。
但ut仍然是服从正态分布。
•异方差一般可归结为三种类型:2随X的增大而增大;(1)单调递增型:si2随X的增大而减小;(2)单调递减型:si2与X的变化呈复杂形式。
(3)复杂型:siØ2、样本数据的观测误差1、参数估计量非有效Ø普通最小二乘法参数估计量仍然具有无偏性,但不具有有效性。
Ø而且,在大样本情况下,参数估计量仍然不具有渐近有效性,这就是说参数估计量不具有一致性。
以一元线性回归模型为例进行说明:(1)仍存在无偏性:证明过程与方差无关12(2)不具备最小方差性由于åååå==-=222222222)()()()ˆ()ˆvar(i i i i i i x x E x x E E m m b b b 2222)()(åå=i i i x E x m (注:交叉项å¹))((,j j i i j i j i x x m m 的期望为零)在i m 为同方差的假定下,22)()var(sm m ==i i E ååå==2222222)()ˆvar(i i i x x x s s b (2. 4.3)在i m 存在异方差的情况下)()()var(222i i i i X f E s s m m ===假设2)(i i X X f =,并且记异方差情况下2b 的OLS 估计为2~b ,则ååååå×==2222222222)()()~var(ii i i i i i x X x x x X f x s s b (2.4.4)对大多数经济资料有:1222>ååi i i x X x ,比较(2.4.3)与(2.4.4),)ˆvar()~var(22b b >(2.4.5)2、变量的显著性检验失去意义关于变量的显著性检验中,构造了t 统计量)ˆ(/ˆi i S t b b =在该统计量中包含有随机误差项共同的方差,并且有t 统计量服从自由度为(n-k)的t 分布。
第五章-异方差性-答案说课讲解
第五章-异方差性-答案第五章 异方差性一、判断题1. 在异方差的情况下,通常预测失效。
( T )2. 当模型存在异方差时,普通最小二乘法是有偏的。
( F )3. 存在异方差时,可以用广义差分法进行补救。
(F )4. 存在异方差时,普通最小二乘法会低估参数估计量的方差。
(F )5. 如果回归模型遗漏一个重要变量,则OLS 残差必定表现出明显的趋势。
( T )二、单项选择题1.Goldfeld-Quandt 方法用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性2.在异方差性情况下,常用的估计方法是( D )A.一阶差分法B.广义差分法C.工具变量法D.加权最小二乘法3.White 检验方法主要用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性4.下列哪种方法不是检验异方差的方法( D )A.戈德菲尔特——匡特检验B.怀特检验C.戈里瑟检验D.方差膨胀因子检验5.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即( B )A.重视大误差的作用,轻视小误差的作用B.重视小误差的作用,轻视大误差的作用C.重视小误差和大误差的作用D.轻视小误差和大误差的作用6.如果戈里瑟检验表明,普通最小二乘估计结果的残差与有显著的形式的相关关系(满足线性模型的全部经典假设),则用加权最小二乘法估计模型参数时,权数应为( B )A. B. C. D. 7.设回归模型为,其中()2i2i x u Var σ=,则b 的最有效估计量为( D )i e i x i i i v x e +=28715.0i v i x 21i x i x 1ix 1i i i u bx y +=A. B. C. D. ∑=i i x y n 1b ˆ 8.容易产生异方差的数据是( C )A. 时间序列数据B.平均数据C.横截面数据D.年度数据9.假设回归模型为i i i u X Y ++=βα,其中()2i 2i X u Var σ=,则使用加权最小二乘法估计模型时,应将模型变换为( C )。
计量经济学第五章 异方差性
●异方差性的概念 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
1
第一节 异方差性的概念
一、异方差性的实质 二、异方差产生的原因
2
一、异方差性的实质
设模型为
Yi 1 2 X 2i 3 X3i ... k X ki ui
如果对于模型中随机误差项,有:
8
第二节 异方差性的后果
一、对参数估计统计特性的影响 二、对参数显著性检验的影响 三、对预测的影响
9
一、对参数估计式统计特性的影响
1、仍然具有线性性 2、仍然具有无偏性
参数估计的无偏性仅依赖于基本假定中的零 均值 假定(即 E(ui ) 0 )。所以异方差的存在对 无偏性的成立没有影响。
3、仍然具有一致性 4、不再具有最小方差性
24
4、检验的特点
(1)适用于大样本; (2)检验递增型或递减型异方差; (3)只能判断异方差是否存在,在多个解释变 量的情下,对哪一个变量引起异方差的判断存在局 限; (4)该检验的功效取决于C,C值越大,检验功 效越好; Continued
25
Continued (5)两个子样回归所用的观测值个数如果不 相等时,也可以用该检验,需要通过改变自由度 和统计量的计算公式来调整; (6)当模型中包含多个解释变量时,应对每 个可能引起异方差的解释变量都进行检验。
26
三、White检验
1、基本思想:
构造残差平方序列与解释变量之间的辅助函 数,通过判断辅助函数的显著性来判断原方程是 否存在异方差。 一般而言,辅助回归的解释变量包括常数项、 原模型中的解释变量、解释变量平方、其交叉乘 积。
27
2、检验的基本步骤:
原模型为
第五章 异方差性 答案
第五章 异方差性一、判断题1. 在异方差的情况下,通常预测失效。
( T )2. 当模型存在异方差时,普通最小二乘法是有偏的。
( F )3. 存在异方差时,可以用广义差分法进行补救。
(F )4. 存在异方差时,普通最小二乘法会低估参数估计量的方差。
(F )5. 如果回归模型遗漏一个重要变量,则OLS 残差必定表现出明显的趋势。
( T ) 二、单项选择题1.Goldfeld-Quandt 方法用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性 2.在异方差性情况下,常用的估计方法是( D )A.一阶差分法B.广义差分法C.工具变量法D.加权最小二乘法 3.White 检验方法主要用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性 4.下列哪种方法不是检验异方差的方法( D )A.戈德菲尔特——匡特检验B.怀特检验C.戈里瑟检验D.方差膨胀因子检验 5.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即( B )A.重视大误差的作用,轻视小误差的作用B.重视小误差的作用,轻视大误差的作用C.重视小误差和大误差的作用D.轻视小误差和大误差的作用 6.如果戈里瑟检验表明,普通最小二乘估计结果的残差与有显著的形式的相关关系(满足线性模型的全部经典假设),则用加权最小二乘法估计模型参数时,权数应为( B ) A. B.C. D.7.设回归模型为,其中()2i2i x u Var σ=,则b 的最有效估计量为( D )A. B.C. D. ∑=ii x y n 1b ˆ8.容易产生异方差的数据是( C )A. 时间序列数据B.平均数据C.横截面数据D.年度数据9.假设回归模型为i i i u X Y ++=βα,其中()2i 2i X u Var σ=,则使用加权最小二乘法估计模i e i x i i i v x e +=28715.0i v i x 21i x i x 1ix 1i i i u bx y +=∑∑=2ˆxxy b 22)(ˆ∑∑∑∑∑--=x x n y x xy n b xyb=ˆ型时,应将模型变换为( C )。
第五章 异方差性 答案
第五章 异方差性一、判断题1. 在异方差的情况下,通常预测失效。
( T )2. 当模型存在异方差时,普通最小二乘法是有偏的。
( F )3. 存在异方差时,可以用广义差分法进行补救。
(F )4. 存在异方差时,普通最小二乘法会低估参数估计量的方差。
(F )5. 如果回归模型遗漏一个重要变量,则OLS 残差必定表现出明显的趋势。
( T ) 二、单项选择题1.Goldfeld-Quandt 方法用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性 2.在异方差性情况下,常用的估计方法是( D )A.一阶差分法B.广义差分法C.工具变量法D.加权最小二乘法 3.White 检验方法主要用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性 4.下列哪种方法不是检验异方差的方法( D )A.戈德菲尔特——匡特检验B.怀特检验C.戈里瑟检验D.方差膨胀因子检验 5.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即( B )A.重视大误差的作用,轻视小误差的作用B.重视小误差的作用,轻视大误差的作用C.重视小误差和大误差的作用D.轻视小误差和大误差的作用 6.如果戈里瑟检验表明,普通最小二乘估计结果的残差与有显著的形式的相关关系(满足线性模型的全部经典假设),则用加权最小二乘法估计模型参数时,权数应为( B ) A. B.C. D.7.设回归模型为,其中()2i2i x u Var σ=,则b 的最有效估计量为( D )A. B.C. D. ∑=ii x y n 1b ˆ8.容易产生异方差的数据是( C )A. 时间序列数据B.平均数据C.横截面数据D.年度数据9.假设回归模型为i i i u X Y ++=βα,其中()2i 2i X u Var σ=,则使用加权最小二乘法估计模i e i x i i i v x e +=28715.0i v i x 21i x i x 1ix 1i i i u bx y +=∑∑=2ˆxxy b 22)(ˆ∑∑∑∑∑--=x x n y x xy n b xyb=ˆ型时,应将模型变换为( C )。
计量经济学第五章异方差性参考答案讲解
计量经济学第五章异⽅差性参考答案讲解第五章异⽅差性课后题参考答案 5.1(1)因为22()i i f X X =,所以取221iiW X =,⽤2i W 乘给定模型两端,得 312322221i i ii i i i Y X u X X X X βββ=+++ 上述模型的随机误差项的⽅差为⼀固定常数,即22221()()i i i iu Var Var u X X σ==(2)根据加权最⼩⼆乘法,可得修正异⽅差后的参数估计式为***12233Y X X βββ=-- ()()()()()()()***2****22232322322*2*2**2223223?i i i i i i i i i i i i i i i i i iW y x W x W y x W x x W x W x W x x β-=-∑∑∑∑∑∑∑()()()()()()()***2****23222222332*2*2**2223223?ii ii i i iii i i ii i i i i iW y x W x W y x W x x Wx W x W x x β-=-∑∑∑∑∑∑∑其中22232***23222,,iii i i i iiiW XW X W Y X X Y WWW ===∑∑∑∑∑∑******222333i i i i i x X X x X X y Y Y=-=-=- 5.2 (1)2222211111 ln()ln()ln(1)1 u ln()1Y X Y X Yu u X X X u ββββββββββ--==+≈=-∴=+ [ln()]0 ()[ln()1][ln()]11E u E E u E u µ=∴=+=+=⼜(2)[ln()]ln ln 0 1 ()11i i iiP P i i i i P P i i E P E µµµµµµµ===?====∑∏∏∑∏∏不能推导出所以E 1µ()=时,不⼀定有E 0µ(ln )= (3)对⽅程进⾏差分得:1)i i βµµ--i i-12i i-1lnY -lnY =(lnX -X )+(ln ln则有:1)]0i i µµ--=E[(ln ln5.3(1)该模型样本回归估计式的书写形式为:Y = 11.44213599 + 0.6267829962*X (3.629253) (0.019872)t= 3.152752 31.5409720.944911R =20.943961R = S.E.=9.158900 DW=1.597946 F=994.8326(2)⾸先,⽤Goldfeld-Quandt 法进⾏检验。
计量经济学实验答案--第二版(张晓峒)
计量经济学张晓峒第二版实验第5章异方差2.已知我国29个省、直辖市、自治区1994年城镇居民人均生活费支出Y,可支配收入X的截面数据见下表(表略)。
(1)用等级相关系数和戈德菲尔徳- 夸特方法检验支出模型的扰动项是否存在异方差性。
支出模型是Y i =β0 +β 1 X i +u i(2)无论{u i}是否存在异方差性,用EViews练习加权最小二乘法估计模型,并用模型进行预测。
解析:Dependent Variable: YMethod: Least SquaresDate: 11/12/13 Time: 12:38Sample: 1 29Included observations: 29Variable Coefficient Std. Error t-Statistic Prob.X 0.795570 0.018373 43.30193 0.0000C 58.31791 49.04935 1.188964 0.2448R-squared 0.985805 Mean dependent var 2111.931Adjusted R-squared 0.985279 S.D. dependent var 555.5470S.E. of regression 67.40436 Akaike info criterion 11.32577Sum squared resid 122670.4 Schwarz criterion 11.42006Log likelihood -162.2236 Hannan-Quinn criter. 11.35530F-statistic 1875.057 Durbin-Watson stat 1.893970Prob(F-statistic) 0.0000001,5002,0002,5003,0003,5004,0001,0002,0003,0004,0005,000可支配收入人均生活费支出(1)略去中心9个样本观测值,将剩下的20个样本观测值分成容量相等的两个子样本,每个子样本的样本观测值个数均为10.由前面的样本回归产生的残差平方和为12363.80,后面样本产生的残差平方和为62996.26.所以F=62996.26/12363.80=5.10,自由度n=10-2=8,查F 分布表得临界值为3.44,因为F=5.10>3.44,所以支出模型的随机误差项存在异方差性。
第五章第三节 异方差性的检验
3、 G-Q检验具体步骤
(1)将样本(观察值)按某个解释变量的大小排序;
(2)将序列中间(段)约 c = 1 / 4 个观察值除去,并使余下的头、尾两段样本容量相同,均为(n-c)/2 个;(3)提出假设:
H0 : ui为同方差; H1:ui为异方差
(4)分别对头、尾两部分样本进行回归,且计算各残差平方和分别为
对(2)式进行回归
R2
a) H0 : 1 2 P H1 : 至少一个i 0
三、Glejser (格里瑟)检验(选学)
四、Breusch—Pagan (布鲁士—佩格)检验(选学) 五、White(怀特)检验 六、ARCH检验
除了图示法以外的检验方法都是构造统计量 实施检验,称为解析法
共同思路
• 异方差性,是相对于不同的样本点,即相对于不 同的X观测值, ui具有不同的方差
ei2
图形分析法是利用残差序列绘制出各种图形,以供分析检验使用。 包括:
1、解释变量为X 轴,残差的平方ei 2 为Y轴的 散点图。
2.解释变量为X 轴,被解释变量为Y轴的X-Y散点图
异方差的类型大致可以分为递增异方差、递减异方差、 复杂异方差三种。 用Y X 作散点图的区域逐渐变宽、变窄、不规则变化, 认为存在异方差; 用ei2 X 作散点图上e2并不近似于某一常数, 则认为存在异方差。
(2)求出残差et , 进而求出et2
(3)估计et2
0
1 X 2t
2 X3t
3
X
2 2t
4
X
2 3t
5 X2t
X 3t
t
(4)针对上述模型作回归,并计算统计量nR2。其中:n为样本
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ*) Var ( 2
( x )
2 2 x i i 2 2 i
(证明见下页)
i2 未知,也不能再用 ( ei2 ) (n 2) ˆ 2 去估计, 2 ˆ * ) 无法确定。 ( i 不再是常数), Var (
2
2、如果仍然用不存在异方差性时的OLS方式估计其 方差,即用
第五章 异 方 差 性
引子:更为接近真实的结论是什么?
根据四川省2000年21个地市州医疗机构数与人口数资 料,分析医疗机构与人口数量的关系,建立卫生医疗机 构数与人口数的回归735 X Y i i
(291.5778) (0.644284) t =(-1.931062) (8.340265)
●
第五章
异方差性
本章将讨论四个问题: ●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
第一节 异方差性的概念
一、异方差的实质
同方差的含义 同方差性:对所有的 i (i 1,2,..., n) 有:
Var(ui ) = σ
2
因为方差是度量被解释变量
Y
的观测值围绕回归线
● 要求为大样本 ● 不仅能够检验异方差的存在性,同时在多变量 的情况下,还能判断出是哪一个变量引起的异方 差。
White 检验在EViews上的实现(用现成命令)
设 Yt 1 2 X 2t 3 X 3t t
1)Ls Y C X2 X3 2)点击 View/residual test/White/回车; 3)在出现的对话框中,选择 no cross terms(没有交叉项) /回车或 cross terms(有交叉项)/回车 4)出现输出框(比模型输出框多2行) Test直接给出了相关的统计量(F-statistic和Obs*R-squared)
ˆ ) 2 Var ( 2
2 x i
所估计的方差,会低估存在异方差时的的真实方差。
ˆ ) ,也就会高估 t 统计量,从而 后果: 低估 Var ( 2 夸大所估计参数的统计显著性。
三、预测精度降低,区间预测面临困难
尽管参数的OLS估计量仍然无偏,并且基 于此的预测也是无偏的,但是
ˆ 的方差增大,Y预测值 ●由于异方差的存在, k 的精确度将会下降
1)
键入 Sort /回车,在对话框中 键入X(或Xi中任一个)/ok;
2) 键入Sample /回车,在对话框中键入1 n1 /ok(前部分样本区) 3) 键入 Ls y c x(或Ls y c x2 x3 x4┄)/回车,得残差平方和S2小 4) 键入Sample /回车,在对话框中键入n1+c+1 n / ok(后部分样本区) 5) 键入Ls y c x(或Ls y c x2 x3 x4┄)/回车,记住残差平方和S2大 6)计算F统计量,作出是否拒绝原假设的结论。
并计算辅助回归的 R 2
3.计算统计量 nR2 2 R n 为样本容量, 为辅助回归可决系数 4.提出假设
H0 : 2 =...= 6 = 0, H1 : ( )不全为零 j j=2,,3,...,6
在大样本情况下可以证明,在零假设成立下,nR 2服
2 从自由度为5的 分布,即 nR 2 ~ 2 (5)
2 ◆如果 ei 不随 X i 而变化,则表明不存在异方差; 2 e ◆如果 i 随 X i 而变化,则表明存在异方差。
通过Eviews作x- e2 散点图 1、键入 LS y c x 作回归 2、键入 genr e1=resid 调用残差 3、键入 genr e2=e1^2 生成残差平方 4、键入 Scat X e2
或 1、点击 2、点击 3、选
Quick / Graph,键入 x e2 Line Graph,在出现的下拉菜单中 Scatter Diagram (散点图) / ok
e
2
e
2
e
2
(a)
X(d )
e
2
(b)
e
2 i
e
与 X i的散点图或Y与X的散点图,作出近似判
2 i
1.残差图形分析
设一元线性回归模型为:
Yi β1 β 2 X i u i
运用OLS法估计,得样本回归模型为:
ˆ + β ˆ X Yˆi = β 1 2
由上两式得残差: 绘制出 ei2 对 X i 的散点图
i
ˆ ei Yi - Y i
其中 t 为随机误差项。
2 2 2 但一般 t 未知,可用原模型回归剩余 et 作为 t 的 估计值,进行以上辅助回归。在大样本情况下寻求 能确定分布的统计量,判断 t2 的变化是否与解释
v
变量有关 (当有K个解释变量时,可作类似的含两两交互的辅 助回归)
检验的基本步骤: (手算)
1.求回归估计式并计算
例如两个解释变量的模型中 Yt = β1 + β2 X2t + β3 X3t +ut 2 设 t 与 X 2 和X 3 的关系为如下辅助回归:
t2 1 2 X 2t 3 X 3t 4 X 22t 5 X 32t 6 X 2t X 3t vt
(2)如果方差随X递减
统计量
F
2 e 1i ( 2 e 2i
nc k) 2 nc k) ( 2
F服从第一、二自由度均为 [( n c) 2] k 的F 分布。 判断:查表得F临界值
F [(n c)
2
k , (n c)
2
k]
◆若 F F(临界值),说明前部分与后部分比值显著大于1, 就拒绝 H 0 (同方差) ,即接受存在异方差性 ◆若 F F(临界值),说明前部分与后部分比值不显著大于1, 就接受 H 0 ,认为是同方差性
对比同方差时为
2 i
(i 1,2, n)
Var (ui | X 2i , , X ki )
2
异方差可看成是由于某个解释变量的变化而引起的,则
V a r (u i | X
2i , , X
ki )
2 i
2
f (X
mi
)
异方差性的图示
概 率 分 布 密 度
储蓄Y
收入X
二、产生异方差性的原因
X
(c )
X
(d )
X
2.相关图分析
Y与X之间图形举例:
分析Y与X的相关图形,也可以初略地看到Y的离散程度与X之间 是否有相关关系。 用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入 的数据,绘制出消费支出对纯收入的散点图,其中用 Y1 表示 农村家庭消费支出, X 1表示家庭纯收入。
2 e 的平方 t 。 2 et
ˆt ,并求残差 用OLS法估计原模型,计算残差 et Yt -Y
2.求辅助函数
2 2 e σ 用残差平方 t 作为异方差 t 的估计,并建立
2 2 X 2t , X 3t , X 2 , X t 3t , X 2t X 3t 的辅助回归,即
2 2 ˆ2 X 2t + α ˆ3 X 3t + α ˆ4 X 2 ˆ ˆ ˆ1 + α ˆt2 = α e + α X t 5 3t + α6 X 2t X 3t
5.检验
2 2 χ χ 给定显著性水平 ,查 分布表得临界值 (5) ,
2 2 nR χ 如果 (5) , H 0 不合理,则拒绝原假设 H 0,
即认为模型中随机误差存在异方差 。
2 2 nR 5 ( ) 则不拒绝 若
H 0 ,即认为模型中随
机误差是同方差。
White检验的特点
Xi
具体步骤:
●排序:将观测值按解释变量X大小顺序排列 ●数据分组:去掉中间的C个(约1/4)观测值,分别进 行前后两部分 (n c) 2 个观测值的回归 ●提出假设 :分别进行前后两部分回归的基础上,提出检 验假设:
H 0 : ui 是同方差(前后两部分方差无显著差异),
2 2 H : 即 0 i
三、White检验
基本思想:
2 如果存在异方差,其方差 t 与某解释变量有关系。
在不知道关于异方差的任何先验信息时,在大样本的 情况下,将OLS估计后的残差平方对解释变量的各种 形式(如常数、解释变量、解释变量的平方及其交叉 乘积等)构成一个辅助回归,利用辅助回归建立相应 的检验统计量来判断异方差性。
F服从第一、二自由度均为 [(n c) 2] k 的F 分布。 ●判断:
k] 2 2 ◆若 F F(临界值),说明后部分与前部分比值显著 大于1,就拒绝 H 0 (同方差) ,即接受存在异方差性 F [(n c) k , (n c)
查表得F临界值
◆若 F F (临界值),说明后部分与前部分比值不 显著大于1,就接受 H 0 ,认为是同方差性
● 由于 难以确定,Y的方差也难以确定,Y置 信区间的确定会出现困难
2 i
第三节 异方差性的检验
一、图形分析法
基本思想: 异方差性的表现是 u i 的方差随某个解释变量的变 化而变化,或Y的分散程度随X的变化而变化。因此可利 用 u i 的代表 ei 与某解释变量的散布图,观察是否存在异 方差及其异方差的形式,或从Y的分散程度与X的关系观 测是否存在异方差。 具体方法: 假定不存在异方差,进行回归,并计算剩余平方 描绘 断。
第二节 异方差性的后果
存在异方差时,OLS估计仍然是无偏估计,但是
一、OLS估计式不再具有最小方差特性(不同方法)
OLS估计式的方差不一定是最小的,即OLS估计式虽然无 偏,但不一定是最佳的(存在异方差时,可证明能够找到比 OLS 的方差更小的估计方法)