第五章:异方差性(作业)
资料:第五章 异方差性题目20150704(习题)-myb
选择题:1. G-Q 检验的局限性在于() A. 该方法适用于大样本B. 该方法无法判断异方差由哪一个变量引起C. 该方法只能检验单调递增或单调递减形式的异方差D. 以上三种说法都正确。
2. 模型遗漏重要变量的可能后果包括() A. 产生异方差性 B. 产生多重共线性 C. 产生序列自相关性D. 误差项与解释变量相关E. 误差项非正态3. 模型包含无关变量的可能后果包括() A. 产生异方差性 B. 产生多重共线性 C. 产生序列自相关性D. 误差项与解释变量相关E. 误差项非正态4. 那些检验方法可以判断异方差性由哪一个变量引起?()A. G-Q 检验B. White 检验C. ARCH 检验D. Glejser 检验E. 以上四种方法皆可5. ****对于模型0112233i i i i i Y X X X u ββββ=++++ ,在使用white 方法检验异方差性时,若要得到可靠的检验结果,则所需要的样本数至少为()A. 30B. 34C. 11D. 406. ***为了弥补White 检验对自由度损失过重的情况,人们提出了如下形式的辅助回归:22123ˆˆi i i ie Y Y αααν=+++ 则下列说法正确的是:( )A. 原假设是:0123:0H ααα=== ;B. 原假设是:023:0H αα== ;C. 检验统计量为F 统计量;D. 检验统计量为2nR ( );E. ˆiY 为多元线性回归的拟合值7. 关于ARCH 方法检验异方差性,说法正确的是() A. 可以应用在截面数据和时间序列数据中;B. ARCH 检验的辅助回归是自回归条件异方差过程;C. 样本数的数目;D. 检验统计量是2()n p R - ,其中2R 为原模型的可决系数。
8. 若Glejser 检验结果显示对于i i i e X ν= ,F 检验的p 值为0.005,而对于1i i ie X βν=+ ,F 检验的p 值为0.15, 则考虑在进行加权最小二乘估计时,选用的权重i w 为()A. i iw X =; B. 1i iw X =; C. i i w X =; D. 2i i w X =. 9. 仅在异方差存在时,会对以下哪些产生影响?()A. OLS 的无偏性;B. OLS 的一致性;C. OLS 的有效性;D. 显著性检验;E. 区间预测 10. 对模型进行对数变换是常用的模型修订的方法,有关对数变换描述错误的是() A. 可以用来修正异方差性 B. 可以用来修正多重共线性 C. 可以用来修正序列自相关性D. 对变量取对数时要注意取对数后变量符合经济意义。
【计量经济学】第五章精选题与答案解析
第五章 异方差二、简答题1.异方差的存在对下面各项有何影响? (1)OLS 估计量及其方差; (2)置信区间;(3)显著性t 检验和F 检验的使用。
2.产生异方差的经济背景是什么?检验异方差的方法思路是什么?3.从直观上解释,当存在异方差时,加权最小二乘法(WLS )优于OLS 法。
4.下列异方差检查方法的逻辑关系是什么? (1)图示法 (2)Park 检验 (3)White 检验5.在一元线性回归函数中,假设误差方差有如下结构:()i i i x E 22σε=如何变换模型以达到同方差的目的?我们将如何估计变换后的模型?请列出估计步骤。
三、计算题1.考虑如下两个回归方程(根据1946—1975年美国数据)(括号中给出的是标准差):t t t D GNP C 4398.0624.019.26-+=e s :(2.73)(0.0060) (0.0736)R ²=0.999t t t GNP D GNP GNP C ⎥⎦⎤⎢⎣⎡-+=⎥⎦⎤⎢⎣⎡4315.06246.0192.25 e s : (2.22) (0.0068)(0.0597)R ²=0.875式中,C 为总私人消费支出;GNP 为国民生产总值;D 为国防支出;t 为时间。
研究的目的是确定国防支出对经济中其他支出的影响。
(1)将第一个方程变换为第二个方程的原因是什么?(2)如果变换的目的是为了消除或者减弱异方差,那么我们对误差项要做哪些假设? (3)如果存在异方差,是否已成功地消除异方差?请说明原因。
(4)变换后的回归方程是否一定要通过原点?为什么? (5)能否将两个回归方程中的R ²加以比较?为什么?2.1964年,对9966名经济学家的调查数据如下:资料来源:“The Structure of Economists’ Employment and Salaries”, Committee on the National Science Foundation Report on the Economics Profession, American Economics Review, vol.55, No.4, December 1965.(1)建立适当的模型解释平均工资与年龄间的关系。
第五章 异方差性
Qt
ALt
K
t
eut
• U为随机误差项,它包含了资本K和劳动力L
以外的因素对产出Q的影响,比如能源、环境、
政策等。由于不同的地区这些因素不同造ui 成了 对产出的影响出现差异,使得模型中的 具有
异方差,并且这种异方差的表现是随资本和劳 动力的增加而有规律变化的。
(二)样本数据的观测误差
• 一方面,样本数据的观测误差常随着时间的 推移而逐步积累,引起随机误差项的方差增 加。另一方面,随着时间的推移,样本观测 技术会随之提高,也可能使得样本的观测误 差减少,引起随机误差项的方差减小。因此, 随着时间的推移,样本数据的观测误差会发 生变化,从而引起随机误差项的变化。
Yt 1 2 X 2i 3 X 3i ui (1)
Y 1 2 X 2 3 X 3
(2)
Yt 1' 2 X 2i ui'
(3)
Y 1' 2 X 2
(4)
由(2)、(4)得:1' 1 3 X3 (5)
由(1)、(3)、(5)得:
Var(ui )
2 i
f
(X
ji )
i 1, 2, , n
则称随机误差项存在异方差.
( 即回归模型中随机误差项的方差不是常数 )
例2:使用截面数据研究储蓄函数
假设 储蓄函数模型Y i 0 1X i ui
式中:Y i第i个家庭的储蓄额,X i第i个家庭的可支配收入,ui 代表除可支配收入以外影响储蓄额的其它因素,如利率、家庭 人口、文化背景等等。这里,同方差假设显然与事实不符。
ui' 1 3 X 3i ui 1'
庞浩 计量经济学5第五章 异方差性
同方差
递增型异方差
递减型异方差
复杂型异方差
18
2.借助X-e2散点图进行判断 观察散点的纵坐标是否随解释变量Xi的变化而 变化。
~2 e2e i ei e2 ~2
X 同方差 递增异方差
X
e2
~2 e i
~2 e 2 e i
X 递减异方差 复杂型异方差
X
19
二、戈德菲尔德—夸特 (Goldfeld-Quanadt)检验
3
说明1
矩阵表示: Y X u 随机扰动项向量 其方差—协 u1 u 方差矩阵不 2 u 再是: un n1 而是:
2 2 Var Cov ( ui ) 2 nn
ei X i v i
ei
1 vi Xi
ei X i v i 1 ei vi Xi
③利用上述回归的R2、t统计量、F统计量等判断,R2 好、t统计量和F统计量显著,即可判定存在异方差。 28
说明: 1.也可以用 e i 与可能产生异方差的多个解释变 量进行回归模拟; 2.戈里瑟检验的优点在于不仅检验了异方差是否 存在,同时也给出了异方差存在时的具体表现 形式,为克服异方差提供了方便。 3.试验模型选得不好,也可能导致检验不出是否 存在异方差性。
12 2 2 Var Cov ( ui ) 2 n nn
4
说明2
随机扰动项 ui具有异方差性,可理解释为被解释变量 的条件分散程度随解释变量的变化而变化,如下图所 示:var( ui ) i2 2 f ( X i)(i 1,2,, n)
10
第二节 异方差性的后果
第5章 异方差性
估计量不具有最佳性。 但OLS估计量不具有最佳性。 估计量不具有最佳性
5.2.3对模型参数估计值显著性检验的影响 对模型参数估计值显著性检验的影响
e′e 并非随机误差项 并非随机误差项 在异方差情况下, ˆ 在异方差情况下, σ = n − k −1 方差的无偏估计量。 方差的无偏估计量。
2
ˆ 导致在此基础上估计的 s ( b j ) 也出现偏误。
e t 来近似代表随机误差项
5.3.1图示检验法 图示检验法
的估计值) (1)用X(或Y的估计值)与残差平方的散点图进 ) ( 的估计值 行初步判断
~ ei 2 ~ ei 2
X 同方差 递增异方差
X
~ ei 2
~ ei 2
X 递减异方差 复杂型异方差
X
(2)用X-Y的散点图进行判断 ) 的散点图进行判断 看是否存在明显的散点扩大 缩小 复杂型趋势 散点扩大、缩小 散点扩大 缩小或复杂型趋势 (即不在一个固定的带型域中)
. 0 . 0 . ... σ nn ...
5.1.2产生异方差的原因 产生异方差的原因
1、解释变量的遗漏。 2、来自不同抽样单元的因变量观察值的差异。 3、异常观测值的出现。 4、时间序列数据中,观测技术的改进引起的观测值的变化。
注意: (1)时间序列数据和截面数据中都有可能存在异方差,其 中截面样本中更为常见。 (2) 经济时间序列中的异方差常为递增型异方差。金融时 间序列中的异方差常表现为自回归条件异方差。
yt = b0 + b1 x1t + b2 x2t + ut
1、用普通最小二乘法估计模型,求出残差平方序 2 列:e t
2、以残差平方作为因变量,以原方程中所有解释变 解释变 解释变量的平方项和交叉积项 量以及解释变量的平方项 交叉积项 解释变量的平方项 交叉积项做辅助回归:
计量经济学课件第五章 异方差性
计量经济学课件第五章异方差性第五章异方差性1 / 80计量经济学课件第五章 异方差性 2 / 80引子:更为接近真实的结论是什么?根据四川省2000年21个地市州医疗机构数及人口数资料,分析医疗机构及人口数量的关系,建立卫生医疗机构数及人口数的回归模型。
对模型估计的结果如下:ˆ Yi -563.0548 5.3735 X i(291.5778) (0.644284) t (-1.931062) (8.340265) R2 0.785456 R 2 0.774146 F 69.56003式中 Y 表示卫生医疗机构数(个), X 表示人口数量(万人)。
计量经济学课件第五章 异方差性3 / 80模型显示的结果和问题 ●人口数量对应参数的标准误差较小;● t 统计量远大于临界值,可决系数和修正的可决系数结果较好,F 检验结果明显显著;表明该模型的估计效果不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735人。
然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。
有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?计量经济学课件第五章 异方差性4 / 80第五章 异 方 差 性 本章讨论四个问题:●异方差的实质和产生的原因●异方差产生的后果●异方差的检测方法●异方差的补救计量经济学课件第五章 异方差性5 / 80第一节 异方差性的概念 本节基本内容:●异方差性的实质●异方差产生的原因计量经济学课件第五章 异方差性6 / 80一、异方差性的实质 同方差的含义同方差性:对所有的 i (i1,2,..., n)有: Var(ui ) = 2 (5.1) 因为方差是度量被解释变量 Y 的观测值围绕回归线 E(Yi ) 1 2 X 2i 3 X 3i ... k X ki (5.2) 的分散程度,因此同方差性指的是所有观测值的分散程度相同。
计量经济学课后答案第五章 异方差性汇总
第五章课后答案5.1(1)因为22()i i f X X =,所以取221iiW X =,用2i W 乘给定模型两端,得 312322221i i ii i i i Y X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即22221()()i i i iu Var Var u X X σ==(2)根据加权最小二乘法,可得修正异方差后的参数估计式为***12233ˆˆˆY X X βββ=-- ()()()()()()()***2****22232322322*2*2**2223223ˆi i i i i i i i i i i i i i i i i iW y x W x W y x W x x W x W x W x x β-=-∑∑∑∑∑∑∑()()()()()()()***2****23222222332*2*2**2223223ˆii ii i i iii i i ii i i i i iW y x W x W y x W x x Wx W x W x x β-=-∑∑∑∑∑∑∑其中22232***23222,,iii i i i iiiW XW X W Y X X Y WWW ===∑∑∑∑∑∑******222333i i i i i x X X x X X y Y Y=-=-=- 5.2(1)2222211111 ln()ln()ln(1)1 u ln()1Y X Y X Yu u X X X u ββββββββββ--==+≈=-∴=+[ln()]0()[ln()1][ln()]11E u E E u E u μ=∴=+=+=又(2)[ln()]ln ln 0 1 ()11i i iiP P i i i i P P i i E P E μμμμμμμ===⇒====∑∏∏∑∏∏不能推导出所以E 1μ()=时,不一定有E 0μ(ln )= (3) 对方程进行差分得:1)i i βμμ--i i-12i i-1lnY -lnY =(lnX -X )+(ln ln 则有:1)]0i i μμ--=E[(ln ln5.3(1)该模型样本回归估计式的书写形式为:Y = 11.44213599 + 0.6267829962*X (3.629253) (0.019872)t= 3.152752 31.5409720.944911R =20.943961R = S.E.=9.158900 DW=1.597946 F=994.8326(2)首先,用Goldfeld-Quandt 法进行检验。
第5章 异方差性
5、计算统计量:
RSS2
F
nc ( k 1) nc nc 2 ~ F( k 1, k 1) RSS1 2 2 nc ( k 1) 2
6、在给定的显著性水平下比较判断。
注意: (1) 当模型含有多个解释变量时,应以每一个解释变 量为基准检验异方差。 (2)对于截面样本,计算F统计量之前,必须先把数据 按解释变量的值从小到大排序。 (3)G—Q检验仅适用于检验递增或递减型异方差。 (4)检验结果与数据剔除个数c的选取有关。 (5) G—Q检验无法判定异方差的具体形式。
5.2异方差性的后果
5.2.1对模型参数估计值无偏性的影响
以简单线性回归模型为例,对模型 yt = b0 + b1 xt + ut ˆ 当Var(ut) = t 2,为异方差时,以 b1 为例:
ˆ b1
k
t
yt b1 kt ut
ˆ E (b1 ) E (b1 kt ut ) b1
划分方法是: 把成对(组)的观测值按解释变量的大小顺序排列, 略去c个处于中心位置的观测值 (通常n 30时,取c n/ 4), 余下的n- c个观测值自然分成容量相等,(n- c) / 2的两 个子样本。
{x1, x2, …, xt-1, xt, xt+1, …, x n-1, xn}
n1 = (n-c) / 2
5.2.3对模型参数估计值显著性检验的影响
ee ˆ 并非随机误差项 在异方差情况下, n k 1 方差的无偏估计量。
2
ˆ 导致在此基础上估计的 s ( b j ) 也出现偏误。
ˆ bj 而变量的显著性检验中,构造了t统计量 t ˆ s(b j )
变量的显著性检验失去意义。
计量经济学 第五章 异方差性
的分散程度,因此同方差性指的是所有观测值的
分散程度相同。
6
异方差性的含义
设模型为
Y i 1 2 X 2 i 3 X 3 i . . . k X k i u i i 1 , 2 , . . . , n
如果对于模型中随机误差项 u i 有:
V a r(u i)i2 , i 1 ,2 ,3 ,...,n (5.3)
的替代变量,对所选函数形式回归。用回归所得
到的 β 、 t 、F 等信息判断,若参数 显β 著不为零,
即认为存在异方差性。
38
第四节 异方差性的补救措施
主要方法:
●模型变换法 ● 加权最小二乘法 ● 模型的对数变换
39
一、模型变换法
以一元线性回归模型为例:
Yi 12Xiui
经检验
u
存在异方差,且
26
(二)检验的特点
要求变量的取值为大样本 不仅能够检验异方差的存在性,同时在多变量的 情况下,还能判断出是哪一个变量引起的异方差。
27
(三)检验的基本步骤:
以一个二元线性回归模型为例,设模型为: Y t= β 1+ β2X 2t+ β3X 3t+ ut
并且,设异方差与 X 2t , X 3t 的一般关系为 σ t 2 = α 1 + α 2 X 2 t+ α 3 X 3 t+ α 4 X 2 2 t+ α 5 X 3 2 t+ α 6 X 2 tX 3 t+ v t
Yi 1 2X2i ui*
X 3i
(u 5i* .5)
当被略去的 X 3 i 与 X 2 i 有呈同方向或反方向变 化的趋势时,随 X 2 i 的有规律变化会体现在(5.5)
第五章-异方差性-答案说课讲解
第五章-异方差性-答案第五章 异方差性一、判断题1. 在异方差的情况下,通常预测失效。
( T )2. 当模型存在异方差时,普通最小二乘法是有偏的。
( F )3. 存在异方差时,可以用广义差分法进行补救。
(F )4. 存在异方差时,普通最小二乘法会低估参数估计量的方差。
(F )5. 如果回归模型遗漏一个重要变量,则OLS 残差必定表现出明显的趋势。
( T )二、单项选择题1.Goldfeld-Quandt 方法用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性2.在异方差性情况下,常用的估计方法是( D )A.一阶差分法B.广义差分法C.工具变量法D.加权最小二乘法3.White 检验方法主要用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性4.下列哪种方法不是检验异方差的方法( D )A.戈德菲尔特——匡特检验B.怀特检验C.戈里瑟检验D.方差膨胀因子检验5.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即( B )A.重视大误差的作用,轻视小误差的作用B.重视小误差的作用,轻视大误差的作用C.重视小误差和大误差的作用D.轻视小误差和大误差的作用6.如果戈里瑟检验表明,普通最小二乘估计结果的残差与有显著的形式的相关关系(满足线性模型的全部经典假设),则用加权最小二乘法估计模型参数时,权数应为( B )A. B. C. D. 7.设回归模型为,其中()2i2i x u Var σ=,则b 的最有效估计量为( D )i e i x i i i v x e +=28715.0i v i x 21i x i x 1ix 1i i i u bx y +=A. B. C. D. ∑=i i x y n 1b ˆ 8.容易产生异方差的数据是( C )A. 时间序列数据B.平均数据C.横截面数据D.年度数据9.假设回归模型为i i i u X Y ++=βα,其中()2i 2i X u Var σ=,则使用加权最小二乘法估计模型时,应将模型变换为( C )。
计量经济学 第五章习题答案
第五章异方差性5.2答案:(1)EVIEWS估计的结果为:Yˆi= 9.3475+0.6371X iT=(2.5691) (32.0088)R2 =0.9464 F=1024.564(2)首先,用Goldfeld-Quandt法进行检验。
将样本X按递减顺序排序,去掉中间1/4的样本,再分为两个部分的样本,即N1=N2=22。
分别对两个部分样本求最小二乘估计,在样本区为1—22的Eviews估计如下:样本区39—60的Eviews估计如下:得到两个部分各自的残差平方和,即∑e 12 =2495.840∑e 22 =603.0148求F 统计量为: F=∑∑e e 2221=2495.840/603.0148=4.1390给定α=0.05,查F 分布表,得临界值为F 0.05=(20,20)=2.12.比较临界值与F 统计量值,有F =4.1390>F 0.05=(20,20)=2.12,说明该模型的随机误差项存在异方差。
其次,用White 法进行检验结果如下:给定α=0.05,在自由度为2下查卡方分布表,得χ2=5.9915。
比较临界值与卡方统计量值,即nR2=10.8640>χ2=5.9915,同样说明模型中的随机误差项存在异方差。
(2)用权数W1=1/X,作加权最小二乘估计,得如下结果用White法进行检验得如下结果:F-statistic 3.138491 Probability 0.050925Obs*R-squared 5.951910 Probability 0.050999。
比较临界值与卡方统计量值,即nR2=5.9519<χ2=5.9915,说明加权后的模型中的随机误差项不存在异方差。
其估计的结果为:Yˆi= 10.3705+0.6309X iT=(3.9436) (34.0467)R2 =0.21144 F=1159.176 DW=0.95855.3答案:(1)EVIEWS估计结果:Yˆi= 179.1916+0.7195X iT=(0.808709) (15.74411)R2 =0.895260 F=247.8769 DW=1.461684 (2)利用White方法检验异方差,则White检验结果见下表:由上述结果可知,该模型存在异方差。
第五篇异方差性
南阳师范学院课时教学计划式中Y表示卫生医疗机构数(个),X表示人口数量(万人)。
●人口数量对应参数的标准误差较小;一、异方差性产生的原因 例1:考察居民家庭收入与储蓄的关系时,用i x 表示第i 个家庭的收入量,用i y 表示第i 个家庭的储蓄量,假设这种关系是线性关系,因而储蓄函数模型可以表示为:i i i u x a y ++=β在这一问题中,收入低的家庭,他们除了必要的支出之外剩余较少,解:先在同方差假定下,应用OLS 对模型进行估计:i i x y8940.01347.1ˆ+-= 96786.02=R 利用此模型可算出yˆ和e 的值,最终得出e 与x 的等级相关系数:异方差性相关理论的解释一、异方差不影响估计量的线性和无偏性,但导致有效性不能满足 (1)线性无偏 证明:()()()()YX U βββββ'='=+'=+-1-1-1X X X (满足线性)那么E()=(无偏性)''X X X X X XU2.有效性 证明:()()()()()()()()()()()()()()()()()()122222222222222222222222222222222222222==i ii i j ii ji i i i i i jjx u x x u x x xx xx f x x x f x x x f x xx xx x βββββσββσσσσβ=++⎛⎫- ⎪+ ⎪ ⎪-⎝⎭-=---==--∑∑∑∑∑∑∑∑i 以一元回归为例假设y 直接做普通最小二乘回归,可得的估计量为:在没有自相关和U 与X 线性无关的假定下:易知的方差为:VAR 当存在异方差时:VAR ()()()()()()()()()2222222222222222=11,jii ji i jx xx f x xx x x f x xx β---->-∑∑∑∑∑由于难以保证所以,异方差的存在就容易使得的方差被高估或低估。
第五章异方差性
∑
2
ˆ σ 2 = ∑ ei2 n − k 是有偏的,在此基础上的区间估 是有偏的,
计和假设检验都将不可靠。 计和假设检验都将不可靠。
第三节 异方差性的检验
一. 图形分析法
基本思想: 基本思想: 异方差性的表现是 u i 的方差随某个解释变量的变 化而变化, 的分散程度随X的变化而变化 化而变化 , 或 Y的分散程度随 的变化而变化 。 因此可 的分散程度随 的变化而变化。 与某解释变量的散布图, 利用 u i 的代表 ei 与某解释变量的散布图,观察是否存 在异方差及其异方差的形式。 在异方差及其异方差的形式。 具体方法: 具体方法: ●假定不存在异方差,进行回归,并计算剩余平方 e 2,描绘 假定不存在异方差,进行回归, 假定不存在异方差
⋅ ⋅⋅ ⋅⋅ ⋅
Yi
⋅⋅ ⋅ ⋅ ⋅ ⋅⋅ ⋅
⋅
C个
Xi
●将前后两部分分别作回归,分别计算出各部 将前后两部分分别作回归, 分剩余 ei , 2 ● 比较前后两个回归的剩余平方和 ∑ ei : ei2 之比接近于 ,为同方差; 如果两个 ∑ 之比接近于1,为同方差; ei2 之比不同于 ,为异方差 如果两个 ∑ 之比不同于1, 前提条件: 前提条件: ●样本容量较大 服从正态分布, ● ui 服从正态分布,并除异方差外满足其他 基本假定
具体步骤: 具体步骤:
●排序 将观测值按解释变量 大小顺序排列 排序:将观测值按解释变量 排序 将观测值按解释变量X大小顺序排列 数据分组:去掉中间的 去掉中间的C个 ●数据分组 去掉中间的 个(约1/4)观测值,分别 )观测值, 进行前后两部分 (n − c) 2 个观测值的回归 ●提出假设:分别进行前后两部分回归的基础上,提出 提出假设 分别进行前后两部分回归的基础上, 分别进行前后两部分回归的基础上 检验假设: 检验假设: o : ui H 即
第五章 异方差性 答案
第五章 异方差性一、判断题1. 在异方差的情况下,通常预测失效。
( T )2. 当模型存在异方差时,普通最小二乘法是有偏的。
( F )3. 存在异方差时,可以用广义差分法进行补救。
(F )4. 存在异方差时,普通最小二乘法会低估参数估计量的方差。
(F )5. 如果回归模型遗漏一个重要变量,则OLS 残差必定表现出明显的趋势。
( T ) 二、单项选择题1.Goldfeld-Quandt 方法用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性 2.在异方差性情况下,常用的估计方法是( D )A.一阶差分法B.广义差分法C.工具变量法D.加权最小二乘法 3.White 检验方法主要用于检验( A )A.异方差性B.自相关性C.随机解释变量D.多重共线性 4.下列哪种方法不是检验异方差的方法( D )A.戈德菲尔特——匡特检验B.怀特检验C.戈里瑟检验D.方差膨胀因子检验 5.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即( B )A.重视大误差的作用,轻视小误差的作用B.重视小误差的作用,轻视大误差的作用C.重视小误差和大误差的作用D.轻视小误差和大误差的作用 6.如果戈里瑟检验表明,普通最小二乘估计结果的残差与有显著的形式的相关关系(满足线性模型的全部经典假设),则用加权最小二乘法估计模型参数时,权数应为( B ) A. B.C. D.7.设回归模型为,其中()2i2i x u Var σ=,则b 的最有效估计量为( D )A. B.C. D. ∑=ii x y n 1b ˆ8.容易产生异方差的数据是( C )A. 时间序列数据B.平均数据C.横截面数据D.年度数据9.假设回归模型为i i i u X Y ++=βα,其中()2i 2i X u Var σ=,则使用加权最小二乘法估计模i e i x i i i v x e +=28715.0i v i x 21i x i x 1ix 1i i i u bx y +=∑∑=2ˆxxy b 22)(ˆ∑∑∑∑∑--=x x n y x xy n b xyb=ˆ型时,应将模型变换为( C )。
第五章:异方差性(作业)
第五章:异方差性(作业)标准化文件发布号:(9312-EUATWW-MWUB-WUNN-INNUL-DQQTY-为了研究中国出口商品总额EXPORT 对国内生产总值GDP 的影响,搜集了1990~2015年相关的指标数据,如表所示。
(1) 根据以上数据,建立适当线性回归模型。
(2) 试分别用White 检验法与ARCH 检验法检验模型是否存在异方差 (3) 如果存在异方差,用适当方法加以修正。
解:(1)100,000200,000300,000400,000500,000600,000700,000XYDependent Variable: Y Method: Least SquaresDate: 04/18/20 Time: 15:38 Sample: 1991 2015Included observations: 25VariableCoefficient Std. Error t-Statistic Prob.C X R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid +10 Schwarz criterionLog likelihood Hannan-Quinn criter. F-statisticDurbin-Watson stat Prob(F-statistic)模型回归的结果:^673.0863 4.0611iX i Y =-+()(0.043820.1368)t =-20.9463,25R n ==(2)white: 该模型存在异方差Heteroskedasticity Test: WhiteF-statistic Prob. F(2,22) Obs*R-squared Prob. Chi-Square(2) Scaled explained SS Prob. Chi-Square(2)Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 04/18/20 Time: 17:45 Sample: 1991 2015 Included observations: 25Variable Coefficient Std. Error t-StatisticProb. C +09 +09 X^2 X R-squared Mean dependent var +09 Adjusted R-squared . dependent var +09. of regression +09 Akaike info criterion Sum squared resid +20 Schwarz criterion Log likelihood Hannan-Quinn criter. F-statistic Durbin-Watson stat Prob(F-statistic)ARCH 检验:该模型存在异方差Heteroskedasticity Test: ARCHF-statisticProb. F(1,22)Obs*R-squaredProb. Chi-Square(1)Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 04/18/20 Time: 19:55Sample (adjusted): 1992 2015Included observations: 24 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob.C+08+08RESID^2(-1)R-squared Mean dependent var+09 Adjusted R-squared . dependent var+09 . of regression+09 Akaike info criterionSum squared resid+20 Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson statProb(F-statistic)(3)修正:加权最小二乘法修正Dependent Variable: YMethod: Least SquaresDate: 04/18/20 Time: 20:46Sample: 1991 2015Included observations: 25Weighting series: W2Weight type: Inverse variance (average scaling)Variable Coefficient Std. Error t-Statistic Prob.CXWeighted StatisticsR-squared Mean dependent varAdjusted R-squared . dependent var. of regression Akaike info criterionSum squared resid+09 Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson statProb(F-statistic) Weighted mean dep.Unweighted StatisticsR-squaredMean dependent var Adjusted R-squared . dependent var . of regressionSum squared resid+10修正后进行white 检验:Heteroskedasticity Test: WhiteF-statistic Prob. F(2,22) Obs*R-squared Prob. Chi-Square(2) Scaled explained SS Prob. Chi-Square(2)Test Equation: Dependent Variable: WGT_RESID^2 Method: Least Squares Date: 04/18/20 Time: 20:41 Sample: 1991 2015 Included observations: 25 Collinear test regressors dropped from specificationVariable Coefficient Std. Error t-StatisticProb. C X*WGT^2 WGT^2R-squared Mean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid +16 Schwarz criterion Log likelihood Hannan-Quinn criter. F-statistic Durbin-Watson stat Prob(F-statistic)修正后的模型为^10781.17 3.931606iX i Y =+(4.925821)(20.47667)t =20.9480,25R n ==表的数据是2011年各地区建筑业总产值(X )和建筑业企业利润总额(Y )。
第五章 异方差性 思考题
第五章 异方差性 思考题5.1 简述什么是异方差 ? 为什么异方差的出现总是与模型中某个解释变量的变化有关 ?5.2 试归纳检验异方差方法的基本思想 , 并指出这些方法的异同。
5.3 什么是加权最小二乘法 , 它的基本思想是什么 ?5.4 产生异方差的原因是什么 ? 试举例说明经济现象中的异方差性。
5.5 如果模型中存在异方差性 , 对模型有什么影响 ? 这时候模型还能进行应用分析吗 ?5.6 对数变化的作用是什么 ? 进行对数变化应注意什么 ? 对数变换后模型的经济意义有什么变化 ? 5.7 怎样确定加权最小二乘法中的权数 ? 练习题5.1 设消费函数为 12233i i i i Y X X u βββ=+++其中,i Y 为消费支出;2i X 为个人可支配收入;3i X 为个人的流动资产;i u 为随机误差项 ,并且 E(i u )=0,Var(i u )= 222i X σ( 其中2σ为常数) 。
试回答以下问题 : 1) 选用适当的变换修正异方差 , 要求写出变换过程 ; 2) 写出修正异方差后的参数估计量的表达式。
5.2 根据本章第四节的对数变换 , 我们知道对变量取对数通常能降低异方差性 , 但需对这种模型的随机误差项的性质给予足够的关注。
例如 ,设模型为21Y X u ββ=,对该模型中 的变量取对数后得12ln ln ln ln Y X u ββ=++1) 如果ln u 要有零期望值 ,u 的分布应该是什么 ? 2) 如果 E(u )=1, 会不会 E(ln u )=0? 为什么 ? 3) 如果 E(ln u ) 不为零 , 怎样才能使它等于零 ?5.3 表 5.8 给出消费 Y 与收入 X 的数据 , 试根据所给数据资料完成以下问题 :1) 估计回归模型12Y X u ββ=++中的未知参数1β和2β, 并写出样本回归模型的书写格式;2) 试用 GOMeld-Quandt 法和 White 法检验模型的异方差性 3 3) 选用合适的方法修正异方差。
第五章异方差
(2).计算残差序列及残差平方序列; (3).求辅助回归函数:
e ˆt2 a 0 a 1 e ˆt2 1 a 2 e ˆt2 2 a p e ˆt2 p
(4).由辅助回归函数求得判定系数 R 2 (5).在H0原假设成立的条件下:
4.实际经济问题中的异方差性
例1:横截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i,Yi:第i个家庭的 储蓄额 Xi:第i个家庭的可支配收入
• 高收入家庭:储蓄的差异较大 • 低收入家庭:储蓄则更有规律性,差异较小 • i的方差呈现单调递增型变化
例2:以某一行业的企业为样本建立企业生产函数模型:Yi Ai1Ki2Li3ei 那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
D12Ω D1D12D D D 1 2I
对上述新模型进行OLS估计就是原始模型的GLS估计。
β ˆ*(X *X *)1X *Y * (XD1D1X)1XD1D1Y (XW1X)1XW1Y
这就是原模型Y=X+的GLS估计量,是无偏、有效
的估计量。
3 通过对数据取对数减弱异方差的影响
1. 2E+ 12 1. 0E+ 12
uˆt = a0 + a1 xt2
uˆt = a0 + a1 xt , ….
Glejser 检验的特点是: ①既可检验递增型异方差,也可检验递减型异方差。 ②一旦发现异方差,同时也就发现了异方差的具体表现形式。 ③当原模型含有多个解释变量值时,可以把 uˆt 拟合成多变量回归形式。
(4)自回归条件异方差(ARCH)检验(不要求掌握)
e~i2
X 递减异方差
异方差性作业
异方差性作业一、问题的提出和模型的设定为了给国内生产总值的研究寻找依据,分析比较国内生产总值和居民消费水平的关系,建立国内生产总值和居民消费水平的回归模型。
假定国内生产总值和居民消费水平之间满足线性约束,则理论模型设定为Yi=β1+β2Xi+ui其中,Yi表示国内生产总值,Xi表示居民消费水平。
由《中国统计年鉴》得到1988-2021年的相关数据。
1988-2021年中国国内生产总值与居民消费水平居民消国内生产费水平总值Y/亿(X1)/年份元元 1988 15042.8 714 1989 16992.3 788 1990 18667.8833 1991 21781.3 932 1992 26923.5 1116 1993 35333.9 1393 1994 48197.9 18331995 60793.7 2355 1996 71176.6 2789 1997 78973 3002 1998 84402.3 3159 1999 89677.1 3346 2000 98000.5 3632 2001 108068.2 3869 2002 119095.7 4106 2021135174 4411 2021 159878.3 4925 2021 183217.4 5463 2021 211923.5 6138 2021 257305.6 7103 2021 300670 8183 二、参数估计进入EViews软件包,确定样本范围,编辑输入数据,选择估计方程菜单,估计一下样本回归函数。
估计样本回归函数Dependent Variable: Y Method: Least Squares Date: 05/27/10 Time: 15:08Sample: 1988 2021 Included observations: 21 Variable ∧ C X R-squared Adjusted R-squared S.E. of regression Sum squared resid Loglikelihood Durbin-Watson statCoefficient -22997.51 37.44105 Std. Error 4413.145 1.119365 t-Statistic -5.211139 33.44846 Prob. 0.0000 0.0000 101966.4 81193.2921.49633 21.59580 1118.800 0.000000 0.983301 Mean dependent var0.982422 S.D. dependent var 10764.71 Akaike info criterion 2.20E+09 Schwarz criterion -223.7114 F-statistic 0.130034 Prob(F-statistic) 估计结果为Yi*=-22997.51+37.44105Xi(-5.211139) (33.44846) 括号内为T统计量值 R2=0.983301,F=1118.8 三、检验模型的异方差生成残差平方(e^2)序列Last updated: 05/27/10 - 15:09 Modified: 1988 2021 // e2=(resid)^2 127857387.187195 109961782.879649 109765834.828736 97688616.985904 66207547.16643 38143361.3624126 6584198.13043462 19205945.2640684 105041477.803645 108733133.860987 118297446.13547158839119.595988 224636533.393974 190266390.82371 135483482.244349 48733766.6299123 2314527.37376778 2803809.81355403 26090125.2535279 206190536.496472 298854278.666403 e^2与x的散点图3.20E+082.80E+082.40E+082.00E+08E21.60E+081.20E+088.00E+074.00E+070.00E+000200 04000X6000800010000 由以上数据和图表可知,模型很可能存在异方差性.下面用GOLDFILED-QUANADTA检验以递增型排序obs 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2021 2021 2021 2021 2021 2021 Y 15042.8 16992.3 18667.8 21781.3 26923.5 35333.9 48197.9 60793.7 71176.6 78973 84402.3 89677.1 98000.5 108068.2 119095.7 135174 159878.3 183217.4 211923.5 257305.6 300670 X 714 788 833 932 1116 1393 1833 2355 2789 3002 3159 3346 3632 3869 4106 4411 4925 5463 6138 7103 8183 构建子样本区间建立回归模型。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为了研究中国出口商品总额EXPORT 对国内生产总值GDP 的影响,搜集了1990~2015年相关的指标数据,如表所示。
资料来源:《国家统计局网站》(1) 根据以上数据,建立适当线性回归模型。
(2) 试分别用White 检验法与ARCH 检验法检验模型是否存在异方差 (3) 如果存在异方差,用适当方法加以修正。
解:(1)100,000200,000300,000400,000500,000600,000700,000XYDependent Variable: Y Method: Least Squares Date: 04/18/20 Time: 15:38Sample: 1991 2015Included observations: 25VariableCoefficientStd. Error t-Statistic Prob.C XR-squared Mean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterionSum squared resid +10 Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson stat Prob(F-statistic)模型回归的结果:^673.0863 4.0611iX i Y =-+()(0.043820.1368)t =-20.9463,25R n ==(2)white: 该模型存在异方差Heteroskedasticity Test: WhiteF-statistic Prob. F(2,22) Obs*R-squared Prob. Chi-Square(2) Scaled explained SSProb. Chi-Square(2)Test Equation:Dependent Variable: RESID^2 Method: Least Squares Date: 04/18/20 Time: 17:45 Sample: 1991 2015Included observations: 25VariableCoefficientStd. Error t-Statistic Prob.C +09+09X^2XR-squared Mean dependent var+09 Adjusted R-squared. dependent var+09. of regression+09Akaike info criterionSum squared resid+20Schwarz criterionLog likelihoodHannan-Quinn criter.F-statistic Durbin-Watson statProb(F-statistic)ARCH检验:该模型存在异方差Heteroskedasticity Test: ARCHF-statistic Prob. F(1,22)Obs*R-squared Prob. Chi-Square(1)Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 04/18/20 Time: 19:55Sample (adjusted): 1992 2015Included observations: 24 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob.C+08+08RESID^2(-1)R-squared Mean dependent var+09 Adjusted R-squared. dependent var+09. of regression+09Akaike info criterionSum squared resid+20Schwarz criterionLog likelihoodHannan-Quinn criter.F-statistic Durbin-Watson stat Prob(F-statistic)(3)修正:加权最小二乘法修正Dependent Variable: YMethod: Least SquaresDate: 04/18/20 Time: 20:46Sample: 1991 2015Included observations: 25Weighting series: W2Weight type: Inverse variance (average scaling)Variable Coefficient Std. Error t-Statistic Prob.CXWeighted StatisticsR-squared Mean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid+09Schwarz criterionLog likelihoodHannan-Quinn criter.F-statistic Durbin-Watson statProb(F-statistic)Weighted mean dep.Unweighted StatisticsR-squared Mean dependent varAdjusted R-squared. dependent var. of regression Sum squared resid+10修正后进行white检验:Heteroskedasticity Test: WhiteF-statistic Prob. F(2,22)Obs*R-squared Prob. Chi-Square(2)Scaled explained SSProb. Chi-Square(2)Test Equation:Dependent Variable: WGT_RESID^2 Method: Least Squares Date: 04/18/20 Time: 20:41 Sample: 1991 2015Included observations: 25Collinear test regressors dropped from specificationVariableCoefficientStd. Error t-Statistic Prob.C X*WGT^2 WGT^2R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterionSum squared resid +16 Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson stat Prob(F-statistic)修正后的模型为^10781.17 3.931606iX i Y =+(4.925821)(20.47667)t =20.9480,25R n ==表的数据是2011年各地区建筑业总产值(X )和建筑业企业利润总额(Y )。
数据来源:国家统计局网站根据样本资料建立回归模型,分析建筑业企业利润总额与建筑业总产值的关系,并判断模型是否存在异方差,如果有异方差,选用最简单的方法加以修正。
解:散点图:0100200300400500600700X Y建立线性回归模型:Dependent Variable: Y Method: Least Squares Date: 04/18/20 Time: 21:16 Sample: 1 31Included observations: 31VariableCoefficientStd. Error t-Statistic Prob.C XR-squared Mean dependent var Adjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid Schwarz criterionLog likelihoodHannan-Quinn criter.F-statistic Durbin-Watson statProb(F-statistic)white检验:Heteroskedasticity Test: WhiteF-statistic Prob. F(2,28)Obs*R-squared Prob. Chi-Square(2)Scaled explained SS Prob. Chi-Square(2)Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 04/18/20 Time: 21:19Sample: 1 31Included observations: 31Variable Coefficient Std. Error t-Statistic Prob.CX^2XR-squared Mean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid Schwarz criterionLog likelihoodHannan-Quinn criter.F-statistic Durbin-Watson stat Prob(F-statistic)模型存在异方差模型修正:加权最小二乘法Dependent Variable: YMethod: Least SquaresDate: 04/18/20 Time: 21:24Sample: 1 31Included observations: 31Weighting series: W2Weight type: Inverse variance (average scaling)Variable Coefficient Std. Error t-Statistic Prob.CXWeighted StatisticsR-squared Mean dependent varAdjusted R-squared. dependent var. of regressionAkaike info criterionSum squared resid Schwarz criterionLog likelihoodHannan-Quinn criter.F-statistic Durbin-Watson stat Prob(F-statistic)Weighted mean dep.Unweighted StatisticsR-squared Mean dependent var Adjusted R-squared. dependent var. of regression Sum squared resid Durbin-Watson stat加权后进行white检验:Heteroskedasticity Test: WhiteF-statistic Prob. F(2,28)Obs*R-squared Prob. Chi-Square(2) Scaled explained SS Prob. Chi-Square(2)Test Equation:Dependent Variable: WGT_RESID^2Method: Least SquaresDate: 04/18/20 Time: 21:25Sample: 1 31Included observations: 31Collinear test regressors dropped from specificationVariableCoefficientStd. Error t-Statistic Prob.C X*WGT^2 WGT^2R-squared Mean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterionSum squared resid Schwarz criterion Log likelihood Hannan-Quinn criter.F-statistic Durbin-Watson stat Prob(F-statistic)修正成功,修正后的模型为:^0.0207340.034505iX i Y =+(0.015338)(14.11049)t =20.8729,31R n ==表是2015年中国各地区人均可支配收入(X )与居民每百户汽车拥有量(Y )的数据。