第六章:违背基本假设的回归方程2013
计量经济学简答题整理
简答题一、计量经济学的步骤答:选择变量和数学关系式 —— 模型设定 确定变量间的数量关系 —— 估计参数 检验所得结论的可靠性 —— 模型检验 作经济分析和经济预测 —— 模型应用 二、模型检验答:所谓模型检验,就是要对模型和所估计的参数加以评判,判定在理论上是否有意义,在统计上是否有足够的可靠性。
对计量经济模型的检验主要应从以下四方面进行:1、经济意义的检验。
2、统计推断检验。
3、计量经济学检验。
4、模型预测检验。
三、模型应用 答:(1)经济结构分析,是指用已经估计出参数的模型,对所研究的经济关系进行定量的考查,以说明经济变量之间的数量比例关系。
(2)经济预测,是指利用估计了参数的计量经济模型,由已知的或预先测定的解释变量,去预测被解释变量在所观测的样本数据以外的数值。
(3)政策评价,是利用计量经济模型对各种可供选择的政策方案的实施后果进行模拟测算,从而对各种政策方案作出评价。
(4)检验与发展经济理论,是利用计量经济模型去验证既有经济理论或者提出新的理论。
四、普通方法的思想和它的计算方法答:计量经济学研究的直接目的是确定总体回归函数12,然而能够得到的知识来自总体的若干样本的观测值,要用样本信息建立的样本回归函数尽可能“接近”地去估计总体回归函数。
为此,可以以从不同的角度去确定建立样本回归函数的准则,也就有了估计回归模型参数的多种方法。
例如,用生产该样本概率最大的原则去确定样本回归函数,成为极大似然发展;用估计的剩余平方和的最小的原则确定样本回归函数。
称为最小二乘法则。
为了使样本回归函数尽可能接近总体回归函数,要使样本回归函数估计的与实际的的误差尽量小,即要使剩余项越小越好。
可是作为误差有正有负,其简单代数和∑最小的准则,这就是最小乘准则,即∑∑∑五、简单线性回归模型基本假定 答:(1)对模型和变量的假定,如12i i iY X u ββ=++①假定解释变量x 是确定性变量,是非随机的,这是因为在重复抽样中是取一组固定的值.或者虽然是随机的,但与随机扰动项也是不相关;②假定模型中的变量没有测量误差。
违背基本假定问题优秀课件
§4.1 异方差性 Heteroscedasticity
一、异方差的概念 二、异方差性的后果 三、异方差性的检验 四、异方差的修正 五、例题
一、异方差的概念
1、异方差
Y i 0 1 X i i 2 X 2 i k X k ii i1,2,,n
高收入家庭:储蓄的差异较大; 低收入家庭:储蓄则更有规律性,差异较小。
i的方差呈现单调递增型变化
例4.1.2: 以绝对收入假设为理论假设、以截面数 据为样本建立居民消费函数:
Ci=0+1Yi+I
将居民按照收入等距离分成n组,取组平均数为样 本观测值。
• 一般情况下,居民收入服从正态分布:中等收入 组人数多,两端收入组人数少。而人数多的组平均 数的误差小,人数少的组平均数的误差大。
V a(ri ) 2
Homoscedasticity
Var(i)i2
即对于不同的样本点,随机误差项的方差不再 是常数,而互不相同,则认为出现了异方差性 (Heteroskedasticity)。
2、异方差的类型
• 同方差:i2 = 常数,与解释变量观测值Xi无关; 异方差:i2 = f(Xi),与解释变量观测值Xi有关。
e~i2
X 同方差
e~i2
X 递增异方差
e~i2
X 递减异方差
X 复杂型异方差
3、帕克(Park)检验与戈里瑟(Gleiser)检验
样本观测值的观测误差随着解释变量观测值的不 同而不同,往往引起随机项的异方差性,且呈U形。
例4.1.3: 以某一行业的企业为样本建立企业生产函 数模型
现代统计分析方法与应用课件第六章违背基本假设的回归分析
2020/4/3
中国人民大学六下页 返回 结束
§6.1 关于异方差性问题
2020/4/3
中国人民大学六西格玛质量管理研究中心
4
目录 上页 下页 返回 结束
§6.1 关于异方差性问题
利用平均数作为样本数据,也容易出现异方差性。因为正态 分布的普遍性,许多经济变量之间的关系遵从正态分布。 引起异方差的原因很多,但样本数据为截面数据时容易出现 异方差性。
中国人民大学六西格玛质量管理研究中心
15
目录 上页 下页 返回 结束
§6.1 关于异方差性问题
2020/4/3
中国人民大学六西格玛质量管理研究中心
16
目录 上页 下页 返回 结束
§6.1 关于异方差性问题
2020/4/3
中国人民大学六西格玛质量管理研究中心
17
目录 上页 下页 返回 结束
§6.1 关于异方差性问题
8
目录 上页 下页 返回 结束
§6.1 关于异方差性问题
2020/4/3
中国人民大学六西格玛质量管理研究中心
9
目录 上页 下页 返回 结束
§6.1 关于异方差性问题
2020/4/3
中国人民大学六西格玛质量管理研究中心
10
目录 上页 下页 返回 结束
§6.1 关于异方差性问题
(二)等级相关系数法
2020/4/3
中国人民大学六西格玛质量管理研究中心
5
目录 上页 下页 返回 结束
§6.1 关于异方差性问题
二、异方差性带来的问题
当一个回归问题存在异方差性时,如果仍用普通最小二乘法 估计未知参数,将引起严重后果,特别是最小二乘估计量不再 具有最小方差的优良性,即最小二乘估计的有效性被破坏了。
第六章-相关与回归
间相关程度的比较。
(2)1≤r≤1,0≤|r|≤1。 |r|越接近于1,说明两变量的相关程度越强; |r|越接近于0,两变量的相关程度越差。
(3)r=0表示x与y无相关, r<0表示负相关, r>0表示正相关, |r|=1为完全相关。
二、样本相关系数的计算
(x1,y1),(x2,y2),…,(xn,yn)。
前面已经指出,要研究两种变量间的关系,最简单的方 法是把一系列观测数据在坐标中用散点图表示,如果散点 大致分布在一条直线附件,就可以判断两者为直线回归关 系。这种关系可用直线回归方程表示。则总体直线回归方 程为:
yi xi i (i=1,2,…,n) i服 N 0 从 ,2,且相互独
相关变量间的关系一般分为两种: 一种是平行关系,是研究变量间关系的强弱程度,此
时我们不关心在它们之间是谁影响了谁,谁是因,谁是果, 变量间的地位是平等的。如黄牛的体长和胸围之间的关系, 猪的背膘厚度和眼肌面积之间的关系等都属于平行关系。
另一种是因果关系,即一个变量的变化受另一个或几 个变量的影响。如仔猪的生长速度受遗传特性、营养水平、 饲养管理条件等因素的影响,子代的体高受亲本体高的影 响。
N 1N 1 (XX X)Y ( Y Y)
(XX)Y (Y) (XX)2 (YY)2
r SP xy
xy(x)n(y)
SSxSSy
x2(nx)2y2(ny)2
其中:
SPxy— 变量x和变量y的离均差乘积和简称乘积和 SSx — 变量x 的离均差平方和 SSy — 变量y 的离均差平方和
相关系数r 的特点:
变量。
例如,进行药物疗效试验 时,应用不同的剂量 (x),分析疗效(y)如 何受到药物剂量的影响及 其变化规律。这里规定的
违背经典假设的线性回归模型及估计
(55)
估计辅助回归模型(55) ,计算未调整可决系数 RA 。 3)提出检验假设 原假设 H 0 : 1 2 p 0 ,即原模型中的 t 不存在 ARCH 效应; 备择假设 H1 : i ( i 1,2,, p )不全为零,即原模型中的 t 存在 ARCH 效应。 4)构造检验统计量 在原假设下,即 t 不存在 ARCH 效应时,LM 检验统计量
2
(Park 检验)是否与解释变量 xt 存在函数关系,若存在某种显著的函数关系,则表明异方 差性的存在;若不存在,则表明异方差性不存在。 检验步骤: 1)利用普通最小二乘法对样本观测值进行回归,估计模型参数并求得残差 et ; 2)分别建立残差的绝对值 et (Glejser 检验)或残差平方 et (Park 检验)对每个解 释变量的回归方程; 3)检验各回归模型参数的显著性; 4)判别:若残差序列与解释变量的回归模型参数显著地不为零,则表明存在异方差; 反之,若模型参数显著地为零,则随机误差项满足同方差性。 检验通常假设的几种函数形式: 1)Glejser 提出的假设函数形式
2 2 2
检验步骤: 1)对原模型作最小二乘估计,计算残差 et 和 et 1 , et 2 , 2)定义 p 阶辅助回归模型
2 2
et 2 0 1et 12 2et 2 2 pet p 2 t
( t p 1, p 2,, n )
2
et 0 1 xt h t
2)Park 提出的假设函数形式
( h 1, 2, 1/ 2, )
et 2 0 xt1 et
或 Glejser 检验的特点: 1)既可检验递增型异方差,也可检验递减型异方差; 2)当存在异方差时,能够发现了异方差的具体表现形式; 3)对样本容量要求也较大,且计算量相对较大; 4)当原模型为多元回归模型时,可以把 et 或 et 拟合成多变量回归形式。
《应用回归分析》课后习题答案
答:选择模型的数学形式的主要依据是经济行为理论,根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,并将由散点图显示的变量间的函数关系作为理论模型的数学形式。对同一问题我们可以采用不同的形式进行计算机模拟,对不同的模拟结果,选择较好的一个作为理论模型。
df
均方
F
显著性
组间
(组合)
1231497.500
7
175928.214
5.302
.168
线性项
加权的
1168713.036
1
1168713.036
35.222
.027
偏差
62784.464
6
10464.077
.315
.885
组内
66362.500
2
33181.250
总数
1297860.000
9
由于 ,拒绝 ,说明回归方程显著,x与y有显著的线性关系。
.212
.586
1.708
a.因变量: y
(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。
去除x3后作F检验,得:
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
12893.199
2
6446.600
11.117
.007a
残差
4059.3.500
.724
.433
.212
.586
1.708
a.因变量: y
(2)
所以三元线性回归方程为
模型汇总
模型
R
应用回归分析第四版答案
应用回归分析第四版答案【篇一:应用回归分析人大版前四章课后习题答案详解】应用回归分析(1-4章习题详解)(21世纪统计学系列教材,第二(三)版,何晓群,刘文卿编著中国人民大学出版社)目录1 回归分析概述 ....................................................................................................... (6)1.1 变量间统计关系和函数关系的区别是什么? (6)1.2 回归分析与相关分析的区别与联系是什么? (7)1.3回归模型中随机误差项?的意义是什么? (7)1.4线性回归模型的基本假设是什么? (7)1.5 回归模型的设置理论根据是什么?在回归变量设置中应该注意哪些问题? (8)1.6收集,整理数据包括哪些内容? (8)1.7构造回归理论模型的基本根据是什么? (9)1.8为什么要对回归模型进行检验? (9)1.9回归模型有哪几个方面的应用? (10)1.10为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合? (10)2 一元线性回归 ....................................................................................................... . (10)2.1一元线性回归模型有哪些基本假定? (10)2.2考虑过原点的线性回归模型足基本假定,求ny??*x??i1ii,i?1,2,...n 误差?1,?2,...?n仍满?1的最小二乘估计。
.............................................................................. 11 n2.3证明?e?o,?xe?0. .................................................................................. . (11)i?1ii?1ii2.4回归方程e(y)????x的参数?,?o101的最小二乘估计与最大似然估计在什么条件下等价?给出理由? (12)2.5证明??0是??0的无偏估计。
以往《计量经济学》作业答案(2)
以往计量经济学作业答案第一次作业:1-2. 计量经济学旳研究旳对象和内容是什么?计量经济学模型研究旳经济关系有哪两个基本特性?答:计量经济学旳研究对象是经济现象,是研究经济现象中旳具体数量规律(或者说,计量经济学是运用数学措施,根据记录测定旳经济数据,对反映经济现象本质旳经济数量关系进行研究)。
计量经济学旳内容大体涉及两个方面:一是措施论,即计量经济学措施或理论计量经济学;二是应用,即应用计量经济学;无论是理论计量经济学还是应用计量经济学,都涉及理论、措施和数据三种要素。
计量经济学模型研究旳经济关系有两个基本特性:一是随机关系;二是因果关系。
1-4.建立与应用计量经济学模型旳重要环节有哪些?答:建立与应用计量经济学模型旳重要环节如下:(1)设定理论模型,涉及选择模型所涉及旳变量,拟定变量之间旳数学关系和拟定模型中待估参数旳数值范畴;(2)收集样本数据,要考虑样本数据旳完整性、精确性、可比性和一致性;(3)估计模型参数;(4)模型检查,涉及经济意义检查、记录检查、计量经济学检查和模型预测检查。
1-6.模型旳检查涉及几种方面?其具体含义是什么?答:模型旳检查重要涉及:经济意义检查、记录检查、计量经济学检查、模型预测检查。
在经济意义检查中,需要检查模型与否符合经济意义,检查求得旳参数估计值旳符号与大小与否与根据人们旳经验和经济理论所拟订旳盼望值相符合;在记录检查中,需要检查模型参数估计值旳可靠性,即检查模型旳记录学性质;在计量经济学检查中,需要检查模型旳计量经济学性质,涉及随机扰动项旳序列有关检查、异方差性检查、解释变量旳多重共线性检查等;模型预测检查重要检查模型参数估计量旳稳定性以及对样本容量变化时旳敏捷度,以拟定所建立旳模型与否可以用于样本观测值以外旳范畴。
第二次作业:2-1答:P27 6条2-3 线性回归模型有哪些基本假设?违背基本假设旳计量经济学模型与否就不可估计?答:(1)略(2)违背基本假设旳计量经济学模型还是可以估计旳,只是不能使用一般最小二乘法进行估计。
违背经典假设的回归模型.pptx
LS Y (w QSH) X C 结果是一致的
2019-11-10
谢谢你的关注
55
模型变换法OLS处理结果
2019-11-10
谢谢你的关注
56
Lx4\lchf106.wf1原始数据
obs
Y
X
1976
22.8
35
1977
27.1 41.3
1978
34.5 52.4
1979
39.4 60.8
1980
1.0
0.5
RESID
0.0
-0.5
-1.0 20 40 60 80 100 120 140
X
2019-11-10
谢谢你的关注
59
2019-11-10
谢谢你的关注
60
模型变换法估计结果
请比较残差平方和是否减小
2019-11-10
谢谢你的关注
61
模型变换法后的残差与自变量的散点图
0.10
0.05
第4章 违背经典假设的回归模型
第一节 异方差性
2019-11-10
谢谢你的关注
1
违背基本假设的情况
在前述基本假定下OLS估计具有BLUE的优良性。 (Best Linear Unbiased Estmator)
然而实际问题中,这些基本假定往往不能满足, 使OLS方法失效不再具有BLUE特性。
1、时间为X轴,残差e为Y轴的残差序列图 2、因变量估计值y^为X轴,残差e为Y轴的Y^-
e散点图 3、解释变量为X轴,残差e(或e2)为Y轴的x-
e散点图 4、残差e的直方图 也可以使用误差项的平方来作图
2019-11-10
《应用回归分析》课后习题部分答案-何晓群版
第二章 一元线性回归2.14 解答:(1)散点图为:(2)x 与y 之间大致呈线性关系。
(3)设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为(4)22ni=11()n-2i i y y σ∧∧=-∑2n01i=11(())n-2i y x ββ∧∧=-+∑=2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1169049363110/3=++++=6.1σ∧=≈ (5)由于211(,)xxN L σββ∧t σ∧==服从自由度为n-2的t 分布。
因而/2|(2)1P t n αασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即:1/211/2(p t t ααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为(7-2.3537+2.353 即为:(2.49,11.5)22001()(,())xxx N n L ββσ-∧+t ∧∧==服从自由度为n-2的t 分布。
因而/2|(2)1P t n αα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1p βσββσα∧∧∧∧-<<+=- 可得195%7.77,5.77β∧-的置信度为的置信区间为()(6)x 与y 的决定系数22121()490/6000.817()nii nii y y r y y ∧-=-=-==≈-∑∑由于(1,3)F F α>,拒绝0H ,说明回归方程显著,x 与y 有显著的线性关系。
(8)t σ∧==其中2221111()22n ni i i i i e y y n n σ∧∧====---∑∑ 3.66==≈/2 2.353t α= /23.66t t α=>∴接受原假设01:0,H β=认为1β显著不为0,因变量y 对自变量x 的一元线性回归成立。
第十讲 违背假设的回归分析
异方差的检验
• 由于异方差的存在会导致OLS估计量的最佳性丧
失,降低精确度。所以,对所取得的样本数据 (尤其是横截面数据)判断是否存在异方差,是
我们在进行正确回归分析之前要考虑的事情。异
方差的检验主要有图示法和解析法,下面我们将 介绍几种常用的检验方法。
图示法
• 图示法是检验异方差的一种直观方法,通常有下 列两种思路: • (一)因变量y与解释变量x的散点图:若随着x 的增加,图中散点分布的区域逐渐变宽或变窄, 或出现了偏离带状区域的复杂变化,则随机项可 能出现了异方差。 ˆ 2 的估计值) • (二)残差图。残差图即残差平方 i(i 2 与x的散点图,或者在有多个解释变量时可作残 2 ˆi2 ˆ 差 与y的散点图或残差 和可能与异方差有关的 i x的散点图。具体做法:先在同方差的假设下对 ˆ 原模型应用OLS法,求出和残差平方 ,再绘制 i2 ˆ ˆ2 残差图( , yi i )。
其中 d i 表示第i个单元或现象的两种不同特性所处 的等级之差,而n表示带有级别的单元或现象的 个数。
• 在这里,我们假设模型为:
Yi 0 1 X i ui
(二)Spearman rank correlation 检验法
• 第一步,运用OLS法对原方程进行回归,计算残 ˆ 差 i= yi yi ,i=1,2…n。 ˆ
• 对于多元回归模型,可分别计算 i 与每个解释变 量的等级相关系数,再分别进行上述检验。
(三)Park检验法
i 2 • Park检验法就是将残差图法公式化,提出 是解 释变量 xi的某个函数,然后通过检验这个函数形 式是否显著,来判定是否具有异方差性及其异方 差性的函数结构。该方法的主要步骤如下:
《计量经济学》第三版课后题答案李子奈
第一章绪论参考重点:计量经济学的一般建模过程第一章课后题(1.4.5)1.什么是计量经济学?计量经济学方法与一般经济数学方法有什么区别?答:计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。
计量经济学方法揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述;一般经济数学方法揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。
4.建立与应用计量经济学模型的主要步骤有哪些?答:建立与应用计量经济学模型的主要步骤如下:(1)设定理论模型,包括选择模型所包含的变量,确定变量之间的数学关系和拟定模型中待估参数的数值范围;(2)收集样本数据,要考虑样本数据的完整性、准确性、可比性和—致性;(3)估计模型参数;(4)检验模型,包括经济意义检验、统计检验、计量经济学检验和模型预测检验。
5.模型的检验包括几个方面?其具体含义是什么?答:模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。
在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号与大小是否与根据人们的经验和经济理论所拟订的期望值相符合;在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质;在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性检验等;模型的预测检验主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。
第二章经典单方程计量经济学模型:一元线性回归模型参考重点:1.相关分析与回归分析的概念、联系以及区别?2.总体随机项与样本随机项的区别与联系?3.为什么需要进行拟合优度检验?4.如何缩小置信区间?(P46)由上式可以看出(1).增大样本容量。
样本容量变大,可使样本参数估计量的标准差减小;同时,在同样置信水平下,n越大,t分布表中的临界值越小。
第六章相关分析与回归分析
+
-
x+x0
+yy0
+
Ⅳ
-
0
x
x
第六章 相关分析与回归分析
STAT
coxv,y()0则r>0,说明x和y之间为正线性
相关;
coxv,y()0则r<0,说明x和y之间为负线性
相关;
coxv,y()0则r=0,说明x和y之间不存在线
性相关。
第六章 相关分析与回归分析
2、标准差 x 和 y 的作用
第六章 相关分222470, 64098 y26383 .48 , 7 5x7y1114.448633 STAT
r
nxyxy
nx2(x)2 ny2(y)2
1011144.486133371.785276.127
三、相关表和相关图
STAT
相关表
将某一变量x按其数值大小顺序排 列,然后再将与其相关的另一个变量y 对应值平行排列,观察x由小到大变化 时,y的变化情况。
第六章 相关分析与回归分析
八个同类工业企业的月产量与生产费用
企业编号
1 2 3 4 5 6 7 8
月产量(千吨)X
1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0
联系
STAT
(1)有函数关系的变量间,由于有测 量误差及各种随机因素的干扰,可表 现为相关关系;
(2)对具有相关关系的变量有深刻了 解之后,相关关系有可能转化为或借 助函数关系来描述。
第六章 相关分析与回归分析
• 例:判断下列关系是什么关系? • 1)物体体积随温度升高而膨胀,随压力加大而STAT
第六章 相关分析与回归分析
正相关
4违背基本假定的情况自相关性
三 序列相关性的后果
11
1 参数估计量非有效
OLS参数估计量仍具无偏性 OLS估计量不具有有效性 在大样本情况下,参数估计量仍然不具有渐 近有效性,这就是说参数估计量不具有一致性
12
2 变量的显著性检验失去意义
在关于变量的显著性检验中,当存在序列相 关时,参数的OLS估计量的方差增大,标准差也 增大,因此实际的 t 统计量变小,从而接受原
n
(et et1)2 /(n 1)
t2 n
(et e )2 / n
t2
该统计量被称为冯诺曼比。当样本容量足够大时 (大于30),该统计量近似服从正态分布。计算该 统计量的值,将它与具有正态分布的理论分布值进 行比较,如果大于临界值,表示不存在序列相关, 如果小于临界值,表示存在序列相关。
21
19
对各方程估计并进行显著性检验,如果存在 某一种函数形式,使得方程显著成立,则说明原 模型存在序列相关性。
具体应用时需要反复试算。
回归检验法的优点是: 一旦确定了模型存在序列相关性,也就
同时知道了相关的形式; 它适用于任何类型的序列相关性问题的
检验。
20
(2) 冯诺曼比检验法 冯诺曼比检验法在于构造统计量
t t1 t , 1 1
其中,被称为一阶自相关系数。
5
二 实际经济问题中的序列相关性
6
为什么会出现序列相关性?下面通过两个例子加 以说明。
例如,建立行业生产函数模型,以产出量为被解释变量, 资本、劳动、技术为解释变量,选择时间序列数据作为 样本观测值。于是有:
Qt f (Kt , Lt ,Tt ) t t 1,2, ,n
假设 i 0 的可能性增大, 检验就失去意义。
实用回归分析课件 (残差与残差图)
违背基本假设的情况
第六章 关于异方差性问题 第七章 关于自相关性问题 第八章 关于多重共相关问题
第六章 关于异方差性问题
var(i ) var( j ), i j
第六章 关于异方差性问题
6.1 异方差性产生的背景 6.2 异方差性的诊断 6.3 异方差问题的建模处理
第六章 关于异方差性问题
5.1 残差与残差图
一、残差概念与残差图
e
0
x
(b)
****y观测值的方差并非相同,随x增加而增加. 【消除异方差】
5.1 残差与残差图
一、残差概念与残差图
e
0
x (c)
****y与x之间并非线性关系. 可能y与x是曲线关系 可能y存在自相关
5.1 残差与残差图
一、残差概念与残差图
e
1 3 57 0
Gauss-Markov条件
E(εi ) 0, i 1, 2, , n
cov(εi,ε j )
σ 2 0
, ,
ij i
j
(i ,j 1, 2,, n)
6.1 异方差性产生的背景
一、异方差产生的原因
例6.1 居民收入与消费水平有着密切的关系。用xi 表示第i户的收入量,yi表示第i户的消费额,一个简单的 消费模型为:
四异常值问题补充53异常值与强影响值最小绝对离差和法012012011221011221????????minpnpiiipipiniiipipiqyxxxyxxx????????????????012????p?称回归参数的最小绝对离差和估计违背基本假设的情况第六章关于异方差性问题第七章关于自相关性问题第八章关于多重共相关问题第六章关于异方差性问题jijivarvar第六章关于异方差性问题61异方差性产生的背景62异方差性的诊断63异方差问题的建模处理2121nijj0ijicovn0ie2jii??????????gaussmarkov条件第六章关于异方差性问题61异方差性产生的背景一异方差产生的原因例61居民收入与消费水平有着密切的关系
违背模型基本假设
注意:由于完全符合理论模型所要求的样本数
据较难收集,特定样本可能存在某种程度的多重共 线性。在多元线性回归模型中我们关心的不是多重 共线性是否存在的问题,而是其多重共线性程度的 问题。因为在现实的经济问题中变量之间完全不相
关的现象很少见,大多数变量之间或多或少都有一
些相关性。 一般经验:时间序列数据样本:简单线性模型, 往往存在多重共线性。 截面数据样本:问题不那么严重,但多重共线
4.E+11 GD P 3.E+11
4.E+11 GDP 3.E+11
2.E+11
2.E+11
1.E+11
1.E+11
0.E+00 80 82 84 86 88 90 92 94 96 98 00 02
GDP(-1) 0.E+00 0.E+00 1.E+11 2.E+11 3.E+11
15
4.E+11
3
[内容] 共分4节: §4.1 多重共线性
§4.2
§4.3
异方差性
模型
讨论违背基本假定的多元线性回归模型的建模 问题(参数的估计、统计检验)。
4
[要求]1、理解多重共线性、异方差性、自相关性、随 机解释变量的基本概念; 2、理解违背基本假定的各种情形产生的原因及 (利用OLS法估计的)后果; 3、掌握估计各种违背基本假定的多元线性回归 模型的常用估计方法; 4、掌握检验模型是否违背基本假定的常用检验 方法。
2
建立违背基本假定回归模型存在的基本问题: OLS法是否还适用?所得参数的OLS估计
量是否还具有优良的统计性质?变量显著性t
检验和方程显著性F检验还有效吗? 如果OLS法失效,有哪些补救措施? 如何检验模型是否违背基本假定条件? 本章主要讨论不满足基本假定中的某一条, 而其余假定条件均成立时,多元线性回归模型参 数的有效估计和检验问题。
《生物统计》教学课件:回归13级动医学生版
0.9924
**
SS X SSY
90 210 .2
9.2.1 一元线性回归的数学模型 变量X与Y的一元线性函数关系为 Y=a+bX;
Y Y a bx
a
(0, 0)
1 单位
(X, Y)
b单位
X
若已知 X 与Y 的 n 组观测值 ( X 1 ,Y1 ) , ( X 2 ,Y2 ) , , ( X n ,Yn ) , 建立线性回归方程 Yˆ a b X
MMuulltiple R 0.818449
i
[ (Y i Y ) b( X i X ) ]b ( X i X )
i
b SP XY b 2 SS X b ( SP XY b SS X ) 0
(Yˆi Y ) 2 (a b X i Y ) 2
i
i
(Y b X b X i Y ) 2 [ b ( X i X ) ] 2
i
i
b 2 SS X
b
SPXY SS X
SS X
b SPXY
SST=SSE+SSR 总平方和=剩余平方和+回归平方和
SST =
(Y i Y )2
Y
2 i
1 n
(
Y i )2 , dfT =n-1,
i
i
i
SSR= b SPXY , dfR =1,
SSE =SST - SSE , dfE =n-2 ,再作方差分析。
9.2 简单回归(linear regression analysis)
研究当一个变量(自变量)发生一定量的变化时,可期望 另一变量(依变量)会相应地发生多大的变化,并通过一个回 归方程,根据自变量的取值对依变量的取值作出估计或预测。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y i − 0 .866 y i − 1 = 131 .59 + 0.318 ( x i − 0.866 x i − 1 )
y i = 131 .59 + 0.318 ( x i − 0.866 x i −1 ) + 0.866 y i −1
2. 一阶差分法: First-order difference method 差分法是用增量数据代替原来的样本数据,适用于原模型是时间序 列,且存在较高程度的一阶自相关的情况。如一元线性回归模型: 当随机项序列高度相关时,即当ρ近似为1时,令ρ=1,则增量形式 的线性模型为: ∆ y i = β 1∆ x i + u i 式中:
7
三. 序列相关性的诊断Diagnosis of Serial Correlation.
1. 图示法 Graphic Method 首先用最小二乘法估计回归模型的参数,求出残差项e;然后 再绘制e 的散点图,根据e的序列相关性来判断ε的序列相关性。残 差e的散点图有两种绘制方法: (1)绘制ei,ei-1的散点图,如果大部分点落入第一、三象限,则残 差项存在正相关,若大部分点落入二、四象限,则残差项序列存在负 相关。 (2)按照时间序列绘制残差项e的图形,如果ei,i=1,2,…,n随 时间的变化而有规律的变化,则可确定残差项存在序列相关性。 相应的图形见书上163页图6-2至6-3。
ρ1 ≈ 1 −
1 D .W = 1 − 0 .5 × 0 .554 = 0 .723 2
查表得du=1.39<D.W=1.537<4-du=2.61, 故模型不存在序列相关性。
13
由上表得:
y 00 = 36 . 45 + 0 . 318 x 00
将模型还原为原始数据的形式:
y ′ = 36 .45 /( 1 − 0 .723 ) + 0 .318 x ′
1
Ø 多元加权最小二乘法:
Qω ( β 0 , β 1 , L , β p ) = ∑ ω i ( yi − β 0 − β 1 xi 1 − L − β p xip )2
加权最小二乘估计WLS的矩阵表达式为:
ˆ = ( X ′WX )−1 X ′Wy β ω
ω1 0 0 ω 2 W = M M 0 0 L 0 L 0 L M L ωn
n
n
n
大致相等,
D .W =
∑
n
i=2
( e i2 − 2 e i e i − 1 + e i2− 1 )
∑
n
≈ 2 (1 −
∑
n
i=2
e ie i−1
n
e
i=2
2 i
∑
) e
2 i
i=2
ˆ) = 2 (1 − ρ
ˆ 是相关系数ρ 的估计值,且有 其中:ρ
ˆ ≈ 1− ρ 1 D .W 2
由证明可知:0 ≤d ≤4,根据给定的显著性水平α,回归系数个数 k和样本数据个数 n,查 D.W表,得到下限值dL和上限值dU .
ˆ +β ˆ x= 最后,将方程还原为: y ˆ=β 0 1
或者:
ˆ′ β 0 ˆ x +β 1 (1 − ρ )
ˆ′ + β ˆ ( x − ρx ) + ρy ˆi = β y 0 1 i i −1 i −1
11
例6.5
考察例4.2中D.W值
显然D.W值非常小,查表可知残差序列存在正自相关.进一步考 察自相关系数:
8
2. 自相关系数法 Autocorrelation Coefficient Method 如果模型存在一阶自回归形式序列相关性,其相关系数ρ满足:
ε
其中
i
= ρε
n
i−1
+ ui
i−1 n
ρ =
∑ ∑
n
i=2
ε iε
2 i
ε
i= 2
∑
ε
i=2
2 i−1
相关系数ρ的估计值为:
ˆ = ρ
∑ ∑
n i=2
例6.4 研究我国2005年31个省、市、自治区的农业总产值Y (亿 元)与有效灌溉面积x1(千公顷)和化肥施用量x2(万吨)的关 系。建立相应的回归模型。 解:首先进行相关分析:
2
用统计软件得回归分析的结果如下:
3
残差图分析可能出现异方差性。
4
使用等级相关系数法考察相关性
以X2化肥施用量构造权函数,用SPSS统计软件估计幂指数m:
X ′X = 0 ,
X ′X ≈ 0 , 并且
由于
( X ′X ) − 1 =
( X ′X ) * X ′X
ˆ ) = σ 2 ( X ′X ) − 1 Var ( β
ˆ 的方差很大,估计精度降低,估计效果明显变 所以,估计量 β 差,这时称设计矩阵X呈病态。
15
若考虑参数估计量的均方误差,有
ˆ ) = E (β ˆ − β )′ ( β ˆ − β ) = E( β ˆ −β MSE ( β
具体做法: 首先,求出残差与滞后残差的相关系数ρ; 其次, 根据相关系数ρ的估计值做出变换, 得到新的变量y´和X´,
y′ i = y i − ρ y i −1 ;
x′ i = x i − ρx i −1
ˆ ′ = βˆ 0′ + βˆ 1 x ′ 再次,根据新变量建立回归方程,y
如果方程通过D.W检验,迭代结束,否则,继续重复上述过程, 直到通过D.W检验。这种方法称为迭代法.
杜志渊
1. 多元线性回归与一元线性回归的基本假设条件有什么不同? 2. 为什么要引入修正的样本决定系数? 3. 复相关系数、偏相关系数与简单相关系数各自的含义是什么?
1. Rk(X)=p+1 2. 避免由于自变量增加使样本决定系数虚高。 3. 复相关系数是全体自变量与因变量线性相关程度的度量; 偏相关系数是一个自变量在控制其它自变量后,与因变量的真 实线性相关程度的度量。 简单相关系数是任意两个变量之间的pearson相关系数。
1. 待定系数法 Method of Undetermined Coefficients 为了诊断模型是否存在多重共线性,可将每一个自变量与其它自 变量进行线性回归,得:
x j = β0 + β1 x1 + L+ β j−1 x j −1 + β j +1 x j+1 + L+ β p x p j = 1,2,L, p
二 . 多重共线性带来的问题
Problems
1. 当回归模型自变量之间出现完全共线性时,参数的估计量不存在。 rk ( X ) < p + 1
( X ′X ) − 1 不存在 ˆ = ( X ′X ) − 1 X ′y 也不存在。 参数向量β的OLSE β
2. 一般共线性下普通最小二乘法参数估计量非有效。 在实际问题中,常见的是近似共线性的情况,即
n
i=2
e ie i−1
e i2
∑
n
i= 2
e i2− 1
其中ˆi ei = y源自 − yi = 1, 2 , L , n
3. DW检验(杜宾-瓦特森) D.W Test D.W检验是适用于小样本的一种检验方法,只能用于检验随机残差 项是否存在一阶自回归形式序列相关性,随机项的一阶自回归形式:
ε
i
= ρε
Cov (ε i , ε j ) ≠ 0
i ≠ j; i = 1, 2 , L , n; j = 1, 2 , L , n
称误差项之间存在自相关关系,是一个变量前后期数值间存在的相关关系。
一、产生的经济背景和原因Economic Background and Reason
1、遗漏了关键变量; 2、经济现象的滞后性; 3、回归函数形式错误; 4、蛛网现象可能带来的自相关性; 5、对数据的加工处理导致误差项出现自相关现象.
二、序列相关带来的问题Problems Caused by Serial Correlation
经济学模型一旦出现序列相关性,如果仍采用普通最小二乘法估计 模型参数,会产生下列不良后果: 1.参数估计值不再具有最小方差的线性无偏性; 2.最小二乘估计可能严重低估了误差项的方差; 3.容易导致对t值的估计过高,以 βˆ 估计β值可能会严重失实; 4. 回归模型预测失效. 注意:前面关于参数估计量的无偏性和有效性的证明过程,应用了 误差项满足同方差性和互相独立性条件。 如果误差项出现序列相关性,使对模型的所有显著性检验失去意 义,使得模型不具有良好的统计性质。模型的预测功能将不再有效。
i−1
+ ui
检验假设 H0:ρ=0;H1:ρ≠0 检验统计量 也称 D.W值
D .W =
∑
n
i= 2
(e i − e i−1 )2
∑
n
e i2
i=2
其中
ˆi ei = y i − y
i = 1,2, L , n
9
2 2 2 从数学上也容易证明当n较大时, ∑ e i ,∑ e i ,∑ e i − 1 i =1 i=2 i= 2 D.W统计量可以化简为:
yi = β 0 + β1 xi1 + β 2 xi 2 + L + β p xip + ε i
i = 1,2,L, n
其基本假设之一是自变量之间相互独立。若某两个或多个自变量间 出现了相关性,则称为多重共线性(Multicollinearity)。 如果某一个自变量可以用其他自变量的线性组合表示,则称为完 全共线性。即:rk(X)<P+1.完全共线性的情况并不多见.
可以证明:
2
2
)
ˆ−β E( β