(07)违背经典假定的回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/11/22
30
(三)戈里瑟(Glejser)检验
用残差绝对值 e i 对每个解释变量建立各种回归 模型,如
ei 12Xi vi
ei
1
2
1 Xi
vi
ei 12Xi2vi
ei 12 Xi vi
等等,并检验回归系数 2 是否为0。
2020/11/22
31
设原假设为 H0 :2 0备择假设为 H1:2 ,0
23
§7.2.2 异方差性的诊断及改进方法
Q1:回归模型中异方差性的检验方法有哪些?
(一)残差图分析法
残差图分析法是一种直观、方便的分析
方法。它以残差
e
2 i
为纵坐标,以其他适宜
的变量为横坐标画散点图。常用的横坐标
有三种选择:(1)以拟合值 Y ˆ i 为横坐标; (2)以 X i 为横坐标 i1,2,,n,;(3)以观 测时间或序号为横坐标。
n2,模型参数个数为k,两段样本回归残
差分别为e1i和e2i,则两段的残差平方和
分别为 和 ,从而可 n1 R SS1 e12i
n2
RSS 2 e22i
i 1
i 1
计算出各段模型的随机误差项的方差估
计量分别为
ˆ
2 1
RSS1 n1 k
和
ˆ
2 2
RSS2 n2 k
2020/11/22
27
由此可构造出检验统计量为
21
引起异方差的原因还有很多,如 模型中省略了重要的解释变量,模型 的函数形式设定不准确等都容易产生 异方差。一般情况下样本数据为截面 数据时容易产生异方差性。
2020/11/22
22
Q3:异方差性会导致哪些后果?
当模型中存在异方差时,参数 ˆ 的方差将大于
在同方差条件下的方差。如果用普通最小二乘法估计
如果多重共线性是欠完全的,那么,回归系数虽然 可以确定,但标准误较大,回归系数的估计精确度 下降
出现多重共线性时,估计值稳定性差,有时回归方 程整体高度显著,有些回归系数则通不过显著性检 验,回归系数的符号也可能出现倒置,使得无法对 回归方程得到合理的经济解释,直接影响到最小二 乘法的应用效果,降低回归方程的应用价值
应用t 检验判断,如果 2 0 ,则有异方
差。这种方法不仅能检验出模型中存在的异 方差,而且把异方差的表现形式找出来便于 后面改进时使用。
2020/11/22
32
(四)怀特检验
用残差平方
e
2 i
对所有解释变量及其平方
项和交叉乘积项 X 2 ,X 3 ,,X 2 2 ,X 3 2 ,,X 2 X 3 ,
2020/11/22
25
(二)戈德菲尔德-匡特检验(样本分段比检验)
首先将样本按某个解释变量的大小顺 序排列,并将样本从中间截成两段;然 后各段分别用普通最小二乘法拟合回归 模型,并分别计算各段的残差平方和。
2020/11/22
26
令第一段为高方差段,第二段为低方
差段,并记两段的样本容量分别为n1 和
)
2
xj2 VIFj
VIFj
1
1
R
2 j
经验表明,当VIFj≥ 10时,说明自变量Xj与
其余自变量之间有严重多重共线性
2020/11/22
7
三、直观判断法
如果出现下列情况时,认为可能存在多重共线性 (1)当增加或剔除一个自变量或者改变一个观察
值时,回归系数的估计值发生较大变化 (2)从定性分析认为,一些重要的自变量在回归
注意事项:较高的简单相关系数只是多重共线性存在的 充分条件,而不是必要条件。特别是在多于两个解释变 量的回归模型中,有时较低的简单相关系数也可能存在 多重共线性。因此并不能简单地依据相关系数进行多重 共线性的准确判断。
2020/11/22
6
二、方差扩大(膨胀)因子法
var(ˆj)
2
xj
2
(11Rj2
进行线性回归,并检验各回归系数是否
为0。
2020/11/22
2020/11/22
20
【例7.3】利用某行业的不同企业的截面 样本数据估计C-D生产函数
YAKLeu
由于这里的u表示了包括不同企业的工 艺、地理条件、工人素质、管理水平上的 差异以及其他因素,对于不同企业,这些 因素对产出的影响程度不同,引起 ui 偏离 0均值的程度不同,出现了异方差。
2020/11/22
2020/11/22
2
§7.1.1 多重共线性基本知识
Q1:什么是多重共线性?
1.完全共线性:
是指解释变量存在下列线性关系:
1 X 1 2 X 2 k X k 0 ( 其 中 1 , 2 ,k 不 全 为 零 )
X 2i1X 1 i3X 3 ikX ki(20 )
wk.baidu.com
2
2
方程中没有通过显著性检验 (3)有些自变量的回归系数符号与定性分析结果
违背时 (4)自变量相关矩阵中,自变量之间的相关系数
较大 (5)一些重要自变量的回归系数的标准误差较大
2020/11/22
8
Q2:处理多重共线性的方法主要有哪些?
1、剔除变量法 2、增大样本容量 3、变换模型形式 4、利用非样本先验信息 5、横截面数据与时序数据并用 6、变量变换 7、逐步回归法 8、使用有偏估计(岭回归法、主成分法、偏最小二
2020/11/22
10
EViews操作
1、建立回归方程 利用最小二乘法,
建立回归方程
y=b0+b1*x1+b2*x2 +b3*x3+b4*x4+b5*x5 命令为
ls y c x1 x2 x3 x4 x5 得到右窗口
2020/11/22
11
2、简单相关系数检验法
命令为cor x1 x2 x3 x4 x5 从解释变量的相关系数来看,x1、x2、x4、x5之
参数,将出现低估 ˆ 的真实方差的情况。进一步将 导致回归系数的检验值高估,可能造成本来不显著的
某些回归系数变成显著。这将给回归方程的应用效果
带来一些影响。
1.参数估计量虽是无偏的,但不是最小方差线性
无偏估计
2.参数的显著性检验失效
3.回归方程的应用效果极不理想,或者说模型的
预测失效。
2020/11/22
Fˆ12 RSS1/(n1k) ˆ22 RSS2 /(n2 k)
2020/11/22
28
该统计量服从自由度为(n1-k)
和(n2-k)的F分布。在给定的显著 性水平α之下,若此F统计量的值大
于临界值
Fn1k,n2k
则可认为有异方差的存在。
2020/11/22
29
为了提高此检验的功效,戈德菲尔 德和匡特曾经建议,将观测样本分成 两段时,可将中间的部分数据删掉。 然而,删掉的数据越多,各段中估计 的自由度就越小,从而又会影响检验 的功效。因此,删掉的中间部分数据 也不能太多。一般地,删掉的数据不 应多于样本观测数据的1/3。
间的相关系数都在90%以上,证明解释变量之间存 在相关性。
2020/11/22
12
3、方差膨胀因子检验法
作辅助回归 x1=b0+b1*x2+b2*x3+b3*x4+b4*x5 命令 ls x1 c x2 x3 x4 x5
计算方差膨胀因子 命令 Scalar VIFX1=1/(1-eqx1.@r2)
14
结果中x2的回归系数为负,与经济理论不符。按上述方法计算 x2,x3,x4,x5对应的方差膨胀因子分别为vif2=77.55, vif3=2.32, vif4=33.81, vif5=24.47, 因 vif2=77.55>>10,说明上述模型依然有较严重的多重共线性。
剔除x2 ,建立y与x3、x4、x5的回归方程,结果如下
2020/11/22
18
【例7.2】 在研究城镇居民收入与消 费的关系时,我们知道居民收入与消费水
平有着密切的关系。用 Xi 表示第 i 户的
收入,Yi 表示第 i 户的消费额,那么反映
收入与消费之间的模型为:
Y i 1 2 X i u ,i 1 ,2 , ,n
2020/11/22
19
在上式的模型中,因为各户的收入不 同,消费观念和习惯的差异,导致消费 的差异非常大,模型中存在明显的异方 差性。一般情况下,低收入的家庭购买 差异性较小,大都购买生活必需品;但 是高收入的家庭购买行为差异就很大, 高档消费品很多,房子、汽车的规格选 择余地也很大,这样购买金额的差异就 很大;导致消费模型的随机误差项具有 不同的方差。
2020/11/22
15
§7.2 异方差诊断及改进方法
§7.2.1 异方差基本知识
Q1:什么是异方差性?
异方差性: 在线性模型的基本假 定中,关于方差不变的假定不成立, 其他假定不变的情形称为异方差性。
2020/11/22
16
Q2:产生异方差性的原因有哪些?
实际问题是非常错综复杂的,因而在建 立实际问题的回归分析模型时,经常会出现 某一因素或一些因素随着解释变量观测值的 变化而对被解释变量产生不同的影响,导致 随机误差项产生不同方差。通过下面的几个 例子,我们可以了解产生异方差性的背景和 原因。
2020/11/22
5
§7.1.2 多重共线性的诊断及处理方法
Q1:检验回归模型中变量之间多重共线性的方法主要有哪些?
一、简单相关系数检验法
含义:是利用解释变量之间的线性相关程度去判断是否 存在严重多重共线性的一种简便方法。
判断规则:一般而言,如果每两个解释变量的简单相关 系数(零阶相关系数)比较高,如大于0.8,则可认为存 在着较严重的多重共线性。
第七章 违背经典假定的回归模型
§7.1 多重共线性的诊断及处理方法 §7.2 异方差诊断及改进方法 §7.3 自相关的检验及补救方法
2020/11/22
1
§7.1 多重共线性的诊断及处理方法
Q:经典线性回归模型中有哪些基本假定?
1、回归模型对参数而言是线性的; 2、各自变量Xi的值在重复抽样中是固定的; 3、对给定的Xi,随机干扰项ui的均值为零; 4、对给定的Xi,随机干扰项ui的方差不变; 5、对给定的Xi,随机干扰项ui无自相关; 6、如果Xi是随机的,则干扰项ui与Xi是不相关的; 7、观测次数必定大于自变量的个数; 8、自变量的取值必须有足够的变异性; 9、回归模型是正确设定的; 10、自变量之间无准确的线性关系,即无多重共线性; 11、随机干扰项ui是正态分布的。
2020/11/22
17
【例7.1】按照差错—学习模式,当人们学 习时,动作上出现的差错随时间的增加而 逐渐减少。如在某一时期内测验打字差错 数(Y)与打字实习小时数(X)之间的关 系。随着打字实习小时数的增加,打字差 错平均字数及它们的方差不是不变的,而 是随之减少的。这个模型中就出现了异方 差。
同理可求x2、x3、x4、x5对应的方差膨胀因子 vifx1=1963.34,vifx2=1741.51,vifx3=3.17, vifx4=55.49, vifx5=25.19
2020/11/22
13
4、模型的修正(剔除法) 剔除x1,建立y与x2、x3、x4、x5的回归方程,
结果如下
2020/11/22
乘法等)
2020/11/22
9
实际案例及EViews应用
为了研究我国民航客运量的变化趋势及其成因, 我们以我国连续16年的数据进行分析。其中,民航 客运量作为被解释变量,以国民收入、消费额、铁 路客运量、民航航线里程、来华旅游入境人数为影 响民航客运量的主要因素。
Y 表示民航客运量(万人),X1表示国民收入 (亿元),X2表示消费额(亿元),X3表示铁路客 运量(万人),X4表示民航航线里程(万公里), X5表示来华旅游入境人数(万人)。
2020/11/22
3
Q2:产生多重共线性的原因有哪些?
1、经济变量之间具有共同变化趋势。 2、模型中包含滞后变量。 3、利用截面数据建立模型也可能出现多重共
线性。 4、样本数据自身的原因。
2020/11/22
4
Q3:多重共线性会导致哪些后果?
如果多重共线性是完全的,各X变量的回归系数将 是不确定的,并且其标准误为无穷大
2020/11/22
24
在EViews软件包中,直接给出了以ei 为纵坐标,以观测时间或序号为横坐标的残
差图。
如果回归模型适合于样本数据,那么残
差ei 应反映ui 所假定的性质,因此可以根据 ei 来判断回归模型ui 是否具有某些性质。一 般情况下,当回归模型满足所有假定时,以
ei为纵坐标的残差图上n个点的散布应是随机 的、无任何规律。
2
2.欠完全线性关系:
是指解释变量与误差项存在下列线性关系:
1 X 1 2 X 2 k X k v i 0 ( 其 中 1 , 2 ,k 不 全 为 零 , v i 为 随 机 误 差 项 )
X 2 i 1X 1 i3X 3 ikX k i1v i(2 0 )
2
2
2
2