第4章 违背经典假定的回归模型-异方差祥解
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
R2 0.785456 R 2 0.774146
F 69.56003
式中 Y 表示卫生医疗机构数(个), X表 示人口数量(万人)。
2018/11/28 2
模型显示的结果和问题
●人口数量对应参数的标准误差较小; ● t统计量远大于临界值,可决系数和修正的可决系 数结果较好,F检验结果明显显著; 表明该模型的估计效果不错,可以认为人口数量 每增加1万人,平均说来医疗机构将增加5.3735个。 然而,这里得出的结论可能是不可靠的,平均说来 每增加1万人口可能并不需要增加这样多的医疗机构, 所得结论并不符合真实情况。 有什么充分的理由说明这一回归结果不可靠呢?更 为接近真实的结论又是什么呢? 异方差问题
都被虚假地夸大,因此所得结果是不可信的。为
什么呢?
2018/11/28
自相关问题
5
第四章 违背经典假定的回归模型
本章讨论四个问题:
●异方差性 ●自相关 ●多重共线性 ●随机解释变量
2018/11/28
6
第一节 异方差性 本节讨论四个问题:
●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
2018/11/28 14
三、异方差的后果
(一)对参数估计统计特性的影响 1、参数估计的无偏性和线性性仍然成立 参数估计的无偏性仅依赖于基本假定中的零均值 假定(即 E(ui ) 0 )。所以异方差的存在对无偏 性的成立没有影响。 2、参数估计的方差不再是最小的 同方差假定是OLS估计方差最小的前提条件,所 以随机误差项是异方差时,将不能再保证最小二 乘估计的方差最小。
u 有相同的
方差,所以利用分析 Y 与 X 的相关图形,可以初略
地看到 Y 的离散程度与 X 之间是否有相关关系。 如果随着 X 的增加, Y 的离散程度为逐渐增大(或 减小)的变化趋势,则认为存在递增型(或递减型) 的异方差。
2018/11/28 19
图形举例1
用1998年四川省各地市州农村居民家庭消费支出与家庭纯 收入的数据,绘制出消费支出对纯收入的散点图,其中用 X 1 表示家庭纯收入。 Y1 表示农村家庭消费支出,
2018/11/28
34
(3)计算 利用求回归估计式(4.8)得到辅助回归函数的可 决系数 nR2 ,n 为样本容量。 (4)提出假设
H0 : 2 = ...= 6 = 0,
H1 : ( )不全为零 j j =2,,3,...,6
2018/11/28
35
(5)检验 在零假设成立下,有 nR2 渐进服从自由度为5的 χ 2 分布。给定显著性水平 ,查 χ 2 分布表得临界 2 2 值 χ (5) ,如果 nR2 χ (5),则拒绝原假设,表明模 型中随机误差存在异方差 。
2018/11/28 3
引子2:t检验和F检验一定就可靠吗?
研究居民储蓄存款 Y 与居民收入 X 的关系:
Yt = 1 + 2 X t + ut
用普通最小二乘法估计其参数,结果为
ˆ = 27.9123+ 0.3524 X Y t t
(1.8690) (0.0055)
t = (14.9343) (64.2069)
定问题。除此而外,模型的函数形式不正确,如把变量间本 X 3i
u i* 来为非线性的关系设定为线性,也可能导致异方差。
(三)数据的测量误差
样本数据的观测误差有可能随研究范围的扩大 而增加,或随时间的推移逐步积累,也可能随 着观测技术的提高而逐步减小。
2018/11/28 13
(四)截面数据中总体各单位的差异
2数据分组将排列在中间的约14的观察值删除掉记再将剩余的分为两个部分每部分观察值的个数为20171018274构造f统计量分别对上述两个部分的观察值求回归模型由此得到的两个部分的残差平方为为前一部分样本回归产生的残差平方和为后一部分样本回归产生的残差平方和
第四章
违背经典假定的回归模型
2018/11/28
2018/11/28
36
EViews软件中: ①建立回归模型:LS Y C X ②检验异方差性:在方程窗口中依次点击View \Residual Test\White Heteroskedastcity 一般是直接观察p值的大小,若p值 较小,认为模型存在异方差性。
2 n -c e2i / [ - k] 2
(4.6)
2018/11/28
28
(5)判断 给定显著性水平 ,查 F分布表得临界值 F n-c n-c ( ) 计算统计量 F * 。
( 2 -k , 2 -k )
如果
F F n-c
*
n-c ( -k , -k ) 2 2
( )
则拒绝原假设,接受备择假设,即模型中的 随机误差存在异方差。
2018/11/28
20
图形举例2
我国制造工业利润函数。已有1998年我国 主要制造工业销售收入与销售利润的统计资料, 可键入命令:Scat X Y
有下图:
2018/11/28
21
2018/11/28
22
2、残差图形分析
设一元线性回归模型为: Yi β1 β2 X i ui
运用OLS法估计,得样本回归模型为: ˆ +β ˆ X ˆ=β Y i 1 2 i
2018/11/28 15
(二)对参数显著性检验的影响
由于异方差的影响,使得无法正确估计参数的
标准误差,导致参数估计的 t 统计量的值不能正
确确定,所以,如果仍用 t 统计量进行参数的显
著性检验将失去意义。
2018/11/28
16
(三)对预测的影响
尽管参数的OLS估计量仍然无偏,并且基于此 的预测也是无偏的,但是由于参数估计量不是有 效的,从而对Y的预测也将不是有效的。
2018/11/28 29可为递减型 ●检验结果与选择数据删除的个数 c 的大小有关 ●只能判断异方差是否存在,在多个解释变量的 情形下,对哪一个变量引起异方差的判断存在局 限。
2018/11/28
30
(三)White检验
1、基本思想:
不需要关于异方差的任何先验信息,只需要在大 样本的情况下,将OLS估计后的残差平方对常数、 解释变量、解释变量的平方及其交叉乘积等所构 成一个辅助回归,利用辅助回归建立相应的检验 统计量来判断异方差性。
2 1 2 2
2 n
26
(4)构造F统计量
分别对上述两个部分的观察值求回归模型,由此
2 得到的两个部分的残差平方为 e12i 和 e2 。 i
e 为前一部分样本回归产生的残差平方和,
2 1i 2 e 2i为后一部分样本回归产生的残差平方和。它
们的自由度均为 [(n - c) / 2] - k ,k 为参数的个数。
Var(ui ) i2 2 f ( X i )
2018/11/28
(4.4)
9
图形表示
概 率 密 度
Y
X
2018/11/28
10
2018/11/28
11
二、产生异方差的原因
(一)模型中省略了某些重要的解释变量
假设正确的计量模型是: Yi 1 2 X 2i 3 X 3i ui
1
引子1:更为接近真实的结论是 什么?
根据四川省2000年21个地市州医疗机构数与 人口数资料,分析医疗机构与人口数量的 关系,建立卫生医疗机构数与人口数的回 归模型。对模型估计的结果如下:
ˆ -563.0548 5.3735 X Y i i
(291.5778) (0.644284) t (-1.931062) (8.340265)
2018/11/28
27
在原假设成立的条件下,因 e1i 和 e2i 自由度均 2 χ 为 [(n - c) / 2] - k , 分布,可导出:
2 2
2 e n -c n -c i F* = = 2 ~ F ( - k, - k) 2 2 2 2 n -c e1i e / [ k ] 1i 2
2 2 σt2 = α1 + α2 X 2t + α3 X 3t + α4 X 2 + α X t 5 3t + α6 X 2t X 3t +vt
其中 vt为随机误差项。
2018/11/28
33
(1)求回归估计式并计算
2 et
ˆt ,并求残差 用OLS估计式(4.7),计算残差 et Yt - Y 2 e 的平方 t 。
假如略去 X 3i ,而采用
Yi 1 2 X 2i ui*
X 3i
* u ( 4.5 ) i 当被略去的 X 3i 与 X 2i 有呈同方向或反方向变 化的趋势时,随 X 2i 的有规律变化会体现在(4.5) 式的 ui* 中。
2018/11/28
12
(二)模型的设定误差
模型的设定主要包括变量的选择和模型数学形式的确定。模 型中略去了重要解释变量常常导致异方差,实际就是模型设
由上两式得残差:
ˆ ei Yi - Y i
绘制出 ei2 对 X i的散点图 ◆如果 ui 不随 X i 而变化,则表明不存在异方差; ◆如果 u i 随 X i 而变化,则表明存在异方差。
2018/11/28 23
或直接观察残差分布图分析 注意观察 之前需要先将 数据关于解释 变量排序,命 令格式为: SORT X LS Y C X
2018/11/28
17
四、 异方差性的检验
常用检验方法:
● ● ● ● ●
2018/11/28
图示检验法 Goldfeld-Quanadt检验 White检验 Park检验和Gleiser检验 ARCH检验
18
(一)图示检验法
1、相关图形分析
方差描述的是随机变量取值的(与其均值的)离散
程度。因为被解释变量 Y 与随机误差项
2018/11/28
7
一、异方差性的实质
同方差的含义
同方差性:对所有的 i (i 1,2,..., n)有:
Var(ui ) = σ 2
(4.1)
因为方差是度量被解释变量 Y 的观测值围绕回归线 E(Yi ) 1 2 X 2i 3 X 3i ... k X ki (4.2) 的分散程度,因此同方差性指的是所有观测值的 分散程度相同。
(2)求辅助函数 2 2 σ e 用残差平方 t 作为异方差 t 的估计,并建立 2 2 X 2t , X 3t , X 2 , X t 3t , X 2t X 3t 的辅助回归,即
2 2 2 ˆ ˆ ˆ ˆ ˆ ˆ ˆ6 X 2t X3t (4.8) et = α1 + α2 X 2t + α3 X 3t + α4 X 2t + α5 X3t + α
通常认为,截面数据较时间序列数据更容易产 生异方差。这是因为同一时点不同对象的差异, 一般说来会大于同一对象不同时间的差异。不过, 在时间序列数据发生较大变化的情况下,也可能 出现比截面数据更严重的异方差。 一般经验告诉我们,对于采用截面数据的计量
经济学问题,由于在不同样本点上解释变量以外
的因素的差异较大,所以往往存在异方差。
2018/11/28 24
(二)Goldfeld-Quanadt检验
作用:检验递增性(或递减性)异方差。 基本思想:将样本分为两部分,然后分别对两个样 本进行回归,并计算两个子样的残差平方和所构成 的比,以此为统计量来判断是否存在异方差。
y
样本1
2018/11/28
C个数据
样本2
GQ检验原理图
x
25
R 2 0.9966 F 4122.531
2018/11/28
4
检验结果表明:回归系数的标准误差非常小,t 统 计量较大,说明居民收入 X 对居民储蓄存款 Y 的
影响非常显著。同时可决系数也非常高,F统计量
为4122.531,也表明模型异常的显著。
但此估计结果可能是虚假的,t统计量和F统计量
2018/11/28
31
2、检验的特点
要求变量的取值为大样本
不仅能够检验异方差的存在性,同时在多变量的
情况下,还能判断出是哪一个变量引起的异方差。
2018/11/28
32
3、检验的基本步骤:
以一个二元线性回归模型为例,设模型为: Yt = β1 + β2 X 2t + β3 X 3t +ut (4.7) 并且,设异方差与 X 2t , X 3t 的一般关系为
1、检验的具体做法
(1)排序
将解释变量的取值按从小到大排序。
(2)数据分组 将排列在中间的约1/4的观察值删除掉,记 为
c,再将剩余的分为两个部分,每部分观察
值的个数为 (n - c) / 2 。 (3)提出假设
H0 : σ = σ , i =1,2,..., n;
2018/11/28
2 i
2
H1 : σ σ ... σ
2018/11/28
8
异方差性的含义
设模型为
Yi 1 2 X 2i 3 X 3i ... k X ki ui i 1,2,..., n
如果对于模型中随机误差项 u i 有:
Var(ui ) i2 , i 1, 2,3,..., n (4.3) 则称具有异方差性。进一步,把异方差看成是由于某 个解释变量的变化而引起的,则