第六章--异方差性
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
f (Xi )
2 i
f (Xi )
2 i
根据 i 与解释变量X的关系,异方差一般可归结为三种类型(如图):
2
(1)单调递增型: (2)单调递减型: (3)复杂型:
i2
随X的增大而增大;
i2 随X的增大而减小; i2 随X的变化呈复杂形式。
三、异方差产生的原因 例6-1
变量的显著性检验中,构造了t统计量
由于方差不是常数而是变数,这时一般意义上t 比值的分布 是未知的,不再遵从t-分布,使得t检验失效;同理,在异方 差条件下,F比值也不再是遵从F-分布,F检验也失效。
4.模型的预测失效
当模型出现异方差时,
一方面,由于上述后果,使得OLS估计不再具有良好的统计 性质;另一方面,由于在被解释变量预测值的置信区间中也 包含有参数估计量的标准差,所以,如果仍然使用OLS估计 量,将导致预测区间偏大或偏小,预测功能失效。
1.参数估计量非有效
根据前面有关OLS参数估计量的无偏性和有效性的证明过程,可以 看到,当计量经济学模型出现异方差时,其普通最小二乘法参数估计量
仍然具有无偏性和一致性,因为同方差假设在证明无偏性和一致性时并
没有起作用。但在异方差情况下OLS估计量不再具有有效性,因为在有 效性证明中利用了
2 E( ) I
而且在大样本情况下,OLS估计量也不具有渐进有效性。
为详细说明异方差使OLS参数估计量的无效性,我们考虑一元回归模型:
Yi 0 1 X i i
(6-2)
对于该模型,我们假定除同方差假设外,其他的高斯马尔科夫假设都成立。 如果模型随机误差项包含异方差,那么有
Var ( i | X i ) i2
二、异方差的类型
同方差性假定是指回归模型中不可观察的随机误差项 i 以解释变量X为 条件的方差是一个常数,因此每个 i 的条件方差不随X的变化而变化,即有
常数 f ( X i )
2 i
在异方差的情况下,总体中的随机误差项 i 的方差 i2不再是常数, 通常它随解释变量值的变化而变化,即
的函数形式不正确,如把变量间本来为非线性的
关系设定为线性,也可能导致异方差。
第二节
异方差性的影响
计量经济学模型一旦出现异方差,如果仍然用普通最小二乘法估计模型 参数,会产生一系列不良后果。
1.参数估计量非有效 2.OLS估计的随机干扰项的方差不再是无偏的 3.基于OLS估计的各种统计检验非有效 4.模型的预测失效
Var(ui ) f ( X i )
2 i 2
(6.4)
图形表示
概 率 密 度
Y
X
异方差性是指模型违反古典假定中的同方差性, 即各残差项的方差并非相等。
一般地,由于数据观测质量、数据异常值、某些 经济变化的特性、模型设定形式的偏误等原因, 导致了异方差的出现。 主要原因往往是重要变量的遗漏,所以很多情况 下,异方差表现为残差方差随着某个(未纳入模 型的)解释变量的变化而变化。
14
7 8 12 11 13 3 6 10
15 17 16
10 5
20 18
19
0
0 5 10 序号 15 20 25
股票 价格 变化 率 消费 者价 格 (% )
三、异方差产生的原因 例6-4 假性异方差
两个变量有真实关系:Yi 0 1 X i i
2
其中 i 满足线性回归模型的假定,即满足零均值和不变方差的假定。
n
ˆ) Var ( 1
2 2 x i i
( xi2 ) 2
i 1
i 1 n
(6-3)
3.基于OLS估计的各种统计检验非有效
1)t统计量 不再服从t分布; 3)F 统计量也不再服从F分布;
2 4)LM(拉格朗日乘数检验)统计量也不再有渐近 分布。
总而言之,在异方差情况下,我们建立在高斯马尔科夫定理 基础上的用来检验各种假设的统计量都不再是有效的, OLS估计量不再是最佳线性无偏估计量。
较好,F检验结果明显显著; 表明该模型的估计效果不错,可以认为人口数量
每增加1万人,平均说来医疗机构将增加5.3735个。
然而,这里得出的结论可能是不可靠的,平均说来每增加1 万人口可能并不需要增加这样多的医疗机构,所得结论并 不符合真实情况。 有什么充分的理由说明这一回归结果不可靠呢?更为接近 真实的结论又是什么呢?
i
例如,相较于没有先进设备的银行,那些拥有先进数据处理设备的 银行,在他们对帐户的每月或每季财务报告中,会出现更少的差错。
(二)数据的测量误差
样本数据的观测误差有可能随研究范围的扩大
而增加,或随时间的推移逐步积累,也可能随
着观测技术的提高而逐步减小。
三、异方差产生的原因
以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3ei 被解释变量:产出量Y 解释变量:资本K、劳动L、技术A, 那么:每个企业所处的外部环境对产出量的影响被 包含在随机误差项中。 每个企业所处的外部环境对产出量的影响程度不 同,造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量 观测值的变化而呈规律性变化,呈现复杂型。
(6.3)
如果对于模型中随机误差项 u i 有:
Var(ui ) i2 , i 1, 2,3,..., n (6.4)
即对于不同的样本点,随机干扰项的方差不再是常数, 而是互不相同,则认为出现了异方差 (Heteroskedasticity)。进一步,把异方差看成是由于 某个解释变量的变化而引起的,则
引子:更为接近真实的结论是什么?
根据四川省 2000 年 21 个地市州医疗机构数与人口数 资料,分析医疗机构与人口数量的关系,建立卫生 医疗机构数与人口数的回归模型。对模型估计的结 果如下: ˆ -563.0548 5.3735 X Y i i 参数标准误差 (291.5778) (0.644284)
这一异方差取决于 X i 的值。 该模型参数的OLS估计量可以写为
xi yi ˆ 1 2 x i
在上述给定的异方差情况下,
ˆ 的OLS 而同方差假设下, 1
估计方差为
ˆ 的方差为 容易证明 1
2 2 x i i n
ˆ) Var (
1
( xi2 ) 2
i 1
i 1 n
第六章
异方差性
◆异方差性及其产生原因
◆ 异方差性的影响
◆ 异方差性的检验 ◆ 异方差性的的修正
第一节 异方差性及其产生原因
同方差的含义
同方差性:对所有的i (i 1,2,..., n) 有:
Var(ui ) = σ 2
E(Yi ) 0 1 X1i 2 X 2i ... k X ki
考虑如下20个国家在第二次世界大战后直至1969年间的股票价格 (Y)和消费者价格(X)的百分比变化的散点图。
30
例6-3
Hale Waihona Puke Baidu25
20
图中,对智利的观测值Y和X远大于对其他国家 的观测值,故可视为一个异常值,在这种情况下, 股票价格和消费者价格 5 同方差性的假定就难以维持了。
价格变化率
15
2 4
1
9
如果我们误以为Y和X之间的关系为:Yi
并认为 E( i ) 0,那么 记
0 1 X i i
Var(i ) E(i2 ) E[i ( 0 0 ) ( 1 X i2 1 X i )]2
f ( Xi ) (0 0 ) (1 Xi2 1 Xi ) ,则
(6.1) (6.2)
因为方差是度量被解释变量 Y 的观测值围绕回归线 的分散程度,因此同方差性指的是所有观测值的 分散程度相同。
图形表示
概 率 密 度
Y
X X
第一节 异方差性及其产生原因
—、异方差性的含义
设模型为
Yi 0 1 X1i 2 X 2i ... k X ki ui i 1,2,..., n
(三)模型中省略了某些重要的解释变量
假设正确的计量模型是: Yi 0 1 X1i 2 X 2i ui 假如略去 X 3i ,而采用
Yi 0 1 X 1i ui*
* u ( 6.5 ) i
3i
当被略去的 X 2 i 与 X 1i 有呈同方向或反方向变X 化的趋势时,随 X 1i 的有规律变化会体现在(6.5) * 式的 ui 中。
ˆi2 Var ( i ) E ( i 2 ) e ˆ) ˆ Y (Y e
i i OLS
对于解释变量引起的异方差,我们可以用 如下几种方法来检验异方差。
一、图示检验法 二、帕克(Park)检验与戈里瑟(Gleiser)检验 三、G-Q(Goldfeld-Quandt)检验 四、F检验 五、拉格朗日乘子检验 六、怀特检验
(一)截面数据中总体各单位的差异
通常认为,截面数据较时间序列数据更容易产生 异方差。这是因为同一时点不同对象的差异,一 般说来会大于同一对象不同时间的差异。不过,
在时间序列数据发生较大变化的情况下,也可能
出现比截面数据更严重的异方差。
三、异方差产生的原因 例6-2
干中学模型
人们在学习的过程中,其行为误差随时间而减少。在这种情况下, 可以预料 i 的方差 i2 会减小。 例如,考虑一次打字测验,在给定的一段时间里,打字出错个数与用 于打字练习的小时数有关系。随着打字练习小时数增加,不仅平均打错 字个数下降,而且打错字个数的方差也下降,这属于递减型的异方差。 资料收集技术的改进可能会使 2 减小。
第六章
异方差性
◆ 学习目的
通过本章的学习,了解什么是异方差性,异方差性是如何形成的,
异方差性导致什么样的后果,怎样检验和处理具有异方差性的模型。
◆ 基本要求
1)掌握异方差性的概念、异方差性的后果和几种常见的检验方法。 2)了解加权最小二乘法原理,并能运用加权最小二乘法估计线性回 归模型。 3)了解异方差稳健推断原理。
判断下列说法是否正确,并简要说明为什么。
(1)当异方差出现时,最小二乘估计是有偏的 和不具有最小方差特性——有效性; (2)当异方差出现时,常用的t和F检验失效; (3)如果回归模型中遗漏一个重要变量,则OLS 残差必定表现出明显的趋势。
第三节
异方差性检验
检验思路:由于异方差性就是相对于不同的解释变量观测值,随机
t (-1.931062) (8.340265)
R2 0.785456 R 2 0.774146
F 69.56003
式中 Y 表示卫生医疗机构数(个), X 表示人口 数量(万人)。
模型显示的结果和问题
●人口数量对应参数的标准误差较小;
● t 统计量远大于临界值,可决系数和修正的可决系数结果
居民储蓄模型 在截面资料下研究居民家庭的储蓄行为,假定储蓄行为模型为
Si 0 1Yi i
S i 为第i个家庭的储蓄额, 其中, Yi 为第i个家庭的可支配收入。
析:
在该模型中,假定 i 的方差为常数往往不符合实际情况。对于高收入
家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一 特定的目的而储蓄),差异较小。因此 的方差往往随的Y 增加而增加, i i 这属于递增型异方差。
Var(i ) E( ) E(i f ( X i )) f ( X i )
2 i 2 2 2
因此Var ( i ) 是 X i 的函数,即我们建立的模型具有异方差。
(四)模型的设定误差 模型的设定主要包括变量的选择和模型数学形式 的确定。模型中略去了重要解释变量常常导致异 方差,实际就是模型设定问题。除此而外,模型
ˆ) Var ( 1
2 x i
2
(6-3) 显然(6-3)式与(6-4)式不同,只有在 i
2
(6-4)
2 时两者才是相同的。
2.OLS估计的随机干扰项的方差不再是无偏的
异方差时OLS估计的随机误差项的方差不再是真实随机干扰项
方差的无偏估计,正是因为这一点才使得OLS估计的参数不再是有 效的,这可从(6-3)式中直接看出来。
误差项具有不同的方差。那么:检验异方差性,也就是检验随机误
差项的方差与解释变量观测值之间的相关性及其相关的“形式”。
问题 : 用什么来表示随机干扰项的方差???
一般的处理方法是首先采用普通最小二乘法估计模型,以求得随机干扰 项的估计量,用
ˆi e
表示。这样我们有
即用
ˆ e
2 来表示随机干扰项的方差。 i