第四章 回归模型中的随机误差项问题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
给定线性回归模型
Y = Xβ + u
(4.7)
若古典假定完全满足,根据Gauss-Markov定理,其 系数的最小二乘估计量
B =(X′X) –1 X′Y
(4.8)
具有 BLUE性质。
若古典假定得不到完全满足,特别是假定2(同方 差性)和假定3(无序列相关性)得不到满足时, 对OLSE的影响更大。
2020年3月7日 山东财经大学统计学院计量经济教研室
3、截面数据中总体各单位的差异 如前面家庭储蓄行为中高低收入家庭的差异。
4. 模型函数形式设定错误
如把变量间本来为非线性的关系设定为线性,也可能导致 异方差。
2020年3月7日 山东财经大学统计学院计量经济教研室
第15页
机动 目录 上页 下页 返回 结束
注意: ☆异方差问题多在于截面数据中而非时间序列数据中。 ☆本教材只讨论横截面数据的异方差问题。
2020年3月7日 山东财经大学统计学院计量经济教研室
第4页
机动 目录 上页 下页 返回 结束
关于假定1,一般地我们认为假定E(ui|xi)=0 是合理的。 因为随机项u是多种因素的综合,而每种因素的影响都 “均匀”地微小,它对因变量的影响不是系统的,且正负 影响相互抵消,故所有可能取值平均起来为零。即使有轻 度的违反,从实践的观点来看可能不会产生严重的后果, 因为它可能只影响回归方程的截距项 。
2020年3月7日 山东财经大学统计学院计量经济教研室
第18页
机动 目录 上页 下页 返回 结束
y
y
x
A 同方差
y
x
B 递增异方差
y
x
C 递减异方差
x
D 复杂异方差
2020年3月7日 山东财经大学统计学院计量经济教研室
第19页
机动 目录 上页 下页 返回 结束
2020年3月7日 山东财经大学统计学院计量经济教研室
I
2020年3月7日 山东财经大学统计学院计量经济教研室
第8页
机动 目录 上页 下页 返回 结束
所以,(4.14) 满足同方差性和无序列相关性,即可以采 用OLS估计参数了。其参数的OLSE为:
βˆ (X%X%)1 X%Y% [(PX )(PX )]1(PX )PY [ X PPX ]1 X PPY [ X 1X ]1 X 1Y (4.16)
关于随机项正态性分布的假定,如果我们的目的仅仅 是估计,这种假定并不是绝对必要的。事实上,无论是否 是正态分布,OLSE估计式都是BLUE。
剩下的四个假定将在下面的四节中分别加以讨论。
2020年3月7日 山东财经大学统计学院计量经济教研室
第5页
机动 目录 上页 下页 返回 结束
三、广义最小二乘法(GLS)
2020年3月7日 山东财经大学统计学院计量经济教研室
第23页
机动 目录 上页 下页 返回 结束
例4.1 根据随机抽取的21个农村家庭年底储蓄余额与年内家庭 纯货币收入的资料,按收入排序后的数据见下表。其中, x为 年内家庭纯货币收入(元), y为年底家庭储蓄余额(元)。
家庭编号 1 2 3 4 5 6 7 8 9 10 11
RSS2
5.进行检验 可以证明,在原假设下,F
~
F(
n
c
k
Βιβλιοθήκη Baidu,
n
c
k
1)
2
2
如果具有等方差性,两个方差估计量应该相差不大,F
值就应接近于1。如果存在异方差,那么F值就应该比1
大出许多。在给定的显著性水平下,利用F分布的临界
值Fα进行显著性检验。当F>Fα时,应拒绝H0,认为存 在异方差性,当F不大于Fα时,应接受H0,认为存在同 方差性。
其中,Q为产出量,K为资本,L为劳动力,u为随机项。
u在该问题中表示了包括不同企业在设计上、生产工艺 上的区别,技术熟练程度和管理上的差别以及其它因素。 这些因素在小企业之间差别不大,而在大企业之间,这 些因素都相差甚远,即随机项的方差随着解释变量的增 大而增大。
2020年3月7日 山东财经大学统计学院计量经济教研室
2020年3月7日 山东财经大学统计学院计量经济教研室
第12页
机动 目录 上页 下页 返回 结束
y
E( y | xi ) 0 1xi
x
图 4.2 收入-储蓄模型中的异方差
2020年3月7日 山东财经大学统计学院计量经济教研室
第13页
机动 目录 上页 下页 返回 结束
例: 以某一行业的企业为样本建立企业生产函数模型 Q = A KαL eu
1682.8
522
19
10448.21
1890.58
664
20
11575.48
2098.25
871
21
12500.84
2499.58
1033
y 1589 2209 2878 3722 5350 8080 11758 15839 18196 20954
2020年3月7日 山东财经大学统计学院计量经济教研室
第16页
机动 目录 上页 下页 返回 结束
二、异方差产生的后果
• 最小二乘估计量仍然是线性无偏的,但不再具有最小 方差性。
• 参数的显著性检验和置信区间的建立发生困难。 • 虽然最小二乘法参数的估计量是无偏的,但这些参数
方差的估计量、是有偏的。 • 预测的精确度降低。
• 原假设为:H0:u同方差,即σ21=…=σ2n • 备择假设为: H1:u是递增异(或递减)方差,即 σ2i随
xi递增(或递减) (i=1,2,…,n)
2020年3月7日 山东财经大学统计学院计量经济教研室
第21页
机动 目录 上页 下页 返回 结束
G-Q检验的步骤:
1.将n对样本观察值(xi , yi)按观察值xi的大小排队。 2.将序列中间的c个观察值除去,并将剩下的观察值
若因假定2和假定3不满足时,有
Cov(u) E(uu) u2
其中Ω≠I, Ω是一个n×n的正定对称方阵。
2020年3月7日 山东财经大学统计学院计量经济教研室
第7页
机动 目录 上页 下页 返回 结束
此时可以觅得一个n×n的非奇异矩阵P,使得: PΩ P′=I 即 P′ P = Ω-1
第14页
机动 目录 上页 下页 返回 结束
异方差产生的原因
1、模型中省略的解释变量
如果将某些未在模型中出现的重要影响因素归入随机误差 项,而且这些影响因素的变化具有差异性,则会对被解释 变量产生不同的影响,从而导致误差项的方差随之变化, 即产生异方差性。
2、测量误差
一方面,解释变量取值越大测量误差会趋于增大;另一方 面,测量误差可能随时间而变化。
2020年3月7日 山东财经大学统计学院计量经济教研室
第17页
机动 目录 上页 下页 返回 结束
三、异方差的检验
由于异方差性就是相对于不同的解释变量观测值, 随机误差项具有不同的方差。那么:
检验异方差性,也就是检验随机误差项的方差与解 释变量观测值之间的相关性及其相关的“形式”。
(一)图示法
随机项u的异方差与解释变量的变化有关。因 此,可利用因变量y与解释变量x的散点图或残差e2i 与x的散点图,对随机项u的异方差作近似的直观判 断。
2020年3月7日 山东财经大学统计学院计量经济教研室
第22页
机动 目录 上页 下页 返回 结束
如果检验递增方差:
如果检验递增方差:
RSS2 F
(n
2
c
k
1)
RSS2
RSS1
(n c k 1) 2
RSS1
RSS1 F
(n
c 2
k
1)
RSS1
RSS2
(n c k 1) 2
划分为较小与较大的相同的两个子样本,每个子 样样本容量均为(n-c)/2。 注意:对于n≥30时,c=n/4最合适。 3.对每个子样分别进行OLS回归,并计算各自的残 差平方和。分别用RSS1与RSS2表示较小与较大的 残差平方和,它们的自由度均为(n-c)/2–k–1,k为 模型中自变量个数。
4.选择统计量
变化而变化的,如图4.1所示,可以把异方差看成是
由于某个解释变量的变化而引起的,则
Var(ui2 )
2 i
2
f
( xi )
2020年3月7日 山东财经大学统计学院计量经济教研室
第10页
机动 目录 上页 下页 返回 结束
f (y) y
E( y | xi ) 0 1xi
x 图4.1 异方差示意图
第6页
机动 目录 上页 下页 返回 结束
广义最小二乘法(General Least Squares-GLS)就是 为了解决上述问题提出的。其基本思路是:若假定2同 方差性)和假定3(无序列相关性)得不到满足时,我 们可以采取适当的变换,使原模型变为以下的形式:
Y% X% u%
使得其中的 U%重新满足假定2(同方差性)和假定3(无序列 相关性)。这样就可以对上式使用OLS估计参数,从而 使得上式的OLSE仍然为BLUE。
表4.1 家庭储蓄余额与纯货币收入数据表
x
y
家庭编号
x
590.2
107
12
2827.73
664.94
123
13
3084.17
809.5
159
14
3462.71
875.54
189
15
3932.52
991.25
233
16
5150.79
1109.95
312
17
7153.35
1357.87
401
18
9076.85
2020年3月7日 山东财经大学统计学院计量经济教研室
第11页
机动 目录 上页 下页 返回 结束
异方差举例 例:截面资料下研究居民家庭的储蓄行为
yi = 0 + 1 xi + ui
yi:第i个家庭的储蓄额 xi:第i个家庭的收入
高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小 ui的方差呈现单调递增型变化
然后用觅得的P乘以(4.7)的两边,有:
PY=PXβ+Pu
记 Y% PY , X% PX ,u% Pu
(4.7)就转换为: 由于:
Y% X% u%
(4.14)
Cov(u%) E(u%u%) E(PuuP) PE(uu)PT Pu2PT
2 u
PPT
2 u
上式中的 βˆ 称为广义最小二乘估计量(GLSE),可以 证明,它具有线性、无偏性和最小方差性,即它是最优 线性无偏估计量(BLUE)
GLSE的协方差矩阵为:
Cov(βˆ )
(
X%X%)1
2 u
(
X
1
X
)1
2 u
2020年3月7日 山东财经大学统计学院计量经济教研室
第9页
机动 目录 上页 下页 返回 结束
第二节 异 方 差
一、异方差及其产生的原因
当不能满足同方差的假设,即u的条件方差在不同 次的观测中不再是一个常数,而是取得不同的数值,即
Var(u
|
xi )
2
i
常数
(i 1,2,L ,n)
则称随机误差项u具有异方差性(Heteroscedasticity)。
如果被解释变量观测值的分散程度是随解释变量的
2020年3月7日 山东财经大学统计学院计量经济教研室
第3页
机动 目录 上页 下页 返回 结束
二、古典假定的违背及造成的后果
在实际经济问题中,上述的古典假定不一定都 能得到满足。如果这些假定不完全满足,则OLSE的 BLUE特性将不复存在。当然,每一个假定不满足所 造成的后果是不同的。在本章中,我们将严格考察 上述假定,找出如果有一个或多个假定得不到满足 时,估计量的性质将会发生什么变化 ,并研究当出现 这些情况时,应该如何处理,即古典模型假定违背 的经济计量问题。
假定5:u服从正态分布
ui ~ N(0, u2 )
i=1,2, …, n
2020年3月7日 山东财经大学统计学院计量经济教研室
第2页
机动 目录 上页 下页 返回 结束
有了以上这些假定,根据高斯-马尔可夫
(Gauss-Markov)定理,我们知道古典回归模型的 最小二乘估计量(OLSE)是线性最优无偏估计量 (BLUE),而且服从正态分布。因此,就可以进行参 数的区间估计,而且也可以检验真实总体回归系数的 显著性。
第四章 回归模型中的 随机误差项问题
第一节 概述 第二节 异方差 第三节 自相关
第一节 概 述
一、古典假定
假定1:随机项ui具有零均值:
E(ui|xi)=0
i=1,2, …, n
假定2:随机项ui具有同方差:
Var (ui|xi)=u2
i=1,2, …, n
假定3:随机项ui无序列相关性:
Cov(ui , uj)=0 i≠j i,j= 1,2, …, n
第20页
机动 目录 上页 下页 返回 结束
(二)Goldfeld-Quandt检验
• 该方法该检验方法是Goldfeld和Quandt于1965年提出 的,用于检验是否存在递增或递减异方差,要求观测 值为大样本。基本思想是将样本分为两部分,然后分 别对两个样本进行回归,并计算比较两个回归的剩余 平方和是否有明显差异,以此判断是否存在异方差。