第7讲异方差计量经济学及Stata应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
© 陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。
第7章 异方差
现实的数据千奇百怪,常不符合古典模型的某些假定。从本章开始,逐步放松古典模型的各项假定。
7.1 异方差的后果
“条件异方差”(conditional heteroskedasticity),简称“异方差”(heteroskedasticity),是违背球型扰动项假设的一种情形,即条件εX依赖于i,而不是常数2σ。
方差Var(|)
i
在异方差的情况下:
(1) OLS 估计量依然无偏、一致且渐近正态。因为在证明这些性质时,并未用到“同方差”的假定。
(2) OLS 估计量方差ˆVar(|)β
X 的表达式不再是21()σ-'X X ,因为2Var(|)σ≠εX I 。使用普通标准误的t 检验、F 检验失效。
(3) 高斯-马尔可夫定理不再成立,OLS 不再是BLUE(最佳线性无偏估计)。
在异方差的情况下,本章介绍的“加权最小二乘法”才是BLUE 。
为直观理解OLS 不是BLUE ,考虑一元回归i i i y x αβε=++。
假设Var(|)i εX 是解释变量i x 的增函数,即i x 越大则Var(|)i εX 越大,参见图7.1。
图7.1 异方差示意图
OLS 回归线在i x 较小时可以较精确地估计,而在i x 较大时则难以准确估计。
方差较大的数据包含的信息量较小,但OLS却对所有数据等量齐观进行处理;故异方差的存在使得OLS的效率降低。
“加权最小二乘法”(Weighted Least Square,WLS)通过对不同数据所包含信息量的不同进行相应的处理以提高估计效率。比如,给予信息量大的数据更大的权重。
计量经济学所指的“异方差”都是“条件异方差”,而非“无条件异方差”。
比如,大样本理论要求样本数据为平稳过程,而平稳过程的方差不变。大样本理论是否已经假设同方差?
关键要区分无条件方差(unconditional variance)与条件方差(conditional variance)。
以一元回归模型i i i y x αβε=++为例,假设{},i i x y 为平稳过程,则i i i y x εαβ=--也是平稳过程,故其无条件方差2Var()i εσ=为常数,不随i 而变。
所有个体的条件方差函数1Var(|,,)i n x x ε 在函数形式上也完全相同;比如,21Var(|,,)i n i x x x ε= 。
但此条件方差函数的具体取值却依赖于i x ,故仍可存在条件异方
差。比如,2111Var(|,,)n x x x ε= ,2
212
Var(|,,)n x x x ε= ,以此类推。
7.2 异方差的例子 (1) 考虑消费函数:
i i i c y αβε=++
(7.1)
其中,i c 为消费,i y 为收入。富人的消费计划较有弹性,而穷人的消费多为必需品,很少变动。富人的消费支出更难测量,包含较多测量误差。Var(|)i i y ε可能随i y 的上升而变大。
(2) 企业的投资、销售收入与利润:大型企业的商业活动可能动辄以亿元计,而小型企业则以万元计;因此,扰动项的规模也不相同。如将大、中、小型企业放在一起回归,可能存在异方差。
(3) 组间异方差:如果样本包含两组(类)数据,则可能存在组内同方差,但组间异方差的情形。
比如,第一组为自我雇佣者(企业主、个体户)的收入,而第二组为打工族的收入;自我雇佣者的收入波动可能比打工族更大。
(4) 组平均数:如果数据本身就是组平均数,则大组平均数的方差通常要比小组平均数的方差小。
比如,考虑全国各省的人均GDP,每个省一个数据。人口较多的省份其方差较小,方差与人口数成反比。
7.3 异方差的检验
1.画残差图(residual plot)
残差可视为扰动项的实现值,可通过残差的波动考察是否存在异方差。
可以看“残差i e 与拟合值ˆi y 的散点图”(residual-versus-fitted plot)。
也可看“残差i e 与某个解释变量ik x 的散点图”(residual-versus-predictor plot)。
这是直观的方法,但不严格。
2.BP 检验(Breusch and Pagan, 1979)
假设回归模型为
122i i K iK i y x x βββε=++++
(7.2)
记2(1)i i iK x x = x 。
假设样本数据为iid ,则Var(|)Var(|)i i i εε=X x 。
“条件同方差”的原假设为
20:Var(|)i i H εσ=x
(7.3)
由于2
2
20
Var(|)E(|)[E(|)]E(|)i i i
i i i i
i εεεε==-=
x x x x ,原假设可写为
220:E(|)i i H εσ=x
(7.4)
如果0H 不成立,则条件方差2E(|)i
i εx 是i x 的函数,称为“条件方差函数”(conditional variance function)。
假设此条件方差函数为线性函数:
2
122i i K iK i x x u εδδδ=++++
(7.5)
故原假设可简化为
02:0K H δδ===
(7.6)