第9章 异 方 差
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9.3 异方差的诊断2
• 残差的图形检验graphical examination of residuals
– 见“精要§13例题”之残差图、残差平方图(收 入X为横轴) – 如果是多元回归方程,可以使用残差平方对Y^ 作图,注意,Y^是有確定规律的,它是X的线性 函数 – 如果呈现图9.6之b、c、d、e模式,即有异方差 性存在
对变换後的模型使用普通最小二乘法得到如 下结果:
Yi / 1 X i 26.611 0.069 X i Xi Se (442.622) t (0.060) R 2 0.230 (0.011 ) (6.194) DW 1.684
ˆ Y 329.996 0.075 X Se (810.332) (0.012) t (0.407) (6.105) R 2 0.489 DW 1.616
• 其中的X,可以是每一个Xi,或者是Y^。 • 如果B2以较大的概率为0,说明自变量对 残差没有影响,不存在异方差。如果B2 以较小的概率为0,说明自变量对残差有 影响,则存在异方差。
9.3 异方差的诊断4格莱泽Gleiser检验
| ei | B1 B2 xih vi h 1,2,0.5,
• 假设误差方差与X成比例,则平方根变换 • 假设误差方差与X2成比例,则倒数变换
• 2.重新设定模型
i2 9.4.1
已知时:加权最小二乘法
Y • 考虑一元线性回归模型 i 1 2 X i u, i 1,2,, n
如果每个观察值的误差项方差 i2 是已知的, 使用 1 / i 为权数,对模型(9.18)作如下变 X i ui 1 换: Yi
第9章 异方差 HETEROSCEDASTICITY
• What happens if the error variance is nonconstant? • 异方差有什么性质 • 异方差的後果是什么 • 如何诊断存在异方差 • 如果存在异方差,该如何补救?
9.1异方差的性质
• 实例
• 在低收入区域,收入的提高可以解释食品 消费的增加,可得到一个规律。但这个规 律在高收入区会不会同样有效?
9.2 异方差的後果consequences 很严重
• 1-3最小二乘估计不再是有效估计
– 随机误差项为异方差时,OLS估计仍然是无偏 估计,但不再具有最小方差的特性
• 4-5、CLRM假定下估计量b的方差有偏,一 个不变的方差估计值不可能代表相异的条 件方差 • 6、t检验、F检验的可靠性降低,增大模型 的预测误差
2000
0
-2000
-4000
-6000 0 20000 40000 60000 80000 100000 120000 140000
销售收入(万元)X
戈里瑟检验的残差回归方程 X e 562.419 0.027X e 858.638 13.314
Se (748.857)(3.215) t (1.160) (3.692) R 0.259
残差的图形模式
残差是无知的代名词
• 对于无知的东西,可能是本质性质的,有 时,虽不知本质,但可以观察到现象
• 无知于理论或本质更常见,但无知与数量 模式则很难敷衍塞责。 • 很多学问之中都有一些词表示“无知”
9.3 异方差的诊断3帕克Park检验 2 ln ei B1 B2 ln X i vi
9.4异方差的补救措施
• What to do if heteroscedasticity is observed: remediak measures • 两个基本思路 • 1.把异方差“算”成同方差,WLS
– 理想状态下,条件方差已知,方程两边同时 除以各条件方差,即得同方差模型 – 实际中,条件方差未知,
相同点:收入增加,储蓄平均来说也增 加。 不同点: (A)储蓄的方差在所有的收入水平上保 持不变。 (B)储蓄的方差随收入的增加而增加。 解释:随收入增长,人们有更多的备用 收入,从而如何支配他们的收入有更大 的选择范围。
现象的联想
• 林子大了……同方差或者异方差假定下, 都会有“什么鸟都有”的现象 • 如果相异的方差是逐渐缩小,鸟的种类 会随着林子扩大而变少 • 如果相异的方差是逐渐增大,鸟的种类 会随着林子扩大而迅速增加 • 幸福的家庭无不相似,不幸的家庭各有 不幸。——列夫·托尔斯泰《安娜·卡列尼娜》 • 一个印象:电影、电视中的“坏人” 更 容易使人记住
i i
E(u ) X
2 i 2 i 2
2 i
选择1/Xi为权数,可将模型(9.18)变换为如下 模型:
Yi ui 1 2 Xi Xi Xi
利用普通最小二乘法,根据表中数据,估 ˆ 计该回归方程为 Y 329.996 0.075 X
Se (810.332) (0.012) t (0.407) (6.105) R 2 0.489 DW 1.616
2
例如储蓄与收入的关系 的模型 Y 1 2 X i ui 其中:Yi 是储蓄;X i 是收入
储蓄Y与收入X: 异方差的图形表示
概 率 密 度 概 率 密 度 储 蓄 Y
同 方 差
储 蓄 Y
异 方 差
1 2 X i 1 2 X i
(A) 收入X 收入X (B)
(A)与(B)的比较
2
Se (748.857) (3.215) t (1.147) (4.141 ) R 2 0.305
二个残差回归方程回归系数的显著性检验, 均拒绝同方差假设,表明存在异方差性。 右式的判定系数 R 2 较大。故认为 ei 与 X i 有线性关系, i2 E(ui2 ) 2 X i ,选择 1 X i 为权数对原模型(13.18)进行变换。
i
i
ui
2
i
i
由于Var (i Nhomakorabea)
1
2 i
Var (ui )
1
2 i
1
2 i
通过加权变换使误差项变成同方差了。
9.4.2
i2
未知时:变换
i2 是未知的,可根据误差与解释变量 • 如果 或被解释变量的关系来確定变换的权数
• 先采用戈里瑟检验確定ei与Xi 之间的关系 。
1.如 为
ei 与 X之间为线性关系,则可认 i
情形1
2
Eu X i
2 i 2 i
选择 型。
1
时乘以
X i 为权数,即对模型(9.18)两边同 1
Xi
,将异方差模型变为同方差模
Yi Xi
1
Xi
2 X i
ui Xi
•
情形2 如 e 与X 之间为线性关系,则可认为
• Gleiser又译戈里瑟,不是格兰杰 • 检验的原理同Park • 如果经检验某方程是显著的,则表明随机误差项 的方差随着解释变量取值的不同而变化,即存在 异方差性。 • 两种检验的特点:不仅能检验异方差性,而且通 过“实验”可以探测异方差的具体形式,这有助 于进一步研究如何消除异方差性的影响。
9.3 异方差的诊断5怀特White检验
Yi B1 B2 X 2i B3 X 3i ui
2 2 ei2 A1 A2 X 2i A3 X 3i A4 X 2i A5 X 3i A6 X 2i X 3i vi
• White检验通过建立辅助回归模型的方式 来判断异方差性 • 1.估计回归模型,并计算残差的平方 。 • 2.估计辅助回归方程 2 2 n • 3.检验模型是否具有解释能力 R ~ k 1 • 4.如果chi方值大,则对应的p低,辅助回 归方程具有解释能力的概率低,则无异 方差
• 相似的道理,收入与支出在不同收入水平 上,是否具有相同的规律?
• 如果某家人每天的食谱都是一样的,穷还 是富?南美安第斯山,穷人老是吃土豆和 玉米
– 变异太小是“单调”、“斋”,他们无力 “丰富”
什么是异方差?
古典假定之一:随机扰 动项i的方差相同 var(i ) 2 i 1,2,...,n 异方差:i的方差随X i的变化而变化,即 var(i ) i 2 f ( X i )
变换函数形式
• 取对数後,可以降低原序列的差异程度, 当然可以降低异方差的程度
9.5 怀特异方差校正後的标准误和t 统计量
• OLS估计量非有效,则常规方法下的标准误 和t统计量不可信
9.6 若干异方差实例concrete examples
• Economies of scale规模经济 or heteroscedasticity • Highway capacity and economic growth公路 容量与经济增长 • An extended wage model扩展的工资模型
北京市大百货商店销售资料
根据此回归方程,可以求出利税总额的回 ˆ 归估计值和残差 ei (Yi Yi ) ,然後将销售收 入Xi 作为横坐标,残差ei 为纵坐标,画出回 归残差图。从残差图看,残差的有不断扩大 的趋势,ui 存在明显的异方差性。
残差图
普 通 残 差
8000 6000 4000
行业的销售收入与利润2009
• 排序後,前19个行业残差的方差为 272^2=73853,後20个行业残差的方差为 481^2=231169 • 可以用F检验231169与73853是否显著不 同 • 计算F统计量[231169/(20-2)]/[73853/(192)]。其中,20与19为变量值个数,2是方 程中包含截距项的自变量个数。F=2.956, 对应的概率为1.51%,能认为两个群体具 有不同的方差。
产生异方差的主要原因
• • 异方差多出现于截面数据 产生异方差的主要原因
– 模型中遗漏了影响逐渐增大的因素。如,储 蓄函数中的证券投资、利息、消费者行为等 因素;成本函数中的管理水平、生产技術条 件和规模效应等因素;消费函数中的家庭财 产、消费心理等因素。 – 模型函数形式的误差。如将指数曲线模型误 设成了线性模型,则误差有增大的趋势。 – 随机因素的影响,如政策变动、自然灾害、 金融危机等。
9.3 异方差的诊断1
• 问题的性质nature of problem
– 从统计学角度看,事物都表现为分布,对于 正态分布,同质指均值、方差相等
– 如男女生的身高数值,变异系数可能接近, 但均值不同。同样满足无偏性的射击比赛, 但方差不同,可以区分高、低水平
• 计量分析中的X和Y通常具有数量上的互 相影响关系,不同的量级代表了不同的 经济性质,很可能存在异方差
Yi /
1 X i 26.611 0.069 X i Xi Se (442.622) t (0.060) R 2 0.230 (0.011 ) (6.194) DW 1.684
对比加权最小二乘估计式(右)与普通最小二 乘估计式(左),斜率系数相差很小,但加权 最小二乘估计的标准误(0.011)要小于OLS估 计的标准误(0.012),说明在有异方差的情 形下,普通最小二乘估计高估了估计量的 标准误。