第五章 线性回归的
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
他假设。 使用的模型 Y 0 1X 2
变换Z X 2 后模型为 Y 0 1Z
因为 0 0 1 X 3 1X 2 E 0 0 1 X 3 1X 2
方法二是进行残差序列分析。这是从技术角度发现和 判断异常值问题的基本方法。因为异常值只是个别情 况,因此即使模型存在异常值问题,最小二乘估计仍 是一致估计量,回归残差仍然能很好的近似得出模型 的误差项,回归残差中会包含由于异常值所导致模型 误差项均值非0的信息。
(二)发现和判断
基本方法:回归残差序列分析
第五章 线性回归的定式偏差
线性回归的定式偏差
本章讨论变量关系非线性、存在异常值、 规律性扰动和解释变量缺落等导致的线性 回归模型前两条假设不成立的定式偏差, 包括它们对线性回归分析的影响、判断和 处理的方法等。
线性回归的定式偏差
第一节 变量关系非线性 第二节 异常值 第三节 规律性扰动 第四节 解释变量缺落 第五节 参数变化
(一) 问题的特征
例如变量 Y 和 X 在长期的关系中,基本上都满足线
性回归模型的各个假设,但在时刻 i0 有了一个 突发情况,如果仍然用线性回归模型
Y X
这个模型的误差项 的均值,实际上就是
E
i
0 C
当i i0 当i i0
(一) 问题的特征
这种情况如果不作处理,那么线性回归结 果就会差强人意。
i
2或 3
注意有经济意义的根据。
(三)问题的处理
问题
Y X
E
i
0 C
当i i0 当i i0
方法:引入一个针对性的虚拟变量,定义式为
0 Di 1
当i i0 当i i0
得到一个新的回归模型
Y X CD
因为 0 0 1 X 2 1X 所以 E 0 0 1 X 2 1X
不可能
始终为0。
例:变量之间的真实关系 Y 0 1 X 3
其中 满足 E 0 和线性回归模型的其
1 b10
f
P
βB0 P bP0
整理可得: Y f X1,, X K ; b10 bP0
P f
i1 i
βB0
bi0
P i 1
f
i
βB0 i
若令:
M Y f
X1,, X K ;b10 bP0
E 不可能始终为0。
回归分析的有效性失去了保障
(二)发现和判断
用数理经济分析方法,对模型的关系进行 更深入的分析。
根据数据及其分布图形、散点图进行直接 判断。
非线性变量关系的残差序列图
e
i
(三)问题的处理和非线性回归
1、模型修正和变换
恢复模型的合理非线性形式 然后再变换成线性模型
这些影响既不能被看作微小的随机扰动,但又不 会决定或改变长期的经济关系。这种情况在经济 数据中反映出来,就会表现为一个脱离基本趋势 的异常值。
如果所研究的经济问题或者相关数据中存在这种 情况,建立线性回归模型时又没有预先处理或剔 除这种影响,就会表现为模型误差项在相应时点 存在均值非0的问题。
泰勒级数展开法
2、泰勒级数展开法
假设一个非线性的变量关系为:
Y f X1,, X K ; 1 P
在 处对 B0 b10 ,,bP0
β 1,, P
作泰勒级数展开:
Y f
X1,, X K ;b10 bP0
f
1
βB0
第一节 变量关系非线性
(一)问题
(二)发现和判断
(三)问题的处理和非线性回归 1.泰勒级数展开法 2.非线性最小二乘法
(一)问题
例:变量之间的真实关系 Y 0 1 X 2
其中 满足 E 0 和线性回归模型的其
他假设。
使用的模型 Y 0 1X
散点图
C在Eviews中专门用于表示常数项,因此用CC表 示消费。
线性回归结果
残差序列图
非线性回归结果
第二节 异常值
问题 异常值的发现和判断 问题的处理
(一) 问题
现实经济中常常存在这样的情况,一些突发事件 或变化对经济活动或经济关系造成短暂的但确实 很显著的冲击影响。
(三)问题的处理
由于两个模型的误差项之间有关系
CD
因此
E
i
E
i
CD
0 0 0 C C 1
0
i
i0 i
i0
例:P66
引入虚拟变量后的回归结果
引入虚拟变量后的回归残差图
P f
i1 i
b βB0 i0
f
Zi i βB0
可以得到: M 1Z1 2Z2 P Z P
泰勒级数展开的反复迭代
3、非线性最小二乘法 (非线性最优化等)
直接用Eviews软件进行估计。
例5-1:
某地总消费和收入两个变量的数据如下表所示。Y为 总收入,C是消费
因为此时适用普通最小二乘法的前提条件 即模型的第二条假设不成立,参数估计量 的性质和相关统计推断都会失效。
(二)发现和判断
克服异常值对线性回归分析影响的前提,是发现和判 断异常值是否存在和在哪些时点存在。
方法一是分析经济问题的相关背景情况,包括对经济 现象、相关社会经济事件、以及数据序列的直接分析。
具体方法:模型假定成立的前提下,残差服从正态分布
根据残差序列计算残差的标准差
S S 2 ei2 n K 1
iΒιβλιοθήκη Baidu
用 S去除各个残差,如果发现某个残差 ei 存在
ei 2 S
或3
的情况时,应该高度怀疑模型在时点 i 存在异常值问题
(二)发现和判断
异常值的检验
2或3
eS
变换Z X 2 后模型为 Y 0 1Z
因为 0 0 1 X 3 1X 2 E 0 0 1 X 3 1X 2
方法二是进行残差序列分析。这是从技术角度发现和 判断异常值问题的基本方法。因为异常值只是个别情 况,因此即使模型存在异常值问题,最小二乘估计仍 是一致估计量,回归残差仍然能很好的近似得出模型 的误差项,回归残差中会包含由于异常值所导致模型 误差项均值非0的信息。
(二)发现和判断
基本方法:回归残差序列分析
第五章 线性回归的定式偏差
线性回归的定式偏差
本章讨论变量关系非线性、存在异常值、 规律性扰动和解释变量缺落等导致的线性 回归模型前两条假设不成立的定式偏差, 包括它们对线性回归分析的影响、判断和 处理的方法等。
线性回归的定式偏差
第一节 变量关系非线性 第二节 异常值 第三节 规律性扰动 第四节 解释变量缺落 第五节 参数变化
(一) 问题的特征
例如变量 Y 和 X 在长期的关系中,基本上都满足线
性回归模型的各个假设,但在时刻 i0 有了一个 突发情况,如果仍然用线性回归模型
Y X
这个模型的误差项 的均值,实际上就是
E
i
0 C
当i i0 当i i0
(一) 问题的特征
这种情况如果不作处理,那么线性回归结 果就会差强人意。
i
2或 3
注意有经济意义的根据。
(三)问题的处理
问题
Y X
E
i
0 C
当i i0 当i i0
方法:引入一个针对性的虚拟变量,定义式为
0 Di 1
当i i0 当i i0
得到一个新的回归模型
Y X CD
因为 0 0 1 X 2 1X 所以 E 0 0 1 X 2 1X
不可能
始终为0。
例:变量之间的真实关系 Y 0 1 X 3
其中 满足 E 0 和线性回归模型的其
1 b10
f
P
βB0 P bP0
整理可得: Y f X1,, X K ; b10 bP0
P f
i1 i
βB0
bi0
P i 1
f
i
βB0 i
若令:
M Y f
X1,, X K ;b10 bP0
E 不可能始终为0。
回归分析的有效性失去了保障
(二)发现和判断
用数理经济分析方法,对模型的关系进行 更深入的分析。
根据数据及其分布图形、散点图进行直接 判断。
非线性变量关系的残差序列图
e
i
(三)问题的处理和非线性回归
1、模型修正和变换
恢复模型的合理非线性形式 然后再变换成线性模型
这些影响既不能被看作微小的随机扰动,但又不 会决定或改变长期的经济关系。这种情况在经济 数据中反映出来,就会表现为一个脱离基本趋势 的异常值。
如果所研究的经济问题或者相关数据中存在这种 情况,建立线性回归模型时又没有预先处理或剔 除这种影响,就会表现为模型误差项在相应时点 存在均值非0的问题。
泰勒级数展开法
2、泰勒级数展开法
假设一个非线性的变量关系为:
Y f X1,, X K ; 1 P
在 处对 B0 b10 ,,bP0
β 1,, P
作泰勒级数展开:
Y f
X1,, X K ;b10 bP0
f
1
βB0
第一节 变量关系非线性
(一)问题
(二)发现和判断
(三)问题的处理和非线性回归 1.泰勒级数展开法 2.非线性最小二乘法
(一)问题
例:变量之间的真实关系 Y 0 1 X 2
其中 满足 E 0 和线性回归模型的其
他假设。
使用的模型 Y 0 1X
散点图
C在Eviews中专门用于表示常数项,因此用CC表 示消费。
线性回归结果
残差序列图
非线性回归结果
第二节 异常值
问题 异常值的发现和判断 问题的处理
(一) 问题
现实经济中常常存在这样的情况,一些突发事件 或变化对经济活动或经济关系造成短暂的但确实 很显著的冲击影响。
(三)问题的处理
由于两个模型的误差项之间有关系
CD
因此
E
i
E
i
CD
0 0 0 C C 1
0
i
i0 i
i0
例:P66
引入虚拟变量后的回归结果
引入虚拟变量后的回归残差图
P f
i1 i
b βB0 i0
f
Zi i βB0
可以得到: M 1Z1 2Z2 P Z P
泰勒级数展开的反复迭代
3、非线性最小二乘法 (非线性最优化等)
直接用Eviews软件进行估计。
例5-1:
某地总消费和收入两个变量的数据如下表所示。Y为 总收入,C是消费
因为此时适用普通最小二乘法的前提条件 即模型的第二条假设不成立,参数估计量 的性质和相关统计推断都会失效。
(二)发现和判断
克服异常值对线性回归分析影响的前提,是发现和判 断异常值是否存在和在哪些时点存在。
方法一是分析经济问题的相关背景情况,包括对经济 现象、相关社会经济事件、以及数据序列的直接分析。
具体方法:模型假定成立的前提下,残差服从正态分布
根据残差序列计算残差的标准差
S S 2 ei2 n K 1
iΒιβλιοθήκη Baidu
用 S去除各个残差,如果发现某个残差 ei 存在
ei 2 S
或3
的情况时,应该高度怀疑模型在时点 i 存在异常值问题
(二)发现和判断
异常值的检验
2或3
eS