多重共线性与虚拟变量
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多重共线性
以下是美国1971-1986年间的年数据。
其中,y为售出新客车的数量(千辆);x1为新车,消费者价格指数,1967=100;x2为所有物品所有居民的消费者价格指数,1967=100;x3为个人可支配收入(PDI,10亿美元);x4为利率;x5为城市就业劳动力(千人)。
考虑下面的客车需求函数:
Lny=b0+b1lnx1+b2lnx2+b3lnx3+b4lnx4+b5lnx5+u
(1)用OLS法估计样本回归方程。
(2)如果模型存在多重共线性,试估计各辅助回归方程,并找出哪些变量是高度共线性的。
(3)如果存在严重的共线性,你会剔除哪一个变量,为什么?
(4)在剔除一个或多个解释变量后,最终的客车需求函数是什么?这个模型在哪些方面好于包括所有解释变量的原始模型?
(5)你认为还有哪些变量可以更好地解释美国的汽车需求?
美国人个可支配收入与储蓄模型(EP129.wf1)
问题描述:研究1970~1995年间美国个人可支配收入与个人储蓄的关系。在1982年,美国遭受到和平时期最严重的经济衰退,当年的城市失业率高达9.7%,是自1948年以来失业率最高的一年。这种事件会扰乱收入和储蓄之间的关系,现考察这种情况是否会发生。
美国个人可支配收入与个人储蓄数据
思考:实际上是对模型稳定性的检验,除了用CHOW 检验,也可用虚拟变量模型进行判断。
1.构造虚拟变量
{
110 1982 1982D =
年以后
年及以前
2.建立虚拟变量模型
在命令窗口输入LS saving c d1 income income*d1,执行后会发现income*d1的系数不显著,可以将其剔除,再次进行LS saving c d1 income ,则发现d1的系数是显著的,因此1982年的事件对美国个人可支配收入与个人储蓄的关系有显著的影响,原模型不具有稳定性。
也可以做分段线性回归,在命令窗口输入LS saving c income (income -2374.3)*d1,执行后也会发现(income -2374.3)*d1的系数显著不为零,可以得到同样的结论。
实验:虚拟变量模型
下表给出1965-1970年美国制造业利润和销售额的季度数据。
1965-1970年美国制造业利润和销售额的季度数据
假定利润不仅与销售额有关,而且和季度因素有关。要求:
①如果认为季度影响使利润平均值发生变异,应当如何引入虚拟变量?
②如果认为季度影响使利润对销售额的变化率发生变异,应当如何引入虚拟变量?
③如果认为上述两种情况都存在,又应当如何引入虚拟变量?
④对上述三种情况分别估计利润模型,进行对比分析。