第四章 多重共线性 思考题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章 多重共线性 思考题

4.1 多重共线性的实质是什么 ? 为什么会出现多重共线性 ? 4.2 多重共线性对回归参数的估计有何影响 ?

4.3 多重共线性的典型表现是什么 ? 判断是否存在多重共线性的方法有哪些 ? 4.4 针对出现多重共线性的不同情形 , 能采取的补救措施有哪些 ?

4.5 在涉及相关的宏观经济总量指标如 GDP 、货币供应量、物价总水平、国民总收入、就业人数等时间序列的数据中一般都会怀疑有多重共线性 , 为什么 ?

4.6 多重共线性的产生与样本容量的个数n 、解释变量的个数k 是有无关系 ? 4.7 具有严重多重共线性的回归方程能否用来进行预测 ? 4.8 岭回归法的基本思想是什么 , 它对降低共线性有何作用 ? 4.9 以下陈述是否正确 ? 请判断并说明理由。

1) 在高度多重共线性的情形中 , 要评价一个或多个偏回归系数的单个显著性是不可能的。 2) 尽管有完全的多重共线性 ,OLS 估计量仍然是BLUE 。

3) 如果有某一辅助回归显示出高的2

j R 值,则高度共线性的存在是肯定无疑的。 4) 变量的两两高度相关并不表示高度多重共线性。 5) 如果其他条件不变 ,VIF 越高 ,OLS 估计量的方差越大。

6) 如果在多元回归中,根据通常的t 检验,全部偏回归系数分别都是统计上不显著的 ,你就不会得到一个高的2

R 值。

7) 在 Y 对

2X 和3X 的回归中 , 假如3X 的值很少变化 ,这就会使Var(3

ˆβ)增大 , 在极端的情形下 , 如果全部3X 值都相同 ,Var(3

ˆβ)将是无穷大。 8) 如果分析的目的仅仅是预测 , 则多重共线性是无害的。

练习题 4.1 假设在模型12233i

i i i Y X X u βββ=+++中 ,2X 与3X 之间的相关系数为零 , 于是有人建议你进行以下回归。

1221i i i Y X u αα=++ 1332i i i Y X u γγ=++

是否存在2ˆα=2ˆβ且3ˆγ=3

ˆβ?为什么 ? 2) 1ˆβ会等于1ˆα或1ˆγ或两者的某个线性组合吗 ? 3) 是否有Var(2ˆβ)且Var(2ˆα)且Var (3

ˆβ)=Var(3ˆγ)? 4.2 在决定一个回归模型的 " 最优 " 解释变量集时人们常用逐步回归的方法,在逐步回归中既可采取每次引进一个解释变量的程序 ( 逐步向前回归 ), 也可以先把所有可能的解释变 量都放在一个多元回归中 , 然后逐一地将它们剔除 ( 逐步向后回归 ) 。加进或剔除一个变量 , 通常是根据 F 检验看其对 ESS 的贡献而做出决定的。根据你现在对多重共线性的认识 , 你赞 成任何一种逐步回归的程序吗 ? 为什么 ?

4.3 表 4.11 给出了中国商品进口额 Y 、国内生产总值 GDP 、消费价格指数 CPI 。

表 4.11 中国商品进口额、国内生产总值、消费价格指数

资料来源 : 中国统计年鉴 .2004. 中国统计出版社 ,2004 请考虑下列模型

123ln ln ln t t t i

Y GDP CPI u βββ=+++

1)利用表中数据估计此模型的参数。 2) 你认为数据中有多重共线性吗 ? 3) 进行以下回归

121ln ln t t i

Y A A GDP v =++

122ln ln t t i

Y B B CPI v =++

123ln ln t t i

GDP C C CPI v =++

根据这些回归你能对数据中多重共线性的性质说些什么 ?

4)假设数据有多重共线性 , 但2ˆβ和3

ˆβ在5%水平上个别的显著 , 并且总的 F 检验也是显著的。对这样的情形 , 我们是否应考虑共线性的问题 ?

4.4 自己找一个经济问题来建立多元线性回归模型 , 怎样选择变量和构造解释变量数据矩阵 X 才可能避免多重共线性的出现 ? 4.5 克莱因与戈德伯格曾用 1921-1950 年 (1942-1944 年战争期间略去 ) 美国国内消 费 Y 和工资收入1X 、非工资一非农业收入

2X 、农业收入3X 的时间序列资料 , 利用OISE 估计得出了下列回归方程 :

ˆY =8.133+1.0591X +0.4522X +0.1213

X (8.92)(0.17)(0.66)(1.09)

2

R =0.95 F=107.37

括号中的数据为相应参数估计量的标准误差。试对上述模型进行评析 , 指出其中存在的问题。

4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此 , 收集了中国能源消费标准煤总量 Y( 万 t) 、国民总收入1X (代表收入水平 )( 亿元 ) 、国内生产总值 GDP 2X ( 代表经济发展

水 平 )( 亿元 ) 、工业增加值

3X ( 亿元 ) 、建筑业增加值4X ( 亿元 ) 、交通运输邮电业增加值 5X ( 代表产业发展水平及产业结

构 )( 亿元 ) 、人均生活电力消费

6X (kW ·h)( 代表人民生活水 平提高 ) 、能源加工转换效率7X ( 代表能源转换技术 )(%) 等

1985-2002 年统计数据 , 具 体见表 4.12 。

表 4.12 1985-2002 年统计数据

资料来源:中国统计年鉴 .2004. 中国统计出版社 ,2004

要求 :

1) 建立对数线性多元回归模型。

2) 如果决定用表中全部变量作为解释变量 , 你预料会遇到多重共线性的问题吗 ? 为什么 ? 3) 如果有多重共线性 ,你准备怎样解决这个问题 ? 明确你的假设并说明全部计算。 4.7 本章引子提出“农业和建筑业的发展会减少财政收入吗 ?” 所采用的数据如表 4.13所示。

表 4.13 1978-2003 年财政收人及其影响因素数据

相关文档
最新文档