计量经济学多重共线性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/6/28
商学院王中昭
教学内容一、多重共线性
二、实际经济问题中的多重共线性三、多重共线性的后果四、多重共线性的检验
五、克服多重共线性的办法和实例
§4.3 多重共线性
2020/6/28
商学院王中昭
对于模型Y i =β0+ β1x 1i + β2x 2i +…… βk x ki +μi
如果某两个或多个解释变量之间出现相关性,即:C 1x 1i +C 2X 2i +……C k X ki =0
其中C i 不全为0,即某一个解释变量是其他解释变量的
线性组合,则称为完全多重共线性。
完全多重共线性的情况并不多见,一般是出现不同程度的多重共线性。
注意多重共线性不是指因变量与解释一、多重共线性概念
2020/6/28
商学院王中昭
Y=Xβ+μ
完全共线性:∣X′X ∣=0,(X′X)-1不存在,使B ^=(X′X)-1X′Y 无法求解。例如:
,
0)(0020
16
3
1084104213211 x x x 321332211321≠'=+-=++⎪⎪⎪⎪⎪⎭
⎫
⎝
⎛=X X x x x X i i i i i i x c x c x c 这里,完全多重共线性
2020/6/28
商学院王中昭
完全多重共线性的情况不多,一般出现不同程度的多重共线性。
多重共线性:∣X′X∣≈0,(X′X)-1存在,但
(X′X)-1主对角线上的元素很大。
⎪⎪
⎪⎪⎫
⎛='≈'⇒≈+⎪⎪⎪⎪⎪⎭⎫
⎝⎛=400300000300000100040030000030000010002100010004
X)
X ( ,
0)( 0,0x x - x 199.2993001001.4004001099.1992001101.1001001 x x x 1
-3i 2i 1i 3
21||这里,X X X 近似多重共线性
2020/6/28
商学院王中昭
1、各时间序列的解释变量受同一因素影响,导致解释变量之间在时间上具有相同近似同增量的变化,这些因素有:(1)经济发展(2)政治事件(3)偶然事件(4)时间趋势
2、解释变量中含有滞后变量容易产生多重共线性。这是因为滞后变量从经济性质上看与原来的变量无区别,只是时间上有所不同。例如,投资模型
I t =β1+β2r t +β3Y t +β4Y t-1+μt
二、实际经济问题中的多重共线性
2020/6/28
商学院王中昭
如粮食产量Y=β0+β1X 1+β2X 2+β3X 3+β4X 4+u 其中Y 为粮食产量,X 1为肥料,X 2为种植面积,X 3为劳动力,X 4为水利浇灌。种植面积越多则投入的肥料和劳动力就越多,故肥料、种植面积和劳动力三者之间存在相关关系。
又如:Y=β0+β1P+β2Q+β3I+u
其中Y 为某种商品需求量,P 为商品价格、Q 为商品质量、I 为居民收入。一般地质量较高的商品其价格也高,故P 和Q 存在线性关系。
一般地时间序列往往导致多重共线性。
但单独用截面数据,或用时间序列和截面数据相结合可减少多重共线性的发生。
3、各经济变量之间的内在联系
2020/6/28
商学院王中昭
B^=(X ′X)-1X ′Y,Var(B ^)=σ2(X ′X)
-11、完全共线性:无法求解参数估计量B^。
2、近似共线性:(参数估计量的方差增大为主要后果):即Var(B ^)变得很大,导致B ^不稳定,。
3、参数估计量经济含义不合理(共线性的解释变量的系数并不表示它们各自对被解释变量的贡献,失去了应有的经济含义。因为共线解释变量之间可互相线性表示,此系数有可能是它们的共同影响)
看模拟分析(第4,5章.do,一.多重共线性的征兆:模拟分析)。
?
三、多重共线性的后果
2020/6/28
商学院王中昭
4、变量的显著性检验失去意义:由于系数的标准差变大,从而该系数对应变量t 统计量变小,故使原本重要的自变量而t 检验通不过。
5、预测功能失效:因为β^I 值不
稳定,从而导致MSE 不准确,→预测不准确。
2020/6/28
商学院王中昭
(一)、整体检验X 1,X 2,…..,X k 是否存在多重共线性。
若R 2,F 均很大,但多数解释变量都不显著,甚至系数符号都不对,则认为存在多重共线性。
缺点:此法无法分辩出共线性由哪些解释变量引起,在此基础上须进行下面进一步检验:
四、多重共线性的检验
2020/6/28
商学院王中昭
1、简单相关系数法(只有两个解释变量时用)
(1)当只有两个自变量时,计算这两个变量的相关系数,若系数绝对值较大。例如大于被解释变量与解释变量之间的相关系数R 的绝对值。则认为这两个变量存在共线性。
(二)具体检验共线性是哪些变量引起的
那就简单了:只要算出任何两个变量的相关系数不就知道是否存在多重共线性了?
如果是三个以上的解释变量,此法行不通!懂吗!
2020/6/28商学院
王中昭
实例(P141):中国粮食生产函数根据理论和经验分析,影响粮食生产(Y )的主要因素有:农业化肥施用量(X1),粮食播种面积(X2),成灾面积(X3) ,农业机械总动力(X4),农业劳动力(X5)。 1.已知中国粮食生产的相关数据,建立中国粮食生产函数:LnY=β0+β 1 LnX1 +β 2 LnX2 +β 3 LnX3 +β 4 LnX4 +β 4 LnX5 +μ经验方法:可以通过每个解释变量与Y 之间的散点图来判断是否为直线关系,然后假定合一起也是直线关系,最后由估计出来的结果再整体检验所有解释变量是否与Y 线相关。