计量经济学庞皓课件(第四章 多重共线性)

合集下载

第四章 多重共线性

第四章 多重共线性
( X X ) 不存在,从( X X ) =X Y
' 1 ' '
中没法解出唯一的 来。
(2)参数估计值的方差无限大;
例如:对一个离差形式的二元回归模型
y 1 x1 2 x 2
如果两个解释变量完全相关,如x 2 x1 ,则有
x12i X X x x 2 i 1i
(2)变量显著性与方程显著性综合判断;

(3)辅助回归:将每个解释变量对其余变量回归,若某 个回归方程显著成立,则该解释变量和其余变量有多 重共线性。即看判定系数较大。 (4)判断参数估计值的符号,如果不符合经济理论或实 际情况,可能存在多重共线性
4.4.1 多重共线性的修正方法 (一):增加样本容量

时间序列数据经常出现序列相关 截面数据时,经常出现异方差

5、随机扰动项方差不等于常数=>异方差

解决问题的思路

1、定义违反各个基本假定的基本概念 2、违反基本假定的原因、背景 3、诊断基本假定的违反 4、违反基本假定的补救措施(修正)
本章主要介绍
4.1 4.2 4.3 4.4 4.5 4.6 多重共线性的实例、定义、产生背景; 多重共线性产生的后果; 多重共线性的检验; 多重共线性的修正。 违反三个假定的总结 案例
4.1.3 产生多重共线性的背景
(3)由于某种决定性因素的影响可能使各个变量向着同 方向变化; (4)滞后变量引入模型,同一变量的滞后值一般都存在 相互关系;在计量经济模型中,往往需要引入滞后经 济变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。
多重共线性分类的矩阵形式

计量经济学课件庞皓第四章

计量经济学课件庞皓第四章

计量经济学课件庞皓第四章简介本文档是关于计量经济学课程中庞皓第四章的课件摘要。

本章重点讲解了关于回归模型的假设检验和模型选择的内容。

通过学习本章,我们将能够对回归模型的假设进行检验,并了解如何选择最合适的模型来解释我们的数据。

回归模型的假设检验回归模型的假设检验是计量经济学中的重要内容,它帮助我们判断我们的回归模型是否有效,以及通过对模型参数的假设进行检验来评估模型的准确性。

本节我们将学习三个重要的假设检验:线性关系、零斜率以及模型中的其他假设。

1. 线性关系的检验在回归模型中,我们假设解释变量和被解释变量之间存在线性关系。

我们可以使用各种统计方法来检验线性关系,其中最常用的方法是利用t统计量对斜率进行假设检验。

具体地,我们对斜率的假设进行如下检验:H0:斜率等于零,即变量之间不存在线性关系。

Ha:斜率不等于零,即变量之间存在线性关系。

我们可以根据t统计量的计算结果,来判断是否拒绝原假设。

2. 零斜率的检验当我们在回归模型中引入一个变量时,我们可以对该变量的斜率进行检验,来判断该变量对模型的解释能力是否显著。

具体地,我们对斜率的假设进行如下检验:H0:斜率等于零,即该变量对模型的解释能力不显著。

Ha:斜率不等于零,即该变量对模型的解释能力显著。

我们可以根据t统计量的计算结果,来判断是否拒绝原假设。

3. 模型中的其他假设检验除了线性关系和零斜率的检验,回归模型中还有其他重要的假设需要进行检验,包括误差项的正态性、异方差性以及自相关性的检验。

这些假设检验对于模型的有效性评估至关重要。

模型选择在计量经济学中,我们常常面临多个模型的选择问题,如何选择最合适的模型来解释我们的数据是一个重要的问题。

本节将介绍两种常用的模型选择方法:最小二乘法(OLS)和信息准则。

1. 最小二乘法(OLS)最小二乘法是回归模型中最常用的估计方法,它通过最小化观测值和模型估计值之间的残差平方和,来得到模型的最优拟合。

最小二乘法通过估计出的模型参数来评估模型的拟合效果,我们可以根据拟合优度以及估计参数的显著性来选择最优模型。

第四章第三节多重共线性 计量经济学 教学课件(共34张PPT)

第四章第三节多重共线性  计量经济学 教学课件(共34张PPT)
第十页,共34页。
5.利用不包含某一解释变量Xj的样本决定系数进行检验
对原模型 Y=f〔X1,X2,…,Xk〕估计,计算R2
逐次减少(jiǎnshǎo)一个解释变量,进行估计计算样本决定系

Y=f〔X2,X3,…,Xk〕 R12
Y=f〔X1,X3,…,Xk〕 R22
……
… … ……
Y=f〔X1,X2,…,X k-1〕 Rk2
8.385373
0.0000
X2
0.4213800.1269253.3199190.0061
X3
-0.166260
0.059229 -2.807065
0.0158
X4
ቤተ መጻሕፍቲ ባይዱ
-0.097770
0.067647
-1.445299
0.1740
X5
-0.028425
0.202357 -0.140471
0.8906
Dependent Variable: Y
Method: Least Squares
Sample: 1983 2000
Included observations: 18
Variable Coefficient
Std. Error t-Statistic Prob.
X1
6.212562
0.740881
第六页,共34页。
三、多重共线性的影响
1.增大最小二乘估(计 yǐ的 ng方差xiǎng)
ˆ (X T X )1 X TY
var(ˆ
)
(
X
T
X
)1 ii
2
若模型当中存在完全共线性,则最小二乘估计失效.
若存在高度的共线性则会使估计值的方差变得很大,

计量经济学课件(庞浩版)

计量经济学课件(庞浩版)
劳动经济学
劳动经济学中经常运用联立方程模型来研究劳动力市场中 的各种问题,如工资决定、就业与失业、劳动力流动等。 例如,可以构建一个包含工资方程和就业方程的联立方程 模型,以分析最低工资制度对就业和工资水平的影响。
06
CATALOGUE
面板数据计量经济学模型
面板数据基本概念与特点
面板数据定义
面板数据是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样 本数据。
面板数据模型估计方法及应用举例
估计方法
面板数据模型的估计方法主要有最小二乘法 、广义最小二乘法和极大似然法等。
应用举例
面板数据模型在经济学、金融学、社会学等 领域有广泛的应用,如经济增长、劳动力市 场、金融市场、环境经济学等问题的研究。 例如,可以利用面板数据模型研究不同国家 经济增长的影响因素,或者分析某个政策对 不同地区或不同群体的影响效果。
模型设定
多元线性回归模型是描述多个自变量与一 个因变量之间线性关系的模型,形式为 Y=β0+β1X1+β2X2+...+βkXk+u。
假设ห้องสมุดไป่ตู้验
对各个自变量的回归系数进行假设检验, 判断其是否显著不为零。
参数估计
通过最小二乘法等方法对模型中的参数进 行估计,得到各个自变量的回归系数估计 值。
多重共线性问题
采用逐步回归法、岭回归法、主成分分析法等方法对多重 共线性进行修正,同时也可以通过增加样本容量或收集更 多信息来缓解多重共线性的影响。
04
CATALOGUE
时间序列计量经济学模型
时间序列基本概念与性质
时间序列定义
按时间顺序排列的一组数据,反映现象随时间 变化的发展过程。

庞皓《计量经济学》(第4版)章节题库-第4章 多重共线性【圣才出品】

庞皓《计量经济学》(第4版)章节题库-第4章 多重共线性【圣才出品】

第4章 多重共线性一、选择题1.下列哪项回归分析中很可能出现多重共线性问题?( )A.“资本投入”“劳动投入”两个变量同时作为生产函数的解释变量B.“消费”作为被解释变量,“收入”作解释变量的消费函数C.“本期收入”和“前期收入”同时作为“消费”的解释变量的消费函数D.“每亩施肥量”“每亩施肥量的平方”同时作为“小麦亩产”的解释变量的模型【答案】C【解析】产生多重共线性的主要原因有:①经济变量相关的共同趋势;②模型设定不谨慎;③样本资料的限制。

C项中“本期收入”和“前期收入”两个解释变量之间很可能存在线性相关性,导致模型中很可能会出现多重共线性问题。

2.在线性回归模型Y i=β0+β1X i1+β2X i2+β3X i3+u i中,如果X3i=2X1i+3X2i,则表明模型中存在( )。

A.异方差B.多重共线性C.序列相关D.设定误差【答案】B【解析】当存在不全为0的c i使c i X i1+c2X i2+…+c k X ik=0(i=1,2,…,n),即某一个解释变量可以用其他解释变量的线性组合表示,则称为解释变量间存在完全共线性,模型的回归系数估计值不存在。

本题中,存在c i 不等于0,使得X 3i -2X 1i -3X 2i =0,因此模型存在完全多重共线性。

3.对于模型Y i =β0+β1X 1i +β2X 2i +μi ,与r 12=0相比,当r 12=0.5时,估计量Error!1的方差Var (1)将是原来的( )倍。

A .1.00B .1.33C .1.45D .2.00【答案】B【解析】在二元线性回归模型中,()221211ˆ1i Var r X σβ=⋅-∑多重共线性使参数估计量的方差增大,方差膨胀因子为VIF (1)=1/(1-r 2),所以当r 12=0.5时,方差将是原来的1/(1-r 122)=1/(1-0.52)=1.33倍。

4.下列各项中,不属于解决多重共线性的方法的是( )。

计量经济学(第四章多重共线性)

计量经济学(第四章多重共线性)

06
总结与展望
研究结论总结
多重共线性现象普遍存在于经济数据中,对计量 经济学模型的估计和解释产生了重要影响。
通过使用多种诊断方法,如相关系数矩阵、方差膨 胀因子(VIF)和条件指数(CI),可以有效地识别 多重共线性问题。
在存在多重共线性的情况下,普通最小二乘法 (OLS)估计量虽然仍然是无偏的,但其方差可能 变得很大,导致估计结果不稳定。
主成分分析法的优点
可以消除多重共线性的影响,同 时降低自变量的维度,简化模型。
岭回归法
岭回归法的基本思想
通过在损失函数中加入L2正则化项(即所有自变量的平方和),使得回归系数的估计更加稳定, 从而消除多重共线性的影响。
岭回归法的步骤
首先确定正则化参数λ的值,然后求解包含L2正则化项的损失函数最小化问题,得到岭回归系数的估 计值。
逐步回归法的优点
可以自动选择重要的自变量,同时消除多重共线性的影响。
主成分分析法
主成分分析法的基本思想
通过正交变换将原始自变量转换 为互不相关的主成分,然后选择 少数几个主成分进行回归分析。
主成分分析法的步骤
首先对原始自变量进行标准化处理, 然后计算相关系数矩阵并进行特征值 分解,得到主成分及其对应的特征向 量。最后,选择少数几个主成分作为 新的自变量进行回归分析。
岭回归法的优点
可以有效地处理多重共线性问题,同时避免过拟合现象的发生。此外,岭回归法还可以提供对所 有自变量的系数进行压缩估计的功能,使得模型更加简洁易懂。
05
实证研究与结果分

数据来源及预处理
数据来源
本研究采用的数据集来自于公开的统 计数据库,涵盖了多个经济指标和影 响因素的观测值。
数据预处理

计量经济学课件第四章多重共线性

计量经济学课件第四章多重共线性

第四章 多重共线性第一节 违背基本假定的一般描述一、基本假定的回顾1、零均值假定。

2、同方差假定。

3、无自相关假定。

4、解释变量与随机误差项不相关。

5、无多重共线性假定。

6、正态性假定。

除此之外,还有一些需要注意的地方,回归模型关于参数线性;在重复抽样中X 值是固定的(或X 是非随机的);X 的值要有变异;模型设定是正确的。

二、假定1和假定6违背的讨论1、违背假定1的情况。

(1)正确理解零均值假定是掌握所有假定的关键(参见Wooldridge ,计量经济学导轮现代观点,pp.23-25)。

(2)假定1不满足的数学描述。

设一元线性回归模型为121212'1212,1,2,,()0,i i i i i i i i i iY X u i nE u k E Y X E u X k k X X ββββββββββ=++==≠=++=++=++=+如果有则有()()()由上式表明,这时在0≠)(i u E 下,改变的只是截距项,而对模型的线性结构并不影响。

(3)对假定1被破坏的解释。

通常在这种情况下,我们认为是变量所取的数据可能出现了异常表现,即有异常值。

因为按照零均值的意义,要求各个散点是均匀地分布在回归线的周围。

修正的方法将在后面虚拟变量部分介绍。

例如,我们分析江苏省社会商品消费品零售总额与江苏省城乡居民可支配收入之间的关系,发现在1991年该省的社会消费品零售总额存在异常值,表现为样本回归模型的残差在1991年有估计值与实际值存在明显的差异。

见下图和下表另一方面,有时通过变量的时序数据的样本折线图也可直接观察到样本是否存在异常表现。

如我们根据全国国有经济单位职工人数(万人)从1952年到1998年的数据绘制了折线图为从图形中我们可以看到,在1958年、1959年、1960年这三年中,全国国有经济单位职工人数存在异常情况,其背景是这几年为国家大跃进时期,国有单位职工人数增加迅速。

因此,要依据这一数据建立模型,零均值假定就不一定成立。

庞浩 计量经济学4第四章 多重共线性

庞浩 计量经济学4第四章  多重共线性

不完全的多重共线性下, k 1 3 1 X 2i X 3i X ki v i 2 2 2 2
5
例如:
X2 X3 X 3*
10 15
18 24 30
50 75
90 120 150
52 75
97 129 152
6
说明
①在完全的多重共线性下,rank ( X ) k 从而,( X X )kk 不可逆。 ②我们定义的多重共线性仅对解释变量之间的线性 关系而言,它们之间的非线性关系,严格来说,并 不违反无多重共线性假定。例如:
x
2 2i
2 2
1 2 2 ( x x ) 2i 3i ] 2 ( x3 )[ 1 i 2 2 ( x 2 i )( x 3 i ) 1 2 2 2 ( x3 )( 1 r i 23 )
20
方差膨胀因子VIF
参数OLS估计量的方差随多重共线性的增强而不断膨 胀起来,扩大的倍数即为方差膨胀因子,也称为方差 扩大因子,记为VIF(variance inflation factor)。 1 VIF 2 1 r23
ˆ ( X X )1 X Y 进而, 1 2 ˆ Var Cov( ) ( X X )
,仍然存在。
16
不完全多重共线性的后果1: 参数OLS估计量的方差增大
二元线性回归模型离差形式
ˆ x ˆ x ˆi y 2 2i 3 3i
假设: x2 i x3i vi 其中,v i 为随机变量,与 x 3 i 无关,即: x3 i v i 0
22
案例1
研究消费与收入和财富之间的关系,建立如下二 元线性回归模型: Yi 1 2 X 2i 3 X 3i ui

最新计量经济学第四章-3-多重共线性ppt课件

最新计量经济学第四章-3-多重共线性ppt课件
计量经济学第四章-3-多重共 线性
一、多重共线性的概念
对于模型:
Yi=0+1X1i+2X2i++kXki+i i=1,2,…,n
其基本假设之一是解释变量之间是互不相关的。 如果某两个或多个解释变量之间出现了相关性,则称为存 在多重共线性(Multicollinearity)。
Copyright©princebf,2008-2009,YNUFE
( x1i x 2i ) 2
x12i
x
2 2i
恰为X1与X2的线性相关系数的平方r2
var(ˆ1)
2
1
x12i •1r2
由于 0 r2 1,故 1/(1- r2 )1
Copyright©princebf,2008-2009,YNUFE
当完全不共线时, r2 =0
vaˆ1r) (2/ x1 2 i
Copyright©princebf,2008-2009,YNUFE
7、引入检验法
以Y为被解释变量,逐个引入解释变量,构成回归模型,进 行模型估计,根据拟合优度的变化决定新引入的变量是否独 立。 如果拟合优度变化显著,则说明新引入的变量是一个独立 解释变量; 如果拟合优度变化很不显著,则说明新引入的变量与其它 变量之间存在共线性关系。
>0.9,非常严重
Copyright©princebf,2008-2009,YNUFE
2、经验判断法
• 若在OLS法下,出现以下现象,则可能意味着共线性的存 在:
a、系数估计值的符号不合常理; b、R2与F值较大,方程具有显著性,但各参数估计值的t检 验值均较小,多个解释变量并不显著
说明各解释变量对Y的联合线性作用显著,但各解释变 量间存在共线性而使得它们对Y的独立作用不能分辨,故t检 验不显著。

计量经济学课件第四章 多重共线性

计量经济学课件第四章 多重共线性

计量经济学课件第四章多重共线性第四章多重共线性1 / 45计量经济学课件第四章 多重共线性 2 / 45引子:发展农业会减少财政收入吗?为了分析各主要因素对财政收入的影响,建立财政收入模型:= β 0 + β1 i + β 2 + β 3 i + β 4 + β 5 i + β 6 i +其中: 财政收入(亿元) ;农业增加值(亿元)工业增加值(亿元); 建筑业增加值(亿元); 总人口(万人); 最终消费(亿元)受灾面积(万公顷)数据样本时期1978年-2007年(资料来源:《中国统计年鉴 2008》,中国统计出版社2008年版)采用普通最小二乘法得到以下估计结果计量经济学课件第四章 多重共线性3 / 45财政收入模型的估计结果农业增加值 工业增加值建 筑业增加值 总人口 最终消费 受灾面积 截距-1.907548.0.342045 0.042746 0.765767 0.091660 0.042807 0.048904 8607.753-5.576888 1.074892 8.433867 1.047591 0.072609 -0.564916 -0.631118.0.0000 0.2936 0.0000 0.3057 0.9427 0.5776 0.53420.0459476.458374 0.096022 0.003108 -0.027627 -5432.507.0.989654 0.986955 1437.448 47523916 -256.7013 1.654140 10049.04 . 12585.51 17.58009 17.90704 366.6801 ()0.000000计量经济学课件第四章 多重共线性4 / 45模型估计与检验结果分析●可决系数为0.9897 ,校正的可决系数为0.9870,模 型拟合很好。

模型对财政收入的解释程度高达98.9%。

●F 统计量为366.68,说明0.05水平下回归方程整体 上显著。

第四章 多重共线性 《计量经济学》PPT课件

第四章    多重共线性  《计量经济学》PPT课件

SE
(
ˆ
j
)
ˆ
x
2 ji
VIFj
参数估计区间的增大,也会造成预测区间增大,使 得预测不稳定。
3.参数估计量的方差和估计区间增大,使检验容 易出现错误判断。
在不完全多重共线性情况下,参数估计区间增大, 会使得假设检验中参数估计值落入接受区域的概 率增大,也就是说,本来应该拒绝原假设反而不 拒绝。
在对模型参数的 t-检验中,由于参数估计量的标准
| XX | 0
• (XX)1对角线上的元素为无限大,从而 ˆ j 的方差
和标准差也为无限大
• 二元线性回归模型
X 3i X 2i
Var(ˆ3 )
x22i
x22i x32i (
x2i x3i )2
2
x22i
x22i
2 x22i (
x2i x2i )2
2
x22i 0
2
Var(ˆ2 )
差增大而使得值变小,结果造成本应该拒绝原假
设反而不拒绝,即t -检验不能通过。
可决系数 R2会很高,F-检验也显著,但是,对参数
的 t-检验可能不显著,甚至出现偏回归系数的符
号与实际经济现象恰好相反,从而得出错误结论。
§4.3 多重共线性的检验
1.相关系数检验法
两个解释变量的简单相关系数大于0.8的情况下,便认为 存在较严重的多重共线性。当解释变量的个数大于2的时 候,不仅要计算俩俩解释变量的简单相关系数,还要检测 偏相关系数。
x22i
x32i x32i (
x2i x3i )2
2
x22i
2 x22i 2 x22i (
x2i x2i )2
2
2
0
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的有偏估计。有偏性是岭回归估计的一个重要性
质。
性质2 在岭回归参数k与Y无关的情形下,是最小 二乘估计的一个线性变换,也是理论值Y的线性函 数。
性质3 可以证明岭回归估计量方差比普通最小二乘 估计的方差要小。
岭回归估计的方差和偏倚与岭回归参数k有关,岭回 归参数k的值越大,的偏倚越大,其方差就越小。 要得到方差较小的估计结果,就不得不牺牲无偏 性。
4. 利用非样本先验信息
通过经济理论分析能够得到某些参数之间的关 系,可以将这种关系作为约束条件,将此约束 条件和样本信息结合起来进行约束最小二乘估 计。
5. 横截面数据与时序数据并用
首先利用横截面数据估计出部分参数,再利用 时序数据估计出另外的部分参数,最后得到整 个方程参数的估计。 注意:这里包含着假设,即参数的横截面估计和 从纯粹时间序列分析中得到的估计是一样的。
当解释变量之间存在多重共线性,即| XX |≈0 时,
E[(ˆ )(ˆ )] 2 (X X )1 会增大,原因在于X′X接近奇异
。如果将X′X加上一个正常数对角矩阵kI(k>0
,I为单位矩阵),X即X kI
,使 | XX kI |≈0
的可能性
比的可能性更小,那X么X kI 接近奇异的程度就
若新变量的引入未能改进 和 检验,且对其他回 归参数估计值的t 检验也未带来什么影响,则认为该 变量是多余变量。 若新变量的引入未能改进 和 检验,且显著地影 响了其他回归参数估计值的数值或符号,同时本身的 回归参数也通不过t 检验,说明出现了严重的多重共 线性。
三、岭回归法简介
1. 岭回归的含义
3. 岭回归参数k的选择
原则上是要选择使达到最小的k,而最优k值依赖 于未知参数和,因而在实际应用中必须通过样本 来确定。目前还没有形成一个公认的最优方法。 但常用的方法主要有岭迹法、方差扩大因子法、 残差平方和方法。在实际应用中,可考虑使用逐 步搜索的方法,即开始给定较小的k值,然后逐渐 增加k的取值进行实验,直至岭回归估计量的值趋 于稳定。
Prob(F-statistic)
Coefficient 119.0786 0.122355 -0.034104 1.181157
0.999791 0.999770 395.9401 4703056. -249.4791 47897.29
Std. Error
t-Statistic
107.1236
1.111600
2. 增大样本容量
如果样本容量增加,会减小回归参数的方差, 标准误差也同样会减小。因此尽可能地收集足 够多的样本数据可以改进模型参数的估计。 问题:增加样本数据在实际计量分析中常面临 许多困难。
3. 变换模型形式
一般而言,差分后变量之间的相关性要比差分 前弱得多,所以差分后的模型可能降低出现共 线性的可能性,此时可直接估计差分方程。 问题:差分会丢失一些信息,差分模型的误差 项可能存在序列相关,可能会违背经典线性回 归模型的相关假设,在具体运用时要慎重。
3. 有些解释变量的回归系数所带正负号与定性分 析结果违背时,很可能存在多重共线性。
4. 解释变量的相关矩阵中,自变量之间的相关系 数较大时,可能会存在多重共线性问题。
四、逐步回归检测法
逐步回归的基本思想
将变量逐个的引入模型,每引入一个解释变量个进行 t 检验,当原来引入的解释变量由于后面解释变量的 引入而变得不再显著时,则将其剔除。以确保每次引 入新的变量之前回归方程中只包含显著的变量。 在逐步回归中,高度相关的解释变量,在引入时会 被剔除。因而也是一种检测多重共线性的有效方法。
注意:
较高的简单相关系数只是多重共线性存在的充分 条件,而不是必要条件。特别是在多于两个解释 变量的回归模型中,有时较低的简单相关系数也 可能存在多重共线性。因此并不能简单地依据相 关系数进行多重共线性的准确判断。
二、方差扩大(膨胀)因子法
统计上可以证明,解释变量 X j 的参数估计式 βˆ j
●经验表明,方差膨胀因子≥10时,说明解释变量 与其余解释变量之间有严重的多重共线性,且这 种多重共线性可能会过度地影响最小二乘估计。
三、直观判断法
1. 当增加或剔除一个解释变量,或者改变一个观 测值时,回归参数的估计值发生较大变化,回归 方程可能存在严重的多重共线性。 2. 从定性分析认为,一些重要的解释变量的回归 系数的标准误差较大,在回归方程中没有通过显 著性检验时,可初步判断可能存在严重的多重共 线性。
Prob. 0.2751 0.0179 0.0000 0.0000
18185.17 26129.67 14.91053 15.09011 14.97177 1.025140
0.000000
模型估计与检验结果分析
●可决系数为0.99979 ,校正的可决系数为0.99977, 模型拟合很好。模型对财政收入的解释程度高达 99.9%。
▲ 从偏回归系数意义看:在 X 2和X3 完全共线性时,无法保
持 X3不变,去单独考虑 X 2 对Y 的影响( X 2 和 X3 的影响
不可区分)
▲ 从OLS估计式看:可以证明此时
βˆ2
=
0 0
2.参数估计值的方差无限大
OLS估计式的方差成为无穷大: Var(ˆ2 )
二、不完全多重共线性产生的后果
第四节 多重共线性的补救措施
本节基本内容:
●修正多重共线性的经验方法 ●逐步回归法
岭回归法在本科教学中只是供选择使用 的内容。
一、修正多重共线性的经验方法
1. 剔除变量法
把方差扩大因子最大者所对应的自变量首先 剔除再重新建立回归方程,直至回归方程中 不再存在严重的多重共线性。 注意: 若剔除了重要变量,可能引起模型的设 定误差。
0.048846
2.504910
0.005068
-6.729101
0.069676
16.95204
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
的方差可表示为
Var(βˆ j ) =
σ2
1
x2j 1- R2j =
σ2 x2j VIFj
其中的 VIFj 是变量 X j 的方差扩大因子
(Variance Inflation Factor),即
VIFj =
1
1
-
R
2 j
其中 R2j 是多个解释变量辅助回归的可决系数
经验规则
●方差膨胀因子越大,表明解释变量之间的多重共 性越严重。反过来,方差膨胀因子越接近于1, 多重共线性越弱。
计量经济学
第四章 多重共线性
引子:
国内生产总值增加会减少财政收入吗?
为了分析各主要因素对国家财政收入的影响,建立 财政收入(亿元) (CZSR)为被解释变量,财政支出 (亿元)(CZZC)、国内生产总值(亿元)(GDP)、 税收总额(亿元)(SSZE)等为解释变量的计量模型。 数据样本时期:1978年-2011年的统计数据。 设定的理论模型为:
则称解释变量 1, X 2, X3,L , X k 之间存在着完全的多重共
线性。
或者说,当 Rank( X ) k 时,表明在数据矩阵 X 中,至少有
一个列向量可以用其余的列向量线性表示,则说明存在完全的多
重共线性。
不完全的多重共线性
实际中,常见的情形是解释变量之间存在不完 全的多重共线性。
对于解释变量 1, X 2 , X3,L X k ,存在不全为0的数
第四章 多重共线性
本章讨论四个问题:
●什么是多重共线性 ●多重共线性产生的后果 ●多重共线性的检验 ●多重共线性的补救措施
第一节 什么是多重共线性
本节基本内容:
●多重共线性的含义 ●产生多重共线性的背景
一、多重共线性的含义
在计量经济学中所谓的多重共线性(Multi-Collinearity),
互正交。这时已不需要作多元回归,每个参数j都可
以通过Y 对 Xj 的一元回归来估计。
(2) rxixj 1 ,解释变量间完全共线性。此时模型参
数将无法确定。
系(3)。0实<际rx中i x j <常1遇到,的解情释形变。量间存在一定程度的线性关
二、产生多重共线性的背景
多重共线性产生的经济背景主要有几种情形:
如果模型中存在不完全的多重共线性,可以得到
参数的估计值,但是对计量经济分析可能会产生 一系列的影响。 1.参数估计值的方差增大
Var(βˆ2 ) = σ2
1
σ2
1
x22i (1- r223 ) =
x22i (1- r223 )

r23 增大时
^
Var( 2 )
也增大
2.对参数区间估计时,置信区间趋于变大 3.假设检验容易作出错误的判断 4.可能造成可决系数较高,但对各个参数单独的
1, 2 ,L k ,使得
1 2 X2i 3 X3i ... k X ki ui 0 i 1, 2,..., n 其中, ui 为随机变量。这表明解释变量
1, X 2 , X3,L X k 只是一种近似的线性关系。
回归模型中解释变量的关系
可能表现为三种情形: (1) rxixj 0 ,解释变量间毫无线性关系,变量间相
6. 变量变换
变量变换的主要方法: (1)计算相对指标 (2)将名义数据转换为实际数据 (3)将小类指标合并成大类指标
变量数据的变换有时可得到较好的结果,但无 法保证一定可以得到很好的结果。
二、逐步回归法
(1)用被解释变量对每一个所考虑的解释变量做简 单回归。
(2)以对被解释变量贡献最大的解释变量所对应的 回归方程为基础,按对被解释变量贡献大小的顺 序逐个引入其余的解释变量。 若新变量的引入改进了 和 检验,且回归参 数的t 检验在统计上也是显著的,则在模型中保 留该变量。
相关文档
最新文档