计量经济学_庞皓_第二版_第四章_多重共线性(公式详细)

合集下载

第四章 多重共线性

第四章 多重共线性
( X X ) 不存在,从( X X ) =X Y
' 1 ' '
中没法解出唯一的 来。
(2)参数估计值的方差无限大;
例如:对一个离差形式的二元回归模型
y 1 x1 2 x 2
如果两个解释变量完全相关,如x 2 x1 ,则有
x12i X X x x 2 i 1i
(2)变量显著性与方程显著性综合判断;

(3)辅助回归:将每个解释变量对其余变量回归,若某 个回归方程显著成立,则该解释变量和其余变量有多 重共线性。即看判定系数较大。 (4)判断参数估计值的符号,如果不符合经济理论或实 际情况,可能存在多重共线性
4.4.1 多重共线性的修正方法 (一):增加样本容量

时间序列数据经常出现序列相关 截面数据时,经常出现异方差

5、随机扰动项方差不等于常数=>异方差

解决问题的思路

1、定义违反各个基本假定的基本概念 2、违反基本假定的原因、背景 3、诊断基本假定的违反 4、违反基本假定的补救措施(修正)
本章主要介绍
4.1 4.2 4.3 4.4 4.5 4.6 多重共线性的实例、定义、产生背景; 多重共线性产生的后果; 多重共线性的检验; 多重共线性的修正。 违反三个假定的总结 案例
4.1.3 产生多重共线性的背景
(3)由于某种决定性因素的影响可能使各个变量向着同 方向变化; (4)滞后变量引入模型,同一变量的滞后值一般都存在 相互关系;在计量经济模型中,往往需要引入滞后经 济变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。
多重共线性分类的矩阵形式

计量经济学课件庞皓第四章

计量经济学课件庞皓第四章

计量经济学课件庞皓第四章简介本文档是关于计量经济学课程中庞皓第四章的课件摘要。

本章重点讲解了关于回归模型的假设检验和模型选择的内容。

通过学习本章,我们将能够对回归模型的假设进行检验,并了解如何选择最合适的模型来解释我们的数据。

回归模型的假设检验回归模型的假设检验是计量经济学中的重要内容,它帮助我们判断我们的回归模型是否有效,以及通过对模型参数的假设进行检验来评估模型的准确性。

本节我们将学习三个重要的假设检验:线性关系、零斜率以及模型中的其他假设。

1. 线性关系的检验在回归模型中,我们假设解释变量和被解释变量之间存在线性关系。

我们可以使用各种统计方法来检验线性关系,其中最常用的方法是利用t统计量对斜率进行假设检验。

具体地,我们对斜率的假设进行如下检验:H0:斜率等于零,即变量之间不存在线性关系。

Ha:斜率不等于零,即变量之间存在线性关系。

我们可以根据t统计量的计算结果,来判断是否拒绝原假设。

2. 零斜率的检验当我们在回归模型中引入一个变量时,我们可以对该变量的斜率进行检验,来判断该变量对模型的解释能力是否显著。

具体地,我们对斜率的假设进行如下检验:H0:斜率等于零,即该变量对模型的解释能力不显著。

Ha:斜率不等于零,即该变量对模型的解释能力显著。

我们可以根据t统计量的计算结果,来判断是否拒绝原假设。

3. 模型中的其他假设检验除了线性关系和零斜率的检验,回归模型中还有其他重要的假设需要进行检验,包括误差项的正态性、异方差性以及自相关性的检验。

这些假设检验对于模型的有效性评估至关重要。

模型选择在计量经济学中,我们常常面临多个模型的选择问题,如何选择最合适的模型来解释我们的数据是一个重要的问题。

本节将介绍两种常用的模型选择方法:最小二乘法(OLS)和信息准则。

1. 最小二乘法(OLS)最小二乘法是回归模型中最常用的估计方法,它通过最小化观测值和模型估计值之间的残差平方和,来得到模型的最优拟合。

最小二乘法通过估计出的模型参数来评估模型的拟合效果,我们可以根据拟合优度以及估计参数的显著性来选择最优模型。

第四章第三节多重共线性 计量经济学 教学课件(共34张PPT)

第四章第三节多重共线性  计量经济学 教学课件(共34张PPT)
第十页,共34页。
5.利用不包含某一解释变量Xj的样本决定系数进行检验
对原模型 Y=f〔X1,X2,…,Xk〕估计,计算R2
逐次减少(jiǎnshǎo)一个解释变量,进行估计计算样本决定系

Y=f〔X2,X3,…,Xk〕 R12
Y=f〔X1,X3,…,Xk〕 R22
……
… … ……
Y=f〔X1,X2,…,X k-1〕 Rk2
8.385373
0.0000
X2
0.4213800.1269253.3199190.0061
X3
-0.166260
0.059229 -2.807065
0.0158
X4
ቤተ መጻሕፍቲ ባይዱ
-0.097770
0.067647
-1.445299
0.1740
X5
-0.028425
0.202357 -0.140471
0.8906
Dependent Variable: Y
Method: Least Squares
Sample: 1983 2000
Included observations: 18
Variable Coefficient
Std. Error t-Statistic Prob.
X1
6.212562
0.740881
第六页,共34页。
三、多重共线性的影响
1.增大最小二乘估(计 yǐ的 ng方差xiǎng)
ˆ (X T X )1 X TY
var(ˆ
)
(
X
T
X
)1 ii
2
若模型当中存在完全共线性,则最小二乘估计失效.
若存在高度的共线性则会使估计值的方差变得很大,

计量经济学庞皓第二版第四章答案

计量经济学庞皓第二版第四章答案

4.1(1) 存在3322ˆˆˆˆβγβα==且。

因为()()()()()()()23223223232322ˆ∑∑∑∑∑∑∑--=ii i i i i ii i i i x x x x x x x y x x y β 当32X X 与之间的相关系数为零时,离差形式的032=∑i i x x 有()()()()222223222322ˆˆαβ===∑∑∑∑∑∑i i ii i i i i x x y x x x x y 同理有:33ˆˆβγ= (2)会的。

(3) 存在()()()()3322ˆvar ˆvar ˆvar ˆvar γβαβ==且。

因为()()∑-=22322221ˆvar r x i σβ当023=r 时,()()()22222232222ˆvar 1ˆvar ασσβ==-=∑∑i i x r x 同理,有()()33ˆvar ˆvar γβ=4.3(1)参数估计结果如下: 093.1275F 991.0 992.0(-4.923) (17.967) (-9.069) ln 0571.1ln 6567.10601.3ˆln 22===-+-=R R CPI GDP Y t(2)数据中有多重共线性,居民消费价格指数的回归系数的符号不能进行合理的经济意义解释,且其简单相关系数呈现正向变动。

(3)分别拟合的回归模型如下:983.0(34.622)(-10.646) ln 187.1745.3ˆln 2=+-=R GDP Y867.0(11.681) (-4.341) PI ln 6638.24424.5ˆln 2=+-=R C Y931.0(16.814) (-1.958) ln 246.2438.1ˆln 2=+-=R CPI P DG单方程拟合效果都很好,回归系数显著,判定系数较高,GDP 和CPI 对进口的显著的单一影响,在这两个变量同时引入模型时影响方向发生了改变;GDP 对CPI 进行回归分析,回归系数显著,判定系数较高,说明GDP 和CPI 有很强的线性关系,这正是原模型多重共线性的原因。

计量经济学(第四章多重共线性)

计量经济学(第四章多重共线性)

06
总结与展望
研究结论总结
多重共线性现象普遍存在于经济数据中,对计量 经济学模型的估计和解释产生了重要影响。
通过使用多种诊断方法,如相关系数矩阵、方差膨 胀因子(VIF)和条件指数(CI),可以有效地识别 多重共线性问题。
在存在多重共线性的情况下,普通最小二乘法 (OLS)估计量虽然仍然是无偏的,但其方差可能 变得很大,导致估计结果不稳定。
主成分分析法的优点
可以消除多重共线性的影响,同 时降低自变量的维度,简化模型。
岭回归法
岭回归法的基本思想
通过在损失函数中加入L2正则化项(即所有自变量的平方和),使得回归系数的估计更加稳定, 从而消除多重共线性的影响。
岭回归法的步骤
首先确定正则化参数λ的值,然后求解包含L2正则化项的损失函数最小化问题,得到岭回归系数的估 计值。
逐步回归法的优点
可以自动选择重要的自变量,同时消除多重共线性的影响。
主成分分析法
主成分分析法的基本思想
通过正交变换将原始自变量转换 为互不相关的主成分,然后选择 少数几个主成分进行回归分析。
主成分分析法的步骤
首先对原始自变量进行标准化处理, 然后计算相关系数矩阵并进行特征值 分解,得到主成分及其对应的特征向 量。最后,选择少数几个主成分作为 新的自变量进行回归分析。
岭回归法的优点
可以有效地处理多重共线性问题,同时避免过拟合现象的发生。此外,岭回归法还可以提供对所 有自变量的系数进行压缩估计的功能,使得模型更加简洁易懂。
05
实证研究与结果分

数据来源及预处理
数据来源
本研究采用的数据集来自于公开的统 计数据库,涵盖了多个经济指标和影 响因素的观测值。
数据预处理

计量经济学课件第四章多重共线性

计量经济学课件第四章多重共线性

第四章 多重共线性第一节 违背基本假定的一般描述一、基本假定的回顾1、零均值假定。

2、同方差假定。

3、无自相关假定。

4、解释变量与随机误差项不相关。

5、无多重共线性假定。

6、正态性假定。

除此之外,还有一些需要注意的地方,回归模型关于参数线性;在重复抽样中X 值是固定的(或X 是非随机的);X 的值要有变异;模型设定是正确的。

二、假定1和假定6违背的讨论1、违背假定1的情况。

(1)正确理解零均值假定是掌握所有假定的关键(参见Wooldridge ,计量经济学导轮现代观点,pp.23-25)。

(2)假定1不满足的数学描述。

设一元线性回归模型为121212'1212,1,2,,()0,i i i i i i i i i iY X u i nE u k E Y X E u X k k X X ββββββββββ=++==≠=++=++=++=+如果有则有()()()由上式表明,这时在0≠)(i u E 下,改变的只是截距项,而对模型的线性结构并不影响。

(3)对假定1被破坏的解释。

通常在这种情况下,我们认为是变量所取的数据可能出现了异常表现,即有异常值。

因为按照零均值的意义,要求各个散点是均匀地分布在回归线的周围。

修正的方法将在后面虚拟变量部分介绍。

例如,我们分析江苏省社会商品消费品零售总额与江苏省城乡居民可支配收入之间的关系,发现在1991年该省的社会消费品零售总额存在异常值,表现为样本回归模型的残差在1991年有估计值与实际值存在明显的差异。

见下图和下表另一方面,有时通过变量的时序数据的样本折线图也可直接观察到样本是否存在异常表现。

如我们根据全国国有经济单位职工人数(万人)从1952年到1998年的数据绘制了折线图为从图形中我们可以看到,在1958年、1959年、1960年这三年中,全国国有经济单位职工人数存在异常情况,其背景是这几年为国家大跃进时期,国有单位职工人数增加迅速。

因此,要依据这一数据建立模型,零均值假定就不一定成立。

庞浩 计量经济学4第四章 多重共线性

庞浩 计量经济学4第四章  多重共线性

不完全的多重共线性下, k 1 3 1 X 2i X 3i X ki v i 2 2 2 2
5
例如:
X2 X3 X 3*
10 15
18 24 30
50 75
90 120 150
52 75
97 129 152
6
说明
①在完全的多重共线性下,rank ( X ) k 从而,( X X )kk 不可逆。 ②我们定义的多重共线性仅对解释变量之间的线性 关系而言,它们之间的非线性关系,严格来说,并 不违反无多重共线性假定。例如:
x
2 2i
2 2
1 2 2 ( x x ) 2i 3i ] 2 ( x3 )[ 1 i 2 2 ( x 2 i )( x 3 i ) 1 2 2 2 ( x3 )( 1 r i 23 )
20
方差膨胀因子VIF
参数OLS估计量的方差随多重共线性的增强而不断膨 胀起来,扩大的倍数即为方差膨胀因子,也称为方差 扩大因子,记为VIF(variance inflation factor)。 1 VIF 2 1 r23
ˆ ( X X )1 X Y 进而, 1 2 ˆ Var Cov( ) ( X X )
,仍然存在。
16
不完全多重共线性的后果1: 参数OLS估计量的方差增大
二元线性回归模型离差形式
ˆ x ˆ x ˆi y 2 2i 3 3i
假设: x2 i x3i vi 其中,v i 为随机变量,与 x 3 i 无关,即: x3 i v i 0
22
案例1
研究消费与收入和财富之间的关系,建立如下二 元线性回归模型: Yi 1 2 X 2i 3 X 3i ui

计量经济学多重共线性

计量经济学多重共线性

四、克服多重共线性的方法
如果模型被检验证明存在多重共线性,则需要 发展新的方法估计模型,最常用的方法有三类。 1、第一类方法:排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除出 去。
以逐步回归法得到最广泛的应用。

注意:
这时,剩余解释变量参数的经济含义和数值都 发生了变化。
2、第二类方法:差分法
——如果解释变量Xi与其他变量相关,那 么就会减小T统计值。为什么?
图示
存在多重共线性时 参数估计值的方差与标准差变大
容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断
思考:从这个“仪器”(统计量)来看, 我们通过作哪些工作,可以减少线性相 关带来的影响?
我们可以做如下工作: ——想办法使模型更精确。即使得被 解释变量更多的很解释,或说使σ 2的 估计值更小(为何?)。
0 1 0.5 2 例表 0.8 0.9 5 10 方差膨胀因子表 0.95 0.96 0.97 20 25 33 0.98 50 0.99 100 0.999 1000
相关系数平方 方差膨胀因子
此表有何特点?随相关系数 平方增大,方差膨胀因子如 何变化?
四、多重共线性的检验
多重共线性表现为解释变量之间具有相关关系,
截面数据样本:问题不那么严重,但多重共线 性仍然是存在的。
二.多重共线性的后果 1.数据的微小变化可能导致参数估计值的大幅 波动 2.尽管系数具有联合显著性,而且回归的R2相 当高,但系数显著性水平会很低 3.系数有何能出现“错误”的符号或不合理的 大小 4.不会影响参数估计的无偏与一致性,但会影 响有效性。
六、案例——中国粮食生产函数
根据理论和经验分析,影响粮食生产(Y)的 主要因素有: 农业化肥施用量(X1);粮食播种面积(X2) 成灾面积(X3); 农业机械总动力(X4); 农业劳动力(X5) 已知中国粮食生产的相关数据,建立中国粮食 生产函数: Y=0+1 X1 +2 X2 +3 X3 +4 X4 +4 X5 +

第四章多重共线性

第四章多重共线性

Std. Error t-Statistic
0.129778
-11.82861
0.245466
3.661558
1.206242 -1.265989
0.033759
4.477646
0.105329
0.963783
0.018460
-1.995382
3191.096 -3.695704
Mean dependent var
30
3. 有些解释变量的回归系数所带正负号与定性分 析结果违背时,很可能存在多重共线性。
4.简单相关系数法:解释变量的相关矩阵中,自变 量之间的相关系数较大时,可能会存在多重共线 性问题。判断规则:一般而言,如果每两个解释 变量的简单相关系数比较高,例如大于0.8,则 可认为存在着较严重的多重共线性。
22
仍以二元线性模型 y=1x1+2x2+ 为例:
var(ˆ1)
2
(X
X
) 1 11
2 x22i
2 / x12i
x12i x22i ( x1i x2i )2 1 ( x1i x2i )2
x12i
x22i
2
x12i
1
1 r
2
(
x1i x2i ) 2 x12i x22i
恰为X1与X2的线性相关系数的平方r2
31
注意:
较高的简单相关系数只是多重共线性存在的充分 条件,而不是必要条件。特别是在多于两个解释 变量的回归模型中,有时较低的简单相关系数也 可能存在多重共线性。因此并不能简单地依据相 关系数进行多重共线性的准确判断。
16
(3)样本数据自身的原因。 由于完全符合理论模型所要求的样本数据较 难收集,特定样本可能存在某种程度的多重共线 性。 一般经验: 时间序列数据样本:简单线性模型,往往 存在多重共线性。 截面数据样本:问题不那么严重,但多重 共线性仍然是存在的。

计量经济学_庞皓_第二版_第四章_多重共线性(公式详细)

计量经济学_庞皓_第二版_第四章_多重共线性(公式详细)

第四章 多重共线性
本章讨论四个问题:
●什么是多重共线性 ●多重共线性产生的后果 ●多重共线性的检验 ●多重共线性的补救措施
第一节 什么是多重共线性
本节基本内容:
●多重共线性的含义 ●产生多重共线性的背景
一、多重共线性的含义
在计量经济学中所谓的多重共线性(Multi-Collinearity),
总人口 最终消费 受灾面积
截距
-1.907548
0.045947 6.458374 0.096022 0.003108 -0.027627 -5432.507
0.342045 0.042746 0.765767 0.091660 0.042807 0.048904 8607.753
-5.576888 1.074892 8.433867 1.047591 0.072609 -0.564916 -0.631118
x32 )(
x32
x32 ) (
x3 x3 )2 2
x32 0
^
Var( )
3 ( 2
2 x32 x32 )( x32 ) (
2 2 x32
x3 x3 )2
0
这表明,在解释变量之间存在完全共线性时,参数估计量的方差将变成 无限大。
x
2 3i
)
yi x3i )( x3i x3i ) 2 ( x3i x3i )2

0 0
^ ( 3
yi x3i )( 2 x23i ) ( yi x3i )( x3i x3i ) 0
( 2
x
2 3i
)(
x
2 3i
)

计量经济学课件第四章 多重共线性

计量经济学课件第四章 多重共线性

计量经济学课件第四章多重共线性第四章多重共线性1 / 45计量经济学课件第四章 多重共线性 2 / 45引子:发展农业会减少财政收入吗?为了分析各主要因素对财政收入的影响,建立财政收入模型:= β 0 + β1 i + β 2 + β 3 i + β 4 + β 5 i + β 6 i +其中: 财政收入(亿元) ;农业增加值(亿元)工业增加值(亿元); 建筑业增加值(亿元); 总人口(万人); 最终消费(亿元)受灾面积(万公顷)数据样本时期1978年-2007年(资料来源:《中国统计年鉴 2008》,中国统计出版社2008年版)采用普通最小二乘法得到以下估计结果计量经济学课件第四章 多重共线性3 / 45财政收入模型的估计结果农业增加值 工业增加值建 筑业增加值 总人口 最终消费 受灾面积 截距-1.907548.0.342045 0.042746 0.765767 0.091660 0.042807 0.048904 8607.753-5.576888 1.074892 8.433867 1.047591 0.072609 -0.564916 -0.631118.0.0000 0.2936 0.0000 0.3057 0.9427 0.5776 0.53420.0459476.458374 0.096022 0.003108 -0.027627 -5432.507.0.989654 0.986955 1437.448 47523916 -256.7013 1.654140 10049.04 . 12585.51 17.58009 17.90704 366.6801 ()0.000000计量经济学课件第四章 多重共线性4 / 45模型估计与检验结果分析●可决系数为0.9897 ,校正的可决系数为0.9870,模 型拟合很好。

模型对财政收入的解释程度高达98.9%。

●F 统计量为366.68,说明0.05水平下回归方程整体 上显著。

第四章 多重共线性 《计量经济学》PPT课件

第四章    多重共线性  《计量经济学》PPT课件

SE
(
ˆ
j
)
ˆ
x
2 ji
VIFj
参数估计区间的增大,也会造成预测区间增大,使 得预测不稳定。
3.参数估计量的方差和估计区间增大,使检验容 易出现错误判断。
在不完全多重共线性情况下,参数估计区间增大, 会使得假设检验中参数估计值落入接受区域的概 率增大,也就是说,本来应该拒绝原假设反而不 拒绝。
在对模型参数的 t-检验中,由于参数估计量的标准
| XX | 0
• (XX)1对角线上的元素为无限大,从而 ˆ j 的方差
和标准差也为无限大
• 二元线性回归模型
X 3i X 2i
Var(ˆ3 )
x22i
x22i x32i (
x2i x3i )2
2
x22i
x22i
2 x22i (
x2i x2i )2
2
x22i 0
2
Var(ˆ2 )
差增大而使得值变小,结果造成本应该拒绝原假
设反而不拒绝,即t -检验不能通过。
可决系数 R2会很高,F-检验也显著,但是,对参数
的 t-检验可能不显著,甚至出现偏回归系数的符
号与实际经济现象恰好相反,从而得出错误结论。
§4.3 多重共线性的检验
1.相关系数检验法
两个解释变量的简单相关系数大于0.8的情况下,便认为 存在较严重的多重共线性。当解释变量的个数大于2的时 候,不仅要计算俩俩解释变量的简单相关系数,还要检测 偏相关系数。
x22i
x32i x32i (
x2i x3i )2
2
x22i
2 x22i 2 x22i (
x2i x2i )2
2
2
0

计量经济学课件:第四章多重共线性

计量经济学课件:第四章多重共线性

第四章 多重共线性第一节 违背基本假定的一般描述一、基本假定的回顾1、零均值假定。

2、同方差假定。

3、无自相关假定。

4、解释变量与随机误差项不相关。

5、无多重共线性假定。

6、正态性假定。

除此之外,还有一些需要注意的地方,回归模型关于参数线性;在重复抽样中X 值是固定的(或X 是非随机的);X 的值要有变异;模型设定是正确的。

二、假定1和假定6违背的讨论1、违背假定1的情况。

(1)正确理解零均值假定是掌握所有假定的关键(参见Wooldridge ,计量经济学导轮现代观点,pp.23-25)。

(2)假定1不满足的数学描述。

设一元线性回归模型为121212'1212,1,2,,()0,i i i i i i i i i iY X u i nE u k E Y X E u X k k X X ββββββββββ=++==≠=++=++=++=+如果有则有()()()由上式表明,这时在0≠)(i u E 下,改变的只是截距项,而对模型的线性结构并不影响。

(3)对假定1被破坏的解释。

通常在这种情况下,我们认为是变量所取的数据可能出现了异常表现,即有异常值。

因为按照零均值的意义,要求各个散点是均匀地分布在回归线的周围。

修正的方法将在后面虚拟变量部分介绍。

例如,我们分析江苏省社会商品消费品零售总额与江苏省城乡居民可支配收入之间的关系,发现在1991年该省的社会消费品零售总额存在异常值,表现为样本回归模型的残差在1991年有估计值与实际值存在明显的差异。

见下图和下表Dependent Variable: JSSHEHSPMethod: Least SquaresDate: 10/16/04 Time: 09:38Sample: 1980 1998Included observations: 19Variable Coefficient Std. Error t-Statistic Prob.C -70.48491 25.87473 -2.724083 0.0144JSCZNC 0.243263 0.005811 41.85896 0.0000R-squared 0.990391 Mean dependent var 751.2384Adjusted R-squared 0.989826 S.D. dependent var 728.4301S.E. of regression 73.47491 Akaike info criterion 11.53107Sum squared resid 91775.55 Schwarz criterion 11.63048Log likelihood -107.5451 F-statistic 1752.172Durbin-Watson stat 1.905133 Prob(F-statistic) 0.000000另一方面,有时通过变量的时序数据的样本折线图也可直接观察到样本是否存在异常表现。

计量经济学庞皓第二版第四章习题答案(2020年10月整理).pdf

计量经济学庞皓第二版第四章习题答案(2020年10月整理).pdf

即有:
1
+
1
=Y
+
1
因此,
1
=Y
− (1+ 1)
从而可以说明,
1

1

1
的一个线性组合。
( ) ( ) (3) 存在 var ˆ2 = var(ˆ2 )且 var ˆ3 = var(ˆ3 )。
( ) var ˆ2 =
( ) 因为
2
x
2 2i
1−
r223
当 r23 = 0 时,
同理,有
( ) ( ) var ˆ2 =
( )( ) ˆ2 = ( )( ) 有
yi x2i x22i
x32i = x32i
yi x2i x22i
= ˆ 2
同理可知 ˆ2 = ˆ3 。
(2)
1 = Y − 2 X 2i − 3 X 3i
1 = Y − 2 X 2i
1 = Y − 3 X 3i
由(1)中结论,我们可得出以下公式:
1+ 1 = 2Y − 2 X 2i − 3 X 3i = 2Y − 2 X 2i − 3 X 3i
计值过大,该值为工资收入对消费边际效应,因为它为 1.059,意味着工资收入每增加一美 元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。
另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的
t 检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相
0.1168 0.8057 0.4140 0.8547
4
X3-X3(-1) X2-X2(-1) X1-X1(-1)
C
0.116616 -10.92141 11.01442 2470.655

计量经济学(庞皓)第二版课后思考题答案

计量经济学(庞皓)第二版课后思考题答案

计量经济学(庞皓)第二版课后思考题答案第一章绪论思考题1.1怎样理解产生于西方国家的计量经济学能够在中国的经济理论研究和现代化建设中发挥重要作用?答:计量经济学的产生源于对经济问题的定量研究,这是社会经济发展到一定阶段的客观需要。

计量经济学的发展是与现代科学技术成就结合在一起的,它反映了社会化大生产对各种经济因素和经济活动进行数量分析的客观要求。

经济学从定性研究向定量分析的发展,是经济学逐步向更加精密、更加科学发展的表现。

我们只要坚持以科学的经济理论为指导,紧密结合中国经济的实际,就能够使计量经济学的理论与方法在中国的经济理论研究和现代化建设中发挥重要作用。

答:计量经济学不仅要寻求经济计量分析的方法,而且要对实际经济问题加以研究,分为理论计量经济学和应用计量经济学两个方面。

理论计量经济学是以计量经济学理论与方法技术为研究内容,目的在于为应用计量经济学提供方法论。

所谓计量经济学理论与方法技术的研究,实质上是指研究如何运用、改造和发展数理统计方法,使之成为适合测定随机经济关系的特殊方法。

应用计量经济学是在一定的经济理论的指导下,以反映经济事实的统计数据为依据,用计量经济方法技术研究计量经济模型的实用化或探索实证经济规律、分析经济现象和预测经济行为以及对经济政策作定量评价。

1.3怎样理解计量经济学与理论经济学、经济统计学的关系?1.4在计量经济模型中被解释变量和解释变量的作用有什么不同?答:在计量经济模型中,解释变量是变动的原因,被解释变量是变动的结果。

被解释变量是模型要分析研究的对象。

解释变量是说明被解释变量变动主要原因的变量。

1.5一个完整的计量经济模型应包括哪些基本要素?你能举一个例子吗?答:一个完整的计量经济模型应包括三个基本要素:经济变量、参数和随机误差项。

例如研究消费函数的计量经济模型:Yαβ某u其中,Y为居民消费支出,某为居民家庭收入,二者是经济变量;α和β为参数;u是随机误差项。

1.6假如你是中央银行货币政策的研究者,需要你对增加货币供应量促进经济增长提出建议,你将考虑哪些因素?你认为可以怎样运用计量经济学的研究方法?答:货币政策工具或者说影响货币供应量的因素有再贴现率、公开市场业务操作以及法定准备金率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、完全多重共线性产生的后果
1 参数的估计值不确定
当解释变量完全线性相关时X矩阵的秩小于k,此时 全共线性的影响。 原式: Yi 1 2 X 2 3 X 3 ui ,采用其离差形式 y 2 x2i 3 x3i
^ ^ ^
X, X 0
OLS 估计式不确定。这里以两个解释变量的回归模型为例,说明完
一、完全多重共线性产生的后果
2 参数估计量的方差无限大
仍以两个变量的多元回归为例,由OLS方法得出偏回归系数的方差如下 式: 2 ^ x3 2 Var ( ) 2 2 2 ( x2 )( x3 ) ( x2 x3 ) 2
x Var ( ) ( x )( x ) ( x x )
或者说,当
X 31 X 32 X 3n
X k1 Xk2 X kn
Rank ( X ) k 时,表明在数据矩阵 X中,至少有
一个列向量可以用其余的列向量线性表示,则说明存在完全的多 重共线性。
不完全的多重共线性
实际中,常见的情形是解释变量之间存在不完 全的多重共线性。 常见的是解释变量之间存在 不完全的多重共线性。即
1.参数估计值的方差增大
仍以只有两个解释变量的回归模型为例,X2与X3不完全的共线性关 系表示为:
X 2i X 3i vi
其中, 0并且vi是具有性质 x3i vi 0的随机误差项。
这种情况下,可以用OLS法估计回归系数2和3 , 将2和3的上述关系式 带到对3的估计式中得:
对于解释变量 1, X 2 , X 3 , X k ,存在不全为0的数 1 , 2 ,k ,使得
1 2 X 2i 3 X 3i ... k X ki ui 0
i 1, 2,..., n
其中, u i 为随机变量。这表明解释变量 1, X 2 , X 3 , X k 只是一种近似的线性关系。
2. rxi x j 1 ,解释变量间完全共线性。此时模型参
数将无法确定。
系。实际中常遇到的情形。
1 ,解释变量间存在一定程度的线性关 3. 0<rxi x j <
二、产生多重共线性的背景
多重共线性产生的经济背景主要有几种情形:
1.经济变量之间具有共同变化趋势。
例如,对于时间序列数据,收入、消费、就业率等,在经济 上升时期均呈现出增长趋势,当经济下滑时,又都呈现出下
模型估计与检验结果分析
●可决系数为0.9897 ,校正的可决系数为0.9870,模 型拟合很好。模型对财政收入的解释程度高达98.9%。
●F统计量为366.68,说明0.05水平下回归方程整体 上显著。
● t 检验结果表明,除了农业增加值、建筑业增加 值以外,其他因素对财政收入的影响均不显著。 ●农业增加值的回归系数是负数。 农业的发展反而会使财政收入减少吗?! 这样的异常结果显然与理论分析和实践经验不相符。 若模型设定和数据真实性没问题,问题出在哪里呢?
在X 2与X 3为不完全共线性时,X 2与X 3的相关系数的平方用离差形式可以表示 为:
2 r23 2 2 x x 2 3
( x2 x3 ) 2
将上式带入到2和3方差估计式中可以得到两个偏回归系数方差估计的 相关系数表达式如下:
Var ( 2 )
2
^
2 2 ( x2 )( x3 ) ( x2 x3 )
2 23
2 3i
2 3i
VIF 表明,参数估计量的方差是由于多重共线性的出现而膨胀起来的。随着
2 共线性的增加r23 趋于1,那么方差的估计量将趋于无穷大。
2.对参数区间估计时,置信区间变大
存在多重共线性时,参数估计值的方差增大,其标准误差也增大,导致 总体参数的置信区间也随之增大。假设方差已知,正态分布下95%置信度下 临界值为1.96,当r23 =0.99时,3的置信区间约比相关系数为零时大10倍。
Mean dependent var 10049.04 S.D. dependent var 12585.51 Akaike info criterion 17.58009 Schwarz criterion 17.90704 F-statistic 366.6801 Prob(F-statistic) 0.000000
此外如果定义VIF=
1 ,(Variance inflation factor)那么上述两式 2 (1-r23 )
^
可以写成更为简单的表达式: Var ( 2 ) Var ( 3 )
^
x x
2
(1 r )
2 23
2 2i
= =
x x
2
2
2 2i
VIF VIF
2
(1 r )
第四章 多重共线性
本章讨论四个问题:
●什么是多重共线性
●多重共线性产生的后果
●多重共线性的检验 ●多重共线性的补救措施
第一节 什么是多重共线性
本节基本内容:
●多重共线性的含义 ●产生多重共线性的背景
一、多重共线性的含义
在计量经济学中所谓的多重共线性(Multi-Collinearity), 不仅包括完全的多重共线性,还包括不完全的多重共线性。 在有截距项的模型中,截距项可以视为其对应的解释变量总 是为1。对于解释变量 1, X 2 , X 3 ,, X k ,如果存在不全为0的 数λ 1 , λ 2 ,...λ k ,使得
^ 2 2 3 2 2 2 3 2 3
2
2
在完全共线性情况下 X 2i X 3带入上式得: i
Var ( Var (

^
^
2
) )
( 2 (
2
3
x x )( x ) ( x x ) x x )( x ) ( x x )
2 3 2 3 2 3 3 3 2 2 3 2 3 2 3 3 3
假定 X 2i X 3i ,这里 是非零常数,将其分别带入上式可得:
2 3
^
^
( yi x3i )( x 23i ) ( yi x3i )( x3i x3i ) ( 2 x 23i )( x 23i ) 2 ( x3i x3i ) 2

0 0 0 0
采用普通最小二乘法得到以下估计结果
财政收入模型的EViews估计结果
Variable
农业增加值 工业增加值建 筑业增加值 总人口 最终消费 受灾面积 截距
Coefficient
-1.907548
Std. Error
0.342045 0.042746 0.765767 0.091660 0.042807 0.048904 8607.753
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
0.989654 0.986955 1437.448 47523916 -256.7013 1.654140
( yi x3i )( 2 x 23i ) ( yi x3i )( x3i x3i ) ( 2 x 23i )( x 23i ) 2 ( x3i x3i ) 2
很明显上式是未定式,无法用OLS方法进行估计。 从回归模型的建模思想看,完全的多重共线性使得解释 变量前面的偏回归系数的失去了原有的经济学含义,无法区 两个解释变量对被解释变量的各自的影响。
降趋势。此时变量之间的相关性就比较强。
2.模型中包含滞后变量。
当建模过程中引入滞后变量,由于变量的时间序列之间往往
呈现出较强的线性关系,所以也会导致多重共线性比较严重。
3.利用截面数据建立模型也可能出现多重共线性。
利用截面数据建模,不同截面的变量变化与发展规模 有关,会出现共同增长的趋势,例如,资本、劳动力, 科技、能源投入等要素的投入都呈现出规模经济的特 征。
4.样本数据自身的原因。
抽样仅仅局限于总体中解释变量取值的一个有限范围, 使得变量变异不够大;或由于总体受限,多个解释变 量的样本数据之间存在,这是都会引起多重共线性 (事实这种情况几乎不可避免)。
第二节 多重共线性产生的后果
本节基本内容: ●完全多重共线性产生的后果 ●不完全多重共线性产生的后果
2 x 3
2 2
1 2 ( x x ) 2 3 2 x2 1 x 2 x 2 2 3
x
^
2
2 (1 r23 )
2 2i
Var ( 3 )
x
2
2 (1 r23 )
2 3i
从上式中可以更清楚的看出,随着共线性增加,r23趋于1,两个参数估计量的方差 也将增大。
计量经济学
第四章 多重共线性
引子: 发展农业会减少财政收入吗?
为了分析各主要因素对财政收入的影响,建立财政收 入模型: CSi 0 1 NZ i 2GZi 3 JZZi
4TPOP i 5CUM i 6 SZMi ui
其中: CS财政收入(亿元) ; NZ农业增加值(亿元); GZ工业增加值(亿元); JZZ建筑业增加值(亿元); TPOP总人口(万人); CUM最终消费(亿元); SZM受灾面积(万公顷) 数据样本时期1978年-2007年(资料来源:《中国统计年鉴 2008》,中国统计出版社2008年版)
2

2
x
0
2 3

2
2
2 2 x3
0
这表明,在解释变量之间存在完全共线性时,参数估计量的方差将变成 无限大。
二、不完全多重共线性产生的后果
完全多重共线性只不过是一种极端情形。通常,解释变量之间会存在
相关文档
最新文档