多重共线性-异方差-内生性-自相关总结对照表
计量经济学知识点汇总
计量经济学知识点汇总1. 变量类型
- 连续变量和离散变量
- 定量变量和定性变量
- 内生变量和外生变量
2. 数据类型
- 横截面数据
- 时间序列数据
- 面板数据
3. 回归分析
- 简单线性回归
- 多元线性回归
- 非线性回归模型
4. 估计方法
- 普通最小二乘法(OLS)
- 加权最小二乘法(WLS)
- 极大似然估计法(MLE)
5. 假设检验
- t检验
- F检验
- 拉格朗日乘数检验
6. 模型诊断
- 异方差性
- 自相关
- 多重共线性
7. 面板数据模型
- 固定效应模型
- 随机效应模型
- hausman检验
8. 时间序列分析
- 平稳性和单位根检验
- 自回归模型(AR)
- 移动平均模型(MA)
- 自回归移动平均模型(ARMA)
9. 计量经济学软件
- Stata
- EViews
- R
10. 应用领域
- 宏观经济分析
- 微观经济分析
- 金融经济分析
- 政策评估
以上是计量经济学的一些主要知识点,涵盖了变量类型、数据类型、回归分析、估计方法、假设检验、模型诊断、面板数据模型、时间序列分析等内容,以及常用的计量经济学软件和应用领域。
计量经济学重点整理
一、含义:多重共线性:对于解释变量 ,如果存在不全为0的数 ,使得 则称解释变量 之间存在着完全的多重共线性。
或者 异方差性:如果对于模型中随机误差项Ui 有: 则称Ui 具有异方差性。
自相关:是指总体回归模型的随机误差项之间存在相关关系。
即不同观测点上的误差项彼此相关。
可以表示为:造成的后果:不完全的多重共线性:(1)OLS 估计量仍保持BLUE 的性质(2)假设检验容易作出错误的判断(3)可能造成可决系数较高,但对各个参数单独的 t 检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。
异方差性和自相关:(1)OLS 估计量仍然是线性无偏的,但不再是有效的,即方差不再是最小的。
(2) T 检验和F 检验失效。
检验方法:多重共线性:(1)简单相关系数检验法(如果每两个解释变量的简单相关系数比较高,如果大于0.8则可以认为存在着严重的多重共线性.但此种方法只是充分条件而不是必要条件,也需要同时检查偏相关系数) (2)方差扩大(膨胀)因子法(3)直观判断法(当增加一个或者剔除一个解释变量改变一个观测值时,回归参数的估计值发生较大变化;从定性分析一些重要的解释变量的回归系数的标准误差较大,在回归方程没有通过显著性检验;有些解释变量回归系数所带正负号与定性结果违背时;相关矩阵种自变量之间的相关系数较大时都可能存在多重共线性一些重要的解释变量在回归方程中没有通过显著性检验,同时R2很高(或F 检验显著),即t 检验和F 检验的结果相矛盾,或解释变量的回归系数所带正负号与定性分析结果违背时,模型可能存在严重的多重共线性。
(4)逐步回归法。
异方差性:(1)图示检验法(2)Goldfeld-Quanadt 检验作用:检验递增性(或递减性)异方差。
(3)White 检验检验步骤1)提出假设2)构造辅助回归方程 3)构造统计量并计算统计量的值,构造并计算统计量nR ²。
R ²为辅助回归的可决系数,n 为样本容量。
第七章 多重共线.
Yi b0 b1X1i b2 X 2i i
(7.1)
存在不为零的常数1、2,使得下列关系式成立
1 X1i +2 X 2i 0
(7.2)
则说X
1、X
存在完全的线性关系。
2
如果解释变量之间存在着完全的线性关系, 那么其间的线性系数就等于1,这在实际上是 少见的,大部分情况是解释变量之间接近线性 关系。对于上面,模型(7.1),存在不为零 的常数λ 1、λ 2,使X1、X2满足
年份
1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
粮食产量
Y
(万吨) 38728 40731 37911 39151 40208 39408 40755 44624 43529 44264 45649 44510 46662 50454 49417 51230 50839 46218
例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。
第二节 多重共线性引起的后果
一、完全多重共线
Y Xb μ
的OLS估计量为:
bˆ X X -1 X Y
如果存在完全共线性,则(X’X)-1不存在,无法得 到参数的估计量。
例:对离差形式的二元回归模型
y b1x1 b2 x2
量中的一个或多个相关程度高,因此就使得回归模型式
Y f X1, X2, , Xk;
的解释变量出现高度多重共线。
二、利用不包含某一解释变量Xj 的样本决定系数检验
Y f X1, X2, , Xk
的样本决定系数为R2我们利用每次去掉一个解释变量作回归,构造如下k个回
计量经济学:多重共线性
计量经济学:多重共线性12第四、五、六章将讨论的主题。
农业和建筑业的发展会减少财政收入吗?国家财政收入主要来自各项税收收入,经济增长是其重要的影响因素。
为了分析各主要因素对国家财政收入的影响,建立财政收入(亿元) (CS)为被解释变量,农业增加值(亿元)(NZ)、工业增加值(亿元)(GZ)、建筑业增加值(亿元)(JZZ)、总人口(万人)(TPOP)、最终消费(亿元)(CUM)、受灾面积(万公顷)(SZM)等为解释变量的计量模型。
数据样本时期为1978年-2003年共26个年份的统计数据(资料来源:《中国统计年鉴2004》,中国统计出版社2004年版)设定的理论模型为:i i i i i i i i u SZM CUM TPOP JZZ GZ NZ CS +++++++=6543210βββββββ采用普通最小二乘法得到以下估计结果关于财政收入的多元回归结果 Variable Coefficient Std. Error t-Statistic Prob. 农业增加值 -1.535090 0.129778 -11.82861 0.0000 工业增加值 0.898788 0.245466 3.661558 0.0017 建筑业增加值-1.527089 1.206242 -1.2659890.2208 总人口 0.151160 0.033759 4.477646 0.0003 最终消费 0.101514 0.1053290.9637830.3473 受灾面积 -0.036836 0.018460 -1.995382 0.0605 截距项-11793.343191.096 -3.6957040.0015R-squared0.995015 Mean dependent var 5897.824 Adjusted R-squared 0.993441 S.D. dependent var 5945.854 S.E. of regression 481.5380 Akaike infocriterion15.41665Sum squared resid 4405699. Schwarz criterion 15.75537 Log likelihood -193.4165 F-statistic 632.0999 Durbin-Watson stat1.873809 Prob(F-statistic)0.000000 从主要指标分析可见,可决系数为0.995,校正的可决系数为0.993,模型拟合很好。
异方差、序列相关性、多重共线性的比较
(2)对多个解释变量模型,采用综合统计检验法
2判明存在多重共线性的范围
(1)判定系数检验法:构造辅助回归模型(Auxiliary Regression)并计算相应的拟合优度
(2)排除变量法(Stepwise Backward Regression )
(3)逐步回归法(Stepwise forward Regression)
后果
(Consequences)
1.参数估计量非有效(但,是线性的、无偏的)
2.变量的显著性检验失去意义(t检验、F检验)
3.模型的预测失效(对Y的预测误差变大,降低预测精度)
与异方差性引起的后果相同:
1.参数估计量非有效
2.变量的显著性检验失去意义
3.模型的预测失效
1.完全共线性下参数估计量不存在
异方差、序列相关性、多重共线性的比较( )
异方差(Heteroskedasticity)
(截面数据:Cross Sectional Data)
序列相关性(SerialCorrelation)
(时间序列数据:Time Series Data)
多重共线性(Multicollinearity)
(时间序列数据:Time Series Data)
,(X’X)-1不存在
2.近似共线性下OLS估计量非有效(估计方差变大)
(1)参数估计量经济含义不合理(变现似乎反常的现象)
(2)变量的显著性检验失去意义(t变小,R2变大,F变大)
(3)模型的预测功能失效(方差变大使预测“区间”变大)
检验
(Test)
1.图示法(散点图)
2.帕克检验(ParkTest)
3.第三类方法:减小参数估计量的方差
异方差 自相关 多重共线性上机实验报告
异方差检验与修正题目如下:由表中给出1985年我国北方几个省市农业总产值,农用化肥量、农用水利、农业劳动力、每日生产性固定生产原值以及农机动力数据,要求:(1) 试建立我国北方地区农业产出线性模型; (2) 选用适当的方法检验模型中是否存在异方差; (3) 如果存在异方差,采用适当的方法加以修正。
一、模型设定选择农业总产值为被解释变量Y ;选择农业劳动力、灌溉面积、化肥用量、户均固定、农机动力分别为解释变量1X 2X 3X 4X 5X 。
数据如下:地区 农业总产值 农业劳动力 灌溉面积 化肥用量 户均固定农机动力(亿元) (万人) (万公顷) (万吨) 资产(元) (万马力) 北京 19.64 90.1 33.84 7.5 394.3 435.3 天津 14.4 95.2 34.95 3.9 567.5 450.7 河北 149.9 1639 .0 357.26 92.4 706.89 2712.6 山西 55.07 562.6 107.9 31.4 856.37 1118.5 内蒙古 60.85 462.9 96.49 15.4 1282.81 641.7 辽宁 87.48 588.9 72.4 61.6 844.74 1129.6 吉林 73.81 399.7 69.63 36.9 2576.81 647.6 黑龙江 104.51 425.3 67.95 25.8 1237.16 1305.8 山东 276.55 2365.6 456.55 152.3 5812.02 3127.9 河南 200.02 2557.5 318.99 127.9 754.78 2134.5 陕西 68.18 884.2 117.9 36.1 607.41 764 新疆49.12256.1260.4615.11143.67523.3二、描述性统计view-discriptive stats-common sample 的结果:individual sample的结果:三、散点图为四、参数估计设定线性回归模型:Y=C+1β1X +2β2X +3β3X +4β4X +5β5X +μ利用EViews 统计软件估计模型的参数,其输出结果如表1: 根据表1中的数据,模型估计的结果为:Y= 155.96 + 8.79X1 + 12X2 - 0.64X3 + 1.81X4 - 0.19X5 (0.811) (0.756) (11.626) (-1.001) (1.168) (-1.305) R 2=0.9156 2R =0.845 D.W.=0.950 F=13.002表 1五、检验1.拟合优度检验无论是可决系数还是调整后的可决系数均较大,表明该模型拟合地很好。
第五讲-多重共线性、异方差、自相关
根据理论和经验分析,影响粮食生产(Y)的 主要因素有:
农业化肥施用量(X1);粮食播种面积(X2)
成灾面积(X3);
农业机械总动力(X4);
农业劳动力(X5)
已知中国粮食生产的相关数据,建立中国粮食 生产函数:
Y=0+1 X1 +2 X2 +3 X3 +4 X4 +5 X5 +
调用数据库E:\博士计量课程软件应用\multi
y (1 2 )x1
这时,只能确定综合参数1+2的估计值:
一个方程确定两个未知数,有无穷多个解。
2、近似共线性下OLS估计量非有效
近似共线性下,可以得到OLS参数估计量, 但参数估计量方差的表达式为 Cov(βˆ ) 2 (XX)1
由于(X X )1 0 ,引起主对角线元素 (X X )1较大, 使参数估计值的方差增大,OLS参数估计量非有 效。
X2 0.01
1.00 -0.45 -0.04 0.18
X3 0.64 -0.45 1.00 0.69 0.36
X4 0.96 -0.04 0.69 1.00 0.45
X5 0.55
0.18 0.36 0.45 1.00
❖ 发现: X1与X4间存在高度相关性。
3、找出最简单的回归形式
分别作Y与X1, X3 ,X2,X4,X5间的回归:
C
X1 X2 X3
X4
X5 R 2
DW
Y=f(X1)
30868 4.23
0.8852 1.56
t值
25.58 11.49
Y=f(X1,X2)
-43871 4.65 0.67
0.9558 2.01
t值
计量经济学多重共线性
四、克服多重共线性的方法
如果模型被检验证明存在多重共线性,则需要 发展新的方法估计模型,最常用的方法有三类。 1、第一类方法:排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除出 去。
以逐步回归法得到最广泛的应用。
•
注意:
这时,剩余解释变量参数的经济含义和数值都 发生了变化。
2、第二类方法:差分法
——如果解释变量Xi与其他变量相关,那 么就会减小T统计值。为什么?
图示
存在多重共线性时 参数估计值的方差与标准差变大
容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断
思考:从这个“仪器”(统计量)来看, 我们通过作哪些工作,可以减少线性相 关带来的影响?
我们可以做如下工作: ——想办法使模型更精确。即使得被 解释变量更多的很解释,或说使σ 2的 估计值更小(为何?)。
0 1 0.5 2 例表 0.8 0.9 5 10 方差膨胀因子表 0.95 0.96 0.97 20 25 33 0.98 50 0.99 100 0.999 1000
相关系数平方 方差膨胀因子
此表有何特点?随相关系数 平方增大,方差膨胀因子如 何变化?
四、多重共线性的检验
多重共线性表现为解释变量之间具有相关关系,
截面数据样本:问题不那么严重,但多重共线 性仍然是存在的。
二.多重共线性的后果 1.数据的微小变化可能导致参数估计值的大幅 波动 2.尽管系数具有联合显著性,而且回归的R2相 当高,但系数显著性水平会很低 3.系数有何能出现“错误”的符号或不合理的 大小 4.不会影响参数估计的无偏与一致性,但会影 响有效性。
六、案例——中国粮食生产函数
根据理论和经验分析,影响粮食生产(Y)的 主要因素有: 农业化肥施用量(X1);粮食播种面积(X2) 成灾面积(X3); 农业机械总动力(X4); 农业劳动力(X5) 已知中国粮食生产的相关数据,建立中国粮食 生产函数: Y=0+1 X1 +2 X2 +3 X3 +4 X4 +4 X5 +
如何应付异方差、自相关、多重共线性
异方差:(Heteroscedasticity)一如何检测?①假设我们做一个回归,求出β1、β2、β3,然后返回求出序列{Ut},现在要检测{Ut}是不是异方差的。
②设立辅助方程:既然假设是异方差,那么我们就假设{Ut}与X存在某种关系,这种关系比较复杂,只要我们证明α1、α2、α3……不为0,即可③构建新的统计量:T·R2,先人曾经证明过其服从 卡方(m)分布。
④最后将算出来的T·R2值与卡方分布的临界值比较,……。
二、如何应对?①如果异方差的形式已知,我们可以通过GLS(广义二乘法)来处理:举例说明:②如果异方差的形式未知自相关:(Autocorrelation)一如何检测?我们直接可以看DW值,注意这个ρ值is the残差项之间的estimated correlation coefficient.也可以用另外一种方法:二如何应对?①如果自相关的形式已知•If the form of the autocorrelation is known, we could use a GLS procedureBut such procedures that “correct” for autocorrelation require assumptions about the form of the autocorrelation.②未知:构建动态模型,如:三多重共线性:(Multicollinearity)①如何检测:look at the matrix of correlations between the individual variables.另外:R2 will be high but the individual coefficients will have high standard errors也可能存在多重共线性。
②如何解决:。
【推荐】stata基本操作汇总——异方差、自相关、多重共线性
【推荐】stata基本操作汇总——异方差、自相关、多重共线性前言:计量经济学服务中心为大家罗列汇总出了关于异方差、自相关、多重共线性相关的知识,推荐收藏。
●●●学术利剑Stata :论文中数据分析的一把利剑学术论文分析利剑 Stata的简介异方差Stata检查是否存在异方差的方法:1、看残差图,模型回归之后使用即可rvfplot(残差与拟合值的散点图)rvpplot(残差与解释变量的的散点图)2、White检验其基本命令是在完成基本的OLS 回归之后,输入imtest, white如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异方差性3、BP(Breusch and Pagan,1979)检验关于stata处理异方差问题的命令基本命令是:estat hettest var1 var2 var3其中,var1 var2 var3 分别为你认为导致异方差性的几个自变量。
是你自己设定的一个滞后项数量。
同样,如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异方差性。
estat hettest(默认设置使用拟合值y_hat)estat hettest(使用方程邮编的解释变量,而不是y_hat)estat hettest varlist(指定使用某些解释变量)解决办法方法一:WLSWLS是GLS(一般最小二乘法)的一种,也可以说在异方差情形下的GLS就是WLS。
在WLS下,我们设定扰动项的条件方差是某个解释变量子集的函数。
之所以被称为加权最小二乘法,是因为这个估计最小化的是残差的加权平方和,而上述函数的倒数恰为其权重。
在stata中实现WLS的方法如下:reg (被解释变量)(解释变量1)(解释变量2)…… [aweight=变量名]其中,aweight后面的变量就是权重,是我们设定的函数。
一种经常的设定是假设扰动项的条件方差是所有解释变量的某个线性组合的指数函数。
在stata中也可以方便地实现:首先做标准的OLS回归,并得到残差项;reg (被解释变量)(解释变量1)(解释变量2)……predict r, resid生成新变量logusq,并用它对所有解释变量做回归,得到这个回归的拟合值,再对这个拟合值求指数函数;gen logusq=ln(r^2)reg logusq (解释变量1) (解释变量2)……predict g, xbgen h=exp(g)最后以h作为权重做WLS回归;reg (被解释变量)(解释变量1)(解释变量2)…… [aweight=h]如果我们确切地知道扰动项的协方差矩阵的形式,那么GLS估计是最小方差线性无偏估计,是所有线性估计中最好的。
多重共线性、异方差及自相关的检验和修正
计量经济学实验报告多重共线性、异方差及自相关的检验和修正——以财政收入模型为例经济学 1班一、引言财政收入是一国政府实现政府职能的基本保障,对国民经济的运行及社会的发展起着非凡的作用。
首先,它是一个国家各项收入得以实现的物质保证。
一个国家财政收入规模的大小通常是衡量其经济实力的重要标志。
其次,财政收入是国家对经济实行宏观调控的重要经济杠杆。
财政收入的增长情况关系着一个国家的经济的发展和社会的进步。
因此,研究财政收入的增长显得尤为重要。
二、数据及模型说明研究财政收入的影响因素离不开一些基本的经济变量。
回归变量的选择是建立回归模型的一个极为重要的问题。
如果遗漏了某些重要变量,回归方程的效果肯定不会好;而考虑过多的变量,不仅计算量增大许多,而且得到的回归方程稳定性也很差,直接影响到回归方程的应用。
通过经济理论对财政收入的解释以及对实践的观察,对财政收入影响的因素主要有农业增加值、工业增加值、建筑业增加值、总人口数、最终消费、受灾面积等等。
全部数据均来源于中华人民共和国国家统计局网站/具体数据见附录一。
为分析被解释变量财政收入(Y)和解释变量农业增加值(X1)、工业增加值(X2)、建筑业增加值(X3)、总人口(X4)、最终消费(X5)、受灾面积(X6)的关系。
作如下线性图(图1)。
图1可以看出Y、X1、X2、X3、X5基本都呈逐年增长的趋势,仅增长速率有所变动,而X4和X6在多数年份呈现水平波动,可能这两个自变量和因变量间不一定是线性关系。
可以初步建立回归模型如下:Y=α+β1*X1+β2*X2+β3*X3+β4*X4 +β5*X5+β6*X6 +U i 其中,U i为随机干扰项。
三、模型的检验及验证(一)多重共线性检验及修正利用Eviews5.0,做Y对X1、X2、X3、X4、X5和X6的回归,Eviews的最小二乘估计的回归结果如下表(表1)所示:表1Dependent Variable: YMethod: Least SquaresDate: 11/16/13 Time: 20:54Sample: 1990 2011Included observations: 22Variable Coefficient Std. Error t-Statistic Prob.C 145188.0 26652.27 5.447488 0.0001X1 -0.972478 0.222703 -4.366701 0.0006X2 0.210089 0.068192 3.080851 0.0076X3 -0.100412 0.569465 -0.176327 0.8624X4 -1.268320 0.247725 -5.119870 0.0001X5 0.600205 0.130089 4.613794 0.0003X6 -0.007430 0.044233 -0.167964 0.8689R-squared 0.999306 Mean dependent var 27186.86Adjusted R-squared 0.999029 S.D. dependent var 28848.33S.E. of regression 899.0866 Akaike info criterion 16.69401Sum squared resid 12125351 Schwarz criterion 17.04116Log likelihood -176.6341 F-statistic 3600.848Durbin-Watson stat 1.825260 Prob(F-statistic) 0.000000 由上表的回归结果可见,,该模型可决系数R2=0.9993很高,F检验值3601,明显显著。
计量经济学 第七章 多重共线性
第七章 多重共线性“多重共线性”一词由R. Frisch 1934年提出,它原指模型的解释变量间存在线性关系。
7.1多重共线性及产生的原因 7.1.1.非多重共线性假定111211212221121111k k T T Tk x x xx xx X x x x ---=如果rk (X 'X ) = rk (X ) < k 或`0X X =称解释变量是完全共线性相关。
在实际经济问题中,完全多重共线性和完全无多重共线性两种极端情况都是极少的,大多数情况是解释变量存在不完全的多重共线性,或者近似的多重共线性,可一表示为:1122110k k x x x u λλλ--++++= 7.1.2.多重共线性的经济解释(1)经济变量在时间上有共同变化的趋势。
如在经济上升时期,收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业率等又都下降。
当这些变量同时进入模型后就会带来多重共线性问题。
0.E+001.E+112.E+113.E+114.E+11808284868890929496980002GDPCONS0.E +001.E +112.E +113.E +114.E +110.0E +005.0E +101.0E +111.5E +112.0E +112.5E +11C O N SG D P o f H o n g K o n g(2)解释变量与其滞后变量同作解释变量。
滞后变量与原因变量在经济意义上没有本质区别,只是时间上的差异,原因变量与解释变量有相关关系,滞后变量也会有相关关系。
(见下图) (3)解释变量之间往往存在密切的关联度。
对同一经济现象的解释变量,往往存在密切的相关关系,如生产函数,资本大,需投入的劳动力也应趆多。
0.E+001.E+112.E+113.E+114.E+11GDP0.E+001.E+112.E+113.E+114.E+110.E+001.E+112.E+113.E+114.E+11GDP(-1)GDP7.2.多重共线性的后果(1) 当 `0X X =,X 为降秩矩阵,则 (X 'X ) -1不存在,βˆ= (X 'X )-1 X 'Y 不可计算。
多重共线性
一、多重共线性1.由此可得出模型估计的结果为:Y ˆ=12815.75+6.2125621X +0.421382X -0.166263X -0.097774X -0.0284255X (14078.9)(0.740881)(0.126925)(0.059229)(0.067647)(0.202357) t= (-0.91028)(8.385373)(3.319919)(-2.807065)(-1.445299)(-0.140471) 2R =0.982798 2R =0.975630 F=137.1164 n=182.模型检验:①经济意义检验:根据经验,除成灾面积3X 增加后,粮食产量Y 会减少外,其余变量增加,Y 都应该是增加的,即除3X 符号为负号,其余均为正号。
但结果显示,4X 和5X 的符号与预期相反,这表明很可能存在严重的多重共线性。
②拟合优度:由表中数据可得,2R =0.982798 ,修正的可决系数为2R =0.975630,可决系数很高,说明模型对样本的拟合很好。
③F 检验:针对0H :1β=2β=3β=4β=5β=0,给定显著性水平α=0.05,在F 分布表中查出自由度为k-1=6-1=5和n-k=12的临界值αF (5,12)=3.11。
由表可得F=137.1164>αF (5,12)=3.11,应拒绝原假设0H :1β=2β=3β=4β=5β=0,说明回归方程显著,即1X ,2X ,3X ,4X ,5X 等变量联合起来确实对粮食产量Y 有显著性影响。
④t 检验:分别针对0H :j β=0(j=1,2,3,4,5),给定显著性水平α=0.05,查t 分布表得自由度为n-k=12的临界值=-)(2k n t α 2.179,由表中数据得:∧1β、^2β、∧3β对应的t 统计量的绝对值大于=-)(2k n t α 2.179,这说明在显著性水平α=0.05下,分别应当拒绝0H :j β=0(j=1,2,3),也就是说1X ,2X ,3X 对Y 都有显著性影响。
自相关异方差多重共线性
也就是说,DW值越接近于2,u的自相关 性越小;DW值越接近于零,u正自相关程度 越高;DW值越接近于4,u负自相关程度越 高。
• c.DW统计量的使用
⑴ 当DW<dL时, 拒绝原假设H0:ρ=0;接受备 择假设H1:ρ≠0,u存在一阶正自相关。 ⑵ 当DW>(4- dL)时,拒绝原假设 H0:ρ=0 ;接 受备择假设H1:ρ≠0,u存在一阶负自相关。 ⑶ 当dU<DW<(4-dU)时,接受原假设H0:ρ=0, 不存在自相关。 ⑷ 当dL<DW<dU 或 (4-dU)<DW<(4-dL)时, 则这种检验没有结果,即u是否存在自相关, 不能确定。
t
对于原假设
H0 : 1 2
p 0
(不存在p阶自相关)。BG检验步骤如下: 1. 用OLS估计样本回归方程,求出残差et 。 2. 作辅助回归,并计算回归方程的R2。
et 0 1x1t k xkt 1ut 1 2ut 2 put p vt
得:
ˆ xt 1 , (t 2, xt* xt
,T )
yt* a0 1 xt* vt
ˆ ˆ0 , a 1
应用OLS,求得a0, 1的估计值 到: ˆ0 a ˆ
0
ˆ 1
,进而得
杜宾二步法存在两个问题: 一、所得参数估计值的精度依赖于的估计值的精确 度;
E(v|ut-1)=0, Var(v|ut-1)=σ2, Cov(vt ,vt+s)=0 s≠0
• 检验随机误差项是否具有AR(1)形式的思路:
首先,通过构造样本回归方程,计算出残差et ; 然后,计算自回归系数ρ的OLS估计值 :
(e e )(e ˆ (e e
计量经济学-7章:多重共线性
重庆工商大学经济贸易学院 张文爱
11/21
1、增加样本容量
如果多重共线性是由样本引起,增加样本容量可以减少多 重共线性的程度。以二元回归方程为例,根据第二节的结果,参 数估计值的方差为:
Var(ˆ1)
xi21
2
xi21
xi22 (
xi1
xi
)2
2
2
xi22
(1
r2 12
)
当样本容量增大时, xi21 增大,方差将减小,
,X
k
)
1
R
2 k
②记R 2 Max(R12,R22, ,Rk2)
若R 2
R
2 j
1,则认为X
与其余变量之间
j
存在较严重的线性关系, 模型具有多重共线性;
否则,则没有多重共线性。
2020/5/8
重庆工商大学经济贸易学院 张文爱
10/21
§7-4 多重共线性的修正
i :如果多重共线性对参数的估计值没有严重影响,可以不修正;
ii :如果多重共线性只影响到某些不重要的解释变量对应的参数 估计值,可以在模型中删去这些解释变量;
iii :如果多重共线性对重要的解释变量对应的估计值有严重影响, 就必须消除这种多重共线性的影响,保证模型的正确性和估计的 有效性。
修正的基本思想:
不是改变参数的估计方法,而是修改模型本身。
2020/5/8
第7章 多重共线性
(Multicollinearity)
授课教师 张文爱 重庆工商大学 ·经济贸易学院
2010. 12
§7-1 多重共线性的概念
回顾:多元线性回归模型
Yi 0 1X1i 21X 2i k X ki i
多重共线性
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 Y 4901 5489 6076 7164 8792 10133 11784 14704 16466 18320 21280 25864 34501 47111 59405 68498 C(-1) 2976 3309 3638 4021 4694 5773 6542 7451 9360 10556 11362 13146 15952 20182 27216 34529 C(-1)/Y 0.6072 0.6028 0.5996 0.5613 0.5339 0.5697 0.5552 0.5067 0.5684 0.5762 0.5339 0.5083 0.4624 0.4284 0.4581 0.5041
y ( 1 2 ) x1
只能确定综合参数 1 2 的估计值:
ˆ ˆ 1 2 x1i y i x12i
4.2.2 不完全多重共线性下的 后果
(1)参数估计仍是无偏估计,但不稳定;估计量 及其标准差非常敏感,观测值稍微变化,估计 量就会产生较大的变动。 (2)参数估计式的方差随着共线性程度的增大而 增大。 (3)t检验失效,区间估计失去意义;估计量的 方差很大,相应标准差增大,进行t检验时,接 受零假设的可能性增大 (4)严重多重共线性时,甚至参数估计式的符号 与其经济意义相反。得出完全错误的结论。
2i
2i
2 2i
x y x y x x
1i i 1i 2 1i 2 1i
i
x12i 2 x12i
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、加权最小二乘法 二、怀特异方差-稳健程序。 三、解释变量的代数变换
解释变量内生性 cov(x ji , ui ) 0 解 释 变 量 与随机误差项之间往往存 在某种程度的相关性。与 随机误差项相关的解释变 量称为内生解释变量。 1、遗漏变量 2、测量误差 3、错误的函数形式 4、联立性
1、解释变量的遗漏或省 略 2、模型函数形式设定错 误 3、原始数据的处理变换 4、经济变量的惯性作用 5、误差项本身存在自相 关 1.斜率系数 Bj 依然是线 性的和无偏的。
E(ˆj ) j
2、最小二乘估计量的方 差估计是有偏的。 3. 因 变 量 的 预 测 精 度 降低。
一、图示检验法 二、解释变量严格外生 条件下,误差项一阶自 相关检验。 ut=ut-1+vt 三、古典假定下,误差 项一阶自相关的 DW 检验 四、自变量非严格外生 条件下,误差项一阶自 相关检验。 五、误差项高阶自相关 的布殊-戈弗雷检验 BG 检验
定义 原因 后果 检验
处理
多重共线性 如果存在某解释变量是其他解释变量 的线性组合,则称为存在完全多重共线
性。 0 1x1 k xk 0
它们之间存在高度的线性相关性,称模 型存在近似(不完全)多重共线性。 0 1x1 k xk v 0 1.经济变量之间具有共同变化趋势。 2.变量之间存在经济联系。 3.模型中包含滞后变量。 4、样本数据自身原因。
异方差
var(u
|
xi )
2
i
常数
则称随机误差项 u 具有异方差性
1.模型中省略的解释变量。 2. 测量误差。 3、截面数据中总体各单位的差 异。 4、模型函数形式设定错误。 5、异常观测
近似多重共线性并不违反回归假定。无 1、最小二乘估计量仍然是线性
偏的、有效的、一致的参数估计量仍可 无偏的与一致的,但不再
1、影响无偏性 2、影响一致性 3、其它影响 随机误差项的方差估计量 是有偏的,假设检验、区 间估计容易导出错误的结 论。
一、RESET 检验 二、豪斯曼检验
一、工具变量法 二、两阶段最小二乘法 三、差分回归法
自相关 Xt 与 xt-j 相关。Cov(ut , us)≠0。即 u 在不同观测 点下的取值相关连,则 称随机误差项 u 存在自 相关。
一、图示法
1、散点图法。
二、斯皮尔曼等级(秩)相关检
2、简单相关系数法。
验
3.经验判断法。
三、戈德菲尔德-匡特检验
4.“经典”判断法。
四、帕克检验
5. Klein 判别法。
五、戈里瑟检验
二、辅助回归法 vif
六、怀特检验
三、特征值与病态指数
七、布殊-帕甘检验
四、法勒—格劳伯(Farrar—Glauber)
一、 已知的广义差分
回归。
二、 未知的广义差分
回归。 1、一阶差分法 2、德宾(Durbin)两步法 3、基于 DW 统计量的估 计 4、基于残差的回归估计 5、科克伦-奥克特迭代 法 三、非线性回归方法 四、尼威-威斯特 (Newey-West)方法
以得出,其标准误也仍将被正确估计。 具有最小方差性。
1、估计结果不好解释
2、随机项 ui 的方差的估计量 6u
2、参数估计值的方差增大
有偏。
3、参数估计的置信区间变大
3、参数方差的估计量有偏
4、假设检验容易作出错误的判断
var(Bj)是有偏的、不一致。标
准误差 se 有偏。
4、预测精度降低
一、直观判断法