第八章 多重共线性解释变量相关会有什么后果
计量经济学的各种检验

主分量回归是将具有多重相关的变量集综合得出少数几个互不相关的主分量.两步:(1)找出自变量集的主分量,建立y与互不相关的前几个主分量的回归式.(2)将回归式还原为原自变量结果.详见,<<实用多元统计分析>>,方开泰;
主分量回归结果
Obs _MODEL_ _TYPE_ _DEPVAR_ _PCOMIT_ _RMSE_ Intercept x1 x2 x3 y 1 MODEL1 PARMS y 0.48887 -10.1280 -0.05140 0.58695 0.28685 –1 2 MODEL1 IPCVIF y 1 0.25083 1.00085 0.25038 –1 3 MODEL1 IPC y 1 0.55001 -9.1301 0.07278 0.60922 0.10626 –14 MODEL1 IPCVIF y 2 0.24956 0.00095 0.24971 -15 MODEL1 IPC y 2 1.05206 -7.7458 0.07381 0.08269 0.10735 -1
多重共线性检验方法(3)样本相关系数检验法
FG test results
fg=20.488013401 p=0.0001344625;拒绝零假设,认为存在多重共线性。具体那些变量之间存在多重共线性,除了上面提到的辅助回归的方法外,还有以下提到的条件数检验和方差膨胀因子法。
多重共线性检验方法:(4)特征值分析法所用的检验统计指标
补救措施
增加样本;岭回归或主分量回归;至少去掉一个具有多重共线性的变量;对具有多重共线性的变量进行变换.对所有变量做滞后差分变换(一般是一阶差分),问题是损失观测值,可能有自相关.采用人均形式的变量(例如在生产函数估计中)在缺乏有效信息时,对系数关系进行限制,变为有约束回归(Klein,Goldberger,1955),可以降低样本方差和估计系数的标准差,但不一定是无偏的(除非这种限制是正确的).对具有多重共线性的变量,设法找出其因果关系,并建立模型和原方程构成联立方程组.
多重共线性

多重共线性“多重共线性”一词由R. Frisch 1934年提出,它原指模型的解释变量间存在线性关系。
1.非多重共线性假定 rk (X 'X ) = rk (X ) = k解释变量不是完全线性相关的或接近完全线性相关的。
| r x i x j | ≠1, | r x i x j | 不近似等于1。
就模型中解释变量的关系而言,有三种可能。
(1)r x i x j = 0,解释变量间非线性相关,变量间相互正交。
这时已不需要多重回归,每个参数βj 都可以通过y 对x j 的一元回归来估计。
(2)| r x i x j | = 1,解释变量间完全共线性。
此时模型参数将无法确定。
直观地看,当两变量按同一方式变化时,要区别每个解释变量对被解释变量的影响程度就非常困难。
(3)0 < | r x i x j | < 1,解释变量间存在一定程度的线性相关。
实际中常遇到的是这种情形。
随着共线性程度的加强,对参数估计值的准确性、稳定性带来影响。
因此我们关心的不是有无多重共线性,而是多重共线性的程度。
2.多重共线性的经济解释(1)经济变量在时间上有共同变化的趋势。
如在经济上升时期,收入、消费、就业率等都增长,当经济收缩期,收入、消费、就业率等又都下降。
当这些变量同时进入模型后就会带来多重共线性问题。
0.E+001.E+112.E+113.E+114.E+11808284868890929496980002GDPCONS0.E +001.E +112.E +113.E +114.E +110.0E +005.0E +101.0E +111.5E +112.0E +112.5E +11C O N SG D P o f H o n g K o n g(2)解释变量与其滞后变量同作解释变量。
0.E+001.E+112.E+113.E+114.E+11808284868890929496980002GDP0.E+001.E+112.E+113.E+114.E+110.E+001.E+112.E+113.E+114.E+11GDP(-1)GDP3.多重共线性的后果(1)当 | r x i x j | = 1,X 为降秩矩阵,则 (X 'X ) -1不存在,βˆ= (X 'X )-1 X 'Y 不可计算。
第8章 多重共线性:解释变量相关会有什么后果

Yi A1 A2 X 2 i A3 (300 2 X 2 i ) ui
A1 300 A3 A2 2 A3 X 2 i ui
令
C1 A1 300 A3 C 2 A2 2 A3
ˆ ˆ X ˆ X ˆ 3t X 3.12 31.2 1t 32.1 2t
• 利用以上偏回归系数,3个变量之间的偏相关系数 可定义如下:
ˆ ˆ r12.3 12.3 21.3
ˆ ˆ r13.2 13.2 31.2
ˆ ˆ r23.1 23.1 32.1
案例分析 一、研究的目的要求
提出研究的问题——为了规划中国未来国内旅游产业 的发展,需要定量地分析影响中国国内旅游市场发展 的主要因素。
二、模型设定及其估计
影响因素分析与确定——影响因素主要有国内旅游 人数 X 2,城镇居民人均旅游支出 X 3,农村居民人均
旅游支出 X 4 ,并以公路里程次 X 5 和铁路里程
8.7鸡肉需求函数[方程(8.15)]的共线性诊断 1.相关矩阵
鸡肉需求函数[方程(8.15)]的共线性诊断 2.辅助回归
8.8 如何解决多重共线性:补救措施
• • • • • • 从模型中删掉一个变量 获取额外的数据或新的样本 重新考虑模型 参数的先验信息 变量变换 其他补救措施
(1)从模型中删掉一个变量
留该变量。
若新变量的引入未能改进 R 2 和 F 检验,且对其他回 归参数估计值的t 检验也未带来什么影响,则认为该 变量是多余变量。 若新变量的引入未能改进 R 2 和 F 检验,且显著地影 响了其他回归参数估计值的数值或符号,同时本身的 回归参数也通不过t 检验,说明出现了严重的多重共 线性。
用主成分法解决多重共线性问题

用主成分法解决多重共线性问题一、多重共线性的表现线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系。
看似相互独立的指标本质上是相同的,是可以相互代替的,但是完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。
二、多重共线性的后果1.理论后果多重共线性是因为变量之间的相关程度比较高。
按布兰查德认为, 在计量经济学中, 多重共线性实质上是一个“微数缺测性”问题,就是说多重共线性其实是由样本容量太小所造成,当样本容量越小,多重共线性越严重。
多重共线性的理论主要后果:(1)完全共线性下参数估计量不存在;(2)近似共线性下OLS估计量非有效;(3)模型的预测功能失效;(4)参数估计量经济含义不合理2.现实后果(1)各个解释变量对指标最后结论影响很难精确鉴别;(2)置信区间比原本宽,使得接受假设的概率更大;(3)统计量不显著;(4)拟合优度的平方会很大;(5)OLS估计量及其标准误对数据微小的变化也会很敏感。
三、多重共线性产生的原因1.模型参数的选用不当,在我们建立模型时如果变量之间存在着高度的相关性2. 由于研究的经济变量随时间往往有共同的变化趋势,他们之间存在着共性。
例如当经济繁荣时,反映经济情况的指标有可能按着某种比例关系增长3. 滞后变量。
滞后变量的引入也会产生多重共线行,例如本期的消费水平除受本期的收入影响之外,还有可能受前期的收入影响,建立模型时,本期的收入水平就有可能和前期的收入水平存在着共线性。
四、多重共线性的识别1.方差扩大因子法( VIF)一般认为如果最大的VIF超过10,常常表示存在多重共线性。
2.容差容忍定法如果容差(tolerance)<=0.1,常常表示存在多重共线性。
3. 条件索引条件索引(condition index)>10,可以说明存在比较严重的共线性。
五、多重共线性的处理方法处理方法有多重增加样本容量、剔除因子法、PLS(偏最小二乘法)、岭回归法、主成分法。
计量经济学简答题及答案

计量经济学简答题及答案1、比较普通最小二乘法、加权最小二乘法和广义最小二乘法的异同;答:普通最小二乘法的思想是使样本回归函数尽可能好的拟合样本数据,反映在图上就是是样本点偏离样本回归线的距离总体上最小,即残差平方和最小∑=n i i e12min ;只有在满足了线性回归模型的古典假设时候,采用OLS 才能保证参数估计结果的可靠性; 在不满足基本假设时,如出现异方差,就不能采用OLS;加权最小二乘法是对原模型加权,对较小残差平方和2i e 赋予较大的权重,对较大2i e 赋予较小的权重,消除异方差,然后在采用OLS 估计其参数;在出现序列相关时,可以采用广义最小二乘法,这是最具有普遍意义的最小二乘法; 最小二乘法是加权最小二乘法的特例,普通最小二乘法和加权最小二乘法是广义最小二乘法的特列;6、虚拟变量有哪几种基本的引入方式 它们各适用于什么情况答: 在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况;除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况;7、联立方程计量经济学模型中结构式方程的结构参数为什么不能直接应用OLS 估计 答:主要的原因有三:第一,结构方程解释变量中的内生解释变量是随机解释变量,不能直接用OLS 来估计;第二,在估计联立方程系统中某一个随机方程参数时,需要考虑没有包含在该方程中的变量的数据信息,而单方程的OLS 估计做不到这一点;第三,联立方程计量经济学模型系统中每个随机方程之间往往存在某种相关性,表现于不同方程随机干扰项之间,如果采用单方程方法估计某一个方程,是不可能考虑这种相关性的,造成信息的损失;2、计量经济模型有哪些应用;答:①结构分析,即是利用模型对经济变量之间的相互关系做出研究,分析当其他条件不变时,模型中的解释变量发生一定的变动对被解释变量的影响程度;②经济预测,即是利用建立起来的计量经济模型对被解释变量的未来值做出预测估计或推算;③政策评价,对不同的政策方案可能产生的后果进行评价对比,从中做出选择的过程;④检验和发展经济理论,计量经济模型可用来检验经济理论的正确性,并揭示经济活动所遵循的经济规律;6、简述建立与应用计量经济模型的主要步骤;答:一般分为5个步骤:①根据经济理论建立计量经济模型;②样本数据的收集;③估计参数;④模型的检验;⑤计量经济模型的应用;7、对计量经济模型的检验应从几个方面入手;答:①经济意义检验;②统计准则检验;③计量经济学准则检验;④模型预测检验;1、在计量经济模型中,为什么会存在随机误差项答:①模型中被忽略掉的影响因素造成的误差;②模型关系认定不准确造成的误差;③变量的测量误差;④随机因素;这些因素都被归并在随机误差项中考虑;因此,随机误差项是计量经济模型中不可缺少的一部分;2、古典线性回归模型的基本假定是什么答:①零均值假定;即在给定x t 的条件下,随机误差项的数学期望均值为0,即t E(u )=0;②同方差假定;误差项t u 的方差与t 无关,为一个常数;③无自相关假定;即不同的误差项相互独立;④解释变量与随机误差项不相关假定;⑤正态性假定,即假定误差项t u 服从均值为0,方差为2σ的正态分布;3、总体回归模型与样本回归模型的区别与联系;答:主要区别:①描述的对象不同;总体回归模型描述总体中变量y 与x 的相互关系,而样本回归模型描述所观测的样本中变量y 与x 的相互关系;②建立模型的不同;总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的;③模型性质不同;总体回归模型不是随机模型,样本回归模型是随机模型,它随着样本的改变而改变;主要联系:样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型;4、试述回归分析与相关分析的联系和区别;答:两者的联系:①相关分析是回归分析的前提和基础;②回归分析是相关分析的深入和继续;③相关分析与回归分析的有关指标之间存在计算上的内在联系;两者的区别:①回归分析强调因果关系,相关分析不关心因果关系,所研究的两个变量是对等的;②对两个变量x 与y 而言,相关分析中:xy yx r r =;但在回归分析中,01ˆˆˆt t y b b x =++和01ˆˆˆt tx a a y =++却是两个完全不同的回归方程;③回归分析对资料的要求是:被解释变量y 是随机变量,解释变量x 是非随机变量;相关分析对资料的要求是两个变量都随机变量;5、在满足古典假定条件下,一元线性回归模型的普通最小二乘估计量有哪些统计性质答:①线性,是指参数估计量0ˆb 和1ˆb 分别为观测值t y 和随机误差项t u 的线性函数或线性组合;②无偏性,指参数估计量0ˆb 和1ˆb 的均值期望值分别等于总体参数0b 和1b ;③有效性最小方差性或最优性,指在所有的线性无偏估计量中,最小二乘估计量0ˆb 和1ˆb 的方差最小;6、简述BLUE 的含义;答:在古典假定条件下,OLS 估计量0ˆb 和1ˆb 是参数0b 和1b 的最佳线性无偏估计量,即BLUE,这一结论就是着名的高斯-马尔可夫定理;7、对于多元线性回归模型,为什么在进行了总体显着性F 检验之后,还要对每个回归系数进行是否为0的t 检验答:多元线性回归模型的总体显着性F 检验是检验模型中全部解释变量对被解释变量的共同影响是否显着;通过了此F 检验,就可以说模型中的全部解释变量对被解释变量的共同影响是显着的,但却不能就此判定模型中的每一个解释变量对被解释变量的影响都是显着的;因此还需要就每个解释变量对被解释变量的影响是否显着进行检验,即进行t 检验;2.在多元线性回归分析中,为什么用修正的决定系数衡量估计模型对样本观测值的拟合优度解答:因为人们发现随着模型中解释变量的增多,多重决定系数2R 的值往往会变大,从而增加了模型的解释功能;这样就使得人们认为要使模型拟合得好,就必须增加解释变量;但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而损失自由度,而实际中如果引入的解释变量并非必要的话可能会产生很多问题,比如,降低预测精确度、引起多重共线性等等;为此用修正的决定系数来估计模型对样本观测值的拟合优度;3.修正的决定系数2R 及其作用; 解答:222/11()/1t t e n k R y y n --=---∑∑,其作用有:1用自由度调整后,可以消除拟合优度评价中解释变量多少对决定系数计算的影响;2对于包含解释变量个数不同的模型,可以用调整后的决定系数直接比较它们的拟合优度的高低,但不能用原来未调整的决定系数来比较;4.常见的非线性回归模型有几种情况解答:常见的非线性回归模型主要有:(1)对数模型01ln ln t t t y b b x u =++(2)半对数模型01ln t t t y b b x u =++或01ln t t t y b b x u =++(3)倒数模型0101111y b b u b b u x y x=++=++或 (4)多项式模型2012...k k y b b x b x b x u =+++++2.产生异方差性的原因及异方差性对模型的OLS 估计有何影响;1模型中遗漏了某些解释变量;2模型函数形式的设定误差;3样本数据的测量误差;4随机因素的影响;产生的影响:如果线性回归模型的随机误差项存在异方差性,会对模型参数估计、模型检验及模型应用带来重大影响,主要有:1不影响模型参数最小二乘估计值的无偏性;2参数的最小二乘估计量不是一个有效的估计量;3对模型参数估计值的显着性检验失效;4模型估计式的代表性降低,预测精度精度降低;3.检验异方差性的方法有哪些1图示检验法;2戈德菲尔德—匡特检验;3怀特检验;4戈里瑟检验和帕克检验残差回归检验法;5ARCH 检验自回归条件异方差检验4.异方差性的解决方法有哪些1模型变换法;2加权最小二乘法;3模型的对数变换等5.什么是加权最小二乘法它的基本思想是什么最小二乘法的基本原理是使残差平方和∑2t e 为最小,在异方差情况下,总体回归直线对于不同的t t e x ,的波动幅度相差很大;随机误差项方差2t σ越小,样本点t y 对总体回归直线的偏离程度越低,残差t e 的可信度越高或者说样本点的代表性越强;而2t σ较大的样本点可能会偏离总体回归直线很远,t e 的可信度较低或者说样本点的代表性较弱;因此,在考虑异方差模型的拟合总误差时,对于不同的2t e 应该区别对待;具体做法:对较小的2t e 给于充分的重视,即给于较大的权数;对较大的2t e 给于充分的重视,即给于较小的权数;更好的使∑2t e 反映)var(i u 对残差平方和的影响程度,从而改善参数估计的统计性质;6.样本分段法即戈德菲尔特——匡特检验检验异方差性的基本原理及其使用条件;将样本分为容量相等的两部分,然后分别对样本1和样本2进行回归,并计算两个子样本的残差平方和,如果随机误差项是同方差的,则这两个子样本的残差平方和应该大致相等;如果是异方差的,则两者差别较大,以此来判断是否存在异方差;使用条件:1样本容量要尽可能大,一般而言应该在参数个数两倍以上;2t u服从正态分布,且除了异方差条件外,其它假定均满足;1.简述DW检验的局限性;答:从判断准则中看到,DW检验存在两个主要的局限性:首先,存在一个不能确定的DW检验只能检验一阶自相DW值区域,这是这种检验方法的一大缺陷;其次:....关;但在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关,而且经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关;所以在实际应用中,对于序列相关问题—般只进行..DW检验;二、简答题1、模型中引入虚拟变量的作用是什么答案:1可以描述和测量定性因素的影响;2能够正确反映经济变量之间的关系,提高模型的精度;3便于处理异常数据;2、虚拟变量引入的原则是什么答案:1如果一个定性因素有m方面的特征,则在模型中引入m-1个虚拟变量;2如果模型中有m个定性因素,而每个定性因素只有两方面的属性或特征,则在模型中引入m个虚拟变量;如果定性因素有两个及以上个属性,则参照“一个因素多个属性”的设置虚拟变量;3虚拟变量取值应从分析问题的目的出发予以界定;4虚拟变量在单一方程中可以作为解释变量也可以作为被解释变量;3、虚拟变量引入的方式及每种方式的作用是什么答案:1加法方式:其作用是改变了模型的截距水平;2乘法方式:其作用在于两个模型间的比较、因素间的交互影响分析和提高模型的描述精度;3一般方式:即影响模型的截距有影响模型的斜率;4、判断计量经济模型优劣的基本原则是什么答案:1模型应力求简单;2模型具有可识别性;3模型具有较高的拟合优度;4模型应与理论相一致;5模型具有较好的超样本功能;5、模型设定误差的类型有那些答案:1模型中添加了无关的解释变量;2模型中遗漏了重要的解释变量;3模型使用了不恰当的形式;6、工具变量选择必须满足的条件是什么答案:选择工具变量必须满足以下两个条件:1工具变量与模型中的随机解释变量高度相关;2工具变量与模型的随机误差项不相关;7、滞后变量模型包括哪几种类型写出各自的模型形式;答案:滞后变量模型包括两种类型:自回归模型和分布滞后模型;自回归模型是模型的解释变量中包含滞后被解释变量,基本形式为:;分布滞后模型是指模型中不仅包含解释变量的当期值,还包括解释变量的滞后值基本形式为: ;8、设定误差产生的主要原因是什么答案:原因有四:1模型的制定者不熟悉相应的理论知识;2对经济问题本身认识不够或不熟悉前人的相关工作;3模型制定者缺乏相关变量的数据;4解释变量无法测量或数据本身存在测量误差;9、在建立计量经济学模型时,什么时候,为什么要引入虚拟变量答案:在现实生活中,影响经济问题的因素除具有数量特征的变量外,还有一类变量,这类变量所反映的并不是数量而是现象的某些属性或特征,即它们反映的是现象的质的特征;这些因素还很可能是重要的影响因素,这时就需要在模型中引入这类变量;引入的方式就是以虚拟变量的形式引入;1、 直接用最小二乘法估计有限分布滞后模型的有:(1) 损失自由度2分(2) 产生多重共线性2分(3) 滞后长度难确定的问题1分2、 因变量受其自身或其他经济变量前期水平的影响,称为滞后现象;其原因包括:1经济变量自身的原因;2分2决策者心理上的原因1分;3技术上的原因1分;4制度的原因1分;3、 koyck 模型的特点包括:1模型中的λ称为分布滞后衰退率,λ越小,衰退速度越快2分;2模型的长期影响乘数为b 0·11λ-1分;3模型仅包括两个解释变量,避免了多重共线性1分;4模型仅有三个参数,解释了无限分布滞后模型因包含无限个参数无法估计的问题1分二、 1.联立方程模型中方程有:行为方程式1分;技术方程式1分;制度方程式1分;平衡方程或均衡条件1分;定义方程或恒等式1分;三、 2.联立方程的变量主要包括内生变量2分、外生变量2分和前定变量1分;四、 3.模型的识别有恰好识别2分、过渡识别2分和不可识别1分三种;五、 4.识别的条件条件包括阶条件和秩条件;阶条件是指,如果一个方程能被识别,那么这个方程不包含的变量总数应大于或等于模型系统中方程个数减13分;秩条件是指,在一个具有K 个方程的模型系统中,任何一个方程被识别的充分必要条件是:所有不包含在这个方程中变量的参数的秩为K -12分;六、 1.简述回归分析和相关分析的关系;七、 答案:回归分析是一个变量被解释变量对于一个或多个其他变量解释变量的依存关系,目的在于根据解释变量的数值估计预测被解释变量的总体均值;相关分析研究变量相关程度,用相关系数表示;相关分析不关注变量的因果关系,变量都是随机变量;回归分析关注变量因果关系;被解释变量是随机变量,解释变量是非随机变量;八、 2.简要说明DW 检验应用的限制条件和局限性;九、 答案DW 检验适用于一阶自回归:不适用解释变量与随机项相关的模型;DW 检验存在两个不能确定的区域十、 3.回归模型中随机误差项产生的原因是什么十一、 答案:模型中省略的变量;随机行为;模型形式不完善;变量合并误差;测量误差十二、 4.简述C-D 生产函数的份额估计法及其缺点;十三、 答案:C-D 生产函数是柯布-道格拉斯生产函数,即,Y A L K αβ=,α是产出的劳动弹性β是产出的资本弹性,缺点是劳动与资本存在不变的等于1 的替代弹性; 十四、 5.假设分布滞后模型为:i 3121110t ...r X X Y u X r r t t t +++++=---λλα将该模型变换成自回归模型形式;为计算模型参数的工具变量估计值,应该用哪些工具变量十五、 答案:0,,r λα1、二元回归模型011i 22i i i Y X X u βββ=+++中,三个参数含义答案:0β表示当X2、X3不变时,Y 的平均变化1β表示当X2不变时,X1变化一个单位Y 的平均变化2β表示当X1不变时,X2变化一个单位Y 的平均变化 2、调整后的判定系数与原来判定系数关系式 答案:2211(1)1n n k R R ---=---- 3、F 检验含义答案:从总体上检验被解释变量与解释变量线性关系的显着性,原假设//(1)RSS k ESS n k --:12...0k βββ====,如果成立,被解释变量与解释变量不存在显着的线性关系;1H :至少有一个i β不等于0,对于显着性水平α,查F 分布表中的(,1)k k n F α--,统计量F=//(1)RSS k ESS n k --,比较二者大小;如果统计量F 大于(,1)k k n F α--,否定原假设,总体回归方程存在显着的线性关系;否则,总体回归方程不存在显着的线性关系;、简述加权最小二乘法的思想;答案:对于存在异方差的模型,用某一权数对样本观测值或残差加权,再使用普通最小二乘法估计模型参数2、多重共线性的后果有哪些对多重共线性的处理方法有哪些答案:多重共线性的后果是:各个解释变量对被解释变量的影响很难精确鉴别;系数估计量的方差很大,显着性检验无效;参数估计量对于增减少量观测值或删除一个不显着的解释变量可能比较敏感;3、常见的非线性回归模型有几种情况答案:双对数模型,半对数模型,倒数变换模型,多项式模型,双曲函数模型,幂函数模型; ⒈什么是随机误差项影响随机误差项的主要因素有哪些它和残差之间的区别是什么 影响Y 的较小因素的集合;被忽略的因素、测量误差、随机误差等;通过残差对误差项的方差进行估计;⒉决定系数2R 说明了什么它与相关系数的区别和联系是什么⒊最小二乘估计具有什么性质P37线性、无偏性和有效性或最小方差性⒋在回归模型的基本假定中,()0t E ε=的意义是什么该假设的含义是:如果两变量之间确实是线性趋势占主导地位,随机误差只是次要因素时,那么虽然随机扰动会使个别观测值偏离线性函数,但给定解释变量时多次重复观测被解释变量,概率均值会消除随机扰动的影响,符合线性函数趋势;。
计量经济学简答题及答案

计量经济学简答题及答案计量经济学简答题及答案1、⽐较普通最⼩⼆乘法、加权最⼩⼆乘法与⼴义最⼩⼆乘法得异同。
答:普通最⼩⼆乘法得思想就是使样本回归函数尽可能好得拟合样本数据,反映在图上就就是就是样本点偏离样本回归线得距离总体上最⼩,即残差平⽅与最⼩∑=n i i e12min 。
只有在满⾜了线性回归模型得古典假设时候,采⽤OLS 才能保证参数估计结果得可靠性。
在不满⾜基本假设时,如出现异⽅差,就不能采⽤OLS 。
加权最⼩⼆乘法就是对原模型加权,对较⼩残差平⽅与2i e 赋予较⼤得权重,对较⼤2i e 赋予较⼩得权重,消除异⽅差,然后在采⽤OLS 估计其参数。
在出现序列相关时,可以采⽤⼴义最⼩⼆乘法,这就是最具有普遍意义得最⼩⼆乘法。
最⼩⼆乘法就是加权最⼩⼆乘法得特例,普通最⼩⼆乘法与加权最⼩⼆乘法就是⼴义最⼩⼆乘法得特列。
6、虚拟变量有哪⼏种基本得引⼊⽅式? 它们各适⽤于什么情况?答: 在模型中引⼊虚拟变量得主要⽅式有加法⽅式与乘法⽅式,前者主要适⽤于定性因素对截距项产⽣影响得情况,后者主要适⽤于定性因素对斜率项产⽣影响得情况。
除此外,还可以加法与乘法组合得⽅式引⼊虚拟变量,这时可测度定性因素对截距项与斜率项同时产⽣影响得情况。
7、联⽴⽅程计量经济学模型中结构式⽅程得结构参数为什么不能直接应⽤OLS估计?答:主要得原因有三:第⼀,结构⽅程解释变量中得内⽣解释变量就是随机解释变量,不能直接⽤OLS 来估计;第⼆,在估计联⽴⽅程系统中某⼀个随机⽅程参数时,需要考虑没有包含在该⽅程中得变量得数据信息,⽽单⽅程得OLS 估计做不到这⼀点;第三,联⽴⽅程计量经济学模型系统中每个随机⽅程之间往往存在某种相关性,表现于不同⽅程随机⼲扰项之间,如果采⽤单⽅程⽅法估计某⼀个⽅程,就是不可能考虑这种相关性得,造成信息得损失。
2、计量经济模型有哪些应⽤。
答:①结构分析,即就是利⽤模型对经济变量之间得相互关系做出研究,分析当其她条件不变时,模型中得解释变量发⽣⼀定得变动对被解释变量得影响程度。
多重共线性

2.采用综合统计检验法
R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线 性作用显著,但各解释变量间存在共线性而使得它们对Y的独 立作用不能分辨,故t检验不显著。
3.3 多重共线性
3、辅助回归模型检验 通过每个解释变量对其它解释变量的辅助回归模型
xi a0 a1 x1 ai 1 xi 1 ai 1 xi 1 ak xk
3.3多重共线性
• • • • 多重共线性及其产生原因 多重共线性的后果 多重共线性的检验 多重共线性的方法
一、多重共线性及其产生原因
1.多重共线性的概念---解释变量间相关
对于多元线性回归模型 yi=b0+b1x1i+b2x2i+…+bkxki+εi 存在一组不全为零的常数λ1,λ2,…λk,使得 λ1x1i + λ2x2i +…+ λkxki +νi=0 其中νi是一个随机误差项,则称模型存在着多重共线性。 “共线性”:变量间线性相关 “多重”:多种组合 “完全多重共线性”: νi=0
3.3 多重共线性
例5.服装需求函数。根据理论和经验分析,影响居民服 装需求的主要因素有:可支配收入X、流动资产拥有量 K、服装类价格指数P1和总物价指数P0 。教材P124的表 3-4给出了有关统计资料。 设服装需求函数为 :Y=a+b1x+b2P1+b3P0+b4K+ε (1)相关系数检验 键入:COR Y X K P1 P0 输出的相关系数矩阵为:
3.3 多重共线性
2、间接剔除重要的解释变量 ⑴利用附加信息
例如,著名的Cobb-Dauglas 生产函数中
附加信息: α +β =1 则
7.2多重共线性的后果

例如, 例如,对于二元线性回归模型
Yi = β 0 + β1 X 1i + β 2 X 2i + ui
如果两个解释变量完全相关,如X 2 = λ X 1,则该二元 线性回归模型退化为一元线性回归模型:
Yi = β 0 + β1 + λβ 2)X 1i + ui (
这时,只能确定综合参数β1 + λβ 2的估计值,无法 确定β1,β 2 各自的估计值。
β1 =
∂Y X1
根据偏导数的概念, 的经济含义是: 根据偏导数的概念,β1的经济含义是:在其他变 量保持不变的情况下, 变化一个单位将使Y变 量保持不变的情况下,X1 变化一个单位将使 变 个单位。 化β1个单位。 但在多重共线性的情况下, 但在多重共线性的情况下,解释变量的相关性将 无法“保持其他变量不变” 无法“保持其他变量不变”,从而也难以分离出 每个解释变量的单独影响。 每个解释变量的单独影响。
四、回归模型缺乏稳定性 从同一总体中抽取不同的样本估计模型, 从同一总体中抽取不同的样本估计模型,得到的 估计值不会完全相同,但不应该有显著差异, 估计值不会完全相同,但不应该有显著差异,此 时称模型为稳定的。 时称模型为稳定的。但是当模型存在多重共线性 样本数据即使有微小的变化, 时,样本数据即使有微小的变化,也可能导致系 数估计值发生明显变化,甚至出现符号错误, 数估计值发生明显变化,甚至出现符号错误,参 数估计对样本的变化比较敏感。 数估计对样本的变化比较敏感。
多重共线性的后果 第二节 多重共线性的后果
• • • • OLS估计量的方差增大 估计量的方差增大 难以区分每个解释变量的单独影响 变量的显著性检验失去意义 回归模型缺乏稳定性
经典回归模型要求模型不存在完全的多重共线 经典回归模型要求模型不存在完全的多重共线 所以,即使模型存在严重的多重共线性, 性,所以,即使模型存在严重的多重共线性,也并 不违背基本假定, 估计仍然是最佳线性无偏估 不违背基本假定,OLS估计仍然是最佳线性无偏估 估计 但多重共线性却会产生以下问题: 计。但多重共线性却会产生以下问题: 一、OLS估计量的方差增大 估计量的方差增大 设二元线性回归模型为: 设二元线性回归模型为:
计量经济学第八讲

三、多重共线性的检验 (一) 相关系数检验利用相关系数可以分析解释变量之间的两两相关情况。
在EViews 软件中可以直接计算(解释)变量的相关系数矩阵: [命令方式]COR 解释变量名[菜单方式]将所有解释变量设置成一个数组,并在数组窗口中点击View\Correlations. (二) 辅助回归模型检验相关系数只能判断解释变量之间的两两相关情况,当模型的解释变量个数多于两下、并且呈现出较为复杂的相关关系时,可以通过每个解释变量对其他解释变量的辅助回归模型来检验多重共线性,即依次建立k 个辅助回归模型:k i x a x a x a x a a x kki i i i i,,1111111=++++++=++--ε如果,其中某些方程显著,则表明存在多重共线性,所对应的变量可以近似地用其他解释变量线性表示。
辅助回归模型检验不仅能检验多元回归模型的多重共线性,而且可以得到多重共线性的具体形式;如果再结合偏相关关系检验,还能进一步判定是哪些解释变量引起了多重共线性,这有助于分析如何消除多重共线性的影响。
(三) 方差膨胀因子检验对于多元线性回归模型,ib ˆ的方差可以表示成:iijiiijiVIF x x R x x b D ∙∑-=-∑-=22222)(11)()ˆ(σσ其中,i i x R 为2关于其他解释变量辅助回归模型的判定系数,i VIF 为方差膨胀因子。
随着多重共线性程度的增强,VIF 以及系数估计误差都在增大。
因此,可以用VIF 作为衡量多重共线性的一个指标;一般当10>VIF 时,(此时9.02>iR ),认为模型存在较严重的多重共线性。
另一个与VIF 等价的指标是“容许度”(Tolerance ),其定义为:iiiVIF R TOL /1)1(2=-=显然,10≤≤TOL ,当i x 与其他解释变量高度相关时,0→TOL 。
因此,一般当1.0<TOL 时,认为模型存在较严重的多重共线性。
第8章 多重共线性:解释变量相关会有什么后果

第8章 多重共线性:解释变量相关会有什么后果本章主要讲授如下内容:8.1 多重共线性的性质8.2 多重共线性产生的原因 8.3 多重共线性的后果8.4 多重共线性的诊断8.5 如何解决多重共线性:补救措施8.1 多重共线性的性质1.完全多重共线性的情形对于变量X 1、X 2……、X k ,如果存在不全为零的数λ1、λ2、……λk ,使得下式成立:02211=+++k k X X X λλλ则称变量X 1、X 2……、X k 之间存在一种完全的共线性。
注意:当解释变量之间存在完全共线性时,不可能获得所有参数的唯一估计值,因而也就不能根据样本进行任何统计推断(即假设检验)。
2.接近或者不完全多重共线性的情形对于变量X 1、X 2……、X k ,如果存在不全为零的数λ1、λ2、……λk ,使得下式成立:02211=++++μλλλk k X X X则称变量X 1、X 2……、X k 之间存在不完全的共线性。
这里,μ为随机误差项。
8.2 多重共线性产生的原因1.经济变量之间往往存在同方向的变化趋势。
2.经济变量之间往往存在着密切的关联度。
3.在模型中采用滞后变量也容易产生多重共线性。
4.在建模过程中由于解释变量选择不当引起了变量之间的多重共线性。
8.3 多重共线性的后果1.增大OLS 估计量的方差和标准差可以证明,参数估计值i b 的方差为:22211)()var(ii iti RX Xb -⋅-=∑σ其中,2i R 是第i 个解释变量对模型中其他解释变量作辅助回归模型),,,,,,(1121k i i i X X X X X f X +-=时的决定系数。
2.可能导致在假设检验中舍去重要的解释变量,检验的可靠性降低。
3.回归模型缺乏稳定性。
4.可能导致回归系数符号的错误。
8.4 多重共线性的诊断多重共线性只是存在的程度而非是否存在的问题,它属于样本特征而非总体特征。
一般可以采取以下方法进行诊断。
1.根据回归结果判断R 2较高但t 值统计显著的不多,这是多重共线性的“典型”特征。
多重共线性

比如对于两个解释变量的模型
Yi 1 X 1i 2 X 2i ui
根据我们前面的讨论,参数的最小二乘估计为:
ˆ 1
2 ( yi x1i )( x2 i ) ( yi x2 i )( x1i x2 i ) 2 2 ( x12i )( x2 ) ( x x ) 1i 2i i
R 2 0.8101 ˆ , ˆ ) 0.00868 cov( 1 2
12 0.5523
df 2
ˆ 在单侧t检验的显著水平10%是显著的(1.886)。 1
第二组数据的回归结果
ˆ 1.2108 Y i se (0.7480) t (1.6187) 0.4014 X 1i (0.2721) (1.4752) 0.0270 X 2i (0.1252) (0.2158)
多重共线性
南开大学数学科学学院 白晓棠
多重共线性
在经典的线性回归模型中,我们假定回归模型中诸回归元 之间无多重共线性。
在本节中我们将放松此要求从而来研究: 1、什么是多重共线性? 2、它会引起什么样的后果? 3、怎样去发现它? 4、我们可以采取哪些补救措施来缓解多重共线性的问 题?
第一组数据
Y 1 2 3 4 5
X1 2 0 4 6 8
X2 4 2 12 0 16
第二组数据
Y 1 2 3 4 5
X1 2 0 4 6 8Leabharlann X2 4 2 0 12 16
第一组数据的回归结果
ˆ 1.1939 Y i se (0.7737) t (1.5431) 0.4463 X 1i (0.1848) (2.4151) 0.0030 X 2i (0.0851) (0.0358)
5.1 多重共线性的定义和后果

虽然系数不显著,但总的拟合优度R2却可能非常高; 可能出现每个偏回归系数的 t 值都不显著,但回归方 程的F值却很显著。
© 电子科大经管学院
© 电子科大经管学院
3
第五讲 多重共线性
引例
回顾收入-消费问题
个人的消费支出不仅受个人收入的影响,也可能受财 富、消费习惯的影响 建立消费对收入、财富的回归模型
Yi 0 1 X 2i 2 X 3i i
其中, Yi 表示消费, X 2i 表示收入, X 3i 表示财富。
ˆ ] 2 ( X X )1 var[
多重共线性可能导致参数估计值的符号与预期符号不 一致吗? 若总体中各解释变量X之间没有线性关系,样本中各解 释变量X之间可能存在线性关系吗?
多重共线性本质上是一种样本现象
© 电子科大经管学院
11
第五讲 多重共线性
多重共线性产生的后果
不完全多重共线性的特征
计量经济学
第五讲 多重共线性
第一节 多重共线性的定义和后果
主讲教师:陈磊
第五讲 多重共线性
回顾:OLS的基本假设
假设1:回归模型是线性的,模型设定无误且含有误差项
假设2:误差项总体均值为零 E(i)=0
假设3:所有解释变量与误差项都不相关 Cov(Xi, i)=0 假设4:误差项观测值互不相关(无序列相关性) Cov(i, j)=0 假设5:误差项具有同方差(不存在异方差性) Var (i)=2 假设6:任何一个解释变量都不是其他解释变量的完全线性函
© 电子科大经管学院
多重共线性的后果四、多重共线性的检验五、克服多重共线

多重共线性
一、多重共线性的概念 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的方法 六、案例
问题的提出
• 在前述基本假定下OLS估计具有BLUE的优良性。 • 然而实际问题中,这些基本假定往往不能满足, 使OLS方法失效不再具有BLUE特性。 • 估计参数时,必须检验基本假定是否满足,并针 对基本假定不满足的情况,采取相应的补救措施 或者新的方法。 • 检验基本假定是否满足的检验称为计量经济学检 验
在矩阵表示的线性回归模型 Y=X+ 中,完全共线性指:秩(X)<k+1,即
1 1 X 1 X 11 X 12 X 1n X 21 X 22 X 2n X k1 X k2 X kn
中,至少有一列向量可由其他列向量(不包括第 一列)线性表出。 如:X2= X1,则X2对Y的作用可由X1代替。
具体可进一步对上述回归方程作F检验: 构造如下F统计量
Fj R2 j . /( k 2) (1 R ) /(n k 1)
2 j.
~ F (k 2, n k 1)
式中:Rj•2为第j个解释变量对其他解释变量的回 归方程的决定系数,
若存在较强的共线性,则Rj•2较大且接近 于1,这时(1- Rj•2 )较小,从而Fj的值较大。 因此,给定显著性水平,计算F值,并与 相应的临界值比较,来判定是否存在相关性。
– 时间序列数据经常出现序列相关
• 5、随机扰动项方差不等于常数=>异方差
– 截面数据时,经常出现异方差
解决问题的思路
• • • • 1、定义违反各个基本假定的基本概念 2、违反基本假定的原因、背景 3、诊断基本假定的违反 4、违反基本假定的补救措施(修正)
多重共线性

一、多重共线性1.由此可得出模型估计的结果为:Y ˆ=12815.75+6.2125621X +0.421382X -0.166263X -0.097774X -0.0284255X (14078.9)(0.740881)(0.126925)(0.059229)(0.067647)(0.202357) t= (-0.91028)(8.385373)(3.319919)(-2.807065)(-1.445299)(-0.140471) 2R =0.982798 2R =0.975630 F=137.1164 n=182.模型检验:①经济意义检验:根据经验,除成灾面积3X 增加后,粮食产量Y 会减少外,其余变量增加,Y 都应该是增加的,即除3X 符号为负号,其余均为正号。
但结果显示,4X 和5X 的符号与预期相反,这表明很可能存在严重的多重共线性。
②拟合优度:由表中数据可得,2R =0.982798 ,修正的可决系数为2R =0.975630,可决系数很高,说明模型对样本的拟合很好。
③F 检验:针对0H :1β=2β=3β=4β=5β=0,给定显著性水平α=0.05,在F 分布表中查出自由度为k-1=6-1=5和n-k=12的临界值αF (5,12)=3.11。
由表可得F=137.1164>αF (5,12)=3.11,应拒绝原假设0H :1β=2β=3β=4β=5β=0,说明回归方程显著,即1X ,2X ,3X ,4X ,5X 等变量联合起来确实对粮食产量Y 有显著性影响。
④t 检验:分别针对0H :j β=0(j=1,2,3,4,5),给定显著性水平α=0.05,查t 分布表得自由度为n-k=12的临界值=-)(2k n t α 2.179,由表中数据得:∧1β、^2β、∧3β对应的t 统计量的绝对值大于=-)(2k n t α 2.179,这说明在显著性水平α=0.05下,分别应当拒绝0H :j β=0(j=1,2,3),也就是说1X ,2X ,3X 对Y 都有显著性影响。
多重共线性的危害

P lim
n
i
n
n
0
那么因为
P lim b1 1 P lim
n
X
i i
i
X i
i
X
X
2
1 0 1
因此 b1 是1 的一致估计。虽然不是无偏估计。
24
三、工具变量法估计
设模型为 Y 0 1 X 其中 X不仅是随机变量,而且与 有强相关性。 对模型作离差变换得 Yi Y 1 X i X i 两边乘 Z Z 并求和得 Zi Z Yi Y 1 Zi Z X i X Zi Z i i i i 然后两边除以 Z Z X X ,有 Z Z Y Y Z Z Z Z X X Z Z X X
8
(二)状态数检验
1、 状态指数 将 X矩阵的每一列 X 用其模 X X X 相除以实现标准化,然后再求 XX 矩阵的 特征值,取其中最大的除以最小的后再求 平方根,得到该矩阵的“状态数”,记为: max min 通常当 大于20或30时,认为存在较 明显的多重共线性。
k
k k
34
一、最大似然估计的原理
根据事物出现的概率(几率、可能性)的 大小,推断事物的真相,包括定性的和定 量的(参数水平)真相。
例1:一个老战士和一个军训学生各射击一 次,但只有一枪中靶。问可能是谁打中的。
β - XX D Dβ
1
19
第二节 随机解释变量
一、解释变量的随机性 二、随机解释变量和参数估计的性质 三、工具变量法估计 四、参数估计量的分布性质和统计推断
多重共线性

再如:建立一个服装需求模型,影响服装需求量q的 收入I,服装价格p,以及其它商品的价格往往存在一定的 相关性,按常规判断,收入和价格之间不应该相关。但细 致地分析后发现,高收入者经常在高档商场购买服装,低 收入者往往在低档商场购买,而同样的服装在高档商场和 低档商场的价格是不同的,这样就产生了多重共线性。
其中:C1=A1+ 300A3 C2=A2-2A3
这并不是多元回归,而是Y对X2的一个简单的双变量 回归
我们虽然可以估计方程并获得C1和C2的估计值,但根 据这些变量我们无法求得原始参数A1,A2和A3的 估计值
结论:
当解释变量之间存在完全线性相关或者完 全多重共线性时,我们不可能获得所有参 数的惟一估计值。既然我们不能获得它们 的惟一估计值,也就不能根据某一样本做 任何统计推论(也即假设检验)
(2)判定系数检验法
使模型中每一个解释变量分别以其余解释变量为解释变量进行
回归分析计算,并计算相应的拟合优度(判定系数)。如果在某种
形式
x ji c1 x1i c2 x2i L cl xli
中判定系数较大,则说明该形式中作为被解释变量的xj可以用x1, x2,…xl的线性组合来表示,即:
xj与x1,x2,…xl之间存在共线性。
另外也可以这样处理:在模型中排除某一个解释变量xj ,然后 估计模型,如果拟合优度与包含xj时的拟合优度十分接近,这说明 xj与其它解释变量之间存在共线性。
(3)逐步回归法
以y为被解释变量,逐个引入解释变量,构成回归模 型进行模型估计,根据拟合优度的变化决定新引入的变量 是否可以用其它变量的线性组合代替,而不作为独立的解 释变量。如果拟合优度变化显著,则说明新引入的变量是 一个独立的解释变量,否则如果拟合优度变化很不显著, 则说明新引入的变量不是一个独立的解释变量,它可以用 其它的变量的线性组合代替(即它与其它变量间存在共线 性)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t 1
• OLS估计量的变异程度受什么因素影响
– 误差项u的方差σ2越大,OLS估计量的变异程度 越大
– 样本量越大, OLS估计量的变异程度越小。 var(b2)公式中的T大,分母也大, var(b2)就小
– 自变量对均值的变异程度越大, OLS估计量的 变异程度越小
2 1
X 2i
3 1
X 3i
k 1
X
ki
vi
1
其中vi 为随机项。解释变量间存在的完全或不完全的线性关係称为多重共
线性。由於经济变量自身的性质,多重共线性或强或弱,普遍存在。
8.2接近或者不完全多重共线性的情形 The case of near, or imperfect, multicollinearity
2、近似(不完全、高度)共线性(near/imperfect/high multicollinearity)
如果存在 c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n 其中ci不全为0,vi为随机误差项
OLS估计量仍是最优线性无偏估计量
注意:
除非是完全共线性,多重共线性并不意味 着任何基本假设的违背;
• 在完全多重共线性的情况下,不可能对多元回归 模型中的某一单个回归系数进行估计和假设检验
如果在解释变量X1,X2,…,Xk中,存在线性关係。
解释变量间的线性关係存在时,存在不全为零的常数 1, 2 ,k,使
1 X1i 2 X 2i k X ki 0
设1 0,则
X 1i
第二部分
实践中的回归分析
基本假定违背:不满足基本假定的情况。
(1)模型设定有偏误;所选模型是正确设定的 基本假定 所选模型是正确设定的
(2)解释变量之间存在多重共线性; 基本假定 解释变量之间不存在完全线性关系
(3)随机误差项序列存在异方差性; 基本假定 误差项方差为常数
(4)随机误差项序列存在序列相关性。 基本假定 误差项之间不相关
第八章 多重共线性
Multi-Collinearity • 一、多重共线性的性质 • 二、多重共线性的实际后果 • 三、多重共线性的诊断 • 四、克服多重共线性的方法 • 五、案例
一、多重共线性的性质
对于模型
Yi=0+1X1i+2X2i++kXki+i
i=1,2,…,n 其基本假设之一是解释变量是互相独立的。
为什么不能容忍多重共线性?
• 一个模型中的某个变量违背常识。 比如某些积极因素被“算”成了消 极因素
• 模型应该儘量简捷
– 奥卡姆剃刀:如无必要,毋增实体
• 产生多重共线性的背景
– 经济变量之间具有共同变化趋势
• 哲学观点:事物是普遍联繫的。联繫的紧密程度有所 不同。多重共线性会经常出现
• 如果一个回归方程之中,幾个自变量之间具有比较强 的相关性,则自变量之间可以互相解释,我们可以只 留下一个自变量:
• 何以怪? • 这样阐述事物,越说越乱,与其说
是“解释”,毋宁是“蛊惑”
生产函数的多重共线性
• 如果技術不变,劳动与资本投入会是等比 例的。比如,每增加一部缝纫机,就要增 加一个工人。此时,投入品之间是完全共 线性,即等比例变化。
• 多途径投放广告,销售额的变动到底来自 哪种广告形式,无法区分。各广告形式之 间经常存在共线性。
• 表8-1中,x2每上升1,x3会下降2,这是完全的共 线是亦性说然,,。x它这3一们时列之,数间无字的法“函按完数表全1关2”係-1可中是以的x3=由资3x0料20取-对2代x回2,,归也反方就之程 进行估计
• 当解释变量之间存在完全线性相关或者完全多重 共线性时,我们不可能獲得所有参数的惟一估计 值。既然我们不能獲得它们的惟一估计值,也就 不能根据某一样本做任何统计推论
– X2和X3之间的相关系数越大,b2的方差也越大。 如果X2和X3完全相关,r23=1, var(b2)无法计算
1、解释变量间存在完全共线性(perfect multicollinearX2i+…+ckXki=0
i=1,2,…,n
其中: ci不全为0
不可能获得所有参数的唯一估计值及根据样本进行任何 统计推断。
如果某两个或多个解释变量之间出现了相 关性,则称为多重共线性(Multicollinearity)。
1、完全多重共线性 2、近似(不完全)多重共线性
完全共线性的情况 并不多见,一般出 现的是在一定程度 上的共线性,即近 似共线性。
一个怪模型
• 商场销售额= B1营业面积+ B2店员人数 + B3铺租+ B4宣传费用+ui
2
var(b2 ) T
( Xt2 X 2 )2 (1 r223)
t 1
r23
( X t2 X 2 )( X t3 X 3 ) ( X t2 X 2 )2 ( X t3 X 3)2
r23是T个XT2值和XT3值的相关系数
影响b 的方差的因素 2
2
var(b2 ) T
• 设y=x1+x2+c, 其中,x1=ax2, 则y=ax2+x2+c=(a+1)x2+c
– 模型中包含滞後变量
– 利用截面数据建模也可能出现多重共线性
• 经济学理论有“互补品”与“替代品”
– 样本数据自身的原因
• 心理学家的调查数据经常出自大学生
8.1 多重共线性的性质 The nature of multicollinearity
2 1
X 2i
3 1
X 3i
k 1
X ki
这種关係为完全多重共线性,变量间的相关係数为1。实际上更多的情
况是,解释变量间有不完全的线性关係:存在不全为零的数:1, 2 ,k,使
1 X1i 2 X 2i k X ki vi 0
假定λ1≠0,
X 1i
• X4的绝大部分信息 包含在x2中,x2幾 乎完全是重複信息
• 这样得到的回归方 程很怪:在整体上 存在较好的解释能 力,但在每一个解 释变量上却出现违 背常识的现象
多重共线性的示意图
OLS估计量的方差与协方差
• OLS估计量的方差与协方差提供了估计量b 置信程度的信息。各样本间越是近似,其
统计量的变异程度就越小,根据这种样本 估计的参数就越准確