第8章 多重共线性:解释变量相关会有什么后果

合集下载

多重共线性PPT课件

多重共线性PPT课件

2-2
多重共线性的性质
多重共线性(multicollinearity)原先的含义指一 个回归模型中的一些或全部解释变量之间存 在一种“完全”或者准确的线性关系。 l 1 X1 + l 2 X 2 + L + l k X k = 0 现在共线性更为广义,既包括上述完全共线 性,也包括非完全(高度)共线性的形式。
2-18
8.4 多重共线性的实际后果
OLS估计量的方差和标准误较大。 置信区间变宽。 t值不显著 。 R 2值较高,但t值并不都是统计显著的。 OLS估计量及其标准误对数据的微小变化非常敏感, 即它们很不稳定。 回归系数符号有误。 难以评估各个解释变量对回归平方和(ESS)或者 R 2 的贡献。
2-15
出现“高度”但“不完全”多重共线性 时的估计问题
仍以上述三变量回归模型为例。 假定 X 3i = l X 2i + vi ,其中 å vi x2i = 0
回归系数估计:
b2 =
(邋yi x2i )(l
2
2 2 x2 + v i i )- (l 2 2i 2 2 2i
邋yi x2i +
l 1 X1 + l 2 X 2 + L + l k X k + ui = 0
2-3
为什么CLRM假定无多重共线性?
如果多重共线性是完全的,则X变量的回归 系数将是不确定的,并且它们的标准误为无 穷大。 如果多重共线性是不完全的,则虽然回归系 数可以确定,却有较大的标准误(相对于系 数本身来说),也即系数不能以很高的精度 或准确度加以估计。
2-26
8.7 扩展一例:1960-1982年期间美国的鸡肉需求

计量ch8 共线性

计量ch8   共线性

29
第8章 多重共线性
结论: 上面我们讨论了五种检验多重共线性的方法
(经验),但我们可以发现没有一种检验方法能够
帮助我们彻底解决多重共线性的问题。所以,要求 记住一点:多重共线性是一个程度问题,它是与样 本相关的一种现象。
30
第8章 多重共线性
第五节
修正多重共线性的方法
多重共线性必定不好吗?
如果回归分析的唯一目的是预测或预报,则多重 共线性不是一个严重的问题。因为,R2 越高,预测 越准确。通常,预测人员都是根据解释能力(用R2来 度量)来选择模型的。但是,如果对于其他样本,共 线性程度不高,依据方程的预测也将失去意义。
(4)
Yi=B1+B2X2i +B3X4i +ui
( 5) (5)
这两个模型的不同之处,在于对收入的不同测度。
6
第8章 多重共线性
如果作X2i对X3i的回归,可的如下的回归方程
X3i =300-2X2i
( 6) (6)
即收入变量(X3i)和价格变量(X2i)之间完全线性相关。
由于存在完全共线性,我们无法对方程(4)进行回归
C
R-squared
2.189792
0.982313
0.155715
14.06283
0.0000
Adjusted R-squared 0.978383
F-statistic
249.9282
19
第8章 多重共线性

第四节
多重共线性的诊断
在讨论如何解决多重共线性问题之前,应该明确 下面两个问题: (1)多重共线性是一个程度问题而不是存在与否的 问题。 (2)多重共线性是在假定解释变量是非随机的条件 下出现的,因而是样本的特征,而不是总体的特征。 因此,我们不仅可以“测定多重共线性”,而且可 以测度任何给定样本的多重共线性程度。

4.2 多重共线性产生的后果

4.2 多重共线性产生的后果
ˆ 2
2 2 ( yx2 )(2 x 2 2 ) ( yx2 y )( x 2 ) 2 2 2 2 ( x 2 )(2 x 2 2 ) 2 ( x 2 )
• 以二元回归为例, X2与X3存在不完全的多重共线性, 二者的相关系数的平方用X2和X3的离差形式x2和x3表 示为: 2 ( x x ) 2 3 2 r • ( 4.2.13 ) 23 2 2
• 可以证明, X2和X3的离差形式仍然有x3 = λ x2成立,将 它们分别代入式4.2.5和式4.2.6,得出如下结果: 2 • ( yx )( ( x ) ) ( y (x 2 ))( x 2 (x 2 )) 0 2 2 ˆ 2 2 2 • 2 0 (4.2.7) ( x )( (x ) ) ( x (x ))
2 2 2 3 2
(4.2.4)
2 ( yx2 )( x3 ) ( yx3 )( x 2 x3 )
(4.2.5) (4.2.6)
2 ( yx3 )( x 2 ) ( yx2 )( x 2 x3 ) 2 2 ( x 2 )( x3 ) ( x 2 x3 ) 2
• 其中,y、 x2、x3为Y、X2、X3的离差形式。假设解释变 量X2、X3存在完全的共线性,且X3= λ X2( λ≠0)。 2
6
• 在多元线性回归模型中,参数显著性检验的 t 统计量 为:
ˆ i t ~ t (n k) ˆ) ˆe( s 2 i
• 我们可以看出,随着 的增大,其标准差也将 ˆ ˆr ( 2 ) Va 增大,这意味着 t 值将会变小,在给定显著性水平 α 下, 当|t| < t/2(n-k)时,表明Xi对Y的影响不显著。
( x )( x ) ( x 2 x3 )

计量经济学+重点

计量经济学+重点

计量经济学+重点形式(3)计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运用数据验证结论3、进行经济计量的分析步骤(P2-P3)(1)建立一个理论假说(2)收集数据(3)设定数学模型(4)设立统计或经济计量模型(5)估计经济计量模型参数(6)核查模型的适用性:模型设定检验(7)检验源自模型的假设(8)利用模型进行预测4、用于实证分析的三类数据(P3-P4)(1)时间序列数据:按时间跨度收集到的(定性数据、定量数据);(2)截面数据:一个或多个变量在某一时点上的数据集合;(3)合并数据:包括时间序列数据和截面数据。

(一类特殊的合并数据—面板数据(纵向数据、微观面板数据):同一个横截面单位的跨期调查数据)第二章线性回归的基本思想:双变量模型1、回归分析(P18)用于研究一个变量(称为被解释变量或应变量)与另一个或多个变量(称为解释变量或自变量)之间的关系2、回归分析的目的(P18-P19)(1)根据自变量的取值,估计应变量的均值;(2)检验(建立在经济理论基础上的)假设;(3)根据样本外自变量的取值,预测应变量的均值;(4)可同时进行上述各项分析。

3、总体回归函数(PRF)(P19-P22)(1)概念:反映了被解释变量的均值同一个或多个解释变量之间的关系(2)表达式:)①确定/非随机总体回归函数:E(Y|Xi=B1+B2XiB1:截距;B2:斜率从总体上表明了单个Y同解释变量和随机干扰项之间的关系②随机/统计总体回归函数:Yi =B1+B2Xi+μiμi:随机扰动项(随机误差项、噪声)B1+B2Xi:系统/确定性部分μi:非系统/随机部分4、随机误差项(P22)(1)定义:代表了与被解释变量Y有关但未被纳入模型变量的影响。

每一个随机误差项对于Y 的影响是非常小的,且是随机的。

随机误差项的均值为0(2)性质①误差项代表了未纳入模型变量的影响;②反映人类行为的内在随机性;③代表了度量误差;④反映了模型的次要因素,使得模型描述尽可能简单。

多重共线性与随机解释变量

多重共线性与随机解释变量

• 由于多重共线性表现为解释变量之间具有相关关
系,所以用于多重共线性的检验方法主要是统计方 法,如判定系数检验法、逐步回归检验法等。
• 多重共线性检验的任务是: (1)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些变量 之间存在共线性。
1、检验多重共线性是否存在
(1)对两个解释变量的模型,采用简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说 明两变量存在较强的多重共线性。 (2)对多个解释变量的模型,采用综合统计检验法 若在OLS法下,模型的R2与F值较大,但各参数估 计量的t检验值较小,则说明各解释变量对Y的联合线 性作用显著,但各解释变量之间存在共线性而使得它 们各自对Y的独立作用不能分辨,故t检验不显著。

2
所以,多重共线性使参数估计量的方差增大。
方差扩大因子(Variance Inflation Factor) 为 1/(1-r2),其增大趋势见下表:
相关系 数平方 方差扩 大因子 0 1 0.5 2 0.8 5 0.9 10 0.95 0.96 20
ˆ
0.97 33
0.98 50
0.99 100
0.999 1000
25
r 2 =1 , var( 1 ) 当完全共线时,
3、参数估计量的经济含义不合理
如果模型(2.8.1)中两个解释变量具有线性相关性, 例如 X1 和 X2 ,那么它们中的一个变量可以由另一个变 量表征。 这时, X1 和 X2 前的参数并不反映各自与被解释变 量之间的结构关系,而是反映它们对被解释变量的共 同影响。 所以,各自的参数已经失去了应有的经济含义, 于是经常表现出似乎反常的现象,例如本来应该是正 的,结果却是负的。

用主成分法解决多重共线性问题

用主成分法解决多重共线性问题

用主成分法解决多重共线性问题一、多重共线性的表现线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系。

看似相互独立的指标本质上是相同的,是可以相互代替的,但是完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。

二、多重共线性的后果1.理论后果多重共线性是因为变量之间的相关程度比较高。

按布兰查德认为, 在计量经济学中, 多重共线性实质上是一个“微数缺测性”问题,就是说多重共线性其实是由样本容量太小所造成,当样本容量越小,多重共线性越严重。

多重共线性的理论主要后果:(1)完全共线性下参数估计量不存在;(2)近似共线性下OLS估计量非有效;(3)模型的预测功能失效;(4)参数估计量经济含义不合理2.现实后果(1)各个解释变量对指标最后结论影响很难精确鉴别;(2)置信区间比原本宽,使得接受假设的概率更大;(3)统计量不显著;(4)拟合优度的平方会很大;(5)OLS估计量及其标准误对数据微小的变化也会很敏感。

三、多重共线性产生的原因1.模型参数的选用不当,在我们建立模型时如果变量之间存在着高度的相关性2. 由于研究的经济变量随时间往往有共同的变化趋势,他们之间存在着共性。

例如当经济繁荣时,反映经济情况的指标有可能按着某种比例关系增长3. 滞后变量。

滞后变量的引入也会产生多重共线行,例如本期的消费水平除受本期的收入影响之外,还有可能受前期的收入影响,建立模型时,本期的收入水平就有可能和前期的收入水平存在着共线性。

四、多重共线性的识别1.方差扩大因子法( VIF)一般认为如果最大的VIF超过10,常常表示存在多重共线性。

2.容差容忍定法如果容差(tolerance)<=0.1,常常表示存在多重共线性。

3. 条件索引条件索引(condition index)>10,可以说明存在比较严重的共线性。

五、多重共线性的处理方法处理方法有多重增加样本容量、剔除因子法、PLS(偏最小二乘法)、岭回归法、主成分法。

计量经济学课件 第8章 多重共线性:解释变量相关会有什么后果

计量经济学课件 第8章 多重共线性:解释变量相关会有什么后果

Fj

ESS j. / 解释变量个数 RSS j. / 样本量-待估参数个数

R
j
2 .
/
df ESS
1-R
j
2 .
/
df RSS
若拒绝原假设则说明Xj与其他解释变量之间存在显著的线性关系。
4、从属回归或辅助回归(判定系数检验法)
Rj•2:第j个解释变量对其他解释变量的回归方程的判定系数
第二部分
实践中的回归分析
基本假定违背:不满足基本假定的情况。
(1)模型设定有偏误;所选模型是正确设定的 基本假定 所选模型是正确设定的
(2)解释变量之间存在多重共线性; 基本假定 解释变量之间不存在完全线性关系
(3)随机误差项序列存在异方差性; 基本假定 误差项方差为常数
(4)随机误差项序列存在序列相关性。 基本假定 误差项之间不相关
OLS估计量仍是最优线性无偏估计量
完全多重共线性和不完全多重共线性:举例
• 完全多重共线性模型: X3=300-2X2 R2=1, 且相关系数r=1 (模型8-3) 两个变量之间存在精确的线性关系
• 不完全多重共线性模型
X4=299.92-2.0055X2+e
(模型8-9)
R2=0.9770, 且相关系数r=-0.9884
1、OLS估计量的方差和标准误较大。 2、置信区间变宽。 由于标准误较大,故总体参数的置信区间就变宽了。
3、t值不显著。
由于标准误变大,所以t值变小,零假设易被接受。
4、R2值较高,但t值并不都是显著的。 变量间作用抵消。
5、OLS估计量及其标准误对数据的微小变化非常敏感。
6、回归系数的符号有误。

7.2多重共线性的后果

7.2多重共线性的后果

例如, 例如,对于二元线性回归模型
Yi = β 0 + β1 X 1i + β 2 X 2i + ui
如果两个解释变量完全相关,如X 2 = λ X 1,则该二元 线性回归模型退化为一元线性回归模型:
Yi = β 0 + β1 + λβ 2)X 1i + ui (
这时,只能确定综合参数β1 + λβ 2的估计值,无法 确定β1,β 2 各自的估计值。
β1 =
∂Y X1
根据偏导数的概念, 的经济含义是: 根据偏导数的概念,β1的经济含义是:在其他变 量保持不变的情况下, 变化一个单位将使Y变 量保持不变的情况下,X1 变化一个单位将使 变 个单位。 化β1个单位。 但在多重共线性的情况下, 但在多重共线性的情况下,解释变量的相关性将 无法“保持其他变量不变” 无法“保持其他变量不变”,从而也难以分离出 每个解释变量的单独影响。 每个解释变量的单独影响。
四、回归模型缺乏稳定性 从同一总体中抽取不同的样本估计模型, 从同一总体中抽取不同的样本估计模型,得到的 估计值不会完全相同,但不应该有显著差异, 估计值不会完全相同,但不应该有显著差异,此 时称模型为稳定的。 时称模型为稳定的。但是当模型存在多重共线性 样本数据即使有微小的变化, 时,样本数据即使有微小的变化,也可能导致系 数估计值发生明显变化,甚至出现符号错误, 数估计值发生明显变化,甚至出现符号错误,参 数估计对样本的变化比较敏感。 数估计对样本的变化比较敏感。
多重共线性的后果 第二节 多重共线性的后果
• • • • OLS估计量的方差增大 估计量的方差增大 难以区分每个解释变量的单独影响 变量的显著性检验失去意义 回归模型缺乏稳定性
经典回归模型要求模型不存在完全的多重共线 经典回归模型要求模型不存在完全的多重共线 所以,即使模型存在严重的多重共线性, 性,所以,即使模型存在严重的多重共线性,也并 不违背基本假定, 估计仍然是最佳线性无偏估 不违背基本假定,OLS估计仍然是最佳线性无偏估 估计 但多重共线性却会产生以下问题: 计。但多重共线性却会产生以下问题: 一、OLS估计量的方差增大 估计量的方差增大 设二元线性回归模型为: 设二元线性回归模型为:

计量经济学第八讲

计量经济学第八讲

三、多重共线性的检验 (一) 相关系数检验利用相关系数可以分析解释变量之间的两两相关情况。

在EViews 软件中可以直接计算(解释)变量的相关系数矩阵: [命令方式]COR 解释变量名[菜单方式]将所有解释变量设置成一个数组,并在数组窗口中点击View\Correlations. (二) 辅助回归模型检验相关系数只能判断解释变量之间的两两相关情况,当模型的解释变量个数多于两下、并且呈现出较为复杂的相关关系时,可以通过每个解释变量对其他解释变量的辅助回归模型来检验多重共线性,即依次建立k 个辅助回归模型:k i x a x a x a x a a x kki i i i i,,1111111=++++++=++--ε如果,其中某些方程显著,则表明存在多重共线性,所对应的变量可以近似地用其他解释变量线性表示。

辅助回归模型检验不仅能检验多元回归模型的多重共线性,而且可以得到多重共线性的具体形式;如果再结合偏相关关系检验,还能进一步判定是哪些解释变量引起了多重共线性,这有助于分析如何消除多重共线性的影响。

(三) 方差膨胀因子检验对于多元线性回归模型,ib ˆ的方差可以表示成:iijiiijiVIF x x R x x b D ∙∑-=-∑-=22222)(11)()ˆ(σσ其中,i i x R 为2关于其他解释变量辅助回归模型的判定系数,i VIF 为方差膨胀因子。

随着多重共线性程度的增强,VIF 以及系数估计误差都在增大。

因此,可以用VIF 作为衡量多重共线性的一个指标;一般当10>VIF 时,(此时9.02>iR ),认为模型存在较严重的多重共线性。

另一个与VIF 等价的指标是“容许度”(Tolerance ),其定义为:iiiVIF R TOL /1)1(2=-=显然,10≤≤TOL ,当i x 与其他解释变量高度相关时,0→TOL 。

因此,一般当1.0<TOL 时,认为模型存在较严重的多重共线性。

第8章 多重共线性:解释变量相关会有什么后果

第8章 多重共线性:解释变量相关会有什么后果

第8章 多重共线性:解释变量相关会有什么后果本章主要讲授如下内容:8.1 多重共线性的性质8.2 多重共线性产生的原因 8.3 多重共线性的后果8.4 多重共线性的诊断8.5 如何解决多重共线性:补救措施8.1 多重共线性的性质1.完全多重共线性的情形对于变量X 1、X 2……、X k ,如果存在不全为零的数λ1、λ2、……λk ,使得下式成立:02211=+++k k X X X λλλ则称变量X 1、X 2……、X k 之间存在一种完全的共线性。

注意:当解释变量之间存在完全共线性时,不可能获得所有参数的唯一估计值,因而也就不能根据样本进行任何统计推断(即假设检验)。

2.接近或者不完全多重共线性的情形对于变量X 1、X 2……、X k ,如果存在不全为零的数λ1、λ2、……λk ,使得下式成立:02211=++++μλλλk k X X X则称变量X 1、X 2……、X k 之间存在不完全的共线性。

这里,μ为随机误差项。

8.2 多重共线性产生的原因1.经济变量之间往往存在同方向的变化趋势。

2.经济变量之间往往存在着密切的关联度。

3.在模型中采用滞后变量也容易产生多重共线性。

4.在建模过程中由于解释变量选择不当引起了变量之间的多重共线性。

8.3 多重共线性的后果1.增大OLS 估计量的方差和标准差可以证明,参数估计值i b 的方差为:22211)()var(ii iti RX Xb -⋅-=∑σ其中,2i R 是第i 个解释变量对模型中其他解释变量作辅助回归模型),,,,,,(1121k i i i X X X X X f X +-=时的决定系数。

2.可能导致在假设检验中舍去重要的解释变量,检验的可靠性降低。

3.回归模型缺乏稳定性。

4.可能导致回归系数符号的错误。

8.4 多重共线性的诊断多重共线性只是存在的程度而非是否存在的问题,它属于样本特征而非总体特征。

一般可以采取以下方法进行诊断。

1.根据回归结果判断R 2较高但t 值统计显著的不多,这是多重共线性的“典型”特征。

多重共线性

多重共线性


比如对于两个解释变量的模型
Yi 1 X 1i 2 X 2i ui

根据我们前面的讨论,参数的最小二乘估计为:
ˆ 1
2 ( yi x1i )( x2 i ) ( yi x2 i )( x1i x2 i ) 2 2 ( x12i )( x2 ) ( x x ) 1i 2i i
R 2 0.8101 ˆ , ˆ ) 0.00868 cov( 1 2

12 0.5523
df 2
ˆ 在单侧t检验的显著水平10%是显著的(1.886)。 1
第二组数据的回归结果
ˆ 1.2108 Y i se (0.7480) t (1.6187) 0.4014 X 1i (0.2721) (1.4752) 0.0270 X 2i (0.1252) (0.2158)
多重共线性
南开大学数学科学学院 白晓棠
多重共线性

在经典的线性回归模型中,我们假定回归模型中诸回归元 之间无多重共线性。

在本节中我们将放松此要求从而来研究: 1、什么是多重共线性? 2、它会引起什么样的后果? 3、怎样去发现它? 4、我们可以采取哪些补救措施来缓解多重共线性的问 题?
第一组数据
Y 1 2 3 4 5
X1 2 0 4 6 8
X2 4 2 12 0 16
第二组数据
Y 1 2 3 4 5
X1 2 0 4 6 8Leabharlann X2 4 2 0 12 16
第一组数据的回归结果
ˆ 1.1939 Y i se (0.7737) t (1.5431) 0.4463 X 1i (0.1848) (2.4151) 0.0030 X 2i (0.0851) (0.0358)

计量经济学各章习题及答案

计量经济学各章习题及答案

计量经济学各章习题及答案第一章习题一、单项选择1.( ) 是经济计量学的主要开拓者人和奠基人。

A.费歇(fisher) B .费里希(frisch)C.德宾(durbin)D.戈里瑟(glejer)2.随机方程又称为()。

A.定义方程 B.技术方程C.行为方程 D.制度方程3.计量经济分析工作的研究对象是()。

A.社会经济系统B.经济理论C.数学方法在经济中的应用D.经济数学模型二、多项选择1.经济计量学是下列哪些学科的统一()。

A.经济学B.统计学C.计量学D.数学E.计算机2.对一个独立的经济计量模型来说,变量可分为()、A.内生变量B独立变量C外生变量D.相关变量E虚拟变量3.经济计量学分析工作的工作步骤包括()。

A设定模型B估计参数C检验模型D应用模型E收集数据三、名词解释1.时序数据2.横截面数据3.内生变量4.解释变量5.模型6.外生变量第一章习题答案一、单项选择B\C\A二、多项选择1C\D 2A\C 3A\B\C\D三、名词解释1.时序数据指同一指标按时间顺序记录的数据列,在同一数据列中的数据必须是同口径的,有可比性2.横截面数据同一时间,在不同统计单位的相同统计指标组成的数据列,要求统计的时间相同,不要求统计对象及范围相同。

要求数据统计口径和计算方法具有可比性 3.内生变量具有一定概率分布的随机变量,数据由模型本身决定 4.解释变量在模型中方程右边作为影响因素的变量,即自变量 5.模型对经济系统的数学抽象 6.外生变量非随机变量,取值由模型外决定,是求解模型时的已知数第二章习题一、单项选择1.一元线性回归分析中有TSS=RSS+ESS 。

则RSS 的自由度为()。

A nB 1C n-1D n-22.一元线性会规中,0β∧、1β∧的值为( )∑∑---=∧2i)()(0X X Y Y X X ii )(βXY 01∧∧-=ββ XY 10∧∧-=ββ∑∑---=∧2i)()(1X X Y Y X X ii )(βY X =+∧∧10ββ∑∑---=∧2i)()(0X X Y Y X X ii )(βXY 10∧∧+=ββ∑∑---=∧2i)()(1X X Y Y X X ii )(β3.一元线性回归中,相关系数r=( ) A.∑∑∑----222)()()))(Y Y X X Y Y X X i i i i (( B.∑∑∑----22)()())(Y Y X X Y Y X X iiii( C ∑∑∑----22)()())(Y Y X XY Y X X iii i ( D∑∑∑---222)()()(Y Y X XY Y iii4.对样本相关系数r,以下结论中错误的是ABDC( )。

计量经济学简答题及答案

计量经济学简答题及答案

计量经济学简答题及答案-CAL-FENGHAI.-(YICAI)-Company One1计量经济学简答题及答案1、比较普通最小二乘法、加权最小二乘法和广义最小二乘法的异同。

答:普通最小二乘法的思想是使样本回归函数尽可能好的拟合样本数据,反映在图上就是是样本点偏离样本回归线的距离总体上最小,即残差平方和最小∑=n i i e12min 。

只有在满足了线性回归模型的古典假设时候,采用OLS 才能保证参数估计结果的可靠性。

在不满足基本假设时,如出现异方差,就不能采用OLS 。

加权最小二乘法是对原模型加权,对较小残差平方和2i e 赋予较大的权重,对较大2i e 赋予较小的权重,消除异方差,然后在采用OLS 估计其参数。

在出现序列相关时,可以采用广义最小二乘法,这是最具有普遍意义的最小二乘法。

最小二乘法是加权最小二乘法的特例,普通最小二乘法和加权最小二乘法是广义最小二乘法的特列。

6、虚拟变量有哪几种基本的引入方式 它们各适用于什么情况答: 在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。

除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。

7、联立方程计量经济学模型中结构式方程的结构参数为什么不能直接应用OLS估计答:主要的原因有三:第一,结构方程解释变量中的内生解释变量是随机解释变量,不能直接用OLS 来估计;第二,在估计联立方程系统中某一个随机方程参数时,需要考虑没有包含在该方程中的变量的数据信息,而单方程的OLS 估计做不到这一点;第三,联立方程计量经济学模型系统中每个随机方程之间往往存在某种相关性,表现于不同方程随机干扰项之间,如果采用单方程方法估计某一个方程,是不可能考虑这种相关性的,造成信息的损失。

2、计量经济模型有哪些应用。

答:①结构分析,即是利用模型对经济变量之间的相互关系做出研究,分析当其他条件不变时,模型中的解释变量发生一定的变动对被解释变量的影响程度。

第八章 多重共线性:解释变量相关会有什么后果

第八章 多重共线性:解释变量相关会有什么后果
– 检验模型中哪个变量与其他变量高度共线性的方法就是 作每个变量对其他剩餘变量的回归并计算相应的R2值
• (5) 方差膨胀因子(the variance inflation factor) – 随着R22的增加,b2和b3的方差也增加或
膨胀了。
1 VIF 2 1 R2
多重共线性存在的线索2
三、多重共线性的诊断
任务:
(1)检验多重共线性是否存在及度量共线性的程度;
(2)估计多重共线性的范围,即判断哪些变量之间存在
共线性。
注意:
(1)没有度量多重共线性的单一方法; (2)具有的是一些经验法则,即是在具体应用中能够提 供判断存在多重共线性的一些线索。
三、多重共线性的诊断
1、对多个解释变量的模型,采用综合统计检验法 若 在OLS法下:R2与F值较大,但t检验值较小,说 明各解释变量对Y的联合线性作用显著,但各解释 变量间存在共线性而使得它们对Y的独立作用不能 分辨,故t检验不显著。 R2值较高,但解释变量t值统计显著的不多。
如果某两个或多个解释变量之间出现了相 关性,则称为多重共线性(Multicollinearity)。 1、完全多重共线性 2、近似(不完全)多重共线性
完全共线性的情况 并不多见,一般出 现的是在一定程度 上的共线性,即近 似共线性。
一个怪模型
• 商场销售额= B1营业面积+ B2店员人数 + B3铺租+ B4宣传费用+ui • 何以怪?
当完全不共线时, R2 =0
当近似共线时, 0< R2 <1
VIF 1,
补充:产生多重共线性的主要原因(了解)
(1)经济变量相关的共同趋势
时间序列样本:经济繁荣时期,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。

多重共线性的危害

多重共线性的危害
i i
P lim
n
i
n
n
0
那么因为
P lim b1 1 P lim
n
X
i i
i
X i
i
X
X
2
1 0 1
因此 b1 是1 的一致估计。虽然不是无偏估计。
24
三、工具变量法估计
设模型为 Y 0 1 X 其中 X不仅是随机变量,而且与 有强相关性。 对模型作离差变换得 Yi Y 1 X i X i 两边乘 Z Z 并求和得 Zi Z Yi Y 1 Zi Z X i X Zi Z i i i i 然后两边除以 Z Z X X ,有 Z Z Y Y Z Z Z Z X X Z Z X X
8
(二)状态数检验
1、 状态指数 将 X矩阵的每一列 X 用其模 X X X 相除以实现标准化,然后再求 XX 矩阵的 特征值,取其中最大的除以最小的后再求 平方根,得到该矩阵的“状态数”,记为: max min 通常当 大于20或30时,认为存在较 明显的多重共线性。
k
k k
34
一、最大似然估计的原理

根据事物出现的概率(几率、可能性)的 大小,推断事物的真相,包括定性的和定 量的(参数水平)真相。
例1:一个老战士和一个军训学生各射击一 次,但只有一枪中靶。问可能是谁打中的。
β - XX D Dβ
1
19
第二节 随机解释变量
一、解释变量的随机性 二、随机解释变量和参数估计的性质 三、工具变量法估计 四、参数估计量的分布性质和统计推断
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X3i 3000 2 X 2i
Yi A1 A2 X 2 i A3 (300 2 X 2 i ) ui
A1 300 A3 A2 2 A3 X 2 i ui

C1 A1 300 A3 C 2 A2 2 A3
ˆ ˆ X ˆ X ˆ 3t X 3.12 31.2 1t 32.1 2t
• 利用以上偏回归系数,3个变量之间的偏相关系数 可定义如下:
ˆ ˆ r12.3 12.3 21.3
ˆ ˆ r13.2 13.2 31.2
ˆ ˆ r23.1 23.1 32.1
案例分析 一、研究的目的要求
提出研究的问题——为了规划中国未来国内旅游产业 的发展,需要定量地分析影响中国国内旅游市场发展 的主要因素。
二、模型设定及其估计
影响因素分析与确定——影响因素主要有国内旅游 人数 X 2,城镇居民人均旅游支出 X 3,农村居民人均
旅游支出 X 4 ,并以公路里程次 X 5 和铁路里程
8.7鸡肉需求函数[方程(8.15)]的共线性诊断 1.相关矩阵
鸡肉需求函数[方程(8.15)]的共线性诊断 2.辅助回归
8.8 如何解决多重共线性:补救措施
• • • • • • 从模型中删掉一个变量 获取额外的数据或新的样本 重新考虑模型 参数的先验信息 变量变换 其他补救措施
(1)从模型中删掉一个变量
留该变量。
若新变量的引入未能改进 R 2 和 F 检验,且对其他回 归参数估计值的t 检验也未带来什么影响,则认为该 变量是多余变量。 若新变量的引入未能改进 R 2 和 F 检验,且显著地影 响了其他回归参数估计值的数值或符号,同时本身的 回归参数也通不过t 检验,说明出现了严重的多重共 线性。
(6)其他补救措施 因子分析、岭回归、主成分分析等方法
补充:逐步回归法
(1)用被解释变量对每一个所考虑的解释变量做简
单回归。
(2)以对被解释变量贡献最大的解释变量所对应的
回归方程为基础,按对被解释变量贡献大小的顺
序逐个引入其余的解释变量。
若新变量的引入改进了 R 2 和 F 检验,且回归参
数的t 检验在统计上也是显著的,则在模型中保
Yi C1 C2 X 2i ui (8 4)
对(8-4)进行回归得:
ˆ 49.667 2.1576X Y i 2i se (0.746)(0.1203)
(8 7)
t (66.538)(-17.935) (9.6417) r 2 0.9757
结论:解释变量之间存在完全相关或者完全多重 共线性时,不可能获得所有参数的唯一估计值。
• 但是这一补救措施比多重共线性本身还糟糕。因 为在构建经济模型时,是以一定的经济理论为基 础的,因此删除这些变量又会导致模型设定错误。 • 如果仅仅为了消除多重共线性而从模型中删除一 个变量,可能得到参数的有偏估计。
• 多重共线性是一个样本特征,因此如果同样一组 变量换一组样本可能多重共线性就不那么高(当 然也可能更高)。 • 但是收集数据的成本或许很高。
回归结果显示,价格与工资高度相关,相关系数为0.9984,即存在近似完全线性关系。 顺便指出:在只有两个解释变量的情况下,相关系数 用于共线性程度的度量,多于两个不可以。
多重共线性的来源
(一)数据采集方法问题 (二)模型或从中取样的总体受到约束 (三)模型设定问题 (四)一个过度决定的模型
8.3 多重共线性的理论后果
• 如果研究的目的不仅仅是预测,而且还要 可靠地估计出模型的参数,则严重的共线 性就是一件“坏事”,因为它导致了估计 量的标准误增大。
8.7
1960-1982年期间美国的鸡肉需求
1960-1982年美国的人均鸡肉需求量Y,人均 实际可支配收入X2,鸡肉的实际零价格X3,猪 肉的实际零售价格X4,牛肉的实际零售价格X5。 估计的需求函数为:
2 2
VIF被称为方差膨胀因子。随着R2的增大, var ˆ 也增大,或者说膨胀了。
j
1 VIFj (1 R 2 j)
注意:诊断多重共线性的方法很多,但是没 有哪一种能够彻底诊断多重共线性问题。多 重共线性是一个程度问题,是一种样本现象。
补充:偏回归系数
• 已知,样本相关系数
r=
• • • • • (1)OLS估计量的方差和标准误较大。 (2)置信区间变宽。 (3)t值不显著 。 (4)R2 值较高,但t值并不都是统计显著的。 (5)OLS估计量及其标准误对数据的微小变化非 常敏感,即它们很不稳定。 • (6)回归系数符号有误。 • (7)难以评估各个解释变量对回归平方和(ESS) 或者R2的贡献。
如何解释这些结果,做价格X2对工资X4的关系图, 如下
图8-2 工资X 4和价格 关系 X2
• 回归结果为
X 4 i 299.92 2.0055X 2 i ei se (0.6748)(0.1088) t (444.44)(-18.44) (9.6417) r 2 0.977
(8 8)
t (1.2107)(-3.4444) ( 0.7971) r 2 0.9778
• 回归结果显示: • (1)模型(8-2)是可估计的。 • (2)两次估计的价格系数都是负的,并且差别不大, 这和预期的价格系数方向一样。相对而言,(8-7)中 价格的t统计量和标准误都略高于(8-8)。 • (3)R2略有增加,0.0021。 • (4)工资的系数是统计不显著的,符号也有错误。 • (5)尽管收入变量不显著,但若假设B2=B3=0,但是 根据(4-49)的F检验很容易拒绝原假设。
8.2 近似或者不完全多重共线性的情形
进行经济数据的分析时,变量间常常表现出不完全 线性相关,但共线性程度很高的情形,这就是近似、 不完全或者高度多重共线性的情形。 用表8-1中的数据估计(8-2)得到如下结果:
ˆ 145.37 2.797X 0.3191X Y i 2i 4i se (120.06)(0.8122)(0.4003)
在LIV(变量线性)模型中,收入系数是统计不显 著的,但猪肉价格系数却是显著的。 产生这一变化的原因是收入与价格之间存在高度 共线性。
(4)参数的先验信息
• 根据先验研究了解有关参数的某些信息,而这些 信息适用于当前样本。 • 例如饰品需求函数中,收入系数为0.9,并且统 计显著。 • 如果认为收入系数(0.9)[0.87164]没有变化,则 可以重新估计方程。 • 需求量=B1+B2价格+B3工资+u • =B1+B2价格+0.9工资+u • 需求量- 0.9工资= B1+B2价格+u • 这样自变量只有一个,不存在多重共线性问题。
用表8-1中的数据拟合模型,计算机拒绝估计 回归。做价格(X2)对收入(X3)的回归, 得如下关系图。
这说明收入与价格完全线性相关,即完全共线性。所有 不能对方程(8-1)进行回归。
将收入与价格之间的关系带入(8-1)得
Yi A1 A2 X 2i A3 X3i ui (8 1)
(四)辅助回归 做每个解释变量对其他剩余变量 的回归并计算相应的R2值。其中的每 一个回归都被称为是从属或者辅助回 归。
例子
(五)方差膨胀因子
Yi 1 2 X 2i 3 X 3i k X ki ui
ˆ var j

VIFj 2 2 2 x j 1 R j x j
• 这一方法的缺陷在于先验信息并不总是可获得的。 更致命的是,即使能够获得这一信息,但是假设 先验信息在当前样本仍是有效的,这样的要求显 得“很高”。
• 当然如果各个样本间的收入效应预期变化不大, 并且得知有关收入系数的先验信息,那么这一补 救措施则是行之有效的。
(5)变量变换
• 通过对模型中的变量进行变换也能够降低共线 性程度。
为什么讨论多重共线性?
1.在近似共线性的情形下,OLS估计量仍然是 无偏的。 2.近似共线性并未破坏OLS估计量的最小方差 性。 X 之间不是线 3.即使在总体回归方程中变量 X 变量之间可 性相关的,但在某个样本中, 能线性相关。 【 多重共线性问题是一个样本问题 】
8.4 多重共线性的实际后果
8.5 多重共线性的诊断
一、多重共线性是一个样本特性,是一个样本现象。 多重共线性是一个程度问题而不是存在与否问题。 多重共线性针对的是解释变量,因此是样本特征,不是 总体特征。
二、侦察多重共线性的规则【线索】
(一)R2值高而显著的t比率少 (二)解释变量之间有高度的两两相关 可以计算两两变量之间的相关系数,如果有些相关系数 很高(超过0.8) ,则可能存在较为严重的共线性。但是 这一标准并不十分可靠。 (三)检查偏相关系数 假设3个解释变量X2,X3,X4,X2与X3的相关系数为r23,X2与X4 的相关系数为r24,X3与X3的相关系数为r34。假如r23=0.9,说 明X2与X3之间高度相关,但是若考察偏相关系数r23,4,即变量 X4保持不变的条件下X2与X3之间的相关系数却仅为0.43。那么 根据偏相关系数不能说明X2与X3之间的共线性程度很高。 但是偏相关系数不能保证对多重共线性提供一个准确的指南。
(2)获取额外的数据或新的样本
• 增加样本容量也可以消减多重共线性。但是和换 一组样本一样,收集数据的成本或许很高。
(3)重新考虑模型
• 在LIV(变量线性)模型中,共线性可能不像双对 数模型那样高。 • 以表7-8中的数据来拟合LIV模型,得如下结果:
37.232-0.00501X -0.6122X +0.1984X +0.0695X Y 2 3 4 5 t (10.015)(1.0241) (-3.753)(3.1137)(1.3631) r 2 0.9426 r 2 =0.9298
相关文档
最新文档