第七章 多重共线性 《计量经济学》PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、不显著系数法
(1)如果拟合优度值 R2 很大(一般大于0.8),但模型
中全部或部分参数估计值却不显著,便意味着自变 量之间存在多重共线性。 (2)从经济理论知某个自变量对因变量有重要影响, 但其系数的OLS估计量却不显著,一般就应怀疑是 多重共线性所致。 (3)如果对模型增添一个新的自变量之后,发现模型 中原有参数估计值的方差明显增大,则表明在自变 量之间(包括新添自变量在内)可能存在多重共线性。
x12i
x
2 2i
(
x1i
x 2i
)2
y i
x
2 2i
x 2i
y i
2
(
x
2 2i
)2
x
2 2i
x
2i
2
(
x
2 2i
)2
y i
0 0
(7.2.2)
用同样的方法可得:
ˆ 2
0 0
(7.2.3)
由(7.2.2)和(7.2.3)式知,参数估计值无法确定。
再来考虑参数估计量的方差:
V
(
ˆ
)
1
2 u
x 22i
值是依赖vi的数值来确定,而残差对不同的样本变化
较大,因而使得
ˆ
的数值很不稳定。
1
同样,对
ˆ
也有类似结果。
2
再来考察参数估计量的方差:
对模型(7.2.1)参数估计量 ˆ1的方差为:
V
(ˆ1)
x12i
2 u
x 22i
x22i ( x1i
x2i )2
2 u
/
x12i
1 r122
(7.2.9)
其中r12为x1i和x2i之间的相关系数
对y的解释作用近似地替代,即xj可近似地由
x1, x2 ,, x j1, x j1,, xk 线性表示。从而可知,xj是
起到严重多重共线性的变量。
四、相关系数矩阵法
对模型
y 0 1 x1 k xk u
其相关系数矩阵
r11
R
r 21
r12
r 22
r1k 1
r2k
r21
并且估计值的方差变为无穷大。
二、不完全多重共线 假定模型(7.2.1)中的x1与x2高度相关,为计算方 便起见,二者之间的关系采用离差形式表示:
x1i x2i vi
并且回归残差vi满足 vi 0 x2i vi 0
计算回归参数
(7.2.6) (7.2.7)
ˆ1
x
2 2i
x1i
y i
x1i
二、利用辅助回归方程检验
设原模型中有k个解释变量,则可利用它们构成k个
回归方程:
x1 f (x2 , x3 ,, xk) x2 f (x1, x3 ,, xk)
x j f (x1, x2 ,, x j1, x j1,, xk)
xk f (x1, x2 ,, xk1)
(7.3.1)
分别求出其拟合优度。如果其中最大的一个接近1,
这时
| X ′X | ≈ 0
(7.2.17)
此时
ˆ ( X X )1 X Y
(7.2.18)
虽然可以估计参数β,但是数值很不稳定,又由于
( X X )1
对角线元素很大,从而方差
V
(ˆ
)
i
2 u
(
X
X
)ii1
很大。
综上所述,多重共线性的后果概括如下:
1.多重共线性使得参数估计值 ˆi 很不稳定,并且对
r122
( x1i x2i )2 x12i x22i
(7.2.10)
从(7.2.9)式可以看出,∣r12∣的值越大,即共线程度
越强,方差就越大。
以上分析,我们可推广到一般模型
中去。
Y X U
(7.2.11)
完全多重共线,即解释变量中存在
0 1 x1i k xki 0 (7.2.12)
4.参数的置信区间明显增大。在存在多重共线性
情况下,由于参数方差的增大,因此参数的置信
区间也将增大。
§7.3 多重共线性的检验 由于多重共线性是一种较为普遍的现象,当多重共 线性程度较高时,会给参数估计造成严重后果,因 此,我们关心的问题是(1)自变量之间是否存在多重 共线,(2)多重共线性的严重程度,(3)多重共线的形 式或性质。 下面我们给出高度多重共线性的几种常见的检验方法。
考察主对角线上方(或下方)的元素即可。由于多重 共线性就是指自变量之间的高度相关,所以只要发 现矩阵主对角上方(或下方)某个元素的绝对值很大 (例如在0.8以上),便可认为相应的两个自变量之间 存在多重共线性。
§7.4 消除多重共线性的方法 多重共线性一旦被检测出来,并且认为很严重时, 就应努力减轻其不良影响。 一、增加样本容量 若多重共线性是样本引起的,也就是说,自变量的 相关性仅偶然地存在原始样本中而不存在于总体中 时,增加样本容量可以减少多重共线性的影响。
(7.3.4)
再依次求出相应的拟合优度
R12
,
R22
,,
R
2 j
,
,
Rk2
。
如果
R2j max{ R12 , R22 ,, R2k}
(7.3.5)
并且R
2 j
与
R2
很接近,则说明模型中增加变量
x
j后,
x1, x2 ,, xk 与y的线性相关的显著程度并没有明显
增加,xj对y的解释作用可以由 x1, x2 ,, x j1, x j1,, xk
样本非常敏感。
2.多重共线性使得参数估计值的方差V
(ˆ
)
i
增大。
3.在对参数进行显著性t检验时,将导致模型的定型
错误。
这是因为统计量
T ˆi
Vˆ
(ˆ
)
i
(7.2.19)
由于多重共线性使
V
(ˆ
)
i
增大,使得|T|变小,
因而使得下式成立的机会变大:
|T|< t / 2
(7.2.20)
即更易于使T值落在接受原假设的范围之内。
r12 1
r1k r2k
rk1 rk 2 rkk rk1 rk 2 1
(7.3.6)
其中
rij
xi x j xi2 x2j
(i , j =1,2,…,k) (7.3.7)
因为 rij r ji ,所以,相关系数矩阵(7.3.6)是
对称矩阵。 r jj =1,所以在相关系数矩阵中只须
x 2i
x 2i
x12i x22i ( x1i x2i )2
y i
x
2 2i
[
(x 2i
vi)
y i]
x 2i
y i [
(
x 2i
vi)
x 2i ]
x22i ( x2i vi )2 [ ( x2i vi) x2i ]2
y i vi vi2
(7.2.8)
由于 vi2 0 ,所以ˆ1是可以确定的。但是,ˆ1 的数
了L与K之间的多重共线性。
四、变换模型形式 有些经济模型并不要分析每个解释变量对被解释变 量的影响程度,因此当存在多重共线性时,可以根 据经济理论或实际经验将原模型作某些变换或改变 变量的定义形式,从而避免或减少多重共线性的影 响。 例7.4.2
Y 0 1 X 2 P 3 P1 u
则它所对应的解释变量xj与其它解释变量中的一个或 几个之间高度相关,足以引起解释变量之间的多重
共线性。
三、利用缺某一个解释变量的拟合优度检验
设有线性回归模型
y f (x1, x2 ,, xk ,u)
其中共有k个解释变量,其拟合优度为 R2。为检验
多重共线,依次建立缺一个解释变量的回归方程:
y f 1(x2 , x3,, xk) y f 2 (x1, x3 ,, xk) y f j (x1, x2 ,, x j1, x j1,, xk) y f k (x1, x2 ,, xk1)
二、出现多重共线性的原因 引起多重共线性的具体原因是各种各样的,一般常 见的有: 1.两个自变量具有相同或相反的变化趋势; 2.数据收集的范围过窄,造成某些自变量之间似乎有 相同或相反变化趋势的假象; 3.经济变量之间往往存在着密切的关联度,因此,使 某些自变量之间存在某种类型的近似线性关系; 4.一个自变量是另一个自变量的滞后值。 5.模型中解释变量选择不适当,可能引起变量之间的 多重共线。
解释变量的完全多重共线性,也就是,解释变量之 间存在严格的线性关系,即数据矩阵的列向量线性 相关,因此,必有一个列向量可由其余列向量线性 表示。这种完全多重共线性是一种极端情形。 在实际中还有另外一种情况,即解释变量之间虽然 不存在严格的线性关系,却有近似的线性关系,即 指解释变量之间高度相关。
完全多重共线性和不完全多重共线性,统称为多 重共线性。因此,所谓多重共线性是指解释变量 之间存在完全的线性关系或近似的线性关系。 多重共线性基本上是一种样本现象。因为人们在 制定模型时,总是尽量避免将理论上具有严格线 性关系的变量作为自变量收集在一起,因此,实 际问题中的多重共线性并不是自变量之间存在理 论上或实际上的线性关系造成的,而是由于所收 集的数据(自变量观察值)之间存在近似的线性关 系所致。
§7.2 多重共线性的后果
一、完全多重共线
为了简单起见,我们先以二元线性回归模型(7.2.1)
为例进行讨论。
考虑模型 并且假设
yi 0 1 x1i 2 x2i ui
x1i x2i 常数λ≠0。
显然,β1的最小二乘估计量为
(7.2.1)
ˆ1
x
2 2i
x1i
y i
x1i
x 2i
x 2i
二、不作处理
1.当所有参数估计量都显著或者t值皆远大于2时,对
多重共线性可不作处理。
2.当因变量对所有自变量回归的拟合优度R2值大于缺
任何一个自变量对其余自变量回归的拟合优度值
R
2 j
时,对多重共线性可不作处理。
3.如果样本回归方程仅用于预测的目的,那么只 要存在于给定样本中的共线现象在预测期保持不 变,多重共性就不会影响预测结果,因此多重共 线性可不作处理。 4.如果多重共线性并不严重影响参数估计值,以 至于我们感到不需要改进它时,多重共线性可不 作处理。
第七章 多重共线性 【本章要点】(1)多重共线性的概念,产生多重 共线性的原因。(2)多重共线性对模型参数估计 的影响;(3)检验多重共线性的主要方法;(4) 消除多重共线性的方法。 §7.1 多重共线性的概念 一、多重共线性的基本概念 如果在经典回归模型Y =X β +U中,经典假定6遭 到破坏,则有rk(X) < k+1,此时称解释变量间存在 完全多重共线性。
x12i x22i ( x1i
x2i )2
2 u
x 22i
2 ( x22i )2 2 ( x22i )2
(7.2.4)
用同样的方法可得
V
(ˆ
)
2
(7.2.5)
(7.2.4)和(7.2.5)式表明,ˆ1和ˆ2 的方差变为无穷
大。以上分析表明,当解释变量存在完全多重共线
性时,利用普通最小二乘法无法将参数估计出来,
三、利用事前信息 这里的事前信息指经济理论知识或前人研究的成 果。信息可能对某些参数之间的关系提供线索或 资料,运用参数之间的事前信息可消除多重共线 性。
例7.4.1 生产函数
Y A L1 K 2 e
(7.4.4)
其中Y、L、K分别表示产出、劳力和资本,A, 1, 2
分别为未知参数,ε为随机项。
五、将时间序列与横断面数据结合使用 设商品销售模型
yt 0 1 x1t 2 x2t ut
(7.4.10)
其中yt、x1t、x2t分别表示第t期该商品的销售量、价
格和消费者的收入。对于时间序列来说,一般x1t与
x2t具有高度共线的倾向。为了摆脱共线性的干扰,
可以再取一个横截面样本。因为在横截面样本中价
将(7.4.4)两边取对数可得,
ln Y ln A 1ln L 2 ln K
(7.4.5)
L与K之间可能高度相关。如果按照经济理论在“生
产规模报酬不变”的假定下,参数之间有关系:
1 2 1
(7.4.6)
将(7.4.6)代入(7.4.5)得
ln
Y K
0 1ln
L K
(7.4.7)
其中 0 ln A ,(7.4.7)变成一元回归模型,消除
其中λi不全为零。于是
便有
rk(X) < k +1
| X ′X |=0
(7.2.13) (7.2.14)
从而使得参数估计量
ˆ ( X X )1 X Y
(7.2.15)
不存在(因为在计算( X X )1 X Y 时,要使用
| X ′X |作分母。)
不完全多重共线,即解释变量之间存在近似共线
性,即
0 1 x1i k xki 0 ( i不全为零) (7.2.16)
(7.4.8)
其中Y、X、P、P1分别代表需求量、收入、该商品
的价格和替代商品的价格。由于该商品价格与替代 商品价格之间往往是同方向变动的或是高度相关的, 使模型存在多重共线性。若用两种商品价格比代替 之,使模型(7.4.8)改为:
Y
0
1X
2
(
P)
P1
uwenku.baidu.com
(7.4.9)
形式,则可避免两种商品价格变量之间的多重共线性。
格x1可以看作是不变的,所以y仅是收入x2的函数。 因此,建立在横截面样本上的模型为:
yi 0 1 x2i ui
(7.4.11)
这是一个一元模型,没有共线问题。可用横截面样
本先求出(7.4.11)的1估计值 ˆ,1 然后用 ˆ1代替