8多重共线性 问题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Thanks for your presence and advice!
0,为 已 知 常 数 。 ( 即 获 得 了 附 加 信 b 息 1 b2) , 则
令
X * λX 1 X 2,则新模型为一元线性 回归模型 Y a b2 X * μ
克服了多重共线性。
ˆ .则原模型中 b ˆ λb ˆ , ˆ, b 利用OLS 得到a 2 1 2 ˆ X b ˆ X , 样本回归函数 ˆ a ˆb 故Y
i 1 1i 2 2i
ii模 型 变 换 法 ;
原 设 定 的 模 型 如 果 存多 在重 共 线 性 , 有 时 进适 行当 的 变 换 可 以 消 除 或 削 弱重 多共 线 性 。 主 要 有 : 变 换 模 型 的数 函形 式 ; 变换模型的变量形式; 变 换 模 型 中 解 释 变 量统 的计 指 标 。
面 板 数 据 , 则 可 以 如 果 能 够 同 时 获 得 时数 序据 和 横 截 面 数 据 先 利 用 其 中 一 类 数 据计 估出 部 分 参 数 , 再 利另 用一 类 数 据 估 计 出 模 型 的 其 余 参。 数 例 如 : 某 一 类 商 品 的求 需函 数 为 : lnY b0 b1 ln X b2 ln P
改 变 模 型 的 统 计 指 标 例2:
如 原 来 需 求 函 数 模 型定 设 为Q b0 b1Y b2 P0 b3 P1 μ; Y为 需 求 量 , P0 为 商 品 自 价 格 , P1为 商 品 互 价 格 ; 两 者 往往高度相关。
P0 此 时 , 可 考 虑 用 相 对格 价 来 综 合 反 映 价 格 因 素影 的响 , P1 P0 而将需求函数设定为 Q a0 a1Y a 2 P ; 1
1 1,i 2 i 2,i k k,i
1.完全共线性 : 存在ci i 1,2, , n不全为 0, 使
c1 X 1,i c2 X 2,i ck X k,i vi 0.
完 全的 共 线 性 不 多 见 , 一 的 般共线性表现为 近似共线性
用矩阵表示就是:
Y Xβ μ 中 1 X 11 1 X 12 X 1 X 1n
S4.3 多重共线性
多重共线性:多元线性模型中的各个解释 变量
之间如果不满足互不相关的性质,即至少有某两个 解释变量之间存在相关性。(Multicollinearity)
c X c X c X 0. 2.近似共线性: 存在c i 1,2, , n不全为0,使
(1)判定系数检验法(又称辅助回归
模型检验法)
对k元 线 性 回 归 模 型 来 说 建 可 立k个 线 性 回 归 模 型 X 1 f X 2 , X 3 , , X k ; X 2 f X 1 , X 3 , , X k ;
X k f X 1 , X 2 , , X k 1 ;
其它某一列线性表示使 。 得r X k 1. 两不同指标提供的信严 息重重叠。
X 21 X k1 X 22 X k2 至少存在一列可以用 X 2n X kn nk 1
S4.3.1多重共线性产生的原因: 1.经济变量之间的内在联系,是多重共线 性存在的根本原因。 许多经济变量表现为同向化趋势。 比如经济繁荣时期,许多正向经济指标 表现为同向增长;经济衰退时 ,又放慢 增速。 再如,农业生产函数中耕地面积与 施肥量,相关密切,与规模密切相关。
引 入差 分 变量 , 改 变模 例1 : 型 变量 形 式
某 一行 业 的投 资 函 数模 型I t b0 b1Yt b2Yt 1 μ, 其 中Yt 为 需求 , 由 于 Yt 与Yt -1相 关性 较 强, 存 在共 性 线,
可以考虑采用模型
I t a0 a1Yt 1 a2 Yt μ ; 需求增量 ΔYt Yt Yt 1
Y商 品 , X居 民 收 入 , P商 品 价 格 。 并 且 已 知 时 在间 序 列 数 据 中X与P高 度 相 关 , 为 此 1先 收 集 最 近 1年 内 该 种 商 品 的 销 售 Y 量 与居民收入 X的 统 计
iii综 合 利 用 混 合 数 据 ;
, 由 于 一 年 内 商 品 价 变 资 料横 截 面 数 据 格动 幅 度 不 大 , 所 以 将需求函数模型设为 lnY a0 a1lnX i μi ˆ1 得到收入弹性, a
β
或由β 1 α, 变换模型,方法类似。
例2: 设工业能源需求函数Y 为 a b1 X 1 b2 X 2 μ, 其 中X 1、X 2 分 别 为 重 、 轻工业总产值,此模不 型仅可以 反映工业经济增长对源 能的需求情况,而且以 可反映 工业结构变化对能源求 需的影响,但轻、重业 工发展 的共向性,很可能使型 模产生多重共线性。
主 要采 用 “ 由 少 到 多 ” 的 入 引解 释 变 量 的 过 程 。
(3)根据回归结果判断
如 果参数估计模型结果中, 拟合优度很高, 方程F 检验高度显著,并且出 现以下一种或几 种情况的。 10.参数估计值符号不对。 20.有些解释变量的 t 值偏低或不显著。 30.当一个不太重要的解释 变量删除后, 重新估计的参数与原变 化很大。 则认为存在多重共线性 。
多重共线性的检验任务:(1)模型是否存在 多重共线性。(2)如果存在多重共线性,是由哪 些变量引起的。这样才有助于解决多重共线性带 来的问题。
1.相关系数检验法
对样本中任两个样本求简单相关系数 r,
若 r 0.8,则说明这两个解释变量 之间存 在严重的多重共线性。
• 2.综合统计检验法
对第2个任务则有
(1)经济意义不合理。
如 生产 函 数 中 , K 资 金与L劳 动高 度 相 关 , 但 直 接 剔 除 它 们 中 的 任 何 一都 个显 然 是 不 合 适 的 ,为 因K, L都 是 重要解释变量。
(2)如果为了消除多重共线性,而剔除了
重要的解释变量 容易引起异方差性和序列相关。
1.剔除法 通常采用的剔除方法有直接剔除法和 间接剔除法。
所以与原模型变为 ˆ1lnX b0 b2 lnPi μi lnYi a Yi b0 b2 lnPi μi
*
2由 于 原 模 型 中 b1也 是 收 入 的 收 入 弹 性 所 。 以b1 a1 这 里 实 际 上 假 设 历 年 平 的均 收 入 弹 性 与 近 期收 的入 弹 性 近 似 相 等
10.直接剔除法:主要采用 “由多到少”直接剔除 不显著的或次要的解释 变量。
20.间接剔除法:
i利 用 附 加 信 息 ; ii模 型 变 换 法 ; iii 综 合 利 用 混 合 数 据 ;
关于间接剔除法
i 利 用 附 加 信 息 ;
例1 : 在Cobb Douglas生 产 函 数 中 , Y ALα K β e μ , 其 中K与L高 度 相 关 , 产 生 了 多 共 重线性,如果已知 模型为规模报酬不变 型 即附加信息 1, 可 以 利用附加信息消除多共 重线性。
(2)逐步回归法
先 从 所 有 被 考 虑 为 最能 可的 解 释 变 量 中 选 择个 一作 为 解 释 变 量 , 进 行 参 OLS 数 估计和显著性检验。如 果 不 显 著 , 剔 除 该 变, 量从 剩 余 的 变 量 中 引一 入个 新 变 量 , 建 立 模 型 ,进 再行 参 数 OLS估 计 和 显 著 性 检 验 , 如 果 显 著 , 保, 留再 从 剩 余 的 可 能 变中 量引 入一新变量,进行 OLS估 计 和 显 著 性 检 验 , 此 如下 去 , 直 到 模 型 之 外 所变 有量 都 不 显 著 为 止 。
办法如下: 因 为α β 1 α 1 β Y AL 也
1- β
K e
β
μ
K μ AL e , L
β
Y K μ A e L L 两边取以 e为 底 的 对 数 Y K ln lnA βln μ L L Y K * * * 记 Y ln , A lnA, K ln L L 得 :Y * A* βK * μ
2.参数的估计方差变大,不再具有有效性 (方差最小性)。
3.参数的 t 检验可靠性减低,容易把重要的解 释变量误判为不显著,从而剔除。
因 为t
ˆ β j Sβ ˆ
j
,多 重 共 线 性 使 Sβ ˆ 变大,
j
t 变得过小 ,很可能接 受 H0.
S4.3.3多重共线性的检验
多重共线性表现为若干解释变量之间相关, 主要的检验方法是统计方法。
由 于b1、 b2 反 映 的 是 重 、 轻 工 业 单 的位 能 耗 , 如 果 根 据 历 史 统 计 资 料 测 得 重业 工的 单 位 能 耗 是 轻 工 业 的 λ倍 原 工 业 能 源 需 求 函 数以 可表 示 成 Y a λb2 X 1 b2 X 2 μ a b2 λX 1 X 2 μ
2.解释变量中含有滞后变量。跟建模有关。 3.时间序列数据也是易产生多重共线性。 事物发展的渐进性规律。 S4.3.2多重共线性产生的后果:
1.极端情况下,如果解释变量之间存在完全共线 性,则导致
1 ˆ X X 0, X X 不可逆了, βOLS X X X Y 不存在 .
分别计算 各个模型的拟合优度 R , R , , R 和
2 1 2 2 2 k
统计量 F1 , F2 , , Fk .
2 2 2 若Ri2 max R1 , R2 ,, Rk 接近 1 ,并且其统计
量Fi 显 著 地 大 于 临 界 值 , 说 则明 解 释 变 量 X k与 其 余 变 量 存 在 多 重 共性 线。
(4)方差膨胀因子检验 (5)特征值检验方法
S4.3.4多重共线性的解决办法
首先明确两点: (1百度文库多重共线性的主要后果是无法判定每个
解释变量的单独影响。因此,如果是为了预测, 只需拟合优度较高,能正确反映解释变量的总 影响即可。可以忽略多重共线性问题。
(2)消除多重共线性的根本办法是从模型
中剔除 这些引起多重共线性的变量。但如果不 加区分地断然剔除该变量,不妥。