7.4多重共线性的修正方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四节 多重共线性的修正方法
• 增大样本容量 • 剔除变量法 • 利用附加信息 • 变换变量形式 • 横截面数据与时序数据并用 • 逐步回归法
1. 增大样本容量
如果样本容量增加,会减小回归参数的方差, 标准误差也同样会减小。因此尽可能地收集 足够多的样本数据可以改进模型参数的估计。
问题:增加样本数据在实际计量分析中常面 临许多困难。
例如,如果将需求函数设成:
Q 0 1Y 2P0 3P1 u
其中Y表示收入,P0 表示商品自身价格,P1 表示 相关商品价格。
商品自身价格P0与相关商品价格P1之间往往是高 度相关的,此时可以用相对价格P0/P1 综合反映 价格因素的影响,从而需求函数可设成:
Q 0 1Y 2 (P0 / P1) u
5. 横截面数据与时序数据并用
首先利用横截面数据估计出部分参数,再利 用时序数据估计出另外的部分参数,最后得 到整个方程参数的估计。
注意:这里包含着假设,即参数的横截面估 计和从纯粹时间序列分析中得到的估计是一 样的。
6.逐步回归法
(1)用被解释变量对每一个解释变量做简单线 性回归,从中选择一个最合适的回归方程作为基 本回归方程,通常选取拟合优度R2最大的回归 方程。
2. 剔除变量法
把引起多重共线性的解释变量首先剔除,再 重 新建立回归方程,直至回归方程中不再存在 严 重 注的 意多: 若重剔共除线了性重。要变量,可能引起模型的 设 定误差。
3. 利用附加信息
如果通过经济理论分析能够得到某些参数之 间的关系,则可以通过参数代换减少或避免 多重共线性。例如,著名的柯布-道格拉斯生 产函数中
(2)在基本回归方程中分别引入第二个解释变 量,重新进行线性回归。
若新变量的引入改进了R2和F检验,且回归参数 的t检验在统计上也是显著的,则在模型中保留 该变量。
若新变量的引入未能改进R2和F检验,且对 其他回归参数估计值的t检验也未带来什么 影响,则认为该变量是多余变量。
若新变量的引入未能改进R2和F检验,且显 著地影响了其他回归参数估计值的数值或符 号,同时本身的回归参数也通不过t检验,说 明出现了严重的多重共线性。
Y AL K
劳动投入量L和资金投入量K之间通常是高度相关 的,如果已知附加信息:
+=1 (规模报酬不变)
则
Y AL1 K AL( K )
L
即
Y A( K )
Baidu NhomakorabeaLL
记
Y* Y , L
K* K L
则C-D生产函数可表示成:
Y* AK*
4. 变换变量形式 对原设定模型中的变量进行适当的变换,可以 消除或削弱原模型中解释变量之间的相关关系, 如引入差分变量、相对数变量等。
(3)再继续引入第三个解释变量,如此下去,直 到无法引入新的解释变量为止。
• 增大样本容量 • 剔除变量法 • 利用附加信息 • 变换变量形式 • 横截面数据与时序数据并用 • 逐步回归法
1. 增大样本容量
如果样本容量增加,会减小回归参数的方差, 标准误差也同样会减小。因此尽可能地收集 足够多的样本数据可以改进模型参数的估计。
问题:增加样本数据在实际计量分析中常面 临许多困难。
例如,如果将需求函数设成:
Q 0 1Y 2P0 3P1 u
其中Y表示收入,P0 表示商品自身价格,P1 表示 相关商品价格。
商品自身价格P0与相关商品价格P1之间往往是高 度相关的,此时可以用相对价格P0/P1 综合反映 价格因素的影响,从而需求函数可设成:
Q 0 1Y 2 (P0 / P1) u
5. 横截面数据与时序数据并用
首先利用横截面数据估计出部分参数,再利 用时序数据估计出另外的部分参数,最后得 到整个方程参数的估计。
注意:这里包含着假设,即参数的横截面估 计和从纯粹时间序列分析中得到的估计是一 样的。
6.逐步回归法
(1)用被解释变量对每一个解释变量做简单线 性回归,从中选择一个最合适的回归方程作为基 本回归方程,通常选取拟合优度R2最大的回归 方程。
2. 剔除变量法
把引起多重共线性的解释变量首先剔除,再 重 新建立回归方程,直至回归方程中不再存在 严 重 注的 意多: 若重剔共除线了性重。要变量,可能引起模型的 设 定误差。
3. 利用附加信息
如果通过经济理论分析能够得到某些参数之 间的关系,则可以通过参数代换减少或避免 多重共线性。例如,著名的柯布-道格拉斯生 产函数中
(2)在基本回归方程中分别引入第二个解释变 量,重新进行线性回归。
若新变量的引入改进了R2和F检验,且回归参数 的t检验在统计上也是显著的,则在模型中保留 该变量。
若新变量的引入未能改进R2和F检验,且对 其他回归参数估计值的t检验也未带来什么 影响,则认为该变量是多余变量。
若新变量的引入未能改进R2和F检验,且显 著地影响了其他回归参数估计值的数值或符 号,同时本身的回归参数也通不过t检验,说 明出现了严重的多重共线性。
Y AL K
劳动投入量L和资金投入量K之间通常是高度相关 的,如果已知附加信息:
+=1 (规模报酬不变)
则
Y AL1 K AL( K )
L
即
Y A( K )
Baidu NhomakorabeaLL
记
Y* Y , L
K* K L
则C-D生产函数可表示成:
Y* AK*
4. 变换变量形式 对原设定模型中的变量进行适当的变换,可以 消除或削弱原模型中解释变量之间的相关关系, 如引入差分变量、相对数变量等。
(3)再继续引入第三个解释变量,如此下去,直 到无法引入新的解释变量为止。