应用回归分析第章课后习题答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第6章

6.1 试举一个产生多重共线性的经济实例。

答:例如有人建立某地区粮食产量回归模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3。由于农业投入资金X3与化肥用量X1,水浇地面积X2有很强的相关性,所以回归方程效果会很差。再例如根据某行业企业数据资料拟合此行业的生产函数时,资本投入、劳动力投入、资金投入与能源供应都与企业的生产规模有关,往往出现高度相关情况,大企业二者都大,小企业都小。

6.2多重共线性对回归参数的估计有何影响?

答:1、完全共线性下参数估计量不存在;

2、参数估计量经济含义不合理;

3、变量的显著性检验失去意义;

4、模型的预测功能失效。

6.3 具有严重多重共线性的回归方程能不能用来做经济预测?

答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。

6.4多重共线性的产生于样本容量的个数n、自变量的个数p有无关系?

答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。

6.6对第5章习题9财政收入的数据分析多重共线性,并根据多重共线性剔除变量。将所得结果与逐步回归法所得的选元结果相比较。

5.9 在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量,自变量如下:x1为农业增加值(亿元),x2为工业增加值(亿元),x3为建筑业增加值(亿元),x4为人口数(万人),x5为社

会消费总额(亿元),x 6为受灾面积(万公顷)。据《中国统计年鉴》获得1978—1998年共21个年份的统计数据,见表5.4(P167)。由定性分析知,所有自变量都与y 有较强的相关性,分别用后退法和逐步回归法作自变量选元。 解:逐步回归法

Coe fficie nts

a 715.30990.574

7.898.000.179.004.99440.739.0001010.840136.027

7.431.000.308.048 1.706 6.367.000-.405.152-.714-2.665.016865.929103.725

8.348.000.639.086 3.5417.439.000-.601.119-1.059-5.057.000-.361.086

-1.493

-4.216.001

(Constant)x5

(Constant)x5x1

(Constant)x5x1x2

Model 12

3

B Std. E rror Unstandardized Coefficients Beta

Standardized

Coefficients

t

Sig.Dependent Variable: y

a.

回归方程为:

y=865.929—0.601x1-0.361x2+0.639x5

但是回归系数的解释不合理。

解:(1)分析数据的多重共线性。直接进行Y 与四个变量的线性回归方程,并做多重共线性的诊断,由SPSS 分析得相应输出结果如下: a 方差扩大因子法,

由表1中VIF 值, 可知x1,x2,x3,x5的方差扩大因子远大于10,这几个自变量之间存在很高的线性相关性,即回归方程存在严重的多重共线性。 b.特征根和条件数判定法。输出结果如表2:

表1

2

其中最大的条件数k 7=290.443,说明自变量间存在严重的多重共线性,这与方差扩大因子法的结果一致。其中x0,x2,x4,x5在第五行同时较大,表明其间存在多重共线性。

(2)消除多重共线性。

下面根据多重共线性剔除变量。先剔除VIF 值最大的自变量2x ,得:

Coe fficie nts

a

-1503.1751546.931

-.972.347-.717.163-1.264-4.391.001.004

268.990-.801.467-.526-1.713.107.003305.769.029.017.102 1.695.111.08511.701.487.078 2.701 6.238.000.002609.067-.010.008

-.026

-1.177.258

.616

1.624

(Constant)x1x3x4x5x6

Model 1

B Std. E rror Unstandardized Coefficients Beta

Standardized

Coefficients

t

Sig.Tolerance VI F

Collinearity Statistics Dependent Variable: y

a.

从上表可以看出,VIF 的值中,除了6x 以外,其余的均大于10,故回归方程依然存在严重的多重共线性。继续剔除VIF 值最大的自变量5x ,得:

Coe fficie nts

a

-3011.2042804.617

-1.074.299-.075.233-.131-.321.753.006

161.9881.515.521.995 2.909.010.009112.777.040.031.141 1.286.217.08611.573.002.015

.007

.167.869

.652

1.533

(Constant)x1x3x4x6

Model 1

B Std. E rror Unstandardized Coefficients Beta

Standardized

Coefficients

t

Sig.Tolerance VI F

Collinearity Statistics Dependent Variable: y

a.

从上表可以看出,VIF 的值中,除了6x 以外,其余的均大于10,故回归方程还存在严重的多重共线性。继续剔除VIF 值最大的自变量1x ,得:

Coe fficie nts

a -2349.3381848.340

-1.271.2211.351.096.88714.119.000.249

4.018.032.019.113 1.70

5.10

6.222 4.509.003.014

.009

.234.818

.673

1.485

(Constant)x3x4x6

Model

1

B Std. E rror Unstandardized Coefficients Beta

Standardized

Coefficients

t

Sig.Tolerance VI F

Collinearity Statistics Dependent Variable: y

a.

由上表可以看出,所有自变量的VIF 值都小于10,故回归方程的多重共线性已经被消除。但自变量6x 没有通过T 检验,说明不显著,剔除6x 后再做回归分析得:

Coe fficie nts

a -2358.8091798.722

-1.311.2061.351.093.88714.505.000.249

4.018.034.017

.119

1.939.068

.249

4.018

(Constant)x3x4

Model

1

B Std. E rror Unstandardized Coefficients Beta

Standardized

Coefficients

t

Sig.Tolerance VI F

Collinearity Statistics Dependent Variable: y

a.

从上表可以看出,得到的回归方程为

34ˆ 1.3510.0342358.809y

x x =+- 回归方程的多重共线性虽然被消除,但是模型的自变量4x 的t 检验P 值为0.068>0.05,说明在95%的置信度下4x 对y 的线性影响不显著。 模型只剩下x 3,

相关文档
最新文档