统计学回归分析大作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
建筑业总产值影响因素的分析
一、问题的提出
通过研究1995-2012年我国建筑行业总产值与建筑行业的动力装备率、劳动力人数、技术装备率以及国有企业总产值在行业总产值中所占比重的关系,来建立建筑行业总产值与其影响因素直接的归回模型,并分析其原因。
本文全部数据来源于《中国统计年鉴》。
表1.1 1995-2012年建筑行业总产值及其影响因素
年份建筑行业总
产值(亿元)
动力装备率
(千瓦/人)
劳动力人数
(万人)
技术装备
率(元/人)
国有企业所
占比重
1995 5793.75 4.70 1497.87 4264.00 0.63
1996 8282.25 4.60 2121.87 4154.00 0.50
1997 9126.48 4.10 2101.51 4729.00 0.50
1998 10061.99 4.30 2029.99 5127.00 0.45
1999 11152.86 4.50 2020.13 5756.00 0.44
2000 12497.60 4.60 1994.30 6304.00 0.40
2001 15361.56 4.86 2110.66 7136.00 0.35
2002 18527.18 4.91 2245.19 9675.00 0.30
2003 23083.87 4.85 2414.27 9957.00 0.26
2004 27745.38 5.80 2557.86 9297.00 0.26
2005 34552.10 5.10 2699.92 9273.48 0.24
2006 41557.16 4.92 2878.16 9109.14 0.22
2007 51043.71 4.97 3133.71 9208.36 0.21
2008 62036.81 5.50 3314.95 9915.00 0.20
2009 76807.74 5.20 3672.56 10088.00 0.20
2010 96031.13 4.66 4160.44 9547.04 0.19
2011 116463.32 5.66 3852.47 12025.29 0.18
2012 137217.86 5.69 4267.24 13374.17 0.17
为了研究影响建筑行业总产值的因素,把建筑行业总产值(亿元)作为被解释变量Y,将动力装备率(千瓦/人)、技术装备率(元/人)、劳动力人数(万人)、国有企业所占比重作为解释变量,分别设为X1、X2、X3、X4,假定其多元线性回归模型表示为:
Y=β0+β1X1+β2X2+β3X3+β4X4
二、相关性问题
图2.1 各变量之间的散点图
散点图如图2.1所示。简单相关系数如表2.1所示。
表2.1 简单相关系数
可以看出,建筑业总产值与劳动力人数相关度很高,与技术装备率和国有企业所占比重相关度也叫较高,而动力装备率相关度一般。但是由于所有的p值检验都小于0.05,所以
变量还是可以用于建模的。
三、建立回归模型
利用强行进入发,建立初步模型。
输出结果如下:
1.拟合优度检验
可以看出,复相关系数R为0.990,样本决定系数为0.981,调整后相关系数为0.975,说明方程拟合良好。
2.回归方程显著性检验
由表可知,F为167.393,P值为0,.000,说明回归方程高度显著,各解释变量整体上对被解释变量有高度显著的线形影响。
3.回归系数检验
由表可知,动力装备率,即X1P值大于0.05,未通过检验。其他变量均通过检验。4.残差分析——正态性检验
如图所示,残差与正态分布直接存在较小差距,基本符合正态分布。
5.残差分析——异方差分析
有图表可知,被解释变量与残差相关系数为0.055,P 值0.829,可以说没有异方差现象。 6.自相关检验
D.W值为1.435.。查表得,dl=0.574,du=1.631,所以不确定。
有图示可以认为,残差之间不存在自相关性。
7.共线性诊断
只有技术装备率的VIF大于10.存在轻微共线性。所以,需要修改模型。
四、修改模型
1.模型存在的问题
1.动力装备率X1未经过回归检验;
2.有轻微的共线性;
2.修改
删除X1,再利用强行进入法建立模型。
得到结果如下:
Descriptive Statistics
Mean Std. Deviation N
建筑行业总产值42074.59722 40200.244255 18 劳动力人数(万人)2726.283333 827.8771536 18 技术装备率(元/人)8274.41556 2691.388053 18 国有企业所占比重.3166666667 .137******** 18
Correlations
国有企业所占比
重
Pearson Correlation 建筑行业总产值-.747
劳动力人数(万人)-.842
技术装备率(元/人)-.928
国有企业所占比重 1.000 Sig. (1-tailed) 建筑行业总产值.000
劳动力人数(万人).000
技术装备率(元/人).000
国有企业所占比重.
N 建筑行业总产值18