北航研究生数理统计第一次大作业-回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
表2.4 已输入/已移除的变量a
模型 输入的变量 移除的变量 方法
1
农业总产值(亿
元)
.
逐步(准则:F-to-enter 的概率 <= .050,F-to-remove 的概 率 >= .100)。
2
工业增加值(亿
元)
.
逐步(准则:F-to-enter 的概率 <= .050,F-to-remove 的概 率 >= .100)。
1
.999** .945** -.843**
建筑业总产值 显著性(双
(亿元)
侧)
.000 .000 .000
.000 .000 .000
N
社会商品零售 Pearson相关
显著性(双
总额
侧)
(亿元)
N
Pearson相关
人口数 显著性(双
(万人)
侧)
15 .997**
.000
15 .959**
.000
15 .985**
3
建筑业总产值
(亿元)
.
逐步(准则:F-to-enter 的概率 <= .050,F-to-remove 的概 率 >= .100)。
4 .
农业总产值(亿逐步(准则:F-to-enter 的概率
元)
<= .050,F-to-remove 的概
率 >= .100)。
5
逐步(准则:F-to-enter 的概率
.000
15 .977**
.000
15 .998**
.000
15 .954**
.000
15 .999**
.000
15 .945**
.000
15 1
15 .947** .000
15
15
.947** -.837**
.000 .000
15
15
1
-.836**
.000
N
15
15
15
15
15
15
15
Pearson相关 -.841** -.839** -.849** -.843** -.837** -.836**
2 建模
2.1 数据收集与整理
查阅《中国统计年鉴》,选取 2000 年至 2014 年之间的财政收入作为因变量, 选取工业增加值、农业总产值、建筑业总产值、社会商品零售总额、人口、受灾 面积六个可能影响财政收入的因素为自变量,统计结果如表 2.1[1]。
1
年份
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
关键词:SPSS;逐步回归法;财政收入;回归模型
目录
1 引言.........................................................................................................1 2 建模.........................................................................................................1
N
15
15
15
15
15
15
15
Pearson相关 .999** .992**
1
.998** .998** .954** -.849**
农业总产值 显著性 (双
(亿元)
侧)
.000 .000
.000 .000 .000 .000
N
15
15
15
15
15
15
15
Pearson相关 .997** .984** .998**
12497.60 15361.56 18527.18 23083.87 29021.45 34522.10 41557.16 51043.71 62036.81 76807.74 96031.13 116463.32 137217.86 160366.06 176713.40
39105.7 43005.4 48135.9 52516.3 59501.0 68352.6 79145.2 93571.6 114830.1 132678.4 156998.4 183918.6 210307.0 242842.8 271896.1
.999 1111.37130 .000 5.580
人口数(万人).
<= .050,F-to-remove 的概
率 >= .100)。
a. 因变量: 财政收入(亿元)
表2.5 模型摘要f
变更统计资料

R 平 调整后 标准偏斜
型R
方 R 平方
误差
R 平方 F 值变
变更

df1
显著性 F df2 值变更
1 .999a .998 .998 2045.63430 .998 6370.486 1
2.1 数据收集与整理 ..............................................................................1 2.2 逐步回归分析 ..................................................................................3
表 2.1 财政收入及其影响因素统计表
建筑业总 社会商品
受灾面积
财政收入 工业增加 农业总产
人口数
产值(亿 零售总额
(万公
(亿元) 值(亿元) 值(亿元) 元)
(亿元) (万人) 顷)
13395.23 16386.04 18903.64 21715.25 26396.47 31649.29 38760.20 51321.78 61330.35 68518.30 83101.51 103874.43 117253.52 129209.64 140349.74
显著性(双 侧)
.000 .000 .000 .000 .000 .000
N
15
15
15
15
15
15
15
Pearson相关 .994**
1
.992** .984** .985** .977** -.839**
工业增加值 显著性 (双
(亿元)源自文库
侧)
.000
.000 .000 .000 .000 .000
北京航空航天大学
利用逐步回归法建立国家财政收入的回归模型
数理统计 第一次大作业
2015 年 12 月
利用逐步回归法建立国家财政收入的回归模型
摘要:本文利用 SPSS 软件采用逐步回归法,建立了 2000 年至 2014 年国家财政 收入的回归模型。其中,选取了工业增加值、农业总产值、建筑业总产值、社会 商品零售总额、人口数和受灾面积作为可能的影响因素对国家的财政收入模型进 行了分析。最后得出工业增加值、建筑业总产值是对国家财政收入影响最为显著 的因素,并对其进行了分析。
由于财政收入关系到国家的经济发展和社会进步,因此研究财政收入的增长 情况显得尤为重要。为了分析影响财政收入的主要原因,研究财政收入的增长规 律,为预测财政收入增减趋势提供依据,就需要建立财政收入的经济模型。
本文统计了从 2000 年至 2014 年这 15 年之间的财政收入与工业增加值、农 业总产值、建筑业总产值、社会商品零售总额、人口、受灾面积这六个可能影响 财政收入的因素之间的关系,利用 SPSS 软件进行了逐步回归分析,建立了国家 财政收入的线性回归模型。
39931.8 43469.8 47310.7 54805.8 65044.2 77034.3 91078.8 110253.9 129929.1 135849.0 162376.4 191570.8 204539.5 217263.9 228122.9
13873.6 14462.8 14931.5 14870.1 18138.4 19613.4 21522.3 24658.1 28044.2 30777.5 36941.1 41988.6 46940.5 51497.4 54771.6
2
2.2 逐步回归分析 2.2.1 逐步回归法的基本思想
从所有解释变量中先选择影响最为显著的变量建立模型,然后再将模型之外 的变量逐个引入模型;每引入一个变量,就对模型中的所有变量进行一次显著性 检验,当原引入的变量由于后面变量的引入而变得不再显著时,将其剔除;逐个 引入——剔除——引入,反复这个过程,直到既无显著变量引入回归方程,也无 不显著变量从回归方程中剔除为止[2][3]。
126743 127627 128453 129227 129988 130756 131448 132129 132802 133450 134091 134735 135404 136072 136782
5468.8 5221.5 4694.6 5450.6 3710.6 3881.8 4109.1 4899.2 3999.0 4721.4 3742.6 3247.1 2496.1 3135.0 2489.1
4
财政收入 (亿元)
表2.3 因变量与自变量的相关性分析表
社会商
财政收 工业增 农业总 建筑业
受灾面
入(亿 加值(亿产值(亿 总产值 品零售 人口数 积(万公
总额(亿 (万人)
元) 元) 元) (亿元)
顷)
元)
Pearson相关 1
.994** .999** .997** .997** .959** -.841**
1 引言
财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务所 需要而筹集的一切资金的总和。财政收入表现为政府部门在一个时期内所取得的 货币收入,财政收入是衡量一国政府财力的重要指标。政府在社会经济活动中提 供的公共物品和服务的范围及数量,在很大程度上决定与财政收入的充裕状况。 财政收入对国民经济的运行及社会发展具有重要影响。
1
受灾面积 显著性 (双
(万公顷) 侧)
.000 .000 .000 .000 .000 .000
N
15
15
15
15
15
15
15
**. 相关性在 0.01 水平上双侧显著相关。
从上表中可以看出,财政收入与各个自变量之间均具有一定的相关性。进一 步进行逐步回归分析。逐步回归在建立多元回归的模型中,按相关性的大小逐个 引入自变量,并进行统计检验,效应显著的自变量留在方程内,并循环遴选下一 个自变量。利用 SPSS 计算时,Fin=0.05,Fout=0.10。输出结果如表 2.4-表 2.9, 如图 2.2-图 2.3。
2.2.1 逐步回归法的基本思想 ............................................................3 2.2.2 分析过程 ....................................................................................3 2.2.3 结论 ..........................................................................................11 3 分析与讨论...........................................................................................11 参考文献...................................................................................................12
13
.000
2 .999b .999
.998 1732.80231 .001 6.118
1
12
.029
3 1.000c .999
.999 1355.29365 .001 8.616
1
11
.014
4 1.000d .999
.999 1306.36708 .000
.149
1
11
.707
5 1.000e .999
各变量的符号说明如表 2.2。
表 2.2 各变量的符号说明
变量 财政收入 工业增加值 农业总产值 建筑业总产值 社会商品零售总额 人口数 受灾面积
符号 Y X1 X2 X3 X4 X5 X6
该问题的线性回归模型为:Y=a+b1X1+b2X2+b3X3+b4X4+b5X5+b6X6。其中,Y 为 因变量的估计值或预测值,X1、X2……X6 为自变量
2.2.2 分析过程
首先利用 SPSS 软件绘制财政收入与各因变量之间的关系,如图 2.1。
3
图2.1 财政收入与各自变量直接的关系 由散点图可以看出,财政收入与工业增加值、农业总产值、建筑业总产值和 社会商品零售总额的线性关系较为显著。而与人口数呈指数相关性,与受灾面积 的相关性并不明显。 接下来进行相关性分析,相关性分析见表 2.3。
相关文档
最新文档