国家财政收入的多元线性回归模型

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用数理统计国家财政收入的回归分析

院(系)名称

专业名称

学生姓名

任课教师

2013年12月

目录

摘要.............................................................................. 错误!未定义书签。符号说明........................................................................ 错误!未定义书签。1引言............................................................................. 错误!未定义书签。2解决问题的方法和计算结果 (3)

2.1 样本数据的选取与整理 (3)

2.2 模型的建立与分析 (4)

2.3 分析结果 (9)

3 结论 (10)

参考文献 (11)

国家财政收入的多元线性回归模型

摘要:本文以多元线性回归为出发点,选取了我国自1990至2011年间的财政收入为因变量,并初步选取了6个影响因素,进一步利用统计软件SPSS 对以上数据进行了筛选,采用多元逐步线性回归的方法,从而找到了能反映财政收入与各因素之间关系的“最优”回归方程:

5

14242.0068.0348.0890.27809X X X Y +++-=

进而得出结论,国家财政收入与建筑业、工业总产值和人口数具有显著地线性关系。

关键词:多元逐步线性回归;财政收入;SPSS

0符号说明

变 量

符号 财政收入(亿元)

Y 工业总产值(亿元)

X 1 农业总产值(亿元)

X 2 受灾面积(万公顷) X 3 建筑业总产值(亿元) X 4 人口总数(万人) X 5 社会商品销售总额(亿元)

X 6

1 引言

改革开放以来,我国的国民经济取得了快速发展,经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府根据国家的财政收入,通过预算安排,用于环境保护、社会保障以及政府行政管理等,从而不断提高人民的生活水平,早日实现中华民族的伟大复兴。因此,为了更好地制订下一年的财政税收政策,研究影响国家财政收入的主要因素是十分必要的。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,进而对他们之间的关系作一下回归,从而通过已

有的数据建立最优的线性回归模型。

建立最优的线性回归模型,一方面要求该模型包含所有对因变量财政收入有显著影响的自变量,另一方面要求该模型中所包含的自变量个数尽可能的少,不含无意义的变量。选择最优模型的方法很多,但各有利弊。全部比较法是把所有可能的自变量的各种组合方式回归方程都求出来,然后比较,选出最优的。对于变量数较少时,该方法比较有优势,但当随着变量数的增加,该方法的计算量也变得越来越大,使得该方法不太实用。向后法,也称为只出不进法,在不显著的变量比较少时常常采用该方法,但在开始建立方程可能自变量过多,计算繁琐,现在也不太常用。向前法,也称只进不出法,由于其本身的特点,使得变量一旦引入方程,就不会剔除。这样得到的模型,由于变量间可能存在相关关系,故不能保证所有的变量都是显著。本文采用的是逐步回归法,也成为有进有出法,它是向前法和向后法的一种结合,克服了前两种方法的缺点,将变量一一引入,每引入一个变量后都要对老变量进行逐个检验,将变得不显著的变量从回归模型中剔除,保证了模型含有的都是有显著影响的自变量。

本文首先分析了可能影响财政收入的因素,找到最有可能的因素,包括工业总产值,农业总产值,建筑业总产值,社会商品销售总额,人口数,受灾面积等。然后从国家统计数据网上查取了1990-2011年这22年间的年度财政收入及主要影响因素的数据,利用逐步回归的统计方法,对数据进行分析处理,最终得出能够反映各个因素对财政收入影响的最“优”模型。在寻找最优回归方程过程中,首先以国家财政收入为因变量,以工业总产值,农业总产值,建筑业总产值,社会商品销售总额,人口数,受灾面积分别为自变量,绘制散点图,初步判断财政收入与各因素之间是否具有线性关系。为了更加直观的分析财政收入与各因素的关系,利用SPSS软件计算了各个变量之间的相关系数,定量的分析了财政收入与各因素之间的相关性大小。最后,为了得到最佳回归模型以及最优回归方程,利用SPSS软件对该数据进行深层次的分析,利用逐步回归分析原理,求得了最优回归方程,并对其残差进行分析,来进一步检验回归模型的拟合性。

2解决问题的方法和计算结果

2.1 样本数据的选取与整理

本文在进行统计时,查阅国家统计数据网—中国统计年鉴2012中收录的1990年至2011年连续22年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上有线性关系的因素,初步选取这20年的工业总产值,农业总产值,建筑业总产值,社会商品销售总额,人口数和受灾面积等因素为自变量,分析它们之间的联系。根据选择的指标,从国家统计数据网查选数据,整理如表2-1所示。

表2-1 1990-2011年财政收入及其影响因素统计表

工业(亿元)

农业

(亿元)

受灾面

积(千

公顷)

建筑业

(亿元)

人口

(万

人)

社会商品

零售总额

(亿元)

财政收入

(亿元)

199018689.227662.13847413451143338300.12937.1 199122088.688157554721564.31158239415.63149.48 199227724.219084.7513322174.411717110993.73483.37 19933969310995.5488273253.511851714270.44348.95 199451353.0315750.5550464653.311985018622.95218.1 199554946.8620340.9458245793.812112123613.86242.2 199662740.1622353.7469918282.212238928360.27407.99 199768352.6823788.4534279126.512362631252.98651.14 199867737.1424541.9501451006212476133378.19875.95 199972707.0424519.14998011152.912578635647.911444.08 200085673.6624915.85468812497.612674339105.713395.23 200195449.026179.65221515361.512762743055.416386.04 2002110776.527390.846946 18527.112845348135.918903.64 2003142271.229691.854506 23083.812922752516.321715.25 2004187220.7362393710629021.451299885950126396.47 2005251619.539450.93881834552.013075668352.631649.29 2006316588.940810.84109141557.113144879145.238760.2 2007405177.148892.94899251043.713212993571.651321.78 200850744858002.139********.81132802114830.161330.35 200954831160361.0472*******.74133450132678.468518.30 201069859169319.83742696031.13134091156998.483101.51 201184426981303.932471116463.32134735183918.6103874.43

相关文档
最新文档