数理统计回归分析大作业任务
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《应用数理统计》
第一次大作业
回归分析
姓名:
学号:
班级:
2014-12-20
国家财政收入的多元线性回归模型
摘 要:本文以多元线性回归为出发点,选取我国自1990至2009年连续20年
的财政收入为因变量,初步选取了7个影响因素,并利用统计软件PASW Statistics 17.0对各影响因素进行了筛选,最终确定了能反映财政收入与各因素之间关系的回归方程:
43806.0044.0357.817y x x ++=
从而得出了结论,最后我们用2010年的数据进行了验证,得出的结果(86482.00)在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。 关键词:多元线性回归,逐步回归法,财政收入,SPSS
0符号说明
变 量 符号 财政收入 Y 工 业 X 1 农 业 X 2 进出口总额 X 3 建 筑 业 X 4 人 口 X 5 商品销售额 X 6 国内生产总值
X 7
1 引言
定义:所谓回归分析法,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。
回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和两个或两个以上自变量时,叫做多元回归分析。此外,回归分析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为线性回归分析和非线性回归分析。通常线性回归分析法是最基本的分析方法,遇到非线性回归问题可以借助数学手段化为线性回归问题处理。回归分析法预测是利用回归分析方法,根据一个或一组自变量的变动情况预测与其有相关关系的某随机变量的未来值。进行回归分析需要建立描述变量间相关关系的回归方程。根据自变量的个数,可以是一元回归,也可以是多元回归。根据所研究问题的性质,可以是线性回归,也可以是非线性回归。本文应用逐步回归的方法进行分析。
中国作为世界第一大发展中国家,要实现中华民族的伟大复兴,必须把发展放在第一位。近年来,随着国家经济水平的飞速进步,人民生活水平日益提高,综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控,对于整个国家和社会的健康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。
国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多,如人口状况、引进的外资总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据,包括工业,农业,建筑业,零售贸易总额,进出口总额,人口总数等。文中主要应用逐步回归的统计方法,对数据进行分析处理,最终得出能够反映各个因素对财政收入影响的最“优”模型。
2解决问题的方法和计算结果
2.1 样本数据的选取与整理
本文在进行统计时,查阅《中国统计年鉴2010》中收录的1990年至2009年连续20年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上有线性关系的因素,初步选取这十九年的国内总产值、工业总产值、人口总数、建筑业、农业、商品零售总额、进出口总额等因素为自变量,分析它们之间的联系。
根据选择的指标,从《中国统计年鉴2010》查选数据,整理如表2-1所示。
2010年的数据是在网上搜索到的。
表2-1 1990-2009年财政收入及其影响因素统计表
年份
工业
(亿元)
农业
(亿元)
进出口总额
(亿元)
建筑业
(亿元)
人口
(万人)
社会商品零售总
额(亿元)
财政收入
(亿元)
国内生产总值
(亿元)
1990 18689.22 7662.1 5560.1 1345 11433
3
8300.1 2937.1 18718.3
1991 22088.68 8157 7225.8 1564.3 11582
3
9415.6 3149.48 21826.2
1992 27724.21 9084.7 9119.6 2174.4 11717
1
10993.7 3483.37 26937.3
1993 39693 10995.5 11271.0 3253.5 11851
7
14270.4 4348.95 35260.0
1994 51353.03 15750.5 20381.9 4653.3 11985
18622.9 5218.1 48108.5
1995 54946.86 20340.9 23499.9 5793.8 12112
1
23613.8 6242.2 59810.5
1996 62740.16 22353.7 24133.8 8282.2 12238
9
28360.2 7407.99 70142.5
1997 68352.68 23788.4 26967.2 9126.5 12362
6
31252.9 8651.14 78060.8
1998 67737.14 24541.9 26849.7 10062 12476
1
33378.1 9875.95 83024.3
1999 72707.04 24519.1 29896.2 11152.9 1257835647.9 11444.08 88479.2