SAS期末论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘要:本文回归分析SAS运用SAS软件对GDP的4个影响因素进行多元统计分析,首先对于数据进行编程录入,录入后对GDP进行单变量进行必要的分析,并对于数据进行正态性检验,然后对于5组变量进行多元分析,并对于方程和系数进行F检验和T检验,并建立回归模型,对GDP影响因素的贡献做出正确的分析。
关键字:国内生产总值固定资产投资
引言:从1978年改革开放到2007年,中国经济经历了一个增长的“神话”30年来,我国的GDP年均增长率达到9.8%。即使以再挑剔的眼光来看,这也是一个了不起的成就,那么接下来的一个问题就是:在过去的30年中,是什么原因使中国能保持如此高速的增长?是固定资产投资,第三产业增加值,人均GDP,工业总产值的增加?如果这些个因素都起到了一定的作用,那么它们的作用有多大?除此之外,我国的高速增长能否继续下去以及如何更好地促进我国的国的长期经济增长也都是值得关注的问题。因此,对中国经济增长因素的分析,无论在理论上还是实证上,都有着重要的意义。在影响经济增长的各种因素中,固定资产投资一般会受到特别的关注。随着我国经济的不断发展以及改革开放的深入,研究经济的发展状况及分析经济发展的各个因素,成为决策部门的一个重要课题。影响我国各地区经济发展的因素有很多,而如何定量化地分析和揭示影响各地区社会经济发展的主要因素及潜在综合因素的影响,是制定切实可行的缩小差距、促进地区经济协调发展的对策的重要基础之一。
理论综述:决定GDP的因素主要有固定资产投资,工业总产值,第三产业增加值等等因素,本文通过对几大因素的回归分析,从而体现出哪几个因素对于GDP 增长起着重要的作用,而哪几个因素是必不可少的,而哪些个因素是要剔除的。(一)数据选取:本文选取数据为90年到08年的国内生产总值、人均GDP、第三产业增加值、固定资产投资和工业总产值,数据均来源于国家统计局网站中国统计年鉴2009
(二)数据录入:首先运行SAS软件并在编辑器内编辑如下内容,使得国内生产总值为因变量,而人均GDP、第三产业增加值、固定资产投资和工业总产值为自变量。
data _feng;
input y x1 x2 x3 x4 @@;
cards;
18718.3 1644 5888.42 4517 6858
21826.2 1892.76 7337.1 5594.5 8087.1 26937.3 2311.09 9357.38 8080.1 10284.5 35260 2998.36 11915.7 13072.3 14188 48108.5 4044 16179.8 17042.9 19480.7 59810.5 5045.73 19978.5 20019.3 24950.6 70142.5 5845.89 23326.2 22913.5 29447.6 78060.8 6420.18 26988.1 24941.1 32921.4 83024.3 6796.03 30580.5 28406.2 34018.4 88479.2 7158.5 33873.4 29854.7 35861.5 98000.5 7857.68 38714 32917.7 40033.6 108068 8621.71 44361.6 37213.5 43580.6 119096 9398.05 49898.9 43499.9 47431.3 135174 10542 56004.7 55566.6 54945.5 159587 12335.6 64561.3 70477.4 65210 184089 14053 73432.9 88773.6 77230.8 213132 16165 84721.4 109998 91310.9 259259 19524.1 103880 137324 110535 302853 22698 120487 172828 129112
;
run;
proc print;
run;
点击运行后得到如下数据输出
表1
(三)数据分析
1单变量分析:在表1窗口下点击解决方案——分析——交互式数据分析打开_feng文件——点击分析——点击分布——将y变量输入表中得出如下图
由上图可知从1990年到2008年的国内生产总值的均值为111032.953亿元,最小值为187719.2亿元,下四分位数为48108.5,上四分位数为159587亿元,最大值为302853亿元。
在矩统计量表中可以看出,共有19个数据,均值为111032.953,标准偏差为80842.8727,变异系数为72.8098,偏度为1.0398,所以GDP为右偏,众数对算术平均数的偏斜度为1.0398,峰度为0.4713。四分位差为111478.5。
上表中是被拟合的正态分布的累计分布函数,,它与表示经验分布函数的阶梯曲线相当靠近,在下方的分布检验中p值>0.15,则说明这组数据服从正态分布。
用菜单项输出的正态性检验的结果如下表,也从不同的角度给出GDP数据与正态样本没有显著差异。
2图表分析:因变量GDP对自变量固定资产投资的散点图和预测置信区间图如下:
可以看出,本图基本可以肯定,GDP和固定资产投资基本为直线关系,并且很稳定。
3回归分析:在表1窗口下点击解决方案——点击分析——分析家——点击鼠标右键——文件——按SAS名称打开——出现图1——在图1窗口下点击统计——回归——线性——设置如图2所示——点击OK出现图3
图1 图2
图3
图3可以看出F 检验通过,说明方程检验通过可以使用,各个自变量的系数经验即T 检验也是通过,所以做出如下的方程。
432150991.011283.047086.00893.7X X X X Y +++=
(四)结论陈述:从结果分析看出,改革开放三十年我国的经济增长主要靠固定资产投资。这跟许多经济学家所认为的“投资是拉动经济增长‘三驾马车’之主”的结论相符。
一方面,过去三十年来,我国经济增长主要靠大量的固定资产投资,固定资产投资增速从上世纪80年代的30-35%提高到了当前近45%的水平。90年代中期以来,中国的GDP 增长主要得益于由政府组织的基础设施、城市建设以及城市化方面的大规模投资。
本文由于数据方面的问题,第三产业增加值的统计结果并不显著。但是我们认为第三产业对中国三十年经济增长的贡献率并不突出。
另一方面,作为发展中国家,中国有着很强的后发优势,应当积极地“引进