对财政支出数据的回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
四、结语
在目前,经济发展较快,而国家财政支出进一步加大,那么在社会建设中确实存在这一些问题,比如医疗卫生,教育,基础设施建设等。
通过建立这样的一个回归模型,我们发现在经济快速增长的下,一些发面的发展已经滞后了,那么如果我们不改善这种情况,财政将会越来越困难,所以在当前我们必须加强教育,社会保障和基础设施的建设,然后我们才能创造一个良好的财政收支环境,以利于经济和社会发展。
在逐步回归中需要注意的一个问题是引入自变量和剔除自变量的显著性水平α值是不相同的,要求
α进<α出
否则可能产生“死循环”。也就是当α进≥α出时,如果某个自变量的显著性P值在α进与α出之间,那末这个自变量将被引入、剔除、再引入、再剔除、…,循环往复,以至无穷。
二、数据分析
1、指标的选取
Y一般预算支出X1一般公共服务X2国防
121007301806669215877529272068578111406187795179360376919531837770782014701563760311218517
270466134682351404591732612550992957133355217828505251404184586002289459823530003004542543623
总之,我们必须着眼未来,加强相关方面的建设,实现财政的良好循环。
附录:
程序;
datasty;
inputy x1-x12;
cards;
1959285719626642210016046163162957112188661113820932851450513354688199838312177368034611160451
131501752234833230199075362349868176381271892218381171495964286310117631096934336037901507
1454573224339141590976447820640171536343162431915179598205796815170439916071774930871253567
三、结果总结
我们得到了回归方程:
Y=-286388+0.67x1+1.18x3+0.59x4+1.99x5+2.80x6+1.31x7+2.22x8+1.38x9+1.23x10+1.24x11+2.07x12
,因此我们可以说,科学,医疗,交通运输与一般性支出的关系是显著的。为了降低财政支出,我们可以在加大对一些方面的支出,以便产生效益,来降低对于一般事项的支出。例如在全国社会保障支出最高的辽宁省(4699675)降低了一般性支支出较大的省往往也在教育,社会保障,社区事务,交通运输,医疗等方面支出较大,说明这些地区已经意识到了需要在这些方面加大支出,搞好建设,才能进一步削减财政支出。
(3)逐步回归法
逐步回归的基本思想是“有进有出”。具体做法是将变量一个一个引入,当每引入一个自变量后,对已选入的变量要进行逐个检验,当原引入的变量由于后面变量的引入而变得不再显著时,要将其剔除。这个过程反复进行,直到既无显著的自变量选入回归方程,也无不显著自变量从回归方程中剔除为止。这样就避免了前进法和后退法各自的缺陷,保证了最后所得的回归子集是“最优”回归子集。
16471253234153120027868949286255723778832746522820051038442547367147874613675255181961862857
1137715918919743146891598523329232562812242511092914742741140264750936804268456079880165
X3公共安全
X4教育
X5科学技术
X6文化体育与传媒
X7社会保障与就业
X8医疗卫生
X9环境保护
X10城乡社区事务
X11农林水事务
X12交通运输
2、结果数据及分析
表一
以上是参数估计的结果,建立回归方程
(1方程的系数检验:
表二
方差分析的结果。P<0.05,证明高度显著,即变量全体x1-x12对y有显著影响,但是我们不能确定没一个变量x都对y有显著性。由表一中我们可以看出诸如x2,x3,x4,x5,等都没有通过检验 的t统计量 及相应的P值,得到,并不是每一个 单独的对因变量y都有显著性影响,这说明尽管回归方程通过了显著性检验,但也出现某些单个变量 对y并不显著的情况。
表三
表三是样本相关阵的输出数据,x7等对y的贡献较大,而x2等比较小,所以我们需要剔除一些变量。
(2)异方差和自相关性检验
表四
我们可以看到在其中的值都小于.05,所以不存在异方差性。
我们看到dw=1.951,故认为不存在自相关性,我们在上表中可以看到有些变量的方差扩大因子较大,vif超过了10,所以我们认为变量间可能存在着多重共线性,我们在后面将进行变量的选择来剔除那些共线性变量。
228160934065896192801391862444026430438941461633023431454726758510135382220958594317272005786
1650276326580311065312564862841940230584252487281300395083840919485220217670063830691254733
(3后退法
取显著性水平a=0.1000.
变量剔除
由此回归子集的最优方程就是:
复决定系数是0.9910,c(p)是3.4128
(4前进法

我们可以看到依次引入了x4 x7 x10 x12,此时我们就能写出最优模型的回归方程:
复决定系数是0.9874.c(p)位10.4241.
以上就是用后退法,前进法选择了变量建立了模型,建立了相对最优的回归方程,但是这两种方法有一定的缺陷,后退法中一旦某个变量被剔除了,就再也不能回到模型中,这样可能使找到的模型不是最优的。前进法相反,一旦变量进入,就不会再被剔除,但是这个变量可能在某个模型中不再显著,这样的模型同样不是最优的。所以我们再运用逐步回归来筛选,建立一个最优模型。
21534348307650353771147583330636004902262994094699675839012481798217221114929333725132212826
118012231742481138607195041880346134116282109199855659517645606785374310733572929761598726
关键词;逐步回归、显著性检验
一、模型
1、多元线性回归的模型表示
矩阵表达
2、估计
最小二乘估计要寻找
经过整理得到回归参数的最小二乘估计就是
3.显著性检验
(1)、F检验
H0:β1=β2=…=βp=0
SST = SSR + SSE
当H0成立时服从
(2)、回归系数的显著性检验
H0j:βj=0, j=1,2,…,p
(5逐步回归
显著性水平a=0.05这里我们先后由六步选择得到了这个最优子集模型,回归方程为
复决定系数是0.9874.c(p)是10.4241.,最后发现vif都小于百度文库0,也都通过了显著性检验,所以这个模型是合理的。
(6)主成分分析和岭回归
以上结果我们可以得到选出的最优子集是x1 x4 x7 x8 x10 x11 x12.
下面我们来做主成分回归;
结果如下:
以上我们看到三个主成分就能够反映91..88%的信息,所以我们取三个主成分就足够了。写出print1=0.422138x1+0.424429x4+0.30694x7+0.416599x8+0.30683x10+0.384503x11+0.332418x12,其他的表达式类似。
(2)后退法
后退法与前进法相反,首先用全部m个变量建立一个回归方程,然后在这m个变量中选择一个最不重要的变量,将它从方程中剔除。设对m个回归系数进行F检验,记求得的F值为 ,选其最小者记为:
给定显著性水平α,若 ≤Fα(1,n-m-1),则首先将xj从回归方程中剔除,为方便,设xj就是xm。
接着对剩下的m-1个自变量重新建立回归方程,进行回归系数的显著性检验,像上面那样计算出 ,如果又有 ≤Fα(1,n-(m-1)-1),则剔除xj,重新建立y关于m-2个自变量的回归方程,依此下去,直至回归方程中所剩余的p个自变量的F检验值均大于临界值Fα(1,n-p-1),没有可剔除的自变量为止。这时,得到的回归方程就是最终确定的方程。
做岭回归如下结果:
我们可以写出K=0.2时的岭回归方程;y=1.0053x1+0.9349x4+1.40079x7+3.5135x8+1.89463x1+0.90681x11+3.80314x12
也可以写出取三个主成分的回归方程。Y=0.8437x1+0.8956x4+1.53278x7+3.4658x8+2.35182x10+0.6661x11+4.3448x12。
3247492751686015322425288455926032915173667446231524114861169517953617904276159911721202886538
220857563724556500481996246453990286792863759314152231428690465183193949917741755942341720324
17652249301064640501112795131126012658932534623103120875987417066120015817637545695751360830
37785681629023177696393206470332691325155667154362834520114674708782832940192602510584041957778
129711002245366310579565632512210162149292467128976978768327974072303313939705847811066574
86772459590555631658481141698528653018012010571644191561097891850121385397141560761033
188166963176185258451367819376981921667429002327137261202379763556132496715189772892071485575
给定显著性水平α,若 ≥Fα(1,n-2),则首先将xj引入回归方程,为方便,设xj就是x1。
接下来因变量y分别与(x1,x2),(x1,x3),…,(x1,xm)建立m-1个
二元线性回归方程,对这m-1个回归方程中x2,x3,…,xm的回归系数进行
F检验,计算F值,记为 ,选其最大的记为:
若 ≥Fα(1,n-3),则接着将xj引入回归方程。
~N(β,σ2(X'X)-1)
记(X'X)-1=(cij)i,j=0,1,2,… ,p
构造t统计量
其中
4、逐步回归
(1)前进法
前进法的思想是变量由少到多,每次增加一个,直至没有可引入的变量为止。首先分别对因变量y建立m个一元线性回归方程,并分别计算这m个一元回归方程的m个回归系数的F检验值,记为 ,选其最大者记为:
154230042404474276539249832566199200885239638228625371698448510598537514815145232812224108
25939161198780792671495741326062812027434952233349669122284025075846862527897111708183598601
应用回归分析论文
题目:影响财政支出因素的应用回归分析
姓名:孙天阳
学号:20112981
摘要
截取了中国国家统计局统计年鉴中的财政支出数据,主要是对影响财政支出的因素进行分析,因为,财政支出的情况也在一定程度上反映了我国当前时段内的经济和社会情况。
选取了各地区财政2008年的支出情况数据,对其做多元线性分析,建立回归模型,并通过对回归系数做显著性检验与逐步回归来分析数据。最后的结果就体现了各地财政支出与教育,国防,等的关系。
相关文档
最新文档