统计学小论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于因子和聚类分析的各地区公共财政支出研究
—以2013年中国31个省市区为例
赵良峰,朱莎
上海大学管理学院信息管理方向专业,上海 200444
摘要:根据各地区财政支出的指标体系,以2013年中国31个省市区为样本,运用因子分析方法改进实证分析,提出“关键领域财政支出”因子、“高新科技财政支出”因子、“保障财政支出”因子3个主因子,并基于主因子得分矩阵对31个省市区进行聚类分析,结果表明:(1)地方财政支出结构的绝大部分信息能够通过“关键领域财政支出”、“高新科技财政支出”、“保障财政支出”这三个主因子较好地反映出来。针对这个结论给出了相应的财政支出统筹优化建议。(2)我国地方财政支出结构可以划分为“偏高级服务支出”地区、“均衡支出”地区、“特殊结构支出”地区三种不同的类型。针对这个结论给出了相应的地区财政划分解释。论文认为利用因子和聚类分析相结合的方法研究各地区财政支出, 能够较好地反映各地区财政支出实际情况。
关键词:财政支出;因子分析;聚类分析
1 引言
财政支出结构会对地区经济发展产生重要影响,是公共经济学关注的一个重要问题。Barro R J.的文章表明财政支出会对经济增长产生重要影响[1]。严成樑发现财政支出对我国人均实际产出以及经济增长的影响存在地区差异[2]。石奇等考察了生产性公共支出对三次产业的生产要素积累所产生的影响[3]。娄峥嵘等人对优化公共服务支出结构提出了一些政策建议[4]。另一些研究者分析了地方财政支出结构与财政分权之间的关系。傅勇认为中国的财政分权对财政支出结构产生了扭曲作用,直接导致文化教育等支出不足[5]。江克忠的研究表明财政分权是行政管理类支出不断增长的一个重要诱因[6]。其它还有对我国地方财政支出结构的类型进行了研究。张明喜以地方财政支出结构和经济发展水平为主要指标,采用聚类分析法将全国划分为四大经济区域类型[7]。张建迎将财政支出分为经济服务、社会服务、政府服务和其他职能,以聚类分析法对2003年31个省份的财政支出结构进行了聚类分析,其结果将财政支出结构分为5种类型[8]。其主要局限在于未能对5种类型的财政支出结构各自具有的特征进行深入分析。
为了深入揭示我国31个省市区财政支出结构上的异同,本文以我国2013年31个省市区财政支出相关数据为基础,采用因子与聚类分析法对此进行了研究。与现有研究相比,本文的主要特色与创新之处在于:将因子与聚类分析结合起来对财政支出结构进行研究。先以因子分析法从财政支出指标中提炼出若干主因子,再用提炼出的主因子为基础进行聚类分析,将2013年我国31个省市区的财政支出结构划分为三种不同的类型,并对每种不同类型的财政支出结构进行深入分析。
本文余下部分的结构是这样安排的,第二部分是评价指标体系的建立,第三部分介绍因子分析在财政支出研究中的作用,第四部分是基于主因子分析的聚类分析,第五部分是结论与建议,最后是参考文献。
2 评价指标体系的建立
各地区财政支出的指标体系建立应该遵循以下原则:
(l) 全面性原则。综合评价指标体系必须全面完整,每一个指标反映地区财政支出的不同方面, 充分揭示其财政支出的内在规律。
(2) 系统性与地区性。各地区财政支出结构本身是一个反映地区经济、社会、政治、文化、生态等各方面的系统,因此在指标构建时要考虑到地区的系统性。
(3) 代表性原则。评价指标要具有较强的鉴别能力, 可以用来区分不同地区财政支出的不同情况。
(4) 实际可操作性原则。在考虑到指标体系完整、科学的前提下, 从实际出发, 尽可能选择现有
统计资料中容易获取的客观指标, 保证操作的简便可行[8]。
经过咨询有关专家, 论文所建立的指标体系共包括17个指标, 具体信息如表1所示:
表1 财政支出指标体系
指标符号指标具体内容指标符号指标具体内容
X1 国防X10 农林水事务
X2 公共安全 X11 交通运输
X3 教育 X12 资源勘探电力信息等事务
X4 科学技术 X13 商业服务业等事务
X5 文化体育与媒体 X14 金融监管的事务支出
X6 社会保障和就业 X15 国土资源气象等事务
X7 医疗卫生与计划生育 X16 住房保障支出
X8 节能环保 X17 粮油物资储备事务支出
X9 城乡社区事务
3 因子分析在财政支出研究中的作用
3.1 因子分析模型及步骤
因子分析是通过对原始数据相关系数矩阵内部结构研究,将多个指标转化为少量互不相关且不可观测的随机变量(即因子),以提取原有指标绝大部分信息的统计方法,当因子载荷矩阵结构不够简化时,可以通过因子旋转使因子具有更为鲜明的实际意义,同时使用因子得分函数对样本给出相应的评价和排序。因子分析的数学模型为: X=AF+ε,其中,X=(X1,X2,X3,…,Xp)’为原指标,F=(F1,F2,…, F m )’为X的公共因子,A 为因子载荷矩阵,ε为特殊因子。论文使用主成分因子提取方法, 其特点在于可以用方差贡献值βi衡量第i个公因子的重要程度。因子分析步骤如下:
(l) 将原始数据标准化, 记为X。
(2) 建立相关系数矩阵R。
(3) 解特征方程|R-λE|=0,计算特征值和特征向量,当累计贡献率不少于85 % 时,取前k个主成分代替原来的m个指标,计算因子载荷矩阵A。
(4) 对A进行最大正交旋转变换。
(5) 对主因子进行命名和解释,如需进行排序,则计算各个主因子的得分F i=αi x i,以贡献率为权重,对F i加权计算综合因子得分[9]。
3.2样本选取及数据来源
所有数据均来源于2013年中国统计年鉴:7-6分地区公共财政支出。部分数据如表2所示:
表2 分地区部分公共财政支出表
3.3数据分析过程
论文使用SPSS数据处理系统作为统计分析工具。通过将原始数据标准化后, 建立指标之间的相关系数矩阵R,由于篇幅原因,本文只列出了部分相关系数矩阵。具体如表3所示:
表3 部分变量相关系数矩阵
以上数据是在SPSS软件中点击分析—>因子分析—>描述—>统计量—>相关系数矩阵后得到的。从上面的表格中可以发现所有数据都标准化了,且是一个对称矩阵。继续点击抽取—>方法—>主成分—>相关性分析后可以得到变量共同度表和变量主成分的方差解释表。分别如表4和表5所示:
表4 变量共同度
初始提取国防 1.000 .790 公共安全 1.000 .934 教育 1.000 .948 科学技术 1.000 .887 文化体育与媒体 1.000 .799 社会保障和就业 1.000 .872 医疗卫生与计划生育 1.000 .910 节能环保 1.000 .814 城乡社区事务 1.000 .845 农林水事务 1.000 .889 交通运输 1.000 .887 资源勘探电力信息等事
务
1.000 .827
商业服务业等事务 1.000 .864 金融监管等事务支出 1.000 .435 国土资源气象等事务 1.000 .316 住房保障支出 1.000 .697 粮油物资储备事务 1.000 .825
提取方法:主成份分析
从表4可以看出,因子提取后,在上述的指标中,国土资源气象等事务支出的变量共同度最低,只有0.316,由于共同度反映了各变量中所包含的原始信息被提取的公因子表示的程度,因而是衡量因子分析效果的一个重要指标。在本研究中,绝大部分变量共同度均在0.8左右,说明提取出的公因子能反映原始变量80%左右的信息。
表5显示了主因子解释原始变量的总方差情况,可以发现,第一、二、三个主因子的特征根分别为10.462、2.045、1.032,其特征根均大于1;方差贡献率分别为61.540%、12.032%、6.072%,前三个公因子的方差贡献率达到79.643%,因而选取前三个因子足以描述各地财政支出特征。继续操作SPSS软件可以得到碎石图,如图1所示: 从碎石图可以看出,结合特征根曲线的拐点及特征根值,该图从另一个侧面说明了取前三个因子为宜。
表6列示了旋转后的因子载荷矩阵从上表中看出因子F1在交通运输、医疗卫生与计划生育、公共安全和教育变量上具有较高的载荷,而这些变量大多属于关键领域财政支出,因而可以命名为“关键领域财政支出”因子;因子F2在资源勘探电力信息等事务、科学技术、城乡社区事务等变量上具有较高载荷,这些变量多为政府为促进科技创新相关服务支出,因而可以命名为“高新科技支出”因子;因子F3在变量在粮油物资储备事务、社会保障和就业、国土资源气象等事务具有较高的载荷,主要反映社会保障类支出,可以命名为“保障财政支出”因子。
为了便于观察得分高低,可以得到一张主成分空间得分,具体得分如图2所示: