SPSS因子分析和主成分分析论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于因子分析的我国经济发展状况实证分析
摘要:选取了2013年我国31个省、直辖市、自治区经济发展的10项指标作为研究对象,运用因子分析的方法,利用spss对数据进行计算,依据因子分析的结果对我国各省的经济发展做出综合评价,得出了这31各省份经济发展状况的综合排名,广东、江苏、山东、浙江、北京排在前5位,是中国各省、直辖市、自治区沿海经济发展较好的地区;甘肃、海南、青海、宁夏、西藏排在后5位,是西部地区经济发展较落后的地区,较为客观反映了中国各省、直辖市、自治区的综合经济实力,为中国各省、直辖市、自治区今后的经济发展提供了理论依据。
关键词:经济发展;因子分析;综合评价;主成分法
一、引言
我国地域辽阔,由于历史、地理位置及经济基础等原因,各地经济发展水平差异很大。改革开放以来,特别是实施西部大开发、振兴东北地区等老工业基地、促进中部地区崛起、鼓励东部地区率先发展的区域发展总体战略以来,各地经济社会发展水平有了很大提高,人民生活也有了很大改善。但区域发展不协调、发展差距拉大的趋势仍未根本改变。本文从我国31 个省市自治区经济的发展视角入手,运用对应分析方法对我国各地区经济发展状况进行统计分析,用以说明我国各地区经济发展不协调的现状。由于衡量各地区经济发展的指标有很多,故选取了比较有代表性的十个指标。
二、相关统计指标与数据的选取
本文运用了因子分析的方法对我国31个省、直辖市、自治区的经济发展状况进行评价。选取了10项经济指标:第一产业增加值(X1);第二产业增加值(X2);第三产业增加值(X3);地方财政预算收入(X4);地方财政预算支出(X5);固定资产投资额(X6);社会消费品零售总额(X7);货物进出口总额(X8);在岗职工平均工资(X9);城乡居民储蓄年末余额(X10)。X2,X3,X4 反映的是经济总量中构成三大产业的不同增加值;X5,X6 反映的是地方财政预算收支;X7 反映的是居民的购买能力;X8反映的是对外贸易;X9,X10反映的是居民的收入与储蓄。本文数据资料来源于《中国统计年鉴》(2013年),具体数据资料见表1。
表1 各地区经济发展状况(2013)
三、数据分析过程
(一)相关性分析
用SPSS21.0数据处理系统将10项经济指标处理后,得到相关系数矩阵、巴特利特球度检验和KMO检验方法进行分析。分析结果见表2和表3。
根据表2原有变量的相关系数矩阵,可以看到:大部分的相关系数都较均大于0.3,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
表3 KMO 和 Bartlett 的检验
Bartlett检验的F值等于541.977,F值显著,Sig.(显著性)小于0.005,表明所取的数据满足正态总体分布;KMO值等于0.74,大于0.7,说明变量之间的相关性可以被其他变量解释,因此适合做因子分析。
(二)提取主因子
根据原有变量的相关系数矩阵,采用主成分分析法提取因子并选取大于1的特征值,得出公因子差和分析结果如下表4。
表4 公因子差
从表中可以看出,10个变量的共同度基本都在80%以上,即这些变量的信息丢失较少,变量都能被因子解释,本次因子提取的总体效果较理想。
一般情况下,确定因子个数时,累计贡献率达到85%以上,本文提取特征值大于1的特征值,得到2个主因子代替原来的10 个因子累计贡献率达90.22%,
因此取出的2个主因子基本上包括了X1~X10的大量信息。分析结果见表5。
表5 解释的总方差
成份初始特征值提取平方和载入旋转平方和载入
合计方差
的 % 累积 % 合计方差
的 %
累积 % 合计方差
的 %
累积 %
1 7.068 70.681 70.681 7.068 70.681 70.681 6.84
2 68.417 68.417
2 1.954 19.541 90.222 1.954 19.541 90.222 2.180 21.805 90.222
3 .397 3.971 94.193
4 .291 2.912 97.106
5 .122 1.221 98.327
6 .074 .743 99.070
7 .049 .485 99.555
8 .032 .323 99.878
9 .008 .078 99.956
10 .004 .044 100.000
由表5可知,第一个公因子的方差贡献率为70.681%,前两个公共因子的累计方差献率已达到90.22>85%,即前两个公共因子已代表了原始数据的绝大部分信息。因子分析效果较理想。在因子旋转后总的累计方差贡献率没有改变,没有影响到原有变量的共同度,但重新分配了各个因子解释原有变量的方差,改变了各因子的方差贡献,使得因子更易于理解。
图1
图1中,横坐标为因子数目,纵坐标为特征值。可以看到:第一个因子的特征值较高,对解释变量的贡献最大;第三个以后的因子特征值都较小,对解释原有变量的贡献很小,已经成为可被忽略的“高山脚下的碎石”,因此提取两个因子适合的。
(三)因子旋转及公因子命名
因为因子意义不明显,对初始因子进行旋转。本文采用旋转因子模型的方法是方差
最大正交旋转,旋转后,得到因子载荷矩阵(见表6)。由旋转后的因子载荷矩阵可以看出,第1主因子第二产业增加值(X2)、第三产业增加值(X3)、地方财政预算收入(X4)、地方财政预算支出(X5)、社会消费品零售总额(X7)、货物进出口总额(X8)、城乡居民储蓄年末余额(X10)这7个指标上的载荷较大,集中反映了第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄这7个方面,因此将其定义为Fac1。第2主因子在在岗职工平均工资(X9)这个指标上的载荷较大,因此,第2因子可定义为在岗职工工资Fac2。这2个主因子的性质及其顺序较好地体现了影响我国各省、直辖市、自治区经济发展的因素,也完全符合社会经济发展的规律。另外还可以看到:这两个因子的实际含义比较模糊。
表6 旋转后因子模型
成份
1
2 X1 .362 .798 X2 .815 .402 X
3 .978 .051 X
4 .989 -.062 X
5 .923 .267 X
6 .754 .591 X
7 .957 .239 X
8 .876 -.346 X
9 -.261 .880 X10
.970
.060
(四)计算因子得分
为了考察各省、直辖市、自治区的经济发展状况,并对其进行分析和综合评价,采用回归法求出因子得分函数,由系数矩阵将2个主因子表示为10项指标的线性组合。
因子得分的函数为:
2个主因子分别从不同的方面反映了我国各省、直辖市、自治区经济发展状况,但单独使某一主因子并不能对我国各省、直辖市、自治区经济发展状况作出综合的评价,
10
98765
432110
98765
4321060.0880.0346.0239.0591.0267.0062.0051.0402.0798.02970.0261.0876.0957.0754.0923.0989.03978.0815.0362.01X X X X X X X X X X Fac X X X X X X X X X X Fac ++-+++-++=+-+++++++=