STATA与SPSS各省市第三产业生产总值

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于STATA与SPSS各省市第三产业生产总值K-均值聚类对比分析报告

姓名:

学号:

专业:

北京科技大学东凌经济管理学院

2012年10月25 日

基于STATA与SPSS各省市第三产业生产总值

K-均值聚类对比分析报告

一、K-均值聚类

1、聚类分析

聚类分析按照对象之间的“相似”程度把对象进行分类,聚类分析的“对象”可以是所观察的多个样本,也可以是针对每个样本测得的多个变量。

2、K-均值聚类

K-均值聚类事先需要确定要分的类别数据,计算量要小得多,效率比层次聚类要高,也被称为快速聚类。

3、K-均值聚类步骤

第1步:确定要分的类别数目K(需要研究者自己确定)在实际应用中,往往需要研究者根据实际问题反复尝试,得到不同的分类并进行比较,得出最后要分的类别数量。

第2步:确定K个类别的初始聚类中心

要求在用于聚类的全部样本中,选择K个样本作为K个类别的初始聚类中心;与确定类别数目一样,原始聚类中心的确定也需要研究者根据实际问题和经验来综合考虑。

第3步:根据确定的K个初始聚类中心,依次计算每个样本到K个聚类中心的距离欧氏距离,并根据距离最近的原则将所有的样本分到事先确定的K个类别中。

第4步:根据所分成的K个类别,计算出各类别中每个变量的均值,并以均值点作为新的K个类别中心。根据新的中心位置,重新计算每个样本到新中心的距离,并重新进行分类。

第5步:重复第4步,直到满足终止聚类条件为止。迭代次数达到研究者事先指定的最大迭代次数;新确定的聚类中心点与上一次迭代形成的中心点的最大偏移量小于指定的量。

K-均值聚类法是根据事先确定的K个类别反复迭代直到把每个样本分到指定的里类别中。类别数目的确定具有一定的主主观性,究竟分多少类合适,需要研究者对研究问题的了解程度、相关知识和经验。

二、数据来源

本文数据选自《2011中国统计年鉴》2-15 按三次产业分地区生产总值部分,见表1。

本表绝对数按当年价格计算,指数按不变价格计算

单位:亿元

三、STATA应用

1、运行命令

cluster kmeans var1 var2 var3 var4 var5, k(4)

cluster completelinkage var1 var2 var3 var4 var5, name(L2clnk3)

cluster dendrogram L2clnk3

2、K-均值聚类结果

通过运行命令,得到聚类结果见表2和图1。

图1:STATA树状聚类图四、SPSS应用

用SPSS进行K-均值聚类,得到的结果见表3和图2.

图2:SPSS树状聚类图

五、结论

通过STATA和SPSS两种统计软件运行,可以看出聚类的结果大致相同,但是存在一些类别中包含数量的差异。

通过聚类的结果可以得出我国第三产业发展不平衡,东部沿海省市第三产业比较发达,中部地区次之,西部地区相对落后,这和我国当前的第三产业发展现状比较吻合。

长期以来,由于各地区生产力发展水平不同,社会劳动力分布不均,各地区

经济发展的重点不一样,因而第三产业的区域发展仍有明显的差异。总体来看,从沿海到内地呈现出明显的层次特征。以增加值为例,经济实力比较强的广东省,2010年第三产业的增加值13020亿元,而经济实力比较弱的西藏和青海合计也只有338亿元,两者相差四十几倍。同时,由于我国在政策上采取地区经济发展梯进推移战略,从东到西分为三级梯度,分别实行不同的发展战略,因而我国东、中、西部三大地区第三产业发展水平差异现在仍比较大。

我国第三产业在区域间的发展过程中呈现出了不平衡状况,要促进各个区域第三产业可持续发展,解决第三产业对国民经济总体发展水平和产业结构的约束作用,促进经济结构的高级化和现代化。地区第三产业的发展应以区域的资源为基础,优势的资源才能支撑起优势的产业。东部沿海地区毗邻港澳,可以充分发挥此项优势,扩大第三产业与它们以及东南亚的交流,在商业、房地产和其它一些行业中吸引港澳人士参与,把东南沿海地区建成我国与东南亚地区进行经济交流与合作的基地。中西部地区旅游资源丰富,正好可以借助此项有利条件,可在这些自然资源基础上,加大旅游基础设施投资力度,改善旅游消费环境,大力加强旅游促销,推广新景点、新线路、新城市,不断形成新的旅游热点和亮点,逐步提高区域旅游业的国内和国际竞争力,促进各地区特别是中西部地区省份第三产业的全面进步。

参考文献

1、张鹏伟李嫣怡. 《Stata统计分析与应用》.电子工业出版社,2011, 5.

2、Joseph F. Hair, Rolph E. Anderson.《Multivariate data analysis》. Prentice Hall, 2010

3、薛薇. 《统计分析与SPSS的应用》中国人民大学出版社,2011, 1.

4、各省市第三产业地区生产总值. /tjsj/ndsj/2011/indexch.htm

5、Abdelmonem A. Afifi, Virginia Clark, Susanne May.《Computer-aided multivariate analysis》. Chapman & Hall/CRC, 2004

相关文档
最新文档