陕西省社会经济发展的统计分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
陕西省社会经济发展的统计分析
摘要
社会经济的发展决定着城市的影响力,城市影响力又是指一个城市与其他城市相比在国内竞争中所表现出来的综合能力的强弱,所具有的自身创造财富和推动地区、国家或世界创造更多社会财富的能力。城市影响力综合反映了城市的生产能力、对外经济辐射能力和人才的吸引能力。
通过对陕西省各城市的综合经济实力、基础设施水平、资金融通能力、对外经济能力、管理水平、科技实力、教育与人口素质进行比较排名,主要采用聚类分析法,划分区域,得出陕西十座城市的社会经济的发展水平。
本文主要采用了系统聚类分析法和K均值法进行聚类分析。
关键词城市影响力;陕西省;城市;系统聚类分析;K均值聚类分析
The Analysis About The Cities Of Shaanxi Province Of
Economical Development
ABSTRACT
The development of social economy determines the influence of the city, city infl uence is refers to a city compared with other cities in the domestic competition is sh own by the strength of the comprehensive ability, have their own to create wealth an promote regional, national, or the ability to create more social wealth in the world. City influence reflects the comprehensive production capacity of the city, foreign econ omic radiation ability and the ability to attract talent.
Based on the comprehensive economic strength of each city in Shanxi Province, infrastructure level, financing ability, foreign economic ability, management level, stre-ngth of science and technology, education and compare ranking the quality of the po-pulation,mainly USES the clustering analysis method, divided area, concluded that soc-ial and economic development level of 10 cities in shaanxi province.
This article mainly USES the system clustering analysis method and the k-means method of clustering analysis.
Key words:The influence of city; Shaanxi province; City; Hierachical Cluster ;the K-Means Cluster
目录
1 绪论 (1)
1.1课题背景及目的 (1)
1.2 课题的相关原理 (1)
2 确定城市影响力的要素 (3)
2.1确定相关要素 (3)
2.2搜集相关数据 (3)
2.3对数据进行整理 (3)
3 运用SPSS软件进行分析 (4)
3.1 系统聚类分析法进行聚类分析 (4)
3.2 K-均值分析法进行聚类分析 (5)
4 结论 (7)
参考文献 (9)
1 绪论
1.1课题背景及目的
陕西省是我国中部地区的重要省份,近年来经济发张程度较快,到2013年底,其国内生产总值已经达到了14451亿元,在全国各省市、自治区中位居第16位,位于内蒙古自治区和黑龙江之间。由于各市资源拥有程度不一、区位条件不同、经济基础差别较大、国家政策等因素的影响,省内各地市间存在着明显的发展差异,经济发展程度很不均衡,如何准确地为陕西省各地市的经济发展程度定位,是一个关系到陕西省实施经济发展战略的重要问题。我们使用多元统计分析中的系统聚类分析法和K均值聚类分析法,较系统、客观的反映陕西省各地市的经济发展情况,比较陕西省各地市的经济发展程度
1.2 课题的相关原理
K-MEANS算法:
输入:聚类个数k,以及包含 n个数据对象的数据库。
输出:满足方差最小标准的k个聚类。
处理流程:
(1)从 n个数据对象任意选择 k 个对象作为初始聚类中心;
(2)循环(3)到(4)直到每个聚类不再发生变化为止
(3)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;
(4)重新计算每个(有变化)聚类的均值(中心对象)
k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。
k-means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为;聚类与分类的不同在于,聚类所要求划分的类是未知的;聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS 等。
从机器学习的角度讲,簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类