对我国主要城市空气质量的聚类分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对我国主要城市空气质量的聚类分析
摘要
本文应用多元统计分析中聚类分析理论,使用SPSS17.0软件和spss13.0对我国主要城市的空气质量进行了聚类分析,将31个城市按照空气质量的类型分为了四类。在此基础上,对这些城市的空气质量归属进行了回报判别,结果令人满意。
1引言
大气环境质量评价是环境质量评价的一项重要内容。对空气环境质量的充分认识对我国社会的可持续发展具有现实的指导意义。
在多元统计分析中,常常使用聚类分析和判别分析来解决样本的分类问题。在事先不知道应将样品或指标分为几类、怎么分类的情况下,可以使用聚类分析根据样本或指标的相似程度,将样本或指标归组分类。
聚类分析的基本思想是:在样品之间定义距离,在变量之间定义相似系数,距离或相似系数代表样品或者变量之间的相似程度。按相似程度的大小,将样品逐一归类,关系密切的类聚集到一个小的分类单位,然后逐步扩大,使得关系疏远的聚合到一个大的分类单位,直到所有的样品都聚集完毕,形成一个表示亲疏关系的谱系图,依次按照某些要求对样品进行分类。一般地,根据分类对象的不同,聚类分析可以分为Q型和R型两大类。Q型聚类分析是对样本进行分类处理,R型聚类分析是对变量进行分类处理。[2]
判别分析也是一种数据的分析方法。在事先已经建立了样品分类,需要将新样本归入到已知分类的样本组中时,就可以使用判别分析。
本文以4种空气质量指标为变量,采用系统聚类分析Ward方法(离差平方和法),对我国31个主要城市的空气质量类型进行了聚类。并在此基础上,对这些
城市的空气质量归属进行了回报判别。从结果来看,比较圆满地完成了预定目标。2聚类分析和主要城市空气质量类型的划分
2.1指标的选取
本文选取了全国31个城市的2008年的四项空气质量指标作为对空气质量类型划分的依据,所选数据全部来自《中国统计年鉴》,具体见下表。
主要城市空气质量指标 (2008年)
单位:毫克/立方米
城市
空气质量达到及可吸入颗粒物二氧化硫二氧化氮好于二级的天数
(天)
北京0.123 0.036 0.049 274 天津0.088 0.061 0.041 322 石家庄0.116 0.046 0.031 301 太原0.094 0.073 0.021 303 呼和浩特0.070 0.049 0.045 340 沈阳0.118 0.059 0.037 323 长春0.096 0.030 0.038 342 哈尔滨0.102 0.043 0.055 308 上海0.084 0.051 0.056 328 南京0.098 0.054 0.053 322 杭州0.110 0.052 0.053 301 合肥0.134 0.022 0.025 257 福州0.071 0.023 0.046 354 南昌0.083 0.050 0.036 344 济南0.126 0.052 0.022 295 郑州0.094 0.060 0.047 325 武汉0.113 0.051 0.054 294 长沙0.097 0.053 0.043 329
广州0.071 0.046 0.056 345 南宁0.056 0.040 0.044 352 海口0.043 0.009 0.017 366 重庆0.106 0.063 0.043 297 成都0.111 0.049 0.052 319 贵阳0.082 0.064 0.023 347 昆明0.067 0.051 0.039 366 拉萨0.051 0.005 0.024 353 西安0.113 0.050 0.044 301 兰州0.132 0.070 0.054 268 西宁0.118 0.029 0.030 296 银川0.084 0.049 0.021 330 乌鲁木齐0.145 0.105 0.065 261
表2
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
11 -+
27 -+
3 -+
4 -+
15 -+
29 -+
17 -+-----+
22 -+ |
8 -+ |
9 -+ +-------------+
18 -+ | |
30 -+ | |
2 -+-----+ |
10 -+ |
6 -+ +---------------------------+
16 -+ | |
23 -+ | |
21 -+---+ | |
25 -+ | | |
13 -+ +---------------+ |
26 -+ | |
20 -+---+ |
5 -+ |
7 -+ |
14 -+ |
19 -+ |
24 -+ |
12 -+ |
31 -+-----------------------------------------------+
1 -+
28 -+
表 3
类型城市
第一类合肥,兰州,太原,呼和浩特,郑州,银川,长沙,上海,成都
第二类南京,广州,乌鲁木齐,石家庄,杭州,武汉,长春,贵阳
第三类拉萨,重庆,南昌,西安,海口,哈尔滨,沈阳,济南,南宁,昆明
第四类天津,西宁,福州,北京
从图1,2中可以看出,全国31个城市可以分为四种空气质量类型,如表3