基于聚类分析法空气质量分析论文

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于聚类分析法的空气质量分析

摘要:本文利用聚类分析法研究深圳市各区的空气质量问题,

就主要污染物so2、no2、pm10、co和o3等进行分析,得到各污染物含量之间的关系,以及其相关性程度,从中找到污染程度相当的主要地区,结合其地理位置,从而判断其主要污染源,对同一类地区用相同的方法进行集中治理。

关键词:聚类分析空气质量集中治理污染源

based on clustering analysis of air quality analysis

wang shuai

(college of mechanical engineering, south east university, nanjing, 211189)

abstract: this paper make use of cluster analysis method to study the district shenzhen city air quality problem, the main pollutant so2, no2 and pm10 readings - which were taken, co and o3 undertake an analysis, get the relationship between the content of each pollutant, and the correlation degree, find the main area is polluted, combined with its geographical position to judge the main pollution sources, to the same kind of area with the same method for centralized management.

keywords: clustering analysis; air quality; centralized management; pollution sources;

中图分类号:q938.1+4文献标识码: a 文章编号:

由于空气的扩散作用,导致对空气环境的治理有一定的盲目性,不能做到对症下药,导致效果不佳。将空气检测数据进行聚类分析找出污染问题相近的区域进行其中治理,使方案更加有针对性。

1 数据来源

本文所有的数据都收集自深圳市环境空气质量时报.空气质量

时报对深圳各区的空气主要污染物的浓度进行检测,进行评级。

2 聚类分析

聚类分析方法聚类分析方法聚类分析方法聚类分析方法聚类分析关注于根据一些不同种类的度量构造一些相似的对象组成的群体。关键的思想去确定对分析目标有利的对象分类方法。在聚类分析前,首先把数据标准化为z-分数,采用系统聚类(hierachical cluster) 方法,用音差平方和法(ward法)计算欧几里得(eudlidean)距离。聚类分析依据的基本原则是:直接比较样本中各事物之间的性质,,将性质相近的归为一类,而将性质差别比较大的分在不同类。也就是说,同类事物之间的性质差异小,类与类之间的事物性质相差较大。其中欧式距离在聚类分析中用得最广,它的表达式如下:其中xik表示第i个样品的第k个指标的观测值,xjk表示第j个样品的第k个指标的观测值,dij为第i个样品与第j个样品之间的欧氏距离。若dij越小,那么第i与j两个样品之间的性质就越接近。性质接近的样品就可以划为一类。当确定了样品之间的距离之后,就要对样品进行分类。分类的方法很多,本节只介绍系统聚类法,它是聚类分析中应用最广泛的一种方法。

首先将n个样品每个自成一类,然后每次将具有最小距离的两类合并成一类,合并后重新计算类与类之间的距离,这个过程一直持续到所有样品归为一类为止。分类结果可以画成一张直观的聚类谱系图。

3. 问题分析

3.1分析方法

本调查所采用的是聚类分析法,通过spss软件进行统计分析。对问卷进行统计处理得到原始数据表(见表1)。利用spss软件得到聚类成员(见表2)和聚类中心(见表3)。同时进行r型聚类即对变量进行分类(见表4)。

表1 原始数据

表2 聚类成员

表3 聚类中心

表4 聚类表

图1树状图

3.2结果分析

由聚类分析的计算结果可以看出,原变量之间的差异不大 ,根

据表2所示可知,污染区域可以分为两类,第一类包含16个区域,第二类有两个区域即盐山和葵涌,由聚类中心(表3)可以看出,第一类是以so2、no2、pm10为主要污染物的区域,而第二类则以o3为主要污染物。从表4可以看出各类中各区域之间的相近程度。从图1中可以更为直观的看出福永、光明、横岗、观澜和沙井,相近程度更大,而宝安、龙华和华侨程度相近。南油、荔园和荔香相近。图中线条长度表示相近程度。

4 结论

聚类分析法表明,可以将全市分为两个大的空气质量区,一区中的十六个区域,主要治理so2、no2、pm10为主,而二区以o3的治理为主。由于空气的扩散作用可知,某一区域的作用会影响到周围一大片区域的空气环境,所以可以结合所属于同一类的区域之间的地理位置关系和该区的主要污染物,对区域内的主要污染源进行排查,从而准确找到相关问题的根源,避免了盲目性。

参考文献(reference)

[1]汪应洛.系统工程[m].北京:机械工业出版社.2009.54-60.

[2]方开泰.实用多元统计分析[m].上海:华东师范大出版

社.1989.291-302.

[3]王学仁,王松桂.实用多元统计分析[m].上海:上海科技出版社.1990.270-272.

[4]方开泰.实用多元统计分析[m].上海:华东师范大学出版

社.1989.291-302.

[5]李冬梅,陈军霞.聚类分析法在公交网络评价中的应用[j].河北科技大学学报.2012(3)

[6]张钰红,刘万荣.因子分析与聚类分析在毕业论文成绩评定中的应用[j].湖南城市学院学报.2009(1)

[7]曾峰,肖宁,李智.应用聚类分析法确定沥青路面预防性养护方案[j].华南理工大学学报.2008(6).

相关文档
最新文档