中国各城市空气质量的聚类分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

✓ 和北京空气质量相近的城市
λ=0.87 λ=0.89 λ=0.9 λ=0.91 λ=0.92
北京 北京 北京 北京 北京
武汉 武汉 武汉 武汉
成都 成都 成都 成都
乌鲁木齐 乌鲁木齐 乌鲁木齐 乌鲁木齐
聚类分析
一些比较
✓ 石家庄、唐山、邢台和邯郸的各项空气指标均大于平均值,特别是PM2.5这项
指标
秦皇岛 张家口 呼和浩特 长春
徐州
青岛
西宁
保定
衡水
济南
南通 连云港 淮安
盐城
扬州
镇江
泰州

太原
沈阳
银川
✓ 分为五类
北京 石家庄 秦皇岛
舟山 承德
天津 唐山 张家口 台州 大连
沧州 邯郸 太原 丽水 长春
廊坊 哈尔滨 邢台 保定 呼和浩特 沈阳 福州 厦门 上海 无锡
南京 衡水 青岛 深圳 常州
成都 济南 银川 珠海 苏州
都邢 台 乌邯鲁木郸齐 海 北口 京 北 京 平均平值均值
年年平平均均二二氧氧化化氮氮浓浓度度
年年平平均均PPMM22..55浓浓度度
聚类分析
kmeans算法
✓ 分为九类
承德
大连
上海
宁波
温州
台州
丽水

舟山
福州
厦门
深圳
珠海
惠州
海口

石家庄 唐山
邯郸
邢台
天津
沧州
廊坊
郑州
西安
北京 哈尔滨 南京
无锡
武汉
成都 乌鲁木齐 …
聚类分析
等价关系法 ✓ 全国空气最好的城市
0<λ<=0.0423,分为一类,{北京,…,乌鲁木齐}
0.0423<λ<=0.4362,分为两类,其中{海口}{北京,…,乌鲁木齐}
✓ 全国空气最差的几个城市
λ=0.85 石家庄 唐山 邯郸 邢台 保定 衡水 济南 λ=0.87 石家庄 唐山 邢台 λ=0.89 石家庄 邢台
China University of Petroleum
中国各城市空气质量聚类和判 别分析
汇报人: 2016.03.30
China University of Petroleum
背景 人员分工 数据的收集和整理 聚类方法 聚类分析 结论
背景
现状 ✓ 当前,我国大气污染状况十分严重,城市大气环境中总 悬浮物普遍超标。
谢谢!
酸雨
数据的收集和整理
国家统计局年鉴
✓ 2013年全国主要城市空气质量数据(74个城市) 指标
✓ 年平均二氧化硫浓度(μg/m3) ✓ 年平均二氧化氮浓度(μg/m3) ✓ 年平均PM2.5浓度(μg/m3)
人员分工
数据的收集和整理 程序的编制 结果分析 PPT制作
聚类方法
等价关系法
✓ F相似矩阵-传递闭包-F等价矩阵 kmeans算法
武汉 乌鲁木齐 …


江门 惠州

南通 连云港 …
kmeans算法 ✓ 分为三类
聚类分析
北京
天津
秦皇岛 沧州
廊坊
太原
呼和浩


ຫໍສະໝຸດ Baidu
石家庄 唐山 邯郸 邢台 保定 衡水 济南 张家口 承德 大连 上海 盐城 宁波 温州 …
结论
1. 等价关系法和kmeans算法能够有效地将样本分类 2. 聚类分析显示海南是空气最好的城市 3. 石家庄、邯郸、邢台和唐山空气质量较差的城市 4. 北京的空气质量同武汉、成都、乌鲁木齐相近
✓ 北京有两项指标高于平均值,分别是年平均PM2.5浓度和二氧化氮浓度
/通用格式
/通用格式 /通用格式 /通用格式
/通用格式
//通通用 用格 格式 式 /通用格式
//通通用 用格 格式 式
//通通用 用格 格式 式 /通用格式 //通通用 用格 格式 式 石 武家 庄汉 唐 山成
年年平平均均二二氧氧化化硫硫浓浓度度
✓ 硬聚类算法 ✓ 以欧式距离作为相似度测度 ✓ 无监督机器学习
等价关系法
等价关系法 ✓ 数据标准化-极差变换 ✓ 建立F关系-最大最小法 ✓ 改造相似关系为等价关系-平方法求传递闭包
kmeans算法
kmeans算法 ✓ 初始化-确定聚类数和聚类中心
✓ 计算所有样本与聚类中心的距离 ✓ 按照最小距离原则对各个样本进行聚类 ✓ 重新计算聚类中心 ✓ 重复1-4,直到聚类中心不再改变
相关文档
最新文档