北京空气质量的评价
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 主成分分析 预测因子有六个,样本容量为17,记预测因子为z1,z2,z3,…,z6,由 这六个变量线性组合成一新变量y=v1*z1+v2*z2+…v6*z6如果y满 足方差极大要求,则y为原6个变量主成分。 我们用spss软件,首先做了KMO 和 Bartlett 的检验,选取了前两 个主成分,累计占总方差的百分率为71.269%。
然后:筛选出适合进行因子分析的那些指标
本着得到85% 以上的原信 息的原则, 最终提取1个 主因子。其 累计方差贡 献率为 88.146%
综合评价函数:
这个结果和定性分析的结果是一致的。北京的污染形势在整 体上呈现自北向南加重的趋势,污染物浓度增加依次为北部<东 北部<市区和东部<南部<西南部
模型。
2004-2013年9月8日至9月14日 各指标值
以相对湿度为例
90 80
70
60 50 40 30 系列1
20
10 0 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
加权移步平均
预测9月8日—9月14日的AQI指数
9月8日 9月9日 9月10日 9月11日 9月12日 9月13日 9月14日 140 211 89 208 259 115 45
空间:
1.定性分析
直观看出北京经济开发区和大兴区的的污染物质比较 多而延庆县的环境污染物质比较少环境相对较好。
2.定量分析
A 因子分析
首先:进行标准化处理后,各指标均值都为0,标准差都为1。 接着:检查原有变量之间是否存在较强的相关关系
得出KMO值为0.779,根据统计学家 Kaiser给出的标准,KMO取值小于0.6, 不太适合因子分析。 Bartlett球度检验给 出的相伴概率为0.00,小于显著性水平 0.05,因此拒绝Bartlett球度检验的零假设, 认为适合于因子分析。
3人口约束 为了使建成的监测网络能最大限度地保护人 口,根据分配到网格中的人口数量来确定备 选的监测站点网格,即通过设置监测站所在 网格的最低人口数Pmin,将人口数量大于或 等于Pmin的网格作为备选网格。 P〉=Pmin(P为网格的人口数量) 通过顺义区25个地方2013年的人口数资料, 令Pmin=4.9万,经筛选,剩下5个备选网格, 标号为1 南彩镇,2光明街道,3李桥,4仁 和,5 石园
六、模型评价
模型的优点
针对问题一 :从官方网站搜索原始数据数据相对可 针对问题四: 巧妙的运用了灰色关联性分析,得出与空气质量相 关的因素并给出合理建议。 靠。导入数据的处理办法使得操作更快捷。 针对问题二 : 能够很好地发现季节性规律、从定性和定量不 针对问题五: 基于径向基函数的神经网络预测比传统线性回归
定量
由于我国环境数据的不完善,所得到数据的样本 量少而且灰度较大,所以考虑采用灰色关联分析 影响因素。
X1--林业投资完成情况(万元) X2--人均GDP(元) X3--治理废气完成投资(万元) X4--能源消耗总量(吨标准煤) X5--汽车保有量(万辆) X6--常住人口总量(万人) X7--绿地覆盖面积(公顷) Y1--PM10浓度(mg/dm3) Y2--SO2浓度(mg/dm3) Y3--NO2浓度(mg/dm3) Y4—CO浓度(mg/dm3)。
通过Lingo求解,选择南彩镇和李桥镇作为新增监测点。综上, 对于现有监测点个数相对较少的顺义区,我们选择了杨镇地区, 南彩镇和李桥镇作为新增监测子站的网格。
问题4: 空气污染的主要成因及解决办法 定性
北京的西部 和北部为山 脉,东南部 为平原,吹 偏南风或偏 东风时,造 成市区污染 物累积而浓 度升高。低 空吹偏北风, 污染物浓度 下降。
二、基本假设
1)从北京市环保局等地查到的数据值得相信,具 有使用价值。 2)不发生突发性的灾害等情况。 3)NO2、SO2、PM10、PM2.5和AQI的浓度或者数值 能反应一个地方的空气质量。 4)不考虑其他随机因素对空气质量的影响。
三、模型的建立以及求解 问题1:查找数据 查询地点:北京市环保局、中国统计年鉴、中央气 象局、世界天气(243)、天气后报等 数据类型:平均温度、大气压、湿度、风速、 PM2.5、PM10、AQI、SO2、NO2 等。发展趋势图
由于官方网站没有公开全部数据,使得有些数据 使用的还是比较2013年的,甚至是2012年以前的。没 有对空气质量与气候因素做出更为具体的分析。虽然 我们改进了神经网络,但是在一定程度上还是会存在 一定的误差。
参考文献
[1] 郑子萍.数学建模教程.沈阳:东北大学出版社,2013年 [2] 赵静,但琦.数学模型与数学实验.北京:高等教育出版社, 2004年 [3] 韩明,张积林.数学建模案例.上海:同济大学出版社,2012年 [4] 刘潘炜等,区域空气质量监测网络优化布点方法研究,中国 环境科学,30卷7期,907-913,出版年:2010年 [5]王帅等,关于我国环境空气质量监测点位设置的思考,环境 与可持续发展,第4期,22-25,出版年:2012年 [6]吴有训等,基于径向基函数网络的宣城市空气质量预测,安 徽师范大学学报,34卷4期,374-379,出版年:2011
结果
控制主管原因,持续削减污染源、降低排放、加大 空气污染指标与其影响因素之间的灰色关联度均达到 治理污染投资力度、减少机动车辆、控制北京的人 0.7 以上。 口总量、增加绿地覆盖面积等才是北京空气质量改 善的根本保证。
问题5:预测未来一周AQI指数
1 数据准备
大气污染物的扩散能力与气象因素的变化密切相关,通过相 关学习,我们选取了平均气温,平均风速,平均气压,平均 水汽压,平均相对湿度和降水量六项指标[。首先,从中国 气象科学数据共享网查阅去年(2013年)8月20日至9月5日 各指标值及每天AQI值,作为训练样本。然后,查阅从2004 年到2013年从9月8日到9月14日(即今年进行预测的日期) 每天的各指标值,来预测今年9月8日到9月14 日各指标值, 作为输入向量,输入到神经网络,进行AQI的预测。
KMO 和 Bartlett 的检验 取 样 足 够 度 的 .428
合计 3.066 1.210 初始特征值 方差的 % 51.098 20.171 累积 % 51.098 71.269 解释的总方差 提取平方和载入 合计 3.066 1.210 方差的 % 51.098 20.171
Kaiser-Meyer-Olkin 度量。 Bartlett 的球形度检验 近似卡方 df Sig. 成份矩阵
a
128.874 15 .000
成份 1 平均气温 平均风速 平均本站气压 平均水汽压 平均相对湿度 20-20 时降水量 .710 -.710 -.219 .958 .934 .469 2 -.265 .039 .818 .034 .046 .683
3 径向基函数网络方法
首先,我们算出2013年8月20日---9月5日通过线性组合的因子值,作 为神经网络的训练样本,通过调试,我们令spread=0.5,结果在第15代 时,误差小于设定的0.01,至此,我们建立好了径向基函数神经网络
B聚类分析
通过SPSS使用离差平和方法(Ward方法),计算样本的欧氏距 离。聚类结果将各个区县分成四种空气质量类型。
空气质量从好到差依次分为四类,如图,这个结果 和上面的因子分析也是一致的。
问题3:监测点的布局
新增质量监测点的约束条件
顺义区各网格点人口数(万人) 马坡地区办事处 1.1 北务镇 1.1 龙湾屯镇 1.5 北石槽镇 1.5 李遂镇 2 双丰街道办事处 2.3 大孙各庄镇 2.4 张镇 2.4 南法信地区办事处 2.6 赵全营镇 3.1 天竺地区办事处 3.3 木林镇 3.4 胜利街道办事处 3.5 牛栏山地区办事处 3.6 北小营镇 3.8 后沙峪地区办事处 4.1 空港街道办事处 4.4 旺泉街道办事处 4.4 高丽营镇 4.4 仁和地区办事处 4.9 石园街道办事处 4.9 南彩镇 5.1 杨镇地区办事处 5.4 光明街道办事处 5.5 李桥镇 7
北京市空气质量的评价
主要内容
一 、摘要
二、模型的基本假设
三、模型的建立以及求解
四、模型的评价
五、参考文献
Biblioteka Baidu、摘要
针对问题一:我们在北京市环保局、中国统计年鉴等地 找到了需要的一些数据。 针对问题二:我们用了因子分析和聚类分析分别定性定 量的从时间、空间两个维度探讨北京空气质量的状况。 针对问题三:针对北京环境空气质量监测点个数不足的 现状,以顺义区为例,用0-1规划模型为新增监测点选址。 针对问题四:用了灰色关联性分析探讨影响北京空气质 量的一些因素并给出合理建议。 针对问题五:用了基于主成分分析的径向基神经网络对 未来一周AQI指数进行预测。 针对问题六:我们结合了上面的分析结果给出了合理的 计划和商业广告。
问题6:给出你的计划及广告词
计划: 1经营理念:引导消费者走上绿色消费之路,使人们的生活环境变得 美好 2经营项目:与环保有关的行业,如新能源,与环保产品有关的商业 活动 3经营行为: (1)生产过程以少产生污染为核心,如果不能避免,一定要达到国 家标准 才能排放 (2)生产过程节约资源,达到资源最大利用率 4个人行为:养成绿色生活的理念 5经营创新:通过一些有趣的环保教育讲座或活动,扩大公司的影响 力,提高公司的名誉 广告词: 让环保扎根现在,用绿色昭示未来 关注环境,就是关注未来
数据处理:导入到excel表格
问题2:分析北京空气污染情况 时间: 1)PM10的浓 度比NO2、SO2 的浓度高。 2)各个污染物 质平均浓度逐 年的下降。
每年空气质量指数达国家二级标准的天数慢 慢上升,到了2009年趋于平稳。
空气质量的季节性规律
2010年1月开始1256天的API指数
各个污染物浓度随着季节呈波动变化趋势
新增质量监测点的目标函数
为了满足规范中对各级百分位误差的限制,应建立监测点和所有网 格备选点的污染物浓度的各级百分位贴近程度最大化目标,但由于 数据的限制,我们将此目标改为新建监测点与原来监测点的距离最 大化,以确保相对均匀分布,覆盖全部建成区,减小误差。
杨镇 顺义新城
已选点与候选网格点距离(km) 1 南彩镇 2光明街道 3李桥 4仁和 5 石园 10.9 15.3 23.9 16.6 16.7 9.9 6.4 13.4 7.1 8
候选网格点之间的距离(km) 1 南彩镇 2光明街道3李桥 4仁和 5 石园 1 南彩镇 0 4.5 13.7 5.8 6.5 2光明街道 0 10.2 2.1 3 3李桥 0 9.2 7.9 4仁和 0 1.8 5 石园 0
4 空间覆盖度约束 在实际设计中,由于受成本的限制, 监测点位的数量有限,为了使在有 限的监测点位下能够最大地覆盖监 测区域,本模型通过限制相邻监测 站点之间的最小距离实现整个监测 网络的覆盖效率最大化。 DC(Xj+Xk)<=2*Djk (j≠k) Djk为网格j中心点到k 中心点的距离, DC为相邻监测站之间距离的临界值, 根据网格之间的实际距离及规范要 求,令DC=5km.
同角度分析了空间、空间两个维度的空气质量情况。恰到好处的 预测误差小 。用主成分分析进行降维去燥,降低神经网络学习矩 运用了因子分析和聚类分析讲北京的各个区县分类,并且计算结 阵维度。 果一致。
针对问题三 : 用优化模型进行监测点选址在实际中经常运 针对问题六: 提出了合理的计划和广告词。
用。
模型的缺点