2011重金属污染源地数学建模
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括、电子、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A
我们的参赛报名号为(如果赛区设置报名号的话):20001032 所属学校(请填写完整的全名):中国人民解放军国防科学技术大学参赛队员(打印并签名) :1. 腾骥
2. 袁雪强
3. 泉朴
指导教师或指导教师组负责人(打印并签名):文强
日期:2011 年9 月9 日赛区评阅编号(由赛区组委会评阅前进行编号):
2011高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):
全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):
基于MCMC的城市表层土壤重金属污染分析
摘要:本文针对某城市城区表层土壤重金属污染分析的问题,从各分区重金属元素污染的空间分布、污染程度、污染原因及传播途径等多方面进行了全面的统计与研究,同时采用贝叶斯推理和马尔科夫链蒙特卡洛法(MCMC),利用MATLAB进行编程,对所设计的模型进行求解,得到了各重金属污染源的地理位置坐标,最后对城市地质环境演变模式的问题进行了探究,得出了初步的结论。
首先,根据所给数据信息,利用MATLAB及EXCEL作图,得到了该地区的地势图及各重金属污染程度的分布图。
对于问题1,通过统计各重金属的重污染点在各区域的分布和计算不同区域各中金属污染程度之间的相关系数,得到了各重金属的大致空间分布,并采用改进的梅罗指数法,得出不同区域重金属的污染程度。
对于问题2,在问题1所得数据及结论的基础上,结合实际情况,对各重金属污染的主要原因进行了较为全面的分析。
对于问题3,通过对污染的传播特征的研究,基于城市的地质特性,得到空气传播为污染主要传播方式的结论,并由此建立关于气体传播的概率模型,采用贝叶斯推理和马尔科夫链蒙特卡洛法,利用MATLAB进行50000次抽样,得到收敛的坐标值,从而计算出各重金属污染源的地理位置坐标分别为:As (2742,7294)、Cd(2382,3693)、Cr(3470,2309)、Cu(2707,2295)、Hg(2708,2294)、Ni(1647,2729)、Pb(2882,3617)、Zn(4152,2299)。
对于问题4,以题中城市土壤重金属污染的演变规律为例进行了一定深度的探究,并对所需信息及模型设计方案进行了初步的讨论。
关键词:梅罗指数法相关系数贝叶斯推理MCMC法MH算法
一、问题的提出与分析
(一)背景介绍
随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。
对城市土壤地质环境异常的查证,以及如何应用查证获得的海量数据资料开展城市环境质量评价,研究人类活动影响下城市地质环境的演变模式,日益成为人们关注的焦点。
按照功能划分,城区一般可分为生活区、工业区、山区、主干道路区及公园绿地区等,分别记为1类区、2类区、……、5类区,不同的区域环境受人类活动影响的程度不同。
现对某城市城区土壤地质环境进行调查。
为此,将所考察的城区划分为间距1公里左右的网格子区域,按照每平方公里1个采样点对表层土(0~10 厘米深度)进行取样、编号,并用GPS记录采样点的位置。
应用专门仪器测试分析,获得了每个样本所含的多种化学元素的浓度数据。
另一方面,按照2公里的间距在那些远离人群及工业活动的自然区取样,将其作为该城区表层土壤中元素的背景值。
(二)要解决的问题
现给出采样点的位置、海拔高度及其所属功能区等信息,8种主要重金属元素在采样点处的浓度及8种主要重金属元素的背景值,解答以下问题:
1. 给出8种主要重金属元素在该城区的空间分布,并分析该城区不同区域重金属的污染程度。
2. 通过数据分析,说明重金属污染的主要原因。
3. 分析重金属污染物的传播特征,由此建立模型,确定污染源的位置。
4. 分析所建立模型的优缺点,并说明为更好地研究城市地质环境的演变模式,还应收集什么信息,有了这些信息,如何建立模型解决问题。
(三)问题分析
整个问题可以分为三类分别进行求解:
问题1和问题2
可将其归结为对所给数据的统计与分析,可以通过作图或列表等直观的形式针对不同金属和区域进行相关统计,再对统计的结果加以比对与分析,即可得出结论。
问题3
确定污染源的位置实质就是要找到使周围污染达到最大的点,这样可以转化为概率模型,在统计数据的基础上,运用贝叶斯推理马尔科夫链蒙特卡洛法可加以计算和确定。
问题4
开放类问题,可根据现有资料进行回答。
二、模型假设
1. 题目中所给出的样本均具有普遍性及代表性,而非所测地区中的特殊情况。
2. 该地区的空气流动没有显著的方向性特征。
3. 污染物浓度在取样前后较长一段时间不会有显著的变化。
三、符号说明
P : 土壤污染元素综合污染指数
: 土壤中污染元素i 的实测值 : 土壤中污染元素i 的评价标准值
S : 任一闭合曲面
3M : S 指定所围的区域 1M : 通过S 流入Ω的质量 2M : 的质量
3M : Ω由于浓度的变化引起的质量增加 2k : 衰减系数
: 贝叶斯公式模型参数 m : 模型参数的个数 y : 贝叶斯公式观测数据
(),k T x x :马尔可夫蒙特链卡洛法中的分布
(,)k x x α:接受概率
()x π: 目标概率密度函数
s : 距离污染源的距离 p : 沉降系数
h: 海拔高度
h:临界海拔
r:重金属元素吸附系数
四、模型建立与求解
(一)空间分布的特征
根据所给数据,对采样点按区域进行重新的排序,由此作出各采样点的地势分布图(图一),又由各种金属在各区域的浓度值,作出金属污染程度在各区域的分布图(以Pb(铅)为例,见图二,其它金属元素分布图见附件),由此分析可得到各金属元素在该城区的空间分布。
以Pb为例进行分析,经统计,Pb的重度污染区域主要集中于图的左下方,且Pb的重度污染点在工业区占62.8%,另有20.9%重度污染点则分布在左下方的交通区中,由此可得Pb的污染区域主要分布于工业区和左下方的部分交通区,对于其它金属元素,可以用相同的方法,还可以通过计算不同区域各金属元素污染程度的相关系数,找出各金属元素污染之间的联系,这样可以有效提高分析效率和准确性。
例如对表一中工业区的各金属元素污染程度相关系数(其它区域见附件)的比较可以得出,Cr与Cu、Cr与Hg、Cu与Hg、Cd与Pb、Cd与Zn、Pb与Zn相关系数较大,可以认为它们具有相同或相近的空间分布。
表一工业区各金属元素污染程度相关系数
根据以上数据分析,可以得到各重金属元素大致的空间分布,分别为:
1. Hg、Cd、Pb、Zn、Cr均主要分布于工业区和左下方的部分交通区;
2. As、Cu主要分布于工业区;
3. Ni的分布比较分散,没有明显的富集现象。
(二)重金属污染程度的划分
为了全面、综合地反映污染物的整体污染水平,需要一种同时考虑污染物综合污染水平的多因子评价方法,这里采用梅罗指数法(《梅罗指数评价法的修正
及其应用》),其计算公式如下:
式中,P 为土壤污染元素综合污染指数;为土壤中污染元素i 的实测值;为土壤中污染元素i 的评价标准值。
梅罗指数土壤污染评价标准如表二。
表二 梅罗指数土壤污染评价标准
但由于梅罗指数法过分突出极大值对水质污染的影响,会出现评价项目中只有一项指标值偏高,而其他指标值均较低也会使综合评分值偏高的情况,故对梅罗法进行改进如下:
'max max 2
w
C C C +=
其中 1
max n
i
i C
C m
==
∑
式中:w C 为权重值前n 项的平均值,n 值根据评价数据确定;i C 为前n 项的值;m
P =
为前n 项中0h h 的项数。
对于以上8种重金属,取权重值如表三:
表三 各重金属权重值
计算得到域不同重金属的污染程度评价结果如表四:
表四 各区域重金属污染程度
(三)重金属污染原因分析
根据(一)、(二)中所得数据及结论,将各重金属污染的原因做如下分析: 1. 对于除Ni 以外的其他重金属元素,均有60%以上的重污染点分布在工业区,由此可认为重金属污染主要源自工业区,这主要是由于工业区中的工厂在生产过程中产生了含该种金属的废弃物,在排放时也没有进行必要的净化处理而直接排入水体或大气中,从而造成了污染的形成与扩散,
2. Hg 、Cd 、Pb 、Zn 四种金属元素的均有约20%重污染点分布在交通区,这些污染主要来自于公路上行驶车辆燃烧汽油或柴油所产生的尾气沉降及轮胎的磨损。
3. 金属元素Zn在生活区和公园绿地区也有一定的分布,这可能是由于该区域所使用的肥料中含有Zn元素。
4. 金属元素Ni的污染点较为分散,可认为该污染与人为因素关系不大,主要来自于土壤母质本身。
(四)重金属污染物的传播特征
重金属一般不会直接通过土壤进行传播,它一般通过如下方式进行传播:1. 空气传播
工业区中的工厂会排放出大量的工业废气,这些废气中可能含有大量的重金属颗粒,这些颗粒会随空气的流动而分散到城市各处,从而造成污染,另外,废气也可能会随降雨渗入土壤。
2. 水源传播
工厂排出的工业废水中含有大量的重金属离子及沉淀物,这些物质均可随水渗入土壤,造成污染。
3. 工业废渣和生活垃圾
废渣及生活垃圾的堆积会造成重金属元素的大量积聚。
另外,重金属的传播受地形因素的影响较为明显,从数据来看,该城市整体海拔较低,地势起伏不大。
相对1000米的取样间隔,300米的高度差不会因高空吸附或雨水冲刷造成污染物沉积异常。
但山势对风向的影响势必导致污染物浓度区域性变化。
如上图的标注,山脚①、②、③较易形成污染物富集;由于Ⅰ、Ⅱ山谷的存在,经过山谷的大风在A、B区域减速后极易产生污染物富集;此外,迎向污染源的山坡受到的污染会明显大于背向污染源的山坡。
从Hg、Cd的污染分布情况可以验证这几点(如图四):
(五)建立模型确定污染源
在进行污染源的确定之前先进行筛选,如果污染是由点污染源引起的,那么污染源就一定处于污染程度最大,即重金属浓度最高的采样点的附近。
由于城市中建筑物较多,人类活动频繁,导致局部气流复杂,因此通过空气
传播占主要地位,又由于城市缺少地表水系,雨水及其它污水会通过下水管排出城外,故影响相对较小,因此只讨论通过空气传播的模型:
设(),,u x y z 是t 时刻点(),x y 处某种重金属污染物的浓度。
任取一个闭合曲面S ,它所围的区域是Ω,由于气体扩散,由t 到t+时刻的这段时间,通过S 流入Ω的质量为:
2122t t
t
s u u u a cos b cos c cos dSdt x y M z αβγ+∆∂∂∂⎛++∂∂∂⎫=
⎪⎝
⎭⎰
⎰⎰ 由高斯公式得:
222
2
222221()t t
t
u u u a b c dxdydzdt x y z M +∆Ω
∂∂∂++∂∂=
∂⎰
⎰⎰⎰ 其中分别是沿,,x y z 方向的扩散系数。
由于衰减(例如吸收、代等),的质量减少为:
2
2t t
t
k udxdydzd M t +∆Ω
=
⎰
⎰⎰⎰ 其中2k 为衰减系数。
由于重金属污染物在土壤中很难降解,因此衰减系数可以取为0。
由质量守恒定律,在Ω由于扩散和衰减的合作用,积存于Ω物质的总量为12M M - 从另外的一个角度来看,Ω由于浓度的变化引起的质量增加为:
()()3,,,,,,M u x y z t t u x y dx d z y t d z Ω
=+∆-⎡⎤⎣⎦⎰⎰⎰
t t
t
u
dxdydzdt t +∆Ω
∂∂=
⎰
⎰⎰⎰ 显然312M M M =-,即
2222222t t
t t
t
t
u
u u dxdydzdt a b k u dxdydzdt t x y +∆+∆Ω
Ω∂∂∂⎛⎫
= ⎪⎝
⎭+-∂∂∂⎰
⎰⎰⎰⎰
⎰⎰⎰ 由
222
2
222222u u u u a b c k u x y z t ∂∂∂∂++-=∂∂∂∂ 设扩散源在点(
由假设可知,如果认为经过相当长的时间后,扩散已经停止,则物质处于平衡状态,有:
0u
t
∂=∂ 即:
222
2
2222220u u u a b c k u x y z ∂∂∂++-=∂∂∂ 由于污染物在空中传播时,地面上污染物的沉积量与z 方向上的传播无关,故上
述方程可以改写成:
22222220u u
a b k u x y
∂∂+-=∂∂ 因此问题转化成二维含源反演问题,可以用贝叶斯推理来估计参数和。
贝叶斯推理的基础是贝叶斯定理,它可以表述如下:
()()(|)
(|)()
p p y p p y p y θθθθ∝
其中,为模型参数,y 为观测数据,()p θ为参数的先验概率密度数,()|p y θ为似然函数,()|p y θ为参数的后验概率密度函数。
在贝叶斯推理中,p ()表示在未获得测量数据之前,对模型参数分布的认识,主要来源于以往数据、 经验和主观判断等。
()|p y θ代表模型参数拟合测量数据的程度,越大表示拟和效果越好,反之则差。
()|p y θ表示了获得测量数据以后模型参数的分布规律,即为在统计反演意义下的反问题的解。
其步骤通常分为以下三步:
1. 确定先验概率密度数
一般情况下,对于参数,如果仅知道它分布的区间[],i i a b ,那么可以假设先验概率为均匀分布:
()p θ=
假设参数之间相互独立则:
()1
()m
i i p p θθ==∏
其中m 为模型参数的个数。
2. 确定似然函数
似然函数的构造对于贝叶斯推理的结果具有很大影响,一般可以认为测量误差服从正态分布()2~N εμσ,,此时似然函数可以表示为:
()()
()()()()2
22
1
|exp 22T n
f y f y p y θθθσπσ⎡⎤
--⎢⎥=
-⎢⎥
⎣⎦
其中n 为测量个数,()f θ 可以用解析解表示,一般情况下,f 为数值解。
3. 对后验概率密度函数抽样,进而获得参数的估计值
选取马尔科夫链蒙特卡洛法(Markov chain Mont Carlo ,简记为MCMC)。
算
法为MH 算法,表示如下:
(1) 设定参数初始值[]
10,12000x ∈并设定1k =;
(2) proposal 分布(),k T x x 中生成[]
10,12000x ∈,计算接受概率:
()()()()|(,)1,|k k k k x T x x x x min x T x x παπ⎡⎤
=⎢⎥⎣
⎦
(3) 生成[0,1]之间均匀分布的随机数t ;
(4) 如果(),k x x t α≥ ,设置1k x x +=;否则1k k x x +=。
当k K = (迭代次数)
时,停止;否则1k k =+,继续第(2)步。
其中,()x π为目标概率密度函数,在贝叶斯推理中为似然函数。
(六)模型的求解
通过MATLAB 编程,使用MH 算法进行50000次抽样,使目标坐标值趋于平稳,最终得到各重金属元素污染源的地理位置坐标如表五。
(图五为Hg 元素进行抽样后的迭代曲线图,可以看到图线最终趋于一条平稳的直线。
)
表五各重金属元素污染源地理位置坐标
(七)对城市地质环境的演变模式的探究
地质环境的演变模式是一个地域在一段较长时期所表现出来的地质变化规律与趋势,因此,要对城市地质环境的演变模式进行研究,就必须掌握所研究城市在长期的地质变化过程中形成的规律,以研究题中城市土壤重金属污染的演变规律为例,就需要收集该城市每年生活、工业等重要污染源的废弃物排放量,以及每年的生物降解量,另外,该城市的水文特征及气候特征也会对重金属元素扩散产生重要的影响,因此还应该考虑降雨量及气候条件的信息。
拥有这些数据后,可以建立因子分析法,回归分析,曲线拟合等模型进行分析,进一步还可使用马尔科夫链等方法对该城市未来的污染状况进行预测与评估。
五、模型评价
优点:
1.通过改进后的梅罗指数法引入了权值,避免了极大值对结果的较大影响,提高了数据的准确性和可信度。
2.通过马尔科夫链蒙特卡洛法(MCMC)简化了微分方程的求解,降低了计算时的复杂度。
3.通过对地形的综合分析,剔除了地形影响较大的区域,简化了模型。
缺点:
1. 没有兼顾降雨、降解等其他对污染产生作用的因素的影响。
2. 对污染的传播规律还有进一步探索的余地。
六、参考文献
[1] 朱嵩、、毛根海、程伟平、黄跃飞,《利用贝叶斯推理估计二维含源对流扩散方程参数》,《大学学报》,第40卷第2期,2008年5月。
[2] 尚志、程继新,《数学建模教程》,2011年
[3] 忠平、卢文喜、辛欣,《市城区表层土壤重金属污染来源解析》,/,2011年9月10日。
[4] 彦峰、郭恒亮、志英,《基于土壤学知识的主成分分析判断土壤重金属来源》,《地理科学》,第28卷第1期,2008年2月
[5] 亚松,兆吉,费宇虹,王昭,《梅罗指数评价法的修正及其应用》,《水资源保护》,第25卷第六期,2009年11月。