水质监测论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
水质评价问题
摘要
水质综合评价就是根据各水质指标值,对某水体的水质等级进行综合评判,为水体的科学管理和污染防治,提供决策依据,在地区可持续发展中具有重要意义。
对于问题一:本文首先考虑利用水质评价和污染评价两个方面,将与水质评价问题无关的项目指标除去。
然后对剩余7项指标溶解氧、高锰酸盐指数、化学需氧量、氨氮、总磷、锌、挥发酚运用主成分分析法,对东井,西井,南井,北井四口井水质检测报告进行分析,选取主成分,并把主成分得分按方差贡献率加权求和,得出每个地区的污染综合评价指数,进而可以计算每个口井的污染综合评价指数。
对于问题二:本文采用模糊综合评价法将定性评价转化为定量评价即利用模糊数学对受到众多因素影响的事物做出总体评价,充分考虑了各项水质影响因子在总体水环境中的地位。
运用隶属函数求出隶属度,根据隶属度最大原则判断四口井的井水属于哪一等级。
关键词:水质评价主成分分析模糊综合评价隶属度
一.问题重述:
某村内有各相距500米以上的四口水井,分别位于村东、村西、村南和村北,由于农业和生活排放废物使地下浅表水遇到污染,水质监测资料如附录1所示
请完成以下问题:
(1)请用2种以上的数学方法对该村的四个井水的水质进行排序,并比较是否由于方法的不同导致存在着异,以及差异产生的原因。
(2)请对该村的四个井的地表水分别进行水质等级判断。
(水质分级标准参考附录2,或自己查有关资料)
二.问题分析
2.1对问题1的分析
井水的质量是由多个指标来进行测量评估的,为了使得建立的模型能够客观、准确地对四口井水质做出全面的评价,要求:
第一、能够消除指标之间可能存在的相关性,以避免数据的重叠冗余。
第二、必须可以确定不同的指标对水质影响的权重。
有很多传统的系统评估方法比如加权评估法、专家评估法、综合评分法以及层次分析法都不免受到主观因素不同程度的影响。
而本文使用的基于主成分分析所构造的评估机制则可以避免主观因素对评估的影响,使得评估结果客观的反映系统状况。
主成分分析方法是一种将多维因子纳入同一系统进行定量化研究、理论成熟的多元统计分析方法。
通过分析变量之间的相关性,使得所反映信息重叠的变量被某一主成分替代,减少了变量数目,从而降低了系统评价的复杂性。
再以方差贡献率作为每个主成分的权重,由每个主成分的得分加权即可完成对水质的综合评价。
首先,考虑水质有等级标准,利用水质评价和污染评价两个方面。
评估因子的确定要根据国家地表水环境质量标准(GB 3838—2002),结合评价四口水井的实际情况以及监测条件,我
们去掉了16项指标,包括五日生化需氧量,总氮(湖、库,以N计),氟化物(以F计),
铜,硒,砷汞,镉,铬(六价),铅,氰化物,石油类,阴离子表面活性剂,硫化物,粪大肠菌群;由于ph值(7-9)难以确定出具体的水质类别,而且依据数据分析可知,ph 值对水质类别的影响很小,所以此问题中对ph不予考虑。
其次,选定了溶解氧、高锰酸盐指数、化学需氧量、氨氮、总磷、锌、挥发酚7个指标,再采用主成分分析法提取出积累贡献率>98%的因子,再以方差贡献率作为每个主成分的权重,由每个主成分的得分加权完成对水质的综合评价。
2.2对问题2的分析
模糊数学综合评判过程一般归纳为下几个步骤:
(1)找出因素集;
(2)给出评价矩阵;
(3)确定评估函数;
(4)计算评判指标
本题中. 模糊综合评价法用隶属函数表示隶属度进而描述水体 污染程度 分类指标 等模糊的概念 对各单项参数都进行了评价 避免了传统方法偏于主观性的弊端。
三.模型的假设及符号说明
3.1 模型假设
(1)问题中所给出的数据能客观的反映现实情况; (2)这段时间降水均匀,无大量降水,无重大干旱 (3)本文只考虑附表一中影响该水质的环境因素 (4)该村四口井互不流通
(5)在一段时间内影响该村水质的污染因素不发生变化
3.2符号说明
四.模型的建立与求解
4.1针对问题1的模型建立及求解 4.1.1问题1的模型建立 主成分分析法进行评价的步骤如下:
1)对原始数据进行标准化处理
假设进行主成分分析的指标变量有M 个:12,,...,m x x x ,共有n 个评价对象,第i
评价对象的第 j 个指标的取值为 ij x ,将各指标值ij x 转化为标准化指标ij x
ij x
ij j
j
x x s -= (1,2,,;1,2,,)i n j m ==
其中1
1
n
j ij
i x x n
==
∑,2
1
1
(),(1,2,,)1
n
j
ij
j i s
x x j m n ==
-=-∑ ,,j j x s 为第j
个指标的样本均值和样
本标准差。
对应地,称
,(1,2,,)i i
i i
x x x
i m s -==
为标准化指标变量。
2)计算相关系数矩阵R
相关系数矩阵()ij m m R r =
1
.1
n
kj
kj
k ij x
x r n ==
-∑
式中 1,,ii ij ji ij r r r r ==是第i 个指标与第j 个指标的相关系数。
3)计算特征值和特征向量
计算相关系数矩阵R 的特征值 12...0m λλλ≥≥≥≥ ,及对应的特征向量12,,...,m u u u ,其中 12(,,...,)T j j j mj u u u u =,由特征向量组成m 个新的指标变量。
111121211212.............................................m m m
m m m m m
y u x
u x u x y u x u x u x =+++=+++
式中1y 是第1主成分,2y 是第2主成分,…,m y 是第m 主成分。
4)选择p (p ≤m )个主成分,计算综合评价值 ① 计算特征值 (1,2,...)j
j m λ
=的信息贡献率和累积贡献率。
称
1
(1,2,,)
j
j m
k
k b j m λλ
==
=∑
为主成分j y 的信息贡献率;
1
1
p
k
k p m
k
k λ
αλ
===
∑∑
为主成分12,,...,p y y y 的累积贡献率,当p α接近于1(95.0,90.0,85.0)p α=时,则选择前p 个指标变量 12,,...,p y y y 作为p 个主成分,代替原来m 个指标变量,从而可对p 个主成分进行
综合分析。
② 计算综合得分
1
p
j
j j Z b
y ==
∑
其中 j b 为第j 个主成分的信息贡献率,根据综合得分值就可进行评价。
4.1.2问题1的模型求解
(1)由于溶解氧的指标是极大型(指标越大,水质越好),所以需对该指标做极小型处理,
即令倒数变换,变换后得四口井的各因子值如下
表2四口井的各因子值
(2)利用 标准化后矩阵
X = 1.4193 1.17740.6080 0.63310.6899 -0.7071 1.45270.49300.4837 1.0902 1.0624 1.0257 -0.7071-0.1321
0.0672-0.8214 -0.8491 -0.7190-0.8651 1.4142-0.66030.8591
-0.8491
-0.8491
-0.9765
-0.8505
-0.6603⎡⎢
-⎢
--⎣⎤
⎥
⎥⎢⎥
⎢
⎥
⎦
相关系数矩阵
R = 1.0000 0.7364 0.3706 0.4207 0.4208 -0.2500 0.9129 0.7364 1.0000 0.8845 0.8900 0.9111 -0.7787 0.9145 0.3706 0.8845 1.0000 0.9942 0.9981 -0.8005 0.6202 0.4207 0.8900 0.9942 1.0000 0.9930 -0.7386 0.6330 0.4208 0.9111 0.9981 0.9930 1.0000 -0.8122 0.6666 -0.2500 -0.7787 -0.8005 -0.7386 -0.8122 1.0000 -0.6226 0.9129 0.9145 0.6202 0.6330 0.6666 -0.6226 1.0000⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢
⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦
相关系数矩阵的前几个特征根及其贡献率如表3所示:
表3主成分分析结果
主成分 特征值 贡献率
累计贡献率
3.9134
97.8359% 97.8359 %
第二主成分0.0740 1.8505% 996.8645% 第三主成分 0.0125 0.3121 % 99.9985% 第四主成分
0.0001
0.0015 %
100%
由表可以看出,前三个特征根的累计贡献率就达到99%以上,主成分分析效果很好。
因此取前三个主成分(累计贡献率达到99%)进行综合评价排序。
前三个特征根对应的特征向量见表4
表4标准化向量的前三个主成分对应的向量
由此可得三个主成分别为:
12710.27360.42370.3651y x
x x =--+- 12720.70190.12440.4585y x
x x =+++ 1237
0.15410.01360.2548y x x x =-+++ 根据线性表达式中的系数及符号,可对各主成分的实际意义作如下解释:第一主成 分除
1
x 之外的六项指标(高锰酸盐指数、化学需氧量、氨氮、总磷、锌、挥发酚)的综合;
第二主成分主要反映了溶解氧和挥发酚的比例;第三主成分主要反映了锌的比例。
以各个主
成分的方差贡献率为权重可得到水质的最终合评价值:
表5四口井的各评价值
污染越严重。
由上表中i Z 值的大小得四口井水质状况排序由好到差依次为南井,北井,西井,东井。
4.2.针对问题2的模型建立与求解 4.2.1针对问题2的模型建立 模糊综合评价法
模糊综合评价法将定性评价转化为定量评价即利用模糊数学对受到众多因素影响的事物做出总体评价充分考虑了各项水质影响因子在总体水环境中的地位。
其运算模式可描述为:
11n m m n B W R ⨯⨯⨯=
式中1n B ⨯为隶属度向量,1m ⨯W为评价因子的权重向量,m n R ⨯为模糊关系矩阵,n 为标准分类分级数。
根据模糊关系的定义模糊关系矩阵元素 ij R 表示i 对j 的隶属度 ,即第i 种污染因子的水质被评为第j 级的可能性,隶属函数的建立方法如下 1、 当1j =时 其隶属函数为
,1
,1,1,1
10i ij
i i j ij ij i i j ij i j i i j C S C S R S C S S S C S ++++⎧≤⎪
-⎪=<<⎨
-⎪⎪≥⎩
当1<j<n 时,其隶属函数为:
,1,1,1
,1,,1,1
,1
01
i ij
i i j i j i ij ij i j ij i ij
i i j i j i i j ij i j i i j C S C S S C S S S R C S C S S C S S S C S ---++++⎧≤⎪-⎪≤≤⎪-⎪⎪==⎨⎪-⎪≤≤⎪-⎪≥⎪⎩
当j n >时,其隶属函数为:
,1,1
,1,101i i j i i j ij i j i ij ij i j i ij
C S C S R S C S S S C S ----⎧≤⎪
-⎪=≤≤⎨
-⎪⎪>⎩
4.4.2问题二的模型求解
通过Matlab 程序(见附录3)计算得到的打分结果依次为:溶解氧 -1.0214、高锰酸盐
指数 0.3550、化学需氧量 4.2326、氨氮 -1.0036 、总磷 -0.4952、锌 -1.0004、挥发酚 -1.0670,所以提取化学需氧量、 高锰酸盐指数 、氨氮 、锌四项为评价对象的指标。
下面以西井为例,确定评价对象的因素集即评价对象指标U ={化学需氧量,高锰酸指数,氨氮,锌},评价集S ={Ⅰ,Ⅱ,Ⅲ}。
各评价因子权重见表6
表6各评价因子权重
W 阵的各元素 结果见表7:
表7西井各污染因子的隶属度
Ⅰ Ⅱ
Ⅲ 化学需氧量 0 0 1 高锰酸盐指数
0 0 1 氨氮 0
0 1 锌
0.895
0.105
由表7可知,西井的水体中化学需氧量不达标,高锰酸盐指数、氨氮严重超标,锌的含量未超标。
将1443R W ⨯⨯与做复合运算,得到水质综合评判矩阵[]B 0.00450.00050.995=西井,根据隶属度最大原则,西井水质属于Ⅲ类水。
同理,可得其余三口井的综合评判矩阵为:
[][][]
B 0.00540.00060.994B 0.94220.05780B 0.97460.02440===东井南井北井
由此可知:东井属于Ⅲ类水,南井属于Ⅰ类水,北井属于Ⅰ类水。
五.模型的优点
基于主成分分析所构造的评估机制则可以避免主观因素对评估的影响,使得评估结果客观的反映系统状况。
主成分分析方法是一种将多维因子纳入同一系统进行定量化研究、理论成熟的多元统计分析方法。
通过分析变量之间的相关性,使得所反映信息重叠的变量被某一主成分替代,减少了变量数目,从而降低了系统评价的复杂性。
六.参考文献
[1] 李宁,董泽彦,林泽彬,长江水质的评价和预测,华南理工大学
[2] 高惠璇,应用多元统计分析,北京:北京大学出版社,265~290页,2005。
[3] 李涛,贺勇军等,Matlab工具箱应用指南,北京:电子工业出版社,75~80页,2000。
[4] 柳军,模糊综合评价在水环境质量评价中的应用研究[D],重庆:重庆大学,2003。
[5] 丁雪卿改进的内梅罗污染指数法在集中式饮用水源地环境质量评价中的应用[J],四川环境,2010,29(2):47~51。
[6] 姜启源,谢金星,叶俊,数学模型(第三版),高等教育出版社,2003
附录1
某村井水水质监测数据
报告编号:商水监/ SM089-2009 监测日期:2011.10.15
某村井水水质监测数据
报告编号:商水监/ SM089-2009 监测日期:2011.10.15
附录2
附录3
clc,clear
load gj.txt %把原始数据保存在纯文本文件gj.txt中
gj=zscore(gj); %数据标准化
r=corrcoef(gj); %计算相关系数矩阵
%下面利用相关系数矩阵进行主成分分析,x的列为r的特征向量,即主成分的系数
[x,y,z]=pcacov(r) %y为r的特征值,z为各个主成分的贡献率
f=repmat(sign(sum(x)),size(x,1),1); %构造与x同维数的元素为±1的矩阵
x=x.*f; %修改特征向量的正负号,每个特征向量乘以所有分量和的符号函数值num=4; %num为选取的主成分的个数
df=gj*x(:,1:num); %计算各个主成分的得分
tf=df*z(1:num)/100; %计算综合得分
[stf,ind]=sort(tf,'descend'); %把得分按照从高到低的次序排列
stf=stf', ind=ind'。