主成分分析法在乐安河水质评价中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
环境评价
主成分分析法在乐安河水质评价中的应用
万金保1,2
, 曾海燕1,2
, 朱邦辉
1,2
(1.南昌大学鄱阳湖湖泊生态与生物资源利用教育部重点实验室,江西南昌330047;
2.南昌大学环境与化学工程学院,江西南昌330031)
摘 要: 采用主成分分析法,借助SPSS 软件,对乐安河7个监测断面的DO 、COD 、COD M n 、BOD 5、NH 3-N 、Cu 、Cr 等7个水质指标进行了分析计算。从原始数据中提取占总方差的82.367%的两个因子来反映水体的污染程度,经分析识别得到了乐安河的两个主成分因子:有机物及重金属(Cu 、C r),结果与实际情况相吻合。证实主成分分析法是一种有效的水质评价方法。 关键词: 主成分分析法; 水质评价; 乐安河
中图分类号:X824 文献标识码:C 文章编号:1000-4602(2009)16-0104-05
Application of Pri ncipal Co m ponent Analysis i n Eval uati on ofW ater
Quality of Lean R iver
WAN Jin bao 1,2
, ZENG H ai yan 1,2
, Z HU B ang hui
1,2
(1.K ey Lab of P oyang Lake E cology and B io resource Utilization
N anchang University,N anchang 330047,China;2.C ollege o f Environ m ental and Che m ical
Eng i n eering,N anchang University ,Nanchang 330031,China )
Abst ract : W ith the help of SPSS so ft w are ,DO,C OD,COD M n ,BOD 5,NH 3-N,Cu and C r i n seven m on itoring secti o ns o fLean R iverw ere analyzed and ca lculated usi n g the pri n cipa l co m ponent anal ysis .The t w o facto rs t h at account for 82.367%o f the total variance were extracted fro m the or i g i n al data to reflect the degree of po ll u tion o fw ater bodies ,and t w o princ i p al co m ponent factors of Lean R iver w ere i d entified :(1)organ ic m atter ;(2)heavy m etals Cu and Cr .The result co i n cidesw ith the act u al situa ti o n .It is confir m ed t h at the princ i p al co m ponent analysis is an effective m ethod to eva l u ate t h e w ater qua lity .
K ey w ords : princi p al co m ponent analysis ; w ater quality eva l u ation ; Lean R iver 基金项目: 十一五 国家科技支撑计划项目(2007B A B23C02)
目前国内外进行水环境质量评价的常用方法有综合指数法[1]
、模糊综合评价法
[2]
、灰色系统理论
方法
[3]
、人工神经网络法[4]
、投影寻踪模型法[5]
等。由于水质系统是由各种污染指标变量组成的复杂系统,各个因子之间具有不同程度的相关性,每一因子
都只从某一方面反映水质情况,从而使上述方法在进行水质评价时表现出一定的局限性
[6]
。而主成
分分析法是将多个指标标准化为少数几个综合指标,简化了统计分析系统的结构,它是在确保不损失
原有信息的前提下,将多种影响水质的指标重新组
第25卷 第16期2009年8月 中国给水排水CH I NA W ATER &WA STE WAT ER
V o.l 25No.16
Aug .2009
合成一组新的、相互之间无关的、较少的综合指标,来反映指标的信息,以达到降维、简化数据和提高分析结果的可靠性的目的[7]。
笔者采用主成分分析法,借助SPSS软件,对江西省境内的乐安河进行水质综合评价,找出其主要影响水质指标及其水质污染程度的排序,以期为该流域的水污染防治及水资源合理开发利用提供决策指导。
1 主成分分析法简介
1 1 基本原理
主成分分析的基本原理[8]是在原坐标系下的数据点图中寻求数据点 波动最大的方向作为新的坐标轴方向,数据点在该坐标轴上的坐标即为第一主成分,然后再寻求第二个方向,第二个方向与新的坐标轴垂直且最能反映数据点的 波动,将这个方向作为第二个新的坐标轴方向,数据点在该坐标轴上的坐标即为第二主成分,依此类推得到能够表达原信息的所有主成分。
1 2 主成分分析法及其计算步骤
设共有n个待评水体样本,每个样本有p个指标变量,则构成一个n∀p阶的水质数据矩阵:
X=x
11
x
12
#x
1p
x21x22#x2p
####
x n1x n2#x np
(1)
经降维处理,p个指标变量可综合成m个新指标F1,F2,#,F m,则X i可由F m表示为:
X=LF+ (2)
X=(x1,x2,#,x p)T(3)
L=x11x12#
x1m
x21x22#x2m
####
x p1x p2#x pm
(4)
F=(F1,F2,#,F m)(5)
=( 1, 2,#, p)(6)上述模型[9]应用于水质综合评价时,可根据精度分析要求(通常累计贡献率E>80%),在p个指标变量中合理选取m个综合指标(m
具体的操作步骤如下:
∃ 建立原始变量矩阵X
设有n个样本,每个样本有p个指标变量,构成数据矩阵:X=(X ij)n∀p,其中i=1,2,#,n,j=1,2, #,p;X ij表示第i个样本的第j项指标值。
% 对原始数据做标准化处理
由于主成分分析中各个因子的量纲、大小以及评价指标往往差别很大,可比性较差,因此首先进行标准化,使其具有良好的可比性[10]。用Z-Score变换对原始变量矩阵X进行标准化处理,得到变换后的新矩阵Z n∀p,即:
Z ij=x ij-x j
S j
(i=1,2,#,n;j=1,2,#,p)
x j=1
n
&n
i=1
x ij,S2j=
1
n-1
&n
i=1
(x ij-x j)2
∋ 计算标准化数据的相关系数矩阵
R=(r jk)p∀p(i=1,2,#,n;j=1,2,#,p)
r jk=1
n-1
&n
i=1
Z ij!Z ik(j,k=1,2,#,p)
( 求相关系数矩阵R的特征根和特征向量,确定主成分
求相关矩阵R的特征根 1) 2)#) p,它是主成分的方差,表示各个主成分在描述被评价对象上所起作用的大小。根据每个特征根求出相应的特征向量,L g=l g1,l g2,#,l gp(g=1,2,#,p),将标准化后的指标变量转换为主成分:F g=l g1Z1+l g2Z2+# +l g p Z p(g=1,2,#,p)。F1称为第一主成分,F2称为第二主成分,#,F p称为第p主成分。
∗ 确定主成分的个数
根据累计方差贡献率来进行确定,即按照方差占总方差的比例=&
p
i=1
i/&n
i=1
i(通常取)85%)来选取,p为主成分的个数。
+ 确定综合评价函数
对每个主成分的线性加权值,F g=l g1Z1+l g2Z2 +#+l g p Z p(g=1,2,#,p),再对p个主成分进行加权求和,即得最终评价函数:
F=
1
1+ 2+#+ p F1+
2
1+ 2+#+ p F2+ #+
p
1+ 2+#+ p F p(7)
万金保,等:主成分分析法在乐安河水质评价中的应用第25卷 第16期