主成分分析法在乐安河水质评价中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

环境评价

主成分分析法在乐安河水质评价中的应用

万金保1,2

, 曾海燕1,2

, 朱邦辉

1,2

(1.南昌大学鄱阳湖湖泊生态与生物资源利用教育部重点实验室,江西南昌330047;

2.南昌大学环境与化学工程学院,江西南昌330031)

摘 要: 采用主成分分析法,借助SPSS 软件,对乐安河7个监测断面的DO 、COD 、COD M n 、BOD 5、NH 3-N 、Cu 、Cr 等7个水质指标进行了分析计算。从原始数据中提取占总方差的82.367%的两个因子来反映水体的污染程度,经分析识别得到了乐安河的两个主成分因子:有机物及重金属(Cu 、C r),结果与实际情况相吻合。证实主成分分析法是一种有效的水质评价方法。 关键词: 主成分分析法; 水质评价; 乐安河

中图分类号:X824 文献标识码:C 文章编号:1000-4602(2009)16-0104-05

Application of Pri ncipal Co m ponent Analysis i n Eval uati on ofW ater

Quality of Lean R iver

WAN Jin bao 1,2

, ZENG H ai yan 1,2

, Z HU B ang hui

1,2

(1.K ey Lab of P oyang Lake E cology and B io resource Utilization ,

N anchang University,N anchang 330047,China;2.C ollege o f Environ m ental and Che m ical

Eng i n eering,N anchang University ,Nanchang 330031,China )

Abst ract : W ith the help of SPSS so ft w are ,DO,C OD,COD M n ,BOD 5,NH 3-N,Cu and C r i n seven m on itoring secti o ns o fLean R iverw ere analyzed and ca lculated usi n g the pri n cipa l co m ponent anal ysis .The t w o facto rs t h at account for 82.367%o f the total variance were extracted fro m the or i g i n al data to reflect the degree of po ll u tion o fw ater bodies ,and t w o princ i p al co m ponent factors of Lean R iver w ere i d entified :(1)organ ic m atter ;(2)heavy m etals Cu and Cr .The result co i n cidesw ith the act u al situa ti o n .It is confir m ed t h at the princ i p al co m ponent analysis is an effective m ethod to eva l u ate t h e w ater qua lity .

K ey w ords : princi p al co m ponent analysis ; w ater quality eva l u ation ; Lean R iver 基金项目: 十一五 国家科技支撑计划项目(2007B A B23C02)

目前国内外进行水环境质量评价的常用方法有综合指数法[1]

、模糊综合评价法

[2]

、灰色系统理论

方法

[3]

、人工神经网络法[4]

、投影寻踪模型法[5]

等。由于水质系统是由各种污染指标变量组成的复杂系统,各个因子之间具有不同程度的相关性,每一因子

都只从某一方面反映水质情况,从而使上述方法在进行水质评价时表现出一定的局限性

[6]

。而主成

分分析法是将多个指标标准化为少数几个综合指标,简化了统计分析系统的结构,它是在确保不损失

原有信息的前提下,将多种影响水质的指标重新组

第25卷 第16期2009年8月 中国给水排水CH I NA W ATER &WA STE WAT ER

V o.l 25No.16

Aug .2009

合成一组新的、相互之间无关的、较少的综合指标,来反映指标的信息,以达到降维、简化数据和提高分析结果的可靠性的目的[7]。

笔者采用主成分分析法,借助SPSS软件,对江西省境内的乐安河进行水质综合评价,找出其主要影响水质指标及其水质污染程度的排序,以期为该流域的水污染防治及水资源合理开发利用提供决策指导。

1 主成分分析法简介

1 1 基本原理

主成分分析的基本原理[8]是在原坐标系下的数据点图中寻求数据点 波动最大的方向作为新的坐标轴方向,数据点在该坐标轴上的坐标即为第一主成分,然后再寻求第二个方向,第二个方向与新的坐标轴垂直且最能反映数据点的 波动,将这个方向作为第二个新的坐标轴方向,数据点在该坐标轴上的坐标即为第二主成分,依此类推得到能够表达原信息的所有主成分。

1 2 主成分分析法及其计算步骤

设共有n个待评水体样本,每个样本有p个指标变量,则构成一个n∀p阶的水质数据矩阵:

X=x

11

x

12

#x

1p

x21x22#x2p

####

x n1x n2#x np

(1)

经降维处理,p个指标变量可综合成m个新指标F1,F2,#,F m,则X i可由F m表示为:

X=LF+ (2)

X=(x1,x2,#,x p)T(3)

L=x11x12#

x1m

x21x22#x2m

####

x p1x p2#x pm

(4)

F=(F1,F2,#,F m)(5)

=( 1, 2,#, p)(6)上述模型[9]应用于水质综合评价时,可根据精度分析要求(通常累计贡献率E>80%),在p个指标变量中合理选取m个综合指标(m

具体的操作步骤如下:

∃ 建立原始变量矩阵X

设有n个样本,每个样本有p个指标变量,构成数据矩阵:X=(X ij)n∀p,其中i=1,2,#,n,j=1,2, #,p;X ij表示第i个样本的第j项指标值。

% 对原始数据做标准化处理

由于主成分分析中各个因子的量纲、大小以及评价指标往往差别很大,可比性较差,因此首先进行标准化,使其具有良好的可比性[10]。用Z-Score变换对原始变量矩阵X进行标准化处理,得到变换后的新矩阵Z n∀p,即:

Z ij=x ij-x j

S j

(i=1,2,#,n;j=1,2,#,p)

x j=1

n

&n

i=1

x ij,S2j=

1

n-1

&n

i=1

(x ij-x j)2

∋ 计算标准化数据的相关系数矩阵

R=(r jk)p∀p(i=1,2,#,n;j=1,2,#,p)

r jk=1

n-1

&n

i=1

Z ij!Z ik(j,k=1,2,#,p)

( 求相关系数矩阵R的特征根和特征向量,确定主成分

求相关矩阵R的特征根 1) 2)#) p,它是主成分的方差,表示各个主成分在描述被评价对象上所起作用的大小。根据每个特征根求出相应的特征向量,L g=l g1,l g2,#,l gp(g=1,2,#,p),将标准化后的指标变量转换为主成分:F g=l g1Z1+l g2Z2+# +l g p Z p(g=1,2,#,p)。F1称为第一主成分,F2称为第二主成分,#,F p称为第p主成分。

∗ 确定主成分的个数

根据累计方差贡献率来进行确定,即按照方差占总方差的比例=&

p

i=1

i/&n

i=1

i(通常取)85%)来选取,p为主成分的个数。

+ 确定综合评价函数

对每个主成分的线性加权值,F g=l g1Z1+l g2Z2 +#+l g p Z p(g=1,2,#,p),再对p个主成分进行加权求和,即得最终评价函数:

F=

1

1+ 2+#+ p F1+

2

1+ 2+#+ p F2+ #+

p

1+ 2+#+ p F p(7)

万金保,等:主成分分析法在乐安河水质评价中的应用第25卷 第16期

相关文档
最新文档