基于Fisher 判别法的湖库营养状态评判分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2010-12-07作者简介:崔东文,男,工程师,主要从事水环境监测评价及水资源保护工作。
《水资源研究》第32卷第4期(总第121期)2011年12櫌櫌櫌櫌櫌櫌櫌櫌櫌櫌櫌櫌殺
殺
殺
殺
月
水环境
基于Fisher 判别分析法的湖库营养状态评判分析
崔东文
(文山州水利学会,云南省文山663000)
摘
要:基于SPSS 统计软件,运用费歇(Fisher )判别分析理论,依据湖库营养状态评价指标和分级标准,针对
复杂多类的湖库营养状态识别,等比例划分参与构造判别式的样本,分别建立费歇(Fisher )线性判别函数模型
和典型判别函数模型,并以云南省九大高原湖泊营养状态识别为例,进行判别分析,结果与指数评价法、主成分
分析评价法评判结果基本一致。表明该模型利用回代估计法所得到的误判率小,具有较强的判别能力,判别效果令人满意。
关键词:营养状态;费歇(Fisher )判别分析;湖库
判别分析是判别样本所属类型的一种统计方法,在经济学、生物学、市场预测、地质勘探、体育运动和医学等领域有着广泛的应用,可与回归分析相媲美。判别分析按判别的组数来区分,有简单的两组判别分析和复杂的多组判别分析;按数学模型来区分,有线性判别和非线性判别;按判别时所处理的变量方法不同,有逐步判别和序贯判别等。判别分析可以从不同角度提出问题,因此有不同的判别准则,如马氏距离最小准则、Fisher 准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等,按判别准则的不同又提出多种判别方法。
本文以Fisher 判别分析法为主要研究对象,建立Fisher 的线性判别函数模型和典型判别函数模型,对它们进行判别分析,将所建立的湖库营养状态识别函数模型应用于云南省九大高原湖泊予以验证,并将湖库营养状态判别结果与主成分分析法、指数法作比对,
为Fisher 判别分析法在水资源和水环境评判中的运用提供参考依据[1]
。
1
Fisher 判别分析
Fisher 判别分析方法的基本原理是投影,即将高维数据点投影到低维空间上,这样,数据点就变得比较密集,从而可以克服由于维数较高而引起的“维数祸根”,根据类间距离最大或类
间距离最小的原则确定判别函数,再依据建立的判别函数判定待判样品的类别。
判别分析的目的是得到体现分类的函数关系式,即判别函数。基本思想是在已知观测样本的分类和特征变量值的前提
下,从中筛选出能提供较多信息的变量,并建立判别函数;目标
是使得到的判别函数在判别样本所属类别时的错判率最小。本文是基于SPSS 统计分析软件,
其Fisher 判别函数的导出、求解及操作方法等限于篇幅,这里不作赘述
[2-4]
。2湖库营养状态识别的Fisher 判别模型
针对Fisher 判别分析的基本原理和思想,建立湖库营养状
态识别的Fisher 判别模型。在湖库营养状态评判标准数据构建的基础上,分别建立针对5类湖库营养状态识别的Fisher 的线性判别函数,并进行判别分析。
2.15类营养状态识别的Fisher 判别模型2.1.1
判别参数确定
依据水利部《地表水资源质量评价技术规程》(SL395-2007)湖库营养状态评判标准,选取总磷、总氮、叶绿素a 、高锰酸盐指数和透明度作为湖库营养状态识别的判别分析变量进行判别分析。
2.1.2判别模型建立
为建立5类湖库营养状态识别的Fisher 判别模型,参照水利部
《地表水资源质量评价技术规程》(SL395-2007)中湖库营养状态评判标准及分级标准,将每一类(如贫营养)营养状态评判标准按等比例划分为10个样本进行训练,即1 10号样本假定为贫营养;11 20号样本假定为中营养;21 30号样本假定为轻度富营养;31 40号样本假定为中度富营养;41 50号样
5
1
本假定为重度富营养;51 60号样本为云南省9大高原湖泊实测资料,即为待识别样本。根据Fisher判别分析理论,建立如下Fisher的线性判别函数:
Y (1)=9.026x
1
-274.584x
2
-253.723x
3
+12.876x
4
-50.697
(1)
Y (2)=11.625x
1
-357.095x
2
-327.867x
3
+4.651x
4
-11.945
(2)
Y (3)=35.123x
1
-1079.089x
2
-991.265x
3
+4.325x
4
-59.214
(3)
Y (4)
=20.155x
1
-519.371x
2
-583.435x
3
+2.720x
4
-41.892
(4)
Y
(5)
=5.975x
1
+43.876x
2
-146.192x
3
+1.767x
4
-120.806
(5)
式中,Y(1) Y(5)分别表示湖库贫营养 重度富营养5类营养
状态;x1,x2,x3,x4分别为高锰酸盐指数、总磷、叶绿素a的含量
和透明度(质量分数)。由于总氮含量对该判别影响不大,故可
以忽略不计。如以待判51号样本(滇池草海)为例,将其各变量
代入式(1) 式(5),可以得到Y(1)=-311.0,Y(2)=-358.4,
Y
(3)
=-1111.7,Y
(4)
=-522.5,Y
(5)
=-15.1,可见Y
(5)
=
-15.1为最大,所以将51号样本(滇池草海)判定为重度富营
养。用同样的方法可以判别其余的待判样本,结果见表1、表2、
表3和表4。
表1湖库营养状态判别变量及判别分类结果
样本
编号
COD MN/
(mg·L-1)
总磷/
(mg·L-1)
总氮/
(mg·L-1)
叶绿素a/
(mg·L-1)
透明度/
m
判别函数值
Y(1)Y(2)Y(3)Y(4)Y(5)
判别分类结果
指数法主成分判别Fisher判别10.1500.00100.0200.0005010.0079.035.8-12.3-12.5-102.3贫营养贫营养贫营养20.1780.00130.0230.000569.4472.033.4-14.1-13.6-103.1贫营养贫营养贫营养……………………………………100.4000.00400.0500.001005.0015.914.2-28.8-22.9-109.6贫营养贫营养贫营养111.0000.01000.1000.002003.00-6.39.4-23.9-19.9-109.4中营养中营养中营养121.1110.01170.1220.002222.83-8.09.2-22.8-19.2-109.0中营养中营养中营养……………………………………202.0000.02500.3000.004001.50-21.28.0-13.4-12.8-105.7中营养中营养中营养214.0000.05000.5000.010001.00-18.018.121.79.6-94.4轻度富营养轻度富营养轻度富营养224.4440.05560.5560.011780.94-16.720.429.314.5-91.9轻度富营养轻度富营养轻度富营养……………………………………308.0000.10001.0000.026000.50-6.139.190.353.6-71.5轻度富营养轻度富营养轻度富营养3110.0000.20002.0000.064000.40-26.413.814.519.5-60.9中度富营养中度富营养中度富营养3211.6670.24442.4440.074670.39-26.413.714.523.8-50.6中度富营养中度富营养中度富营养……………………………………4025.0000.60006.0000.160000.30-26.513.414.157.832.0中度富营养中度富营养中度富营养4140.0000.90009.0000.4000.20-35.71.5-21.164.099.6重度富营养重度富营养重度富营养4242.2220.91119.7780.4670.19-35.81.3-21.563.9103.5重度富营养重度富营养重度富营养……………………………………5060.0001.000016.0001.0000.12-35.91.2-21.764.9135.6重度富营养重度富营养重度富营养
滇池草海9.961.24315.340.0640.57-311.0-358.4-1111.7-522.5-15.1重度富营养重度富营养重度富营养滇池外海9.890.1262.440.0630.42-6.639.391.556.3-64.7中度富营养中度富营养轻度富营养阳宗海2.430.0340.420.0043.8710.720.92.3-2.3-98.5中营养中营养中营养洱海2.590.0190.410.0131.70-14.114.95.3-2.8-103.5中营养中营养中营养抚仙湖1.130.0050.170.0026.1336.527.2-0.6-6.3-103.3贫营养中营养贫营养星云湖7.490.1272.080.0271.08-10.826.045.030.5-72.5轻度富营养轻度富营养轻度富营养杞麓湖7.510.0662.990.0361.185.145.6103.157.6-76.2轻度富营养轻度富营养轻度富营养程海3.600.0300.500.0023.3015.533.947.122.9-92.4中营养中营养轻度富营养泸沽湖1.000.0050.100.00112.1112.553.922.08.1-93.4贫营养贫营养贫营养异龙湖9.370.0472.070.0281.2329.676.6196.3109.3-64.7轻度富营养轻度富营养轻度富营养注:以上待判样本数据来源于《2008年云南省环境状况公报》。
表2分类判别式函数系数
分析变量贫营养判别
函数Y(1)
中营养判别
函数Y(2)
轻度富营养
判别函数Y(3)
中度富营养
判别函数Y(4)
重度富营养
判别函数Y(5)
高锰酸盐指数9.02611.62535.12320.1555.975总磷-274.584-357.095-1079.089-519.37143.876叶绿素-253.723-327.867-991.265-583.435-146.192透明度12.8764.6514.3252.7201.767(常量)-50.697-11.945-59.214-41.892-120.806
注:Fisher的线性判别式函数。
表3典型判别式函数系数
分析
变量
第1类
判别函数
第2类
判别函数
第3类
判别函数
第4类
判别函数高锰酸盐指数-0.617-2.403-2.183169总磷33.29176.09462.985-14.149叶绿素18.55068.88860.5286.967透明度-0.4330.651-1.036-0.103(常量)-2.4701.2656.8550.606注:非标准化系数。
61