河流水环境有机污染物的自组织预测模型及应用

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

) ; 河段流始断面的氧亏浓度 x 2 ( mg/ L ) ; 水温 x 3 ( ℃
的是一组由 4 个变量构成的四次多项式。再选择这些新变量中的最优者 , 用所挑选出的方程生成第 3 代输入变量来代替第 2 代 , 并用第 3 代输入变量逐对组合构造二次回归方程。将这一过程继续进行下去 , 直到新的回归方程开始比前一代的回归方程的估计能力有所下降时为止。在逐代构造回归方程的过程停止后 , 挑选出最后一代的二次多项式中最好的一个 , 最终得到的对 y 的估计是 2 个变量的二次多项式 , 这 2 个变量各是上一代另外 2 个变量的二次多项式 , 而另外 2 个变量又各是更上一代 2 个变量的二次多项式 , 如此逆推 , 第 2 代变量则是原始变量的二次多项式。换句话说 , 如果做出所有的代数替换 , 将得到如下形式的非常复杂的多项式 :
式 ( 3) 称之为 Ivakhnenko 多项式 ,也称 Kolmogorov2
Gabor 多项式。
2 河流水环境有机污染物预测评价的自组
织方法
一般而言 , 传统的确定性水质预测模型均事先
48
Leabharlann Baidu环境科学研究
第 12 卷
去 , 直到回归方程的中间变量仅剩下 1 个二元二次多项式时为止 , 这就是在给定误差下的最后一代预测方程。 d1 确定预测模型。根据不同的误差门限值 , 重复计算步骤 a ～c , 从中挑选一个最好的二元二次多项式拟合方程作为河流有机污染物的预测模型。
收稿日期 :1998 - 09 - 08 修回日期 :1998 - 12 - 06 第一作者 : 男 ,1964 年生 ,副教授 3 高速水力学国家重点实验室开放基金 (9804) 和国家自然科学基金 (59639240) 资助项目
于水环境有机污染物的预测评价工作。
1 自组织模型概述
A. G. Ivakhnenko 于 70 年代前后基于生物控制
a1 挑选预测变量和预测因子。输入变量和输
( 2)
其中 A , B , C , D , E 和 F 为回归系数 , 这里将产生出 m ( m - 1 ) / 2 个较高阶变量 , 用它们替代最初的 m 个变量 x 1 , x 2 , …, x m , 对输出变量 y 进行估计。在从一组输入和输出观测数据中找到这些回归方程后 , 用一个判据来对每一个回归方程进行评估 , 选出其中最佳者保留下来 , 于是可得到一组 ( 假定为
第 12 卷第4期
环境科学研究 Research of Environmental Sciences
Vol. 12 ,No. 4 ,1999
河流水环境有机污染物的自组织预测模型及应用 3
易顺民赵文谦蒲迅赤
( 四川大学高速水力学国家重点实验室 ,成都 610065)
m 1 个) 对 y 进行最佳估计的二次回归方程 , 每个估
计只依赖于 2 个自变量。再利用每一个刚刚得到的回归方程生成第 2 代输入变量 , 并以此代替原始数据序列的 x 1 , x 2 , …, x m 。按照上述操作方法 , 计算 y 的这些新的输入变量的二次回归方程 , 这样将得到更新的一组 m 1 ( m 1
摘要自组织预测模型是前苏联学者伊万年科提出的一种非线性建模预测方法 ,它能有效地解决复杂非线性系统的数据处理和建模问题。该文应用它进行水环境有机污染物预测 ,以实际监测数据为基础 ,建立了一个河流有机物浓度预测的自组织模型 , 其检验样本的预测误差在
5 %以内。
关键词自组织模型数据处理有机污染物污染预测
y = A + B x i + Cx j + Dx i + Ex j + Fx i x j
2 2
假定了模型内部变量之间的函数关系 , 即使是基于模拟试验基础之上建立的水质预测模型 , 也很难完全符合野外实际河流的水环境污染状态 , 其考虑的水污染影响因子数量有限。自组织模型建模预测的基本思想是不带任何人为偏见 , 根据自组织原理和优选法原则 , 通过分析实际观测数据来客观地进行建模预测。虽然自组织方法处理数据的数学基础仍然是统计回归原理 , 但它是一种探索性质的统计预测方法 , 最主要的区别是 GMDH 的回归方程的阶数是依据某些判据客观自动地给出 , 而不是事先人为地确定好的 , 也就是说 , 人为的干预程度相对轻得多。对河流水环境有机物污染而言 , 有机物的扩散迁移过程是一个复杂的非线性过程 , 其影响因素很多。在建立河流有机污染物的自组织模型时 , 用输入变量的 Kolomogorov2 Gabor 多项式去逼近未知预测模型式 ( 1) , 在每层采用二元二次多项式来逐步完成 , 其具体预测步骤如下 :
∑∑c
ij x i x j
+ ( 3)
i =1 j =1 k =1
∑∑∑d
ijk x i x j x k
+ …
…, m ; k = 1 , 2 , …, m ( m - 1) / 2 来逐步拟合完成预测模型式 ( 1) 。 c1 中间变量筛选。用预检验组数据对拟合建模数据产生的中间变量按平方误差原则进行优选。根据给定的误差门限值 , 将误差大于门限值的中间变量排除掉 , 再用剩下的中间变量序列进行第 2 代中间变量拟合。如此重复计算 , 一代接一代拟合下
( 6) ( 5)
3 实例分析
这里以渭河某污染河段为例 , 将自组织预测模型用于该河段有机污染物浓度预测 , 并实测了不同时间的 15 组数据 , 选择其中 12 组为建模数据 ( 表 1) 。拟合优选中间变量时采用 A IC 准则 [ 4 ] 。 A IC = n ln S 2 k + 2 ( k + 1) + C
按照前述计算方法 , 通过拟合表 1 建模数据得到该河段有机污染物的最后一代自组织预测模型为 : BOD5 = 212247 + 017936 Q + 017125 V +
016249 Q 2 + 013137 V 2 + 118755 Q V COD = 315427 + 015431 Q + 019178 V + 019876 Q 2 + 015787 V 2 + 216749 Q V
河流水环境的有机物污染状态和迁移性质 , 不仅取决于污水排放量和排放物浓度 , 而且与河流的径流量及泥沙含量等因素有关 , 是一个涉及多种影响因子的复杂体系。对水环境有机物污染进行预测评价 ,是制定环境战略和环境规划的一项重要基础性工作。由于河流水环境污染系统复杂多变 , 不同河流的历史监测资料差异性大 , 特别是近年来工农业生产的快速发展 ,有机物污染日趋严重 ,使得水环境有机物污染预测工作困难加重。传统的水容量模型、箱式模型和模拟水质模型的预测方法 ,对水质监测数据的完备性要求较高 , 但由于受客观条件的限制 ,实际河流特别是中小河流水环境的基础性水质监测工作很难达到较高的水准 , 这就是应用传统水质模型对有机污染物进行预测评价时精度不高的主要原因。因此 ,开发新的水环境有机物污染预测评价方法 ,对水环境学科的理论发展和工程实践有着重要的意义。基于此 , 笔者尝试将自组织模型应用
第4期
易顺民 , 等 :河流水环境有机污染物的自组织预测模型及应用
47
自组织和优选法原理所得的结果往往是高阶非线性函数 , 故能最大限度地拟合出河流水环境有机物污染系统内多种影响因子之间的复杂非线性关系。首先从系统的输入变量 x 1 , x 2 , …, x m 出发 , 对输入变量中的每一对 x i 和 x j 与输出变量 y 计算回归方程 :
y = f ( x 1 , x 2 , …, x m ) ( 1)
式中 : y — — — 预测输出变量 ;
x 1 , x 2 , …, x m — — — 输入变量。
GMDH 方法只利用输入和输出变量的观测数
据 , 不需要事先设置任何参数和模型的具体形式 , 而是根据研究对象的具体情况 , 通过计算机由某些判据自动地寻找出数据间的函数关系。这种基于变量
- 1) / 2 个用新变量估计 y 的回归方程 , 此时所得到
出变量的筛选 , 不仅要体现预测评价的目的和研究对象的污染性质 , 还要视监测条件而定。预测河流水环境的有机物污染状态 , 选择 BOD5 和 COD 指标作为特征输出变量。这 2 个指标是表示河流水环境有机物污染状态的基本参数。输入变量的选择原则是尽可能挑选对 BOD5 和 COD 影响程度比较大的监测指标。根据河流水环境污染状态 , 对具体的预测河段 , 选择初始断面的 BOD5 浓度 x 1 ( mg/ L ) ; 初
论中的自组织原理提出了一种处理复杂系统的非线性辩识方法 ,也称数据组合处理方法 ( Group Met hod
of Data Handling) ,其基本思想是以生物有机体演化
的方法构造数学模型。它可以根据各种建模目的 , 通过自组织过程来选择输入变量 , 对样本数量的要求较低 ,是一种先进的建模预测方法 ,对河流水环境的有机物污染预测评价工作的适应性较强。自组织模型的基本结构见式 ( 1) [ 1～3 ] 。设想要建立的复杂系统的高阶回归模型为 :
m m m
量 x 4 ( m3 / s) ; 预测河段污水流量 x 5 ( m3 / s) ; 污水中
BOD5 浓度 x 6 ( mg/ L ) ; 河水流经预测河段所需的时
间 x 7 ( s) 为预测因子。预测变量 ( 输出变量) 和预测因子 ( 输入变量) 确定后 , 将具体数据分为 2 组 , 一组为拟合数据组 , 一组为检验数据组。
A Self2organize d Pre diction Mo del of Organic Pollutant s of Water Environment in River and It s Application
YI Shunmin ZHAO Wenqian PU Xunchi
( State Key Hydraulic Laboratory of High Speed Flows ,Sichuan University ,Chengdu 610065) Abstract The self2organized prediction model ,proposed by Russian scholar Ivakhnenko A. G. ,is a kind of non2linear prediction met hod and can effectively solve difficulty in t he data handing and model fitting of t he non2linear complex system. This self2organiza2 tion met hod was applied to predict organic pollutant concentration of water environment ,based on t he field observation data. The rela2 tive error of t he predicted values of each testing sample is less t han 5 %. Keywords Self2organization model ; Group handling of data ; Organic pollutant ; Pollution prediction
b1 变量自组织过程。按自组织原理 , 通过任意 2 个输入变量构成的二元二次多项式函数 : y k = A
2 + B x i + Cx j + D x 2 i + Ex j + Fx i x j , 其中 i , j = 1 , 2 ,
y = a +
m
i =1 m
∑b x
i
m
i
+
i =1 j =1