基于改进混合遗传-支持向量机的CMF产水预测
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* ξi , ξ i ≥0
{
1 T ω ω + C∑ ( ξ i + ξ * i 2 i =1
l
)
y i - ω T φ( x i ) - b ≤ε + ξ
( 3) 其对偶问题为: minJ = -
a, a* i l
1 2Байду номын сангаас
l
l
∑ ∑ ( ai i =1 j =1
l
- a* i
)(a
j
) K( x , ) - a* j i xj )
由于此法基于结构风险最小化而非经验风险最 其训练等价于求解二次规划问题 , 因而小样本 小化, 训练时不会出现过学习现象, 模型具有更强的泛化 能力, 且其解为全局最优解, 不存在局部极值问题。 1. 1. 2 改进混合遗传算法 遗传算法是一种借鉴生物界自然选择和自然遗 传机制的随机化搜索方法, 具有较强的自适应性、 鲁 但存在着收敛过早、 陷入局部 棒性和全局搜索能力, [16 ] 最优等缺点 ; 模拟退火算法是通过模拟热力学中 经典粒子系统的降温过程以求解规划问题的极值 , 具有局部搜索能力强、 可使搜索过程避免陷入局部 收敛等优点, 但寻优解过程中需要较高的初温 、 较慢 故优化过程时间 的降温速率以及较低的终止温度, [17 ] 。 较长 鉴于上述两种算法各自的优缺点, 在遗传 [18 ] 操作中嵌入模拟退火算子 , 改进选择策略和遗传 算子, 有效结合遗传算法隐含并行与模拟退火算法 建立加速遗传模拟退火算法 ( ac全局寻优的特点, celerating genetic and simulated annealing algorithm, AGSA) , 具体过程为: ①确定种群规模, 设定初温、 交叉率、 变异率等 , , 参数 用实数编码对各个状态进行编码 随机产生初 始种群; ② 结合退火罚因子构造适应度函数, 计算每个 个体的适应度, 进行解码及适应度评价;
- a* i
( 4)
f( x) =
(a ∑ i i =1
) K( x , )+ b - a* i i x
( 5)
1
数学模型
1. 1 模型原理 1. 1. 1 支持向量机 SVM ) 是一 支持向量机( support vector machine, [15 ] 种基于统计学习理论的机器学习方法 , 基本思想 可概括为通过定义适当的内积函数实现输入空间到 一个高维空间的非线性变换, 然后在此新空间中求 取最优线性分类面。具体原理如下: y k } R n , 对给定的样本数据 { x k , 利用非线性映 射 φ( * ) 将训练数据集映射到一个高维特征空间 ( Hilbert 空间) , 使输入空间中的非线性函数估计问 题转化为高维特征空间中的线性函数估计问题 。设 函数具有如下形式: nh f ( x ) = ω T φ( x k ) + b , b ∈R ( 1) ω∈R , : n , b 其中 高维特征区间的维数 不是固定的 为偏置 量。基于统计学中结构风险最小化原理, 函数估计 问题就是寻找使下面风险函数最小的 f( x) : 1 Rreg = ω T ω + CR ε ( 2) emp f 2
Study on output prediction of CMF based on improved hybrid genetic algorithm and support vector machine
Xu Danyu1 Wang Qi2 Tang Yunping1 Zhang Zhiyang1 Shi Yan1 Sun Kai1 Chai Shuman3
第5 卷 第8 期 2 0 1 1 年 8 月
环境工程学报
Chinese Journal of Environmental Engineering
Vol . 5 , No . 8 Aug. 2 0 1 1
基于改进混合遗传 -支持向量机的 CMF 产水预测研究
许丹宇
1
王
琦
2
唐运平
1
张志扬
1
石
岩
1
孙
凯
1
基金项目:国家水体污染控制与治理科技重大专项 ( 2008ZX07314001 ) ; 天津市科技创新专项资金项目( 08FDZDSH01200 ) 收稿日期:2010 - 04 - 11 ; 修订日期:2010 - 10 - 19 作者简介:许丹宇( 1979 ), 男, 博士, 高级工程师, 从事水处理研究 mail: danyu079@ yahoo. com. cn 工作。E-
- ε∑ ( a i + a * i
i =1
)
+
x j ) 是满足 Mercer 条件的任意对 式中: 核函数 K ( x i , 参数 a 和 a 称为拉格朗日乘子。求解该二 称函数, a * 再利用库恩次型问题可得参数 a, 塔克条件求得 b , 偏置 即可得到支持向量机的输出为:
l *
yi ( ai ∑ j =1
因此本文基于此方法建立cmf系统产水预测模型同时改进混合遗传算法并与支持向量机方法相耦合构造支持向量机模型参数的自适应优化算法以期解决实际cmf系统产水预测时存在的小样本经验性非线性高维数等难点为提高单位膜表面上微滤通量预测精度特别是突发性水质污染时膜通量变化的短期预测效果调整优化操作条件提供科学依据和技术方法
Abstract Combined the accelerating genetic algorithm ( AGA ) and simulated annealing algorithm ( SA ) , and through improved select tactics and genetic operators to form a new accelerating genetic and simulated annealing algorithm( AGSA ) . Based on improved hybrid genetic algorithm and support vector machine ( SVM ) ,it formed a new selfadapting optimized algorithm applied in the SVM parameters. A modified method to develop the flow rate prediction model of continuous microfiltration ( CMF ) system was proposed. The prediction models were verified by flow rate experiments in pilotscale continuous microfiltration system,results showed that this model could reveal the rule of flow rate variation in CMF. It had small error and strong correlation ( R 2 = 0. 91 , MAE = 0. 0132 , SSE = 0. 0055 , RMSE = 0. 0155 ) between predicted values and measured values which explained the model had a strong predictability. Based on leaveoneout cross validation of training samples,the model also showed good robustness( R 2 = 0. 89 、 MAE = 0. 0164 、 SSE = 0. 0073 、 RMSE = 0. 0178 ) . Moreover,the model developed by AGSASVM was compared with the model constructed by BP neural network. The former algorithm showed the optimal predictive capability and robustness in the comparison,indicating more suitable for the flow rate prediction of CMF. Key words continuous microfiltration; support vector machine; accelerating genetic and simulated annealing algorithm; BP neural network; membrane flux filtration, CMF) 主要 连续微滤( continuous micro用于产品的分级、 浓缩、 分离和提纯等过程, 已在环 [13 ] 。 由于膜污 保、 食品、 化工等领域得到广泛应用 染导致其通量非理想变化, 因此准确预测膜通量变
柴树满
3
( 1. 天津市环境保护科学研究院 , 天津 300191 ; 2. 天津职业技术师范大学 , 天津 300222 ; 300352 ) 3. 天津荣程钢铁集团有限公司 , 天津 摘 要 将模拟退火思想和加速遗传特性相结合 , 改进选择策略和遗传算子 , 建立加速遗传模拟退火算法 ( AGSA ) ; 基 于支持向量机( SVM) 的非线性回归和改进混合遗传算法的因子筛选 , 构造了支持向量机模型参数的自适应优化算法 , 提出 结果表明: 该模型较好 连续微滤系统( CMF) 产水预测模型; 通过实测中试规模连续微滤系统产水量变化对模型进行验证 , 2 MAE = 0. 0132 、 SSE = 0. 0055 、 RMSE 地揭示了 CMF 系统产水变化规律, 模拟与实测结果间的误差小 、 相关性强 ( R = 0. 91 、 2 MAE = 0. 0164 、 SSE = 0. 0073 、 = 0. 0155 ) , 说明模型具有较强的预测能力 ; 采用留一法对训练样本进行交叉验证 ( R = 0. 89 、 SVM 的模型与神经网络 BP 算法进行了比较, RMSE = 0. 0178 ) , 表明该模型同时具有良好的稳健性 。此外, 将基于 AGSA结 SVM 建立的模型在稳健性和预测能力都优于 BP 算法, 因此该算法更适合于对 CMF 系统进行产水预测 果显示: 应用 AGSA研究。 关键词 连续微滤 支持向量机 加速遗传模拟退火算法 BP 神经网络 膜通量 中图分类号 X703. 1 文献标识码 A 9108 ( 2011 ) 08172306 文章编号 1673-
( 1. Tianjin Academy of Environmental Science,Tianjin 300191 ,China; 2. Tianjin University of Technology and Education, Tianjin 300222 , China; 3. Tianjin Rockcheck Steel Group Co. Ltd. ,Tianjin 300352 ,China)
1724
环 境 工 程 学 报
第5卷
化规律、 及时调整操作条件和运行参数, 对膜系统的 长效稳定运行有着重要的现实意义 。鉴于微滤体系 目前尚无普遍适用 的多样性和污染机理的复杂性, 的模型预测污染膜的通量变化规律 。国内外学者基 表面吸附、 沉积特性以 于分离相在膜孔内收缩堵塞、 及多效协同作用, 分别建立了描述浓差极化、 膜孔阻 [47 ] , 堵塞和沉积层等因素的微滤通量模型 但参 塞、 数较多、 过程复杂, 难以依靠此类模型进行不同操作 压力等 ) 的优 化 研 究。 针 对 这 类 多 因 条件 ( 温度、 素、 多层次非线性复杂问题, 采用线性回归法、 时间 序列法、 指标平滑法等线性模型求解时精度并不理 [810 ] [12 ] , Piron 等[11]、 孙光民等 在预测微滤通量时 想 引入改进的神经网络方法, 一定程度上克服了传统 方法的不足。由于神经网络法尚有诸多待克服的缺 一般规模化的膜系统难以在短期提供充足的数 陷, 据进行样本训练, 限制了此方法在实际中的应用范 。 围 支持向量机方法对未来样本具有较好的泛化能 力, 特别是对于资料缺乏、 系统结构尚欠清晰的问题 [13 , 14 ] 。 因此, 本文基于此方法 有着较好的预测效果 CMF , 建立 系统产水预测模型 同时改进混合遗传算 并与支持向量机方法相耦合, 构造支持向量机模 法, 型参数的自适应优化算法, 以期解决实际 CMF 系统 、 产水预测时存在的小样本 经验性、 非线性、 高维数 等难点, 为提高单位膜表面上微滤通量预测精度 , 特 别是突发性水质污染时膜通量变化的短期预测效 果, 调整优化操作条件提供科学依据和技术方法 。
T 2 式中: ω ω = ‖ω‖ 描述函数 f ( * ) 的复杂程度, 其 C 为惩罚因子。 引入非负 中 ε 为不灵敏损失参数, * ξi , 得到式 ( 2 ) 的最小化规则化风险 的松弛变量 ξ i , 泛函等价优化问题:
b, ω, ξ i, ξ* i
minJ =
s. t. y i ω T φ( x i ) + b - y i ≤ε + ξ * 2, …, l) i ( i = 1,
{
1 T ω ω + C∑ ( ξ i + ξ * i 2 i =1
l
)
y i - ω T φ( x i ) - b ≤ε + ξ
( 3) 其对偶问题为: minJ = -
a, a* i l
1 2Байду номын сангаас
l
l
∑ ∑ ( ai i =1 j =1
l
- a* i
)(a
j
) K( x , ) - a* j i xj )
由于此法基于结构风险最小化而非经验风险最 其训练等价于求解二次规划问题 , 因而小样本 小化, 训练时不会出现过学习现象, 模型具有更强的泛化 能力, 且其解为全局最优解, 不存在局部极值问题。 1. 1. 2 改进混合遗传算法 遗传算法是一种借鉴生物界自然选择和自然遗 传机制的随机化搜索方法, 具有较强的自适应性、 鲁 但存在着收敛过早、 陷入局部 棒性和全局搜索能力, [16 ] 最优等缺点 ; 模拟退火算法是通过模拟热力学中 经典粒子系统的降温过程以求解规划问题的极值 , 具有局部搜索能力强、 可使搜索过程避免陷入局部 收敛等优点, 但寻优解过程中需要较高的初温 、 较慢 故优化过程时间 的降温速率以及较低的终止温度, [17 ] 。 较长 鉴于上述两种算法各自的优缺点, 在遗传 [18 ] 操作中嵌入模拟退火算子 , 改进选择策略和遗传 算子, 有效结合遗传算法隐含并行与模拟退火算法 建立加速遗传模拟退火算法 ( ac全局寻优的特点, celerating genetic and simulated annealing algorithm, AGSA) , 具体过程为: ①确定种群规模, 设定初温、 交叉率、 变异率等 , , 参数 用实数编码对各个状态进行编码 随机产生初 始种群; ② 结合退火罚因子构造适应度函数, 计算每个 个体的适应度, 进行解码及适应度评价;
- a* i
( 4)
f( x) =
(a ∑ i i =1
) K( x , )+ b - a* i i x
( 5)
1
数学模型
1. 1 模型原理 1. 1. 1 支持向量机 SVM ) 是一 支持向量机( support vector machine, [15 ] 种基于统计学习理论的机器学习方法 , 基本思想 可概括为通过定义适当的内积函数实现输入空间到 一个高维空间的非线性变换, 然后在此新空间中求 取最优线性分类面。具体原理如下: y k } R n , 对给定的样本数据 { x k , 利用非线性映 射 φ( * ) 将训练数据集映射到一个高维特征空间 ( Hilbert 空间) , 使输入空间中的非线性函数估计问 题转化为高维特征空间中的线性函数估计问题 。设 函数具有如下形式: nh f ( x ) = ω T φ( x k ) + b , b ∈R ( 1) ω∈R , : n , b 其中 高维特征区间的维数 不是固定的 为偏置 量。基于统计学中结构风险最小化原理, 函数估计 问题就是寻找使下面风险函数最小的 f( x) : 1 Rreg = ω T ω + CR ε ( 2) emp f 2
Study on output prediction of CMF based on improved hybrid genetic algorithm and support vector machine
Xu Danyu1 Wang Qi2 Tang Yunping1 Zhang Zhiyang1 Shi Yan1 Sun Kai1 Chai Shuman3
第5 卷 第8 期 2 0 1 1 年 8 月
环境工程学报
Chinese Journal of Environmental Engineering
Vol . 5 , No . 8 Aug. 2 0 1 1
基于改进混合遗传 -支持向量机的 CMF 产水预测研究
许丹宇
1
王
琦
2
唐运平
1
张志扬
1
石
岩
1
孙
凯
1
基金项目:国家水体污染控制与治理科技重大专项 ( 2008ZX07314001 ) ; 天津市科技创新专项资金项目( 08FDZDSH01200 ) 收稿日期:2010 - 04 - 11 ; 修订日期:2010 - 10 - 19 作者简介:许丹宇( 1979 ), 男, 博士, 高级工程师, 从事水处理研究 mail: danyu079@ yahoo. com. cn 工作。E-
- ε∑ ( a i + a * i
i =1
)
+
x j ) 是满足 Mercer 条件的任意对 式中: 核函数 K ( x i , 参数 a 和 a 称为拉格朗日乘子。求解该二 称函数, a * 再利用库恩次型问题可得参数 a, 塔克条件求得 b , 偏置 即可得到支持向量机的输出为:
l *
yi ( ai ∑ j =1
因此本文基于此方法建立cmf系统产水预测模型同时改进混合遗传算法并与支持向量机方法相耦合构造支持向量机模型参数的自适应优化算法以期解决实际cmf系统产水预测时存在的小样本经验性非线性高维数等难点为提高单位膜表面上微滤通量预测精度特别是突发性水质污染时膜通量变化的短期预测效果调整优化操作条件提供科学依据和技术方法
Abstract Combined the accelerating genetic algorithm ( AGA ) and simulated annealing algorithm ( SA ) , and through improved select tactics and genetic operators to form a new accelerating genetic and simulated annealing algorithm( AGSA ) . Based on improved hybrid genetic algorithm and support vector machine ( SVM ) ,it formed a new selfadapting optimized algorithm applied in the SVM parameters. A modified method to develop the flow rate prediction model of continuous microfiltration ( CMF ) system was proposed. The prediction models were verified by flow rate experiments in pilotscale continuous microfiltration system,results showed that this model could reveal the rule of flow rate variation in CMF. It had small error and strong correlation ( R 2 = 0. 91 , MAE = 0. 0132 , SSE = 0. 0055 , RMSE = 0. 0155 ) between predicted values and measured values which explained the model had a strong predictability. Based on leaveoneout cross validation of training samples,the model also showed good robustness( R 2 = 0. 89 、 MAE = 0. 0164 、 SSE = 0. 0073 、 RMSE = 0. 0178 ) . Moreover,the model developed by AGSASVM was compared with the model constructed by BP neural network. The former algorithm showed the optimal predictive capability and robustness in the comparison,indicating more suitable for the flow rate prediction of CMF. Key words continuous microfiltration; support vector machine; accelerating genetic and simulated annealing algorithm; BP neural network; membrane flux filtration, CMF) 主要 连续微滤( continuous micro用于产品的分级、 浓缩、 分离和提纯等过程, 已在环 [13 ] 。 由于膜污 保、 食品、 化工等领域得到广泛应用 染导致其通量非理想变化, 因此准确预测膜通量变
柴树满
3
( 1. 天津市环境保护科学研究院 , 天津 300191 ; 2. 天津职业技术师范大学 , 天津 300222 ; 300352 ) 3. 天津荣程钢铁集团有限公司 , 天津 摘 要 将模拟退火思想和加速遗传特性相结合 , 改进选择策略和遗传算子 , 建立加速遗传模拟退火算法 ( AGSA ) ; 基 于支持向量机( SVM) 的非线性回归和改进混合遗传算法的因子筛选 , 构造了支持向量机模型参数的自适应优化算法 , 提出 结果表明: 该模型较好 连续微滤系统( CMF) 产水预测模型; 通过实测中试规模连续微滤系统产水量变化对模型进行验证 , 2 MAE = 0. 0132 、 SSE = 0. 0055 、 RMSE 地揭示了 CMF 系统产水变化规律, 模拟与实测结果间的误差小 、 相关性强 ( R = 0. 91 、 2 MAE = 0. 0164 、 SSE = 0. 0073 、 = 0. 0155 ) , 说明模型具有较强的预测能力 ; 采用留一法对训练样本进行交叉验证 ( R = 0. 89 、 SVM 的模型与神经网络 BP 算法进行了比较, RMSE = 0. 0178 ) , 表明该模型同时具有良好的稳健性 。此外, 将基于 AGSA结 SVM 建立的模型在稳健性和预测能力都优于 BP 算法, 因此该算法更适合于对 CMF 系统进行产水预测 果显示: 应用 AGSA研究。 关键词 连续微滤 支持向量机 加速遗传模拟退火算法 BP 神经网络 膜通量 中图分类号 X703. 1 文献标识码 A 9108 ( 2011 ) 08172306 文章编号 1673-
( 1. Tianjin Academy of Environmental Science,Tianjin 300191 ,China; 2. Tianjin University of Technology and Education, Tianjin 300222 , China; 3. Tianjin Rockcheck Steel Group Co. Ltd. ,Tianjin 300352 ,China)
1724
环 境 工 程 学 报
第5卷
化规律、 及时调整操作条件和运行参数, 对膜系统的 长效稳定运行有着重要的现实意义 。鉴于微滤体系 目前尚无普遍适用 的多样性和污染机理的复杂性, 的模型预测污染膜的通量变化规律 。国内外学者基 表面吸附、 沉积特性以 于分离相在膜孔内收缩堵塞、 及多效协同作用, 分别建立了描述浓差极化、 膜孔阻 [47 ] , 堵塞和沉积层等因素的微滤通量模型 但参 塞、 数较多、 过程复杂, 难以依靠此类模型进行不同操作 压力等 ) 的优 化 研 究。 针 对 这 类 多 因 条件 ( 温度、 素、 多层次非线性复杂问题, 采用线性回归法、 时间 序列法、 指标平滑法等线性模型求解时精度并不理 [810 ] [12 ] , Piron 等[11]、 孙光民等 在预测微滤通量时 想 引入改进的神经网络方法, 一定程度上克服了传统 方法的不足。由于神经网络法尚有诸多待克服的缺 一般规模化的膜系统难以在短期提供充足的数 陷, 据进行样本训练, 限制了此方法在实际中的应用范 。 围 支持向量机方法对未来样本具有较好的泛化能 力, 特别是对于资料缺乏、 系统结构尚欠清晰的问题 [13 , 14 ] 。 因此, 本文基于此方法 有着较好的预测效果 CMF , 建立 系统产水预测模型 同时改进混合遗传算 并与支持向量机方法相耦合, 构造支持向量机模 法, 型参数的自适应优化算法, 以期解决实际 CMF 系统 、 产水预测时存在的小样本 经验性、 非线性、 高维数 等难点, 为提高单位膜表面上微滤通量预测精度 , 特 别是突发性水质污染时膜通量变化的短期预测效 果, 调整优化操作条件提供科学依据和技术方法 。
T 2 式中: ω ω = ‖ω‖ 描述函数 f ( * ) 的复杂程度, 其 C 为惩罚因子。 引入非负 中 ε 为不灵敏损失参数, * ξi , 得到式 ( 2 ) 的最小化规则化风险 的松弛变量 ξ i , 泛函等价优化问题:
b, ω, ξ i, ξ* i
minJ =
s. t. y i ω T φ( x i ) + b - y i ≤ε + ξ * 2, …, l) i ( i = 1,