基于正则化GRU模型的洪水预测
基于VMD-TCN-GRU 模型的水质预测研究

基于VMD-TCN-GRU模型的水质预测研究作者:项新建许宏辉谢建立丁祎胡海斌郑永平杨斌来源:《人民黄河》2024年第03期摘要:為充分挖掘水质数据在短时震荡中的变化特征,提升预测模型的精度,提出一种基于VMD(变分模态分解)、TCN(卷积时间神经网络)及GRU(门控循环单元)组成的混合水质预测模型,采用VMD-TCN-GRU模型对汾河水库出水口高锰酸盐指数进行预测,并与此类研究中常见的SVR(支持向量回归)、LSTM(长短期记忆神经网络)、TCN和CNN-LSTM(卷积神经网络-长短期记忆神经网络)这4种模型预测结果对比表明:VMD-TCN-GRU模型能更好挖掘水质数据在短时震荡过程中的特征信息,提升水质预测精度;VMD-TCN-GRU模型的MAE(平均绝对误差)、RMSE(均方根误差)下降,R2(确定系数)提高,其MAE、RMSE、R2分别为0.0553、0.0717、0.9351;其预测性能优越,预测精度更高且拥有更强的泛化能力,可以应用于汾河水质预测。
关键词:水质预测;混合模型;变分模态分解;卷积时间神经网络;门控循环单元;时间序列;汾河中图分类号:TV213.4;X524文献标志码:Adoi:10.3969/j.issn.1000-1379.2024.03.017引用格式:项新建,许宏辉,谢建立,等.基于VMD-TCN-GRU模型的水质预测研究[J].人民黄河,2024,46(3):92-97.近年来,国内外专家学者为掌握未来水质变化趋势,对水体水质预测方法进行了大量研究,并取得了一定研究成果。
罗学科等[1]利用差分自回归移动平均模型(ARIMA)对巢湖水域水质进行了预测,结果显示其预测精度及泛化能力较强。
张颖等[2]基于改进的灰色模型和模糊神经网络预测了太湖流域未来一段时间内水质整体变化。
传统的预测方法虽然理论体系成熟、计算简单,但是随着水环境的变化,无法有效处理高差异、对长时间序列依赖性强且非线性关系复杂的水质数据[3],而人工神经网络凭借强大的非线性适应性信息处理能力[4]、能充分逼近任意非线性函数以及泛化能力强[5]等特点,被广泛应用于水质预测中。
正则化RBF网络模型在地下水位预测中的应用

正则化RBF网络模型在地下水位预测中的应用张殷钦;刘俊民;郝健【摘要】【目的】建立地下水位预测的正则化RBF网络模型,为区域地下水资源的利用、规划和管理提供决策依据。
【方法】以MATLAB7.0为平台,用函数newrb创建正则化RBF网络模型,基于宝鸡峡灌区B210号观测井1983-2009年的地下水位埋深资料,对网络模型进行训练后再用测试集检验,分别绘制训练集与测试集的拟合曲线,同时计算实测值与预测值间的相对误差(RE)、平均绝对偏差(MAD)和均方误差(MSE),并将其与BP网络模型的相应值进行对比。
【结果】正则化RBF网络模型和BP网络模型的相对误差均小于5%,平均绝对偏差分别为0.53和0.85,均方误差分别为0.54和1.15,相比之下,正则化RBF网络模型的预测精度更高。
【结论】训练样本和测试样本的合理选取为时间序列的拟合扩展了思路,良好的泛化能力使正则化RBF网络模型在区域地下水位预测中具有一定的可行性。
%【Objective】 Establishing regularized RBF network model for groundwater level prediction can provide strategic decision for groundwateruse,planning and management.【Method】 Regularized RBF network model was built employing newrb function in MATLAB7.0 for well B210 in Baojixia irrigation area based on the groundwater level depth data from 1983 to 2009.The training sets and testing sets were used to train and test the network respectively.Corresponding fitting curve was plotted aswell.Meanwhile,relative error(RE),mean absolute deviation(MAD) and mean-square error(MSE) between predicted and measured values were all calculated and the comparison was addressed with BP network model.【Result】 RE of both regularized RBF and BP network model is less than5%,MAD is 0.53 and 0.85,MSE is 0.54 and 1.15 respectively.By contrast,the precision of regularized RBF network model about predicted values is much higher.【Conclusion】 Selecting training sample and testing sample reasonably has provided a new way for time series simulation.Regularized RBF network model is viable in forecasting regional groundwater table due to its good generalization.【期刊名称】《西北农林科技大学学报(自然科学版)》【年(卷),期】2011(039)010【总页数】5页(P204-208)【关键词】正则化;RBF网络模型;径向基函数;地下水;水位预测【作者】张殷钦;刘俊民;郝健【作者单位】西北农林科技大学水利与建筑工程学院,陕西杨凌712100;西北农林科技大学水利与建筑工程学院,陕西杨凌712100;西北农林科技大学水利与建筑工程学院,陕西杨凌712100【正文语种】中文【中图分类】P332.3地下水是水资源的重要组成部分,是农业灌溉、工矿企业以及生活用水的主要供水水源之一,因而系统地研究地下水的运动规律,并科学地预测地下水位动态有着重要的现实意义。
《基于深度学习的锂电池RUL预测》

《基于深度学习的锂电池RUL预测》一、引言随着科技的飞速发展,锂电池因其高能量密度、长寿命和环保等优点,在电动汽车、移动设备等领域得到了广泛应用。
然而,锂电池的可靠性和使用寿命是影响其应用范围和效率的关键因素。
因此,准确预测锂电池的剩余使用寿命(RUL)显得尤为重要。
近年来,深度学习技术的快速发展为锂电池RUL预测提供了新的解决方案。
本文旨在探讨基于深度学习的锂电池RUL预测方法及其应用价值。
二、锂电池RUL预测的背景及重要性锂电池的RUL预测对于电池管理系统的优化、维护策略的制定以及延长电池使用寿命具有重要意义。
传统的RUL预测方法主要基于经验模型和统计分析,然而这些方法往往难以准确反映锂电池的实际性能退化情况。
随着深度学习技术的发展,越来越多的研究者开始探索基于深度学习的锂电池RUL预测方法。
三、深度学习在锂电池RUL预测中的应用深度学习通过模拟人脑神经网络的工作方式,能够从大量数据中自动提取特征,从而实现对复杂问题的求解。
在锂电池RUL 预测中,深度学习可以有效地处理电池性能退化过程中的非线性、时变性和不确定性等问题。
目前,常用的深度学习模型包括循环神经网络(RNN)、长短期记忆网络(LSTM)和卷积神经网络(CNN)等。
四、基于深度学习的锂电池RUL预测方法1. 数据准备与预处理:首先,需要收集锂电池的性能退化数据,包括电压、电流、温度、容量等。
然后,对数据进行归一化、去噪等预处理操作,以便于深度学习模型的训练。
2. 模型构建:根据具体问题选择合适的深度学习模型。
例如,对于时间序列数据,可以采用RNN或LSTM模型;对于图像数据,可以采用CNN模型。
在构建模型时,需要设置合适的网络结构、激活函数、损失函数等参数。
3. 模型训练与优化:使用训练数据对模型进行训练,通过调整模型参数以优化性能。
在训练过程中,可以采用批量梯度下降、随机梯度下降等优化算法。
4. RUL预测:利用训练好的模型对锂电池的RUL进行预测。
防洪调度中的预测算法优化研究

防洪调度中的预测算法优化研究随着城市化进程不断加速,越来越多的城市面临着洪水的威胁。
因此,防洪调度变得越来越重要。
在防洪调度中,预测是至关重要的,因为它是决策的基础。
在目前的洪水预测工作中,常用的算法是模型预测,但由于模型误差较大,预测效果并不总是理想的。
因此,本文研究了洪水预测中的预测算法优化问题。
一、洪水预测中的模型预测在洪水预测中,目前常用的是基于模型的预测算法。
在该算法中,通过对历史数据进行分析,建立基于数据的数学模型,预测未来水位。
但这种方法存在问题在于,洪水预测涉及到许多随机因素,如降雨量、排放流量以及内部水位等,这导致模型对基础数据的要求较高。
一旦输入数据变化,模型就会出现误差,其预测效果可能不理想,甚至失准。
二、计算优化中的神经网络算法因此,在实际应用中,需要通过计算优化算法来提高模型的精度。
目前,一种常用的优化算法是神经网络算法。
神经网络是由大量神经元组成的模型,并且可以从数据中自动学习。
它能够识别数据中的特征,并学会预测未来变化。
因此,神经网络算法被广泛应用于各种领域的预测和计算中。
在洪水预测中,神经网络可以通过学习数据的特征变化,提高预测的准确性。
三、洪水预测中的多模型集成然而,神经网络模型在某些情况下也会出现过拟合的问题,这使得神经网络的预测结果不够可靠。
因此,在实际应用中,可以采用多模型集成的方法来提高预测的准确性。
在多模型集成中,可以使用多个不同的预测算法,对同一种变量进行多次预测。
如果这些预测结果存在较大差异,则可以结合使用多个预测算法,从而提高预测的准确性。
在洪水预测中,可以将神经网络、统计模型和基于信息论的模型等预测算法集成在一起,从而提高洪水预测的精度和可靠性。
四、结论综上所述,洪水预测中的预测算法优化是一个很重要的问题。
传统的预测算法要求数据有较高的准确性,并且容易受到随机因素的影响,因此存在很大的误差。
而通过计算优化算法和多模型集成,可以提高洪水预测的准确性和可靠性。
水库水位的VMD-CNN-GRU混合预测模型

水库水位的VMD-CNN-GRU混合预测模型作者:韩莹王乐豪魏平慧李占东周文祥来源:《南京信息工程大学学报》2024年第02期摘要水库水位预测为其运营、防洪、水资源调度管理提供了重要决策支持.准确可靠的预测对水资源的优化管理起着至关重要的作用.针对水库水位数据的非线性、不稳定性以及复杂的时空特性,提出一种融合自适应变分模态分解(VMD)、卷积神经网络(CNN)和门控循环单元(GRU)的混合水库水位预测模型.VMD通过对水位序列进行分解消除噪声,CNN用于有效提取水位数据的局部特征,GRU用于提取水位数据的深层时间特征.以葠窝水库日水位为例,与多个相关模型对比分析,结果表明:精度方面,新模型在选取的评价指标上均表现最佳;运算效率方面,本文选择的GRU与长短时记忆网络(LSTM)相比,运算效率显著提高.新模型预测的高精度、高运算效率更能满足实际水库水位实时调度的需求.关键词水位预测;变分模态分解;门控循环单元;卷积神经网络;深度学习中图分类号TP391文献标志码A0引言准确的水库水位预测[1-2]对当地开展防洪减灾工作具有重要指导作用.多年来,诸多学者期望使用水动力学模型[3-4]来模拟渠道水流,达到对水位预测的效果.然而,基于水动力学模型的预测需要模拟出当地精确的地形资料、准确的实测数据等大量人力测量的输入数据,同时模型需要大量参数调整,极大地影响着水位监测的准确性.机器学习模型通过挖掘输入数据隐藏特征便可做出预测,可以有效避免水动力学模型的缺陷.王蒙蒙等[5]提出一種基于支持向量回归(Support Vector Regression,SVR)的洞庭湖水位预测模型,相比传统水动力学模型精度更高.SVR模型对处理非线性问题很难找到合适的核函数且拟合率不高,而深度学习中长短时记忆网络(Long Short-Term Memory,LSTM)在处理非线性序列数据方面优势明显[6-7].刘亚新等[8]提出一种基于LSTM的短期水位预测模型.唐鸣等[9]考虑到迭代次数对计算效率的影响,建立了三层LSTM模型应用于南水北调中线京石段闸前水位预测.Chung等[10]在不同应用场景下对递归神经网络中不同的递归单元进行比较后发现,相比于LSTM,门控循环单元(Gate Recurrent Unit,GRU)也能达到相当的效果,且计算量更小.计算效率更高.纪国良等[11]指出,在水库水位预测中GRU 要优于LSTM.单一模型存在特征提取不完备的缺陷,多个预测方法结合可以提高预测精度.周勇强等[12]将LSTM与卷积神经网络(Convolutional Neural Networks,CNN)相结合,同时捕捉水位数据的局部特征和时序特征,有效地提高了预测准确率.另外,考虑到水位数据非线性和不稳定性,时频分析中经验模态分解(Empirical Mode Decomposition,EMD)[13]、集合经验模态分解(EEMD)、完全集合经验模态分解(CEEMDAN)和变分模态分解(Variational Mode Decomposition,VMD)[14]等被应用于水位预测的预处理中,分解后的数据更加平稳,降低了噪声对水位数据的影响,有利于提高水位预测精度.为解决非线性、不稳定性以及复杂的时空特性对水库水位时间序列的影响,本文提出一种基于VMD-CNN-GRU的水库日水位预测模型.其中,VMD消除水位数据的噪声,CNN有效提取水位数据的局部特征[15],GRU提取水位数据的深层时间特征.选取辽宁省辽阳县葠窝水库2000—2009年3 652 d水位数据进行实例研究.与多个相关模型对比分析表明,本文模型在选取的预测精度评价指标上均表现最佳.分解模块分析表明,VMD与EMD、EEMD和CEEMDAN相比,纳什系数(Nash-Sutcliffe Efficiency coefficient,NSE)提升大于6%,均方根误差(RMSE)降低73.06%以上,平均绝对误差(MAE)降低74.24%以上.选用GRU模块的训练时间比LSTM模块在运算效率方面提升23.71%.本文模型预测精度高、运算效率高,更适合实际水库水位实时调度的需求.1基本原理1.1VMD原理与其他时频分解方法相比,VMD可以有效降低复杂度高和非线性强的水库水位时间序列的非平稳性.VMD具体步骤如下:1)构造变分问题x(t)=[(δt+j/πt)*uk(t)]e-jωkt,(1)min{uk},{ωk}∑k‖tx(t)‖22 ,(2)s.t.∑Kk=1uk=f. (3)其中:式(2)是关于{uk},{ωk}的多元函数,式(3)为各模态的约束条件.f是初始信号,K是分解模态的个数,{uk},{ωk}分别是分解后的第k个模态分量和中心频率,δt为狄拉克函数,*为卷积运算,e-jωkt为原始信号的指数信号,t为偏导运算,t为时间变量,j为虚数符号.2)求解变分问题L({uk},{ωk},λ)=α∑k‖tx(t)‖22+‖f(t)-∑kuk‖22+〈λ(t),f(t)-∑kuk(t)〉.(4)其中,λ为拉格朗日乘法算子,α为二次惩罚因子,〈·〉为内积运算,‖·‖22 表示L2范数的平方.3)求各模态分量和中心频率通过搜寻增广拉格朗日函数的鞍点,交替寻找迭代后的{uk},{ωk}和λ的最优结果,其表达式如下:n+1k (ω)=(ω)-∑k-1i=1i(ω)+(ω)21+2α(ω-ωk)2,(5)ωn+1k=∫∞0ω|n+1k (ω)|2dω∫∞0|n+1k (ω)|2dω,(6)n+1(ω)=n(ω)+γ((ω)-∑Kk=1n+1k(ω)).(7)其中,n+1k(ω)为(ω)-∑Kk=1n+1k(ω)的维纳滤波,ωn+1k为此过程的模态函数功率谱的重心,γ为噪声容忍度,n+1k (ω),i (ω),i (ω)和(ω)分别是原信号un+1k (t),ui(t),f(t),λ(t)对应的傅里叶变换,n表示迭代次数.1.2CNN原理CNN在本质上是一种输入与输出间的映射关系.CNN所包含的权值共享特点降低了网络的复杂性,避免了特征提取和分类过程中数据重建的复杂度.CNN网络特有的局部感知野使得每个神经元只需对局部特征进行感知,然后在更高层将局部的信息综合就可得到全局信息.设x=(x1,x2,…,xn)为时间序列数据输入向量,n为每个窗口数值数量,xi为归一值,i为特征值索引,j为每个数据窗口的特征图索引.利用输入数据的数值xlij,第l个卷积层的输出值可表示为ylij=σbl-1j+∑Mm=1Wl-1m,jxl-1i+m-1,j .(8)式中,bl-1j 表示第j个特征图的偏置,W为核权重,M为过滤器大小,σ为激活函数.池化层降低表征的空间尺寸,以减少网络的参数量和计算复杂度,同时可以防止过拟合.池化层的计算可表示为plij=maxr∈R yl-1i×T+r,j.(9)式中,R为池化大小(R<y),T为确定池化区域步长,plij表示池化后的神经元值.1.3GRU原理GRU混合了细胞状态和隐藏状态,将LSTM中的遗忘门和输入门合并为一个单一的更新门,其结构如图1所示.相比LSTM模型,GRU的结构更加简单.其中:xt为t时刻的输入;yt 为t时刻隐藏节点的输出;ht为传递给下一个节点的隐藏状态;ht-1为t-1时刻的隐藏层状态,该隐藏层状态包含了之前节点的相关信息;rt为重置门;zt为更新门;σ为sigmoid函数;tanh为激活函数,将数值限制在-1~1之间;t为候选隐藏层状态.GRU的数学原理如下:rt=σ(xtWxr+ht-1Whr+br),(10)zt=σ(xtWxz+ht-1Whz+bz),(11)=tanh(xtWhx+rt⊙ht-1Whh+bh),(12)ht=(1-zt)⊙ht-1+zt⊙t.(13)其中:Wxr,Whr,Wxz,Whz,Whx,Whh表示输入向量与重置门、更新门和候选隐藏层状态之间相对应的权向量;br,bz,bh是偏置变量;⊙表示按元素相乘.2模型建立2.1模型的输入及输出目前,过程驱动模型与数据驱动模型被广泛运用于时间序列的预测.本文建立的VMD-CNN-GRU模型属于数据驱动模型方法的一种,有效避免了传统过程驱动模型需要进行过程近似模拟、大量未知输入数据以及模型参数的缺陷,同时兼备计算速度快、输入参数少且不需考量中间过程的物理机制的优点,只需要寻求输入输出变量间的最佳映射关系.本文模型與现有模型相比具有较强的数据处理和映射功能,仅需将采集到的水库水位数据作为输入向量按比例划分后直接输入模型进行学习、映射,得到输出向量.从预报成果来说,预报方案满足《水文情报预报规范》(GB/T 22482—2008)[16]要求,并取得理想的成果,可应用于实际预测.2.2基于VMD-CNN-GRU的水库水位预测模型VMD-CNN-GRU水库水位预测混合模型具体参数如表1所示.VMD-CNN-GRU水库水位预测混合模型整体结构如图2所示.VMD-CMM-GRU水位预测模型具体运算步骤如下:1)步骤1:数据预处理①缺失数据补足根据数据缺失特征,选择相应的数据缺失方法进行数据补足.②基于自适应变分模态分解的数据处理EMD算法具有不需要人为设置和干预的自适应性,对未知数据无需进行分析研究,直接对其进行循环迭代,便可将原始混合信号x分解成n个模态,n个模态又被分为n-1个子信号和1个残差项,其目标函数式为x=∑ni=1ui+ri.(14)式中,x为原信号,ui为第i个IMF分量,ri为第i个去掉高频成分的新信号.对补全后的水位数据进行排列并按照比例划分构建为列表数据,再将划分好的数据输入到VMD进行分解预处理.结合EMD分解自适应性优势,获取最优分解模态数,将其作为VMD 分解模态数K值.自适应VMD分解模块能够将序列中隐藏的周期和趋势进行有效挖掘,使得模型能够学习到水位数据周期性的隐藏特征,同时增加数据量,使模型充分进行学习,有效提高预测准确率,模态分解如图3所示.③数据归一化处理对划分好的数据进行归一化处理,其计算方法如下:x′=x-xminxmax-xmin.(15)其中,x表示模型的输入值,x′表示归一化后的数值.2)步骤2:基于CNN的水位局部特征提取CNN的卷积核强调空间中的“窗口”,使得其在处理时间序列数据时可以考虑到当前数据前后数据的影响,从而进行局部数据特征提取,最后将局部信息聚合得到整体信息.引入的CNN层可以有效弥补循环神经网络不考虑空间上下问题,对输入数据进行层次特征提取.CNN层用于水位的局部感知提取特征,可以减少参数量和连接数,从而显著提高模型迭代的效率,为进一步利用循环神经网络提取深层时间特征奠定了基础.将经过预处理后的数据构建为S×τ×D的三维向量作为CNN层的输入.其中,S为样本数量(samples),τ为时间步长(timesteps),D为特征个数(features).数据通过输入层进入卷积层,卷积层包含数个特征面,每个特征面包含数个神经元,对数据进行特征提取.提取到的特征由激活函数处理得到神经元的输出,输入到池化层中.池化层与卷积层相同,包含数个特征面,池化层主要用于二次特征提取、简化数据量并利用其每个神经元进行采样.其中,n+1k(ω)为(ω)-∑Kk=1n+1k(ω)的维纳滤波,ωn+1k为此过程的模态函数功率谱的重心,γ为噪声容忍度,n+1k (ω),i (ω),i (ω)和(ω)分别是原信号un+1k (t),ui(t),f(t),λ(t)对应的傅里叶变换,n表示迭代次数.1.2CNN原理CNN在本质上是一种输入与输出间的映射关系.CNN所包含的权值共享特点降低了网络的复杂性,避免了特征提取和分类过程中数据重建的复杂度.CNN网络特有的局部感知野使得每个神经元只需对局部特征进行感知,然后在更高层将局部的信息综合就可得到全局信息.设x=(x1,x2,…,xn)为时间序列数据输入向量,n为每个窗口数值数量,xi为归一值,i为特征值索引,j为每个数据窗口的特征图索引.利用输入数据的数值xlij,第l个卷积层的输出值可表示为ylij=σbl-1j+∑Mm=1Wl-1m,jxl-1i+m-1,j .(8)式中,bl-1j 表示第j个特征图的偏置,W为核权重,M为过滤器大小,σ为激活函数.池化层降低表征的空间尺寸,以减少网络的参数量和计算复杂度,同时可以防止过拟合.池化层的计算可表示为plij=maxr∈R yl-1i×T+r,j.(9)式中,R为池化大小(R<y),T为确定池化区域步长,plij表示池化后的神经元值.1.3GRU原理GRU混合了细胞状态和隐藏状态,将LSTM中的遗忘门和输入门合并为一个单一的更新门,其结构如图1所示.相比LSTM模型,GRU的结构更加简单.其中:xt为t时刻的输入;yt 为t时刻隐藏节点的输出;ht为传递给下一个节点的隐藏状态;ht-1为t-1时刻的隐藏层状态,该隐藏层状态包含了之前节点的相关信息;rt为重置门;zt为更新门;σ为sigmoid函数;tanh为激活函数,将数值限制在-1~1之间;t为候选隐藏层状态.GRU的数学原理如下:rt=σ(xtWxr+ht-1Whr+br),(10)zt=σ(xtWxz+ht-1Whz+bz),(11)=tanh(xtWhx+rt⊙ht-1Whh+bh),(12)ht=(1-zt)⊙ht-1+zt⊙t.(13)其中:Wxr,Whr,Wxz,Whz,Whx,Whh表示输入向量与重置门、更新门和候选隐藏层状态之间相对应的权向量;br,bz,bh是偏置变量;⊙表示按元素相乘.2模型建立2.1模型的输入及输出目前,过程驱动模型与数据驱动模型被广泛运用于时间序列的预测.本文建立的VMD-CNN-GRU模型属于数据驱动模型方法的一种,有效避免了传统过程驱动模型需要进行过程近似模拟、大量未知输入数据以及模型参数的缺陷,同时兼备计算速度快、输入参数少且不需考量中间过程的物理机制的优点,只需要寻求输入输出变量间的最佳映射关系.本文模型与现有模型相比具有较强的数据处理和映射功能,仅需将采集到的水库水位数据作为输入向量按比例划分后直接输入模型进行学习、映射,得到输出向量.从预报成果来说,预报方案满足《水文情报预报规范》(GB/T 22482—2008)[16]要求,并取得理想的成果,可应用于实际预测.2.2基于VMD-CNN-GRU的水库水位预测模型VMD-CNN-GRU水库水位预测混合模型具体参数如表1所示.VMD-CNN-GRU水库水位预测混合模型整体结构如图2所示.VMD-CMM-GRU水位预测模型具体运算步骤如下:1)步骤1:数据预处理①缺失数据补足根据数据缺失特征,选择相应的数据缺失方法进行数据补足.②基于自适应变分模态分解的数据处理EMD算法具有不需要人为设置和干预的自适应性,对未知数据无需进行分析研究,直接对其进行循环迭代,便可将原始混合信号x分解成n个模态,n个模态又被分为n-1个子信号和1个残差项,其目标函数式为x=∑ni=1ui+ri.(14)式中,x为原信号,ui为第i个IMF分量,ri为第i个去掉高频成分的新信号.对补全后的水位数据进行排列并按照比例划分构建为列表数据,再将划分好的数据输入到VMD进行分解预处理.结合EMD分解自适应性优势,获取最优分解模态数,将其作为VMD 分解模态数K值.自适应VMD分解模块能够将序列中隐藏的周期和趋势进行有效挖掘,使得模型能够学习到水位数据周期性的隐藏特征,同时增加数据量,使模型充分进行学习,有效提高预测准确率,模态分解如图3所示.③数据归一化处理对划分好的数据进行归一化处理,其计算方法如下:x′=x-xminxmax-xmin.(15)其中,x表示模型的输入值,x′表示归一化后的数值.2)步骤2:基于CNN的水位局部特征提取CNN的卷积核强调空间中的“窗口”,使得其在处理时间序列数据时可以考虑到当前数据前后数据的影响,从而进行局部数据特征提取,最后将局部信息聚合得到整体信息.引入的CNN层可以有效弥补循环神经网络不考虑空间上下问题,对输入数据进行层次特征提取.CNN层用于水位的局部感知提取特征,可以减少参数量和连接数,从而显著提高模型迭代的效率,为进一步利用循环神经网络提取深层时间特征奠定了基础.将經过预处理后的数据构建为S×τ×D的三维向量作为CNN层的输入.其中,S为样本数量(samples),τ为时间步长(timesteps),D为特征个数(features).数据通过输入层进入卷积层,卷积层包含数个特征面,每个特征面包含数个神经元,对数据进行特征提取.提取到的特征由激活函数处理得到神经元的输出,输入到池化层中.池化层与卷积层相同,包含数个特征面,池化层主要用于二次特征提取、简化数据量并利用其每个神经元进行采样.其中,n+1k(ω)为(ω)-∑Kk=1n+1k(ω)的维纳滤波,ωn+1k为此过程的模态函数功率谱的重心,γ为噪声容忍度,n+1k (ω),i (ω),i (ω)和(ω)分别是原信号un+1k (t),ui(t),f(t),λ(t)对应的傅里叶变换,n表示迭代次数.1.2CNN原理CNN在本质上是一种输入与输出间的映射关系.CNN所包含的权值共享特点降低了网络的复杂性,避免了特征提取和分类过程中数据重建的复杂度.CNN网络特有的局部感知野使得每个神经元只需对局部特征进行感知,然后在更高层将局部的信息综合就可得到全局信息.设x=(x1,x2,…,xn)为时间序列数据输入向量,n为每个窗口数值数量,xi为归一值,i为特征值索引,j为每个数据窗口的特征图索引.利用输入数据的数值xlij,第l个卷积层的输出值可表示为ylij=σbl-1j+∑Mm=1Wl-1m,jxl-1i+m-1,j .(8)式中,bl-1j 表示第j个特征图的偏置,W为核权重,M为过滤器大小,σ为激活函数.池化层降低表征的空间尺寸,以减少网络的参数量和计算复杂度,同时可以防止过拟合.池化层的计算可表示为plij=maxr∈R yl-1i×T+r,j.(9)式中,R为池化大小(R<y),T为确定池化区域步长,plij表示池化后的神经元值.1.3GRU原理GRU混合了细胞状态和隐藏状态,将LSTM中的遗忘门和输入门合并为一个单一的更新门,其结构如图1所示.相比LSTM模型,GRU的结构更加简单.其中:xt为t时刻的输入;yt 为t时刻隐藏节点的输出;ht为传递给下一个节点的隐藏状态;ht-1为t-1时刻的隐藏层状态,该隐藏层状态包含了之前节点的相关信息;rt为重置门;zt为更新门;σ为sigmoid函数;tanh为激活函数,将数值限制在-1~1之间;t为候选隐藏层状态.GRU的数学原理如下:rt=σ(xtWxr+ht-1Whr+br),(10)zt=σ(xtWxz+ht-1Whz+bz),(11)=tanh(xtWhx+rt⊙ht-1Whh+bh),(12)ht=(1-zt)⊙ht-1+zt⊙t.(13)其中:Wxr,Whr,Wxz,Whz,Whx,Whh表示输入向量与重置门、更新门和候选隐藏层状态之间相对应的权向量;br,bz,bh是偏置变量;⊙表示按元素相乘.2模型建立2.1模型的输入及输出目前,過程驱动模型与数据驱动模型被广泛运用于时间序列的预测.本文建立的VMD-CNN-GRU模型属于数据驱动模型方法的一种,有效避免了传统过程驱动模型需要进行过程近似模拟、大量未知输入数据以及模型参数的缺陷,同时兼备计算速度快、输入参数少且不需考量中间过程的物理机制的优点,只需要寻求输入输出变量间的最佳映射关系.本文模型与现有模型相比具有较强的数据处理和映射功能,仅需将采集到的水库水位数据作为输入向量按比例划分后直接输入模型进行学习、映射,得到输出向量.从预报成果来说,预报方案满足《水文情报预报规范》(GB/T 22482—2008)[16]要求,并取得理想的成果,可应用于实际预测.2.2基于VMD-CNN-GRU的水库水位预测模型VMD-CNN-GRU水库水位预测混合模型具体参数如表1所示.VMD-CNN-GRU水库水位预测混合模型整体结构如图2所示.VMD-CMM-GRU水位预测模型具体运算步骤如下:1)步骤1:数据预处理①缺失数据补足根据数据缺失特征,选择相应的数据缺失方法进行数据补足.②基于自适应变分模态分解的数据处理EMD算法具有不需要人为设置和干预的自适应性,对未知数据无需进行分析研究,直接对其进行循环迭代,便可将原始混合信号x分解成n个模态,n个模态又被分为n-1个子信号和1个残差项,其目标函数式为x=∑ni=1ui+ri.(14)式中,x为原信号,ui为第i个IMF分量,ri为第i个去掉高频成分的新信号.对补全后的水位数据进行排列并按照比例划分构建为列表数据,再将划分好的数据输入到VMD进行分解预处理.结合EMD分解自适应性优势,获取最优分解模态数,将其作为VMD 分解模态数K值.自适应VMD分解模块能够将序列中隐藏的周期和趋势进行有效挖掘,使得模型能够学习到水位数据周期性的隐藏特征,同时增加数据量,使模型充分进行学习,有效提高预测准确率,模态分解如图3所示.③数据归一化处理对划分好的数据进行归一化处理,其计算方法如下:x′=x-xminxmax-xmin.(15)其中,x表示模型的输入值,x′表示归一化后的数值.2)步骤2:基于CNN的水位局部特征提取CNN的卷积核强调空间中的“窗口”,使得其在处理时间序列数据时可以考虑到当前数据前后数据的影响,从而进行局部数据特征提取,最后将局部信息聚合得到整体信息.引入的CNN层可以有效弥补循环神经网络不考虑空间上下问题,对输入数据进行层次特征提取.CNN层用于水位的局部感知提取特征,可以减少参数量和连接数,从而显著提高模型迭代的效率,为进一步利用循环神经网络提取深层时间特征奠定了基础.将经过预处理后的数据构建为S×τ×D的三维向量作为CNN层的输入.其中,S为样本数量(samples),τ为时间步长(timesteps),D为特征个数(features).数据通过输入层进入卷积层,卷积层包含数个特征面,每个特征面包含数个神经元,对数据进行特征提取.提取到的特征由激活函数处理得到神经元的输出,输入到池化层中.池化层与卷积层相同,包含数个特征面,池化层主要用于二次特征提取、简化数据量并利用其每个神经元进行采样.其中,n+1k(ω)为(ω)-∑Kk=1n+1k(ω)的维纳滤波,ωn+1k为此过程的模态函数功率谱的重心,γ为噪声容忍度,n+1k (ω),i (ω),i (ω)和(ω)分别是原信号un+1k (t),ui(t),f(t),λ(t)对应的傅里叶变换,n表示迭代次数.1.2CNN原理CNN在本质上是一种输入与输出间的映射关系.CNN所包含的权值共享特点降低了网络的复杂性,避免了特征提取和分类过程中数据重建的复杂度.CNN网络特有的局部感知野使得每个神经元只需对局部特征进行感知,然后在更高层将局部的信息综合就可得到全局信息.设x=(x1,x2,…,xn)为时间序列数据输入向量,n为每个窗口数值数量,xi为归一值,i为特征值索引,j为每个数据窗口的特征图索引.利用输入数据的数值xlij,第l个卷积层的输出值可表示为ylij=σbl-1j+∑Mm=1Wl-1m,jxl-1i+m-1,j .(8)式中,bl-1j 表示第j个特征图的偏置,W为核权重,M为过滤器大小,σ为激活函数.池化層降低表征的空间尺寸,以减少网络的参数量和计算复杂度,同时可以防止过拟合.池化层的计算可表示为plij=maxr∈R yl-1i×T+r,j.(9)式中,R为池化大小(R<y),T为确定池化区域步长,plij表示池化后的神经元值.1.3GRU原理GRU混合了细胞状态和隐藏状态,将LSTM中的遗忘门和输入门合并为一个单一的更新门,其结构如图1所示.相比LSTM模型,GRU的结构更加简单.其中:xt为t时刻的输入;yt 为t时刻隐藏节点的输出;ht为传递给下一个节点的隐藏状态;ht-1为t-1时刻的隐藏层状态,该隐藏层状态包含了之前节点的相关信息;rt为重置门;zt为更新门;σ为sigmoid函数;tanh为激活函数,将数值限制在-1~1之间;t为候选隐藏层状态.GRU的数学原理如下:rt=σ(xtWxr+ht-1Whr+br),(10)zt=σ(xtWxz+ht-1Whz+bz),(11)=tanh(xtWhx+rt⊙ht-1Whh+bh),(12)ht=(1-zt)⊙ht-1+zt⊙t.(13)其中:Wxr,Whr,Wxz,Whz,Whx,Whh表示输入向量与重置门、更新门和候选隐藏层状态之间相对应的权向量;br,bz,bh是偏置变量;⊙表示按元素相乘.2模型建立2.1模型的输入及输出目前,过程驱动模型与数据驱动模型被广泛运用于时间序列的预测.本文建立的VMD-CNN-GRU模型属于数据驱动模型方法的一种,有效避免了传统过程驱动模型需要进行过程近似模拟、大量未知输入数据以及模型参数的缺陷,同时兼备计算速度快、输入参数少且不需考量中间过程的物理机制的优点,只需要寻求输入输出变量间的最佳映射关系.本文模型与现有模型相比具有较强的数据处理和映射功能,仅需将采集到的水库水位数据作为输入向量按比例划分后直接输入模型进行学习、映射,得到输出向量.从预报成果来说,预报方案满足《水文情报预报规范》(GB/T 22482—2008)[16]要求,并取得理想的成果,可应用于实际预测.2.2基于VMD-CNN-GRU的水库水位预测模型VMD-CNN-GRU水库水位预测混合模型具体参数如表1所示.VMD-CNN-GRU水库水位预测混合模型整体结构如图2所示.VMD-CMM-GRU水位预测模型具体运算步骤如下:1)步骤1:数据预处理①缺失数据补足根据数据缺失特征,选择相应的数据缺失方法进行数据补足.②基于自适应变分模态分解的数据处理EMD算法具有不需要人为设置和干预的自适应性,对未知数据无需进行分析研究,直接对其进行循环迭代,便可将原始混合信号x分解成n个模态,n个模态又被分为n-1个子信号和1个残差项,其目标函数式为。
基于GRU-BP组合模型的湖泊水位预测方法探索

基于GRU-BP组合模型的湖泊水位预测方法探索刘惟飞;陈兵;余周【期刊名称】《中国农村水利水电》【年(卷),期】2022()11【摘要】为改善传统循环神经网络预测梯度消失的问题,并探讨组合模型在水位预测中的应用,提出了一种基于门控循环单元(Gated Recurrent Unit,GRU)和BP神经网络的组合预测模型,对广州市猎德涌的源头西湖水位进行预测。
研究以西湖3-7月的水文时间序列作为训练集,8月作为测试集,通过控制变量法确定了GRU-BP 模型的最佳参数。
该模型以西湖监测点的历史雨量及水位作为输入条件,预测未来1 h的水位过程,通过GRU融合层进行非线性分配单个模型框架的输出向量权重从而修正预测误差;利用并联式的集成方式能精确分配补水、排水时序变化及雨量等信息对水位增量的反馈权重。
结果表明,与基于卷积神经网络(CNN)和GRU的组合模型及GRU、长短时记忆网络(Long Short-Term Memory,LSTM)、BP相比,GRU-BP模型整体预测精度分别提高了10.6%,17.2%,32.5%,51.2%。
进一步选取短时间序列(3-4月)和典型雨季水文时间序列(5-7月)训练模型,并在参数不变情况下探讨了不同预测步长对模型精度的影响。
结果显示,使用数据驱动模型时,应尽可能选择典型及代表性的水文数据用于训练;模型对暴雨期及大雨期水位进行预测时,预测步长设置为30 min时,可以获得一定的提前时间,同时也能取得较好的预测精度;GRU-BP集成时的精确度与稳定性得到了提高,为湖泊水位预测提供了一种新的方法。
【总页数】8页(P58-65)【作者】刘惟飞;陈兵;余周【作者单位】华南理工大学环境与能源学院;广东省环境风险防控与应急处置工程技术研究中心【正文语种】中文【中图分类】TV8【相关文献】1.基于灰色-BP神经网络组合模型的水位预测案例2.基于集合经验模态分解与BP 组合模型的短期余水位预测3.基于SFLA-CNN和LSTM组合模型的水位预测4.基于卫星测高的湖泊水位监测及预测方法研究因版权原因,仅展示原文概要,查看原文内容请购买。
机器学习技术在曹娥江流域洪水预报中的应用

机器学习技术在曹娥江流域洪水预报中的应用
孙小洪;赵兵;孙逸群;石朋
【期刊名称】《浙江水利科技》
【年(卷),期】2022(50)2
【摘要】以逐步线性回归、正则化技术、L曲线方法等机器学习技术为理论基础,提出基于机器学习方法的水位预报模型,在此基础上建立曹娥江中下游流域的水位预报方案。
水位预报模型使用逐步回归方法以使用最少的预测变量数来实现最大化预测的能力,引入正则化方法及L曲线方法在应对复共线性问题的同时引入先验信息。
研究实现多模型方案的对比,分析历年场次洪水特征和重点水利工程对洪水预报精度的影响,提出基于机器学习方法的水位预报模型,在台风“烟花”中进行试运行,结果表明技术可行,方案模型准确。
并应用于曹娥江中下游流域,预报结果精准。
【总页数】5页(P83-87)
【作者】孙小洪;赵兵;孙逸群;石朋
【作者单位】上虞区虞东水闸运行管理中心;信阳市南湾水库管理局;河海大学水文水资源学院
【正文语种】中文
【中图分类】P338.9
【相关文献】
1.大型钢闸门支铰翻身技术在曹娥江大闸枢纽工程中的应用
2.贝雷架龙门吊及闸墩混凝土施工大型钢模一次成型技术在曹娥江大闸中的应用
3.信息智能融合技术在
曹娥江大闸安全监测系统中的应用4.高压摆喷灌浆技术在曹娥江大堤加固中的应用5.大钢模一次浇筑成型技术在曹娥江大闸混凝土闸墩施工中的应用
因版权原因,仅展示原文概要,查看原文内容请购买。
基于混合深度学习模型的洪水过程概率预报研究

2023年8月水 利 学 报SHUILI XUEBAO第54卷 第8期文章编号:0559-9350(2023)08-0889-10收稿日期:2022-09-23;网络首发日期:2023-04-19网络首发地址:https:??kns.cnki.net?kcms?detail?11.1882.TV.20230418.1158.001.html基金项目:国家重点研发计划项目(2021YFC3200301);国家自然科学基金项目(U20A20317)作者简介:崔震(1997-),博士生,主要从事水文水资源研究。
E-mail:zhencui@whu.edu.cn通信作者:郭生练(1957-),教授,挪威工程院外籍院士,主要从事水文水资源研究。
E-mail:slguo@whu.edu.cn基于混合深度学习模型的洪水过程概率预报研究崔 震1,郭生练1,王 俊1,2,张 俊2,周研来1(1.武汉大学水资源与水电工程科学国家重点实验室,湖北武汉 430072;2.长江水利委员会水文局,湖北武汉 430010)摘要:传统的人工神经网络模型无法量化洪水预报的不确定性,而且在多时段连续预报中未考虑输出的时间相关性。
本文通过融合新安江(XAJ)模型、基于外源输入编码-解码(EDE)结构的长短期记忆(LSTM)神经网络和混合密度网络(MDN),构建了XAJ-LSTM-EDE-MDN混合深度学习模型,以实现洪水过程概率预报。
该模型在考虑预报洪水时间相关性的前提下,将解码过程产生的点估计转化为条件概率分布的估计;进一步采用最大似然估计法建立了损失函数,通过自适应矩估计(Adam)算法优选模型参数。
在陆水和建溪两个流域的研究结果表明:该模型在不降低XAJ-LSTM-EDE模型预报精度的前提下,可有效反映预报洪水过程的不确定性,获得合理可靠的置信区间和优良的概率预报性能,为水库防洪调度等决策提供更多的风险信息,同时为研究深度学习在洪水概率预报中的应用提供参考。
人工智能自然语言技术练习(试卷编号1111)

人工智能自然语言技术练习(试卷编号1111)1.[单选题]下列属于西文字符编码的是()A)ASCII码B)国标码C)GB13000D)GBK答案:A解析:2.[单选题]TextRank 是由哪个算法改进而来的A)FastTextB)TextCNNC)PageRankD)TF-IDF答案:C解析:3.[单选题]在NLP任务中,以下哪个可以提高模型精度A)ELMoB)Open AI’s GPTC)ULMFitD)One-Hot答案:B解析:Open AI的GPT能够通过使用Transformer模型的注意力机制(Attention Mechanism)来学习数据中的复杂模式,因此更适合于诸如语义相似性、阅读理解和常识推理之类的复杂用例。
4.[单选题]浅层句法分析方法大体分为两类,其一基于统计的方法,统计方法中不属于具有代表性的方法是A)基于HMM模型的方法B)Φ2统计方法C)互信息方法D)统计分组方法答案:D解析:5.[单选题]在NLP当中,像Bi-Gram和TriGram这样的模型都属于什么模型A)N-GramB)Seq2seq解析:6.[单选题]机器学习中关于SVM,以下说法错误的是A)L2正则项,作用是最大化分类间隔,使得分类器拥有更强的泛化能力B)Hinge 损失函数,作用是最小化经验分类错误C)分类间隔为1/||w||,||w||代表向量的模D)当参数C越小时,分类间隔越大,分类错误越多,趋于欠学习答案:C解析:7.[单选题]多分类问题一般用什么激活函数进行映射A)sigmoidB)tanhC)softmaxD)relu答案:C解析:8.[单选题]katz指数又称ADL指数,由难到易分为()类A)4B)5C)6D)7答案:C解析:9.[单选题]数据归一化通常和以下哪个选项中一起使用A)训练集的mini-batchB)测试集的mini-batchC)整个训练集D)整个测试集答案:A解析:10.[单选题]在TensorFlow框架中,如何正确的调用Adam优化器?A)tf.example.AdamOptimizerB)tf.train.AdamOptimizerC)tf.nn.AdamOptimizerD)tf.AdamOptimizer11.[单选题]朴素贝叶斯作为常用的方法,它是以( )为基础的分类方法。
基于分析的LSTM组合模型径流预测

基于分析的LSTM组合模型径流预测一、内容概述随着气候变化和人类活动的影响,径流预测在水资源管理、防洪减灾和水环境保护等领域具有重要的现实意义。
传统的径流预测方法往往依赖于经验公式或统计模型,这些方法在一定程度上可以解决实际问题,但由于其局限性,很难适应复杂多变的气候和地形条件。
因此研究一种基于分析的LSTM组合模型径流预测方法具有重要的理论和实践价值。
通过对大量实验数据的验证和分析,本文证明了所提出的基于分析的LSTM组合模型径流预测方法在预测精度和泛化能力方面均优于现有的方法。
此外该方法还可以有效地处理非线性、非平稳和多变量等问题,为水资源管理和水环境保护提供了有力的支持。
1. 研究背景和意义随着全球气候变化和人类活动对自然环境的影响加剧,径流预测在水资源管理和防洪减灾领域具有重要意义。
然而传统的径流预测方法往往缺乏对复杂地理环境和气象条件的考虑,导致预测结果的准确性和可靠性有限。
因此研究一种基于分析的LSTM组合模型径流预测方法,以提高预测精度和实用性,具有重要的理论和实际价值。
本文首先介绍了LSTM(长短期记忆)网络的基本原理和应用,然后分析了现有的径流预测方法的不足之处,提出了基于分析的LSTM组合模型径流预测方法。
该方法结合了LSTM网络的时间序列特征提取能力和分析方法,以及传统径流预测方法的空间信息处理能力,能够更好地捕捉地理空间和气象条件的变化趋势,从而提高预测精度。
此外本文还探讨了模型参数的选择和优化方法,以进一步提高预测性能。
通过对实际流域数据集的实证分析,本文验证了基于分析的LSTM 组合模型径流预测方法的有效性和实用性。
实验结果表明,相比于传统的径流预测方法,本文提出的方法在预测精度和泛化能力方面均具有显著优势。
这为水资源管理和防洪减灾领域的决策提供了有力支持,也为未来径流预测研究提供了新的思路和方向。
2. 国内外研究现状随着全球气候变化和城市化进程的加速,径流预测在水资源管理、防洪减灾、水环境保护等方面具有重要意义。
基于CNN-GRU-ATT的城市暴雨积水预测研究

基于CNN-GRU-ATT的城市暴雨积水预测研究胡昊;陈军朋;李擎;马鑫;徐鹏;刘明潇【期刊名称】《华北水利水电大学学报(自然科学版)》【年(卷),期】2024(45)4【摘要】多发频发的极端暴雨事件导致很多城市普遍面临严重内涝问题。
能否准确高效地预测城市积水点的水位变化,是城市内涝防治的重要组成部分。
为有效提升城市暴雨积水预测的精度和效率,建立了一种基于卷积神经网络(CNN)-门控循环单元(GRU)-注意力机制(ATT)的城市暴雨积水预测模型。
首先利用CNN与GRU 提取水位数据的局部空间特征和深层时间特征,然后引入ATT加强对降雨序列中关键信息的记忆,从而完成城市积水点的水位预测。
利用开封市某积水点的实测水位对模型进行了验证,并与以往的CNN-GRU、ATT-CNN-LSTM以及CNN-LSTM 模型进行了对比分析。
结果表明,CNN-GRU-ATT模型的损失函数在epoch=20处即达到收敛,损失函数值最终稳定在0.0002左右,收敛效果较好。
此外,与其他3种模型相比,CNN-GRU-ATT模型的预测精度评价指标表现均为最优,且模型仍能保持较高的运算效率。
其中均方根误差为1.39%,平均绝对百分比误差为4.32%,决定系数为0.9954。
这表明CNN-GRU-ATT模型能够准确、高效地预测出积水点的水位变化情况,可为暴雨内涝预警和制定防汛排涝方案提供有效的科学依据。
【总页数】9页(P27-35)【作者】胡昊;陈军朋;李擎;马鑫;徐鹏;刘明潇【作者单位】黄河水利职业技术学院;华北水利水电大学;河南省跨流域区域引调水运行与生态安全工程研究中心;中国水利水电科学研究院流域水循环模拟与调控国家重点实验室【正文语种】中文【中图分类】P338;P429【相关文献】1.基于GIS的城市暴雨积水模拟预测方法2.基于GIS和SWMM模型的城市暴雨积水模拟3.基于分布式水文模型的城市暴雨积水过程模拟4.基于STARMA模型的城市暴雨积水点积水短时预测5.基于GIS和SWMM的城市道路暴雨积水模拟因版权原因,仅展示原文概要,查看原文内容请购买。
基于正则化和自适应遗传算法的水文预测模型的构建方法[发明专利]
![基于正则化和自适应遗传算法的水文预测模型的构建方法[发明专利]](https://img.taocdn.com/s3/m/2452b915c8d376eeafaa314a.png)
专利名称:基于正则化和自适应遗传算法的水文预测模型的构建方法
专利类型:发明专利
发明人:万定生,朱海南,刘昕玥,赵群
申请号:CN202010876835.9
申请日:20200827
公开号:CN112015719A
公开日:
20201201
专利内容由知识产权出版社提供
摘要:本发明公开一种基于正则化和自适应遗传算法的水文预测模型的构建方法,通过改进正则化门控循环单元GRU水文预测模型,在GRU神经网络中引入弹性网正则化项对水文输入数据进行处理,并利用改进自适应遗传算法优化正则项参数,提高水文预测准确率。
申请人:河海大学
地址:210098 江苏省南京市鼓楼区西康路1号
国籍:CN
代理机构:南京华恒专利代理事务所(普通合伙)
代理人:宋方园
更多信息请下载全文后查看。
基于GRU的锂电池组健康状态预测研究

第40卷 第2期吉林大学学报(信息科学版)Vol.40 No.22022年3月Journal of Jilin University (Information Science Edition)Mar.2022文章编号:1671⁃5896(2022)02⁃0181⁃07基于GRU 的锂电池组健康状态预测研究收稿日期:2021⁃07⁃11作者简介:曹广华(1964 ),男,河南柘城人,东北石油大学教授,博士,硕士生导师,主要从事高分辨率数据采集与智能系统技术研究,(Tel)86⁃139****2451(E⁃mail)cgh_05@㊂曹广华,赵中林,许昀昊(东北石油大学电气信息工程学院,黑龙江大庆163318)摘要:锂电池组的健康状态(SOH:State of Health)是电池寿命预测中最重要的参数㊂由于电池组内部单体电池的相互影响,使电池组SOH 难以准确预测㊂因此,采取了一种基于门控循环单元(GRU:Gated Recurrent Unit)的锂电池组SOH 的预测模型,在不同连接结构下,使用充电周期序列㊁电池容量序列和电池温度序列单体电池和电池组指标预测电池组的健康状态㊂研究结果表明,在串联和并联连接方式下,使用单体电池指标的预测曲线可以更好地体现电池的退化过程,预测结果优于使用电池组指标的预测曲线,具有较低的预测误差㊂关键词:健康状态;门控循环单元;电池容量;电池温度中图分类号:TM912文献标识码:AResearch on Health State Prediction of Lithium Battery Pack Based on GRUCAO Guanghua,ZHAO Zhonglin,XU Yunhao(College of Electrical Engineering and Information,Northeast Petroleum University,Daqing 163318,China)Abstract :The most important parameter in the life prediction of lithium battery is SOH(State Of Health).Due to the interaction between individual cells in the battery pack,it is difficult to accurately predict the SOH of battery pack.Therefore,we propose a prediction model for SOH of lithium battery pack based on GRU(Gating Recurrent Unit).Under different connection structures,charge cycle series,battery capacity series and battery temperature series are used to predict the health status of battery pack.The results show that in series and parallel connection mode,the prediction curves of single battery index show better degradation process of batteries,the prediction result is better than that of battery pack index and has lower pridiction error.Key words :state of health;gated recurrent unit;battery capacity;battery temperature0 引 言近年来,新能源汽车逐渐兴起,锂电池因其具有寿命长㊁污染低㊁成本低廉等优点被作为常用的动力来源㊂由于锂电池在反复充放电过程中其性能和容量都会发生衰退[1],当下降到一定阈值时将会更加明显㊂因此,对电池组的健康状态进行准确预测是电池组稳定运行的重要保障[2]㊂目前,国内外提出的电池健康状态预测方法主要可分为两类:基于模型法和数据驱动法[3]㊂基于模型的方法主要有电化学分析法和等效电路模型(ECM:Equivalent Circuit Model)分析法[4]㊂电化学分析法是依据物质的电化学基本性质㊁原理以及变化,并结合滤波器或观测器进行定性处理和分析的方法[5]㊂徐超等[6]利用观测得到的SOH(State Of Health)指标进行模型的映射,使用萤火虫优化和粒子滤波相结合建立退化状态转移方程,通过测量方程描述指标与SOH 之间的映射关系,预测锂电池组的SOH㊂相比之下,等效电路模型分析法将复杂的机理进行等效变换,使其保持相同的作用㊂由于后者结构相对简单,因而得到了广泛应用[7]㊂任璞等[8]对锂电池组构建二阶RC等效电路模型,从内阻和容量方面分析SOH的变化趋势,构建离散状态空间方程,通过参数辨识,导入拟合方程,评估锂电池组的健康状态㊂由于不同的模型结构会影响预测指标的精度,因此,等效电路模型法的适应性较差㊂基于数据驱动的方法,根据锂电池内部的化学反应演变[9],不需要考虑其内部化学反应机理,根据测量数据即可预测锂电池组的SOH,成为当前研究锂电池SOH预测的热点技术㊂王宇胜等[10]使用长短期记忆网络(LSTM:Long Short⁃Term Memory)捕捉容量和电压数据随时间变化的依赖关系,与支持向量回归(SVR: Support Vector Regression)相结合算法对锂电池组的SOH进行估计,得到了较好的预测精度㊂在以往的研究中,电池组的指标是预测锂电池SOH时广泛被选取的指标,而通常电池组是由多个单体电池通过串联和并联等方式连接的㊂笔者通过研究单体电池间的相互作用对电池组的影响,同时将环境温度作为输入辅助预测锂电池的SOH,从而改善电池组的SOH预测精度㊂在不同连接结构下,使用深度学习门控循环单元挖掘每个充电周期下单体电池之间的相互关系,保留SOH数据随时间变化特征进行预测㊂预测结果与只使用电池组指标预测结果进行对比,通过数据曲线描述退化过程,同时使用相对误差分析SOH预测精度,证明其可行性㊂1 锂电池的健康参数锂电池的荷电状态(SOC:State Of Charge)[11]是电池均衡工作的重要依据㊂由于锂电池SOC是非线性的,通常使用安时积分法[12],根据时间㊁电流和温度等外部特征,通过对时间和电流进行积分,计算流入和流出电池的总电量,通过电量表示容量,进而估算锂电池的SOH㊂电池的当前容量Q可表示为Q=∫t0KI d(t)(1)其中I为放电电流,K为常数,K=k tη,k t为温度修正系数,η为充放电效率指数㊂可见,在每个周期序列,电池温度和环境温度对容量有很大影响,使用相关温度辅助预测SOH有重要意义㊂在周期性的充放电过程中,电池额定容量会降低㊂这里取锂电池衰减容量阈值为额定容量的80%,使用电池容量损失L 表达电池的SOH,Q0为初始容量,则电池的SOH表示为L=Q Q0×100%(2)2 基于门控循环单元的预测模型在深度学习中,通常使用循环神经网络(RNN:Recurrent Neural Networks)[13]处理序列问题㊂RNN 如图1所示,输入x0向量到A中,RNN会更新状态向量h0,同时将此刻的状态信息h0与第2个输入x1输入到A中,这样h1包含了第1个和第2个输出的信息㊂参数A只有一个,A随机初始化,用训练数据学习A,将A优化成最佳值㊂总体来说,RNN当前的输入是由上一个状态和当前输入决定的,这就使网络拥有了记忆功能㊂RNN在训练过程遵循梯度下降原则,拟合真实值和预测值之间的差值,从而达到最优损失值㊂在反向传播过程中,RNN会出现梯度消失现象,并且无法解决网络长依赖的问题[14]㊂假如时间序列很长,标准RNN很难将前面的信息传递到最后,可能会漏掉开始时最重要的信息㊂RNN的另一种变体门控循环单元(GRU:Gated Recurrent Unit)[15]的出现很好地解决了上述问题㊂其使用门控机制控制输入信息和记忆信息,并在当前时间状态下给出预测信息㊂GRU通过两个门控制神经网络的输出,能长时间保存时间序列信息,不会随时间推移和预测结果不同而被丢弃㊂GRU模型如图2所示㊂GRU两个门分别是重置门和更新门,表达式如下r t=σ(W r㊃[h t-1,x t]+b r)(3)z t=σ(W z㊃[h t-1,x t]+b r)(4)其中x t为当前时刻输入,h t-1为上一时刻的隐藏状态,σ为Sigmoid激活函数,W为当前权重矩阵,b r为偏置参数㊂Sigmoid激活函数将重置门和更新门的值域转换为(0,1)区间内㊂候选隐藏状态281吉林大学学报(信息科学版)第40卷h t 1=tanh(W ㊃[r t h t -1,x t ]+b n )(5)其中tanh 为激活函数,W 为当前的权重矩阵,b n 为偏置参数㊂重置门r t 和上一个隐藏状态按元素乘积,如果r t 为0,则上一个隐藏状态被丢弃,仅使用当前的输入㊂ 图1 循环神经网络示意图 图2 GRU 模型结构图 Fig.1 Schematic diagram of RNN Fig.2 GRU model structure diagram图3 基于GRU 的锂电池组健康 状态预测模型示意图Fig.3 Schematic diagram of health state prediction model of lithium battery pack based on GRU 如果r t =1,上一时刻的隐含状态将被保留同时作为输入㊂最后通过tanh 激活函数将值域转换为(-1,1)区间范围内㊂最后隐藏状态h t =(1-z t )h t -1+z t h t 1(6)更新门z t 控制过去隐藏状态和当前候选隐藏状态信息的组合,当z t =1时,当前隐藏状态被丢弃,过去的隐藏状态通过时间的保存传递到当前时刻㊂因此门控循环机制很好地解决了梯度消失现象,同时能更好地捕捉时间序列数据中间隔较大的相互依存关系㊂所以选用GRU 模型挖掘电池单体间复杂的相互关系,同时经过dropout 层降低网络复杂度,最后使用全连接层将维度变换,保存有用的信息,构建出完整的预测模型㊂基于GRU 的锂电池组健康状态预测模型如图3所示㊂3 实验与分析3.1 实验数据(退化信息)获取针对不同的连接结构,在串联㊁并联电池连接下,采用18650型锂离子电池,采集350个周期下充放电运行数据㊂18650锂离子电池容量大,寿命长,稳定性好,普遍作为电动汽车㊁电子产品等产品动力能源㊂数据的采集使用新威电池检测系统与计算机相连接㊂在室温下,采集每个周期下电池组的充放电状态下的容量数据,同时采集电池的实时温度作为电池SOH 预测指标㊂为模拟真实环境,使用传感器采集周围环境温度对电池的影响㊂以单体电池串联预测为例,前5行数据处理后的SOH 指标数值如表1所示㊂表1 SOH 预测指标Tab.1 SOH prediction index周期电池1容量/(mA㊃h)电池2容量/(mA㊃h)电池组容量/(mA㊃h)电池1温度/℃电池2温度/℃环境温度/℃11996.3101998.3602056.55026.42126.39621.14521994.1561996.4912056.97021.15827.35720.66931995.4801996.8942045.53225.52727.43320.86241998.6311998.6812053.92124.30425.47019.85651993.2381994.0952053.52225.72226.56620.608381第2期曹广华,等:基于GRU 的锂电池组健康状态预测研究3.2 模型的输入与输出该实验仿真处理基于CPU (Inter core i5⁃104002.9GHz)㊁GPU (NVIDIA GeForce RTX20606GByte)㊁Windows 操作系统和Anaconda 下Jupyter Notebook 环境㊂通过电池组指标进行预测时,使用周期序列和环境温度序列作为输入,GRU 模型进行训练和超参数调整,输出电池组的SOH 预测数据㊂使用单体电池进行预测时,第1个单体电池SOH 数据使用周期序列和电池温度序列作为输入,用神经网络表示内部交互关系,输出为第1个单体电池SOH 数据㊂第2个单体电池预测方法同样如此,在350个周期下,将训练集㊁验证集㊁测试集按7∶2∶1的比例划分,数据正则化操作后,训练集维度为(245,1,2),验证集维度为(70,1,2),测试集维度为(35,1,2),经模型训练㊁参数调整后,输出得到第1个单体电池及其SOH 数据,将周期序列和环境温度序列同时作为输入,辅助预测电池组SOH,经过GRU 模型训练和参数调整后,得到电池组的预测数据㊂同时进行交叉验证,每次预测后,将训练集和验证集重新划分,得到新的电池组预测数据㊂基于单体电池的电池组SOH 预测流程图如图4所示㊂图4 单体电池SOH 预测流程图Fig.4 Flow chart of SOH prediction for single cell 3.3 超参数解决办法模型训练过程中,需要对超参数进行优化,选用relu 激活函数,其计算简单,收敛速度快㊂在回归问题中,使用均方误差(MSE:Mean Squared Error)损失函数求解模型,MSE 公式为γ=∑n i =1(y i -y ′i )2n (7)其中y i 为神经网络的训练值,y ′i 为神经网络的预测值,γ为两者之间的均方差㊂同时使用均方根误差(RMSE:Root Mean Squared Error)[16]为超参数调整的指标,评价预测值和真实值在训练集和验证集之间的差值㊂标准的梯度下降算法计算步骤较多,上下波动很大,速度慢,无法使用大的学习率㊂Adam 优化算法运行速度快于标准梯度下降算法,通过参数在某一方向震荡幅度调整该方向的学习率和梯度下降的步长,进而降低震荡幅度,寻找到梯度下降方向的最优值㊂同时在训练过程中,使用dropout 算法将隐藏层神经单元按照指定的概率随机丢弃,降低了网络的复杂程度,使模型训练更快㊂3.4 预测指标分析在串联和并联结构下,分析单体电池和电池组容量序列数据同充放电周期之间的关系㊂单体电池和电池组容量随充放电周期的平滑散点图如图5㊁图6所示㊂从图5,图6中可以看出,容量和充放电周期之间呈线性关系㊂其中相关系数大于0.96,说明两者间存在强相关性㊂在一定次数的充放电周期条件后,串联和并联连接下锂电池的容量都会产生衰退,即曲线呈现出负相关性㊂481吉林大学学报(信息科学版)第40卷图5 串联电池容量和周期的关系Fig.5 Relationship between capacity and cycle of series batteries 图6 并联电池容量和周期的关系Fig.6 Relationship between capacity and cycle of parallel batteries 3.5 预测结果分析取10次交叉验证后30个周期SOH 的最优预测曲线,如图7所示㊂在串联和并联的连接结构下,分别使用GRU 模型和常用的LSTM 模型进行预测,可以看出两种模型下单体电池指标和电池组指标预测曲线均高于原始实验数据,说明模型给出较好的预测寿命㊂图7中原始实验数据出现了一定的波动,使用电池组指标进行SOH 预测的曲线相对平坦,无法描述电池组的动态衰退过程,使用单体电池预测方法能很好地表达出电池组的动态衰退信息㊂串联结构下使用LSTM 模型进行预测时,单体电池预测曲线在第345和348个数据点出现异常波动,在并联结构下出现同样的情况㊂GRU 模型很好地跟随了这些波动,因此选用GRU 模型预测结果更为精确㊂图7 SOH 预测Fig.7 SOH prediction 为进一步比较串联和并联下单体电池和电池组SOH 预测结果的准确性,使用相对误差(Relative Error)更能体现出测量结果的可信度㊂相对误差E r 表示如下E r =y′-y y ×100%(8)581第2期曹广华,等:基于GRU 的锂电池组健康状态预测研究其中y′为SOH 预测数据,y 为原始数据,在串联和并联方式下,GRU 模型预测的相对误差曲线如图8所示㊂图8 相对误差曲线Fig.8 Curve of relative error 从图8可以看出,在串联和并联方式下,因为电池组中单体电池之间的相互作用影响,使用电池组指标预测的误差均高于用电池单体指标预测的误差㊂说明单体电池指标预测更加符合原始数据,预测稳定性更高㊂其中串联方式下使用单体电池指标预测的最大相对误差为0.87%,与文献[17]相比,最大相对误差降低了0.15%,得到了更高的准确度㊂4 结 语笔者使用数据驱动的方法,采用神经网络表达单体电池内部交互关系,使用GRU 模型挖掘每个周期序列下单体电池之间的相互影响预测SOH㊂结果表明,在串联和并联的连接结构下,使用单体电池指标预测效果好于使用电池组指标预测效果,其相对误差较小,预测曲线更接近实际实验数据,很好地体现出了单体电池之间复杂的相互影响,证明了预测方法的有效性㊂本研究在已有的研究锂电池SOH 实时监测方法下,为更合理地选取电池预测指标提供了新思路㊂同时在其它新型电池SOH 预测的适用性上还需进一步研究验证㊂参考文献:[1]SCHMIDT A P,BITZER M,ÁRPÁD W IMRE,et al.Model⁃Based Distinction and Quantification of Capacity Loss and RateCapability Fade in Li⁃Ion Batteries [J].Journal of Power Sources,2010,195(22):7634⁃7638.[2]刘大同,宋宇晨,武巍.锂离子电池组健康状态估计综述[J].仪器仪表学报,2020,41(11):1⁃18.LIU Datong,SONG Yuchen,WU Wei.Review of State of Health Estimation for Lithium⁃ion Battery Pack [J].ChineseJournal of Scientific Instrument,2020,41(11):1⁃18.[3]杨胜杰,罗冰洋,王菁.基于容量增量曲线峰值区间特征参数的锂离子电池健康状态估算[J].电工技术学报,2021,36(11):2277⁃2287.YANG Shengjie,LUO Bingyang,WANG Jing.Health State Estimation of Lithium⁃Ion Battery Based on Characteristic Parameters of Peak Range of Capacity Increment Curve [J].Journal of Electrotechnics,2021,36(11):2277⁃2287.[4]陈翌,白云飞,何瑛.数据驱动的锂电池健康状态估算方法比较[J].储能科学与技术,2019,8(6):1204⁃1210.CHEN Yi,BAI Yunfei,HE parison of Data⁃Driven Lithium Battery State of Health Estimation Methods [J].Energy Storage Science and Technology,2019,8(6):1204⁃1210.[5]张少宇,伍春晖,熊文渊.采用门控循环神经网络估计锂离子电池健康状态[J].红外与激光工程,2021,50(2):236⁃243.ZHANG Shaoyu,WU Chunhui,XIONG Wenyuan.State of Health Estimation for Lithium⁃Ion Batteries Using Recurrent Neural Networks with Gated Recurrent Unit [J].Infrared and Laser Engineering,2021,50(2):236⁃243.[6]徐超,李立伟,杨玉新.基于改进粒子滤波的锂离子电池健康状态估计[J].汽车技术,2020(12):19⁃24.XU Chao,LI Liwei,YANG Yuxin.State of Health Estimation of Lithium⁃Ion Battery Based on Improved Particle Filter [J].Automobile Technology,2020(12):19⁃24.681吉林大学学报(信息科学版)第40卷[7]王萍,张吉昂,程泽.基于最小二乘支持向量机误差补偿模型的锂离子电池健康状态估计方法[J /OL].电网技术:1⁃11.[2021⁃11⁃06].https:∥ /10.13335/j.1000⁃3673.pst.2021.0045.WANG Ping,ZHANG Jiang,CHENG Ze.State of Health Estimation of Li⁃Ion Battery Based on Least Squares Support Vector Machine Error Compensation Model [J /OL].Power System Technology:1⁃11.[2021⁃11⁃06].https:// /10.13335/j.1000⁃3673.pst.2021.0045.[8]任璞,王顺利,何明芳.基于内阻增加和容量衰减双重标定的锂电池健康状态评估[J].储能科学与技术,2021,10(2):738⁃743.REN Pu,WANG Shunli,HE Mingfang.State of Health Estimation of Li⁃Ion Battery Based on Dual Calibration of Internal Resistance Increasing and Capacity Fading [J].Energy Storage Science and Technology,2021,10(2):738⁃743.[9]LYU Z,GAO R,LI X.A Partial Charging Curve⁃Based Data⁃Fusion⁃Model Method for Capacity Estimation of Li⁃Ion Battery[J].Journal of Power Sources,2021,483:229131.[10]王宇胜,陈德旺,蔡俊鹏.基于LSTM⁃SVR 的锂电池健康状态预测研究[J].电源技术,2020,44(12):1784⁃1787.WANG Yusheng,CHEN Dewang,CAI Junpeng.Research on Lithium Battery State of Health Prediction Based on LSTM⁃SVR [J].Power Sources,2020,44(12):1784⁃1787.[11]HU Xiaosong,SUN Fengchun,ZOU Yuan.Estimation of State of Charge of a Lithium⁃Ion Battery Pack for Electric VehiclesUsing an Adaptive Luenberger Observer [J].Energies,2010,3(9):1586⁃1603.[12]刘志豪.锂电池荷电状态在线估计优化方法[J].有色设备,2020,34(5):13⁃15.LIU Zhihao.Optimization Method for On⁃Line State of Charge Estimation of Lithium Battery [J].Colored Equipment,2020,34(5):13⁃15.[13]ALEX GRAVES,ABDEL⁃RAHMAN MOHAMED,GEOFFREY E HINTON.Speech Recognition with Deep Recurrent NeuralNetworks [DB /OL].(2013⁃10⁃21).[2021⁃04⁃15].https:// /document /6638947/citations#citations.[14]张思原,卢忝余,曾辉.基于LSTM 的核电传感器多特征融合多步状态预测[J].核动力工程,2021,42(4):208⁃213.ZHANG Siyuan,LU Tianyu,ZENG Hui.Multi⁃Feature Fusion Multi⁃Step State Prediction of Nuclear Power Sensor Based on LSTM [J].Nuclear Power Engineering,2021,42(4):208⁃213.[15]刘慧婷,李建军.GRU⁃CNN 优化模型的手势动作识别研究[J].小型微型计算机系统,2021,42(10):2121⁃2124.LIU Huiting,LI Jianjun.Research on Gesture Recognition Based on GRU⁃CNN Optimization Model [J].Minicomputer System,2021,42(10):2121⁃2124.[16]杨秋菊.基于CPSO⁃RBF 神经网络算法的预测控制方法研究[J].贵阳学院学报(自然科学版),2021,16(3):13⁃17.YANG Qiuju.Research on Predictive Control Method Based on CPSO⁃RBF Neural Network Algorithm [J].Journal of Guiyang University (Natural Sciences),2021,16(3):13⁃17.[17]李鹏,李立伟,杨玉新.基于IBOA⁃PF 的锂电池健康状态预测[J].储能科学与技术,2021,10(2):705⁃713.LI Peng,LI Liwei,YANG Yuxin.Estimation of Lithium⁃Ion Battery State of Health Based on IBOA⁃PF [J].Energy StorageScience and Technology,2021,10(2):705⁃713.(责任编辑:刘俏亮)781第2期曹广华,等:基于GRU 的锂电池组健康状态预测研究。
基于融合自注意力机制的GRU_边坡预测算法研究

捉序列中的长期依赖关系,引入了自注意机制,以增
强模型的关注能力;通过训练和优化模型,使用历史
数据来学习边坡的演化规律,并预测未来边坡的状
态;通过与实际观测数据的比较,评估了模型的预测
性能。 实验结果表明,融合自注意机制的 GRU 边坡
预测算法在边9 期
2023 年 10 月
无线互联科技
Wireless Internet Science and Technology
No. 19
October,2023
基于融合自注意力机制的 GRU 边坡预测算法研究
贾学明,黄 河,毛友平 ∗ ,周 伟
( 招商局重庆交通科研设计院有限公司,重庆 404100)
(1) 对边坡监测历史数据进行预处理,从而降低数据集中的随机噪声,同时去除由设备问题产生的重
复数据;(2) 为了捕捉序列中的长期依赖关系,构建基于 GRU 的循环神经网络模型,并引入自注意机
制以增强模型的关注能力。 (3) 将 LSTM、GRU 和 SA - GRU 3 种网络得到预测结果进行对比,发现融
态和输出中,以增强模型对序列数据的建模能力和
表征能力。 融合自注意力机制的 GRU 预测模型如
图 2 所示。
图 2 融合自注意力机制的 GRU 预测模型
2 实验验证
2. 1 实验环境
本实验采用 Python3. 8 进行编程,Pytorch 作为模
型基本框架实现,学习率为 0. 001,优化器选择 Adam,
产生异常跳变数据。 在正常情况下,设备的采样间隔
为每 1 h 采集 1 个样本点,但是在实际的工程应用中,
由于设备及通信环境的不稳定性,导致设备在很短的
基于ISSA-GRU_的混凝土抗压强度预测

第42卷第7期2023年7月硅㊀酸㊀盐㊀通㊀报BULLETIN OF THE CHINESE CERAMIC SOCIETYVol.42㊀No.7July,2023基于ISSA-GRU的混凝土抗压强度预测段妹玲1,张㊀单2,袁锦虎3,孙爱军4,强㊀晟1(1.河海大学水利水电学院,南京㊀210098;2.中国电建集团华东勘测设计研究院有限公司,杭州㊀311122;3.江西省鄱阳湖水利枢纽建设办公室,南昌㊀330046;4.余姚市水利局,宁波㊀315402)摘要:考虑到抗压强度对混凝土设计的重要影响,本文提出了改进麻雀搜索算法(ISSA)和门控循环单元(GRU)结合的ISSA-GRU预测模型,实现对高性能混凝土抗压强度的精准预测㊂对收集的数据集进行归一化处理后,利用基于光谱-理化值共生距离(SPXY)法对数据集进行训练集和测试集划分,采用GRU对高性能混凝土抗压强度进行回归预测,并通过引入动态惯性权重的ISSA,加强对GRU网络参数的寻优效率㊂结果表明,在使用相同数据样本的情况下,将ISSA-GRU模型与长短期记忆(LSTM)网络㊁核极限学习机(KELM)和支持向量回归(SVR)模型进行比较,其均方根误差RMSE分别降低了9.3%㊁37.5%㊁33.5%,平均绝对误差MAE分别降低了13.5%㊁38.5%㊁41.7%㊂同时,研究了训练集数据量和输入变量对模型预测性能的影响,研究结果表明,所提出的模型能高效寻找超参数,具有较高的预测精度和较好的适应性,为多样化原材料和混凝土特定性能的发展提供可行参考㊂关键词:高性能混凝土;门控循环单元;动态惯性权重;麻雀搜索算法;深度学习;强度预测中图分类号:TU528.01㊀㊀文献标志码:A㊀㊀文章编号:1001-1625(2023)07-2392-09 Prediction of Compressive Strength of Concrete Based on ISSA-GRU DUAN Meiling1,ZHANG Dan2,YUAN Jinhu3,SUN Aijun4,QIANG Sheng1(1.College of Water Resources and Hydropower,Hohai University,Nanjing210098,China;2.Power China Huadong Engineering Corporation Limited,Hangzhou311122,China;3.Jiangxi Poyang Lake Water Conservancy Project Construction Office,Nanchang330046,China;4.Yuyao Water Resources Bureau,Ningbo315402,China)Abstract:Considering the important influence of compressive strength on concrete design,an ISSA-GRU prediction model combining improved sparrow search algorithm(ISSA)and gate recurrent unit(GRU)was proposed to achieve accurate prediction of compressive strength of high-performance concrete.After normalizing the collected data set,the data set was divided into training set and testing set based on spectral-physicochemical value symbiotic distance(SPXY)method,GRU was used to predict the compressive strength of high-performance concrete,and enhances optimization efficiency of GRU network parameters by introducing ISSA with dynamic inertia weight.The results show that,in the case of using same data samples,the ISSA-GRU model is compared with the long short-term memory network(LSTM),kernel extreme learning machine(KELM)and support vector regression(SVR)models.The root mean square error(RMSE)is reduced by 9.3%,37.5%,and33.5%,respectively,and the mean absolute error(MAE)is reduced by13.5%,38.5%,and 41.7%,respectively.At the same time,the influences of the amount of training set data and input variables on prediction performance of the model were studied.The results show that the proposed model is efficient in finding GRU parameters, has high prediction accuracy and good adaptability,and provides a feasible reference for the development of diverse raw materials and specific properties of concrete.Key words:high-performance concrete;gate recurrent unit;dynamic inertia weight;sparrow search algorithm;deep learning;strength prediction收稿日期:2023-03-28;修订日期:2023-05-25基金项目:国家自然科学基金(52079049);宁波市水利科技项目(NSKA202343)作者简介:段妹玲(1999 ),女,硕士研究生㊂主要从事水工结构工程的研究㊂E-mail:1836488646@通信作者:强㊀晟,博士,教授㊂E-mail:sqiang2118@第7期段妹玲等:基于ISSA-GRU的混凝土抗压强度预测2393㊀0㊀引㊀言混凝土是当今必不可少的建筑材料之一[1]㊂现如今,结构工程对于混凝土力学性能的提升具有迫切需求,其中抗压强度是最重要的指标之一,它直接关系到结构的安全,因此,如何快速确定混凝土的抗压强度对工程建设与运行的影响至关重要[2-3]㊂目前,混凝土抗压强度的获取方法主要有回弹法[4]㊁钻芯法[5]和模型预测法[6]等㊂回弹法操作简便,但是对于同种混凝土,采用不同回弹仪时会有较大的差异,不能准确地估计混凝土的内部强度;钻芯法的均值较为精确,但是标准差偏大,试验耗时且结果不稳定;模型预测法是通过建立材料配合比㊁龄期与混凝土抗压强度的数学模型进行预测,但是由于各因素与抗压强度并非简单的线性关系,直接建立显式的数学模型比较困难㊂因此,亟需一种快速㊁准确㊁可靠的混凝土抗压强度预测方法[7]㊂近年来,国内外学者针对混凝土抗压强度预测模型进行了大量的探索,其中统计方法和机器学习方法已被广泛应用[8]㊂许开成等[9]利用SPSS统计分析软件,通过逐步回归分析法和多元非线性回归分析法建立了锂渣混凝土强度预测模型,但该模型只有在使用P㊃O42.5级普通硅酸盐水泥时才有效㊂陈洪根等[10]考虑不同配合比与强度的非线性结构关系,利用误差反向传播(error back propagation training,BP)神经网络预测粉煤灰混凝土的抗压强度,然而,在分析时未综合考虑龄期对混凝土抗压强度的影响㊂如今,将深度学习算法应用于混凝土领域已成为当前研究热点㊂高蔚[11]采用卷积神经网络预测了再生混凝土的抗压强度,与传统神经网络模型相比,卷积神经网络模型具有高精度和高泛化性能的优点㊂Chen等[12]利用长短期记忆(long short-term memory,LSTM)网络模型评估了在一定配合比下高强混凝土抗压强度,证明LSTM能很好捕捉原材料的不同配合比与混凝土抗压强度的非线性关系㊂门控循环单元(gate recurrent unit,GRU)是LSTM网络的改进形式,不仅在预测中考虑了时间序列,还通过引入门机制有效解决了记忆网络中易引发梯度爆炸的问题,使得该模型具有结构更简单㊁计算效率更高的明显优势㊂因此,本研究采用GRU模型作为混凝土抗压强度预测的主体模型㊂对于混凝土抗压强度的预测主体模型中参数的选择,张静等[13]利用混沌灰狼群算法优化了最小二乘支持向量机(least squares support vector machines,LSSVM)的混凝土强度预测模型,提高了机器学习算法在实际应用的泛化性能和稳定性,但训练集与测试集的任意选取降低了预测模型的泛化性能㊂Rankbar等[14]结合卷积神经网络与遗传算法对高性能混凝土的抗压强度进行预测,通过10折交叉验证了所提出方法的可靠性㊂鉴于此,本研究采用改进麻雀搜索算法优化门控循环单元神经网络(ISSA-GRU)的高性能混凝土抗压强度预测优化模型㊂利用光谱-理化值共生距离(SPXY)抽样方法综合考虑输入变量与输出变量的差异性,合理划分ISSA-GRU模型训练和测试样本集;采用引入动态惯性权重的麻雀搜索算法综合全局搜索与局部搜索,优化GRU模型的units㊁batch_size㊁epochs参数以提高预测精度;通过对比LSTM㊁核极限学习机(kernel extreme learning machine,KELM)和支持向量回归(support vector regression,SVR)模型预测结果,验证ISSA-GRU预测模型的有效性;最后,分析训练集数据量和输入变量对预测模型的影响㊂1㊀基本原理1.1㊀SPXY划分样本集不同于将所有训练数据统一看待而随机选取样本训练集的传统方法,SPXY样本划分方法依据数据间的欧式距离来构建样本训练集,这避免了因样本随机划分而降低模型本身预测性能的影响,计算式如式(1)~(3)所示㊂d xy(p,q)=d x(p,q)max d x(p,q)+d y(p,q)max d y(p,q);p,qɪ[1,N](1)d x(p,q)=ðN j=1[x p(j)-x q(j)]2(2)d y(p,q)=y p-y q(3)式中:N为数据样本集的样本总数;x p㊁x q为样本数据值;y p㊁y q为样本标签值;d x(p,q)为样本p数据值与样本q数据值的欧氏距离;d y(p,q)为样本p标签值与样本q标签值的欧氏距离;d xy(p,q)为样本数据值与样本2394㊀水泥混凝土硅酸盐通报㊀㊀㊀㊀㊀㊀第42卷标签值的综合距离㊂算法的具体计算步骤详见文献[15-16]㊂1.2㊀门控循环单元(GRU )神经网络GRU 网络是LSTM 网络的改进形式,能有效解决梯度爆炸问题㊂GRU 网络通过巧妙地使用门结构来减少传统递归神经网络中的梯度消失现象,能更好地捕捉序列中的长期依赖性关系㊂核心思想是GRU 单元的门结构可以通过同时接收当前输入和输出的新信息,利用动态更新机制有效捕获记忆时间序列的长期历史信息和前一状态信息㊂与由遗忘门㊁输入门和输出门组成的LSTM 单元相比,GRU 单元仅使用重置门和更新门来调节信息流㊂因此,GRU 网络具有结构简单㊁参数少㊁计算效率高等优点[17-18]㊂GRU 模型计算式如式(4)~(7)所示㊂z t =σ(W z [h t -1,x t ]+b z )(4)r t =σ(W r [h t -1,x t ]+b r )(5)h ~t =tanh(W h [(h t -1∗r t ),x t ]+b h )(6)h t =(1-z t )∗h ~t +z t ∗h t -1(7)式中:∗为矩阵元素相乘;x t 为时间t 的输入;h t 为在时间t 的隐藏状态;h t -1为时间t -1的隐藏激活状态;h ~t 为存放当前时刻信息的记忆存储单元;z t 和r t 分别为更新门和重置门;σ和tanh 为激活函数;W z ㊁W r 和W h 为对应的权重系数矩阵;b z ㊁b r 和b h 为对应的偏置向量㊂1.3㊀改进麻雀搜索算法(ISSA )麻雀搜索算法(sparrow search algorithm,SSA)是通过模仿麻雀群体的搜索行为提出的方法[19]㊂根据麻雀群体中个体的健康状况,可以被分为发现者和追随者,此外,在麻雀种群中随机分配10%~20%的警备者,它们在群体觅食的过程中负责躲避捕食者㊂简而言之,麻雀群体可以通过不断更新位置来寻找更低风险的食物,其发现者㊁追随者和警备者的位置更新公式如(8)~(10)所示[20-22]㊂X t +1i ,j =X t i ,j ㊃exp -i α㊃T max (),if R 2<ST X t i ,j +Q ˑL ,if R 2>ST ìîíïïï(8)X t +1i ,j =Q ˑexp X t worst -X t i ,j i 2(),if i >m 2X t +1P +X t i ,j -X t +1PˑA +ˑL or ìîíïïï(9)X t +1i ,j =X t best +βˑX t i ,j -X t +1best ,if f i >f g X t i ,j +K ˑX t i ,j -X t best f i -f w ()+ε(),f i =f g ìîíïïï(10)式中:X t +1i ,j 为更新后的麻雀位置;t 为当前迭代次数;j 为所优化的参数维度;m 为麻雀种群中麻雀的总数;T max 为最大迭代次数;α为介于0和1之间的随机数;Q 为正态分布的随机数;L 为单位矩阵;X t i ,j 为第t 次迭代时维度为j 的第i 只麻雀的位置;R 2和ST 分别为警备值和安全值;X worst 为当前的全局最差位置;X P 为当前发现者最优位置;A 为每个元素随机赋值1或-1的矩阵,A +为伪逆矩阵,A T 为转置矩阵,且A +=A T (AA T )-1;X best 为当前麻雀的最优位置;β为正态分布的随机数;K ɪ[-1,1]并且随机产生;f i 为当前麻雀个体的适应度值;f w 和f g 分别为当前全局最优和最差的适应度值;ε为极小的常数,取0.0001,用来防止分母为0㊂与其他元启发算法相同,如何平衡算法的全局搜索能力和局部搜索能力一直是算法工程师关注的重点问题[23]㊂麻雀种群中的发现者负责引领整个种群并确定觅食方向,进而影响算法的最终寻优效果㊂为了适应算法在不同阶段的需要,引入动态惯性权重w ㊂在迭代计算的早期,w 的值较大,全局搜索效果越好;在迭代计算的后期,w 自适应减小,使得局部搜索效果更好,也使得算法收敛速度更快㊂w 的计算公式如式(11)所示,改进的发现者更新方法如式(12)所示㊂w =1.5-t T max ()1t (11)第7期段妹玲等:基于ISSA-GRU 的混凝土抗压强度预测2395㊀X t +1i ,j=w ㊃X t i ,j ㊃exp -i α㊃T max (),if R 2<ST X t i ,j +Q ˑL ,if R 2>ST ìîíïïï(12)2㊀混凝土抗压强度预测模型2.1㊀数据源和数据预处理数据来源于UCI Machine Learning Database,该数据集由水泥㊁高炉矿渣㊁粉煤灰㊁水㊁高效减水剂㊁粗骨料㊁细骨料㊁龄期和混凝土抗压强度9种参数下的1030组实测数据值组成[24]㊂根据相关学者[25-27]的研究,混凝土的原材料和龄期对抗压强度有不同的影响,因此,不可直接忽略任一属性对混凝土抗压强度预测的影响㊂本研究采用的GRU 主体预测模型结构较简单,可以很好地考虑该数据集中所有原材料的配合比㊂在此,选择前8个参数作为模型的输入变量,第9个参数作为模型的输出变量,构建高性能混凝土抗压强度预测模型的初始指标体系㊂分别用X 1~X 8表示8个输入变量,Y 表示输出变量,现将反映数据分布情况的几个统计特征归纳至表1㊂Max㊁Min㊁Mean 和SD 分别表示数据的最大值㊁最小值㊁平均值和标准差㊂表1㊀原始数据统计特征Table 1㊀Statistical features of raw setVariable Max Min Mean SD Cement X 1/(kg㊃m -3)540.0102.0281.2104.5Blast furnace slag X 2/(kg㊃m-3)359.4073.986.3Fly ash X 3/(kg㊃m -3)200.1054.264.0Water X 4/(kg㊃m -3)247.0121.8181.621.4Superplasticizer X 5/(kg㊃m -3)32.20 6.2 6.0Coarse aggregate X 6/(kg㊃m -3)1145.0801.0972.977.8Fine aggregate X 7/(kg㊃m -3)992.6594.0773.680.2Age X 8/d 365.0 1.045.763.2Compressive strength Y /MPa 82.6 2.335.816.7图1㊀原始数据的归一化结果Fig.1㊀Normalization results of raw data 从表1中可以明显看出各个变量之间数值差异较大,未缩放的输入变量和输出变量可能导致缓慢或不稳定的训练过程㊂因此,采用式(13)对原始数据进行归一化处理,处理后的数值皆在0~1,归一化结果如图1所示㊂由图1可知,归一化处理不仅消除了龄期所具备的量纲与其他输入变量所具备的量纲之间的差异性影响,还避免了由各变量值域差异引起的训练过程仅受单个输入变量控制的情况㊂x norm =x i -x min x max -x min (13)式中:x norm 为第i 个数据变量归一化后的值;x i 为第i个数据变量的原始值;x max 和x min 分别为第i 个数据变量的最大值和最小值㊂2.2㊀ISSA-GRU 模型预测混凝土抗压强度流程由于GRU 主体预测模型中的units㊁batch_size㊁epochs 是影响GRU 拟合精度的关键参数,为了避免参数估计带来的偏差,采用ISSA 同时优化这3个参数,实现对混凝土抗压强度的精准预测㊂对收集数据集进行分析和整理,并且考虑样本划分方式,ISSA-GRU 模型预测混凝土抗压强度的具体实施步骤如下:1)数据预处理㊂根据混凝土实际性能发展原理分析收集数据的可用性,合理选择输入变量和输出变量㊂采用SPXY 样本集划分方法,将归一化后的所有数据样本按一定比例划分为训练集和测试集㊂使用训练集对建立的预测模型进行训练后,代入测试集数据可得到混凝土抗压强度预测值㊂2396㊀水泥混凝土硅酸盐通报㊀㊀㊀㊀㊀㊀第42卷2)ISSA-GRU 算法终止条件㊂初始化ISSA 算法中的麻雀种群信息,设置GRU 算法来优化参数的范围和ISSA 算法的最大迭代次数㊂设定适应度函数值ɤ0.001或达到最大迭代次数作为算法的终止条件㊂图2㊀混凝土抗压强度预测模型流程图Fig.2㊀Flow chart of prediction model of concrete compressive strength 3)ISSA 优化算法㊂根据麻雀种群信息计算适应度值,标记当前最坏和最佳适应情况,并给出相应的位置信息㊂随后,根据适应度值对麻雀种群进行排序并分类,从种群中选择适应度较好的麻雀作为发现者,种群中的其他麻雀扮演追随者,种群中随机选取一部分麻雀作为警备者㊂根据引入动态惯性权重的式(12)更新发现者位置;根据式(9)更新追随者位置;根据式(10)更新警备者位置㊂一次迭代完成后,计算麻雀种群位置更新后的适应度值,其中,最小适应度值为局部最优适应度值㊂将局部最优适应度值与位置更新前的全局最优适应度值进行比较,取更小的适应度值作为位置更新后的全局最优适应度值,此时全局最优适应度值对应的超参数组即为最优超参数组㊂更新全局最优适应度值,并将最新确定的超参数组传递给GRU 模型㊂4)GRU 主体预测模型㊂判断是否满足步骤2中设定的终止条件,如不满足则返回步骤3;如满足则根据全局最优超参数组获取GRU 模型中units㊁batch _size 和epochs 的最佳值㊂最后,利用最佳模型参数建立GRU 预测模型㊂综上所述,基于ISSA-GRU 的混凝土抗压强度预测模型流程如图2所示㊂2.3㊀模型评价指标为评估ISSA-GRU 模型的拟合预测性能,使用广泛的评估指标来评估模型以确定最佳模型,在分析时采用如式(14)~(16)的具体评价指标[28-29]㊂所采用的各评价指标具有以下趋势时说明模型具有更优预测性能:决定系数R 2值越接近1;均方根误差(root mean square error,RMSE)越小;平均绝对误差(mean absolute error,MAE)越小㊂R 2=1-ðn i =1(y obs -y pred )2ðni =1(y obs -y -obs )2(14)RMSE =ðn i =1(y obs -y pred )2n (15)MAE =ðn i =1y pred -y obs n(16)式中:y obs 为抗压强度实测值;y -obs 为抗压强度实测值的平均值;y pred 为抗压强度预测值;n 为样本总数㊂3㊀预测结果及分析3.1㊀数据划分与模型建立为测试SPXY 划分数据样本训练集和测试集的性能,参考Feng 等[30]研究,将原始数据样本集按9-1划第7期段妹玲等:基于ISSA-GRU 的混凝土抗压强度预测2397㊀分为训练集和测试集,同时与随机抽样(random sampling,RS)方法进行对比分析㊂样本集中9个变量的量纲不完全相同且测量尺度具有较大差异,故采用变异系数对数据进行比较,SPXY 与RS 两种数据样本划分方法得到的变异系数结果如图3所示㊂图3㊀SPXY 和RS 划分样本的变异系数Fig.3㊀Coefficient of variation of SPXY and RS divided samples 从图3(a)可以看出,利用SPXY 和RS 两种方法划分数据样本,得到的训练集变异系数与原始数据变异系数都呈现较好的一致性,表明两种方法皆具较强的针对遵循变量原始数据分布特征的训练集数据筛选的能力,使训练模型更具代表性㊂分别代表高炉矿渣㊁粉煤灰㊁高效减水剂和龄期的变量X 2㊁X 3㊁X 5和X 8变异系数均超过了50%,说明这些变量数据的离散性较大㊂同时,结合图1可以看出,产生较大变异系数的原因主要有两种:一是高炉矿渣㊁粉煤灰和高效减水剂具有较多值为零的数据;二是龄期具有阶段划分的特征㊂从图3(b)可以看出,在SPXY 方法划分得到的测试集结果中,高炉矿渣㊁粉煤灰㊁高效减水剂和龄期的变异系数较RS 法分别降低了22.03%㊁2.93%㊁37.87%和52.92%,表明SPXY 具有更强的测试集数据选取能力,能自发地避免由混凝土抗压强度及其原材料因素带来的变量数值异常性影响㊂现分别利用SPXY 和RS 数据样本划分方法,使用本研究提出的ISSA-GRU 模型对混凝土抗压强度进行预测,输出结果表现为:训练集RMSE 分别为2.89%和3.28%;测试集RMSE 分别为3.60%和4.44%;训练集MAE 分别为2.04%和2.29%;测试集MAE 分别为2.70%和3.13%㊂涉及两种样本集划分方法中更直观的ISSA-GRU模型预测图4㊀SPXY 与RS 划分样本的模型误差Fig.4㊀Model error between SPXY and RS 精度结果如图4所示㊂从图4中可以明显看出,与RS 划分数据样本集相比,将SPXY 方法划分的训练集和测试集数据代入预测模型均会得到更小的RMSE 和MAE 值,说明采用SPXY 方法划分样本集对混凝土抗压强度数据预测具有更强的适应性,具备更高的预测精度㊂从图4中可以发现,测试集数据对应的RMSE 和MAE 值均大于训练集,与实际相符㊂因为预测模型是针对训练集数据特征对提出模型进行训练的结果,所以测试集数据下的RMSE 和MAE 值应均大于训练集,否则将表现为弱化训练集数据及过拟合现象㊂因此,通过将变量间距离加以考虑并为样本空间赋权的SPXY 样本划分方法,能高效覆盖变量的各个空间,智能表征变量分布特征,在混凝土抗压强度预测模型的稳定性与预测精度方面表现优异㊂3.2㊀模型对比分析ISSA-GRU 模型针对测试集数据得到的混凝土抗压强度预测值与实测值对比结果如图5所示㊂其中,中2398㊀水泥混凝土硅酸盐通报㊀㊀㊀㊀㊀㊀第42卷图5㊀ISSA-GRU 模型抗压强度预测值与实测值Fig.5㊀Prediction values versus real values under ISSA-GRU 心线代表抗压强度预测值等于实测值,即测试集数据点越接近中心线,预测精度越高㊂从图5可以看到数据点大致分布在中心线两侧,且无明显离群点,表明ISSA-GRU 模型的预测强度值与实测强度值接近,模型的整体拟合预测结果较好㊂同时,从图5中观察测试集数据的相对误差可以发现,当混凝土抗压强度值较小时,预测结果的相对误差较大,最大相对误差接近35%;当混凝土抗压强度值较大时,预测结果的相对误差较小,且当强度值大于25MPa 之后时,预测结果的相对误差在20%之内,这与早期混凝土的强度增长不稳定有关,符合预期㊂为评估ISSA-GRU 模型对于混凝土抗压强度预测能力的优越性,采用相同数据集,选择LSTM㊁KELM㊁SVR 三种模型与本研究所提出的模型进行对比分析㊂各模型的预测性能指标如表2所示㊂表2㊀模型预测性能指标Table 2㊀Performance criteria values of models MethodTraining set Testing set RMSE MAE R 2RMSE MAE R 2ISSA-GRU 2.89 2.040.98 3.60 2.700.98LSTM3.17 2.370.98 3.97 3.120.97KELM 5.414.020.955.76 4.390.95SVR 4.93 4.160.95 5.41 4.630.95从表2结果可以看出,与LSTM㊁KELM㊁SVR 模型相比,本研究提出的ISSA-GRU 模型测试集R 2=0.98,具有最大的决定系数值,拟合优度好;同时,测试集RMSE 值分别降低了9.3%㊁37.5%㊁33.5%,测试集MAE值分别降低了13.5%㊁38.5%㊁41.7%,针对混凝土抗压强度预测具有最高的整体预测精度㊂3.3㊀模型性能分析为考虑数据训练集数据量对模型预测性能的影响,训练集数据量与测试集数据量分别选取为8.5-1.5㊁8-2㊁7.5-2.5和7-3,采用ISSA-GRU 模型对混凝土抗压强度进行预测,不同数据集划分比例下的预测性能指标如表3所示㊂表3㊀不同数据集划分比例下的预测性能指标Table 3㊀Prediction performance values under different data set divisionData setTraining set Testing set RMSE MAE R 2RMSE MAE R 28.5-1.5 3.01 2.180.98 3.75 2.950.978-23.11 2.220.98 3.96 2.920.977.5-2.5 3.17 2.260.984.07 2.990.977-3 3.79 2.770.97 4.38 3.380.97由表3可知,ISSA-GRU 模型在不同训练集数据量下,对应的测试集性能指标表现为:RMSE 最大值为4.38;MAE 最大值为3.38;R 2最小值为0.97,这表明在不同的训练集数据量下,ISSA-GRU 模型整体预测的误差均较小,具备较强的混凝土抗压强度预测能力㊂同时,模型预测精度随着训练集数据量的减少而降低,符合数据驱动模型的特性,但并没有表现出较大程度的降低,表明ISSA-GRU 模型稳定性较高,对不同数据样本划分比例均有较好的适定性㊂输入变量也对模型性能有很大的影响㊂参考相关文献[30],另外选取三种输入变量组合,与表2中ISSA-GRU 的测试集性能指标进行对比分析,不同输入变量下的预测性能指标如表4所示㊂㊀第7期段妹玲等:基于ISSA-GRU的混凝土抗压强度预测2399表4㊀不同输入变量下的预测性能指标Table4㊀Performance criteria values under different input variableInput variable RMSE MAE R2 X2,X3,X4,X5,X6,X7,X86.465.200.93X1,X2,X4,X6,X7,X86.225.100.94X2,X5,X6,X7,X813.5010.860.76从表4可以看出随着输入变量的减少,预测数据集的性能指标明显降低,并且模型的预测性能与输入变量数之间没有明确的相关关系,例如,仅缺少 水泥 1个输入变量的预测误差大于缺少 粉煤灰 和 高效减水剂 2个输入变量的预测误差㊂这表明直接减少输入变量的数量是不可行的,会造成输入信息损失,为保证模型的预测性能,需保留所有输入变量㊂4㊀结㊀论1)通过SPXY抽样方法合理划分数据集,能减少随意划分数据集对于预测结果的影响,有效避免对模型预测性能评估的干扰㊂2)在基础SSA模型中引入动态惯性权重,具有前期扩大搜索范围,避免陷入局部最优,后期增强局部搜索,加快计算收敛的特点,提高计算效率和泛化性能㊂3)提出的ISSA-GRU模型避免了传统GRU网络参数的人为选取方式,能高效获取对预测性能有较大影响的GRU网络参数㊂ISSA-GRU模型能有效预测混凝土抗压强度,与LSTM㊁KELM㊁SVR模型相比, ISSA-GRU模型具有更好的预测能力㊂4)一般数据驱动模型的预测精度会随着训练集数据量的减少而降低,本文提出的ISSA-GRU模型符合该特征,但降低程度较小,表明ISSA-GRU模型针对不同训练集数据量均有较稳定的预测性能㊂输入变量的减少会极大影响模型预测精度,需将混凝土所有材料参数加以考虑,保留全部输入变量㊂参考文献[1]㊀缪昌文,穆㊀松.混凝土技术的发展与展望[J].硅酸盐通报,2020,39(1):1-11.MIAO C W,MU S.Development and prospect of concrete technology[J].Bulletin of the Chinese Ceramic Society,2020,39(1):1-11(in Chinese).[2]㊀刘㊀诚,聂㊀鑫,汪家继,等.混凝土宏观本构模型研究进展[J].建筑结构学报,2022,43(1):29-41.LIU C,NIE X,WANG J J,et al.State-of-the-art of macroscopic constitutive models of concrete[J].Journal of Building Structures,2022, 43(1):29-41(in Chinese).[3]㊀LI D H,TANG Z L,KANG Q A,et al.Machine learning-based method for predicting compressive strength of concrete[J].Processes,2023,11(2):390.[4]㊀王㊀楠.回弹法在C50~C60混凝土抗压强度检测应用中的探讨[J].建筑结构,2020,50(增刊2):654-657.WANG N.Discussion on application of rebound method in C50~C60concrete compressive strength inspect[J].Building Structure,2020, 50(supplement2):654-657(in Chinese).[5]㊀郑士举,刘㊀辉,蒋利学.不同测试方式下混凝土抗压强度对比试验研究[J].建筑结构,2022,52(8):105-111.ZHENG S J,LIU H,JIANG L parative experimental research on concrete compression strength under different testing methods[J].Building Structure,2022,52(8):105-111(in Chinese).[6]㊀曹㊀斐,周㊀彧,王春晓,等.一种改进的支持向量回归的混凝土强度预测方法[J].硅酸盐通报,2021,40(1):90-97.CAO F,ZHOU Y,WANG C X,et al.An improved support vector regression method for concrete strength prediction[J].Bulletin of the Chinese Ceramic Society,2021,40(1):90-97(in Chinese).[7]㊀吴贤国,刘鹏程,陈虹宇,等.基于随机森林的高性能混凝土抗压强度预测[J].混凝土,2022(1):17-20+24.WU X G,LIU P C,CHEN H Y,et al.Characteristic screening and prediction of high-performance concrete compressive strength based on random forest method[J].Concrete,2022(1):17-20+24(in Chinese).[8]㊀徐潇航,胡张莉,刘加平,等.基于机器学习回归模型的三峡大坝混凝土强度预测[J].材料导报,2023,37(2):45-53.XU X H,HU Z L,LIU J P,et al.Concrete strength prediction of the Three Gorges Dam based on machine learning regression model[J].Materials Reports,2023,37(2):45-53(in Chinese).[9]㊀许开成,毕丽苹,陈梦成.基于SPSS回归分析的锂渣混凝土抗压强度预测模型[J].建筑科学与工程学报,2017,34(1):15-24.。
一种基于深度学习模型和KNN实时校正的洪水预测方法[发明专利]
![一种基于深度学习模型和KNN实时校正的洪水预测方法[发明专利]](https://img.taocdn.com/s3/m/1f2397a7dc88d0d233d4b14e852458fb770b38ad.png)
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201810965625.X(22)申请日 2018.08.23(71)申请人 河海大学地址 211100 江苏省南京市江宁开发区佛城西路8号(72)发明人 王继民 朱跃龙 张成 张鹏程 朱晓晓 张玲 (74)专利代理机构 南京苏高专利商标事务所(普通合伙) 32204代理人 梁耀文(51)Int.Cl.G06Q 10/04(2012.01)G06N 3/04(2006.01)(54)发明名称一种基于深度学习模型和KNN实时校正的洪水预测方法(57)摘要本发明公开了一种基于深度学习模型和KNN实时校正的洪水预测方法,步骤为:1、对历史洪水过程数据进行归一化处理;2、对归一化后的历史洪水过程数据序列进行分析;3、利用滑动窗口从历史场次洪水数据中建立预测模型的输入和输出值,建立预测模型数据集TRSet1;4、建立基于深度学习的预测模型CNNFM;5、建立实时误差校正模型训练数据集TRSet2;6、建立基于加权K近邻的实时误差校正模型KNNCM;7、进行预测,利用模型CNNFM对实时数据进行预测,利用实时误差校正模型KNNCM结合训练数据TRSet2进行校正,获得最终的预测值。
本发明通过卷积神经网络自动提取数据特征的特点对训练数据进行建模,并通过加权k近邻误差校正模型进行校正以提高模型预测的准确率。
权利要求书2页 说明书9页 附图4页CN 109299812 A 2019.02.01C N 109299812A1.一种基于深度学习模型和KNN实时校正的洪水预测方法,其特征在于,包括如下步骤:(1)对历史洪水过程数据进行归一化处理;(2)对归一化后的历史洪水过程数据序列进行分析,分析降雨量和蒸发量影响因素对流域出口流量的影响时间范围;(3)利用滑动窗口从历史场次洪水数据中建立预测模型的输入和输出值,建立预测模型数据集TRSet1;(4)建立基于深度学习的预测模型CNNFM,利用训练数据TRSet1训练预测模型获得模型参数;(5)建立实时误差校正模型训练数据集TRSet2,输入与TRSet1相同,CNNFM模型的预测误差作为输出;(6)建立基于加权K近邻的实时误差校正模型KNNCM;(7)进行预测,利用模型CNNFM对实时数据进行预测,利用实时误差校正模型KNNCM结合训练数据TRSet2进行校正,获得最终的预测值。
基于GRA-GRU的淮河流域水质预测研究

基于GRA-GRU的淮河流域水质预测研究陈静;李海洋【期刊名称】《安全与环境学报》【年(卷),期】2024(24)1【摘要】水质指标具有多元相关性、时序性和非线性的特点,为有效预测河流水质变化,针对水质数据存在缺失和异常的问题,提出基于灰色关联分析-门控循环单元(Grey Relational Analysis-Gated Recurrent Unit, GRA-GRU)的水质预测模型。
以淮河流域水质数据为样本,使用线性插值修补缺失数据和剔除的异常数据。
使用灰色关联分析计算不同水质指标间的相关性,选择高相关性的水质指标以确定输入变量,并使用门控循环单元(Gated Recurrent Unit, GRU)预测不同的水质指标。
将GRA-GRU的预测结果与反向传播神经网络(Back Propagation Neural Network, BPNN)、循环神经网络(Recurrent Neural Network, RNN)、长短期记忆神经网络(Long Short Term Memory, LSTM)、GRU及灰色关联分析-长短期记忆神经网络(Grey Relational Analysis-Long Short Term Memory, GRA-LSTM)进行对比分析,结果显示GRA-GRU在不同水质指标预测上具有较好的适应性,可以有效降低预测误差。
其中,与其他模型相比,GRA-GRU预测的化学需氧量在均方根误差上分别降低了3.617%、0.681%、0.478%、1.505%和0.471%。
【总页数】12页(P376-387)【作者】陈静;李海洋【作者单位】安徽理工大学电气与信息工程学院【正文语种】中文【中图分类】X832【相关文献】1.淮河流域省界水质标准的确定——以淮河流域为例2.淮河流域红色文化阐释与研究——基于淮河流域范围内红色基地的调查分析3.国家环保总局发布2004年第四季度淮河流域水质通报淮河来水不足同期三成水质与同期相比稳定4.基于水质-水量的淮河流域生态补偿框架研究5.淮河流域农业可持续发展能力研究——基于安徽淮河流域的经验证据因版权原因,仅展示原文概要,查看原文内容请购买。
基于GR4J-LSTM混合模型的洪水预报研究

基于GR4J-LSTM混合模型的洪水预报研究崔震;郭生练;王俊;王何予;尹家波;巴欢欢【期刊名称】《人民长江》【年(卷),期】2022(53)7【摘要】为提高洪水过程预报的准确性,将概念性水文模型GR4J (modèle duGénie Ruralà4 paramètres Journalier)的预报流量耦合到长短时记忆神经网络(Long Short-Term Memory Neural Network, LSTM)中,构建了GR4J-LSTM混合模型,并与GR4J、LSTM模型进行对比。
基于2012~2019年陆水水库汛期与洪水事件相关的数据集,并结合欧洲中期天气预报中心的3 h预报降水产品,驱动GR4J-LSTM混合模型,预报陆水水库3~12 h预见期的入库流量。
最后采用平均影响值(Mean Impact Value, MIV)算法评估输入变量的相对重要性。
结果表明:GR4J、LSTM和GR4J-LSTM模型均具有较好的模拟预报能力,但GR4J-LSTM 混合模型的预报性能最优,既可以学习GR4J模型的产汇流过程,又提高了洪水预报的精度。
研究成果可为洪水预报方案制定提供参考。
【总页数】7页(P1-7)【作者】崔震;郭生练;王俊;王何予;尹家波;巴欢欢【作者单位】武汉大学水资源与水电工程科学国家重点实验室;长江勘测规划设计研究有限责任公司【正文语种】中文【中图分类】P338.1【相关文献】1.基于流溪河模型的乐昌峡水库入库洪水预报模型研究2.基于新安江改进模型和NAM模型的通县站洪水预报研究3.基于混合回归模型的沿海平原河网洪水位预报研究4.基于流溪河模型的新丰江水库入库洪水预报模型研究5.基于水文水动力耦合模型的钱塘江流域洪水预报研究因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
① 基金项目: 国家自然科学基金 (61866028, 61741312) Foundation item: National Natural Science Foundation of China (61866028, 61741312) 收稿时间: 2018-11-08; 修改时间: 2018-12-03; 采用时间: 2018-12-07; csa 在线出版时间: 2019-05-01
计算机系统应用 ISSN 1003-3254, CODEN CSAOBN Computer Systems & Applications,2019,28(5):196−201 [doi: 10.15888/ki.csa.006883] ©中国科学院软件研究所版权所有.
E-mail: csa@ Tel: +86-10-62661041
DUAN Sheng-Yue, WANG Chang-Kun, ZHANG Liu-Yan (School of Information Engineering, Nanchang Hangkong University, Nanchang 330063, China) Abstract: Aiming at the problems of low accuracy and over-fitting of traditional neural network model in flood forecasting process, this study takes the monthly average water level of Waizhou Hydrological Station in Ganjiang River Basin as the research object, and proposes a flood forecasting model based on regularized GRU neural network to improve the accuracy of flood forecasting. Relu function is selected as the output layer activation function of the whole neural network. To improve the generalization performance of GRU model, regularization of elastic network is introduced into GRU model, and regularizes the input weights in the network. The model is applied to the fitting and prediction of the monthly average water level at Waizhou Hydrological Station, and the experimental comparison shows that the model optimized by regularization of elastic network has a higher fitting degree, the qualified rate is increased by 9.3%, and the calculated root mean square error is small. Key words: time series; GRU; ElasticNet normalization; flood forecast; water level
196 研究开发 Research and Development
2019 年 第 28 卷 第 5 期
计算机系统应用
安全有着非常重要的意义. 一般来说洪水预测有 3 种 不同的方法, 经验法、统计法以及模型方法, 但水文系 统中多变量之间的非线性关系[1]远非传统方法能解决. 随着科学技术的快速发展, 如何把最新的科学技术引 入到水文预报中, 提高水文预报精度, 成为大家的关注 点. 随着人工神经网络[2]等非线性科学技术在各个行业 的广泛应用, 为解决上述问题提供了机遇.
ห้องสมุดไป่ตู้
我国是世界上洪水灾害频繁且严重的国家之一,洪 水灾害不仅范围大、发生频繁、突发性强, 而且损失 大. 特别是近年来, 受全球气候变化和人类活动影响, 极端天气事件和人为突发水事件明显增加. 为了防治 洪涝灾害, 我国投入了大量的人力、财力与物力,建设
了一批又批防洪工程, 大大加强了我国抗灾御洪的能 力. 与此同时, 我国还加强了非工程防洪措施. 其中, 洪 水预报就是预防洪水灾害的重要非工程措施之一, 也 一直是专家学者关心的课题. 因此提高洪水预测的准 确性, 减轻洪水带来的一系列灾害, 对整个流域的防洪
引用格式: 段生月,王长坤,张柳艳.基于正则化 GRU 模型的洪水预测.计算机系统应用,2019,28(5):196–201. /10033254/6883.html
Flood Forecast Based on Regularized GRU Model
基于正则化 GRU 模型的洪水预测①
段生月, 王长坤, 张柳艳
(南昌航空大学 信息工程学院, 南昌 330063) 通讯作者: 王长坤, E-mail: 2076885@
摘 要: 针对传统神经网络模型在洪水预测过程中存在准确性低、过拟合等问题, 本文以赣江流域外洲水文站每月 平均水位为研究对象, 提出基于正则化 GRU 神经网络的洪水预测模型来提高洪水预报精度. 选用 relu 函数作为整 个神经网络的输出层激活函数, 将弹性网正则化引入到 GRU 模型中, 对网络中输入权重 w 实施正则化处理, 以提 升 GRU 模型的泛化性能, 并将该模型应用于外洲水文站每月平均水位的拟合及预测. 实验对比表明, 弹性网正则 化优化后的模型预测拟合程度较高, 合格率提高了 9.3%, 计算出的均方根误差较小. 关键词: 时间序列; 门结构循环单元; 弹性网正则化; 洪水预报; 水位