一种基于级联神经网络的河口余水位预测方法[发明专利]
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 202010572944.1
(22)申请日 2020.06.22
(71)申请人 中山大学
地址 510275 广东省广州市新港西路135号
(72)发明人 任磊 袁家敏 潘广维 姬进财
傅林曦 杨清书
(74)专利代理机构 北京集佳知识产权代理有限
公司 11227
代理人 郭帅
(51)Int.Cl.
G06F 30/27(2020.01)
G06F 17/18(2006.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06F 111/10(2020.01)
(54)发明名称
一种基于级联神经网络的河口余水位预测
方法
(57)摘要
本发明提供了一种基于级联神经网络的河
口余水位预测方法,包括:获取影响河口余水位
变化的关键数据,关键数据包括第一关键数据和
第二关键数据,对关键数据进行预处理得到数据
集;其中,数据集分为训练集、验证集和测试集;
建立两级串联的余水位神经网络预测模型,一级
网络为GA ‑BP神经网络,二级网络为RBF神经网
络;将第一关键数据作为输入变量,对一级网络
进行训练,将训练得到的输出值和第二关键数据
作为二级网络的输入变量;对二级网络进行训
练,当误差满足要求时,输出河口余水位的预测
值。
本发明综合考虑影响余水位的多个因素,优
化模型的预测能力,充分发挥GA ‑BP网络和RBF网
络各自的优点,
提高模型预测的精度和效率。
权利要求书1页 说明书11页 附图4页CN 111723523 A 2020.09.29
C N 111723523
A
1.一种基于级联神经网络的河口余水位预测方法,其特征在于,包括:
获取影响河口余水位变化的关键数据,所述关键数据包括第一关键数据和第二关键数据,对所述关键数据进行预处理得到数据集;其中,所述数据集分为训练集、验证集和测试集;
建立两级串联的余水位神经网络预测模型,所述预测模型包括一级网络和二级网络,所述一级网络为BP神经网络结合遗传算法的网络,所述二级网络为RBF神经网络;
将所述训练集中的所述第一关键数据作为输入变量,对所述一级网络进行训练,将训练得到的输出值和所述训练集中的所述第二关键数据作为所述二级网络的输入变量;
对所述二级网络进行训练,当误差满足要求时,输出河口余水位的预测值。
2.根据权利要求1所述的基于级联神经网络的河口余水位预测方法,其特征在于,所述第一关键数据包括外海潮位、水深、河宽、流速、流域径流量和水位,所述第二关键数据包括径流因子、潮流因子、径潮作用因子。
3.根据权利要求1所述的基于级联神经网络的河口余水位预测方法,其特征在于,对所述关键数据进行预处理进一步包括:对所述关键数据进行时空统一、时段划分和标准化处理。
4.根据权利要求1所述的基于级联神经网络的河口余水位预测方法,其特征在于,建立两级串联的余水位神经网络预测模型进一步包括:分别对多个特征阶段建立两级串联的余水位神经网络预测模型,其中,所述特征阶段是在预处理时根据余水位特征划分的。
5.根据权利要求4所述的基于级联神经网络的河口余水位预测方法,其特征在于,所述特征阶段具体为:洪水期大潮阶段、洪水期小潮阶段、枯水期大潮阶段、枯水期小潮阶段、平水期大潮阶段和平水期小潮阶段。
6.根据权利要求1所述的基于级联神经网络的河口余水位预测方法,其特征在于,对所述一级网络进行训练具体为:初始化BP神经网络的参数,利用遗传算法获取的最优权值和阈值对BP神经网络进行训练,计算各隐含层的输入和输出值,当所述输出值误差满足误差条件时,将所述输出值输出至二级网络。
7.根据权利要求6所述的基于级联神经网络的河口余水位预测方法,其特征在于,初始化BP神经网络的参数进一步包括:最大训练次数、学习精度、初始权值、初始阈值和初始学习速率。
8.根据权利要求1所述的基于级联神经网络的河口余水位预测方法,其特征在于,对所述二级网络进行训练具体为:初始化RBF网络,采用K -均值聚类算法确定中心,计算RBF网络总体均方误差,判断误差是否满足要求,若不满足则修正权值,若满足则结束训练。
9.根据权利要求1所述的基于级联神经网络的河口余水位预测方法,其特征在于,利用遗传算法获取最优权值和阈值的具体过程为:对BP神经网络中的初始权值和初始阈值进行编码,重复执行种群初始化、适应度评价、选择、交叉和变异操作直至满足约束条件,解码获取所述最优权值和所述阈值。
10.根据权利要求1所述的基于级联神经网络的河口余水位预测方法,其特征在于,输出河口余水位的预测值之后还包括:将所述预测值进行实时可视化展示。
权 利 要 求 书1/1页CN 111723523 A
一种基于级联神经网络的河口余水位预测方法
技术领域
[0001]本发明涉及测控技术领域,尤其是涉及一种基于级联神经网络的河口余水位预测方法。
背景技术
[0002]余水位,也称潮平均水位(如日潮周期水位的平均值,以多年平均海平面为高程零点),是河口径流、潮流两大动力非线性耦合作用的典型结果。
在外海潮汐动力和流域径流动力协同作用下,河口区余水位受多因子影响呈现多时空尺度变化特征。
掌握余水位变化规律,实时对余水位的准确预测,不仅可为河口海岸治理与生态防护提供重要支撑,而且可为河口水资源高效利用和防洪安全提供重要参考。
[0003]因河口区径潮动力过程具显著非线性耦合特征,现有针对河口余水位的分析及预测大多基于解析求解法、调和分析法、线性回归法和数值模拟法等方法。
现有方法在进行余水位预测时均有局限性,解析求解法通过数学推导,将研究目标变量余水位/余水位梯度的环境进行简化或近似,得出的一个数学表达式,其使用条件具有局限性,即该解析公式可能在某些河口能得到较准确的结果,而在其他类型河口可能不适用;调和分析法通常选取代表性调和常数来表征其变化特性,而对其他信号信息的忽略往往导致其分析不够完整;线性回归法适用于对线性过程的描述及应用,对具有显著非线性特征的余水位进行回归预测难以到达高准确度要求;数值模拟法中的初始条件和边界条件的给定直接影响对余水位的模拟精度,初始条件和边界条件中存在的小误差可能导致模拟目标变量余水位存在较大误差。
[0004]因此,急需一种综合考虑余水位的非线性特征及多影响因素的变化规律、能准确预测河口余水位的预测方法。
发明内容
[0005]本发明的目的是提供一种基于级联神经网络的河口余水位预测方法,以解决现有方法在预测河口余水位时具有局限性、预测结果误差较大的技术问题。
[0006]本发明的目的,可以通过如下技术方案实现:
[0007]一种基于级联神经网络的河口余水位预测方法,包括:
[0008]获取影响河口余水位变化的关键数据,所述关键数据包括第一关键数据和第二关键数据,对所述关键数据进行预处理得到数据集;其中,所述数据集分为训练集、验证集和测试集;
[0009]建立两级串联的余水位神经网络预测模型,所述预测模型包括一级网络和二级网络,所述一级网络为BP神经网络结合遗传算法的网络,所述二级网络为RBF神经网络;[0010]将所述训练集中的所述第一关键数据作为输入变量,对所述一级网络进行训练,将训练得到的输出值和所述训练集中的所述第二关键数据作为所述二级网络的输入变量;[0011]对所述二级网络进行训练,当误差满足要求时,输出河口余水位的预测值。
[0012]可选地,所述第一关键数据包括外海潮位、水深、河宽、流速、流域径流量和水位,所述第二关键数据包括径流因子、潮流因子、径潮作用因子。
[0013]可选地,对所述关键数据进行预处理进一步包括:对所述关键数据进行时空统一、时段划分和标准化处理。
[0014]可选地,建立两级串联的余水位神经网络预测模型进一步包括:分别对多个特征阶段建立两级串联的余水位神经网络预测模型,其中,所述特征阶段是在预处理时根据余水位特征划分的。
[0015]可选地,所述特征阶段具体为:洪水期大潮阶段、洪水期小潮阶段、枯水期大潮阶段、枯水期小潮阶段、平水期大潮阶段和平水期小潮阶段。
[0016]可选地,对所述一级网络进行训练具体为:初始化BP神经网络的参数,利用遗传算法获取的最优权值和阈值对BP神经网络进行训练,计算各隐含层的输入和输出值,当所述输出值误差满足误差条件时,将所述输出值输出至二级网络。
[0017]可选地,初始化BP神经网络的参数进一步包括:最大训练次数、学习精度、初始权值、初始阈值和初始学习速率。
[0018]可选地,对所述二级网络进行训练具体为:初始化RBF网络,采用K-均值聚类算法确定中心,计算RBF网络总体均方误差,判断误差是否满足要求,若不满足则修正权值,若满足则结束训练。
[0019]可选地,利用遗传算法获取最优权值和阈值的具体过程为:对BP神经网络中的初始权值和初始阈值进行编码,重复执行种群初始化、适应度评价、选择、交叉和变异操作直至满足约束条件,解码获取所述最优权值和所述阈值。
[0020]可选地,输出河口余水位的预测值之后还包括:将所述预测值进行实时可视化展示。
[0021]本发明提供了一种基于级联神经网络的河口余水位预测方法,包括:获取影响河口余水位变化的关键数据,所述关键数据包括第一关键数据和第二关键数据,对所述关键数据进行预处理得到数据集;其中,所述数据集分为训练集、验证集和测试集;建立两级串联的余水位神经网络预测模型,所述预测模型包括一级网络和二级网络,所述一级网络为BP神经网络结合遗传算法的网络,所述二级网络为RBF神经网络;将所述训练集中的所述第一关键数据作为输入变量,对所述一级网络进行训练,将训练得到的输出值和所述训练集中的所述第二关键数据作为所述二级网络的输入变量;对所述二级网络进行训练,当误差满足要求时,输出河口余水位的预测值。
[0022]本发明提供的基于级联神经网络的河口余水位预测方法,基于河口余水位本身的非线性特征及影响其形成变化的多因子变化规律,建立两级串联的余水位级联神经网络预测模型,一级网络采用GA-BP神经网络,二级网络采用RBF神经网络,将一级网络的输出与径流因子、潮流因子、径潮相互作用因子一起作为二级网络的输入;对影响河口余水位变化的输入变量进行分类处理,通过综合考虑对余水位产生影响因素的综合效应并对预测模型中各级神经网络结构进行优化,能优化模型的预测能力,充分发挥GA-BP神经网络和RBF神经网络各自的优点,提高模型预测的精度和效率。
附图说明
[0023]图1为本发明一种基于级联神经网络的河口余水位预测方法的流程示意图;[0024]图2为本发明一种基于级联神经网络的河口余水位预测方法的余水位预测模型示意图;
[0025]图3为本发明本发明一种基于级联神经网络的河口余水位预测方法的一级GA-BP 网络的BP计算流程示意图;
[0026]图4为本发明一种基于级联神经网络的河口余水位预测方法的一级GA-BP网络的GA算法流程示意图;
[0027]图5为本发明一种基于级联神经网络的河口余水位预测方法的二级RBF神经网络的流程示意图。
具体实施方式
[0028]本发明实施例提供了一种基于级联神经网络的河口余水位预测方法,以解决现有方法在预测河口余水位时具有局限性、预测结果误差较大的技术问题。
[0029]为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。
附图中给出了本发明的首选实施例。
但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。
相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
[0030]除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0031]解析求解法是基于动量守恒方程计算余水位梯度(即余水位沿x轴方向的一阶导数)来定量描述余水位的沿程变化速率及特征,为简化计算,方程中假定余水位梯度项主要与非线性摩擦项相平衡,余水位梯度解析解可由一维动量方程求得:
[0032]
[0033]式中,t为时间;U为横断面平均流速;Z为水位;h为水深;g为重力加速度;K是曼宁系数的倒数;E为密度变化引起的斜压项。
[0034]将上式取潮周期平均后得到:
[0035]
[0036]式中,左边项分别为正压项、斜压项、对流项。
左式中第三项对流项可进一步改写成:
[0037]
[0038]引入无量纲弗洛德数上式可变为:
[0039]
[0040]式中,和分别为积分初始时刻的弗洛德数和流速值。
[0041]基于以上变换,可得考虑斜压影响的余水位梯度计算公式:
[0042]
[0043]用切比雪夫多项式对非线性摩擦项中的二次流速项进行线性化处理可得:
[0044]
[0045]式中,v′为可能的最大流速,ε0,ε1,ε2为基于v′的无量纲流速振幅,即:[0046]v′=|u0|+v1+v z;
[0047]
[0048]根据三角函数公式展开cos函数的幂次方并提取简谐波频率为ω和2ω得到:[0049]U|U|=v’2[F0+F1cos(ωt+ψ1)+F2cos(2ωt+ψ2)];
[0050]其中:
[0051]
[0052]
[0053]
[0054]因此,沿程余水位梯度的解析表达式可简化为:
[0055]
[0056]其中,非线性摩擦项引起的余水位可分解成以下3个因子:
[0057]潮流因子:
[0058]
[0059]径流因子:
[0060]
[0061]径潮相互作用因子:
[0062]
[0063]水动力数值模型如SCHISM(Semi-implicit Cross-scale Hydroscience Integrated System Model)可通过将地形岸线概化,设定模拟阶段相对应的初始条件包括温度场、盐度场和边界条件如外海调和分潮、上游流域河流流量等,然后进行模拟分析余水位变化;调和分析法是基于最小二乘法计算调和常数,通过研究不同分潮特征及其组合效应对余水位的影响;线性回归法是将不同类型余水位(正值余水位或称增水位数据序列、负值余水位或称减水位数据序列和余水位数据序列)按不同时段进行数据处理(如日平均、月平均等)后建立回归模型,对各数据序列进行变化趋势估计。
[0064]本发明实施例提供了一种基于级联神经网络的河口余水位预测方法,包括:[0065]S1:获取影响河口余水位变化的关键数据,所述关键数据包括第一关键数据和第二关键数据,对所述关键数据进行预处理得到数据集;其中,所述数据集分为训练集、验证集和测试集;
[0066]S2:建立两级串联的余水位神经网络预测模型,所述预测模型包括一级网络和二级网络,所述一级网络为BP神经网络结合遗传算法的网络,所述二级网络为RBF神经网络;[0067]S3:将所述训练集中的所述第一关键数据作为输入变量,对所述一级网络进行训练,将训练得到的输出值和所述训练集中的所述第二关键数据作为所述二级网络的输入变量;
[0068]S4:对所述二级网络进行训练,当误差满足要求时,输出河口余水位的预测值。
[0069]获取关键数据:获取或通过公式计算获得影响余水位变化的关键数据,具体包括获取研究区域的河流宽度、水深、上游流域径流量、外海潮波水位、水位、流速等;计算径流因子、潮流因子、径潮相互作用因子(计算公式见上)。
其中,研究区域的河流宽度、水深可通过卫星遥感资料或无人机影像拍摄后反演获取,外海潮波水位可通过位于研究区域最近的潮位站获得,上游流域径流量、水位、流速可通过研究区域所属管辖的水文机构获取。
[0070]数据时空统一:因获取的各类数据来自不同的数据源,变量间的空间点位与时间步长不统一,而建立预测模型需确保数据信息的空间一致性和时间同步性,因此,需要对各类数据在空间和时间上进行统一。
在空间上,将各变量采用反距离加权平均插值法将影响余水位变化的变量插值到对应余水位分析区域/点位;在时间上,以已有余水位历史数据的时刻为基准,采用线性插值方法将影响余水位变化的变量数据插值到与余水位对应的时刻。
[0071]时段划分:由于余水位具有复杂时空变化的特征,为提高对其预测的精度和效率,本发明实施例分为三个典型时期,分别建立余水位预测模型,因此,该模块将上一模块中获得的数据按照研究区域历史水文特征划分为6个阶段:洪水期大潮阶段、洪水期小潮阶段、枯水期大潮阶段、枯水期小潮阶段、平水期大潮阶段、平水期小潮阶段。
以珠江河口为例,洪水期一般为5月至8月,枯水期一般为11月至来年2月,平水期一般为3月、4月、9月、10月。
大
小潮阶段划分可基于研究河口历史潮位过程线判断。
[0072]数据标准化处理:由于各个变量变化区间存在较大差别,为有效地提高本发明实施例中采用的级联神经网络模型精度,确保在神经网络模型中各变量贡献效应的平等性,采用离差标准化,是对原始数据进行线性变换,使结果落到[0,1]区间,利用下列转换函数对序列x1,x2,…,x n进行变换:
[0073]
[0074]通过对每一个变量时间序列的离差标准化处理,使得以上各变量的波动区间统一化,均在[0,1]之间。
[0075]数据集分类:将以上进行标准化和时空统一化的数据以时间数据为参照,按6个阶段类型(洪水期大潮阶段、洪水期小潮阶段、枯水期大潮阶段、枯水期小潮阶段、平水期大潮阶段、平水期小潮阶段)对数据进行选取和分组重建,然后,将获得的6个阶段数据集合进行进一步分类,按照6:2:2的比例关系,将6个阶段所有数据集采用随机选取方法分别划分为训练集、验证集和测试集(6:2:2)。
[0076]训练集作用是用来拟合模型,通过设置分类器的参数,训练分类模型。
后续结合验证集作用时,会选出同一参数的不同取值,拟合出多个预测模型;验证集作用是当通过训练集训练出多个模型后,为了能找出效果最佳的模型,使用各个模型对验证集数据进行预测,并记录模型准确率。
选出效果最佳的模型所对应的参数,即用来调整模型参数;测试集通过训练集和验证集得出最优模型后,使用测试集进行模型预测。
用来衡量该最优模型的性能和预测能力。
即可以把测试集当做从来不存在的数据集,当已经确定模型参数后,使用测试集进行模型性能评价。
因此,此模块获得的数据集为6个特征阶段,每个阶段含有3类数据集。
[0077]本发明实施例基于级联神经网络建立河口余水位预测模型时,基于6个特征阶段及每个阶段中的3类数据集,运用级联神经网络分别建立每种特征阶段的余水位预测模型,即最终获得余水位预测模型含有6个对应的阶段模型,使用时,明确需要预测的余水位所在阶段(所处月份、潮位特征阶段),然后运用对应的阶段模型进行预测。
模型的建立过程包括调参、对比、优化、择优等过程。
[0078]模型预测精度采用均方根误差(RMSE)、效率系数(NSE)、平均绝对误差(MAE)、确定系数(R2)进行评价,其计算方法:
[0079]
[0080]
[0081]
[0082]
[0083]式中,X i、Y i分别为第i个时段的实测值和估算值,X′i、Y′i分别为第i个时段的实测值和模型估算值的平均值;n为时间段。
通过不同参数条件下的对比,分别选取6个阶段对应的RMSE、NSE、MAE值最小和R的平方最大时对应的模型为最优模型。
[0084]预测结果可视化:为将运用基于级联神经网络获得的余水位预测结果实时展示,结合GIS等软件,将不同预测窗口期(如未来6小时、24小时)的余水位预测值在河口及流域图中进行实时在线展示,便于响应决策者或使用机构直观判定,也便于大众对于未来余水位变化趋势的了解。
[0085]单一神经网络的预测模型,要么是隐藏层神经元个数不够,要么算法内的函数较复杂且样本有限表现能力差,泛化水平不够,无法得到甚为理想的预测结果,因此,本发明中余水位的预测模型是基于级联神经网络。
从信息利用角度来看,单一神经网络预测模型仅能从一个侧面去刻画数据序列规律,即只能利用数据部分有效信息,具有一定局限性;而不同的预测方法往往能提供不同的有用信息,组合模型将单一模型的优势互补,能更大程度挖掘数据信息,获得更佳的预测效果。
多级神经网络结构的每一级子系统,通常都由特征提取模块和神经网络模块所组成。
特征提取模块从输入数据中提取特征矢量,基于该特征矢量,神经网络模块在学习阶段对所有训练数据进行学习,而在工作阶段则对输入到本级的数据进行分类判别,包括识别输出和拒识输出两种情况。
不妨假定:某一级的特征提取模块所提取的特征能有效地代表一部分输入样本的本质特征,因此这一部分样本在该级中将成功地得到识别,其余的样本则由于特征不清而被拒识,送入到下一级进行基于另外一种特征提取和神经网络结构的分类判别。
一个好的多级神经网络结构应满足两个条件:[0086](1)有效设计每一级的特征提取模块,尽可能使每一级的特征提取方法相互独立,互为补充;
[0087](2)合理设计各级神经网络模块,使得该神经网络能有效地拒识那些在该级特征下模糊不清的样本,从而使误识率尽可能降低。
多级神经网络结构的整体性能在很大程度上依赖于每一级子系统误识率的高低,而前几级的误识率尤其关键。
[0088]本发明实施例采用两级串联的级联神经网络,第一级采用GA-BP网络,第二级采用RBF网络。
由于BP神经网络算法是基于梯度下降法进行计算,当处理复杂的非线性函数问题时,BP算法会出现局部极小解,而非全局最小解,因此,本发明实施例在级联神经网络的一级网络中采用BP神经网络结合遗传算法(GA)的网络,GA算法模拟自然界中生物适者生存、优胜劣汰的生存法则,通过杂交、变异等繁衍操作使得优良基因得以往后传递。
实际算法计算中,利用GA算法寻找阈值和权值的最优值,然后将其赋值给BP神经网络,将接收到的信号强度作为输入值,距离值作为输出值进行训练。
[0089]请参阅图5,第二级RBF网络要学习的参数有3个,步骤如下:
[0090](1)学习中心t i(i=1,2,…,I,I为隐单元的个数)。
自组织学习过程要用到聚类算。