利用结构逼近式混合神经网络实现间歇反应器的建模
在Matlab中实现神经网络的方法与实例
在Matlab中实现神经网络的方法与实例神经网络是一种模拟人类大脑神经系统的计算模型,它能够通过学习数据的模式和关联性来解决各种问题。
在计算机科学和人工智能领域,神经网络被广泛应用于图像识别、自然语言处理、预测等任务。
而Matlab作为一种功能强大的科学计算软件,提供了一套完善的工具箱,可以方便地实现神经网络的建模和训练。
本文将介绍在Matlab中实现神经网络的方法与实例。
首先,我们会简要介绍神经网络的基本原理和结构,然后详细讲解在Matlab中如何创建并训练神经网络模型,最后通过几个实例展示神经网络在不同领域的应用。
一、神经网络的原理和结构神经网络模型由神经元和它们之间的连接构成。
每个神经元接收输入信号,并通过权重和偏置进行加权计算,然后使用激活函数对结果进行非线性变换。
这样,神经网络就能够模拟复杂的非线性关系。
常见的神经网络结构包括前馈神经网络(Feedforward Neural Network)和循环神经网络(Recurrent Neural Network)。
前馈神经网络是最基本的结构,信号只能向前传递,输出不对网络进行反馈;而循环神经网络具有反馈连接,可以对自身的输出进行再处理,适用于序列数据的建模。
神经网络的训练是通过最小化损失函数来优化模型的参数。
常用的训练算法包括梯度下降法和反向传播算法。
其中,梯度下降法通过计算损失函数对参数的梯度来更新参数;反向传播算法是梯度下降法在神经网络中的具体应用,通过反向计算梯度来更新网络的权重和偏置。
二、在Matlab中创建神经网络模型在Matlab中,可以通过Neural Network Toolbox来创建和训练神经网络模型。
首先,我们需要定义神经网络的结构,包括输入层、隐藏层和输出层的神经元数量,以及每个神经元之间的连接权重。
例如,我们可以创建一个三层的前馈神经网络模型:```matlabnet = feedforwardnet([10 8]);```其中,`[10 8]`表示隐藏层的神经元数量分别为10和8。
可压缩两气体流动的简化神经网络模型
第9卷㊀第2期2024年3月气体物理PHYSICSOFGASESVol.9㊀No.2Mar.2024㊀㊀DOI:10.19527/j.cnki.2096 ̄1642.1089可压缩两气体流动的简化神经网络模型刘子岩ꎬ㊀许㊀亮ꎬ㊀刘耀峰(中国航天空气动力技术研究院ꎬ北京100074)ASimplifiedNeuralNetworkModelforCompressibleTwo ̄GasFlowsLIUZiyanꎬ㊀XULiangꎬ㊀LIUYaofeng(ChinaAcademyofAerospaceAerodynamicsꎬBeijing100074ꎬChina)摘㊀要:实用的虚拟流体方法(practicalghostfluidmethodꎬPGFM)利用Riemann问题速度解对可压缩多介质流场界面条件进行建模ꎮ基于构造的嵌入物理约束的神经网络模型预测Riemann问题速度解的方式ꎬ给出一种两气体流动的神经网络模型简化方法ꎮ首先提出完全气体状态方程下神经网络模型输入特征采样范围从无界域到有界域的转换方法ꎬ改善模型预测不同初始条件下Riemann解的泛化性能ꎮ根据该转化方法ꎬ进一步提出一种结构更加简单的神经网络优化方法ꎬ将输入维度从5个减少到3个ꎬ有效提高神经网络的训练效果ꎮ将该神经网络代理模型应用于PGFM程序框架ꎬ通过典型的一维与二维两气体流动问题进行数值验证与对比分析ꎮ结果表明ꎬ简化的网络模型与已有研究的神经网络模型相比ꎬ能取得精度相近的计算结果ꎮ而在神经网络训练效率上ꎬ简化神经网络具有明显优势ꎮ同时因为简化神经网络采样维度少ꎬ方便尝试加密采样提高拟合精度ꎬ更具备发展潜力ꎮ关键词:可压缩多介质问题ꎻ虚拟流体方法ꎻ两气体Riemann问题ꎻ神经网络㊀㊀㊀收稿日期:2023 ̄09 ̄26ꎻ修回日期:2023 ̄12 ̄19基金项目:国家自然科学基金(11872351)第一作者简介:刘子岩(1998 )㊀男ꎬ博士ꎬ主要研究方向为机器学习在可压缩多介质流问题中的应用ꎮE ̄mail:lzy210@buaa.edu.cn通信作者简介:许亮(1982 )㊀男ꎬ研究员ꎬ主要研究方向为可压缩多介质流模拟方法㊁CFD中机器学习建模方法等ꎮ中图分类号:O359㊀㊀文献标志码:AAbstract:Thepracticalghostfluidmethod(PGFM)utilizesvelocitysolutionsofRiemannproblemstomodeltheinterfaceevolutionofcompressiblemulti ̄materialflows.Thispaperpresentedasimplifiedneuralnetworkmodelfortwo ̄gasflowsbypredictingthevelocitysolutionofRiemannproblembasedontheneuralnetworkmodelembeddedwithphysicalconstraints.Firstlyꎬamethodforconvertingthesamplingrangeoftheneuralnetworkmodelfromunboundeddomaintoboundeddomainwasproposedꎬwhichholdstruefortheperfectgasequationofstate.Itcanimprovethegeneralizationperformanceofthemodelunderdifferentinitialconditions.Basedonthistransformationmethodꎬasimplerneuralnetworkstructurewasfurtherproposed.Thetrainingresultoftheneuralnetworkcanbeeffectivelyimprovedbyreducingtheinputdimensionsfrom5to3.TheneuralnetworkmodelwasappliedtothePGFM.Numericalvalidationoftheneuralnetworkmodelwascarriedoutthroughtypicalone ̄dimensionalandtwo ̄dimensionalgasflowproblems.Theresultsshowthatthesimplifiednetworkmodelcanachievesimilarcomputationalaccuracycomparedwithexistingneuralnetworkmodels.Intermsoftrainingefficiencyofneuralnetworksꎬthesimplifiedneuralnetworkhasobviousadvantages.Moreoverꎬbecausethesimplifiedneuralnetworkhasfewersamplingdimensionsꎬitisconvenienttotrydensersamplingtoimprovefittingaccuracyandsuchmethodhasmoredevelopmentpotential.Keywords:compressiblemulti ̄materialflowsꎻghostfluidmethodꎻtwo ̄gasRiemannproblemꎻneuralnetwork气体物理2024年㊀第9卷引㊀言数值模拟可压缩多介质流体动力学问题在航空航天㊁武器物理㊁生物医疗等前沿领域具有大量应用需求[1]ꎮ清晰准确地模拟界面运动及变形是这类问题关注的重点ꎮ处理物质界面的一类方案为锐利界面方法ꎬ即把界面视作零厚度界面ꎬ这种方案须时刻捕捉界面位置并定义非线性波与界面发生作用而产生的边界条件ꎮ捕捉界面位置常用的方法有界面追踪法[2]和水平集(levelset)方法[3]等ꎬ定义边界条件的方法有切割网格法[4]和虚拟流体方法等ꎮ虚拟流体方法有着诸多版本ꎬ其中Liu等[5]提出的修正虚拟流体方法(modifiedghostfluidmethodꎬMGFM)通过求解界面附近多介质Riemann问题来预测界面状态ꎬ并以此定义虚拟流体状态ꎮ许亮等[6]提出了实用虚拟流体方法ꎬ借助多介质Riemann问题的速度解ꎬ并结合界面另一侧的流场状态可以准确定义虚拟流体状态ꎮ由于充分考虑波与物质界面的相互作用和介质性质对界面运动的影响ꎬ这两种方法已被证明适用于各种强间断气-气㊁气-液㊁流-固等挑战性多介质流动难题[7]ꎮ使用基于Riemann解的虚拟流体方法在定义虚拟流体状态时ꎬ须迭代求解非线性方程ꎮ多介质Riemann问题近似求解可以分成隐式和显式两类方法[8]ꎮ虚拟流体方法中常用的基于双激波结构的隐式近似Riemann解[5]也包含迭代过程ꎮXu等[8]发展了2种不含迭代的显式近似Riemann解ꎬ计算效率高ꎬ但是只适用于刚性气体状态方程ꎮ传统方法求解多介质Riemann问题应对不同的状态方程须进行特定的数学推导ꎮ当问题比较复杂时ꎬ通常会涉及繁琐的计算过程ꎮ比如ꎬ对于含热完全气体的多介质流动问题ꎬ在压力的每一步迭代求解过程中也包含了温度的迭代解[8]ꎮ如果考虑黏性㊁表面张力㊁相变㊁化学反应等影响因素ꎬ那么物质界面求解迭代过程可能更加复杂ꎬ这就对稳定性提出很高要求ꎮ因此ꎬ有必要尝试借助新兴的机器学习方法替代传统的Riemann解算器ꎬ对降低建模难度以及提高计算稳定性等方面进行探索ꎮ机器学习方法近年来被广泛应用于各种研究领域中[9]ꎬ尤其常见于求解偏微分方程的过程中替代复杂的计算ꎬ并取得了较好的效果[10ꎬ11]ꎮFeng等[12ꎬ13]使用神经网络构造了智能激波指示器ꎬ应用于格式设计ꎬ并给出了机器学习模型的合理性解释ꎮ同时ꎬ研究者们也尝试加入一些约束条件以使得结果更加符合流动物理ꎮ丘润荻等[14]在相场法中引入含物理约束的神经网络ꎬ用于求解RT不稳定性问题ꎬ明显提高了计算效率ꎮMagiera等[15]针对Riemann问题ꎬ首次提出嵌入物理约束的神经网络模型ꎬ使预测结果尽可能满足Rankine ̄Hugoniot间断条件ꎮ基于该方法ꎬWang等[16]针对跨临界流的Riemann问题ꎬ分析了具有不同输入与输出形式的神经网络架构ꎬ提出了兼顾计算效率及计算精度的网络构造方法ꎮRuggeri等[17]将Riemann解的神经网络模型推广到真实气体ꎬ比精确Riemann解具有更高的计算效率ꎮ但是ꎬ由于关注的网络输出维度较多ꎬ这些文献所使用的神经网络结构仍较复杂ꎮ本人在文献[9]中提出了多介质Riemann问题速度解的神经网络模型ꎬ通过构建物理约束层的方式考虑流场间断关系ꎬ简化网络规模ꎬ成功应用于PGFM框架求解多介质流动问题ꎮ本文将进一步提出应用于两气体Riemann问题的神经网络标准化映射方法ꎬ构造针对输入特征的神经网络结构优化方式ꎬ能够提高网络的训练效果及应用价值ꎮ1㊀问题描述与求解方法1.1㊀流体控制方程与状态方程研究模型设定为可压缩无黏流动模型ꎬ其二维形式Euler守恒方程组为∂U∂t+∂F∂x+∂G∂y=0(1)式中ꎬU=[ρꎬρuꎬρvꎬE]T代表守恒变量ꎬF=[ρuꎬρu2+pꎬρuvꎬ(E+p)u]TꎬG=[ρvꎬρuvꎬρv2+pꎬ(E+p)v]T均为守恒通量ꎮρꎬpꎬu分别是流体的密度ꎬ压力以及速度ꎬE是流体总能量ꎬE=ρe+ρu2/2ꎮe是单位质量流体的内能ꎮ上述方程组的封闭还须补充一个状态方程ꎮ本文目前的工作只涉及由完全气体状态方程p=(γ-1)ρe(2)描述的可压缩两气体流动问题ꎮ式中ꎬγ表示气体比热比ꎮ1.2㊀虚拟流体方法在虚拟流体方法中ꎬ把物质界面看成内边界ꎮ一般每种介质取界面附近3~5个网格点的区域作43第2期刘子岩ꎬ等:可压缩两气体流动的简化神经网络模型为虚拟流体区域ꎬ虚拟流体层数由计算采用的数值格式决定ꎮ该区域内的虚拟流体状态作为内边界条件来定义ꎮ这样可以将多介质界面问题转化成多个单介质问题来模拟ꎮ原则上ꎬ只要这些虚拟流体状态定义准确ꎬ任何高分辨率计算格式可以直接使用ꎬ不需要在界面附近特殊处理ꎮ本文使用水平集方法捕捉界面运动ꎬ使用PG ̄FM[7]定义不同流体的界面条件ꎬPGFM的原理如图1所示ꎮ对比MGFM[5]须使用3个界面自由度定义虚拟流体状态ꎬPGFM仅借助1个界面速度就可以计算出虚拟流体速度ꎬ虚拟流体的压力和密度通过镜像对称得到ꎮ这种区别意味着当采用神经网络对流场界面条件建模时ꎬ在PGFM的框架下仅关注界面速度这一个物理量ꎬ神经网络的输入和输出更加简洁ꎬ并能因此取得更好的训练效果ꎮ图1㊀PGFM定义虚拟流体状态的示意图[7]Fig.1㊀IllustrationofthePGFMfordefiningghostfluidstates[7]为抑制界面附近的非物理解ꎬ界面附近和虚拟流体的密度也可以通过某些校正技术[7]获得ꎮ1.3㊀多介质Riemann问题的速度解在多维问题中ꎬ虚拟流体方法首先须沿界面法向构造并求解多介质Riemann问题ꎮ一维形式的初始值间断Riemann问题为∂U∂t+∂F∂x=0ꎬU|t=0=ULꎬx<xIURꎬx>xI{(3)其中ꎬU=[ρꎬρuꎬE]TꎬF=[ρuꎬρu2+pꎬ(E+p)u]TꎬUL和UR是界面法向上由位于xI处的物质界面分开的两个常值状态ꎮ下标I㊁L和R分别表示界面㊁左侧和右侧ꎮ对多介质Riemann问题(3)ꎬ须求解下面的非线性系统uL-uI=fL(pI)uI-uR=fR(pI){(4)其中函数f的具体形式为[6]fH(p)=f(pIꎬpHꎬρH)=(p-pH)/(p-pH)ρHρρ-ρHꎬp>pHʏppH1ρdρdpdpꎬpɤpHìîíïïïïïï(5)式中ꎬH=L或Rꎬρ和p的关系由状态方程确定ꎮ由uI=12(fR-fL)+12(uL+uR)(6)求出界面速度解uIꎬ然后按照图1中PGFM方式确定虚拟流体状态U∗R和U∗Lꎮ这样ꎬ每个时间步在界面处只需求解如下两个带虚拟流体状态的单介质Riemann问题∂U∂t+∂F∂x=0ꎬU|t=0=ULꎬx<x0U∗Rꎬx>x0{(7)∂U∂t+∂F∂x=0ꎬUt=0=U∗Lꎬx<x0URꎬx>x0{(8)这里上标∗表示虚拟流体状态ꎮ问题(7)的求解区域是从最左边的网格点一直跨过物质界面进入右边介质区的虚拟网格点ꎮ问题(8)的求解区域则是从左边的虚拟网格点跨过物质界面一直到最右边的网格点ꎮ2㊀神经网络模型建立及优化2.1㊀嵌入物理约束的神经网络模型神经网络的输入和输出须根据具体问题确定ꎮPGFM定义虚拟流体状态只需利用多介质Riemann问题界面速度解uIꎬ而根据界面速度uI的求解流程(4)~(6)ꎬ神经网络的输入特征可选择为{pLꎬρLꎬpRꎬρRꎬΔu}共5个量ꎬ神经网络输出特征为函数(5)fL和fR的逼近值φL和φRꎮ最终根据神经网络预测结果和式(6)计算得到uIꎮ为了使神经网络学习结果更符合流动物理要求ꎬ根据流场间断关系构建了物理约束条件φL+φR+Δu=0(9)通过构建物理约束层的方式将式(9)嵌入神经网络ꎬ具体操作方法为:将神经网络两个输出φL和φR改写成φL和-Δu-φLꎬ神经网络模型的输出层只需要一个输出量φLꎮ但神经网络训练样本的标签仍为两个量ꎬ由φL和-Δu-φL物理约束层参与训练ꎮ这种方式能严格满足式(9)的流场间断关53气体物理2024年㊀第9卷系ꎮ考虑物理约束的神经网络原理如图2所示ꎮ图2㊀考虑物理约束的人工神经网络示意图Fig.2㊀Illustrationoftheartificialneuralnetworkwithphysicalconstraints本部分工作已在文献[9]中完成ꎬ具体实现方法和神经网络的基本原理参考文献[9]ꎮ2.2㊀神经网络标准化映射及网络结构简化神经网络代理模型的使用范围应尽量在训练样本采样范围内以保证模型的预测效果ꎮ注意到PGFM的神经网络模型的5个输入量都是无界的ꎮ本质上ꎬ流体的压力和密度取值范围为(0ꎬ+ɕ)ꎬ界面两侧流体的速度差Du取值范围为(-ɕꎬ+ɕ)ꎮ为了提高神经网络模型的训练效果ꎬ通过预处理的方法将采样范围从无界域映射到有界域ꎮ基于Ri ̄emann速度解的求解方法可以获得标准化映射方法依赖紧密的一个性质[18]ꎮ对于完全气体状态方程(2)ꎬ如果界面两侧流体的压力㊁密度经过以下变换p-=pp0ꎬρ-=ρρ0那么界面速度uI的表达式将被改写成uI=12[f(p-Iꎬp-Rꎬρ-R)-f(p-Iꎬp-Lꎬρ-L)]p0ρ0+12(uL+uR)(10)其中ꎬp0ꎬρ0为任意大于零的参考压力和参考密度ꎮ为简化网络结构的输入输出关系ꎬ提高神经网络训练效果ꎬ降低采样难度ꎬ考虑将参考压力和参考密度设置为左右两侧压力㊁密度的较大值ꎬ即p0=max(pLꎬpR)ꎬρ0=max(ρLꎬρR)显然有0<pminp0ɤ1ꎬpmaxp0=1ꎻ0<ρminρ0ɤ1ꎬρmaxρ0=1(11)经过这样处理ꎬ5个输入特征中的2个特征确定为1ꎬ采样及训练时只须考虑其他3个不为1的输入特征ꎬ达到了简化网络结构的目的ꎮ值得注意的是ꎬ本方法研究对象为两气体问题ꎬ界面两侧流体的不同导致不能通过训练一个神经网络解决该问题ꎮ根据流体左右压力㊁密度的大小关系ꎬ共计有4种情况ꎬ须对应训练4个神经网络代理模型并综合使用ꎬ见表1ꎮ简化的神经网络标准化原理如图3ꎬ该图以pL<pRꎬρLȡρR的情况为例ꎬ神经网络选用2号神经网络ꎮ表1㊀各神经网络代理模型Table1㊀VariousneuralnetworkmodelsNo.relationofprelationofρneuralnetworkinputs1pL<pRρL<ρR{p-Lꎬρ-LꎬΔu-}2pL<pRρLȡρR{p-Lꎬρ-RꎬΔu-}3pLȡpRρLȡρR{p-Rꎬρ-RꎬΔu-}4pLȡpRρL<ρR{p-Rꎬρ-LꎬΔu-}图3㊀简化神经网络标准化原理示意图Fig.3㊀Illustrationoftheneuralnetworkaftersimplification因为每次计算都只会用到其中一个神经网络代理模型ꎬ相比于之前工作的神经网络模型[9]ꎬ简化后的神经网络模型降低了建模复杂度ꎬ同时也减小了计算量ꎬ可以提高计算效率ꎮ另外ꎬ根据前文介绍的性质ꎬ神经网络的输入经过了标准化映射ꎬ输出值也会变成标准化后的结果φ-L和φ-Rꎬ其中φ-R=-Δu--φ-LꎬΔu-=Δu/p0ρ0ꎬ为标准化后的速度差ꎮ须经过一个逆向映射得到φL63第2期刘子岩ꎬ等:可压缩两气体流动的简化神经网络模型和φRꎬ表达式为φL=u0φ-LꎬφR=u0φ-R(12)uI即可根据式(13)求出uI=12(φR-φL)+12(uL+uR)(13)2.3㊀训练样本生成神经网络模型的训练集通过一维多介质Riemann精确解算器生成ꎬ即求解非线性系统(4)ꎮ一般根据状态方程的具体表达形式ꎬ通过迭代方法获得界面压力解pIꎬ再根据函数fH(p)表达形式(5)获得神经网络的样本标签fL和fRꎮ对于本文关注的完全气体状态方程(2)ꎬ其压力迭代方式和求解流程可以参考文献[19]ꎮ采样范围根据2.2节的标准化映射方式而定ꎬ由式(11)ꎬ界面两侧流体压力的较大值映射为1ꎬ较小值映射为一个大于0㊁小于等于1的值ꎻ界面两侧流体密度的较大值映射为1ꎬ较小值映射为一个大于0㊁小于等于1的值ꎮ所以只需对压力㊁密度的较小值进行采样ꎮ本文采用均匀采样的方式ꎬ界面两侧流体的压力㊁密度的较小值在(0ꎬ1]的范围内各取11个点ꎮ标准化后的速度差Δu-与p0和ρ0的选取相关ꎬ无法映射到一个具体的有界范围内ꎬ因此需要选定一个较为合理的范围ꎮ在实际工况下ꎬ压力p0通常在105Pa的量级上ꎬ密度ρ0在1kg/m3的量级上ꎮ如果速度差的采样范围取在[-10ꎬ10]ꎬ即可覆盖[-3000m/sꎬ3000m/s]的范围ꎬ这能满足绝大部分实际工况的需求ꎮ所以速度差在[-10ꎬ10]的范围内取21个点ꎮ对样本数据的初始条件精确求解Riemann问题ꎬ并根据压力正项条件(Δu)critʉ2cLγL-1+2cRγR-1>Δu(14)去除其中的非物理解ꎬ将结果依次输出ꎬ即可得到训练神经网络需要的样本集ꎮ其中ꎬ(Δu)crit表示临界的速度差ꎬcL和cR表示左右声速ꎮ减少神经网络输入维度带来的最直接的好处是大幅压缩了样本量ꎮ简化前的网络结构共有5个输入量ꎬ在忽略非物理解数量的情况下共计11ˑ11ˑ11ˑ11ˑ21=307461个样本ꎮ而3个输入量的神经网络要达到同样的采样密度ꎬ只需要使用11ˑ11ˑ21=2541个样本ꎮ同时ꎬ简化的神经网络拟合难度更低ꎬ这将大大减少神经网络的训练耗时ꎬ提升该方法的应用价值ꎮ神经网络的训练优势及计算效果将在2.4节算例应用部分进行展示ꎮ2.4㊀神经网络模型的应用方式4个神经网络完成训练后将其相关参数输出ꎬ以数学表达式的形式编制成程序模块嵌入到PGFM计算框架中[9]ꎬ即可直接应用ꎮ对于某个具体的两气体Riemann问题ꎬ首先判断界面左侧的压力㊁密度大小关系ꎬ标准化后应用对应神经网络代理模型ꎬ计算得到φL和φRꎮ而后求解出界面速度uIꎬ即可通过PGFM定义虚拟流体状态ꎮ类似于反射边界条件ꎬ对于一维问题ꎬ定义界面左侧流场的虚拟流体状态为p∗=pR㊀ρ∗=ρR㊀u∗=2uI-uR(15)定义界面右侧流场的虚拟流体状态为p∗=pL㊀ρ∗=ρL㊀u∗=2uI-uL(16)上标∗表示虚拟节点处的状态量ꎮ对于多维问题ꎬ需要根据PGFM的原理ꎬ将预测的界面法向速度与已知的切向速度合成ꎬ构造虚拟流体速度分量ꎬ保持密度和压力的定义不变ꎮ定义界面左侧流场的虚拟流体状态为p∗L=pRꎬρ∗L=ρRꎬV∗L=VR+2(unꎬI-unꎬR)n(17)定义界面右侧流场的虚拟流体状态为p∗R=pLꎬρ∗R=ρLꎬV∗R=VL+2(unꎬI-unꎬL)n(18)这里的下标n表示界面法线方向ꎮ3㊀算例验证3.1㊀训练误差收敛效果本算例通过对比神经网络训练过程中误差的收敛速度和精度体现简化的神经网络结构的优势ꎮ假设左侧气体为空气(γL=1.4)ꎬ右侧气体为氦气(γR=1.667)ꎮ通过对比实验发现ꎬ神经网络隐含层层数为2ꎬ即可取得不错的拟合效果ꎮ为表述方便ꎬ本文使用M1 ̄M2 ̄M3 ̄M4的形式表示神经网络模型的规模ꎬ例如5 ̄10 ̄10 ̄2表示的是该神经网络模型输入量为5ꎬ输出量为2ꎬ含2个隐含层ꎬ每个隐含层各包含10个节点ꎮ本文中所有训练均采用PyTorch神经网络框架ꎬ优化过程使用adam优化器ꎮ73气体物理2024年㊀第9卷图4分别给出了隐含层包含5个节点的神经网络模型和包含40个节点的神经网络模型的两种网络结构训练效果对比ꎮ因为两种网络结构的训练集规模不同且相差较大ꎬ所以收敛对比图的横轴选为训练批量(batch)数而不是训练周期(epoch)数ꎻ纵轴loss为神经网络预测值与标签值的均方误差ꎮ具体计算式为LMSE=1Nð y-Fθ(x) 2(19)其中ꎬθ={wlꎬbl}Kl=1为神经网络各层权重和偏置参数ꎬFθ(x)为神经网络预测结果ꎬy为标签值ꎬN表示每个训练批量的样本个数ꎮ训练过程中学习率设定为0.0002ꎮ从图中结果可以反映出ꎬ3个输入量的神经网络模型在收敛速度上存在明显优势ꎮ5个输入量的神经网络模型也能达到同样的收敛精度ꎬ但是还需要花费相当多的训练步数ꎬ并且误差曲线依然存在明显的振荡ꎮ图中仅分别展示20000和5000个批量下的训练过程对比ꎮ(a)Neuralnetworkwith5nodesinthehiddenlayer(b)Neuralnetworkwith40nodesinthehiddenlayer图4㊀神经网络训练误差收敛图Fig.4㊀Convergenceofneuralnetworktrainingerrors采取同样的方式生成测试集来体现两种类型的神经网络代理模型计算效果ꎮ左侧流体的压力㊁密度在{0.25ꎬ0.45ꎬ0.65}中取值ꎬ速度在{-2.0ꎬ-0.5ꎬ1.0ꎬ2.5}中取值ꎻ右侧流体的压力㊁密度在{0.35ꎬ0.55ꎬ0.75}中取值ꎬ速度在{-2.5ꎬ-1.0ꎬ0.5ꎬ2.0}中取值ꎬ共计1296个测试样本ꎮ这些测试样本完全不同于训练样本ꎮ分别给出了两种类型的隐含层包含5个节点的神经网络模型和包含40个节点的神经网络模型在该测试集上的误差值ꎬ如图5所示ꎮ横坐标表示样本点编号ꎬ纵坐标表示网络预测值与精确解的绝对误差ꎮ(a)Neuralnetworkwith5nodesinthehiddenlayer(b)Neuralnetworkwith40nodesinthehiddenlayer图5㊀网络预测值与精确解绝对误差对比图Fig.5㊀Absoluteerrorsbetweenexactandpredictedvelocities该结果初步表明ꎬ简化的神经网络模型的计算精度并没有因输入特征维度及样本量的减少而下降ꎬ并且每个隐含层包含40个节点的神经网络模型的测试误差基本都在1%以下ꎮ3.2㊀一维气-气问题本节共选取两个一维空气-氦气问题测试各版本神经网络模型的计算效果ꎬ两个算例因初始状态的不同而产生不同的波系结构ꎮ83第2期刘子岩ꎬ等:可压缩两气体流动的简化神经网络模型算例1的初始无量纲参数为x<0.5:(γLꎬuLꎬpLꎬρL)=(1.4ꎬ-1.0ꎬ1.0ꎬ1.0)x>0.5:(γRꎬuRꎬpRꎬρR)=(1.667ꎬ1.0ꎬ1.0ꎬ1.38){在本算例中ꎬ物质界面两侧各产生一个稀疏波ꎬ运算到0.15终止ꎮ算例2的初始无量纲参数为x<0.45:(γLꎬuLꎬpLꎬρL)=(1.4ꎬ-1.0ꎬ1.0ꎬ1.0)x>0.45:(γRꎬuRꎬpRꎬρR)=(1.667ꎬ1.0ꎬ10.0ꎬ1.0){在本算例中ꎬ物质界面左侧会产生一个激波ꎬ界面右侧会产生一个稀疏波ꎬ运算到0.08终止ꎮ分别采用基于隐式迭代的标准PGFM以及两种结构的神经网络代理模型的PGFM进行求解ꎬ在0<x<1的计算域内共划分1000个计算网格ꎮ空间离散使用5阶WENO格式ꎬ时间离散使用3阶Runge ̄Kutta格式ꎮ两个算例的速度㊁压力㊁密度计算结果对比分别见图6和图7ꎮ图中ImplicitRS表示隐式迭代求解Riemann问题的方法ꎬ从图中可以看出ꎬ除5 ̄5 ̄5 ̄2㊁5 ̄10 ̄10 ̄2与3 ̄5 ̄5 ̄2等含较少神经元的神经网络出现了相对大的误差外ꎬ其他各网络均能较好地拟合标准PGFM结果ꎬ3 ̄40 ̄40 ̄2神经网络的计算结果几乎与标准PGFM计算结果完全重合ꎮ(a)Velocity(b)Pressure(c)Density图6㊀算例1计算结果对比Fig.6㊀Comparisonofcalculationresultsforcase1(a)Velocity(b)Pressure(c)Density图7㊀算例2计算结果对比Fig.7㊀Comparisonofcalculationresultsforcase293气体物理2024年㊀第9卷将算例2的界面处流体压力㊁速度和密度的部分神经网络预测结果与Riemann问题精确解进行对比ꎬ对相对误差定量统计ꎬ如表2所示ꎮ根据定量分析结果ꎬ简化的网络模型的误差甚至更小ꎮ表2㊀算例2相对误差定量统计表Table2㊀Quantitativeresultsofrelativeerrorsincase2physicalquantitysolution5 ̄10 ̄10 ̄23 ̄10 ̄10 ̄25 ̄40 ̄40 ̄23 ̄40 ̄40 ̄2pIexactsolution2.61265predictedsolution2.696192.630792.602562.61361relativeerror3.198%0.694%0.386%0.037%uIexactsolution-1.88304predictedsolution-1.82254-1.87015-1.89035-1.88242relativeerror3.213%0.685%0.388%0.033%ρILexactsolution1.93621predictedsolution1.854021.912841.940861.92968relativeerror4.245%1.207%0.240%0.337%ρIRexactsolution0.44701predictedsolution0.453510.446260.443870.44501relativeerror1.454%0.168%0.702%0.447%可见在计算一维问题时ꎬ简化的神经网络模型也能够在训练效率和计算效率领先的情况下和5个输入特征的神经网络模型保持相近的计算精度ꎮ3.3㊀二维气-气问题本算例模拟左行激波(Mas=1.22)扫过氦气气泡的过程ꎬ计算域如图8所示ꎬ该算例常被用于测试计算格式的性能ꎬ相关研究可参考文献[20]ꎮ计算域上下边界采用反射边界条件ꎬ左右边界采用无反射边界条件ꎬ网格密度为651ˑ179ꎬCFL数设定为0.5ꎮ初始无量纲条件和状态方程相关参数为air(I):(γIꎬuIꎬvIꎬpIꎬρI)=(1.4ꎬ0.0ꎬ0.0ꎬ1.0ꎬ1.0)air(II):(γIIꎬuIIꎬvIIꎬpIIꎬρII)=(1.4ꎬ-0.394ꎬ0.0ꎬ1.5698ꎬ1.3764)heliumbubble(III):(γIIIꎬuIIIꎬvIIIꎬpIIIꎬρIII)=(1.667ꎬ0.0ꎬ0.0ꎬ1.0ꎬ0.138)ìîíïïïïïïïï图8㊀空气中激波扫过氦气泡算例的计算域(单位:mm)Fig.8㊀Computationaldomainofanairshockimpingingonaheliumbubble(unit:mm)使用嵌入物理约束的40 ̄40规模的神经网络模型对本算例进行计算ꎬ空间离散使用5阶WENO格式ꎬ时间离散使用3阶Runge ̄Kutta格式ꎮ同时ꎬ也给出基于隐式迭代的标准方法计算结果作为对比ꎮ图9给出3种方法在第731ꎬ1207ꎬ1604ꎬ3998时间步的流场结果ꎬ图9(a)为5 ̄40 ̄40 ̄2神经网络代理模型与基于隐式迭代的标准PGFM的对比纹影图ꎬ图9(b)为3 ̄40 ̄40 ̄2神经网络代理模型与基于隐式迭代的标准PGFM的对比纹影图ꎮ从图中可以看出ꎬ激波从右向左扫过氦气泡ꎬ氦气泡在激波的作用下被压缩变形ꎬ并形成向四周扩散的膨胀波ꎮ膨胀波在上下壁面发生反射后进一步与气泡作用ꎬ最终形成复杂的波系结构ꎮ(a)5 ̄40 ̄40 ̄2NN&implicitRS04第2期刘子岩ꎬ等:可压缩两气体流动的简化神经网络模型(b)3 ̄40 ̄40 ̄2NN&implicitRS图9㊀激波扫过氦气泡算例纹影对比图Fig.9㊀Comparisonoftheschlierenforanairshockimpingingonaheliumbubble分析两个对比图ꎬ两种结构的神经网络与标准PGFM方法相比ꎬ均能清晰地反映波系结构ꎬ并不会产生明显的误差ꎮ可见在应用于二维问题时ꎬ简化的神经网络也能取得与5个输入量的神经网络相同的计算效果ꎮ4㊀结论本文基于之前提出的嵌入物理约束的可压缩多介质流神经网络模型ꎬ给出一种两气体流动的神经网络模型简化方法ꎮ首先详细介绍了在完全气体状态方程下输入特征从无界集到有界集的标准化映射方法ꎬ可提高神经网络模型的泛化能力ꎮ基于该标准化方法ꎬ通过选取较大压力㊁密度值作为参考压力㊁密度ꎬ可将神经网络的输入量从5个减少到3个ꎮ经过算例验证证实该方法的计算效果与5个输入量的神经网络模型相当ꎬ但神经网络的训练效果得到很大提高ꎮ另外ꎬ因为网络结构的简单化ꎬ计算效率也会进一步提高ꎬ该方法更加具备进一步开发的潜力ꎮ值得注意的是ꎬ目前该工作基于提到的完全气体状态方程具备的性质ꎬ因此目前只适用于两气体界面问题ꎮ对于含有其他状态介质的问题ꎬ还须继续展开相关研究ꎮ参考文献(References)[1]㊀刘铁钢ꎬ许亮.模拟多介质界面问题的虚拟流体方法综述[J].气体物理ꎬ2019ꎬ4(2):1 ̄16.LiuTGꎬXuL.Areviewofghostfluidmethodsformulti ̄mediuminterfacesimulation[J].PhysicsofGasesꎬ2019ꎬ4(2):1 ̄16(inChinese).[2]KawakamiKꎬKitaYꎬYamamotoY.Front ̄trackingsimu ̄lationofthewettingbehaviorofanimpingingdropletusingarelaxedimpermeabilityconditionandageneralizedNavierboundarycondition[J].Computers&Fluidsꎬ2023ꎬ251:105739.[3]OsherSꎬSethianJA.Frontspropagatingwithcurvature ̄dependentspeed:algorithmsbasedonHamilton ̄Jacobiformulations[J].JournalofComputationalPhysicsꎬ1988ꎬ79(1):12 ̄49.[4]LiuTGꎬKhooBCꎬYeoKS.Thesimulationofcom ̄pressiblemulti ̄mediumflow.I.Anewmethodologywithtestapplicationsto1Dgas ̄gasandgas ̄watercases[J].Computers&Fluidsꎬ2001ꎬ30(3):291 ̄314.[5]LiuTGꎬKhooBCꎬYeoKS.Ghostfluidmethodforstrongshockimpactingonmaterialinterface[J].JournalofComputationalPhysicsꎬ2003ꎬ190(2):651 ̄681.[6]许亮ꎬ冯成亮ꎬ刘铁钢.虚拟流体方法的设计原则[J].计算物理ꎬ2016ꎬ33(6):671 ̄680.XuLꎬFengCLꎬLiuTG.Designprinciplesofghostfluidmethod[J].ChineseJournalofComputationalPhy ̄sicsꎬ2016ꎬ33(6):671 ̄680(inChinese).[7]XuLꎬFengCLꎬLiuTG.Practicaltechniquesinghostfluidmethodforcompressiblemulti ̄mediumflows[J].CommunicationsinComputationalPhysicsꎬ2016ꎬ20(3):619 ̄659.[8]XuLꎬYangWBꎬLiuTG.Aninterfacetreatmentfortwo ̄materialmulti ̄speciesflowsinvolvingthermallyperfectgaseswithchemicalreactions[J].JournalofComputationalPhysicsꎬ2022ꎬ448:110707.[9]刘子岩ꎬ许亮.嵌入物理约束的可压缩多介质流神经网络模型[J].计算物理ꎬ2023ꎬ40(6):761 ̄769.LiuZYꎬXuL.Neuralnetworkmodelsofcompressiblemulti ̄mediumflowsembeddedwithphysicalconstraints[J].ChineseJournalofComputationalPhysicsꎬ2023ꎬ40(6):761 ̄769(inChinese).[10]XuLꎬLiuTG.Explicitinterfacetreatmentsforcompres ̄siblegas ̄liquidsimulations[J].Computers&Fluidsꎬ2017ꎬ153:34 ̄48.[11]RayDꎬHesthavenJS.Anartificialneuralnetworkasatroubled ̄cellindicator[J].JournalofComputationalPhy ̄sicsꎬ2018ꎬ367:166 ̄191.[12]FengYWꎬLiuTGꎬWangK.Acharacteristic ̄featuredshockwaveindicatorforconservationlawsbasedontrain ̄inganartificialneuron[J].JournalofScientificCompu ̄tingꎬ2020ꎬ83(1):21.14气体物理2024年㊀第9卷[13]FengYWꎬLiuTG.Acharacteristic ̄featuredshockwaveindicatoronunstructuredgridsbasedontraininganartifi ̄cialneuron[J].JournalofComputationalPhysicsꎬ2021ꎬ443:110446.[14]丘润荻ꎬ王静竹ꎬ黄仁芳ꎬ等.改进的物理融合神经网络在瑞利 ̄泰勒不稳定性问题中的应用[J].力学学报ꎬ2022ꎬ54(8):2224 ̄2234.QiuRDꎬWangJZꎬHuangRFꎬetal.Theapplicationofmodifiedphysics ̄informedneuralnetworksinRayleigh ̄Taylorinstability[J].ChineseJournalofTheoreticalandAppliedMechanicsꎬ2022ꎬ54(8):2224 ̄2234(inChi ̄nese).[15]MagieraJꎬRayDꎬHesthavenJSꎬetal.Constraint ̄awareneuralnetworksforRiemannproblems[J].JournalofComputationalPhysicsꎬ2020ꎬ409:109345. [16]WangJCꎬHickeyJP.FluxNet:aphysics ̄informedlearning ̄basedRiemannsolverfortranscriticalflowswithnon ̄idealthermodynamics[J].ComputerMethodsinAp ̄pliedMechanicsandEngineeringꎬ2023ꎬ411:116070. [17]RuggeriMꎬRoyIꎬMueterthiesMJꎬetal.Neural ̄net ̄work ̄basedRiemannsolverforrealfluidsandhighexplo ̄sivesꎻapplicationtocomputationalfluiddynamics[J].PhysicsofFluidsꎬ2022ꎬ34(11):116121.[18]XuLꎬLiuZYꎬFengYWꎬetal.Physics ̄constrainedneuralnetworksasmulti ̄materialRiemannsolversforcompressibletwo ̄gassimulations[J].JournalofCompu ̄tationalScienceꎬ2024ꎬ78:102261.[19]ToroEF.Riemannsolversandnumericalmethodsforfluiddynamics:apracticalintroduction[M].3rded.Ber ̄linꎬHeidelberg:Springerꎬ2009:151 ̄162.[20]CoralicVꎬColoniusT.Finite ̄volumeWENOschemeforviscouscompressiblemulticomponentflows[J].JournalofComputationalPhysicsꎬ2014ꎬ274:95 ̄121.24。
机械工程中的优化算法应用研究
机械工程中的优化算法应用研究在机械工程中,优化算法的应用研究主要集中在解决复杂问题和寻找最优解决方案上。
这些算法通过模拟自然界中的生物进化、群体行为等原理,或者采用数学建模等方式,能够在较短的时间内找到较好的解决方案。
以下是一些常见的优化算法及其在机械工程中的应用:1. 遗传算法:遗传算法是一种模拟生物进化过程的优化算法,通过选择、交叉和变异等操作,逐步逼近最优解。
在机械工程中,遗传算法可以用于解决结构设计、参数优化等问题。
例如,可以利用遗传算法对机械结构进行拓扑优化,以实现结构轻量化或提高结构性能等目标。
2. 粒子群优化算法:粒子群优化算法是一种模拟鸟群觅食行为的优化算法,通过粒子之间的信息共享和协作,寻找最优解。
在机械工程中,粒子群优化算法可以用于解决路径规划、机器人控制等问题。
例如,可以利用粒子群优化算法对机器人的运动轨迹进行规划,以实现避障、最短路径等目标。
3. 模拟退火算法:模拟退火算法是一种模拟固体退火过程的优化算法,通过模拟物体内部粒子的热运动过程,寻找全局最优解。
在机械工程中,模拟退火算法可以用于解决布局优化、调度等问题。
例如,可以利用模拟退火算法对工厂布局进行优化,以减少物料搬运成本和提高生产效率。
4. 神经网络优化算法:神经网络优化算法是一种基于人工神经网络的优化算法,通过训练神经网络模型来逼近最优解。
在机械工程中,神经网络优化算法可以用于解决故障诊断、预测等问题。
例如,可以利用神经网络对机械设备的运行状态进行监测和故障诊断,以提前发现潜在故障并采取相应的维修措施。
总之,随着计算机技术和人工智能技术的不断发展,优化算法在机械工程中的应用将会越来越广泛。
未来,将会有更多的智能优化算法被应用到机械工程中,为机械工程的发展带来更多的创新和突破。
BP神经网络以及径向基网络的研究RBF毕业论文
Chen等人提出的正交最小二乘(Orthogonal Least Squares,OLS)算法,每次选择对网络输出影响最大的输入数据作为隐节点的中心,逐个加入RBF网络中,直到适当的网络构造出来为止[23]。这种方法不存在数值病态问题,简单高效,但是选择出来的网络结构不一定是最简单的。Chen又提出了正则化正交最小二乘(Regularized orthogonal least squares, ROLS),把OLS方法和正则化方法相结合,可以训练出网络结构简单泛化、性能优越的RBF网络[24]。Mao使用OLS消除隐层各单元响应的相关性[25],从而每个RBF隐层神经元的分类能力可以分别估计,此方法选择的网络结构简洁,而且隐节点的中心具有很强的分类能力。
2006年,Barreto等人提出了RBF网络基因正交最小二乘算法[39],这个算法在同一层次上混合了正交最小二乘算法和基因算法,吸收了两原始算法的长处,训练出来的RBF网络比仅试用正交最小二乘算法训练出来的网络的泛化性能要优越,而且计算复杂度小于标准遗传算法。
(7)离群点
1995年Sánchez提出了一种针对离群点的RBF网络的鲁棒学习算法[40],用定标鲁棒代价函数(Scaled Robust Loss Function,SRLF)代替通常学习算法使用的平方代价函数,然后使用共轭梯度法完成非线性优化过程,但这种算法不能自动选择隐节点的中心。1999年Chien-Cheng等提出了一种新的鲁棒RBF神经网络[41],具有高效的学习速率,合理的网络结构,可以用于拟合常数值函数,并且对离群点具有鲁棒性。1999年,刘妹琴等提出了一种结合改进遗传算法的RBF网络鲁棒学习算法[42],可以提高RBF网络的泛化性能,消除噪声影响,揭示训练数据的潜在规律,但是该算法的复杂度比较高。
(完整word版)神经网络历史发展及应用综述个人整理(word文档良心出品)
人工神经网络历史发展及应用综述1、引言人类为了生存在改造探索自然的过程中,学会利用机械拓展自身的体力,随着对自然认识的不断深入,创造语言,符号,算盘、计算工具等来强化自身脑力。
复杂的数字计算原本是靠人脑来完成的,为了摆脱这种脑力束缚发明了计算机。
其数字计算能力比人脑更强,更快、更准。
计算机的出现,人类开始真正有了一个可以模拟人类思维的工具,期盼可以实现人工智能,构造人脑替代人类完成相应工作。
要模拟人脑的活动,就要研究人脑是如何工作的,要怎样模拟人脑的神经元。
人脑的信息处理具有大规模并行处理、强容错性和自适应能力、善于联想、概括、类比和推广的特点,多少年以来,人们从生物学、医学、生理学、哲学、信息学、计算机科学、认知学、组织协同学等各个角度企图获悉人脑的工作奥秘,寻求神经元的模拟方法。
在寻找上述问题答案的研究过程中,从20世纪40年代开始逐渐形成了一个新兴的边缘性交叉学科,称之为“神经网络”,是人工智能、认知科学、神经生理学、非线性动力学、信息科学、和数理科学的“热点”。
关于神经网络的研究包含众多学科领域,涉及数学、计算机、人工智能、微电子学、自动化、生物学、生理学、解剖学、认知科学等学科,这些领域彼此结合、渗透,相互推动神经网络研究和应用的发展。
2、定义思维学普遍认为,人类大脑的思维有三种基本方式,分为抽象(逻辑)思维、形象(直观)思维和灵感(顿悟)思维。
逻辑性的思维是根据逻辑规则进行推理的过程,这一过程可以写成指令,让计算机执行,获得结果。
而直观性(形象)的思维是将分布式存储的信息综合起来,结果是忽然间产生想法或解决问题的办法。
这种思维方式的有以下两个特点:一是信息通过神经元上的兴奋模式分布储在网络上;二是信息处理通过神经元之间同时相互作用的动态过程来完成的。
人工神经网络就是模拟第二种人类思维方式。
人工神经网络是由大量具备简单功能的人工神经元相互联接而成的自适应非线性动态系统。
虽然单个神经元的结构和功能比较简单,但大量神经元连接构成的网络系统行为却异常复杂。
【国家自然科学基金】_间歇训练_基金支持热词逐年推荐_【万方软件创新助手】_20140802
2011年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
2011年 科研热词 骨骼肌 大鼠 动物实验 鼠 非线性动态系统建模 雷帕霉素 间歇性运动 间歇反应过程 运动 蛋白激酶c 脂联素 胰岛素抵抗指数 耐力运动 线粒体融合 线粒体分裂 甘油三酯 游泳运动 游泳训练 海马 支持向量机 总胆固醇 孤束核 多输出非线性回归 启发式训练 低强度间歇性运动 c-fos b样条神经网络 推荐指数 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
科研热词 推荐指数 鼠 3 动物实验 3 降钙素基因相关肽 2 间歇训练 2 运动预适应 2 大鼠 2 骨骼肌 1 间歇性速度训练 1 血液 1 背根神经节 1 耳鸣 1 耐力训练 1 缺血预适应 1 纹状体 1 电生理 1 游泳 1 海马 1 水杨酸钠 1 持续训练 1 心脏 1 听觉皮层 1 下丘脑室旁核 1 sco2 1 p53-sco2-coxⅱ-有氧呼吸轴 1 p53 1 coxⅱ 1 camp 1 c-fos蛋白 1 c-fosmrna 1
推荐指数 3 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2013年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
科研热词 间歇过程 鼠 心肌梗死 动物实验 主元分析 高强度间歇有氧运动 骨骼肌 雷帕霉素 陶粒 阶段不等长 间歇有氧运动 间歇式 过程控制 获得性无助 肌肉抑制素 统计模量 粉煤灰 穿梭箱逃避反应 磷酸化 游泳 混凝土 氟西汀 核糖体蛋白s6激酶 核糖体蛋白s6 核主元回归 数值模拟 故障诊断 故障检测 持续有氧运动 抑郁动物模型 心功能 城市污水脱氮 双u型混凝土储热桩 加权迭代学习的控制 中强度持续有氧运动 一氧化氮合酶 β 3-ar k-均值聚类 icr小鼠 gambit fluent
MATLAB中的神经网络模型构建与训练
MATLAB中的神经网络模型构建与训练神经网络模型是一种模拟人脑神经元活动的数学模型,其可以用于进行各种复杂的数据分析和问题求解。
在MATLAB中,我们可以利用其强大的工具和函数来构建和训练神经网络模型。
本文将介绍MATLAB中神经网络模型的构建过程及其相关训练方法。
一、神经网络模型简介神经网络模型是由一系列相互连接的神经元组成的网络结构。
每个神经元都有多个输入和一个输出,输入通过权重被加权后,经过激活函数激活输出。
神经网络可以分为三层:输入层、隐藏层和输出层。
输入层接收原始数据,隐藏层进行信息处理和特征提取,而输出层给出最终结果。
二、神经网络构建在MATLAB中,可以通过Neural Network Toolbox来构建神经网络。
首先,我们需要确定网络结构,包括输入层神经元数、隐藏层神经元数和输出层神经元数。
接下来,我们调用network函数来创建一个空的神经网络对象。
```matlabnet = network;```然后,我们可以通过net的属性来设置神经网络的各个参数,如输入层的大小、隐藏层的大小、激活函数等。
```matlabnet.numInputs = 1; % 设置输入层神经元数net.numLayers = 2; % 设置网络层数net.biasConnect = [1; 1]; % 设置偏置net.inputConnect = [1; 0]; % 设置输入连接yerConnect = [0 0; 1 0]; % 设置层连接net.outputConnect = [0 1]; % 设置输出连接yers{1}.size = 10; % 设置隐藏层神经元数yers{1}.transferFcn = 'tansig'; % 设置激活函数yers{2}.transferFcn = 'purelin'; % 设置激活函数```上述代码中,我们设置了一个具有10个隐藏层神经元的神经网络,其输入和输出分别为1个。
人类大脑神经元连接网络建模及其动态模式分析
人类大脑神经元连接网络建模及其动态模式分析人类大脑是自然界中最为复杂的生物系统之一,其中神经元起着关键的作用。
神经元之间通过突触相连,形成了一个复杂的网络结构。
了解人类大脑神经元连接网络的建模和动态模式分析对于我们理解大脑功能和神经系统疾病的发生机制具有重要意义。
建立人类大脑神经元连接网络模型需要从多个层面进行研究。
首先,需要获取大脑神经元连接的解剖数据,例如神经元的位置、突触连接的形式等。
通过现代神经科学技术,如电镜扫描和跨尺度成像,可以获得高分辨率的神经元网络数据。
其次,需要构建一个可行的计算模型来模拟神经元之间的连接关系。
常用的网络模型包括随机网络模型、小世界网络模型和尺度自由网络模型等。
这些模型可以基于实际的神经元连接数据进行参数化,并通过计算机仿真来模拟神经元网络的动态行为。
神经元网络的动态模式分析是研究人类大脑运作方式的重要手段之一。
通过模拟大脑神经元网络的动力学过程,可以揭示其复杂的信息传递和处理机制。
一种常用的分析方法是利用动力学模型来模拟神经元之间的相互作用。
例如,震荡模型可以用来分析大脑中的同步现象,如γ波和θ波的产生机制。
另外,耦合模型也可以用来研究神经元网络中的信号传播速度和时空动态特性等。
神经元连接网络的动态模式分析还可以应用于探索神经系统疾病的发生机制。
许多神经系统疾病,如帕金森病和癫痫,与神经元网络中的异常连接和功能紊乱有关。
通过比较正常人脑与疾病患者的神经元连接网络模型,可以发现异常连接和功能模式,并揭示其疾病发生的机制。
这为神经系统疾病的早期诊断和治疗提供了关键线索。
此外,神经元连接网络的动态模式分析还对于人工智能领域具有重要意义。
人脑作为一种智能系统,其神经元网络的复杂结构和动态模式可能提供了一种启示,有助于设计更加高效的人工智能算法和模型。
例如,可以借鉴神经元网络的同步和异步机制,设计用于解决优化和学习问题的算法。
此外,神经元网络的拓扑结构和信息传递模式也可以启发我们构建更加智能化的通信网络和分布式系统。
神经网络控制系统教程PPT(MATLAB基于Simulink的三种典型神经网络控制系统学习资料)
1. 基于传统控制理论的神经控制将神经网络作为传统控制系统中的一个或几个部分,用以充当辨识器,或对象模型,或控制器,或估计器,或优化计算等。这种方式很多,常见的一些方式归纳如下:
22
(a)
(b)
图3-3 神经直接逆动态控制系统
1).神经直接逆动态控制神经直接逆动态控制采用受控对象的一个逆模型,它与受控对象串联,以便使系统在期望响应(网络输入
22
(2)神经间接自校正控制间接自校正控制一般称为自校正控制。自校正控制是一种利用辨识器将对象参数进行在线估计,用控制器实现参数的自动整定相结合的自适应控制技术,它可用于结构已知而参数未知但恒定的随机系统,也可用于结构已知而参数缓慢变化的随机系统。
图3-4 神经自校正控制系统
22
神经自校正控制结构如图3-4所示,它由一个自校正控制器和一个能够在线辨识的神经网络辨识器组成。自校正控制器与被控对象构成反馈回路,根据神经网 络辨识器和控制器设计规则,以得到控制器的参数。 可见,辨识器和自校正控制器的在线设计是自校正控 制实现的关键。
22
上述两种分类并无本质差别,只是后者划分更细一些,几乎涉及到传统控制、系统辨识。滤波和预报等所有方面,这也间接地反映了随着神经网络理论和应用研究的深入,将向控制领域、信息领域等进一步透。为了更能从本质上认识神经网络在实现智能控制中的作用和地位。1998年李士勇将神经网络控制从它与传统控制和智能控制两大门类的结合上考虑分为两大类:即基于传统控制理论的神经控制和基于神经网络的智能控制两大类。
神经网络控制系统
1
神经网络控制理论基于Simulink的三种典型神经网络控制系统
神经网络发展至今已有半个多世纪的历史,概括起来经历了三个阶段:20世纪40 60年代的发展初期; 70年代的研究低潮期;80年代,神经网络的理论研究取得了突破性进展。神经网络控制是将神经网络在相应的控制系统结构中当做控制器或辨识器。神经网络控制的发展,虽仅有十余年的历史,但已有了多种控制结构。
对训练BP神经网络的步骤进行总结
对训练BP神经网络的步骤进行总结训练多层反向传播(BP)神经网络是一种常用的机器学习算法,用于解决分类、回归等问题。
BP神经网络具有良好的非线性建模能力和逼近能力,但其训练过程较为复杂。
下面是BP神经网络的训练步骤的详细总结。
1.数据准备:训练BP神经网络首先需要准备训练数据集,包括输入数据和目标输出数据。
输入数据是网络接收的输入特征,而目标输出数据是对应的期望输出结果。
这些数据应该经过预处理,如归一化或标准化,以确保数据在合适的范围内。
2.网络结构定义:定义BP神经网络的结构,包括网络的层数、每层的神经元数量以及神经元之间的连接权重。
网络的结构设计需要根据具体问题的性质和需求进行选择,一般包括输入层、隐藏层和输出层。
3.初始化网络参数:初始化网络参数,包括各层之间的连接权重和偏置项的取值。
通常可以随机初始化这些参数。
4.前向传播:输入数据通过网络的前向传播过程,从输入层经过隐藏层到达输出层。
在前向传播过程中,每个神经元接收到输入信号后,根据激活函数计算输出值并传递给下一层。
5.计算误差:计算网络的输出误差,通过将网络的实际输出与期望输出进行比较得到。
常用的误差函数包括均方误差(MSE)和交叉熵误差等。
6.反向传播:反向传播是BP神经网络的关键步骤,通过计算每个连接权重对误差的贡献来调整网络参数。
首先,计算输出层的误差,然后逐层向后传递误差,计算隐藏层和输入层的误差。
这个过程利用链式法则计算每个神经元的误差,并保存在反向传播过程中用于更新权重的临时变量中。
7.更新权重和偏置项:根据反向传播过程中计算得到的误差,使用梯度下降法或其他优化算法来更新网络中的权重和偏置项。
通过调整权重和偏置项来最小化总体误差,以提高网络的性能。
8.重复迭代训练:通过重复迭代上述步骤,直到网络达到预定的停止条件。
通常,可以设定一个最大的迭代次数,或者当误差降低到一定程度时停止训练。
9.结果评估:训练完成后,使用测试数据验证网络的性能。
【国家自然科学基金】_反应器模型_基金支持热词逐年推荐_【万方软件创新助手】_20140801
补血机理 1 蓄热 1 萘 1 苯乙酮 1 苯 1 膜污染 1 脱除so2/no, 1 脱硫效率 1 聚丙烯超滤膜 1 聚丙烯超 1 聚丙烯 1 聚(n-异丙基丙烯酰胺-co-丙烯酸)1 联苯 1 耦合流化床反应器 1 耦合 1 结构逼近式神经网络 1 结构逼近式混合神经网络 1 终还原 1 细菌氧化预处理 1 组织工程 1 纯碱 1 级间构件 1 约束优化 1 红酵母 1 粒群衡算 1 粒径分布 1 等效电路模型 1 竖炉 1 空隙率 1 离散小波变换 1 神经网络 1 碳酸化分解 1 碳化塔 1 短程硝化 1 电子计算机 1 甲醇水蒸气重整 1 甲醇 1 甲烷蒸气重整 1 甲烷催化燃烧 1 甲烷 1 生物除磷 1 生化反应器 1 环流反应器 1 环氧乙烷 1 燃料乙醇 1 照度分布 1 烯烃 1 热对流 1 热化学储能 1 烟气脱硫 1 潜流湿地 1 滴定 1 深度加氢脱硫 1 液液相平衡 1
邻硝基甲苯 通量分布系数 逆流湍动床 连续搅拌釜反应器 连续制氢 连续催化重整 还原竖炉 近红外 过程模型 过氧化氢 输出跟踪 输入干扰模型 软测量模型 超燃冲压发动机 超临界二氧化碳 超临界co2 超临界 费托合成 计算机应用 解析 螺旋藻 藻体干重 蔗糖 蒸发 萃取方法 苯酚 节能降耗 致灾性气体 自絮凝酵母细胞 自养脱氮 膜生物反应器 膜反应器 脂肪干细胞 能量平衡 胞外多糖 肝样细胞 肝损伤 聚团 聚丙烯 耦合流化床; 固含率轴向分布; 密相区; 相似 群体平衡模型(pbm) 络合反应-反胶团 结焦 结构逼近式神经网络 细胞接种 约束显示 约束分解 絮凝退化现象 紫外光化学反应器 简化机理 等温吸附 笺流体力学 空速 稳定逆
107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160
【国家自然科学基金】_反应器网络_基金支持热词逐年推荐_【万方软件创新助手】_20140801
科研热词 microrna 靶基因预测 靶基因 阳离子聚合反应器 资源分配网络 药物新功能预测 药物-药物网络 膜通量 膜生物反应器 肝脏干细胞 网络分析 网络 综述文献 结块故障 组织工程 红花 粒子群优化 电荷传输 生理通路关联网络 生物可降解材料 生物反应器 状态空间 激活函数 流化床 气含率 正交最小二乘算法 模型预测控制 模块化分析 心血管疾病 径向基神经网络 广义pi控制 声纹特征 反应器网络 动态输出反馈 剪枝策略 分布参数系统 分子指纹 充填浮选柱 傅立叶神经网络 低频声波 优化设计 人工神经网络 二维反应器模型 二次有界 乙肝 主成分分析法 丹酚酸b 不确定系统 三维培养 rbf神经网络 hbv蛋白 go
2012年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
推荐指数 1 1 1 1 1 1 1 1 1 1 1 1 1
2011年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
2011年 科研热词 非线性动态系统建模 集总 间歇反应过程 耦合反应器 粒子群优化 神经网络 碳转化率 环管反应器 玉米秸秆 煤气化 模糊理论 模型预测控制 植物纤维床反应器 故障诊断 循环喷淋 多点式棉纤维床反应器 回声状态网络(esn) 反馈校正 反应器网络模型 半纤维素 动力学 代谢通量分布 丙酸 cstr b样条神经网络 推荐指数 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
化工间歇反应过程产品质量预测建模
化工间歇反应过程产品质量预测建模化工间歇反应过程是化学工业生产中常见的一种重要方式,该过程具有反应时间长、温度变化大、物质浓度变化大、控制难度大等特点,对产品质量的影响十分显著。
因此,化工间歇反应过程产品质量的预测建模在化学工业生产中具有重要意义。
化工间歇反应过程的产品质量预测建模是指通过对反应过程中的反应动力学、传热传质、流体动力学等过程进行研究分析,建立反应过程与产品质量之间的数学模型,通过模型预测和优化控制反应过程,提高产品质量和生产效益。
下面将分别从反应动力学、传热传质、流体动力学三个方面进行阐述。
一、反应动力学反应动力学是化学反应过程中最基础的物理过程之一,研究的是反应速率与反应物浓度及温度、压力等因素的关系,并建立反应速率方程。
在化工间歇反应过程中,反应速率方程的建立对产品质量的预测具有重要作用。
对于复杂的化工反应,反应速率方程往往难以确定。
因此,需要通过试验方法获取及处理反应数据,根据动力学及热力学原理建立数学模型。
常用的建模方法包括:非线性回归分析、神经网络、遗传算法、粒子群优化等方法,以成倍增加建模的精度和独特性。
二、传热传质传热传质是化工反应过程中的重要过程之一,主要表现为热量、质量和动量传递。
反应器容器A、B两部分之间存在着传热传质现象,传热传质过程的不稳定性对产品质量的影响十分显著。
因此,需要建立传热传质模型,预测反应器内的传热传质状态,优化反应器设计,进而提高反应器生产效率和产品质量。
传热传质模型的建立主要包括两个方面:一是建立传热传质方程,计算热量、质量和动量的传递过程;二是建立传热传质模型修正方程,实现优化反应器设计。
传热传质模型能够有效预测反应过程中各种因素的变化,包括反应器内的温度、流量及反应物的分布,从而提高产品质量。
三、流体动力学流体动力学是化工反应过程中较为复杂的物理过程之一,研究的是流体的流动规律和物理特性,包括速度、压力和密度等。
化工反应过程中的流体动力学主要涉及配管、搅拌、气液传质等问题,对产品质量的影响非常大。
人脑仿真模型的神经网络构建方法教程
人脑仿真模型的神经网络构建方法教程人脑是自然界最为复杂、精密的信息处理系统之一。
近年来,随着计算机科学和神经科学的发展,人们对于人脑的研究也取得了重要的突破,其中一个重要的研究方向就是人脑仿真模型的构建。
人脑仿真模型是通过模拟人脑神经元之间的连接和电信号传递来模拟人脑的运作机制。
在这篇文章中,我们将介绍一种常用的神经网络构建方法,以帮助读者了解人脑仿真模型的实现过程。
首先,构建人脑仿真模型的第一步是选择合适的神经元模型。
神经元是人脑的基本组成单元,负责信息的传递和处理。
常用的神经元模型有LIF(Leaky Integrate-and-Fire)模型和Hodgkin-Huxley模型等。
LIF模型简化了神经元的电流和电压传递,适用于大规模网络模拟;而Hodgkin-Huxley模型更为复杂,能够更精确地描述神经元的生理特性。
接下来,我们需要考虑神经元之间的连接方式。
人脑中神经元之间的连接方式非常复杂多样,涉及到兴奋性和抑制性的突触连接。
在仿真模型中,我们可以使用随机连接、全连接或者特定模式的连接来模拟不同类型的神经回路。
这些连接方式可以通过设置权重值来调节连接的强度。
另外一个关键的步骤是确定神经网络的拓扑结构。
自然界中的神经网络具有高度复杂的结构,比如皮层、小世界网络和无标度网络等。
在仿真模型中,我们可以选择简化的拓扑结构,如全连接网络、WS(Watts-Strogatz)网络或者BA(Barabasi-Albert)网络等。
选择适当的拓扑结构可以更好地模拟人脑的特性和功能。
在构建神经网络模型时,我们还需要考虑神经元之间突触连接的类型。
突触是神经元之间信息传递的关键部分,根据突触传递的类型,可以将其分为化学突触和电子突触。
化学突触是通过神经递质的释放来传递信息,而电子突触则是通过电流传递来实现。
合理选择突触类型,可以进一步提高人脑仿真模型的真实性。
除了以上提到的主要步骤外,还有一些辅助的工具和方法可以用于人脑仿真模型的构建。
大脑神经网络连接建模
大脑神经网络连接建模大脑是人类最神秘、最复杂的器官之一,其中神经网络的表现和功能一直是研究人员关注的焦点。
大脑神经网络连接建模是一种通过模拟大脑神经元之间的连接、传递和处理信息的过程,来解析大脑认知活动的方法。
大脑是由上百亿个神经元组成的,它们之间通过神经突触进行信息传递。
通过建立神经网络连接模型,研究者可以更好地理解大脑的工作原理,揭示认知和行为的基本机制。
神经网络连接建模的关键是建立神经元之间连接的拓扑结构。
大脑的神经网络是高度复杂、互连的,可以分为多个脑区和亚区,每个区域都有不同的功能和特性。
因此,研究者需要根据不同脑区的特点来构建连接模型,以便更好地模拟大脑的整体工作过程。
在建模过程中,研究者通常通过采集大脑的结构和功能数据来获取连接信息。
结构数据包括脑区的解剖特征、体积和形状等,而功能数据则反映了大脑在特定任务下的活动模式。
这些数据可以通过核磁共振成像(MRI)和脑电图(EEG)等技术获取。
建立连接模型后,研究者需要进行大脑功能网络的分析和探索。
他们可以使用图论、复杂网络理论和机器学习等方法,来研究神经网络的拓扑结构、节点之间的关联和信号传递等特征。
通过这些分析方法,研究者可以揭示大脑网络的特性,如小世界结构、高度聚集性和无标度网络特性等。
此外,大脑神经网络连接建模还可用于探索大脑疾病的机制和治疗方法。
例如,研究者可以对比正常大脑和病理大脑的连接模型,发现病理性变化的特征和变化。
这有助于理解疾病的发病机制,并为相关疾病的诊断和治疗提供依据。
除了理论模型外,研究者还可以利用计算机模拟来研究大脑神经网络的连接和功能。
计算机模拟可以模拟大脑中的庞大神经网络,通过调整不同的参数和拓扑结构,来探索不同条件下神经网络的行为和功能。
总之,大脑神经网络连接建模是研究者解析大脑认知机制的重要手段。
通过构建神经网络的连接模型,分析网络的拓扑结构和功能特征,研究者可以更好地理解大脑的工作原理和机制。
这项研究对于认知科学、神经科学和临床医学都具有重要意义,有望为人类认知和大脑疾病的研究提供新的思路和方法。
prenet公式原理
prenet公式原理
Prenet是一种神经网络结构,通常用于序列到序列的模型中,
例如语音识别、机器翻译和语音合成等任务中。
Prenet的主要原理
是通过多层感知器(MLP)来对输入数据进行预处理,以提取有用的
特征并减少噪音,从而提高模型的性能和泛化能力。
Prenet的结构通常包括两个或多个全连接的隐藏层,每个隐藏
层都使用非线性激活函数(如ReLU或sigmoid)来处理输入数据。
这些隐藏层可以帮助网络学习输入数据的复杂特征,并且通过多层
结构可以逐渐提取更高级别的抽象特征。
Prenet的输出通常会被用
作后续模型的输入,例如用于注意力机制或解码器。
在语音识别任务中,Prenet通常被用来对音频信号进行预处理,以提取语音中的特征并减少噪音的影响。
在机器翻译任务中,
Prenet可以用来对源语言句子进行编码,以提取句子中的语义信息。
在语音合成任务中,Prenet可以用来对文本进行编码,以提取需要
合成语音的语义和语调信息。
总的来说,Prenet的原理是通过多层感知器对输入数据进行预
处理,以提取有用的特征并减少噪音,从而提高后续模型的性能和
泛化能力。
它在序列到序列的模型中发挥着重要作用,为模型提供了更好的输入表示。
煤直接液化间歇反应器性能的人工神经网络模拟
煤直接液化间歇反应器性能的人工神经网络模拟杨中凯;刘辉;李建伟;李成岳【期刊名称】《煤化工》【年(卷),期】2007(35)2【摘要】鉴于煤直接液化反应的复杂性和机理模型难以建立、计算量大等,结合人工神经网络建模方法,建立了煤直接液化间歇反应器的BP神经网络模型,并利用统计极差分析方法考察了影响反应器煤转化率、油收率及综合评价3个指标的8个关键因素的敏感程度.结果表明,训练完成的BP神经网络模型不仅能很好地拟合已知实验结果,而且具有良好的预测能力,预测结果的平均相对误差为3.75%;当煤为烟煤或亚烟煤、溶剂分别为萘满(1,2,3,4-四氢化萘)或循环溶剂时,综合评价给出的影响因素的敏感性顺序为:温度>反应时间>剂煤比>煤粒度>氢分压和填充程度>煤类型>溶剂类型.【总页数】4页(P27-30)【作者】杨中凯;刘辉;李建伟;李成岳【作者单位】北京化工大学化工资源有效利用国家重点实验室,北京,100029;北京化工大学化工资源有效利用国家重点实验室,北京,100029;北京化工大学化工资源有效利用国家重点实验室,北京,100029;北京化工大学化工资源有效利用国家重点实验室,北京,100029【正文语种】中文【中图分类】TQ529【相关文献】1.带多台侧反应器的间歇反应精馏生产氯化苄非稳态模拟与过程设计 [J], 孙玉玉;汤吉海;陈献;崔咪芬;费兆阳;乔旭2.煤直接液化反应器循环杯的数值模拟及优化 [J], 张传江;韩来喜;蒋雪冬;许明;门卓武3.强制内循环煤直接液化反应器流动性能的冷模与热模试验 [J], 任相坤;房鼎业;刘辉4.煤直接液化浆态反应器内气-浆流动与反应的CFD模拟 [J], 李军;王腾;郭晓峰;周强;陈彩霞5.人工神经网络在UASB反应器处理生活污水中的模拟预测与应用 [J], 易赛莉;雒文生因版权原因,仅展示原文概要,查看原文内容请购买。
基于神经网络技术的间歇过程建模与优化控制方法
基于神经网络技术的间歇过程建模与优化控制方法
冯恩波;俞金寿
【期刊名称】《华东化工学院学报》
【年(卷),期】1992(018)A00
【摘要】将整个间歇生产过程表达成梯形的神经网络群,利用实际操作数据对整个网络群进行学习。
同时研究了具有滚动运算特征的在线优化策略,该法完全避免了非线性系统实时辩识和建立优化模型的困难。
对发酵生产过程的仿真结果,表明本文方法是有效的。
【总页数】6页(P113-118)
【作者】冯恩波;俞金寿
【作者单位】不详;不详
【正文语种】中文
【中图分类】TQ920
【相关文献】
1.多产品间歇过程调度问题的建模与优化 [J], 曹瑞金;俞欢军;胡上序
2.不确定性间歇过程的一种实时优化控制方法 [J], 叶凌箭;马修水;宋执环
3.基于神经网络技术的间歇过程建模与优化控制方法 [J], 冯恩波;俞金寿;蒋慰孙
4.间歇过程综合预测迭代学习控制方法基于二维理论的分析(英文) [J], 陈宸;熊智华;钟宜生
5.基于人工神经网络技术的板料拉深成形工艺优化的数值建模 [J], 潘江峰;钟约先;袁朝龙;罗捷
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 1 间歇反应过程描述 间歇反应过程[ 6 7] 包括间歇反应器和夹套换热
系统。典型的间歇过程如图 1 所示。该过程包括两 个并行的高度放热的反应, 反应为搅拌充分、液相 定容过程。
dM A dt
=-
k1 M A M B -
k2 M A M C
dM B dt
=-
k1 M A M B
化学反应过程的模型描述普遍存在着 上述特 点, 可以被分解成非线性静态和线性动态两部分, 因而可以使用结构逼近式混合神经网络来建模。反 应器中的非线性因素主要表现在反应速率常数 k 的 Arrhenius 方程中, 如式 ( 3) 。该非线性代数方程 描述了反应速率函数与反应温度和反应物浓度之间 的静态关系, 当把此非线性因素 R= f ( X) 作为系 统的内部输入变量来考虑, 这类系统便转化为一个 线性动态系统。结合式 ( 1) ~ 式 ( 4) 构建混合神 经网络, 如图 3 所示, 该混合网络由两部分组成, 一部分 为非线 性部分, 采用 BSNN 描述式 ( 3) 、 式 ( 4) ; 其输入为系统的状态向量, 输出为反应速 率函数; 另一部分为动态网络, 注意到对于间歇反 应, 也包括 CST R 等反应, 线性 部分的状 态空间 形式中的状 态转移 矩阵都 是以对 角的形 式出 现, 同时考虑到系统的动态行为, 采用线性 DRNN 描 述式 ( 1) 、式 ( 2) , 该网络由输入层、普通隐含 层、带有 对角 反馈 权 值 的状 态 隐 含层 和 输 出层 组成。
温度。间歇过程的动态过程由式 ( 1) 、式 ( 2) 表
示。MA 、M B 、MC 和 MD 的初始值分别为 12、12、 0、0 km ol。T j 和 T r 的初始温度均为 20 ∀ 。反应温
度和夹套温度的变化范围为 20~ 120 ∀ , 间歇反应
器反应温度的参 考值设定在 92 0 ∀ 。其他过程参
关键词: 结构逼近式混合神经网络; 间歇反应器; 建模; 串联混合神经网络
中图分类号: T Q 31- 1157 ( 2008) 04- 0958- 06
Modeling of batch reactor based on structure approaching hybrid neural networks approach
实际化工过程中存在这样一类非线性对象, 其 非线性因素 R= f ( X) 具有稳态的可分离特性, 它 是系统状态变量的非线性函数, 可使用非线性代数 方程描述。若把 R 作为系统的内部输入变量来考 虑, 则这类对象便可转化为线性系统。因此, 可以 采用线性状态空间描述方法来描述这类非线性系统
X = L1 ( R) + L 2 ( U) , R = f ( X)
Received date: 2007- 05- 09. Corresponding author: LI X iaogu ang. E- mail: 2004080102 @ grad buct edu cn Foundat ion item: support ed by t he N at ion al N at ural Science Foundati on of Ch ina ( 60704011) .
第 59 卷 第 4 期 2008 年 4 月
化
工
学
报
Jo urnal o f Chemical Indust ry and Eng ineering ( China)
V ol 59 N o 4 A pr il 2008
研究论文
利用结构逼近式混合神经网络 实现间歇反应器的建模
曹柳林, 李晓光, 王 晶
数见文献 [ 6] 。
2 结构逼近式混合神经网络模型
图 1 间歇反应过程 F ig 1 Diag ram of batch reactor process
反应过程为
A + B k1 C k2
A+ C D
其中, A 和 B 分别代 表原料, C 和 D 分别 代表主 产物 和 副 产 物; k1 、k2 为 反 应 速 率 常 数, 符 合 A r r h en iu s方程 。 1 2 数学模型
dMC dt
=+
k 1 MA MB -
k2 M A M C
dMD dt
=+
k2 M A M C
( 1)
能量平衡方程
dTr = dt
[- H 1 k1 M A M B - H 2 k 2 MA M C ] + UA T j - T r ( M A + MB + M C + M D ) Cp r
( 2)
第4期
曹柳林等: 利用结构逼近式混合神经 网络实现间歇反应器的建模
# 959 #
然而由于间歇过程 的强非线性、缺少稳态操 作条 件、反应过程的不确定性、未知扰动、过程变量的 限制, 不易建立准确的数学模型, 进而难于实施自 动控制。因此, 间歇反应过程建模是现在研究的热 点和难点。建立间歇反应过程的数学模型一般通过 3 种方式: 一是利用机理和实验的方法得到系统的 数学模型[ 1] ; 二是利用单一和混合神经网络方法来 获得过程的黑箱模型[ 2] ; 三是将机理模型和神经网 络方法相结合, 利用神经网络对机理模型当中的某 个时变参数进行估 计, 得到 系统的 灰箱模型[ 3 5] 。 在第二、三种建模方法的基础之上, 本文提出了一 种新的混合神经网络建模方法: 结构逼近式混合神 经网络 ( SAH NN) 。基于这 种方法, 对一类 典型 的间歇反应建立了数学模型, 并和两种不同类型的 混合神经网络模型作了比较说明, 证明了方法的有 效性。
Abstract: A new hybrid neural netw or ks mo deling approach, named st ruct ure appro aching hy brid neural net w ork ( SAH NN ) is pr esent ed in t his paper T he characteristics and str ucture of t his appro ach are int roduced T he approach w hich co mbines f irst principles model w it h neural net w orks f ully ut ilizes st ruct ural infor matio n of know n nonlinear syst em , makes neural net w orks a g rey box !, describes and ex plains t he consequence relation o f syst em variables in a bet t er w ay A det ailed analysis o f SA H NN modeling w as perf orm ed Considering delayed measurem ent of out put s, simulat io n of a chemical bat ch react or w as perfo rmed and co mparison o f t w o t ypes of hybr id neural net w ork ( H NN ) w as m ade T he result s o f simulat io n and compar ison sho w ed t hat t he appro ach w as a pr omising t ool to mo del complicat ed no nlinear sy st em ef fect ively and could be ut ilized as a vehicle t o co nt rol and o pt imize chemical react ors.
Key words: SAH NN; bat ch react or; modeling; H NN
引言
间歇反应过程在化学过程工业中占有十分重要
的地位。间歇过程具有灵活多变的特性, 可以用同 一套多用途、多功能的设备生产多种类型的产品, 特别适合聚合物、生物制品和特殊化学品的制备。
2007- 05- 09 收到初稿, 2007- 09- 16 收到修改稿。 联系人: 李晓光。第一作者: 曹柳林 ( 1953 ) , 女, 教授。 基金项目: 国家自然科学基金项目 ( 60704011) 。
图 3 SAH N N 拓扑图 F ig 3 T o po log y fo r SA H NN
系统的状态空间描述如下
X( k + 1) = AX ( k) + WH WI U( k)
Y( k ) = WO X( k)
其中, rS 表示非线性部分第 S 个输出变量; H q 表
示隐含层的第 q 个节 点输出; WI ∃ % h & m, WH ∃ % n& h ; WO ∃ % p & n ; X ∃ % n& 1 , Y ∃ % p & 1 , U ∃
CAO Liulin, LI Xiaoguang, WANG Jing
( I ns titute of A utomation , S chool of I nf o rmation S cience and T echnology , Beij ing Univ er s ity of Chemical T echnolog y , Beij ing 100029, China)
其中,
Cp r =
Cp A M A + Cp B M B + Cp C MC + Cp D M D Mr
反应速率函数