adp算法稳定性分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

adp算法稳定性分析
随着生产力的提高和控制理论的发展,被控对象往往存在高度的非线性。

传统的自适应控制针对的是参数不变,或者发生缓慢变化的控制对象。

但系统内部特性发生改变或者外部出现大幅扰动时,系统调节时间长,超调量大,控制性能往往不好,甚至是不稳定的。

本课题针对此问题,本文对复杂非线性系统采用多模型自适应控制的方法,从下面几个方面进行研究。

1)对于一类仿射非线性的被控对象,把自适应动态规划(Adaptive Dynamic Programming,ADP)算法与多模型思想相结合,并分析了其收敛性和稳定性。

ADP算法方法是利用神经网络等函数近似结构,来逼近动态规划中的性能指标函数和控制策略,并保证控制量有界。

但是控制器不能保证系统的动态品质,尤其是瞬态过程,常常导致超调很大。

根据多模型控制阶梯状设定值的思路,设定阶梯状的跟踪轨迹,使被控对象的状态从一个设定值跟踪到另一个设定值,逐渐的接近最终目标,最后对仿真结果进行了分析,结果表明了此方法的可行性和有效性。

2)通过反向传播(Back Propagation, BP)神经网络建模,来近似非线性离散时间系统的动态特性,用带死区辨识算法调整神经网络的权值参数。

当系统的参数随时间改变时,对应的神经网络权值也不一样。

根据不同权值的神经网络构造出多模型,覆盖系统参数的不确定性。

设置固定模型和自适应模型的不同组合,每个采样周期,根据
性能指标函数选择最佳模型和对应的控制器,取得了很好的控制效果。

最后给出了严格的稳定性和收敛性证明。

3)把多模型控制方法应用到实际的高炉布料系统中,根据大量雷达扫描得到的高炉料面数据进行分类,建立多模型料面模型集;设定期望料面,针对料面模型集中的每种料面,设计对应的布料控制策略,求出相应的布料矩阵。

在一个布料周期中,根据切换机制把获得的实时料面数据与模型集相匹配,进而采取相应的布料矩阵进行布料,直至达到期望料面。

此方法在某钢厂2500m3高炉布料系统中得以实施,生产数据验证了方法的有效性。

本文的主要创新点包括:1)提出了一种基于ADP算法的多设定值跟踪控制方法。

由于控制器约束的存在,引入非二次型的性能指标函数,使得控制量始终在有界的范围内变化。

不会由于设定值的微小变化使得输出有大的波动。

根据多模型控制的思想,阶段性的跟踪阶梯状的参考设定值,既确保了系统的稳定性,又极大的减小了超调量,改善控制品质。

2)用BP神经网络来近似非线性离散时间系统的动态特性,考虑系统的未建模动态,提出了一种BP神经网络鲁棒多模型自适应控制器。

用固定模型和自适应模型的三种不同组合来建立多模型集,通过基于辨识误差的性能指标函数来选择最佳模型和对应的控制器。

此部分的主要贡献是给出了严格的BP神经网络鲁棒多模型自适应控制稳定性和收敛性证明。

3)在实际高炉布料控制问题中,建立先验的料面多模型集和对应的布料矩阵,并设立切换机制。

由于雷达的在线自动监控,使得高炉内部料
面的形状能够实时获得,形成了在线反馈机制,设计出完整的闭环控制系统。

此方法克服了传统的高炉布料开环控制方法的不足,提高了布料的精度和效率。

相关文档
最新文档