一种鲁棒神经网络自适应控制策略及其应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
控制工程C ontrol Engineering of China May 2007V ol.14,N o.3
2007年5月第14卷第3期
文章编号:167127848(2007)0320290204
收稿日期:2006203216; 收修定稿日期:2006204226 基金项目:国家自然科学基金资助项目(60304012)
作者简介:李宁宁(19762),女,湖南长沙人,研究生,主要研究方向为智能控制、自适应控制等;宋 苏(19632),男,博士,教授。
一种鲁棒神经网络自适应控制策略及其应用
李宁宁1
,宋 苏
2
(11北京工业大学人工智能与机器人研究所,北京100022;21国家自然科学基金委员会信息学部,北京100085
)
摘 要:针对具有外部干扰等不确定因素的离散未知非线性受控对象,提出了一种鲁棒
神经网络自适应控制策略。该策略运用自适应预测及带遗忘因子的递推最小二乘参数估计的思想,对神经网络的预报输出进行修正,利用鲁棒反馈控制器保证系统稳定性,并对控制信号的增量进行限幅以抑制突变大幅值干扰信号对系统的影响。将提出的控制方法应用于实验室级液面系统的仿真中,结果表明了该控制策略的有效性。关 键 词:神经网络;模型参考自适应控制;自适应预测;液面系统中图分类号:TP 273 文献标识码:A
R obust Neural Netw ork Adaptive C ontrol Scheme and Its Application
LI Ning 2ning 1
,SONG Su
2
(1.Institute of Artificial Intelligence and R obotics ,Beijing University of T echnology ,Beijing 100022,China ;2.Department of In formation Sciences ,National Natural Science F oundation of China ,Beijing 100085,China )
Abstract :A robust adaptive control based on neural netw ork for unknown nonlinear dynamical systems with bounded disturbances or unm odeled dynamics is proposed.I t is realized using adaptive forecasting and the recursive forgetting factor least square method.The stability of system is guaranteed by a robust controller.The increment of control signal is restricted in a proper range.This scheme is applied to a laboratory 2scale liquid 2level system ,and the results of simulation show the effectiveness of the proposed scheme.K ey w ords :neural netw ork ;m odel reference adaptive control ;adaptive forecasting ;liquid 2level system
1 引 言
近年来,由于神经网络所具有的良好的非线性
映射能力、自学习适应能力和并行信息处理能力等,为解决复杂非线性系统的建模和控制等问题提供了很好的思路。然而,神经网络控制在实际中的应用大大受阻,原因之一是在实际的工业控制中,大量的干扰等不确定因素广泛存在,使系统的控制效果等受到影响,甚至失去稳定性。因此,提高神经网络控制系统的鲁棒性变得十分重要,而目前在此领域的研究成果还比较少见。
本文基于神经网络模型参考自适应控制,提出了一种鲁棒神经网络自适应控制策略。
2 鲁棒神经网络自适应控制策略的设计
考虑到实际的受控对象多为具有不确定因素的
未知非线性系统,本文以间接型神经网络模型参考自适应控制为基础,提出了一种鲁棒神经网络自适应控制策略,其控制结构如图1所示
。
图1 提出的鲁棒神经网络自适应控制策略的结构
Fig 11Structure of the proposed robust neural netw ork
ad aptive control
图中,两个神经网络分别作为辨识器NNI 和控
制器NNC 。为提高系统鲁棒性,采用对辨识误差进行自适应预测的方法,并通过一个鲁棒反馈控制器
RC 保证系统稳定性。y p ,y ^
,y m 分别为受控对象、NNI 和参考模型的输出;u n 和u r 分别为NNC 和RC 的输出;ξ为干扰输入。
假设具有外部干扰或未建模动态的SIS O 离散
非线性受控对象采用如下的NARMA 模型描述[1]
:y p (k +1)=f [y p (k ),y p (k -1),…,y p (k -n +1),
u (k ),u (k -1),…,u (k -m +1)]+ξ(k +1)(1)
式中,u (k )和y p (k )分别为受控对象在k 时刻的输入和实际输出;m 和n 分别为输入时间序列和输
出时间序列的阶次,m ≤n ;f :R m +n
→R 为未知的非线性函数。
1)控制策略 因神经网络模型参考自适应控制NNMRAC 的控制效果在很大程度上取决于神经网络辨识器的辨识精度和神经网络控制器的学习情况,而考虑到实际控制系统中存在的大量不确定因素,及控制系统的实时性要求,对神经网络不能无止境地进行在线训练直至其收敛。本文采用对辨识误差进行建模和预测的方法,修正神经网络的训练数据,有效地弥补了神经网络在此方面的缺陷。
通过对前p 个采样周期中辨识器NNI 所产生的辨识误差[Δy (k ),Δy (k -1),…,Δy (k -p +1)]进行建模。其中:
Δy (k )=y p (k )-y ^(k )
(2)对下一个采样周期中可能产生的偏差
Δy (k +1)进行一步预测,将预测结果Δy 3
(k +1)补偿到辨识器的输出中,即:
y ~(k +1)=y ^(k +1)+Δy 3
(k +1)
(3)再用修正后的数据y ~
(k +1)对神经网络进行训练,预测值的求解将在后续的文字中进行介绍。
应用预测的方法能很好地补偿神经网络的辨识误差,在一定程度上抑制了因动态过程中的不确定因素造成的影响,但不能保证系统的稳定性,因而引入一个鲁棒反馈控制器RC ,根据系统的输出跟
踪误差e m =y m -y ~
,产生一个反馈控制信号,在系统受到外部干扰等影响时,使系统仍具有良好的跟踪性能。鲁棒控制器设计为
u r (k )=K R e m (k )+u r (k -1)
(4)式中,u r (k )为k 时刻鲁棒控制器的输出,用于抑制干扰对控制系统的影响;K R 为控制器增益。
此时,受控非线性系统的输入为
u (k )=u n (k )+u r (k )
(5)
式中,u n (k )为k 时刻神经网络控制器NNC 输出的控制量。
为进一步抑制突变干扰信号使系统在受扰初期产生的波动等不良影响,将式(5)中的控制信号u (k )作如下修正:
u (k )=
u n (k )+u r (k ),|Δu (k )|≤
δu (k -1)+δsign (
Δu (k )),|Δu (k )|>δ(6)式中,Δu (k )=u n (k )+u r (k )-u (k -1);δ为给定有界正数。
2)预测部分的设计 时间序列模型最主要的特征就是承认观测值之间的依赖关系和相关性,它是一种动态模型,能够应用于动态预测。根据时间序列的这一特点,采用相应的方法对所欲知的辨识误差进行预测。本文中,预测方法采用了基于p 阶自回归模型AR (p )的实时自适应预测算法。模型的数学表达式为
Δy (k +1)=λ1Δy (k )+λ2
Δy (k -1)+…+λp Δy (k -p +1)+e (k +1)(7)写成矢量形式为
Δy (k +1)=ΦT (k )θ+e (k +1)(8)式中,ΦT
(k )=[Δy (k ),Δy (k -1),…,Δy (k -p +
1)];θ=[λ1,λ2,…,λp ]T
,λi ∈R (i =1,…,p );e (k )为零均值的白噪声。
在参数时变的条件下,由于参数时变的信息更多地蕴藏在新的观测数据中,而与先前观测数据的关系将逐渐减弱,本文采用带遗忘因子的递推最小
二乘方法[2]
对参数θ进行估计,遗忘因子μ起到强化当前偏差数据对参数估计的作用,且0<μ<1。递推算法公式如下:θ^(k )=θ^(k -1)+K (k )[Δy (k )-Φ^T (k )θ^(k -1)]
(9)
K (k )=
P (k -1)Φ(k )
μ+ΦT (k )P (k -1)Φ(k )
(10)P (k )=[I -K (k )ΦT
(k )]P (k -1)Π
μ(11)Δy 3(k +1)=ΦT (k )θ^(k
)
(12)
式中,θ^
(k )为参数θ在k 时刻的估计值;Δy (k )由
式(2)计算得出;取初始值θ^
(0)=0・I p ×1,I p ×1为p
行1列的单位矩阵;P (0)=102
・I p ×p 。3)神经网络的训练 在该类控制中,神经网络的训练是重要环节之一。对辨识器NNI 进行离线
训练和在线修正相结合的方式,以提高控制系统在
控制初期跟踪的快速性。结合所提出的控制策略,训练算法如下:
①神经网络辨识 对于式(1)所描述的未知SI 2
S O 离散受扰非线性系统,进行辨识[3]
采用的神经网络模型如图2所示。
图中,V 为输入层到隐层的权值矩阵;W 为隐层到输出层的权值矩阵;g 和h 为隐层和输出层神经元的激活函数;隐层第i 个神经元输出为o i 。
假设第i 层第j 个神经元的净输入为net ij ,阈值为b ij ,则有输入:
P =[x 1,x 2,…,x n -m
]=[y ~(k ),…,y ~
(k -n +1),
・192・第3期 李宁宁等:一种鲁棒神经网络自适应控制策略及其应用