基于RBF逼近不确定项的机械手自适应控制研究
一类输入受限的不确定非线性系统自适应 Backstepping变结构控制
一类输入受限的不确定非线性系统自适应 Backstepping变结构控制李飞;胡剑波;王坚浩;汪涛【摘要】针对一类输入受限的不确定非线性系统,提出了一种自适应Backstepping变结构控制器设计方法.建立了受未知非线性特征约束的执行器故障模型,可以描述系统存在死区、齿隙、饱和、滞回等输入受限情形以及可能发生的执行器失效、卡死等故障情形.设计径向基函数神经网络补偿未建模动态项,引入一阶低通滤波器避免了Backstepping控制中的计算复杂性问题.自适应近似变结构控制能够有效削弱控制信号抖振.理论分析和仿真实验结果证明,提出的自适应鲁棒控制律能够在输入受限的情况下自适应地调节控制输入,使得闭环系统稳定且满足控制性能要求.%An adaptive Backstepping sliding mode control method is proposed for a class of uncertain nonlinear systems with input constraints.A model for the nonlinear actuator is developed, which includes input constrained situations such as dead zone, backlash, saturation, hysteresis, and unknown faults such as partial loss of effectiveness fault and actuator stuck fault.Radial basis function neural network is employed to approximate the unknown nonlinear functions.The explosion of complexity is avoided in the traditional Backstepping design method by introducing a first order filter.Adaptive approximate variable structure control is effective to reduce the chatting of the control signal.Theoretical analysis and simulation results are presented to demonstrate the effectiveness of this method by adaptively adjusting control input.【期刊名称】《系统工程与电子技术》【年(卷),期】2017(039)008【总页数】11页(P1823-1833)【关键词】未知非线性;未知故障;不确定性;自适应Backstepping控制;径向基函数神经网络【作者】李飞;胡剑波;王坚浩;汪涛【作者单位】空军工程大学理学院, 陕西西安 710051;空军工程大学装备管理与安全工程学院, 陕西西安 710051;空军工程大学装备管理与安全工程学院, 陕西西安710051;空军工程大学装备管理与安全工程学院, 陕西西安 710051【正文语种】中文【中图分类】TP273物理器件的固有特性、机械设计和制造偏差、外部环境干扰以及安全因素的制约,使得死区、齿隙、饱和以及滞回等非线性特征不可避免地存在于机械系统、伺服系统、压电系统等实际控制系统中,使得系统控制信号受到一定的约束限制,影响被控系统的性能,甚至会造成系统出现发散、震荡等不稳定情况。
基于扰动观测器的机器人自适应神经网络跟踪控制研究
基于扰动观测器的机器人自适应神经网络跟踪控制研究于欣波;贺威;薛程谦;孙永坤;孙长银【摘要】为解决机器人动力学模型未知问题并提升系统鲁棒性,本文基于扰动观测器,考虑动力学模型未知的情况,设计了一种自适应神经网络(Neural network,NN)跟踪控制器.首先分析了机器人运动学和动力学模型,针对模型已知的情况,提出了刚体机械臂通用模型跟踪控制策略;在考虑动力学模型未知的情况下,利用径向基函数(Radial basis function,RBF)神经网络设计基于全状态反馈的自适应神经网络跟踪控制器,并通过设计扰动观测器补偿系统中的未知扰动.利用李雅普诺夫理论证明所提出的控制策略可以使闭环系统误差信号半全局一致有界(Semi-globally uniformly bounded,SGUB),并通过选择合适的增益参数可以将跟踪误差收敛到零域.仿真结果证明所提出算法的有效性并且所提出的控制器在Baxter机器人平台上得到了实验验证.【期刊名称】《自动化学报》【年(卷),期】2019(045)007【总页数】18页(P1307-1324)【关键词】神经网络控制;全状态反馈;扰动观测器;李雅普诺夫理论;Baxter机器人【作者】于欣波;贺威;薛程谦;孙永坤;孙长银【作者单位】北京科技大学自动化学院、人工智能研究院北京 100083;北京科技大学自动化学院、人工智能研究院北京 100083;北京科技大学自动化学院、人工智能研究院北京 100083;北京科技大学自动化学院、人工智能研究院北京100083;东南大学自动化学院南京 211189【正文语种】中文在国内传统制造业发展过程中,机器人技术的应用将极大程度地带动传统装备制造业的转型升级[1].机器人的应用可以降低生产成本、提高生产效率,替代人在复杂、危险工业环境中完成任务,可以从事程序化、高强度、易疲劳的工作.除工业领域外,机器人还在军事、航天、消防救灾、家庭、社会服务和医疗中得到广泛应用[2−5].机器人是一类典型的非线性、强耦合、时变多输入多输出系统[6−8],这种复杂系统给控制器设计带来一定的难度.因为实际情况存在多种不确定因素,机器人系统难以获取精确的动力学模型[9],通常会出现模型失配、模型完全未知等情况,此时基于模型的非线性控制策略将失效.另外,传统控制策略通常对非线性系统进行了线性假设,而这种控制设计也将一定程度影响系统稳定性和控制精度.神经网络具有一致逼近和自适应能力,能够起到非线性补偿、参数辨识等作用[10−12],也可以作为控制器直接控制机器人系统,在机器人系统中得到广泛应用[13−16].神经网络的早期研究缺乏对机器人闭环系统稳定性分析,以梯度学习算法(Error back propagation,BP)为例,需要通过一定时间的离线训练才能将神经网络应用于机器人闭环系统中.反步法通过迭代设计与坐标变换[17],并设置虚拟镇定变量,结合自适应控制,可以应用于含不确定参数的非线性系统并通过选取合适参数调整瞬态特性[18],实现渐近稳定或一致有界[19].本文采用径向基函数(Radial basis function,RBF)[20]作为神经网络(Neural network,NN)[21]隐含层激活函数,通过RBF神经网络估计控制器中不确定项,利用李雅普诺夫稳定性理论反推得到神经网络权重自适应律,避免离线训练,通过在线反馈系统输入输出数据,构造合适的神经网络结构,使机器人系统达到跟踪精度并满足稳定性条件,实现系统误差信号的半全局一致有界.文献[22]提出了一种基于神经网络估计未知动态模型的自适应控制策略,并通过反向传播算法对系统静态和动态参数进行了调整.文献[23]以双臂机器人为研究平台,利用神经网络技术估计多机械臂协调控制中的不确定非线性项,以提高协调控制位置精度.文献[24]提出了一种基于神经网络的自适应阻抗控制策略,通过神经网络补偿机器人中的部分不确定项,在控制作用下使外界交互力呈现出给定的理想阻抗关系.在文献[25]中,神经网络技术被应用于补偿一种欠驱动轮式移动机器人动力学模型,解决一类自平衡移动小车的跟踪控制问题,并基于扰动观测器提出了一种鲁棒跟踪控制策略.除神经网络具有一致逼近能力外,模糊控制对任意非线性系统也具有很好的拟合效果,文献[26]利用模糊控制设计了一种含扰动观测器的外骨骼控制系统,通过实验验证了控制器有效性.大多数文献提出的控制方法在线计算量大,针对不确定性较大的机器人系统控制难度较高,并且对于考虑非参数的不确定系统控制研究较少.扰动观测器被广泛应用于处理非线性系统中的不确定扰动[27−29],设计扰动观测器的目的是不依靠附加的力传感器来估计未知不确定扰动[30].文献[31]利用扰动观测器处理机器人系统的摩擦力补偿问题,并通过仿真得到验证.在文献[32]中,扰动观测器被用来处理非匹配不确定性带来的扰动.文献[33]设计了一种含有扰动观测器的自适应神经网络控制策略,以解决机器人系统中的时滞效应.如果在控制器设计过程中不考虑未知扰动带来的影响,将会在一定程度上影响机械臂跟踪精度.大多数研究多结合非线性系统设计扰动观测器,对于机器人系统利用反推方法设计扰动观测器并且将理论方法应用到实际机器人系统的研究较少.近几年提出的神经网络控制方法结合传统自适应控制、反演控制能够解决含有线性参数的不确定非线性系统,但神经网络难以处理含有非参数的系统不确定性.本文与其他方法不同的创新点是:本文主要结合自适应神经网络和扰动观测器同时解决系统模型未知部分和系统未知扰动,通过RBF神经网络在线学习不确定模型并根据李雅普诺夫函数反推设计权重自适应律,证明了闭环系统误差信号半全局一致有界.本文同时将跟踪控制算法应用于仿真与实际Baxter机器人中,通过两台计算机互相配合,即一台计算神经网络未知补偿量,一台通过用户数据报协议(User datagram protocol,UDP)接收信息并产生Baxter机器人控制信号,一定程度上提升整个系统的运算和响应能力,并通过实验对比PD控制验证了所提出控制算法的有效性和优势.以下几章将对本文所提出的控制算法进行详细介绍与分析.文章具体安排如下:第1节通过D-H(Denavit-Hartenberg)建模方法对Baxter机器人运动学进行分析,通过Lagrange-Euler方法建立机器人动力学模型;第2节考虑动力学模型已知的情况,设计一种基于模型的通用跟踪控制器和扰动观测器并对闭环系统进行稳定性分析;第3节考虑机器人模型未知的情况,提出一种基于扰动观测器的自适应神经网络全状态反馈跟踪控制策略,并通过构造李雅普诺夫函数分析机器人系统稳定性;第4节通过数值仿真验证所提出的控制算法的有效性与通用性,仿真考虑了不同关节连接方式的机器人,分别利用机器人工具箱和数值仿真验证跟踪控制算法的有效性和控制精度;第5节简述了Baxter机器人的硬件及软件结构,将控制算法应用于Baxter机器人实验平台上并与比例微分(Proportion derivative,PD)控制进行对比以验证所提出控制算法的跟踪精度.1 运动学与动力学分析1.1 Baxter机器人运动学分析以Baxter机器人底座中心为基坐标,将连杆坐标系原点位置设置在关节连杆末端,利用 D-H建模方法,通过 D-H参数表 (如表 1所示)可以实现各关节处坐标点的变换矩阵所以基坐标与关节坐标变换矩阵A为:式中,变换矩阵将连杆坐标系原点建立在连杆的关节连杆末端,其中变换矩阵表示为:其中,c代表余弦运算cos,s代表正弦运算sin.di表示平移距离,αi表示扭转角,ai表示长度,θi表示关节角度.表1 Baxter机器人D-H参数和连杆质量Table 1 D-H parameter and link mass of Baxter robotLink θ d(m) a(m) α(rad) m(kg)1 θ1 0.2703 0.069 −π5.70044 2 θ2 0 0 π2 3.22698 3 θ3 0.3644 0.069 −π 2 4.31272 4 θ4 0 0 π2 2.07206 5 θ5 0.3743 0.01 −π 2 2.24665 6 θ6 0 0 π2 1.60979 7 θ7 0.2295 0 0 0.54218 2通过Baxter机器人制造商Rethink robotics在Github网站上提供的相关信息,可以从中获取刚性连杆i的质量如表1所示,其中连杆惯性矩阵、转动惯量以及相对坐标中心位置都可以从中获得.1.2 机器人动力学分析通过拉格朗日动力学方程,建立机械臂n关节通用动力学模型:其中,分别表示机械臂角度,角速度,角加速度向量,Mj(q)∈Rn×n表示机械臂惯性矩阵,表示机械臂科氏力矩向量,Gj(q)∈Rn表示机械臂重力矩向量.τ∈Rn表示机械臂控制力矩向量,τd∈Rn表示外部环境的未知扰动力矩向量.机械臂前向运动学可由下式关系表示:机械臂逆向运动学可由下式关系表示:式中,J(q)∈Rm×n为机械臂雅克比转换矩阵,雅克比转换矩阵中的m为机械臂操作空间向量维数,J+(q)∈Rn×m代表雅克比转换矩阵的广义逆矩阵,分别代表任务空间的位移,速度,加速度,通过上式可以得到m维机械臂任务空间通用动力学模型如下:式中,Mt(x)∈Rm×m,Gt(x)∈Rm分别代表机械臂任务空间的惯性矩阵,科氏力矩阵和重力矩阵,u∈Rm为机械臂控制力,f∈Rm为机械臂未知外界扰动力.其关节空间到任务空间相关矩阵具有如下关系:以下为本文利用的相关定义、引理与性质:定义1[34].半全局一致有界(Semi-globally uniformly bounded,SGUB):考虑广义非线性系统对任意初始紧集Ωi,初始状态ε(t0)∈Ωi,若存在常数ξ>0以及时间常数T(ξ,ε(t0)), 对任意t ≥ t0+T(ξ,ε(t0)) 都满足||ε(t)||≤ ξ.我们定义系统状态ε(t)为半全局一致有界(SGUB).引理1[24].若存在连续正定可微函数V(x)满足κ1(||x||)<V(x)< κ2(||x||)(κ1,κ2属于K 类函数)且具有有界初始条件,若其中,C和ρ为正常数,那么解ε(t)为一致有界.性质1[35].惯性矩阵Mj(q)、Mt(q)在式(3)与式(6)中为正定对称矩阵,且和为斜对称矩阵.引理2[26].若连续可微函数Ξ是有界函数,即对于任一时刻t∈[t1,t2],如果Ξ(t)满足Ξ(t)≤ξ1,其中,ξ1为正常数,那么我们能够得出也为有界函数.2 含扰动观测器的模型控制器设计以关节空间为例,设计基于机器人动力学模型的控制器.在本节考虑机器人动力学模型已知,定义为便于分析,将式(3)转换为状态空间形式:定义xd为关节空间期望轨迹向量,定义状态误差如下式:为设计扰动观测器我们定义一个辅助变量e3表示为:其中,%(e2)代表非线性函数向量,同时我们定义式(9)中α1为虚拟镇定信号,e1为角度误差,e2为虚拟速度误差,其中,α1定义如下:通过式(9)分析得到和可以表示为:通过式(10)分析得到表示为:其中,Y(e2)为%(e2)的对e2的导数,我们简化%(e2)为线性函数向量,所以在这种假设下Y(e2)为一个常数.通过分析我们可得并定义为:通过以上分析,我们可以得到以下变量估计误差与扰动估计误差之间的关系为:通过式(15)可以得到:由以上分析设计基于模型的控制器τ0为:下面对系统稳定性进行分析,构造如下李雅普诺夫函数V1:将模型控制器τo代入上式可得:其中,ς为的最大值,ρ1和C1分别表示为:式中,λmin,λmax分别代表矩阵的最小和最大特征值.K1,和为正定对称矩阵,由引理1可知:在模型控制器τo的作用下,闭环系统误差一致有界,可以保证系统稳定.如果使用非线性函数作为%(e2)的表达形式,那么Y(e2)可以描述为,由式(20)可以得出,选取合适的%(e2)保证为正定矩阵,即可保证闭环系统稳定性.所以选取非线性函数或由线性函数近似,对于系统性能没有影响,但是非线性函数需要考虑更为复杂的动态关系,其实际函数选择较线性函数更为复杂.在选取Y(e2)时,由于Mj(x1)矩阵为对称正定矩阵,所以其最大特征值为λmax(Mj(x1))>0.Mj(x1)矩阵的逆矩阵最小特征值为1/λmax(Mj(x1))>0,因此选择合适的 Y(e2)使矩阵的最小特征值Y(e2)/λmax(Mj(x1))− 1>0.当选取Y(e2)>λmax(Mj(x1))时,就可以保证Y(e2)/λmax(Mj(x1))−1>0,即保证矩阵为正定矩阵.以上分析同样应用于式 (38)中,通过选取 R(e2),ι和和Mjk(x1)共同保证3 含扰动观测器的自适应神经网络控制器设计实际情况中,机械臂惯性矩阵Mj(q),机械臂科氏力矩矩阵存在不确定性,我们用Mjk(q)和Cjk(q,)表示动力学模型中的设定参考部分,其中用Mju(q)和Cju(q,)表示其他未知部分,其动态关系可以描述为:利用神经网络一致逼近性能,设计一种在线自适应神经网络控制器以补偿未知动力学模型参数.自适应神经网络控制器τf设计为:式中,ψ(Z)代表RBF神经网络径向基函数,代表神经网络权重估计,其中,$∗代表神经网络实际最优权重,最优权重是为便于推导分析人为构造的,其定义如下:式中,νi(Z)∈Rn为神经网络的估计误差,神经网络权值误差我们用用来估计$∗Tψ(Z),设计神经网络权重自适应律为:式中,σi为小的正常数,Γi为正定对称矩阵.把式(25)代入式(12)可得:同模型控制类似,我们定义辅助变量e4为:对e4求导可得:式中,R(e2)为χ(e2)对e2求导的结果,同理为便于分析,令χ(e2)为线性方程,因此在该假设下R(e2)为常数.同时我们定义如下:其中,为e4的估计值.通过式(28)可以得出:通过式(28)和(31)可以得出:由以上分析可以得到下面对神经网络控制器的闭环系统进行稳定性分析,构造如下李雅普诺夫函数V2:对V2求导,并将神经网络控制器代入可得到如下式所示结果:利用如下不等式性质:可以得到:式中,ρ2和C2分别为:为使ρ2>0,控制增益需满足以下条件:通过以上分析,我们可以证明误差e1,e2,和为半全局一致有界.定理1.对于式(3)描述的闭环系统,在控制(23)的作用下,所有状态量均可测得,对于初始紧集Ω0,其中,则闭环系统误差信号将始终在紧集内:其中,D=2(V2(0)+C2/ρ2),l为神经网络节点数,ρ2和C2为正常数.证明. 在式(37)左右两端乘以eρ2t,可以得到:由以上分析可以得出:通过上式可以发现,e1收敛于紧集同理可以证明e2和分别收敛于紧集和内,收敛于紧集内.4 数值仿真4.1 3旋转关节机器人仿真本节通过Matlab机器人工具箱(Robotic toolbox)程序对具有3旋转关节的机器人进行数值仿真.如图1所示,刚性连杆1质量与长度:mt1=0.5kg,lt1=0.114m;刚性连杆2质量与长度:mt2=0.5kg,lt2=0.144m;刚性连杆3质量与长度:mt3=1kg,lt3=0.241m.初始关节角矩阵设置为[0.0714rad;1.6718rad;−1.7432rad].设置任务空间期望轨迹为:其中,RBF参数节点数选择为28=256,镇定参数为0.02,正定增益矩阵为Γi=10I256×256.神经网络中心选择为[−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1]× [−1,1]× [−1,1]× [−1,1],其中控制增益K1=diag{40,40,40},K2=diag{30,30,30},扰动设置为[0.02sin(t)+0.06,0.01cos(t)+0.02,0]T,扰动观测器χ(e2)设置为[25e21,25e22,25e23]T.图2、3分别为关节空间、任务空间中3关节神经网络控制与PD控制跟踪对比图.图4为任务空间中神经网络与PD控制对比效果图,图5为神经网络控制器控制输入.由上图可知,所提出的控制算法可以保证跟踪误差收敛到较小的零域内,较PD控制而言,所提出的神经网络控制具有更好的跟踪控制效果.4.2 2旋转关节1伸长关节机器人仿真本节通过Matlab数值仿真对具有2旋转关节1伸长关节的机器人系统进行仿真.其中刚性连杆1质量与长度:mt1=2.0kg,lt1=0.3m;刚性连杆2质量与长度:mt2=2.0kg,lt2=0.4m;刚性连杆3质量与长度:mt3=1.0kg,lt3=0.25m.初始状态矩阵为[0.5rad;0.9rad;0.4m].设置期望跟踪轨迹为:其中,RBF参数节点数为212,镇定参数为0.02,正定增益矩阵为Γi=10I212×212.神经网络中心选择为[−1,1]× [−1,1]× [−1,1]× [−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1],其中控制增益K1=diag{6,6,6},K2=diag{12,12,12}.图6,8,10分别为3关节含扰动观测器的神经网络控制与不含扰动观测器角度跟踪控制对比图,图7,9,11分别为3关节含扰动观测器的神经网络控制与不含扰动观测器速度跟踪控制对比图.真实扰动设置为[sin(t)+1,2cos(t)+0.5,2sin(t)+1]T.扰动观测器χ(e2)设置为[25e21,25e22,25e23]T.图1 3旋转关节自由度机器人Robotic toolbox中的模型Fig.1 Model of 3revolute joint robot in robotic toolbox图2 NN与PD控制角度跟踪Fig.2 Joint tracking of NN and PD control图3 NN与PD控制位置跟踪Fig.3 Position tracking of NN and PD control 图4 NN与PD轨迹跟踪效果Fig.4 NN and PD trajectory tracking performance图5 NN控制输入Fig.5 NN control input由上图可知,所提出的带扰动观测器的控制算法可以保证跟踪误差收敛到较小的零域内,较不加扰动观测器控制而言,所提出的带扰动观测器神经网络控制器具有更好的跟踪控制效果.图12为扰动观测器与真实扰动误差对比图,图13为控制输入对比图,图14为神经网络估计权值与权值估计误差图,图15为神经网络逼近函数与被逼近函数.由图12、14和15可知,扰动观测器观测误差和神经网络估计误差都将收敛到较小的零域内.图6 关节1含扰动观测器和不加扰动观测器角度跟踪控制Fig.6 Joint 1 angle tracking control with and without disturbance observer图7 关节1含扰动观测器和不加扰动观测器速度跟踪控制Fig.7 Joint 1 velocity tracking control with and without disturbance observer图8 关节2含扰动观测器和不加扰动观测器角度跟踪控制Fig.8 Joint 2 angle tracking control with and without disturbance observer图9 关节2含扰动观测器和不加扰动观测器速度跟踪控制Fig.9 Joint 2 velocity tracking control with and without disturbance observer图10 关节3含扰动观测器和不加扰动观测器角度跟踪控制Fig.10 Joint 3 angle tracking control with and without disturbance observer图11 关节3含扰动观测器和不加扰动观测器速度跟踪控制Fig.11 Joint 3 velocity tracking control with and without disturbance observer图12 扰动与扰动观测误差Fig.12 Disturbance and disturbance observer error 图13 控制输入Fig.13 Control input图14 NN权值估计与误差Fig.14 Weight estimation and error of NN图15 逼近函数与被逼近函数Fig.15 Approximation and approximated function5 基于Baxter机器人的跟踪实验验证本文基于Baxter机器人对自适应神经网络跟踪控制策略进行实验验证.Baxter机器人是美国Rethink robotics公司研发的一款双臂机器人[36],其单机械臂是一种具有七自由度的冗余柔性关节机械臂[37].Baxter机械臂存在的摩擦力等未知扰动也会影响到机器人的控制精度.因此,对于Baxter机器人需要提高其定位精度以完成精确的跟踪任务[38].图16为Baxter机器人结构示意图.通过移动底座支撑机器人本体,机器人手臂采用旋转关节连接刚性连杆,关节处采用弹性制动器连接,即通过电机、减速器串联弹簧带动负载,在人机协作或外部冲击下起到保护人或机器人本体的作用.柔性关节还可通过霍尔效应检测角度偏差,由于弹簧具有固定刚度,通过胡克定律可检测关节处力矩,即在Baxter关节处都具有力矩传感器.手臂前后端通过26W 和63W 伺服电机驱动,通过14bit编码器实现关节角度的读取.Baxter机器人为基于ROS(Robot operating system)操作系统的开源机器人,通过Linux平台运行,用户可通过网络与机器人内部计算机互联读取信息或发送指令,或通过SSH(Secure shell)远程控制在内部计算机运行相关程序.利用Baxter相关的SDK(Software development kit),通过ROS的API(Application programming interface)可以实现对Baxter机器人的信息读取与实时控制.Baxter中的SDK可以提供相关函数接口与重要工具:如Gazebo仿真器及Moveit移动软件包等.Baxter 机器人在力矩控制模式下,还需设置补偿力矩以抵消机械臂重力和肩关节支撑弹簧形变带来的影响.本节通过Baxter机器人实现机器人轨迹跟踪实验.图17为Baxter机器人实验平台.计算机A通过Windows MATLAB simulink模块计算神经网络未知补偿量并通过UDP传输至另一台用于接收机器人状态信号并提供控制信号的计算机B中.计算机B利用Ubuntu 14.04 LTS平台下的Baxter RSDK(Robot operating system SDK)实现对Baxter机器人的编程与控制.其中RBF神经网络参数节点数为73,镇定参数为0.02,正定增益矩阵Γi=500I.协方差为0.75,其中控制增益K1=diag{17.7,20,15.7,22,20.3,12.6,15},K2=diag{2.1,2.2,1.2,2,5.1,10.1,4.5}.利用Moveit软件令Baxter机器人单臂移动一段距离,通过实时位置反馈信息,记录下移动过程中各关节轨迹.之后通过设计控制器令关节跟踪这条期望轨迹,并将所提出的控制方法与PD控制对比轨迹跟踪效果.表2所示为Baxter机器人PD控制参数.图18∼24分别为Baxter机器人S0,S1,E0,E1,W0,W1,W2关节含扰动观测器的神经网络与PD控制角度跟踪效果对比图.图25为Baxter机器人七关节神经网络控制输入.由图18∼24通过与PD控制对比可以得出,所提出的控制算法与PD控制相比具有更好的跟踪控制效果.图16 Baxter机器人系统结构:1.肩S0关节;2.肩S1关节;3.肘E0关节;4.肘E1关节;5.腕W0关节;6.腕W1关节;7.腕W2关节;8.声纳传感器;9.面部摄像头;10.显示屏;11.末端摄像头;12.末端抓手;13.操作旋钮;14.柔性关节;15.肩关节支撑弹簧;16.吸盘Fig.16 The system structure of Baxter robot:1.shoulder jointS0;2.shoulder jointS1;3.elbow jointE0;4.elbow jointE1;5.wrist jointW0;6.wrist jointW1;7.wrist jointW2;8.sonar sensor;9.facial camera;10.screen;11.end-effector camera;12.gripper;13.operating knob;14.flexiblejoint;15.S1shoulder support spring;16.sucker图17 Baxter机器人实验平台Fig.17 Experimental platform of Baxter robot 表2 Baxter机器人PD控制参数Table 2 PD control parameter of BaxterrobotJoint P D S0 50.01 2.5 S1 60 1.3 E0 15.1 2.5 E1 14 3 W0 25.2 3 W1 12 10 W2 12.3 10图18 NN与PD控制S0关节角度跟踪Fig.18 S0 joint tracking of NN and PD control图19 NN与PD控制S1关节角度跟踪Fig.19 S1 joint tracking of NN and PD control图20 NN与PD控制E0关节角度跟踪Fig.20 E0 joint tracking of NN and PD control图21 NN与PD控制E1关节角度跟踪Fig.21 E1 joint tracking of NN and PD control图22 NN与PD控制W0关节角度跟踪Fig.22 W0 joint tracking of NN and PD control图23 NN与PID控制W1关节角度跟踪Fig.23 W1 joint tracking of NN and PID control图24 NN与PD控制W2关节角度跟踪Fig.24 W2 joint tracking of NN and PD control图25 Baxter机器人NN控制输入Fig.25 NN control input to Baxter robot6 结论本文提出了一种基于扰动观测器的自适应神经网络跟踪控制策略,以解决机器人动力学模型未知问题并提升系统鲁棒性.针对模型已知的情况,通过研究机器人运动学和动力学模型,提出了刚体机械臂通用模型跟踪控制策略;针对动力学模型未知情况下,设计了基于全状态反馈的自适应RBF神经网络跟踪控制器,并通过设计扰动观测器补偿系统中的未知扰动.通过选择合适的增益参数可以将跟踪误差收敛到零域,并利用李雅普诺夫理论证明所提出的控制策略能使闭环系统误差信号半全局一致有界.最后通过对比仿真证明所提出算法的有效性并且将控制算法在Baxter机器人平台上进行验证.References【相关文献】1 He W,Li Z J,Chen C L P.A survey of human-centered intelligent robots:issues and challenges.IEEE/CAA Journal of Automatica Sinica,2017,4(4):602−6092 Li Y N,Ge S S.Human-robot collaboration based on motion intentionestimation.IEEE/ASME Transactions on Mechatronics,2014,19(3):1007−10143 Li H Y,Chen Z R,Wu L G,Lam H-K.Event-triggered control for nonlinear systems under unreliable communication links.IEEE Transactions on Fuzzy Systems,2017,25(4):813−8244 Hou Zeng-Guang,Zhao Xin-Gang,Cheng Long,Wang Qi-Ning,Wang Wei-Qun.Recent advances in rehabilitation robots and intelligent assistance systems.Acta Automatica Sinica,2016,42(12):1765−1779(侯增广,赵新刚,程龙,王启宁,王卫群.康复机器人与智能辅助系统的研究进展.自动化学报,2016,42(12):1765−1779)5 He Wei,Ding Shi-Qiang,Sun Chang-Yin.Research progress on modeling and control of flapping-wing air vehicles.Acta Automatica Sinica,2017,43(5):685−696(贺威,丁施强,孙长银.扑翼飞行器的建模与控制研究进展.自动化学报,2017,43(5):685−696)6 Wei Qing-Lai,Zhang Hua-Guang,Liu De-Rong,Zhao Yan.An optimal control scheme for a class of discrete-time nonlinear systems with time delays using adaptive dynamic programming.Acta Automatica Sinica,2010,36(1):121−129(魏庆来,张化光,刘德荣,赵琰.基于自适应动态规划的一类带有时滞的离散时间非线性系统的最优控制策略.自动化学报,2010,36(1):121−129)7 Xu B,Shi Z K,Yang C G,Sun F posite neural dynamic surface control of a class of uncertain nonlinear systems in strict-feedback form.IEEE Transactions on Cybernetics,2014,44(12):2626−26348 Tie Lin,Cai Kai-Yuan,Lin-Yan.A survey on the controllability of bilinear systems.Acta Automatica Sinica,2011,37(9):1040−1049(铁林,蔡开元,林岩.双线性系统可控性综述.自动化学报,2011,37(9):1040−1049)9 Shen Fei,Cao Zhi-Qiang,Xu De,Zhou Chao.A dynamic model of robotic dolphin based on Kane method and its speed optimization method.Acta AutomaticaSinica,2012,38(8):1247−1256(沈飞,曹志强,徐德,周超.基于Kane方法的机器海豚动力学建模及速度优化方法.自动化学报,2012,38(8):1247−1256)10 Modares H,Ranatunga I,Lewis F L,Popa D O.Optimized assistive human-robot interaction using reinforcement learning.IEEE Transactions onCybernetics,2016,46(3):655−66711 Sun Fu-Chun,Sun Zeng-Qi,Zhang Bo.Observer-based adaptive control for robot trajectory tracking using neural networks.Acta Automatica Sinica,1999,25(3):295−302(孙富春,孙增圻,张钹.基于观测器的机械手神经网络自适应控制.自动化学报,1999,25(3):295−302)12 Li Y N,Ge S S.Impedance learning for robots interacting with unknown environments.IEEE Transactions on Control Systems Technology,2014,22(4):1422−143213 He W,Dong Y T.Adaptive fuzzy neural network control for a constrained robot using impedance learning.IEEE Transactions on Neural Networks and LearningSystems,2017,29(4):1174−118614 De Santis A,Siciliano B,De Luca A,Bicchi A.An atlas of physical human-robot interaction.Mechanism and Machine Theory,2008,43(3):253−27015 Liu Y J,Tong S C,Li D J,Gao Y.Fuzzy adaptive control with state observer for a class of nonlinear discrete-time systems with input constraint.IEEE Transactions on Fuzzy Systems,2016,24(5):1147−115816 Wang F Y,Zhang J,Wei Q L,Zheng X H,Li L.PDP:parallel dynamic programming.IEEE/CAA Journal of Automatica Sinica,2017,4(1):1−517 Tong S C,Wang T,Li Y M,Chen B.A combined backstepping and stochastic small-gain approach to robust adaptive fuzzy output feedback control.IEEE Transactions on Fuzzy Systems,2013,21(2):314−32718 Liu Y J,Tong S C.Adaptive NN tracking control of uncertain nonlinear discrete-time systems with nonaffine deadzone input.IEEE Transactions onCybernetics,2015,45(3):497−50519 Chen C L P,Wen G X,Liu Y J,Wang F Y.Adaptive consensus control for a class of nonlinear multiagent time-delay systems using neural networks.IEEE Transactions on Neural Networks and Learning Systems,2014,25(6):1217−122620 Han Hong-Gui,Qiao Jun-Fei,Bo Ying-Chun.On structure design for RBF neural network based on information strength.Acta Automatica Sinica,2012,38(7):1083−1090(韩红桂,乔俊飞,薄迎春.基于信息强度的RBF神经网络结构设计研究.自动化学报,2012,38(7):1083−1090)21 Ding S B,Wang Z S,Zhang H G.Event-triggered stabilization of neural networks with time-varying switching gains and input saturation.IEEE Transactions on Neural Networks and Learning Systems,2018,29(10):5045−505622 Narendra K S,Parthasarathy K.identification and control of dynamical systems using neural networks.IEEE Transactions on Neural Networks,1990,1(1):4−2723 Yang C G,Jiang Y M,Li Z J,He W,Su C Y.Neural control of bimanual robots with。
基于RBF网络逼近的自适应控制
一种简单的基于RBF 网络逼近的自适应控制1 问题描述简单的运动系统动力学方程为:(),f u θ=θθ+ (1)其中θ为角度,u 为控制输入。
写成状态方程形式为:()122x x x f x u==+ (2)其中()f x 为未知。
位置指令为d x ,则误差及其变化率为1d e x x =-,2d e x x =-定义误差函数为s ce e =+,0c > (3)则()2d d s ce e ce x x ce f x u x =+=+-=++-。
由式(3)可见,如果0s →,则0e →且0e →。
2 RBF 网络原理由于RBF 网络具有万能逼近特性[1],采用RBF 神经网络逼近()f x ,网络算法为:22exp 2jj j h b ⎛⎫- ⎪= ⎪⎝⎭x c(4) ()*T f ε=+W h x (5)其中x 为网络的输入,j 为网络隐含层第j 个节点,Tj h ⎡⎤=⎣⎦h 为网络的高斯基函数输出,*W 为网络的理想权值, ε为网络的逼近误差,N εε≤。
网络输入取[]T 12x x =x ,则网络输出为:()()T ˆf x x =Wh (6) 3 控制算法设计与分析由于()()()()()*T T T ˆˆf x fx x εε-=+-=-+W h x W h W h x 。
定义Lyapunov 函数为2T1122V s W W γ=+ (7) 其中0γ>,*ˆ=-W WW 。
则()()T T d11ˆˆV ss W W s ce f x u x W W γγ=+=++-+ 设计控制律为()()dˆsgn u ce f x x s η=--+- (8) 则()()()()()()()()T T T T 1ˆˆsgn 1ˆ sgn 1ˆ V s f x fx s W W s s W Ws s W W s ηγεηγεηγ=--+=-+-+⎛⎫=-+- ⎪⎝⎭W h x h x 取maxηε>,自适应律为()ˆWs γ=h x (9) 则0V s s =-<εη。
基于RBF神经网络辨识的单神经元PID模型参考自适应控制
基于RBF神经网络辨识的单神经元PID模型参考自适应控制
作者:郑晋平
来源:《电子技术与软件工程》2015年第19期
摘要本论文提出了PID自适应在线识别神经单元基于径向基函数神经网络。
单神经元自适应控制器是由单神经元构成,它有自适应和学习的相关能力,其优点为适应性强、结构简单。
为获得更好的控制效果,我们可以建立RBF对系统在线进行辨识,通过控制器自学习随时对参数进行调整。
【关键词】RBF神经网络单神经元 PID控制在线辨识
1 引言
在当下,常规的PID凭借自身良好的可靠性,稳定的结构性以及便于使用的优点而被广泛使用。
而PID控制的效果是与系统的参数变化有很大关系的,如果参数没有较大的变化,则其控制效果较好,如果其存在较大的干扰,此时单单依靠PID控制是达不到要求的。
所以对应系统不同的结构参数,应该使用不同的控制方式,而参数不变的PID控制的控制结果并不理想。
针对其不足,现在有变结构和自调节等很多与PID相结合在一起的综合的控制方式,同时还有神经网络控制。
随着人工神经网络的不断发展,它的优点在智能控制之中得到了充分的展现,人们十分关注并且对其在各种特定系统的控制做了广泛的实践,进而对于PID和神经网络的共同控制进行了深入的研究探索。
本文就上述情况对应提出单神经元PID自适应控制,通过单神经元形成控制器。
并且这是基于RBF的在线辨识实现的,这种方法的优点在于其有着简单的结构和很强的适应能力,拥有自我的学习能力。
为了达到面对系统的时刻变化采集、传达更多的控制信息,在线辨识是我们做的较好的一步。
经过大量的实验证明,这种办法在动态特性与控制方面更加突出。
现代控制理论
现代控制理论⾮线性动态系统的稳定性和鲁棒控制理论研究上世纪50年代,Kallman成功的将状态空间法引⼊到系统控制理论中,从⽽标志着现代控制理论研究的开始。
现代控制理论的研究对象是系统的数学模型,它根据⼈们对系统的性能要求,通过对被控对象进⾏模型分析来设计系统的控制律,从⽽保证闭环系统具有期望的性能。
其中,线性系统理论已经形成⼀套完整的理论体系。
过去⼈们常⽤线性系统理论来处理很多⼯程问题,并在⼀定范围内取得了⽐较满意的效果。
然⽽,这种处理⽅法是以忽略系统中的动态⾮线性因素为代价的。
实际中很多物理系统都具有固有的动态⾮线性特性,如库仑摩擦、饱和、死区、滞环等,这些⾮线性动态⾮线性特性的存在常常使系统的控制性能下降,甚⾄变得不稳定。
这就使得利⽤线性系统理论处理⾮线性动态系统⾯临巨⼤的困难。
此外,在控制系统运⾏过程中,环境的变化或者元件的⽼化,以及外界⼲扰等不确定因素也会造成系统实际参数和标称值之间出现较⼤差别。
因此,基于标称数学模型所设计的控制律⼀般很难达到期望的性能指标,甚⾄会使系统不稳定。
综上所述,研究不确定条件下⾮线性动态系统的鲁棒稳定性及鲁棒控制间题具有重要的理论意义和迫切的实际需要。
⾮线性动态系统是指按确定性规律随时间演化的系统,⼜称动⼒学系统,其理论来源于经典⼒学,⼀般由微分⽅程来描述。
美国数学家Birkhoff[1]发展了法国数学家Poincare在天体⼒学和微分⽅程定性理论⽅⾯的研究,奠定了动态系统理论的基础。
在实际动态系统中,对象往往受到各种各样的不确定的影响,所以其数学模型⼀般不可能精确得到。
因此,我们只能⽤近似的标称数学模型来描述被控对象,并据此来设计控制系统,动态系统鲁棒控制由此产⽣。
所谓鲁棒性就是指系统预期⾮线性动态系统的稳定性和鲁棒控制理论研究的设计品质不因不确定性的存在⽽遭到破坏的特性,鲁棒控制是⾮线性动态系统控制理论研究的⼀个⾮常重要的分⽀。
现代控制理论的发展促进了对动态系统的研究,使它的应⽤从经典⼒学扩⼤到⼀般意义下的系统。
采摘机械臂的PSO-RBF神经网络自适应控制
1 机械臂系统问题描述
由于机械臂的每个关节就是一个输入ꎬ也是一个输
出ꎬ而且关节与关节之间又存在着扰动ꎬ耦合关系复杂ꎮ
由于径向基神经网络结构简单ꎬ具有较强的泛化性
能ꎬ近年来ꎬ很多人对 RBF 神经网络在机械臂控制的方
向进行了研究ꎬ极大地推动了机械臂的 RBF 神经网络控
制发展的进程ꎮ 一些研究人员运用 RBF 神经网络的特
子规模ꎮ
来决定下一步运动速度和位置ꎮ 基本 PSO 算法的粒子位
τ = M 0( q) ( q-k v e-k p e) +C0( qꎬq ) q +G0( q) -f( ) (3)
其中:k p = êê
法ꎬ第 t1 次迭代时ꎬ粒子将根据自身的经验和同伴的经验
(7)
(8)
其中 f ∗( )= w ∗ T h( x) ꎬw ∗ 表示 f( ) 的最佳逼近权值
( 期望) 的角度、角速度、角加速度指令ꎮ
在实际工程中ꎬf( ) 通常是未知的ꎬ需要估计 f( )
并对其补偿ꎮ 利用 RBF 神经网络逼近任意非线性函数的
特性逼近 f( ) ꎬ并对其进行补偿ꎬ就可以达到想要的控
制效果ꎮ
2 PSO -RBF 神经网络
采用 RBF 网络逼近 f( ) ꎬ其算法为
adaptive control method is designedꎬ with which a radial basis function neural network is used to approximate and compensate for
system model errorsꎬ and particle swarm optimization is applied to optimize RBF weight parameters to ensure better PSO - RBF
基于RBF神经网络的TCSC自适应PID控制
1 引言
随着“ 西 电东送 、 南北互供 、 全 国联 网” 电力发 展战略 的 实施 , 远距离 、 超高压 、 大 容量 跨 区域的交 流输 电在 我 国将 会越来越普遍 , 然而远距 离交 流输 电 的容量 常常受 到稳 定
极 限的制 约| 】 ] 。可 控 串联 电容 补 偿 ( T h y r i s t o r c o n t r o l l e d s e r i e s c a p a c i t o r , TC S C) 技 术 是 一 种 提 高 远 距 离 交 流 输 电 系
随着国内外学者 对 TC S C控制 策略研 究 的不 断深 入 , 控制 理论 中的各种最新成果都在 T C S C的控制 中得到 了广
泛 的研究 l g 。文献 [ 9 ] 采用 基于微 分几何理 论 的反馈线 性化 理论设计 了 T C S C控 制器 , 文献 [ 1 O ] 基于 非线性 最优 预测 控制理论设计 T C S C控制 , 都取得不错 的控制 效果 , 但
simulink 自适应控制 rbf 自适应律
simulink 自适应控制rbf 自适应律[simulink 自适应控制rbf 自适应律]一、介绍在控制系统中,自适应控制是一种可以根据系统变化自动调整控制律的方法。
自适应控制可以提高系统的稳定性和性能,并适应系统动态变化,从而实现更好的控制效果。
在Simulink中,我们可以利用RBF(径向基函数)自适应律来实现自适应控制。
二、什么是RBF自适应律?RBF自适应律是一种基于径向基函数的自适应控制方法。
它通过使用一组基于RBF的神经网络,动态调整控制律,以适应系统变化。
RBF自适应律的核心思想是在控制系统中引入一组具有适应性的神经元,这些神经元根据系统的输入和输出来学习和调整权重,从而实现更好的控制效果。
三、使用Simulink实现RBF自适应律1. 创建Simulink模型:首先,在Simulink中创建一个新的模型。
你可以添加输入信号,输出信号以及其他相关的组件。
2. 添加RBF自适应律模块:在Simulink库中,可以找到RBF自适应律模块。
将该模块拖放到模型中。
3. 配置RBF自适应律模块:双击RBF自适应律模块,可以配置其参数。
例如,你可以设置RBF的数量、权重初始值、学习率等。
4. 连接输入输出信号:将输入信号和输出信号连接到RBF自适应律模块。
这样,模块将根据输入和输出信号中的数据进行学习和调整。
5. 运行模型:点击Simulink模型中的Run按钮,可以运行模型并观察自适应律的效果。
四、RBF自适应律参数解释1. RBF数量:RBF数量是指在RBF网络中使用的径向基函数的数量。
通常,RBF 数量越多,模型的逼近能力越强,但计算复杂度也相应增加。
2. 权重初始值:权重初始值是指RBF神经元初始的权重值。
这些权重值会随着模型的学习和调整而改变,以适应系统的动态变化。
3. 学习率:学习率是指RBF网络在学习和调整过程中的更新速率。
较大的学习率可以快速调整权重,但可能导致不稳定的系统行为,较小的学习率则可能导致收敛速度较慢。
基于RBF神经网络整定的PID控制器设计及仿真_毕业设计(论文)
华北电力大学毕业设计(论文)题目基于RBF神经网络整定的PID控制器设计及仿真基于RBF神经网络整定的PID控制器设计及仿真摘要目前,因为PID控制具有简单的控制结构,可通过调节比例积分和微分取得基本满意的控制性能,在实际应用中又较易于整定,所以广泛应用于过程控制和运动控制中,尤其在可建立精确模型的确定性控制系统中应用比较多。
然而随着现代工业过程的日益复杂,对控制要求的逐步增高(如稳定性、准确性、快速性等),经典控制理论面临着严重的挑战。
对工业控制领域中非线性系统,采用传统PID 控制不能获得满意的控制效果。
采用基于梯度下降算法优化RBF神经网络,它将神经网络和PID控制技术融为一体,既具有常规PID控制器结构简单、物理意义明确的优点,同时又具有神经网络自学习、自适应的功能。
因此,本文通过对RBF神经网络的结构和计算方法的学习,设计一个基于RBF神经网络整定的PID控制器,构建其模型,进而编写M语言程序。
运用MATLAB软件对所设计的RBF神经网络整定的PID控制算法进行仿真研究。
然后再进一步通过仿真实验数据,研究本控制系统的稳定性,鲁棒性,抗干扰能力等。
关键词:PID;RBF神经网络;参数整定SETTING OF THE PID CONTROLLER BASED ON RBF NEURAL NETWORK DESIGN AND SIMULATIONAbstractAt present, because the PID control has a simple control structure, through adjusting the proportional integral and differential gain basic satisfactory control performance, and is relatively easy to setting in practical application, so widely used in process control and motion control, especially in the accurate model can be built more deterministic control system application. With the increasingly complex of the modern industrial process, however, increased step by step to control requirements (e.g., stability, accuracy and quickness, etc.), classical control theory is faced with severe challenges. Non-linear systems in industrial control field, using the traditional PID control can not obtain satisfactory control effect. Optimized RBF neural network based on gradient descent algorithm, it will be integrated neural network and PID control technology, with a conventional PID controller has simple structure, physical meaning is clear advantages, at the same time with neural network self-learning, adaptive function. Therefore, this article through to the RBF neural network structure and the calculation method of learning, to design a setting of the PID controller based on RBF neural network, constructs its model, and then write M language program. Using the MATLAB software to design the RBF neural network setting of PID control algorithm simulation research. Data and then further through simulation experiment, the control system stability, robustness, anti-interference ability, etc.Keywords: PID; RBF neural network; Parameter setting目录摘要 (Ⅰ)Abstract (Ⅱ)1 绪论 (1)1.1 课题研究背景及意义 (1)1.2神经网络的发展历史 (3)2 神经网络 (6)2.1神经网络的基本概念和特点 (6)2.2人工神经网络构成的基本原理 (7)2.3神经网络的结构 (8)2.3.1前馈网络 (8)2.3.2 反馈网络 (8)2.4神经网络的学习方式 (9)2.4.1监督学习(有教师学习) (9)2.4.2非监督学习(无教师学习) (9)2.4.3再励学习(强化学习) (9)2.5 RBF神经网络 (10)2.5.1 RBF神经网络的发展简史 (10)2.5.2 RBF的数学模型 (10)2.5.3被控对象Jacobian信息的辨识算法 (11)2.5.4 RBF神经网络的学习算法 (12)2.6 本章小结 (14)3 PID控制器 (14)3.1 PID控制器简介 (14)3.2 经典PID控制原理 (14)3.3 现有PID控制器参数整定方法 (16)3.4 PID控制的局限 (17)3.5本章小结 (17)4 基于RBF神经网络整定的PID控制器设计 (17)4.1 RBF神经网络的PID整定原理 (17)4.2 神经网络PID控制器的设计 (18)4.3 本章小结 (19)5 仿真分析 (19)5.1 系统的稳定性分析 (19)5.2 系统抗干扰能力分析 (21)5.3 系统鲁棒性分析 (22)5.4 本章小结 (24)结论 (25)参考文献 (26)致谢 (27)附录仿真程序 (28)1 绪论1.1 课题研究背景及意义PID控制器(按比例、积分和微分进行控制的调节器)是最早发展起来的应用经典控制理论的控制策略之一,是工业过程控制中应用最广泛,历史最悠久,生命力最强的控制方式,在目前的工业生产中,90%以上的控制器为PID控制器。
控制方向未知的不确定系统预设性能自适应神经网络反演控制
控制方向未知的不确定系统预设性能自适应神经网络反演控制耿宝亮;胡云安【摘要】对一类控制方向未知的不确定严格反馈非线性系统的预设性能自适应神经网络反演控制问题进行了研究.系统中含有时变非匹配不确定项且控制方向未知.首先,提出了一种新的误差转化方法,放宽了对初始误差已知的限制;随后,利用径向基函数(radial basis function,RBF)神经网络及跟踪微分器分别实现了对未知函数和虚拟控制量导数的逼近,并综合运用Nussbaum函数和反演控制技术设计了控制器.所设计的控制器能保证系统内所有信号有界且输出误差满足预设的瞬态和稳态性能要求.最后的仿真研究验证了控制器设计方法的有效性.【期刊名称】《控制理论与应用》【年(卷),期】2014(031)003【总页数】7页(P397-403)【关键词】预设性能;神经网络;Nussbaum函数;反演【作者】耿宝亮;胡云安【作者单位】海军航空工程学院控制工程系,山东烟台264001;海军航空工程学院控制工程系,山东烟台264001【正文语种】中文【中图分类】TP273近年来,科研工作者对不确定非线性系统的稳定控制问题进行了大量的研究,最初系统的不确定性仅限于某些不确定的参数,研究成果包括自适应反馈线性化[1]、自适应反演[2]、控制Lyapunov函数[3]等;神经网络的出现使得更为复杂的不确定系统的稳定控制成为可能,神经网络由于其逼近特性而被用于对未知函数进行逼近,将神经网络与自适应技术相结合成为最近的一个研究热点[4–5].上述文献虽不要求控制增益精确已知,但是却要求控制方向已知,Nussbaum增益法[6]的出现为解决控制方向未知的不确定非线性系统的稳定控制问题提供了一条途径,将自适应技术与Nussbaum函数相结合也取得了一系列的研究成果[7–9].另外一个研究热点是系统的跟踪性能问题,包括稳态性能和瞬态性能两个方面.现有的控制方法大多将注意力放在系统稳态性能的研究上,即保证系统的跟踪误差收敛到一个有界的区域或渐近收敛到原点,而对系统的瞬态性能(包括超调量和收敛速度)缺乏系统的分析和设计工具.Bechlioulis等[10]提出了预设性能的概念,同时兼顾了系统的稳态和瞬态性能.所谓预设性能是指在保证跟踪误差收敛到一个预先设定的任意小的区域的同时,保证收敛速度及超调量满足预先设定的条件.文献[10]针对一类单输入单输出反馈线性化系统进行了预设性能控制器的设计,文献[11]将模型进一步推广到多输入多输出反馈线性化系统,文献[12–14]将预设性能的概念与输出反馈相结合,提出了一种预设性能输出反馈控制器的设计方法;但上述方法并不能简单推广到严格反馈系统,控制方向未知也使问题变得更为复杂,对于控制方向未知的严格反馈非线性系统的预设性能控制问题还没有发现相关报道,并且现有预设性能方法都要求初始跟踪误差已知,使预设性能控制的应用领域受到很大限制.针对上述问题,本文提出一种新的误差转化方法,放宽了对初始误差已知的限制,并针对一类具有非匹配不确定项且控制方向未知的严格反馈非线性系统进行研究,综合运用backstepping技术、Nussbaum增益、自适应控制技术和跟踪微分器解决了此类系统的预设性能控制问题.2.1 问题描述(Problem description)考虑如下具有一般形式的严格反馈非线性系统:其中:x=[x1x2...xn]T∈ℝn,u∈ℝ和y∈ℝ分别为系统的状态量、输入量和输出量;定义¯xi= [x1x2...xi]T∈ℝi,fi(.)和gi(.)为未知连续光滑函数,∆i(t,¯xi)为非匹配不确定项.控制目标如下:1)输出误差e(t)=y(t)−yr(t)满足预先设定的瞬态和稳态性能;2)闭环系统中的所有信号有界.对系统的基本假设[15]如下:假设1存在一个紧集Ω,使得x∈Ω.假设2函数gi(¯xi)及其符号未知,且存在未知正常数和使得0注1假设2表明光滑函数为严格正或严格负.假设3存在未知正常数和已知非负函数,使得假设4期望轨迹yr(t)及其高阶导数yir(t)(i= 1,2,...,n)均连续有界.2.2 性能函数(Performance function)定义1连续函数ρ∶ℝ+→ℝ+为性能函数,满足:1)ρ(t)是正的且严格递减;为满足控制目标(2),文献[10]在假设e(0)已知的情况下给出如下形式:显然,假设e(0)已知具有很大的局限性,在很多系统中是不满足的,本文给出一种变参数约束方案:其中光滑函数和α¯(t)满足下面的性质:且严格递减;注2上面的性质(2)表明,在初始误差e(0)未知的情况下,(0)ρ(0)<e(0)<−(0)ρ(0)始终满足,因此也就放宽了对初始误差已知的限制,本文选取和为如下形式:其中λ,γ,µ,ν为选取的正常数.性能函数选取为其中:ρ0,ρ∞,l>0为预先设定的常数,max{γ/λ, ν/µ}.ρ∞表示预先设定的稳态误差的上界,误差收敛速度及最大超调量可以通过系数λ,µ,l进行调节,上述过程可借助图1进行说明.2.3 误差转化(Error transformation)对于系统中存在形如式(2)的不等式约束的情况,直接处理的难度很大,为将其转化为等式约束,定义误差转化函数S(ε):其中:ε为转化误差,S(ε)满足下述性质:1)S(ε)光滑且严格递增;注3结合性质(2)和ρ(t)>0,得到S(ε)ρ(t)<(t),代入式(5)可得(t)ρ(t)<e(t)<α¯(t)ρ(t),式(2)所示的不等式约束得到满足.本文选取误差转化函数(如图2所示)为由误差转化函数的性质可知,S(ε)可逆(T= S−1),因此转化误差ε可表示为注4如果ε∈ℓ∞,∀t≥0,则不等式约束(2)满足,进一步,考虑到性能函数ρ(t)的衰减特性,对应的跟踪误差将被限制在以下区域:2.4 神经网络逼近(Neural approximation)假设系统中的不确定函数可表示为f(x),其中: x∈ℝn.对于自治型的不确定性,径向基函数(RBF)神经网络的逼近引理如下:引理1对于定义在紧子集Ω∈ℝn上的连续函数f∶Ω→ℝ,存在最优权值向量θ∗f∈ℝm和对应的高斯基函数φf(.)∶ℝn→ℝm,使得[16]其中:m为神经元节点数;x∈ℝn为神经网络的输入向量;ωf(x)为网络重构误差.且存在未知常数Wf>0,使得为解决增益函数及其符号未知的问题,引入Nussbaum增益法.Nussbaum函数的基本定义如下:定义2任意的连续函数N(.)∶ℝ→ℝ,称为Nussbaum函数,如果满足[6]显然,N(ζ)=ζ2cosζ是一个典型的Nussbaum函数,且具有如下的性质[17]:引理2设V(.)和N(.)为定义在[0,tf)上的连续函数,V(t)≥0,∀t∈[0,tf);如果N(.)满足[17]式中:c1,c0>0为适当的常数,g(x(τ))严格正或严格负,则V(t)及ζ(t)在[0,tf)上有界. Step 1对于模型(1)中的第1个子系统,选择虚拟状态量由式(6)可得转化误差ε1为式(9)两边对时间求导可得其中:为关于状态和参数的已知函数,选取Lyapunov函数为其中:=−为估计误差,为对未知参数的估计值.式(11)对时间求导并结合式(10)可以得到选择虚拟控制量x2d为其中=r1ε1η1,η1为待设计的光滑函数.将式(13)代入式(12)得其中z2=x2−x2d为虚拟状态量.结合式(7)–(8)以及假设3得到选择其中k1,nf1,nφ1,ng1,σ1>0.又有将式(15)–(17)代入式(14)得如果|z2(t)|≤Wz2,Wz2>0为未知常数,结合假设2,进一步得到其中:常数p1,q1>0,且定义为式(18)两侧同时乘以ep1t,得到在[0,t)上对式(19)积分,得到由引理2可得,ζ1,V1有界,进一步得到ε1和˜θf1有界.因此,问题转化为z2(t)的有界问题.Step 2对于模型(1)中的第2个子系统,虚拟状态量转化误差式(22)两边对时间求导,得到其中:为关于状态的已知函数.由于˙x2d非常难以计算,本文采用二阶非线性跟踪微分器对其进行光滑逼近.对于跟踪微分器的性能,作如下假设[18]:假设5合理设计跟踪微分器,可以使得跟踪微分器的输出和其输入信号x2d的微分之间的误差一致有界,即存在未知常数εx2d>0,使得|−注5假设5同样适用于其他子系统的设计过程,即存在常数Wxi,d>0,使得|˙xi,d−ˆ˙xi,d|≤Wxi,d,i=3,4,...,n.选取Lyapunov函数为其中:为估计误差,为对未知参数的估计值.式(24)对时间求导并结合式(23)可以得到选择虚拟控制量x3d为其中:˙ζ2=r2ε2η2,η2为待设计的光滑函数.将式(26)代入式(25)得其中z3=x3−x3d为虚拟状态量.结合式(7)–(8)以及假设3和假设5得到选择其中:k2,nf2,nφ2,ng2,nx2d,σ2>0.将式(29)代入式(28)得接下来的步骤与Step1中对应的过程类似,这里不再赘述,最终得到结合引理2可得,ζ2,V2有界,进一步得到ε2和˜θf2有界.采用递归的思想,得到Stepn对于模型(1)中的第n个子系统,选择虚拟状态量误差转化方程为选取Lyapunov函数为其中:=−为估计误差,为对未知参数的估计值.控制量u选择为其中:为待设计的光滑函数.选择最终得到ζn,Vn有界,进一步得到εn和有界.定理1对于式(1)所描述的控制方向未知的不确定严格反馈非线性系统,以假设1–5为前提,采用误差转化方程(33),设计控制器(35)–(36)和自适应律(37),可得到如下结论:1)输出信号y(t)跟踪期望信号yr(t)的同时,闭环系统中的所有信号有界;2)输出误差e(t)=y(t)−yr(t)满足预先设定的瞬态和稳态性能.平面上的双连杆机械手具有强非线性,其动力学方程可以写成如下形式:其中:二维向量q=(q1,q2)T表示关节角,二维力矩向量u=(u1,u2)T为机械手关节处的执行器输入,为机械手惯性矩阵,C(q)=为向心力和科氏力矩阵,G(q)=为重力矩,∆(q,˙q,t)为非匹配不确定项. 2由于上述模型是多输入多输出系统,令q2=˙q2= 0,将其转化为单输入单输出系统,参考信号设置为qr1(t)=π/2+π/6cos(t).具体参数设置为质量/kg:m1=3.2,m2=2.长度/m:l1=0.5,l2=0.4,r1=l1/2,r2=l2/2.转动惯量/(kg.m2):Iz1=0.96,Iz1=0.81.摩擦力系数/(N.m):km1=1,km2=1.性能函数参数:l=0.2,ρ0=1,ρ∞=5×10−3.初值:[q1(0)˙q1(0)]T=[80π/180 0]T.控制器参数:k1=1.0,k2=5.0,nf=1.0,nφ=3.0,ng=0.6,nx2d=5.0.引入二阶非线性跟踪微分器对x2d的导数进行光滑逼近,其数学表达式如下[19]: 其中设计跟踪微分器的参数为R=3.0,δ=0.1.用一个RBF神经网络对系统中的不确定函数进行逼近,选取25个节点,权值向量的初值设为零向量,仿真结果如图3–6所示.图3为跟踪误差随时间的变化情况(左图为整个时间区间的仿真情况,右图为最后10s的仿真情况),图中的点划线表示预先设定的上界和下界,其包围的区域便为跟踪误差的限制区域,可以看出,跟踪误差始终没有超出这个预设的区域,系统响应速度快,超调量小,稳态误差最终控制在5×10−3以内,因此满足文中所提到的预设性能的要求.图4为RBF神经网络的权值变化情况,可以看出25维的权值向量是收敛的,图5为RBF神经网络对未知函数的逼近情况,可以看出不论是逼近速度还是逼近精度都达到了很好的效果,图6为控制量u的变化情况,控制曲线连续平滑,而且幅值较小,易于工程实现.另外,在整个仿真过程中,系统的所有信号有界(限于篇幅,没有一一列出),充分验证了定理1的正确性.本文针对一类含非匹配不确定项及控制方向未知的严格反馈系统进行研究,提出了一种新的误差转化方法,将预设性能这种新型控制方式的应用对象进一步拓宽,并将其与backstepping技术、Nussbaum增益、自适应控制技术和跟踪微分器相结合,完成了控制器的设计,解决了此类系统的预设性能控制问题.耿宝亮(1984–),男,博士研究生,目前研究方向为智能控制、自适应控制等,E-mail:********************;【相关文献】[1]KANELLAKOPOULOS I,KOKOTOVIC P V,MARINO R.An extended direct scheme for robust adaptive nonlinear control[J].Automatica,1991,27(2):247–255.[2]KOJIC A,ANNASWAMY A M.Adaptive control of nonlinearly parameterized systems with a triangular structure[J].Automatica,2002, 38(1):115–123.[3]LIN Y,SONTAG E D.Control-Lyapunov universal formulas for restricted inputs[J].Control Theory and Advanced Technology,1995, 10(4):1981–2004.[4]CHEN F C,KHALIL H K.Adaptive control of nonlinear systems using neuralnetworks[J].International Journal of Control,1992, 55(6):1299–1317.[5]ROVITHAKIS G A.Stable adaptive neuro-control design via Lyapunov function derivative estimation[J].Automatica,2001,37(8): 1213–1221.[6]NUSSBAUM R D.Some remarks on the conjecture in parameter adaptivecontrol[J].Systems and Control Letters,1983,3(5):242–246.[7]YE X.Asymptotic regulation of time-varying uncertain nonlinear systems with unknown control directions[J].Automatica,1999, 35(5):929–935.[8]GE S S,WANG J.Robust adaptive neural control for a class of perturbed strict feedback nonlinear systems[J].IEEE Transactions on Neural Networks,2002,13(6):1409–1419.[9]GE S S,HONG F,LEE T H.Adaptive neural control of nonlinear time-delay systems with unknown virtual control coeff i cients[J]. IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2004,34(1):499–516.[10]BECHLIOULIS C P,ROVITHAKIS G A.Prescribed performance adaptive control of SISO feedback linearizable systems with disturbances[C]//The 16th Mediterranean Conference on Control and Automation.Ajaccio,France:IEEE,2008:1035–1040.[11]BECHLIOULIS C P,ROVITHAKIS G A.Robust adaptive control of feedback linearizable MIMO nonlinear systems with prescribed performance[J].IEEE Transactions on Automatic Control,2008,53(9): 2090–2099.[12]KOSTARIGKA A K,ROVITHAKIS G A.Prescribed performance output feedback control:an approximate passivation approach[C] //The 18 th Mediterranean Conference on Control and Automation. Marrakech,Morocco:IEEE,2010:11–16.[13]KOSTARIGKA A K,ROVITHAKIS G A.Prescribed performance outputfeedback/observer-free robust adaptive control of uncertain systems using neural networks[J].IEEE Transactions on Systems, Man,and Cybernetics,PartB:Cybernetics,2011,41(6):1483–1494.[14]KOSTARIGKA A K,ROVITHAKIS G A.Adaptive dynamic output feedback neural network control of uncertain MIMO nonlinear systems with prescribed performance[J].IEEE Transactions on Neural Networks and Learning Systems,2012,23(1):138–149.[15]胡云安,晋玉强,李海燕.非线性系统鲁棒自适应反演控制[M].北京:电子工业出版社,2010. (HU Yun’an,JIN Yuqiang,LI Haiyan.Robustness of Adaptive Backstepping Control forNonlinear Systems[M].Beijing:Publishing House of Electronics Industry,2010.)[16]PARK J,SANDBERG I W.Universal approximation using radial basis function networks[J].Neural Computation,1991,3(2):246–257.[17]XU J X,YAN R.Iterative learning control design without a priori knowledge of the control direction[J].Automatica,2004,40(11): 1802–1809.[18]韩京清,王伟.非线性跟踪–—微分器[J].系统科学与数学,1994, 14(2):177–183. (HAN Jingqing,WANG Wei.Nonlinear tracking differentiator[J]. System Science and Mathematics,1994,14(2):177–183.)[19]李静,胡云安,耿宝亮.控制方向未知的二阶时变非线性系统自适应迭代学习控制[J].控制理论与应用,2012,29(6):730–740. (LI Jing,HU Yun’an,GENG Baoliang.Adaptive iterative learningcontrol for second-order time-varying nonlinear system with unknown control directions[J].Control Theory and Applications,2012, 29(6):730–740.)。
SCARA机械手的RBF神经网络自适应轨迹跟踪控制
S e l f - A d a p t i v e T r a j e c t o r y T r a c k i n g Co n t r o l o f R B F Ne u r a l Ne t w o r k S C A RA Ma n i p u l a t o r
S C A R A机械手的 R B F神 经网络 自适应轨迹跟踪控制
龚发 云 ,袁 雷华 ,汤亮
( 湖北工业大学机械 工程学院,湖北武汉 4 3 0 0 6 8 )
摘要 :为 了解决机械手 系统模 型存 在参数 变化 、强耦合 、高度非线性等不确定性 因素 ,提出基于 R B F神经 网络机 械手 自适应控制方法 。该方法利 用 R B F神经 网络 的 自适应 、容错 、并行处理 及非 线性 映射能力 ,从 而实现了无需机械手精 确模 型信息 的控制 。通过 M a t l a b / S i m u l i n k环境 下的仿真实验表 明 ,该方法 可实现 对 S C A R A机械 手 的位 置跟踪控 制 ,通过 控制 算法适 时地修 正网络参 数 , 实现对非线性 系统任 意轨迹 的轨迹 跟踪控制 , 具有 良好 的控制 品质 。 关键词 :机械手 ;R B F神经 网络 ;Ma t l a b / S i m u l i n k ;轨迹 跟踪 中图分 类号 :T P 2 4 1 . 2 文献标识 码 :A 文章编号 :1 0 0 1 —3 8 8 1( 2 0 1 4 )3— 0 4 1 —6
c o n t r o l a l g o r i t h m, t h e rb a i t r a r y t r a j e c t o y r t r a c k i n g c o n t r o l o f t h e n o n l i n e a r s y s t e m i s r e a l i z e d w i t h g o o d c o n t r o l q u a l i t y . Ke y w o r d s :M a n i p u l a t o r ; R B F n e u r a l n e t w o r k ; Ma t l a b / S i m u l i n k ;T r a j e c t o r y t r a c k i n g
基于RBF神经网络的新型AUV自抗扰控制方法
基于RBF神经网络的新型AUV自抗扰控制方法随着科技的快速发展,自主水下机器人(AUV)在海洋勘探、海洋资源开发和环境监测等领域中日益受到重视。
然而,水下环境的复杂性和不确定性给AUV的控制带来了巨大的挑战。
为了提高AUV的自主性和鲁棒性,研究者们提出了许多控制方法。
本文将重点介绍一种基于RBF神经网络的新型AUV自抗扰控制方法。
一、介绍1.1 AUV的自抗扰控制需求AUV在海洋中进行各种任务时,受到水流、水压变化、潮汐等外部扰动的影响。
这些扰动会干扰AUV的轨迹跟踪、深度控制等关键任务。
因此,提高AUV的自抗扰控制能力是非常重要的。
1.2 RBF神经网络RBF神经网络是一种特殊的前馈神经网络,其具有良好的逼近能力和学习能力。
RBF神经网络由输入层、隐含层和输出层组成,其中隐含层的神经元采用径向基函数作为激活函数。
二、基于RBF神经网络的AUV自抗扰控制方法2.1 系统建模为了对AUV的运动进行建模,将AUV的水动力学方程表示为:(此处省略具体公式)2.2 控制器设计基于RBF神经网络的AUV自抗扰控制器由主控制器和辅助控制器组成。
2.2.1 主控制器主控制器采用RBF神经网络来估计系统扰动,并将估计值用于控制器设计中的补偿环节。
具体步骤如下:1) 随机初始化RBF神经网络的权重和偏置。
2) 根据训练数据对神经网络进行训练,得到最优的权重和偏置。
3) 利用训练好的神经网络进行扰动估计。
4) 将扰动估计值输入到控制器的补偿环节中,实现对系统扰动的抵消。
2.2.2 辅助控制器辅助控制器用于跟踪期望轨迹,保证AUV的运动服从期望指令。
具体步骤如下:1) 设计适用于期望轨迹跟踪的控制器结构,如PID控制器。
2) 根据期望轨迹和当前状态的误差,计算控制器输入。
3) 将控制器输入和主控制器输出进行叠加,得到总的控制指令。
4) 将控制指令输入到AUV的执行单元中,控制AUV运动。
三、仿真实验及结果分析为了验证基于RBF神经网络的AUV自抗扰控制方法的有效性,进行了一系列的仿真实验。
基于RBF网络的模型参考自适应控制
LI H u— i U im ng,LI Li n U a g,DONG o - a H ng c n
( t r no m ainCe tr Ne wo k I fr to n e ,Qig a ie st fSce c ndTe h oo y,Qig a 6 0 1,Chia n d o Unv riyo in ea c n lg n d o2 6 6 n)
Ab ta t sr c :Th o e e e e c da tv o r 1t t a e n RBF e a e wor s i e m d 1r f r n e a p i e c nt o ha b s d o n ur ln t k s p o s d f ra ca s o o i e rd a c ls s e . The c nt o lra go ih e r po e o l s fn nln a yn mia y t ms o r le l rt m mpl y o sa r di lb ss f nc i n ne wo k t o p n a e t on i a iis a p i ey.A t b e c n a a a i u to t r o c m e s t he n lne rte da tv l s a l o —
文 章编 号 : 6 26 8 ( 0 8 0 — 0 8 0 1 7 — 9 7 2 0 ) 10 6 —4
基 于 RB F网络 的模 型 参 考 自适 应控 制
刘慧 明 ,刘 亮 ,董洪灿
( 岛 科技 大 学 网 络 中 心 , 青 山东 青 岛 2 6 6 ) 6 0 1
摘 要 :针对 一类非 线性动 态 系统 给 出 了一种 基 于 R F 径 向基 函数 ) 经 网络 的模 型参 B ( 神
基于外环速度补偿的封闭机器人确定学习控制
基于外环速度补偿的封闭机器人确定学习控制王 敏 1, 2林梓欣 1王 聪 3杨辰光1摘 要 针对未开放力矩控制接口的一类封闭机器人系统, 提出一种基于外环速度补偿的确定学习控制方案. 该控制方案考虑机器人受到未知动力学影响, 且具有未知内环比例积分(Proportional-integral, PI)速度控制器. 首先, 利用宽度径向基函数(Radial basis function, RBF)神经网络对封闭机器人的内部未知动态进行逼近, 设计外环自适应神经网络速度控制指令. 在实现封闭机器人稳定控制的基础上, 结合确定学习理论证明了宽度RBF 神经网络的学习能力, 提出基于确定学习的高精度速度控制指令. 该控制方案能够保证被控封闭机器人系统的所有信号最终一致有界且跟踪误差收敛于零的小邻域内. 在所提控制方案中, 通过引入外环补偿控制思想和宽度神经网络动态增量节点方式, 减小了设备计算负荷, 提高了速度控制下机器人的运动性能, 解决了市场上封闭机器人系统难以设计力矩控制的难题, 实现了不同工作任务下的高精度控制. 最后数值系统仿真结果和UR5机器人实验结果验证了该方案的有效性.关键词 确定学习, 速度补偿控制, 神经网络, 封闭机器人引用格式 王敏, 林梓欣, 王聪, 杨辰光. 基于外环速度补偿的封闭机器人确定学习控制. 自动化学报, 2023, 49(9): 1904−1914DOI 10.16383/j.aas.c220575Deterministic Learning of Manipulators With Closed ArchitectureBased on Outer-loop Speed Compensation ControlWANG Min 1, 2 LIN Zi-Xin 1 WANG Cong 3 YANG Chen-Guang 1Abstract In this paper, a deterministic learning outer-loop speed compensation control scheme is proposed for a class of manipulator systems with closed architecture and without open torque control interface. The proposed scheme focuses on that the manipulator is affected by unknown modelling dynamics and has an unknown inner-loop proportional-integral (PI) speed controller. Firstly, the broad radial basis function (RBF) neural network is used to approximate the internal unknown dynamics of the manipulator with closed architecture, and the outer-loop adapt-ive neural network speed control command is designed by using the Lyapunov function. Based on the stable control of man-ipulator with closed architecture, the dynamic learning ability of RBF neural network is verified, and then the high-accuracy speed control command is designed based on the deterministic learning theory. The proposed control sch-eme guarantees that all signals of the manipulator system with closed architecture are ultimately uniformly boun-ded, and the tracking error converges to a small neighborhood of zero. By the combination of outer-loop compensa-tion control and dynamic incremental node of broad neural networks, the proposed scheme reduces the computing lo-ad, improves the motion performance of the robot under speed control, solves the torque control design difficulty of the closed manipulator, and realizes high-precision control in different working tasks. Finally, simulation results of numerical system and experimental results of UR5 robot are used to show the effectiveness of the proposed scheme.Key words Deterministic learning, speed compensation control, neural network, manipulators with closed architec-tureCitation Wang Min, Lin Zi-Xin, Wang Cong, Yang Chen-Guang. Deterministic learning of manipulators with closed architecture based on outer-loop speed compensation control. Acta Automatica Sinica , 2023, 49(9):1904−1914近年来, 机器人在工程应用和日常生活中发挥着越来越重要的作用, 被广泛应用于空间探测、焊收稿日期 2022-07-14 录用日期 2023-01-11Manuscript received July 14, 2022; accepted January 11, 2023国家自然科学基金(62273156, 61890922, U20A20200, 61973129), 广东省自然科学基金(2019B151502058), 鹏城实验室重大攻关项目(PCL2021A09), 佛山市科技攻关项目(2020001006308,2020001006496)资助Supported by National Natural Science Foundation of China (62273156, 61890922, U20A20200, 61973129), Natural Science Foundation of Guangdong Province (2019B151502058), the Ma-jor Key Project of Peng Cheng Laboratory (PCL2021A09), and Industrial Key Technologies Program of Foshan (2020001006308,2020001006496)本文责任编委 许斌Recommended by Associate Editor XU Bin1. 华南理工大学自动化科学与工程学院 广州 5106412. 鹏城实验室 深圳 5180553. 山东大学控制科学与工程学院 济南2500611. School of Automation Science and Engineering, South China University of Technology, Guangzhou 5106412. Peng Cheng Laboratory, Shenzhen 5180553. School of Control Science and Engineering, Shandong University, Jinan 250061第 49 卷 第 9 期自 动 化 学 报Vol. 49, No. 92023 年 9 月ACTA AUTOMATICA SINICASeptember, 2023接、装配、医疗等领域, 相关技术也越来越受到科研人员重视[1−3]. 在机器人控制领域, 其控制目标之一就是实现机器人对特定任务轨迹的跟踪. 多自由度机器人作为一个高度耦合的非线性多输入多输出系统[4], 主要控制难点在于机器人工作环境任务多变,在外界扰动、负载变化、参数测量不精确等因素影响下, 机器人系统精确建模难度较大, 使得比例积分微分(Proportional-integral-derivative, PID)控制等经典控制算法难以满足机器人控制的精度要求. 针对机器人系统存在部分参数不确定或测量不准确的问题, 一些学者结合鲁棒控制、滑模控制等思想, 提出了许多有效的自适应控制算法[5−7]. 当机器人系统存在不可建模动态时, 一些学者结合神经网络的非线性函数逼近特性, 提出了大量的自适应神经网络控制方案, 保证了机器人在多变环境下的高性能控制[8−12].值得注意的是, 上述控制方案大多数都是基于力矩进行控制器设计, 其方案有效性主要是通过数值系统仿真进行验证, 鲜有在实际机器人上进行实验和应用. 造成上述现象的原因是, 当前市面上大部分工业/商业机器人并不开放力矩接口, 而是采用速度/位置控制. 这些封闭机器人采用标准的内外环控制结构, 其中外环为运动学环, 内环为动力学环, 内环控制的采样速率一般比外环要快得多,且普遍认为其内环控制使用速度比例积分(Propor-tional-integral, PI)控制器或位置PID控制器[13].封闭机器人的这些性质, 导致用户一般只能对其进行简单的运动学控制[14], 从而使得机器人难以应对多变的个性化产品加工. 针对这类具有内外环结构的机器人的控制问题, 部分学者提出了解决方案.文献[5, 15]在研究具有未知动力学和未知运动学的机械臂控制时, 提出了适当的自适应控制器. 文献[16]研究了一类具有关节速度反馈内环的机器人任务空间控制问题, 提出了一种基于模型的内环关节速度控制器通用结构[17]. 注意到, 上述控制方案中跟踪误差的收敛依赖于内环速度控制器的修改或再设计, 并不是常见的速度PI控制器或位置PID控制器, 对于具有不可修改内环的工业/商业机器人而言, 这些控制方案也难以实现应用. 进一步, 一些学者提出了预校正方案[18], 这些预校正方案的有效性验证主要是通过直观解释和实验结果进行的, 并没有进行严格理论分析. 针对封闭机器人控制存在的上述问题, 文献[19]在考虑机器人具有可以线性参数化的未知动力学和运动学且内环控制器参数未知和不可修改的背景下, 设计了一类外环自适应速度补偿控制器, 保证了机器人系统的稳定性和误差收敛. 该方案需要计算动力学和运动学回归矩阵, 这两个矩阵随着机械臂关节增多, 计算的复杂度呈指数倍增长. 此外, 实际机器人系统由于受到阻尼以及摩擦力等影响, 存在本质的非线性. 因此, 如何提出简单有效的封闭机器人控制方案, 既能实现封闭力矩的补偿控制, 又能精确建模未知非线性仍是一个开放性的问题.众所周知, 神经网络是建模未知非线性的有效方法[20]. 然而, 现有的大部分自适应神经网络控制并没有充分利用神经网络的学习能力, 即使是处理相同的任务也需要对神经网络进行重复训练, 该过程耗时长、计算资源消耗大、暂态阶段的控制性能也较差. 因此, 如何实现神经网络在控制过程中的学习和经验知识再利用是一个很有意义的课题[21].对此, 文献[22]提出确定学习理论, 解决了神经网络对未知动态的学习问题. 该理论证明了沿着回归轨迹的径向基函数(Radial basis function, RBF)神经网络满足持续激励(Persistent excitation, PE)条件, 进一步结合线性时变系统指数稳定性证明了神经网络权值的精确收敛. 基于该理论, 文献[23]引入动态面技术, 解决了自适应神经网络在严格反馈系统中的学习问题. 近年来, 确定学习理论也已被广泛应用于机器人编队控制[24]、心肌缺血早期诊断[25]、水面无人船控制[26]等领域, 在机械臂控制领域也有相关工作[27]. 然而, 现有基于确定学习的控制方案仍是基于力矩进行设计的, 无法在封闭的工业/商业机器人上直接进行应用.综上所述, 本文针对未开放力矩接口的一类封闭机器人系统, 在考虑机器人受到未知动力学影响且具有未知内环PI速度控制器的情况下, 基于文献[19]的外环补偿框架提出了一种基于外环速度补偿的确定学习控制方案, 实现了封闭机器人的关节轨迹跟踪控制. 该方案的主要贡献点如下: 1)在文献[19]的工作基础上, 引入神经网络处理系统未知动态, 取消了封闭机器人未知动力学模型参数线性化假设, 并简化了外环补偿控制设计过程; 2)采用宽度RBF神经网络动态增量神经网络节点, 降低了网络结构复杂度, 改善了系统控制的实时性;3)引入确定学习理论, 实现了宽度RBF神经网络对封闭机器人未知动态的精确学习, 并利用经验知识避免了对网络重复训练, 降低了计算负担, 实现了快稳准的高精度跟踪控制; 4)为确定学习理论应用于具有类似结构的封闭机械系统提供了研究思路, 拓展了确定学习的应用范围.1 问题描述及预备知识1.1 系统说明与控制目标n 本文所考虑的由永磁直流电动机驱动的自由9 期王敏等: 基于外环速度补偿的封闭机器人确定学习控制1905度机器人动力学模型[19]如下x 1∈R n M (x 1)∈R n ×nC (x 1,˙x1)∈R n ×n G (x 1)∈R n K ∈R n ×n u ∈R n 其中, 是机器人关节角位置; 是机器人的惯性矩阵; 是机器人的科氏力矩阵; 是机器人的重力向量; 是机器人内部的控制增益, 为一常值对角正定矩阵; 是封闭机器人的内环控制器.M (x 1)λm λM λm I ≤M (x 1)≤λM I I 性质 1. 机器人动力学方程的惯性矩阵 是对称并一致正定的, 且具有一致的界限, 存在正常数 和 使得 , 其中 为适当定义的单位矩阵.C (x 1,˙x 1)˙M (x 1)−2C (x 1,˙x 1)性质 2. 可以通过适当定义机器人动力学方程的科氏力矩阵 , 使得 是斜对称矩阵.在研究的封闭机器人内外环控制方法中, 本文考虑内环控制器为PI 速度控制器[19], 结构如下˙q c q c K p K i 其中, 和 是关节速度指令和关节位置指令, 是内环控制器的比例系数, 是内环控制器的积分系数, 均为未知对角正定矩阵.考虑如下光滑有界参考模型, 该模型将产生封闭机器人的关节期望轨迹x d 1∈R n x d 2∈R n f (x d 1,x d 2)y d =x d 1y d 其中, 和 分别是封闭机器人期望的关节角位置和角速度, 是给定的光滑非线性函数, 是封闭机器人期望输出. 本文假设期望输出 为周期轨迹.本文的控制目标是基于外环速度补偿控制思想, 在考虑封闭机器人具有不确定动力学和未知参数内环控制器的情况下设计系统(1)的速度控制指x 1y d 令, 从而确保: 1)机器人系统的所有信号都是最终一致有界的; 2)系统的输出 能够跟踪给定的期望输出轨迹 ; 3)在控制过程中学习机器人内部未知动态, 并利用学到的未知动态知识实现封闭机器人高精度跟踪控制. 控制方案框图如图1所示.1.2 RBF 神经网络1) RBF 神经网络的万能逼近特性: 为逼近机械臂控制过程中的未知非线性动态, 本文使用如下形式的RBF 神经网络f (Z )∈R n Z ∈ΩZ ΩZ W ∗∈R np p S (Z )=[s 1(Z −ξ1),···,s p (Z −ξp )]T s i (Z −ξi )=exp (−(Z −ξi )T (Z −ξi )/ηi )ξi =[ξi 1,···,ξin ]T ηi ϵ(Z )ΩZ f (Z )∥ϵ(Z )∥≤ϵ∗ϵ∗其中, , 是神经网络输入向量, 为一紧集, 是神经网络理想权值向量, 为RBF 神经网络隐含层节点数, 为回归向量, 此处选取高斯函数 作为径向基函数, 和 分别是神经元节点的中心和宽度, 是RBF 神经网络逼近误差. 文献[28]已经证明通过选取适当的神经元节点数、神经元中心和宽度, RBF 神经网络能够以任意精度逼近在紧集 上的任意光滑连续函数 , 即逼近误差 , 是一个任意小的正整数.ΩZ Z f (Z )2) RBF 神经网络的局部逼近能力: 基于文献[22], 对于紧集 内的任意有界轨迹 , 可以用沿着该轨迹的局部区域内有限数量的神经元逼近, 即S ζ(Z )=[s 1ζ(Z −ξ1ζ),···,s p ζ(Z −ξp ζ)]T S (Z )W ∗ζ∈R np ζW ∗p ζ<p ϵζ(Z )∥ϵζ(Z )∥−∥ϵ(Z )∥其中, 是回归向量 的子向量, 是神经网络理想权值向量 的子向量, 且 , 是局部RBF 神经网络逼近误差, 且 是一图 1 封闭机器人控制系统框图Fig. 1 Schematic diagram of manipulators with closed architecture control system1906自 动 化 学 报49 卷个极小值.S :[0,∞)→R s Λ1,Λ2,T 0定义 1[22]. 考虑一致有界且分段连续的向量函数 , 若存在大于零的常数 ,使得如下公式成立S I s ×s那么向量函数 满足PE 条件, 其中 定义为 维的单位矩阵.Z Z [0,∞)R q Z ΩZ ⊂R q ΩZ Z S ζ(Z )引理 1[22]. RBF 神经网络的局部PE 条件: 考虑任意回归/周期轨迹 , 假设 是从 到 的连续映射, 且 位于紧集 中. 则对于中心置于规则晶格(足够大到覆盖紧集 )上的RBF 神经网络, 只有中心位于回归/周期轨迹 的小邻域内的神经元才会被激励, 由其组成的回归子向量 将满足PE 条件.1.3 宽度RBF 神经网络在传统的RBF 神经网络逼近中, 需通过选取合适的神经元节点数、中心和宽度来保证逼近精度,而在实际应用中通常需要设计者根据自己的经验不断试错, 采用均匀布点的方式来设计RBF 神经网络的结构, 具有很强的主观性. 同时, 机器人控制系统是一个多输入多输出系统, 随着控制连杆数量的增加, RBF 神经网络的输入维数会呈几何倍数增长, 在均匀布点的设计方案下, 神经元数量也会急剧升高, 这将导致神经网络的计算负荷提高, 对硬件设备提出了更高的要求, 同时也将影响系统控制的实时性. 为了解决上述问题, 本文将使用文献[29]所提出的宽度RBF 神经网络方法进行网络结构设计. 该方法结合宽度神经网络增量节点的思想, 可实现在系统控制过程中神经元的自适应调整.宽度RBF 神经网络在初始化阶段以系统的初始状态为第一个神经元, 之后会根据神经网络的实际输入与网络已有神经元中心的距离来判断是否应该新增神经元. 新增神经元的增加策略如下:1)定义新增神经元所需参数ξn ,ηn ,W n 其中, 分别是新增神经元的中心、宽度和权值, 本文新增神经元的宽度设置与已有神经元一致, 权值统一初始化为零.2)判断当前网络输入是否超出现有神经元所构成的紧集域k C min ={c 1,···,ck }首先, 本文使用欧氏距离来描述当前网络输入与神经元中心点的距离, 根据距离选取离当前输入最近的 个点集 , 则可由下式获得新增神经元的中心βC min 0∼1¯Cmin C min ¯Cmin =(c 1+c 2+···+c k )/k 其中, 是决定新增神经元与神经元集合 之间距离的可调参数, 取值范围为 ; 是神经元集合 的平均中心位置, .εZ C min ¯Cmin ε然后, 设置判断是否新增神经元的可调阈值 ,当神经网络当前输入 与神经元集合 的平均中心位置 之间距离大于阈值 时, 添加新的神经元, 否则保持原有神经元集合不变.2 外环自适应神经网络速度控制指令设计本节将针对系统(1), 采用反步法进行基于外环补偿的速度控制指令设计. 首先将封闭机器人系统的内环速度PI 控制器(2)代入系统(1), 将系统(1)转化为如下形式K P =KK p K I =KK i y y =x 1其中, , , 是机器人系统输出关节角位置, .根据传统反步法设计思想, 定义如下误差变量α1α1˙q c 其中, 是虚拟控制器. 考虑系统(8), 接下来的反步设计包括两个步骤, 将依次设计出虚拟控制器 和速度控制指令 . 具体设计过程如下:z 1步骤 1. 考虑系统(8)以及误差定义(9), 对 求导得α1根据式(10), 虚拟控制器 可设计为c 1其中, 为控制增益, 且为正的设计参数.z 2步骤 2. 根据误差定义(9), 对 求导可得考虑封闭机器人系统具有未知的动力学和内环速度PI 控制器, 定义未知系统动态为Z 1=[x T 1,x T 2,q T c ,˙αT 1]T ∈R 4n n f (Z 1)其中, , 是机器人自由度. 使用RBF 神经网络来逼近未知动态 , 得9 期王敏等: 基于外环速度补偿的封闭机器人确定学习控制1907ϵ1(Z 1)∥ϵ1(Z 1)∥≤ϵ∗ϵ∗W ∗1∈R nϖϖW ∗1ˆW 1˜W 1=ˆW 1−W ∗1其中, 是逼近误差, 且 , 是任意小的正数, 是未知的理想权值向量, 为宽度RBF 神经网络节点个数. 令 的估计值为, 则权值估计误差为 .将式(14)代入式(12)可得ˆW1W ∗根据式(15), 利用权值估计值 代替理想权值 , 设计自适应神经网络速度控制指令如下并构造神经网络权值估计值更新率为c 2˙q c γσσ其中, 是速度控制指令 的控制增益, 且为正的可设计参数; , 分别是神经网络权值估计值更新率的控制增益和 修正项, 均为正的待设计参数.q c ˙qc q c 注 1. 在考虑未知动力学影响的机器人自适应神经网络控制器设计中, 现有大部分成果均为力矩控制器, 无法应用于本文所考虑的封闭机器人系统.本文在机器人具有未知不可修改内环速度PI 控制器的背景下, 设计了与内环相匹配的外环自适应神经网络速度控制指令. 该指令与常见力矩控制器的代数方程形式不同, 是一个关于 的一阶微分方程,通过求解该微分方程, 可以获得输入机器人系统的速度控制指令 和位置控制指令 , 同时, RBF 神经网络的应用使该速度控制指令具有适应机器人未知动力学影响和未知内环控制器的能力.q c K,K p ,K i K −1P K I q c 注 2. 与现有基于反步法的自适应神经网络力矩控制器相比, 本文所设计速度控制指令在神经网络输入上将多出一个信号 . 这是因为在控制器设计过程中, 为了处理内环速度PI 控制器的未知参数 带来的不确定性, 本文在定义未知系统动态的时候将 考虑在内, 从而有助于后续的控制器设计以及未知动态的精确神经网络逼近.至此, 可得封闭机器人的闭环系统动态如下µ>0V (0)≤µc 1c 2γσz 1z 2定理 1. 考虑由封闭机器人系统(8)、参考模型(3)、自适应神经网络速度控制指令(16)和神经网络权值估计值更新率(17)所组成的闭环系统, 那么对于任意给定的常数 以及所有满足 的系统初始状态,则通过选取合适的设计参数 ,, 和 , 可以使得闭环系统中的所有信号是最终一致有界的, 并且跟踪误差 , 能够收敛到零的小邻域内.证明. 选取如下Lyapunov 函数结合机器人动力学方程性质2, 沿系统(18)所产生的轨迹对所选Lyapunov 函数求导可得利用Young 不等式对Lyapunov 函数的导数放缩得λmin (K P )K P 其中, 是矩阵 的最小特征值.结合式(19)和式(21)可得其中a >b /µV =µ˙V≤0V ≤µV (0)≤µt >0V (t )≤µ至此, 只要选择 , 那么可以保证当 时, , 因此 是一个不变集, 即对于任意满足 的初始条件, 对于任意 , 有 .进一步, 对式(22)积分可得其中c 1,c 2,从上式可知, 通过选取合适的设计参数 1908自 动 化 学 报49 卷γ,σθ, 可使得 任意小. 因此, 闭环系统中的所有信号是最终一致有界的.进一步, 从式(19)及式(23)可得ν1>√2θ/λmin (K P )ν2>√2θ/λm T 1t>T 1令 , , 则存在一个有限时间 , 对于任意 有θν1,ν2z 1,z 2T 1从上述分析可知, 选取合适的设计参数可使 任意小, 即 可以任意小, 因此跟踪误差 可以在有限时间 内收敛到零的小邻域内.□3 基于确定学习的速度补偿控制T 1在第 2 节, 本文针对封闭机器人系统(8)设计了外环自适应神经网络速度控制指令(16)以及神经网络权值估计值更新率(17), 并证明了系统在该控制指令的作用下是最终一致有界的, 且系统跟踪误差可在有限时间 内收敛于零的小邻域内. 本节将基于确定学习理论[22], 进一步验证神经网络对封闭机器人系统(8)未知动态的准确学习, 且实现学习后的常值神经网络权值的表达与存储.y d ˆW 1(0)=0W ∗1Z 1diag {S T 1(Z 1),···,S T 1(Z 1)}¯W1定理 2. 考虑由封闭机器人系统(8)、参考模型(3)、自适应神经网络速度控制指令(16)和神经网络权值估计值更新率(17)所组成的闭环系统, 对于任意给定的回归期望轨迹 , 有界的初始条件以及, 神经网络权值估计值将收敛到理想权值 的小邻域内, 且沿着回归输入信号 的常值RBF神经网络 , 即ϵ1(Z 1)∥ϵ1(Z 1)∥≤ϵ∗ϵ∗¯W1其中, 是神经网络对未知系统动态的逼近误差, 且 , 是一个任意小的正整数, 且常值神经网络权值 的表达式为t b >t a >T 1[t a ,t b ]其中, , 是系统达到稳态后的一段时间.证明. 证明分为以下两个部分进行:Z 11)神经网络输入 回归性证明.y d ,˙y d ,¨y d T 1z 1=x 1−y d y =x 1y d α1=−c 1z 1+˙y d 根据给定光滑有界参考模型(3), 期望轨迹 均为周期轨迹. 由定理1可知, 闭环系统内的所有信号均有界且跟踪误差在有限时间 内收敛到零的小邻域. 根据 , 封闭机器人的输出关节角位置 能够跟踪上给定的期望周期轨迹 ; 虚拟控制器 将跟踪上周˙y d z 2=x 2−α1x 2˙y d ˙α1=−c 1(x 2−˙y d )+¨y d ¨y d 期轨迹 . 根据跟踪误差 , 能够跟踪上周期轨迹 , 故虚拟控制器的导数 将跟踪上周期轨迹 .x 2α1˙z 2=˙x 2−˙α1M (x 1)x 1M (x 1)z 1,z 2,ϵ1(Z 1)diag {S T 1(Z 1),···,S T 1(Z 1)}˜W1˜W1S 1(Z 1)˙qc =−diag {S T1(Z 1),···,S T 1(Z 1)}ˆW 1−c 2z 2−z 1˜W 1ˆW 1˙q c 因为 和 均为周期信号, 故 为周期信号. 考虑封闭机器人系统的惯性矩阵 ,当机器人所有的运动关节为转动关节时, 矩阵中仅含有 的正弦函数和余弦函数元素, 因此惯性矩阵 是周期信号. 又 均为任意小的值, 从式(18)可得, 是周期信号且有界, 根据定理1有 有界, 且对于所有的神经网络输入 有界. 则考虑外环自适应神经网络速度控制指令 , 由 有界可得 有界, 故 是有界信号.x 1,˙x 1C (x 1,˙x 1)G (x 1)˙q c +K −1P K I q c q c 根据科氏力矩阵和重力矩阵的定义可知, 当 为周期信号时, 和 亦是周期信号. 结合式(12)可得, 为周期信号且有界, 则 有界且满足回归性.t T 1Z 1=[x T 1,x T 2,q T c ,˙αT1]S 1(Z 1)综上所述, 当时间 超过有限时间 后, 神经网络输入 是满足回归性的. 进一步借由引理1, 可以得到回归向量 满足局部PE 条件.2)构建线性时变系统及其稳定性证明.Z 1使用沿着回归信号 的局部RBF 神经网络对未知系统动态进行逼近, 并考虑由(15)、(16)和(17)组成的闭环子系统有S 1ζ(Z 1)S 1(Z 1)Z 1ˆW 1ζ¯1ζZ 1∥diag {S T¯1ζ(Z 1),···,S T ¯1ζ(Z 1)}ˆW ¯1ζ∥Z 1ϵ1ζ(Z 1)=ϵ1(Z 1)−diag {S T ¯1ζ(Z 1),···,S T ¯1ζ(Z 1)}˜W ¯1ζ∥ϵ1ζ(Z 1)∥∥ϵ1(Z 1)∥其中, 是回归向量 的子向量, 是由回归轨迹 附近被激活的神经元构成的; 是权值估计值向量的子向量. 式(28)中下标 表示远离回归轨迹 的神经元, 这部分神经元不会被激活, 其权值将会在零附近, 因此 将是一个较小的值. 沿着回归轨迹 的局部RBF 神经网络逼近误差为 , 且 将接近于 .M (x 1)K P 考虑到 的存在可能使得神经网络的逼近误差项被放大, 这将导致即使闭环系统(27)标9 期王敏等: 基于外环速度补偿的封闭机器人确定学习控制1909e 2=K −1PM (x 1)z 2称部分的指数稳定性得到证明, RBF 神经网络的学习能力也无法实现. 对此, 本文引进一个新的误差变量 来避免上述问题, 借由新误差变量可将系统(27)转化为如下带小摄动项的线性时变系统形式H (Z 1)=diag {S 1ζ(Z 1),···,S 1ζ(Z 1)}ϵ′1ζ=−z 1+ϵ1ζA =−(c 2+K −1P C (x 1,˙x 1)−K −1P˙M (x 1))×M −1(x 1)K P ,P =γM −1(x 1)K P 其中, , , .ϵ′1ζσσγˆW1ζc 2˙P+P A +A T P <0ϵ′1ζ−σγˆW 1ζe 2˜W1ζT 1根据定理1可知, 是一个极小值, 通过选取较小的参数 也可使 是一个极小值, 故系统(29)是一个带有小摄动项的线性时变系统. 随后通过选取合适的参数 , 可使得 . 进一步运用文献[23]的方法可证明系统(29)中标称部分的指数稳定性. 此外, 由于通过选取合适参数可使得摄动项 和 非常小, 因此借由文献[30]中的小摄动定理(引理4.6), 可保证误差 和 在有限时间 内均可收敛到零的小邻域内.ˆW1W ∗根据上述证明, 权值估计值 最终会收敛于理想权值 , 故可运用式(26)所存储的常值权值构造常值RBF 神经网络¯ϵ1ζ¯ϵ1ϵ1ζϵ1其中, 和 分别接近 和 .□进一步, 运用所获常值RBF 神经网络, 可获基于确定学习的速度控制指令如下ρ>0U (0)≤ρc 1c 2z 1定理 3. 考虑由封闭机器人系统(8)、参考模型(3)、基于确定学习的速度控制指令(31)所组成的闭环系统, 对于任意给定的常数 以及所有满足 的系统初始状态, 则通过选取合适的待设计参数 , 可使得闭环系统中的所有信号是最终一致有界的, 并且跟踪误差 能够收敛到零的小邻域内.该证明与定理1的证明过程类似, 此处略.注 3. 基于自适应神经网络的速度补偿控制方案需要在线自适应调整神经网络估计权值, 主要适用于控制任务变化的工作场景. 基于确定学习的速度补偿控制方案包括两个工作阶段: 神经网络训练和经验利用. 神经网络训练阶段, 即自适应调节过程, 该阶段适用任务多变的工作场景; 经验利用阶段, 即利用训练阶段获取的未知动态知识构造神经网络学习控制器, 提升系统的暂态控制性能和降低在线计算量, 主要适用于与训练阶段控制任务相同或相似的工作场景.4 实验验证为验证本文所提方案的有效性, 本节将分别在双连杆封闭机器人数值系统和实际UR5机器人平台上进行实验验证. UR5机器人作为市面上常见的工业机器人, 其力矩控制接口不予开放, 一般只可做运动控制, 符合本文封闭机器人的研究背景.4.1 数值仿真本节将对定理1所提自适应控制方案以及定理3所提学习控制方案进行对比实验, 以验证RBF神经网络在稳定自适应控制过程中的学习和知识再利用能力, 并分别使用均匀布点和宽度RBF 神经网络两种网络构造方式完成上述对比实验, 以验证宽度RBF 神经网络的优越性. 考虑由(1)和(2)组成的双连杆封闭机器人动力学模型x 1=[x 1,1,x 1,2]T x 1,1x 1,2其中,, 和 分别代表封闭机器人的关节1角位置和关节2角位置, 且各矩阵为a 1=m 2l 22+(m 1+m 2)l 21a 2=2l 1l 2m 2a 3=m 2l 22a 4=(m 1+m 2)l 1g a 5=m 2l 2g m 1,m 2l 1,l 2g 其中, , , , , , 分别是连杆1和连杆2的质量, 分别是连杆1和连杆2的长度, 是重力加速度.m 1=0.8m 2=2.3l 1=1l 2=1g =9.8y d =[y d 1,y d 2]T =[0.5sin (0.5t )+0.3sin (t ),0.3sin (0.5t )+0.5sin (t )]T K =diag {10,10}K p =diag {2,2}K i =diag {15,15}x 1=[0,实验所用系统参数设置为: kg, kg, m, m, m/s 2, 系统所选期望轨迹为 , 系统内环控制器增益 , 比例系数 ,积分系数 . 系统初始状态为 1910自 动 化 学 报49 卷。
一类不确定执行器非线性系统的自适应控制
一类不确定执行器非线性系统的自适应控制刘棕成;董新民;薛建平;张立鹏【摘要】An adaptive neural network control method is proposed for a class of control systems with uncer-tain actuator nonlinearity.A model for the nonlinear actuator is developed which includes the characteristics of dead zone,backlash and “backlash-like”hysteresis.By combining the developed model and the Nussbaum-gain technique,the problem of uncertain actuator nonlinearity is solved perfectly.The proposed scheme does not re-quire the prior knowledge on the bounds of parameters of the motioned characteristics,and the slopes of dead zone can be time variant when dead zone nonlinearity is concerned.The adaptive compensation term is adopted to minify the influence of modeling error and external disturbance.Simulation results are presented to demon-strate the effectiveness of this method.%针对一类带不确定执行器非线性的控制系统,提出了一种自适应神经网络控制方法。
自适应控制在机械臂系统中的应用研究
自适应控制在机械臂系统中的应用研究引言:自适应控制是一种在复杂环境下的控制系统,其关键在于通过对环境变化的检测和自我调节,使系统能够自主地适应变化,并实现良好的控制效果。
在机械臂系统中,自适应控制的应用能够提高机械臂的精度、稳定性和灵活性。
本文将探讨机械臂系统中自适应控制的应用研究。
一、自适应控制的原理及特点自适应控制是一种基于反馈的控制方法,其特点在于能够根据系统的状态和环境的变化,实时调整控制参数以适应变化。
自适应控制的主要原理是通过不断地感知系统或环境的状态,并根据这些信息进行反馈调节,实现对系统的控制和优化。
相比于传统的固定控制方法,自适应控制具有较强的适应性和鲁棒性。
二、机械臂系统中的自适应控制应用1. 动态特性补偿机械臂系统在一些快速运动场景下,由于惯性、摩擦等因素的影响,可能出现动态特性的偏差。
通过自适应控制,可以根据实际情况和环境变化,对系统的动态特性进行实时补偿和调节,以提高机械臂系统的控制精度和稳定性。
2. 模型参数自适应机械臂系统的模型参数可能会因为材料疲劳、装配精度等因素发生变化,对系统的控制效果产生不利影响。
自适应控制可以通过不断地对模型参数进行估计和修正,使控制系统能够自主适应模型参数的变化,提高机械臂的控制精度和稳定性。
3. 环境变化适应机械臂系统在工业环境中经常会遭遇各种干扰,如气压、温度、摩擦等。
自适应控制可以通过感知和检测这些环境变化,并根据变化实时调整控制参数,以实现对环境变化的适应和补偿。
这减少了系统对环境的依赖性,提高了机械臂系统的鲁棒性和灵活性。
4. 反馈调节策略在机械臂系统中,通过自适应控制可以根据系统的反馈信号对控制策略进行实时调节。
例如,当机械臂系统出现稳定性问题时,自适应控制可以通过调整控制策略,使系统在运动过程中更加稳定;当机械臂系统需要快速响应时,自适应控制可以通过调整控制策略,实现更高的响应速度。
结论:自适应控制在机械臂系统中的应用研究具有重要意义。
基于RBF神经网络电液伺服系统智能控制的在线辨识与PID参数自适应整定共34页文档
56、书不仅是生活,而且是现在、过 去和未 来文化 生活的 源泉。 ——库 法耶夫 57、生命不可能有两次,但许多人连一 次也不 善于度 过。— —吕凯 特 58、问渠哪得清如许,为有源头活水来 。—— 朱熹 59、我的努力求学没有得到别的好处, 只不过 是愈来 愈发觉 自己的 无知。 ——笛 卡儿
拉60、生活的道路一旦Fra bibliotek定,就要勇敢地 走到底 ,决不 回头。 ——左
基于RBF神经网络电液伺服 系统智能控制的在线辨识与
PID参数自适应整定
41、实际上,我们想要的不是针对犯 罪的法 律,而 是针对 疯狂的 法律。 ——马 克·吐温
42、法律的力量应当跟随着公民,就 像影子 跟随着 身体一 样。— —贝卡 利亚
43、法律和制度必须跟上人类思想进 步。— —杰弗 逊
44、人类受制于法律,法律受制于情 理。— —托·富 勒
RBF神经网络补偿的并联机器人控制研究
RBF神经网络补偿的并联机器人控制研究彭志文;高宏力;梁超;文刚【摘要】为了实现对三自由度Delta并联机器人更精确的轨迹跟踪控制,对并联机构的动力学建模不确定性进行研究,提出了计算力矩控制基础上的RBF神经网络在线补偿控制策略.利用Lyapunov理论推导了神经网络在线权值自适应律,保证了系统稳定性.运用RBF神经网络在线自学习系统的不确定性,提高了控制效率同时增加算法的自适应性.在Simmechanics中建立系统物理模型并在Simulink中设计控制器,之后进行Simulimk/Simmechanics联合仿真,结果表明算法优于计算力矩控制,可以有效减小跟踪误差的收敛半径,实现对目标轨迹的准确跟踪.%In order to realize a more accurate trajectory tracking control of the 3-DOF delta parallel robot,the uncertainty of parallel mechanism's dynamic model was researched,a control strategy based on on-line error compensated by RBF neural network was proposed. The law of network weights was develop ed based on Lyapunov theory and the system stability was guaranteed.The system instability was learned on-line by RBF neural network,the control efficiency and the adaptability of algorithm were improved.The physical model was established in Simmechanics and the controller was designed in Simulink. Then the co-simulation was realized based onSimulink/Simmechanics. The results show that the algorithm is better than computed torque control.It can reduce errors effectively and realize the precise track of target trajectory.【期刊名称】《机械设计与制造》【年(卷),期】2018(000)003【总页数】4页(P252-254,259)【关键词】Delta并联机器人;计算力矩;RBF神经网络;Simmechanics【作者】彭志文;高宏力;梁超;文刚【作者单位】西南交通大学机械工程学院,四川成都610031;西南交通大学机械工程学院,四川成都610031;西南交通大学机械工程学院,四川成都610031;西南交通大学机械工程学院,四川成都610031【正文语种】中文【中图分类】TH161 引言三自由度Delta机器人是食品、药品分拣包装等生产线上的关键组成部分[1],由于机构三个运动支链对称安装使其有着刚度大、无累积误差等优势。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
L i u J i a n ’ Wa n g Xi a o g u a n g ’ Ya n g Ho n g n a 。 L i u L i l i
( 1 . Y a n T a i T I MK E N C o ; L t d , Y a n t a i S h a n d o n g , 2 6 4 0 0 0 , C h i n a ; 2 . Y a n t a i N a n s h a n U n i v e r s i t y , Y a n t a i S h a n d o n g , 2 6 5 7 1 3 , C h i n a )
工业技术
S C I E N C E & T E C H N 0 L 0 G Y . 一 2 0 1 4 N O . 0 9 匪圆
基于 R B F逼近 不确 定 项 的机 械 手 自适应 控 制研 究①
刘剑 王晓光 杨红娜 ’ 刘丽丽
( 1 . 烟台铁姆肯 有限公 司 山东 烟台 2 6 4 0 0 0 ;2 . 烟台 南山学院 山东 烟台 2 6 5 7 1 3 )
Re s e a r c h o n Se I f —a d a p t i V e Co n t r o l o f Ro b o t i c Ma n i p u l a t o r Ba s e d o n Un c e r t a i n t i e s Ap p r o x i ma t e d b y RBF
摘 要: 针 对机械 手控制 系统 中的不确定 因素, 提 出了 R B F 神经 网络逼近 不确定项 的 自适应控 制策略 。 在逆动 力学计算 力矩 方法的基础上 , 设计 了鲁棒 自 适 应控 制 器。 利 用R B F 神 经 网络对 模型 中的不确定 项分块进行逼 近 , 并用L y a p u n o v  ̄定性理论 建立 了网络权 重 白 适 应学 习 律, 证 明 了系统的全 局稳定性 ; 最 后进行 了仿真 , 结果表 明该方 法能 够有效 的消除模 型不确 定性的 影响 , 准确地 实现 了轨迹跟 踪 。 关键词 : 机械手 自适 应控 制 不确 定嘎 RB F 神经 网络 中 图分 类号 : T P 1 8 3 文献 标 识 码 : A 文章编 号 : 1 6 7 2 — 3 7 9 1 ( 2 0 1 4 ) 0 3 ( c ) - 0 0 9 7 - 0 3
d y n a mi c s . t h e r o b u s t a d a p t i v e c o n t r o l l e r wa s d e v e l o p e d. Th e bl o c k u n c e r t a i n t i e s o f mo d e l wa s a p p r o xi ma t e d b y u s i ng RBF n e u r a l n e t wo r k, a n d t h e a d a p t i v e l e a r n i n g l a w o f n e t wo r k we i g h t s wa s d e v e l o p e d b a s e d o n Ly a pu no v s t a b i l i t y t h e o r y, t h e g l o b a l s t a b i l i t y o f s y s t e m w a s g u a r a n t e e d l I n t h e e n d. t h e r e s u l t s o f s i mu l a t i o n v e r i f i e d t h a t t h e i n f l u e n c e o f mo d e l u nc e r t a i n t i e s c a r l b e e f f e c t i ve l y
u n c e r t a i n t i e s a p p r o x i ma t e d b y t h e RBF ne u r a l n e t wo r k wa s p r o p o s e d. By me a n s o f c o mp u t e d t o r q ue c o n t r o l me t h o d b a s e d o n e d, t h e t r a j e c t o r y t r a c k i n g wa s a c c u r a t e l y r e a l i z e d.
Ke y W o r d s: Ro b o t i c Ma n i p u l a t o r I S e l f -a d a p t i v e C o n t r o l ; Un c e r t a i nt i e s l RBF Ne u t r a l Ne t wo r k