时变时滞随机非线性系统的自适应神经网络跟踪控制
不确定随机非线性时滞系统的自适应神经网络跟踪控制
f ( £ + ()
() ≤ £ )f
f ()f ( () 面 £ 十
() )
() 5
假 设 2 存 在非 负定 的未 知连 续 函数 ( ) 对 于 i 2 3 … , 使 函数 ( ) 足 ・, 一 , , , ・满
(( + ()≤ ∑ l ( (( + () 三£ j ) ) ) 三 £ ) )
W E R ∈ n
假 设 4 对 VA ∈ n存在 最优 常数 权 向量 w , 使
l 1 w ly≤ 7… , l ( 】 . )l U ≤
由式 ( ) 8 得
,
… >0
8
青岛大学学 报 ( 程技 术版 ) 工
f
第 2 7卷
w ( + () s )+ I ∑ l () 7 + ≤邮 () s ) 3 ≤I , W ( I1()≤ I2 s . 2 .
z 一 一 a一 , 1 一 1, 3, , 2, … ( 4)
其中,
是待 定 的虚拟 控制 信号 a 。 。一
假 设 1 对 于 i 1 2 3 … , 存在 一个 非负 定 的未知 连续 函数 ( ) 对 于 z 1 2 … ,使 函数 h ( ) 一 , , , , ・, 一 ,, i ・
第 2 7卷 第 3期
20 1 2年 9月
青 岛 大 学 学 报 ( 程 技 术 版 )’ 工 J UR A F Q N D O UN V RST ( O N L O I G A I E I Y E&T )
Vo. o 1 27 N .3
Se p. 2 0 1 2
器 , 真验 证 了该控 制器 的有效 性 。 仿
1 问题 描 述
基于神经网络的非线性系统控制技术研究
基于神经网络的非线性系统控制技术研究随着机器学习和人工智能技术的飞速发展,神经网络控制技术被广泛应用于非线性系统控制领域。
本文将重点介绍基于神经网络的非线性系统控制技术研究,探讨其在实际应用中的优势和挑战。
一、神经网络控制技术概述神经网络控制技术是一种将神经网络应用于非线性系统控制的方法,其核心思想是通过神经网络建模和预测实现系统控制。
与传统的控制方法相比,神经网络控制技术具有以下优势:1. 适用范围广神经网络可以对非线性系统进行建模和预测,而传统的控制方法往往只适用于线性系统。
2. 建模精度高神经网络可以根据系统在不同时间步的输入输出数据进行学习,从而得到更为准确的系统模型。
3. 控制效果好神经网络控制具有自适应性和鲁棒性,能够在复杂环境下实现精确控制。
二、基于神经网络的非线性系统建模方法神经网络控制技术的核心在于神经网络的建模和预测,下面介绍基于神经网络的非线性系统建模方法。
1. 前向神经网络建模方法前向神经网络是一种常用的人工神经网络类型,其具有简单明了的结构和较高的预测精度。
该方法通常将非线性系统输出作为神经网络的目标变量,将非线性系统的输入与输出作为神经网络的输入数据,通过神经网络模拟实现非线性系统的预测和控制。
2. 循环神经网络建模方法循环神经网络是一种带有时序信息的神经网络,其可以用于描述非线性系统的时序演化过程。
该方法通常将非线性系统的输出序列作为循环神经网络的目标变量,将非线性系统的输入序列作为循环神经网络的输入数据,通过循环神经网络模拟实现非线性系统的预测和控制。
三、基于神经网络的非线性系统控制方法基于神经网络的非线性系统控制技术包括开环控制、闭环控制和模糊神经网络控制等方法。
下面将重点介绍闭环控制方法。
闭环控制是一种基于系统反馈调节的控制方法,其核心在于将神经网络控制器与系统的反馈环结合,实现系统控制。
该方法通常将被控系统的测量输出作为反馈信号,将神经网络输出作为控制信号,通过反馈作用实现系统的实时控制。
基于神经网络的自适应控制技术研究
基于神经网络的自适应控制技术研究神经网络作为一种模拟人脑神经元网络的计算模型,在多个领域得到了广泛的应用。
其中,自适应控制技术是神经网络研究的重要方向之一。
使用神经网络进行自适应控制,可以有效地解决各种非线性、时变和模型不确定的动态系统控制问题。
一、神经网络的基本原理神经网络模仿人类大脑组织,由若干个神经元构成。
每个神经元接受若干个输入信号,并将它们加权求和后传递到激活函数中进行处理,最终得到输出信号。
多个神经元可以组成网络,进行更加复杂的信息处理和控制。
神经网络的学习过程是通过对输入和输出数据的训练实现的。
通常采用的训练方法是反向传播算法。
该算法基于一种误差反向传播的思想,通过计算每个神经元的误差,根据误差大小对神经元的权重进行更新和调整,不断减小网络的误差,达到有效的学习效果。
二、自适应控制技术自适应控制技术是一种针对动态系统进行控制的技术。
动态系统具有非线性、时变性、模型不确定等特性,传统的线性控制方法往往难以达到理想的效果。
自适应控制技术基于神经网络模型,可以进行模型自适应、参数自适应和信号处理等多种操作,以适应各种复杂的动态系统。
常见的自适应控制方法有基于模型参考自适应控制、基于模型自适应控制、基于直接自适应控制等。
其中,基于模型参考自适应控制是一种应用广泛的方法。
该方法将实际输出与期望参考模型的输出进行比较,通过误差反馈,计算调整控制器参数的信号,最终实现对动态系统的控制。
三、神经网络自适应控制技术的研究进展神经网络自适应控制技术在航空、机械、电力、化工等行业中得到了广泛的应用。
在航空领域,神经网络自适应控制技术可以应用于飞机自动驾驶、导航、起降控制等方面。
在机械领域,神经网络自适应控制技术可以应用于机械臂、机器人控制、数控机床等领域。
在电力、化工领域,神经网络自适应控制技术可以应用于发电机组调节、化工装置控制等领域。
目前,神经网络自适应控制技术的研究主要集中在以下几个方面:1.神经网络自适应PID控制技术PID控制是一种基于比例、积分、微分三个控制器参数的控制方法。
时变时滞非仿射大系统的分散自适应控制
关键词 : 自适 应 控 制 ;非仿 射 系统 ; 分散 控 制 ; 经 网络 ;未 知 时 变 时 滞 神 中 图 分 类 号 : P 7 T23 文 献 标 志 码 : A
De e r l e d p i e c nt o f c nt a i d a a tv o r lo z l r e s a e no f n i e v r i g de a y t m s a g - c l na i e tm - a y n l y s s e
n n f n u cin r e a ae y t e me n v l e te r m, w i h e t ci n f t e u k o i ea s a d t e o af e fn t swe e s p r td b h a au h o e i o h l t e r sr t s o h n n wn t e i o me d ly n h u c r i i —a yn ea n ec n e t n e e r lx d b t iig t e s p r t n tc n q e a d t e Yo n ’ ie u l y i n et nt a me v r i g d ly i tr o n ci sw r e a e y u i zn h e a ai e h i u n h u gS n q a 对 一 类具 有 未知 时 变 时滞 的 非 仿 射 互 联 大 系统 基 于神 经 网络 的 逼 近 能 力 , 出 了 一 种 分 散 自适 应 神 针 提
经 网络控制方案。该方案利用 中值 定理 对未知非仿射 函数 进行分 离;利用分 离技 术和 Y ug on’ S不等式放 宽 了对 未知 时滞及 时滞互联 不确定项的限制 ,同时大大减 少了在 线调 节参 数的数 量。此外 ,利用 L au o—rsvki 函补偿 ypn vKaosi 泛 了未知时滞带来的不确定性。通过理论分析 ,证明 了闭环 系统所有信 号是 有界 的,输 出跟踪 误差收敛 到原点的一 个
控制系统中的自适应控制与神经网络控制比较
控制系统中的自适应控制与神经网络控制比较在控制系统中,自适应控制和神经网络控制是两种常见的控制方法。
它们都旨在通过对系统模型和输入输出关系进行学习和调整,实现系统的自适应性能。
然而,它们在实现方式、性能和适用范围等方面存在一些差异。
本文将对自适应控制和神经网络控制进行比较,以帮助读者理解它们的优缺点和适用情况。
自适应控制是一种基于模型参考自适应原理的控制方法。
其核心思想是通过建立系统模型并根据模型误差来调整自适应控制器的参数。
自适应控制根据系统模型的准确性进行分类,可以分为基于精确模型的自适应控制和基于近似模型的自适应控制。
基于精确模型的自适应控制方法要求系统模型必须准确地描述系统的动态特性。
这种方法可以针对不同的系统进行定制化设计,控制性能较好。
然而,由于实际系统的模型通常是复杂和不确定的,因此需要大量的模型辨识工作,且容易受到模型误差的影响。
相比之下,基于近似模型的自适应控制方法更常见。
这种方法通过选择适当的模型结构和参数估计方法,利用系统的输入输出数据进行模型辨识和参数调整。
基于近似模型的自适应控制方法对系统模型的精确性要求较低,适用于对系统了解不充分或者模型难以得到的情况。
然而,近似模型的准确性直接影响自适应控制的性能,需要通过参数调整策略进行优化。
与自适应控制相比,神经网络控制利用神经网络对系统进行建模和控制。
神经网络是一种模仿人脑神经元结构和功能的计算模型,通过大量的神经元连接和权重调整来实现输入输出之间的非线性映射。
在神经网络控制中,神经网络模型可以根据系统的输入输出数据进行在线学习和参数调整。
神经网络控制具有较强的适应性和非线性建模能力,能够有效处理系统模型复杂或不确定的情况。
它不需要事先对系统进行准确建模,适用范围广。
然而,神经网络控制的设计、训练和调参过程较为复杂,需要大量的计算资源和时间,且很难对其内部机制进行解释和理解。
综上所述,自适应控制和神经网络控制都是常见的控制方法,各有其优势和适用范围。
时变大时滞系统的控制方法综述
时变大时滞系统的控制方法综述1 引言在化工、炼油、冶金、玻璃等一些复杂的工业过程当中,广泛地存在着大时滞现象。
由于时滞的存在,使得被控量不能及时地反映系统所承受的扰动,从而产生明显的超调,使得控制系统的稳定性变差,调节时间延长,对系统的设计和控制增加了很大的困难。
而时变时滞的特性则使得问题更加复杂,因而对此类问题的研究具有重要的理论和实际意义。
自从1957年Smith首次提出针对时滞系统的预估控制方法以来,许多学者在这一领域进行了广泛而深入的研究,相继提出了许多行之有效的控制方法。
根据对专统数学模型的依赖程度的不同,这些方法大致可以分为自适应控制和智能控制两大类。
本文即对此进行了总结介绍,分析了各种控制方法的优点及其所存在的局限性,并且探讨了该领域今后的发展方向。
2 Smith预估器Smith预估器是得到广泛应用的时滞系统的控制方法。
该方法的基本思路是:预先估计出系统在基本扰动下的动态特性,然后由预估器对时滞进行补偿,力图使被延迟了的被调量超前反映到调节器,使调节器提前动作,从而抵消掉时滞特性所造成的影响:减小超调量,提高系统的稳定性$加速调节过程,提高系统的快速性。
Smith预估器的原理如图1所示。
图1 Smith预估器控制框图从理论上分析,Smith预估器可以完全消除时滞的影响,从而成为一种对线性、时不变和单输入单输出时滞系统的理想控制方案。
但是在实际应用中却不尽人意,主要原因在于:Smith预估器需要确知被控对象的精确数学模型,而且它只能用于定常系统。
这一条件事实上相当苛刻,因而影响了Smith预估器在实际应用中的控制性能。
在Smith预估器的基础上,许多学者提出了扩展型的或者改进型的方案,这些方案包括:多变量Smith预估控制,非线性系统的Smith预估器,改进的Smith预估器。
这些方法由于并没有减小对系统数学模型的依赖程度,因而同样也具有很大的局限性。
3 自适应控制方法对大多实际控制过程而言,被控对象的参数在整个被控过程中不可能保持定常,对于这一类系统,如果采用常规的控制方法,不仅控制性能会变差,而且还会造成系统发散,然而利用自适应技术却可以获得比较满意的控制效果。
反馈控制系统稳定性问题及改进方法研究
反馈控制系统稳定性问题及改进方法研究1. 研究背景反馈控制系统是一种常用的控制系统,广泛应用于工业自动化、机器人控制、飞行器等领域。
然而,反馈控制系统在实际应用中常常面临稳定性问题,如系统振荡、不稳定等。
这些问题对系统的性能、可靠性和安全性都会产生负面影响,因此需要进行研究和改进。
2. 稳定性问题的原因分析反馈控制系统稳定性问题的产生原因有多种,主要包括以下几个方面:a. 参数不确定性:如果系统参数存在不确定性,如变化范围较大或存在随机性,会导致系统的稳定性下降。
b. 时滞问题:反馈控制系统中的时滞(包括传感器延迟、信号传输延迟等)会导致系统的稳定性退化。
c. 非线性特性:系统的非线性特性会导致系统稳定性问题的产生和加剧。
d. 信号干扰:如果系统受到外部信号干扰或噪声干扰,会导致系统的稳定性受到影响。
3. 稳定性改进方法针对反馈控制系统的稳定性问题,可以采取如下改进方法:a. 参数估计与鲁棒控制:通过参数估计技术,对系统的参数进行辨识和估计,从而提高系统的鲁棒性和稳定性。
鲁棒控制策略可以针对参数不确定性,克服参数变化带来的稳定性问题。
b. 时滞补偿:采用时滞补偿技术,通过估计和预测时滞,对控制器进行补偿,消除由于时滞引起的不稳定性。
c. 非线性控制方法:针对系统的非线性特性,可以采用模糊控制、神经网络控制等非线性控制方法。
这些方法可以更好地处理系统的非线性特性,提高系统的稳定性和性能。
d. 信号处理与滤波:对于受到信号干扰的系统,可以通过信号处理和滤波技术来减小干扰的影响,提高系统的稳定性。
4. 实验研究为了验证改进方法的有效性,可以进行实验研究。
首先,建立反馈控制系统的数学模型,并模拟各种稳定性问题的影响。
然后,针对每个稳定性问题,应用相应的改进方法进行实验,比较改进前后系统的稳定性和性能。
实验结果可以提供参考,为实际应用中的系统优化提供指导。
5. 结论反馈控制系统的稳定性问题对于系统的性能和可靠性具有重要影响,需要进行研究和改进。
时滞系统几种控制策略研究
时滞系统几种控制策略研究时滞系统几种控制策略研究时滞系统是一类在实际控制中常见的系统,其特点是系统状态变量在对应的输出值上受到时间延迟的影响。
时滞系统在工程领域广泛应用,例如飞行器、机器人等。
然而,由于时滞的存在,时滞系统往往容易出现不稳定、震荡和性能下降的问题,因此如何有效地控制时滞系统,降低时滞对系统性能的影响成为了一个重要的研究方向。
针对时滞系统的控制策略研究,主要包括经典控制方法、自适应控制方法和智能控制方法等。
经典控制方法中,最常用的是PID控制器。
PID控制器是一种基于比例、积分、微分控制的经典控制策略,它能够对系统的误差进行调节。
然而,对于时滞系统,传统PID控制器存在不足之处,因为时滞会导致控制信号滞后,从而影响系统的稳定性。
因此,需要对PID控制器进行改进,使其能够对时滞系统进行有效的控制。
自适应控制方法通过根据系统的特性实时调整控制器的参数,从而适应系统的变化。
其中,模型参考自适应控制(Model Reference Adaptive Control, MRAC)是一种常用的方法。
MRAC通过在线估计系统的模型,并根据估计的模型来调整控制器的参数,从而实现对时滞系统的控制。
此外,自适应滑模控制(Adaptive Sliding Mode Control, ASMC)也是一种常用的控制方法。
ASMC通过引入滑模面,并根据系统误差的变化调整滑模面的位置,以降低时滞对系统的影响。
智能控制方法中,模糊控制和神经网络控制是常见的策略。
模糊控制是一种基于模糊逻辑推理的控制方法,通过将人类的经验和知识转化为模糊规则,来对系统进行控制。
神经网络控制是一种通过训练神经网络来实现对系统的控制的方法,神经网络可以学习系统的非线性映射关系,并通过适当的训练来调整权值,从而实现对时滞系统的控制。
在实际应用中,不同的控制策略可以结合使用,以实现更好的控制效果。
例如,可以将PID控制器和模糊控制器结合,利用PID控制器对系统进行粗略调节,再利用模糊控制器进行微调,从而达到更好的控制效果。
【国家自然科学基金】_lyapunov-krasovskii函数_基金支持热词逐年推荐_【万方软件创新助手】_20140801
1 1 1 1 1 1 1 1 1 1 1
53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83
2011年 科研热词 线性矩阵不等式 时变时滞 自适应控制 模糊系统 动态面控制 h∞控制 鲁棒控制 非线性系统 非线性参数化系统 随机扰动 自适应迭代学习控制 自适应 耦合神经网络 神经网络 混合时滞 模糊逻辑系统 时变参数 复合能量函数 全局渐近同步 不确定 马尔可夫跳变 马尔可夫参数转换 非脆弱 非线性耦合 非线性时滞系统 非线性时滞大系统 非对称扇区输入 非仿射系统 随机系统 随机稳定性 随机hopfield神经网络 部分状态反馈 部分元件等效电路 跳跃参数 跟踪控制 自适应模糊 自由权重矩阵 脉冲神经网络 脉冲 网络控制系统 线性矩阵不等式(lmi) 稳定性 积分不等式 神经网络控制 模态依赖时延 未知时变时滞 未知控制方向 有限时间有界 有限时间h_∞控制 有限时间 有界实引理 有界不确定性 推荐指数 9 4 3 3 3 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
科研热词 线性矩阵不等式 非线性时滞系统 时变时滞 鲁棒镇定 鲁棒稳定 马尔可夫过程 非线性观测器 非线性网络控制系统 非线性系统 随机系统 输出反馈 自适应重复控制 自适应边界技术 自适应控制 自动控制技术 网络时延 线性矩阵不等式. 线形矩阵不等式 积分等式 离散控制系统}模糊lyapunov-krasovskii函数 神经网络 矩阵不等式 灵敏性 滑模控制 渐近稳定 混合时滞 模糊逻辑系统 模糊辨识 模糊控制 有限时间镇定 有限时间有界 时间延迟 时滞系统 时滞相关稳定性 时滞依赖 时滞 数据包丢失 故障检测滤波器 故障检测 广义系统 复合能量函数 增广lyapunov-krasovskii泛函 均方指数稳定性 反向递推 双向联想记忆(bam)神经网络 区间递归神经网络 区间时变 动态而控制 全局鲁棒稳定 全局稳定性 中立型bam神经网格 不确定时滞
不确定非仿射非线性时滞系统的神经网络自适应控制
Sp20 0 e 1
.
Vo 2 No. 1 7 3
文章编号 :0 2 7 3 2 1 )3 0 2 5 1 0 —8 4 { 0 0 0 —0 3 —0
不 确 定 非 仿 射 非 线 性 时 滞 系统 的 神 经 网络 自适 应 控 制
江惠英 王汝凉b梅昆波 , , 一
( 西师范 学院 a数 学科 学学院 ;. 算机 与信 息 工程 学 院 , 广 . b计 广西 南 宁 50 2 ) 30 3
中 图分 类 号 : 2 2 TP 0 文献标识码 : A
1 引 言
在 工程上 , 几乎所 有 的系统都 具有非 线性特 性 , 同时 , 制对 象 的不确 定 性 和时 变性 一直 是研 究 者 控 面 临的具有挑 战性 的问题 , 因此 , 不确定 非线性 系统 引起 了人们 的关 注 , 并取得 了许 多重要 的结果 .
摘 要: 针对一类不 确定非仿射非线性时滞系统 , 出了一种神经 网络的 自适应控 制器 . 提 利用隐 函数定 理、 泰
勒展开式和中值定理 , 把非仿射非线性时滞系统转化 为仿射非线性 时滞系统 , 同时利用 神经网络可逼 近任意非线
性 函数的能力 , 结合误 差滤波理论及 Y u g on 不等式处理 时滞项 . 根据 L au o 理论 , ypn v 在一定 的条件 下 , 出了系统 给 稳定的充分条件 , 并给予证明. 该控制器保证 了跟踪误差收敛 , 从而说 明了该控制器的有效性 . 关键词 : 非仿射非线 性 ; 时滞系统 ; 神经 网络 ; 自适应
性 能变差 的主要原 因 . 本 文针对 非线性 时滞 系统 的两类不 确定项 : ) 建模 动态 , ) 仿射 未 知 函数 , 1未 2非 主要 是 利用 隐 函数
一类非线性输入时滞系统自适应控制——无源化方法
目前 Bcs p ig 制方 法 的研 究 已经获 得 很 akt pn 控 e 大进展 . 是 B cs pig 制 方 法 应用 于 时滞 但 akt pn 控 e 系统 的相 关研究 却 不多见 . 实 际系统 中 , 在 由于 执行
题 _ . 源化 控制也 是 鲁 棒控 制 的一 个 重要 研 究 方 5无 J 向 J本 文针 对 一 类 带 有 输 入 时 滞 的不 确 定 严 反 . 馈 非线性 系统设计 了无 源 化 控 制 器. 个 系 统 的设 整 计 过 程 可认 为 是局 部 无 源 化控 制 与 自适 应 神 经
誊 ) ([ ]
( :) 1
() = t
0( z) = 缈( z)一 ( z)+0( z). 2
() 5
, 2) + ([ ]
式 中:
= Z) , =da ( ig … ) ,
g(
=
(z r )=dO Z)/z 1 : =1 , z T i [ ( ]d ; o o , , …, 2 .
式 中: :[
: …
] ∈R 为 系 统 状 态 ,
r =[ 2 … 1 ]
] ∈R , t 、 t () W()∈R分 另 0
根 据万 能逼 近定理 , 在 期望 最 佳 逼 近 时 的理 想 权 存 值 矩 阵 W 、 , I Z)I < 使 p( ≤p 0对 于所 有 Z∈
关键 词 : 严反馈非线性系统 ; 输入时滞 ; 无源 ; aktp i 一 B cs pn e g方法 ; 神经 网络
中图分 类号 :P 7 文献标 志码 : 文章编号 :0 67 4 (0 1 0 -180 T20 A 10 -03 2 1 )20 8 - 6
基于事件触发机制的一类非严格反馈非线性系统的自适应神经网络追踪控制
基于事件触发机制的一类非严格反馈非线性系统的自适应神经网络追踪控制作者:廉玉晓杨文静王琳淇王学良夏建伟来源:《南京信息工程大学学报》2021年第01期摘要基于事件触发机制,研究了一类非严格反馈非线性系统的自适应神经网络追踪控制问题.结合反步技术、神经网络和事件触发机制,提出了一种自适应神经网络控制方案,减少了数据传输量并减轻了控制器和执行器之间的传递负担,保证了输出信号尽可能地追踪到参考信号,同时使得闭环系统的所有信号有界.此外,通过避免芝诺现象保证了所提事件触发机制的可行性.最后,给出一个例子验证了所提出策略的有效性.关键词非严格反馈结构;非线性系统;反步技术;事件触发机制;追踪控制中图分类号 TP13文献标志码 A0 引言近年来,由于非线性系统被广泛地应用在实际生活中,因此相关的控制问题受到广泛的关注.在对非线性系统的研究中,反步技术成为处理非线性系统相关问题的有力工具之一[1-2] .基于反步技术,文献[3]研究了一类带有全状态约束的随机非线性系统的自适应追踪控制问题.然而,当非线性系统中的非线性函数不再是完全已知或者具有未知参数的线性形式时,仍然使用传统的反步控制技术研究此类系统会有一定的困难.因此,基于上述分析,大量的有关模糊逼近和神经网络的控制策略[4-9] 被提出.例如,文献[7]结合反步技术和模糊逻辑系统针对一类带有时滞的随机非线性系统设计了一种自适应追踪控制方案.值得注意的是,上述所提到的文献[7]研究的是一类带有严格反馈结构的系统,这类系统中的非线性函数 f i(·)至多包含系统中的前i个状态.然而,非严格反馈非线性系统中的非线性函数f i(·)是包含全部状态变量 x =[x 1,x 2,…,x n] T 的函数,这一特性无疑将增加虚拟控制器设计的难度.为解决上述问题,人们针对非严格反馈非线性系统展开了一系列的研究[10-14] .在文献[13]中,通过对非线性函数进行假设解决了非严格反馈带来的困难,并且针对带有未知时滞的非严格反馈随机系统提出了一种自适应神经网络控制策略.不同的是,文献[14]移除了关于非线性函数的假设,利用模糊逻辑系统的结构特征克服了非严格反馈带来的困难.随着网络控制系统的迅速发展,事件触发控制[15-18] 作为一种节省网络通信资源的有效方法得到了广泛的研究.如文献[15]基于事件触发机制和命令滤波,讨论了一类随机非线性系统的追踪控制问题.本文结合反步技术和事件触发机制,针对非严格反馈非线性系统提出一种自适应神经网络追踪控制策略.在控制设计的过程中,基于神经网络及其结构特征解决了系统中非线性函数和非严格反馈结构带来的问题.通过将反步技术、神经网络与事件触发机制相结合设计了一个自适应神经网络控制器,所设计的控制器不仅可以保证所有信号在闭环系统中有界,而且减少了控制器与执行器之间的传递次数,节约了通信资源.同时,通过排除芝诺现象证明了该方案的有效性.1 问题陈述考虑一类单输入单输出非严格反馈下的非线性系统:d x i=f i( x )+g i( x )x i+1 ,i=1,…,n-1,d x n=f n( x )+g n( x )u,y=x 1,(1)其中 i=[x 1,…,x i] T (i=1,2,…,n)且 n= x ∈ R n代表状态向量,u和y分别代表输入和输出,f i( x )(i= 1,…,n)是未知光滑的非线性函数,g i( x )(i=1,…,n)是已知光滑的非线性函数.假设1 [2] 对于i=1,…,n,函数g i( x )的符号不变,存在已知常数g 1和g 2,使得0<g 1≤|g i( x )|≤g 2<∞, x ∈ R n. (2)显然,式(2)表明 g i( x )严格正或者严格负,因此可以假设g i( x )>0, x ∈ R n.假设2 参考信号y d及其直到n阶导数y(n) d是连续有界的.控制目标:基于事件触发机制,利用神经网络自适应控制方法,使系统的输出y尽可能地跟踪到参考信号y d,且保证所有信号在闭环系统中是有界的.为了更好地实现控制目标,下面给出一些预备知识.引理1 [1] 对于任意的变量ξ∈ R 和常数ρ>0,有以下不等式成立:0≤|ξ|-ξ tanh ξ ρ ≤δρ,δ=0.278 5. (3)引理2 [4] 对 t∈ R +,令V(t)是一个连续函数并且V(0)有界.若有不等式(t)≤-a 1V(t)+a 2,(4)这里 a 1>0,a 2>0是常數,则V(t)有界.在本文中,径向基函数神经网络将会被用来逼近连续的非线性函数.径向基函数神经网络可被表达成如下形式:f nn ( Z )= W T S( Z ),(5)其中 Z ∈Ω Z R q是输入向量, W =[w 1,…,w l] T 是权向量,l(>1)是径向基函数神经网络节点的数目,S( Z )=[s 1( Z ),…,s l( Z )] T 是基函数向量且s i( Z )= exp - ( Z - μ i) T ( Z - μ i)η2 ,这里μ i=[μ i1 ,μ i2 ,…,μ iq ] T 是接受域的中心且常数η>0是高斯函数的宽度.式(5)表明如果f(·)在紧集Ω Z R q上是连续的,则对任意的精度ε>0,有一个径向基函数神经网络(5)使得f( Z )= W * T S( Z )+δ( Z ),这里 W *是理想的权向量且逼近误差δ( Z )满足|δ( Z )|≤ε.引理3 [6] 令S(·)是径向基函数神经网络(5)的一个基函数向量. n=[z 1,…,z n] T 和μ i=[μ i1 ,μ i2 ,…,μ in ] T 分别是输入变量和接受域的中心.对一个整数k<n定义了一个新的输入变量 k=[z 1,…,z k] T 和i=[μ i1 ,μ i2 ,…,μ ik ] T ,则对于相同的宽度常数,有S( n) T S( n)≤S( k) T S( k),这里 k和 i分别是由 n和μ i的前k个元素组成的向量.2 自适应神经网络控制设计通过反步设计法,构造一个针对系统(1)的自适应神经追踪控制器.首先,定义坐标变换如下:z 1=x 1-y d,z i=x i-α i-1 ,i=2,…,n,(6)其中 z i是虚拟状态追踪误差,α i是虚拟控制器.在设计过程中,虚拟控制器和自适应律将会被设计为如下形式;α i=-c iz i- i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(7)· i=-γ i i+λ iz i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(8)这里 i=1,…,n,c i,ρ i,γ i和λ i是正设计常数,S i( X ii )是径向基函数神经网络的一个基函数向量, X 11 =[x 1,y d, d] T , X ii =[x 1,x 2,…,x i,y d, d,…,y(i) d,1, 2,…, i-1 ] T , i是未知常数θ i的估计.注1 从式(8)可以得出若 i(0)≥0则 i(t)≥ 0,t≥0,因此本文将假设 i(0)≥0.步骤1.由z 1=x 1-y d可得1=f 1( x )+g 1( x )x 2- d. (9)给出如下李雅普诺夫函数为V 1= 1 2 z2 1+ g 1 2λ 1 2 1,(10)其中1=θ 1- 1是参数误差.通过联立式(9)和(10),可以得出:1=z 1(f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2)- g 1 λ 1 1 · 1+z 1g 1(x 1)z 2+z 1g 1(x 1)α 1. (11)根据杨氏不等式有:z 1g 1(x 1)z 2≤ 1 2 g 1(x 1)z2 1+ 1 2 g 1(x 1)z2 2. (12)将式(12)代入式(11)有1=z 1g 1(x 1)α 1+z 1φ 1( X 1)- g 1 λ 1 1 · 1- 1 2 z2 1+ 1 2 g 1(x 1)z2 2,(13)這里φ 1( X 1)=f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2+ 1 2 z 1+ 1 2 g 1(x 1)z 1,且X 1=[ x ,y d, d] T .应用神经网络逼近φ 1( X 1),即:z 1φ 1( X 1)=z 1 W * T 1S 1( X 1)+z 1δ 1( X 1),‖δ 1( X 1)‖≤ε 1,ε 1>0. (14)这里μ i=[μ i1 ,μ i2 ,…,μ iq ] T 是接受域的中心且常数η>0是高斯函数的宽度.式(5)表明如果f(·)在紧集Ω Z R q上是连续的,则对任意的精度ε>0,有一个径向基函数神经网络(5)使得f( Z )= W * T S( Z )+δ( Z ),這里 W *是理想的权向量且逼近误差δ( Z )满足|δ( Z )|≤ε.引理3 [6] 令S(·)是径向基函数神经网络(5)的一个基函数向量. n=[z 1,…,z n] T 和μ i=[μ i1 ,μ i2 ,…,μ in ] T 分别是输入变量和接受域的中心.对一个整数k<n定义了一个新的输入变量 k=[z 1,…,z k] T 和i=[μ i1 ,μ i2 ,…,μ ik ] T ,则对于相同的宽度常数,有S( n) T S( n)≤S( k) T S( k),这里 k和 i分别是由 n和μ i的前k个元素组成的向量.2 自适应神经网络控制设计通过反步设计法,构造一个针对系统(1)的自适应神经追踪控制器.首先,定义坐标变换如下:z 1=x 1-y d,z i=x i-α i-1 ,i=2,…,n,(6)其中 z i是虚拟状态追踪误差,α i是虚拟控制器.在设计过程中,虚拟控制器和自适应律将会被设计为如下形式;α i=-c iz i- i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(7)· i=-γ i i+λ iz i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(8)这里 i=1,…,n,c i,ρ i,γ i和λ i是正设计常数,S i( X ii )是径向基函数神经网络的一个基函数向量, X 11 =[x 1,y d, d] T , X ii =[x 1,x 2,…,x i,y d, d,…,y(i) d,1, 2,…, i-1 ] T , i是未知常数θ i的估计.注1 从式(8)可以得出若 i(0)≥0则 i(t)≥ 0,t≥0,因此本文将假设 i(0)≥0.步骤1.由z 1=x 1-y d可得1=f 1( x )+g 1( x )x 2- d. (9)给出如下李雅普诺夫函数为V 1= 1 2 z2 1+ g 1 2λ 1 2 1,(10)其中1=θ 1- 1是参数误差.通过联立式(9)和(10),可以得出:1=z 1(f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2)- g 1 λ 1 1 · 1+z 1g 1(x 1)z 2+z 1g 1(x 1)α 1. (11)根据杨氏不等式有:z 1g 1(x 1)z 2≤ 1 2 g 1(x 1)z2 1+ 1 2 g 1(x 1)z2 2. (12)将式(12)代入式(11)有1=z 1g 1(x 1)α 1+z 1φ 1( X 1)- g 1 λ 1 1 · 1- 1 2 z2 1+ 1 2 g 1(x 1)z2 2,(13)这里φ 1( X 1)=f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2+ 1 2 z 1+ 1 2 g 1(x 1)z 1,且X 1=[ x ,y d, d] T .应用神经网络逼近φ 1( X 1),即:z 1φ 1( X 1)=z 1 W * T 1S 1( X 1)+z 1δ 1( X 1),‖δ 1( X 1)‖≤ε 1,ε 1>0. (14)这里μ i=[μ i1 ,μ i2 ,…,μ iq ] T 是接受域的中心且常数η>0是高斯函数的宽度.式(5)表明如果f(·)在紧集Ω Z R q上是连续的,则对任意的精度ε>0,有一个径向基函数神经网络(5)使得f( Z )= W * T S( Z )+δ( Z ),这里 W *是理想的权向量且逼近误差δ( Z )满足|δ( Z )|≤ε.引理3 [6] 令S(·)是径向基函数神经网络(5)的一个基函数向量. n=[z 1,…,z n] T 和μ i=[μ i1 ,μ i2 ,…,μ in ] T 分别是输入变量和接受域的中心.对一个整数k<n定义了一个新的输入变量 k=[z 1,…,z k] T 和i=[μ i1 ,μ i2 ,…,μ ik ] T ,则对于相同的宽度常数,有S( n) T S( n)≤S( k) T S( k),这里 k和 i分别是由 n和μ i的前k个元素组成的向量.2 自适应神经网络控制设计通过反步设计法,构造一个针对系统(1)的自适应神经追踪控制器.首先,定义坐标变换如下:z 1=x 1-y d,z i=x i-α i-1 ,i=2,…,n,(6)其中 z i是虚拟状态追踪误差,α i是虚拟控制器.在设计过程中,虚拟控制器和自适应律将会被设计为如下形式;α i=-c iz i- i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(7)· i=-γ i i+λ iz i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(8)这里 i=1,…,n,c i,ρ i,γ i和λ i是正设计常数,S i( X ii )是径向基函数神经网络的一个基函数向量, X 11 =[x 1,y d, d] T , X ii =[x 1,x 2,…,x i,y d, d,…,y(i) d,1, 2,…, i-1 ] T , i是未知常数θ i的估计.注1 从式(8)可以得出若 i(0)≥0则 i(t)≥ 0,t≥0,因此本文将假设 i(0)≥0.步骤1.由z 1=x 1-y d可得1=f 1( x )+g 1( x )x 2- d. (9)给出如下李雅普诺夫函数为V 1= 1 2 z2 1+ g 1 2λ 1 2 1,(10)其中1=θ 1- 1是参数误差.通过联立式(9)和(10),可以得出:1=z 1(f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2)- g 1 λ 1 1 · 1+z 1g 1(x 1)z 2+z 1g 1(x 1)α 1. (11)根據杨氏不等式有:z 1g 1(x 1)z 2≤ 1 2 g 1(x 1)z2 1+ 1 2 g 1(x 1)z2 2. (12)将式(12)代入式(11)有1=z 1g 1(x 1)α 1+z 1φ 1( X 1)- g 1 λ 1 1 · 1- 1 2 z2 1+ 1 2 g 1(x 1)z2 2,(13)这里φ 1( X 1)=f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2+ 1 2 z 1+ 1 2 g 1(x 1)z 1,且X 1=[ x ,y d, d] T .应用神经网络逼近φ 1( X 1),即:z 1φ 1( X 1)=z 1 W * T 1S 1( X 1)+z 1δ 1( X 1),‖δ 1( X 1)‖≤ε 1,ε 1>0. (14)这里μ i=[μ i1 ,μ i2 ,…,μ iq ] T 是接受域的中心且常数η>0是高斯函数的宽度.式(5)表明如果f(·)在紧集Ω Z R q上是连续的,则对任意的精度ε>0,有一个径向基函数神经网络(5)使得f( Z )= W * T S( Z )+δ( Z ),这里 W *是理想的权向量且逼近误差δ( Z )满足|δ( Z )|≤ε.引理3 [6] 令S(·)是径向基函数神经网络(5)的一个基函数向量. n=[z 1,…,z n] T 和μ i=[μ i1 ,μ i2 ,…,μ in ] T 分别是输入变量和接受域的中心.对一个整数k<n定义了一个新的输入变量 k=[z 1,…,z k] T 和i=[μ i1 ,μ i2 ,…,μ ik ] T ,则对于相同的宽度常数,有S( n) T S( n)≤S( k) T S( k),这里 k和 i分别是由 n和μ i的前k个元素组成的向量.2 自适应神经网络控制设计通过反步设计法,构造一个针对系统(1)的自适应神经追踪控制器.首先,定义坐标变换如下:z 1=x 1-y d,z i=x i-α i-1 ,i=2,…,n,(6)其中 z i是虚拟状态追踪误差,α i是虚拟控制器.在设计过程中,虚拟控制器和自适应律将会被设计为如下形式;α i=-c iz i- i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(7)· i=-γ i i+λ iz i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(8)這里 i=1,…,n,c i,ρ i,γ i和λ i是正设计常数,S i( X ii )是径向基函数神经网络的一个基函数向量, X 11 =[x 1,y d, d] T , X ii =[x 1,x 2,…,x i,y d, d,…,y(i) d,1, 2,…, i-1 ] T , i是未知常数θ i的估计.注1 从式(8)可以得出若 i(0)≥0则 i(t)≥ 0,t≥0,因此本文将假设 i(0)≥0.步骤1.由z 1=x 1-y d可得1=f 1( x )+g 1( x )x 2- d. (9)给出如下李雅普诺夫函数为V 1= 1 2 z2 1+ g 1 2λ 1 2 1,(10)其中1=θ 1- 1是参数误差.通过联立式(9)和(10),可以得出:1=z 1(f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2)- g 1 λ 1 1 · 1+z 1g 1(x 1)z 2+z 1g 1(x 1)α 1. (11)根据杨氏不等式有:z 1g 1(x 1)z 2≤ 1 2 g 1(x 1)z2 1+ 1 2 g 1(x 1)z2 2. (12)将式(12)代入式(11)有1=z 1g 1(x 1)α 1+z 1φ 1( X 1)- g 1 λ 1 1 · 1- 1 2 z2 1+ 1 2 g 1(x 1)z2 2,(13)这里φ 1( X 1)=f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2+ 1 2 z 1+ 1 2 g 1(x 1)z 1,且X 1=[ x ,y d, d] T .应用神经网络逼近φ 1( X 1),即:z 1φ 1( X 1)=z 1 W * T 1S 1( X 1)+z 1δ 1( X 1),‖δ 1( X 1)‖≤ε 1,ε 1>0. (14)这里μ i=[μ i1 ,μ i2 ,…,μ iq ] T 是接受域的中心且常数η>0是高斯函数的宽度.式(5)表明如果f(·)在紧集Ω Z R q上是连续的,则对任意的精度ε>0,有一个径向基函数神经网络(5)使得f( Z )= W * T S( Z )+δ( Z ),这里 W *是理想的权向量且逼近误差δ( Z )满足|δ( Z )|≤ε.引理3 [6] 令S(·)是径向基函数神经网络(5)的一个基函数向量. n=[z 1,…,z n] T 和μ i=[μ i1 ,μ i2 ,…,μ in ] T 分别是输入变量和接受域的中心.对一个整数k<n定义了一个新的输入变量 k=[z 1,…,z k] T 和i=[μ i1 ,μ i2 ,…,μ ik ] T ,则对于相同的宽度常数,有S( n) T S( n)≤S( k) T S( k),这里 k和 i分别是由 n和μ i的前k个元素组成的向量.2 自适应神经网络控制设计通过反步设计法,构造一个针对系统(1)的自适应神经追踪控制器.首先,定义坐标变换如下:z 1=x 1-y d,z i=x i-α i-1 ,i=2,…,n,(6)其中 z i是虚拟状态追踪误差,α i是虚拟控制器.在设计过程中,虚拟控制器和自适应律将会被设计为如下形式;α i=-c iz i- i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(7)· i=-γ i i+λ iz i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(8)这里 i=1,…,n,c i,ρ i,γ i和λ i是正设计常数,S i( X ii )是径向基函数神经网络的一个基函数向量, X 11 =[x 1,y d, d] T , X ii =[x 1,x 2,…,x i,y d, d,…,y(i) d,1, 2,…, i-1 ] T , i是未知常数θ i的估计.注1 从式(8)可以得出若 i(0)≥0则 i(t)≥ 0,t≥0,因此本文将假设 i(0)≥0.步骤1.由z 1=x 1-y d可得1=f 1( x )+g 1( x )x 2- d. (9)给出如下李雅普诺夫函数为V 1= 1 2 z2 1+ g 1 2λ 1 2 1,(10)其中1=θ 1- 1是参数误差.通过联立式(9)和(10),可以得出:1=z 1(f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2)- g 1 λ 1 1 · 1+z 1g 1(x 1)z 2+z 1g 1(x 1)α 1. (11)根據杨氏不等式有:z 1g 1(x 1)z 2≤ 1 2 g 1(x 1)z2 1+ 1 2 g 1(x 1)z2 2. (12)将式(12)代入式(11)有1=z 1g 1(x 1)α 1+z 1φ 1( X 1)- g 1 λ 1 1 · 1- 1 2 z2 1+ 1 2 g 1(x 1)z2 2,(13)这里φ 1( X 1)=f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2+ 1 2 z 1+ 1 2 g 1(x 1)z 1,且X 1=[ x ,y d, d] T .应用神经网络逼近φ 1( X 1),即:z 1φ 1( X 1)=z 1 W * T 1S 1( X 1)+z 1δ 1( X 1),‖δ 1( X 1)‖≤ε 1,ε 1>0. (14)這里μ i=[μ i1 ,μ i2 ,…,μ iq ] T 是接受域的中心且常数η>0是高斯函数的宽度.式(5)表明如果f(·)在紧集Ω Z R q上是连续的,则对任意的精度ε>0,有一个径向基函数神经网络(5)使得f( Z )= W * T S( Z )+δ( Z ),这里 W *是理想的权向量且逼近误差δ( Z )满足|δ( Z )|≤ε.引理3 [6] 令S(·)是径向基函数神经网络(5)的一个基函数向量. n=[z 1,…,z n] T 和μ i=[μ i1 ,μ i2 ,…,μ in ] T 分别是输入变量和接受域的中心.对一个整数k<n定义了一个新的输入变量 k=[z 1,…,z k] T 和i=[μ i1 ,μ i2 ,…,μ ik ] T ,则对于相同的宽度常数,有S( n) T S( n)≤S( k) T S( k),这里 k和 i分别是由 n和μ i的前k个元素组成的向量.2 自适应神经网络控制设计通过反步设计法,构造一个针对系统(1)的自适应神经追踪控制器.首先,定义坐标变换如下:z 1=x 1-y d,z i=x i-α i-1 ,i=2,…,n,(6)其中 z i是虚拟状态追踪误差,α i是虚拟控制器.在设计过程中,虚拟控制器和自适应律将会被设计为如下形式;α i=-c iz i- i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(7)· i=-γ i i+λ iz i‖S i( X ii )‖ tanh z i‖S i( X ii )‖ ρ i ,(8)这里 i=1,…,n,c i,ρ i,γ i和λ i是正设计常数,S i( X ii )是径向基函数神经网络的一个基函数向量, X 11 =[x 1,y d, d] T , X ii =[x 1,x 2,…,x i,y d, d,…,y(i) d,1, 2,…, i-1 ] T , i是未知常数θ i的估计.注1 从式(8)可以得出若 i(0)≥0则 i(t)≥ 0,t≥0,因此本文将假设 i(0)≥0.步骤1.由z 1=x 1-y d可得1=f 1( x )+g 1( x )x 2- d. (9)给出如下李雅普诺夫函数为V 1= 1 2 z2 1+ g 1 2λ 1 2 1,(10)其中1=θ 1- 1是参数误差.通过联立式(9)和(10),可以得出:1=z 1(f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2)- g 1 λ 1 1 · 1+z 1g 1(x 1)z 2+z 1g 1(x 1)α 1. (11)根据杨氏不等式有:z 1g 1(x 1)z 2≤ 1 2 g 1(x 1)z2 1+ 1 2 g 1(x 1)z2 2. (12)将式(12)代入式(11)有1=z 1g 1(x 1)α 1+z 1φ 1( X 1)- g 1 λ 1 1 · 1- 1 2 z2 1+ 1 2 g 1(x 1)z2 2,(13)这里φ 1( X 1)=f 1( x )+g 1( x )x 2- d-g 1(x 1)x 2+ 1 2 z 1+ 1 2 g 1(x 1)z 1,且X 1=[ x ,y d, d] T .应用神经网络逼近φ 1( X 1),即:z 1φ 1( X 1)=z 1 W * T 1S 1( X 1)+z 1δ 1( X 1),‖δ 1( X 1)‖≤ε 1,ε 1>0. (14)。
【国家自然科学基金】_robust_基金支持热词逐年推荐_【万方软件创新助手】_20140801
rbf神经网络 lmi 鲁棒预测控制 预测控制 随机系统 输出反馈 节点定位 网络化系统 结构系统 空时自适应处理 空天飞行器 稳健 模型预测控制 极点配置 故障诊断 并行遗传算法 容错控制 姿态控制 奇异时滞系统 奇异值分解 增广变量法 图像水印 反馈线性化 参数不确定性 动态面控制 几何攻击 t-s模糊系统 pid控制 lyapunov函数 鲁棒统计 鲁棒离散优化 鲁棒故障检测 鲁棒容错控制 鲁棒估计 鲁棒l2控制 饱和控制 饱和因子 飞行控制系统 飞行控制 风速反演 音频盲水印 非线性控制系统 非线性扰动 非线性不确定性 雷达数据处理 随机时滞系统 通信带宽受限传感器网络 运动补偿 输出调节 输入状态稳定性 谱估计 说话人确认 警戒雷达 解速度模糊
视频编码 航天器 自适应神经网络 自适应 自由矩阵 自动控制技术 线性系统 线性矩阵不等式(lmis) 稳健优化 移动机器人 离散积分滑模控制 电梯群控调度 电性结构 田口方法 独立分量分析 状态时滞 特征点 特征多项式 灰色 滑模观测器 混沌 测量数据丢失 流形 洪水预报 概率密度函数 枢纽机场 未建模动态 时滞相关型判据 时延估计 时延 无线定位 振动控制 指数稳定 执行器故障 感应电机 弹性控制 异常值 并行分布补偿 定点控制 姿态估计 奇异摄动系统 多输入多输出 多目标跟踪 多lyapunov函数 复杂产品 块模型 图 变结构鲁棒控制 变结构控制
4 4 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106
基于Razumikhin方法的非线性时滞系统的自适应模糊控制设计
青岛大学学报 ( 程技术版 ) 工 J U N FQI G A I E S T ( &T) O R AL O N D O UN V R I Y E
Vo . 3 No 4 12 .
De . 2 0 e 0 8
作者 简 ቤተ መጻሕፍቲ ባይዱ :李 晓 丽 ( 9 4 ) 女 , 1 8 一 , 山东 烟 台 人 , 士研 究 生 , 究 方 向为 非 线 性 系 统 的 稳定 性 分 析 与 控 制 。 硕 研
第 4 期
李晓 丽 , : 等 基于 R z mihn方法 的非 线性 时滞系统 的 自适 应模糊 控制设 计 au k i
一
统, 即是 利用 神经 网络 的 函数 逼 近 功 能对 完 全 未 知 的非 线 性 函 数 建 模 , b c se pn 用 ak tp ig技 术 来 构 造 控 制 L auo y p n v函数并 进行 控 制 器设 计 。 由于 现 行 的 神 经 网 络 自适 应 设 计 方 法 主 要 是 基 于 L y u o a p n v—Kr— a s vki 函估计 权重 向量 中的 每一个分 量 , o s i泛 因此 , 自适 应控 制器 中有 大 量 的 自适应 参 数要 求 在线 自学 习 , 这
l 5
式 中, , , ER分别是 系统 的状 态 变量 、 制输入 和控制 输 出 ;() “y 控 r £是时 变时滞 , 满足 r £≤ rr是正 常数 ; () ,
一
[ l , , ] 厂 ) g ) q ) , … ; ( , ( 和 ( 是未知 的非线 性光 滑 函数 , 满足 f O 一q O 0 () () 。 对于 系统 ( ) 目前 尚无模糊 控制方 法能 够进行 控制设计 。然 而 , 1, 在假 定控 制增益 函数 g ) ( 的范数 上 界
随机非线性系统基于事件触发机制的自适应神经网络控制
随机非线性系统基于事件触发机制的自适应神经网络控制王桐;邱剑彬;高会军【摘要】This paper investigates the event-triggered adaptive output-feedback control problem for a class of strictfeedback stochastic nonlinear systems, and a novel event-triggered adaptive neural network output-feedback control strategy is proposed. The radial basis function neural networks are utilized to approximate the unknown nonlinear functions.By introducing Nussbaum gain function and designing filter during the backstepping design procedure, the effect of unknown control direction is compensated. The boundness of the closed-loop stochastic nonlinear system is guaranteed by designing a relative threshold event-triggered mechanism. Finally, a numerical example is given to show the effectiveness of the proposed control strategy.%针对一类具有严格反馈结构且控制方向未知的随机非线性系统, 提出了基于事件触发机制的自适应神经网络 (Adaptive neural network, ANN) 输出反馈控制方法.利用径向基神经网络逼近系统中未知的非线性函数.通过引入Nussbaum增益函数并设计滤波器, 解决了系统控制方向未知的问题.通过设计具有相对阈值的事件触发机制, 保证了闭环随机非线性系统的有界性.最后给出数值仿真例子验证所提控制方法的有效性.【期刊名称】《自动化学报》【年(卷),期】2019(045)001【总页数】8页(P226-233)【关键词】随机非线性系统;事件触发;反步法;自适应神经网络;输出反馈【作者】王桐;邱剑彬;高会军【作者单位】哈尔滨工业大学智能控制与系统研究所,哈尔滨 150001;哈尔滨工业大学智能控制与系统研究所,哈尔滨 150001;哈尔滨工业大学智能控制与系统研究所,哈尔滨 150001【正文语种】中文在过去的20多年中,针对具有严格反馈结构的非线性系统的自适应反步控制设计问题得到了广泛的研究[1-4].反步法(Backstepping)由Kanellakopoulos等于1991年在文献[3]中首先提出,是针对不确定性系统,将Lyapunov函数的选取与控制器的设计相结合的一种回归设计方法,通过从系统的最低阶次微分方程开始,引入虚拟控制的概念,一步一步设计满足要求的虚拟控制.上述文献[1-4]主要研究了具有严格反馈结构非线性系统的自适应控制设计问题,降低了自适应参数的数量.然而,上述方法并不能解决系统中存在未知的非线性项的情况.通过引入模糊逻辑系统或神经网络,文献[5-8]研究了一类含有未知非线性函数系统的自适应模糊/神经网络控制设计方法.针对一类最小相位非线性系统,文献[5]基于可线性化的神经网络结构提出了自适应神经网络(Adaptive neural network,ANN)反步设计方法.文献[6]通过结合二次Lyapunov-Krasovskii函数,解决了多输入多输出非线性时滞系统的跟踪控制问题.而针对具有严格反馈结构的单输入单输出非线性系统,文献[7]提出了基于动态面控制技术的自适应神经网络控制方法,解决了反步法带来的“维数爆炸”问题,降低了算法的计算复杂度.在此基础上,文献[8]将上述控制方法扩展到了一类具有纯反馈结构的非线性时滞系统.同时,自适应反步法控制设计也被应用到了悬架控制[9]等实际例子当中.考虑到各种随机干扰和随机扰动对非线性系统的影响,随机非线性系统的控制问题也得到了深入的研究[10-12].文献[10]解决了随机非线性系统的稳定性问题,文献[11]将该结果扩展到了一类互联的随机非线性大系统,文献[12]通过结合随机小增益定理和输入到状态实际稳定概念解决了一类含有未建模动态的随机非线性系统的自适应反步控制设计问题.通过结合神经网络文献[13-14]分别研究了随机严格反馈非线性时滞系统和随机非线性互联大系统的输出反馈控制问题,得到了系统依概率稳定的结果.另一方面,由于基于事件触发机制的控制策略不仅带来了诸如资源共享等优点,同时也可以充分利用有限的带宽资源实现可靠性较高的控制需求.文献[15]针对一般结构非线性系统的跟踪问题研究了其在事件触发机制条件下的稳定性,文献[16]则结合小增益定理将该结果扩展到了含有未建模动态的非线性系统.文献[17]提出了基于事件触发机制的输出反馈控制策略,解决了一类非线性系统的镇定问题.在系统中存在未知非线性函数的情形下,文献[18]结合模糊逻辑系统,针对离散非线性网络化系统,研究了其基于事件触发机制的H∞控制方法.文献[19-20]则研究了一类具有随机干扰的多智能体系统的一致性控制问题,文献[21-22]则基于事件触发机制分别研究了随机系统的滑模控制问题和H∞控制问题.上述的结果均是针对非线性系统或者随机线性系统,而非本文所研究的随机非线性系统,且在事件触发机制框架下针对控制方向未知的随机非线性系统的自适应神经网络控制问题的结果还未见报道.本文针对该类系统,提出了基于事件触发机制的自适应神经网络控制策略,通过引入Nussbaum增益函数克服了未知控制方向对系统性能的影响,保证了闭环系统的随机稳定性,使得系统所有的信号半全局一致有界,在事件触发设计框架下解决了随机非线性系统中同时存在未知非线性项和未知控制方向的自适应神经网络控制问题.1 问题描述1.1 系统模型及假设本文所考虑的为如下结构的随机非线性系统其中, 为系统的状态向量,y∈R和u∈R分别为系统的输出和输入,b为未知的常数,且存在已知正常数使得bmin≤|b|≤bmax,fi为未知的非线性光滑函数,gi(x)为不确定函数,记增量dω的协方差为σσTdt,即均值E{dωdωT}=σσTdt,其中函数矩阵σ是有界但不确定的.针对随机非线性系统(1),首先给出如下的假设.假设1.非线性函数fi满足局部Lipschitz条件,即|fi(X1)-fi(X2)|≤Li||X1-X2||,其中Li 为正的常数,这里的|·|表示函数的绝对值,‖·‖表示向量的1-范数.假设2.系统的随机扰动协方差是有界的,且满足如下等式.引理1[23].给出定义在时间段[0,tf)上的光滑函数ς(t)(详细表达式为式(42)).并考虑特定的Nussbaum 增益函数N(ς)= ς2cos(ς),针对随机非线性系统(1),若存在正定的函数V(t,x)和正定常数C,D使得如下不等式成立则E(V(t,x))和ς(t)均在[0,tf)上保持有界,其中ℓ为随机非线性系统的无穷小算子,其定义如下:考虑随机非线性系统dx=f(t,x)+hT(t,x)dω,针对V(t,x)的无穷小算子表达式为证明.首先,设计函数W(t,x)为可得利用式(2)可得由式(5)可得结合W(t,x)的定义可知值得注意的是,式 (8)中,对于s∈[0,t],e-C(t-s)满足0<e-C(t-s)≤1.假设e-C(t-s)(N(ς)+1)为 Nussbaum 型函数,则由Nussbaum 函数的性质可知,对于函数变量ξ,如下两个不等式成立可得EV(t,x)<0.然而,这与EV(t,x)≥0的事实相矛盾.因此,变量ς和EV(t,x)<0在时间段[0,tf)上是有界的,EV(t,x)也因此是有界的.□1.2 径向基神经网络针对随机非线性系统(1),将采用如下结构的径向基神经网络逼近系统中存在的未知非线性函数其中,为输入向量, θ=[θ1,θ2,···,θM]T 为权重向量,M>1为网络的节点个数,激活函数选取为如下结构其中,µi为对应的神经元中心参数, η为宽度向量.由于径向基神经网络的逼近特性,上述神经网络函数可以在一个紧集上以任意精度逼近任意的连续函数.其中,ε为逼近误差.1.3 滤波器设计首先,利用假设1和径向基神经网络逼近针随机非线性系统(1)中存在的未知非线性函数,即其中,为逼近误差,且满足为最优参数向量.记,随机非线性系统(1)可以写为其中,,,,.设计滤波器为其中,.设计滤波器结构为其中,.结合式(16)和(17),可得:需要注意的是,由于滤波器中存在未知参数变量ϑ,因此在接下来的控制设计中利用如下的状态观测值.选取向量K使得矩阵A为正定的赫尔维茨矩阵,即对于给定的正定对称矩阵Q,存在正定对称矩阵P使得如下等式成立定义系统的滤波误差变量可得针对滤波误差系统(22),选取Lyapunov函数为利用伊藤微分定理,可得如下不等式利用Young's不等式,可得:将上述不等式(25)~(27)代入式(24),可得:其中,.2 自适应反步设计由滤波器结构可得本节主要利用自适应反步法设计随机非线性系统(1)的控制器,首先给出如下的坐标变换步骤1.由系统模型(1)可得由式(16)可得式(32)等价于其中,.选取第一步的Lyapunov函数为其中,为参数估计误差向量,γ >0为设计参数.利用伊藤微分定理,可得利用Young's不等式,可得将不等式(37)~(40)代入式(36)可得其中,.设计虚拟控制器α1和自适应律为其中,c1>0,q>0为设计参数.将虚拟控制器α1和自适应律代入式(41)可得步骤2.由系统模型(1)可得其中,.选取步骤2的Lyapunov函数为其中,为参数估计误差.利用伊藤微分定理,可得利用Young's不等式,可得将上述不等式代入式(52),可得其中,.设计虚拟控制器α2和自适应律为其中,c2>0为设计参数.将虚拟控制器α2和自适应律代入式(52),可得步骤i.(i=3,···,n)同第一步和第二步所采用的技术方法类似,可设计虚拟控制器αi为其中,ci>0为设计参数.同时可得其中,.在步骤n需要设计最终的控制器u,因此考虑如下不等式接下来设计最终的基于事件触发机制的自适应神经网络输出反馈控制器其中,均为正的常数,ρ(t)=v(t)-u(t)为测量误差.由式(59)可得其中,κ1(t)和κ2(t)为满足如下条件的时变参数|κ1(t)|≤1,|κ2(t)|≤1.则控制器 u(t)可以改写为将u(t)代入式(58)可得由v(t)的定义可得根据tanh(·)函数如下的特性0≤|x|-xtanh,可得如下不等式最终可得其中,..由引理1可知,非线性随机系统(1)的所有信号均保持有界.对于任意的t∈[tk,tk+1),由ρ(t)=v(t)-u(t)可得,由上述结论可知为有界函数,即存在常数使得.在tk时刻,ρ(tk)=0,且limt→tk+1ρ(tk+1)= δv(t)+ψ.所以,事件触发时刻间隔满足.因此,事件触发时刻间隔存在下界t∗=ψ/>0,即排除了所设计的事件触发机制的Zeno行为.3 仿真实例本文给出如下的数值仿真实例其中,f1(x1)=0.5sin(x1),g1(x)=0.3sin(x1),f2(x)=0.5cos(x1)sin(x2),g2(x)=0.3cos(x1 ),b=-1.选取仿真运行时间为40秒,采样周期为0.01秒,选取初始值为,选取设计参数为.仿真结果见图1和图2,图1给出了系统和观测器的输出信号x1和,以及系统的跟踪信号yr.图2给出了传统基于时间驱动的控制信号和本文所提出的基于事件触发机制的控制信号.图1 系统的跟踪和观测性能Fig.1 Output tracking and observation performance图2 控制信号Fig.2 Control signals4 结论本文研究了一类具有未知控制方向的随机非线性系统的自适应神经网络控制设计方法.利用神经网络的逼近特性和Nussbaum增益函数解决了系统存在未知非线性函数和未知控制方向的问题,最后结合事件触发机制算法,提出了基于事件触发机制的自适应神经网络反步控制算法.仿真结果表明闭环系统的信号均是半全局有界的. References【相关文献】1 Polycarpou M M,Mears M J.Stable adaptive tracking of uncertain systems using nonlinearly parametrized on-line approximators.International Journal ofControl,1998,70(3):363-3842 Krstic M,Kanellakopoulos I,Kokotovic P V.Adaptive nonlinear control without overparametrization.Systems&Control Letters,1992,19(3):177-1853 Kanellakopoulos I,Kokotovic P V,Morse A S.Systematic design of adaptive controller for feedback linearizable systems.IEEE Transactions on Automatic Control,1991,36:1241-12534 Krstic M,Kanellakopoulos I,Kokotovic P.Nonlinear and Adaptive Control Design.New York:Wiley,19955 Zhang Y,Peng P Y,Jiang Z P.Stable neural controller design for unknown nonlinear systems using backstepping.IEEE Transactions on Neural Networks,2000,11(6):1347-13606 Chen B,Liu X,Liu K,Lin C.Novel adaptive neural control design for nonlinear MIMO time-delay systems.Automatica,2009,45(6):1554-15607 Li T S,Wang D,Feng G,Tong S C.A DSC approach to robust adaptive NN tracking control for strict-feedback nonlinear systems.IEEE Transactions on Systems,Man,and Cybernetics,Part B(Cybernetics),2010,40(3):915-9278 Wang M,Liu X,Shi P.Adaptive neural control of pure feedback nonlinear time-delay systems via dynamic surface technique.IEEE Transactions on Systems,Man,and Cybernetics,Part B(Cybernetics),2011,41(6):1681-16929 Sun W,Gao H,Kaynak O.Adaptive backstepping control for active suspension systems with hard constraints.IEEE/ASME Transactions on Mechatronics,2013,18(3):1072-107910 Deng H,Krstic M.Output-feedback stochastic nonlinear stabilization.IEEE Transactionson Automatic Control,1999,44(2):328-33311 Liu S J,Zhang J F,Jiang Z P.Decentralized adaptive output-feedback stabilization for large-scale stochastic nonlinear systems.Automatica,2007,43(2):238-25112 Wu Z J,Xie X J,Zhang S Y.Adaptive backstepping controller design using stochastic small-gain theorem.Automatica,2007,43(4):608-62013 Chen W,Jiao L,Li J,Li R.Adaptive NN backstepping output-feedback control for stochastic nonlinear strictfeedback systems with time-varying delays.IEEE Transactions on Systems,Man,and Cybernetics,Part B(Cybernetics),2010,40(3):939-95014 Li J,Chen W,Li J M.Adaptive NN output-feedback decentralized stabilization for a class of large-scale stochastic nonlinear strict-feedback systems.International Journal of Robust and Nonlinear Control,2011,21(4):452-47215 Tallapragada P,Chopra N.On event triggered tracking for nonlinear systems.IEEE Transactions on Automatic Control,2013,58(9):2343-234816 Liu T,Jiang Z P.A small-gain approach to robust eventtriggered control of nonlinear systems.IEEE Transactions on Automatic Control,2015,60(8):2072-208517 Abdelrahim M,Postoyan R,Daafouz J,Dragan Nesic.Stabilization of nonlinear systems using event-triggered output feedback controllers.IEEE Transactions on Automatic Control,2016,61(9):2682-268718 Li H,Chen Z,Wu L,Lam H K.Event-triggered control for nonlinear systems under unreliable communication links.IEEE Transactions on Fuzzy Systems,2017,25(4):813-824 19 Ding D,Wang Z,Shen B,Wei G.Event-triggered consensus control for discrete-time stochastic multi-agent systems:the input-to-state stability inprobability.Automatica,2015,62:284-29120 Ma L,Wang Z,Lam H K.Event-triggered mean-square consensus control for time-varying stochastic multi-agent system with sensor saturations.IEEE Transactions on Automatic Control,2017,62(7):3524-353121 Wu L,Gao Y,Liu J,Li H.Event-triggered sliding mode control of stochastic systems via output feedback.Automatica,2017,82:79-9222 Dong H,Wang Z,Shen B,Ding D.Variance-constrained H∞control for a class of nonlinear stochastic discrete timevarying systems:the event-triggereddesign.Automatica,2016,72:28-3623 Yu Z,Li S.Neural-network-based output-feedback adaptive dynamic surface control fora class of stochastic nonlinear time-delay systems with unknown controldirections.Neurocomputing,2014,129:540-547。
神经网络自适应控制的原理
神经网络自适应控制的原理自适应控制是一种特殊的反馈控制,它不是一般的系统状态反馈或输出反馈,即使对于现行定常的控制对象,自适应控制亦是非线性时变反馈控制系统。
这种系统中的过程状态可划分为两种类型,一类状态变化速度快,另一类状态变化速度慢。
慢变化状态可视为参数,这里包含了两个时间尺度概念:适用于常规反馈控制的快时间尺度以及适用于更新调节参数的慢时间尺度,这意味着自适应控制系统存在某种类型的闭环系统性能反馈。
原理图如下:图2-7 自适应控制机构框图人工神经网络(简称ANN)是也简称为神经网络(NNS )或称作连接模型,是对人脑或自然神经网络若干基本特性的抽象和模拟。
人工神经网络以对大脑的生理研究成果为基础的,其目的在于模拟大脑的某些机理与机制,实现某个方面的功能。
人工神经网络下的定义就是:“人工神经网络是由人工建立的以有向图为拓扑结构的动态系统,它通过对连续或断续的输入作状态相应而进行信息处理。
”这一定义是恰当的。
人工神经网络的研究,可以追溯到1957年Rosenblatt 提出的感知器模型。
目前在神经网络研究方法上已形流派,最富有成果的研究工作包括:多层网络BP 算法,Hopfield 网络模型,自适应共振理论,自组织特征映射理论等。
它虽然反映了人脑功能的基本特征,但远不是自然神经网络的逼真描写,而只是它的某种简化抽象和模拟。
神经网络的研究可以分为理论研究和应用研究两大方面。
理论研究可分为以下两类:(1)利用神经生理与认知科学研究人类思维以及智能机理。
NZ-1倒转神经模型DNN期望输出过程u(t)y(t)Un(t)实际输出+-(2)利用神经基础理论的研究成果,用数理方法探索功能更加完善、性能更加优越的神经网络模型,深入研究网络算法和性能,如:稳定性、收敛性、容错性、鲁棒性等;开发新的网络数理理论。
应用研究可分为以下两类:(1)神经网络的软件模拟和硬件实现的研究。
(2)神经网络在各个领域中应用的研究。
非线性控制系统中的自适应控制算法研究
非线性控制系统中的自适应控制算法研究自适应控制算法是一种能够根据系统实时变化进行调整和优化的控制方法,广泛应用于非线性控制系统中。
非线性系统由于其复杂性和不确定性,往往需要更加灵活和智能的控制方法来保证系统的稳定性和性能。
本文将对非线性控制系统中的自适应控制算法进行研究和探讨。
一、非线性控制系统概述非线性控制系统是指系统的输入与输出之间的关系不能通过简单的线性函数来描述的控制系统。
这种系统常常存在着非线性动态和非线性耦合等特性,具有较为复杂的动态行为。
由于非线性系统具有不确定性和不可预测性,传统的控制方法往往难以应对非线性系统的控制问题。
二、自适应控制算法概述自适应控制算法是一种基于系统自身反馈信息进行调整和优化的控制方法。
与传统的固定控制器不同,自适应控制器能够根据实时测量的系统信息进行参数的自适应调整,以实现对系统动态的自适应控制。
自适应控制算法通过学习和优化过程,使控制器的参数逐渐趋近最优值,从而提高系统控制性能。
三、自适应控制算法在非线性控制系统中的应用1. 模型参考自适应控制(MRAC)模型参考自适应控制是一种常用的自适应控制算法,通过建立一个理想模型与实际非线性系统进行比较,自适应调整控制器的参数以实现稳定的控制效果。
MRAC算法通过自适应更新控制器参数,根据系统的实时信息进行反馈调整,使得系统的输出能够与理想模型的输出保持一致。
这种算法能够有效应对非线性系统的多变性和不确定性。
2. 非线性全局自适应控制(NLGA)非线性全局自适应控制算法是一种基于反馈线性化技术和稳定性方法的控制策略。
该算法通过建立非线性系统的线性化模型,并结合稳定性分析方法,实现对非线性系统的全局自适应控制。
NLGA算法通过对系统状态进行反馈调整,实现对非线性系统的稳定性保证和优化控制。
3. 自适应扰动抑制控制(ADRC)自适应扰动抑制控制是一种能够有效抑制外部扰动对系统影响的控制算法。
该算法通过引入扰动观测器和自适应补偿器,实时对系统的扰动进行测量和补偿,从而保证系统在扰动影响下的稳定性和性能。
非线性纯反馈时滞系统的自适应模糊跟踪控制
2 0 1 3年 1 2月
青 岛大 学 学 报 ( 工 程技术版 ) J O UR N A L OF Q I N G D A O U NI V E R S I T Y( E&T)
Vol _ 2 8 NO. 4 De c .2 0 1 3
制、 滑 模变 结构 控制 等领 域 , 并 取得 了许 多研 究成 果 ] 。许 多研究 者将 自适应 B a c k s t e p p i n g控制 方 案与 李 亚普诺 夫 函数 方法 , 神经 网络 , 模糊 逻 辑 系统 以及非 线性 最优 化 方 法结 合在 一 起 , 成功 应 用 到一 类 严 格反 馈 非线性 不 确定 系统 的控 制 问题E ] 。纯反 馈 系统如 机械 系统 , 生 化 过程 等 , 没有 可 以直 接 仿射 的状 态 变量 来
关键词 :自适 应控 制 ;模糊 跟踪 控制 ;非线 性纯 反馈 时滞 系统 ; B a c k s t e p p i n g
中 图分 类 号 :T9 9 1 年, I . Ka n e l l a k o p o u l o s 等人 n 首次提出了 B a c k s t e p p i n g方 法 , 之后 被 推 广 到 自适 应 控 制 、 鲁 棒 控
摘要 : 针 对一 类不 确定 非线性 纯 反 馈 时滞 系统 的 自适 应 模糊 跟 踪 控 制 问题 , 本 文采 用 模 糊 逻辑 系 统来逼 近 系统 中未 知 的非 线 性 函数 , 利用 自适 应方 法 和 B a c k s t e p p i n g方 法构 造
出一种 自适 应模 糊控 制器 , 并 给 出了非 线性 纯反 馈 时滞 系统 跟 踪控 制 问题 可解 的充分 条
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时变时滞随机非线性系统的自适应神经网络跟踪控制余昭旭;杜红彬【摘要】This paper focuses on the adaptive neural control for a class of uncertain stochastic nonlinear strict-feedback systems with time-varying delay. Based on the Razumikhin function approach, a novel adaptive neural controller is de- veloped by using the backstepping technique. The proposed adaptive controller guarantees that all the error variables are 4-moment semi-globally uniformly ultimately bounded in a compact set while the tracking error remains in a neighborhood of the origin. The effectiveness of the proposed design is validated by simulation results.%针对一类具有时变时滞的不确定随机非线性严格反馈系统的自适应跟踪问题,利用Razumikhin引理和backstepping方法,提出一种新的自适应神经网络跟踪控制器.该控制器可保证闭环系统的所有误差变量皆四阶矩半全局一致最终有界,并且跟踪误差可以稳定在原点附近的邻域内.仿真例子表明所提出控制方案的有效性.【期刊名称】《控制理论与应用》【年(卷),期】2011(028)012【总页数】5页(P1808-1812)【关键词】自适应跟踪控制;神经网络(NNs);Razumikhin引理;随机系统;时变时滞【作者】余昭旭;杜红彬【作者单位】华东理工大学自动化系,上海200237;华东理工大学自动化系,上海200237【正文语种】中文【中图分类】TP2731 引言(Introduction)随机干扰广泛地存在于各类实际系统中,因此随机非线性系统的稳定性分析及控制器设计受到越来越多的关注[1~6].特别地,对于严格反馈型随机非线性系统,采用backstepping方法提出了许多控制策略[3~6].然而这些控制策略往往要求系统函数已知或满足匹配条件.如果不能获得系统函数的这些先验知识,那么这些方法显然不适用.由于神经网络和模糊系统对未知非线性函数具有良好的逼近性能,采用自适应神经网络控制和自适应模糊控制能较好地避免前面的限制.然而对具有未知系统函数的随机系统的神经网络控制问题和模糊控制问题的研究结果还比较少[6~10]. 时滞现象大量存在于如计算机网络、核反应器等实际系统中,并且往往会导致系统的不稳定,因此时滞系统一直是研究的热点问题[11].Lyapunov-Krasovskii方法和Lyapunov-Razumikhin方法也广泛地应用于时滞随机非线性系统的稳定性分析和控制器设计.文献[12,13]已将Lyapunov-Razumikhin方法应用到时滞不确定随机非线性系统的稳定性分析.对时滞随机非线性系统的镇定与跟踪问题,大多采用Lyapunov-Krasovskii方法[9,14~16]. 相比Lyapunov-Razumikhin方法,Lyapunov-Krasovskii函数则不易构造,且Lyapunov-Krasovskii函数的复杂性使得稳定性分析与控制器设计也更为复杂.此外Lyapunov-Krasovskii对时滞常常不仅要求有界,而且须满足(t)<ς<1(ς为常数),而Lyapunov-Razumikhin方法仅要求时滞有界.因此针对时变时滞随机非线性系统的跟踪控制问题,采用Lyapunov-Razumikhin方法提出一种新的自适应神经网络控制器设计方法具有重要意义.本文利用Razumikhin引理和backstepping方法,针对一类具有时变时滞的不确定随机非线性严格反馈系统,提出一种新的自适应神经网络跟踪控制策略.所提出的控制器可保证跟踪误差四阶矩半全局一致最终有界.同时由于神经网络参数化[10]的应用,使得自适应控制器中所估计的参数大量减少.2 问题描述及准备(Problem formulation and preliminary results)2.1 预备知识(Preliminary results)考虑以下随机非线性系统:其中:x∈Rn为状态,ω为定义完备概率空间(Ω,F,P)上的r维的标准布朗运动,其中:Ω为采样空间,F为σ域以及P为概率测度;f和h为合适维数的向量值函数或矩阵值函数.针对C2函数V(t,x)定义如下算子L:其中tr(A)为A的迹.Razumikhin引理:考虑时滞随机泛函微分方程(retarded stochastic functional differential equation,RSFDE):dx=f(t,xτ)dt+h(t,xτ)dω,令p > 1,如果存在函数V(t,x)∈ C1,2([−τ,∞]× Rn)和常数ci>0(i=1,2),q>1,满足以下不等式:对所有的t≥0,满足那么RSFDE的具有初值ξ的解x(t,ξ)概率意义下一致最终有界,并且满足其中:|ξ(s)|p,γ=µ1∧.由文献[17]中定理4.1.4取κ =0,ψ(t)=e−t,µ = µ1和ζ(t)= µ2可容易得到以上Razumikhin引理,证明略.本文中考虑p=4.引理1 对于ε>0和任意实数η∈R,存在不等式[18]其中k为常数且满足k=e−(k+1),即k=0.2785.引理2 考虑不等式其中λ为正常数,如果初始条件(0)≥0成立,则对所有t≥0有(t)≥0.本文中,高斯径向基函数(RBF)神经网络用来逼近任意的连续函数g(·):Rn→R,也即=TΦ(Z),其中输入向量Z∈ΩNN⊂Rn,权向量=(w1,···,wl)T ∈ Rl以及核向量Φ(Z)=(s1(Z),s2(Z),···,sl(Z))T;激励函数si(Z)采用高斯函数,即其中:µi=(µi1,···,µin)T为接受域的中心,νi为高斯函数的宽度.通过选择足够多的节点,神经网络在紧集ΩNN⊂Rn上可以逼近任意的连续函数,即“理想”的权向量W∗是为了分析而设想的量,定义为W∗:=arg|g(Z)−Z)|}.假设1 ∀Z∈ΩNN,存在“理想”的常数权向量W∗,使得‖W∗‖∞ ≤ wmax和|δ|≤ δmax,其中上界wmax,δmax > 0.由式(7)容易得到其中:β(Z)==max{δmax,wmax}.2.2 问题描述(Problem formulation)考虑由以下方程描述的时滞随机非线性系统:其中:xi∈R(i=1,···,n)为系统的状态,定义i=[x1···xi]T,x=n;u∈R为控制输入;y∈R为系统的输出;Borel可测函数τ(t):R+→ [0,τ]表示未知的时变时滞;ω与系统(1)定义相同;f(·),g(·),q(·):Rn→ R和h(·):Rn→ Rr皆为未知的非线性光滑函数.本文的主要目的是设计一种自适应状态反馈控制率u(x,θ),=Φ(x,),使得对于某紧集内的初始条件x(0),(0),闭环系统的所有误差变量皆四阶矩半全局一致最终有界,且跟踪误差可以稳定在原点附近的邻域内.假设2 未知非线性函数g(x)的符号已知,且存在正常数bm和bM,满足0<bm≤|g(x)|≤bM<∞,∀x∈Rn.不失一般性,可进一步假设0<bm≤g(x)≤bM<∞.假设3 存在未知k∞类函数Q(·)满足以下不等式:|q(x(t− τ(t)))|≤ Q(‖x(t− τ(t))‖).假设 4 未知非线性函数h(x,x(t−τ(t)))满足以下不等式:‖h(x,x(t− τ(t)))‖2 ≤H1(‖x‖)+H2(‖x(t− τ(t))‖),其中:H1(·)为未知非负光滑函数,H2(·)为未知k∞类函数.(t)皆为连续且有界的.进一步,假定存在常数d,假设 5 参考信号yd(t)及其微分(t),···,使得‖[yd···]T‖ ≤ d.3 控制器设计及稳定性分析(Controller design and stability analysis)这一节,针对系统(9),利用backstepping方法及Razumikhin引理设计一种新的自适应神经网络跟踪控制器.首先,需引入以下误差变量:其中:为待定的虚拟控制函数,.对于1≤i≤n−1,选取Lyapunov函数选取虚拟控制函数为其中:Lαi−1=,ki为待定设计常数.则容易得到以下关系式:其中:p1=k1−3/4>0,pi=ki−1>0(2≤i≤n−1).将式(11)可改写为如下形式:系数di,j为常数.另外,α0(yd)=yd.基于以上的介绍,容易得到下面引理3.引理3 存在正常数ρ,υ,使得其中:Z=[z1···zn:=−θ/bm,表示未知常数θ/bm的估计.下面继续控制器的设计.当i=n时,由Itˆo公式可得其中Lαn−1:=.定义Lyapunov函数由式(2)可得由假设3可得由于Q(·)为k∞类函数,利用引理3及Razumikhin引理可得由引理1,||Fn,其中Fn=Q(2ρq‖Z(t)‖)+Q(2υ),可通过以下不等式进行处理: 由假设4,可得以下不等式:其中:Gn=H2(2ρq‖Z‖)+H2(2υ),ϑ1和ϑ2为任意的正常数.定义一个新的函数在紧集ΩZ中可通过RBF神经网络逼近:其中:Zn=[x[n]]∈ ΩZ,W∗TS(Zn)表示的“理想”神经网络近似,而δ(Zn)表示逼近误差.利用神经网络参数化式(8),可得其中: β(·)==max{δmax,wmax}.构造实际控制器及参数调整算法如下:其中kn,σ与λ为待定的正设计参数.利用不等式θ≥,在控制器(20)(21)的作用下,由式(14)~(19)可得其中pn:=knbm−>0.式(22)可改写为其中: µ :=min{4p1,4p2,···,4pn−1,4pn,λ},ν :=θ2+k(θσ + ε)+由式(23)及Razumikhin引理可知,闭环系统的解四阶矩半全局一致最终有界,且对于足够小的ς>0,存在时间T:=,其中:E|Z(s)|4,γ=µ∧,c1 ≤min{},使得∀t≥T,有E|(y(t)−yd)4|≤ (1+ς)基于以上分析,主要结论可由以下定理描述:定理1 对于满足假设(2)~假设(5)的时变时滞不确定随机非线性系统(9),在控制器(20)和参数自适应率(21)作用下,闭环系统的所有误差信号四阶矩半全局一致最终有界,且跟踪误差稳定在以下集合Ω所定义的区域内:注 1 定义如下紧集:初始值集合Ω0、有界紧集ΩZ、稳态紧集Ωs和神经网络逼近的有效集合ΩNN.在控制器设计过程中为了∀t≥0神经网络逼近皆有效,需保证ΩZ⊆ΩNN.为了阐述方便,由式(23)及Razumikhin引理,可将有界紧集ΩZ和稳态紧集Ωs定义如下:这些集合之间的关系如图1所示.在控制器设计的初始阶段首先定义ΩNN,并且ΩNN与控制器的参数和初始集合Ω0均无关.由式(24)(25)可知:i)初始集合Ω0通过‖ξ‖0影响ΩZ,但与Ωs和ΩNN无关;ii)可通过调整参数ki,λ,σ,ε,ϑ1和ϑ2,使得ΩZ和Ωs足够小.图1 各紧集之间的关系Fig.1 The relationship among compact sets由集合ΩZ和Ωs的界可知,对于给定足够大的ΩNN,存在合适的‖ξ‖0,γ和ν使得ΩZ ⊆ ΩNN和Ωs ⊆ ΩNN. 而由γ和ν的定义可知,γ和ν的值依赖于控制参数ki,λ,σ,ε,ϑ1和ϑ2的选择.因此对于给定足够大的ΩNN和‖ξ‖0=ξmax>0,存在合适的控制参数使得ΩZ⊆ΩNN.定义xi(0),zi(0)和(0)的初始值集合Ω0使得‖ξ‖0<ξmax.这时对于属于Ω0的所有xi(0),zi(0)和(0),∀t>0均有ΩZ⊆ΩNN.4 仿真研究(Simulation example)考虑以下时变时滞不确定随机非线性系统:其中:τ(t)=1+sint,初始条件为x1(0)=0.2和x2(0)=0.1,参考输入信号yd=0.5(sint+sin 0.5t).仿真过程中,采用RBF神经网络来逼近未知函数,W∗TS(Z2)包含729个节点,中心分布在[−5,5]×[− 5,5]×[− 5,5]×[− 5,5]×[− 5,5]×[0,5],宽度为1;其他仿真参数给出如下:k1=4.74,k2=15,λ=5,σ=1.采用定理1中的控制器(20)和参数自适应率(21),其中z1=x1−yd,z2=x2− α1,β = β(Z2).仿真结果由图2~4给出,图2表明所提出的自适应跟踪控制器具有良好的跟踪性能,输出响应y能比较快地跟踪参考输入yd;控制输入如图3所示;图4描述了自适应参数曲线.图2 输出响应y(t)和参考输入yd(t)Fig 2 Output responsey(t)and reference inputyd(t)图3 控制输入u(t)Fig 3 Control inputu(t)图4 自适应参数Fig 4 Adaptive parameter5 结论(Conclusion)本文针对一类具有未知时变时滞的不确定随机非线性严格反馈系统,利用Razumikhin引理和backstepping方法,提出了一种新的神经网络自适应控制器,可以保证跟踪误差四阶矩半全局一致最终有界.所给出的控制器结构简单,易于实现.将该方法推广到更一般的严格反馈型随机非线性系统是下一步工作的方向.参考文献(References):【相关文献】[1]FLORCHINGER P.Lyapunov-like techniques for stochastic stability[J].SIAM Journal on Control and Optimization,1995,33(4):1151–1169.[2]FLORCHINGER P.Feedback stabilization of affine in the control stochastic differential systems by the control Lyapunov function method[J].SIAM Journal on Control and Optimization,1997,35(2):500–511.[3]PAN Z G,BASAR T.Adaptive controller design for tracking and disturbance attenuation in parameter-feedback nonlinear systems[J].IEEE Transactions on AutomaticControl,1998,43(8):1066–1083.[4]DENG H,KRISTIC M.Stochastic nonlinear stabilization:part 1:a backsteppingdesign[J].Systems&Control Letters,1997,32(3):143–150.[5]DENG H,KRISTIC M.Stochastic nonlinear stabilization:part 2:inverseoptimality[J].Systems&Control Letters,1997,32(3):151–159.[6]WANG Y C,ZHANG H G,WANG Y Z.Fuzzy adaptive control of stochastic nonlinearsystems with unknown virtual control gainfunction[J].Acta AutomaticaSinica,2006,32(2):170–178.[7]PSILLAKIS H E,ALEXANDRIDIS.NN-based adaptive tracking control of uncertain nonlinear systems disturbed by unknown covariance noise[J].IEEE Transactions on Neural Networks,2007,18(6):1830–1835.[8]YU J J, ZHANG K J, FEI S M. Direct fuzzy tracking control of a class of nonaffine stochastic nonlinear systems with unknown dead-zone input[C] //Proceedings of the 17th World Congress, the International Federation of Automatic Control. Elseviet: International Federation of Accountants, 2008, 12236 – 12241.[9]谢立,何星,熊刚,等,随机非线性时滞大系统的输出反馈分散镇定[J].控制理论与应用,2003,20(6):825–830.(XIE Li,HE Xing,XIONG Gang,et al.Decentralized output feedback stabilization for large scale stochastic nonlinear system with time delays[J].Control Theory&Applications,2003,20(6):825–830.)[10]GE S S,HUANG C C,LEE T,et al.Stable Adaptive Neural Network Control[M].USA:Kluwer Academic,2002.[11]RICHARD J P.Time-delay systems:an overview of some recent advances and open problems[J].Automatica,2003,39(10):1667–1694.[12]MAO X R.Razumikhin-type theorems on exponential stability of stochastic functional differential equataions[J].Stochastic Process and Their Application,1996,65(2):233–250. [13]JANKOVIC S,RANDJELOVIC J,JOVANOVIC M.Razumikhintype exponential stability criteria of neutral stochastic functional differential equations[J].Journal of Mathematical Analysis and Applications,2009,355(2):811–820.[14]CHEN W S,JIAO L C,liJ,et al.Adaptive NN backstepping output-feedback control for stochastic nonlinear strict-feedback systems with time-varying delays[J].IEEE Transations on System,Man and Cybernetics,Part B:Cybernetics,2010,40(3):939–950.[15]LIU S J,GE S S,ZHANG J F.Robust output-feedback stabilization for a class of uncertain stochastic nonlinear systems with timevarying delays[C]//Proceedings of 2007 IEEE International Conference on Control and Automation.Piscataway,NJ:IEEE,2007:2766–2771.[16]余昭旭,杜红彬.基于NN的不确定随机非线性时滞系统自适应有界镇定[J].控制理论与应用,2010,27(7):855–860.(YU Zhaoxu,DU Hongbin.Neural-network-based bounded adaptive stabilization for uncertain stochastic nonlinear systems with timedelay[J].Control Theory&Applications,2010,27(7):855–860.)[17]胡适耕,黄乘明,吴付科.随机微分方程[M].科学出版社,2008:153–156.(HU Shigeng,HUANG Chengming,WU Fuke.Stochastic Differential Equations[M].Beijing:Science Press,2008:153–156.)[18]PLOLYCARPOU M M.Stable adaptive neural control scheme for nonlinearsystems[J].IEEE Transactions on Automatic Control,1996,41(3):447–451.。