综述非线性系统最优控制理论.docx
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
综述非线性系统最优控制理论
近年来,最优控制理论[1,2]的研究,无论在深度和广度上,都有了很大的发展,已成为系统与控制领域最热门的研究课题之一,取得了许多研究成果。同时,也在与其他控制理论相互渗透,出现了许多新的最优控制方式,形成了更为实用的学科分支。例如鲁棒最优控制[3]、随机最优控制[4]、分布参数系统的最优控制[5]、大系统的次优控制[6]、离散系统的最优控制及最优滑模变结构控制[7,8]等。而对于非线性系统,其最优控制求解相当困难,需要求解非线性HJB方程或非线性两点边值问题,除简单情况外[9],这两个问题都无法得到解析解。因此,许多学者都致力于寻求近似的求解方法[10~13],通过近似解得到近似的最优控,即次优控制。
1、非线性最优控制理论研究成果分类
目前,较为流行的近似最优控制求解方法主要有以下几类[6][13]。
1)幂级数展开法:幂级数展开方法通过一个幂级数来构造控制律,得到序列形式的近似最优解,或者将系统中的非线性项以幂级数形式分解,或者通过引进一个临时变量并围绕它展开。
将上式代入HJB方程求得级数近似解,也可利用Adomian分解将非线性项进行分解,由此寻求非线性HJB方程级数的近似解。
2)Galerkin逐次逼近方法:由动态规划得到的一般性偏微分HJB方程,引入一个迭代过程来求解一般非线性HJB方程的一个近似解序列。
3)广义正交多项式级数展开法:其主要思想是将最优控制问题中的状态变量,控制输入,性能指标和各个参数分别用广义正交多项式展开,利用广义正交多项式的积分、乘积运算阵
将描述系统的微分方程转化为一系列的代数方程。然后,得到,T非奇异时由得到的控制律是一个多项式级数解。该方法将最优控制问题转化为代数极值问题,从而避免了求解时变非线性Riccati方程。
4)有限差分和有限元方法:经典的有限差分和有限元方法可以用来近似求解非线性HJB方程。近年来,这类方法用来近似求取非线性HJB方程的粘性解。
5)状态相关Riccati方程方法:这种方法适用的模型是仿射非线性系统,
通过极大值原理假设最优控制律具有如下形式
其中为下式所述里卡提方程的解
这样,问题的关键归结于近似求解。状态相关里卡提方程方法通过在中引入灵敏度参数变量ε,在邻域内将展为幂级数
通过比较幂级数同次项系数将状态相关里卡提方程分解为一组矩阵微分方程序列,由此求得其近似解。状态相关里卡提方程方法所设计的近似最优控制律是一种级数形式的状态反馈控制律。
6)Riccati方程近似序列法:该方法对非线性系统构造线性时变序列以及相应的线性二次型时变性能指标,得到线性时变序列的最优反馈控制序列
其中是里卡提方程近似序列的解。
此方法计算量较大,但是当系统的维数不是很大时,较里卡提方程近似序列方法具有很快的收敛速度,并表现出很好的鲁棒性。
7)逐次逼近法:该方法是针对非线性的一次项和高次项可分离的一类非线性系统进行近似最优控制问题的求解,给出了一种逐次逼近的近似求解方法。该方法针对由极大值原理导致的两点边值问题,构造近似的等价序列将其转化为一组线性非齐次两点边值问题序列,通过迭代求解一系列的向量微分方程,包括状态向量方程序列和共态向量方程序列,得到原非线性系统近似最优控制问题的解。该方法被广泛应用到各类非线性系统,其最大优点是在迭代过程中每次计算的不是矩阵微分或代数方程,而是向量微分或代数方程,计算量大大减少,而且实时性很高。
2、非线性最优控制理论研究成果对比
比较以上方法,各有优缺点。其中,幂级数展开方法要求系统关于状态向量x解析,才能够进行展开,这在实际工程应用中是不现实的。Galerkin逐次逼近法的收敛性过于依赖系统的初值,收敛性在很多情况下是无法保证的。广义正交多项式级数展开法和有限差分、有限元方法都是采用不同的数学工具来解决近似求解非线性系统的最优控制问题,但这两种方法的计算收敛性不好,所需的巨大计算量也使得它们离工程实际应用有很大一段距离。状态相关里卡提方程适
用于一类仿射非线性系统。里卡提方程近似序列方法同样适用于一类仿射非线性系统,当处理高维系统时,其计算量将很大。而逐次逼近法,从计算复杂度看,是对向量迭代,得到的最优控制律是由精确的线性反馈项和非线性补偿项组成,将最优控制的求解转化为非线性补偿向量序列的求极限过程,大大减少了计算量,容易被实际工程所应用。简言之,逐次逼近法通过较为简单的计算设计得到系统的近似最优控制律,具有计算量少,易于工程实现的优点,有很好的工程应用前景。然而,逐次逼近法的缺点在于其对外部扰动和系统内部参数摄动以及未建模动态敏感,因此提高最优控制的鲁棒性是非常必要的。
3、结束语
对于非线性系统,其最优控制的解一般是不存在的。再加上非线性系统的复杂性和多样性,这方面的研究成果还很少,尚待解决的问题还很多,,本文对非线性最优控制理论现有研究成果对比进行了详细的阐述,并对其优缺点进行了客观的对比,为非线性最优控制理论的进一步研究提
参考。