最优控制(Ch5)
最优控制第一章课件 (2)
•·
确定目标函数,通常是最小化某个性能指标,如时间、 成本等。
确定一个系统在一维空间中的最优运动路径,使得某个 性能指标达到最优。例如,在生产线上,需要控制机器 的速度以达到最大的生产效率。 定义系统的状态变量和动态方程。
应用最优控制算法,如极值原理、庞特里亚金极大值原 理等,求解最优控制策略。
THANKS
感谢观看
最优控制问题的分类
总结词
最优控制问题可以根据不同的标准进行分类,如线性与非线性、确定性与不确定 性、连续时间与离散时间等。
详细描述
根据系统动态特性的不同,可以分为线性系统和非线性系统;根据是否存在不确 定性,可以分为确定性和不确定性系统;根据时间变量的不同,可以分为连续时 间和离散时间系统。
最优控制问题的数学模型
龙格-库塔方法
一种高阶数值方法,通过构造一 系列的差分方程来逼近最优控制 方程,具有更高的计算精度和稳 定性。
梯度法
梯度法的基本思想是利用目标函数的梯度信息,通过迭代的方式逐步逼近最优解 。在最优控制问题中,梯度法可以用于求解状态和控制变量的最优解。
梯度法的优点是计算简单、收敛速度快,但需要足够好的初始点才能保证收敛到 全局最优解。
最优控制第一章课件
• 引言 • 最优控制的基本概念 • 最优控制的基本原理 • 最优控制的数值解法 • 案例分析
01
引言
主题简介
01
介绍最优控制的基本概念和背景 ,包括其在工程、经济、金融等 领域的应用。
02
简要说明最优控制理论的发展历 程和主要成果。
课程目标
掌握最优控制的基本 原理和方法。
实际应用的最优控制问题
择合适的性能指标和优化 算法。
将最优控制理论应用于实际工程问题中,解决实际生产 和生活中的控制问题。例如,汽车自动驾驶、无人机飞 行控制、机器人路径规划等。 针对具体问题,建立实际系统的数学模型。
最优控制理论课件
8
最优控制问题
1.1 两个例子
例1.1 飞船软着陆问题
软着陆 过程开 始时刻 t 为零
h& v
v& u g m
m& K u
m 飞船的质量 h 高度 v 垂直速度 g 月球重力加速度常数 M 飞船自身质量 F 燃料的质量 K 为常数
初始状态 h(0) h0 v(0) v0 m(0)MF
f(x(t),u(t),t) 为n维向量函数
22.03.2020
现代控制理论
24
最优控制问题
1.2 问题描述
(1) 状态方程 一般形式为
x&(t) f (x(t),u(t),t)
x(t) Rn
x(t)|tt0 x0
为n维状态向量
u(t) Rr
为r 维控制向量
f(x(t),u(t),t) 为n维向量函数
求解最优控制的变分方法
泛函与函数的几何解释
22.03.2020
现代控制理论
50
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
22.03.2020
现代控制理论
51
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
泛函的增量 J ( x ( g ) ) J ( x ( g ) x ) J ( x ( g ) ) L ( x , x ) r ( x , x )
J x ( T ) ,y ( T ) ,x & ( T ) ,y & ( T ) x & ( T )
控制
(t)
22.03.2020
现代控制理论
最优控制02
概述(问题提出、抽象、分类、求解) 变分法(控制 u(t) 不受限制) 极小值原理(u(t) 受限制)
动态规划法(多级决策、最优性原理)
二次型性能指标的线性系统最优控制 (控制的实现)
极小值原理求解最优控制问题
•古典变分法求解最优控制问题:假定控制变量u(t)不受任何限制,即容 许控制集合可以看成整个m维控制空间开集,这时控制变分du可以任取。 同时还严格要求哈密尔顿函数H对u连续可微。在这种情况下,应用变分 法求解最优控制问题是行之有效的.
*T b u 某一 时间 段持 续为 0 ,则 ( 3) i i 为不确定值。
极小值原理求解最优控制问题
1、乒乓(bang-bang)原理 上面的系统如果属于平凡情况,则其最短时间控制为
u* (t ) Msign( BT * (t ))
该原理也适用于非线性系统 x A( x,t ) B( x,t )u(t ) 2、最短时间控制存在定理 设给定的线性系统为完全可控,并且系统矩阵A的特征值均具 有非正实部,控制变量满足不等式约束:u(t ) M 则最短时间控制存在!
极小值原理求解最优控制问题
3、最短时间控制存在唯一性定理 设该系统属于平凡情况,若时间最优控制存在,它必定唯一。
4、开关次数定理 设该系统属于平凡情况, u(t ) M ,并且系统阵A的特征值全部为负实数 ,
则如果最短时间控制存在,必为bang-bang控制,并且每个控制分量在两个 边界值之间的切换次数最多不超过n-1次。
K பைடு நூலகம்0
求最优控制序列,使J极小。
极小值原理求解最优控制问题
拉格朗日乘子法:
J a Q ( x ( N ), N ) F ( x, u, k ) T (k 1)[ f ( x, u, k ) x (k 1)])
最优控制
最优控制最优控制(optimal control)使控制系统的性能指标实现最优化的基本条件和综合方法。
可概括为:对一个受控的动力学系统或运动过程,从一类允许的控制方案中找出一个最优的控制方案,使系统的运动在由某个初始状态转移到指定的目标状态的同时,其性能指标值为最优。
这类问题广泛存在于技术领域或社会问题中。
例如,确定一个最优控制方式使空间飞行器由一个轨道转换到另一轨道过程中燃料消耗最少。
最优控制理论是50年代中期在空间技术的推动下开始形成和发展起来的。
苏联学者L.S.庞特里亚金1958年提出的极大值原理和美国学者R.贝尔曼1956年提出的动态规划,对最优控制理论的形成和发展起了重要的作用。
线性系统在二次型性能指标下的最优控制问题则是R.E.卡尔曼在60年代初提出和解决的。
从数学上看,确定最优控制问题可以表述为:在运动方程和允许控制范围的约束下,对以控制函数和运动状态为变量的性能指标函数(称为泛函)求取极值(极大值或极小值)。
解决最优控制问题的主要方法有古典变分法(对泛函求极值的一种数学方法)、极大值原理和动态规划。
最优控制已被应用于综合和设计最速控制系统、最省燃料控制系统、最小能耗控制系统、线性调节器等。
最优控制理论(optimal control theory)最优控制理论概述最优控制理论是现代控制理论的一个主要分支,着重于研究使控制系统的性能指标实现最优化的基本条件和综合方法。
最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科。
它是现代控制理论的重要组成部分。
这方面的开创性工作主要是由贝尔曼(R.E.Bellma n)提出的动态规划和庞特里亚金等人提出的最大值原理。
这方面的先期工作应该追溯到维纳(N.Wiener)等人奠基的控制论(Cybernetics)。
1948年维纳发表了题为《控制论—关于动物和机器中控制与通讯的科学》的论文,第一次科学的提出了信息、反馈和控制的概念,为最优控制理论的诞生和发展奠定了基础。
最优控制课后习题答案
最优控制课后习题答案最优控制课后习题答案最优控制是现代控制理论中的重要分支,它研究如何在给定约束条件下,使系统的性能指标达到最优。
在最优控制的学习过程中,课后习题是巩固理论知识、培养解决问题能力的重要环节。
本文将为大家提供一些最优控制课后习题的答案,希望能对大家的学习有所帮助。
1. 线性二次型最优控制问题考虑一个线性时不变系统,其状态方程和性能指标分别为:$$\begin{align*}\dot{x}(t) &= Ax(t) + Bu(t) \\J(u) &= \int_{0}^{T} (x^T(t)Qx(t) + u^T(t)Ru(t))dt\end{align*}$$其中,$x(t)$为系统的状态向量,$u(t)$为控制输入向量,$A$和$B$为系统矩阵,$Q$和$R$为正定矩阵,$T$为最优控制的时间段。
求解该问题的最优控制输入$u^*(t)$。
答案:根据最优控制的原理,最优控制输入$u^*(t)$满足以下的最优性条件:$$\begin{align*}\frac{\partial J}{\partial u}(u^*(t)) &= 2R u^*(t) + 2B^T P(t)x(t) = 0 \\\dot{P}(t) &= -PA - A^T P - Q + PBR^{-1}B^T P\end{align*}$$其中,$P(t)$为状态向量的共轭变量矩阵。
通过求解上述的代数方程和微分方程,可以得到最优控制输入$u^*(t)$和状态向量的共轭变量矩阵$P(t)$。
2. 非线性最优控制问题考虑一个非线性系统,其状态方程和性能指标分别为:$$\begin{align*}\dot{x}(t) &= f(x(t), u(t)) \\J(u) &= \int_{0}^{T} g(x(t), u(t)) dt\end{align*}$$其中,$f(x(t), u(t))$为非线性函数,$g(x(t), u(t))$为性能指标函数。
最优控制问题的鲁棒H∞控制
最优控制问题的鲁棒H∞控制最优控制问题是控制理论中的一个重要研究领域,其目标是设计最优的控制策略,使得系统在给定的性能指标下达到最佳的控制效果。
然而,在实际应用中,系统参数的不确定性以及外部干扰等因素往往会对控制系统产生严重影响,导致传统最优控制策略难以在这些不确定因素下取得令人满意的控制效果。
为了解决上述问题,鲁棒控制方法被引入到最优控制问题中。
鲁棒控制的主要思想是设计一个能够对系统参数不确定性和外部干扰具有抗扰能力的控制策略,以保证系统在面临这些不确定性因素时仍能保持良好的控制性能。
其中,H∞控制是鲁棒控制的一种重要方法。
H∞控制是一种基于H∞优化理论的控制方法,其目标是设计一个稳定的控制器,使得系统输出对于外部干扰和参数不确定性具有最大的衰减能力。
H∞控制方法能够针对不确定性系统进行鲁棒性分析,并在饱和脉冲干扰和噪声扰动等情况下仍能保持系统的稳定性和性能。
在具体的系统应用中,鲁棒H∞控制方法常常需要进行控制器的设计和参数调整。
控制器的设计一般采用线性矩阵不等式(LMI)方法,在满足一定约束条件的前提下求解最优的控制器参数。
参数调整则可以采用各种数学优化算法,如内点法、遗传算法等,以达到使系统的H∞控制性能最优化的目标。
鲁棒H∞控制方法在许多领域中得到了广泛应用。
例如,在机器人控制、飞行器控制、电力系统控制等领域中,鲁棒H∞控制方法能够有效地抑制参数不确定性和外部干扰,提高系统的鲁棒性和控制性能。
此外,鲁棒H∞控制方法还能够应用于网络控制系统、混合控制系统等复杂系统中,具有广泛的应用前景。
总之,最优控制问题的鲁棒H∞控制方法在解决系统参数不确定性和外部干扰等问题时具有重要的研究意义和实际应用价值。
通过设计稳定的控制器并考虑系统的鲁棒性,能够有效提高控制系统的性能和稳定性,为实际工程应用提供了可靠的控制方案。
第六章最优控制
(2)自由始端:在给定t0情况下,x(t0 )可以任意取值,不受限制。
(3)可变始端:x(t0 ) 0,x(t0 )满足某些约束条件
j[x(t0 )] 0,j 1,2,, m
相应的始端集0
u(t) j ( x,u)0
4、终端条件:
(1)固定终端:t f 和x(t f )都给定
称J为积分型性能指标。
小结: 最优控制问题:就是从 可供选择的容许控制集 U中,寻求 控制向量 u(t),使受控系统在时间域 [t0,t f ]内,从初态 x(t0 ) 转移到终态 x(t f ) f时,性能指标 J取最小(大)值。
最优控制 u*(t):满足上述条件的控制 作用u(t)。 最优轨线 x*(t):在u*(t)作用下状态方程的解。 最优指标 J *:沿最优轨线 x*(t),使性能指标 J所达到的最优值。
2.控制作用域 (1)控制集U
U u(t) j ( x,u)0
U是在Rr空间中,满足某些约束条件 j (x,u) 0
( j 1,2,m)的点u(t)的集合。 (2)容许控制: 属于U的u(t),即u(t) U
3、始端条件:
(1)固定始端:最优控制的初始时刻t0和初始状态x(t0 )都给定。
2 f x 2
0
10
2
2 2 2
是正定的。故x 1 1 -2T 为极小值点x*, f的极小值f * f (x*) 0
三、具有等式约束条件极值的解法--拉格朗日乘子法
将具有等式约束条件的极值问题化为约束条件的极值问
题来求解 (一)拉格朗日函数
已知
连续可微的目标函数为
第六章 最优控制
着重介绍最优控制系统的基本概念、基 本理论及其应用。
武汉大学自动化专业 《现代控制理论》第七章 最优控制
1
最优控制研究的主要问题是: 根据已建立的被控对象的数学模型,选择一个容许的 控制规律,使得被控对象按预定要求运行,并使给 定的某一性能指标达到极小值(或极大值); 从数学观点看,最优控制研究的是求解一类带有约束 条件的泛函极值问题,属于变分学的范畴。 古典变分理论只能解决控制无约束(即容许控制属于 开集)的一类最优控制问题,为满足工程实际的需 要,在20世纪50年代中期出现了现代变分理论, 常用的数学工具是Bellman(美国)的“动态规划”, 和Pontryagin(苏联)的‘极大值原理“。,又进一步推动了现代控制论的发展
T t0 T tf t0
∴ ..J = {θ [ X (t ), t ] λ (t ) X (t )}
+ ∫ {H [ X (t ), u (t ), t ] + λT (t ) X (t )}dt
t0
tf
9
极大值曲线的充分条件为 δ2 J<0
五 无约束条件的泛函极值
& 求 J ( X ) = ∫t Φ( X , X , t )dt 的极值,就是确定X(t),使 J = min .
0
tf
& 几何意义:寻找一条曲线X(t),使给定的可微函数 Φ ( X , X , t ) 沿X(t) 的积分达到极值,此时X(t)=X*(t)
横截条件: ①两端固定 ②两端状态自由
δX 0 = 0,.....δX f = 0
Φ & X Φ & X
tf
= 0,.....
③始端自由,终端固定 ④始端固定,终端自由 ⑤终端 t f 自由,但状态 X (tf )=c (tf ) 受约束——拦截 问题
Φ & X
最优控制问题的鲁棒H∞控制设计
最优控制问题的鲁棒H∞控制设计随着科技的发展,控制理论在工程领域发挥着越来越关键的作用。
最优控制是控制理论中的一个重要分支,它的目标是在给定的约束条件下,使系统的性能达到最佳。
然而,实际系统常常受到各种不确定因素的干扰,这就需要应用鲁棒控制来解决这些问题。
本文将探讨最优控制问题的鲁棒H∞控制设计。
1. 引言最优控制问题是控制理论中的一个经典问题,它的目标是在给定的约束条件下,通过合适的控制策略使系统的性能达到最佳。
最优控制的方法有很多种,比如动态规划、最优化理论等。
而鲁棒控制是一种可以应对系统参数不确定性或者外部干扰的控制方法。
H∞控制是鲁棒控制的一种重要方法,可以有效地抑制系统的不确定性,并在一定程度上保证系统的稳定性和性能。
2. 最优控制与鲁棒控制的结合最优控制问题的解决需要考虑系统的性能以及各种约束条件,而鲁棒控制则可以应对系统参数变化或者外部扰动对系统性能的影响。
将最优控制和鲁棒控制相结合,可以得到更加鲁棒的控制策略。
在最优控制问题中引入鲁棒性的考虑,可以通过引入H∞范数来描述系统的性能和不确定性。
H∞范数可以有效地衡量系统的响应对不确定因素的敏感程度,通过优化H∞范数,可以得到更加鲁棒的控制策略。
3. 鲁棒H∞控制设计的方法鲁棒H∞控制设计的关键是确定系统的H∞范数和设计合适的控制器来优化H∞范数。
通常可以采用以下步骤进行鲁棒H∞控制设计:(1) 确定系统的数学模型,并分析系统的不确定性和外部干扰。
(2) 设计系统的H∞性能指标,可以根据系统的需求和约束条件来确定。
(3) 根据系统的H∞指标和约束条件,设计合适的控制器结构。
可以采用线性控制器,如PID控制器,或者非线性控制器,如模糊控制器等。
(4) 利用数学工具和优化算法,优化系统的H∞范数,得到最优的控制器参数。
(5) 实施最优控制器,并进行系统的仿真和实验验证。
4. 实例分析为了更好地理解鲁棒H∞控制设计的方法和效果,我们选取一个简单的控制系统进行实例分析。
最优控制
最优控制在生产过程,军事行动,经济活动以及人类的其它有目的的活动中,常需要对被控系统或被控过程施加某种控制作用以使个性能指标达到最优,这种控制作用称为最优控制。
上世纪五十年代初期Bushaw研究了伺服系统的时间最优控制问题。
以后,拉塞尔发展了时间最优控制的理论,即所谓的Bang-Bang控制理论。
1953至1957年间美国学者贝尔曼创立了“动态规划”理论,发展了变分学的哈密顿-雅可比理论。
1956至1958年间苏联学者庞特利雅金等创立了“极大值原理”。
这2种方法成为了目前最有控制理论的两个柱石。
时至今日,最有控制理论的研究无论在深度上和广度上都有了很大的发展,例如发展了对分布参数系统、随即系统、大系统的最有控制理论的研究等等。
例如在生活中的火车快速运行问题。
设有一列火车从甲地出发,要求算出容许的控制使其到达乙地的时间最短。
火车的运动方程)(t u x m =∙∙,m是火车的质量,∙∙x 是火车的加速度,为使旅客舒适,其值有限制。
)(t u 是产生加速度的控制作用(即推力),其值也有限制,设M t u ≤)(。
初始条件x t x 00)(=,0)(0=∙t x ,终端条件x t f f x =)(,0)(=∙t f x ,性能指标t t f t t dt u J f 00)(-==⎰,选择)(t u 使)(u J 为最小。
这就是最优控制方面的列子。
还有月球软着陆问题。
为了使宇宙飞船在月球表面上实现软着陆(即着陆时速度要为零),要寻求着陆过程中的发动机推力的最优控制规律,使得燃料的消耗最少。
设飞船的质量为)(t m ,离月球表面的距离为)(t h ,飞船的垂直速度为)(t v ,发动机的推力为)(t u ,月球的表面的重力加速度为g,设不带燃料的飞船质量为M,初始燃料的质量为F ,则飞船的运动方程可表示为)()(t v t h =∙,)()()(t m t u g t v +-=∙,)()(t ku t m -=∙式中k为比例系数,表示了推力与燃料消耗率的关系。
控制系统最优控制器
控制系统最优控制器在现代工业和工程领域,控制系统起到至关重要的作用,它可以帮助我们实现对各种系统的稳定性和性能的控制和优化。
而控制系统最优控制器则是控制系统中的一个关键概念,它可以帮助我们设计出最佳的控制策略,以达到系统的最佳性能。
一、最优控制简介最优控制是控制理论中的一个重要分支,它的目标是在给定的约束条件下,使系统达到最佳的性能。
最优控制问题可以基于不同的标准进行定义,比如最小化能耗、最大化系统稳定性等等。
最优控制的核心思想是通过优化算法来求解控制问题,得到最佳的控制策略。
二、最优控制器的设计最优控制器的设计是实现最优控制的关键步骤。
在最优控制理论中,常用的方法有线性二次型控制、最小二乘法、模型预测控制等。
这些方法基于不同的数学原理和算法,在不同的应用场景下有不同的适用性。
1. 线性二次型控制(LQR)线性二次型控制是最优控制中常用的一种方法,它通过最小化系统输出和期望输出之间的误差的平方和来设计控制器。
线性二次型控制具有数学理论良好、计算简单的优点,广泛应用于工业控制中。
2. 最小二乘法控制(LSE)最小二乘法控制是一种基于最小二乘法原理的最优控制方法。
它通过最小化系统输出和期望输出之间的误差的平方和,来求解控制器的参数。
最小二乘法控制适用于系统存在随机扰动或测量误差的情况下。
3. 模型预测控制(MPC)模型预测控制是一种基于模型的最优控制方法,它通过建立系统的数学模型,并利用模型对未来系统行为进行预测,来制定最佳的控制策略。
模型预测控制具有很强的适应性,可以应对复杂的系统和动态环境变化。
三、最优控制实例应用最优控制器的设计和应用涉及到多个领域,下面我们将以自动驾驶车辆的控制为例,来说明最优控制的实际应用。
自动驾驶车辆是一个复杂的控制系统,目标是实现车辆的安全、高效和舒适的行驶。
在自动驾驶系统中,最优控制器起到了至关重要的作用。
通过对车辆的感知和环境的分析,最优控制器能够实时地生成最佳的行驶策略,包括速度控制、转向控制等,以实现车辆的最佳性能。
最优控制
§6-1 概述
例如,在时间定义域[ t 0,t f ]上的目标泛函数为
(8)
J
tf
t0
L[ x (t ), u(t ), t ]dt
基本约束条件是受控对象的状态方程,如
x f [ x (t ), u(t ), t ]
最优控制要解决的题目是 —— 在满足上式的约束条件下,寻求最优控制函数 使目标泛函数取得极值(最大值或最小值)。
(3)
j [ x (t0 )] 0
相应的始端集为 Ω0 { x (t0 ) | 此时,
j 1, 2,..., m m ≤ r
j [ x (t0 )] 0}
x (t0 ) Ω0
称之为可变始端。
四、明确终端条件 固定终端: 终端时刻 tf 给定,终端状态 自由终端: 终端时刻 tf 给定,终端状态
... ... ... ...
2 f u1 un 2 f u2 un 2 f 2 un
最优控制 21
§6-3 静态最优化问题的解 (5)
例题6-1 设:
2 2 f ( x) 2 x12 5 x2 x3 2 x2 x3 2 x3 x1 6 x2 3
§6-1 概述
四、最优化的通常描述 目标函数:
(5)
J ( x) f ( x)
gi ( x ) 0
约束条件为等式约束
i 1,2,..., m
j 1,2,..., l
和不等式约束
h j ( x) ≤0
最优化的任务:在上述约束条件下,寻求 x ,使目标 函数取得最优值(最大或最小)。
最优控制 9
求
f ( x)
优化理论与最优控制
无约束最优化方法的特点及应用范围
最优化方法 坐标轮换法(变量轮 换法或降维法) 特点及应用范围 不需求导数,方法易懂,程序设计容易,但迭代过程较长,收敛速 度较慢,且问题的维数n愈多求解效率愈低,适用于n≤10的小型无约 束最优化问题,当函数的等值线为圆或为长短轴都平行于坐标轴的 椭圆时此法很有效。 效率高于上法,尤其最初几步迭代函数值下降很快,但愈靠近极值 点愈慢。迭代计算简单,占用计算机单元少,对初始点的选择要求 低。常与其它方法混用。 当初始点选得合适时是目前算法中收敛得最快的一种(尤其对二次函 数),但当初始点选择不当会影响到能否收敛或导致失败。计算较繁 且要求Hessian矩阵是非奇异的。计算量和存贮量都以维数n的平方 (n2)比例增加,故当函数变量较多和因次较高时不宜采用此法。 即使初始点选择不当,此法亦会成功,其它特点与牛顿法相同。 是对最速下降法在收敛速度上的重大改进,其收敛速度比最速下降 法大为加快,而计算又比牛顿法大为简化。计算简单,所需的存储 量少,收敛速度快,常用于多变量的最优化设计。 不需求导数只需计算函数值,适用于中、小型问题的无约束最优化 问题。Powell法是一种求无约束最优化问题较为有效的方法,适用于 中小型无约束最优化问题,但对于多维问题收敛速度较慢。
• 调整(设计、策略、决策)变量 设计变量的数目称为最优化设计的维数。 • 目标函数 在最优化设计中,可将所追求的设计目标(最优 指标)用设计变量的函数(解析或隐含)形式表 达出来,这一过程称为建立目标函数。 • 约束条件 在很多实际问题中,设计变量的取值范围是有限 制的或必须满足一定的条件。以及其他方面的限 制。
f (X ( k 1) )-f (X ( k ) ) 2
③当迭代点逼近极值点时,目标函数在该点的 梯度将变得充分小,故目标函数在迭代点处 的梯度达到充分小时,也可作为终止迭代的 判据:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最优控制与滤波理论Principle of Optimal Control and Filtering第五章离散系统最优控制Chapter 5 Optimal Control of Discrete Time Systems • 5.1 离散变分法与Euler方程• 5.2 离散极小值原理• 5.2 离散线性调节器¾研究离散系统最优控制的原因:计算机控制系统的普及化¾两种离散系统:1.无采样器:如社会经济系统等•泛函求极值问题:2.有采样器:如工业受控对象等•泛函求极值问题(等间隔采样):•简写同无采样器系统1u()00min (x(),)(x(),u(),)..x(1)(x(),u(),)x()x f k f f k k k J k k L k k k s t k g k k k k ϕ−==++==∑01u()00min (x(),)(x(),u(),)x[(1)]x[]..(x(),u(),)x()x f k f f kT k k J k T k T L kT kT kT k T kT s t f kT kT kT k T Tϕ−==++−==∑§5.1 离散变分法与Euler 方程¾当控制序列不受约束时,采用离散变分法,得到离散极值的必要条件-¾Lagrange •连续时间:•离散时间:¾性能指标设存在极值解x(k )= x*(k )+x(k (J (J 第x(k )= x*(k )时J 最小,意即:α=0时因此:于是有:于是(000111x (x x f f f k T k k k k k k k k δδδ−=−=−=⎧⎨⎩⎧=⎨⎩⎧=⎨⎩∑∑∑上式对任意δx(k )离散Euler 方程:横截条件:¾例:¾900111x ()x ()0x()x()x()ff k k k TTk k k k k k k L L L k k k k k δδ=−−−==∂∂∂⎧⎫++=⎨⎬∂∂∂⎩⎭∑(5.1.3)等式约束下的离散泛函极值问题••令则()min u k 01()min (x(),)(x(),u(),)f k f f u k k k nrJ k k L k k k ϕ−==+∑H9若泛函极值存在,则如下方程成立:•Euler 方程:•横截条件:∵x ∈R n ,u ∈R rx (Tf k δx ()Tk δu ()Tk δ{}11(x(),)()λ(1)x(1)f k Tf f k k J k k H k k k ϕ−==+−++∑()(x(),u(),)λ(1)f(x(),u(),)TH k L k k k k k k k =++问题:泛函极值存在的必要条件:协态方程:控制方程:横截条件:状态方程:边界条件:(x(),)λ()x()f f f f k k k k ϕ∂=∂()λ()x()H k k k ∂=∂()u()H k k ∂=∂()(x(),u(),)λ(1)f (x(),u(),)T H k L k k k k k k k =++00x(1)f(x(),u(),)x()x k k k k k +==01()000min (x(),)(x(),u(),)..x(1)f(x(),u(),),x ,u ,x()x ,x()f k f f u k k k nrf f J k k L k k k s t k k k k k k k k ϕ−==++=∈∈=∑\\固定,自由•例5.1.1 已知离散系统及边界条件:x (k +1)= x (k )+au (k ) x (0)=1 x (10)=0性能指标为:求使性能指标极小的控制序列u (k )与相应的状态序列x (k )。
解:两端状态固定的有约束极值问题伴随方程:控制方程:9201()2k J u k ==∑221()f(x(),u(),)()()21()()(1)(()())2k L u k k k k x k au k H k u k k x k au k λ==+=+++()(x(),u(),)λ(1)f(x(),u(),)T H k L k k k k k k k =++()λ()(1)()()x()H k k k k k C k λλλ∂=⇒+==∂故()0()(1)0()u()H k u k a k u k aC k λ∂=⇒++=⇒=−∂状态方程x(k+1)= x(k)+au(k) 故x(k+1)= x(k)-a2C x(1)= x(0) -a2Cx(2)= x(1) -a2C= x(0) -2a2Cx(3)= x(2) -a2C= x(0) -3a2C…x(k)= x(0) -ka2C代入边界条件:x(0)=1 x(10)=0 得:C=1/(10a2)最优控制:u*(k)= -1/(10a)最优轨线:x(k)= 1-0.1k*注:也可用z变换法替代后面的递推,自己试试§5.2离散极小值原理•庞特里亚金发表极小值原理时,只讨论了连续系统情况。
为了获得离散系统的极小值原理,有人曾从离散系统与连续系统比较接近这点出发,设想把连续极小值原理直接推广到离散系统,但除了采样周期足够小的情况外,其余都失败了。
•离散极小值原理的普遍论述较复杂,证明过程十分冗长。
9这里不加证明地给出结论。
离散极小值原理k 0, x(k 0)=x 0固定,k f态序列{x*(k )}及适当的序列{λ1.状态方程: x*(k +1)=f[x*(k 2.伴随方程:()λ()x()H k k k ∂=∂01()00min (x(),)(x(),u(),)..x(1)f (x(),u(),),x()x x(),u()f ,,f k f f u k k k n n J k k L k k k s t k k k k k k k L ϕϕ−==++==∈∈∈∈∑\\\[()x((x(H k H k L k ==其中:3.极值条件:4.5.¾说明1.2.9***()U x (),u (),λ(1),min x (),u(),λ(1),u k H k k k k H k k k k ∈⎡⎤⎡⎤+=+⎣⎦⎣⎦§5.3离散线性调节器¾类似于线性连续系统的二次型最优控制问题,线性离散系统的二次型最优控制也是线性控制律。
¾线性连续系统的二次型最优控制问题的解可最后归结到一个最优状态反馈律和求解一个黎卡提矩阵微分方程。
9线性离散系统的二次型最优控制问题的解可最后归结到一个最优状态反馈律和求解一个黎卡提矩阵差分方程(与黎卡提矩阵微分方程相类似)。
¾讨论两种状态调节器•时变状态调节器•定常状态调节器时变状态调节器离散线性系统的状态差分方程为:x(k +1)= A(k )x(k )+ B(k )u(k )(k =0,1,2, …, N -1)性能指标为:x(0)=x0, 固定,N 固定,X(N )自由,x(k )∈R n ,u(k ) ∈R r F ≥0,对称;Q(k )≥0,对称;R(k )>0,对称求最优控制序列{u*(k )}使性能指标J 最小。
{}1011x ()Fx()x ()Q()x()u ()R()u()22N T T T k J N N k k k k k k −==++∑{}11()x ()Q()x()u ()R()u()22λ(1)A()x()B()u()T T T H k k k k k k k k k k k k =++++伴随方程:极值条件:∵R(k )>0,∴u(kx(k 边界条件:横截条件:()λ()T H k k ∂=()u()H k k ∂∂λ()N =1λ()Q()x()A ()λ(1)x(1)A()x()B()R ()B ()λ(1)λ()Fx()T T k k k k k k k k k k k k N N −⎧=++⎪+=−+⎨⎪=⎩9上述三个方程组成离散两点边值问题,可解出λ(k ),但是得到的u*(k )是开环控制。
z 如何得到闭环最优控制u(x(k ))?(5.3.2)•用数学归纳法推导9假设λ(k +1)=P(k +1)x(k +1)当k =N -1时,由横截条件有:λ(N )= P(N )x(N ) (其中P(N )=F)证明λ(k )=P(k )x(k ) 是否成立。
•将(5.3.3)代入(5.3.2)得:将(5.3.4)代入(5.3.3)得:(5.3.3)111x(1)A()x()B()R ()B ()P(1)x(1)x(1)I B()R ()B ()P(1)A()x()(5.3.4)T T k k k k k k k k k k k k k k k −−−+=−++⎡⎤∴+=++⎣⎦11λ(1)P(1)I B()R ()B ()P(1)A()x()T k k k k k k k k −−⎡⎤+=+++⎣⎦(5.3.5)1x(1)A()x()B()R ()B ()λ(1)(5.3.2)T k k k k k k k −+=−+将(5.3.5)代入伴随方程得:因此,假设条件λ(k +1)=p(k +1)x(k +1)成立。
将(5.3.5)代入(5.3.1),得:则111u()R ()B ()P(1)I B()R ()B ()P(1)A()x()T T k k k k k k k k k k −−−⎡⎤=−+++⎣⎦{}1111λ()Q()A ()P(1)I B()R ()B ()P(1)A()x()P()Q()A ()P(1)I B()R ()B ()P(1)A()λ()P()x()1,,0T T T T k k k k k k k k k k k k k k k k k k k k k k k k N −−−−=⎡⎤++++⎣⎦⎡⎤=++++⎣⎦=∀=−"令那么成立()(5.3.6)⎣⎦(5.3.7)111K R ()B ()P(1)I B()R ()B ()P(1)A()T T k k k k k k k k −−−⎡⎤=+++⎣⎦令u()Kx()k k λ()Q()x()A ()λ(1)T k k k k k =++u(k )=-R -1(k )B T (k )λ(k +1) (5.3.1)11λ(1)P(1)I B()R ()B ()P(1)A()x()(5.3.5)T k k k k k k k k −−⎡⎤+=+++=−(5.3.8)u(k )是x(k )的线性反馈11P()Q()A ()P(1)I B()R ()B ()P(1)A()(5.3.6)T T k k k k k k k k k −−⎡⎤=++++⎣⎦1u()R ()B ()P(A()x()T k k k k k k −=−+11P(1)I B()R ()B ()P(1)A()A ()(P()Q())T T k k k k k k k k k −−−⎡⎤+++=−⎣⎦代入上式得:若A(k )可逆,则由式(5.3.6)得:[]1u()R ()B ()A ()P()Q()x()T T k k k k k k k −−=−−(5.3.9)*通过(5.3.6)计算出P(k ),然后可得u(k )。