第七章极小值原理与典型最优控
第七章极小值原理与典型最优控_...
31
在某些情况下,S矩阵的某些元素大到足 以引起计算上的困难,在此情况下,用 逆Riccati方程求解。 令
P(t ) P (t ) I
P(t ) P 1 (t ) P(t ) P 1 (t ) 0
1
(11)
(12)
32
则逆Riccati方程为
P 1 (t ) A(t ) P 1 (t ) P 1 (t ) AT (t ) B(t ) R 1 (t ) BT (t ) P 1 (t )Q(t ) P 1 (t ) 1 P (t f ) S 1
H x
11
也可以写成
H[ x(t ), u(t ), (t ), t ] min H[ x(t ), v(t ), (t ), t ],
H x f ( x, u , t )
H x
v
12
满足边界条件
x(t 0 ) x 0
33
•最优反馈控制结构
R (t ) B(t )
1
x(t ) A(t ) x(t ) B(t )u(t )
P(t)
34
•P(t)的计算
由
将Riccati方程写成差分格式
P (t t ) P (t ) t[ P (t ) A(t ) AT (t ) P (t ) P (t ) B (t ) R 1 (t ) B T (t ) P (t ) Q (t )
J min
J min 0, 且t0为任意
P(t ) 0
37
•无限时间调节器问题
1 T J [ x (t )Q (t ) x(t ) u T (t ) R (t )u (t )]dt Min 2 t0 u (t ) x(t ) A(t ) x(t ) B (t )u (t ) s.t. x(t0 ) x0
Lecture 07 最小值原理
H (xf , λf ,u f ) = 0
若能知道λ (0)的值,就能根据协态方程解得最优控制
λ (t ) = exp(− AT t )λ0 , u * = − sgn( BT exp(− AT t )λ0 )
如果λ T b j ≠ 0, 可以确定最优控制 u * = − sgn(λ T b j ); j 如果λ T b j = 0, 则不能确定u *。 j 如果λ T b j = 0只在t的离散点上成立,则在这些点上u *作边界 j 值的切换; 如果λ T b j = 0在某一段时间间隔成立,这时无法确定u *j的值
5.1 最小值原理
系统运动方程 & x = f ( x, u, t ) 式中:x ∈ Rn − 状态变量;u ∈ Rm − 控制变量;t ∈[t0 , t f ] − 时间变量。 给定系统的初始时刻和初始状态 x(t0 ) = x0 系统的终端时刻和状态满足r个约束方程 n( x(t f ), t f ) = 0 控制变量满足若干不等式约束 g (u, t ) ≤ 0 最优控制问题的性能指标为 J = θ ( x(t f ), t f ) + ∫ φ ( x, u, t )dt
关于判别线性定常系统最优控制问题的正规性和奇异性, 有以下定理。 & 定理7-1 对于线性定常系统x=Ax+Bu 快速最优控制奇异的充要条件是,m个矩阵 Uj = [b j Ab j A2b j K An −1b j ], j = 1, 2,K , m 中,至少有一个是奇异的。 定理7-2 定理7-3ห้องสมุดไป่ตู้对于线性定常系统,快速最优控制正规的充要条件是: 对于正规快速最优控制问题,其最优控制律u*的每一个 m个矩阵Uj全部是非奇异的。
(1)快速最优控制的正规与奇异问题 定义7-1 若所有函数λ T b j 在时间间隔[0,tf ]上只存在有限个零点,则 对应的快速最优控制问题成为正规的。 定义7-2 如果对所有j=1,2, ,m,至少存在一个λ T b j函数在某一段时间 K 间隔[t1 ,t2 ]∈[0,tf ]上的取值为零,则对应的快速最优控制问题是奇异 的,并称时间间隔[t1 ,t2 ]为奇异段。 对于正规快速最优控制问题,完全能确定最优控制律u* ,即每个控制分量 u*均在边界值之间切换,且切换点就是λ T b j =0的时刻。这种控制方式成为 j “乒乒控制”。 对于奇异快速最优控制问题,在奇异段[t1 ,t2 ]上不能确定最优控制律,但 不表明最优控制u*不存在。因为在奇异段u*上,H函数与对应的u*无关,u* j j 可以取任意容许值,仍能满足最小值原理。此时快速最优控制不再具有 “乒乒控制”形式
最优控制特点
切换一次,设切换
2t
时间为ts,则令
0
为了求出ts,必须
首先找出状态在
1
平面上的转移轨线。
0
1
ts
tf
t
t
由 则:
设u=1,则
其中
如图(a)所示,为一组抛物线, 当K=0时经过原点[pos]
X2 s
0
t
p
若u=-1,则
X2 N
o
X1
T u=-1
为一组抛物线,如图(b),当K1=0时过原点[NOT]
j =1,2…r
u 最优控制 *(t)是使
为极小,则:
+1 -1 不定
u*(t) +1
-1
奇异
t
可见:当 当
时, 时,
有确定值,正常情况 不定, 奇异情况
我们仅研究正常情况
u*(t)写成符号函数sgn{ }形式
则
j =1,2…r
向量形式:u*(t)=-sgn{q*(t)}
=-sgn{
}
⑶根据规范方程:
在证明过程中:
与H得符号与这里所定义的相反。
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求,因此应用拓宽。 4、 极小值原来是求取最优控制的必要条件,非充分条件。 即:满足极小值原理不一定J取极小值,需进一步判断。
一般:对于实际系统
有最优解
有唯一解
最优解
三、几种边界条件得讨论:
上面所讨论的是
控制向量约束条件: 末端状态:
g:p ×1维函数向量
目标函数:
: 自由
问题:寻求最优控制u*(t),使系统由初态到终态, 目标函数J 为最小
❖ 步骤:应用最小值原理进行问题的求解
第七章 最优控制:最大值原理
(7.39)
H
2
u
2
2 0
u (t )
的解是最大化 H
例1 最大化
满足 y y u 和 y (0 ) 1
V
1 0
u dt
2
y (1) 0
汉密尔顿函数: H u 2 ( y u )
0
H t , y
(T ) y T ( 0 ) y 0
的第一项对 求导,得:
T ( ) 0
(7.28)
H H q ( t ) dt H y q (t ) p (t ) u y
f (t , y , u ) H
以上两个方程右边相同,因此左边相等:
y
推导得到最大值 原理的条件之一
以上推导得到:
H ( t , y , u , ) y ( t ) dt ( T ) y
T 0
T
(0) y0
步骤3 推导新目标泛函 的另一种形式
推导得到最大值原 理的一般横截条件
第二节 其他终结条件
一般横截条件:
H t T T
(T ) y T 0
(7.30)
y
y Z
• 固定终结点的横截条件:
y (T ) y T
(T 和
y T 给定)
水平终结线的横截条件:
[ H ]t T 0
t
0
T
T2
T
极小值原理最优控制 现代控制理论 教学PPT课件
2021年4月30日
第7章第1页
例 7.3.1 给定 1 阶系统
x x u , x(0) 1
求 u ,要求 u 1,并使
1
J 0 x(t)dt
取最小值。 解 使用变分法求解,取哈密顿函数
H x (x u)
则有
H x 1, (1) 0
2021年4月30日
第7章第2页
u(t)
1, 0,
t 0,1
t 1
2021年4月30日
第7章第18页
7.3.2 离散系统的极小值原理
1 离散欧拉方程与离散极小值原理的证明
当控制序列不受约束时,可以采用离散变分法求解离散系统的最优控制问题,得到离 散极值的必要条件,即离散欧拉方程。
设描述离散系统的状态差分方程为
x(k 1) f [x(k), u(k), k], k 0,1, , N 1
第7章第7页
故有
J (u) J (u)
t1[H ( x, u, )
t0
H(x, u, )]dt
T
(x
x)
t1 t0
1
这里 1 (t1 t0 ) 。
已知 t0
与
x(t0 ) 是固定的,即 ( x
x) t t0
0 ;如果 t1 与 x(t1) 也是不变的,则
(x
x) t t1
0 ;若
根据则方程 因而
式中 c1 和 c2 为待定常数。
1
H x1
1
2
2
H x2
0
1(t) c1et c2 2 (t) c2
2021年4月30日
第7章第17页
根据横截条件,得
1(1)
x1(1)
武汉大学自动化专业 《现代控制理论》第七章 最优控制
1
最优控制研究的主要问题是: 根据已建立的被控对象的数学模型,选择一个容许的 控制规律,使得被控对象按预定要求运行,并使给 定的某一性能指标达到极小值(或极大值); 从数学观点看,最优控制研究的是求解一类带有约束 条件的泛函极值问题,属于变分学的范畴。 古典变分理论只能解决控制无约束(即容许控制属于 开集)的一类最优控制问题,为满足工程实际的需 要,在20世纪50年代中期出现了现代变分理论, 常用的数学工具是Bellman(美国)的“动态规划”, 和Pontryagin(苏联)的‘极大值原理“。,又进一步推动了现代控制论的发展
T t0 T tf t0
∴ ..J = {θ [ X (t ), t ] λ (t ) X (t )}
+ ∫ {H [ X (t ), u (t ), t ] + λT (t ) X (t )}dt
t0
tf
9
极大值曲线的充分条件为 δ2 J<0
五 无约束条件的泛函极值
& 求 J ( X ) = ∫t Φ( X , X , t )dt 的极值,就是确定X(t),使 J = min .
0
tf
& 几何意义:寻找一条曲线X(t),使给定的可微函数 Φ ( X , X , t ) 沿X(t) 的积分达到极值,此时X(t)=X*(t)
横截条件: ①两端固定 ②两端状态自由
δX 0 = 0,.....δX f = 0
Φ & X Φ & X
tf
= 0,.....
③始端自由,终端固定 ④始端固定,终端自由 ⑤终端 t f 自由,但状态 X (tf )=c (tf ) 受约束——拦截 问题
Φ & X
基于古典变分法和极小值原理推导最优控制的解析求解条件
基于古典变分法和极小值原理推导最优控制的解析求解条件基于古典变分法和极小值原理推导最优控制的解析求解条件引言:最优控制理论是数学和工程学交叉的一个重要领域,在各个工程领域都有广泛的应用。
它的目标是通过优化方法寻找使系统指标达到极值的控制策略。
在这个领域中,变分法和极小值原理是两个重要的数学工具。
本文将介绍古典变分法和极小值原理,以及如何利用它们推导最优控制的解析求解条件。
一、古典变分法的基本原理古典变分法是研究极值问题的一种有效数学方法。
它的核心思想是将待求函数看作一族函数的极限形式,然后通过对这族函数进行泛函求导来获得包含待求函数的微分方程。
在最优控制问题中,我们希望找到一个控制策略,使系统的目标函数达到最小值或最大值。
通过应用古典变分法,我们可以将这个极值问题转化为一个泛函极值问题,并通过求解泛函极值问题来得到最优控制。
在使用古典变分法进行最优控制问题的分析时,我们需要定义一个泛函,即系统的目标函数。
泛函通常形式如下:\[ J[y,u] = \int_{t_0}^{t_f} L(t, y(t), u(t)) dt \]其中,\[y(t)\] 是状态变量,\[u(t)\] 是控制变量,\[L(t, y(t), u(t))\] 是泛函的被积表达式,它描述了系统的动力学以及待求函数的影响因素。
二、极小值原理极小值原理是古典变分法中的一个基本概念,用于推导变分问题的最优性条件。
对于一个给定的泛函\[J[y,u]\],如果它的极小值存在且为唯一解,那么这个极小值必须满足极小值原理的条件。
极小值原理的一般形式可以表示为:\[ \frac{d}{dt} \left(\frac{\partial L}{\partial \dot{y}}\right) -\frac{\partial L}{\partial y} = 0 \]\[ \frac{\partial L}{\partial u} = 0 \]这两个条件是极小值原理的必要条件。
07讲 最优控制-极小值-连续系统
连续时变系统的极小值原理
能源与动力学院系统控制与仿真研究室
31
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
32
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
33
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
21
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
22
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
23
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
肖玲斐 lf i @ lfxiao@ d
最优控制——极小值原理 最 控制 值原 内容提要
连续系统的极小值原理 离散系统的极小值原理 几类典型最优控制
•时间最短 •燃料最少 •能量最小 •时间-燃料最优控制
能源与动力学院系统控制与仿真研究室 2
最优控制——极小值原理 最 控制 值原 内容提要
例
能源与动力学院系统控制与仿真研究室
37
最优控制——极小值原理 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
38
最优控制——极小值原理 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
39
最优控制——极小值原理 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
最优控制极小值
∂H ∂L ∂ T =− − [λ f ] ∂x ∂x ∂x
(2·1—8) (2·l—9) (2·1—10)
ɺ λ=−
∂H =0 ∂u
(2·1—11) 方程(2·1—8)、(2·1—9)和(2·1—10)是利用哈米尔登函数法导 出的欧拉方程,分别叫做系统方程和控制方程。方程 (2·1—11)是相应的横截条件,式中n维矢量 λ (t )叫做协状态矢量 方程(2·1—8)和(2·1—9)一起叫做规范方程。
∂2H ∂u∂x δx dt ∂ 2 H δu 2 ∂u
(2·3—19)
和(n十m)×(n十m)矩阵, 即
∂2H 2 x ∂2 ∂ H ∂x∂u ∂2H ∂u∂x ∂2H ∂u 2
(2·3—20) 都是正定或半正定(负定或半负定)的。
tf
(2·1—14) υ 式中µ 和 分别是r维和q维的。根据泛函取极值的必要条件,J = 0 δ 可求出初始状态和终端状态受约束时的横截条件为
t0
∂Φ 2 ∂Mµ T + ]t =t0 λ (t0 ) = [ ∂x ∂x
M [ x(t 0 ), t 0 ] = 0
∂Φ1 ∂Nυ T λ (t f ) = [ + ]t =t f ∂x ∂x
t0 tf
(2.1—2) 、Φ 2 和L都是连续可微的纯量函数。假设端点时间 t 0 和 t f
t0
定义一个纯量函数
(2.1—4) 该函数称做哈米尔等函数。利用这个函数,方程(2·1—3)可写成
ɺ J ′ = Φ1[ x(t f ), t f ] − Φ1[ x(t0 ), t0 ] + ∫ {H [ x(t ), u (t ), t ] − λT (t ) x(t )}dt
极小值原理——精选推荐
§ 7. 3 极小值原理极小值原理是前苏联数学家庞特里亚金首提. 是变分法的延伸和推广,亦称极大值原理是解决控制和状态受约束最优控制问题的有力工具. 极小值原理的一种表述及其应用(不证) 1. 极小值原理 定理7.3 设==00()[(),(),],()xt f x t u t t x t x , 指标=+⎰0[(),(),]d [()]Tt J F x t u t t t S x T ,约束∈()()u t U 容许控制集,Hamilton 函数=+(,,,)[,,][,,]TH x u λt F x u t λf x u t ,则*()u t 是最优控制的必要条件是:*()u t 和相应的*()x t , *()λt 满足系统方程,∂=∂H x λ; (7.16)伴随方程,∂=-∂H λx; (7.17) 极值条件,******≤∈[,,,][,,,],,H x u λt H x u λt u u U ;(7.18)边界条件,∂=∂()()x T SλT x 。
(7.19)对(7.12)~(7.15’),改变的只是极值条件和边界条件。
说明:1) 只有*()u t 才能使Hamilton 函数为全局最小(故名)若无控制约束, 则有∂∂=/0H u .2)边值条件自然含=00()x t x →确定状态和伴随向量. 3)非充要条件。
对线性系统,条件是充要的。
4)解题步骤类似§2中用变分法<1> 作Hamilton 函数→极值条件→待定u (t ); <2> 若伴随方程中无x ,则求出λ;<3>若待定最优控制中不含x →即已求得()u t ;(否则就要解规范方程组),<4>求出,x J **(若要计算)。
2. 自由终端状态的最优控制举例例 7.5 求状态方程为==,(0)1xu x , 指标为=⎰1min ()d J x t t ,控制约束为()[1,1]u t ∈-,的最优控制。
第7章最优控制原理资料
目录(1/1)
目
录
7.1 最优控制概述 7.2 变分法 7.3 变分法在最优控制中的应用 7.4 极大值原理 7.5 线性二次型最优控制 7.6 动态规划与离散系统最优控制 7.7 Matlab问题 本章小结
x(t ) k1[u(t ) x(t )], x(t ) 0, x(1) 40 C
式中,k1为比例系数。 我们的目标是确定流入的液体的温度 u(t) 如何变化, 使得 散失的热量最少,即归结为在上述状态方程和边界条件下, 求函数
J [k2 x 2 (t ) k3u 2 (t )]dt
目标集(2/3)
因问题而异 , 末态可以是状态空间的一个点 , 更为一般的 情况是末态要落在事先规定的范围内,如要求末态满足如 下约束条件 g1(x(tf),tf)=0 g2(x(tf),tf)0 式中,g1(x(tf),tf)和g2(x(tf),tf)为关于末态时刻 tf 和末态状态x(tf) 的非线性向量函数。
t0 tf
最优控制问题的描述(2/2)
值得注意的是 ,所谓的“最优性”,是指被控系统相对于性能 指标函数意义下的最优性。 不同的性能指标函数,最优控制结果是不相同的。
最优控制发展简史(1/5)
7.1.3 最优控制发展简史
20世纪50年代,随着现代化生产的发展,特别是空间技术的发 展,被控系统日趋复杂,对自动控制提出的要求愈来愈高。 于是,那种建立在传递函数、频率特性基础上的经典控制 理论,日益暴露出它的局限性。 主要表现在: 首先,它只适用于集中参数的SISO线性定常系统,且 只适应于以解决伺服系统稳定性为主要目标的设计 问题,难以适应综合性能指标设计控制系统的要求。 再者,在应用经典控制理论设计时,需要凭经验试凑及 大量手工计算,难以用来解决复杂问题。
极小值原理及应用
27
定理3-4
综合型最优控制问题的极大值原理
给定系统的状态方程
X (t ) f [ X (t ),U (t ), t ]
和控制函数U(t)的闭集约束条件 U (t ) , t [t0,t f ] 则为将系统从给定的初态X(t0)=X0,转移到满足终端约束条件 [ X (t f ), t f ] 0 的某个终态X(tf ),其中tf是可变的,并使性能泛函
的某个终态X(tf ),其中tf是可变的,并使性能泛函
J [ X (t f ), t f ] L[ X (t ),U (t ), t ]
t0 tf
达到极小值的最优控制应满足的必要条件是:
25
(1) 设U*(t)是最优控制, X*(t)是对应于U*(t)的最优轨线,则存
在一与U*(t)和X*(t)相对应的n维协态变量(t),使得X*(t)和(t) 满足规范方程
取决于闭集性约束的边界时,特别要求H/U(t)有定义, 古典变分法便不再适用了。
ā
(2)在应用古典变分法来求解最优控制问题时,要求函数
[X ( tf ) ,tf ], L[X(t),U(t),t] ,
变量具有“充分”的可微性. 例如:
f [X(t), U(t) ,t] 对它们的自
J u (t ) dt
个闭子集。
容许控制
要求:确定满足约束条件的最优控制U*(t),使系统从给定的 初态X(t0)转移到某个终态X(tf) ,并使性能泛函达到极小值。
5
如果不考虑约束条件 ,那么该最优控制 问题的解的必要条件可由定理2-10给出,现引述如下: (1)设U*(t)是最优控制, X*(t)是对应于U*(t)的最优轨线,则 必存在一与U*(t)和X*(t)相对应的n维协态变量(t) ,使得X(t)与
应用极小值原理确定最优控制系统
即 F :1
线 t
线性 调节器要求 从任意 的初 始状 态调节 回平 衡状态 , 其调节 过程 中, 状态变量 就是偏 差, 而偏差 又有正负 , 因此性能 指标 中取 x的平方 。在 x的 n个分量 中, 大小 各不相 同 , 性 在
i t =fx t. 【)t () i 【)u I 】 I t, 给定 的初 始状 态 为 x ) ( =x
式 中 x t为 n维状态向量 , ( 为有界 闭集Q 的 P 控制 向量 , 下列 不等式约束 ( ) uI ) 维 受
g x t, () I ≥0 t () u t ,】
gx t, ( ,】 m维连 续可 微 的向量函数 , 中 m≤P t ( U t t是 ) ) 其 。系统 由初始状 态 终端 状态 xt , () 终端时 间 t 未确定 , 而终端状 态 xt要 满足下列 终端约束 : () r
能指标 中不能同等对 待 , 用加权 的方法予 以区别 , 即每个 X 以加权 系数 q。 乘 l 加权 后性能指 标为
J』; dJ td = t Qt tn :t x
q. 0 … 0 0
式 中 O为加权 阵 即
0 q2 0 0
Q=
0 0 0
在一般情 况下 , Q阵也 可 以不是对角 线矩 阵 , 虑到 实际情况 , 考 u不能无穷 大 , 对性 能指 标中 u 应加 以约束 , u有约束 的性能 指标为 对
J +uR d ' U] t  ̄
式 中 Q及 R阵都是 正定 的 , U 当 为纯量 时 , R亦为纯量 。
( 下转第 2 6页 )
维普资讯
鲫 第期 。 年 州
嚣 。E A院 。 学A L
大学课件《微积分》极小值原理
§7-1 极小值原理
例. 给定受控系统:
x1 x1 u
x1(0) 1
x2 x1
x2(0) 0
控制变量 u 满足如下不等式
1 u 1
求最优控制和最优轨迹,使如下性能指标取得极小值。
J x1(1) 解:哈密尔顿函数为H L(x,u,t) T f (x,u,t)
协状态方程:
H x
1 2
(g )T x
x1x1
u
1(x1
* *
1
1
* 0
u) 2 *2
x1
§7-1 极小值原理
运用极小值原理:H[x*,u*, *] min H[x*,u, *]
u 1
min {1*(u x1*) *2x1*}
最优轨迹x*(t) 为下述状态方程的解:
x*(t) Ax*(t) Bu *(t), x*(0) x0
而最优性能值为:J *
1 2
x0T
P(0)x0,
x0
0
第八章 线性二次型最优控制问题
其中, P(t) 为下述黎卡提微分方程的半正定对称解阵:
P(t) P(t)A AT P(t) Q P(t)BR 1BT P(t) P(t f ) S,t [0, t f ]
有限时间问题与无限时间问题,对控制及控制系统的要求有着显著 的不同;而跟踪问题则可以看作是调节问题的一种推广。
二. 有限时间LQ调节问题
1.结论:对于有限时间LQ调节问题u*,(t) 为具有最优控制的充要
条件是其具有如下形式:
u*(t) K *(t)x*(t), K *(t) R1BT P(t)
极小值原理
综上可得: c 最优控制为u (0) x ( 0) 1 2c c c * u (1) x(1) x(0) 1 c 1 2c 最优轨迹为x* (0) x0
*ห้องสมุดไป่ตู้
1 c x (1) x(0) 1 2c 1 1 x* (2) x(1) x(0) 1 c 1 2c
2)求 (t )以确定u的切换点 H 由协态方程 (1 )得+=- ,其解为=- +Ce t 1 1 x 当t f 1时 (t f ) (1) 0, C e, 故切换点:令 1, 得t 1 ln 2 0.307
二、补充说明
1、式H [ x* (t ), u * (t ), * (t ), t ] H [ x* (t ), u (t ), * (t ), t ] 说明当u (t )和u (t )都从容许的有界集中取 值时,
最优控制(最小值原理)1
最优控制最优控制——————最小值原理最小值原理七 几种典型的几种典型的工程工程工程应用应用 1.时间最优控制时间最优控制问题,是可以运用极小值原理求解的一个常见的工程实际问题。
如果性能指标是系统有初态转移到目标集的运动时间,则使转移时间为最短的控制称为时间最优控制,或称最速控制。
本节主要介绍线形定常系统的时间最优控制分析法及其应用。
1.1 一类非线性系统的时间最优控制先把需要解决的问题叙述如下:[问题3-1] 移动目标集的一类非线性系统的时间最优控制问题为()1min ,1,2,,fj t u t t J dt j m ≤==∫⋯..s t ① [][]00()(),(),(),()xt f x t t B x t t u t x t x =+=ɺ ② (),0f f x t t ψ =式中()n x t R ∈,()m u t R ∈;()f •和()B •维数适当,其各元对()x t 和t 连续可微;移动目标集()r R ψ•∈,其各元对()f x t 和f t 连续可微,f t 是状态轨线与移动目标集相遇的末端时刻。
显然,问题3-1属于时变条件、积分型性能指标、f t 自由和末端约束的最优控制问题。
根据极小值原理,令哈密顿函数[][]{}(,,,)1()(),(),()T H x u t t f x t t B x t t u t λλ=++ (3-136)正则方程为:[][]()(),(),()Hxt f x t t B x t t u t λ∂==+∂ɺ (3-137) [](),()()()()()TTB x t t u t H ft t t x xx t λλλ ∂∂∂=−=−−∂∂∂ɺ (3-138)边界条件及横截条件为00()x t x = (3-139)(),0f f x t t ψ = (3-140)()()T f f t x t ψλγ∂=∂ (3-141)极小值条件:***1()(),()(),()T T t f x t t t B x t t u t λλ ++{}**1min 1()(),()(),()j T T u t f x t t t B x t t u t λλ≤ =++ 或者[]{}*1()(),()min ()(),()j T T u t B x t t u t t B x t t u t λλ≤ = (3-142)因而得:**()sgn (,)()T u t B x t t λ =− (3-143)式中sgn()•为符号函数。
极小值原理
极小值原理极小值原理是微积分中的一个重要概念,它在数学和物理学中都有着广泛的应用。
极小值原理的核心思想是在给定条件下,某个函数在局部最小值点处的导数为零。
在这篇文档中,我们将深入探讨极小值原理的定义、应用和相关概念。
首先,我们来了解一下极小值原理的定义。
在数学中,给定一个函数f(x),如果存在一个数a,使得在a的某个邻域内,对任意的x,都有f(a)≤f(x),那么称f(a)是函数f(x)在该邻域内的一个极小值。
而极小值原理则指出,如果函数f(x)在点a处可导,并且在该点的导数为零,那么a可能是f(x)的极小值点。
极小值原理在实际问题中有着广泛的应用。
在物理学中,许多自然现象都可以通过极小值原理来进行描述和解释。
例如,光的传播路径往往是使光程取极小值的路径,这就是光的折射定律的基础。
在工程学中,极小值原理也被广泛应用于优化问题的求解,例如最优化设计和控制系统的设计等。
除了极小值原理的基本概念外,我们还需要了解一些相关的概念和定理。
例如,极值定理指出,如果函数f(x)在点a处可导,并且在该点的导数为零,那么a可能是f(x)的极值点。
另外,拉格朗日乘数法是一种利用极小值原理求解约束条件下极值的方法,它在优化问题中有着重要的应用。
在实际问题中,我们常常需要利用极小值原理来求解最优化问题。
例如,在工程设计中,我们希望找到一个函数的极小值点,以获得最优的设计方案。
而在物理学中,我们也需要利用极小值原理来描述和解释各种自然现象。
因此,深入理解和掌握极小值原理对于解决实际问题具有重要意义。
总之,极小值原理是微积分中的重要概念,它在数学和物理学中都有着广泛的应用。
通过深入学习和理解极小值原理,我们可以更好地解决实际问题,提高问题求解的效率和准确性。
希望本文对您对极小值原理有更深入的了解和认识,谢谢阅读!。
第7章-极小值原理(2024版)
(3).计算反馈增益阵 K * 及最优控制 u*(t) K*(t) R1BT P、u*(t) K*x*(t)
(4).计算最优状态轨迹
x*(t) Ax*(t) BR1BT Px*(t), x*(0) x0
(5).计算最优目标函数值
J
*
J
(u*())
uU
H (g )T
u u
§7-1 极小值原理
3) H 函数在最优轨线终点处的值决定于
H
T
N
0
t f
t f t t f
4) 协状态终值满足横截条件
(t
f
)
x(t f
)
( N x(t f
)T )
t t
f
5) 满足边界条件
x(t0) 0 N[x(t f ), t f ] 0
x
2
x10
消去t可得:
x1(t)
1 2
x22 (t)
( x10
1 2
x20 )
§7-2 时间最优控制问题
当:*2(t) C1t C2 0
有: u*(t) 1
状态方程为: x1(t) x2 (t) x2(t) 1
x1(0) x10 x2 (0) x20
解得:
x2 (t) t x20
xT
(t
f
)S
x(t
f
)
强调了终端时刻与平衡状态的偏差最小;
第八章 线性二次型最优控制问题
第二项
1 tf
xT (t)Qx(t)dt
希望系统的整个运动轨迹与平衡状态的偏差最
小; 2 0
第三项
1 tf
uT
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对于线性系统
(t ) A(t ) x(t ) B(t )u(t ) x x(t 0 ) x 0
LQR问题为
1 J x(t f ) 2
2 S
Min
u (t )
1 2
tf
t0
[ x(t )
2 Q (t )
u(t )
2 R (t )
]dt
S , Q 0, R 0
24
* (t ) K1 x(t ) K 2u * (t ) u u * (t0 ) u (t0 ) K1 S P21 , K 2 S P22
41
1
1
P A AT P PT S 1 P Q P 11 11 11 21 21 11 (T ) 0 P P A BT P PT S 1 P P 21 21 11 22 21 P21 (T ) 0
u * (t ) R B P x(t )
T
1
39
为下列代数Riccati方程的解 P A AT P P BR1BT P Q 0
P
或是Riccati微分方程的稳态解
(t ) P(t ) A(t ) AT (t ) P(t ) P P(t ) B(t ) R 1 (t ) B T (t ) Q(t ) P(T ) 0
tf
t0
(t )]}dt (t )[ f [ x(t ), u(t ), t ] x
T
6
定义标量函数
Hamilton 函数为
H [ x(t ), u(t ), (t ), t ] [ x(t ), u(t ), t ]
(t ) f [ x(t ), u(t ), t ]
P(t t ) P(t ) (t ) P lim t 0
取步长为负值,反向积分,即
P(t f ) P(t 0 )
34
P(t)的对称性,即
PT (t ) P(t )
所以P待求的元素个数为n(n+1)/2
35
•P(t)的半正定性
可以证明
但 故
1 T x (t0 ) P (t0 ) x(t0 ) 2
P lim P(t ,0, T )
T
40
PI调节器
1 T T T (t )]dt J [ x (t )Qx(t ) u (t ) Ru(t ) u (t ) Su Min 2 t0 u (t ) (t ) Ax(t ) Bu(t ) x s.t. x(t0 ) x0
tf
t0
T {H[ x(t ),u(t ), (t ),t ] (t ) x(t )}dt
9
如果 u 是最优控制律
对应于边界条件有
H [ x(t ), u(t ), (t ), t ] H [ x(t ), v(t ), (t ), t ], v
H x f ( x, u , t )
上述问题有解的条件:系统完全可控
u * (t ) R (t ) B (t ) P (t ) x(t )
T
37
1
P (t ) P(t ,0, ) lim P(t ,0, T )
T
T P(t ) P(t ) A(t ) A (t ) P(t )
P(t ) B(t ) R 1 (t ) B T (t ) Q(t ) P(T ) 0
为使H相对于所选择的u(t)尽可能小,必 T 须有: u (t ) B (t )
B T (t )
即u(t)取单位向量,
16
H (t ) x Ax(t ) Bu(t ) H T (t ) A (t ) x x(t0 ) x0 , x(t f ) 0 H [ x(t f ), (t f ), u (t f )] 1
H x
10
也可以写成
H [ x(t ), u (t ), (t ), t ] min H [ x(t ), v(t ), (t ), t ],
H x f ( x, u , t )
H x
v
11
满足边界条件
x(t 0 ) x 0
T
7
Hale Waihona Puke 特性指标为J [ x(t ), t ] t t
tf
t t f
0
(t )}dt {H[ x(t ),u(t ), (t ),t ] (t ) x
T t0
8
积分可得
J { [ x(t ), t ] (t ) x(t )
T
t t f t t0
J min
J min 0, 且t0为任意
P(t ) 0
36
•无限时间调节器问题
1 T T J [ x ( t ) Q ( t ) x ( t ) u (t ) R(t )u (t )]dt Min 2 t0 u (t ) (t ) A(t ) x(t ) B(t )u (t ) x s.t. x(t0 ) x0
2 2 2 2
1 u (t ) sign[ x1 (t ) x2 (t ) x2 (t ) ] 2
21
22
6.2 典型最优控制
主要内容
LQR问题 线性伺服机构 Bang-Bang 控制 奇异控制
离散系统最优控制
23
6.2.1 LQR(Linear Quadratic Regulator)问题
H 0 u(t ) R 1 (t ) BT (t ) (t ) u
A(t ) x B(t )u x
x(t 0 ) x 0
(t f ) Sx(t f )
26
确定闭环控制
假设 则得
(t ) P(t ) x(t )
T P(t ) P(t ) A(t ) A (t ) P(t )
17
如
MinJ t f s.t. 1 (t ) x2 (t ) x 2 (t ) u (t ) x
式中: u (t ) 1
18
H[ x(t ),u(t ), (t )] 1 1 (t ) x2 (t ) 2 (t )u(t )
(t ) 0 1 (t ) (t ) 2 1 1 (t ) c1 , 2 (t ) c2 c1t u sign(2 ) sign(c2 c1t ) x(t f ) 0
则逆Riccati方程为
1 (t ) A(t ) P 1 (t ) P 1 (t ) AT (t ) B(t ) R 1 (t ) BT (t ) P 1 1 P ( t ) Q ( t ) P (t ) P 1 (t ) S 1 f
32
•最优反馈控制结构
LQR问题的普遍性
LQR问题的提法具有普遍意义,不限于 哪种物理系统,而且人们证明这样的提 法易于获得解析解,最为可贵的是能获 得线性反馈解。 线性系统最优控制所的结果也适用于小 信号下运行的非线性系统,可以作为一 次近似 提供了一种统一的框架。
25
应用极小值原理
实现最优控制要求满足
H Q(t ) x(t ) AT (t ) (t ) x
N[ x(t f ), t f ] 0
N T H (t f ) ( )v, t t f t f t f
N T (t f ) ( )v, t t f x x
12
极小值原理与变分学
区别在于极值条件不同 极小值原理的极值条件是 Hamilton 函数
MinJ t f s.t. (t ) Ax(t ) Bu(t ) x x(t0 ) x0
式中:u (t ) U ,即 u (t ) 1
15
解:Hamiliton 函数为
T
H[ x(t ),u(t ), (t ),t ] (t )[ Ax(t ) Bu(t )]
u – m 维控制向量函数
容许控制
u Rm
- 是一给定的有界集合
假定终端时间 t f 满足 N[ x(t f ), t f ] 0
3
假设 f 对于 x , u 具有连续的偏导数
这种光滑性假定,对于任何分段连续的函数 u 保证了存在唯一的属于式(1)的容许轨线 x 可定义容许控制函数集合是这类分段连续的函数 并假定对于一个容许的 u 和给定的初始条件 , x(t 0 ) 在所考虑的控制区域内,式( 1)确定了一个唯一 的容许解
P(t ) B(t ) R 1 (t ) BT (t ) P(t ) Q(t ) P(t f ) S
27
dy 2 ( x ) y ( x ) y ( x) 在数学中,dx
称为
Riccati方程,所以(7)式也称为Riccati 方程
28
最优控制律为
令
K (t ) R 1 (t ) BT (t ) P(t )
主要内容
极小值原理
典型最优控制
1
6.1 极小值原理
极小值原理
研究最优控制问题的现代理论 对古典变分学的发展 一些文献中也被称为极大值原理 以 Bolza 问题为对象描述极小值原理