现代控制理论变分法在最优控制中的应用

合集下载

最优控制 现代控制理论 教学PPT课件

最优控制 现代控制理论 教学PPT课件

第7章第3页
7.1.1宇宙飞船登月软着陆的实例
实例1:宇宙飞船若实现在月球表面实现软着陆,即登月舱到达月球表面时的速度为
零,要寻求登月舱发动机推力的最优变化率,使燃料消耗最少,以便在完成登月考察 任务后,登月舱有足够燃料离开月球与母舱会合,从而返回地球。
m(t) h(t) v(t)
u(t) g
M F h0 v0
如果泛函的变分存在,则
J ( x, x) J ( x x)
2021年4月30日
0
第7章第15页
求证 如果泛函的变分存在,则
J ( x, x) J ( x x)
0
证明 根据泛函变分的定义
J J (x0 x) J (x0 ) L(x0, x) r(x0, x)
由于 L( x0, x) 时关于 x 的连续线性泛函,故
J (C1x1(t) C2 x2 (t)) C1J ( x1(t)) C2J ( x2 (t)) ,且其增量可以表示为
J J ( x(t) x(t)) J ( x(t)) L( x(t), x(t)) r( x(t), x(t))
2021年4月30日
第7章第14页
其中,第一项是 x(t) 的连续线性泛函,第二项是关于 x(t) 的高阶无穷小,则称上式第
变分 x 表示U 中点 x(t) 与 x0 (t) 之间的差。由于 x 存在,必然引起泛函数值的变化,
并以 J (x x) 表示。其中 为参变数,其值 0 1。当 1时,得增加后的泛函值
J ( x x) ;当 0 时,得泛函原来的值 J (x) 。
若 泛 函 J ( x(t)) 对 于 任 何 常 数 C1 , C2 及 任 何 x1(t) U , x2 (t) U , 都 有

现代控制理论 最优控制

现代控制理论 最优控制
所以它的导数在 = 时应为零,即

[∗ + ]቟
=

=
由变分引理

[∗

+ ]ቕ
=
= ∗
=
得证
《现代控制理论》MOOC课程
6.2.2 无约束条件的变分问题(1)
6.2.2 无约束条件的变分问题
引理:如果函数() 在区间 ∈ [ , ]上是连Βιβλιοθήκη 的,而且对于只满足某些一般条件的任意

[ + ]቟

=
+ ]ቕ
=
∆ +
= lim

∆→

=
+ −
= lim




1
1 2


= lim { ඐ +


+}
2

2
− ∗
<
则称泛函 在∗ 处是连续的。
其中, , ∗ 表示在函数空间中 与∗ 之间的距离:

泛函的变分
, ∗ = max − ∗
≤≤
泛函 增量∆ 的线性主部称为泛函的一阶变分,简称泛函的变分,记作

选定的函数()有‫)()( ׬‬

= , 则在区间 ∈ [ , ]上有: () ≡
一 欧拉方程
讨论一个固定端点时间,固定端点状态的无约束条件变分问题。
问题: 考虑泛函为



= න [ , (),
]


式中 在 ∈ [ , ]上连续, [ , (),

现代控制理论 6 最优控制

现代控制理论 6 最优控制

(11)
对(11)式中的第三项进行分部积分,得
T J [ x ( t )] H ( x , u , λ , t ) d t λ ( t ) x λ ( t ) x d t f t T t f t 0
0

t f
t f
t 0
(12)
当泛函J 取极值时,其一次变分等于零。 即

T
将上式改写成
T T t H H f δ J λ ( t ) δ x ( t ) λ δ x δ u d t 0 f f t x ( t ) x u 0 f (13)
0
tf
( x ,x , t ) 及 x ( t ) 在 [ t 0 , t f ] 上连续可微, t 0 和 t f 给定, 其中, L
(t0) x x (tf ) xf ,x(t)Rn ,则极值轨线 x * ( t ) 满足如下欧 已知 x 0, 拉方程
L d L 0 x dt x
J [ x ( t t ( x , u , t ) d t f), f] L
t f t 0
(x ,u ,t) 是 x 、u 和t 的连续函数 最优。其中 L
最优控制问题就是求解一类带有约束条件的条件泛函极值问题。
补充:泛函与变分法
一、泛函与变分
1、泛函的基本定义: 如果对于某个函数集合 x(t)中的每一个函数 x (t ),变量J 都有一个 值与之对应,则称变量J 为依赖于函数 x (t ) 的泛函,记作 Jx ( t) 可见,泛函为标量,可以理解为“函数的函数” 例如:
由于 δ u 是任意的变分,根据变分法中的辅助引理,由(16)式得 (17) (14)式称为伴随方程, λ (t )为伴随变量,(17)式为控制方程。

哈工大现代控制理论基础第十一章 最优控制

哈工大现代控制理论基础第十一章      最优控制

11.1.1 最优控制问题的两个例子
[例1] 飞船的月球软着陆问题。 如图所示,飞船 靠其发动机产生一个与月球重力方向相反的推力 , 使得飞船到月球表面时速度为零, 即实现软着陆。 要求设计推力函数 ,使得发动机燃料消耗最少。
月球
[解]
设飞船的质量为 , 其高度和垂直速度分别为 和 ,月球的重力加速度为常数 ,飞船的自身 质量及所带燃料分别为 和 。
其中, 目标集 可表示为 性能指标 可表示为 其中 和 为连续可导的标量函数。
11.2 应用变分法求解无约束条件 的最优控制问题
11.2.1 泛函与变分
一. 泛函与泛函算子
所谓泛函,简单地说就是函数的函数,定义如下:

为给定的某类函数,如果对于这类函数中的
每一个函数,有某个数 与之相对应, 则称 为这类
哈工大现代控制理论基 础第十一章 最优控制
2020年4月24日星期五
11.1 最优控制问题的一般提法
最优控制研究的主要问题: 根据已建立的被控 对象的数学模型, 选择一个容许控制律, 使得被控 对象按照预定的规律运动,并使某一个性能指标达到 最大或最小。
从数学的观点来看, 最优控制问题是求解一类 带有约束条件的泛函极值问题, 属于变分学范畴。
经典的变分法只能解决控制无约束的问题, 即容许控制属于开集的一类最优控制问题。 然而, 工程中的控制常常是有约束的, 即容许控制是属于 闭集的。为了解决这个问题, 20世纪50年代,美国 学者贝尔曼和苏联科学院院士庞德里亚金分别独立 地拓展了经典变分法, 分别给出了动态规划方法和 极大值原理。 它们构成了最优控制的理论基础。
证明略
泛函变分的规则 泛函的变分是一种线性映射, 满足下列性质:
1 2 3 4

现代控制理论 7-2 变分法求泛函极值问题

现代控制理论 7-2 变分法求泛函极值问题

应用变分法求解最优控制问题()t x x =()[]t J J x =泛函的变分dt xdt 定理10-1返回例2:求泛函的变分tfδJ =∂ J [x + εδx] |ε =0 ∂ε& J = ∫ L[x (t ), x (t ), t ]dtt0解:δJ = ∂ ∂ε=∫tf t0& & ∫ L[x + εδx, x(t ) + εδx, t ]dt |εtf t0=0前页∂ & & L[x + εδx, x(t ) + εδx, t ]dt |ε =0 ∂ε返回t f ⎡ ∂L ∂L ⎤ & = ∫ ⎢ δx + δx ⎥ dt t0 & ∂x ⎦ ⎣ ∂x泛函的极值设 J [x(t)]:Rn→R 是线性赋范空间 Rn 上的连 续泛函,对于与x0(t) 接近的宗量x(t) ,泛函J [x(t)] 的增量:ΔJ = J [x(t )] − J [x 0 (t )] ≥ 0或者ΔJ = J [x(t )] − J [x 0 (t )] ≤ 0则称泛函 J [x(t)]在x0(t)处达到极小值(或极大值)11泛函极值的必要条件定理10-2 定理10-2设 J [x(t)]:Rn→R 是线性赋范空间 Rn 上的 连续可微泛函,且在x0(t)处达到极值,则泛函J [x(t)]在x0(t)处的变分为零:返回δJ [x 0 , δx] = 0返回变分预备定理设g(t) 是[t0, tf]上连续的n 维向量函数,h(t)是 任意的n 维连续向量函数,且 h(t0) = h(tf) = 0。

若满足:∫tft0g T (t )h(t )dt = 0∀t ∈ t0 , t f则必有: g (t ) ≡ 0[]12二、欧拉方程、横截条件 二、欧拉方程、横截条件返回1,无等式约束泛函极值的必要条件2,有等式约束泛函极值的必要条件返回最速降线问题确立一条连结定点A和B的 曲线,使质点m 在重力作用下 从A 滑动到B 所需的时间最短 (忽略摩擦和阻力)。

华中科技大学现代控制理论-7.2 变分法共66页文档

华中科技大学现代控制理论-7.2 变分法共66页文档

有不等式约束条件的多元函数极值(2/7)
有不等式约束条件的函数极值问题的求解比等式约束条件的 函数极值问题复杂。 ➢ 受前面讨论的引入拉格朗日乘子的启发,求解不等式约束 的函数极值问题也引入了乘子的概念,其求解基本方法可 由如下库恩-塔哈克(Kuhn-Tucker)定理给出。
有不等式约束条件的多元函数极值(3/7)—定理7-1
5
0
解 先定义库恩-塔哈克函数如下
L ( x ,y ,1 ,2 ) x 2 2 y 2 1 ( y 2 ) 2 ( y 2 x 5 )
有不等式约束条件的多元函数极值(5/7)
➢ 根据库恩-塔哈克定理,极小值的必要条件如下:
L x
df(x) 0
dx xx*
d2f(x)
dxdx
0
xx*
是x*为该多元函数极值问题的解的一个充分条件。
有等式约束条件的多元函数极值(1/5)
2. 有等式约束条件的多元函数极值
有等式约束条件的多元函数极值问题可描述为
m in f ( x) x
s.t. g ( x ) 0
式中,g(x)为p维的向量变量x的向量函数,并假定其连续可微; ➢ g(x)=0即为等式约束条件。
有不等式约束条件的多元函数极值(1/7)
3. 有不等式约束条件的多元函数极值
有不等式约束条件的多元函数极值问题可描述为
m in f ( x) x
s.t. g ( x ) 0
式中,g(x)为p维的向量变量x的向量函数,并假定其连续可微; ➢ 式g(x)=0即为不等式约束,
✓ 符号“”的意思为函数向量g(x)中每个元素“小于 等于0”。
x
➢ 当(A+A)可逆时
x A A 1b H λ

最优控制的基本理论及应用

最优控制的基本理论及应用
前苏联学者庞特里亚金等则在1956~1958年间创立 了极小值原理, 也发展了经典变分原理,成为处理控 制有闭集约束的变分问题的强有力工具。
本章在介绍解决最优控制问题3种基本方法(变分 法、极小值原理和动态规划)的基础上,阐述两类典 型最优反馈系统的设计,即线性二次型最优控制和最 小时间控制。
6.2 最优控制问题的提出及数学描述
6.3.2 用变分法求解无约束条件的泛函极值问题
设积分型性能泛函为
Jtt0f L[x(tx)(,t)]d,tt
(6-24)
在区间[t0 ,t f ]上,被积函数 L[x(t),x(t),t]二次连续可微, 轨线x(t)有连续的二阶导数,x(t)Rn ,对x(t)没有任何 约束。要求确定极值轨迹 x *(t) ,使泛函J为极值。
级数 ,则
J()tt0f L x Tη(t) L x Tη (t)R dt
(6-29)
式中,R表示泰勒(Taylor)级数展开式中的高阶项。
如果定义x(t)和 x (t) 的一阶变分为 δ x εη (t),δ x εη (t)
由泛函变分的定义,泛函的一阶变分为
(6-30)
6.2.2 最优控制问题的数学描述
构成最优控制问题必须具备以下几个基本条件:
1.被控系统的数学模型,即动态系统的状态方程
状态方程在最优控制中为等式约束条件。
2.控制变量的约束条件(容许控制)
任何实际物理系统,控制变量总是受约束的,一
般可写成
u(t)U
(6-3)
式中,U表示一个封闭的点集合,称为控制域。此时称 u(t)为容许控制。
1)积分型性能泛函
Jtt0f Lx((t)u,(t),dtt)
2)终值型性能泛函
J[x(tf ),tf]

现代控制理论 第6章 最优控制(校内讲稿)1

现代控制理论 第6章 最优控制(校内讲稿)1

2)终端型性能指标( 梅耶问题)
J x( t f )或J x( N )
3)综合型性能指标( 鲍尔扎问题)
J x ( t f ) Lx t ,ut ,t dt
终端指标


t
f
或J x( N )
N 1 k k 0
t0
L [ x( k ),u( k ),k ]
2.拉格朗日乘子法 设目标函数:
n维
x( tk 1 ) f [ x( tk ),u( tk ),tk ] n N倍
N 1 L k 0
J x( N ) 约束条件为:
x( k ), u( k ), k
( k 0 ,1, N 1 )
f [ x( k ), u( k ), k ] x( k 1 ) 0
6.9
Bang-Bang控制
总目录 章目录 返回
上一页 下一页
教学要求: 1. 学习泛函变分法,理解最优控制的一般概念 2. 掌握利用变分法求最优控制方法 3.掌握状态调节器,极小值原理
重点内容: •最优控制的一般问题及类型,泛函与变分,欧拉 方程,横截条件。 •变分法求有约束和无约束的最优控制。 •连续系统的极小值原理。 •有限和无限时间状态调节器方法,Riccati方程求 解。
爬山法 梯度法
总目录 章目录 返回
上一页 下一页
6.3 静态最优化问题的解
6.3.1 一元函数的极值
设: f ( u ) a , b 上的单值连续可微函数 J 则1) u为极小值点的充要条件
f ( u ) |u u 0
f ( u ) |u u 0
f ( u ) |u u 0
H f ( g )T 0 x x x H f ( g )T 0 u u u H g ( x ,u )0

最优控制理论-最优控制中的变分法

最优控制理论-最优控制中的变分法

0
(1-3)
ˆ) lim J ( x) J ( x
0
易见
2016/4/2
ˆ (t ), lim x(t ) x
0
6
b a u (t )v(t )dt

b a u (t )dv(t )
b u (t )v(t ) |a
b a v(t )du (t )
将式(1-2)对求导数,并利用式(1-3)可得
J ( x) L x L x dt 0 t [ 0 0 x x tf ˆ, x ˆ, t ) ˆ, x ˆ, t ) L( x L( x { (t ) (t ) }dt 0 t0 x x
tf
第一章
最优控制中的变分法
2016/4/2
1
主要内容:
• 固定端点的变分问题 • 变动端点的变分问题 • 等式约束条件下的变分问题 • 小结
2016/4/2
2
§1-1 固定端点的变分问题
所谓固定端点问题,是指状态空间中轨线(或轨迹)的 起点和终点都是预定的。 例:设有某航空班机从A城飞往B城,试寻求一个控制,使 飞机消耗的燃料最少。 在飞机起飞和降落的时刻,标志其飞行状态的量,如 位移(或角位移)、速度(或角速度)等,都是确定的。目标 是要寻找一控制规律,用以控制喷气发动机推力的大小和 方向,使飞机沿最优轨线航行,以期所消耗的燃料最少。 显然无论飞机沿什么轨线飞行,其始态和终态都是固 定的,用状态空间的话来说,飞机的任一轨线都必须通过 2016/4/2同一起点和同一终点。 3
t[ y ( x )] 0 f
ˆ (t ) (t ) ,当ε 在0与1间变动 即x
时表示通过A,B两点间的一束轨线,

现代控制理论最优控制(1)

现代控制理论最优控制(1)

1)泛函自变量的变分
δ x x(t ) x (t )
*
2)泛函的变分 泛函的增量:由自变量函数x(t)的变分δx(t)的泛函J[x(t)]
增量为
Δ J [x] J [x(t) δ x(t)] J [x(t)] L[x(t ), δ x(t)] o[x(t), δ x(t)]
泛函的变分:泛函J[x(t)]的增量ΔJ[x(t)]的线性主部称为 泛函的一阶变分,简称泛函变分记为δJ,即
J J [ x(t ) x(t )] 0 L[ x(t ), x(t )]
类比于函数y=f(x),其增量为 Δy= f(x+Δx)-f(x)=f’(x)dx+o(Δx) y=f(x)的微分 dy=f’(x)dx
2. 确定容许控制域
对于r维控制向量u(t),要满足客观约束条件
i ( x, u ) 0 j 1, 2,, m mr 把u {u (t ) i ( x, u ) 0}称为控制域
满足u (t ) u的u (t )称为容许控制
3.确定始端与终端条件 若系统的初始时刻t0确定,则:
3) 泛函的极值
若泛函J[x(t)]在曲线x(t)= x*(t)上达到极值,则有
J J [ x(t ) x(t )] 0 0

ΔJ=J[x(t)]-J[x*(t)] ≥0
则称泛函J[x(t)]在曲线x*(t)上达到极小值;若
ΔJ=J[x(t)]-J[x*(t)] ≤0
3)综合型性能指标( 波尔扎型)
J x t , u t , t dt x(t f ), t f t 0 L 或J x(k f ), k f L[ x (k ), u ( k ), k ]

变分法及其应用概要

变分法及其应用概要

变分法及其应用1.变分问题2.泛函与泛函的极值3.变分基本定理4.无约束泛函的极值问题5.带约束泛函的极值问题6.变分法在最优控制中的应用1. 变分问题变分法是17世纪末开始发展起来的一个数学分支。

微积分研究了函数的极值。

变分法是为了研究泛函的极值问题而产生的。

而泛函的极值问题在力学、最优控制等领域经常遇到。

为了解变分法所研究问题的特点,先介绍几个例子。

例 1.1(最速降线问题)。

设一质量为m 的质点,在重力作用下,从定点A 沿曲线下滑到定点B ,试确定一条曲线,使质点下滑的时间最短。

假定(1)A ,B 两点不在同一铅直线上,(2)质点在A 点处的初速为0v ,(3)不计曲线上的摩擦力和周围介质的阻力。

取坐标系xOy ,A 点的坐标为00(,)x y , B 点的坐标为11(,)x y ,过A ,B 两点任取一条 光滑曲线l ,设其方程为01:(),l y y x x x x =≤≤。

若质点从点A 沿曲线l 下滑到任意一点(,)P x y 处的速率为v ,由能量守恒定律可得22001()()2m v v mg y y -=-, 其中g 为重力加速度。

记 图1.1 最速降线2002v y gα=-, 则v =若s 表示弧AP 的长度,由微分学知识,dsv dt=,并且ds =,则ds dt v ==。

沿曲线l 从A 点下滑到B 点所需时间为1xTldsT dtv===⎰⎰⎰。

(1.1)对于过A,B两点的每一条光滑曲线l,由积分(1.1)都有唯一确定的T值与之对应,即T是依赖于曲线()y y x=的,不妨记[]T T y=。

如果记集合1010011{()|()[,],(),()}D y x y x C x x y x y y x y=∈==,则最速降线问题归结为在集合D上求泛函[]T T y=的极小值问题,即求()y x D∈,使得1minxx=⎰。

这个问题由约翰.贝努利(Johann Bernoulli)1696年提出并研究。

现代控制理论最优控制.

现代控制理论最优控制.

情况下,线性调节器或状态调节器是最常 见的一类线性二次型问题.
最优控制的目的是:当线性系统由于某种 原因偏离出原来的平衡状态,控制的目的是 使系统的状态x(t)尽量接近平衡状态,而所用 的量又不能太大,控制能量一般描述为控制 变量的二次型.
因此目标函数选为:
1 tf T J (u ) ( x Qx u T Ru )dt 2 t0
(5)跟踪问题.
5. 线性二次型最优控制问题
所谓二次型最优控制问题,实际上是指 目标函数是状态变量和控制变量的二次 型.
如状态调节器问题,而线性二次型最优 控制问题:则是除目标函数是状态变量和控 制变量的二次型,而且它的状态方程是线性 微分方程,即
x A(t ) x B(t )u, x(t0 ) x0
0
由于A-Bk是稳定矩阵,因此 x 0 , 故而 J 1 xT 0 Px 0 2 显然性能指标可由初始条件和P算得。
5.以下求k 由于R为正定实对称阵,故 R T T T ,其中 T为非奇异矩阵,于是方程式(5)可以写 成 T T T T T A k B P P A Bk Q k T Tk 0 (6)
明显地两者之间的差异和相同处在于: 相同: 都要在给定目标函数条件下,求使目标 函数取极值的函数式变量. 相异: 一个是求函数的极值时的变量取值问题, 另一个是求函数极值时求控制函数的问题.
由于最优控制中,目标函数依赖于控制 函数u(t),因而也称目标函数为目标泛函.
因此最优控制问题实际上是求使目标泛 函取极值的控制规律问题.
1 T
例2. 考虑如图所表示的系统.假如控制信号 为 u(t ) Kx(t )
试确定最优反馈增益 K ,使得下列性能指标 达到最小

用变分法求解最优控制问题

用变分法求解最优控制问题

t
tt0 f F xx F xx o (x )2 ,(x )2 d t
上式中 o[(x)2,(x)2]是高阶项。
(泰勒级数展开)
根据定义,泛函的变分 J 是 J的线性
主部,即
J
tf t0
F xx F x x dt
对上式第二项作分部积分,按公式
可得
tf t0
5.1 变分法基础回顾
相关的定义:
1、泛函: 如果对某一类函数X(t)中的每一个函
数X (t),有一个实数值J与之相对应,则称J为依赖于
函数X (t) 的泛函,记为
JJX(t)
简单来说,泛函是以函数为自变量的函数。
2、泛函的连续性:若对任给的 0,存在 0
当 X(t)Xˆ(t) 时,就有
J(X)J(Xˆ)
为了判别是极大还是极小,要计算二阶变 分 2 J。但在实际问题中根据问题的性质容易
判别是极大还是极小,故一般不计算 2 J 。
5.2 无约束条件的泛函极值问题
5.2.1 泛函的自变量函数为标量函数的情况
为简单起见,先讨论自变量函数为标量函数 (一维)的情况。我们要寻求极值曲线 x(t)x*(t), 使下面的性能泛函取极值
于是有约束条件的泛函 J 的极值问题化为无约
束条件的增广泛函 J a 的极值问题。 再引入一个标量函数
H (X ,U ,,t) F (X ,U ,t) T f(X ,U ,t) (5-18)
它称为哈密顿(Hamilton)函数,在最优控制中 起着重要的作用
于是J a 可写成
J aX ( tf)tf, tt 0 f H (X ,U ,,t) T X dt
的线性主部。
6、泛函的极值:若存在 0 ,对满足的 X X* 一切X,J(X)J(X*)具有同一符号,则

part II Chap 2 变分法及其在最优控制中的应用

part II Chap 2 变分法及其在最优控制中的应用

则最优解为: x1* ( t ) = 极值轨线: 极值控制:
1 3 7 2 t − t + t +1 2 4 3 2 7 * x2 (t ) = t − t + 1 2 2
7 u ( t ) = 3t − 2
*
14
极值轨线和极值控制曲线如图所示:
1 0
θ (t ) = x1* (t )
7 6
t
* θ (t ) = x2 (t )
~见书P529 表10-1 说明:以上Euler方程的形式与 无约束 有等式约束 的泛函极值问题中的Euler方程完全相同。
16
【例】求从平面上一点x(0)=1至直线 x(t f ) = c(t f ) = 2 − t f 取最短距离的轨线。
解:已知弧线元:ds = ( dt )2 + ( dx )2
1 1+ x
2
⋅2x =
x 1+ x
2
17
d 代入Euler方程,得: d t ⋅
x 1+ x
2
= 0

x
1 + x
2
= C
( C : const)
x = ±
c
(a,b均为const) 由初态x(0)=1 得: b=1。常数a则由横截条件确定 现: 自由(未知),末端受约束,方程为:x(t f ) = c(t f ) = 2 − t f tf 由横截条件:⎡ L ( x * , x * , t ) + ( c − x ) T ∂ L ⎤ = 0 ⎢ ∂x ⎥ t f ⎣ ⎦ ⎡ ⎤ x 得: 1 + x 2 + ( − 1 − x ) ⋅ =0
∂ δ J [ x, δ x ] = J [ x + εδ x ] ∂ε ε =0

变分法及其在最优控制中的应用

变分法及其在最优控制中的应用

2.欧拉方程的全导数形式
基础知识:设函数 z f (x, y, z)
则: dz f dx f dy f dz dt x dt y dt z dt
在<10>式中, d 为全导数
dt x(t)

z
d dt
x
g(x, x,t)
dz dt
d dt
x
x
x
dx dt
x
x
dx dt
t
x
dt dt
当 : x(t) t 2 x(t) 0.2t 时
x(t)
(1,1) (1,0.2) (1,0.1)
t
J 10.2t 3dt 1
0
20
J
1
0.4t
3dt
1
0
10
< 定理1 > 如果泛函J[ y(x)] 是可微的,则泛函的变分为:
J[ y(x)] J[ y(x) y(x)]
0
证明从略,见P 46页 证明进一步,多元函数的变分为: 即:
t0
tf
注: = + t f t f t0 t0
tf t0 t0
t f t f tf
— = — — t0 t0
t0
t0 t0
tf
tf
t0
对 函数 L 在[x, x,t] 处进行泰勒展开,则:
J t f L(x, x,t)dt t0
tf t0
(
L x
h
L x
h)dt
t f L(x, x,t)dt t0
x(t f )
xf t
<4> 端点变动的情况:(3.2.2)
1>自由端点,无约束条件的变分,如图:

最优控制第三章用变分法解最优控制问题

最优控制第三章用变分法解最优控制问题

H 2x
x
H 0 2u 0 2u
u
u x
x u x u u x x x 0
2023/12/27
x(t ) c1et c2et x(t) c1et c2et u
由边界条件和横截条件 x(0) x0
H (t f ) [ t ]t f
cc11
c2 x0 c2 0
约束条件 x(t0 ) x0 , M [x(t f ), t f ] 0
正则方程 x H
H x
控制方程 H 0 u
2023/12/27
边界条件和横截条件
终端固定
x(t0 ) x0 ,
M [x(t f )] 0 x(t f ) x f
tf
给定
终端自由 终端约束
终端固定
tf
自由
终端自由 终端约束
2 (t f
)
x2 (t f
)
M (
x2 (t f
)T )
v(t f
)
2 (2) x2 (2) 2 5v c2e2 c1
代入 x1 (2), x2 (2)
2023/12/27
14
解得
0.5c2 c3 c1 0.5c2
c4 c3
0 0
7c1 3e2c2 4e2c3 c4 15 x1 (2) 5x2 (2) 15
(t f
)
[ x
(M x
)T v] tt f
M [x(t f ), t f ] 0
H (t f
)
[
t
vT
M t
] tt f
9
例2 已知系统状态方程为 x u(t), x(0) 1
求最优控制 u* (t) 使性能指标 J 1e2t (x 2 u 2 )dt 为最小 0

现代控制理论-第7章-最 优 控 制

现代控制理论-第7章-最 优 控 制



代入式(7-11)则得:
* * * * F x , x , t F x , x ,t tf dJ d dt t0 d x dt x
(7-12)

* * F x , x ,t
§7.1 无约束条件的性能指标(泛函)
极值问题
(从最简单的情况开始) 设性能指标为积分型(拉格朗日问题)
t ,t J F x t ,x dt t0
tf
(7-1)
x t
t0
tf
xf
A
B
x* t
固定或自由
x t0 x t f
x0

t0
tf
t
航天飞机最小能量控制
⑷ 线性调节器问题:
J x t dt
tf i 1 t0 2 i
n
tf
t0
2 x i t dt i 1
n
特别要注意以下的指标形式:
tf
导弹滚动通道调节问题
1 T T J x t Qx t u t Ru t dt t0 2 1 T T F x t , u t , t x t Qx t u t Ru t 2
2
2
(7-20)
(3) 泛函 J x 在 x* t 处达到极小值的必要条件为:
J x* , x 0
其充分条件为:
(7-21)
2 J x* , x 0
(7-22)
仍然讨论固定边界的泛函极值,即设泛函为积分型(拉 格朗日问题): tf (7-23) J F x t , x t , t dt
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(7-3)
xt xt x* t t
xf
x0
x* t
t0
tf
tห้องสมุดไป่ตู้
这里,是一个小参变量,但不是时间函数。 t 是时间函数。
且满足
t0 t f 0
(7-4)
即在x* t 的邻区的所有x t 均应满足边界条件
x t0 x* t0 x0
(7-5)
x t f x* t f xf
tt0f
g
F
x*,x&*,t
x&
dt
F x*,x&*,t
x&
tf t0
tt0f
d dt
F
x*,x&*,t
dt
x&
代入式(7-11)则得:
dJ
d
tf t0
F
x*,x&*,t x
(7-10)
为此,我们采用复合求导的方法,将J x在 0处对 求

dJ
d
| 0
tf
F
g
x*,x&*,t
g
F
x*,x&*,t
dt
t0
x
x&
(7-11)
对于积分号内第二项的变换,利用分步积分的方法:
tt0f
u&vdt
uv
tf t0
tt0f
uv&dt
这样,积分号内第二项作分部积分后可得:
2.可动边界的极值
t0 ,t f 给定,x t0 固定或自由 x t f 自由
3.终端时刻自由的极值
t0 给定, x t0 固定, t f , x t f 自由
一、固定边界的极值问题 已知条件:
假定x t 为一维变量,在t t0,t f 区间上二次可
导,并设起始及终端时刻 t0、t f 均给定,且
⑴ 最短时间问题:
J t f t0
t f dt
t0
F xt ,ut ,t 1
拦截导弹最短时间控制
⑵ 最小燃料消耗问题:控制量u(t)与燃料消耗量成正比。
J tf u t dt t0
F xt ,u t ,t u t
导弹最小燃料控制
⑶ 最小能量控制问题:考虑与消耗功率成正比。
J tf u2 t dt t0
⑵ 终值型性能指标:
J x t f ,t f
卫星的指向控制
在变分法中称为迈耶尔问题。它只要求状态在过程终端 时满足一定要求,但在整个动态过程中对状态及控制的演变 不作要求。
⑶ 复合型性能指标:
J x
tf
,t f
tf t0
F
x t
,u t
,t dt
卫星的指向和 稳定控制
在变分法中称为波尔札问题。它要求状态在过程终端 时满足一定要求,而且状态向量及控制向量在整个动态过 程中都应满足一定要求。
• 最优控制问题的提法 • 性能指标的分类
xt0 x0
一、最优控制问题的提法
设动态系统的状态方程:
x&t f xt ,ut ,t
初始状态: 目标集:
xt0 x0
xtf S
控制域:
utU Rm
性能指标:
J x
tf
,t f
tf t0
F
x t
,u t
,t dt
xt0 x0
最优控制的问题就是:从所有可供选择的容许控制中寻找
一个最优控制 u* t ,使状态x t 由x t0 经过一定时间转移
到目标集 S ,并且沿此轨线转移时,使相应的性能指标达 到极值(极大或极小)。
二、性能指标的分类
能指标函数(又称价值函数、目标函数、性能泛函), 最优控制问题可归结为求性能指标的极值问题。按照实际 控制性能的要求大致可以分为:
(7-6)
并当 0 时,则
xt x* t
(7-7)
对x t 求导得

x&t x&* t t
(7-8)
将x t 及 x&* t 的表示式代入指标函数 J x式得
J x
tf t0
F
x*
t

t
,x&* t
g
t
,t
dt
(7-9)
根据性能指标极值的必要条件,应满足
dJ
d
0 0
t
xd
t
⑷、⑸两类性能指标统称为二次型性能指标,这是工程实践
中应用最广的一类性能指标。
性能指标还可以按其数学形式大致分为下列三类: ⑴ 积分型性能指标:
J
tf t0
F
xt ,ut ,t
dt
导弹稳定控制
在变分法中这类问题称为拉格朗日问题。它要求状态向 量及控制向量在整个动态过程中都应满足一定要求。
xT
t
Qx
t
uT
t
Ru
t
⑸ 状态跟踪器问题:如果在过程中要求状态x(t)跟踪目
标轨线 xd t 。
弹道导弹的弹 道跟踪控制
J 1 tf 2 t0
xt xd t T Q xt xd t uT t Ru t
dt
F
x
t
,u
t
,t
1 2
xt uT t
xd t T Rut
Q
x
本篇主要内容
• 变分法解最优控制 • 极小值原理 • 动态规划法 • 二次型性能指标的最优控制
第七章 变分法在最优控制中的应用
主要内容: • 无约束条件的性能指标(泛函)极值问题 • 有约束条件的性能指标(泛函)极值问题 • 变分法法解最优控制问题
§7.1 无约束条件的性能指标(泛函) 极值问题
F xt ,u t ,t u2 t
航天飞机最小能量控制
⑷ 线性调节器问题:
n
J
i1
x t f 2
t0 i
t dt
x t f n 2
t0 i1 i
t dt
特别要注意以下的指标形式:
导弹滚动通道调节问题
J
tf t0
1 2
xT
t Qxt
uT
t Rut dt
F
x
t
,u
t
,t
1 2
(从最简单的情况开始) 设性能指标为积分型(拉格朗日问题)
J
tf t0
F
x t
,x&t
,t dt
(7-1)
t0
tf
固定或自由
xt0 xt f
固定或自由
xt
xf
A
x0
B
x* t
t0
tf
t
7.1 无约束条件的泛函极值问题
在无约束条件下,按边界条件,极值问题一般分为: 1.固定边界的极值
t0 ,t f 给定,且xt0 x0,x t f x f固定
xt0 x0,x t f xf
(7-2)
要求确定使J x 达极小的 xt 轨线 。
现在我们讨论两种解法:复合求导法和变分法
1.复合求导法
设x* t 为满足以上边界条件并 使J x达到极小的最优状态轨线,
如图所示。
则其邻区的状态轨迹x t 可用
下式表示:
xt x* t t
第二篇 最 优 控 制
线性系统对控制系统的设计方法:极点配置 在实际工程应用中不仅仅是极点配置,常常考虑到性 能指标最优的问题。
倒立摆控制 点击观看
导弹轨迹控制 点击观看
航天器控制 点击观看
最优控制研究的问题是:对一个控制系统,在给定 的性能指标要求下,如何选择控制规律,使性能指标达 到最优(极值)。
相关文档
最新文档