最优控制第六章习题答案

合集下载

最优控制胡寿松版部分习题答案

最优控制胡寿松版部分习题答案

2-5 求通过(0)1x =,(1)2x =,使下列性能泛函为极值的极值曲线*()x t :2(1)ft t J x dt =+⎰解:由题可知,始端和终端均固定被积函数21L x =+,0L x ∂=∂,2L x x ∂=∂, 2d L x dt x∂⋅=∂ 代入欧拉方程0L d L x dt x∂∂-⋅=∂∂,可得20x =,即0x = 故1x c = 其通解为:12x c t c =+代入边界条件(0)1x =,(1)2x =,求出11c =,21c = 极值曲线为*()1x t t =+2-6 已知状态的初值和终值为(1)4x =,()4f x t =式中f t 自由且f t >1,试求使下列性能泛函达到极小值的极值轨线*()x t :211[2()()]2ft J x t x t dt =+⎰ 解:由题可知,2122L x x =+,()4f t ψ=,()14x =,()4f x t = 欧拉方程:L 0d L x dt x∂∂-=∂∂ 横截条件:()00t x =x ,()()f f x t t ψ=,()0fTt L L x x ψ∂⎛⎫+-= ⎪∂⎝⎭易得到2dxdt= 故12x t c =+ 其通解为:()212x t t c t c =++根据横截条件可得:()()()122121114424f f f f f x c c x t t c t c x t t c ⎧=++=⎪⎪=++=⎨⎪=+=⎪⎩解以上方程组得:12569f t c c =⎧⎪=-⎨⎪=⎩将f t ,1c ,2c 代入J 可得5*201500502150233J x x dt =+=-=⎰ 极值轨线为()*269x t t t =-+2-7 设性能泛函为120(1)J x dt =+⎰求在边界条件(0)0x =,(1)x 自由情况下,使性能泛函取极值的极值轨线*()x t 。

解:由题可知,21L x =+,()00x =,()1x 自由欧拉方程:L 0d L x dt x∂∂-=∂∂ 横截条件:()00t x =x ,L 0ft x∂=∂,0fTt L L x x ∂⎛⎫+= ⎪∂⎝⎭易得到()x t a =其通解为:()x t at b =+代入边界条件()f x t a =,()00x =,1f t =,求出0a =,0b = 将f t ,a ,b 代入J 可得()1*211J x dt =+=⎰极值轨线为()*0x t = 2-9 求使泛函22211220(2)J x x x x dt π=++⎰为极值并满足边界条件1(0)0x =,2(0)0x =1()12x π=,2()12x π=- 的极值轨线*1()x t 和*2()x t 。

最优控制6-1

最优控制6-1

(6-6) (6-7)
其工作特点是:最大限度地提高该阶段的收益,不考 虑回收问题。
17
若阶段数N=2,则第二阶段的工作方式与N=1时相同,即 不需考虑回收。 为使两个阶段的总收益最大,对第二阶段来说,不论在 第一阶段资源如何分配,即 y0 如何选取,要求其回收 量 ay0 b(x0 y0 ) 在第二阶段发挥最大效用 也就是说,第二阶段的最大收益应是:
解 由(6-3)式可以看出,这是一个求N元函数极值点的问 题。
1)若整体最大值位于(6-4)式限定的区域内部,即所有 yi 满足不等式 0 yi xi ,且g和h存在导数,则所有可通 过解下列方程组求出:
g( yN1) g( yN1) h(xN1 yN1)
13
希望通过合理选择使N个阶段的总收益最大,即:
max RN (x0 , y0 , y1,, yN1)
( y0 , y1,, yN 1 )
max g( y0 ) h(x0 y0 ) g( y1) ( y0 , y1,, yN 1 ) h(x1 y1) g( yN1) h(xN1 yN1)
6-1 所示。
5
站与站各地间凡有连线者,表示相应两地可铺设管 道,线间数字表示两地距离;凡无连线者,表示相应两 地不能铺设管道。现需选择一条由A0 到A6 的铺管线路, 使其总距离最短。
6
解 这一问题可用两种方法求解。 第一种:穷举法 即列出所有可能的组合方案,计算每 一方案的起迄距离,从中选出其总距离最短者,即得最 短铺管线路。
(6-1)
现设以y0与x0-y0投入生产A与B后,可以部分回收,其回 收率分别是 0 a 1 与 0 b 1 ,则经第一阶段生产 后回收的资源总共是:

第六章 最优控制2012

第六章 最优控制2012

,使J 为极小。
一、性能指标及分类 性能指标函数(又称目标函数、性能泛函),最优控制
问题可归结为求性能指标的极值问题。按照实际控制性能 常见:
⑴ 最短时间问题:
拦截导弹最短时间控制
⑵ 最小消耗问题:控制量u(t)与燃料消耗量成正比
导弹最小燃料控制
(3) 线性调节器问题:考虑在平衡位置 x=0附近的状态调节
导弹稳定控制
在变分法中这类问题称为拉格朗日问题。它要求状态向 量及控制向量在整个动态过程中都满足性能要求。
⑵ 终值型性能指标:
卫星的指向控制
在变分法中称为迈耶尔问题。只要求状态在过程终端时 满足一定要求,而对状态及控制量在整个动态过程中的演变 不作要求。
⑶ 复合型性能指标:
卫星的指向和 稳定控制
的变分是指两个函数间的差
问题:何为两个函数的差?两个函数距离接近?
K阶近似度
定义:设 是线性赋范空间 上的连续泛函,其增量可表示为
其中,
是关于 的线性连续泛函,
是关于 的高
阶无穷小。则
称为泛函 的变分。
泛函的变分等于
3、泛函变分的规则 1) 2) 3) 4)
变分的导数等于导数的变分
4、泛函的极值
寻求在
上的最优控制

,以将系统状
态从
转移到 x(t f ) 或 x(t f ) 的一个集合,并使性能指标
最优。其中
是 x 、u 和t 的连续函数
最优控制问题就是求解一类带有约束条件的条件泛函极值问 题。
泛函与变分法
一、泛函与变分
1、泛函的基本定义: 对于某个函数集合 中的每一个函数 ,变量J 都有一个
在变分法中称为波尔札问题。它要求状态在过程终端 时满足一定要求,而且状态向量及控制向量在整个动态过 程中都应满足一定要求。

(完整word版)最优控制第六章习题答案

(完整word版)最优控制第六章习题答案

1. 有十个城市①为起点,⑩为终点。

站与站之间称为段,每段路程所用的时间(小时)写在段上,则应如何行使,让从①到⑩所花的时间最短.解:⑴ 4N =11(8)3,(9)4J J ==将距离数字标注于图中,数字旁括号内的文字表示相应的决策变量。

由于从8到10及从9到10都只有一种可能,所以本级无决策问题.⑵3N =本级决策有三种选择。

每种选择中又有两条可能的路线.例如,从5出发,可达8,也可达9,所以131(5,8)(8)13(2)min min 4(5,9)(9)44d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明5到10的最短距离为4,路线为5—8-10决策变量为2(5)8S = 同理,从6出发时,有121(6,8)(8)63(6)min min 7(6,9)(9)34d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明6到10的最短距离为7,路线为6-9—10决策变量为2(6)9S = 从7出发时,有121(7,8)(8)33(7)min min 6(7,9)(9)34d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明7到10的最短距离为6,路线为7-8—10决策变量为2(7)8S = ⑶2N =本级有三种选择,计算过程如下:2322(2,5)(5)74(2)min (2,6)(6)min 471166(2,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(2)5(6)S =2322(3,5)(5)34(3)min (3,6)(6)min 27746(3,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(3)5S =2322(4,5)(5)44(4)min (4,6)(6)min 17856(4,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(4)5(6)S =⑷1N =本级决策是唯一的,计算结果为2422(1,2)(2)211(1)min (1,3)(3)min 471138(1,4)(4)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量4(1)3(4)S =可确定最短路线为1-3-5-8—102.一维线性系统,设变量无约束,最优控制问题的数学模型为:22210(),k k k k k J qx ru T x ax bu +=+=+∑初始状态0x 为已知.式中,,,a b q r 为常数,0,=1r T >设。

现代控制理论 6 最优控制

现代控制理论 6 最优控制

(11)
对(11)式中的第三项进行分部积分,得
T J [ x ( t )] H ( x , u , λ , t ) d t λ ( t ) x λ ( t ) x d t f t T t f t 0
0

t f
t f
t 0
(12)
当泛函J 取极值时,其一次变分等于零。 即

T
将上式改写成
T T t H H f δ J λ ( t ) δ x ( t ) λ δ x δ u d t 0 f f t x ( t ) x u 0 f (13)
0
tf
( x ,x , t ) 及 x ( t ) 在 [ t 0 , t f ] 上连续可微, t 0 和 t f 给定, 其中, L
(t0) x x (tf ) xf ,x(t)Rn ,则极值轨线 x * ( t ) 满足如下欧 已知 x 0, 拉方程
L d L 0 x dt x
J [ x ( t t ( x , u , t ) d t f), f] L
t f t 0
(x ,u ,t) 是 x 、u 和t 的连续函数 最优。其中 L
最优控制问题就是求解一类带有约束条件的条件泛函极值问题。
补充:泛函与变分法
一、泛函与变分
1、泛函的基本定义: 如果对于某个函数集合 x(t)中的每一个函数 x (t ),变量J 都有一个 值与之对应,则称变量J 为依赖于函数 x (t ) 的泛函,记作 Jx ( t) 可见,泛函为标量,可以理解为“函数的函数” 例如:
由于 δ u 是任意的变分,根据变分法中的辅助引理,由(16)式得 (17) (14)式称为伴随方程, λ (t )为伴随变量,(17)式为控制方程。

第6章 最优控制

第6章 最优控制
解出 的表达式。
F * d F * 0 X dt X F * d F * 0 u dt u
解出 u 的表达式。
例题: 约束条件为: 初始条件为:
1 2 2 J Q (t )dt 2 0
Q(t ) u(t )
Q(0) 1 Q(0) 1 Q(2) 0,Q(2) 0 , ,
第六章 最优控制
——泛函及变分法 ——最小值原理
6.1 最优控制问题及其描述
6.1.1 最优控制问题的例子
飞船软着陆问题
宇宙飞船在月球表面上着陆时垂直速度必须为零,即软着陆。 这个问题必须靠控制发动机推力的变化来实现。问题是如何选择 一个推力方案,使燃料消耗最小。
设飞船的总质量为 m ,高度为 的重力加速度为 g ,推力为 u 。
取:x1(t ) Q(t ),x2 (t ) Q(t )
有:
x1 (t ) x2 (t ) x2 (t ) u (t )
x1 (t ) x2 (t ) 0 x2 (t ) u (t ) 0
x1 (t ) x2 (t ) f x2 (t ) u (t )
轨线1
x(t f )
t
此时终端不仅状态可变、终端的时间也是可变的。
F 0 F ( x) x t T
例题:求 x(0)=1 到直线 x(t)=2-t 的距离最短的直线:
解:目标函数为:
积分上限是可变的
x (t )
J
T
0
(1 x ) dt
T
F d F 0 x dt x
这是一个微分方程,其解中含有待定系数,通过给出的边界条件
x(t0 ) x0 , x(T ) x1

最优控制课后习题答案

最优控制课后习题答案

最优控制课后习题答案最优控制课后习题答案最优控制是现代控制理论中的重要分支,它研究如何在给定约束条件下,使系统的性能指标达到最优。

在最优控制的学习过程中,课后习题是巩固理论知识、培养解决问题能力的重要环节。

本文将为大家提供一些最优控制课后习题的答案,希望能对大家的学习有所帮助。

1. 线性二次型最优控制问题考虑一个线性时不变系统,其状态方程和性能指标分别为:$$\begin{align*}\dot{x}(t) &= Ax(t) + Bu(t) \\J(u) &= \int_{0}^{T} (x^T(t)Qx(t) + u^T(t)Ru(t))dt\end{align*}$$其中,$x(t)$为系统的状态向量,$u(t)$为控制输入向量,$A$和$B$为系统矩阵,$Q$和$R$为正定矩阵,$T$为最优控制的时间段。

求解该问题的最优控制输入$u^*(t)$。

答案:根据最优控制的原理,最优控制输入$u^*(t)$满足以下的最优性条件:$$\begin{align*}\frac{\partial J}{\partial u}(u^*(t)) &= 2R u^*(t) + 2B^T P(t)x(t) = 0 \\\dot{P}(t) &= -PA - A^T P - Q + PBR^{-1}B^T P\end{align*}$$其中,$P(t)$为状态向量的共轭变量矩阵。

通过求解上述的代数方程和微分方程,可以得到最优控制输入$u^*(t)$和状态向量的共轭变量矩阵$P(t)$。

2. 非线性最优控制问题考虑一个非线性系统,其状态方程和性能指标分别为:$$\begin{align*}\dot{x}(t) &= f(x(t), u(t)) \\J(u) &= \int_{0}^{T} g(x(t), u(t)) dt\end{align*}$$其中,$f(x(t), u(t))$为非线性函数,$g(x(t), u(t))$为性能指标函数。

最优控制习题答案

最优控制习题答案

最优控制习题答案1.设系统方程及初始条件为⎩⎨⎧=+-=)()()(2)()(1211t x t x t u t x t x,⎩⎨⎧==0)0(1)(21x t x 。

约束5.1)(≤t u 。

若系统终态)(f t x 自由,利用连续系统极大值原理求)(*t u 性能指标,)3(2x J =取最小值。

解:2.设一阶离散时间系统为)()()1(k u k x k x +=+,初值2)0(=x ,性能指标为∑=+=2022)(21)2(k k u x J ,试用离散系统最小值原理求解最优控制序列:)2(),1(),0(u u u ,使J 取极小值。

解:3.软着落、空对空导弹的拦截问题、防空拦截问题。

解答:4.设离散系统状态方程为)(2.00)(101.01)1(k u k x k x ⎥⎦⎤⎢⎣⎡+⎥⎦⎤⎢⎣⎡=+,已知边界条件⎥⎦⎤⎢⎣⎡=01)0(x ,⎥⎦⎤⎢⎣⎡=00)1(x 。

试用离散系统最小值原理求最优控制序列,使性能指标∑==102)(03.0k k u J 取极小值,并求出最优的曲线序列。

解:属于控制无约束,N 不变,终端固定的离散最优控制问题,构造离散哈密尔顿函数)](2.0)()[1()](1.0)()[1()(03.0)(222112k u k x k k x k x k k u k H ++++++=λλ其中)1(),1(21++k k λλ为给定拉个朗日乘子序列,由伴随方程:)1()()(111+=∂∂=k k x H k λλ,)1()1(1.0)()(2122+++=∂∂=k k k x Hk λλλ得出 ⎩⎨⎧+==+==)2()2(1.0)1(),2()1()1()1(1.0)0(),1()0(2121121211λλλλλλλλλλ,由极值条件⎪⎪⎩⎪⎪⎨⎧>=∂∂=++=∂∂006.0)(0)1(2.0)(06.0)(222k u H k k u k u Hλ极小)1(310)(2+-=k k u λ可使min )(=k H ,令k=0和k=1的⎪⎩⎪⎨⎧-=-=)2(310)1(*)1(310)0(*22λλu u ,)(k u 带入状态方程并令k=0和1得到: 5.求泛函dtx x x x J ⎰++=102221211],[ 满足边界条件π===-=)3(,0)0(,0)3(,3)0(2211x x x x 和约束条件36221=+t x 的极值曲线。

最优控制习题及参考答案

最优控制习题及参考答案

最优控制习题及参考答案6212最优控制习题及参考答案习题 1求通过 x (0) = 1 , x (1) = 2 ,使下列性能指标为极值的曲线:t f J = ∫(x2 +1)dt t 0解: 由已知条件知: t 0=0 , t f= 1d由欧拉方程得:(2x ) = 0dtx = C 1x = C 1t + C 2将 x (0) = 1,x (1) = 2 代入,有:C 2 = 1,C 1 = 1得极值轨线: x *(t ) = t +1习题 2求性能指标:J = ∫ 1(x 2 +1)dt在边界条件 x (0) = 0 , x (1) 是自由情况下的极值曲线。

解: 由上题得:x * (t ) = C t + Cx * (t )63x f由 x (0) = 0 得: C 2= 0∂L由 ∂xt =tf= 2x (t f ) = 2C 1 t =t = 0t0 1于是: x *(t ) = 0【分析讨论】对于任意的 x (0) = x,x (1)自由。

6421∫ ⎩λ =有: C = x , C = 0 ,即: x *(t ) = x其几何意义: x (1) 自由意味着终点在虚线上任意点。

习题 3已知系统的状态方程为:x 1 (t ) = x 2 (t ), x 2 (t ) = u (t )边界条件为: x 1(0) = x 2(0) = 1 , x 1(3)= x 2(3) = 0 ,31 试求使性能指标 J =u 2(t )dt 2取极小值的最优控制 u *(t ) 以及最优轨线 x *(t ) 。

⎡ x ⎤解: 由已知条件知: f = ⎢ 2⎥⎢⎣ u ⎥⎦Hamiton 函数: H = L + λTfH = 1u 2+ λ x + λ u⎧λ = 0由协态方程: ⎨12121 2 2⎧λ = C① 得: ⎨1 1⎩λ2 = −C 1t + C2 ② ∂H由控制方程:∂u= u + λ2 = 0 得: u = −λ2= C 1t − C 2③由状态方程:x2 = u = C1t −C2得:x (t) = 1 C t2 −C t + C ④2 2由状态方程:x1 = x21 2 3得:x (t) = 1 C t3 −1 C t 2 + C t + C ⑤1 6 12 23 465661⎪⎩=− ∫⎡1⎤ ⎡0⎤将x (0) = ⎢ ⎢,x (3) = ⎢0⎢代入④,⑤, ⎣1⎦⎣ ⎦ 10联立解得: C 1 =由③、④、⑤式得:u * (t ) = 10t − 29,C 2 = 2 , C3=C 4 =1 9x * (t ) = 5 t 3 −t 2+ t +1 27 x *(t ) = 5 t 2 − 2t +1 29习题 4已知系统状态方程及初始条件为x =u , x (0) = 1试确定最优控制使下列性能指标取极小值。

第6章 最优控制

第6章 最优控制

v h u g v M Ku M
从初始状态
h(0) h0 ,
厦门大学机电系
v(0) v0 ,
m(0) M F
4
现代控制理论
在时刻 T 实现软着陆,即终点条件为
h(T ) 0,
选择推力u(t) ,使
v(T ) 0
J M (T )
现代控制理论
总运费 f (x)为目标函数,最优任务为确定x使 f (x)最小。 但是x的取值范围:
x1 x2 x3 1500 x1 x4 900 x2 x5 600 x3 x6 1200
x4 x5 x6 1800
变成了一个具有约束的优化问题。 目标函数用J来表示: 约束的条件为:
现代控制理论
第七章 线性二次型最优控制
1 2 3
概述
静态最优问题的解 泛函及其极值
厦门大学机电系
现代控制理论 第六章 最优控制
着重介绍最优控制系统的基本概念、基本理论及其应用。 要点: 1 最优控制的概念 2 变分法 3 极小值原理 4 动态规划 5 线性最优控制器的设计 难点: 线性最优控制器的设计
式中x为n维状态向量;u为r维输入向量;y为m维输出向量 f(x,u,t) 和 g(x,u,t) 分别为 n 维和 m 维关于状态向量 x、输入向量 u 和时间t的非线性函数向量。
7
厦门大学机电系
现代控制理论
被控系统的数学模型
对许多实际被控系统,在一定精度范围内, 其最优控制问题中的数 学模型也可以分别采用 – 线性定常系统 – 线性时变系统 – 非线性定常系统 的状态空间表达式来描述。
22
厦门大学机电系
现代控制理论

自动控制原理第6章 习题及解析

自动控制原理第6章 习题及解析

第6章 习题及参考解答6-9 已知单位负反馈控制系统校正前对数幅频特性)(0ωL 如图6-63中点画线所示,串联校正装置对数幅频特)(c ωL 如图6-63中实线所示,要求1)作出校正后系统开环对数幅频渐进特性)(ωL 。

2)比较校正前、后的开环对数幅频特性)(0ωL 和)(ωL ,说明校正装置的作用。

习题 6-9 参考解答:1)校正后系统开环对数幅频渐进特性)(ωL 是)(0ωL 和)(c ωL 的线性叠加,如图右上图中红色实线所示。

2)校正装置的传递函数为2(1)()101c s G s s +=+,为滞后校正装置。

它的作用:①抬高了低频段幅值,可提高速度输入的稳态精度;②固有特性以-40dB/dec 穿越0dB 线,校正后的Bode 图以-20dB/dec 穿越0dB 线,中频段变缓,平稳性变好;校正后系统Bode 图的高频段幅值降低了,抗干扰能力提高;校正后系统的开环截止频率减小了,滞后校正是靠牺牲系统的快速性来换取平稳性的。

6-10 图6-64为三种校正装置的对数渐近幅频特性,它们都是由最小相位环节组成。

系统为单位负反馈 系统,其开环传递函数为02400()(0.011)G s s s =+试问: 1)这些校正网络特性中,哪一种使已校正系统的稳定性最好?2)为了将12Hz 的正弦噪声削弱10倍左右,你确定采用哪种校正网络特性?习题 6-10 参考解答: 校正装置传递函数分别是12310.110.510.51(),(),().1010.0111010.0251c c c s s s s G s G s G s s s s s ++++===++++。

1)a )使用滞后校正网络,校正后021400()(0.011)1().101c G G s s s s s s =+++10()()1c G j G j ωω==L (图6-63 题6-9图图6-64 题6-10图102400()()1110180arctan 6.32180arctan 0.01 6.32arctan16.3211.7063.2cc c co oo c G j G j ωωωωωγω⨯=⇒⨯⨯≈=-=+--⨯-⨯=b )使用超前校正网络,校正后022400()(0.011)0.11().0.011c G G s s s s s s =+++10()()1c G j G j ωω==1024000.1()()11180arctan 0.140180arctan 0.0140arctan 04032.4.0140c occ c o o G j G j ωγωωωω⨯=⇒⨯=+⨯---⨯==⨯≈c )使用滞后-超前校正网络,校正后0223400()(0.011)(0.51)().(101)(0.0251)c G G s s s s s s s =++++2230224000.5()()11011180(arctan 0.510)180arctan 1041010arctan 0.02510arctan 0.01108.2cc c c o o c oG j G j ωγωωωωω⨯=⇒⨯⨯⨯=+⨯--⨯-⨯-⨯=≈=由上述结果可知,在这些校正网络特性中,滞后-超前校正网络,其相角裕量γ=48o 最大,所以滞后-超前网络使已校正系统的稳定性最好。

第6章 最优控制

第6章 最优控制

6.12.4 输出调节器问题 1.输出调节器的任务是当系统受到外扰时,在不消耗过多能量的前提下, 维持系统的输出矢量接近其平衡状态。 1.线性时变系统输出调节器问题 给定一个能观的线性时变系统:
性能泛函为:
于是可以用状态调节器上式来确定最优控制:
式中,
为下列黎卡提距阵微分方程的解:
边界条件:
2. 线性定常系统输出调节器问题 给定一个完全能控、能观的线性定常系统:
式中, 成,即
为正定(或半正定)对称阵; 是由输出变量
为正定对称阵。 的线性负反馈所构
如上所述,设控制变量
闭环系统结构图示如下图所示:
从图可得闭环系统的状态方程: (1)
式中,
为闭环系统的状态矩阵。
此时,性能指标演化为:
(2) 式中 在规定了系统结构的情况下,设计任务就是确定输出反馈矩阵K,使性 能指标式(2)取极值。 对渐近稳定系统式(1),构造一个李雅普诺夫函数:
状态轨线及开关曲线 最优控制律 转移到终态(0,0)。
为了使系统的状态能以最小时间从初态
当初态所划位置不同时,应当采取的控制规律不同。但是,凡不在开关曲线 上的点,至少要经过一次切换,转到开关曲线后才能沿着 γ+或γ-到达原点(0, 0)。因此,按照初态 所处的位置可得到下列最优控制规律:
若将开关曲线写成:
(3) 将上式两边求导数,得:
对于渐近稳定的系统,当 为此,令: 式中Q 为正定的实对称阵。 因此 是负定的。比较式(5)和式(3)可得:
必须为负定。 (4)
(5)
(6)
将式(6)代入式(2),得性能指标:
由于A 所有特征值均具负实部,故有
,从而下式成立: (7)
此外,反馈矩阵K 亦不能从李雅普诺夫方程: (8)

最优控制第六章极小值原理

最优控制第六章极小值原理

以 w u,w * u*代入上式,便得
H x*, *,u,t H x*, *,u*,t
(35)
上式表明,如果哈密尔顿函数H看成 utU 的
函数,那么最优轨迹上与最优控制u*(t)相对应的
H将取绝对极小值(即最小值)。这是极小值原理的
一个重要结论。
定理 设系统状态方程为
xt0 x0
Nxt f ,t f 0
(48)
这就是著名的极小值原理。
下面对定理作些说明: 1) 定理的第一、第二个条件,即式(41)~式
(44),普遍适用于求解各种类型的最优控制问题, 且与边界条件形式或终端时刻自由与否无关。其
中,第二个条件:min H x*, *,u,t H x*, *,u*,t uU
(45)
u u
3) H函数在最优轨迹终点处的值决定于
H

Φ
T
N

0
(46)
t f
t f tt f
4) 协态终值满足横截条件
t f
Φ


x
t
f
N T
x t f


tt f
(47)
5) 满足边界条件
J1

Ψ

x T
Ψ x

Φ t f

N T t f


tt f
t f
d xT
tf
Φ

x

N T x


Ψ x
t t
f
wT
Ψ w tt f
zT
Ψ z
tt f

最优控制 第6章 最优控制的计算方法

最优控制 第6章 最优控制的计算方法
则(6-7)变为
δJ = φ[ X (t f ) + δX (t f ), t f ] − φ[ X (t f ), t f ] + ∫ {H [ X + δX , U + δU , X , t ]
t0
tf
− H [ X , U , λ , t ] − λ [ f ( X + δX , U + δU , t ) − f ( X , U , t )]}dt
δJ = J [U + δU ] − J [U ] = φ[ X (t f ) + δX (t f ), t f ] − φ[ X (t f ), t f ]
+ ∫ F [ X + δX , U + δU , t ] − F [ X , U , t ]dt
t0 tf
(6-7)
哈密顿函数为:
H [ X , λ , U , t ] = F [ X , U , t ] + λT f [ X , U , t ]
§6.1 直接法
一、梯度法
给定系统的状态方程:
& = f [ X (t ), U (t ), t ] X
初始条件:
(6-1) (6-2)
X (t 0 ) = t0
以及性能泛函: J [U (t )] = φ[ X (t f ), t f ] + 终端时刻 t f 给定, X (t f ) 自由。

tf
t f ∂H ∂φ T t ] δX (t f ) − [λT (t )δX ]t0f + ∫ [ ] δUdt t0 ∂U ∂X (t f ) T
(6-11)
考虑边界条件 则(6-11)变为

06.最优控制

06.最优控制
由于Q1,Q2均为正定矩阵,满足极小值的充分条件。
6.4 泛函及其极值――变分法 1.什么是泛函?
➢ 泛函就是函数的函数
➢ 函数:对于x定义域中的每一个x值,y又有一个 (或者一组)确定的值与之对应,则称y是x的函数, 记做y(x)。
其中,Q1,Q2均为正定矩阵,F为任意矩阵。
解:构造拉格朗日函数:
H f ( x, u) λT g( x, u)
1 2
xTQ1x
1 2
uTQ2u
λT x
Fu
d
则目标函数存在最优解的条件是:
H x
Q1x
λ
0
H u
Q2 x F T λ 0
H x Fu d 0 λ
解得极值点为: u* (Q2 F TQ1F )1F TQ1d x* [I F (Q2 F TQ1F )1F TQ1]d λ* [Q1 Q1F (Q2 F TQ1F )1F TQ1]d
不等式约束条件 hj ( x) 0 j 1,2, ,l
最优化问题的数学描述
动态最优化问题
目标函数
min J (x) tf L[x(t),u(t),t]dt t0
约束条件--受控对象的状态方程 x(t) f [x(t),u(t),t]
6.2 最优控制的前提条件
1.状态方程 x(t) f [x(t),u(t),t]
第六章 最优控制
2020年4月26日
本章内容
➢ 6.1 概述 ➢ 6.2 研究最优控制的前提条件 ➢ 6.3 静态最优化问题的解 ➢ 6.4 泛函及其极值――变分法 ➢ 6.5 用变分法求解连续系统的最优控制问题 ➢ 6.6 极小值原理 ➢ 6.7 线性二次型最优控制问题
6.1 概述
1元 工地A 900包

最优控制习题及参考答案

最优控制习题及参考答案

12f最优控制习题及参考答案习题 1 求通过 x (0) = 1 , x (1) = 2 ,使下列性能指标为极值的曲线:t f J = ∫(x2 +1)dt t 0解: 由已知条件知: t 0 = 0 , t f = 1d由欧拉方程得: (2x ) = 0dtx = C 1x = C 1t + C 2将 x (0) = 1,x (1) = 2 代入,有:C 2 = 1,C 1 = 1得极值轨线: x * (t ) = t +1习题 2 求性能指标: J = ∫ 1(x 2 +1)dt在边界条件 x (0) = 0 , x (1) 是自由情况下的极值曲线。

解:由上题得: x *(t ) = C t + C由 x (0) = 0 得: C 2 = 0∂L由∂xt =t f= 2x (t f ) = 2C 1 t =t = 0 t于是: x * (t ) = 0【分析讨论】对于任意的 x (0) = x 0 ,x (1) 自由。

2 0 1 0∫ ⎩ λ= −λ 有: C = x , C = 0 ,即: x *(t ) = x其几何意义: x (1) 自由意味着终点在虚线上任意点。

习题 3 已知系统的状态方程为: x1 (t ) = x2 (t ) , x 2 (t ) = u (t )边界条件为: x 1 (0) = x 2 (0) = 1 , x 1 (3) = x 2 (3) = 0 ,31 试求使性能指标 J = 0 u 2(t )dt2取极小值的最优控制 u * (t ) 以及最优轨线 x * (t ) 。

⎡ x ⎤ 解:由已知条件知: f = ⎢ 2 ⎥⎢⎣ u ⎥⎦Hamiton 函数: H = L + λT fH = 1u 2 + λ x + λ u⎧λ = 0由协态方程: ⎨12 121 22⎧λ = C① 得: ⎨11⎩λ2 = −C 1t + C 2 ②∂H由控制方程: ∂u= u + λ2 = 0得: u = −λ2 = C 1t − C 2③由状态方程: x 2 = u = C 1t − C 2得: x (t ) = 1C t 2− C t + C④22由状态方程: x 1 = x 21 23得: x (t ) = 1C t 3 − 1C t 2 + C t + C⑤16122 341 ⎪ ⎩=− =− ∫ ⎡1⎤⎡0⎤将 x (0) = ⎢ ⎥ , x (3) = ⎢0⎥ 代入④,⑤, ⎣1⎦⎣ ⎦ 10联立解得: C 1 =由③、④、⑤式得:u * (t ) = 10t − 29 , C 2 = 2 , C 3 = C 4 = 1 9x * (t ) = 5 t 3 −t 2 + t +127 x *(t ) = 5 t 2 − 2t +1 2 9习题 4 已知系统状态方程及初始条件为x =u , x (0) = 1试确定最优控制使下列性能指标取极小值。

第六章 控制(习题答案)

第六章  控制(习题答案)

【思考与练习】一、单项选择题1.“亡羊补牢,犹未为晚”,可以理解成是一种(C)。

A.前馈控制 B.同步控制 C.反馈控制 D.直接控制2.控制工作得以展开的前提是(A)。

A.确定控制标准 B.分析偏差原因 C.采取矫正措施 D.明确问题性质3.“治病不如防病,防病不如讲卫生”说明(A)最重重。

A.前馈控制 B.同步控制 C.反馈控制 D.直接控制4.预算是一种(B)。

A.控制 B.计划 C.领导 D.组织5.控制工作的关键步骤是(C)。

A.拟定标准 B.衡量绩效 C.纠正偏差 D.管理突破6.确定控制对象和选择控制重点的工作是属于控制过程中(C)环节的工作。

A.衡量成效 B.纠正偏差 C.确立标准 D.找出偏差7.同步控制工作的重点是(B )。

A.把注意力集中在历史结果 B.正在进行的计划实施过程C.在计划执行过程的输入环节上 D.控制行动的结果8.按控制组织结构的不同,可把控制方法分为(A)。

A.集中控制、分散控制、分级控制B.战略控制、任务控制、结果控制C.前馈控制、同步控制、反馈控制D.内在控制、外在控制、结果控制9.预算是一种典型的(A)。

A.前馈控制 B.同步控制 C.反馈控制 D.预防性控制10.种庄稼需要水,但这一地区近年老不下雨,怎么办?一种办法是灌溉,以补天不下雨的不足,另一办法是改种耐旱作物,使所种作物与环境相适应。

这两种措施分别( C )。

A.纠正偏差和调整计划 B.调整计划和纠正偏差C.反馈控制和前馈控制 D.前馈控制和反馈控制二、多项选择题1.控制的特点包括(ABCD)。

A.目的性 B.整体性 C.动态性 D.人为性 E.实用性2.管理控制的必要性是由(ADE)因素决定的。

A.环境的变化 B.经济的发展 C.社会的需要D.管理权力的分散 E.工作能力的差异3.控制的基本过程包括(BCE)。

A.制订计划 B.确定标准 C.衡量成效D.诊断原因 E.纠正偏差4.一般来说,预算内容要涉及以下几个方面:(ABCDE)。

最优控制LQ

最优控制LQ
u* (t ) K (t ) x(t ) Q2 1 (t ) BT (t ) P(t ) x(t )
系统的结构图
6.4 线性二次型最优控制问题
P296
6.4 线性二次型最优控制问题
例题 6-20
x ax u, x(0) x0
tf
1 1 2 J q0 x (t f ) [ q1 x 2 q2u 2 ]dt 2 2 t0
u(t ) R
m
最优控制问题, 就是从可供选择的容许控制集合U中,寻找 一个控制u(t), 使受控系统在[t0,tf]内,从初始状态x(t0), 转移到终端状态x(tf)或目标集时,性能指标J取最小(大)值.
u * (t )
x * (t )
最优控制 最优轨线 最优性能指标
J
*
6.3 最优控制求解
第六章 最优控制
1 最优控制概述
2 最优控制问题
3 最优控制求解
4 LQ问题及求解
6.1 最优控制概念
快速升降问题
有一物体作垂直升降运动。假定在M内装有一 个控制器,它可以产生一个作用力 u(t),可 控制物体M的上下运动;
u M g
u(t ) u0
x(t0 ) h
x(t0 ) v0
u(t ) x(t f ) 0, x(t f ) 0
使tf最小.
6.1 最优控制概念
u与x的关系:状态方程
M(t ) u (t ) g , x1 x(t ), x2 (t ) x(t ) x x1 (t ) x2 (t ) x2 (t ) u (t ) g , x1 (0) x10 , x2 (0) x20
1 Q b
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 有十个城市①为起点,⑩为终点。

站与站之间称为段,每段路程所用的时间(小时)写在段上,则应如何行使,让从①到⑩所花的时间最短。

解:⑴ 4N =11(8)3,(9)4J J ==将距离数字标注于图中,数字旁括号内的文字表示相应的决策变量。

由于从8到10及从9到10都只有一种可能,所以本级无决策问题。

⑵3N =本级决策有三种选择。

每种选择中又有两条可能的路线。

例如,从5出发,可达8,也可达9,所以131(5,8)(8)13(2)min min 4(5,9)(9)44d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明5到10的最短距离为4,路线为5-8-10决策变量为2(5)8S =同理,从6出发时,有121(6,8)(8)63(6)min min 7(6,9)(9)34d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明6到10的最短距离为7,路线为6-9-10决策变量为2(6)9S = 从7出发时,有121(7,8)(8)33(7)min min 6(7,9)(9)34d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明7到10的最短距离为6,路线为7-8-10决策变量为2(7)8S = ⑶2N =本级有三种选择,计算过程如下:2322(2,5)(5)74(2)min (2,6)(6)min 471166(2,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(2)5(6)S =2322(3,5)(5)34(3)min (3,6)(6)min 27746(3,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(3)5S =2322(4,5)(5)44(4)min (4,6)(6)min 17856(4,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(4)5(6)S =⑷1N =本级决策是唯一的,计算结果为2422(1,2)(2)211(1)min (1,3)(3)min 471138(1,4)(4)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量4(1)3(4)S =可确定最短路线为1-3-5-8-102.一维线性系统,设变量无约束,最优控制问题的数学模型为:22210(),k k k k k J qx ru T x ax bu +=+=+∑初始状态0x 为已知。

式中,,,a b q r 为常数,0,=1r T >设。

求最优控制序列。

解: 本题为三级决策问题. 因为=1T ,22210(),k k k k k J qxru T x ax bu +=+=+∑①令3,2N k ==*22122322,J qx ru x ax bu =+=+因为k u 无约束,故令*12220J ru u ∂==∂求得*20u =将上述结果代入*1J 方程,易得*212J qx = ② 2,1N k == 211x ax bu =+*22*2111222121222111122221111()[()](1)2()J qx ru J q x x ru q x ax bu ru q a x abqx u qb r u =++=++=+++=++++*2211122()0J abqx qb r u u ∂=++=∂解得*1121abq u x qb =-+将上述结果代入*2J 方程,易得 2222*222122(32)[(1)](1)a qb qb r J q a x qb ++=+++ ③ 1,0N k == 100x ax bu =+*22*3002222222220122222222220022(32)[(1)](1)(32)[(1)]()(1)J qx ru J a q b qb r qx ru q a x qb a q b qb r qx ru q a ax bu qb =++++=+++++++=++++++解得*0u 将上述结果代入*3J 方程,易得 3. 22210(),k k k k k J xru T x ax bu +=+=+∑,求最优控制序列。

解:本题为三级决策问题. 因为=1T ,22210(),k k k k k J xru T x ax bu +=+=+∑①令3,2N k ==*22122322,J x ru x ax bu =+=+因为k u 无约束,故令*12220J ru u ∂==∂求得*20u =将上述结果代入*1J 方程,易得*212J x = ② 2,1N k == 211x ax bu =+*22*2111222121222111122221111()[()](1)2()J x ru J x x ru x ax bu rua x abx ub r u =++=++=+++=++++*2211122()0J abx b r u u ∂=++=∂解得*1121ab u x b =-+将上述结果代入*2J 方程,易得 222*222122(32)[(1)](1)a b b r J a x b ++=+++③ 1,0N k == 100x ax bu =+*22*30022222222012222222220022(32)[(1)](1)(32)[(1)]()(1)J x ru J a b b r x ru a x b a b b r x ru a ax bu qb =++++=+++++++=++++++解得*0u 将上述结果代入*3J 方程,易得4.运用动态规划方法确定下列系统的最优控制3220(1)2()(),0,1,2,3[()()]t x t x t u t t J x t u t =+=+==+∑解:本题为四级决策问题。

① 3t =,(4)2(3)(3)x x u =+ *221(3)(3)J x u =+*12(3)0(3)J u u ∂==∂求得(3)0u =将上述结果代入*1J 方程,易得*21(3)J x = ②2t =,(3)2(2)(2)x x u =+,*22*2122222(2)(2)(2)(2)(3)5(2)2(2)4(2)(2)J x u J x u x x u x u =++=++=++*24(2)4(2)0(2)J u x u ∂=+=∂解得(2)(2)u x =-上述结果代入*2J 方程,易得*223(2)J x = ③1t =,(2)2(1)(1)x x u =+*22*3222222(1)(1)(1)(1)3(2)13(1)4(1)12(1)(1)J x u J x u x x u x u =++=++=++*38(1)12(1)0(1)J u x u ∂=+=∂解得3(1)(1)2u x =-上述结果代入*3J 方程,易得*233(1)J x = ④0t =,(1)2(0)(0)x x u =+*22*4322222(0)(0)(0)(0)4(1)17(0)5(0)16(0)(0)J x u J x u x x u x u =++=++=++*410(0)16(0)0(0)J u x u ∂=+=∂解得8(0)(0)5u x =-上述结果代入*4J 方程,易得*2421(0)5J x =5.系统方程为00()(),()dx ax t bu t x t x dt =-+=求最优控制使12210()tJ cx t u dt =+⎰取最小值,此处,,a b c 均为正常数。

解:令***2(,,)()()T T J J J H x u u ax bu x x x ∂∂∂=-+∂∂∂ ①对**(,)J u x x∂∂隐式解。

因为()u t 无约束,故令****120(,)=-2T T H J J J u b u x b u x x x∂∂∂∂=+=∂∂∂∂得 因为2220H u ∂=>∂故求得的**(,)J u x x∂∂可使哈密顿函数H 极小。

把***1(,)=-2T J J u x b x x ∂∂∂∂代入哈密顿—雅可比方程得:2***21()4T J J J b ax t x x⎛⎫∂∂∂=+ ⎪∂∂∂⎝⎭ 考虑该问题为定常问题,且f t 自由,因此最优函数仅为()x t 的函数,因此有2**21()04TJ J b ax x x ⎛⎫∂∂+= ⎪∂∂⎝⎭可得*=0x J ∂∂或*24a =-bJ x x ∂∂即可得:2**22a (bJ M x ==-恒值)或J **2=0=-a x b u u 最优控制或6.对于系统422,[]2x x u J u x dt ==++⎰最小化写出哈密顿-雅可比-贝尔曼方程式。

解:构造哈密顿函数**242J 1J L ()X 2xT H f x x u u ∂∂=+=+++∂∂ 根据哈密顿-雅可比方程有***242J J 1J min L min[()]2x T f x x u u x x ⎡⎤∂∂∂-=+=+++⎢⎥∂∂∂⎣⎦考虑控制不受限制可得:***H J 1J 20u 2u u x x ∂∂∂=+=→=-∂∂∂ 所以:**242J 11J ()24Xx x t ∂∂-=++∂∂。

相关文档
最新文档