最优控制笔记

《最优控制》第4章线性系统二次型性能指标的最优控制问题

1 T 1 T e ( t ) Q ( t ) e ( t ) X (t )Q(t ) x(t ) 以零状态为平衡状态 2 2 1 T 1 T ②输出调节器 e (t )Q(t )e(t ) y (t )Q(t ) y (t ) 2 2
<输出调节器可转化为状态调节器> y(t ) c(t ) x(t )
第4章——线性系统二次型性能指标的最优控制问题
(t ) (22 F12 )1( F11 21) x(t )
可以证明 (22 F12 )1 存在因此， (t )与X (t ) 呈线性关系，可表示为 (t ) P(t ) x(t ) 则
u * (t ) R 1(t ) BT (t ) P(t ) x(t )
（微分方程解的存在性和唯一性定理）
* * * * x1 x2 即x1 x2
16
第4章——线性系统二次型性能指标的最优控制问题
5.总结状态调节器控制规律 u * (t ) R 1 (t ) BT (t ) P(t ) x(t ) 其中P(t)满足下面的矩阵黎卡提微分方程及边界条件
⑤状态方程
x Qx AT
1 T 1 T x x Ax BR B A BR B x T T Qx A Q A
x(t0 ) x(t ) (t ) (t , t0 ) (t ) 0
3 Q(t ), R(t ) 加权矩阵 Q(t )半正定，R(t )正定且均为时变 1 T 4 e (t f ) Fe(t f ) 突出对终端的误差的要求 2 特别要求终端固定，即e(t f ) 0时，F
5

最优控制6-1

(6-6) (6-7)
其工作特点是：最大限度地提高该阶段的收益，不考虑回收问题。
17
若阶段数N=2，则第二阶段的工作方式与N=1时相同，即不需考虑回收。为使两个阶段的总收益最大，对第二阶段来说，不论在第一阶段资源如何分配，即 y0 如何选取，要求其回收量 ay0 b(x0 y0 ) 在第二阶段发挥最大效用也就是说，第二阶段的最大收益应是：
解由(6-3)式可以看出，这是一个求N元函数极值点的问题。
1）若整体最大值位于(6-4)式限定的区域内部，即所有 yi 满足不等式 0 yi xi ，且g和h存在导数，则所有可通过解下列方程组求出：
g( yN1) g( yN1) h(xN1 yN1)
13
希望通过合理选择使N个阶段的总收益最大，即：
max RN (x0 , y0 , y1,, yN1)
( y0 , y1,, yN 1 )
max g( y0 ) h(x0 y0 ) g( y1) ( y0 , y1,, yN 1 ) h(x1 y1) g( yN1) h(xN1 yN1)
6-1 所示。
5
站与站各地间凡有连线者，表示相应两地可铺设管道，线间数字表示两地距离；凡无连线者，表示相应两地不能铺设管道。现需选择一条由A0 到A6 的铺管线路，使其总距离最短。
6
解这一问题可用两种方法求解。第一种：穷举法即列出所有可能的组合方案，计算每一方案的起迄距离，从中选出其总距离最短者，即得最短铺管线路。
(6-1)
现设以y0与x0-y0投入生产A与B后，可以部分回收，其回收率分别是 0 a 1 与 0 b 1 ，则经第一阶段生产后回收的资源总共是：

最优控制内容要点

④ 性能指标
反映和评价系统性能优劣的指标。
tf t0
J [[ x (t f ), t f ] f [ x (t ), u (t ), t ]dt
性能指标值的大小依赖于控制作用的整体u(· )的选择，而不是取决于控制u(t)在t时刻的值；因此J[u(· )]是控制函数u(· )的函数（称为u(· )的泛函）。
5
习题
1.求使 min f ( X ) 4x12 5x2 2 , 且 g ( X ) 2x1 3x2 6 0
2.求原点到曲线 y 2 ( x 1) 3 0 的距离为最小。 3.求函数极值 f ( X ) x1 2 x2 2 x3 2，若 ( x1 x2 )2 x32 1
t* f
2．tf和x(tf)受c(tf)曲线约束 x(t0)=x0
* x(t * ) c ( t f f ) L c(t ) x(t ) L 0, x
3． tf自由，x(tf)固定 x(t0)=x0和x(tf*)=xf
L (t ) Lx 0, x t t* f
( x , x , t ) m
引入矢量拉格郎日乘子λ(t)=[λ1(t) λ2(t) …λm(t)]T将微分方程约束条件结合到性能泛函中构成一个新泛函，即
15
, t ] λ TΛ[x, x , t ] dt J' L[x, x
t0
tf

于是，在微分方程组约束下求泛函的条件极值问题，只需用拉格朗日乘子法将有约束条件问题转化为无约束条件问题来解决。假设函数x1(t)，x2(t)，…，xn(t) ，λ1(t)， λ2(t)， …， λm(t)使泛函J'取极值，那么这n+m个函数必须满足下面 n+m个欧拉方程：

最优控制笔记整理

1.性能指标按其数学形式可分为如下三类：1)积分型性能指标L[x(),(),]ft t J t u t t dt =⎰拉格朗日问题。

2）终值型性能指标[x(),]f f J t t ϕ=这种性能指标只是对于系统在动态过程结束时的终端状态提出了要求，而对于整个动态过程中系统的状态和控制的演变未作要求。

这样的最优控制问题为迈耶尔问题。

3）复合型性能指标[x(),]L[x(),(),]ft f f t J t t t u t t dt ϕ=+⎰这样的最优控制问题为波尔扎问题。

通过适当变换，拉格朗日问题和迈耶尔问题可以相互转换。

2.按控制系统的用途不同，所选择的性能指标不同，常见的有：1：最小时间控制01ft f t J t t dt =-=⋅⎰2：最小燃料消耗控制|()|ft t J u t dt =⎰控制量u(t)与燃料消耗量成正比3：最小能量控制2()ft t J u t dt =⎰控制函数u 2(t)与所消耗的功率成正比3. J(x)取极小值的充分条件为正定(>=0) ，反之则极大4. J(x)取极值的必要条件为：欧拉方程0Ld L xdtx∂∂∂∂-=横截条件5. t 0和t f 给定，x(t 0) 或x(t f )未给定时横截条件：（1）给定x(t 0) 或x(t f )222222L L x xx L L x xx ∂∂∂∂∂∂∂∂∂∂⎡⎤⎢⎥⎢⎥⎣⎦横截条件为：x(t 0)=x 0或x(t f )=x f (2)自由x(t 0) 或x(t f )00L t x∂∂= 或0f Lt x∂∂= 那个自由（为给定），那个偏导为0.6. 始端时刻t 0给定， x(t 0)固定或约束；而终端时刻t f 自由，终端状态x(t f )自由或约束,x(t)不受任何方程约束时的横截条件：7.当x(t)受状态方程约束时，设系统状态方程：(,,)x f x u t = 性能指标：0[(),](,,)ft f f t J x t t F x u t dt ϕ=+⎰满足极值所需条件： H=L+T λ f（1）欧拉方程(伴随方程) H xλ∂=-∂ （2）状态方程H xλ∂=∂ （3）控制方程0Hu∂=∂ （4）横截条件：初始时刻t 0及始端状态x(t 0)给定t f 自由终端x(t f )自由或者约束；若x(t f )自由则无N 方程，若x(t f )固定则无()f t λ方程8. 极小值原理设系统的状态方程为()[(),(),]xt f x t u t t = 控制u(t)满足不等式约束: [(),(),]0G x t u t t ≥ 末端约束：[(),]0ff N x t t =f()()[ff t t N H t t ϕμ=∂+=-∂()()[t f f t f N t x ϕμλ∂+=∂（）性能指标：0[(),]L [(),(),]ft f f t J x t t x t u t t dt ϕ=+⎰求解过程：(1).沿最优轨线满足正则方程()T H xH G x x λλ∂=∂∂∂=--Γ∂∂(2)横截条件及边界条件:(3)在最优轨线x*(t)上与最优控制u*(t)相对应的H 函数取绝对极小值,即：9.设离散系统的状态方程为:)1,,2,1,0(]),(),([)1(-==+N k k k u k x f k xk 表示时刻t k ,终端时刻t f =t N .设初始状态x(0)=0,终端时刻t N 给定,终端状态x(N)自由.系统性能指标为: ∑-=+=1]),(),([]),([N k k k u k x L N N x J ϕ要求寻找最优控制u*(k),使性能指标J 为极小. 求解过程：（1）列出哈密顿函数)1,,2,1,0(]),(),([)1(]),(),([]),1(),(),([-=++=+N k k k u k x f k k k u k x L k k k u k x H Tλλ（2）正则方程1,,2,1,0,)1(]),1(),(),([)1(1,,2,1,0,)(]),1(),(),([)(-=+∂+∂=+-=∂+∂=N k k k k k u k x H k x N k k x k k k u k x H k λλλλ（3）边界条件与横截条件:)(]),([)(0)0(N x N N x N x ∂∂==ϕλ（4）控制方程:00(()[]([(,,,)]0()[(),]0f f ft t t t f f N t xN H x u t t x t x N x t t ϕμλϕμλ==∂+=∂∂++=∂==））*****(,,,)(,,,)H x u t H x u t λλ≤()TH G u u ∂∂=-Γ∂∂无这个方程1,,2,1,0,0)(]),1(),(),([-==∂+∂N k k u k k k u k x H λ当u(k)有不等式约束时]),1(),(),([min ]),1(),(),([**)(***k k k u k x H k k k u k x H k u +=+Ω∈λλ。

11讲最优控制-极小值-总结及习题讲解

能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理

极小值原理与变分法求最优控制的比较
能源与动力学院系统控制与仿真研究室
18
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理
33
最优控制——极小值原理 3.4 极小值原理的典型应用

月面软着陆问题
h
v g
月球
能源与动力学院系统控制与仿真研究室
34
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
35
最优控制——极小值原理 3.4 极小值原理的典型应用

时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
7
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理最控制值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
27
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
28
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
29

第七章最优控制：最大值原理

H u 2u 0 u 1 2

（7.39)
H
2
u
2
2 0
u (t )
的解是最大化 H

例1 最大化
满足 y y u 和 y (0 ) 1
V

1 0
u dt
2
y (1) 0

汉密尔顿函数： H u 2 ( y u )
0
H t , y

(T ) y T ( 0 ) y 0
的第一项对求导，得：
T ( ) 0
(7.28)

H H q ( t ) dt H y q (t ) p (t ) u y

f (t , y , u ) H
以上两个方程右边相同，因此左边相等：
y
推导得到最大值原理的条件之一
以上推导得到：

H ( t , y , u , ) y ( t ) dt ( T ) y
T 0
T
(0) y0
步骤3 推导新目标泛函的另一种形式
推导得到最大值原理的一般横截条件
第二节其他终结条件

一般横截条件：
H t T T
(T ) y T 0
（7.30）
y
y Z
• 固定终结点的横截条件：
y (T ) y T

（T 和
y T 给定）
水平终结线的横截条件：
[ H ]t T 0
t
0
T
T2
T

第6章最优控制

1 (t ) x2 (t ) 0 x 2 (t ) u (t ) 0 x
根据边界条件：
x1(0) 1 ，x2 (0) 1 ，x1(2) 0，x2 (2) 0
可解出各待定系数为：
7 a1 3，a2 ，a 3 1，a4 1 2
解：
u a1t a2
刻 T 不固定，终端状态 x(T ) 也不固定，但又必须满足
x(T ) (T )这一约束条件时，终端条件变为横截条件，
即：
F x ) 0 F ( t T x
6.2.4 多元泛函的极值问题
设泛函为：
1, x 2 ,, x n , x1, x2 ,, xn , t )dt J F (x
T
0
) dt (1 x
2
x(t ) 2 t
x(0) 1
其中：F (1 x 2)
T
t
由欧拉方程有
x (t )
2) F (1 x
d 0 dt 1 x
x
F d F 0 x dt x
x(0) 1
x(t ) 2 t
x 1 x
边界条件为：
x1(0) 1 ，x2 (0) 1 ，x1(2) 0，x2 (2) 0
引进乘子： (t ) 1 (t ) 2 (t )T 构造一个新的函数：
1 2 1 x2 ) 2 ( x 2 u ) F F f u 1 ( x 2
* T
y ( x 3)2
求当 x 取何值时， y 有极小值。这一问题的解答结果是一个数值， y 即当 x 时，有极小值 0。 3 在最优控制中，目标函数J是 u 的函数，而 u 又是时间t的函数。所以和上述问题不同，最优控制的解答结果是一个函数而不是一个数值。例如

最优控制理论考试重点

1．最优控制问题的性能指标(1)积分型性能指标(拉格朗日型)：⎰=ft t dt t t u t x L u J 0]),(),([)(反映控制过程偏差在某种意义下的平均或控制过程的快速性，同时能反映燃料或能量的消耗。

(2)末值型性能指标（梅耶型）：]),([)(f f t t x u J φ=，接近目标集程度，即末态控制精度的度量。

(3)综合性能指标（鲍尔扎型）：⎰+=ft t f f dt t t u t x L t t x u J 0]),(),([]),([)(φ。

2．最优控制问题的数学模型给定系统的状态方程：]),(),([)(t t u t x f t x =•；状态方程的边界条件：⎩⎨⎧∈===St x t t x t x t t f f )(,)(,000；给定性能指标：⎰+=ft t f f dt t t u t x L t t x u J 0]),(),([]),([)(φ；允许控制域u(t)：U t u ∈)(。

3．最优控制应用的几种类型：最短时间控制，最小能量控制，线性调节器，最少燃料消耗控制，线性跟踪器。

4．选取性能指标注意：应能反映对系统的主要技术条件要求，便于对最优控制进行求解，所导出最优控制易于实现。

5．边界条件：指状态向量在起点或终点的所有容许值的集合。

6．横截条件：依据性能指标的要求，从容许值的集合中选择哪一点作为始态或终态的问题。

1．泛函：对于某一类函数y(·)中的每一个函数y(x)，变量J 都有一个值与之相对应，那么变量J 称作依赖于函数y(x)的泛函。

记为：J=J[y(x)]，y(x)称为泛函的宗量。

宗量的变分：)()(0x y x y y -=δ。

2．泛函的连续性：对任意给定的正数ε，总存在另一个正数δ，当,...)()(,...,)()(,)()()()(000δδδ<-<-<-x y x y x y x yx y x y k k 时，ε<-)]([)]([0x y J x y J ，则称泛函J[y(x)]在点y 0(x)处是连续的，而此时y(x)与y 0(x)具有k 阶接近度。

最优控制又叫动态优化工程技术领域里的过程（物理过程或化学过程），通常都是可以控制的过程控制：使过程的发展变化按人们的需要进行动态优化问题的四个要素：1.建立过程的动态模型（动态系统的状态方程）2.指定所需的初始状态和结束状态（状态方程的边界条件）3.确立在可行控制策略4.性能指标动态系统的变化，可以看成对应状态的变化，其中每一个状态对应着n维状态空间中的一个点，系统的运动将在状态空间中画出一条状态曲线动态系统的状态方程：1.是对研究对象的动态数学建模2.体现了系统运动时应遵循的规律,反映了系统的动态特征3.一般是微分方程组描述状态方程f[x(t),u(t),t]的数学性质：1.f[x(t),u(t),t]是向量函数，维数与状态变量维数相同2.f[x(t),u(t),t]是关于x(t)/u(t)/t的连续函数3.f[x(t),u(t),t]是关于x(t)/t的连续可微函数4.u(t)是关于t的分段连续函数，只有有限个第一类间断点系统的初始时刻t0和初始状态x0一般都是已知的系统的结束时刻tf：固定或者不固定系统的结束状态xf：全部固定/全部不固定/部分固定性能指标：1.要根据实际任务确定，例如过程持续的时间最少/过程消耗的能量最少/成本最小/利益最大等等2.种类：终值型/积分型/复合型,它们都是关于x(t)/t的连续可微函数最优控制一定是容许控制，即最优控制策略（最优控制函数）在控制函数空间中的一个子集中选择当最优控制轨迹确定后，通过系统的状态方程，可以确立对应的最优状态轨迹现代控制理论相对于经典控制理论的优点：1.从时不变系统延伸到时变系统2.从单输入单输出系统延伸到多输入多输出系统3.从频域回到时域，采用能够揭示系统内部各状态变化规律的状态空间描述法最优控制理论属于现代控制理论的分支从数学角度来看，最优控制问题本质上是求泛函极值的变分学问题变分法分为古典变分法和现代变分法（最大值原理/动态规划）古典变分法只能解决容许控制集为开集的最优控制问题实际最优控制问题的容许控制集都是闭集，可以用现代变分法解决函数分为两类：普通函数和泛函普通函数随自变量t变化有确定值对应泛函随普通函数（称为泛函的宗量函数）的形式变化有确定值对应，t已确定或不产生影响复合函数也是普通函数，随自变量t变化有确定值对应具有某些相同特征的所有函数组成一个函数类，或称函数空间在函数空间内，每一个函数（形式不同的）成为函数空间的一个点，例如sin(x)和sin(2x)是正弦函数空间的两个点泛函宗量的变分：1.同一函数空间中的两个函数的差（t已确定或不产生影响）2.宗量的变分仍然是一个普通函数3.这里“变分”的意思是改变量宗量的维数为m时，则宗量的变分在m维函数空间中进行，其中每一维函数空间各自是具有某些相同特征的函数类两个普通函数k阶相近的定义，从几何上来看就是曲线的相似程度两个普通函数间的k阶距离定义，从几何上来看就是曲线的差异程度m维函数空间中，与点[x0(t),x1(t),...xm(t)]距离相同的点构成m维空间中的一个球面泛函k阶连续的定义（利用两个普通函数间的k阶距离来定义）线性泛函的定义：满足齐次性与可加性泛函的变分：1.是泛函增量的关于宗量变分的线性主部2.是关于宗量变分的线性连续泛函3.仍然是一个泛函4.泛函的变分是唯一的5.这里变分的意思相当于普通函数的微分泛函变分的计算公式，是关于宗量变分的泛函，也是关于alpha的普通函数，从普通函数极值条件出发推导得到泛函极值条件求普通函数的极值，必要条件是：极值在稳定点获得，稳定点即普通函数导数为0的点求泛函的极值，必要条件是：极值在泛函变分为0的点取得Lagrange/Mayer/Bolza形式指标的相互转换欧拉--拉格朗日方程的推导过程欧拉--拉格朗日方程是一个二阶微分方程欧拉--拉格朗日方程成立的前提：1.宗量函数对自变量的二阶导数存在2.积分函数二阶连续可微欧拉--拉格朗日方程的能积分出最优解的特殊情况含有多个宗量函数的欧拉--拉格朗日方程组形式等式约束条件下的泛函极值问题采用拉格朗日乘子思想等式约束下的多变量普通函数极值问题，拉格朗日乘子是m维常向量等式约束下的泛函极值问题，拉格朗日乘子是m维普通函数，称为协态变量拉格朗日乘子法的步骤：原问题-->辅助泛函-->解等式约束+欧拉方程-->用边界条件确定未知系数-->判断极大/极小/鞍点等式约束下的泛函极值问题中，拉格朗日乘子（本质上是普通函数）的欧拉方程就是原问题的等式约束条件对于最优控制问题，控制函数u(t)和状态函数x(t)都看成是泛函的宗量，系统的动态方程作为等式约束条件Hamilton函数是泛函，其t的范围由x(t)/u(t)中的t范围确定，可以看成是mayer型泛函Hamilton函数的作用：积分型泛函J对u(t)的等式约束条件极值问题，转换成H对u(t)的无约束条件机制问题Hamilton函数方法解决最优控制问题，是基于必要条件，而不是充分条件Hamilton函数沿着最优空之轨迹和最优状态轨迹，对时间t的全导数等于偏导数当Hamilton函数不显含t时，H是不依赖于t的常数基础数理化：数学是理路，物理和化学是实践；工程中的物理和化学变化过程都是可控的；过程：与时间有关，随着时间推荐的变化，又叫动态过程；动态过程的数学模型又称状态方程，为OEDs或者DAEs形式对一个过程实施控制往往可以选择的策略不唯一，为了使得任务完成得最好，需要选择最优控制策略；最优的意义：根据任务确定的技术或者经济指标，可以是时间上最快、能量上最省、成本最低、利润最大等；状态微分方程f[x(t),u(t),t]是关于u(t),x(t),t的连续函数，是关于x(t),t的连续可微函数，u(t)只有有限个第一类间断点；状态、状态空间、动态系统的变化过程对应于状态空间中的点运动轨迹、点运动轨迹的起始点和结束点就是状态方程的边界条件；系统的初始时间t0和初始状态x0通常是给定的；系统的结束状态根据结束时间tf是否固定和结束状态是否固定可分为6种情况；性能指标的类型：终值型（Mayer型）、积分型（Lagrange型）、复合型（Bolza型；）终值型（Mayer型）是x(t),t的连续可微函数；积分型（Lagrange型）是u(t),x(t)，t的连续函数，是x(t),t的连续可微函数，u(t)只有有限个第一类间断点；注意终值型（Mayer型）指标中不含u(t)；最优控制轨迹往往在m维控制函数空间的一个子集omiga中选择；经典控制论的特点：针对SISO、线性、时不变（定常）、集中参数系统，以laplace变换作为分析工具，频域内；现代控制论的特点：针对MIMO、非线性、时变、分布参数系统，以状态空间分析方法为分析工具，时域内分析；对系统的状态空间描述，最大好处在于能够反映系统内部各状态变量之间的关系；最优控制理论属于现代控制理论的一部分；最优控制问题在数学上来说属于求泛函极值的变分学领域；古典变分法的局限性：只能处理u(t)无约束或者为开集的泛函极值问题；现代变分学的两个代表：最大值原理（苏联，Pontryagin提出）和动态规划（美国，Bellman 提出）；现代计算机的发展推动了控制理论和优化理论的发展与应用，增加了基于计算的科研活动方式；函数分为一般函数和泛函两类；一般函数：自变量形式唯一，当自变量确定为某一值时，函数值也随之确定；泛函：自变量形式和取值（范围）已经确定，当宗量函数形式确定时，泛函值也随之确定；复合函数属于一般函数；终值型泛函中，tf能被确定，所以泛函值取决于终值型泛函的宗量形式；积分型泛函中，被积函数往往是u(t),x(t),dx(t)/dt,t的函数，u(t),x(t)都属于积分型泛函的宗量；积分型泛函中，由于宗量的维数大于1：宗量为u(t),x(t)，且各自维数也可能大于1，所以积分型泛函属于多维泛函（宗量为多维，在多维函数空间内取值）；Hamiltonian属于多维泛函，自变量取值范围为t0~tf，宗量包括控制函数u(t),状态函数x(t)，协态函数y(t);函数空间：具有相同性质的函数类（按函数不同形式区分函数类中的单个函数），构成了一维函数空间（一根轴），每个属于该函数类的具体形式函数都是该一维函数空间（轴）上的一个点；宗量函数的变分deltax(t)：是同一函数类中两个一般函数的差，或者说是某一维函数空间中两个点之间的距离，本质上仍然是一个一般函数；一般函数相近的几何意义：曲线形态相似；泛函连续性的定义及与宗量函数相近（宗量函数的变分趋于0）的关系；线性泛函的定义：满足针对宗量函数的齐次性和可加性（将宗量看成一般函数的自变量）；泛函变分detalJ[x(t)]：是泛函增量关于“宗量函数变分”的线性主部，是关于“宗量函数变分”的线性连续泛函，本质是泛函；泛函的变分具有唯一形式；求一个泛函的变分不直接使用定义，而用偏导数方法获得，这与一般函数的微积分知识相似；泛函达到极值的必要条件：泛函在宗量函数x*(t)处的变分为0，有三种情况：非极值，极大值，极小值；古典变分法中的欧拉方程由积分型泛函变分为0的必要条件推出，所以欧拉方程也是泛函达到极值的必要条件；欧拉方程本质上是一个二阶偏微分方程；欧拉方程成立的前提是:L[x(t),dx(t)/dt,t]对宗量函数x(t)、宗量函数的导数dx(t)/dt、自变量t存在二阶偏导数；注意L[x(t),dx(t)/dt,t]本身不能称为泛函（自变量的值没有给定），也不能称为宗量函数（宗量函数是x(t)）；欧拉方程可以求解的条件：L[x(t),dx(t)/dt,t]中不显含x(t)、dx(t)/dt、t三者其一或其二；宗量函数为向量函数时，欧拉方程也成为向量二阶偏微分方程（二阶偏微分方程组）；phi(tf)这条终端曲线实际靠测试获得，并作为已知曲线；横街条件反应的是：极值曲线终端斜率与给定曲线斜率之间的关系横街条件成立的前提：L[x(t),dx(t)/dt,t]对宗量函数x(t)、宗量函数的导数dx(t)/dt、自变量t存在二阶偏导数；phi(t)对自变量t存在一阶偏导数；终端点可变情况下，泛函极值的必要条件共有两个：欧拉方程、横街条件；Lagrange型泛函的一阶变分和二阶变分的表达式；泛函极值属性的判断需要借助二阶变分表达式，它是一个对称函数矩阵；涉及到最优控制问题时，最优状态轨迹不仅要使目标函数最优，更重要的是满足系统的状态方程；系统的状态方程（等式）可以看成是求泛函极值问题时的微分等式约束；带等式约束的泛函极值问题，处理思想和一般函数的等式约束极值问题思路一样，采用拉格朗日乘子法思想；带等式约束的泛函极值问题，拉格朗日乘子是一般函数（一般函数的等式约束极值问题中，拉格朗日乘子是常数）；带等式约束的泛函极值问题，与一般函数的等式约束极值问题相比，梯度为0的必要条件进化成为变分为0（欧拉方程的满足）；带等式约束的泛函极值问题，原等式约束可以视为F[x(t),dx(t)/dt,lamda(t),t]对宗量函数lamda(t)的欧拉方程；利用古典变分法求解最优控制问题，是将控制函数u(t)和拉格朗日乘子函数lamda(t)都作为泛函的宗量函数；Hamiltonian的作用是将dx(t)/dt从F[u(t),x(t),dx(t)/dt,lamda(t),t]中分离出去，它们的关系是：H[u(t),x(t),lamda(t),t]=F[u(t),x(t),dx(t)/dt,lamda(t),t]-lamda(t)dx(t)/dt正则方程组的推导既可以从F[u(t),x(t),dx(t)/dt,t]的欧拉方程推导，也可以直接从变分=0的必要条件推导（欧拉方程从变分=0的必要条件中推导出来）；推导tf固定、tf自由时的最优控制问题必要条件时，辅助函数的做法：终态约束等式约束放在积分号外面，状态方程等式约束放在积分号里面；tf固定时的三种情况：x(tf)固定（仅需要欧拉方程无需横截条件）属于x(tf)自由的特殊情况，x(tf)自由又属于x(tf)受约束的情况；tf自由时的三种情况：x(tf)固定（仅需要欧拉方程无需横截条件）属于x(tf)自由的特殊情况，x(tf)自由又属于x(tf)受约束的情况；tf固定又属于tf自由时的特殊情况，仅缺少关于最优时间的方程，所以6种情况最终都可以归类为tf自由、x(tf)受约束的情况处理；Hamiltonian沿着最优控制轨迹和最优状态轨迹（即H[u(t),x(t),lamda(t),t]中的u(t),x(t),lamda(t)都在最优轨迹上取值）时，对时间的偏导数等于对时间的全导数；以上性质说明：沿着最优控制轨迹和最优状态轨迹时，若Hamiltonian不显含t，则Hamiltonian为常数；不等式约束泛函极值问题？古典变分法要求u(t)属于一个全函数空间或者一个函数空间中的开集；现代变分法从实际出发，u(t)可以属于一个函数空间中的闭集；现代变分法中的代表：极小值原理（苏联，Pontryagin）和动态规划（美国，Bellman）极小值原理比古典变分法的进步：u(t)可以属于一个函数空间内的闭集，不要求Hamiltonian对u(t)可微；当u(t)属于一个函数空间内的闭集时，H对u(t)的偏导数可能不为0（在闭函数空间内取不到极点）、deltau(t)可以为0，两方面原因造成古典变分法不再适用；与古典变分法对应的是，极小值原理也有6种情况，最普遍的是tf可变、x(tf)受约束的情况；对于tf可变的情况，需要增加一个确定tf的方程（属于横截条件的一部分）；Hamiltonian达到极小值的定义？极小值原理仅是最优控制问题的必要条件；如果x(tf)有终端约束，那么两点边值问题的求解难度会增加很多，常用方法为打靶法（扫描法）；协态变量就是等式约束泛函极值问题的拉格朗日乘子函数；状态变量终态的自由与固定，对应协态变量终态的固定与自由；状态变量微分方程求解联合协态变量微分方程求解体现了原问题--对偶问题的共同求解思想？目标泛函对u(t)求偏导，实际是泛函对宗量函数求偏导；从理论分析可以得到，目标泛函对u(t)的梯度（偏导数）在最优控制问题中与Hamiltonian 对u(t)的梯度（偏导数）等价；最优控制（动态优化）问题转换成静态优化问题的理论：通过对u(t)的离散化，将函数空间变为向量空间？从而可以直接使用静态优化算法；处理x(tf)受约束的方法除了惩罚函数法还有其他方法没？[文档可能无法思考全面，请浏览后下载，另外祝您生活愉快，工作顺利，万事如意!]。

最优控制 (8)

• 如果考虑进入系统的功率时，或在目标函数中包含yTy项(y=Cx+Du)时，目标函数也会呈现式(8.21)的形式。 • 对于这种目标函数，修正后的黎卡提方程为
• 最优控制为
• (2)带有预制稳定度的调节器 • 修正的目标函数为
• 对应的黎卡提方程为
• 8.1.3 MATLAB实现方法 • 应用MATLAB中的lqr和lqry命令可以直接求解二次型调节器问题，以及相关的黎卡提方程。这两个命令的格式为
• 命令 are 则可用来求解由下式给出的一般形式的代数黎卡提方程 • 命令格式为 • 该命令返回对应黎卡提方程的正定解。这个正定解存在的条件为：B是半正定对称矩阵，C是对称矩阵。
• 例8.3 给定系统如下
• 性能指标为
• 式中
• 假定系统控制信号由下式给出
• 其结构图如图8.1所示。在决定控制率时，设输入信号r=0，试用MATLAB求反馈增益矩阵K=[k1 k2 k3]。
• 如无特殊说明，在下面的推导中设矩阵 ABK是稳定的，即A-BK的特征值均具有负实部。 • 将式(8.3)代入式(8.4)中，可得
• 对任意x都有
• 式中，P为正定实对称矩阵，可进一步推得
• 将式(8.5)代入式(8.8)中，可得 • 由 Lyapunov 第二方法可知，对于给定的正定矩阵 Q+KTRK ，如果 A-BK 是稳定的，则存在正定矩阵P，使得
• 当N=∞时，性能指标变为
• 因为控制系统是稳定的x(∞)=0，性能指标进而变成 • 离散系统的稳态二次最优控制问题就是，当控制步数N是无限时，求取最优控制序列 {u(k)}，使得式(8.83) 表示的系统性能指标 J 达到最小值。
• 8.3.2 离散系统的稳态二次最优问题的解 • 稳态二次最优问题的解与二次最优问题的解相比具有如下变化 • ①P(k)变为常数矩阵，由式(8.56)得到 • ②反馈增益矩阵K(k)变成常数增益矩阵，由式(8.57)得到

最优控制总结

最优控制理论总结宫庆义2010.6.301. 最优控制问题可用下列泛函表示:[][]0()00min (),(),(),..(1)()(),(),,()(2)(),0ft f f t u t f f J x t t L x t u t t dt s t xt f x t u t t x t x x t t ϕψ∈Ω⎡⎤=+⎣⎦==⎡⎤=⎣⎦⎰2. 最优控制的应用类型:(一) 积分型性能指标: []0(),(),ft t J L x t u t t dt =⎰(1) 最小时间控制: 00ft f t J dt t t ==-⎰(2) 最少燃耗控制: 01()fmt jt j J u t dt ==∑⎰(3) 最少能量控制: 0()()ft T t J u t u t dt =⎰(二) 末值型性能指标: (),f f J x t t ϕ⎡⎤=⎣⎦ (三) 复合性能指标:(1) 状态调节器:011()()()()()()22f t T T Tf f t J x t Fx t x t Qx t u t Ru t dt ⎡⎤=++⎣⎦⎰ (2) 输出跟踪系统:011()()()()()()()()()22f t T T Tf f t J e t Fe t e t Qe t u t Ru t dt e t z t y t ⎡⎤=++=-⎣⎦⎰3. 欧拉-拉格朗日方程:0L d L x d t x ∂∂⎛⎫-= ⎪∂∂⎝⎭注: 若()min (,,)..(,,)0ft x t J g x xt dt s t f x xt ==⎰ (,,,)(,,)()(,,)TL x xt g x x t t f x x t λλ=+例题:(1)求通过点(0,0)及(1,1)且使120()J x xdt =+⎰取极值的轨迹*()x t 解: 欧拉-拉格朗日方程: 2(2)0dx x dt-= 即 0x x -= ()c o s h s i n hx t a t b t =+ 由初始条件:(0)00x a =⇒= 末端条件: 1(1)1sinh1x b =⇒= 因而极值轨迹为:*1()sinh sinh1x t t = (2)求使指标1230()J xx dt =+⎰取极值的轨迹*()x t , *(0)0x = 解:这是终端自由的情况, 欧拉-拉格朗日方程为:()2230dx x dt+= 即 223x x C += 令()xt at b =+ 由(0)00x b =⇒= 又末端自由, 横截条件为:2310ft t Lx x x=∂⎡⎤=+=⎣⎦∂ 即 2230a a +=得:0a =或23a =-, *()0,0x t J ==对应局部极小, *24(),327x t t J =-=对应局部极大(3)设系统状态方程: x u = 边界条件为: (0)1,()0,f f x x t t ==自由性能指标为: 2012f t f J t u dt =+⎰ 要求确定最优控制*u , 使J 最小解: 这是f t 自由问题, 末端状态固定, ()0f x t =是满足约束集的特殊情况, 即 (),()0f f f x t t x t ψ⎡⎤==⎣⎦(),f f f x t t t ϕ⎡⎤=⎣⎦哈密顿函数: 212H u u λ=+ 正则方程: 0HHxu xλλ∂∂===-=∂∂ 控制方程: 0Hu u uλλ∂=+=⇒=-∂()1f fH t t ϕ∂=-=-∂ 即 : 221()()10()2f f f t t t λλλ-+=⇒=由正则方程: ()0t λ= 所以 ()t λ=于是 *()u t =再由正则方程: xu λ==- 可得()x t c =+ 由初始条件 (0)1x = 得 1c =故最优轨迹为: *()1x t =+ *()02f f x t t =⇒=(4) 设系统的状态方程为: ()()()xt x t u t =-+ 边界条件为: (0)1,()0f x x t ==, 求()u t , 使221()2f t J x u dt =+⎰为最小解: 221()()2H x u x u λ=++-+协态方程和控制方程为: H x x λλ∂=-=-+∂ Hu uλ∂=+=0∂ 即 u λ=- 故可得正则方程: ()()()xt x t t λ=-- ()()()t x t t λλ=-+ 拉氏变换: ()(0)()()sX s x X s s λ-=-- ()(0)())s s X s s λλλ-=-+( 解代数方程得:()(0)(0)()(0)(0)s x X s x λ==拉氏反变换:()()()()()(0)1)1)(0)()(0)1)1)(0)t e x e x t ee x λλλ⎤=-++⎦⎡⎤=-++⎣⎦由: (0)1,()0f x x t ==得:(0)f fλ=*()()1)1)u t t eeλ⎧⎫⎪⎤=-=-+⎬⎦⎪⎭注: 拉氏变换表(5)设系统状态方程为: 122()()()()x t x t xt u t == 初始条件为: 12(0)(0)1x x ==, 末端条件为: 12(1)0(1)x x =自由要求确定最优控制*()u t , 使泛函1201()2J u t dt =⎰取极小值解: 边界条件222()(1)0(1)f t x ϕλλ∂===∂ 哈密顿函数: (,,)(,,)T H L x u t f x u t λ=+ 212212u x u λλ=++ 正则方程: 12112()0()()H Ht t t x x λλλ∂∂=-==-=-∂∂ 状态方程: 1222()()()()xt x t xt t λ==- 极值条件:0Hu∂=∂ ⇒ 20u λ+= 即 : *2()()u t t λ=- 边界条件: 12(0)1(0)1x x ==1222(1)0()(1)0(1)f x t x ϕλλ∂====∂ 对正则方程和状态方程进行拉氏变换:11222211221()(0)()()(0)()()(0)0()(0)()sX s x X s sX s x s s s s s s λλλλλλ-=-=--=-=-解以上代数方程得:11221222112123234111()(0)()(0)(0)1111111()(0)(0)()(0)(0)s s ss s X s X s s s ss s s sλλλλλλλλλ==-=--=+-+拉氏反变换:2312122111()1(0)(0)26()(0)(0)x t t t t t tλλλλλ=+-+=- 利用末端条件: 1212(1)0,(1)0(0)(0)6x λλλ==⇒== 最优状态轨迹:*231()13x t t t t =+-+ 最优协态:*2()6(1)t t λ=- 最优控制: **2()()6(1)u t t t λ=-=-(6) 设系统的状态方程为:10()()()001xt x t u t ⎡⎤⎡⎤=+⎢⎥⎢⎥⎣⎦⎣⎦指标泛函: 2201()2J u t dt =⎰ 边界条件: 10(0)(2)10x x ⎡⎤⎡⎤==⎢⎥⎢⎥⎣⎦⎣⎦求使指标泛函取极值的极值轨线*()x t 和极值控制*()u t 解: []121212221,,2T f x x g u f f u xλλλ-⎡⎤⎡⎤====⎢⎥⎢⎥-⎣⎦⎣⎦ 拉格朗日标量函数: 2121221()()2TL g f u x xu x λλλ=+=+-+- 欧拉方程:1111122222000L d L a x dt x L d L at b x dt xL d L u u at bu dt uλλλλλλ∂∂-===∂∂∂∂-=+==-+∂∂∂∂-=+==-∂∂由于状态约束方程:22223212112111262xu at b x at bt c xx at bt c x at bt ct d==-=-+==-+=-++代入边界条件: 10(0)(2)10x x ⎡⎤⎡⎤==⎢⎥⎢⎥⎣⎦⎣⎦得: 73,,12a b c d ====于是极值轨线: *321**22()0.5 1.751()3 3.5() 1.5 3.51x t t t t u t t x t t t ⎡⎤⎡⎤-++==-⎢⎥⎢⎥-+⎢⎥⎣⎦⎣⎦*x =(7)设性能指标泛函: 0ft J =⎰(0)1,()()2f f f x x t c t t ===-求使泛函为极值的最优轨线*()x t 及相应的**,ft J 解: L = 欧拉-拉格朗日方程:22220,()1L d L d C C x a x t at b x dt x dt C⎡⎤∂∂-=-=⇒===⇒=+∂∂- 由(0)1x =得: 1b =由横截条件:()(10()11ffTf t t L L cx x xt a x ⎤∂⎡⎤+-=--=⇒=⇒=⎢⎥∂⎣⎦最优轨线为: *()1x t t =+当f t t =时, ()()f f x t c t = 即: 12f f t t +=-, 求得末端时刻 *12f t = 将**(),f x t t 代入指标泛函,可得最优性能指标*J =(8) 设系统方程为: 122()()()()x t x t xt u t == 初态:12(0)(0)0x x == 末端时刻: 1f t = 末端约束: 12(1)(1)1x x += 性能指标: 121()2J u t dt =⎰ 求使J 最小的最优控制*()u t 和相应的最优轨线*()t x 解: 2121()0,()()(1)(1)12f f t L u t x x ϕψ⎡⎤⎡⎤===+-⎣⎦⎣⎦ x x212212H u x u λλ=++ 由协态方程: 1110()H t a x λλ∂=-==∂2122()H t at b x λλλ∂=-=-=-+∂由极值条件:220Hu u at b uλλ∂=+=⇒=-=-∂由状态方程:2222321211()2111()262xu at b x t at bt c xx at bt c x t at bt ct d==-=-+==-+=-++由初态: 12(0)(0)00x x c d ==⇒== 由目标集: 12(1)(1)10496x x a b +-=⇒-=根据横截条件:1212(1)(1)(1)(1)x x ψψλγγλγγ∂∂====∂∂即: 121(1)(1)2a b λλ=⇒=于是解得: 36,77a b =-=-最优解为: *3()(2)7u t t =-- 最优轨线: *211()(6)14x t t t =-- *23()(4)14x t t t =--例题:(1) 最短时间控制问题:状态方程: 122,x x xu == 初始条件: 101220(0)(0)(0)x x x x ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦x = 末端条件: 12()()0f f x t x t ==约束控制: ()10f u t t t ≤≤≤求使性能指标0ft f J dt t ==⎰取极小的最优控制.解: 1221T H L f x u λλ=+=++λ协态方程: 110H x λ∂=-=∂ 212H x λλ∂=-=-∂12()()t at at b λλ==-+选择u 使H 取极小 []2221()0()sgn ()1()0t u t t t λλλ<⎧==⎨->⎩2()t λ为t 的线性函数, u 最多改变一次符号当()1u t =时, 状态方程的解为:220212010()1()2x t t x x t t x t x =+=++ 消去t 得相轨迹方程: 2121()()2x t x t C =+ 当()1u t =-时, 状态方程的解为:220212010()1()2x t t x x t t x t x =-+=-++ 消去t 得相轨迹方程: 2121()()2x t x t C '=-+ 相轨迹的方向总是逆时针两簇曲线中, 每一簇中有一条曲线的半支进入末端状态点(原点) ()1u t =的曲线簇中, 通过原点的曲线方程为: 21221()()()02x t x t x t =≤ 记: γ+()1u t =-的曲线簇中, 通过原点的曲线方程为:21221()()()02x t x t x t =-≥ 记: γ-,γγ+-称为开关线, 其方程为: 1221()()()2x t x t x t =-开关线左侧区域用R +表示, 开关线右侧区域用R -表示于是最优控制律, 可以表示为状态[]12,Tx x x =的函数, 即*121,(,)1,x R u x x x R γγ++--∈⎧=⎨-∈⎩(2)最少燃料控制问题状态方程: 122,xx x u == 初始条件: 101002020()()()x t x t x t x ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦x = 末端条件: 12()()0f f x t x t == 约束控制: 0()1f u t t t t ≤≤≤ 求使性能指标0()ft t J u t dt =⎰取极小的最优控制. 解: 122()T H L f u t x u λλ=+=++λ协态方程: 110H x λ∂=-=∂ 212H x λλ∂=-=-∂ 12()()t a t at b λλ==-+使H 取得极小值, 等价于求下式的极小值2()min ()()()u t u t t u t λ∈⎡+⎤⎣⎦Ω 使H 取得极小值的最优控制律为:[]222220()1()sgn ()()10()1()11()0()1t u t t t u t t u t t λλλλλ⎧<⎪=⎨->⎪⎩≤≤=--≤≤= 当()1u t =时, 2121()()2x t x t C =+ (开口向右--抛物线) 当()1u t =-时, 2121()()2x t x t C =-+ (开口向左--抛物线) 当()0u t =时, 220110200(),()()x t x x t x x t t ==+- (水平线)由状态方程得: 21120211120110222112112121222121222221:()1()20:()()()()()()1:0()()10()()()()2f f u x t t x x t t x t x u x t x t Cx t x t x t t t u x t t t x t x t t t t t =-=-+=-++====+-==+-=+-+-由以上6个方程, 来解6个未知数:(3)设系统状态方程为: 122()(),()()xt x t x t u t == 边界条件: 12121(0)(0)0,()()4f f x x x t x t ==== 控制约束: ()1u t ≤, 末端时刻f t 自由求: 最优控制*()u t 使性能指标20()f t J u t dt =⎰最小解: 22212221221124H u x u u x λλλλλ⎛⎫=++=++- ⎪⎝⎭ 由极小值条件知:2*2221()21()()()221()2t u t t t t λλλλ<-⎧⎪⎪=-≤⎨⎪->⎪⎩ 由协态方程: 1112122()0()()()()H t t a x H t t t at b x λλλλλ∂=-==∂∂=-=-=-+∂ *211()()()22u t t at b λ=-=- 代入状态方程: 22232121111()()()24211()()()124x t u at b x t at bt c x t x t x t at bt ct d ⎧==-⇒=-+⎪⎪⎨⎪=⇒=-++⎪⎩ 由初始条件: 12(0)(0)00x x c d ==⇒==根据末端条件: 321221()12441()424f f f f f f a b x t t t a b x t t t =-==-= 根据H 沿最优轨线变化律: 2122()()()()()()0f f f f f f H t u t t x t t u t λλ=++=解得: 323(2)31,0,39f f f ff t t a b t t t --===== 最优控制: *1()()218t u t at b =-= 验证: 在0,f t ⎡⎤⎣⎦区间上, 2()1,()2u t t λ≤≤满足要求最优轨线: *3*21211(),()10836x t t x t t == 最优性能指标: 23*01()36J u t dt ⎡⎤==⎣⎦⎰7. 对于线性连续系统, 提出二次型目标函数:00011()()()()()()()22()()()()(),(),(),(),()f t T T T f f J x t Px t x t Qx t u t R t u t dt x t A t x t B t u t x t x R t P t Q t ⎡⎤=++⎣⎦=+=⎰ 正定半正定 0,f t t 固定求: 最优反馈控制, 并论述如何选择二次型目标函数中的加权矩阵.解: []1()()()()()()()()()()2T T T H x t Qx t u t R t u t t A t x t B t u t λ⎡⎤=+++⎣⎦ 协态方程: ()()()()T H Q t x t A t t xλλ∂⎡⎤=-=-+⎣⎦∂ 控制方程: 1()()()()0()()()()T T H R t u t B t t u t R t B t t u λλ-∂=+=⇒=-∂ 横截条件: 1()()()()()()2T f f f f f f t x t Px t Px t x t x t ϕλ∂∂⎡⎤===⎢⎥∂∂⎣⎦由此可见, 协态()t λ状态()x t 在末端时刻f t 成线性关系.设: ()()()t K t x t λ= 代入状态方程:1()()()()()()()()T x t A t x t B t R t B t K t x t -=- 由协态方程: ()()()()()()()()()()T t K t x t K t x t Q t x t A t K t x t λ⎡⎤=+=-+⎣⎦ 将()xt 代入: 1()()()()()()()()()()()()0T T K t K t A t K t B t R t B t K t A t K t Q t x t -⎡⎤+-++=⎣⎦ ()K t 由下面的黎卡提矩阵微分方程确定:1()()()()()()()()()()()T T K t K t A t A t K t K t B t R t B t K t Q t -=--+- 边界条件: ()f K t P =由此可得最优反馈控制: 1()()()()()()()T u t R t B t K t X t G t x t -=-=- 加权阵的选择: 若已知各加权变量允许的最大值为:1max 2max max ,,,n x x x 和1max 2max max ,,,n u u u1m a x 2m a x m a x 111,,,,n Q d i a gx x x ⎡⎤=⎢⎥⎣⎦ , 1max 2max max 111,,,,n R diag u u u ⎡⎤=⎢⎥⎣⎦8. 最优性原理: 一个多级决策问题的最优决策具有这样的性质: 当把其中任何一级及其及其状态作为初始级和初始状态时, 则不管初始状态是什么, 达到这个初始状态的决策是什么, 余下的决策对此初始状态必定构成最优策略.例题:(1) 系统方程为: (1)()()x k x k u k +=+, (0)x 给定 (1)122011(2)()22k J cx u k ==+∑ (2) 要求: 用动态规划寻找最优控制序列(0),(1)u u 使J 最小解: 先考虑最后一步, 即从(1)(2)x x → 这时由(1),(2)得:(2)(1)(1)x x u =+[]222211111(2)(1)(1)(1)(1)2222J cx u c x u u =+=++ 求(1)u 使1J 最小, 得:[]1(1)(1)(1)(1)0(1)(1)1J cx c x u u u u c∂=++=⇒=-∂+ 将(1)u 代入1J 和(2)x 得: 2*1(1)(1)(2)211c x x J x c c==++ 再考虑倒数第二步, 即从(0)(1)x x → 这时: (1)(0)(0)x x u =+[]22*22011(1)1(0)(0)(0)(0)22122(1)c x c J J J u u x u c c =+=+=++++ 求(0)u 使J 最小得:[](0)(0)(0)0(0)1J c u x u u c∂=++=∂+ (0)(0)12cx u c=-+ 于是最优性能指标与最优状态转移为: 2*(0)2(12)cx J c =+ 1(1)(0)(0)(0)12c x x u x c +=+=+ 9. (1)直接法: 在每一步迭代中, ()u t 不一定要满足H 取极小值的必要条件, 而是逐步改善它, 在迭代终了使它满足这个必要条件, 而且, 积分状态方程是从0f t t →, 积分协态方程是从0f t t →, 这样就避免了去寻找缺少的协态初值0()t λ的困难. 常用的有: 梯度法, 二阶梯度法, 共轭梯度法(2)间接法: 在每一步迭代中, ()u t 都要满足H 取极小值的必要条件, 而且要同时积分状态方程和协态方程,两种方程的积分都是从0f t t →或从0f t t →. 常用的有边界迭代法, 拟线性化法.10. 分离定理: 按照此定理, 可以把最优控制问题和状态变量的最优估计问题分开讨论.在研究最优控制问题时, 假定所有状态变量都可以直接得到, 而在研究状态变量的最优估计时, 则假定控制信号是已知的确定性函数.最后把控制器中的状态变量用其估计值代替, 就得到了随机线性系统的最优控制.11. 分离定理应用: 在随机线性系统最优控制中, 目前理论上和应用上比较成熟的是所谓LQG 问题, 即线性系统, 二次型指标, 高斯分布噪声情况下的最优调节器问题. 这时分离定理可以成立.根据分离定理: 可将LQG 分成两部分, 即根据确定性系统来求出最优反馈控制律, 再由卡尔曼滤波器来测定最优状态估计值, 将这个状态估计值代替状态变量本身, 就得到了最优反馈控制.。

胡寿松《自动控制原理》笔记和课后习题(含考研真题)详解(动态系统的最优控制方法)【圣才出品】

二、最优控制中的变分法（1）泛函如果变量 J 对于某一类函数{x（t）}中的每一个函数 x（t），都有一个确定的值与之对应，那么就称变量 J 为依赖于函数 x（t）的泛函，记为：J[x（t）]。
1 / 32
圣才电子书

（2）变分和变分法
十万种考研考证电子书、题库视频学习平台
t
tx t dt
试求：
（1）δJ 的表达式；
（2）当 x（t）＝t2，δx＝0.1t 和 δx＝0.2t 时的变分 δJ 的值。
解：（1）由泛函变分规则可知：
4 / 32
圣才电子书十万种考研考证电子书、题库视频学习平台

（2）由（1）可知，δx＝0.1t 时：
δx＝0.2t 时：
10-6 试求下列性能指标的变分 δJ。
J tf t2 x2 x&2 dt t0
解：由泛函变分规则，求得：
10-7 已知性能指标为：求 J 在约束条件 t2＋x12＝R2 和边界条件 x1（0）＝－R，x2（0）＝0，x1（R）＝0，x2 （R）＝π 下的极值。解：构造广义泛函为：
5 / 32
圣才电子书十万种考研考证电子书、题库视频学习平台

第 10 章动态系统的最优控制方法
10.1 复习笔记
考研初试一般不考查本章内容，下文为最优控制问题的基础理论部分。
一、最优控制的基本概念（1）最优控制概念：在系统状态方程和约束条件给定的情况下，寻找最优控制律，使衡量系统的某一性能指标达到最优（最小或最大）。（2）最优控制问题任何一个最优控制问题均应包含四方面内容：①系统数学模型；②边界条件与目标集； ③容许控制；④性能指标。（3）最优控制的研究方法包括：解析法；数值计算法；梯度型法。

第六章最优控制

（2）自由始端：在给定t0情况下，x(t0 )可以任意取值，不受限制。
（3）可变始端：x(t0 ) 0，x(t0 )满足某些约束条件
j[x(t0 )] 0，j 1,2,, m
相应的始端集0

u(t) j ( x,u)0
4、终端条件：
（1）固定终端：t f 和x(t f )都给定
称J为积分型性能指标。
小结：最优控制问题：就是从可供选择的容许控制集 U中，寻求控制向量 u(t)，使受控系统在时间域 [t0，t f ]内，从初态 x(t0 ) 转移到终态 x(t f ) f时，性能指标 J取最小（大）值。
最优控制 u*(t)：满足上述条件的控制作用u(t)。最优轨线 x*(t)：在u*(t)作用下状态方程的解。最优指标 J *：沿最优轨线 x*(t)，使性能指标 J所达到的最优值。
2.控制作用域（1）控制集U
U u(t) j ( x,u)0
U是在Rr空间中，满足某些约束条件 j (x,u) 0
( j 1,2,m)的点u(t)的集合。（2）容许控制: 属于U的u(t)，即u(t) U
3、始端条件：
（1）固定始端：最优控制的初始时刻t0和初始状态x(t0 )都给定。
2 f x 2
0
10
2
2 2 2
是正定的。故x 1 1 －2T 为极小值点x*, f的极小值f * f (x*) 0
三、具有等式约束条件极值的解法－－拉格朗日乘子法
将具有等式约束条件的极值问题化为约束条件的极值问
题来求解（一）拉格朗日函数
已知
连续可微的目标函数为
第六章最优控制
着重介绍最优控制系统的基本概念、基本理论及其应用。

最优控制总结

/系统的数学模型,物理约束条件及性能指标。

数学描述:设被控对象的状态方程及初始条件为()[(),(),],(0)0x t f x t u t t x t x ==；其中,()x t X Rn ∈⊂为状态向量，X 为状态向量的可容许集；()u t Rm ∈Ω⊂为控制向量，Ω为控制向量的可容许集。

试确定容许的最优控制*()u t 和最优状态轨迹*()x t ，使得系统实现从初始状态(0)x t 到目标集[(),]0x tf tf ψ=的转移,同时使得性能指标0[(),][(),(),]tft J x tf tf L x t u t t dt ϕ=+⎰达到极值。

系统状态方程形式(连续,离散)(2)最优控制形式(开环,闭环) (3)实际应用(时间,燃料,能量,终端) (4)终端条件(固定,自由) (5)被控对象形目标函数及约束条件组成的静态优化问题可以描述为：在满足一系列约束条件的可行域中，确定一组优化变量，(极大值或极小值)。

数学描述：min (),,:n nf x x R f R R ∈→，..()0,:;()0,:n m n l s tg x g R R h x h R R =→≥→静态最优化问题，也称为参数最优化问题，它的三个基本要素是优化变量、目标函数和约束条件，其本质是解决函数，也称为最优控制问题，它的三个基本要素是被控对象数学模型、物理约束条件和性能指标，其本质是解多变量目标函数沿着初始搜索点的负梯度方向搜索,函数值下降最快,又称最速下降法;(2)多变量无约束。

根据具体的最优换问题构造合适的惩罚函数,将多变量有约束最优化问题转换为一系列多变量无约束最优化问题,从而采用合适;(2)多变量有约束(外点法:等式约,不等式约束;内点法:不等式约束)。

通过构造拉格朗日函数,将原多变量有约束最优化问题转化为一个多变量无约束最优化问题,从而采用合适的无约束方法继(等式约束,不等式约束)。

梯度定义12()()()()f x x f x f x f x xx ∂⎡⎤⎢⎥∂∂⎢⎥=∇=⎢⎥∂∂⎢⎥∂⎣⎦，Hessian 矩阵22221212222212()()f f x x x f x H x x f f x x x ⎡⎤∂∂⎢⎥∂∂∂∂⎢⎥==⎢⎥∂∂∂⎢⎥∂∂∂⎢⎥⎣⎦,最优梯度法(无约束)：迭代(1)()()()()k k k k x x f x α+=-∇，()()()()()()()()()()()k T k k k T k k f x f x f x H x f x α∇∇=∇∇，终止误差()()()k p k f x ε=-∇≤ 例：(),(0),()f x f x H x ∇∇；(0)[(0)(0)]f x T f x α=∇•∇/[(0)(0)]T f x H f x ∇••∇；(1)(0)(0)(0)x x f x α=-•∇；()f xk ε∇<，()x k 是极()0,()0x x =≥g h (1) 等式约束：(,)()()T H x f x x λ=+λg ，利用1210,0,0,0,0n mH H H H Hx x xλλ∂∂∂∂∂=====∂∂∂∂∂解出极大值点或极小值点。

第六章最优控制(2012)资料

x* (t* f )
x*(t f )
c(t)
x* (t )
t* f
t* f (t f )
t
t* f (t f )
考虑相对于最优控制 u*(t)
最优轨线
x* (t )
和
t
* f
的变分
J
'
tf
H
x(t f
), u(t f
), (t f
), t f
由于公用用同一，显然函数的
变分同时包含了函数及其作用时间。
终端时间改变造成的部分，包括函数变分的影响
为简单计，在第二项中，只考虑终端时间变分影响的部分，不考虑函数变分的影响
J (x)
t*f t0
L[x* (t)
(t ),
x* (t)
(t ), t ]dt
(t f
)L[x* (t*f
问题2：如果电动机从初始时刻 t0 0的静止状态转过角度
又停下，求控制 ID (t) （ID (t)是受到限制的），使得所需时间最短。
这也是一个最优控制问题：
系统方程为
x1 x2
0 0
1 x1
0
x2
0 Km
JD
I
D
0 1
JD
TF
初始状态
x1(0)
x2
(0)
0 0
L x2
0
L xn
d dt
L xn
0
两端固定 xi (t0 ) xi0; xi (t f ) xif
两端自由
L
L
x t0 0; x t f 0
L d L 0 x dt x L d L 0 u dt u
x(4) u(2) x x(4) x 0

第五章_最优控制_10

Pontriagin极小值条件：
0 ( x ) x t f
T
H x H f ( x , u , t ), x (t 0 ) x0 x H x * (t ), u * (t ), * (t ) H x * (t ), u (t ), * (t )
tf t0
Mayer型指标：
min J
u
x(t ), t
f
f

求解方法：利用算子将状态方程引入到泛函求极值算式中！
* J min x(t f ), t f u

tf
t0
T & x F x ( t ), u ( t ), t (t ) ） (t ) f ( x(t ), u (t ), t dt tf
minJ
u
s.t. x (t) f x(t),u(t),t, x(t ) x
f f t0 0
x(t ),t Fx(t),u(t),tdt
tf 0
式中：s.t. 为 subject to 的缩写
其它指标形式： Lagrange 型指标：
min J
u
F x(t ), u (t ), t dt

2
1
2 2 ( x x t ) dt
边界条件为x(1)=1, x(2)=2, 试求J为极值时的x*(t)。
5.3.3 向量时的情况设目标函数为：
J(y , y y ) F ( x, y , y , , y , y , y , , y )dx
y1 , y 2 , , y n x1 x0
目标函数：(性能指标）对于连续系统，性能指标一般表示为：

高宏第三章最优控制

第三章最优控制（上）-变分法第一节动态优化简介一、静态优化问题如果一个企业要确定一个最优产出水平x *以最大利润()F x ：0max ()x F x ≥ （1）这样的问题的解通常将是一数，即确定选择变量的单个最优值。

最优值常可由一阶条件()0F x *'=确定。

动态问题是多期（multiperiod ）的，但是并不是有多期的时间就是动态问题．．．．．．．．．．．．．．．．．。

考虑企业的多期决策问题：1max (,)Tt t F t x =∑ （2）(0,1)t x t T = 描述的是每阶段的产出组成的序列，即给出了一个产出的时间路径。

显而易见，总利润不是由单期的产出决定，而是由整个的产出的时间路径确定，所以要使利润最大化，实质上是要找到一条最优的路径（而不是单个期的t x ）。

但由于t 期利润只与t 期的产出有关，所以要在整个时间序列内最大化利润，就只要分别在每一期最大化利润即可，即这一个问题的解是一个有T 个数的集合，1{,}T x x ** 。

所以由于任一产量只影响该期利润，问题（2）实际上是一系列的．．．．静态问题，即在每一期选择当前产量使该期利润最大化。

问题（2）有类似的T 个一阶条件，各期的一阶条件之间没有联系。

在Ramsey 模型的竞争性均衡结构中，生产者问题就具有这样的性质。

二、动态问题具有动态性质的问题是，当前的产出不但影响到当前的利润，还影响到未．．．．．来．的利润。

更为一般地来说，当前决策影响未来决策。

11max (,,).. 0,1Tt t t t F t x x s t x t T-=≥=∑0x 给定或0(0)x x = （3）在问题（3）中，每一期的利润不但取决于当前产量，还与过去的产量有关；换句话说，t 期选择的产量t x 不但影响t 期的利润，还会影响到以后的利润。

注意，上述问题中已指定了0x 。

0x 影响到了以后各期的利润（从而也影响到总利润）。

问题（3）与问题（2）不同，它的最优解的T 个一阶条件不能分别确定，而是要同时确定，也就是我们实际上要“一次性”确定一条最优路径。

第6章最优控制

（鲍尔扎型）
J (u ) [ x(t f ), t f ]
(0 6)
J (u) [ x(t f ), t f ] L[ x(t ), u(t ), t ]dt
t0
tf
(0 7)
第6章线性二次型的最优控制
2. 最优控制问题的数学模型用以下4个方程来描述 (1)给定系统的状态方程 (2)状态方程的边界条件
1956~1958年，庞特里亚金创立“最大值原理”。它是最优控制理论的主要组成部分和该理论发展史上的一个里程碑。对于“最大值原理”，由于放宽了有关条件的使得许多古典变分法和动态规划方法无法解决的工程技术问题得到解决，所以它是解决最优控制问题的一种最普遍的有效的方法。同时，庞特里亚金在《最优过程的数学理论》著作中已经把最优控制理论初步形成了一个完整的体系。
6.3 输出调节器
6.4 跟踪器
1 tf T J (u ) ( x Qx u T Ru)dt 2 t0
线性二次型问题的特点
(0 14)
（1）最优解可写成统一的解析表达式，实现求解过程规范化（2）可以兼顾系统的性能指标（快速性、准确性、稳定性、灵敏度）
第6章线性二次型的最优控制
线性二次型问题的本质：
用不大的控制，来保持较小的误差，以达到能量和误差综合最优的目的。线性二次型问题的三种重要情形：
x(t ) A(t ) x(t ) B(t )u(t ) y(t ) C (t ) x(t )
e(t ) yr (t ) y(t ) 1) 2) 3) C (t ) I yr (t ) 0 yr (t ) 0 yr (t ) 0 y(t ) e(t ) (5 2)
性能指标的物理含义：

第六章最优控制

重点内容： •最优控制的一般问题及类型，泛函与变分，欧拉方程，横截条件。 •变分法求有约束和无约束的最优控制。 •连续系统的极小值原理。 •有限和无限时间状态调节器方法，Riccati方程求解。
6.1 引言 1. 经典控制理论设计控制方法
幅值裕量、相位裕量（频率指标）上升时间、调节时间、超调量（时域指标）特点：系统的控制结构是确定的，控制参数设计一般采用试凑方法，不是最优结果。
由边界条件 : c1 0, c2 2
6.4 有约束条件的泛函极值问题
设
tf
J Fxt, xt,tdt
t0
在 t0,t f 上，F 可微，
1. 约束方程 Gx, t 0 G Rm m n
tf
构造增广泛函： Ja Fx, x,t T tGx,tdt
t0
令 Lx, x,t Fx, x,t T tGx,t
由于 Lx0,x 是 x 的线性连续泛函，
Lx0,x Lx0,x
x
又 rx0,x 关于
的高价无穷小
lim 0 0
rx0 , x
0
J x0
x
0
lim
J x0
x
J x0
lim
1
L
x0
,
x
r
x0
,
x
Jx 在 x0 上达到极值的必要条件
F
T
xdt
t0 x
F
T
x
x
tf t0
t f d t0 dt
F
T
xdt
x
代入上式，且令 J 0
J
tf t0
F x
d dt
F
T
x&

最优控制（最小值原理）1

最优控制最优控制——————最小值原理最小值原理七几种典型的几种典型的工程工程工程应用应用 1．时间最优控制时间最优控制问题，是可以运用极小值原理求解的一个常见的工程实际问题。

如果性能指标是系统有初态转移到目标集的运动时间，则使转移时间为最短的控制称为时间最优控制，或称最速控制。

本节主要介绍线形定常系统的时间最优控制分析法及其应用。

1.1 一类非线性系统的时间最优控制先把需要解决的问题叙述如下：[问题3-1] 移动目标集的一类非线性系统的时间最优控制问题为()1min ,1,2,,fj t u t t J dt j m ≤==∫⋯..s t ① [][]00()(),(),(),()xt f x t t B x t t u t x t x =+=ɺ ② (),0f f x t t ψ =式中()n x t R ∈，()m u t R ∈；()f •和()B •维数适当，其各元对()x t 和t 连续可微；移动目标集()r R ψ•∈，其各元对()f x t 和f t 连续可微，f t 是状态轨线与移动目标集相遇的末端时刻。

显然，问题3-1属于时变条件、积分型性能指标、f t 自由和末端约束的最优控制问题。

根据极小值原理，令哈密顿函数[][]{}(,,,)1()(),(),()T H x u t t f x t t B x t t u t λλ=++ （3-136）正则方程为：[][]()(),(),()Hxt f x t t B x t t u t λ∂==+∂ɺ （3-137） [](),()()()()()TTB x t t u t H ft t t x xx t λλλ ∂∂∂=−=−−∂∂∂ɺ （3-138）边界条件及横截条件为00()x t x = （3-139）(),0f f x t t ψ = （3-140）()()T f f t x t ψλγ∂=∂ （3-141）极小值条件：***1()(),()(),()T T t f x t t t B x t t u t λλ ++{}**1min 1()(),()(),()j T T u t f x t t t B x t t u t λλ≤ =++ 或者[]{}*1()(),()min ()(),()j T T u t B x t t u t t B x t t u t λλ≤ = （3-142）因而得：**()sgn (,)()T u t B x t t λ =− （3-143）式中sgn()•为符号函数。

最优控制笔记

《最优控制》第4章线性系统二次型性能指标的最优控制问题

最优控制6-1

最优控制内容要点

最优控制笔记整理

11讲 最优控制-极小值-总结及习题讲解

第七章 最优控制：最大值原理

第6章 最优控制

最优控制理论考试重点

最优控制笔记

最 优 控 制 (8)

最优控制总结

胡寿松《自动控制原理》笔记和课后习题(含考研真题)详解(动态系统的最优控制方法)【圣才出品】

第六章最优控制

最优控制总结

第六章 最优控制(2012)资料

第五章_最优控制_10

高宏第三章 最优控制

第6章 最优控制

第六章 最优控制

最优控制（最小值原理）1

11讲最优控制-极小值-总结及习题讲解

第七章最优控制：最大值原理

第6章最优控制

最优控制 (8)

第六章最优控制(2012)资料

高宏第三章最优控制

第6章最优控制

第六章最优控制