最优控制4资料

合集下载

最优控制理论课件

最优控制理论课件

8
最优控制问题
1.1 两个例子
例1.1 飞船软着陆问题
软着陆 过程开 始时刻 t 为零
h& v
v& u g m
m& K u
m 飞船的质量 h 高度 v 垂直速度 g 月球重力加速度常数 M 飞船自身质量 F 燃料的质量 K 为常数
初始状态 h(0) h0 v(0) v0 m(0)MF
f(x(t),u(t),t) 为n维向量函数
22.03.2020
现代控制理论
24
最优控制问题
1.2 问题描述
(1) 状态方程 一般形式为
x&(t) f (x(t),u(t),t)
x(t) Rn
x(t)|tt0 x0
为n维状态向量
u(t) Rr
为r 维控制向量
f(x(t),u(t),t) 为n维向量函数
求解最优控制的变分方法
泛函与函数的几何解释
22.03.2020
现代控制理论
50
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
22.03.2020
现代控制理论
51
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
泛函的增量 J ( x ( g ) ) J ( x ( g ) x ) J ( x ( g ) ) L ( x , x ) r ( x , x )
J x ( T ) ,y ( T ) ,x & ( T ) ,y & ( T ) x & ( T )
控制
(t)
22.03.2020
现代控制理论

最优控制 第三章 静态最优化问题的最优控制

最优控制 第三章 静态最优化问题的最优控制
第三章 静态最优化问题的最优控制
5
它在定义域上可以不止一个, 它在定义域上可以不止一个,如果将整个定义 上所有的极小值进行比较, 域[a,b]上所有的极小值进行比较,找出最小的极小 上所有的极小值进行比较 称为最小值 它具有全局性质, 最小值。 值,称为最小值。它具有全局性质,而且是唯一 的。一般地记为
三、具有等式约束条件的极值
上面讲的是无约束条件极值问题的求解方法。 上面讲的是无约束条件极值问题的求解方法。 对于具有等式约束条件的极值问题,则要通过等效 对于具有等式约束条件的极值问题, 变换,化为无约束条件的极值问题来求解。 变换,化为无约束条件的极值问题来求解。
第三章 静态最优化问题的最优控制
第三章 静态最优化问题的最优控制
18
嵌入法只适用于简单情况, 嵌入法只适用于简单情况,而拉格朗日乘子 法具有普遍意义。现把式(3-15)写成更为一般的形 法具有普遍意义。现把式 写成更为一般的形 式。 目标函数为 设连续可微的目标函数 设连续可微的目标函数为 J = f(x,u) 等式约束条件为 等式约束条件为 g(x,u) = 0 式中x——n维列矢量; 维列矢量; 式中 维列矢量 u——r维列矢量; 维列矢量; 维列矢量 g——n维矢量函数。 维矢量函数。 维矢量函数
第三章 静态最优化问题的最优控制 19
(3-18)
(3-19)
在拉格朗日乘子法中,用乘子矢量 乘等式 在拉格朗日乘子法中,用乘子矢量λ乘等式 约束条件并与目标函数相加,构造拉格朗日函数 约束条件并与目标函数相加,构造拉格朗日函数
H = J + λ g = f ( x, u) + λ g( x, u)
第三章 静态最优化问题的最优控制
13
显然, 显然,式(3-11)取极值的条件为 取极值的条件为

机械工程控制基础复习资料

机械工程控制基础复习资料

一、填空1.机械工程控制基础:是研究一机械工程技术为对象的控制论问题;是研究在这一工程领域中广义系统的动力学问题,也就是研究系统及其输入、输出三者之间的动态关系。

2.系统分析:当系统已定,输入知道时,求出系统的输出(响应),并通过输出来研究系统本身的有关问题。

3.最优控制:当系统已定,且系统的输出也已给定,要确定系统的输入应使输出尽可能符合给定的最佳要求。

4.最优设计:当输入已知,且输出也是给定时,确定系统应使得输出尽可能符合给定的最佳要求。

5. 系统识别或系统的辨识:当输入与输出均已知时,求出系统的结构与参数,即建立系统的数学模型。

6.信息传递:是指信息在系统及过程中以某种关系动态地传递,或称转换。

7.信息的反馈:就是把一个系统的输出信号不断直接地或经过中间变换后全部或部分地返回,再输入到系统中去。

8.控制系统:是指系统的输出,能按照要求的参考输入或控制输入进行调节的。

9.按系统是否存在反馈,将系统分为开环系统和闭环系统。

10.开环系统:系统的输出量对系统无控制作用,或者说系统中无反馈回路。

11.闭环系统:系统的输出量对系统有控制作用,或者说,系统中存在反馈的回路。

12.数学模型:是系统动态特性的数学表达式。

13.分析法:是依据系统本省所遵循的有关定律列写数学表达式。

14.实验法:是根据系统对某些典型输入信号的响应或其它实验数据建立数学模型。

15.线性系统:系统的数学模型表达式是线性。

16.非线性系统的最重要特性,是不能运用叠加原理。

17. 传递函数:线性定常系统的传递函数,是初始条件为零时,系统输出地拉氏变换比输入的拉氏变换。

18. 传递函数:是通过输入与输出之间信息的传递关系,来描述系统本省的动态特性。

19.方块图:是系统中各环节的功能和信号流向的图解表示方法。

20.串联:各个环节传递函数一个个顺序连接。

21.并联:凡是几个环节的输入相同,输出相加或想减的连接形式。

22.反馈:是将系统或某一环节的输出量,全部或部分地通过传递函数回输到输入端,又重新输入到系统中去。

最优控制ppt课件

最优控制ppt课件
称 J (X ) 在 XX*处有极值(极大值或极小值)。
精品课件
定理(变分预备定理):设 ( t )
是时间区间
[t0, t1]上连续的n维向量( t函) 数,
的连续n维向量函数(t,0)且(t1)0

t1
T
(t)(t)dt
,若
0
t0
是任意
则必有
(t)0,t[t0,t1]
精品课件
4.1.2 欧拉方程
LX,XrX,X
这里,LX,X 是X 的线性泛函,rX,X 是关于 X
的 高阶无穷小,则
JLX,X
称为泛函J[x]的变分。 可知泛函变分就是泛函增量 的线性主部。
精品课件
当一个泛函具有变分时,也称该泛函可微。和函 数的微分一样,泛函的变分可以利用求导的方 法来确定。
定理 设J[x]是线性赋范空间Rn上的连续泛函
返回主目录
精品课件
在动态系统最优控制问题中,性能指标是 一个泛函,性能指标最优即泛函达到极值。解决泛 函极值问题的有力工具是变分法。所以下面就来列 出变分法中的一些主要结果,大部分不加证明,但 读者可对照微分学中的结果来理解。
精品课件
4.1.1 泛函与变分
先来给出下面的一些定义。
1、泛函: 如果对某一类函数X(t)中的每一个函
(1) (L1 L2 ) L1 L2
(2) ( L1L2 ) L2 L1 L1 L2
b
b
(3) a L[ x, x, t]dt a L[ x, x, t]dt
(4) dx d x
dt dt 精品课件
举例:
可见,计算泛函的变分如同计算函数的微分一样。
精品课件
6、泛函的极值:若存在 0 ,对满足的 X X* 一切X,J(X)J(X*)具有同一符号,则

系统最优控制资料

系统最优控制资料
系统目标泛函J达到最大或最小。这样的控制u(t)就称系统的最优控制u*(t),将 u*(t)代入系统状态方程就可解得系统的状态轨迹X(t),称之为最优状态轨迹 X*(t)。
• 一个最优控制问题的复杂程度,或者说其求解和实现的难易程度是由上述四 方面的具体规定,特别是系统的性能指标的具体形式来决定的。一般来说,
• 常用的最优化求解方法有变分法、最大值原理以及动态规划 法等。
• 控制系统的最优控制问题一般提法为:对于用动态方程描述 的系统,在某初始和终端状态条件下,从系统所允许的某控
制系统集合中寻找一个控制,使得给定的系统的性能目标函 数达到最优。
最优控制问题的描述
1、系统的状态方程。 对连续系统,其状态方程为: X f ( X (t ), u(t ), t ) 对离散系统,其状态方程为: X(k+1)=f( X(k), u(k), k ) 系统状态方程给出了系统内部状态随系统控制输入的变化关系,或者说是 内部状态的一种约束关系,或者说是系统状态在整个控制过程的转移约束 关系。
1953-1957年,贝尔曼(R.E.Bellman)创立“动态规划”原理。 为了解决多阶段决策过程逐步创立的,依据最优化原理,用一组基本 的递推关系式使过程连续地最优转移。“动态规划”对于研究最优控 制理论的重要性,表现于可得出离散时间系统的理论结果和迭代算法。
1956-1958年,庞特里亚金创立“极小值原理”。 它是最优控制理论的主要组成部分和该理论发展史上的一个里程 碑。对于“最大值原理”,由于放宽了有关条件的使得许多古典 变分法和动态规划方法无法解决的工程技术问题得到解决,所以 它是解决最优控制问题的一种最普遍的有效的方法。同时,庞特 里亚金在《最优过程的数学理论》著作中已经把最优控制理论初 步形成了一个完整的体系。

6 最优控制

6 最优控制

则H 取极值
的必要条件
H x
f x
(
g x
)T
0
H u
f u
(
g u
)T
0
H
g(
x
,u
)0
其中
(
g x
g1 T
)T

x
gn
g1
x1
g1
x
xn
gn
x1
gn
xn
6.4 泛函及其极值--变分法
6.4.1 变分法的基本概念
1.泛函:
设对于自变量 x,存在一类函数 yx,对
由边界条件确定。 xt
四种边界条件:
a.固定端点: x( t f )0
x
tf t0
t0
d dt
L x
xdt
分部积分:
uv dxuv vudx
tf
J
L x
x
tf t0
t0
Lx
d dt
L x
xdt 0tfJ L xxtf t0
t0
L x
d dt
L x
xdt 0
xt 不受约束 x 任意
故泛函 J 取极值的必要条件:
1 ) L x
d dt
L x
0
欧拉方程
LL( x ,x ,t )
始端自由: x( t f )=0
L x
t0
0
x( t0 ) 0
x( t f ) x f
终端自由: x( t f ) 0
L
x
t
f
0
x( t0 )=0
x( t0 ) x0
两端自由: x( t f ) 0 x( t0 ) 0

第6章 最优控制

第6章 最优控制

6.12.4 输出调节器问题 1.输出调节器的任务是当系统受到外扰时,在不消耗过多能量的前提下, 维持系统的输出矢量接近其平衡状态。 1.线性时变系统输出调节器问题 给定一个能观的线性时变系统:
性能泛函为:
于是可以用状态调节器上式来确定最优控制:
式中,
为下列黎卡提距阵微分方程的解:
边界条件:
2. 线性定常系统输出调节器问题 给定一个完全能控、能观的线性定常系统:
式中, 成,即
为正定(或半正定)对称阵; 是由输出变量
为正定对称阵。 的线性负反馈所构
如上所述,设控制变量
闭环系统结构图示如下图所示:
从图可得闭环系统的状态方程: (1)
式中,
为闭环系统的状态矩阵。
此时,性能指标演化为:
(2) 式中 在规定了系统结构的情况下,设计任务就是确定输出反馈矩阵K,使性 能指标式(2)取极值。 对渐近稳定系统式(1),构造一个李雅普诺夫函数:
状态轨线及开关曲线 最优控制律 转移到终态(0,0)。
为了使系统的状态能以最小时间从初态
当初态所划位置不同时,应当采取的控制规律不同。但是,凡不在开关曲线 上的点,至少要经过一次切换,转到开关曲线后才能沿着 γ+或γ-到达原点(0, 0)。因此,按照初态 所处的位置可得到下列最优控制规律:
若将开关曲线写成:
(3) 将上式两边求导数,得:
对于渐近稳定的系统,当 为此,令: 式中Q 为正定的实对称阵。 因此 是负定的。比较式(5)和式(3)可得:
必须为负定。 (4)
(5)
(6)
将式(6)代入式(2),得性能指标:
由于A 所有特征值均具负实部,故有
,从而下式成立: (7)
此外,反馈矩阵K 亦不能从李雅普诺夫方程: (8)

第7章 最优控制

第7章 最优控制

第七章 最优控制(Optimal Control )最优化(Optimization ):生产过程的控制,企业的生产调度,对资金、材料、设备的分配,经济政策的制定等都与最优化有关。

最优控制:通常是针对控制系统本身而言的,目的是使一个机组、一台设备、或一个生产过程实现局部最优。

7-1概述1.最优分配问题:仓库(水泥) 运费(元/包) 工地(需要水泥)问应怎样发送这些水泥,才能使运费最省?设:从甲仓库运往A 、B 、C 工地的水泥数分别为1x 、2x 、3x ;从乙仓库运往A 、B 、C 工地的水泥数分别为4x 、5x 、6x 目标函数()x f (总运费):()65432195442x x x x x x x f +++++= 最优化的任务:确定[]Tx x x x x x x 654321=的值,使()x f 为最小。

约束条件:⎪⎪⎪⎩⎪⎪⎪⎨⎧=+=+=+≤++≤++1200600900180********241654321x x x x x x x x x x x x该问题称为具有不等式约束条件的线性最优化问题,属于静态最优化问题,变量x 与时间无关2.动态最优化问题动态最优化问题:在最优控制系统中,受控对象是一个动态系统,所有变量都是时间的函数。

目标函数:是时间函数的函数,称为泛函数(简称泛函) 例:目标泛函 ()()[]⎰=ft t dt t t u t x L J 0,,基本约束条件(受控对象的状态方程):()()()[]t t u t x f t x ,,= J----标量L----标量函数()t x ----n 维状态矢量 ()t u ----r 维控制矢量f ----n 维矢量函数最优控制问题:在满足约束条件下,寻求最优控制函数()t u ,使目标泛函J 取极值(最小或最大),即()max min =J 。

3.求解动态最优化问题的方法古典变分法、极小(大)值原理、动态规划法7-2研究最优控制的前提条件1.给出受控系统的动态描述,即状态方程()()()[]t t u t x f t x,,= 2.明确控制作用域控制集:()(){}0,≤=u x j t u U ϕ()()r m m j u x j ≤=≤;,,2,10, ϕ----()t u 满足的约束条件容许控制:()U t u ∈ 3.明确始端条件 固定始端:()0t x 给定 自由始端:()0t x 任意可变始端:()00Ω∈t x 始端集:()()[]{}0000==Ωt x j t x ρ()[]()n m m j t x j ≤==;,2,100 ρ----()0t x 必须满足的约束条件 4. 明确终端条件固定终端:f t 、()f t x 给定 自由终端:f t 给定、()f t x 任意可变终端:()f f t x Ω∈ 目标集:()()[]{}0==Ωf j t x ff t x ϕ()[]()n m m j t x f j ≤==;,2,10 ϕ----()f t x 必须满足的约束条件5. 给出目标泛函(即性能指标) 对于连续时间系统,一般表示为:()[]()()[]⎰+Φ=ft t f dt t t u t x L t x J 0,, (综合型或鲍尔扎型)()[]f t x Φ----终端指标函数,反映对终端性能的要求;()()[]⎰ft t dt t t u t x L 0,,----动态指标函数,L 为状态控制过程中对动态品质及能量或燃料消耗的要求等。

现代控制理论CA14-最优控制资料

现代控制理论CA14-最优控制资料
m(t)
m(t) ku(t)
边界条件
h(0) h0, v(0) v0, m(0) m0 M F
h(t f ) 0, v(t f ) 0
控制约束 0 u(t) umax
性能指标
J m(t f )
燃料消耗量 为最少
最优控制问题的组成
• 系统数学模型(状态方程) • 边界条件(初态和末态) • 容许控制(控制向量的取值范围) • 性能指标
曲线满足运动微分方程
f (x, x,t) 0
极值轨线x(t)满足如下欧拉方程
L d L 0 x dt x
L(x, x,,t) g(x, x,t) T (t) f (x, x,t)
约束 方程
例 人造地球卫星姿态控制系统
x
0 0
1 0
x
0 1
u
J 1 2 uபைடு நூலகம்dt 20
求使性能泛函取极值的极值轨线和极值控 制
状态调节器
对于运行于某一平衡状态的系 统,在受到扰动偏离原平衡状 态时,使系统恢复到原平衡状 态附近时要求的性能。
J
1 2
xT
(t f
)Fx(t f
)
1 2
tf [xTQx(t) uT (t)Ru(t)]dt
t0
末态偏差
状态偏差
控制能量
输出跟踪系统
J
1 2
eT
(t f
)Fe(t f
)
1 2
tf [eTQe(t) uT (t)Ru(t)]dt
14 .3 极小值原理
应用经典变分法解最优控制问题, 要求控制向量不受任何约束.
为解决控制有约束的变分问题, 庞特里亚金提出并证明了极小值原理, 能够应用于控制变量受边界限制的情 况。

北航最优控制ppt第三章

北航最优控制ppt第三章

5、泛函的变分: 当自变量函数 X (t ) 有变分δX 时, 泛函的增量为
∆J = J [X + δX ] − J [X ]
= δJ [X ,δX ] + ε δX
这里, [X , δX ] 是 δX 的线性泛函,若 δX → 0 时, δJ 有ε → 0,则称δJ [X , δX ] 是泛函 J [X ] 的变分。 J 是 ∆J δ 的线性主部。
6、泛函的极值:若存在ε > 0 ,对满足的 X − X * < ε 一切X,J ( X ) − J ( X * ) 具有同一符号,则 称 J ( X ) 在 X = X *处有极值。
定理: ( X ) 在 X = X * 处有极值的必要条件是对 J
于所有容许的增量函数 δX (自变量的变分), 泛函 J ( X ) 在 X * 处的变分为零
例3-1
求通过点(0,0)及(1,1)且使
& J = ∫ ( x 2 + x 2 )dt
0 1
x * (t )。 取极值的轨迹
解 这是固定端点问题,相应的欧拉——拉格朗日方 程为 d
2x − dt & (2 x) = 0

&& − x = 0 x
它的通解形式为
x (t ) = Acht + Bsht
现在,将上面对 x(t ) 是标量函数时所得到的公式推 广到 X (t )是n维向量函数的情况。这时,性能泛函为
& J = ∫ F ( X , X , t )dt
t0 tf
(3-9)
式中
x1 (t ) x (t ) X = 2 M xn (t )
& x1 (t ) x (t ) & & = 2 X M & x n (t )

数学建模——最优控制

数学建模——最优控制

30
H对最优控制取极小值.
H x * (t ), u * (t ), * (t ), t
u ( t )U , tt 0 ,T
min
H ( x * (t ), u (t ), * (t ), t )
40 在最优轨线上:
H * (t ) H * (T ) T H t t
dh v dt dv u g dt m dm (k>0 为常数) ku dt
v h
.
o
图 2
( 5 )
要求飞船从初始状态
h(0) h0 v (0) v0 m(0) M F
( 7 )
实现软着陆
h (T ) 0 v (T ) 0
( 8 )
发动机的最大推力为 a ,故
单位时间单位产品的库存费用为b, 则t时刻单位时间的成本为:
L(t , x(t ), u(t )) h(u(t )) bx(t )
故总成本为
T J (u) L(t , x(t ), u (t ))dt t0
(4)
于是问题归结为:求满足条件(2)的生产速率u(t),使库存量满 足(3),且使J(u)为最小.
续表:
按末端 状态分 末端自由 末端时间固定 末端时间自由 定常问题 按函数 类型分 末值状态可以任意 到达末态的时刻 T固定 到达末态的时刻 T 不固定 状态方程,性能指标和末态约束中的函数均不显含时间 t
时变问题
线性系统问题 非线性系统问题 调节器问题 跟踪问题
状态方程,性能指标和末态约束中的函数有显含时间 t 的 状态方程中的函数关于 x(t), u(t)均是线性的
1 最优控制问题实例 最优控制问题是从大量的实际问题中提炼出来 的。下面通过几个典型例子说明什么是最优控制。 例1 生产计划问题 某工厂制定从t0到T时间间隔的生产计划,即要 选择适当的生产速率,使得在时间[t0 , T]内,在保 证供应的前提下,花费的成本最低。

电力拖动考试资料1

电力拖动考试资料1

1.常用的可控直流电源:旋转变流机组、静止式可控整流器、直流斩波器或脉宽调制变换器。

2.静止式可控整流器:晶闸管—电动机调速系统(简称V —M 系统)3.工作原理:通过调节触发装置GT 的控制电压Uc 来移动触发脉冲的相位,即可改变平均整流电压Ud ,从而实现平滑调速。

3.可逆脉宽调速系统原理:由VT1-VT4共4个电力电子开关器件构成桥式(或H 形)可逆脉冲宽度调制变换器(PWM )4.抑制电流脉动的措施:①增加整流电路相数或采用多重化技术②设置平波电抗器。

5.用触发脉冲的相位角α控制整流电压的平均值Ud0是晶闸管整流器的特点6.晶闸管—电动机系统的机械特性:改变控制角α,可得一簇平行直线。

只要电流连续晶闸管可控整流器就可以看成一个线性的可控电压源。

7.完整的V-M 系统机械特性:包含整流状态(α<90 )和逆变状态(α>90 )当电流连续时,特性还比较硬,断续段的特性还很软,而且呈显著地非线性,理想空载转速翘的很高。

6.晶闸管触发和整流装置的放大系数,,,晶闸管触发和整流装置可看成是一个纯滞后环节,其滞后效应是有晶闸管的失控时间引起的。

8.直流脉宽调速系统(直流PWM 调速系统):采用脉冲宽度调制的高频开关控制方式,形成了脉宽调制变换器—直流电动机调速系统。

9.与V-M 系统相比PWM 系统的优越性:①主电路简单,需要用的电子电路器件少②开关频率高电流容易连续,谐波少,电机损耗及发热都小③低速性能好,稳速精度高,调速范围宽,可达1:10000左右④若与快速响应的电动机配合,则系统频带宽,动态响应快,动态抗扰性能强⑤电力电子开关器件工作在开关状态,导通损耗小,当开关频率适当时,开关损耗也不大,因而装置效率较高⑥直流电源采用不控整流时,电网功率因数比相控整流器高10.桥式可逆PWM 变换器控制方式:双极式、单极式、受限单极式等11.双极式控制优缺点:优/在电动机停止时仍有高频微振电流,从而消除了正反方向时的静摩擦死区起着动力润滑的作用。

最优控制第五章用变分法求解连续最优控制问题—有约束条件的泛函极值

最优控制第五章用变分法求解连续最优控制问题—有约束条件的泛函极值

xT


H x
uT

H u

d
t

xT

tf t0
使J´取极小的必要条件是,对任意的δu和δx,
都有δJ´=0成立。
因此得
H 0
x H x

H 0 u
tf 0 t0
(5-9) (5-10) (5-11) (5-12)
(5-5)
或 J tf H x, x,u, ,td t t0
(5-6)
式中
Hx, x,u,,t Lxt,ut,t T tf xt,ut,t xt
(5-7)
对式(5-5)右边第二项作分部积分,得
t f T x d t t f T x d t T x t f
为此,构造增广泛函
J Φxt f ,t f T Nxt f ,t f

t f
t0
Lxt,ut,t T
t f
xt , ut , t
xt d t
(5-21)
写出哈密顿函数
Hxt,ut,t,t Lxt,ut,t T t f xt,ut,t
(5-25)
ut u*t ut
(5-26)
tf

t
* f
t f
(5-27)
x(t) δx (t* f)
x*(t)
x(t) x(t0)
x
t
f
t f
δx(tf)
0 t0
t*f t*f+ δtf
t
图4 可变终端各变分间的关系
从图4可知在端点处变分之间存在下列近似关系
考虑到式(5-24)右边第一项和第二项的一次

最优控制系统

最优控制系统

L x , x r x , x
1
0 0
§1.1 变分法的基本概念
§1.1.1 泛函和变分 泛函变分的规则 (1) (2)
( L1 L2 ) L1 L2
( L1L2 ) L1 L2 L2 L1
L[ x, x, t ]dt L[ x, x, t ]dt
且满足 t0 若
tf
t 0
f
t t dt 0
必有
t0
则:t [t , t ] 0 f 推广到向量函数:
t 0
若: T t t dt 0
t0 tf
(t ) [ 1(t ) 2(t ) n(t )]T
*
0 处达到极值。
§1.2
欧拉方程
§1.2.2 欧拉方程
J [ x x ] 根据极值存在的必要条件: 0
tf
0
J
tf
tf
J L x* t x (t ), x* t x (t ), t dt
x
t1
t2
§1.1 变分法的基本概念
§1.1.1 泛函和变分 泛函的变分 泛函的变分与函数的微分定义类似。 回顾 若函数y=f(x)导数存在, 那么他的增量可以表示为:
y f ( x x) f ( x) f ( x)x ( x, x) J J [ x x] J [ x]
J L x t , x t , t dt
t0 tf
t
J L x* t x (t ), x* t x (t ), t dt

最优控制总结

最优控制总结

/系统的数学模型,物理约束条件及性能指标。

数学描述:设被控对象的状态方程及初始条件为()[(),(),],(0)0x t f x t u t t x t x ==;其中,()x t X Rn ∈⊂为状态向量,X 为状态向量的可容许集;()u t Rm ∈Ω⊂为控制向量,Ω为控制向量的可容许集。

试确定容许的最优控制*()u t 和最优状态轨迹*()x t ,使得系统实现从初始状态(0)x t 到目标集[(),]0x tf tf ψ=的转移,同时使得性能指标0[(),][(),(),]tft J x tf tf L x t u t t dt ϕ=+⎰达到极值。

系统状态方程形式(连续,离散)(2)最优控制形式(开环,闭环) (3)实际应用(时间,燃料,能量,终端) (4)终端条件(固定,自由) (5)被控对象形目标函数及约束条件组成的静态优化问题可以描述为:在满足一系列约束条件的可行域中,确定一组优化变量,(极大值或极小值)。

数学描述:min (),,:n nf x x R f R R ∈→,..()0,:;()0,:n m n l s tg x g R R h x h R R =→≥→静态最优化问题,也称为参数最优化问题,它的三个基本要素是优化变量、目标函数和约束条件,其本质是解决函数,也称为最优控制问题,它的三个基本要素是被控对象数学模型、物理约束条件和性能指标,其本质是解 多变量目标函数沿着初始搜索点的负梯度方向搜索,函数值下降最快,又称最速下降法;(2)多变量无约束。

根据具体的最优换问题构造合适的惩罚函数,将多变量有约束最优化问题转换为一系列多变量无约束最优化问题,从而采用合适;(2)多变量有约束(外点法:等式约,不等式约束;内点法:不等式约束)。

通过构造拉格朗日函数,将原多变量有约束最优化问题转化为一个多变量无约束最优化问题,从而采用合适的无约束方法继(等式约束,不等式约束)。

梯度定义12()()()()f x x f x f x f x xx ∂⎡⎤⎢⎥∂∂⎢⎥=∇=⎢⎥∂∂⎢⎥∂⎣⎦,Hessian 矩阵22221212222212()()f f x x x f x H x x f f x x x ⎡⎤∂∂⎢⎥∂∂∂∂⎢⎥==⎢⎥∂∂∂⎢⎥∂∂∂⎢⎥⎣⎦,最优梯度法(无约束):迭代(1)()()()()k k k k x x f x α+=-∇,()()()()()()()()()()()k T k k k T k k f x f x f x H x f x α∇∇=∇∇,终止误差()()()k p k f x ε=-∇≤ 例:(),(0),()f x f x H x ∇∇;(0)[(0)(0)]f x T f x α=∇•∇/[(0)(0)]T f x H f x ∇••∇;(1)(0)(0)(0)x x f x α=-•∇;()f xk ε∇<,()x k 是极()0,()0x x =≥g h (1) 等式约束:(,)()()T H x f x x λ=+λg ,利用1210,0,0,0,0n mH H H H Hx x xλλ∂∂∂∂∂=====∂∂∂∂∂解出极大值点或极小值点。

最优控制 西安交通大学课件lecture9

最优控制 西安交通大学课件lecture9
高峰、吴江 8
SEI
从另一角度看泛函求极值问题
这种离散泛函求极值问题称为多段决策过程
高峰、吴江 9
SEI
加性可分目标函数

可分

本段的目标f(x(k),u(k),k),只决定于本段的段 变量k ,本段的控制u(k),本段的状态x(k) 。 总目标为各段目标之和。
高峰、吴江 10加性ຫໍສະໝຸດ SEI提纲
Δ u k
高峰、吴江 31
SEI
动态规划的连续形式(HamiltonJacobi-Bellman方程)
高峰、吴江
32
SEI
思考的问题


最优控制的经典内容已经结束,考虑一下对最 优控制理论与方法的理解。 是否可以演绎出最优控制理论与方法的体系? 依从于什么样的线索? 如果能做到这一点,最优控制就真的变成你自 己的了。 你的大脑改变了!
T
2 F
7
D
3
为找到S->T的最优路线,先找出各站到终 点T的最优路线。

表面上,多作了计算,但在迭代求解过程中, 每一步只需作很简单的计算。

最优决策S->B->C->F->T中,从任一点开始 到T的任一段,如C->F->T也是从C到T的最 优决策。
高峰、吴江
动态规划 最优性原理
16
SEI
动态规划的基本假定

而每倒递推一阶段都不是孤立地只考虑这一 阶段的性能指标,而总是从这一阶段直到最 后一阶段构成全局最优决策的角度来确定这 一阶段的最优决策。
例6-1 p175-176
高峰、吴江 20
SEI
提纲

最大值原理回顾 多段决策过程 动态规划与Bellman方程
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(4 10)
第4章
平凡最短时间控制系统
瞬 第q*j刻一只才类是取间在零断各值点个,的孤u分*j立是段的有恒
值函数。
奇异(非平凡)最短时间 控制系统。 并不意味着在该区间内最 优控制不存在,仅表明, 从必要条件不能推出确切 关系式。
第4章
4.2 线性时不变系统的最短时间控制问题
线性时间最优调节器问题的提法: 设受控系统状态方程为
qj
1
2
...
n
b21
b22 ... ......
b2m
u2
...
m
n
u j{ biji}
j 1
i 1
(4 7)
bn1
bn2
...
bnm
um
则极值条件可写为:
m
m
u*jq*j min u j q*j
j 1
u j 1 j 1
(4 8)
第4章
m
m
u*jq*j min u j q*j
1 T ( f Bu*) min {1 T ( f Bu)}
u j (t ) 1
(4 6)
T B[x*(t),t]u*(t) min {T B[x*(t),t]u(t)} ( j 1, 2,..., m)
u j (t ) 1
将(4-6)式中的矩阵表达式展开成分量形式
b11 b12 ... b1m u1
x&(t) Ax(t) Bu(t)
(4 11)
给定终端约束条件为
x(t0 ) x(0) a
寻求m维有界闭集中x(的t f )最优0控制u*(t),(4满1足2)不等式约束
uj (t) 1 ( j 1, 2,..., m) (4 13) 使系统从以最短时间从初始状态 x(0) 转移到状态空间原点。
j 1
u j 1 j 1
(4 8)
m
由式(4-8)可见,由于 q*j 是确定的,故使 u jq*j 取极小值的最优控制为
j 1
1
u
* j

1
不定
qj 0 qj 0 qj 0
(4 9)
(砰-砰控制)
u* j
1
0
q*j
1
n
或简写为:
u*j
sgn
q* j
sgn{
bij i }
i 1
根据 q*j 是否为零,将系统分为两种情形:
第4章
第4章 最短时间和最少燃料控制
本章主要内容:
4.1 非线性系统的 4.2 线性时不变系统 4.3 双积分模型的 4.4 非线性系统的 4.5 线性时不变系统 4.6 双积分模型的
最短时间控制问题 最少燃料控制问题
时间最优控制:导弹以最短时间击毁敌机 最少燃料最优控制:航天航空控制(高度、姿态、交会)
中全部为非奇异矩阵时,系统是平凡的。(至少有一个为奇异矩阵 时,系统是奇异的)
(2)系统最优解存在的条件:常数矩阵A的特征值全部具有非正实部。
(3)最优解唯一性定理:系统是平凡的且最短时间控制存在,则最短时 间控制必然是唯一的。
(4)开关次数定理:系统是平凡的且最短时间控制存在,又若系统矩阵
A的特征值均为实数,则最优控制u*的任一分量
使系统从已知初始状态 x(t0 ) 转移到目标集中某一状态 x(t f ) 时,如
下目标泛函取极小值,其中 t f 未知
J[u(t)]
tf t0
dt
tf
t
0
(4 4)
第4章
应用最小值原理,系统的哈密尔顿函数为:
H[x(t), (t),u(t),t] 1 T ( f Bu) (4 5)
在使J最小以实现最优控制的必要条件中,侧重分析极值条件
的开关序列为:
{1},{1},{1,1},{1,1}
第4章
双积分模型最短时间控制问题的提法:
已知二阶系统的状态方程为
x&1(t) x2 (t) x&2 (t) u(t)
(4 21)
给定端点约束条件为
x(0) [x10 x20 ]T 寻求有界闭x集(t中f )的 [最0 优控0制]T u*(t),(4满足22不) 等式约束
u(t) 1
(4 23)
。(n为系统维数)
u
*的切换次数最多为n-1次
j
第4章
4.3 双积分模型的最短时间控制问题
双积分模型的物理意义:惯性负载在无阻力环境中运动
m 质量,y(t) 位移,f (t) 作用力
负载运动方程:
m&y&(t) f (t) (4 16)
传递函数:
G(s) Y (s) 1 (4 17) (由两个积分环节组成) F (s) ms2
(4 24)
1 (t
2 (t)
) H 0
x1
H x2
1
12((tt))1010t 20
u* sgn(20 10t) 1
第4章
u*(t) sgn(2t) sgn(20 10t) 1
(4 25)
由式(4-25)可知,2 (t)为一直线,由于开关次数的限制,其四种可能
使系统以最短时间从任意初态转移到终态。
先判断该系统是否平凡?
x(t)
0 0
1 0
x(t)
10u(t)
G [B
AB]
0 1
1 0
第4章
由上节重要结论可知:
(1)本系统为平凡最短时间控制系统
(2)其时间最优控制存在且唯一 (3)时间最优控制u(t)至多切换一次
最优控制表达式:
u* sgn{BT λ(t)} sgn[2 (t)] 下面利用协态方程求解 2 (t) H 1 T f 1 1x2 2u
根据上一节的结论,可得极值条件为:
u*j
sgn q* j
sgn{bTj
λ* (t )}
(4 14)
第4章
对于线性时不变系统的最短时间控制问题,经过理论推导和证明,可得 如下重要结论:
(1)系统平凡的充要条件:当且仅当m个矩阵
Gj [bj, Abj, A2bj,..., An1bj ] (4 15)
第4章
4.1 非线性系统的最短时间控制问题
最短时间控制问题的提法: 设受控系统状态方程为
x&(t) f [x(t),t] B[x(t),t]u(t)
(4 1)
给定终端约束条件为
x(t0 ) x0
寻求m维有界闭集中的[x最(t f优),控t f ]制u0*(t),(4满 2足) 不等式约束
uj (t) 1 ( j 1, 2,..., m) (4 3)
定义u(t)=f(t)/m , 则(4-16)式变为: &y&(t) u(t) (4 18)
取状态变量
x1(t) y(t), x2 (t) y(t)
则有
x&1(t) x2 (t) x&2 (t) u(t)
(4 19)
矩阵形式为:
x&(t)
0 0
1 0
x(t)
0 1
u(t
)
(4 20)
相关文档
最新文档