最优控制理论考试重点
最优控制内容要点
④ 性能指标
反映和评价系统性能优劣的指标。
tf t0
J [[ x (t f ), t f ] f [ x (t ), u (t ), t ]dt
性能指标值的大小依赖于控制作用的整体u(· )的选择, 而不是取决于控制u(t)在t时刻的值;因此J[u(· )]是控制函 数u(· )的函数(称为u(· )的泛函)。
5
习题
1.求使 min f ( X ) 4x12 5x2 2 , 且 g ( X ) 2x1 3x2 6 0
2.求原点到曲线 y 2 ( x 1) 3 0 的距离为最小。 3.求函数极值 f ( X ) x1 2 x2 2 x3 2,若 ( x1 x2 )2 x32 1
t* f
2.tf和x(tf)受c(tf)曲线约束 x(t0)=x0
* x(t * ) c ( t f f ) L c(t ) x(t ) L 0, x
3. tf自由,x(tf)固定 x(t0)=x0和x(tf*)=xf
L (t ) Lx 0, x t t* f
( x , x , t ) m
引入矢量拉格郎日乘子λ(t)=[λ1(t) λ2(t) …λm(t)]T将微 分方程约束条件结合到性能泛函中构成一个新泛函,即
15
, t ] λ TΛ[x, x , t ] dt J' L[x, x
t0
tf
于是,在微分方程组约束下求泛函的条件极值问题,只 需用拉格朗日乘子法将有约束条件问题转化为无约束条件问 题来解决。假设函数x1(t),x2(t),…,xn(t) ,λ1(t), λ2(t), …, λm(t)使泛函J'取极值,那么这n+m个函数必须满足下面 n+m个欧拉方程:
第二部分最优控制理论习题答案
x c1 , x c1t c2 (通解形式)
由边界条件
x(0) c2 1 c1 1 , 解之,得 x(1) c1 c2 2 c2 1
*
故最优轨线为 x (t ) t 1
2-2、求一阶系统 x(t ) u(t ), x(0) 1,当性能指标为 J
构造哈密顿函数: H x1 u12 u2 2 1 u1 2 ( x1 u2 ) 最优轨线 x1* (t ) t , x2* (t ) 0.5t 2 0.5t 最优控制 u1* 1 , u2* 0.5
2-8、 设二阶系统状态方程为 x1 x1 u,
x2 (1) ,
1
故
H H 1 2 , 2 0, x1 x2
1 1 2 11 c1et c2 Nhomakorabea c2
由横截条件
1 (1)
0, 2 (1) 1 x1 (1) x2 (1)
那么 所以
代入边界条件
x(0) 1 (c1 c2 1)
,
(1) 0
(c1e c2e 0)
1
, [终端横截条件 t f
] x(t f )
得 c1 0.12, c2 0.88
最优轨线 x* (t ) 0.12et 0.88et 最优控制 u* (t ) 0.12et 0.88et
-1
最优轨线是齐次方程 x x 的解
x(t ) [ A BR1BT K ]x(t )
由 x(0) 1 ,解得: x (t ) e
* t
所以: u (t ) e
最优控制-基本概念-理论-应用
J [ x( N )] L[ x(k ), u (k ), k ]
2、讨论:
k 0
N 1
( 1 )第一项为终端指标函数,称为终端项。保证在终端时刻t f 时,系统的终端状态能与给定的终端状态尽量接近。 (2)第二项为动态指标函数,称为积分项。保证系统的某些 综合性能。 (3)仅有终端项时,称J为终端型性能指标,仅有积分项时, 称J为积分型性能指标。
最优指标J *:沿最优轨线x* Biblioteka t ),使性能指标J所达到的最优值。
6.2 静态最优控制问题的解
(多元普通函数极值的解法) 静态最优化:J是一个多元普通函数
一、一元函数的极值:
设J f (u )为定义在闭区间[a, b]上的单值连续可微函数 则存在极值点u 的必要条件是 f (u ) u u* 0 u *的极小值点充要条件是f (u ) 0, f (u ) 0
2 f 2 u 21 f 2 f 2 u u f u 2 1 u 2 2 f un u1 2 f u1u2 2 f 2 u2 2 f u n u2 2 f u1u n 2 f u2 u n 2 f 2 u n
(2)自由终端:t f 给定,x(t f )可任意取值 其中 f u (t )
(3)可变终端:x(t f ) f
j ( x ,u ) 0
是由约束条件 j ( x, u ) 0所形成的一个目标集。
(二)给出目标函数 1、性能指标表达式:
J [ x(t f )] L[ x(t ), u (t ), t ]dt
2.控制作用域
( 1 )控制集U
U u (t )
最优控制理论考试重点
1.最优控制问题的性能指标(1)积分型性能指标(拉格朗日型):⎰=ft t dt t t u t x L u J 0]),(),([)(反映控制过程偏差在某种意义下的平均或控制过程的快速性,同时能反映燃料或能量的消耗。
(2)末值型性能指标(梅耶型):]),([)(f f t t x u J φ=,接近目标集程度,即末态控制精度的度量。
(3)综合性能指标(鲍尔扎型):⎰+=ft t f f dt t t u t x L t t x u J 0]),(),([]),([)(φ。
2.最优控制问题的数学模型给定系统的状态方程:]),(),([)(t t u t x f t x =•;状态方程的边界条件:⎩⎨⎧∈===St x t t x t x t t f f )(,)(,000;给定性能指标:⎰+=ft t f f dt t t u t x L t t x u J 0]),(),([]),([)(φ;允许控制域u(t):U t u ∈)(。
3.最优控制应用的几种类型:最短时间控制,最小能量控制,线性调节器,最少燃料消耗控制,线性跟踪器。
4.选取性能指标注意:应能反映对系统的主要技术条件要求,便于对最优控制进行求解,所导出最优控制易于实现。
5.边界条件:指状态向量在起点或终点的所有容许值的集合。
6.横截条件:依据性能指标的要求,从容许值的集合中选择哪一点作为始态或终态的问题。
1.泛函:对于某一类函数y(·)中的每一个函数y(x),变量J 都有一个值与之相对应,那么变量J 称作依赖于函数y(x)的泛函。
记为:J=J[y(x)],y(x)称为泛函的宗量。
宗量的变分:)()(0x y x y y -=δ。
2.泛函的连续性:对任意给定的正数ε,总存在另一个正数δ,当,...)()(,...,)()(,)()()()(000δδδ<-<-<-x y x y x y x yx y x y k k 时,ε<-)]([)]([0x y J x y J ,则称泛函J[y(x)]在点y 0(x)处是连续的,而此时y(x)与y 0(x)具有k 阶接近度。
最优控制笔记
最优控制又叫动态优化工程技术领域里的过程(物理过程或化学过程),通常都是可以控制的过程控制:使过程的发展变化按人们的需要进行动态优化问题的四个要素:1.建立过程的动态模型(动态系统的状态方程)2.指定所需的初始状态和结束状态(状态方程的边界条件)3.确立在可行控制策略4.性能指标动态系统的变化,可以看成对应状态的变化,其中每一个状态对应着n维状态空间中的一个点,系统的运动将在状态空间中画出一条状态曲线动态系统的状态方程:1.是对研究对象的动态数学建模2.体现了系统运动时应遵循的规律,反映了系统的动态特征3.一般是微分方程组描述状态方程f[x(t),u(t),t]的数学性质:1.f[x(t),u(t),t]是向量函数,维数与状态变量维数相同2.f[x(t),u(t),t]是关于x(t)/u(t)/t的连续函数3.f[x(t),u(t),t]是关于x(t)/t的连续可微函数4.u(t)是关于t的分段连续函数,只有有限个第一类间断点系统的初始时刻t0和初始状态x0一般都是已知的系统的结束时刻tf:固定或者不固定系统的结束状态xf:全部固定/全部不固定/部分固定性能指标:1.要根据实际任务确定,例如过程持续的时间最少/过程消耗的能量最少/成本最小/利益最大等等2.种类:终值型/积分型/复合型,它们都是关于x(t)/t的连续可微函数最优控制一定是容许控制,即最优控制策略(最优控制函数)在控制函数空间中的一个子集中选择当最优控制轨迹确定后,通过系统的状态方程,可以确立对应的最优状态轨迹现代控制理论相对于经典控制理论的优点:1.从时不变系统延伸到时变系统2.从单输入单输出系统延伸到多输入多输出系统3.从频域回到时域,采用能够揭示系统内部各状态变化规律的状态空间描述法最优控制理论属于现代控制理论的分支从数学角度来看,最优控制问题本质上是求泛函极值的变分学问题变分法分为古典变分法和现代变分法(最大值原理/动态规划)古典变分法只能解决容许控制集为开集的最优控制问题实际最优控制问题的容许控制集都是闭集,可以用现代变分法解决函数分为两类:普通函数和泛函普通函数随自变量t变化有确定值对应泛函随普通函数(称为泛函的宗量函数)的形式变化有确定值对应,t已确定或不产生影响复合函数也是普通函数,随自变量t变化有确定值对应具有某些相同特征的所有函数组成一个函数类,或称函数空间在函数空间内,每一个函数(形式不同的)成为函数空间的一个点,例如sin(x)和sin(2x)是正弦函数空间的两个点泛函宗量的变分:1.同一函数空间中的两个函数的差(t已确定或不产生影响)2.宗量的变分仍然是一个普通函数3.这里“变分”的意思是改变量宗量的维数为m时,则宗量的变分在m维函数空间中进行,其中每一维函数空间各自是具有某些相同特征的函数类两个普通函数k阶相近的定义,从几何上来看就是曲线的相似程度两个普通函数间的k阶距离定义,从几何上来看就是曲线的差异程度m维函数空间中,与点[x0(t),x1(t),...xm(t)]距离相同的点构成m维空间中的一个球面泛函k阶连续的定义(利用两个普通函数间的k阶距离来定义)线性泛函的定义:满足齐次性与可加性泛函的变分:1.是泛函增量的关于宗量变分的线性主部2.是关于宗量变分的线性连续泛函3.仍然是一个泛函4.泛函的变分是唯一的5.这里变分的意思相当于普通函数的微分泛函变分的计算公式,是关于宗量变分的泛函,也是关于alpha的普通函数,从普通函数极值条件出发推导得到泛函极值条件求普通函数的极值,必要条件是:极值在稳定点获得,稳定点即普通函数导数为0的点求泛函的极值,必要条件是:极值在泛函变分为0的点取得Lagrange/Mayer/Bolza形式指标的相互转换欧拉--拉格朗日方程的推导过程欧拉--拉格朗日方程是一个二阶微分方程欧拉--拉格朗日方程成立的前提:1.宗量函数对自变量的二阶导数存在2.积分函数二阶连续可微欧拉--拉格朗日方程的能积分出最优解的特殊情况含有多个宗量函数的欧拉--拉格朗日方程组形式等式约束条件下的泛函极值问题采用拉格朗日乘子思想等式约束下的多变量普通函数极值问题,拉格朗日乘子是m维常向量等式约束下的泛函极值问题,拉格朗日乘子是m维普通函数,称为协态变量拉格朗日乘子法的步骤:原问题-->辅助泛函-->解等式约束+欧拉方程-->用边界条件确定未知系数-->判断极大/极小/鞍点等式约束下的泛函极值问题中,拉格朗日乘子(本质上是普通函数)的欧拉方程就是原问题的等式约束条件对于最优控制问题,控制函数u(t)和状态函数x(t)都看成是泛函的宗量,系统的动态方程作为等式约束条件Hamilton函数是泛函,其t的范围由x(t)/u(t)中的t范围确定,可以看成是mayer型泛函Hamilton函数的作用:积分型泛函J对u(t)的等式约束条件极值问题,转换成H对u(t)的无约束条件机制问题Hamilton函数方法解决最优控制问题,是基于必要条件,而不是充分条件Hamilton函数沿着最优空之轨迹和最优状态轨迹,对时间t的全导数等于偏导数当Hamilton函数不显含t时,H是不依赖于t的常数基础数理化:数学是理路,物理和化学是实践;工程中的物理和化学变化过程都是可控的;过程:与时间有关,随着时间推荐的变化,又叫动态过程;动态过程的数学模型又称状态方程,为OEDs或者DAEs形式对一个过程实施控制往往可以选择的策略不唯一,为了使得任务完成得最好,需要选择最优控制策略;最优的意义:根据任务确定的技术或者经济指标,可以是时间上最快、能量上最省、成本最低、利润最大等;状态微分方程f[x(t),u(t),t]是关于u(t),x(t),t的连续函数,是关于x(t),t的连续可微函数,u(t)只有有限个第一类间断点;状态、状态空间、动态系统的变化过程对应于状态空间中的点运动轨迹、点运动轨迹的起始点和结束点就是状态方程的边界条件;系统的初始时间t0和初始状态x0通常是给定的;系统的结束状态根据结束时间tf是否固定和结束状态是否固定可分为6种情况;性能指标的类型:终值型(Mayer型)、积分型(Lagrange型)、复合型(Bolza型;)终值型(Mayer型)是x(t),t的连续可微函数;积分型(Lagrange型)是u(t),x(t),t的连续函数,是x(t),t的连续可微函数,u(t)只有有限个第一类间断点;注意终值型(Mayer型)指标中不含u(t);最优控制轨迹往往在m维控制函数空间的一个子集omiga中选择;经典控制论的特点:针对SISO、线性、时不变(定常)、集中参数系统,以laplace变换作为分析工具,频域内;现代控制论的特点:针对MIMO、非线性、时变、分布参数系统,以状态空间分析方法为分析工具,时域内分析;对系统的状态空间描述,最大好处在于能够反映系统内部各状态变量之间的关系;最优控制理论属于现代控制理论的一部分;最优控制问题在数学上来说属于求泛函极值的变分学领域;古典变分法的局限性:只能处理u(t)无约束或者为开集的泛函极值问题;现代变分学的两个代表:最大值原理(苏联,Pontryagin提出)和动态规划(美国,Bellman 提出);现代计算机的发展推动了控制理论和优化理论的发展与应用,增加了基于计算的科研活动方式;函数分为一般函数和泛函两类;一般函数:自变量形式唯一,当自变量确定为某一值时,函数值也随之确定;泛函:自变量形式和取值(范围)已经确定,当宗量函数形式确定时,泛函值也随之确定;复合函数属于一般函数;终值型泛函中,tf能被确定,所以泛函值取决于终值型泛函的宗量形式;积分型泛函中,被积函数往往是u(t),x(t),dx(t)/dt,t的函数,u(t),x(t)都属于积分型泛函的宗量;积分型泛函中,由于宗量的维数大于1:宗量为u(t),x(t),且各自维数也可能大于1,所以积分型泛函属于多维泛函(宗量为多维,在多维函数空间内取值);Hamiltonian属于多维泛函,自变量取值范围为t0~tf,宗量包括控制函数u(t),状态函数x(t),协态函数y(t);函数空间:具有相同性质的函数类(按函数不同形式区分函数类中的单个函数),构成了一维函数空间(一根轴),每个属于该函数类的具体形式函数都是该一维函数空间(轴)上的一个点;宗量函数的变分deltax(t):是同一函数类中两个一般函数的差,或者说是某一维函数空间中两个点之间的距离,本质上仍然是一个一般函数;一般函数相近的几何意义:曲线形态相似;泛函连续性的定义及与宗量函数相近(宗量函数的变分趋于0)的关系;线性泛函的定义:满足针对宗量函数的齐次性和可加性(将宗量看成一般函数的自变量);泛函变分detalJ[x(t)]:是泛函增量关于“宗量函数变分”的线性主部,是关于“宗量函数变分”的线性连续泛函,本质是泛函;泛函的变分具有唯一形式;求一个泛函的变分不直接使用定义,而用偏导数方法获得,这与一般函数的微积分知识相似;泛函达到极值的必要条件:泛函在宗量函数x*(t)处的变分为0,有三种情况:非极值,极大值,极小值;古典变分法中的欧拉方程由积分型泛函变分为0的必要条件推出,所以欧拉方程也是泛函达到极值的必要条件;欧拉方程本质上是一个二阶偏微分方程;欧拉方程成立的前提是:L[x(t),dx(t)/dt,t]对宗量函数x(t)、宗量函数的导数dx(t)/dt、自变量t存在二阶偏导数;注意L[x(t),dx(t)/dt,t]本身不能称为泛函(自变量的值没有给定),也不能称为宗量函数(宗量函数是x(t));欧拉方程可以求解的条件:L[x(t),dx(t)/dt,t]中不显含x(t)、dx(t)/dt、t三者其一或其二;宗量函数为向量函数时,欧拉方程也成为向量二阶偏微分方程(二阶偏微分方程组);phi(tf)这条终端曲线实际靠测试获得,并作为已知曲线;横街条件反应的是:极值曲线终端斜率与给定曲线斜率之间的关系横街条件成立的前提:L[x(t),dx(t)/dt,t]对宗量函数x(t)、宗量函数的导数dx(t)/dt、自变量t存在二阶偏导数;phi(t)对自变量t存在一阶偏导数;终端点可变情况下,泛函极值的必要条件共有两个:欧拉方程、横街条件;Lagrange型泛函的一阶变分和二阶变分的表达式;泛函极值属性的判断需要借助二阶变分表达式,它是一个对称函数矩阵;涉及到最优控制问题时,最优状态轨迹不仅要使目标函数最优,更重要的是满足系统的状态方程;系统的状态方程(等式)可以看成是求泛函极值问题时的微分等式约束;带等式约束的泛函极值问题,处理思想和一般函数的等式约束极值问题思路一样,采用拉格朗日乘子法思想;带等式约束的泛函极值问题,拉格朗日乘子是一般函数(一般函数的等式约束极值问题中,拉格朗日乘子是常数);带等式约束的泛函极值问题,与一般函数的等式约束极值问题相比,梯度为0的必要条件进化成为变分为0(欧拉方程的满足);带等式约束的泛函极值问题,原等式约束可以视为F[x(t),dx(t)/dt,lamda(t),t]对宗量函数lamda(t)的欧拉方程;利用古典变分法求解最优控制问题,是将控制函数u(t)和拉格朗日乘子函数lamda(t)都作为泛函的宗量函数;Hamiltonian的作用是将dx(t)/dt从F[u(t),x(t),dx(t)/dt,lamda(t),t]中分离出去,它们的关系是:H[u(t),x(t),lamda(t),t]=F[u(t),x(t),dx(t)/dt,lamda(t),t]-lamda(t)dx(t)/dt正则方程组的推导既可以从F[u(t),x(t),dx(t)/dt,t]的欧拉方程推导,也可以直接从变分=0的必要条件推导(欧拉方程从变分=0的必要条件中推导出来);推导tf固定、tf自由时的最优控制问题必要条件时,辅助函数的做法:终态约束等式约束放在积分号外面,状态方程等式约束放在积分号里面;tf固定时的三种情况:x(tf)固定(仅需要欧拉方程无需横截条件)属于x(tf)自由的特殊情况,x(tf)自由又属于x(tf)受约束的情况;tf自由时的三种情况:x(tf)固定(仅需要欧拉方程无需横截条件)属于x(tf)自由的特殊情况,x(tf)自由又属于x(tf)受约束的情况;tf固定又属于tf自由时的特殊情况,仅缺少关于最优时间的方程,所以6种情况最终都可以归类为tf自由、x(tf)受约束的情况处理;Hamiltonian沿着最优控制轨迹和最优状态轨迹(即H[u(t),x(t),lamda(t),t]中的u(t),x(t),lamda(t)都在最优轨迹上取值)时,对时间的偏导数等于对时间的全导数;以上性质说明:沿着最优控制轨迹和最优状态轨迹时,若Hamiltonian不显含t,则Hamiltonian为常数;不等式约束泛函极值问题?古典变分法要求u(t)属于一个全函数空间或者一个函数空间中的开集;现代变分法从实际出发,u(t)可以属于一个函数空间中的闭集;现代变分法中的代表:极小值原理(苏联,Pontryagin)和动态规划(美国,Bellman)极小值原理比古典变分法的进步:u(t)可以属于一个函数空间内的闭集,不要求Hamiltonian对u(t)可微;当u(t)属于一个函数空间内的闭集时,H对u(t)的偏导数可能不为0(在闭函数空间内取不到极点)、deltau(t)可以为0,两方面原因造成古典变分法不再适用;与古典变分法对应的是,极小值原理也有6种情况,最普遍的是tf可变、x(tf)受约束的情况;对于tf可变的情况,需要增加一个确定tf的方程(属于横截条件的一部分);Hamiltonian达到极小值的定义?极小值原理仅是最优控制问题的必要条件;如果x(tf)有终端约束,那么两点边值问题的求解难度会增加很多,常用方法为打靶法(扫描法);协态变量就是等式约束泛函极值问题的拉格朗日乘子函数;状态变量终态的自由与固定,对应协态变量终态的固定与自由;状态变量微分方程求解联合协态变量微分方程求解体现了原问题--对偶问题的共同求解思想?目标泛函对u(t)求偏导,实际是泛函对宗量函数求偏导;从理论分析可以得到,目标泛函对u(t)的梯度(偏导数)在最优控制问题中与Hamiltonian 对u(t)的梯度(偏导数)等价;最优控制(动态优化)问题转换成静态优化问题的理论:通过对u(t)的离散化,将函数空间变为向量空间?从而可以直接使用静态优化算法;处理x(tf)受约束的方法除了惩罚函数法还有其他方法没?[文档可能无法思考全面,请浏览后下载,另外祝您生活愉快,工作顺利,万事如意!]。
最优控制总结
最优控制理论总结宫庆义2010.6.301. 最优控制问题可用下列泛函表示:[][]0()00min (),(),(),..(1)()(),(),,()(2)(),0ft f f t u t f f J x t t L x t u t t dt s t xt f x t u t t x t x x t t ϕψ∈Ω⎡⎤=+⎣⎦==⎡⎤=⎣⎦⎰2. 最优控制的应用类型:(一) 积分型性能指标: []0(),(),ft t J L x t u t t dt =⎰(1) 最小时间控制: 00ft f t J dt t t ==-⎰(2) 最少燃耗控制: 01()fmt jt j J u t dt ==∑⎰(3) 最少能量控制: 0()()ft T t J u t u t dt =⎰(二) 末值型性能指标: (),f f J x t t ϕ⎡⎤=⎣⎦ (三) 复合性能指标:(1) 状态调节器:011()()()()()()22f t T T Tf f t J x t Fx t x t Qx t u t Ru t dt ⎡⎤=++⎣⎦⎰ (2) 输出跟踪系统:011()()()()()()()()()22f t T T Tf f t J e t Fe t e t Qe t u t Ru t dt e t z t y t ⎡⎤=++=-⎣⎦⎰3. 欧拉-拉格朗日方程:0L d L x d t x ∂∂⎛⎫-= ⎪∂∂⎝⎭注: 若()min (,,)..(,,)0ft x t J g x xt dt s t f x xt ==⎰ (,,,)(,,)()(,,)TL x xt g x x t t f x x t λλ=+例题:(1)求通过点(0,0)及(1,1)且使120()J x xdt =+⎰取极值的轨迹*()x t 解: 欧拉-拉格朗日方程: 2(2)0dx x dt-= 即 0x x -= ()c o s h s i n hx t a t b t =+ 由初始条件:(0)00x a =⇒= 末端条件: 1(1)1sinh1x b =⇒= 因而极值轨迹为:*1()sinh sinh1x t t = (2)求使指标1230()J xx dt =+⎰取极值的轨迹*()x t , *(0)0x = 解:这是终端自由的情况, 欧拉-拉格朗日方程为:()2230dx x dt+= 即 223x x C += 令()xt at b =+ 由(0)00x b =⇒= 又末端自由, 横截条件为:2310ft t Lx x x=∂⎡⎤=+=⎣⎦∂ 即 2230a a +=得:0a =或23a =-, *()0,0x t J ==对应局部极小, *24(),327x t t J =-=对应局部极大(3)设系统状态方程: x u = 边界条件为: (0)1,()0,f f x x t t ==自由性能指标为: 2012f t f J t u dt =+⎰ 要求确定最优控制*u , 使J 最小解: 这是f t 自由问题, 末端状态固定, ()0f x t =是满足约束集的特殊情况, 即 (),()0f f f x t t x t ψ⎡⎤==⎣⎦(),f f f x t t t ϕ⎡⎤=⎣⎦哈密顿函数: 212H u u λ=+ 正则方程: 0HHxu xλλ∂∂===-=∂∂ 控制方程: 0Hu u uλλ∂=+=⇒=-∂()1f fH t t ϕ∂=-=-∂ 即 : 221()()10()2f f f t t t λλλ-+=⇒=由正则方程: ()0t λ= 所以 ()t λ=于是 *()u t =再由正则方程: xu λ==- 可得()x t c =+ 由初始条件 (0)1x = 得 1c =故最优轨迹为: *()1x t =+ *()02f f x t t =⇒=(4) 设系统的状态方程为: ()()()xt x t u t =-+ 边界条件为: (0)1,()0f x x t ==, 求()u t , 使221()2f t J x u dt =+⎰为最小解: 221()()2H x u x u λ=++-+协态方程和控制方程为: H x x λλ∂=-=-+∂ Hu uλ∂=+=0∂ 即 u λ=- 故可得正则方程: ()()()xt x t t λ=-- ()()()t x t t λλ=-+ 拉氏变换: ()(0)()()sX s x X s s λ-=-- ()(0)())s s X s s λλλ-=-+( 解代数方程得:()(0)(0)()(0)(0)s x X s x λ==拉氏反变换:()()()()()(0)1)1)(0)()(0)1)1)(0)t e x e x t ee x λλλ⎤=-++⎦⎡⎤=-++⎣⎦由: (0)1,()0f x x t ==得:(0)f fλ=*()()1)1)u t t eeλ⎧⎫⎪⎤=-=-+⎬⎦⎪⎭注: 拉氏变换表(5)设系统状态方程为: 122()()()()x t x t xt u t == 初始条件为: 12(0)(0)1x x ==, 末端条件为: 12(1)0(1)x x =自由要求确定最优控制*()u t , 使泛函1201()2J u t dt =⎰取极小值 解: 边界条件222()(1)0(1)f t x ϕλλ∂===∂ 哈密顿函数: (,,)(,,)T H L x u t f x u t λ=+ 212212u x u λλ=++ 正则方程: 12112()0()()H Ht t t x x λλλ∂∂=-==-=-∂∂ 状态方程: 1222()()()()xt x t xt t λ==- 极值条件:0Hu∂=∂ ⇒ 20u λ+= 即 : *2()()u t t λ=- 边界条件: 12(0)1(0)1x x ==1222(1)0()(1)0(1)f x t x ϕλλ∂====∂ 对正则方程和状态方程进行拉氏变换:11222211221()(0)()()(0)()()(0)0()(0)()sX s x X s sX s x s s s s s s λλλλλλ-=-=--=-=-解以上代数方程得:11221222112123234111()(0)()(0)(0)1111111()(0)(0)()(0)(0)s s ss s X s X s s s ss s s sλλλλλλλλλ==-=--=+-+拉氏反变换:2312122111()1(0)(0)26()(0)(0)x t t t t t tλλλλλ=+-+=- 利用末端条件: 1212(1)0,(1)0(0)(0)6x λλλ==⇒== 最优状态轨迹:*231()13x t t t t =+-+ 最优协态:*2()6(1)t t λ=- 最优控制: **2()()6(1)u t t t λ=-=-(6) 设系统的状态方程为:10()()()001xt x t u t ⎡⎤⎡⎤=+⎢⎥⎢⎥⎣⎦⎣⎦指标泛函: 2201()2J u t dt =⎰ 边界条件: 10(0)(2)10x x ⎡⎤⎡⎤==⎢⎥⎢⎥⎣⎦⎣⎦求使指标泛函取极值的极值轨线*()x t 和极值控制*()u t 解: []121212221,,2T f x x g u f f u xλλλ-⎡⎤⎡⎤====⎢⎥⎢⎥-⎣⎦⎣⎦ 拉格朗日标量函数: 2121221()()2TL g f u x xu x λλλ=+=+-+- 欧拉方程:1111122222000L d L a x dt x L d L at b x dt xL d L u u at bu dt uλλλλλλ∂∂-===∂∂∂∂-=+==-+∂∂∂∂-=+==-∂∂由于状态约束方程:22223212112111262xu at b x at bt c xx at bt c x at bt ct d==-=-+==-+=-++代入边界条件: 10(0)(2)10x x ⎡⎤⎡⎤==⎢⎥⎢⎥⎣⎦⎣⎦得: 73,,12a b c d ====于是极值轨线: *321**22()0.5 1.751()3 3.5() 1.5 3.51x t t t t u t t x t t t ⎡⎤⎡⎤-++==-⎢⎥⎢⎥-+⎢⎥⎣⎦⎣⎦*x =(7)设性能指标泛函: 0ft J =⎰(0)1,()()2f f f x x t c t t ===-求使泛函为极值的最优轨线*()x t 及相应的**,ft J 解: L = 欧拉-拉格朗日方程:22220,()1L d L d C C x a x t at b x dt x dt C⎡⎤∂∂-=-=⇒===⇒=+∂∂- 由(0)1x =得: 1b =由横截条件:()(10()11ffTf t t L L cx x xt a x ⎤∂⎡⎤+-=--=⇒=⇒=⎢⎥∂⎣⎦最优轨线为: *()1x t t =+当f t t =时, ()()f f x t c t = 即: 12f f t t +=-, 求得末端时刻 *12f t = 将**(),f x t t 代入指标泛函,可得最优性能指标*J =(8) 设系统方程为: 122()()()()x t x t xt u t == 初态:12(0)(0)0x x == 末端时刻: 1f t = 末端约束: 12(1)(1)1x x += 性能指标: 121()2J u t dt =⎰ 求使J 最小的最优控制*()u t 和相应的最优轨线*()t x 解: 2121()0,()()(1)(1)12f f t L u t x x ϕψ⎡⎤⎡⎤===+-⎣⎦⎣⎦ x x212212H u x u λλ=++ 由协态方程: 1110()H t a x λλ∂=-==∂2122()H t at b x λλλ∂=-=-=-+∂由极值条件:220Hu u at b uλλ∂=+=⇒=-=-∂由状态方程:2222321211()2111()262xu at b x t at bt c xx at bt c x t at bt ct d==-=-+==-+=-++由初态: 12(0)(0)00x x c d ==⇒== 由目标集: 12(1)(1)10496x x a b +-=⇒-=根据横截条件:1212(1)(1)(1)(1)x x ψψλγγλγγ∂∂====∂∂即: 121(1)(1)2a b λλ=⇒=于是解得: 36,77a b =-=-最优解为: *3()(2)7u t t =-- 最优轨线: *211()(6)14x t t t =-- *23()(4)14x t t t =--例题:(1) 最短时间控制问题:状态方程: 122,x x xu == 初始条件: 101220(0)(0)(0)x x x x ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦x = 末端条件: 12()()0f f x t x t ==约束控制: ()10f u t t t ≤≤≤求使性能指标0ft f J dt t ==⎰取极小的最优控制.解: 1221T H L f x u λλ=+=++λ协态方程: 110H x λ∂=-=∂ 212H x λλ∂=-=-∂12()()t at at b λλ==-+选择u 使H 取极小 []2221()0()sgn ()1()0t u t t t λλλ<⎧==⎨->⎩2()t λ为t 的线性函数, u 最多改变一次符号当()1u t =时, 状态方程的解为:220212010()1()2x t t x x t t x t x =+=++ 消去t 得相轨迹方程: 2121()()2x t x t C =+ 当()1u t =-时, 状态方程的解为:220212010()1()2x t t x x t t x t x =-+=-++ 消去t 得相轨迹方程: 2121()()2x t x t C '=-+ 相轨迹的方向总是逆时针两簇曲线中, 每一簇中有一条曲线的半支进入末端状态点(原点) ()1u t =的曲线簇中, 通过原点的曲线方程为: 21221()()()02x t x t x t =≤ 记: γ+()1u t =-的曲线簇中, 通过原点的曲线方程为:21221()()()02x t x t x t =-≥ 记: γ-,γγ+-称为开关线, 其方程为: 1221()()()2x t x t x t =-开关线左侧区域用R +表示, 开关线右侧区域用R -表示 于是最优控制律, 可以表示为状态[]12,Tx x x =的函数, 即*121,(,)1,x R u x x x R γγ++--∈⎧=⎨-∈⎩(2)最少燃料控制问题状态方程: 122,xx x u == 初始条件: 101002020()()()x t x t x t x ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦x = 末端条件: 12()()0f f x t x t == 约束控制: 0()1f u t t t t ≤≤≤ 求使性能指标0()ft t J u t dt =⎰取极小的最优控制. 解: 122()T H L f u t x u λλ=+=++λ协态方程: 110H x λ∂=-=∂ 212H x λλ∂=-=-∂ 12()()t a t at b λλ==-+使H 取得极小值, 等价于求下式的极小值2()min ()()()u t u t t u t λ∈⎡+⎤⎣⎦Ω 使H 取得极小值的最优控制律为:[]222220()1()sgn ()()10()1()11()0()1t u t t t u t t u t t λλλλλ⎧<⎪=⎨->⎪⎩≤≤=--≤≤= 当()1u t =时, 2121()()2x t x t C =+ (开口向右--抛物线) 当()1u t =-时, 2121()()2x t x t C =-+ (开口向左--抛物线) 当()0u t =时, 220110200(),()()x t x x t x x t t ==+- (水平线)由状态方程得: 21120211120110222112112121222121222221:()1()20:()()()()()()1:0()()10()()()()2f f u x t t x x t t x t x u x t x t Cx t x t x t t t u x t t t x t x t t t t t =-=-+=-++====+-==+-=+-+-由以上6个方程, 来解6个未知数:(3)设系统状态方程为: 122()(),()()xt x t x t u t == 边界条件: 12121(0)(0)0,()()4f f x x x t x t ==== 控制约束: ()1u t ≤, 末端时刻f t 自由求: 最优控制*()u t 使性能指标20()f t J u t dt =⎰最小 解: 22212221221124H u x u u x λλλλλ⎛⎫=++=++- ⎪⎝⎭ 由极小值条件知:2*2221()21()()()221()2t u t t t t λλλλ<-⎧⎪⎪=-≤⎨⎪->⎪⎩ 由协态方程: 1112122()0()()()()H t t a x H t t t at b x λλλλλ∂=-==∂∂=-=-=-+∂ *211()()()22u t t at b λ=-=- 代入状态方程: 22232121111()()()24211()()()124x t u at b x t at bt c x t x t x t at bt ct d ⎧==-⇒=-+⎪⎪⎨⎪=⇒=-++⎪⎩ 由初始条件: 12(0)(0)00x x c d ==⇒==根据末端条件: 321221()12441()424f f f f f f a b x t t t a b x t t t =-==-= 根据H 沿最优轨线变化律: 2122()()()()()()0f f f f f f H t u t t x t t u t λλ=++=解得: 323(2)31,0,39f f f ff t t a b t t t --===== 最优控制: *1()()218t u t at b =-= 验证: 在0,f t ⎡⎤⎣⎦区间上, 2()1,()2u t t λ≤≤满足要求 最优轨线: *3*21211(),()10836x t t x t t == 最优性能指标: 23*01()36J u t dt ⎡⎤==⎣⎦⎰7. 对于线性连续系统, 提出二次型目标函数:00011()()()()()()()22()()()()(),(),(),(),()f t T T T f f J x t Px t x t Qx t u t R t u t dt x t A t x t B t u t x t x R t P t Q t ⎡⎤=++⎣⎦=+=⎰ 正定半正定 0,f t t 固定求: 最优反馈控制, 并论述如何选择二次型目标函数中的加权矩阵.解: []1()()()()()()()()()()2T T T H x t Qx t u t R t u t t A t x t B t u t λ⎡⎤=+++⎣⎦ 协态方程: ()()()()T H Q t x t A t t xλλ∂⎡⎤=-=-+⎣⎦∂ 控制方程: 1()()()()0()()()()T T H R t u t B t t u t R t B t t u λλ-∂=+=⇒=-∂ 横截条件: 1()()()()()()2T f f f f f f t x t Px t Px t x t x t ϕλ∂∂⎡⎤===⎢⎥∂∂⎣⎦由此可见, 协态()t λ状态()x t 在末端时刻f t 成线性关系.设: ()()()t K t x t λ= 代入状态方程:1()()()()()()()()T x t A t x t B t R t B t K t x t -=- 由协态方程: ()()()()()()()()()()T t K t x t K t x t Q t x t A t K t x t λ⎡⎤=+=-+⎣⎦ 将()xt 代入: 1()()()()()()()()()()()()0T T K t K t A t K t B t R t B t K t A t K t Q t x t -⎡⎤+-++=⎣⎦ ()K t 由下面的黎卡提矩阵微分方程确定:1()()()()()()()()()()()T T K t K t A t A t K t K t B t R t B t K t Q t -=--+- 边界条件: ()f K t P =由此可得最优反馈控制: 1()()()()()()()T u t R t B t K t X t G t x t -=-=- 加权阵的选择: 若已知各加权变量允许的最大值为:1max 2max max ,,,n x x x 和1max 2max max ,,,n u u u1m a x 2m a x m a x 111,,,,n Q d i a gx x x ⎡⎤=⎢⎥⎣⎦ , 1max 2max max 111,,,,n R diag u u u ⎡⎤=⎢⎥⎣⎦8. 最优性原理: 一个多级决策问题的最优决策具有这样的性质: 当把其中任何一级及其及其状态作为初始级和初始状态时, 则不管初始状态是什么, 达到这个初始状态的决策是什么, 余下的决策对此初始状态必定构成最优策略.例题:(1) 系统方程为: (1)()()x k x k u k +=+, (0)x 给定 (1)122011(2)()22k J cx u k ==+∑ (2) 要求: 用动态规划寻找最优控制序列(0),(1)u u 使J 最小解: 先考虑最后一步, 即从(1)(2)x x → 这时由(1),(2)得:(2)(1)(1)x x u =+[]222211111(2)(1)(1)(1)(1)2222J cx u c x u u =+=++ 求(1)u 使1J 最小, 得:[]1(1)(1)(1)(1)0(1)(1)1J cx c x u u u u c∂=++=⇒=-∂+ 将(1)u 代入1J 和(2)x 得: 2*1(1)(1)(2)211c x x J x c c==++ 再考虑倒数第二步, 即从(0)(1)x x → 这时: (1)(0)(0)x x u =+[]22*22011(1)1(0)(0)(0)(0)22122(1)c x c J J J u u x u c c =+=+=++++ 求(0)u 使J 最小得:[](0)(0)(0)0(0)1J c u x u u c∂=++=∂+ (0)(0)12cx u c=-+ 于是最优性能指标与最优状态转移为: 2*(0)2(12)cx J c =+ 1(1)(0)(0)(0)12c x x u x c +=+=+ 9. (1)直接法: 在每一步迭代中, ()u t 不一定要满足H 取极小值的必要条件, 而是逐步改善它, 在迭代终了使它满足这个必要条件, 而且, 积分状态方程是从0f t t →, 积分协态方程是从0f t t →, 这样就避免了去寻找缺少的协态初值0()t λ的困难. 常用的有: 梯度法, 二阶梯度法, 共轭梯度法(2)间接法: 在每一步迭代中, ()u t 都要满足H 取极小值的必要条件, 而且要同时积分状态方程和协态方程,两种方程的积分都是从0f t t →或从0f t t →. 常用的有边界迭代法, 拟线性化法.10. 分离定理: 按照此定理, 可以把最优控制问题和状态变量的最优估计问题分开讨论.在研究最优控制问题时, 假定所有状态变量都可以直接得到, 而在研究状态变量的最优估计时, 则假定控制信号是已知的确定性函数.最后把控制器中的状态变量用其估计值代替, 就得到了随机线性系统的最优控制.11. 分离定理应用: 在随机线性系统最优控制中, 目前理论上和应用上比较成熟的是所谓LQG 问题, 即线性系统, 二次型指标, 高斯分布噪声情况下的最优调节器问题. 这时分离定理可以成立.根据分离定理: 可将LQG 分成两部分, 即根据确定性系统来求出最优反馈控制律, 再由卡尔曼滤波器来测定最优状态估计值, 将这个状态估计值代替状态变量本身, 就得到了最优反馈控制.。
胡寿松《自动控制原理》笔记和课后习题(含考研真题)详解(动态系统的最优控制方法)【圣才出品】
1 / 32
圣才电子书
(2)变分和变分法
十万种考研考证电子书、题库视频学习平台
t
tx t dt
试求:
(1)δJ 的表达式;
(2)当 x(t)=t2,δx=0.1t 和 δx=0.2t 时的变分 δJ 的值。
解:(1)由泛函变分规则可知:
4 / 32
圣才电子书 十万种考研考证电子书、题库视频学习平台
(2)由(1)可知,δx=0.1t 时:
δx=0.2t 时:
10-6 试求下列性能指标的变分 δJ。
J tf t2 x2 x&2 dt t0
解:由泛函变分规则,求得:
10-7 已知性能指标为: 求 J 在约束条件 t2+x12=R2 和边界条件 x1(0)=-R,x2(0)=0,x1(R)=0,x2 (R)=π 下的极值。 解:构造广义泛函为:
5 / 32
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 10 章 动态系统的最优控制方法
10.1 复习笔记
考研初试一般不考查本章内容,下文为最优控制问题的基础理论部分。
一、最优控制的基本概念 (1)最优控制 概念:在系统状态方程和约束条件给定的情况下,寻找最优控制律,使衡量系统的某一 性能指标达到最优(最小或最大)。 (2)最优控制问题 任何一个最优控制问题均应包含四方面内容:①系统数学模型;②边界条件与目标集; ③容许控制;④性能指标。 (3)最优控制的研究方法 包括:解析法;数值计算法;梯度型法。
最优控制总结
/系统的数学模型,物理约束条件及性能指标。
数学描述:设被控对象的状态方程及初始条件为()[(),(),],(0)0x t f x t u t t x t x ==;其中,()x t X Rn ∈⊂为状态向量,X 为状态向量的可容许集;()u t Rm ∈Ω⊂为控制向量,Ω为控制向量的可容许集。
试确定容许的最优控制*()u t 和最优状态轨迹*()x t ,使得系统实现从初始状态(0)x t 到目标集[(),]0x tf tf ψ=的转移,同时使得性能指标0[(),][(),(),]tft J x tf tf L x t u t t dt ϕ=+⎰达到极值。
系统状态方程形式(连续,离散)(2)最优控制形式(开环,闭环) (3)实际应用(时间,燃料,能量,终端) (4)终端条件(固定,自由) (5)被控对象形目标函数及约束条件组成的静态优化问题可以描述为:在满足一系列约束条件的可行域中,确定一组优化变量,(极大值或极小值)。
数学描述:min (),,:n nf x x R f R R ∈→,..()0,:;()0,:n m n l s tg x g R R h x h R R =→≥→静态最优化问题,也称为参数最优化问题,它的三个基本要素是优化变量、目标函数和约束条件,其本质是解决函数,也称为最优控制问题,它的三个基本要素是被控对象数学模型、物理约束条件和性能指标,其本质是解 多变量目标函数沿着初始搜索点的负梯度方向搜索,函数值下降最快,又称最速下降法;(2)多变量无约束。
根据具体的最优换问题构造合适的惩罚函数,将多变量有约束最优化问题转换为一系列多变量无约束最优化问题,从而采用合适;(2)多变量有约束(外点法:等式约,不等式约束;内点法:不等式约束)。
通过构造拉格朗日函数,将原多变量有约束最优化问题转化为一个多变量无约束最优化问题,从而采用合适的无约束方法继(等式约束,不等式约束)。
梯度定义12()()()()f x x f x f x f x xx ∂⎡⎤⎢⎥∂∂⎢⎥=∇=⎢⎥∂∂⎢⎥∂⎣⎦,Hessian 矩阵22221212222212()()f f x x x f x H x x f f x x x ⎡⎤∂∂⎢⎥∂∂∂∂⎢⎥==⎢⎥∂∂∂⎢⎥∂∂∂⎢⎥⎣⎦,最优梯度法(无约束):迭代(1)()()()()k k k k x x f x α+=-∇,()()()()()()()()()()()k T k k k T k k f x f x f x H x f x α∇∇=∇∇,终止误差()()()k p k f x ε=-∇≤ 例:(),(0),()f x f x H x ∇∇;(0)[(0)(0)]f x T f x α=∇•∇/[(0)(0)]T f x H f x ∇••∇;(1)(0)(0)(0)x x f x α=-•∇;()f xk ε∇<,()x k 是极()0,()0x x =≥g h (1) 等式约束:(,)()()T H x f x x λ=+λg ,利用1210,0,0,0,0n mH H H H Hx x xλλ∂∂∂∂∂=====∂∂∂∂∂解出极大值点或极小值点。
现代控制理论 第6章 最优控制(校内讲稿)1
2)终端型性能指标( 梅耶问题)
J x( t f )或J x( N )
3)综合型性能指标( 鲍尔扎问题)
J x ( t f ) Lx t ,ut ,t dt
终端指标
t
f
或J x( N )
N 1 k k 0
t0
L [ x( k ),u( k ),k ]
2.拉格朗日乘子法 设目标函数:
n维
x( tk 1 ) f [ x( tk ),u( tk ),tk ] n N倍
N 1 L k 0
J x( N ) 约束条件为:
x( k ), u( k ), k
( k 0 ,1, N 1 )
f [ x( k ), u( k ), k ] x( k 1 ) 0
6.9
Bang-Bang控制
总目录 章目录 返回
上一页 下一页
教学要求: 1. 学习泛函变分法,理解最优控制的一般概念 2. 掌握利用变分法求最优控制方法 3.掌握状态调节器,极小值原理
重点内容: •最优控制的一般问题及类型,泛函与变分,欧拉 方程,横截条件。 •变分法求有约束和无约束的最优控制。 •连续系统的极小值原理。 •有限和无限时间状态调节器方法,Riccati方程求 解。
爬山法 梯度法
总目录 章目录 返回
上一页 下一页
6.3 静态最优化问题的解
6.3.1 一元函数的极值
设: f ( u ) a , b 上的单值连续可微函数 J 则1) u为极小值点的充要条件
f ( u ) |u u 0
f ( u ) |u u 0
f ( u ) |u u 0
H f ( g )T 0 x x x H f ( g )T 0 u u u H g ( x ,u )0
现代控制理论最优控制(1)
1)泛函自变量的变分
δ x x(t ) x (t )
*
2)泛函的变分 泛函的增量:由自变量函数x(t)的变分δx(t)的泛函J[x(t)]
增量为
Δ J [x] J [x(t) δ x(t)] J [x(t)] L[x(t ), δ x(t)] o[x(t), δ x(t)]
泛函的变分:泛函J[x(t)]的增量ΔJ[x(t)]的线性主部称为 泛函的一阶变分,简称泛函变分记为δJ,即
J J [ x(t ) x(t )] 0 L[ x(t ), x(t )]
类比于函数y=f(x),其增量为 Δy= f(x+Δx)-f(x)=f’(x)dx+o(Δx) y=f(x)的微分 dy=f’(x)dx
2. 确定容许控制域
对于r维控制向量u(t),要满足客观约束条件
i ( x, u ) 0 j 1, 2,, m mr 把u {u (t ) i ( x, u ) 0}称为控制域
满足u (t ) u的u (t )称为容许控制
3.确定始端与终端条件 若系统的初始时刻t0确定,则:
3) 泛函的极值
若泛函J[x(t)]在曲线x(t)= x*(t)上达到极值,则有
J J [ x(t ) x(t )] 0 0
若
ΔJ=J[x(t)]-J[x*(t)] ≥0
则称泛函J[x(t)]在曲线x*(t)上达到极小值;若
ΔJ=J[x(t)]-J[x*(t)] ≤0
3)综合型性能指标( 波尔扎型)
J x t , u t , t dt x(t f ), t f t 0 L 或J x(k f ), k f L[ x (k ), u ( k ), k ]
6 最优控制
则H 取极值
的必要条件
H x
f x
(
g x
)T
0
H u
f u
(
g u
)T
0
H
g(
x
,u
)0
其中
(
g x
g1 T
)T
=
x
gn
g1
x1
g1
x
xn
gn
x1
gn
xn
6.4 泛函及其极值--变分法
6.4.1 变分法的基本概念
1.泛函:
设对于自变量 x,存在一类函数 yx,对
由边界条件确定。 xt
四种边界条件:
a.固定端点: x( t f )0
x
tf t0
t0
d dt
L x
xdt
分部积分:
uv dxuv vudx
tf
J
L x
x
tf t0
t0
Lx
d dt
L x
xdt 0tfJ L xxtf t0
t0
L x
d dt
L x
xdt 0
xt 不受约束 x 任意
故泛函 J 取极值的必要条件:
1 ) L x
d dt
L x
0
欧拉方程
LL( x ,x ,t )
始端自由: x( t f )=0
L x
t0
0
x( t0 ) 0
x( t f ) x f
终端自由: x( t f ) 0
L
x
t
f
0
x( t0 )=0
x( t0 ) x0
两端自由: x( t f ) 0 x( t0 ) 0
现代控制理论CA14-最优控制资料
m(t) ku(t)
边界条件
h(0) h0, v(0) v0, m(0) m0 M F
h(t f ) 0, v(t f ) 0
控制约束 0 u(t) umax
性能指标
J m(t f )
燃料消耗量 为最少
最优控制问题的组成
• 系统数学模型(状态方程) • 边界条件(初态和末态) • 容许控制(控制向量的取值范围) • 性能指标
曲线满足运动微分方程
f (x, x,t) 0
极值轨线x(t)满足如下欧拉方程
L d L 0 x dt x
L(x, x,,t) g(x, x,t) T (t) f (x, x,t)
约束 方程
例 人造地球卫星姿态控制系统
x
0 0
1 0
x
0 1
u
J 1 2 uபைடு நூலகம்dt 20
求使性能泛函取极值的极值轨线和极值控 制
状态调节器
对于运行于某一平衡状态的系 统,在受到扰动偏离原平衡状 态时,使系统恢复到原平衡状 态附近时要求的性能。
J
1 2
xT
(t f
)Fx(t f
)
1 2
tf [xTQx(t) uT (t)Ru(t)]dt
t0
末态偏差
状态偏差
控制能量
输出跟踪系统
J
1 2
eT
(t f
)Fe(t f
)
1 2
tf [eTQe(t) uT (t)Ru(t)]dt
14 .3 极小值原理
应用经典变分法解最优控制问题, 要求控制向量不受任何约束.
为解决控制有约束的变分问题, 庞特里亚金提出并证明了极小值原理, 能够应用于控制变量受边界限制的情 况。
最优控制理论复习
解决多目标最优控制问题需要考虑不同目标之间的权衡和冲 突,发展协同优化和多目标决策理论,以满足多方面的需求 。
THANKS
感谢观看
动态规划的基本步骤包括:建立状态转移方程、定义性能指标函数、应用 递推关系求解最优解。
极大值原理
极大值原理是分析最优控制问题的一种方法,它基于微分和变分法的原理,寻找最 优控制策略使得性能指标达到极大值。
在极大值原理中,关键在于找到一个特殊的控制函数,使得性能指标函数在该控制 下取得极大值。
极大值原理在处理具有约束条件的优化问题时特别有效,如轨迹优化、多目标优化 等。
速度,为后续学习和考试打下基础。
扩展应用领域
03
深入理解最优控制理论,有助于将其应用于更广泛的领域,如
经济、工程等,为实际问题提供解决方案。
最优控制理论简介
定义
最优控制理论是研究如何优化一个动态系统的控制策略,使得系 统在满足一定约束条件下达到预期的性能指标。
核心概念
最优控制理论涉及的关键概念包括最优解、最优控制、性能指标、 动态系统等。
最优控制理论复习
• 引言 • 最优控制理论基础知识 • 最优控制理论的应用 • 最优控制理论中的问题与挑战 • 最优控制理论的发展趋势与展望
01
引言
复习的目的和意义
巩固所学知识
01
通过复习,加强对最优控制理论的理解和记忆,提高在实际问
题中的应用能力。
提升解题技巧
02
复习过程中,通过练习各种典型例题和习题,提高解题技巧和
应用领域
最优控制理论广泛应用于航空航天、机器人、化工、经济等领域, 为实际问题的解决提供理论支持。
02
最优控制理论基础知识
动态规划
最优控制理论讲义
最优控制理论讲义第一章 绪论§1.1最优控制问题静态最优化问题:输入—输出—代数方程 动态最优化问题:输入—输出—微分方程 确定性最优控制:系统参数确定,无随机输入 随机性最优控制:系统参数确定,有随机输入⎩⎨⎧=+=)()()()()(t Cx t Y t Bu t Ax t x⎩⎨⎧+=++=)()()()()()()(t v t Cx t Y t w t Bu t Ax t x例:飞船的月球软着陆问题推力 dtdmkf -= 运动方程 mg dt dmk mg f dtx d m --=-=22)()(][00f t t t m t m dt dtdmJ f-=-=⎰ 初始条件 ⎩⎨⎧======0)(,)(,00f f t x x t t ht x x t t约束条件为 0≤≤-dtdmα 求min J§1.2最优控制的数学模型一 控制系统的数学模型(集中参数系统)直接法建立:动力学、运动学的基本定律,即解析法. 间接法建立:通过“辩识”的途径确定系统的结构与参数.)),(),(()(t t u t x f t x= 其中 T n t x t x t x t x )](,)(),([)(21 =,T r t u t u t u t u )](,)(),([)(21 =,],,[21n f f f f =)(t x 为n 维状态向量,)(t u 为r 维控制向量,f 为n 维函数向量.二 目标集通过)(t u 使)(t x 由)(0t x 到)(f t x ,其中)(0t x 为初始状态,并且通常为已知;)(f t x 为终端状态,即控制所要求达到的目标。
一般来说对终端状态的要求可用如下的约束条件表示:0)),((,0)),((21≤=f f f f t t x g t t x g . 三 容许控制i u 具有不同的物理属性,一般有r 1,2i u i ,,=≤α,即在控制域U 内.凡在闭区间],[0f t t 上有定义,且控制域U 内取值的每一个控制函数)(t u 均称为容许控制。
最优控制简答题复习
1. 最优控制的应用类型有哪一些?(性能指标,应用)
2. 变分法的优点及局限性。
3、动态规划的局限性及重要性
4、简要说明变分法、极小值原理和动态规划求解最优控制问题的特点,并写出最优控制问题目标泛函常用的三种形式。
∙积分型泛函:
∙末值型泛函:
∙混合型泛函:
5、最优控制三要素是什么?
6、如何才能将有约束优化问题转化成无约束优化问题?
7.最优控制在控制领域所处的位置。
8.
8 . 什么是泛函?什么是泛函极值?
9.线性连续系统的二次型目标泛函求极值:
10.说明在最优控制问题中性能指标的类型。
在终端时刻、终端状态固定的最优控制问题中,一般采用哪种类型的性能指标,为什么?
11.最优控制理论所要解决的问题是
12.研究最优控制的方法有哪一些?。
最优控制的复习提纲共16页PPT
21、要知道对好事的称颂过于夸大,也会招来人们的反感轻蔑和嫉妒。——培根 22、业精于勤,荒于嬉;行成于思,毁于随。——韩愈
23、一切节省,归根到底都归结为时间的节省。——马克思 24、意志命运往往背道而驰,决心到最后会全部推倒。——莎士比亚
最优控制的复习提纲
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
25、学习是劳动,是充满思想的劳动。——乌申斯基
谢谢!
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.最优控制问题的性能指标(1)积分型性能指标(拉格朗日型):⎰=ft t dt t t u t x L u J 0]),(),([)(反映控制过程偏差在某种意义下的平均或控制过程的快速性,同时能反映燃料或能量的消耗。
(2)末值型性能指标(梅耶型):]),([)(f f t t x u J φ=,接近目标集程度,即末态控制精度的度量。
(3)综合性能指标(鲍尔扎型):⎰+=ft t f f dt t t u t x L t t x u J 0]),(),([]),([)(φ。
2.最优控制问题的数学模型给定系统的状态方程:]),(),([)(t t u t x f t x =•;状态方程的边界条件:⎩⎨⎧∈===St x t t x t x t t f f )(,)(,000;给定性能指标:⎰+=ft t f f dt t t u t x L t t x u J 0]),(),([]),([)(φ;允许控制域u(t):U t u ∈)(。
3.最优控制应用的几种类型:最短时间控制,最小能量控制,线性调节器,最少燃料消耗控制,线性跟踪器。
4.选取性能指标注意:应能反映对系统的主要技术条件要求,便于对最优控制进行求解,所导出最优控制易于实现。
5.边界条件:指状态向量在起点或终点的所有容许值的集合。
6.横截条件:依据性能指标的要求,从容许值的集合中选择哪一点作为始态或终态的问题。
1.泛函:对于某一类函数y(·)中的每一个函数y(x),变量J 都有一个值与之相对应,那么变量J 称作依赖于函数y(x)的泛函。
记为:J=J[y(x)],y(x)称为泛函的宗量。
宗量的变分:)()(0x y x y y -=δ。
2.泛函的连续性:对任意给定的正数ε,总存在另一个正数δ,当,...)()(,...,)()(,)()()()(000δδδ<-<-<-x y x y x y x yx y x y k k 时,ε<-)]([)]([0x y J x y J ,则称泛函J[y(x)]在点y 0(x)处是连续的,而此时y(x)与y 0(x)具有k 阶接近度。
)]([x y J 满足:(1))]([)]([)]()([2121x y J x y J x y x y J +=+,(2))]([)]([x y aJ x ay J =则称其为线性泛函。
3.泛函的变分(计算题)设泛函J[y(x)]为连续泛函,则泛函增量的线性主部称为泛函的变分,记为:J δ。
泛函的变分是唯一的。
泛函J[y(x)] 的求解:0)]()([)]([=+∂∂=εεδεδx y x y J x y J 。
dt t x t x t L J ft t ⎰=0)](),(,[ ,则dt t x t xt xt x t L t x t x t x t x t L J f t t )}()()](),(,[)()()](),(,[{0δδ∂∂+∂∂=⎰。
4.泛函的极值:对于与y 0(x)接近的曲线y(x),泛函J[y(x)]的增量0)]([)]([0)]([)]([00≤-=∆≥-=∆x y J x y J J x y J x y J J 或,则泛函J[y(x)]在曲线y 0(x)上达到极值。
泛函极值定理:若可微泛函J[y(x)]在y 0(x)上达到极值,则在y=y 0(x)上的变分为零,即0=J δ。
5.欧拉方程:(1)00)]([=-=∂∂-∂∂x x L dtdL x L dt d x L 或,展开形式为0=---x x x x t xx L x L x L L 。
(2)L 中不显含t 时,即),(x x L L =,此时C L x L x =- 。
6.无约束条件的最优化问题(思路)(解题步骤)(计算) (1)端点固定:欧拉方程:0=-x x L dtdL 。
(2)可变端点:欧拉方程:0=-x x L dt d L ,横截条件:⎪⎩⎪⎨⎧===-+===-+ff t f t xf f t x x t x t t x L x L t t x x t x L x L )(),()(;0])([)()(,)(;0])([00000ϕϕψψ。
7.具有等式约束条件的最优化问题:⎰+=ft t f f dt t t u t x L t t x u J 0]),(),([]),([)(φ,泛函极值必要条件为:状态方程:],,[t u x f H x=∂∂=λ ,协态方程:x H ∂∂-=λ ,控制方程(极值条件):0=∂∂u H , 端点约束:0]),([)(00==f f t t x x t x ξ,v t x t x t f Tf f )()()(∂∂+∂∂=ξφλ,横截条件:0)(=∂∂+∂∂+f T f f t v t t H ξφ。
8.应用变分法求解最优控制问题步骤如上,首先列写哈密尔顿函数f L H Tλ+=,横截条件用于补充所缺少的边界条件。
9.几种典型的欧拉方程(1)J(x)取极值的必要条件为:欧拉方程:0=-∂∂∂∂xFdt d xF,横截条件:0)(0=∂∂ft t xFt η。
(2)欧拉方程的展开形式:002222=---=∂∂-∂∂∂-∂∂∂-∂∂x L x L L L x xLx x x L x t L x L x x x x x t x或 (3)不同函数F 的欧拉方程:1)]),([t t x F :0=∂∂xF;2)]),([t t x F :022=∂∂x x F ;3)]),([t t x F :0222=∂∂∂+∂∂t x F x x F ; 4))](),([t xt x F :0222=∂∂-∂∂∂+∂∂x F t x F x x F ;5)x t x t x t t x t x F ),(),(]),(),([βα+=:0=∂∂-∂∂tx βα。
连续系统的最小值原理沿最优轨线函数H 相对最优控制u*(t)取绝对极小值,这是极小值原理的一个重要结论。
]),(),(),([min ]),(),(),([*)(**t t u t t x H t t u t t x H Ut u λλ∈=设系统的状态方程为]),(),([)(t t u t x f t x= ,控制u(t)是有第一类间断点的分段连续函数,属于p 维空间中的有界闭集Ω,满足不等式约束:0]),(),([≥t t u t x G ,在终端时刻t f 未知的情况下,为使状态自初态00)(x t x =,转移到满足边界条件0]),([=f f t t x M 的终态,并使性能指标⎰+=ft t f f dt t t u t x F t t x J 0]),(),([]),([θ达极小值。
设哈密而顿函数为),,(),,(t u x f t u x F H Tλ+=则最优控制u*(t),最优轨线x*(t)和最优伴随向量λ*(t)必须满足下列条件:(1)沿最优轨线满足正则方程:λ∂∂=H x,Γ∂∂-∂∂-=T xG x H )(λ ,式中Γ是与时间t 无关的拉格朗日乘子向量,其维数与G 相同,若G 中不包含x ,则:xH ∂∂-=λ。
(2)横截条件及边界条件:f t t T f v x M x t =∂∂+∂∂=])([)(θλ,0])(),,,([=∂∂+∂∂+=f t t Tv tM t t u x H θλ,00)(x t x =,0]),([=f f t t x M 。
(3)在最优轨线x*(t)上与最优控制u*(t)相对应的H 函数取绝对极小值,即),,,(),,,(*****t u x H t u x H λλ≤,并且沿最优轨线,下式成立Γ∂∂-=∂∂T uGu H )(。
上述条件与不等式约束下的最优控制的必要条件相比较,横截条件及端点边界条件没有改变,仅0=∂∂uH这一条件不成立,而代之以与最优控制相对应的函数为绝对极小,其次是正则方程略有改变,仅当G 中不包含x 时,方程才不改变。
1.砰-砰控制原理:若线性定常系统Bu Ax t x+=)( 属于平凡情况, 则其最短时间控制为)](sgn[)(**t B M t u T λ-=,)(*t u 的各个分量都是时间的分段恒值函数,并均取边界值,称此为Bang-Bang 原理。
即),...,2,1(,)}()(sgn{)](sgn[)(1***m j t t bt q t u ni i ijjj =-=-=∑=λ或)}(]),([sgn{)](sgn[)(***t t t x B t Q t u T j λ-=-=。
2.平凡最短时间控制系统:*j q 只是在各个孤立的瞬刻才取零值,*j u 是有第一类间断点的分段恒值函数。
3.奇异(非平凡)最短时间控制系统:*j q 在一段区间取零值。
并不意味着在该区间内最优控制不存在,仅表明,从必要条件不能推出确切关系式。
如果j Tb t )(*λ在某一时间区间内保持为零,则)(*t u j 为不确定值,这种情况称为奇异问题或非平凡问题,相应的时间区段称为奇异区段。
当整个时间区间内不出现奇异区段时,则称为非奇异问题或平凡问题,对于平凡问题,有以下几个定义及定理。
砰--砰控制原理也称为继电器型控制或开关控制,其主要特点是控制向量的分量都取控制域的边界,而且不断的从一个边界值切换到另一个边界值,从而构成一种最强的控制作用。
砰-砰控制实质是平凡时间最优问题,其最优解也就是控制器的输出是一个类似于继电器动作的开关式动作。
最短时间控制存在定理:若线性定常系统Bu Ax t x+=)( 完全能控,矩阵A 的特征值均具有非正实部,控制变量满足不等式约束|u(t)|≤M ,则最短时间控制存在。
最短时间控制的唯一性定理:若线性定常系统Bu Ax t x+=)( 属于平凡情况,若时间最优控制存在,则必定是唯一的。
开关次数定理:若线性定常系统Bu Ax t x +=)( 控制变量满足不等式约束|u(t)|≤M ,矩阵A 的特征值全部为实数,若最短时间控制存在。
则必为Bang-Bang 控制,并且每个控制分量在两个边界值之间的切换次数最多不超过n-1次。
切换点为0)(*==λj b t q j 。
系统平凡的充要条件:当且仅当m 个矩阵],...,,,[12j n j j j j b A b A Ab b G -=中全部为非奇异矩阵时,系统是平凡的。
(至少有一个为奇异矩阵时,系统是奇异的。
)双积分模型的物理意义:惯性负载在无阻力环境中运动。
双积分模型⎩⎨⎧==)()()()(221t u t x t x t x的最短时间控制问题,求解过程为:1)应用最小值原理得出最优控制表达式)](sgn[2*t u λ-=;2)解协态方程,结合开关次数定理,列出最优控制的候选函数序列(4种);3)在状态平面上分析状态转移轨线,寻找开关曲线,总结控制规律; 4)计算状态转移的最短时间。