最优控制理论第二次作业.doc
最优控制习题答案
最优控制习题答案最优控制习题答案最优控制是一门研究如何在给定的约束条件下,使某个系统的性能指标达到最优的学科。
在实际应用中,最优控制被广泛应用于工程、经济、生态学等领域。
然而,最优控制问题通常非常复杂,需要运用数学方法进行求解。
在本文中,我们将探讨一些最优控制习题,并给出相应的答案。
习题一:一辆汽车行驶在一条直线上,其速度v(t)满足以下微分方程:m*dv(t)/dt = F(t) - kv(t),其中m为汽车的质量,F(t)为外部施加的力,k为阻力系数。
求使得汽车行驶时间最短的外部力F(t)。
解答:首先,我们需要确定行驶时间的数学表达式。
设汽车的初始速度为v0,行驶时间为T,根据题意,我们可以得到以下约束条件:v(0) = v0,汽车的初始速度为v0;v(T) = 0,汽车的最终速度为0。
根据最小时间原理,我们可以建立一个最优控制问题的数学模型,即求解以下极值问题:minimize T,使得v(T) = 0;subject to m*dv(t)/dt = F(t) - kv(t),v(0) = v0。
通过拉格朗日乘子法,我们可以得到最优控制问题的解析解。
最终,我们可以得到外部力F(t)的解析表达式。
习题二:一个农民想要将一块矩形土地分成两块,使得两块土地的总面积最大。
该农民只能在土地的一条边上建立一道直线围栏。
求最优划分方案。
解答:设矩形土地的长为a,宽为b。
我们需要确定如何划分土地,使得两块土地的总面积最大。
根据题意,我们可以得到以下约束条件:2a + b = L,L为围栏的长度。
根据最大面积原理,我们可以建立一个最优控制问题的数学模型,即求解以下极值问题:maximize A = ab,使得2a + b = L。
通过拉格朗日乘子法,我们可以得到最优控制问题的解析解。
最终,我们可以得到最优划分方案的解析表达式。
习题三:一架飞机要从A地飞往B地,途中需要经过一个位于C地的雷达站。
飞机的速度恒定为v,雷达站可以通过调整飞机的航向角度来监测飞机的位置。
第6章最优控制 (2)
I D (t )
≤ I D max
tf 0
(5) (6)
性能指标
J dt t f
最优控制问题为:在状态方程的约束下,寻求最优控制 I D (t )≤ I D max
,将 x (t f ) 转移到 x (0) ,使J 为极小。
最优控制问题的一般性提法为
f ( x,u, t ) 系统状态方程为 x
(6)
空间中任 空间
意取值,而必须受到某些物理限制,(例如,控制电压,控制 要满足某些约束条件,这时,在
中,把所有满足上式的点
的集合,记作:
(7)
这时,在
空间中,把所有满足上式的点
的集合,记作:
(8)
U称为控制集。把满足
(9)
的
称为容许控制。
3.明确初始条件 通常,初始时刻 给定的称 固定始端。 如果 是任意的,则称自由始端。 是给定的。如果初始状态 也是
什么是最优控制?
最优控制问题: 1969年,美国阿波罗11号---人类首次载人登月飞行 任务:要求登月舱在月球表面实现软着陆,并有足够的燃料返 回登月舱;求登月过程,发动机推力的最优控制 软着陆 月球表面速度为零 使燃料消耗最小 才有足够的燃料返回登月舱
发动机最大推力有限
u t
mt 登月舱质量
δ J [ x0 , δ x] 0
欧拉方程:
, t )dt J [ x] L( x, x 定理:设有如下泛函极值问题: min t x (t )
0
tf
, t ) 及 x(t ) 在 [t0 , t f ] 上连续可微, t 0 和 t f 给定, 其中, L( x, x
x(t f ) x f ,x(t ) Rn ,则极值轨线 x * (t ) 满足如下欧 已知 x(t0 ) x0, 拉方程
(完整word版)最优控制课后习题
最优控制第四次作业4—2 一位公务员乘出租车要从机场赶到会场参加重要会议,已知交通网络如图所示。
图上数字为每条支路的驾驶时间,且全部支路都是单行线.试用动态规划找出最短时间路线。
解:机场用A 表示,会场用O 表示,从左到右,从上到下分别用字母A-O 表示,采用逆序计算法,末端开始,终端为止。
如上图。
(1) N=14(N 级)11(1)4(2)5J N J N ==由于从N1到O 以及从N2到O 都只有一种可能,所以本级无决策问题.(2) N=13(M 级)本级决策有三种选择,计算如下21(1)(1,1)(1)6410J M d M N J N =+=+=121(2,1)(1)9413(2)min 9(2,2)(2)459d M N J N J M d M N J N +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量2(2)2S M N =本级决策有四种选择,计算如下32(1)(1,1)(1)51015J L d L M J M =+=+=232(2,1)(1)41014(2)min 14(2,2)(2)7916d L M J M J L d L M J M +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量3(2)2S L M =232(3,2)(2)5914(3)min 10(3,3)(3)3710d L M J M J L d L M J M +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量3(3)3S L M =32(4)(4,3)(3)4711J L d L M J M =+=+=(4) N=11(K 级)本级决策有五种选择,计算如下413()(1,1)(1)31518J K d K L J L =+=+=343(2,1)(1)71522(2)min 16(2,2)(2)21416d K L J L J K d K L J L +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量4(2)2S K L =343(3,2)(2)41418(3)min 16(3,3)(3)61016d K L J L J K d K L J L +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量4(3)3S K L =343(4,3)(3)31013(4)min 13(4,4)(4)61117d K L J L J K d K L J L +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量4(4)3S K L =43(5)(5,4)(4)81119J K d K L J L =+=+=(5) N=10(J 级)本级决策有六种选择,计算如下(1)(1,1)(1)51823J J d J K J K =+=+=454(2,1)(1)41822(2)min 21(2,2)(2)51621d J K J K J J d J K J K +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量5(2)2S J K =454(3,2)(2)31619(3)min 19(3,3)(3)61622d J K J K J J d J K J K +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量5(3)2S J K =454(4,3)(3)41620(4)min 20(4,4)(4)81321d J K J K J J d J K J K +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量5(4)3S J K =454(5,4)(4)21315(5)min 15(5,5)(5)31922d J K J K J J d J K J K +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量5(5)4S J K =54(6)(6,5)(5)41923J J d J K J K =+=+=(6) N=9(I 级)本级决策有七种选择,计算如下65(1)(1,1)(1)72330J I d I J J J =+=+=565(2,1)(1)22325(2)min 25(2,2)(2)52126d I J J J J I d I J J J +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量6(2)1S I J =565(3,2)(2)42125(3)min 21(3,3)(3)21921d I J J J J I d I J J J +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量6(3)3S I J =565(4,3)(3)71926(4)min 25(4,4)(4)52025d I J J J J I d I J J J +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量6(4)4S I J =5(5,4)(4)32023d I J J J +=+=⎧⎫565(6,5)(5)11516(6)min 16(6,6)(6)32326d I J J J J I d I J J J +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量6(6)5S I J =65(7)(7,6)(6)62329J I d I J J J =+=+=(7) N=8(H 级)本级决策有八种选择,计算如下76(1)(1,1)(1)33033J H d H I J I =+=+=676(2,1)(1)33033(2)min 31(2,2)(2)62531d H I J I J H d H I J I +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量7(2)2S H I =676(3,2)(2)52530(3)min 24(3,3)(3)32124d H I J I J H d H I J I +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量7(3)3S H I =676(4,3)(3)42126(4)min 26(4,4)(4)42529d H I J I J H d H I J I +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量7(4)3S H I =676(5,4)(4)52530(5)min 28(5,5)(5)52328d H I J I J H d H I J I +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量7(5)5S H I =676(6,5)(5)72330(6)min 25(6,6)(6)91625d H I J I J H d H I J I +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量7(6)6S H I =6(7,6)(6)21618d H I J I +=+=⎧⎫76(8)(8,7)(7)32932J H d H I J I =+=+=(8) N=7(G 级)本级决策有七种选择,计算如下787(1,1)(1)53338(1)min 35(1,2)(2)43135d G H J H J G d G H J H +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量8(1)2S G H =787(2,2)(2)63137(2)min 27(2,3)(3)32427d G H J H J G d G H J H +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量8(2)3S G H =787(3,3)(3)22426(3)min 26(3,4)(4)92534d G H J H J G d G H J H +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量8(3)3S G H =787(4,4)(4)52530(4)min 30(4,5)(5)42832d G H J H J G d G H J H +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量8(4)4S G H =787(5,5)(5)32831(5)min 30(5,6)(6)52530d G H J H J G d G H J H +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量8(5)6S G H =787(6,6)(6)92534(6)min 20(6,7(7)21820d G H J H J G d G H J H +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量8(6)7S G H =787(7,7)(7)71825(7)min 25(7,8)(8)73239d G H J H J G d G H J H +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量8(7)7S G H =898(1,1)(1)23537(1)min 35(1,2)(2)82735d F G J G J F d F G J G +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量9(1)2S F G =898(2,2)(2)52732(2)min 32(2,3)(3)72633d F G J G J F d F G J G +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量9(2)2S F G =898(3,3)(3)82634(3)min 34(3,4)(4)63036d F G J G J F d F G J G +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量9(3)3S F G =898(4,4)(4)63036(4)min 34(4,5)(5)43034d F G J G J F d F G J G +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量9(4)5S F G =898(5,5)(5)43034(5)min 23(5,6)(6)32023d F G J G J F d F G J G +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量9(5)6S F G =898(6,6)(6)52025(6)min 25(6,7)(7)32528d F G J G J F d F G J G +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量9(6)6S F G =(10) N=5(E 级)本级决策有五种选择,计算如下9109(1,1)(1)63541(1)min 36(1,2)(2)43236d E F J F J E d E F J F +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量10(1)2S E F =9109(2,2)(2)23234(2)min 34(2,3)(3)93443d E F J F J E d E F J F +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量10(2)2S E F =9(3,3)(3)63440d E F J F +=+=⎧⎫9109(4,4)(4)43438(4)min 31(4,5)(5)82331d E F J F J E d E F J F +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量10(4)5S E F =9109(5,5)(5)32326(5)min 26(5,6)(6)72532d E F J F J E d E F J F +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量10(5)5S E F =(11) N=4(D 级)本级决策有四种选择,计算如下101110(1,1)(1)73643(1)min 38(1,2)(2)43438d D E J E J D d D E J E +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量11(1)2S D E =101110(2,2)(2)63440(2)min 40(2,3)(3)24042d D E J E J D d D E J E +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量11(2)2S D E =101110(3,3)(3)84048(3)min 35(3,4)(4)43135d D E J E J D d D E J E +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量11(3)4S D E =101110(4,4)(4)53136(4)min 32(4,5)(5)62632d D E J E J D d D E J E +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量11(4)5S D E =(12) N=3(C 级)本级决策有三种选择,计算如下111211(1,1)(1)53843(1)min 43(1,2)(2)74047d C D J D J C d C D J D +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量12(1)1S C D =111211(3,3)(3)33538(3)min 37(3,4)(4)53237d C D J D J C d C D J D +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量12(3)4S C D =(13) N=2(B 级)本级决策有两种选择,计算如下121312(1,1)(1)44348(1)min 44(1,2)(2)63844d B C J C J B d B C J C +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量13(1)2S B C =121312(2,2)(2)33841(2)min 41(2,3)(3)103747d B C J C J B d B C J C +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量13(2)2S B C =(14)N=1(A 级)本级决策是唯一的,计算如下131413(,1)(1)84452()min 46(,2)(2)54146d A B J B J A d A B J B +=+=⎧⎫==⎨⎬+=+=⎩⎭决策变量14()2S A B =最后可知最短时间路线是A-B2-C2—D3-E4—F5-G6-H7-I6-J5-K4-L3-M3—N2—O 最短时间是464.4设二阶离散系统1112122(1)2()(),(0)1(1)()(),(0)0x k x k u k x x k x k x k x +=+=+=+=试求使性能指标12220[2(1)2()]k J x k u k ==++∑为极小的最优控制*()u k 和最优轨线*()x k 。
现代控制理论7.5 线性二次型最优控制
最优控制的充分必要条件(1/10)—定理7-14
1. 最优控制的充分必要条件
� 定理7-14(有限时间LQ调节器) 对于有限时间LQ调节器问题, 为其最优控制的充分必要条件是
u* (t ) = −Kx * (t), K (t) = −R −1(t) B τ( t) P( t)
� 最优轨线为下述状态方程
线性二次型最优控制(中发展最为成熟、最有 系统性、应用最为广泛和深入的分支。 � 本节将陆续介绍线性二次型问题及其解的存在性、唯一 性和最优控制解的充分必要条件。 � 线性系统的二次型性能指标的最优控制问题可表述如下。
线性二次型最优控制(4/12)
� 线性二次型最优控制问题 设线性时变系统的状态方程和输 出量测方程为
� 对于最优控制问题,极大值原理很好地描述了动态系统的最 优控制解的存在性。 � 但对于复杂的控制问题,如非线性系统的控制问题、系 统模型与性能指标函数对控制量u(t)不为连续可微的控 制问题,在确定最优控制规律时存在不少困难,如 � 非线性常微分方程求解、 � 最优控制的非平凡性问题, � 而且带来闭环控制系统工程实现时困难性,难以得到统 一、简洁的最优控制规律的表达式。
式中,F为m×m维非负定的常数矩阵; � Q(t)为m×m维时变的分段连续的非负定矩阵; � R(t)为 r ×r 维时变的分段连续的正定矩阵, 且其逆矩 阵存在并有界; � 末态时刻tf是固定的。
线性二次型最优控制(6/12)
� 下面对上述性能指标泛函作细致的讨论: 1) 性能指标泛函J[u(·)]中的第1项eτ(tf)Fe(tf),是为了突出对末 端目标的控制误差的要求和限制而引进的 , 称为末端代 价函数。 � 非负定的常数矩阵 F为加权矩阵 , 其各行各列元素的 值的不同 ,体现了对误差向量 e(t)在末态时刻 tf 各分量 的要求不同、重要性不同。 � 若矩阵 F的第 i 行第 i 列元素值较大 , 代表二次项的重 要性较大,对其精度要求较高。
最优控制_2
u (t ) 为p维控制向量,在[t0,tf] 上分段连续
f ( x (t ), u (t ), t ) 为n维连续向量函数, 对x和t连续可微
⎡ f1(x(t),u(t),t)⎤ ⎡ f1(x1(t), x2 (t)Lxn (t),u1(t),u2 (t)Lup (t),t)⎤ ⎢ f (x(t),u(t),t)⎥ ⎢ f (x (t), x (t)Lx (t),u (t),u (t)Lu (t),t)⎥ 2 n 1 2 p ⎥ ⎥=⎢ 2 1 &(t) = f (x(t),u(t),t) = ⎢ 2 x ⎥ ⎢ ⎥ ⎢ M M ⎥ ⎢ ⎥ ⎢ f x t x t L x t u t u t L u t t ( ( ), ( ) ( ), ( ), ( ) ( ), ) f x t u t t ( ( ), ( ), ) ⎥ 2 n 1 2 p ⎣ n ⎦ ⎢ ⎣ n 1 ⎦
无条件约束的泛函极值问题中的边界条件和横截条件列表(表10-1) x(t0)固定 x(tf)固定 x(t0)自由 x(tf)固定 tf固定 x(t0)固定 x(tf)自由 x(t0)自由 x(tf)自由 x(t0)固定 x(tf)自由 tf自由 x(t0)固定 x(tf)约束
x (t 0 ) = x 0
∂L ∂x d − dt ∂L & ∂x
=0
T t0
T ( ∂∂L ) & x t
f
L δx(t f ) − ( ∂ &) ∂x
δx(t0 ) = 0
& , λ , t ) = g ( x, x &, t ) + λT f ( x, x &, t ) L ( x, x
λ (t ) ∈ R n 称为拉格朗日乘子
最优控制大作业
单纯行法第一题和第二题采用了单纯形法进行解决,单纯形法的理论依据是:线形规划问题的可行域是n 维向量空间Rn 中的多面凸集,其最优值如果存在必在该凸集的某顶点处达到。
顶点所对应的可行解称为基本可行解。
单纯形法的基本思想是:先找出一个基本可行解,对它进行鉴别,看是否是最优解;若不是,则按照一定法则转换到另一改进的基本可行解,再鉴别;若仍不是,则再转换,按此重复进行。
因基本可行解的个数有限,故经有限次转换必能得出问题的最优解。
如果问题无最优解也可用此法判别。
单纯形法的一般解题步骤可归纳如下:1.把线性规划问题的约束方程组表达成典范型方程组,找出基本可行解作为初始基本可行解。
2.若基本可行解不存在,即约束条件有矛盾,则问题无解。
3.若基本可行解存在,从初始基本可行解作为起点,根据最优性条件和可行性条件,引入非基变量取代某一基变量,找出目标函数值更优的另一基本可行解。
4.按步骤3进行迭代,直到对应检验数满足最优性条件(这时目标函数值不能再改善),即得到问题的最优解。
5.若迭代过程中发现问题的目标函数值无界,则终止迭代。
用单纯形法求解线性规划问题所需的迭代次数主要取决于约束条件的个数。
1 某工厂生产A 和B 两种产品。
已知制造A 产品,每公斤要用煤9吨、电力4千万、劳力3个;制造产品B ,每公斤要用煤4吨、电力5千瓦-劳力10个。
又知制成产品A 每公斤的产值是7万元;B 每公斤的产值是12万元。
现该厂只有煤360吨、电力200千瓦、劳力300个。
问在这种条件下,应该生产A 、B 产品各多少才能使产值为最高。
试写出其数学模型,即约束方程和目标函数,并利用单纯形法求解该线性规划问题。
解:设生产A 、B 产品各,x y 吨9436045200310300x y x y x y +≤⎧⎪+≤⎨⎪+≤⎩使max 712J x y =+引入附加变量123,,x x x ,使不等式约束变为等式约束1239436045200310300x y x x y x x y x ++=⎧⎪++=⎨⎪++=⎩程序清单如下:#include<iostream>#include<iomanip>using namespace std;int varIn(double delta[5]); //计算进基变量int varOut(double sita[3],double a[3][5],double b[3],double delta[5]); //计算出基变量void cal(double sita[3],double a[3][5],double b[3],double delta[5]); //计算方程组系数和判别数 double *A;//产品A 的产量double *B;//产品B 的产量int main(){double max=0; //最高产值double delta[5]={-7,-12,0,0,0}; //判别数double b[3]={360,200,300}; //基可行解double a[3][5]={9,4,1,0,0, //系数矩阵A4,5,0,1,0,3,10,0,0,1};double sita[3]; //出基变量判别数int in; //进入基变量位置int out; //出入基变量位置int flag=0; //判别数是否全部非负的标志while (!flag){in=varIn(delta);out=varOut(sita, a, b, delta);cal(sita, a, b, delta);flag=1;for (int i=0;i<5;i++){if (delta[i]<0) //是否所有的判别数都大于0flag = 0;}}cout<<"生产A和B产品的产量和最大产值:"<<endl;cout<<"*****************************"<<endl;max=7*(*A)+12*(*B);cout<<"产值最大时A产品的产量: x="<<*A<<","<<endl;cout<<"产值最大时B产品的产量: y="<<*B<<","<<endl;cout<<"最大产值为:optimal="<<max<<endl;cout<<"*****************************"<<endl;return 0;}int varIn(double delta[5]){int k=0;double mindelta=delta[0];for (int i=1; i<5; i++){if (delta[i]<mindelta){mindelta=delta[i];k=i;}}return k;}int varOut(double sita[3],double a[3][5],double b[3],double delta[5]) {int l=0;double minsita=1000;for (int i=1; i<3; i++){if (a[i][varIn(delta)]> 0)sita[i]=b[i]/a[i][varIn(delta)];if (sita[i]<minsita){minsita=sita[i];l=i;}}return l;}void cal(double sita[3],double a[3][5],double b[3],double delta[5]) {int i,j,k,l;double a1[3][5];double b1[3];double delta1[5];k=varIn(delta);l=varOut(sita, a, b,delta);for (i=0;i<3;i++){b1[i]=b[i];for(j=0;j<5;j++){a1[i][j] = a[i][j];delta1[j]=delta[j];}}for (i=0;i<3;i++){for(j=0;j<5;j++){if (i!=l){a[i][j]=a1[i][j]-a1[l][j]*a1[i][k]/a1[l][k];b[i]=b1[i]-b1[l]*a1[i][k]/a1[l][k];}else{a[i][j]=a1[l][j]/a1[l][k];b[i]=b1[l]/a1[l][k];}delta[j]=delta1[j]-a1[l][j]*delta1[k]/a1[l][k];}}if (k==0){A=&b[l];}else if(k==1){B=&b[l];}}程序运行结果为:2某车间有一批长度为180公分的钢管(数量充分多)。
最优控制(2)
则满足末态要求的最优轨线方程可表示为
取u*= -1,也可得到满足末态要求的最优轨线方程 曲线 , 组成曲线 ,称为开关曲线,表示为
开关曲线将相平面分成两部分R+和R-
则时间最优控制为
4.2.4 最小能量控制
设线性定常系统
求满足下列不等式约束的容许控制:
使系统从初始状态x0转移到x(tf)=xf,并使性能指标
由横截条件 解出
由极小值条件
由于
可得到
t=1时,u*(t)应该为 零,即不存在最优 控制
定理 对于如下时变系统、末值型性能指标、末端自由、 控制受约束的最优控制问题
式中末端时刻固定或自由,假设同前,则对于最优解 u*,x*,tf*,必存在非零的 (t ) ,使如下必要条件成立: 1) 正则方程
则对于最优解u*,x*,tf*,必存在非零的 (t ),使如下必要条 件成立: 1) 正则方程 其中
2) 边界条件与横截条件
3) 极小值条件
4) 沿最优轨线哈密尔顿函数变化率(tf自由时用)
例子:
解:已知
由协态方程 可得到
2 (t ) c2 , 1 (t ) c1e c2
t
其中
2) 边界条件与横截条件
3) 极小值条件
4) 沿最优轨线哈密尔顿函数变化率(tf自由时用)
于是该问题就变成了如下定常问题:
(16)
利用定常系统的结论,可知协态方程为
即 (17)
横截条件为
即 极小值条件为 (18)
将式(16)代入可得
即得结论3)。沿最优轨线哈密尔顿函数变化率
将(18)代入可得到本定理的结论4)。
极小,其中 tf 固定。
构造
定义开关向量函数
最优控制理论第二次作业
4题任选2题1.一质点沿曲线()y f x =从点(0,8)运动到(4,0),设质点运动速度为x ,问曲线取什么样的形状,质点运动的时间最短? 解答:取两点之间的连线直线为质点运动时间最短曲线。
2.设有一阶系统x x u ∙=-+,()03x =,试确定控制函数()u t ,在t=2时,把系统转移到零状态,并使泛函()2201J u dt=+⎰取极小值,如果把系统转移到零态的时间不固定,那该如何求解? 解答:t=2时的系统转移到零时刻,2112H 0201112201(t)(t)(t )e 23(0)3,(2)0(t 32t tu x u H x Hx xx u Hu uu xx x x d dx CC e x C x x x λλλλλλλλλλλλ--=∂=-→=-∂∂=-→=-+∂∂=→+=∂→⎧⎛⎫=-+---⎛⎫⎛⎫⎪ ⎪⇒=⎨ ⎪ ⎪ ⎪⎝⎭⎝⎭⎪-=-⎝⎭⎩=→=+==⇒=+ 做汉密尔顿函数:(1+)+(-+)欧拉方程:状态方程:控制方程:消除代入边界条件:)e 3(t)2t tu e --⇒=-222111(t )0(1)()0t 2123033(t 3)e e 22C 31e C t +6+C 22f f f f ftt f t f H u x u u ux u x u θθλλ---∂=-=→++-+=∂=-→+-==+=-=移动到零态的时间不固定则还要符合条件由于则将和代入()无法继续。
3.已知线性二阶系统的微分方程及初始条件为12x x ∙=,()101x = 2x u ∙=,()201x =求最优控制()u t ,使下列性能指标分别为最小 (a )120J u dt =⎰,()111x =(b )20f t J u dt =⎰,()()21f f f x t c t t ==-(f t 可变)(c )20f t J u dt =⎰,()()()212,0f f f f x t c t t x t ==-=解答:(a )2122122111212112H ,0,(t)C (t)C C H0202f u x u Hxxx x u H xt u u t u λλλλλλλλλλ=++∂=→==∂∂=-→==∂=→=∂=→+=→=-∂ 本题为t =1,终端固定的最优解问题正则方程:控制方程:211222231112123231113122(t)24(t)412(0)11,1(1)11111212(t)t 1(t)3t 1C Cxt x t C C Cxt C x t C t C x C C C x C x t x =-→=-+=-+→=-++=→===→-++=⇒=⇒=-++=-+ 边界条件 (b )2321111C =1,C =1(t )t (t )()(t )(t )1f f Tf f f x M v x v C λ=-∂=→∂==同理可以得到4.设受控系统为12x x ∙=,23x x ∙=,3x u ∙=,试写出在约束()1u t ≤条件下,系统由初始条件()()()1230000x x x ===转移到目标集()21f f x t t =,()()223f f x t x t =,且使性能指标()220f t f f J t x t u dt =+⎰为最小的最优控制必要条件,其中f t 未定。
最优控制作业2
(2.2)
终端约束:
(2.3)
哈密顿函数:
(2.4)
协态方程:
(2.5)
积分式(2.5):
(2.6)
横截条件:
(2.7)
将式(2.7)代入式(2.5)可得
(2.8)
控制方程:
(2.9)
整理式(2.9)Байду номын сангаас优控制律:
(2.10)
其中
将自变量由t变成控制量β,对上式求导可得
(2.11)
将式(2.11)代入状态微分方程中,可得
·最优控制作业2
一、题目描述
(1.1)
(1.2)
哈密顿函数:
(1.3)
协态方程:
(1.4)
控制方程:
(1.5)
(1.6)
横截条件:
(1.7)
哈密顿末端条件:
(1.8)
将式(1.6)代入式(1.1)中得到
(1.9)
联立式(1.4)(1.9)可以解得
(1.10)
(1.11)
其中c1、c2为位置常数;
将初始条件 代入式(1.11)中,解得
(1.12)
由式(1.7)(1.8)可以求得 ,代入方程(1.10)和(1.11)中可以求得
(1.13)
将式(1.13)两端同时乘以 (>0),并将式(1.12)代入可得
(1.14)
因为 ,所以 ,则c1=0, 。
所以
(1.15)
(1.16)
二、题目描述
图2.1问题示意图
目标函数:
状态方程:
(2.1)
(2.12)
同理
(2.13)
解微分方程(2.12):
(2.14)
最优化控制 线性二次型最优控制问题
用不大的控制能量,使系统状态X(t)保持在零值 附近——状态调节器问题。
7
线性二次型最优控制问题的几种特殊情况
若Yr(t)0,则 e(t) Yr (t) Y (t)
于是性能指标可写为
J
1 2
[Yr
(t
f
) Y (t f
)]T
S[Yr (t f
) Y (t f
)]
1 2
性能指标的物理意义
➢性能指标中的第一部分
1 2
eT
(t
f
)Se(t
f
)
称作终端代价,用它来限制终端误差e(tf) ,以保证
终端状态X(tf)具有适当的准确性。
➢性能指标中的第二部分
1 tf eT (t)Q(t)e(t)
2 t0
称作过程代价,用它来限制控制过程的误差e(t),
以保证系统响应具有适当的快速性。 9
t
f
]
(t f ) P(t f )X (t f )
(t f ) SX (t f )
所以,
P(t f ) S
矩阵黎卡提(Riccati)微分方程 的边界条件
21
P(t)的3个重要性质:
由微分方程理论的存在与唯一性定理,可以证明P(t) 存在而且唯一。 对于任意的t[t0,tf], P(t)均为对称阵,即P(t)=PT(t)。
由(1)和(2),得
[P&(t) P(t)B(t)R1(t)BT (t)P(t) P(t) A(t) AT (t)P(t) Q(t)]X (t) 0 20
由于X(t)是任意的,所以有
P&(t) P(t)B(t)R1(t)BT (t)P(t) P(t) A(t) AT (t)P(t) Q(t) 0
2021年智能控制第二次大作业神经网络控制作业
智能控制第二次大作业——神经网络控制作业学院: 自动化科学与电气工程学院学号: SY1403姓名:日期: 12月31日1、 以一个三层BP 网络(输入层、 隐层和输出层结点数分别为n 1、 n 2和n 3)为例, 给出BP 算法学习(训练)步骤, 包含关键步骤具体计算公式。
设给定P 组输入输出样本31(0)(0)(0)(0)(0),1,2,,1,2,[],[](1,2,,)T T p p p p p n p p p n x x x x x x p P ===x d 。
(10分)O1O21) 初始化, 对权值矩阵W,V 赋数。
将样本计数器p 和训练次数计数器q 置1, 误差E 置0,学习率η设为0-1之间小数, 网络训练后达成精度E min 设为一正小数。
2) 输入训练样本对, 计算各层输出。
用目前样本(0)(0),pp x d 对向量数组X 、 d,赋值, 用公式(1)、 (2)计算Y 和O 中各分量。
()2330,1,2,,1,2,K k n k jk j j O f net k n net w y k n =====∑ (1)()1220,1,2,,1,2,j j n j ij i i y f net j n net v x j n =====∑ (2)3) 计算网络输出误差, 设共有p 对训练样本, 网络对应不一样本含有不一样误差()31n pp p k k k E d o ==-∑ (3) 可将全部样本输出误差平方()2p E 进行累加再开方作为总输出误差, 也可用诸误差中最大值E MAX 代表网络中总输出误差, 使用中更多采取均方根误差作为网络总误差, 军方误差表示式如公式(4)所表示。
RME E = (4) 4) 计算各层误差信号, 应用公式(5)和(6)计算p y k j δδ和。
()()01k k k k k d o o o δ=-- (5)()()()()330111n n y j k k k jk j k jk j j k k d o f net w f net w y y δδ==⎡⎤⎛⎫''=-=- ⎪⎢⎥⎣⎦⎝⎭∑∑ (6)5) 调整各层权值, 应用公式(7)和(8)计算W 、 V 中各分量。
最优控制理论 第二章
x(t ) f ( x(t ), u (t ), t ) 1
x(t 0 ) x0 2
t0 , t f
终端状态满足:
目标函数:
已知。
N [ x(t f ), t f ] 0 3
J [ x(t ), u (t ), t ]dt 4
J
tf t0
[
x(t )
x(t ) x x
*
x (t )
x (t )
x x*
]dt
泛函取极值的必要条件:
J 0
即:
tf
t0
[ x(t ) x(t )]dt 0 8 x(t ) x(t )
tf
t0
X
x(t )
tf t0
0 横截条件,又称为边界条件
3.横截条件的分析 <1> x(t0 ), x(t f )都固定,图a
x(t0 )
x(t )
许多状态轨线
求出最优
即 x* (t ) x(t ) 0 0
x (t f ) x(t f )
*
即 x(t 0 ) 0 x(t f ) 0 <2> x(t0 ) 固定, x(t f )自由 图 b
t1
F
证明见书。
< 定理2 > :若可微泛函 J [ y( x)] 在 y0 ( x) 上达到极值, 则在 y y0 ( x)上的变分等于0,即 J 0 证明较简单,见书。
变分规则:<1 > ( F1 F2 ) F1 F2
< 2> ( F1 F2 ) F1F2 F2F1
chap4_线性二次型最优控制问题
2019/3/9
9
系统系课件
对容许控制U(t)和终态X(tf)的说明
(1) 在线性二次型问题的定义中,并没有直接提出对控制作 用U(t)的不等式约束,但这并不等于在物理上不需要对U(t)进 行必要的限制。实际上,用适当选择Q(t)和R(t)数值比例的方 法,同样可以把U(t)的幅值限制在适当的范围之内。这样,就 可以在保持闭环系统线性性质的前提下,实现对U(t)的限制。 (2)在定义问题时,也没有直接提出对终态X(tf)的要求。实际 上,对终态的要求,是利用性能指标的终端代价来反映的,性 能指标中的终端代价用于限制终端误差,它表明期望终态X(tf) 尽量靠近误差信号e(t)=0所对应的状态。
2019/3/9
12
系统系课件
§4.2 有限时间的状态调节器问题
问题4.2.1 给定线性定常系统的状态方程和初始条件
X (t ) AX (t ) BU (t ) (4.2.1) X (t0 ) X 0 其中X(t)是n维状态变量,U(t)是m维控制变量,A是nn常数矩阵, B是nm常数矩阵。性能指标是
说明:
(1)二次型性能指标是一种综合型性能指标。它可以兼顾 终端状态的准确性、系统响应的快速性、系统运行的安全性 及节能性各方面因素。线性二次型最优控制问题(4.1.1)、 (4.1.2)的实质是:用不大的控制能量,来保持较小的输出 误差,以达到控制能量和误差综合最优的目的。
2019/3/9 6
系统系课件
系统系课件
第四章 线性二次型最优控制问题
返回目录
系统系课件
主 要 内 容
§4.1 线性二次型最优控制问题的提法 §4.2 有限时间的状态调节器问题 §4.3 无限时间的状态调节器问题 §4.4 输出调节器问题 §4.5 跟 踪 问 题 §4.6 具有指定稳定度的最优调节器问题 §4.7 在阶跃干扰作用下的状态调节器问题 §4.8 带有观测器的最优调节器问题 课外习题
最优控制上机作业
最优控制上机作业二级倒立摆稳定控制仿真实验倒立摆系统在控制系统研究中受到普遍重视。
通过对倒立摆系统的研究,不仅可以解决控制中的理论问题,还能将控制理论所涉及的三个基础学科:力学、数学和电学有机地结合起来,在倒立摆系统中进行综合应用。
近代机械控制系统中,如直升机、火箭发射、人造卫星运行(变轨等)及机器人举重、做体操和行走机器人步行控制等,都存在有类似于倒立摆的稳定控制问题。
1.作业题目二级倒立摆系统由以下部分组成:有效长度为90cm 的光滑导轨,可以在导轨上来回移动小车,材料为铝的摆杆铰接在小车上,二级摆杆以同样的方式与一级摆杆相连,它们的铰接方式决定了它们在竖直平面运动,一级摆杆和二级摆杆规格相同,有效长度为525cm 。
小车的驱动由一直流力矩伺服电机和同步带传动系统组成,小车相对参考点(即导轨的中心位置)的相对位移x 由电位器和测量传动带得到,一级摆杆与竖直方向的夹角1θ由固定在一级摆杆和小车铰接处的电位器1测量得到,二级摆杆与竖直方向的夹角2θ由电位器通过测量两个摆的角度差12θθ-而间接得到。
直流伺服电机产生驱动力F 使小车根据摆角的变化而在导轨上运动,从而达到二级倒立摆系统的平衡。
2.二级倒立摆数学模型的建立为了进行线性控制器的设计,首先需要对被控系统进行建模。
二级倒立摆系统数学模型的建立基于以下假设: 1)每一级摆杆都是刚体。
2)在实验过程中同步带长度保持不变。
3)驱动力与放大器输入成正比,没有延迟直接施加于小车。
4)实验过程中的库仑摩擦、动摩擦等所有摩擦力足够小,在建模过程中可忽略不计。
图1:二级倒立摆系统如上图1所示的二级倒立摆系统,根据牛顿力学理论建模: 对于由小车和上下摆组成的整个系统,在水平方向上有:uG l M L M l M x F l M L M l M r M M M 022222211121102222111211210sin sin )(cos cos )()(=•-•+-+•+•++++θθθθθθθθ&&&&&&&&& (1)对于下摆杆受力分析后,根据其在转动方向上力矩平衡,可得器旋转方程式:112112212212221212122121************sin )()sin()()cos()(cos )(θθθθθθθθθθθg L M l M l L M F F F l L M L M l M J r L M l M +=•---++•-++++•+&&&&&&&&& (2)对于上摆杆受力分析后,根据其在转动方向上力矩平衡,可得器旋转方程式:2222212211221222222112212222sin )sin()()cos(cos θθθθθθθθθθθgl M F F l L M l M J l L M r l M =+-•-+++•-+•&&&&&&&&& (3)以上三个等式构成了二级倒立摆系统动力学方程,经整理可得:GU N rF r M ++⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡),(),,,(),(212121212121θθθθθθθθθθθθ&&&&&&&&&&& (4) 式中⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+--++++++=222212212222122122122111112112221121121021)cos(cos )cos(cos )(cos cos )(),(l M J l L M l M l L M L M l M J L M l M l M L M l M M M M M θθθθθθθθθθ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-+•--+•-+-••+-=2221221222122122122221111102121)sin(0)sin()(0sin sin )(),,,(F F l L M F l L M F F l M ML l M F F θθθθθθθθθθθθθθ&&&&&&⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+=2221121121sin sin )(0),(θθθθg l M g L M l M N ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=000G G上式中各参量的意义及参数值如下表表1所示:表1:二级倒立摆系统的结构参数表参数 参数值 意义M 0 1.3280 小车及驱动系统的等效质量(kg )M 1 0.22 下摆质量(kg ) M 2 0.187 上摆质量(kg ) J 1 0.004963 下摆转动惯量(kg*m 2) J 2 0.004824 上摆转动惯量(kg*m 2) l 1 0.304 下摆质心至轴心的距离(m ) l 2 0.226 上摆质心至轴心的距离(m ) L 1 0.49 下摆轴心至上摆轴心的距离(m ) F 0 22.915 小车系统的摩擦系数(N*m*s ) F 1 0.00705 下摆摩擦阻力系数(N*m*s ) F 2 0.00264 上摆摩擦阻力系数(N*m*s ) G 011.887力与控制电压之比(N/V )3.二级倒立摆数学模型的线性化在平衡点021==θθ和021==θθ&&附近对上述方程线性化,即假设θθ≈sin ,1cos ≈θ,得:GU r N r F r M +⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡212121)0,0()0,0,0,0()0,0(θθθθθθ&&&&&&&&& (5) 式中⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+++++++=22222122221221221111211221211210)0,0(l M J l L M l M l L M L M l M J L M l M l M L M l M M M M M⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-+--=222210)(000)0,0,0,0(F F F F F F F⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+=g l M gL M l M N 221211000)(0000)0,0(,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=000G G定义状态变量[][]T Tr r x x x x x x X 2121654321θθθθ&&&==, [][]TT r x x x Y 21321θθ==那么利用等式(4)和(5)我们就可以构造出原系统和线性化后的系统的状态方程⎩⎨⎧=+=CX Y BU AX X& 式中⎥⎦⎤⎢⎣⎡=⨯⨯222133330A A I A ,⎥⎦⎤⎢⎣⎡=⨯2330B B ,[]33330⨯⨯=I CN M A 121-=,F M A 122-=,G M B 12-=。
最优控制理论期末考试试题
研究生2018-2019学年 第(1)学期期末考试试卷 课程名称 最优控制理论 课程代码 5317850 考试形式 开卷 一、 简答题(50分,共5小题,每题10分) 1. 什么是容许控制? 2. 什么是性能指标? 3. 函数与泛函的比较? 4. 函数微分与泛函变分的比较? 5. 泛函极值问题中的边界条件与横截条件? 二、 证明题(30分,共2小题,每题15分) 1. 证明连续系统的极小值原理。
2. 证明离散系统的极小值原理。
三、 计算题(15分,共1题) 人造地球卫星姿态控制系统的状态方程为 ẋ(t )=[0 100]x (t )+[01]u (t ) 指标泛函:12∫u 2(t)dt 20 边界条件:x (0)=[11],x (2)=[00] 求使指标泛函取极值的x ∗(t ),u ∗(t ). 院 系 学 号 姓 名 密封装订线 密封装订线 密封装订线。
第二篇最优控制理论习题答案
第二篇最优控制理论习题答案:2-1、求通过x(0)=1,x(1)=2,并使性能指标120(1)J xdt =+∫&为最小的曲线x(t)。
解:本题属于无约束(无状态方程约束),始端和终端均固定的泛函极值问题,可用变分法求解。
被积函数 21,0,2,2L L d LL xx x x x dt x∂∂∂=+==⋅=∂∂∂&&&&&& 代入欧拉方程 0L d Lx dt x ∂∂−⋅=∂∂&, 得20x =&&, 即0x =&& 1xc =&, 12x c t c =+ (通解形式) 由边界条件 212(0)1(1)2x c x c c ==⎧⎨=+=⎩, 解之,得1211c c =⎧⎨=⎩ 故最优轨线为 *()1x t t =+2-2、求一阶系统()(),(0)1xt u t x ==&,当性能指标为12201()2J x u dt =+∫取最小值时的最优控制与最优轨线。
解:本题属于有约束,始端固定;终端时间f t 固定,()f x t 自由,控制u 无限制的泛函极值问题,可用变分法求解。
构造哈密顿函数 222211() ()22H x u u L x u λ=++=+注: 协态方程 H x x λ∂=−=−∂&, 即x λ=−& ① 极值条件/控制方程 0Hu uλ∂=+=∂, 即u λ=− ②由系统的状态方程 xu =&及②式,,x x λλ=−=−&&&& ③ 由①式及③式,得 xx =&& 故12()ttx t c e c e −=+ 12()()t t t xt c e c e λ−=−=−+& 代入边界条件11212(0)1(1)0,(1)(0)x c c c e c e λ−==+=−+=, [终端横截条件()f t f x t φλ∂=∂] 得 120.12,0.88c c ==最优轨线 *()0.120.88t tx t e e −=+ 最优控制 *()0.120.88t tu t e e −=−2-5、有一开环系统,包含放大倍数为4的放大器和一个积分环节。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4题任选2题
1.一质点沿曲线()y f x =从点(0 ,8)运动到(4 ,0) ,设质点运动速度为x ,问曲线取什么样的形状 ,质点运动的时间最短? 解答:取两点之间的连线直线为质点运动时间最短曲线。
2.设有一阶系统x x u •
=-+ ,()03x = ,试确定控制函数()u t ,在t=2时 ,把系统转移到零状态 ,并使泛函
()2
20
1J u dt
=+⎰
取极小值 ,如果把系统转移到零态的时间不固定 ,那该如何求解? 解答:t=2时的系统转移到零时刻 ,
2112H 020
1112201(t)(t)(t )e 2
3
(0)3,(2)0(t 32
t t
u x u H
x H
x x x u
H
u u
u x x x x d dx C
C e x C x x x λλλλ
λ
λλ
λλλλλ--=∂=-→=-∂∂=-→=-+∂∂=→+=∂→
⎧⎛
⎫=-+---⎛⎫⎛⎫⎪ ⎪⇒=⎨ ⎪ ⎪ ⎪⎝⎭⎝⎭⎪-=-⎝⎭⎩
=→=+==⇒=+做汉密尔顿函数:(1+)+(-+)
欧拉方程:状态方程:控制方程:消除代入边界条件:
)e 3(t)2
t t
u e --⇒=-
222111(t )0(1)()0
t 21230
33(t 3)e e 22C 31e C t +6+C 22f f f f f
t
t f t f H u x u u ux u x u θ
θλλ---∂=-=→++-+=∂=-→+-==+=-=移动到零态的时间不固定则还要符合条件
由于则将和代入
()
无法继续。
3.已知线性二阶系统的微分方程及初始条件为
12x x •
= ,()101x = 2x u •= ,()201x =
求最优控制()u t ,使下列性能指标分别为最小 (a )1
20J u dt =⎰ ,()111x =
(b )20
f t J u dt =⎰ ,()()21f f f x t c t t ==-(f t 可变)
(c )20
f t J u dt =⎰ ,()()()212,0f f f f x t c t t x t ==-=
解答:(a )
2122122111
212112H ,0,(t)C (t)C C H
0202
f u x u H
x x x x u H
x
t u u t u λλλλλλλλλλ=++∂=
→==∂∂=-→==∂=→=∂=→+=→=-∂本题为t =1,终端固定的最优解问题正则方程:
控制方程:
211222
231112123
231
113122(t)24
(t)412
(0)11,1
(1)11111212
(t)t 1(t)3t 1C C
x t x t C C C
x t C x t C t C x C C C x C x t x =-
→=-+=-+→=-++=→===→-++=⇒=⇒=-++=-+边界条件 (b )
232
1111C =1,C =1(t )t (t )(
)(t )(t )
1
f f T
f f f x M v x v C λ=-∂=→∂==同理可以得到
4.设受控系统为12x x •= ,23x x •= ,3x u •
= ,试写出在约束()1u t ≤条件下 ,系统由初始条件()()()1230000x x x ===转移到目标集
()21f
f x t t = ,()()2
23f f x t x t = ,且使性能指标()220
f
t f f J t x t u dt =+⎰为
最小的最优控制必要条件 ,其中f t 未定。