最优控制笔记整理
《最优控制》第4章线性系统二次型性能指标的最优控制问题
1 T 1 T e ( t ) Q ( t ) e ( t ) X (t )Q(t ) x(t ) 以零状态为平衡状态 2 2 1 T 1 T ②输出调节器 e (t )Q(t )e(t ) y (t )Q(t ) y (t ) 2 2
<输出调节器可转化为状态调节器> y(t ) c(t ) x(t )
第4章——线性系统二次型性能指标的最优控制问题
(t ) (22 F12 )1( F11 21) x(t )
可以证明 (22 F12 )1 存在 因此, (t )与X (t ) 呈线性关系,可表示为 (t ) P(t ) x(t ) 则
u * (t ) R 1(t ) BT (t ) P(t ) x(t )
(微分方程解的存在性和唯一性定理)
* * * * x1 x2 即x1 x2
16
第4章——线性系统二次型性能指标的最优控制问题
5.总结 状态调节器控制规律 u * (t ) R 1 (t ) BT (t ) P(t ) x(t ) 其中P(t)满足下面的矩阵黎卡提微分方程及边界条件
⑤状态方程
x Qx AT
1 T 1 T x x Ax BR B A BR B x T T Qx A Q A
x(t0 ) x(t ) (t ) (t , t0 ) (t ) 0
3 Q(t ), R(t ) 加权矩阵 Q(t )半正定,R(t )正定且均为时变 1 T 4 e (t f ) Fe(t f ) 突出对终端的误差的要求 2 特别要求终端固定,即e(t f ) 0时,F
5
最优控制理论课程总结
《最优控制理论》课程总结姓名:肖凯文班级:自动化1002班学号:0909100902任课老师:彭辉摘要:最优控制理论是现代控制理论的核心,控制理论的发展来源于控制对象的要求。
尽50年来,科学技术的迅速发展,对许多被控对象,如宇宙飞船、导弹、卫星、和现代工业设备的生产过程等的性能提出了更高的要求,在许多情况下要求系统的某种性能指标为最优。
这就要求人们对控制问题都必须从最优控制的角度去进行研究分析和设计。
最优控制理论研究的主要问题是:根据已建立的被控对象的时域数学模型或频域数学模型,选择一个容许的控制律,使得被控对象按预定要求运行,并使某一性能指标达到最优值[1]。
关键字:最优控制理论,现代控制理论,时域数学模型,频域数学模型,控制率Abstract: The Optimal Control Theory is the core of the Modern Control Theory,the development of control theory comes from the requires of the controlled objects.During the 50 years, the rapid development of the scientific technology puts more stricter requires forward to mang controlled objects,such as the spacecraft,the guide missile,the satellite,the productive process of modern industrial facilities,and so on,and requests some performance indexes that will be best in mang cases.To the control problem,it requests people to research ,analyse,and devise from the point of view of the Optimal Control Theory. There are mang major problems of the Optimal Control Theory studying,such as the building the time domain’s model or the frenquency domain’s model according to the controlled objects,controlling a control law with admitting, making the controlled objects to work according to the scheduled requires, and making the performance index to reseach to a best optimal value.Keywords: The Optimal Control Theroy, The Modern Control Theroy, The Time Domaint’s Model, The Frequency domain’s Model,The Control Law一、引言最优控制理论的形成和发展和整个现代自动控制理论的形成和发展十分不开的。
最优控制笔记
最优控制又叫动态优化工程技术领域里的过程(物理过程或化学过程),通常都是可以控制的过程控制:使过程的发展变化按人们的需要进行动态优化问题的四个要素:1.建立过程的动态模型(动态系统的状态方程)2.指定所需的初始状态和结束状态(状态方程的边界条件)3.确立在可行控制策略4.性能指标动态系统的变化,可以看成对应状态的变化,其中每一个状态对应着n维状态空间中的一个点,系统的运动将在状态空间中画出一条状态曲线动态系统的状态方程:1.是对研究对象的动态数学建模2.体现了系统运动时应遵循的规律,反映了系统的动态特征3.一般是微分方程组描述状态方程f[x(t),u(t),t]的数学性质:1.f[x(t),u(t),t]是向量函数,维数与状态变量维数相同2.f[x(t),u(t),t]是关于x(t)/u(t)/t的连续函数3.f[x(t),u(t),t]是关于x(t)/t的连续可微函数4.u(t)是关于t的分段连续函数,只有有限个第一类间断点系统的初始时刻t0和初始状态x0一般都是已知的系统的结束时刻tf:固定或者不固定系统的结束状态xf:全部固定/全部不固定/部分固定性能指标:1.要根据实际任务确定,例如过程持续的时间最少/过程消耗的能量最少/成本最小/利益最大等等2.种类:终值型/积分型/复合型,它们都是关于x(t)/t的连续可微函数最优控制一定是容许控制,即最优控制策略(最优控制函数)在控制函数空间中的一个子集中选择当最优控制轨迹确定后,通过系统的状态方程,可以确立对应的最优状态轨迹现代控制理论相对于经典控制理论的优点:1.从时不变系统延伸到时变系统2.从单输入单输出系统延伸到多输入多输出系统3.从频域回到时域,采用能够揭示系统内部各状态变化规律的状态空间描述法最优控制理论属于现代控制理论的分支从数学角度来看,最优控制问题本质上是求泛函极值的变分学问题变分法分为古典变分法和现代变分法(最大值原理/动态规划)古典变分法只能解决容许控制集为开集的最优控制问题实际最优控制问题的容许控制集都是闭集,可以用现代变分法解决函数分为两类:普通函数和泛函普通函数随自变量t变化有确定值对应泛函随普通函数(称为泛函的宗量函数)的形式变化有确定值对应,t已确定或不产生影响复合函数也是普通函数,随自变量t变化有确定值对应具有某些相同特征的所有函数组成一个函数类,或称函数空间在函数空间内,每一个函数(形式不同的)成为函数空间的一个点,例如sin(x)和sin(2x)是正弦函数空间的两个点泛函宗量的变分:1.同一函数空间中的两个函数的差(t已确定或不产生影响)2.宗量的变分仍然是一个普通函数3.这里“变分”的意思是改变量宗量的维数为m时,则宗量的变分在m维函数空间中进行,其中每一维函数空间各自是具有某些相同特征的函数类两个普通函数k阶相近的定义,从几何上来看就是曲线的相似程度两个普通函数间的k阶距离定义,从几何上来看就是曲线的差异程度m维函数空间中,与点[x0(t),x1(t),...xm(t)]距离相同的点构成m维空间中的一个球面泛函k阶连续的定义(利用两个普通函数间的k阶距离来定义)线性泛函的定义:满足齐次性与可加性泛函的变分:1.是泛函增量的关于宗量变分的线性主部2.是关于宗量变分的线性连续泛函3.仍然是一个泛函4.泛函的变分是唯一的5.这里变分的意思相当于普通函数的微分泛函变分的计算公式,是关于宗量变分的泛函,也是关于alpha的普通函数,从普通函数极值条件出发推导得到泛函极值条件求普通函数的极值,必要条件是:极值在稳定点获得,稳定点即普通函数导数为0的点求泛函的极值,必要条件是:极值在泛函变分为0的点取得Lagrange/Mayer/Bolza形式指标的相互转换欧拉--拉格朗日方程的推导过程欧拉--拉格朗日方程是一个二阶微分方程欧拉--拉格朗日方程成立的前提:1.宗量函数对自变量的二阶导数存在2.积分函数二阶连续可微欧拉--拉格朗日方程的能积分出最优解的特殊情况含有多个宗量函数的欧拉--拉格朗日方程组形式等式约束条件下的泛函极值问题采用拉格朗日乘子思想等式约束下的多变量普通函数极值问题,拉格朗日乘子是m维常向量等式约束下的泛函极值问题,拉格朗日乘子是m维普通函数,称为协态变量拉格朗日乘子法的步骤:原问题-->辅助泛函-->解等式约束+欧拉方程-->用边界条件确定未知系数-->判断极大/极小/鞍点等式约束下的泛函极值问题中,拉格朗日乘子(本质上是普通函数)的欧拉方程就是原问题的等式约束条件对于最优控制问题,控制函数u(t)和状态函数x(t)都看成是泛函的宗量,系统的动态方程作为等式约束条件Hamilton函数是泛函,其t的范围由x(t)/u(t)中的t范围确定,可以看成是mayer型泛函Hamilton函数的作用:积分型泛函J对u(t)的等式约束条件极值问题,转换成H对u(t)的无约束条件机制问题Hamilton函数方法解决最优控制问题,是基于必要条件,而不是充分条件Hamilton函数沿着最优空之轨迹和最优状态轨迹,对时间t的全导数等于偏导数当Hamilton函数不显含t时,H是不依赖于t的常数基础数理化:数学是理路,物理和化学是实践;工程中的物理和化学变化过程都是可控的;过程:与时间有关,随着时间推荐的变化,又叫动态过程;动态过程的数学模型又称状态方程,为OEDs或者DAEs形式对一个过程实施控制往往可以选择的策略不唯一,为了使得任务完成得最好,需要选择最优控制策略;最优的意义:根据任务确定的技术或者经济指标,可以是时间上最快、能量上最省、成本最低、利润最大等;状态微分方程f[x(t),u(t),t]是关于u(t),x(t),t的连续函数,是关于x(t),t的连续可微函数,u(t)只有有限个第一类间断点;状态、状态空间、动态系统的变化过程对应于状态空间中的点运动轨迹、点运动轨迹的起始点和结束点就是状态方程的边界条件;系统的初始时间t0和初始状态x0通常是给定的;系统的结束状态根据结束时间tf是否固定和结束状态是否固定可分为6种情况;性能指标的类型:终值型(Mayer型)、积分型(Lagrange型)、复合型(Bolza型;)终值型(Mayer型)是x(t),t的连续可微函数;积分型(Lagrange型)是u(t),x(t),t的连续函数,是x(t),t的连续可微函数,u(t)只有有限个第一类间断点;注意终值型(Mayer型)指标中不含u(t);最优控制轨迹往往在m维控制函数空间的一个子集omiga中选择;经典控制论的特点:针对SISO、线性、时不变(定常)、集中参数系统,以laplace变换作为分析工具,频域内;现代控制论的特点:针对MIMO、非线性、时变、分布参数系统,以状态空间分析方法为分析工具,时域内分析;对系统的状态空间描述,最大好处在于能够反映系统内部各状态变量之间的关系;最优控制理论属于现代控制理论的一部分;最优控制问题在数学上来说属于求泛函极值的变分学领域;古典变分法的局限性:只能处理u(t)无约束或者为开集的泛函极值问题;现代变分学的两个代表:最大值原理(苏联,Pontryagin提出)和动态规划(美国,Bellman 提出);现代计算机的发展推动了控制理论和优化理论的发展与应用,增加了基于计算的科研活动方式;函数分为一般函数和泛函两类;一般函数:自变量形式唯一,当自变量确定为某一值时,函数值也随之确定;泛函:自变量形式和取值(范围)已经确定,当宗量函数形式确定时,泛函值也随之确定;复合函数属于一般函数;终值型泛函中,tf能被确定,所以泛函值取决于终值型泛函的宗量形式;积分型泛函中,被积函数往往是u(t),x(t),dx(t)/dt,t的函数,u(t),x(t)都属于积分型泛函的宗量;积分型泛函中,由于宗量的维数大于1:宗量为u(t),x(t),且各自维数也可能大于1,所以积分型泛函属于多维泛函(宗量为多维,在多维函数空间内取值);Hamiltonian属于多维泛函,自变量取值范围为t0~tf,宗量包括控制函数u(t),状态函数x(t),协态函数y(t);函数空间:具有相同性质的函数类(按函数不同形式区分函数类中的单个函数),构成了一维函数空间(一根轴),每个属于该函数类的具体形式函数都是该一维函数空间(轴)上的一个点;宗量函数的变分deltax(t):是同一函数类中两个一般函数的差,或者说是某一维函数空间中两个点之间的距离,本质上仍然是一个一般函数;一般函数相近的几何意义:曲线形态相似;泛函连续性的定义及与宗量函数相近(宗量函数的变分趋于0)的关系;线性泛函的定义:满足针对宗量函数的齐次性和可加性(将宗量看成一般函数的自变量);泛函变分detalJ[x(t)]:是泛函增量关于“宗量函数变分”的线性主部,是关于“宗量函数变分”的线性连续泛函,本质是泛函;泛函的变分具有唯一形式;求一个泛函的变分不直接使用定义,而用偏导数方法获得,这与一般函数的微积分知识相似;泛函达到极值的必要条件:泛函在宗量函数x*(t)处的变分为0,有三种情况:非极值,极大值,极小值;古典变分法中的欧拉方程由积分型泛函变分为0的必要条件推出,所以欧拉方程也是泛函达到极值的必要条件;欧拉方程本质上是一个二阶偏微分方程;欧拉方程成立的前提是:L[x(t),dx(t)/dt,t]对宗量函数x(t)、宗量函数的导数dx(t)/dt、自变量t存在二阶偏导数;注意L[x(t),dx(t)/dt,t]本身不能称为泛函(自变量的值没有给定),也不能称为宗量函数(宗量函数是x(t));欧拉方程可以求解的条件:L[x(t),dx(t)/dt,t]中不显含x(t)、dx(t)/dt、t三者其一或其二;宗量函数为向量函数时,欧拉方程也成为向量二阶偏微分方程(二阶偏微分方程组);phi(tf)这条终端曲线实际靠测试获得,并作为已知曲线;横街条件反应的是:极值曲线终端斜率与给定曲线斜率之间的关系横街条件成立的前提:L[x(t),dx(t)/dt,t]对宗量函数x(t)、宗量函数的导数dx(t)/dt、自变量t存在二阶偏导数;phi(t)对自变量t存在一阶偏导数;终端点可变情况下,泛函极值的必要条件共有两个:欧拉方程、横街条件;Lagrange型泛函的一阶变分和二阶变分的表达式;泛函极值属性的判断需要借助二阶变分表达式,它是一个对称函数矩阵;涉及到最优控制问题时,最优状态轨迹不仅要使目标函数最优,更重要的是满足系统的状态方程;系统的状态方程(等式)可以看成是求泛函极值问题时的微分等式约束;带等式约束的泛函极值问题,处理思想和一般函数的等式约束极值问题思路一样,采用拉格朗日乘子法思想;带等式约束的泛函极值问题,拉格朗日乘子是一般函数(一般函数的等式约束极值问题中,拉格朗日乘子是常数);带等式约束的泛函极值问题,与一般函数的等式约束极值问题相比,梯度为0的必要条件进化成为变分为0(欧拉方程的满足);带等式约束的泛函极值问题,原等式约束可以视为F[x(t),dx(t)/dt,lamda(t),t]对宗量函数lamda(t)的欧拉方程;利用古典变分法求解最优控制问题,是将控制函数u(t)和拉格朗日乘子函数lamda(t)都作为泛函的宗量函数;Hamiltonian的作用是将dx(t)/dt从F[u(t),x(t),dx(t)/dt,lamda(t),t]中分离出去,它们的关系是:H[u(t),x(t),lamda(t),t]=F[u(t),x(t),dx(t)/dt,lamda(t),t]-lamda(t)dx(t)/dt正则方程组的推导既可以从F[u(t),x(t),dx(t)/dt,t]的欧拉方程推导,也可以直接从变分=0的必要条件推导(欧拉方程从变分=0的必要条件中推导出来);推导tf固定、tf自由时的最优控制问题必要条件时,辅助函数的做法:终态约束等式约束放在积分号外面,状态方程等式约束放在积分号里面;tf固定时的三种情况:x(tf)固定(仅需要欧拉方程无需横截条件)属于x(tf)自由的特殊情况,x(tf)自由又属于x(tf)受约束的情况;tf自由时的三种情况:x(tf)固定(仅需要欧拉方程无需横截条件)属于x(tf)自由的特殊情况,x(tf)自由又属于x(tf)受约束的情况;tf固定又属于tf自由时的特殊情况,仅缺少关于最优时间的方程,所以6种情况最终都可以归类为tf自由、x(tf)受约束的情况处理;Hamiltonian沿着最优控制轨迹和最优状态轨迹(即H[u(t),x(t),lamda(t),t]中的u(t),x(t),lamda(t)都在最优轨迹上取值)时,对时间的偏导数等于对时间的全导数;以上性质说明:沿着最优控制轨迹和最优状态轨迹时,若Hamiltonian不显含t,则Hamiltonian为常数;不等式约束泛函极值问题?古典变分法要求u(t)属于一个全函数空间或者一个函数空间中的开集;现代变分法从实际出发,u(t)可以属于一个函数空间中的闭集;现代变分法中的代表:极小值原理(苏联,Pontryagin)和动态规划(美国,Bellman)极小值原理比古典变分法的进步:u(t)可以属于一个函数空间内的闭集,不要求Hamiltonian对u(t)可微;当u(t)属于一个函数空间内的闭集时,H对u(t)的偏导数可能不为0(在闭函数空间内取不到极点)、deltau(t)可以为0,两方面原因造成古典变分法不再适用;与古典变分法对应的是,极小值原理也有6种情况,最普遍的是tf可变、x(tf)受约束的情况;对于tf可变的情况,需要增加一个确定tf的方程(属于横截条件的一部分);Hamiltonian达到极小值的定义?极小值原理仅是最优控制问题的必要条件;如果x(tf)有终端约束,那么两点边值问题的求解难度会增加很多,常用方法为打靶法(扫描法);协态变量就是等式约束泛函极值问题的拉格朗日乘子函数;状态变量终态的自由与固定,对应协态变量终态的固定与自由;状态变量微分方程求解联合协态变量微分方程求解体现了原问题--对偶问题的共同求解思想?目标泛函对u(t)求偏导,实际是泛函对宗量函数求偏导;从理论分析可以得到,目标泛函对u(t)的梯度(偏导数)在最优控制问题中与Hamiltonian 对u(t)的梯度(偏导数)等价;最优控制(动态优化)问题转换成静态优化问题的理论:通过对u(t)的离散化,将函数空间变为向量空间?从而可以直接使用静态优化算法;处理x(tf)受约束的方法除了惩罚函数法还有其他方法没?[文档可能无法思考全面,请浏览后下载,另外祝您生活愉快,工作顺利,万事如意!]。
自动控制原理最优控制知识点总结
自动控制原理最优控制知识点总结自动控制原理是现代工程领域中一个非常重要的学科,广泛应用于工业生产、交通运输、航空航天等各个领域。
在自动控制原理中,最优控制是一个关键的概念和方法,它旨在通过优化系统的性能指标,实现系统的最佳控制效果。
本文将对自动控制原理中的最优控制知识点进行总结。
一、最优控制的基本概念最优控制是在给定约束条件下,通过设计最优控制器使系统的性能指标达到最佳的控制方法。
其中,性能指标主要包括系统的稳定性、响应速度、误差稳态和鲁棒性等方面。
最优控制的目标是通过优化控制器参数和系统的状态变量,使系统的性能指标最小化或最大化。
二、最优控制的数学模型最优控制的数学模型主要包括动态模型和性能指标两个方面。
动态模型描述了系统的演化过程,可以是线性模型或非线性模型;性能指标则是对系统性能的衡量,可以是能量消耗、误差平方和、状态变量变化率等。
最常用的数学工具是拉格朗日乘子法、泛函分析、动态规划等。
三、最优控制的方法最优控制的方法包括最优化理论、动态规划、变分法等。
其中,最优化理论是最常用的方法之一,主要通过求解极值问题来设计最优控制器。
动态规划则是一种递推算法,通过将大问题分解成小问题,并利用最优性原理逐步求解最优控制器。
变分法则是通过对系统状态和控制器函数进行变分,并通过求解欧拉-拉格朗日方程来得到最优系统。
四、最优控制的应用最优控制在各个领域都有广泛的应用。
在工业生产中,最优控制可以提高生产过程的效率和质量;在交通运输中,最优控制可以优化交通流量和减少交通拥堵;在航空航天中,最优控制可以提高飞行器的性能和安全性。
此外,最优控制还应用于经济学、生物学、环境科学等其他领域。
五、最优控制的发展趋势随着科技的发展和应用领域的不断扩展,最优控制领域也在不断发展和创新。
未来的研究方向主要包括多目标最优控制、非线性最优控制、鲁棒最优控制等。
同时,随着计算机技术的进步,最优控制算法也将得到进一步改进和优化。
总结:自动控制原理中的最优控制是一个重要的概念和方法,通过优化系统的性能指标,实现系统的最佳控制效果。
最优控制总结
最优控制理论总结宫庆义2010.6.301. 最优控制问题可用下列泛函表示:[][]0()00min (),(),(),..(1)()(),(),,()(2)(),0ft f f t u t f f J x t t L x t u t t dt s t xt f x t u t t x t x x t t ϕψ∈Ω⎡⎤=+⎣⎦==⎡⎤=⎣⎦⎰2. 最优控制的应用类型:(一) 积分型性能指标: []0(),(),ft t J L x t u t t dt =⎰(1) 最小时间控制: 00ft f t J dt t t ==-⎰(2) 最少燃耗控制: 01()fmt jt j J u t dt ==∑⎰(3) 最少能量控制: 0()()ft T t J u t u t dt =⎰(二) 末值型性能指标: (),f f J x t t ϕ⎡⎤=⎣⎦ (三) 复合性能指标:(1) 状态调节器:011()()()()()()22f t T T Tf f t J x t Fx t x t Qx t u t Ru t dt ⎡⎤=++⎣⎦⎰ (2) 输出跟踪系统:011()()()()()()()()()22f t T T Tf f t J e t Fe t e t Qe t u t Ru t dt e t z t y t ⎡⎤=++=-⎣⎦⎰3. 欧拉-拉格朗日方程:0L d L x d t x ∂∂⎛⎫-= ⎪∂∂⎝⎭注: 若()min (,,)..(,,)0ft x t J g x xt dt s t f x xt ==⎰ (,,,)(,,)()(,,)TL x xt g x x t t f x x t λλ=+例题:(1)求通过点(0,0)及(1,1)且使120()J x xdt =+⎰取极值的轨迹*()x t 解: 欧拉-拉格朗日方程: 2(2)0dx x dt-= 即 0x x -= ()c o s h s i n hx t a t b t =+ 由初始条件:(0)00x a =⇒= 末端条件: 1(1)1sinh1x b =⇒= 因而极值轨迹为:*1()sinh sinh1x t t = (2)求使指标1230()J xx dt =+⎰取极值的轨迹*()x t , *(0)0x = 解:这是终端自由的情况, 欧拉-拉格朗日方程为:()2230dx x dt+= 即 223x x C += 令()xt at b =+ 由(0)00x b =⇒= 又末端自由, 横截条件为:2310ft t Lx x x=∂⎡⎤=+=⎣⎦∂ 即 2230a a +=得:0a =或23a =-, *()0,0x t J ==对应局部极小, *24(),327x t t J =-=对应局部极大(3)设系统状态方程: x u = 边界条件为: (0)1,()0,f f x x t t ==自由性能指标为: 2012f t f J t u dt =+⎰ 要求确定最优控制*u , 使J 最小解: 这是f t 自由问题, 末端状态固定, ()0f x t =是满足约束集的特殊情况, 即 (),()0f f f x t t x t ψ⎡⎤==⎣⎦(),f f f x t t t ϕ⎡⎤=⎣⎦哈密顿函数: 212H u u λ=+ 正则方程: 0HHxu xλλ∂∂===-=∂∂ 控制方程: 0Hu u uλλ∂=+=⇒=-∂()1f fH t t ϕ∂=-=-∂ 即 : 221()()10()2f f f t t t λλλ-+=⇒=由正则方程: ()0t λ= 所以 ()t λ=于是 *()u t =再由正则方程: xu λ==- 可得()x t c =+ 由初始条件 (0)1x = 得 1c =故最优轨迹为: *()1x t =+ *()02f f x t t =⇒=(4) 设系统的状态方程为: ()()()xt x t u t =-+ 边界条件为: (0)1,()0f x x t ==, 求()u t , 使221()2f t J x u dt =+⎰为最小解: 221()()2H x u x u λ=++-+协态方程和控制方程为: H x x λλ∂=-=-+∂ Hu uλ∂=+=0∂ 即 u λ=- 故可得正则方程: ()()()xt x t t λ=-- ()()()t x t t λλ=-+ 拉氏变换: ()(0)()()sX s x X s s λ-=-- ()(0)())s s X s s λλλ-=-+( 解代数方程得:()(0)(0)()(0)(0)s x X s x λ==拉氏反变换:()()()()()(0)1)1)(0)()(0)1)1)(0)t e x e x t ee x λλλ⎤=-++⎦⎡⎤=-++⎣⎦由: (0)1,()0f x x t ==得:(0)f fλ=*()()1)1)u t t eeλ⎧⎫⎪⎤=-=-+⎬⎦⎪⎭注: 拉氏变换表(5)设系统状态方程为: 122()()()()x t x t xt u t == 初始条件为: 12(0)(0)1x x ==, 末端条件为: 12(1)0(1)x x =自由要求确定最优控制*()u t , 使泛函1201()2J u t dt =⎰取极小值 解: 边界条件222()(1)0(1)f t x ϕλλ∂===∂ 哈密顿函数: (,,)(,,)T H L x u t f x u t λ=+ 212212u x u λλ=++ 正则方程: 12112()0()()H Ht t t x x λλλ∂∂=-==-=-∂∂ 状态方程: 1222()()()()xt x t xt t λ==- 极值条件:0Hu∂=∂ ⇒ 20u λ+= 即 : *2()()u t t λ=- 边界条件: 12(0)1(0)1x x ==1222(1)0()(1)0(1)f x t x ϕλλ∂====∂ 对正则方程和状态方程进行拉氏变换:11222211221()(0)()()(0)()()(0)0()(0)()sX s x X s sX s x s s s s s s λλλλλλ-=-=--=-=-解以上代数方程得:11221222112123234111()(0)()(0)(0)1111111()(0)(0)()(0)(0)s s ss s X s X s s s ss s s sλλλλλλλλλ==-=--=+-+拉氏反变换:2312122111()1(0)(0)26()(0)(0)x t t t t t tλλλλλ=+-+=- 利用末端条件: 1212(1)0,(1)0(0)(0)6x λλλ==⇒== 最优状态轨迹:*231()13x t t t t =+-+ 最优协态:*2()6(1)t t λ=- 最优控制: **2()()6(1)u t t t λ=-=-(6) 设系统的状态方程为:10()()()001xt x t u t ⎡⎤⎡⎤=+⎢⎥⎢⎥⎣⎦⎣⎦指标泛函: 2201()2J u t dt =⎰ 边界条件: 10(0)(2)10x x ⎡⎤⎡⎤==⎢⎥⎢⎥⎣⎦⎣⎦求使指标泛函取极值的极值轨线*()x t 和极值控制*()u t 解: []121212221,,2T f x x g u f f u xλλλ-⎡⎤⎡⎤====⎢⎥⎢⎥-⎣⎦⎣⎦ 拉格朗日标量函数: 2121221()()2TL g f u x xu x λλλ=+=+-+- 欧拉方程:1111122222000L d L a x dt x L d L at b x dt xL d L u u at bu dt uλλλλλλ∂∂-===∂∂∂∂-=+==-+∂∂∂∂-=+==-∂∂由于状态约束方程:22223212112111262xu at b x at bt c xx at bt c x at bt ct d==-=-+==-+=-++代入边界条件: 10(0)(2)10x x ⎡⎤⎡⎤==⎢⎥⎢⎥⎣⎦⎣⎦得: 73,,12a b c d ====于是极值轨线: *321**22()0.5 1.751()3 3.5() 1.5 3.51x t t t t u t t x t t t ⎡⎤⎡⎤-++==-⎢⎥⎢⎥-+⎢⎥⎣⎦⎣⎦*x =(7)设性能指标泛函: 0ft J =⎰(0)1,()()2f f f x x t c t t ===-求使泛函为极值的最优轨线*()x t 及相应的**,ft J 解: L = 欧拉-拉格朗日方程:22220,()1L d L d C C x a x t at b x dt x dt C⎡⎤∂∂-=-=⇒===⇒=+∂∂- 由(0)1x =得: 1b =由横截条件:()(10()11ffTf t t L L cx x xt a x ⎤∂⎡⎤+-=--=⇒=⇒=⎢⎥∂⎣⎦最优轨线为: *()1x t t =+当f t t =时, ()()f f x t c t = 即: 12f f t t +=-, 求得末端时刻 *12f t = 将**(),f x t t 代入指标泛函,可得最优性能指标*J =(8) 设系统方程为: 122()()()()x t x t xt u t == 初态:12(0)(0)0x x == 末端时刻: 1f t = 末端约束: 12(1)(1)1x x += 性能指标: 121()2J u t dt =⎰ 求使J 最小的最优控制*()u t 和相应的最优轨线*()t x 解: 2121()0,()()(1)(1)12f f t L u t x x ϕψ⎡⎤⎡⎤===+-⎣⎦⎣⎦ x x212212H u x u λλ=++ 由协态方程: 1110()H t a x λλ∂=-==∂2122()H t at b x λλλ∂=-=-=-+∂由极值条件:220Hu u at b uλλ∂=+=⇒=-=-∂由状态方程:2222321211()2111()262xu at b x t at bt c xx at bt c x t at bt ct d==-=-+==-+=-++由初态: 12(0)(0)00x x c d ==⇒== 由目标集: 12(1)(1)10496x x a b +-=⇒-=根据横截条件:1212(1)(1)(1)(1)x x ψψλγγλγγ∂∂====∂∂即: 121(1)(1)2a b λλ=⇒=于是解得: 36,77a b =-=-最优解为: *3()(2)7u t t =-- 最优轨线: *211()(6)14x t t t =-- *23()(4)14x t t t =--例题:(1) 最短时间控制问题:状态方程: 122,x x xu == 初始条件: 101220(0)(0)(0)x x x x ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦x = 末端条件: 12()()0f f x t x t ==约束控制: ()10f u t t t ≤≤≤求使性能指标0ft f J dt t ==⎰取极小的最优控制.解: 1221T H L f x u λλ=+=++λ协态方程: 110H x λ∂=-=∂ 212H x λλ∂=-=-∂12()()t at at b λλ==-+选择u 使H 取极小 []2221()0()sgn ()1()0t u t t t λλλ<⎧==⎨->⎩2()t λ为t 的线性函数, u 最多改变一次符号当()1u t =时, 状态方程的解为:220212010()1()2x t t x x t t x t x =+=++ 消去t 得相轨迹方程: 2121()()2x t x t C =+ 当()1u t =-时, 状态方程的解为:220212010()1()2x t t x x t t x t x =-+=-++ 消去t 得相轨迹方程: 2121()()2x t x t C '=-+ 相轨迹的方向总是逆时针两簇曲线中, 每一簇中有一条曲线的半支进入末端状态点(原点) ()1u t =的曲线簇中, 通过原点的曲线方程为: 21221()()()02x t x t x t =≤ 记: γ+()1u t =-的曲线簇中, 通过原点的曲线方程为:21221()()()02x t x t x t =-≥ 记: γ-,γγ+-称为开关线, 其方程为: 1221()()()2x t x t x t =-开关线左侧区域用R +表示, 开关线右侧区域用R -表示 于是最优控制律, 可以表示为状态[]12,Tx x x =的函数, 即*121,(,)1,x R u x x x R γγ++--∈⎧=⎨-∈⎩(2)最少燃料控制问题状态方程: 122,xx x u == 初始条件: 101002020()()()x t x t x t x ⎡⎤⎡⎤=⎢⎥⎢⎥⎣⎦⎣⎦x = 末端条件: 12()()0f f x t x t == 约束控制: 0()1f u t t t t ≤≤≤ 求使性能指标0()ft t J u t dt =⎰取极小的最优控制. 解: 122()T H L f u t x u λλ=+=++λ协态方程: 110H x λ∂=-=∂ 212H x λλ∂=-=-∂ 12()()t a t at b λλ==-+使H 取得极小值, 等价于求下式的极小值2()min ()()()u t u t t u t λ∈⎡+⎤⎣⎦Ω 使H 取得极小值的最优控制律为:[]222220()1()sgn ()()10()1()11()0()1t u t t t u t t u t t λλλλλ⎧<⎪=⎨->⎪⎩≤≤=--≤≤= 当()1u t =时, 2121()()2x t x t C =+ (开口向右--抛物线) 当()1u t =-时, 2121()()2x t x t C =-+ (开口向左--抛物线) 当()0u t =时, 220110200(),()()x t x x t x x t t ==+- (水平线)由状态方程得: 21120211120110222112112121222121222221:()1()20:()()()()()()1:0()()10()()()()2f f u x t t x x t t x t x u x t x t Cx t x t x t t t u x t t t x t x t t t t t =-=-+=-++====+-==+-=+-+-由以上6个方程, 来解6个未知数:(3)设系统状态方程为: 122()(),()()xt x t x t u t == 边界条件: 12121(0)(0)0,()()4f f x x x t x t ==== 控制约束: ()1u t ≤, 末端时刻f t 自由求: 最优控制*()u t 使性能指标20()f t J u t dt =⎰最小 解: 22212221221124H u x u u x λλλλλ⎛⎫=++=++- ⎪⎝⎭ 由极小值条件知:2*2221()21()()()221()2t u t t t t λλλλ<-⎧⎪⎪=-≤⎨⎪->⎪⎩ 由协态方程: 1112122()0()()()()H t t a x H t t t at b x λλλλλ∂=-==∂∂=-=-=-+∂ *211()()()22u t t at b λ=-=- 代入状态方程: 22232121111()()()24211()()()124x t u at b x t at bt c x t x t x t at bt ct d ⎧==-⇒=-+⎪⎪⎨⎪=⇒=-++⎪⎩ 由初始条件: 12(0)(0)00x x c d ==⇒==根据末端条件: 321221()12441()424f f f f f f a b x t t t a b x t t t =-==-= 根据H 沿最优轨线变化律: 2122()()()()()()0f f f f f f H t u t t x t t u t λλ=++=解得: 323(2)31,0,39f f f ff t t a b t t t --===== 最优控制: *1()()218t u t at b =-= 验证: 在0,f t ⎡⎤⎣⎦区间上, 2()1,()2u t t λ≤≤满足要求 最优轨线: *3*21211(),()10836x t t x t t == 最优性能指标: 23*01()36J u t dt ⎡⎤==⎣⎦⎰7. 对于线性连续系统, 提出二次型目标函数:00011()()()()()()()22()()()()(),(),(),(),()f t T T T f f J x t Px t x t Qx t u t R t u t dt x t A t x t B t u t x t x R t P t Q t ⎡⎤=++⎣⎦=+=⎰ 正定半正定 0,f t t 固定求: 最优反馈控制, 并论述如何选择二次型目标函数中的加权矩阵.解: []1()()()()()()()()()()2T T T H x t Qx t u t R t u t t A t x t B t u t λ⎡⎤=+++⎣⎦ 协态方程: ()()()()T H Q t x t A t t xλλ∂⎡⎤=-=-+⎣⎦∂ 控制方程: 1()()()()0()()()()T T H R t u t B t t u t R t B t t u λλ-∂=+=⇒=-∂ 横截条件: 1()()()()()()2T f f f f f f t x t Px t Px t x t x t ϕλ∂∂⎡⎤===⎢⎥∂∂⎣⎦由此可见, 协态()t λ状态()x t 在末端时刻f t 成线性关系.设: ()()()t K t x t λ= 代入状态方程:1()()()()()()()()T x t A t x t B t R t B t K t x t -=- 由协态方程: ()()()()()()()()()()T t K t x t K t x t Q t x t A t K t x t λ⎡⎤=+=-+⎣⎦ 将()xt 代入: 1()()()()()()()()()()()()0T T K t K t A t K t B t R t B t K t A t K t Q t x t -⎡⎤+-++=⎣⎦ ()K t 由下面的黎卡提矩阵微分方程确定:1()()()()()()()()()()()T T K t K t A t A t K t K t B t R t B t K t Q t -=--+- 边界条件: ()f K t P =由此可得最优反馈控制: 1()()()()()()()T u t R t B t K t X t G t x t -=-=- 加权阵的选择: 若已知各加权变量允许的最大值为:1max 2max max ,,,n x x x 和1max 2max max ,,,n u u u1m a x 2m a x m a x 111,,,,n Q d i a gx x x ⎡⎤=⎢⎥⎣⎦ , 1max 2max max 111,,,,n R diag u u u ⎡⎤=⎢⎥⎣⎦8. 最优性原理: 一个多级决策问题的最优决策具有这样的性质: 当把其中任何一级及其及其状态作为初始级和初始状态时, 则不管初始状态是什么, 达到这个初始状态的决策是什么, 余下的决策对此初始状态必定构成最优策略.例题:(1) 系统方程为: (1)()()x k x k u k +=+, (0)x 给定 (1)122011(2)()22k J cx u k ==+∑ (2) 要求: 用动态规划寻找最优控制序列(0),(1)u u 使J 最小解: 先考虑最后一步, 即从(1)(2)x x → 这时由(1),(2)得:(2)(1)(1)x x u =+[]222211111(2)(1)(1)(1)(1)2222J cx u c x u u =+=++ 求(1)u 使1J 最小, 得:[]1(1)(1)(1)(1)0(1)(1)1J cx c x u u u u c∂=++=⇒=-∂+ 将(1)u 代入1J 和(2)x 得: 2*1(1)(1)(2)211c x x J x c c==++ 再考虑倒数第二步, 即从(0)(1)x x → 这时: (1)(0)(0)x x u =+[]22*22011(1)1(0)(0)(0)(0)22122(1)c x c J J J u u x u c c =+=+=++++ 求(0)u 使J 最小得:[](0)(0)(0)0(0)1J c u x u u c∂=++=∂+ (0)(0)12cx u c=-+ 于是最优性能指标与最优状态转移为: 2*(0)2(12)cx J c =+ 1(1)(0)(0)(0)12c x x u x c +=+=+ 9. (1)直接法: 在每一步迭代中, ()u t 不一定要满足H 取极小值的必要条件, 而是逐步改善它, 在迭代终了使它满足这个必要条件, 而且, 积分状态方程是从0f t t →, 积分协态方程是从0f t t →, 这样就避免了去寻找缺少的协态初值0()t λ的困难. 常用的有: 梯度法, 二阶梯度法, 共轭梯度法(2)间接法: 在每一步迭代中, ()u t 都要满足H 取极小值的必要条件, 而且要同时积分状态方程和协态方程,两种方程的积分都是从0f t t →或从0f t t →. 常用的有边界迭代法, 拟线性化法.10. 分离定理: 按照此定理, 可以把最优控制问题和状态变量的最优估计问题分开讨论.在研究最优控制问题时, 假定所有状态变量都可以直接得到, 而在研究状态变量的最优估计时, 则假定控制信号是已知的确定性函数.最后把控制器中的状态变量用其估计值代替, 就得到了随机线性系统的最优控制.11. 分离定理应用: 在随机线性系统最优控制中, 目前理论上和应用上比较成熟的是所谓LQG 问题, 即线性系统, 二次型指标, 高斯分布噪声情况下的最优调节器问题. 这时分离定理可以成立.根据分离定理: 可将LQG 分成两部分, 即根据确定性系统来求出最优反馈控制律, 再由卡尔曼滤波器来测定最优状态估计值, 将这个状态估计值代替状态变量本身, 就得到了最优反馈控制.。
胡寿松《自动控制原理》笔记和课后习题(含考研真题)详解(动态系统的最优控制方法)【圣才出品】
1 / 32
圣才电子书
(2)变分和变分法
十万种考研考证电子书、题库视频学习平台
t
tx t dt
试求:
(1)δJ 的表达式;
(2)当 x(t)=t2,δx=0.1t 和 δx=0.2t 时的变分 δJ 的值。
解:(1)由泛函变分规则可知:
4 / 32
圣才电子书 十万种考研考证电子书、题库视频学习平台
(2)由(1)可知,δx=0.1t 时:
δx=0.2t 时:
10-6 试求下列性能指标的变分 δJ。
J tf t2 x2 x&2 dt t0
解:由泛函变分规则,求得:
10-7 已知性能指标为: 求 J 在约束条件 t2+x12=R2 和边界条件 x1(0)=-R,x2(0)=0,x1(R)=0,x2 (R)=π 下的极值。 解:构造广义泛函为:
5 / 32
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 10 章 动态系统的最优控制方法
10.1 复习笔记
考研初试一般不考查本章内容,下文为最优控制问题的基础理论部分。
一、最优控制的基本概念 (1)最优控制 概念:在系统状态方程和约束条件给定的情况下,寻找最优控制律,使衡量系统的某一 性能指标达到最优(最小或最大)。 (2)最优控制问题 任何一个最优控制问题均应包含四方面内容:①系统数学模型;②边界条件与目标集; ③容许控制;④性能指标。 (3)最优控制的研究方法 包括:解析法;数值计算法;梯度型法。
武汉大学自动化专业 《现代控制理论》第七章 最优控制
1
最优控制研究的主要问题是: 根据已建立的被控对象的数学模型,选择一个容许的 控制规律,使得被控对象按预定要求运行,并使给 定的某一性能指标达到极小值(或极大值); 从数学观点看,最优控制研究的是求解一类带有约束 条件的泛函极值问题,属于变分学的范畴。 古典变分理论只能解决控制无约束(即容许控制属于 开集)的一类最优控制问题,为满足工程实际的需 要,在20世纪50年代中期出现了现代变分理论, 常用的数学工具是Bellman(美国)的“动态规划”, 和Pontryagin(苏联)的‘极大值原理“。,又进一步推动了现代控制论的发展
T t0 T tf t0
∴ ..J = {θ [ X (t ), t ] λ (t ) X (t )}
+ ∫ {H [ X (t ), u (t ), t ] + λT (t ) X (t )}dt
t0
tf
9
极大值曲线的充分条件为 δ2 J<0
五 无约束条件的泛函极值
& 求 J ( X ) = ∫t Φ( X , X , t )dt 的极值,就是确定X(t),使 J = min .
0
tf
& 几何意义:寻找一条曲线X(t),使给定的可微函数 Φ ( X , X , t ) 沿X(t) 的积分达到极值,此时X(t)=X*(t)
横截条件: ①两端固定 ②两端状态自由
δX 0 = 0,.....δX f = 0
Φ & X Φ & X
tf
= 0,.....
③始端自由,终端固定 ④始端固定,终端自由 ⑤终端 t f 自由,但状态 X (tf )=c (tf ) 受约束——拦截 问题
Φ & X
最优控制的计算方法
可得
3、将 代入协态方程,且由边界条件 从t=1倒向积分可得 这里选步长因子 。如此继续下去,直至指标函数随迭代变化很小为止。 由 ,得
图b 最优状态的求解
图a 用梯度法寻找最优控制 右图表示了控制和状态的初始值和第一次迭代值,可以看到第一次迭代 就几乎收敛到最优值, 与最优值还有差异,而且一般说来愈接近最优值收敛愈慢。
K=1时时,控制量为
所以,这个例子只要两步迭代即可得到最优解。一般说来,共轭梯度法比梯度法收敛快,但接近最优解后收敛性仍是较慢的。一个补救办法是重新启动,即找出几个共轭梯度方向 后,令 ,再重新迭代,寻找共轭梯度方向。
可以证明 ,即为最优控制。这只要证明
2、共轭梯度法
*
用共轭梯度法寻找最优控制时是沿着所谓共轭梯度向量的方向进行的。为了说明共轭梯度的意义,我们先从求函数极值问题的共轭梯度法开始,再推广到求泛函极值问题。
(1) 求函数极值的共轭梯度法
其中,
C为常数, Q为正定阵。
要求寻找X使F(X)取极值。
设F(X)是定义在Rn空间中的二次指标函数
直接法的特点是,在每一步迭代中,U(t)不一定要满足H 取极小的必要条件,而是逐步改善它,在迭代终了使它满足这个必要条件,而且,积分状态方程是从t0到tf ,积分协态方程是从tf到t0,这样就避免了去寻找缺少的协态初值(t0)的困难。常用的直接法有梯度法,二阶梯度法,共轭梯度法。
间接法的特点是,在每一步迭代中都要满足H取极小的必要条件,而且要同时积分状态方程和协态方程,两种方程的积分都从从t0到tf或从tf到t0 。常用的间接法有边界迭代法和拟线性化法。
最优控制总结
/系统的数学模型,物理约束条件及性能指标。
数学描述:设被控对象的状态方程及初始条件为()[(),(),],(0)0x t f x t u t t x t x ==;其中,()x t X Rn ∈⊂为状态向量,X 为状态向量的可容许集;()u t Rm ∈Ω⊂为控制向量,Ω为控制向量的可容许集。
试确定容许的最优控制*()u t 和最优状态轨迹*()x t ,使得系统实现从初始状态(0)x t 到目标集[(),]0x tf tf ψ=的转移,同时使得性能指标0[(),][(),(),]tft J x tf tf L x t u t t dt ϕ=+⎰达到极值。
系统状态方程形式(连续,离散)(2)最优控制形式(开环,闭环) (3)实际应用(时间,燃料,能量,终端) (4)终端条件(固定,自由) (5)被控对象形目标函数及约束条件组成的静态优化问题可以描述为:在满足一系列约束条件的可行域中,确定一组优化变量,(极大值或极小值)。
数学描述:min (),,:n nf x x R f R R ∈→,..()0,:;()0,:n m n l s tg x g R R h x h R R =→≥→静态最优化问题,也称为参数最优化问题,它的三个基本要素是优化变量、目标函数和约束条件,其本质是解决函数,也称为最优控制问题,它的三个基本要素是被控对象数学模型、物理约束条件和性能指标,其本质是解 多变量目标函数沿着初始搜索点的负梯度方向搜索,函数值下降最快,又称最速下降法;(2)多变量无约束。
根据具体的最优换问题构造合适的惩罚函数,将多变量有约束最优化问题转换为一系列多变量无约束最优化问题,从而采用合适;(2)多变量有约束(外点法:等式约,不等式约束;内点法:不等式约束)。
通过构造拉格朗日函数,将原多变量有约束最优化问题转化为一个多变量无约束最优化问题,从而采用合适的无约束方法继(等式约束,不等式约束)。
梯度定义12()()()()f x x f x f x f x xx ∂⎡⎤⎢⎥∂∂⎢⎥=∇=⎢⎥∂∂⎢⎥∂⎣⎦,Hessian 矩阵22221212222212()()f f x x x f x H x x f f x x x ⎡⎤∂∂⎢⎥∂∂∂∂⎢⎥==⎢⎥∂∂∂⎢⎥∂∂∂⎢⎥⎣⎦,最优梯度法(无约束):迭代(1)()()()()k k k k x x f x α+=-∇,()()()()()()()()()()()k T k k k T k k f x f x f x H x f x α∇∇=∇∇,终止误差()()()k p k f x ε=-∇≤ 例:(),(0),()f x f x H x ∇∇;(0)[(0)(0)]f x T f x α=∇•∇/[(0)(0)]T f x H f x ∇••∇;(1)(0)(0)(0)x x f x α=-•∇;()f xk ε∇<,()x k 是极()0,()0x x =≥g h (1) 等式约束:(,)()()T H x f x x λ=+λg ,利用1210,0,0,0,0n mH H H H Hx x xλλ∂∂∂∂∂=====∂∂∂∂∂解出极大值点或极小值点。
(完整word版)最优控制讲义
第一章 绪论§1。
1最优控制问题静态最优化问题:输入—输出—代数方程 动态最优化问题:输入—输出-微分方程 确定性最优控制:系统参数确定,无随机输入 随机性最优控制:系统参数确定,有随机输入⎩⎨⎧=+=)()()()()(t Cx t Y t Bu t Ax t x⎩⎨⎧+=++=)()()()()()()(t v t Cx t Y t w t Bu t Ax t x例:飞船的月球软着陆问题推力 dtdmkf -= 运动方程 mg dt dmk mg f dtx d m --=-=22 )()(][00f t t t m t m dt dtdmJ f-=-=⎰ 初始条件 ⎩⎨⎧======0)(,)(,00f f t x x t t ht x x t t约束条件为 0≤≤-dtdmα求min J§1.2最优控制的数学模型一 控制系统的数学模型(集中参数系统)直接法建立:动力学、运动学的基本定律,即解析法.间接法建立:通过“辩识"的途径确定系统的结构与参数.)),(),(()(t t u t x f t x= 其中 T n t x t x t x t x )](,)(),([)(21 =,T r t u t u t u t u )](,)(),([)(21 =,],,[21n f f f f = )(t x 为n 维状态向量,)(t u 为r 维控制向量,f 为n 维函数向量。
二 目标集通过)(t u 使)(t x 由)(0t x 到)(f t x ,其中)(0t x 为初始状态,并且通常为已知;)(f t x 为终端状态,即控制所要求达到的目标。
一般来说对终端状态的要求可用如下的约束条件表示:0)),((,0)),((21≤=f f f f t t x g t t x g 。
三 容许控制i u 具有不同的物理属性,一般有r 1,2i u i ,,=≤α,即在控制域U 内。
第7章 最优控制原理总结
本 章 简 介(1/1)
本章简介
本章讨论最优控制问题初步,目的是使读者掌握求解最优控制 问题的主要理论和方法,能对一些常见的最优控制问题进行有 效的分析和求解。 主要内容包括
泛函基础、
变分法和极大值原理、 线性二次型最优控制问题,以及
离散系统的最优控制问题。
连续搅拌槽的温度控制问题(1/2)
3) 连续搅拌槽的温度控制问题 设有一盛液体的连续搅拌槽,如图7-1所示。槽内开始装有 0oC的液体,现需将其温度经1小时后升高到40oC。 为此在入口处以常速流入温度为u(t) 的液体,经槽内不停转动的搅拌器使 槽内液体温度均衡上升。
在出口处,设流出的液体保持槽内液 面恒定,其温度与槽内液体一致。
E k1 (T ) Ai 0 exp i RT i 1,2
设反应时间区间[t0,tf],反应器内温度T(t)满足 T*T(t)T* t0ttf
间歇化学反应器的最大产量控制问题(3/3)
该问题的目标是确定反应器内温度T(t)应该如何变化,才 能使在时刻 tf 时 B 物质的产量 C2(tf) 为最大 , 即归结到在约 束条件下,求 J=C2(tf) 最大的数学问题。
本章最后介绍基于Matlab的线性系统的线性二次型最优 控制系统的设计计算与运动仿真问题的程序设计与仿真 计算。
目录(1/1)
目
录
7.1 最优控制概述 7.2 变分法 7.3 变分法在最优控制中的应用 7.4 极大值原理 7.5 线性二次型最优控制 7.6 动态规划与离散系统最优控制 7.7 Matlab问题 本章小结
v h f v g m kf m
(2021年整理)最优控制理论考试重点
(完整)最优控制理论考试重点编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((完整)最优控制理论考试重点)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(完整)最优控制理论考试重点的全部内容。
1.最优控制问题的性能指标(1)积分型性能指标(拉格朗日型):⎰=ft t dt t t u t x L u J 0]),(),([)(反映控制过程偏差在某种意义下的平均或控制过程的快速性,同时能反映燃料或能量的消耗。
(2)末值型性能指标(梅耶型):]),([)(f f t t x u J φ=,接近目标集程度,即末态控制精度的度量. (3)综合性能指标(鲍尔扎型):⎰+=ft t f f dt t t u t x L t t x u J 0]),(),([]),([)(φ.2.最优控制问题的数学模型给定系统的状态方程:]),(),([)(t t u t x f t x =•;状态方程的边界条件:⎩⎨⎧∈===St x t t x t x t t f f )(,)(,000;给定性能指标:⎰+=f tt f f dt t t u t x L t t x u J 0]),(),([]),([)(φ;允许控制域u (t ):U t u ∈)(。
3.最优控制应用的几种类型:最短时间控制,最小能量控制,线性调节器,最少燃料消耗控制,线性跟踪器。
4.选取性能指标注意:应能反映对系统的主要技术条件要求,便于对最优控制进行求解,所导出最优控制易于实现。
5.边界条件:指状态向量在起点或终点的所有容许值的集合。
6.横截条件:依据性能指标的要求,从容许值的集合中选择哪一点作为始态或终态的问题。
第6章 最优控制
J (u ) [ x(t f ), t f ]
(0 6)
J (u) [ x(t f ), t f ] L[ x(t ), u(t ), t ]dt
t0
tf
(0 7)
第6章 线性二次型的最优控制
2. 最优控制问题的数学模型 用以下4个方程来描述 (1)给定系统的状态方程 (2)状态方程的边界条件
1956~1958年,庞特里亚金创立“最大值原理”。 它是最优控制理论的主要组成部分和该理论发展史上的一个里程碑。对 于“最大值原理”,由于放宽了有关条件的使得许多古典变分法和动态 规划方法无法解决的工程技术问题得到解决,所以它是解决最优控制问 题的一种最普遍的有效的方法。同时,庞特里亚金在《最优过程的数学 理论》著作中已经把最优控制理论初步形成了一个完整的体系。
6.3 输出调节器
6.4 跟踪器
1 tf T J (u ) ( x Qx u T Ru)dt 2 t0
线性二次型问题的特点
(0 14)
(1)最优解可写成统一的解析表达式,实现求解过程规范化 (2)可以兼顾系统的性能指标(快速性、准确性、稳定性、灵敏度)
第6章 线性二次型的最优控制
线性二次型问题的本质:
用不大的控制,来保持较小的误差,以达到能量和误差综合最优的目的。 线性二次型问题的三种重要情形:
x(t ) A(t ) x(t ) B(t )u(t ) y(t ) C (t ) x(t )
e(t ) yr (t ) y(t ) 1) 2) 3) C (t ) I yr (t ) 0 yr (t ) 0 yr (t ) 0 y(t ) e(t ) (5 2)
性能指标的物理含义:
最优控制的复习提纲汇总
g ( x(t f ),t f ) t f
7
连续极小值原理 三、极小值原理 离散极小值原理 H L( x(t ), u (t ), t ) T (t ) f ( x(t ), u (t ), t ) a )正则方程: f x H x b)极值条件: H ( x* (t ), u * (t ), (t ), t ) min H ( x* (t ), u (t ), (t ), t )
10
四、时间、燃料最优控 制 定理4.1~4.6 二次积分模型、无阻尼 振荡二阶系统的时间最 优控制 相平面分析法 二次积分模型的燃料最 优控制 五、动态规划 1.基本递推公式
u ( k )V
J * x(k ) min L( x(k ), u (k ), k ) J * x(k 1) k 0,1,, N a. J * x( N 1)的取法
T x tf
0
4
c) x(t0 ) x0 , x(t f )、t f自由
F F x
T x
Fx (t f ) 0
tf
0
d ) x(t0 ) x0 , x(t f ) x f , t f自由
F F x
T 分法求解最优控制 问题) 1 ) 前提条件 固定 2)t f , 自由 固定 x(t f )自由 受等式约束
b. 末态x( N )受约束x( N )=0或 x( N ) =0时,u * ( N 1)的确定
H L( x(t ), u (t ), t ) T (t ) f ( x(t ), u (t ), t ) a)正则方程: f x H x b)极值条件: H =0 u
6
第4章 最优控制理论
t* f t f
t f 很小,第二项可用积分中值定理
, t dt F x* t f , x * * t f , t f * t f J x F x* , x
t0 tf t* f
t* f
F x
J
1 T T x ( t ) x ( t ) Q x ( t ) x ( t ) u Ru dt d d 2 t0
二次型性能指标,工程中应用最为广泛
• 性能指标,泛函,即函数的函数
按数学形式
积分型 拉格朗日问题 终值型 迈耶耳问题 混合型 波尔扎问题
* *
tf
x
t0
f * , t d F x* , x * , t *, t F x* , x dJ F x* , x dt d 0 t x dt x x t 0
t
tf
0
t0 t f 0 以及极值条件
2.固定边界的泛函极值
t , t dt 积分型,Langrange问题 设泛函 J x F x t , x
xR
tf t0
分部积分法
udv uv
a b
b
b a
vdu
a b b
b
在 t0 , t f 连续二次可导
xt0 x0 xt f x f
2015年11月
§4.0 概述
研究:针对一个控制系统(被控对象),在给定一个性能指标下,
如何选择控制规律,使性能指标达到最优(极小)。
• 问题描述
动态系统: 初始状态:
如何选取容许控制域或最优控制
6 最优控制
则H 取极值
的必要条件
H x
f x
(
g x
)T
0
H u
f u
(
g u
)T
0
H
g(
x
,u
)0
其中
(
g x
g1 T
)T
=
x
gn
g1
x1
g1
x
xn
gn
x1
gn
xn
6.4 泛函及其极值--变分法
6.4.1 变分法的基本概念
1.泛函:
设对于自变量 x,存在一类函数 yx,对
由边界条件确定。 xt
四种边界条件:
a.固定端点: x( t f )0
x
tf t0
t0
d dt
L x
xdt
分部积分:
uv dxuv vudx
tf
J
L x
x
tf t0
t0
Lx
d dt
L x
xdt 0tfJ L xxtf t0
t0
L x
d dt
L x
xdt 0
xt 不受约束 x 任意
故泛函 J 取极值的必要条件:
1 ) L x
d dt
L x
0
欧拉方程
LL( x ,x ,t )
始端自由: x( t f )=0
L x
t0
0
x( t0 ) 0
x( t f ) x f
终端自由: x( t f ) 0
L
x
t
f
0
x( t0 )=0
x( t0 ) x0
两端自由: x( t f ) 0 x( t0 ) 0
现代控制理论 7-1 最优控制的一般概念
第七章 动态系统的最优控制方法§1 最优控制的一般概念 §2 最优控制中的变分法 §3 极小值原理及其应用 §4 线性二次型问题的最优控制系统分析 System Analysis建模 建模 稳态 稳态 性能 性能稳定性 稳定性 动态 动态 性能 性能控制 系统 研究 可控性 可控性 可观性 可观性综合设计 System Synthesis设计控制器 设计控制器改善性能,达到各种性能指标1综合设计 System Synthesis 常规综合 Conventional Synthesis 常规综合 Conventional Synthesis只满足系统某些指标的要求,如 稳定性、快速性及稳态误差;最优综合/控制 Optimal Synthesis 最优综合/控制 Optimal Synthesis确保系统某种指标最优的综合, 如最短时间、最低能耗等。
返回经典控制理论设计控制方法幅值裕量、相位裕量(频率指标); 上升时间、调节时间、超调量(时域指标)PID控制串联校正特点: 系统的控制结构是确定的;控制参数设计一般采用试凑方法; 不是最优结果。
2现代控制理论常规综合方法上升时间、调节时间、超调量(时域指标) 希望的闭环极点位置(复域指标);状态反馈 特点: 系统的控制结构是确定的;不是最优结果。
综合最优化 (optimization)—— 研究和解决如何从一切可能的方案中寻 找最优的方案。
(1) 如何将最优化问题表示为数学模型; (2) 如何根据数学模型(尽快)求出其最优解。
举例最优控制 (optimal control)—— 控制理论中的优化技术。
寻找在某种性能 指标要求下最好的控制。
返回3例:搅拌槽的温度控制 例:搅拌槽的温度控制一连续搅拌槽,J为搅拌器。
槽中原放0℃的液体, 现需将其温度经1小时后升高到40℃。
为此在入口处送 进温度为u(t) 的液体,出口处流出等量的液体,以保持 槽内液面恒定。
第9章 最优控制1
9 最优控制用经典控制理论设计系统时,是根据给定的频域和时域指标,通过选择适当结构和参数的校正装置进行调节,本质上是一个试凑的方法,设计质量的好坏很大程度上依赖于设计人员的实践经验。
而最优控制的设计目标是要选择适当的控制的规律,使控制系统在严格的数学基础上实现系统的性能品质在某种意义下是最优的。
最优控制是现代控制理论的一个重要组成部分。
本章主要讨论最优控制问题的基本概念。
二次型最优控制问题以及最优观测器设计。
9.1最优控制问题实例9.1.1最优控制问题实例设有一盛放液体的连续搅拌槽,如图9.3所示。
槽内装有搅拌器使槽内液体经常处于完全混合状态。
若槽内液体初始温度为0℃,现需将其温度经1小时后升高到40℃。
为此在入口处送进一定量的温度为u(t)的加热液体。
(为保持槽内液体恒定,出口处的流出量等于入口处的流入量),试寻找加热液体温度u(t)的变化规律,使槽中的液体温度经1小时后上升到40℃,且散失热量最小。
因假定槽内液体处于完全混合状态,由热力学可知,槽内液体温度x(t)的变化率与两种液体的温差(u(t)-x(t))成正比,为简便计,令比例系数为1,于是有)()()(t x t u dtt dx -= (9.1-1)初始条件x(0)=0 (9.1-2) 终值条件x(1)=40 (9.1-3)在1小时内散失掉的热量可用下式表示J=⎰10[qx2(t)+ru2(t)]dt (9.1-4)其中q和r都是正的常数。
该问题的任务是,寻求加热液体温度的最优变化规律u*(t),使槽内液体由初态9.1-2转移到终态9.1-3的过程中散失热量9.1-4为最小。
9.1.2最优控制问题的一般提法根据上例可概括出,最优控制问题用数学语言来描述时应该包含以下几方面内容:1.系统状态方程.x=f[x(t),u(t),t] (9.1-5)其中,x为n维状态向量,u为r维控制向量,f(.)是n维函数向量。
2.控制变量的约束条件大多数实际控制系统中的控制变量的取值范围是受限制的,如发动机的推力,电动机的转矩等都不能超出某一极限,即|u|≤K在数学上,表示容许控制域为控制空间中的一个集合Uu∈3.初始条件和终值条件在最优控制中,初始条件通常是已知的,即X(t0)=X,而终值条件则要复杂些,它可以是状态空间中一个确定的点,或状态空间中某一个点集(目标集)中的任何一个点。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.性能指标按其数学形式可分为如下三类:
1)积分型性能指标
L[x(),(),]f
t t J t u t t dt =⎰拉格朗日问题。
2)终值型性能指标
[x(),]f f J t t ϕ=
这种性能指标只是对于系统在动态过程结束时的终端状态提出了要求,而对于整个动态过程中系统的状态和控制的演变未作要求。
这样的最优控制问题为迈耶尔问题。
3)复合型性能指标
[x(),]L[x(),(),]f
t f f t J t t t u t t dt ϕ=+⎰
这样的最优控制问题为波尔扎问题。
通过适当变换,拉格朗日问题和迈耶尔问题可以相互转换。
2.按控制系统的用途不同,所选择的性能指标不同,常见的有:
1:最小时间控制
01f
t f t J t t dt =-=⋅⎰
2:最小燃料消耗控制
|()|f
t t J u t dt =⎰控制量u(t)与燃料消耗量成正比
3:最小能量控制
2()f
t t J u t dt =⎰控制函数u 2(t)与所消耗的功率成正比
3. J(x)取极小值的充分条件
为正定(>=0) ,反之则极大
4. J(x)取极值的必要条件为:
欧拉方程0L
d L x
dt
x
∂∂∂∂-=
横截条件
5. t 0和t f 给定,x(t 0) 或x(t f )未给定时横截条件:
(1)给定x(t 0) 或x(t f )
222
222L L x x
x L L x x
x ∂∂∂∂∂∂∂∂∂∂⎡⎤⎢⎥⎢⎥⎣⎦
横截条件为:x(t 0)=x 0或x(t f )=x f (2)自由x(t 0) 或x(t f )
00L t x
∂∂= 或
0f L
t x
∂∂= 那个自由(为给定),那个偏导为0.
6. 始端时刻t 0给定, x(t 0)固定或约束;而终端时刻t f 自由,终端状态x(t f )自由或约束,x(t)不受任何方程约束时的横截条件:
7.当x(t)受状态方程约束时,设系统状态方程:(,,)x f x u t = 性能指标:0
[(),](,,)f
t f f t J x t t F x u t dt ϕ=+⎰
满足极值所需条件: H=L+T λ f
(1)欧拉方程(伴随方程) H x
λ
∂=-∂ (2)状态方程H x
λ
∂=∂ (3)控制方程
0H
u
∂=∂ (4)横截条件:
初始时刻t 0及始端状态x(t 0)给定
t f 自由
终端x(t f )自由或者约束 ; 若x(t f )自由则无N 方程,若x(t f )固定则无()f t λ方程
8. 极小值原理
设系统的状态方程为
()[(),(),]x
t f x t u t t = 控制u(t)满足不等式约束: [(),(),]0G x t u t t ≥ 末端约束:[(),]0f
f N x t t =
f
()()[
f
f t t N H t t ϕμ=∂+=-∂()
()[t f f t f N t x ϕμλ∂+=∂()
性能指标:0
[(),]L [(),(),]f
t f f t J x t t x t u t t dt ϕ=+
⎰
求解过程:
(1).沿最优轨线满足正则方程
()T H x
H G x x λ
λ
∂=∂∂∂=--Γ∂∂
(2)横截条件及边界条件:
(3)在最优轨线x*(t)上与最优控制u*(t)相对应的H 函数取绝对极小值,即:
9.
设离散系统的状态方程为:
)1,,2,1,0(]),(),([)1(-==+N k k k u k x f k x
k 表示时刻t k ,终端时刻t f =t N .设初始状态x(0)=0,终端时刻t N 给定,终端状态x(N)自由.系统性能指标为: ∑-=+
=1
]),(),([]),([N k k k u k x L N N x J ϕ
要求寻找最优控制u*(k),使性能指标J 为极小. 求解过程:
(1)列出哈密顿函数
)
1,,2,1,0(]),(),([)1(]
),(),([]),1(),(),([-=++=+N k k k u k x f k k k u k x L k k k u k x H T
λλ
(2)正则方程
1
,,2,1,0,)
1(]
),1(),(),([)1(1
,,2,1,0,)
(]
),1(),(),([)(-=+∂+∂=+-=∂+∂=
N k k k k k u k x H k x N k k x k k k u k x H k λλλλ
(3)边界条件与横截条件:
)
(]
),([)(0)0(N x N N x N x ∂∂=
=ϕλ
(4)控制方程:
00
(()[]([(,,,)]0
()[(),]0f f f
t t t t f f N t x
N H x u t t x t x N x t t ϕμλϕμλ==∂+=∂∂++=∂==)
)
*****(,,,)(,,,)H x u t H x u t λλ≤()T
H G u u ∂∂=-Γ∂∂无这个方程
1,,2,1,0,0)
(]
),1(),(),([-==∂+∂N k k u k k k u k x H λ
当u(k)有不等式约束时
]),1(),(),([min ]),1(),(),([**)(***k k k u k x H k k k u k x H k u +=+Ω
∈λλ。