最优控制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6
H (k) L[x(k),u(k), k] T (k 1) f [x(k),u(k), k]
Fra Baidu bibliotek
实现最优控制的必要条件:
J 0
注意到 dx(N), dx(k), du(k)是任意的,dx(0)=0 可得:
(k) H (k)
x(k )
(N )
x(N )
k 0,1,2 N 1
(k) L f T (k 1)
N 1
J [x(N ), N ] T (N )x(N ) [H (k) T (k)x(k)] T (0)x(0)
k 0
(2-94)
(2-94)式的一阶变分是
J
x(N )
(N )T
dx(N )
Nk01xH(k
)
(k
)T
dx(k
)
H u(k
)
T
du(k
)
T
(0)dx(0)
(2-95)
寻找最优控制序列 u(k),使性能指标达极小值。
设P是n x n实对称方阵,V(x)=xTPx为由P所决定的二次型 函数,若V(x)>0,P称为正定,若V(x)>=0,P称为半正定。
20
解 写出哈密顿函数
H (k) 1 xT (k)Q(k)x(k) 1 uT (k)R(k)u(k)
2
2
T (k 1)[ A(k)x(k) B(k)u(k)]
值受约束的情形中来。
11
定理 2-4 设离散系统的状态方程是
x(k 1) f [x(k),u(k), k]
则为把状态 x(k)自初态
x(0) x0
转移到满足边界条件
k 0,1, N 1
[x(N ), N ] 0
的终态,并使性能指标
N 1
J [x(N ), N ] L[x(k),u(k), k]
u (k )
u(k) u(k)
(2-118)
求解离散最优控制问题的步骤
写出哈密顿函数(2-92) 由哈密顿函数求出规范方程组(2-113)和(2-114),以及控 制方程(2-118)。 列出边界条件(2-115)-(2-117)。 将方程(2-118)对u(k)求解,并把u(k)的表示式代入规范 方程组,以消去u(k)。然后应用边界条件求解x(k)和(k)。 把求得的x(k)和(k)代入u(k)的表示式中,即得最优控制 u(k)。
H (k ) L[x(k ),u(k ), k ] T (k 1) f [x(k ),u(k ), k ] k 0,1,2 N 1
(2-92)
5
则(2-91)式可写成
N 1
J [x(N ), N ] [H (k) T (k 1)x(k 1)]
(2-93)
k 0
把(2-93)式右边第二项进行简单变换,可得
2-2 离散系统的最小值原理
离散系统的最优控制问题:
✓实际系统本身就是离散的,这类系统的进程,是在逐 个离散的时刻按步实现的。
✓实际系统本身是连续的,但在用计算机进行最优控制 的计算和实际控制时,要把时间量化,以适应计算机 运算的需要,仍是离散化的最优控制问题。
介绍控制向量不受约束情况下离散系统的最小值原理。
k 0
取极小值,以实现最优控制的必要条件是:
12
(2-109) (2-110) (2-111) (2-112)
1)状态向量序列 x(k)和协态向量序列(k) 满足下列差分方
程:
x(k 1) H (k) 或 x(k 1) f [x(k),u(k), k] (k 1)
(2-113)
(k) H (k) 或 (k) L f T (k 1)
0.101.1
0 1 1
0 0.01
0 0.1
故
18
x(2)
1 0
0.2 1
x1 x2
(0) (0)
0 0.01
0.01 1 (1) 0.202 (1)
代入 x(0)、x(2),整理得
0 0.01
0.01 0.20
1 (1) 2 (1)
1 0
解得
1 2
(1) (1)
2000 100
uˆ(0) ,uˆ(1) ,…,uˆ(N 1) 和相应的 N 个最优状态向量xˆ(1) ,
xˆ(2),…,xˆ(k) 以使(2-90)式表示的性能指标取极小值。
称uˆ(k) ,k=0,1,…,N-1 为最优控制
xˆ(k) ,k=1,2,…,N 为最优轨线
N 1
J [x(N ), N ] L[x(k),u(k), k]
x(k) x(k)
H (k) 0 u (k )
k 0,1,2 N 1
L f T (k 1) 0
u(k) u(k)
7
定理 2-3 设离散系统的状态方程为
x(k 1) f [x(k),u(k), k] k 0,1,2 N 1
其状态初值已知是
x(0) x0
则为使性能指标
N 1
J [x(N ), N ] L[x(k),u(k), k]
17
x(2) Ax(1) 10BBT AT (1) A2x(0) 10 ABBT (1) 10BBT AT (1)
由 x(2)可以求得(1) ,随之确定(0) 。
由于
A2
1 0
0.2 1
AT
1 0.1
0 1
10 ABBT 1010
01.100.10
0.1
0 0
0.01 0.10
10BBT AT 1000.10
4
k 0
为了寻找离散系统的最优解,和连续系统的情形相
仿,引进协态向量序列(k) ,k=1,2,…,N,则问题便化为 求广义性能指标:
J [x(N ), N ]
N 1
[
L[
x(k
),
u(k
),
k
]
T
(k
1){
f
[
x(k
),
u
(k
),
k
]
x(k
1)}]
(2-91)
k 0
的极小值。
定义离散的哈密顿函数序列:
x(k )
x(k) x(k)
(2-100)
其边界条件是
x(0) x0
(N )
x(N )
(2-101) (2-102)
2) 离散哈密顿函数对最优控制序列uˆ(k) 取极值,即
H (k) 0 或 L f T (k 1) 0
u (k )
u(k) u(k)
(2-103)
9
k=0,1,…,N-1
状态终端受约束
x(k )
x(k) x(k)
(2-114)
并满足边界条件
x(0) x0
(2-115)
[x(N ), N ] 0 (N ) T v
x(N ) x(N )
(2-116) (2-117)
2)离散哈密顿函数对最优控制序列uˆ(k) 取极值:
H (k) 0 或 L f T (k 1) 0
13
k 0
取极小值。
10
(2-104) (2-105) (2-106)
(2-107)
和状态终值不受约束的情形相比,这里多了一个边界
约束条件(2-106),于是寻找最优解的问题,便归结为求广
义性能指标
J [x(N ), N ] vT [x(N ), N ]
N 1
[L[x(k),u(k), k]
T
(k
1){
f
[x(k),u(k), k]
x(k
1)}]
(2-108)
k 0
的极小值。
把关系式(2-108)和(2-91)比较一下,可见它们之间的唯
一 差 别 , 是 (2-108) 式 中 添 加 了 一 个 反 映 终 态 条 件 的 项 vT [x(N ), N ]。如在定理 2-3 中凡出现[x(N ), N ]的地方,均 代之以[x(N ), N ]+vT [x(N ), N ] ,则定理 2-3 可移植到状态终
求出协态方程
(k) H (k) Q(k)x(k) AT (k)(k 1)
x(k )
(2-121) (2-122)
因状态终值无约束,故协态终值是
(N) F(N)x(N)
(N ) T v
x(N ) x(N )
(2-123)
(N) 1 xT (N)F(N)x(N)
21
2
H (k) 1 xT (k)Q(k)x(k) 1 uT (k)R(k)u(k)
16
由协态方程
(k) AT (k 1)
和状态方程
x(k 1) Ax(k ) 10BBT AT (k )
可得 当 k=0 时,(0) AT (1)
x(1) Ax(0) 10BBT AT (0) Ax(0) 10BBT (1)
当 k=1 时,(1) AT (2)
x(2) Ax(1) 10BBT AT (1) A2x(0) 10 ABBT (1) 10BBT AT (1)
u(0) u(1)
u(N-1)
x(0) x(1)
x(2) x(N-1)
x(N)
f
f
...
f
图 2-4
2
状态终端不受约束
问题 2-2 设离散系统的状态方程为
x(k 1) f [x(k),u(k), k]
其状态初值已知是
k 0,1,2 N 1
x(0) x0
寻找最优控制序列uˆ(k) ,k=0,1,…,N-1 使性能指标
x(k 1) A(k)x(k) B(k)u(k) k 0,1, N 1 (2-119)
其初态 x(0) x0已知。性能指标是二次型的,并用下式表示:
J 1 xT (N )F(N )x(N ) 2
1
N 1
[
xT
(k
)Q(k
)
x(k
)
uT
(k
)
R(k
)u(k
)]
2 k0
(2-120)
式中 R(k)是正定矩阵,F(N)和 Q(k)是半正定矩阵。
14
例 离散系统的状态方程为
x(k 1) Ax(k) Bu(k)
其中:
A
1 0
0.1 1
B
0 0.1
x(0)
x1 (0) x2 (0)
1 0
性能指标:
x(2)
x1 x2
(2) (2)
0 0
1
J 0.05u2 (k)
k 0
寻找最优控制序列 u(k),使性能指标达极小值。
15
解 N=2 哈密顿函数:H (k) 0.05u2 (k) T (k 1)[ Ax(k) Bu(k)]
k 0
取极小值,以实现最优控制的必要条件是:
(2-96) (2-97) (2-98)
8
1)状态向量序列 x(k)和协态向量系列(k) 满足下列差分方
程:
x(k 1) H (k) 或 x(k 1) f [x(k),u(k), k] (k 1)
(2-99)
(k) H (k) 或 (k) L f T (k 1)
1
离散系统的状态方程可以用非线性差分方程表示:
x(k 1) f [x(k),u(k), k]
k 0,1,2 N 1
(2-86)
式中x(k) 为 n 维状态向量序列,u(k) 为 m 维控制向量序列,
而 f 则是连续可微的 n 维向量函数,其相互关系如图 2-4
所示,图中x(0) 和x(N ) 分别表示状态的初值和终值。
得
x(k 1) A(k )x(k ) B(k )R1(k )BT (k )(k 1)
(2-125)
22
(N) F(N)X(N)
设规范方程组(2-122)
(k) Q(k)x(k) AT (k)(k 1)
和(2-125)
x(k 1) A(k )x(k ) B(k )R1(k )BT (k )(k 1)
问题 2-3 设离散系统的状态方程为
x(k 1) f [x(k),u(k), k] k 0,1,2 N 1
其状态初值已知是
x(0) x0
状态终值应满足边界条件 [x(N ), N ] 0
式中 是 r 维向量函数。 寻找最优控制序列
uˆ(k) ,
k=0,1, …,N-1,
使性能指标
N 1
J [x(N ), N ] L[x(k),u(k), k]
N 1
J [x(N ), N ] L[x(k),u(k), k]
k 0
取极小值。
(2-88) (2-89) (2-90)
3
连续系统最优控制:
在时间区间[t0,t f ]上寻找最优控制uˆ(t) 和相应的最优轨 线xˆ(t) ,使性能指标取极小值。
离散系统最优控制:
在离散时刻 0,1,…,N-1 上寻找 N 个最优控制向量
2
2
T (k 1)[ A(k)x(k) B(k)u(k)]
由控制方程 H (k) 0知
u (k )
R(k )u(k ) BT (k )(k 1) 0
于是
u(k ) R1(k )BT (k )(k 1)
(2-124)
把(2-124)式代入方程(2-119)
x(k 1) A(k)x(k) B(k)u(k)
求出协态方程
(k) H (k) AT (k 1) (k 1) A1(k)
x(k ) 由控制方程
H (k) 0.1u(k) BT (k 1) 0
u (k )
得
u(k ) 10BT (k 1) 10BT AT (k )
代入状态方程可得
x(k 1) Ax(k) 10BBT AT (k )
1 (0) 2 (0)
AT
(1)
1 0.1
0 2000 1 100
2000 300
故
u(0) 10BT AT (0) 100
u(1) 10BT AT (1) 100
19
x(1)
1 0
0.1 1
1 0
00.1(100)
1 10
例 2-2 离散型线性调节器
时变系统
设离散系统的状态方程为