离散极小值原理(离散与连续做对比)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

[
]
(4) )
所以,离散广义泛函可写为: 所以,离散广义泛函可写为:
Ja = ϕ[x(N)] + γ ψ [x(N)] + ∑ H(k ) − λT (k )x(k ) + λT (0)x(0) − λT (N)x(N)
T k =0
N −1
[
]
(5) )
对上式取一次变分, 对上式取一次变分,考虑到
将 u∗(k) 表达式代入状态方程,可得 表达式代入状态方程,
x 2 (k + 1) = x 2 (k ) − 0.1λ 2 (k + 1)
分别等于0和 , 令k分别等于 和1,有 分别等于
x1 (k + 1) = x1 (k ) + 0.1x 2 (k )
x 1 (1 ) = x 1 (0 ) + 0 . 1 x 2 (0 ), x 2 (1 ) = x 2 (0 ) − 0 . 1 λ 2 (1 ), x 1 (2 ) = x 1 (1 ) + 0 . 1 x 2 (1 ),
∂H (k ) = 0.1u (k ) + 0.1λ 2 (k + 1) = 0 ∂ (k )
∂ 2 H (k ) = 0 .1 > 0 2 ∂u (k )
故 :
u ∗ (k ) = − λ2 (k + 1)
k 可使H(k)=min. 令: = 0 , k = 1 可使
∗ ∗ 得 u (0) = −λ 2 (1), u (1) = −λ 2 (2),
(2)列方程: )列方程:
状态方程: 状态方程:
∂H (k ) x(k + 1) = ∂λ (k + 1)
协态方程: 协态方程:
∂ H (k ) λ (k ) = ∂ x (k )
u ( k )∈Ω
控制方程: 控制方程:
H ∗ (k ) = min H (k )
(3)解上述方程构成的方程组。 )解上述方程构成的方程组。 (4)积分常数及末端时刻的确定。 )

2000 λ (0) = , 300
2000 λ (0) = − 100
∑ [λ (k + 1)x (k + 1)] = ∑ [λ (m )x (m )]
N −1 k =0 N T T m =1
=
m =0
∑ [λ (m )x (m )]− λ (0 )x (0 ) + λ (N )x (N )
N −1 T T T N −1 k =0
= ∑ λT (k )x (k ) − λT (0 )x (0 ) + λT ( N )x (N )
δ (0) = 0 可得: 可得:
是任意的,可得: 令 δJ a = 0 ,考虑到变分 δx(k ) 和 δx(N ) 是任意的,可得:
∂H (k ) λ (k ) = , ∂x(k ) ∂ϕ ∂ψ T λ (N ) = + γ ∂x( N ) ∂x[N ]
对于: 对于:

N −1 k =0
∂H (k ) =0 δ 不受约束时, 是任意的, 当 u (k ) 不受约束时, u (k ) 是任意的,故必有 ∂u (k )
T T T N −1 ∂ϕ ∂H (k ) ∂H (k ) ∂ψ T δJ a = + γ − λ (N ) δx(N ) + ∑ − λ (k ) δx(k ) + δu (k ) k = 0 ∂x (k ) (6) ) ∂u (k ) ∂x( N ) ∂x[N ]
相关条件为: 相关条件为: x (0 ) = x 0 ∂ϕ λ (N ) = ∂ x (N ) ∂ H (k ) =0 ∂ u (k ) (控制变量不受约束时的极值条件) 控制变量不受约束时的极值条件)
例:设离散系统方程为

1 0.1 0 x(k +1) = x(k ) + u(k ) 0 1 0.1
已知边界条件为: 已知边界条件为:
1 x (0 ) = , x (2 ) = 0
0 0
使用离散极小值原理求最优控制序列, 使用离散极小值原理求最优控制序列,使性能指标
J = 0.05∑ u 2 (k ) 取极小值,并求出最优轨线序 取极小值, k =0 列。
固定, 解:本例为控制无约束,N固定,末端固定的离散最优控制问题, 本例为控制无约束, 固定 末端固定的离散最优控制问题, 1)构造哈密顿函数已知边界条件为: )构造哈密顿函数已知边界条件为:
∂ H (k ) ∂ u (k ) δ u (k ) = 0
T
(7) )

∗ 时,不加证明得: H (k ) = min H (k ) 不加证明得: u (k ) ∈ Ω u ( k )∈Ω
3.2 末端自由时的离散极小值原理
末端自由—— 指末端状态自由;末端时刻固定或自由。 指末端状态自由;末端时刻固定或自由。 末端自由
x 2 (2 ) = x 2 (1 ) − 0 . 1 λ 2 (2 ),
不难解出最优解:
u ∗ (0 ) = −100,
1 x (0) = , 0
∗ ∗
u ∗ (1) = 100
1 x (1) = , − 10 2000 λ (0) = , 100 0 x (2) = , 0
问题的解法: 问题的解法:
(1)构造离散哈密顿(Hamilton)函数: )构造离散哈密顿( )函数:
= L [x (k ), u (k ), k ] + λ T (k + 1) f [x (k ), u (k ), k ]
H (k )∆ H [x (k ), u (k ), λ (k ), k ]
λ1 (0 ) = λ1 (1), λ 2 (0 ) = 0.1λ1 (1) + λ 2 (1) λ1 (1) = λ1 (2 ), λ 2 (1) = 0.1λ 2 (2 ) + λ 2 (2 )
极值条件: 极值条件:
∂ H (k ) = λ 2 (k + 1) = 0 . 1 x 1 (k + 1) + λ 2 (k + 1) ∂ x 2 (k )
N −1
其中, 固定, 都是其自变量的连续可微函数; 其中,N 固定,f (• ) 末端状态 ϕ (• ) 和 L (• ) 都是其自变量的连续可微函数; m n x(k ) ∈ R ; u (k ) ∈ R ,其约束 u(k ) ∈Ω , Ω 为容许控制域。末端状态受下列 为容许控制域。 目标集约束: 目标集约束:ψ (x(N )) = 0 。 且连续可微, 式中 ψ (•)∈ R r且连续可微,r ≤ n。 是使性能指标为极小的最优控制序列, 为相应的最优轨线序列, 若:u (k)是使性能指标为极小的最优控制序列, ∗ (k ) 为相应的最优轨线序列,则 x 必存在 r 维非零常向量 γ 和 n 维向量序列 λ (k ) ,使得最优解满足如下必要 条件: 条件:

问题的解法: 问题的解法:
(1)构造哈密顿(Hamilton)函数 )构造哈密顿( )
H (k )∆ H [x (k ), u (k ), λ (k ), k ] = L [x (k ), u (k ), k ] + λ T (k +1) f [x (k ), u (k ), k ]
ຫໍສະໝຸດ Baidu
(2)列方程 )
∂H (k ) 状态方程: 状态方程: x (k + 1) = ∂λ (k + 1)
协态方程: 协态方程: λ (k ) = ∂ H (k )
∂ x (k )
控制方程: 控制方程:H ∗
(k ) = uminΩ H (k ) ( k )∈
(3)解上述方程构成的方程组。 )
(4)积分常数确定 )
x (0 ) = x ,ψ [x ( N )] = 0 0 ∂ϕ ∂ψ T + γ λ (N ) = ∂ x ( N ) ∂ x [N ] ∂ H (k ) =0 无约束时的极值条件 ∂ u (k ) 若u(k)无约束时的极值条件
极值条件的证明 证明:引入拉格朗日乘子λ (k ) 和 证明:
T N −1 k =0
γ
]
(1) ) (2) )
J a = ϕ [x ( N )] + γ ψ [x ( N )] + ∑ H (k ) − λT (k + 1)x (k + 1)
[
T 令离散哈密顿函数 H (k ) = L[x(k ), u (k ), k ] + λ (k + 1) f [x(k ), u (k ), k ]
把(2)代入(1)得 )代入( )
J a = ϕ[x(N )] + γ ψ [x(N )] + ∑{L[x(k ), u(k ), k ]+ λT (k +1)[ f (x(k ), u(k ), k ) − x(k +1)]
T k =0 N −1
} (3) )
因为“离散部分积分” 因为“离散部分积分”
1
H(k ) = 0.05u 2 (k ) + λ1 (k +1)[x1 (k ) + 0.1x2 (k )] + λ2 (k +1)[x2 (k ) + 0.1u(k )]
2)列方程 )
协态方程: 协态方程:
λ 1 (k ) = λ 2 (k ) =
∂ H (k ) = λ 1 (k + 1) ∂ x 1 (k )
3.1 末端约束时的离散极小值原理 问题1: 问题 :x (k + 1) = f [x (k ), u (k ), k ], x (0 ) = x 0 (k = 0,1,⋅ ⋅ ⋅, N − 1)
性能指标: 性能指标: J = ϕ [x( N )] +
K =0 =0
∑ L[x(k ), u(k ), k ]
问题1: 问题 :x(k + 1) = f [x(k ), u(k ), k ], (k = 0,1,⋅ ⋅ ⋅, N − 1)
性能指标: 性能指标:
x(0) = x0
J = ϕ [x( N )] + ∑ L[x(k ), u (k ), k ]
K =0
N −1 −1
其中: 固定, 自由,其余同上节定理. 其中 N 固定,末端状态 x( N ) 自由,其余同上节定理 是性能指标为极小的最优控制序列, 若:u∗(k) 是性能指标为极小的最优控制序列,∗ (k) 为相应的最优轨线序 x n 维向量序列 λ (k ) ,使得最优解满足如下必要条件: 使得最优解满足如下必要条件: 列,则必存在
相关文档
最新文档