最优控制与状态估计3
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
u ( 0)
对于任意级k , 有 J *[ x(k ), k ] opt{L[ x(k ), u(k )] J *[ x(k 1), k 1]}
u(k )
(65)
应该指出,最优性原理所肯定的是余下的决策为最优决策。对以前 的决策没有明确的要求。
华东理工大学
ECUST
三、 用动态规划法求解离散系统最优控制问题
1) 从最后一级开始,即 k 2 1 J * [ x(2), 2] cx 2 (2) 2
华东理工大学
ECUST
2) 向前倒推一级,即
*
k 1
1 2 1 2 1 2 * J [ x(1),1] min u (1) J [ x(2),2] min u (1) cx (2) u (1) 2 2 u (1) 2 1 1 2 min u (1) c[ x(1) u (1)]2 u (1) 2 2
x(k )
N k 0
k 0
x(0)
J L[ x (k ), u(k )]
要求确定 u(k ),使性能指标最优,即 J opt
华东理工大学
ECUST
一般认为,第k 级决策 u(k )与第k 级以及k 以前各级状态 x(k i)和决 策 u(k i) 有关 (i 1,2,) u(k ) u[ x(k ), x(k 1),, u(k ), u(k 1),] (64) 以上函数称为策略函数
华东理工大学
ECUST
二、 最优性原理(Bellman)
最优性原理——在一个多级决策问题中的最优决策具有这样的性 质,不管初始级 、初始状态和初始决策是什么,当把其中任何一级 和这一级的状态再作为初始级和初始状态时,余下的决策对此必定 构成一个最优决策。 将最优性原理应用到离散系统中去,系统状态方程为 x(k 1) f [ x(k ), u(k )] 初始状态为 性能指标为
J *[ x(0),0]
u ( 0)
opt
{L[ x(0), u(0)] L[ x(1), u(1)] L[ x( N ), u( N )]}
opt
u (1),u ( 2),,u ( N )
u ( 0),u (1),,u ( N )
opt{L[ x(0), u(0)]}
因为 u (k )不受限制,故 u * (1) 可以通过下式求得
J *[ x(1),1] u(1) cx(1) cu(1) 0 u (1)
cx (1) u * (1) 1 c
cx2 (1) J [ x(1),1] 2(1 c)
*
x* (2) x(1) u * (1)
x(1) 1 c
华东理工大学
ECUST
3) 再向前倒推一级,即 k 0 2 1 1 cx (1) * 2 * 2 J [ x(0),0] min u (0) J [ x(1),1] min u (0) u ( 0) 2 u (0) 2 2(1 c)
1 2 c[ x(0) u (0)]2 min u (0) u ( 0) 2 2 ( 1 c ) * J [ x(0),0] 由 0 ,解得 u * (0) cx (0) u (0) 1 c
1 c x (1) x(0) 1 2c
*
x* (2)
1 x(0) 1 2c
cx2 (0) J [ x(0),0] 2(1 c)
*
注意:1、对一个多级决策过程来说,最优性原理保证了全过程性 能指标最小,并不保证每一级性能指标最小。但是在每考虑一级时, 都不是孤立地只把这一级的性能指标最小的决策作为最优决策,而 总是把这一级放到全过程中间去考虑,取全过程的性能指标最优的 决策作为最优决策。 2、动态规划法给出的是最优控制的充分条件,不是必要条件。这 和极小值原理是不同的。
华东理工大学
ECUST
华东理工大学
ECUST
第二个办法:从最后一段开始, 向前倒推。当倒推到某一站时, 计算该站到终点站的总里程, 并选择里程最少的走法。
华东理工大学
ECUST
从该例看出,这种解法有两个特点: 第一,它把一个复杂的问题 (即:决定一条路线的选择问题)变成许多个简单的问题(即:每 次只决定向上走(p)还是向下走(q)的问题),因此问题的求解 变得简单容易了。 不变嵌入原理的含义是:为了解决一个特定的最优控制问题,而把 原问题嵌入到一系列相似的但易于求解的问题中去。对于一个多级 最优控制过程来说,就是把原来的多级最优控制问题代换成一系列 单级最优控制问题。
系统状态方程为
x(k 1) f ( x(k )ቤተ መጻሕፍቲ ባይዱ u(k ))
(66) (67) (68)
x(k )
N k 0
k 0
x(0)
J L( x (k ), u(k ))
要求在状态方程约束下,寻求 u(k )使 J min
u(k ) 可以受限制,也可以不受限制。
J *[ x (k ), k ] min{L[ x (k ), u(k )] J *[ x (k 1), k 1]}
{L[ x(1), u(1)] L[ x( N ), u( N )]}
如果记 则
J *[ x(1),1]
opt
{L[ x(1), u(1)] L[ x( N ), u( N )]}
u (1),u ( 2),,u ( N )
J *[ x(0),0] opt{L[ x(0), u(0)] J *[ x(1),1]}
u(k )
华东理工大学
ECUST
例 4 线性定常离散系统的状态方程为
x(k 1) x(k ) u(k )
初始状态为 x(0) ,性能指标为 1 2 1 N 1 2 J cx ( N ) u (k ) 2 2 k 0 寻求最优控制序列 u (k ) ,使 J min (为了简单起见,设 N 2 ) 解 运用动态规划法来求解
对于任意级k , 有 J *[ x(k ), k ] opt{L[ x(k ), u(k )] J *[ x(k 1), k 1]}
u(k )
(65)
应该指出,最优性原理所肯定的是余下的决策为最优决策。对以前 的决策没有明确的要求。
华东理工大学
ECUST
三、 用动态规划法求解离散系统最优控制问题
1) 从最后一级开始,即 k 2 1 J * [ x(2), 2] cx 2 (2) 2
华东理工大学
ECUST
2) 向前倒推一级,即
*
k 1
1 2 1 2 1 2 * J [ x(1),1] min u (1) J [ x(2),2] min u (1) cx (2) u (1) 2 2 u (1) 2 1 1 2 min u (1) c[ x(1) u (1)]2 u (1) 2 2
x(k )
N k 0
k 0
x(0)
J L[ x (k ), u(k )]
要求确定 u(k ),使性能指标最优,即 J opt
华东理工大学
ECUST
一般认为,第k 级决策 u(k )与第k 级以及k 以前各级状态 x(k i)和决 策 u(k i) 有关 (i 1,2,) u(k ) u[ x(k ), x(k 1),, u(k ), u(k 1),] (64) 以上函数称为策略函数
华东理工大学
ECUST
二、 最优性原理(Bellman)
最优性原理——在一个多级决策问题中的最优决策具有这样的性 质,不管初始级 、初始状态和初始决策是什么,当把其中任何一级 和这一级的状态再作为初始级和初始状态时,余下的决策对此必定 构成一个最优决策。 将最优性原理应用到离散系统中去,系统状态方程为 x(k 1) f [ x(k ), u(k )] 初始状态为 性能指标为
J *[ x(0),0]
u ( 0)
opt
{L[ x(0), u(0)] L[ x(1), u(1)] L[ x( N ), u( N )]}
opt
u (1),u ( 2),,u ( N )
u ( 0),u (1),,u ( N )
opt{L[ x(0), u(0)]}
因为 u (k )不受限制,故 u * (1) 可以通过下式求得
J *[ x(1),1] u(1) cx(1) cu(1) 0 u (1)
cx (1) u * (1) 1 c
cx2 (1) J [ x(1),1] 2(1 c)
*
x* (2) x(1) u * (1)
x(1) 1 c
华东理工大学
ECUST
3) 再向前倒推一级,即 k 0 2 1 1 cx (1) * 2 * 2 J [ x(0),0] min u (0) J [ x(1),1] min u (0) u ( 0) 2 u (0) 2 2(1 c)
1 2 c[ x(0) u (0)]2 min u (0) u ( 0) 2 2 ( 1 c ) * J [ x(0),0] 由 0 ,解得 u * (0) cx (0) u (0) 1 c
1 c x (1) x(0) 1 2c
*
x* (2)
1 x(0) 1 2c
cx2 (0) J [ x(0),0] 2(1 c)
*
注意:1、对一个多级决策过程来说,最优性原理保证了全过程性 能指标最小,并不保证每一级性能指标最小。但是在每考虑一级时, 都不是孤立地只把这一级的性能指标最小的决策作为最优决策,而 总是把这一级放到全过程中间去考虑,取全过程的性能指标最优的 决策作为最优决策。 2、动态规划法给出的是最优控制的充分条件,不是必要条件。这 和极小值原理是不同的。
华东理工大学
ECUST
华东理工大学
ECUST
第二个办法:从最后一段开始, 向前倒推。当倒推到某一站时, 计算该站到终点站的总里程, 并选择里程最少的走法。
华东理工大学
ECUST
从该例看出,这种解法有两个特点: 第一,它把一个复杂的问题 (即:决定一条路线的选择问题)变成许多个简单的问题(即:每 次只决定向上走(p)还是向下走(q)的问题),因此问题的求解 变得简单容易了。 不变嵌入原理的含义是:为了解决一个特定的最优控制问题,而把 原问题嵌入到一系列相似的但易于求解的问题中去。对于一个多级 最优控制过程来说,就是把原来的多级最优控制问题代换成一系列 单级最优控制问题。
系统状态方程为
x(k 1) f ( x(k )ቤተ መጻሕፍቲ ባይዱ u(k ))
(66) (67) (68)
x(k )
N k 0
k 0
x(0)
J L( x (k ), u(k ))
要求在状态方程约束下,寻求 u(k )使 J min
u(k ) 可以受限制,也可以不受限制。
J *[ x (k ), k ] min{L[ x (k ), u(k )] J *[ x (k 1), k 1]}
{L[ x(1), u(1)] L[ x( N ), u( N )]}
如果记 则
J *[ x(1),1]
opt
{L[ x(1), u(1)] L[ x( N ), u( N )]}
u (1),u ( 2),,u ( N )
J *[ x(0),0] opt{L[ x(0), u(0)] J *[ x(1),1]}
u(k )
华东理工大学
ECUST
例 4 线性定常离散系统的状态方程为
x(k 1) x(k ) u(k )
初始状态为 x(0) ,性能指标为 1 2 1 N 1 2 J cx ( N ) u (k ) 2 2 k 0 寻求最优控制序列 u (k ) ,使 J min (为了简单起见,设 N 2 ) 解 运用动态规划法来求解