智能控制 第5章 分层递阶智能控制
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学习功能
• 根据任务执行产生的经验, 不断减小决策的不确定性, 改进任务分配的能力
16/34
3. 执行级
可以根据具体情况采用任何控制理论的经典 方法。
设被控系统为
f (x, u, w, t ) x
x(t 0 ) x 0
性能指标
V (x 0 , t 0 ; u(x, t )) L(x, t , u(x, t ))dt
第5章 分层递阶智能控制
智能控制基础
目录
5.1 引言 5.2 递阶智能控制的基本原理 5.3 递阶智能控制的组织和协调 5.4 分层递阶智能控制的应用举例
2/34
5.1 引言
分层递阶是人们分析和组织复杂系统的一种 常用方法。 无论是信息分析、还是行为控制,都有其层 次性,在高层负责宏观的信息和决策,在低 层负责具体的数据和控制。 Saridis在1977年针对机器人控制,提出了一 种智能控制的三级递阶结构。该思想在智能 控制中有广泛应用,并进一步推广到了结合 信息融合的集散递阶智能控制系统。
9/34
IPDI的证明
P(MI , DB) P( R)
P(MI | DB) P( DB) P( R) H (MI | DB) H ( DB) H ( R)
假设MI与DB无关
H (MI ) H ( DB) H ( R)
10/34
目录
5.1 引言 5.2 递阶智能控制的基本原理 5.3 递阶智能控制的组织和协调 5.4 分层递阶智能控制的应用举例
30/34
Petri网实现
便于同步、异步操作
31/34
3. 执行级设计
控制目标
J (u) [(x(t ) x d ]T Q[(x(t ) x d ] uT (t )u(t )]dt
0 T
, , ]T x [1 , 2 , 3 , 1 2 3
运动方程
Y
c1 1
{e1 , e2 , e4 , e1 , e2 , e3 , e1 , e2 , e5 }
Y
Y
c1 2
{e1 , e2 , e4 , e1 , e2 , e3 , e2 , e5 }
{e1 , e2 , e4 , e2 , e3 , e1 , e2 , e5 } {e1 , e2 , e4 , e2 , e3 , e2 , e5 }
2. 协调级
将任务序列分解为子任务,根据子任务之间 的并行关系,由分配器给低一级的协调器。 协调器将子任务分解为控制器可执行的控制 序列,并保证该子任务最优。 由于各子任务之间可能存在着耦合关系,分 配器还必须根据总的目标,对各子任务的控 制序列进行平衡和协调。例如,在各子任务 的控制策略中引入一个协调参数、关联约束, 通过预测或修正的方法来进行调整。
27/34
协调层设计: (1)任务描述
①分配器输入:来自组织级的动作序列YO 。 ② 协调器输入:子任务序列。
v={controv, procv, analyv, sendvp, sendpv, finish} s={contros, procs, analys, sendsg, sendgs, finish} p={path, sendvp, sendpv, sendap, sendpa, finish} a={move, sendap, sendpa, finish} g={ grasp,put,sendsg, sendgs, finish }
11/34
1. 组织级
12/34
组织级功能
机器推理 机器规划 机器决策 机器学习和反 馈 机器记忆交换
• 根据前提和规则,推出结论的能力
• 根据控制目的,获得任务序列的过程
• 选择最有利的任务序列
• 根据任务的执行情况,对控制进行评估,并更 新机器学习算法 • 对长期存储器进行信息更新
13/34
T
32/34
5.4.2 集散递阶智能控制系统
33/34
多传感器信息融合级
34/34
协调级
• 是组织级和执行级的接口,负责将组织级的指令分配 为执行级的各项子任务,同时反馈任务执行的信息。
执行级
• 一般由多个硬件控制器所组成,负责具体的过程控制。
6/34
IPDI基本原理
精度随智能降低而增大的原理被称为IPDI (Increasing Precision with Decreasing Intelligence)原理。
0 0 I 0 (t ) x x(t ) 1 1 u(t ) 0 0 J ( x) N ( x) J ( x)
次优状态反馈控制
u(x, x d ) N(x) J (x)[0 I] S[x(t ) x d ]
i
8/34
机器智能的映射变换
假设机器智能MI(Machine Intelligence)由 知识库(规则库)来实现,各种信息由数据 库DB(Date Base)来存储,可以看到,当MI 作用于DB时,就会引起推理、映射等信息变 换过程,产生知识流率R(Rate of Machine Knowledge)。这种映射变换的关系可以表 示为: (MI):(DB) R
3/34
目录
5.1 引言 5.2 递阶智能控制的基本原理 5.3 递阶智能控制的组织和协调 5.4 分层递阶智能控制的应用举例
4/34
递阶智能控制结构
5/34
三层结构的内容
组织级
• 负责整个系统的推理、规划、决策、长期记忆、信息交 流等,是智能最高的级别,主要进行的是基于Βιβλιοθήκη Baidu识的各 种信息处理和决策。
7/34
信息熵
一个用来衡量信息丰富程度的物理量,对于 代表某个信息的随机量x,其信息熵可以定义 为:
H ( x) E[ln P( x)]
P(x)为信息取值x时的概率密度 。
信息集合 X {xi },i=0,1,2,,则整个信息 集合的总熵为
H ( X ) H ( xi )
22/34
事件状态转移图
23/34
组织层设计:(2)机器规划
(2)机器规划 为了找到各种可行的行为序列,将5种事件划 分为可重复事件集合E1和不可重复事件集合 E2。
E1 {e1 , e2 }
E2 {e3 , e4 , e5 }
24/34
动作序列
根据摄像头一次能观察到的目标数目,可以 得到4种动作序列:
29/34
协调层设计:(2)任务翻译
任务的调度、转换。 例如组织级的动作序列: YO {e1 , e2 , e4 , e2 , e3 , e2 , e5}
则可作如下翻译: ①初始情况下,需要观察环境,则指令e1可翻译为: { controv, procv, analyv, finish} ②发现目标后,将手爪移向目标,则指令e2可翻译为: {( controv, procv, analyv, sendvp, path, move, sendpv)+, finish} 因为括号内部分可能要反复校对,所以用+表示。 ③靠近目标并抓取物品的指令e4可翻译为: {( contros, procs, analys, sendsg, grasp, sendgs)+, finish}
28/34
说明
controc为协调器c的对应设备的数据处理命令,例如 获取图像或力觉数据; procc为controc的数据处理算法,用于去除噪声等; analyc 为 controc 数据的分析和融合算法,可以获得 特征信息、识别信息、方位信息等; sendab 为协调器 a 、 b 之间的信息的发送或接收,通 讯的方向为ab; path为路径规划算法; move为具体运动轨线的计算; grasp为抓取动作; put为放置动作; finish为接收过程,并反馈信息。
c1:拾取玻璃杯,注满水并放入指定的地点。 c2:拾取书本,并将其放入指定的地点。
21/34
1. 组织层设计:(1)机器推理
(1)机器推理 这些命令涉及了5个事件(event):
e1:摄像头获取目标 e2:机械手移动 e3:在水龙头处注满水 e4:抓取物品 e5:将物品放在指定的地点
c1 3 c1 4
Y
25/34
组织层设计:其他部分
(3) 机器决策:
Yo arg max{P (Yrc1 | c1 )}
r
(4) 反馈:更新相关概率,为下一次决策做准 备。
(5) 机器记忆交换:存储更新的概率,以及其 他必要的反馈信息。
26/34
2. 协调层设计
涉及到视觉协调v、路径规划协调p、传感器 协调s、手臂协调a和抓取协调g五个部分
14/34
分配器和协调器的统一结构
15/34
具体功能
通讯功能
• 与上、下层进行通讯,接 收或发送信息。
数据处理功能
• 对上层的命令信息和下层 的反馈信息进行描述,并 对自身的决策进行修改。
任务处理功能
• 识别要执行的任务,进行 任务的调度、转换和建立, 产生下层的控制程序,以 及对上层的反馈信息。
可见:分层递阶智能控制的目标就是使总熵 最小 。
18/34
目录
5.1 引言 5.2 递阶智能控制的基本原理 5.3 递阶智能控制的组织和协调 5.4 分层递阶智能控制的应用举例
19/34
5.4.1智能机器人系统的递阶控制
智能机械手,具有6个自由度,配有全局摄像 头。
20/34
设计任务
假设需要完成两项任务,其对应的指令 (Command)分别为c1、c2:
t0 tf
17/34
信息熵
控制量
u(x, t )
在允许控制空间u中信息熵为,
u
H (u, p[u(x, t )]) p[u(x, t )] ln p[u(x, t )]dx
由变分引理可得
H (x 0 , t 0 , u(x, t )) E{V (x 0 , t 0 , u(x, t ))}