多智能体系统一致性综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多智能体系统一致性综述
一 引言
多智能体系统在20世纪80年代后期成为分布式人工智能研究中的主要研究对象。研究多智能体系统的主要目的就是期望功能相对简单的智能体系统之间进行分布式合作协调控制,最终完成复杂任务。多智能体系统由于其强健、可靠、高效、可扩展等特性,在科学计算、计算机网络、机器人、制造业、电力系统、交通控制、社会仿真、虚拟现实、计算机游戏、军事等方面广泛应用。多智能体的分布式协调合作能力是多智能体系统的基础,是发挥多智能体系统优势的关键,也是整个系统智能性的体现。
在多智能体分布式协调合作控制问题中,一致性问题作为智能体之间合作协调控制的基础,具有重要的现实意义和理论价值。所谓一致性是指随着时间的演化,一个多智能体系统中所有智能体的某一个状态趋于一致。一致性协议是智能体之间相互作用、传递信息的规则,它描述了每个智能体和其相邻的智能体的信息交互过程。当一组智能体要合作共同去完成一项任务,合作控制策略的有效性表现在多智能体必须能够应对各种不可预知的形式和突然变化的环境,必须对任务达成一致意见,这就要求智能体系统随着环境的变化能够达到一致。因此,智能体之间协调合作控制的一个首要条件是多智能体达到一致。
近年来,一致性问题的研究发展迅速,包括生物科学、物理科学、系统与控制科学、计算机科学等各个领域都对一致性问题从不同层面进行了深入分析,研究进展主要集中在群体集、蜂涌、聚集、传感器网络估计等问题。
目前,许多学科的研究人员都开展了多智能体系统的一致性问题的研究,比如多智能体分布式一致性协议、多智能体协作、蜂涌问题、聚集问题等等。下面,主要对现有文献中多智能体一致性协议进行了总结,并对相关应用进行简单的介绍。
1.1 图论基础
多智能体系统是指由多个具有独立自主能力的智能体通过一定的信息传递方式相互作用形成的系统;如果把系统中的每一个智能体看成是一个节点,任意两个节点传递的智能体之间用有向边来连接的话,智能体的拓扑结构就可以用相应的有向图来表示。
用)(A E,V,G =来表示一个有向加权图,其中}{n 21v ,,v ,v V =代表图的n 个顶
点;V V E ⨯⊆是边集合,如果存在从第i 个顶点到第j 个顶点的信息流,则有E v ,v e j i ij ∈=)(;A 是非负加权邻接矩阵0>⇔∈ij ij a E e ;节点i v 的邻居集定义为})({E v ,v |v N j i j i ∈=。如果对所有的E e ij ∈意识着E e ji ∈,则称G 是无向图。
2个不同的节点i v 和j v 之间有有向路径是指存在1个有序节点序列)()()(j k k k k 1v ,v v ,v v ,v l 211,,, ;如果图G 中任意两个不同的结点间都存在1条有向路径,则称G 是强连通图;如果G 是无向的,则称G 是连通图。图G 有有向生成树指的是图G 存在1个包含所有定点的子图,除了唯一的根节点以外,其余节点有且仅有1个父节点。
二.主要研究内容
2.1多智能体系统一致性问题描述
令q i R x ∈表示图中第i 个顶点i v 的状态且满足)u ,f(x x i i = ,这样可利用二元组
)(x G,来表示动态多智能体网络系统,其中T T n T 2T 1
x ,,x ,x x )( =,系统状态方程为u)F(x,x = 。如果对于所有的j i,,都有0)()(=-∞
→t x t x lim j i t ,则称多智能体系统实现一致性。
2.2一致性协议
2.2.1一阶一致性
在早期关于一致性问题的研究中,绝大多数研究工作针对智能体为一阶智能体的情形,分析不同网络拓扑结构下实现一致性需要满足的条件和一致性实现时的收敛值。
(1)连续时间情形 当网络中的智能体均具有形如:
i i u x = )(R x i ∈ (1) 的状态方程时,经常采用一致性协议为:
∑-=∈N
i i j ij i x x a u )( (2)
因此,在上述一致性协议下的闭环系统为Lx x -= ,系统(1)的解为)()(0x e t x Lt =,
可以利用线性系统理论来分析系统的一致性问题。
在固定拓扑结构下,一致性的相关结论为:
定理1 假定G 有一个有向生成树,L 为其拉普拉斯矩阵且有01=L ,0L T =γ,11T =γ,则在协议(2)作用下,多智能体系统可实现一致性,且(0))(x γt x lim T i t =∞
→。特别地,当G 为无向连通图或强连通平衡图时,多智能体系统
可实现平均一致性,即∑==∞→n
1i i i t x t x lim (0))(。 许多场合下,由于节点间连接的建立或失败,多智能体系统的拓扑结构往往是动态发生变化的。拥有动态网络的系统一般称之为切换网络,切换网络可以用)(t G 0来表示,其中m},{1,2,J R :)( =→t σ为切换信号,}{m 21G ,,G ,G 为所有可能的拓扑结构组成的集合。在协议(2)的作用下,且有切换拓扑结构的闭环系统为:
x G L x k )(-= (3) 如果上述系统仅在离散时刻)(02121t ,,,n n ≤<<<ττττττ 处切换,则系统(3)的解为:
(0)e e e e )t (x 10(1)120(2)1-1)0()0()L()-)(L()-)(L()))(L(x G τG τG τt G h h h h h τττ------=
系统一致性分析转化为多个具有非负对角的随机矩阵乘积的极限问题的分析。 在切换拓扑结构下,一致性的相关结论为:
定理2 假定切换网络在任意长度有上界的时间间隔内均有一个有向生成树,则在协议(2)作用下,切换多智能体系统可渐进实现一致性。
(2)离散时间情形 当网络中的智能体均具有形如:
)((k))(k u x 1k x i i i +=+ (4) 的状态方程时,采用一致性协议:
∑∈=i
N j i j ij i k x k x a u ))(-)((ε (5)
因此,在上述一致性协议下形成的闭环系统为:
)()(k Px 1k x =+ (6) 式中,∆<<-=1ε0εL,I P ,∆是网络节点的最大出度。
在固定拓扑和切换拓扑结构下,多智能体系统有类似定理1和定理2相应的结论。
(3)其他研究热点 除了上述关于一致性的经典结论外,还有学者分别考虑带时滞的一致性、有一个动态领导者、多个静态或者动态领导者的一致性问题。
2.2.2二阶一致性
多智能体系统二阶一致性的研究中假设智能体具有下列形式的状态方程:
⎩⎨⎧==i i i i u x
v x n i ,1,2, = (7) 采用一致性协议:
∑∈-+=i
N j i j ij i i )x (x a kv u (8)