多智能体
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分布式计算是一门计算机科学,一种计算方法,和集中式计算是相对的。
它研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终的结果。
这样可以节约整体计算时间,大大提高计算效率。
分布式人工智能(Distributed Artificial Intelligence),简称DAI,它是人工智能和分布式计算相结合的产物。
DAI的提出,适应了设计并建立大型复杂智能系统以及计算机支持协同工作(CSCW)的需要。
目前,DAI的研究大约可划分为两个基本范畴:一是分布式问题求解(Distributed Problem Solving,DPS);另一个是关于多智能体系统(Multi Agent System,MAS)实现技术的研究。
分布式问题求解:往往针对待解决的总问题,将其分解为若干子任务,并为每个子任务设计一个问题求解的子系统。
这里,首先需要智能地确定一个分配策略:如何把总工作任务在一群模块(Module)或者节点(Node)之间进行子任务分配;其次需要智能地确定一个工作任务协同的策略:要在基于分散、松耦合知识源的基础上,实现对问题的合作求解。
这里所谓“分散”的概念是指任务的控制操作和可利用的信息都是分布的,没有全局控制和全局数据;知识源分布在不同的处理节点上,数据、信息、知识和问题的答案可以按照某种规则予以共享。
(松耦合系统通常是基于消息的系统,此时客户端和远程服务并不知道对方是如何实现的。
客户端和服务之间的通讯由消息的架构支配。
只要消息符合协商的架构,则客户端或服务的实现就可以根据需要进行更改,而不必担心会破坏对方。
)
(3)主动性(Proactive):对于外界环境的改变,智能体能主动采取活动的能力。
(4)社会性(Social ) : 智能体具有与其它智能体或人进行合作的能力,不同的智能体可根据各自的意图与其它智能体进行交互,以达到解决问题的目的。
(5)进化性:智能体能积累或学习经验和知识,并修改自己的行为以适应新环境。
智能体可以看作是一类特殊的对象,即具有心智状态和智能的对象,智能体本身可以通过对象技术进行构造,而且目前大多数智能体都采用了面向对象的技术,智能体本身具有的特性又弥补了对象技术本身存在的不足,成为继对象技术后,计算机领域的又一次飞跃。
单智能体的基本结构如下图
感知器用来接收环境信息;知识库管理用来处理知识库中的各种知识,通信模块在Agent内部进行信息交互;效应器用来影响或改变环境;角色列表对Agent在系统中所扮演的角色进行列表。
多智能体系统(MAS,Multi-AgentSystem)也称多智能体技术(MAT, Multi-Agent T echnology):是多个智能体组成的集合,是由一个在一个环境中交互通讯、协调合作的多个智能体组成的计算系统。
它的目标是通过智能体之间的紧密合作,将大而复杂的系统建设成小的、彼此互相通信和协调的,易于管理的系统,从而解决大型、复杂的现实问题。
是分布式人工智能(DAI,DistributedArtificial Intelligence)的一个重要分支,是20世纪末至21世纪初国际上人工智能的前沿学科。
研究的目的在于解决大型、复杂的现实问题。
多智能体系统(MAS,M山ti.Agent System)是智能体概念的延伸,是指智能体之间通过连接拓扑结构、刚体连接或者通信连接等,与周围的智能体进行交互【2】。
这种交互方式可指协同、竞争或者知识共享
相比于单个智能体的控制效果,多智能体系统的协调控制显现出更好的鲁棒性、灵活性、经济性
多智能体系统由于其健壮、可靠、成本低等特点在自主机器人、空间飞行器、无人机和无线传感器网络等领域有着广泛的应用
它的研究涉及智能体的知识、目标、技能、规划以及如何使智能体采取协调行动解决问题等。
研究者主要研究智能体之间的交互通信、协调合作、冲突消解等方面,强调多个智
能体之间的紧密群体合作,而非个体能力的自治和发挥,主要说明如何分析、设计和集成多个智能体构成相互协作的系统。
Simon的有限性理论是多智能体系统形成的一个重要的理论基础,Simon认为一个大的结构把许多个体组织起来可以弥补个体工作能力的有限;每个个体负责一项专门的任务可以弥补个体学习新任务的能力的有限;社会机构间有组织的信息流动可以弥补个体知识的有限;精确的社会机构和明确的个体任务可以弥补个体处理信息和应用信息的能力的有限。
MuIti-agent之间的通信
通信是agent相互协作的前提,多智能体之间知识和信息的交换需要解决有关表示、语言、传输、上下文等方面的问题。
当多个agent组成MAS以后,agent之间信息的交互就产生了所谓的通信问题。
目前agent的通信方式主要有黑板系统和消息通信系统。
黑板系统是传统的人工智能系统和专家系统的议事同程的扩充,通过实用合适的结构支持分布式问题求解。
在Multi.agent系统中,黑板提供公共工作区供agent交换信息、数据和知识。
agent可以在黑板写入信息项,其它agent通过黑板读取信息,agent之间不直接发生通信。
黑板系统实现了局部数据共享,但它的不足之处在于要求各agent具有统一的数据结构或知识表达方式,降低了设计和建造agent的灵活性。
采用消息通信系统是实现灵活复杂的协调策略的基础,消息通信的两个agent只要知道对方地址的标识就可以建立连接,进行直接的消息交换。
消息通信系统中需要解决的问题可分为三个方面,对话管理、通信语言和通信协议。
对话管理:通信意图一旦产生,通常不是一条消息所能完成的,消息与消息之间存在一定的逻辑关系。
一条消息的正确理解不仅依赖于消息内容和对话协议,也依赖于对话历史。
因此通话双方需要对对话过程进行管理,以保证通信内容正确地结合到协议过程中去。
通信语言:通信语言是agent间传送信息和交换知识的媒介,通信双方共享语言的语义、语法的定义。
通信协议:包括高层对话协议和底层传输协议。
对话协议说明对话的基本过程和相应消息的各种可能情况;传输协议指通信中实际使用的底层传送机制,如TCP、SMTP和HTTP。
其中通信语言(ACL ,Agent Communication Language)和通信协议是agent之间能够高效交互信息和知识的基础。
作为一种高层的agent通信语言,ACL一般都有其一定的规范框架,见图2.2所示,ACL位于逻辑层上,用来定义各agent能够理解交流的消息类型和消息内容。
在ACL框架中,主要包括消息类型、消息格式、语义描述和内容语言等几个部分,以及支持的共享本体和采用的交互协议。
一般的ACL在此规范框架上建立起来,其中知识查询与处理语言KQML(Knowledge Query and Manipulation Language) 是当前主流的ACL之一,它是一种用于信息和知识交换的语言和协议,可以认为是一种agent之间消息的表示格式,也可以理解为一种消息处理协议。
作为应用程序与智能系统之间进行交流的一种语言,KQML以知识共享为基础,支持协同问题处理。
标准的KQML语法基于Lisp语言中的S-表达式,用一个通信原语(消息形式)开头,紧跟参数名称和参数值。
图2.3所示为一般的KQML消息语法,它是基于由配对括号括住的表,表的第一元素是行为原语,其余元素是行为原语的参数及其值,图中以冒号开头的是KQML的保留参数关键字。
可见,一条KQML语言结构在概念上分为三层,一是通信层,用来描述底层的通信参数,包括信息发送者(:sender)和接收者(:receiver)信息,该层是KQML语言的核心,明确了agent的收发方;二是协议层,明确了信息所对应的应答标识ID(:in_replyto)、当前信息
标识ID(:reply_with)、知识表述语言(:language)以及使用的本体(:ontology):三是内容层,包含了信息内容(:content)。
KQML与其他通信协议的区别在于,它不仅仅负责传递消息本身,而且能通过定义丰富消息类型及其语义,并告知接收者应如何处理消息内容和如何应答,从而促进agent之间通信的协调。
此外,KQML的实现比较灵活、简单,它与agent间的具体通信方式(如采用的协议和网络的具体形式)无关,其中的内容可以包含任意信息,如编程语言的表达式等。
agent 接收和处理KOML信息的过程见图2.4所示。
多智能体系统常采用协同控制方式,即控制律中包含协同项。
分布式计算、分布式布局为协同控制的主要特征。
协同控制系统不需要中央处理单元,也不需要采集各个智能体的信息给中央处理器。
协同多智能体系统的应用和研究领域较广。
应用方面,例如移动机器人、无人驾驶飞机和自动公路系统等。
理论研究方面,例如群集问题和一致性问题多智能体系统协调控制所研究的问题主要包括:跟踪(tracking)、编队(formation)、蜂拥(flocking)、群集(swarm)、聚集(rendezvous)、分布式滤波(distributed filter)、可控性(controllability)、一致性(consensus)等,
多智能体一致性问题研究智能体通过和邻居智能体之间的信息交流,使得所有智能体的状态趋于一个共同感兴趣的目标(也称为一致性状态)。
智能体和邻居智能体之间所釆用的信息交流方式称为控制协议。
处理一致性问题的关键正是在于如何采用一个合理的控制协议使得智能体的状态达到一致。
多智能体系统的一致性问题主要应用于分布式计算以及决策等方面。
此外,一致性问题是多智能体系统协调控制的基础。
“一致性”是指智能体通过自身控制算法,并且与周围的邻居通信,实现全局目标或者执行全局任务,该问题一直是协同控制领域研究的热点。
协同一致性任务是指每个智能体通过其协同控制律实现状态一致,共同完成任务
一致性问题作为多智能系统协同控制的基础,其主要包含两个方面的内容:一致性和一致性算法。
一致性是指随着时间的变化,多智能体系统中所有智能体的状态都趋于某个一致的状态。
一致性算法表示多智能体之间的互相作用、传递信息的规则。
其描述了单个智能体与其邻接智能体信息交换的过程。
多智能体系统一致性与复杂网络同步控制研究--郭凌
复杂动态网络(complex dynamical networks)的同步(synchronization)问题是与多智能体系统一致性密切相关的一个研究课题,共同关注复杂系统的动力学行为
夏日夜晚青蛙的齐鸣、心肌细胞和大脑神经网络的同步、剧场中观众鼓掌频率的逐渐同步。
同步主要研究两个或多个系统借助共同的动力学行为互相作用,通过全局或局部稱合来产生驱动,调整它们的某个动态性质以达到相同性质.相比复杂网络的同步,多智能系统一致性问题更强调个体之间的局部信息交流方式.
复杂性科学(complexity science)是当代科学发展的前沿领域之一,以复杂系统和复杂性为研究对象,揭示和解释复杂系统运行规律,涉及的范围包括自然、工程、生物、经济、管理、政治与社会等各个方面,被誉为是“21世纪的科学”.作为复杂性科学的重要研究课题,多智能体系统agentsystems)和复杂动态网络(complex dynamical networks)近年来已经成为系统和控制领域的两个紧密相关的研究热点问题
多智能体系统一致性问题得到了更多学者进一步的深入研究,取得了丰硕的成果.从智能体动力学考虑,可将现有结果归纳为以下几类:
(1) 一阶积分器系统
(2)二阶系统
(3)高阶系统
(4)线性系统
(5)非线性系统
根据智能体在系统中作用的不同,可将一致性划分为无领导者的一致性和带有领导者的一致性,即领导-跟随一致性(leader-following consensus).
无领导者的一致性,系统一致性状态是由所有智能体共同决定的.
领导-跟随一致性中系统一致性状态仅由领导者决定.2005年,文献[126]指出,在迁徙的鱼群中,一部分鱼担任着领导者的工作,其状态不受其他智能体的影响.
在多智能体系统中,起到领导作用的智能体称为领导者(leader),其余的智能体称为跟
随者(followe r).领导-跟随一致性是指通过智能体间的协调,使得所有跟随者的状态趋于领导者的状态。
从实际应用的角度出发,领导-跟随一致性还可以分为真实领导者和虚拟领导者,其中虚拟领导者一致性也称为模型参考一致性.对于具有多个领导者的多智能体系统,考虑使得所有跟随者进入到由领导者组成的凸包内,称为包含控制问题。
领导-跟随一致性:研究热点主要集中在两个方面:
(1)智能体之间的通讯拓扑(例如,时滞、切换、不能正常运行的通讯连接等);
(2)智能体的动态结构(例如,一阶、二阶、高阶器,非线性动态,噪声扰动等),即智
能体自身的动态特性。
有关多智能体一致性已有工作中,尚未考虑到控制效果与智能体自身状态之间的依赖关系.本文将讨论智能体状态与控制输入之间具有相关性的一类系统,考虑智能体的状态满足:
1.第二章研究一类多智能体系统的领导-跟随一致性问题,系统由一个领导者和多个跟随者
组成,考虑跟随者自身状态与控制输入之间的依赖性。
设计一致性协议。
在系统中智能体初始状态为正值的条件下,首先,在无向通讯拓扑图下,利用代数图论,矩阵论和稳定性理论,得到了具有固定或切换拓扑结构的系统实现领导-跟随一致性的充分条件。
进而,在有向通讯拓扑图下,讨论具有通讯时滞系统的领导-跟随一致性问题.结果表明,系统实现领导-跟随一致性与跟随者之间的通讯时滞无关.仿真结果验证所得结论的有效性.
2 .第三章研究具有一个领导者和多个跟随者间组成的多智能体系统领导-跟随一致性问题,在系统中考虑智能体状态随时间和空间变化,且跟随者受到空间扩散作用的影响。
和第二章一样,本章也考虑到跟随者的控制效果依赖于其自身状态。
对于这种反应扩散方程描述的系统,设计一致性控制协议。
当系统中智能体的初始状态满足一定条件时,得到多智能体系统实现领导-跟随一致性的充分条件.通过两个数值仿真例子验证所得结论的有效性.
目前已有工作所涉及的系统大多是用常微分方程(ODEs)所描述的,即考虑智能体的状态仅随时间而变化,并未考虑到空间变量对智能体状态的影响.事实上,很多现实的系统中智能体的状态是随着空间和时间的变化而变化的,这类系统描述为偏微分方程(PDEs)的形式.
扩散现象源于个体在空间中的分布不均衡,是化学、物理、生物和工程中非常普遍的一种现象.可分为物理扩散、生物扩散、化学扩散等,通常用一类偏微分方程--扩散方程(也称为热方程)描述。
作为热传递三种基本方式(热传导、对流、辐射)之一,热传导是指热量从系统的一部分传到另一部分或由一个系统传到另一个系统的现象。
这种现象产生的根本原因是物体或系统内的各点间存在温度差。
每个智能体的状态表热量,通常的单位为卡路里或BTU(英国热量单位)。
热量的存在可以用温度来直观的衡量.从热传导的观点出发,热量从温度高的地方向温度低的地方流动,这个过程被描述为扩散。
在领导-跟随多智能体系统中,领导者的温度与跟随者无关。
领导-跟随一致性意味着通过智能体间的热传导,使得所有跟随者的温度趋于领导者的温度,智能体之间热传导可借助于某些装置(例如温度传感器等)来实现。
饱和受限的多智能体系统一致性问题研究---王庆领
多智能体网络系统的一致性协同控制理论设计的网络控制算法作用于工程项目时却达不到期望的控制效果。
究其原因,一方面是描述对象的理论模型和
一个重要的原因就是在网络化算法的设计过程中没有充分考虑到实际系统的工作范围要受理论设计的控制信号不能准确的作用在实际对象之上,这在很大程度上限制了多智能体网络系统控制算法的进一步发展及其在实际工程中的应用。
鉴于任何实际的被控对象都会受到饱和约束。
因而,饱和受限的多智能体网络系统一致性以及在此基础之上的分析和协同控制问题是近年来网络化控制领域的前沿研究课题。
(饱和受限特性在多智能体系统中的普遍存在性和其非线性的特点)
多智能体系统一致性协同控制理论在工业应用中却受到各种物理条件上的限制。
最明显的是物理器件执行器的工作范围有限以及控制信号在物理器件上的消耗使得系统的有效性输入有限。
几乎所有的实际物理系统都会受到执行器工作范围限制或者存在物理器件损耗。
即受到执行器饱和约束或者输入饱和约束。
饱和受限的多智能体系统本质上是一种非线性多智能体系统
本文在总结前人工作的基础上,系统、深入地研究了饱和受限的连续和离散时间多智能体系统一致性及协同控制算法。
在统一的领航-跟随(leader-follower)框架下解决了饱和受限的多智能体系统一致性及协同控制问题,提出了饱和受限的一阶、高阶(high-order)以及部分线性多智能体系统在无向图和有向图的拓扑条件下达到全局一致及协同控制的分析与设计方法。
首先,考虑在无向图网络拓扑下,执行器饱和的线性智能体系统半全局一致性问题。
作为一种特殊情况,考虑执行器饱和的双积分器智能体系统在无向图网络拓扑下,多智能体系统的全局一致性问题。
其次,考虑在有向图网络拓扑下,执行器饱和的线性智能体系统半全局一致性和一致性协同算法设计问题。
结论进一步表明,对于饱和受限的非稳定智能体系统来说,线性反馈控制算法能够达到的最好的控制目标是半全局一致性。
一致性问题作为多智能系统协同控制的基础,其主要包含两个方面的内容:一致性和一致性算法。
一致性是指随着时间的变化,多智能体系统中所有智能体的状态都趋于某个一致的状态。
一致性算法表示多智能体之间的互相作用、传递信息的规则。
其描述了单个智能体与其邻接智能体信息交换的过程。
从两个方面,受限动态性能的一致性和受限控制算法的一致性,阐述饱和受限的多智能体系统一致性的发展及研究现状。
1.2.1受限动态性能的一致性
1.2.2受限控制算法的一致性
协同一致性多智能体系统的故障参数辨识与容错控制---余志恒
●协同一致性任务是指每个智能体通过其协同控制律实现状态一致,共同完成任务
●协同控制多智能体系统,是指智能体之间通过协同控制律相互影响、相互协作,共
同完成汇聚、编队和状态一致性等任务
●
本文以执行协同一致性任务的多智能体系统为背景,研究故障对该系统的影响,提出了融合故障检测、参数辨识和容错控制的故障处理框架。
协同一致性多智能体系统技术适用领域最广,因此,本文以该背景为基础,通过为其建立一阶和二阶模型,研究其故障处理机制。
协同一致性问题为分布式多智能体系统的基础问题,网络化多智能体系统可通过协同控制律实现状态一致。
单个智能体的执行器故障可通过智能体间的协同行为扩散到整个系统,使整个系统失稳。
然而传统的故障诊断与容错控制未考虑智能体问的协同行为,使其难于应用于协同系统。
因此,本文建立一种一致性多智能体系统故障处理框架,研究该框架下的基于未知输入观测器的故障检测方法、基于极值搜索的故障参数辨识方法和基于李雅普诺夫稳定性理论的协同容错控制策略。
首先,建立包含协同项的一阶系统和二阶系统模型,并分析系统稳定性与拉普拉斯矩阵的关系。
在此基础上分析系统故障、传感器故障和执行器故障对系统性能的影响,并对执行器故障进行进一步分类。
针对执行器故障,通过解耦故障项矩阵,为每个智能体设计一组未知输入观测器进行故障检测,实现了快速的故障定位。
分别为一阶和二阶系统的故障检测设计了对应的仿真场景,验证了所提观测器具有快速故障检测的能力。
其次,利用极值搜索不依赖于数学模型的特性,提出一种新的自适应故障参数辨识方法,即把故障参数辨识问题转化为极值搜索的参数优化问题。
单故障情况,为其设计对应的代价函数,并证明了极值搜索闭环结构的参数在满足一定约束条件下,具有负梯度的收敛能力;多故障情况,基于梯度的思想设计了一种可同时辨识多个参数的极值搜索闭环结构,并分析了多种形式激励函数的参数辨识性能。
针对基于梯度思想的结构收敛速度较慢的问题,提出了一种基于牛顿算法的参数辨识结构,并验证了牛顿算法具有快速的参数辨识能力。
最后,基于李雅普诺夫稳定性思想,设计调整互连权重的协同容错策略。
针对单故障情况,为其设计李雅普诺夫函数,推导系统稳定性条件,并根据该稳定条件设计权重调整策略,在实现容错的基础上满足一定的性能指标,并通过水平位置一致性运动仿真验证其有效性,其中,二阶系统中隔离了故障智能体;针对多故障情况,在隔离故障智能体的基础上,设计了可重构的协同控制律,以补偿故障对系统的影响,从而实现一致性多智能体系统的故障容错。
1.故障检测
本文的协同一致性多智能体系统,通过建立系统的模型深入系统的本质,采用了基于模型和基于未知输入观测器的方法,为每一个智能体构造一组观测器观测系统状态,可快速诊断出系统故障。
2.故障参数辨识
本文提出一种基于极值搜索的参数辨识方法,把故障参数辨识问题转化为极值搜索的参数优化问题,所设计的闭环结构具有一定的通用性,适用于存在最优值的输入输出系统,且。