三、Agent-basedModel-中国科学院理论物理研究所
agent based模型
agent based模型Agent-based modeling (ABM) is a computational modeling technique used to simulate the actions and interactions of autonomous agents within a complex system. These agents can represent individuals, groups, organizations, or any other entities that can make decisions and interact with their environment. ABM is a powerful tool for studying emergent phenomena and understanding the dynamics of complex systems.In an agent-based model, agents are typically programmed with a set of rules that govern their behavior, decision-making processes, and interactions with other agents and their environment. These rules can be based on empirical data, theoretical principles, or a combination of both. By simulating the behavior of individual agents and observing how they interact with one another, researchers can gain insights into the macro-level patterns and dynamics that emerge from these interactions.One of the key advantages of agent-based modeling is its ability to capture the heterogeneity and complexity of real-world systems. Unlike traditional modeling approaches that rely on aggregate equations and assumptions about the behavior of a system as a whole, ABM allows for the representation of individual-level variability and interactions. This makes ABM particularly well-suited for studying social, economic, and ecological systems, where the behavior of individual agents can have a significant impact on the system as a whole.Agent-based models can be used to explore a wide range of research questions, such as the spread of infectious diseases, the dynamics of financial markets, the emergence of social norms, and the effects of land-use changes on biodiversity. By experimenting with different parameters, assumptions, and scenarios, researchers can gain a better understanding of how the system behaves under different conditions and identify potential interventions or policies to improve its performance.Developing an agent-based model typically involves several key steps, including defining the research question, identifying the relevant agents and their interactions, specifying the rules that govern agent behavior, implementing the model in a simulationplatform, calibrating and validating the model, and conducting sensitivity analyses and scenario testing. While the process of developing an ABM can be complex and time-consuming, the insights gained from the model can provide valuable insights that would be difficult or impossible to obtain through empirical studies alone.In conclusion, agent-based modeling is a powerful and flexible technique for studying complex systems and understanding the emergent properties that arise from the interactions of individual agents. By simulating the behavior of autonomous agents and observing the dynamics of the system as a whole, researchers can gain valuable insights into the underlying mechanisms driving the system and develop strategies for improving its performance. ABM has applications in a wide range of fields, including social science, economics, ecology, and public health, and is a valuable tool for researchers seeking to explore the complexities of the world around us.。
agent-based modeling发展过程
Agent-Based Modeling (ABM,基于代理的建模) 是一种用于模拟和研究复杂
系统的方法,其中每个个体被视为一个“代理”,这些代理根据一组规则相互作
用和行为,从而产生整体系统的行为。下面是 Agent-Based Modeling 发展过 程的简要概述:
1. 起源: Agent-Based Modeling 的概念最早可以追溯到 20 世纪 50 年代
和 60 年代的社会科学领域,但真正的发展开始是在 20 世纪 70 年代和
80 年代。
2. 初期探索: 在 20 世纪 80 年代,研究人员开始使用 Agent-Based
Modeling 来模拟复杂系统,如城市交通、生态系统和经济市场等。这些 模型通常基于简单的规则,模拟个体之间的相互作用,从而展示出系统 整体的行为。 3. 发展和应用: 随着计算机技术的进步,Agent-Based Modeling 的发展
迅速加速。20 世纪 90 年代,该方法在各个领域得到了广泛的应用,如 社会科学、生态学、经济学、流行病学等。研究人员开始使用更复杂的 模型和代理行为规则来模拟更真实的现象。 4. 跨学科交叉: Agent-Based Modeling 的发展促使不同领域的研究人员 之间展开合作,进行跨学科的研究。该方法允许从多个角度来研究一个 问题,从而深入理解复杂系统的行为。 5. 高级技术的应用: 随着计算机性能的提升,研究人员开始使用更复杂的
Байду номын сангаас
断发展,人们可以预期将来会出现更复杂、更真实的 Agent-Based Modeling,以更好地理解和解释复杂系统的行为。
总之,Agent-Based Modeling 的发展过程是一个逐渐从初期探索到广泛应用、 跨学科交叉的过程,通过模拟个体代理之间的相互作用,帮助人们更好地理解 和研究复杂系统。
复杂适应系统及基于agent的建模与仿真方法
复杂适应系统及基于agent的建模与仿真方法一、引言随着科技的不断发展和社会的快速变革,复杂适应系统的研究和应用在现代社会中变得愈发重要。
复杂适应系统是由大量相互作用的个体组成的系统,个体之间的互动会引发整个系统的非线性行为和演化。
而基于agent的建模与仿真方法则是应对复杂适应系统挑战的有效工具。
本文将对复杂适应系统及基于agent的建模与仿真方法进行全面、详细、完整且深入的探讨。
二、复杂适应系统的概念和特征2.1 复杂适应系统的概念复杂适应系统是指由大量相互作用的个体组成的系统,例如生态系统、社交网络、物流系统等。
个体之间的互动和自适应能力是复杂适应系统的重要特征。
2.2 复杂适应系统的特征1.非线性性:复杂适应系统的行为往往不是简单的线性关系,而是呈现出非线性的特征。
2.自组织性:复杂适应系统具有自组织的能力,即个体之间通过相互作用形成全局的整体行为。
3.自适应性:复杂适应系统能够根据外部环境的变化对自身进行适应和调整。
4.高度耦合性:复杂适应系统的个体之间存在相互依赖和耦合关系。
三、基于agent的建模与仿真方法3.1 Agent的概念Agent是指具有自主性、目标导向性和适应性的个体,它能够感知环境、做出决策并采取行动。
3.2 Agent的分类根据不同的特征和功能,Agent可以分为以下几类: - 简单反应型Agent:根据环境的当前状态产生固定的响应。
- 模型型Agent:通过对环境进行建模,预测环境的变化并做出相应的决策。
- 脚本型Agent:预先定义好一系列的行为模式和规则,根据环境的状态选择相应的脚本执行。
- 学习型Agent:通过学习和积累经验改进自身的行为策略。
3.3 Agent的建模和仿真方法1.有限状态机(FSM):将Agent的决策过程建模为有限状态机,通过定义不同状态和状态转移条件来描述Agent的行为。
2.强化学习(RL):基于奖励信号和价值函数来训练Agent的决策策略,使Agent能够从环境中学习并逐渐优化自身的行为。
基于Agent-based自组织算法的鱼群逃生模型
基于Agent-based自组织算法的鱼群逃生模型崔旭冉;林涵轩;刘云帆;石朝宇【摘要】自然界生物以其特定的方式抵御伤害和袭击。
硬骨鱼纲动物沙丁鱼以聚集成群、协作逃生的方式对抗捕食者的捕食和侵犯。
基于Agent-based自组织算法建立关于鱼群逃生过程的数学模型,并加以改进。
将逃生过程分为两部分进行模型的建立与求解。
将鱼群遇到捕食者之前设为第一部分,使用Boids行为准则作为鱼群普通运动的规律要求,根据内聚、分散、对齐三大原则分别对沙丁鱼的运动规律进行约束,并使用Matlab仿真实现模型的可视化,从而证明鱼群普通运动状态近似成球形的推断。
将鱼群突遇捕食者开始改变运动状态设为第二部分,使用基于Agent-baesd的自组织算法,定义每条沙丁鱼为一个AFishAgent,其行为模型为AFishBehModel[1]。
在第一部分建立的普通运动规律模型的基础上和AFishAgent之间的局部连接准则,建立鱼群突遇捕食者时协作逃生运动模型。
【期刊名称】《科技与创新》【年(卷),期】2018(000)022【总页数】3页(P58-60)【关键词】Boids行为准则;Agent-based自组织算法;Matlab仿真;逃生模型【作者】崔旭冉;林涵轩;刘云帆;石朝宇【作者单位】[1]山东科技大学电气信息系,山东济南250000;;[1]山东科技大学电气信息系,山东济南250000;;[1]山东科技大学电气信息系,山东济南250000;;[1]山东科技大学电气信息系,山东济南250000【正文语种】中文【中图分类】TP301.6在光线较暗的海洋环境中,沙丁鱼群在遇到捕食者捕食前后,其运动状态会发生显著变化。
假设捕食者只能通过回声定位判断较远处鱼群的位置,第一部分将鱼群运动状态抽象成球形,并分析出鱼群的普通运动轨迹;第二部分以现有模型为基础,模拟鱼群在突遇袭击时整体的协作逃生规律,以实现对鱼群在遇捕食者前后的运动规律变化路线的近似模拟。
一个基于自组织多Agent系统的智能控制与决策模型
一个基于自组织多Agent系统的智能控制与决策模型杨斯博;李敏强【摘要】提出了一个基于自组织多 Agent 系统的智能控制与决策模型,它是一种基于行为主义的智能控制与决策模型,由环境和自组织多 Agent 系统两大部件构成,分别通过环境的定义、环境的识别、多 Agent 控制与决策过程以及多 Agent 控制与决策输出4个基本步骤来完成建模工作。
该模型可以灵活地选择多种算法进行具体的实现工作,文中给出的算法是一种基于作用力机制(物理激励)的多Agent 控制与决策算法,该算法是通过模仿经典物理学理论中的万有引力定律,将多 Agent 系统中的自组织交互过程转化为相互的作用力,并通过交互作用力的大小和方向体现多 Agent 之间的交互机制,充分利用了多 Agent 系统的群体决策优势。
测试实验结果表明,该模型具有较好的应用效果并且其系统能量在Agent 数目为300、迭代次数超过80次时具有稳定性。
【期刊名称】《天津大学学报》【年(卷),期】2012(000)010【总页数】9页(P903-911)【关键词】自组织;多Agent系统;智能控制与决策;环境;作用力机制;群体决策【作者】杨斯博;李敏强【作者单位】天津大学管理与经济学部,天津 300072;天津大学管理与经济学部,天津 300072【正文语种】中文【中图分类】TP18智能控制与决策的研究内容比较广泛,涉及机器人、自动化导航车 AGV、智能车辆Ⅳ、智能设备以及生产生活中那些需进行智能控制和决策的系统(如计算机网络,智能交通系统 ITS)等.目前,国际上智能控制与决策模型以Brooks[1]教授提出的包容式结构、Pomerleau[2]提出的 ALVINN 系统和 Barbara Hayes-Roth[3]教授提出的黑板控制结构最为著名.其中,包容式结构是人工智能领域中基于行为主义的智能控制与决策模型,ALVINN系统和黑板控制结构则分别是人工智能领域中基于连接主义(神经网络)和符号主义(逻辑推理)的智能控制与决策模型的代表.包容式结构打破了传统人工智能领域研究者强调的基于符号主义(逻辑推理)的模型构建方法,仅需通过机器人与环境之间的交互行为建模具体完成所需要的智能控制与决策任务,可以说是对传统人工智能的一大挑战.在前述3个经典模型的基础上,近些年来国内外研究者围绕智能控制与决策模型进行了大量的研究工作.国外一些研究者将最新的生物进化理论及协同进化理论引入智能控制与决策模型的构建过程中,为智能控制与决策模型提供了一些新途径,如基于蚁群优化的方法[4]、基于免疫算法的模型[5]等.其他一些研究者对传统人工智能方法进行了改进,采用本体论、机器学习方法来完成智能控制与决策模型的构建工作,包括基于 POMDP的方法[6]、基于人工神经网络的模型[7]、基于本体论及 Web服务的模型[8].随着近几年智能控制与决策领域对环境适应性和复杂性要求的不断上升,国外学者重新开始重点关注采用基于行为主义的方法来构建智能控制与决策模型,如基于会话的模型[9]和基于交互行为的模型[10]等.与国外相比,我国的研究者近些年来也提出了一些较好的理论模型,如基于模拟退火的多Agent模型[11]、基于混合结构的多 Agent模型[12]、基于 Petri网的方法[13]、基于协同进化的方法[14-15]和基于多智能体协商机制的方法[16]等.但是,目前我国在智能控制与决策领域的研究工作大多是注重理论模型研究,而能够直接具体应用和实现的理论模型相对较少,大多数研究成果主要集中在采用传统的逻辑推理或是生物进化的方法进行分析和建模,而对于基于行为主义的智能控制与决策模型的关注和研究工作较为匮乏,特别需要能够提供适应复杂环境下控制与决策任务的要求,又能简单方便地进行具体应用和实现的理论模型.为此,笔者提出了一种基于行为主义的自组织多Agent系统智能控制与决策模型.该模型由环境和自组织多Agent系统两大部件所构成,可通过环境的定义、环境的识别、多 Agent控制与决策过程以及多Agent控制与决策输出 4个基本步骤来完成具体建模工作.与现存的多 Agent系统控制与决策模型相比,该模型可以灵活选择多种算法进行具体物理实现,并可充分利用自组织多Agent系统的群体决策优势.此外,该自组织多 Agent系统智能控制与决策模型不是针对现有的多机器人或多车辆的整体控制问题(现有大多数多 Agent系统模型属于此类,如机器人足球、道路交通控制等),而是针对在单独的智能机器(如智能车辆、机器人、无人驾驶飞机、自动化导航车等)上构建智能控制与决策模型,从而满足其在复杂环境下自适应性控制与决策的需要.1 基于自组织多 Agent系统的智能控制与决策模型根据在单独智能机器(如智能车辆、机器人、无人驾驶飞机、自动化导航车等)上构建复杂环境下自适应性控制与决策系统的目标,基于自组织多 Agent系统的智能控制与决策模型见图 1.该模型主要由两大部件构成:一个是环境部分,代表了智能机器在其识别范围内的实际运动空间(如行驶的道路、实验场地等);另一个是智能机器上的自组织多 Agent系统.该自组织多Agent系统以软件形式运行在智能机器的计算机系统中,可针对需要完成不同的控制与决策任务.在对环境的信息处理中,为方便自组织多Agent系统有效处理环境变化信息,将环境中的各种物理对象(如设施、行人、车辆、障碍物等)定义为各种外部Agent,这些外部 Agent的位置变化(出现/消失/移动)和数目则体现了环境的变化情况.自组织多Agent系统实现其控制与决策任务则主要通过 4个基本步骤完成,即环境的定义、环境的识别、多 Agent控制与决策过程和多Agent控制与决策输出.1.1 环境的定义在基于自组织多 Agent系统的控制与决策模型中,环境指的是智能机器(如智能车辆、机器人、无人驾驶飞机、自动化导航车等)在其可识别范围内的真实运动空间(如行驶道路、所在场地等).环境反映智能机器在行驶或运行过程中遇到的各种外部环境变化,如遇到车辆、行人、设施或各种障碍物等.智能机器可根据这些外部环境变化进行相应的决策控制.环境按其属性可划分为静态环境和动态环境两种.静态环境指的是环境保持不变的情况,也就是说在某段时间内没有新的物理对象出现、移动或消失的情况.此时,智能机器可保持原先运行状态不变(不改变运动轨迹);动态环境指的是在环境中出现以下3种情况中的1种或者多种,即环境中出现了新的物理对象、原有物理对象发生了位移、原有物理对象消失在识别范围外.此时,智能机器就需要根据不同情况做出准确判断并进行相应控制决策操作行为.图1 基于自组织多Agent系统的智能控制与决策模型Fig.1 Intelligent control and decision making model based on self-organizing multi-Agent system 1.2 环境的识别在完成对智能机器所处环境的定义之后,需要对环境信息进行有效的识别工作.该识别过程是由装载在智能机器上的各种传感器具体完成的.这些传感器可以是光学传感器、电磁传感器或是声学传感器中的一种或多种.而衡量这几种传感器的识别效果的指标包括:感知范围(即传感器可探测的最长/最大范围)、精确度(传感器可测量的最小距离变化范围)、方向度(传感器可测量感知光束的宽度范围)和响应时间(传感器对距离变化的响应速度).与此同时,为了弥补传统传感器的不足,也可在传统传感器基础上增加很多成本低廉的新型传感器设备,如摄像机、无线通信设备等.此时,智能机器所做的工作就是将由多个传感器捕获到的环境信息融合后通过传感器接口输入到自组织多Agent系统中,这时需将外部的物理对象转化为软件形式的 Agent并添加到自组织多Agent系统中参与控制与决策过程.这些软件形式的外部 Agent所具有的属性(如大小、形状、静止/移动等)来源于多传感器信息融合后的信息并始终与外部物理环境保持一致.在自组织多Agent系统成功获取外部环境信息并添加了外部 Agent之后就完成了环境识别工作.1.3 多Agent控制与决策过程多 Agent控制与决策过程是整个模型的核心模块,其主要由内/外部 Agent具体功能的划分、内部Agent结构和数量的选择、内/外部Agent交互机制的选择以及多 Agent控制与决策算法的选择 4个子步骤构成.1) 内/外部Agent具体功能的划分在自组织多Agent系统中,存在两类软件形式的Agent:一类是自身具有功能目的性的内部 Agent,另一类则是无功能目的性的外部 Agent.内部Agent的主要功能可根据控制与决策的需要进行定义,又称为决策Agent,它们可完成不同的功能性目标,如避撞、导航、路径规划等.为便于使用,这些决策 Agent可定义为同源 Agent(即各种属性都相同),它们通过协作交互的方式协同完成某些具体功能目标.外部Agent主要是指那些在环境中的物理对象(如车辆、行人、设施、障碍物等).这些外部 Agent一般不具有功能性目的,它们是智能机器所处的真实物理环境在自组织多Agent系统(软件环境)中的映射,它们是一类经过形式转换并能实时体现实际物理对象特性的软件 Agent,它们通过传感器接口输入后将参与随后自组织多Agent系统的智能控制与决策过程.2) 内部Agent结构和数量的选择完成内/外部主体功能划分后,需根据不同控制与决策功能需要选择内部Agent的结构和数量(外部Agent也是根据内部 Agent的结构进行选择的,其数量由传感器依实际情况确定).内部 Agent结构可以有 3种基本形式,即认知型 Agent、反应式 Agent和混合式Agent,使用者可根据功能需要选择以上3种结构形式中的一种或多种,如可选择功能简单且易实现的反应式 Agent(其不具有逻辑推理能力或是逻辑推理能力比较低)作为内部 Agent的结构.内部Agent的数量是根据要完成任务目标的复杂程度、多Agent系统构建的复杂性和智能机器所要求的响应时间等因素综合考虑的:若内部 Agent数量过多,则由于大量的 Agent的交互过程会导致控制与决策过程非常复杂且响应速度慢,甚至会出现死锁情况,这种情况对于可靠性要求高的任务是无法容忍的(如车辆避撞问题);若内部 Agent的数量过少,每个内部Agent对最终控制与决策效果的贡献度过大,会出现个别内部Agent的死锁或信息输入的错误,从而导致控制与决策目标的背离,使控制与决策过程失效,这种情况对于可靠性要求高的任务也同样是致命性的(如车辆避撞问题).从另一方面来说,数量过少的Agent难以有效地协同完成特定任务目标,因为每个Agent受其他 Agent的制约过少,可能在极端情况(单独的 Agent实现控制与决策功能)难以进行全局性有效控制.因此,内部 Agent的数量应根据任务要求及经验知识进行适中选择.3) 内/外部Agent交互机制的选择确定内部Agent的结构和数量之后,要根据它们的结构和数量及功能任务需要为其选择与外部Agent交互行为相适应的交互机制,该步骤可根据内部Agent的结构类型、任务复杂性和对功能任务所需响应时间等因素进行综合考虑.比如说,选择基于逻辑推理的交互机制(较适合于认知型Agent结构和混合型 Agent结构且响应时间要求不太高的情况)、基于交互行为的交互机制(较适用于反应式Agent 结构且响应时间要求比较高的情况)或是基于生物进化的交互机制(可适用于所有Agent结构且对响应时间要求较低的情况)等.4) 多Agent控制与决策算法的选择确定内/外部 Agent交互机制之后,为了使自组织多Agent系统对智能机器进行有效控制,需根据不同功能任务选取或者构建不同控制与决策算法,但前提是这些算法必须是适用于多 Agent系统的分析和建模要求的.这些算法大体可被分为3种类型.(1)基于逻辑推理的算法,即通过使用逻辑推理的相关理论和算法构建和实现的多Agent系统计算模型.如机器学习算法等.(2)基于交互行为的算法,即通过模拟人类交互活动或是采用物理学原理构建和实现的多Agent系统计算模型.如基于社会推理的算法和模拟退化算法.(3)基于生物进化的算法,即通过对生物学现象或机理的模仿构建和实现的多Agent系统计算模型.如遗传算法、协同遗传算法、蚁群算法、粒子群算法和群体智能算法等.为此,使用者一般可根据所选择的Agent结构形式来选择不同类型的多Agent系统控制与决策算法:对于认知型或混合型结构的 Agent较适合采用基于逻辑推理的算法来进行建模和计算;对于选取反应式结构的 Agent更适合采用基于生物进化或交互行为的算法来进行建模和计算,因为反应式Agent内部没有或很少具有逻辑推理能力,一般也不需要设有逻辑推理功能,而控制与决策任务的实现则主要是通过Agent之间的交互行为和群体决策来具体实现的.1.4 多Agent控制与决策输出在确定多Agent控制与决策算法之后,最后步骤就是根据多 Agent控制与决策算法的计算结果产生对智能机器的控制与决策行为,并通过智能机器上传动装置的硬件控制接口实现对智能机器的实际控制操作并可通过智能机器的运行轨迹输出来评价其性能.2 模型应用实例简介为了对基于自组织多Agent系统的智能控制与决策模型进行具体的应用实验测试,这里选取了车辆避撞问题作为该模型的一个典型应用实例和实验测试对象.此时,环境的定义是指智能车辆(一种智能机器)在其可识别范围内的行驶道路状况;环境的识别则是由装载在智能车辆上的各种传感器(摄像机、红外传感器、声纳传感器)具体完成的,并通过信息融合输入环境信息;在多 Agent控制与决策过程中,内部 Agent作为决策 Agent,而外部 Agent作为智能车辆在行驶过程中所遇到的各种障碍物 Agent,同时考虑到车辆避撞问题对响应时间要求较高且为了计算方便,这里选取经验数量(300个)的反应式 Agent并基于作用力的交互行为构建基于作用力机制(物理激励)的多Agent控制与决策算法并由其计算结果作为最后多Agent控制与输出的结果来控制智能车辆完成避撞任务.3 基于作用力机制的自组织多 Agent控制与决策算法基于作用力机制(物理激励)的自组织多 Agent控制与决策算法基本思想是通过模仿经典物理学中的万有引力定律,将内部 Agent(决策 Agent)与外部Agent(障碍物 Agent)的自组织交互过程转化为两者之间的相互作用力,并通过交互作用力的大小和方向体现多Agent之间的交互机制,其算法步骤如下:第 1步设定决策主体的数量n,对所有n个决策主体进行初始化(随机放置在n个不同的位置is,并对这些决策主体的属性参数值如质量 im、速度 iv、加速度 ia、识别范围r和R、能量Ei等参数分别设定).第 2步由外部传感器的接口对车辆行驶环境进行探测,将探测到的p个障碍物主体添加到自组织多Agent系统中(由传感器获取的信息自动设置障碍物主体的大小Ik,质量 Mk,位置 S k、速度 V k、加速度Ak、等属性参数值的大小),并循环执行第 3步~第4步.第 3步对所有n个决策主体循环执行以下操作:(1) 计算第i( i∈ [1 ,… ,n ])个决策主体与第k(k∈[1,…,p])个障碍物主体的排斥力向量;(2) 计算第i( i ∈ [1 ,… ,n ])个决策主体与其他 n-1个决策主体的排斥力向量;(3) 计算由操作(1)和(2)得到的排斥力合力向量 F i,并通过人为设定的外力向量(摩擦力向量对合力向量大小进行调整.(4) 根据操作(3)得到的合力向量 F i由牛顿力学公式( F i =mai)计算出第i( i ∈[1… n])个决策主体的加速度向量 ai,再由加速度向量 ai经离散积分得到其速度向量 v i和位置向量 s i,并计算出其能量的大小.第4步根据第3步结果计算出n个决策主体的平均位置向量和平均能量大小meanE =,并由它们的平均位置向量和前次的平均位置向量的差向量Δ sm ean计算出车辆此时(假定时间为 t)新的位置向量S ( t)(S ( t) = S ( t − 1)+ L Δ smean(t ),L为一个调整参数),并可通过硬件接口对车辆实施相应的避撞控制.第 5步若满足收敛条件Δ s mean(t) <ε(ε →0)或是Δ E m ean(t) <δ (δ → 0 ),则转向第 6步;否则,返回第2步继续对车辆行驶环境进行探测.第 6步根据第 4步对于车辆位置向量 S (t)的累计计算结果输出车辆避撞控制轨迹,从而实现最终的车辆控制与决策输出并可在其基础上进行评价.该算法是以自组织多 Agent系统中的多个内部Agent(决策 Agent)与外部Agent(障碍物)的交互作用力向量为基础,通过实时计算所有参与作用力交互的内部 Agent(决策 Agent)的合力向量计算出决策Agent的平均加速度向量,并进而计算出平均速度向量和平均位移向量,最后将决策Agent的平均位移向量作为智能车辆避撞控制与决策的修正向量来实时调整车辆的位置运行轨迹,从而满足车辆避撞问题的任务要求.这里需要说明的是,由第1步~第6步列出的自组织多 Agent智能控制与决策算法是以第 3步和第4步2个循环步骤为其核心计算步骤,其中第3步中操作(1)和(2)对应的2种排斥力计算方法如式(1)和式(2)所示.式中:FA i O k 为决策 Agent与障碍物 Agent之间基于排斥力交互机制的作用力向量;β为常数,β ∈ [ 0,1];mi 、M k分别为决策主体和障碍物主体的质量大小,mi >0,M k> 0 ;D为两者之间交互距离向量.因决策 Agent为同源主体,所以它们的参数设置相同,即质量 m i可统一简化为质量m表示;X k和 X i分别代表障碍物主体和决策主体之间的位置向量,它们的位置向量差Xk−Xi代表两者之间的距离向量,而X k −X i 则为它们之间的距离向量范数.式中:F A iA j 为决策 Agent之间基于排斥交互机制的作用力向量;α为常数,α ∈ [ 0,1];m i和 m j分别为任意 2个相互交互决策 Agent质量大小,m i> 0 ,m j> 0 ;d为两者之间的交互距离向量.因所有决策Agent都是同源主体,属性参数都相同,所以质量 m i统一简化为质量m表示.X j和 X i分别代表2个任意交互的决策Agent之间的位置向量,它们的位置向量差Xj−Xi代表了两者之间距离向量,而X j −Xi则为它们之间的距离向量范数.第3步中操作(3)中摩擦力Ffi 的计算式为式中:λ为自组织多Agent系统中人为设定的摩擦力系数,λ ∈ [ 0,1];vi为第i(i ∈ [1 ,… ,n ])个决策Agent的速度向量;F fi为人为设定的摩擦力向量,即人为设定的一个外力向量,目的是避免所有决策Agent不断发生位移导致系统难以控制的情况.第3步中操作(3)中合力向量 F i的计算式为式中:为第i(i ∈ [1 ,… ,n ])个决策Agent与其他n-1个决策 Agent之间排斥力向量和(即累计向量和,见式(2));∑ k FA iO k 为第i(i ∈ [1 ,… ,n ])个决策Agent与第k (k ∈ [1 ,… , p])个障碍物Agent之间排斥力向量和(即累计向量合,见式(1));Ffi为第i∈ [ 1,… ,n ]个决策Agent的摩擦力向量,而 F i为决策Agent Ai所受的合力向量.第3步中操作(4)是根据合力向量 F i并根据牛顿力学公式 F i =mai计算第i(i ∈ [1 ,… ,n ])个决策Agent的加速度向量 ai的过程,其计算式为特别是当环境中仅有一个障碍物 Agent与决策Agent交互作用时,式(5)则可简化为通过对式(5)和式(6)两边同时进行离散化积分可得到第i(i ∈ [1 ,… ,n ])个决策Agent的速度向量 vi和位置向量 si.同时,第i(i ∈ [1 ,… ,n ])个决策Agent的自身能量为第3步计算结束后,第4步是根据第3步的计算结果分别计算出所有 n个决策Agent的平均位置向量 means 和平均内部能量 meanE .平均位置向量 means 的计算式为平均内部能量 meanE 的计算式为第4步最终的智能车辆移动位置的计算式为此时,由式(10)可知,自组织多 Agent系统对智能车辆新的位置向量 ()tS 的计算是根据所有决策Agent随时间不断变化(假定时间为 t)平均位置向量差mean()tΔs(L为一个人为设定的调整参数)与前次车辆位置(1)t−S(时间为t-1)的累加向量.而最终的第 6步所给出的车辆避撞控制轨迹则是由 t时间内车辆位置向量 ()tS 得到的.4 模型参数设定及模拟实验测试为验证基于自组织多 Agent系统的智能控制与决策模型对车辆避撞问题的应用效果,对模型参数进行了设定,为计算方便,将决策 Agent和障碍物Agent的质量m和M均设为1,两者最大交互半径r和 R均为 100,交互距离向量分别为d和D,决策Agent之间排斥力因子α和β分别设为 0.2(根据经验设定),摩擦力因子λ设为0.07(根据经验设定),车辆位置调整参数因子L设为2,决策Agent的数量n设为300,障碍物Agent数量p设为1~3个(即分单个障碍物和多个障碍物情况).由设定的模型参数值和第 1步到第 6步中所给出的基于作用力交互机制的自组织多 Agent控制与决策算法以及计算式(1)~式(10),对固定和移动障碍物的车辆避撞问题进行了模拟实验测试,最终实验测试结果见图2和图3.图2 车辆避撞轨迹(1~3个固定障碍物)Fig.2 Vehicle collision avoidance trajectories(one to three fixed obstacles)图 2的测试实验结果是在车辆避撞模拟环境的中心位置分别放置 1个(单个固定障碍物,图中方框表示)、2个和 3个固定障碍物(多个固定障碍物,图中方框表示)的模拟测试情况.根据最终分别得到的对单个和多个固定障碍物的车辆避撞轨迹(星号线表示)可知采用基于自组织多Agent系统的智能控制与决策模型和基于交互作用力机制的多 Agent智能控制与决策算法能够使智能车辆有效地避开环境中的固定障碍物.图3的测试实验结果是在车辆避撞模拟环境中不同位置放置一个移动障碍物(移动的方框表示)的情况.该移动障碍物分别被放置在水平方向、垂直方向和对角线(斜线)方向进行测试:在坐标[0,50]沿水平向右方向和坐标[100,50]沿水平向左方向测试;在坐标[50,100]沿垂直向下方向测试(以 2种不同的速度);在坐标[0,100]沿对角线向右下方向和在坐标[100,100]沿对角线向左下方向测试.通过图2中对上述 3个不同方向移动障碍物的6条车辆避撞轨迹(星号线表示)可知,即使对于移动障碍物的情况,采用上述基于自组织多Agent系统的智能控制与决策模型和基于交互作用力机制的多Agent智能控制与决策算法同样可使智能车辆有效避开环境中的移动障碍物.5 模型的稳定性分析图 2和图 3的测试结果验证了模型的可行性和有效性.图4则对模型的稳定性进行了简单分析.图 4从自组织多 Agent系统的平均内部能量变化角度分析了模型的稳定性.将相应的模型参数值代入式(9)得到由图4的能量变化曲线可以看到,在决策Agent数量为300个时,平均内部能量值随着计算迭代次数的增加而不断降低,并在迭代次数超过 80次后趋于稳定,由此可知该基于自组织多Agent系统的智能控制与决策模型从能量角度上来看是具有稳定性的.图3 车辆避撞轨迹(1个移动障碍物)Fig.3 Vehicle collision avoidance trajectories(one moved obstacle)图4 自组织多Agent系统平均能量变化(Agent数目=300)Fig.4 Mean energy diagram of self-organizing multi-Agent system(Agent number=300)6 结语介绍了一种基于自组织多 Agent系统的控制与决策模型,该模型主要分为环境和自组织多Agent系统两大部分,其建模工作以环境的定义和识别为基础,并通过。
agent-based model发展历程
Agent-based model发展历程Agent-based model(ABM)是一种建模和仿真方法,它模拟各种智能代理(或“个体”)在特定环境中的行为和互动。
ABM在过去几十年中得到了广泛的发展和应用,其应用领域涵盖了经济学、生态学、社会学、地理学、计算机科学等多个学科。
本文将从ABM的起源和发展历程、理论基础、应用领域以及未来展望等方面进行全面评估和探讨。
1. 起源和发展历程ABM的理论起源可以追溯到20世纪40年代的元胞自动机(Cellular Automata),但真正的ABM模型出现在20世纪70年代的社会科学领域。
随着计算机技术的进步和对复杂系统研究的需求增加,ABM 逐渐受到学术界的关注并得到了快速发展。
1996年,美国著名社会学家约翰·霍尔因(John H. Holland)的《隐藏的秩序》一书将ABM的概念引入了更广泛的学术讨论中,为ABM的进一步发展奠定了理论基础。
2. 理论基础ABM的理论基础主要包括个体行为规则、相互作用关系和环境条件三个方面。
个体行为规则是指每个代理根据其内部状态和外部环境做出决策的规则,相互作用关系描述了不同代理之间的互动方式,环境条件则是指模拟的物理空间或社会空间的特征和约束。
这些理论基础构成了ABM模型的基本框架,使得模型能够更真实地模拟复杂系统中个体行为的动态变化。
3. 应用领域ABM已经被广泛应用于经济学、生态学、社会学、地理学等多个学科领域。
在经济学领域,ABM被用于研究市场竞争、金融风险和货币政策等诸多问题;在生态学领域,ABM被用于模拟自然资源利用、生态系统稳定性和物种演化等方面;在社会学和地理学领域,ABM被用于分析城市结构、人口迁移和文化传播等复杂社会现象。
这些应用说明了ABM在复杂系统研究中的重要作用,为学科交叉和跨学科研究提供了新的方法和工具。
4. 未来展望随着计算机技术的不断发展和对复杂系统研究需求的增加,ABM将会在未来得到更广泛的应用。
基于Agent的应急疏散模型研究
基于Agent的应急疏散模型研究褚龙现;刘高原【摘要】Studying the process of emergency evacuation, and through studying the nowadays microscopic models, a new evacuation simulation model based on Agent was proposed. With the introduction of several of factors, the model based on Agent can simulate evacuation dynamics. In this model, introduce a variety of factors in evacuation process, and simulate crowd dispersal state in real situation. Compared with modem models, it can be used for evacuation simulation of many kinds of emergencies, and optimize simulation results. So that evacuation efficiency and people's security in the process of evacuating can be guaranteed.%根据突发事件出现的等级,选择安全区域,并采用适当的疏散方式,选择受灾区域的周边安全区域作为避难所;通过分析影响应急情况下人员选择目的地的因素,对人员疏散行为直观分析并结合人机功效评估,对疏散行为规范,建立基于Agent的应急疏散人员避难所选择模型.通过设定可能影响人员疏散的多种可能因素,该模型能够比较真实地模拟紧急情况下的人员疏散状态.仿真过程与实际情况相似,方法可广泛用于人员应急疏散过程分析研究.【期刊名称】《计算机技术与发展》【年(卷),期】2011(021)009【总页数】4页(P201-203,207)【关键词】突发事件;疏散动态;人员疏散;Agent模型【作者】褚龙现;刘高原【作者单位】平顶山学院,河南平顶山467000;平顶山学院,河南平顶山467000【正文语种】中文【中图分类】U2980 引言随着世界各国逐步加快城市化进程,城市的规模也迅速扩大,随之就带来人口越来越稠密,各种城市突发事件呈明显上升的问题。
多主体模拟技术简介
多主体模拟技术简介多主体模拟(multi-agent simulation)是一种新兴的建模仿真技术,得到了各方面的关注,本章首先概述它的理论背景,而后简单介绍一种大型多主体微观模拟经济系统——Aspen,最后介绍在各种领域均取得了很好应用效果的通用多主体模拟软件平台——Swarm软件。
第一节多主体模拟的理论背景多主体模拟产生的理论背景是复杂适应系统理论的兴起和发展,它也是考察复杂适应系统的最主要手段。
一、复杂适应系统理论的由来复杂适应系统(Complex Adaptive System,简称CAS)产生于人们对复杂性的研究,而说到复杂系统的研究,就不能不提到圣达菲研究所(Santa Fe Institute)。
圣达菲研究所的创始人考恩(George Cowan)于1984年联合一大批各方面的专家对复杂性问题进行了讨论,包括诺贝尔经济学奖得主阿罗,诺贝尔物理学奖得主盖尔曼和安德森等等。
在此次会议上,各领域的专家找到共同的研究兴趣,也就是复杂系统。
在不同学科领域内均存在大量复杂系统,它们之间存在相当程度的相似性,然而以往还原论的科学研究思维难以对它们加以整体把握。
科学研究中存在的条块分割、缺少交流现象也使得人们难以综合各方面知识。
为此与会者一致同意设立圣达菲研究所,作为对复杂性的一个研究中心。
其特色是使各种差异极大的学科能开展共同研究,创建了一个包容性极强,不受传统的资金分配、成果认定体制约束的研究场所。
为此圣菲研究所吸引了全世界大量优秀的人才进入,从事短期的交流合作,成为新思想、新概念的发源点,而圣达菲研究所也在前不久被评为全美最优秀的5个研究所之一。
得益于这种研究环境,霍兰(J. Holland)于1994年圣达菲研究所成立10周年时的讨论会上首次提出了复杂适应系统的概念,他也是遗传算法(genetic algorithm)的创建者。
二、复杂适应系统的基本思想复杂适应系统的概念是从自然界和人类社会中各种复杂系统的观察而产生的一种概念,它的产生也得益于对以往科学研究实践中所遇到问题的反思。
心智模型综述
基于心智模型理论的网络分类理解机制研究(以电子商务商品搜索为例)文献综述心智模型来自国外的mental model,在国内也有其它多种翻译,使用较多的是心智模型、心智模式、心理模型、思维模型等,本文中统一采用“心智模型”的叫法。
心智模型影响我们看待周边世界的方式,从而决定我们采取何种行动。
因为这些“想法”都存在我们的心中,影响我们的行为,所以称为“心智”;过去的经验形成我们看问题的角度,它不易察觉,不易改变,故成为“模型”[1]。
1 心智模型基本概念1.1 心智模型定义心智模型(Mental Model)概念最早是由苏格兰心理学家Kenneth Craik 在1943 年提出,用以表示一个系统的内部表征(internal representations),指那些在人们心中根深蒂固存在的,影响人们认识世界、解释世界、面对世界,以及如何采取行动的许多假设、陈见和印象[2]。
白新文等指出,心智模型的研究主要在人类工效学和认知科学(特别是认知心理学)这两个领域进行[3],但从现有研究看,心智模型已经扩展到许多学科领域。
下面就列举几个学科,从各领域研究角度解释什么是心智模型。
1.1.1 认知心理学自从Craik(1943)第一次提出心智模型这一概念起,认知心理学很多学者就对其投入了较大关注。
大多数心理学家将心智模型当作理解人类感知、认识、决策以及构建行为的一种重要途径,与其它学科相比,对它的关注主要集中在大脑推理与概念发展上,更为从个人内心和知识状况来阐释。
个人知识的局限性、个人不能完全作出准确的预期以及个人行为受到限制。
因此,个人在决策时依赖于心理过程。
诺斯等人将这种心理过程称为心智模型,并将之定义为用于解释环境的内部表征,它由人的认知系统为应对环境的不确定性而创立[4]。
文献[4]Luria(1973)指出,心智模型介于知觉和行为之间,是最高的知识表征模式[5]。
Williams(1983)认为心智模型,也称为“知识结构”,是一些相互关联的心理对象的集合,是它们与其它对象相互关系状态,以及一系列内部因素的外显表征[6]。
Agent仿真技术在科技政策决策支持中的应用
基金项 目:广 东高校优秀青年创新人才培养计划项 目资助 ( M0 10 WY 9 1 ) 项 目来源 :广 东技术师范学院科研基金项 目 ( D N 0 1 G 12 1 )
赵剑冬等 :A et gn 仿真技术 在科技政 策决策支持 中的应用
17 5
1 人 工社 会建模 思路
基 于 复 杂 适 应 系统 视 角 对 产 业 集 群 进 行 分 析 , 产业集群 中的行为主体主要包 括政府 、行 业协会 、 企 业 、金 融 机 构 、培 训 机 构 、技 术 中 心 、高 校 等 , 在 仿真 模 型 中分别 对应 一类 型 A et gn。产业 集 群 中企 业 具有 自主的决 策 行 为 ,据 集 群 内外 的环 境 变 化 不 断 改变 自身 的行 为 策 略 ,来 适 应 新 的生 态 位 。高 科 技 产业 集群 中企 业 最重 要 的 决 策行 为是 技 术 创 新 行 为 ,除 此外包 括 产 品推 广 和销 售 行 为 ,另 外 集 群 中 的企业处 于 社会 网络 中,企业 与 企业 之 间 还 存 在 技 术扩 散行 为 。对 应 地 ,仿 真模 型必 须 对 企 业 的 各种 行为 进行模 拟 ,仿真模 型参 数体 现 了产 业集 群 环境 。 仿真模型中的企业 A et gn 根据环境参 数的变化不断 调整 自己的行为。同时调整仿 真模型环境变量参数 的时 候 ,企业 A et gn 的行 为 以及 企 业 之 间技 术 扩 散 行 为 也会 发生变 化 。 基 于以上 分 析 ,对科 技 政 策 的决 策 支 持 问题 转 化为什 么 样 的产 业 集 群 环 境 有 利 于 企 业 技 术 创 新 ? 由于我们 比较难识别什么样 的产业集群环境适合于 企业技术创新 ,所 以借鉴博弈论的思想 ,我们是模 拟 两组 企业 分别 是 创 新 型企 业 和 非 创新 型企 业 同时 在 产业 集群 进行 软 件 服 务 ,仿 真 开始 的 时候 两 组 企 业 的企 业 的总 数 、员 工 总数 、平 均技 术 积 累 、平 均 流动资金这些衡量指标都是一样 的,创新 型企业每 个 仿真周 期 投入一定 资金 进行研 发 等技 术 创新 行 为 , 如果 成 功的话 在 一定 研 发 周 期后 获 得 一 定 的创 新 回 报 ,而非创新型则不投入资金进行技术创新。仿真 模 型运行 若 干仿真周 期 ( 例如模 拟 1 )后 ,根 据 0年 衡量 指标 来 比较 两 组 企业 的生 产 经 营 现 状 ,如 果 创 新型企业各项指标都优 于非创新企业各项指标 ,那 就说 明这样 的环境更 有利 于产业 集 群企 业技 术 创新 , 否 则相反
基于深度学习的代理模型在实际气藏三维模拟中的应用
第29卷第1期油气地质与采收率Vol.29,No.12022年1月Petroleum Geology and Recovery EfficiencyJan.2022—————————————收稿日期:2021-10-08。
作者简介:秦峰(1972—),女,山东滕州人,高级工程师,硕士,从事油气田开发工程工作。
E-mail :*****************.cn 。
文章编号:1009-9603(2022)01-0152-08DOI :10.13673/37-1359/te.2022.01.019基于深度学习的代理模型在实际气藏三维模拟中的应用秦峰1,闫正和1,唐圣来1,罗睿乔1,龚斌2(1.中海石油(中国)有限公司深圳分公司,广东深圳518000;2.中国地质大学(武汉)资源学院,湖北武汉430074)摘要:应用基于深度学习的代理模型进行油气藏模拟是油气藏仿真研究的一个新方向。
针对高精度全阶油气藏模拟速度慢的问题,采用一种基于深度学习的嵌入式控制框架(E2C ,Embed to Control )模型,通过“编码器+线性转化模型+解码器”的架构构建深度学习网络,将原始时刻的压力场、饱和度场数据与井控约束条件相结合来演化出新时刻的场数据。
以南海东部番禺35-1气田为例,测试E2C 模型与传统数值模拟器模拟结果的差别。
测试结果显示E2C 模型误差较小,其中饱和度场的相对误差小于5%,压力场的平均相对误差为8%;在相同的CPU 条件下,E2C 模型运行100次算例时间为16s ,比传统数值模拟器(运行时间为6000s )快375倍。
实际应用结果表明E2C 模型在保证模拟精度的条件下可以大幅度提升模拟速度。
关键词:深度学习;嵌入式控制框架模型;代理模型;井控条件;气藏模拟中图分类号:TE319+.2文献标识码:AApplication of agent models based on deep learning inactual three-dimensional gas reservoir simulationQIN Feng 1,YAN Zhenghe 1,TANG Shenglai 1,LUO Ruiqiao 1,GONG Bin 2(1.Shenzhen Branch ,CNOOC China Limited ,Shenzhen City ,Guangdong Province ,518000,China ;2.School ofEarth Resources ,China University of Geosciences (Wuhan ),Wuhan City ,Hubei Province ,430074,China )Abstract :The application of agent models based on deep learning is a new direction of oil and gas reservoir simulation.Given the huge time cost of high-precision full-order oil and gas reservoir simulation ,this paper adopts an Embed to Con⁃trol (E2C )model to construct a deep learning network through the architecture of “encoder+linear converter+decoder ”.Data of the pressure field and saturation field at the original moment are integrated with well control constraints to generate the field data at a new moment.The PY35-1Gas Field in the east of the South China Sea is discussed as an example to test thedifferences between the simulation results of the E2C model and those of the traditional numerical simulator.The test re⁃sults show that the E2C model has smaller errors ,with a relative error in the saturation field of less than 5%and an average relative error in the pressure field of 8%.Under the same CPU ,the E2C model takes 16s to run 100cases ,which is 375times faster than the traditional numerical simulator (the time cost is 6000s ).In conclusion ,the E2C model can greatly re⁃duce the time cost under the condition of ensuring simulation precision.Key words :deep learning ;E2C model ;agent model ;well control constraint ;gas reservoir simulation数值模拟技术目前已是大型油气藏开发决策常用的辅助分析手段之一[1-5],然而由于控制方程的非线性性质和地质描述的多尺度特性,油气藏模型包含了复杂的渗流机理和巨量网格,当模型应用于优化、不确定性量化和数据同化时可能需要运行数千次模拟计算[6-9],这样模型的计算成本极高。
3.北大版《公共管理研究方法》公共管理研究中的理论建构与理论检验
四、理论的范围和层次
理论由概念构成,概念外延所涵盖的范围即理论的范围。理论 范围和层次是从概念的内涵、外延的角度对理论属性所做的描 述。 1.宏观理论和微观理论。 2.实质理论与形式理论。
实质理论(substantive theory)是指出对某 个特定领域的社会关注而发展出的理论。例如 帮派、罢工、离婚或种族关系。 形式理论(formal theory)则是针对一般理论 内某个广泛的概念而发展出来的理论。例如越 轨、社会化或权力。
三、诠释性解释
诠释性解释(interpretive explanation) 旨在促进人们对意义、价值、文化、文本、 精神的理解。诠释性解释是诠释主义方法论 流派主张的理解方式,这种方式主张将待理 解的现象纳入特定社会情境中,阐发特定现 象的意义。
第三节 公共管理研究中的理论建构
一、理论建构的基石 二、理论建构的框架 三、理论建构的过程与方法 四、理论建构的评价标准
第三章 公共管理研究中的理论建 构与理论检验
第三章 公共管理研究中的理论建构与理 论检验
第一节 第二节 第三节 第四节 理论和公共管理理论概述 公共管理研究中的理论解释 公共管理研究中的理论建构 公共管理研究中的理论检验
第一节 理论和公共管理理论概述
一、理论和公共管理理论的定义 二、理论和公共管理理论的特点 三、理论和公共管理理论的构成 四、理论的范围和层次 五、理论的功能
五、理论的功能
1.理论的描述功能。 2.理论的解释功能。 3.理论的预测功能。 4.理论的批判功能。 5.理论的改造功能。
第二节 公共管理研究中的理论解释
一、因果解释 二、结构解释 三、诠释解释
一、因果解释
agent-based model发展历程
agent-based model发展历程Agent-based model(ABM)是一种模拟和分析复杂系统行为的计算模型。
它基于个体代理的行为规则和相互作用,通过模拟个体之间的动态交互,可以研究和预测整个系统的发展和演化。
本文将回顾ABM的发展历程,并探讨其在不同领域的应用。
ABM的发展可以追溯到上世纪40年代的约翰·冯·诺依曼(John von Neumann)和斯坦尼斯拉夫·乌拉姆(Stanislaw Ulam)的细胞自动机(Cellular Automata)理论。
细胞自动机是一种离散空间和离散时间的模型,代表了一种由离散的细胞组成的系统,每个细胞根据一定的规则与周围的细胞交互。
这种思想为ABM的发展奠定了基础。
随着计算机技术的进步,20世纪80年代,ABM开始成为复杂系统研究的重要工具。
ABM的一个重要特点是可以考虑个体差异和异质性,对系统的行为和演化进行真实而细致的建模。
ABM模型可以通过调整个体代理的行为规则和相互作用关系来研究系统的不同状态和演变趋势。
它可以从微观层面揭示系统的宏观行为,帮助我们理解和解释复杂系统的现象和规律。
在社会科学领域,ABM被广泛应用于研究人类行为和社会系统。
例如,经济学家使用ABM模型来研究市场竞争、资本流动和经济稳定性。
政治学家利用ABM来模拟选民行为、政府决策和社会动态。
社会学家使用ABM来研究群体行为、文化传播和社交网络。
ABM在这些领域的应用为我们提供了一种全新的研究方法,可以更好地理解和预测人类行为和社会系统的运作方式。
此外,ABM还在生态学、生物学和环境科学等领域得到了广泛应用。
生态学家使用ABM来研究物种的扩散、生物多样性的维持和生态系统的稳定性。
生物学家利用ABM模拟生物体的进化和适应性。
环境科学家使用ABM来研究能源利用、自然资源管理和环境政策的效果。
ABM在这些领域的应用有助于我们理解和管理复杂生态系统和环境问题。
自混合干涉效应
⾃混合⼲涉效应⾃混合⼲涉效应在振动测量中的应⽤现状摘要:近年来,随着半导体激光器技术的不断发展,利⽤半导体激光器的⾃混合⼲涉效应进⾏物理量的测量,成为近代光学⼲涉测量技术中⼀门具有潜⼒的新兴学科。
本⽂将会对⾃混合⼲涉系统在振动测量中的应⽤情况进⾏分析。
⾸先将会对⾃混合⼲涉的发展历程进⾏介绍,然后重点介绍基于⾃混合⼲涉理论的振动测量⽅法,⽂章中将会介绍条纹计数法、正弦相位调制⽅法,并分析它们在振动测量中的优势和不⾜之处。
关键词:半导体激光器;⾃混合⼲涉;光反馈;振动测量;1 引⾔激光⾃混合⼲涉效应指的是在激光测量中,激光器发出的光被外部物体反射或散射[1],部分光反馈会与激光器腔内光相混合,引起激光器的输出功率、频率发⽣变化,引起输出的功率信号与传统的双光束⼲涉信号类似,所以被称为⾃混合⼲涉(self-mixing interference)[2]。
1963年,King⾸次报道了⾃混合⼲涉现象[3],发现⼀个可移动的外部反射镜可以引起激光输出功率的变化,⽽且这种波动条纹类似于传统的双光束⼲涉现象。
King的研究奠定了⾃混合⼲涉理论的基础,⽽同时与传统的⼲涉技术相⽐,它克服了光路复杂、不易准直调整等诸多缺点,因其只存在⼀条光路,结构紧凑,易准直等特点,同时还能实现⾼精度的测量,引起研究学者的⼴泛关注,⾃混合技术得以快速发展[4]。
⾃混合⼲涉技术现如今已经被⼴泛应⽤于距离、位移、速度、振动等⽅⾯的测量。
2 激光⾃混合⼲涉技术的发展历程对⾃混合⼲涉现象的初期研究主要是对激光强度波动⽅⾯的研究,由于信号类似于传统的双光束⼲涉信号,因此研究者⼤多借⽤传统⼲涉理论去解释⾃混合⼲涉现象,但是当由弱光反馈⽔平拓宽到适度光反馈⽔平时,观察到的现象已不同于传统的⼲涉信号,这些不同于常理的现象不断吸引研究学者们深⼊研究其机理[5]。
1980年,/doc/2642ab1f05087632301212c3.html ng和K.Kobayashi认为可以将激光器和外反射体作为复合腔激光器,考虑了外腔运动反馈的影响,修正了半导体激光器的速率⽅程,从理论上分析了激光器的稳态特性和动态特性,特别是带外腔的单模激光器可以存在多稳态并出现迟滞现象[6]。
分数阶多机器人的领航-跟随型环形编队控制
第38卷第1期2021年1月控制理论与应用Control Theory&ApplicationsV ol.38No.1Jan.2021分数阶多机器人的领航–跟随型环形编队控制伍锡如†,邢梦媛(桂林电子科技大学电子工程与自动化学院,广西桂林541004)摘要:针对多机器人系统的环形编队控制复杂问题,提出一种基于分数阶多机器人的环形编队控制方法,应用领航–跟随编队方法来控制多机器人系统的环形编队和目标包围,通过设计状态估测器,实现对多机器人的状态估计.由领航者获取系统中目标状态的信息,跟随者监测到领航者的状态信息并完成包围环绕编队控制,使多机器人系统形成对动态目标的目标跟踪.根据李雅普诺夫稳定性理论和米塔格定理,得到多机器人系统环形编队控制的充分条件,实现对多机器人系统对目标物的包围控制,通过对一组多机器人队列的目标包围仿真,验证了该方法的有效性.关键词:分数阶;多机器人;编队控制;环形编队;目标跟踪引用格式:伍锡如,邢梦媛.分数阶多机器人的领航–跟随型环形编队控制.控制理论与应用,2021,38(1):103–109DOI:10.7641/CTA.2020.90969Annular formation control of the leader-follower multi-robotbased on fractional orderWU Xi-ru†,XING Meng-yuan(School of Electronic Engineering and Automation,Guilin University of Electronic Technology,Guilin Guangxi541004,China) Abstract:Aiming at the complex problem of annular formation control for fractional order multi robot system,an an-nular formation control method based on fractional order multi robot is proposed.The leader follower formation method is used to control the annular formation and target envelopment of the multi robot systems.The state estimation of multi robot is realized by designing state estimator.The leader obtains the information of the target state in the system,the followers detects the status of the leader and complete annular formation control,the multi-robot system forms the target tracking of the dynamic target.According to Lyapunov stability theory and Mittag Leffler’s theorem,the sufficient conditions of the annular formation control for the multi robot systems are obtained in order to achieve annular formation control of the leader follower multi robot.The effectiveness of the proposed method is verified by simulation by simulation of a group of multi robot experiments.Key words:fractional order;multi-robots;formation control;annular formation;target trackingCitation:WU Xiru,XING Mengyuan.Annular formation control of the leader-follower multi-robot based on fractional order.Control Theory&Applications,2021,38(1):103–1091引言近年来,随着机器人技术的崛起和发展,各式各样的机器人技术成为了各个领域不可或缺的一部分,推动着社会的发展和进步.与此同时,机器人面临的任务也更加复杂,单个机器人已经无法独立完成应尽的责任,这就使得多机器人之间相互协作、共同完成同一个给定任务成为当前社会的研究热点.多机器人系统控制的研究主要集中在一致性问题[1]、多机器人编队控制问题[2–3]、蜂拥问题[4–5]等.其中,编队控制问题作为多机器人系统的主要研究方向之一,是国内外研究学者关注的热点问题.编队控制在生活生产、餐饮服务尤其是军事作战等领域都发挥着极大的作用.例如水下航行器在水中的自主航行和编队控制、军事作战机对空中飞行器的打击以及无人机在各行业的应用等都是多机器人编队控制上的用途[6–7].目前,多机器人编队控制方法主要有3种,其中在多机器收稿日期:2019−11−25;录用日期:2020−08−10.†通信作者.E-mail:****************;Tel.:+86132****1790.本文责任编委:黄攀峰.国家自然科学基金项目(61603107,61863007),桂林电子科技大学研究生教育创新计划项目(C99YJM00BX13)资助.Supported by the National Natural Science Foundation of China(61603107,61863007)and the Innovation Project of GUET Graduate Education (C99YJM00BX13).104控制理论与应用第38卷人系统编队控制问题上应用最广泛的是领航–跟随法[8–10];除此之外,还有基于行为法和虚拟结构法[11].基于行为的多机器人编队方法在描述系统整体时不够准确高效,且不能保证系统控制的稳定性;而虚拟结构法则存在系统灵活性不足的缺陷.领航–跟随型编队控制法具有数学分析简单、易保持队形、通信压力小等优点,被广泛应用于多机器人系统编队[12].例如,2017年,Hu等人采用分布式事件触发策略,提出一种新的自触发算法,实现了线性多机器人系统的一致性[13];Zuo等人利用李雅普诺夫函数,构造具有可变结构的全局非线性一致控制律,研究多机器人系统的鲁棒有限时间一致问题[14].考虑到分数微积分的存储特性,开发分数阶一致性控制的潜在应用具有重要意义.时中等人于2016年设计了空间遥操作分数阶PID 控制系统,提高了机器人系统的跟踪性能、抗干扰性、鲁棒性和抗时延抖动性能[15].2019年,Z Yang等人探讨了分数阶多机器人系统的领航跟随一致性问题[16].而在多机器人的环形编队控制中,对具有分数阶动力学特性的多机器人系统的研究极其有限,大部分集中在整数阶的阶段.而采用分数阶对多机器人系统目标包围编队控制进行研究,综合考虑了非局部分布式的影响,更好地描述具有遗传性质的动力学模型.使得系统的模型能更准确的反映系统的性态,对多机器人编队控制的研究非常有利.目标包围控制问题是编队控制的一个分支,是多智能体编队问题的重点研究领域.随着信息技术的高速发展,很多专家学者对多机器人系统的目标包围控制问题进行了研究探讨.例如,Kim和Sugie于2017年基于一种循环追踪策略设计分布式反馈控制律,保证了多机器人系统围绕一个目标机器人运动[17].在此基础上,Lan和Yan进行了拓展,研究了智能体包围多个目标智能体的问题,并把这个问题分为两个步骤[18]. Kowdiki K H和Barai K等人则研究了单个移动机器人对任意时变曲线的跟踪包围问题[19].Asif M考虑了机器人与目标之间的避障问题,提出了两种包围追踪控制算法;并实现了移动机器人对目标机器人的包围追踪[20].鉴于以上原因,本文采用了领航–跟随型编队控制方法来控制多机器人系统的环形编队和目标包围,通过设计状态估测器,实现对多机器人的状态估计.系统中目标状态信息只能由领航者获取,确保整个多机器人系统编队按照预期的理想编队队形进行无碰撞运动,并最终到达目标位置,对目标、领航者和跟随者的位置分析如图1(a)所示,图1(b)为编队控制后的状态.通过应用李雅普诺夫稳定性理论,得到实现多机器人系统环形编队控制的充分条件.最后通过对一组多机器人队列进行目标包围仿真,验证了该方法的有效性.(a)编队控制前(b)编队控制后图1目标、领航者和追随者的位置分析Fig.1Location analysis of targets,pilots and followers2代数图论与分数阶基础假定一个含有N个智能体的系统,通讯网络拓扑图用G={v,ε}表示,定义ε=v×v为跟随者节点之间边的集合,v={v i,i=1,2,···,N}为跟随者节点的集合.若(v i,v j)∈ε,则v i与v j为相邻节点,定义N j(t)={i|(v i,v j)∈ε,v i∈v}为相邻节点j的标签的集合.那么称第j个节点是第i 个节点的邻居节点,用N j(t)={i|(v i,v j)∈ε,v i∈v}表示第i个节点的邻居节点集合.矩阵L=D−A称为与图G对应的拉普拉斯矩阵.其中:∆是对角矩阵,对角线元素i=∑jN i a ij.若a ij=a ji,i,j∈I,则称G是无向图,否则称为有向图.如果节点v i与v j之间一组有向边(v i,v k1)(v k1,v k2)(v k2,v k3)···(v kl,v j),则称从节点v i到v j存在有向路径.定义1Riemann-Liouville(RL)分数阶微分定义:RLD atf(t)=1Γ(n−a)d nd t ntt0f(τ)(t−τ)a−n+1dτ,(1)其中:t>t0,n−1<α<n,n∈Z+,Γ(·)为伽马函数.定义2Caputo(C)分数阶微分定义:CDαtf(t)=1Γ(n−α)tt0f n(τ)(t−τ)α−n+1dτ,(2)其中:t>t0,n−1<α<n,n∈Z+,Γ(·)为伽马第1期伍锡如等:分数阶多机器人的领航–跟随型环形编队控制105函数.定义3定义具有两个参数α,β的Mittag-Leffler方程为E α,β(z )=∞∑k =1z kΓ(αk +β),(3)其中:α>0,β>0.当β=1时,其单参数形式可表示为E α,1(z )=E α(z )=∞∑k =1z kΓ(αk +1).(4)引理1[21]假定存在连续可导函数x (t )∈R n ,则12C t 0D αt x T (t )x (t )=x T (t )C t 0D αt x (t ),(5)引理2[21]假定x =0是系统C t 0D αt x (t )=f (x )的平衡点,且D ⊂R n 是一个包含原点的域,R 是一个连续可微函数,x 满足以下条件:{a 1∥x ∥a V (t ) a 2∥x ∥ab ,C t 0D αt V (t ) −a 3∥x ∥ab,(6)其中:t 0,x ∈R ,α∈(0,1),a 1,a 2,a 3,a,b 为任意正常数,那么x =0就是Mittag-Leffler 稳定.3系统环形编队控制考虑包含1个领航者和N 个跟随者的分数阶非线性多机器人系统.领航者的动力学方程为C t 0D αt x 0(t )=u 0(t ),(7)式中:0<α<1,x 0(t )∈R 2是领航者的位置状态,u 0(t )∈R 2是领航者的控制输入.跟随者的动力学模型如下:C t 0D αt x i (t )=u i (t ),i ∈I,(8)式中:0<α<1,x i (t )∈R 2是跟随者的位置状态,u i (t )∈R 2是跟随者i 在t 时刻的控制输入,I ={1,2,···,N }.3.1领航者控制器的设计对于领航者,选择如下控制器:u 0(t )=−k 1(x 0(t )−˜x 0(t ))−k 2sgn(x 0(t )−˜x 0(t )),(9)C t 0D αt x 0(t )=u 0(t )=−k 1(x 0(t )−˜x 0(t ))−k 2sgn(x 0(t )−˜x 0(t )).(10)设计一个李雅普诺夫函数:V (t )=12(x 0(t )−˜x 0(t ))T (x 0(t )−˜x 0(t )).(11)根据引理1,得到该李雅普诺夫函数的α阶导数如下:C 0D αt V(t )=12C 0D αt (x 0(t )−˜x 0(t ))T (x 0(t )−˜x 0(t )) (x 0(t )−˜x 0(t ))TC 0D αt (x 0(t )−˜x0(t ))=(x 0(t )−˜x 0(t ))T [C 0D αt x 0(t )−C 0D αt ˜x0(t )]=(x 0(t )−˜x 0(t ))T [−k 1(x 0(t )−˜x 0(t ))−k 2sgn(x 0(t )−˜x 0(t ))−C 0D αt ˜x0(t )]=−k 1(x 0(t )−˜x 0(t ))T (x 0(t )−˜x 0(t ))−k 2∥x 0(t )−˜x 0(t )∥−(x 0(t )−˜x 0(t ))TC 0D αt ˜x0(t )=−2k 1V (t )−k 2∥x 0(t )−˜x 0(t )∥+∥C 0D αt ˜x0(t )∥∥x 0(t )−˜x 0(t )∥=−2k 1V (t )−(k 2−∥C 0D ∝t ˜x0(t )∥)∥x 0(t )−˜x 0(t )∥ −2k 1V (t ).(12)令a 1=a 2=12,a 3=2k 1,ab =2,a >0,b >0,得到a 1∥x 0(t )−˜x 0(t )∥a V (t ) a 2∥x 0(t )−˜x 0(t )∥ab ,(13)C t 0D αt V(t ) −a 3∥x 0(t )−˜x 0(t )∥ab .(14)根据引理2,可知lim t →∞∥x 0(t )−˜x 0(t )∥=0,即x 0(t )逐渐趋近于˜x 0(t ).为了使跟随者能够跟踪观测到领航者的状态,设计了一个状态估测器.令ˆx i ∈R 2是追随者对领航者的状态估计,给出了ˆx i 的动力学方程C 0D αt ˆx i=β(∑j ∈N ia ij g ij (t )+d i g i 0(t )),(15)其中g ij =˜x j (t )−˜x i (t )∥˜x j (t )−˜x i (t )∥,˜x j (t )−˜x i (t )=0,0,˜x j (t )−˜x i (t )=0.(16)对跟随者取以下李雅普诺夫函数:V (t )=12N ∑i =1(ˆx i (t )−x 0(t ))T (ˆx i (t )−x 0(t )).(17)计算该函数的α阶导数如下:C 0D αt V(t )=12C 0D αtN ∑i =1(ˆx i (t )−x 0(t ))T (ˆx i (t )−x 0(t )) N ∑i =1(ˆx i (t )−x 0(t ))TC 0D αt (ˆx i (t )−x 0(t ))=N ∑i =1(ˆx i (t )−x 0(t ))T [C 0D αt ˆxi (t )−C 0D αt x 0(t )]=N ∑i =1(ˆx i (t )−x 0(t ))T [β(∑j ∈N ia ijˆx j (t )−ˆx i (t )∥ˆx j (t )−ˆx i (t )∥+d iˆx 0(t )−ˆx i (t )∥ˆx 0(t )−ˆx i (t )∥)−C 0D αt x 0(t )]=N ∑i =1(ˆx i (t )−x 0(t ))T β(∑j ∈N i a ij ˆx j (t )−ˆx i (t )∥ˆx j (t )−ˆx i(t )∥+106控制理论与应用第38卷d iˆx 0(t )−ˆx i (t )∥ˆx 0(t )−ˆx i (t )∥)−N ∑i =1(ˆx i (t )−x 0(t ))TC 0D αt x 0(t )=βN ∑i =1(ˆx i (t )−x 0(t ))T ∑j ∈N i a ij ˆx j (t )−ˆx i (t )∥ˆx j (t )−ˆx i (t )∥+βN ∑i =1(ˆx i (t )−x 0(t ))Td i ˆx 0(t )−ˆx i (t )∥ˆx 0(t )−ˆx i(t )∥−N ∑i =1(ˆx i (t )−x 0(t ))TC 0D αt x 0(t ).(18)在上式中,令C 0D αt V (t )=N 1+N 2以方便后续计算,其中:N 1=βN ∑i =1(ˆx i (t )−x 0(t ))T ∑j ∈N i a ij ˆx j (t )−ˆx i (t )∥ˆx j (t )−ˆx i (t )∥+βN ∑i =1(ˆx i (t )−x 0(t ))Td i ˆx 0(t )−ˆx i (t )∥ˆx 0(t )−ˆx i (t )∥=β2[N ∑i =1N ∑j =1a ij (ˆx i (t )−x 0(t ))T ˆx j (t )−ˆx i (t )∥ˆx j (t )−ˆx i (t )∥+N ∑j =1N ∑i =1a ij (ˆx j (t )−x 0(t ))Tˆx i (t )−ˆx j (t )∥ˆx i (t )−ˆx j (t )∥]−βN ∑i =1d i∥ˆx 0(t )−ˆx i (t )∥2∥ˆx 0(t )−ˆx i (t )∥=β2N ∑i =1N ∑j =1a ij [(ˆx i (t )−x 0(t ))Tˆx j (t )−ˆx i (t )∥ˆx j (t )−ˆx i (t )∥−(ˆx j (t )−x 0(t ))T ˆx i (t )−ˆx j (t )∥ˆx i (t )−ˆx j (t )∥]−βN ∑i =1d i∥ˆx 0(t )−ˆx i (t )∥2∥ˆx 0(t )−ˆx i (t )∥=β2N ∑i =1N ∑j =1a ij [ˆx T i(t )ˆx j (t )−ˆx i (t )∥ˆx j (t )−ˆx i (t )∥−x T 0(t )ˆx j (t )−ˆx i (t )∥ˆx j (t )−ˆx i (t )∥−ˆx T j(t )ˆx i (t )−ˆx j (t )∥ˆx i (t )−ˆx j (t )∥+x T0(t )ˆx i (t )−ˆx j (t )∥ˆx i (t )−ˆx j (t )∥]−βN ∑i =1d i ∥ˆx 0(t )−ˆx i (t )∥=β2N ∑i =1N ∑j =1a ij [ˆx T i (t )ˆx j (t )−ˆx i (t )∥ˆx j (t )−ˆx i (t )∥−ˆx T j (t )ˆx i (t )−ˆx j (t )∥ˆx i (t )−ˆx j (t )∥]−βN ∑i =1d i ∥ˆx 0(t )−ˆx i (t )∥2∥ˆx 0(t )−ˆx i (t )∥=β2N ∑i =1N ∑j =1a ij (ˆx T i(t )−ˆx Tj (t ))ˆx j (t )−ˆx i (t )∥ˆx j (t )−ˆx i (t )∥−βN ∑i =1d i ∥ˆx 0(t )−ˆx i (t )∥2∥ˆx 0(t )−ˆx i (t )∥=−β(12N ∑i =1N ∑j =1a ij (ˆx T j (t )−ˆx T i (t ))׈x j (t )−ˆx i (t )∥ˆx j (t )−ˆx i (t )∥+N ∑i =1d i ∥ˆx 0(t )−ˆx i (t )∥2∥ˆx 0(t )−ˆx i (t )∥),(19)N 2=−N ∑i =1(ˆx i (t )−x 0(t ))TC 0D αt x 0(t )=N ∑i =1∥ˆx i (t )−x 0(t )∥∥C 0D αt x 0(t )∥×cos {ˆx i (t )−x 0(t ),−C 0D αt x 0(t )}.(20)由于∥C 0D αt x 0(t )∥k 1∥x 0(t )−˜x 0(t )∥+k 2∥sgn(x 0(t )−˜x 0(t ))∥ k 1∥x 0(t )−˜x 0(t )∥+k 2.(21)根据定义3,当lim t →∞∥x 0(t )−˜x 0(t )∥=0时,存在T >0(T 为实数),使得在t >T 时∥x 0(t )−˜x 0(t )∥ ε成立,那么对于t >T ,有0<∥C 0D αt x 0(t )∥ k 1ε+k 2=M 2,可得−N ∑i =1(ˆx i (t )−x 0(t ))TC 0D αt x 0(t )N ∑i =1∥ˆx i (t )−x 0(t )∥M 2M 2N max {∥ˆx i (t )−x 0(t )∥},(22)C 0D αt V(t ) −(β−M 2N )max i ∈I{∥ˆx i (t )−x 0(t )∥}−2β1λmin V (t ).(23)根据引理2,得lim t →∞∥ˆx i (t )−x 0(t )∥=0.(24)由上式可知,ˆx i (t )在对目标的追踪过程中逐渐趋近于x 0(t ).3.2跟随者控制器的设计在本文中,整个多机器人系统中领导者能够直接获得目标的位置信息,将这些信息传递给追随者,因此需要为每个追随者设计观测器来估计目标的状态.令ϕi (t )∈R 2由跟随者对目标i 的状态估计,给出ϕi (t )的动力学方程C 0D αt ϕi(t )=α(∑j ∈N ia ij f ij (t )+d i f i 0(t )),(25)其中f ij =ϕj (t )−ϕi (t )∥ϕj (t )−ϕi (t )∥,ϕj (t )−ϕi (t )=0,0,ϕj (t )−ϕi (t )=0.(26)取如下李雅普诺夫函数:V (t )=12N ∑i =1(ϕi (t )−r (t ))T (ϕi (t )−r (t )).(27)计算α阶导数如下:C 0D αt V(t )=第1期伍锡如等:分数阶多机器人的领航–跟随型环形编队控制10712N ∑i =1(ϕi (t )−r (t ))T (ϕi (t )−r (t )) N ∑i =1(ϕi (t )−r (t ))TC 0D αt (ϕi (t )−r (t ))=N ∑i =1(ϕi (t )−r (t ))T [C 0D αt ϕi (t )−C 0D αt r (t )]=N ∑i =1(φi (t )−r (t ))T [α(∑j ∈N ia ij f ij (t )+d i f i 0(t ))]−C 0D αt r (t )=N ∑i =1(ϕi (t )−r (t ))T α(∑j ∈N ia ij ϕj (t )−ϕi (t )∥ϕj (t )−ϕi (t )∥+d i ϕ(t )−ϕi (t )∥ϕ(t )−ϕi (t )∥)=βN ∑i =1(ϕi (t )−r (t ))T ∑j ∈N i a ijϕj (t )−ϕi (t )∥ϕj (t )−ϕi(t )∥+βN ∑i =1(ϕi (t )−r (t ))T d i ϕ(t )−ϕi (t )∥ϕ(t )−ϕi(t )∥−N ∑i =1(ϕi (t )−r (t ))TC 0D αt r (t ),(28)可得lim t →∞∥x i (t )−˜x i (t )∥=0.(29)由上式可知,x i (t )在对目标的追踪过程中逐渐趋近于˜x i (t ).4仿真结果与分析本节通过仿真结果来验证本文所提出的方法.图2为通信图,其中:V ={1,2,3,4}表示跟随者集合,0代表领导者.以5个机器人组成的队列为例进行验证,根据领航者对目标的跟随轨迹,分别进行了仿真.图2通信图Fig.2Communication diagrams假设系统中目标机器人的动态为C 0D αt r (t )=[cos t sin t ]T ,令初始值r 1(0)=r 2(0)=1,α=0.98,k 1=1,k 2=4,可知定理3中的条件是满足的.根据式(24)和式(29),随着时间趋于无穷,领航者及其跟随者的状态估计误差趋于0,这意味着领航者的状态可以由跟随者渐近精确地计算出来.令k 2>M 1,M 1=M +M ′>0,则lim t →∞∥x 0(t )−˜x 0(t )∥=0,x 0渐近收敛于领航者的真实状态.此时取时滞参数µ=0.05,实验结果见图3,由1个领航者及4个跟随者组成的多机器人系统在进行目标围堵时,最终形成了以目标机器人为中心的包围控制(见图3(b)).(a)领航者和跟随者的初始位置分析(b)编队形成后多机器人的位置关系图3目标、领航者和追随者的位置分析Fig.3Location analysis of target pilots and followers综合图4–5曲线,跟随者对领航者进行渐进跟踪,领航者同目标机器人的相对位置不变,表明该领航跟随型多机器人系统最终能与目标机器人保持期望的距离,并且不再变化.图4领航者及其跟随者的状态估计误差Fig.4The state estimation error of the leader and followers108控制理论与应用第38卷图5编队形成时领航者与目标的相对位置关系Fig.5The relative position relationship between leader andtarget仿真结果表明,多个机器人在对目标物进行包围编队时,领航者会逐渐形成以目标物运动轨迹为参照的运动路线,而跟随者则渐近的完成对领航者的跟踪(如图6所示),跟随者在对领航者进行跟踪时,会出现一定频率的抖振,但这些并不会影响该多机器人系统的目标包围编队控制.5总结本文提出了多机器人的领航–跟随型编队控制方法,选定了一台机器人作为领航者负责整个编队的路径规划任务,其余机器人作为跟随者.跟随机器人负责实时跟踪领航者,并尽可能与领航机器人之间保持队形所需的距离和角度,确保整个多机器人系统编队按照预期的理想编队队形进行无碰撞运动,并最终到达目标位置.通过建立李雅普诺夫函数和米塔格稳定性理论,得到了实现多机器人系统环形编队的充分条件,并通过对一组多机器人队列的目标包围仿真,验证了该方法的有效性.图6领航者与跟随者对目标的状态估计Fig.6State estimation of target by pilot and follower参考文献:[1]JIANG Yutao,LIU Zhongxin,CHEN Zengqiang.Distributed finite-time consensus algorithm for multiple nonholonomic mobile robots with disturbances.Control Theory &Applications ,2019,36(5):737–745.(姜玉涛,刘忠信,陈增强.带扰动的多非完整移动机器人分布式有限时间一致性控制.控制理论与应用,2019,36(5):737–745.)[2]ZHOU Chuan,HONG Xiaomin,HE Junda.Formation control ofmulti-agent systems with time-varying topology based on event-triggered mechanism.Control and Decision ,2017,32(6):1103–1108.(周川,洪小敏,何俊达.基于事件触发的时变拓扑多智能体系统编队控制.控制与决策,2017,32(6):1103–1108.)[3]ZHANG Ruilei,LI Sheng,CHEN Qingwei,et al.Formation controlfor multi-robot system in complex terrain.Control Theory &Appli-cations ,2014,31(4):531–537.(张瑞雷,李胜,陈庆伟,等.复杂地形环境下多机器人编队控制方法.控制理论与应用,2014,31(4):531–537.)[4]WU Jin,ZHANG Guoliang,ZENG Jing.Discrete-time modeling formultirobot formation and stability of formation control algorithm.Control Theory &Applications ,2014,31(3):293–301.(吴晋,张国良,曾静.多机器人编队离散模型及队形控制稳定性分析.控制理论与应用,2014,31(3):293–301.)[5]WANG Shuailei,ZHANG Jinchun,CAO Biao.Target tracking al-gorithm with double-type agents based on flocking control.Control Engineering of China ,2019,26(5):935–940.(王帅磊,张金春,曹彪.双类型多智能体蜂拥控制目标跟踪算法.控制工程,2019,26(5):935–940.)[6]SHAO Zhuang,ZHU Xiaoping,ZHOU Zhou,et al.Distributed for-mation keeping control of UA Vs in 3–D dynamic environment.Con-trol and Decision ,2016,31(6):1065–1072.(邵壮,祝小平,周洲,等.三维动态环境下多无人机编队分布式保持控制.控制与决策,2016,31(6):1065–1072.)[7]PANG Shikun,WANG Jian,YI Hong.Formation control of multipleautonomous underwater vehicles based on sensor measuring system.Journal of Shanghai Jiao Tong University ,2019,53(5):549–555.(庞师坤,王健,易宏.基于传感探测系统的多自治水下机器人编队协调控制.上海交通大学学报,2019,53(5):549–555.)[8]WANG H,GUO D,LIANG X.Adaptive vision-based leader-followerformation control of mobile robots.IEEE Transactions on Industrial Electronics ,2017,64(4):2893–2902.[9]LI R,ZHANG L,HAN L.Multiple vehicle formation control basedon robust adaptive control algorithm.IEEE Intelligent Transportation Systems Magazine ,2017,9(2):41–51.[10]XING C,ZHAOXIA P,GUO G W.Distributed fixed-time formationtracking of multi-robot systems with nonholonomic constraints.Neu-rocomputing ,2018,313(3):167–174.[11]LOPEZ-GONZALEA A,FERREIRA E D,HERNANDEZ-MAR-TINEZ E G.Multi-robot formation control using distance and ori-entation.Advanced Robotics ,2016,30(14):901–913.[12]DIMAROGONAS D,FRAZZOLI E,JOHNSSON K H.Distributedevent-triggered control for multi-agent systems.IEEE Transactions on Automatic Control ,2019,57(5):1291–1297.[13]HU W,LIU L,FENG G.Consensus of linear multi-agent systems bydistributed event-triggered strategy.IEEE Transactions on Cybernet-ics ,2017,46(1):148–157.第1期伍锡如等:分数阶多机器人的领航–跟随型环形编队控制109[14]ZUO Z,LIN T.Distributed robustfinite-time nonlinear consensusprotocols for multi-agent systems.International Journal of Systems Science,2016,47(6):1366–1375.[15]SHI Zhong,HUANG Xuexiang,TAN Qian.Fractional-order PIDcontrol for teleoperation of a free-flying space robot.Control The-ory&Applications,2016,33(6):800–808.(时中,黄学祥,谭谦.自由飞行空间机器人的遥操作分数阶PID控制.控制理论与应用,2016,33(6):800–808.)[16]YANG Z C,ZHENG S Q,LIU F.Adaptive output feedback con-trol for fractional-order multi-agent systems.ISA Transactions,2020, 96(1):195–209.[17]LIU Z X,CHEN Z Q,YUAN Z Z.Event-triggered average-consensusof multi-agent systems with weighted and directed topology.Journal of Systems Science and Complexity,2016,25(5):845–855.[18]AI X L,YU J Q.Flatness-basedfinite-time leader-follower formationcontrol of multiple quad rotors with external disturbances.Aerospace Science and Technology,2019,92(9):20–33.[19]KOWDIKI K H,BARAI K,BHATTACHARYA S.Leader-followerformation control using artificial potential functions:A kinematic ap-proach.IEEE International Conference on Advances in Engineering.Tamil Nadu,India:IEEE,2012:500–505.[20]ASIF M.Integral terminal sliding mode formation control of non-holonomic robots using leader follower approach.Robotica,2017, 1(7):1–15.[21]CHEN W,DAI H,SONG Y,et al.Convex Lyapunov functions forstability analysis of fractional order systems.IET Control Theory& Applications,2017,11(7):1070–1074.作者简介:伍锡如博士,教授,硕士生导师,目前研究方向为机器人控制、神经网络、深度学习等,E-mail:***************.cn;邢梦媛硕士研究生,目前研究方向为多机器人编队控制,E-mail: ****************.。
呈展现象
S2
S1
e1
e
i 2
e
i1
Josephson 效应:相位的深刻含义
J J 0 sin(1 2 ); J J 0 sin( 0 2e V0 t ), t 2 eV0
用两个Josephson 结可做成 SQUID
I max 2 I c cos(2 / 0 ), 0 hc / 2e
更多是不同的
··将万事万物还原成简单的基本规律,并不蕴含着从这些 ·· ·· 规律出发重建宇宙的能力·· ·· ·· 面对尺度与复杂性的双重困难,重建论的假定就崩溃了。 不能依据少数粒子的性质作简单外推来解释由大量粒子构 成的复杂集聚体的行为。正好相反,在复杂性的每一个层 次会呈现全新的性质,为理解这些新行为所需要作的研究, 就其基础性而言,与其他研究相比毫不逊色。
“X”科学研究的“元件”由 “Y” 科学描述, 但不能说:“X” 是 “Y” 的应用 “X”
凝聚态/多体物理 化学 分子生物学 细胞生物学
“Y”
微观粒子物理 凝聚态/多体物理 化学 分子生物学 ……
心理学 社会科学
……
生理学 心理学
从水的三态变化说起
100° C 水沸腾成蒸汽 0° C 水冻结成冰
铁磁体-旋转对称破缺
超导体的宏观波函数- 序参量 (Landau) e i
被多次“发明”的平均场理论
(P (
N V
) 2 a )(V Nb ) NkT
1873 范德瓦耳斯状态方程;1907 外斯分子场理论;1934 布喇格-威廉姆斯合金有序化理论;1937朗道二类相变 “普遍”理论··· ·· ··
2 2; ( 1) 2
一种结合效用的Agent思维状态模型
100029825 2000 11(11)1522205○c2000Journal of Softw are 软件学报V o l.11,N o.11一种结合效用的Agen t思维状态模型Ξ徐晋晖, 石纯一(清华大学计算机科学与技术系,北京 100084)E2m ail:xujinhui@h ttp: 摘要:建立A gent思维状态模型是A gent理论研究的一个重要课题.结合效用提出一种A gent思维状态模型BD I CU(belief desire intenti on com bined w ith utility),使A gent的行为具有逻辑理性和决策理性,为副作用问题提供了解决方法.同时,给出目标和意图的生成和更新规则.BD I CU模型改进和扩充了R ao和Geo rgeff的信念2期望2意图理论,为逻辑和效用理性A gent系统提供了实现支持.关键词:A gent;思维状态;信念;目标;意图;效用;可能世界中图法分类号:T P18 文献标识码:AA gent的理论研究普遍基于一种“意向姿态(intenti onal stance)”的观点,把人类行为过程中的信念、能力、意图、承诺等心智成分引入A gent的研究中,来刻画和描述A gent的概念和特征,改变了经典A I研究中所采用的单纯模拟人类的知识表示与推理能力的研究模式[1~3].Cohen和L evesque[4]首先进行了思维状态模型的研究,提出基本模态算子Bel,Goal,H appens,Done的模态逻辑系统,意图作为一个导出概念加以定义,分析了A gent的信念、目标、规划、意图、承诺间理性平衡以及意图的作用.进而,R ao和Geo rgeff[5,6]给出BD I模型,建立了BD I解释器,讨论了承诺性质.Kono lige和Po llack[7]针对副作用问题,以非正规模态逻辑作为描述工具,建立了一个关于意图的形式化系统.L inder[8]试图给出统一的形式化框架来研究动机类别的A gent认识状态,并提出A gent效用理性研究的想法.但是,上述对思维状态模型的研究还存在3个问题:(1)理论与实现的脱离问题,原因是可能世界过于抽象,难以在现实模型中找到对应的映射,以致于实现的A gent系统不能符合所给的理论[9];(2)思维状态模型没有考虑决策理性,而把决策的过程体现在具体的实现中,使得逻辑与实现脱节[8];(3)副作用问题,这是由正规模态逻辑的逻辑全知问题所导致的,虽然有的模型给出了部分解决方法[7],但尚未满意地加以解决.本文针对以上问题给出了一种结合效用的思维状态模型BD I CU(belief desire intenti on com bined w ith utili2 ty),在语言上给出了决策所涉及的参数的刻画,在语义解释模型中引入了两个可能世界之间的变化值和实现变化代价度量函数,使得逻辑理性和效用理性结合起来.概括R ao和Geo rgeff所给出的公理分析了BD I CU,建立了带效用限制的KU公理,使副作用问题可以得到避免.另外,从实现角度分析了目标和意图的生成以及更新问题.1 非形式化分析理性A gent要不断地进行决策行为,必然涉及效用问题[9,10].效用可以通过行为的代价和行为所导致的A gent状态改变的收益来求得,这样,依代价和收益就可以刻画A gent的决策过程.Ξ收稿日期:1999201207;修改日期:1999209203基金项目:国家自然科学基金资助项目(69773026;69733020);教育部高等学校重点实验室访问学者基金资助项目;清华大学博士学位论文基金资助项目作者简介:徐晋晖(1966-),男,山西人,博士,主要研究领域为多A gent系统;石纯一(1935-),男,河北人,教授,博士生导师,主要研究领域为人工智能应用基础.作为A gent 的思维状态成分信念、目标和意图等,应该有对于代价和收益的心理刻画.例1:我相信我将成为一个科学家.我想成为一个科学家.我打算成为一个科学家.我作为一个A gent 相信、想和打算自己成为一个科学家,同时对于成为一个科学家的代价和收益是有一个心理评判的,并且这种评判指导我的行为.例2:我执行成为一个科学家的行为.对于这样的一个行为,如何去评价其理性应从两个角度来进行:(1)这种行为是逻辑理性的,即我相信是可能的同时自己有这样的目标,就是现有思维状态模型刻画的理性;(2)这种行为是决策理性的,即这种行为在所有可能的行为中(因为可能存在多个逻辑理性的行为,如:成为一个政治家,成为一个企业家等)效用是极大的.我们在A gent 的思维状态模型BD I 中引入一个二元组bc ,来描述对应的代价和收益,以BEL (A ,Υ,bc ),GOAL (A ,Υ,bc ),I N T END (A ,Υ,bc )表示.BD I 对应的语义解释是可能世界模型,在可能世界中存在一种可达关系.从一个可能世界到另一个可能世界需要执行相应的动作,而这种动作需要A gent 对应的资源消耗,同时,A gent 进入不同的可能世界会产生状态上的改变.例3:目前的A gent 可能世界是学生,下一个可达的可能世界是科学家.从学生世界到科学家世界,A gent 要作出各种努力,这就是可能世界变化的代价,处于科学家和学生世界对应的价值是不同的.为了给出BEL (A ,Υ,bc ),GOAL (A ,Υ,bc ),I N T END (A ,Υ,bc )中bc 的语义解释,我们将可能世界之间存在的可能世界变化的代价和价值引入到解释模型中.对于副作用问题,我们以一个研究BD I 常引用的例子来加以说明.例4:知道拔牙会导致痛苦,这样,如果有拔牙的意图,就会有痛苦的意图.这是明显不符合A gent 理性的,如果一个模型纯粹考虑逻辑的理性,这个问题则是不可避免的,因为副作用本质上是一个符合逻辑理性的公式,但并不符合效用理性.如果结合效用理性的观点,可以得知痛苦的效用是很低的,这样,即使采纳了拔牙的意图,也不会采纳痛苦的意图.可见,要想解决副作用问题,有必要引入效用理性的考虑.2 形式化模型BD I CU 是在R ao 和Geo rgeff 的BD I 模型的基础上结合效用的一种扩充,下面的描述延用了有关符号,我们仅对扩充之处加以说明.2.1 语 言定义1.B C 是一个二元组集合.元素bc =(b ,c ),其中b 表示收益,c 表示代价.效用函数U 是B C →R 的映射.效用函数U 通常满足5U 5b >0和5U 5c <0约束,也就是说,效用随收益的增大而增大,随代价的变小而增大.新增加的状态公式如定义2(其他的公式与已有的公式一致).定义2.如果Υ是一个状态公式且bc ∈B C ,那么BEL (A ,Υ,bc ),GOAL (A ,Υ,bc ),I N T END (A ,Υbc )是状态公式.2.2 语 义定义3.一个解释模型M =〈W ,B ,D ,I ,5,RB ,R C 〉.其中W 是可能世界集合,B ,D ,I 分别是信念、愿望和意图可达关系,函数RB :W ×W →R 度量可能世界的价值变化量;函数R C :W ×W →R 度量可能世界之间可达的代价,5是原子命题的真值函数.对应于BEL (A ,Υ,bc ),GOAL (A ,Υ,bc ),I N T END (A ,Υ,bc )的语义解释如下:〈M ,v ,w 〉4BEL (A ,Υ,bc )当且仅当Πw ′∈B (w ),〈M ,v ,w ′〉4Υ且RB (w ′,w )≥b 且R C (w ′,w )≤c .—3251—徐晋晖等:一种结合效用的A gent 思维状态模型〈M ,v ,w 〉4GOAL (A ,Υ,bc )当且仅当Πw ′∈D (w ),〈M ,v ,w ′〉4Υ且RB (w ′,w )≥b 且R C (w ′,w )≤c .〈M ,v ,w 〉4I N T END (A ,Υ,bc )当且仅当Πw ′∈I (w ),〈M ,v ,w ′〉4Υ且RB (w ′,w )≥b 且R C (w ′,w )≤c .b ,c 分别是对应的w 的信念(目标、意图)可达世界集合B (w )(G (w ),I (w ))中状态改变的最小值和改变所花费代价的最大值.如果在给定b ,c 的情况下,则对于所有w 信念(目标、意图)可达的世界w ′可能有〈M ,v ,w ′〉4Υ,但是不满足其他两个条件,我们可以将全部满足的那些可能世界称为效用信念(目标、意图)可达的世界,分别记为B U ,GU ,IU ,这样便有下面的性质1.性质1.B U (w )ΑB (w ),DU (w )ΑD (w ),IU (w )ΑI (w ).BEL (Υ,bc ),GOAL (Υ,bc )和I N T END (Υ,bc )为真,当且仅当所对应的解释中,3个与条件里有1个不成立.3 有关公理3.1 模型性质公理根据通常的约定BEL 满足KD 45系统公理,GOAL 和I N T END 满足KD 系统公理,在BD I CU 中,BEL ,不含bc 的GOAL 和不含bc 的I N T END 公式符合以上的公理.但是,对于含有bc 的GOAL 和I N T END 公式满足带效用阈值限制的公理KU .定义4.效用阈值AU 是A gent 作出决策时的最低效用值.通常地,不同的A gent 有不同的AU ,并且一个A gent 在不同的条件下会有不同的AU .公理1(KU 公理).GOAL (A ,P →Q ,(U (bc 1)≥AU )∧U (bc 2)≥AU )))→(GOAL (A ,P ,bc 1)→GOAL (A ,Q ,bc 2)),(1)I N T END (A ,P →Q ,(U (bc 1)≥AU )∧(U (bc 2)≥AU )))→(I N T END (A ,P ,bc 1)→I N T END (A ,Q ,bc 2)).(2)bc 1和bc 2分别是P 和Q 的效用描述,KU 公理是指A gent 如果以P 作为目标(意图),那么Q 也成为A gent 的目标(意图)是有条件的,也就是说,对应的效用不能小于该A gent 的效用阈值AU .利用该公理可以避免副作用问题.用例4来说明,有GOAL (A ,拔牙→牙痛,(U (拔牙的bc 1≥AU ∧U (牙痛的bc 2)<AU )),这样,即使有GOAL (A ,拔牙,bc 1),但是不能有GOAL (A ,牙痛,bc 2).对于I N T END 的解释类似.推论1.由GOAL (A ,P →Q )不能推出(GOAL (A ,P ,bc 1))→GOAL (A ,Q ,bc 2)),由I N T END (A ,P →Q )不能推出(I N T END (A ,P ,bc 1))→I N T END (A ,Q ,bc 2)).3.2 BEL ,G OAL 和I NTEND 关系公理根据R ao 和Geo rgeff 给出的有关公理,我们可以得到以下类似的公理.公理2(信念2目标相容公理).GOAL (A ,Υ,bc )]BEL (A ,Υ,bc ).公理3(目标2意图相容公理).I N T END (A ,Υ,bc )]GOAL (A ,Υ,bc ).公理4(关于意图的信念公理).I N T END (A ,Υ,bc )]BEL (I N T END (A ,Υ,bc )).公理5(关于意图的目标公理).I N T END (A ,Υ,bc )]GOAL (I N T END (A ,Υ,bc )).公理6(意图放弃公理).I N T END (A ,Υ,bc )]inevitabl ◇ (I N T END (A ,Υ,bc )).4 模型实现分析根据R ao 和Geo rgeff 给出的BD I 解释器:BD I Interp reterinitialize -state ();doop ti ons ∶=op ti on -generato r (event -queue ,B ,G ,I );selected -op ti ons ∶=deliberate (op ti ons ,B ,G ,I );update -intenti ons (selected -op ti ons ,I );—4251—J ou rnal of S of t w are 软件学报 2000,11(11)execute (I );get -new -external -events ();drop -successful -attitudes (B ,G ,I );drop -i m po ssible -attitudes (B ,G ,I );until quit 可以发现,在一个思维状态模型的具体实现过程中,核心问题是:信念、目标和意图的生成与更新.对于这些问题,R ao 和Geo rgeff 在有关逻辑理性的基础研究中给出了分析,这里,我们结合逻辑理性和效用理性来加以描述.关于信念的处理可以参考有关文献,本文着重于目标和意图方面.4.1 目标的生成与更新目标一般是指当前未成立,并且相信将来会成立的命题.这样,则有:目标生成规则.如果一个A gent 对于Υ知道目前不成立,相信将来成立,并且Υ的实现所带来的效用大于等于其效用阈值,那么A gent 可以将Υ作为其目标.BEL (A ,Υ)∧BEL (A ,inevitabl Υ,bc )∧(U (bc )≥AU )]GOAL (A ,Υ,bc ).这样,A gent 不是将所有当前未成立,并且将来会成立的命题都作为目标,而是要满足效用阈值.目标冲突消解规则.如果一个A gent 有两个冲突的目标,那么选择效用大的目标,删除效用小的目标.GOAL (A ,Υ,bc 1)∧GOAL (A , ,bc 2)∧(U (bc 1)>U (bc 2))]GOAL (A ,Υ,bc 1).目标冲突有显式和隐式冲突两种,显式冲突即 =Υ;隐式冲突是指两个目标不能同时执行,或者一个目标的实现导致另一个目标不能实现.目标持续规则.A gent 有一个目标直到相信目标成立,或该目标必然不能实现,或即使可以实现但是效用值低于效用阈值.GOAL (A ,Υ,bc )]inevitabl [GOAL (A ,Υ,bc )U ntil (BEL (A ,Υ)∨(BEL (A ,inevitablΥ)∨(BEL (A ,Υ,bc )∧(U (bc )<AU ))].4.2 意图的生成与更新意图是对于目标的承诺,意图的生成依赖于是否有实现目标的规划.一个规划是一棵由行为或子目标节点构成的树.一个A gent 有一个实现目标Υ的规划PL 可以用H as -PLAN (A ,PL ,Υ,c )来描述,其中c 是对应规划的代价,关于其对应的语义解释见文献[11].意图生成规则.如果一个A gent 有目标,并且有对应的规划,且规划的代价小于等于目标预期的代价.GOAL (A ,Υ,bc )∧BEL (A ,H as -PLAN (A ,PL ,Υ,c 1))∧(c 1≤c )]I N T END (A ,Υ,bc ).规划选择规则.如果A gent 有两个可以实现目标Υ的规划,那么选择代价小的规划.H as -PLAN (A ,PL 1,Υ,c 1)∧H as -PLAN (A ,PL 2,Υ,c 2))∧(c 1≤c 2)]H as -PLAN (A ,PL 1,Υ,c 1).意图持续是指A gent 何时重新考虑承诺的目标,R ao 和Geo rgeff 给出3种不同的承诺策略,粗略地描述了不同性格的A gent .本文结合效用给出意图持续规则.意图持续规则.A gent 有一个意图直到相信其实现,或对应的目标不存在,或没有可以完成该目标的规划.I N T END (A ,Υ,bc )]inevitable [I N T END (A ,Υ,bc )U ntil (BEL (A ,Υ)V GOAL (A ,Υ,bc )V H as -P lan (A ,PL ,Υ,c ))].目标不存在通过目标持续规则确定,没有规划是指规划库中无规划,或者有规划但是代价大于意图的代价.5 结 语R ao 和Geo rgeff [5,6]建立的思维状态模型,可以刻画A gent 的逻辑理性,但是难以刻画效用理性,也难以解决模态逻辑固有的副作用问题,所给出的实现模型忽略了效用在目标和意图产生中的作用.L inder [8]提出应建立逻辑理性和效用理性的思维状态模型,但是没有给出具体的工作.S .K raus [10]只是从效用理性的观点出发分析A gent 的行为过程,没有结合思维状态研究逻辑理性问题.Cohen 和L evesque [4],Kono lige 和Po llack [7]虽然建—5251—徐晋晖等:一种结合效用的A gent 思维状态模型立了对应的思维状态模型,但是没有给出实现的考虑.本文在R ao 和Geo rgeff 工作的基础上,提出了结合效用的思维状态模型BD I CU ,实现了逻辑理性和效用理性的结合,保证了A gent 行为的逻辑理性和决策理性.为副作用问题的解决提供了方法.结合模型的实现,给出了符合逻辑和效用的目标和意图的生成以及更新规则.BD I CU 模型对R ao 和Geo rgeff 的信念2期望2意图理论进行了改进和扩充,解决了副作用问题和单纯的逻辑理性的片面性,为逻辑和效用理性A gent 系统提供了实现支持.以BD I CU 模型作为支持,所提出的A gent 之间的社会承诺建立机制[12]验证了该模型的优点.References :[1] W oo ldridge,M.,Jennings,N.R.Intelligent agents:theo ry and p ractice .Know ledge Engineering R eview ,1995,10(2):115~152.[2] Shoham ,Y .A gent 2O riented p rogramm ing .A rtificial Intelligence ,1993,60(1):51~92.[3] M a ,Guang 2w ei ,Xu ,J in 2hui ,Sh i ,Chun 2yi.A bout the m ental state model fo r A gent .Journal of Softw are ,1999,10(4):342~348(in Ch inese ).[4] Cohen ,P .R .,L evesque ,H .J .Intenti on is cho ice w ith comm itm ent .A rtificial Intelligence ,1990,43(223):213~261.[5] R ao ,Geo rgeff .M odeling rati onal A gents w ith in a BD I 2arch itecture .In :A llen ,J .,F ikes ,R .,Sandew all ,W eds .P rinci p les of Know ledge R ep resentati on and R easoning .San M ateo ,CA :M o rgan Kaufm ann Publishers ,Inc .,1991.473~484.[6] R ao ,Geo rgeff .A n abstract arch itecture fo r rati onal A gents .In :N ebel ,B .,R ich ,C .,Sw artout ,W eds .P rinci p les ofKnow ledge R ep resentati on and R easoning .San M ateo ,CA :M o rgan Kaufm ann Publishers ,Inc .,1992.439~449.[7] Kono lige ,K .,Po llack ,M .E .A rep resentati onalisty theo ry of intenti on .In :Bajcsy ,R ed .P roceedings of the 13th In 2ternati onal Jo int Conference on A rtificial Intelligence .San M ateo ,CA :M o rgan Kaufm ann Publishers ,Inc .,1993.390~395.[8] L inder ,B .V .,der Hock ,W .V .,Ch .M eyer ,J .J .Fo r m alising mo tivati onal attitudes of A gents on p reference ,goalsand comm itm ents .In :W oo ldridge ,M .,M uller ,J .P .,T am be ,M eds .Intelligent A gent :A gent T heo ries ,A rch i 2tectures ,and L anguages .Berlin :Sp ringer 2V erlag ,1996.17~32.[9] W oo ldridge,M.T h is is M Y W ORLD:the logic of an agent 2o riented DA I testbed .In:W oo ldridge,M.,Jennings,N.R eds .Intelligent A gents ——P roceedings of the ECA I’94W o rk shop on A gent T heo ries ,A rch itectures ,and L an 2guages .Berlin :Sp ringer 2V erlag ,1995.160~178.[10] K raus ,S .A n overview of incentive contracting .A rtificial Intelligence ,1996,83(3):297~346.[11] H addadi ,A .S .Comm unicati on and Cooperati on in A gent System s .Berlin :Sp ringer 2V erlag ,1996.1~134.[12] Xu ,J in 2hui ,Sh i ,Chun 2yi .O ne m echanis m of social comm itm ent based on belief 2desire 2intenti on and utility .Journal ofSoftw are ,1999,10(8):829~834(in Ch inese ).附中文参考文献:[3] 马光伟,徐晋晖,石纯一.A gent 思维状态模型.软件学报,1999,10(4):342~348.[12] 徐晋晖,石纯一.一种基于信念2期望2意图和效用的社会承诺机制.软件学报,1999,10(8):829~834.A M odel of M en ta l Sta tes Com b i ned w ith Util ity for Agen tsXU J in 2hui , SH I Chun 2yi(D ep a rt m en t of Co mp u ter S cience and T echnology ,T sing hua U n iversity ,B eij ing 100084,Ch ina )E 2m ail :xujinhui @h ttp: www.tsinghua .edu .cnR eceived January 7,1999;accep ted Sep tem ber 3,1999Abstract : It is an i m po rtant subject to build the model of m ental states fo r A gents in the theo retic research of agent .A model BD I CU (belief desire intenti on com bined w ith utility )of m ental states com bined w ith utility is p resented in th is paper ,w h ich guarantees agent’s acti on w ith rati onal logic and decisi on ,the p roblem of side effect w ith a so luti on is p rovided ,and the rules fo r p roducting and updating goal and intenti on are also p resent 2ed .T h is model modifies and extends R ao and Geo rgeff’s Belief 2D esire 2Intenti on theo ry ,and p rovides rati onal agent system s w ith i m p lem enting suppo rt on logic and utility .Key words : agent ;m ental state ;belief ;goal ;intenti on ;utility ;po ssible w o rld —6251—J ou rnal of S of t w are 软件学报 2000,11(11)。
可形变光学超构表面及其动态调控
可形变光学超构表面及其动态调控洪孝荣 陈珊珊 李家方Deformable optical metasurfaces with dynamic reconfigurationHONG Xiao-rong, CHEN Shan-shan, LI Jia-fang引用本文:洪孝荣,陈珊珊,李家方. 可形变光学超构表面及其动态调控[J]. 中国光学, 2021, 14(4): 867-885. doi: 10.37188/CO.2021-0036 HONG Xiao-rong, CHEN Shan-shan, LI Jia-fang. Deformable optical metasurfaces with dynamic reconfiguration[J]. Chinese Optics, 2021, 14(4): 867-885. doi: 10.37188/CO.2021-0036在线阅读 View online: https:///10.37188/CO.2021-0036您可能感兴趣的其他文章Articles you may be interested in超颖表面原理与研究进展The principle and research progress of metasurfaces中国光学. 2017, 10(5): 523 https:///10.3788/CO.20171005.0523电磁编码超材料的理论与应用Theory and application of coding metamaterials中国光学. 2017, 10(1): 1 https:///10.3788/CO.20171001.0001表面等离子体平面金属透镜及其应用Planar plasmonic lenses and their applications中国光学. 2017, 10(2): 149 https:///10.3788/CO.20171002.0149光学卫星在轨动态场景实时匹配方法及试验On-orbit dynamic scene real-time matching method and experiment of optical satellite中国光学. 2019, 12(3): 575 https:///10.3788/CO.20191203.0575石墨烯太赫兹波动态调制的研究进展Recent progress in terahertz dynamic modulation based on graphene中国光学. 2017, 10(1): 86 https:///10.3788/CO.20171001.0086动态测量的高光谱图像压缩感知Hyperspectral image compression sensing based on dynamic measurement中国光学. 2018, 11(4): 550 https:///10.3788/CO.20181104.0550第 14 卷 第 4 期中国光学Vol. 14 No. 4 2021年7月Chinese Optics Jul. 2021文章编号 2095-1531(2021)04-0867-19可形变光学超构表面及其动态调控洪孝荣1,2,陈珊珊1,2,李家方1,2 *(1. 北京理工大学 物理学院 教育部先进光电量子结构设计与测量重点实验室,北京 100081;2. 北京理工大学 物理学院 北京市纳米光子学与超精密光电系统重点实验室,北京 100081)摘要:经过近10年的发展,超构表面作为一种新型的二维人工微纳结构,在光场特性调控方面展现出了巨大的研究潜力。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
搜集数据
中国某城市(eg. 北京)2004年的房价分布数据;分别计算2000年至 2008年某城市(eg. 北京)各收入阶层家庭收入增长率的平均值
建立基于agent的 居住分类模型
Agent-based Model的动态机制 Gini系数——度量经济不平等程度
二 、 研 究 路 线 图
经济分割的度量
No
一块地B被一致随机 的选择
四、经济分割程度的度量——经济不平等程度
用基尼系数度量模型参数对经济不平等程度的影响,
0.7 0.6 0.5
基尼系数
0.4 0.3 0.2 0.1 0 0 20 40 60 80 100
0
0.01
0.02
0.03
0.04
0.05
年数
研究结果表明:资本增长是导致经济不平等的主要因素,人口迁移是否频繁对经济不平等相对影响较小, 但是也增加了经济不平等的程度。
化发展到一定程度后,住房购买力的不同会产生 居住分类现象,而居住分类将进一去10年中,我国的保障性住房建设主要采取 “集中、成片建设经济适用住房小区和廉租住房 小区”的发展模式。 发达国家公共住房的 发展经历表明,公共住 房政策也会加速居住分 类,富人逐渐搬出了公 共住房社区,在长期引 发贫困集中、经济分割 等很多社会问题。
空间差异指数——度量经济分割程度
测试在不同情况下的居住分类过程
分析模拟结果,提出政策建议
三、Agent-based Model——基本图景
模型建立在65×65个格子的拓扑结构中,每个格子代表一个家庭居 住的土地面积。
三、Agent-based Model——基本图景
北京未来会不 会出现经济分 割现象?
三、Agent-based Model——基本图景
一次迭代开始 Yes
No
一块地A被一致随机的 选择
如果B位置比A位置更 加理想,房价亦在可支 付能力范围内,则移入
Yes A是否空置? 如果B空置? No Yes
拥有一定数量资本的 一个新家庭以较小的 可能性进入
占有A地块的家庭 以较小的概率移出
移出
• 美国解决公共住房问题的办法
HOPE VI计划 住房选择代金券计划 低收入住房税收优惠证
基于Agent-based Model的城市 经济分割问题研究
报告人: 闫 妍 中国科学院研究生院 管理学院
一、研究背景
1998年住房商品化后,住房购买力成为家庭能否 获得理想住房的决定性因素,收入阶层相近的家 庭趋向于居住在一起,打破了原来以各企事业单 位的住宅区为基础的城市房屋分布格局。
经济分割是指不同经济阶层在 空间上彼此居住分离的程度。 发达国家房地产市场的发展经历表明,住房商品
四、经济分割程度的度量——空间差异指数
本文采用空间差异指数,计算初始条件为北 京市地价分布,移入可能性为1%、资本增长率为 3%时的D*值,度量空间经济分割程度,
D*
ti 100 qi Q 2Q(1 Q) T
其中,D*是空间差异指数,ti是在社区i中的人 口,T是总人口,qi是在社区i中穷人所占的比例, Q是总人口中穷人所占的比例。 在北京房价分布图上,资本增长率导致经济不 平等现象加剧,家庭根据行为规则购买资产,在 经济承受能力允许的情况下,收入较高的家庭会 搬向房价更高的地区,空间经济分割的程度越来 越高。
一、研究背景(续)
本课题将住房市场视为一个复杂系统,利用改进 后的agent-based model,模拟和判断住房商品化和 我国现行的住房保障政策是否会在长期引起城市 内部的经济分割现象。
1、经济分割问题
文献综述
2、Agent-based Model 3、英美等国的住房保障制度 4、我国的住房保障制度
47 46 45 44 43 42 41 40 39 38
20 40 60 80 100 120
空间差异指数
年数
五、创建可持续发展的混合收入社区
• 20世纪90年代以来,美国、英国、澳大利亚、瑞典、 加拿大和荷兰等国相继提出了混合收入社区的发展计 划,旨在促进经济融合、减少贫困、增强社会流动性、 降低经济分割程度、为低收入家庭提供更多好的机会 • 英国政府提出“创建可持续发展的混合社区”
公共住房
因
特 重要 征
经济分割
重
要
原
直接原因
贫困集中
一、研究背景(续)
图:公共住房社区进入循环下降的过程
一、研究背景(续)
2008年11月9日,为抵御国际经济环境 对我国的不利影响,中国政府出台 “进一步扩大内需、促进经济增长” 的十项措施,其中第一项措施为“加 快建设保障性安居工程,加大对廉租 住房建设支持力度” 。