粒计算研究综述
粒计算研究综述
第2卷第6期 智 能 系 统 学 报 V ol.2 .62007年12月 CAAI T ransactions on Intelligent Systems D ec.2007粒计算研究综述王国胤1,2,张清华1,2,胡 军1,3(1.重庆邮电大学计算机科学与技术研究所,重庆400065; 2.西南交通大学信息科学与技术学院,四川成都610031;3.西安电子科技大学电子工程学院,陕西西安710071)摘 要:粒计算(gr anular computing)是当前计算智能研究领域中模拟人类思维和解决复杂问题的新方法.它覆盖了所有有关粒度的理论、方法和技术,是复杂问题求解、海量数据挖掘、模糊信息处理的有效工具.首先回顾了粒计算研究和发展状况,介绍了粒计算的基本组成和问题,综述了粒计算的基本模型和方法,并讨论了它们之间的相互关系,最后探讨了构建统一的粒计算模型、复杂问题空间的粒化、粒层之间的转换、高效的粒计算方法、新的粒计算模型、动态粒计算模型、自主粒计算模型、粒计算方法的模糊化以及粒计算模型的应用和推广等几个方面的关键问题.关键词:粒计算;数据挖掘;智能信息处理;粗糙集;模糊集;商空间中图分类号:T P18 文献标识码:A 文章编号:1673 4785(2007)06 0008 19An overview of granular computingWAN G Guo yin 1,2,ZHANG Qing hua 1,2,HU Jun 1,3(1.Institute of Comput er Science &T echno lo gy ,Cho ng qing U niversit y of Po st s and T eleco mmunications,Chong qing 400065,China;2.Scho ol of Infor matio n Science &T echnolog y,Southwest Jiao tong U niv ersit y,Chengdu 610031,China; 3.School of Electro nic Engineer ing,Xidian U niver sity,Xi an 710071,China)Abstract:In the field of com putational intelligence,granular computing (GrC)is a new w ay to simulate hu m an thinking to help solve co mplicated problems.Gr C involv es all the theories,methodo logies and tech niques o f granularity,pr oviding a pow erful to ol for the so lution of complex problems,m assiv e data min ing,and fuzzy information pr ocessing.In this paper,first the current situation and the developm ent pros pects of GrC are introduced,then the fundamental and ex isting problem s r elated to GrC ar e presented and its basic models and metho ds summ arized.Finally,som e future research topics abo ut GrC are presented,such as,uniform granular co mputing mo del,granulation of complex pro blem space,transform ation be tw een granule spaces,efficient g ranular co mputing algor ithm,nov el g ranular co mputing model,dy namic granular co mputing m odel,data driven g ranular co mputing m odel,fuzzy gr anular co mputing method,and the applications of gr anular computing models,etc.Keywords:g ranular computing;data m ining;intelligent inform ation processing;roug h sets;fuzzy sets;quotient space收稿日期:2007 04 02.基金项目:国家自然科学基金资助项目(60573068);新世纪优秀人才支持计划;重庆市教委科学技术研究资助项目(KJ060517).自Zadeh 1979年发表论文!Fuzzy sets and in form ation granularity ∀以来[1],研究人员对信息粒度化的思想产生了浓厚的兴趣.Zadeh 认为很多领域都存在信息粒的概念,只是在不同领域中的表现形式不同.自动机与系统论中的!分解与划分∀、最优控制中的!不确定性∀、区间分析里的!区间数运算∀、以及D S 证据理论中的!证据∀都与信息粒密切相关.H obss 在1985年直接用!粒度(granularity)∀作为论文题目发表论文[2],讨论了粒的分解和合并,以及如何得到不同大小的粒,并提出了产生不同大小粒的模型.Lin 在1988年提出邻域系统并研究了邻域系统与关系数据库之间的关系[3].1996年,他在U C Berkeley 大学访问时,向Zadeh 提出作!granular computing∀的研究,Zadeh称之为!g ranular mathematics∀,Lin改称为!granular co mputing∀,并缩写成Gr C.他发表了一系列关于粒计算与邻域系统的论文[4-10],主要是研究二元关系(邻域系统、Rough集和信任函数)下的粒计算模型,论述基于邻域系统的粒计算在粒结构、粒表示和粒应用等方面的问题,讨论了粒计算中的模糊集和粗糙集方法,并将粒计算方法引入数据挖掘和机器发现.依据人们在解决问题时能从不同的粒度世界去分析和观察同一问题,并且很容易地从一个粒度世界转到另一个粒度世界,张钹和张铃在1990年针对复杂问题求解,建立了一种复杂问题求解的商结构形式化体系,给出了一套解决信息融合、启发式搜索、路径规划和推理等问题的理论和算法[11-12].1997年,Zadeh进一步指出[13],世上有3个基本概念构成人类认知的基础:粒化、组织及因果关系.其中,粒化是整体分解为部分,组织是部分结合为整体,而因果关系则涉及原因与结果间的联系.物体的粒化产生一系列的粒子,每个粒子即为一簇点(物体),这些点难以区别,或相似、或接近、或以某种功能结合在一起.一般来说,粒化在本质上是分层次的,时间可粒化为年、月、日、小时、分、秒就是大家熟悉的例子.在Lin的研究基础上,Yao结合邻域系统对粒计算进行了详细的研究[14-16],发表了一系列研究成果[17-22],并将它应用于知识挖掘等领域,建立了概念之间的if then规则与粒度集合之间的包含关系,提出利用由所有划分构成的格求解一致分类问题,为数据挖掘提供了新的方法和视角.结合粗糙集理论,Yao探讨了粒计算方法在机器学习、数据分析、数据挖掘、规则提取、智能数据处理和粒逻辑等方面的应用.Yao给出了粒计算的3种观点[22]:1)从哲学角度看,粒计算是一种结构化的思想方法;2)从应用角度看,粒计算是一个通用的结构化问题求解方法;3)从计算角度看,粒计算是一个信息处理的典型方法.随着粒计算研究的发展,近年来国内外又有很多学者加入到了粒计算研究的领域.为了探讨粗糙集理论在各种环境下的应用,Skow r on[23-27]以包含度概念来研究粒近似空间上的Rough下近似和Rough上近似.刘清[28-30]在Roug h逻辑的基础上,提出了粒-逻辑的概念(G 逻辑),构造了这种逻辑的近似推理系统,并应用于医疗诊断.近几年来,在掀起粒计算研究的热潮中,商空间理论被人们广泛认识和推广,2003年张铃和张钹将模糊概念与商空间理论结合,提出模糊商空间理论,为粒计算提供了新的数学模型和工具,并成功应用于数据挖掘等领域[31-35].2002年苗夺谦等人[36]对知识的粒计算进行探讨,引入属性的重要度,并在求最小属性约简方面得到应用.王飞跃等人[37]对词计算和语言动力学进行了探讨,以词计算为基础,对问题进行动态描述、分析和综合,提出了设计、控制和评估的语言动力学系统.王国胤等人[38-44]提出了基于容差关系的粒计算模型,利用属性值上的容差关系给出了不完备信息系统的粒表示、粒运算规则和粒分解算法,同时结合粗糙集中的属性约简问题,提出了不完备信息系统在粒表示下属性必要性的判定条件,对粒计算方法在规则提取方面进行了探索.郑征等人[45-47]提出了相容粒度空间模型,并在图像纹理识别和数据挖掘中取得了成功,他们认为,人类具有根据具体的任务特性把相关数据和知识泛化或者特化成不同程度、不同大小的粒的能力,以及进一步根据这些粒和粒之间的关系进行问题求解的能力.卜东波等人[48]从信息粒度的角度剖析聚类和分类技术,试图使用信息粒度原理的框架来统一聚类和分类,指出从信息粒度的观点来看,聚类是在一个统一的粒度下进行计算,而分类却是在不同的粒度下进行计算,并根据粒度原理设计了一种新的分类算法,大规模中文文本分类的应用实践表明,这种分类算法有较强的泛化能力.Zhang等人[49-50]对粒神经网络进行了探讨,并在高效知识发现中得到很好的应用.李道国等人[51]研究了基于粒向量空间的人工神经网络模型,在一定程度上提高了人工神经网络的时效性、知识表达的可理解性.杜伟林等人[52]根据概念格[53]与粒度划分在概念聚类的过程中都是基于不同层次的概念结构来进行分类表示,而且粒度划分本身构成一个格结构的特点,研究了概念格与粒度划分格在概念描述与概念层次转换之间的联系,通过对概念的分层递阶来进行概念的泛化与例化,使概念在递阶方面忽略不必要的冗余信息.Yager[54]探讨了基于粒计算的学习方法和应用.Lin[55]在2006年粒计算国际会议上提出了新的研究思路!infrastruc tures for AI engineering∀.同时,Bargiela和Pe dry cz[56]也从各个侧面对粒计算的根源和实质进行了详细的探讨和总结.Yag er指出,发展信息粒的操作方法是当前粒计算研究的一个重要任务[57].1 粒计算的基本组成粒计算的基本组成主要包括3部分:粒子、粒层#9#第6期 王国胤,等:粒计算研究综述和粒结构.1 1 粒 子粒子是构成粒计算模型的最基本元素[58-59],是粒计算模型的原语.一个粒可以被解释为许多小颗粒构成的一个大个体,现实生活中,粒子无处不在,如在地图上观察洲、国家、海洋、大陆和山脉等是一些粗的粒子(大的粒子),观察省、市、区等是一些中等的粒子,而观察街道、饭店、机场等是一些相对较小的粒子.一个粒子可以被同时看作是由内部属性描述的个体元素的集合,以及由它的外部属性所描述的整体.一个粒子的存在仅仅在一个特定的环境中才有意义.一个粒子的元素可以是粒子,一个粒子也可以是另外一个粒子的元素.而衡量粒子!大小∀的概念是粒度,一般来讲,对粒子进行!量化∀时用粒度来反映粒化的程度[59].1 2 粒 层按照某个实际需求的粒化准则得到的所有粒子的全体构成一个粒层,是对问题空间的一种抽象化描述.根据某种关系或算子,问题空间产生相应的粒子.同一层的粒子内部往往具有相同的某种性质或功能.由于粒化的程度不同,导致同一问题空间会产生不同的粒层.粒层的内部结构是指在该粒层上的各个粒子组成的论域的结构,即粒子之间的相互关系.在问题求解中,选择最合适的粒层对于问题求解尤为关键,因为,在不同粒层求解同一问题的复杂度往往不同.在高一级粒层上的粒子能够分解成为下一级粒层上的多个粒子(增加一些属性),在低一级粒层上的多个粒子可以合并成高一级粒层上的粒子(忽略一些属性).粒计算模型的主要目标是能够在不同粒层上进行问题求解,且不同粒层上的解能够相互转化.1 3 粒结构一个粒化准则对应一个粒层,不同的粒化准则对应多个粒层,它反应了人们从不同角度、不同侧面来观察问题、理解问题、求解问题.所有粒层之间的相互联系构成一个关系结构,称为粒结构[20].粒结构给出了一个系统或者问题的结构化描述.通过从系统思维、复杂系统理论和层次结构理论(技术)中得到的启发至少需要确定一个粒结构网[20]中3个层次的结构:粒子的内部结构、粒子集结构和粒子网的层次结构.粒子集的集体结构可以看作是全部层次结构中一个层次或者一个粒度视图中的结构.它本身可以看作是粒的内部连接网络.对于同一个系统或者同一个问题,许多解释和描述可能是同时存在的.所以,粒结构需要被模型化为多种层次结构,以及在一个层次结构中的不同层次.虽然一个粒子在某个粒层上被视为一个整体,但粒子内部元素(子粒子)的结构在问题求解时也很重要,因为它能提供粒子更为详细的特性.而在同一层上的粒子之间也具有某种特殊的结构,它们可能是相互独立,或者部分包含.如果同一粒层上的粒子之间的独立性越好,可能问题求解后合并起来越方便;反之,如果粒子之间的相关性越好,则问题求解后的合并工作相对越繁杂.粒子网的层次结构是对整个问题空间的概括,它的复杂性在一定程度上决定了问题求解的复杂程度.2 粒计算的基本问题粒计算中存在2个最基本的问题,即粒化和粒的计算.问题空间的粒化是指将问题空间分解为许多子空间,或是基于有用的信息和知识将问题空间中的个体聚集成不同的类,这些类称之为粒.粒中的元素可以理解为对应概念的实例.可以把粒计算和概念生成、知识发现和数据挖掘联系起来,因为概念生成的目的之一是对具有某些概念的粒的表示、特征化、描述和解释,而知识发现和数据挖掘就是在粒之间建立关联和因果等联系.2 1 粒 化粒化是问题求解空间的一个构造性过程,它可以简单理解为在给定粒化准则下得到一个粒层的过程,是粒计算基础单元的构建,包括粒子、粒视图、粒网和层次结构.在不同的粒化准则下就得到多个粒层,进而得到粒层的网络结构.通常的粒化方法有自顶而下通过分解粗粒子得到细粒子的方法,和自底向上将细粒子通过合并得到粗粒子的方法.粒化过程是粒计算的必要过程.问题空间的粒化过程主要涉及粒化准则、粒化算法(方法)、粒子和粒结构的表示(描述)以及粒子和粒结构的定性(定量)描述等问题[59].粒化准则主要是语义方面的问题,解决为什么2个对象能放进同一个粒子内的问题.它是根据实际问题求解的具体需求和具体精度要求得到的.粒化准则的一个基本要求是忽略掉那些无关紧要的细节,从而达到降低问题求解复杂度的目的.粒化方法面对实际问题,回答如何对问题空间进行粒化,采用什么算法或工具实现粒层的构造,它属于算法方面的问题.如在粗糙集理论中,如何对对象集进行划分产生粒层,如何高效实现属性的约简等问题.粒子的结构描述主要是用粒化方法得到的粒子,如何用形式化的语言表述出来,以便后面进行计算.例如在粗糙集理论模型中,粒子的表示可能是一个子集.而#10#智 能 系 统 学 报 第2卷在概念格理论中,粒子的表述就是一个概念,它包括概念的外延(一个对象子集)和内涵(一个属性子集) 2部分.粒结构的描述往往形式多样,在商空间理论模型中,粒结构是一种分层递阶的结构,在概念格模型中,粒结构是一种H asse图.粒子和粒结构的定性、定量描述主要指粒子和粒结构的大小(主要是指粒度的结果)和复杂性度量.当前,成功的粒化方法往往都是以将解空间形成划分空间为主要的目标,这样便于将子空间上的解合成原问题空间的解,商空间理论就是这样一个成功的实例.当然,如果用某种粒化方法形成的解空间不是划分(如覆盖),这将增加合成的复杂度.2 2 粒的计算以粒子为运算对象进行问题的求解或推理,是狭义的粒计算.粒计算可以通过系统访问粒结构来解决问题,包括在层次结构中向上和向下2个方向的交互,以及在同一层次内的移动,主要分为2种[59]:同一粒层上粒子之间相互转换和推理,不同粒层上粒子之间的转换或推理.不同粒层之间的联系可以由映射来表示,在不同粒层上同一问题以不同的粒度、不同的细节表示,粒层之间的映射就建立了同一问题的不同细节描述之间的关系.商空间理论模型就是通过自然投影建立了分层递阶的商空间链式结构.粒计算的主要特点是同一问题的解可以在不同粒层之间自由转化.正是基于这一点,人们才能用粒计算方法高效地实现复杂问题的求解.模糊商空间上的分层递阶结构可以通过模糊等价关系的截关系建立相应的转化联系;粗糙集理论中的划分粒度可以通过属性的增加或删减来控制;而概念格理论模型中的概念粒子的相互转化可以通过改变概念的内涵来实现.这些转化虽然方式不同,但一个共同的特点是在转化的过程中,问题求解的重要性质必须能在不同粒层上表现出来,这也是评价粒化方法好坏的一个重要指标.如果在粒化后粒层之间的相互转化过程中,某些重要属性不能体现出来,这不但不利于问题的求解,反而会导致问题求解过程发散,从而增加问题求解的复杂度.商空间理论模型中的!保真∀和!保假∀原理使得粒化后形成的商空间具有!保序∀性,使得问题求解的搜索空间大大减少,复杂度由相乘变为相加.粒计算的2个基本问题中,粒化是关键,它直接决定粒计算的成功与否.因此,粒化方法是人们研究的热点问题.目前,粒化方法很多,如基于等价关系的划分产生粒子[17],基于模糊集产生模糊信息粒[1],基于模糊等价关系截集产生分层递阶粒空间[35],基于概念格产生概念信息粒和概念知识粒[60],基于邻域系统产生邻域粒子[3]等等.总之,粒计算是一个多准则学科,它从许多领域中获得其基本的思想、准则和方法,是基于不同层次粒度和细节的问题求解的一般性理论.在粒计算的!大伞∀下进行统一的研究,可以发现不同学科之间原理的关联,它与具体的学科研究是相互独立的[59].一旦掌握了粒计算中的结构化思维和结构化问题求解的抽象思想,就可以很容易地在任何领域中运用.3 粒计算的主要模型与理论方法3 1 词计算模型高标准的精确表达,普遍存在于数学、化学、工程学和另外一些!硬∀科学之中,而不精确表达却普遍存在于社会、心理、政治、历史、哲学、语言、人类学、文学、文艺及相关的领域中[61].针对复杂且非明晰定义的现象,无法用精确的数学方法来描述,但可以用一些程度词语,如不很可能、十分不可能、极不可能等,来对某些模糊概念进行修饰.尽管普通的精确方法(如数学)在某些科学领域应用相当广泛,也一直尝试着应用到人文学科中,但人们在长期的实践中已经清楚地认识到精确的方法应用到人文学科有很大的局限性.面对巨大而又复杂的人文学科系统,区别于传统方法的新方法∃∃∃模糊计算方法被Zadeh提出.在人类的认识中,粒的模糊性直接源于无区别、相似性、接近性以及功能性等这些概念的模糊性.人类具有在不精确性、部分知识、部分确定以及部分真实的环境下作出合理决策这一不同寻常的能力,而模糊信息粒化正是这种能力的基础.在模糊逻辑中,模糊信息粒化是语言变量、模糊!if then∀规则以及模糊图的基础.词计算(com puting w ith w o rds)是用词语代替数进行计算及推理的方法[62].如何利用语言进行推理判断,这就要进行词计算.信息粒化为词计算提供了前提条件,词计算在信息粒度、语言变量和约束概念上产生了自己的理论与方法,意在解决模糊集合论的数值化隶属度函数表示法的局限性、表达的概念缺乏前后联系、逻辑表达和算子实现的复杂性等问题,使它们能够更符合人类的思维特点.词计算有狭义和广义2个方面的概念.狭义的模糊词计算理论是指利用通常意义下的数学概念和运算(如加、减、乘、除等)构造的带有语义的模糊数值型的词计算的理论体系;广义的词计算理论统指用词进行推理、用词构建原型系统和用词编程,前者是后者的基#11#第6期 王国胤,等:粒计算研究综述础[63].模糊逻辑在词计算中起中心作用,它可以近似地被认为与词计算相同[62].在词计算中存在2个核心问题:模糊约束的表现问题和模糊约束的繁殖问题,它们是模糊信息粒化的基本准则.信息粒化(infor mation granulation)是粒化的一种形式.在众多的信息粒化中,非模糊粒化的方法很多,如将问题求解空间形成划分空间,每个粒子都是精确的.但这种粒化方法不能解决很多现实问题,如将人的头部粒化为脸、鼻子、额头、耳朵、头盖、脖子等粒子,这些粒子之间没有明确的分界线,它们都是模糊的粒子.模糊信息粒化是传统信息粒化的一种推广.模糊信息粒化理论[64-65](theor y of fuzzy information g ranulation,TFIG)建立在模糊逻辑和信息粒化方法基础之上,是从人类利用模糊信息粒化方式中获得的启发,其方法的实质是数学.Zadeh指出[64],除模糊逻辑外,没有一种方法能提供概念框架及相关技术,它能在模糊信息粒化起主导作用.继Zadeh之后,许多学者开始了有关词计算的研究工作,Wang[66]编写了词计算一书.广义词计算理论的研究工作,中国刚刚起步,李征等人[67-68]通过研究模糊控制器的结构,认为模糊控制实际上是应用了信息粒化和词计算技术,但却只是应用了该技术的初级形式,而基于信息粒化和词计算(IGCW)的模糊控制系统,将具有更强的信息处理和推理判断能力,是对人类智能更高程度的模拟.他们指出,基于信息粒化和词计算的模糊控制系统是通过信息粒化和重组、多层次的思维决策,动态地改变下层控制器的参数和推理方法或控制规则,因而使控制器具有变结构和多模态的特性.信息太多会延误推理计算的时间,给系统带来不必要的处理任务;而信息太少,则会降低推理结果的完善性.因此,提出了合理重新组织信息的研究课题.随着近年来智能信息处理的不断深入与普及,特别是处理复杂系统分析与评估时的迫切需要,人们越来越发现排除自然语言的代价太大了.首先,从应用角度来看,人类已习惯于用自然语言描述和分析事物,特别是涉及社会、政治、经济和管理中的复杂过程.人类可以方便地利用以自然语言表示的前提进行推理和计算,并得到用自然语言表达的结果;其次,从理论角度来看,不利用自然语言,现有的理论很难甚至不能够处理感性信息,而只能处理测度信息.感性信息或知识通常只能用自然语言来描述,由于人类分辨细节和存储信息的认知能力的内在限制,感性信息在本质上是不精确的[69-72].W ang利用自然语言知识和信息,建立以词计算为基础的语言动力学系统(linguistic dynamic system s,LDS),并通过融合几个不同领域的概念和方法[37],提出基于词计算的语言动力学系统的计算理论框架,根据这个计算理论框架,利用常规或传统数值动力学系统中已有的成熟概念和方法,对语言动力学系统进行动力学分析、设计、控制和性能评估.这些研究的目的是建立连接人类的语言知识表示与计算机的数字知识表示的桥梁,成为下一代智能化人机交互的理论基础之一.总之,词计算理论和方法对于复杂信息系统的模糊推理和控制非常重要,但由于自身的局限性,它必须和其他理论体系相结合,才能更有效地处理复杂信息.3 2 粗糙集模型一个对象属于某个集合的程度随着属性粒度的不同而不同,为了更好地刻画集合边界的模糊性,波兰学者Paw lak[73]在20世纪80年代提出了粗糙集理论,其本质思想是利用不可分辨关系(等价关系)来建立论域的一个划分,得到不区分的等价类(即不同属性粒度下的概念粒),从而建立一个近似空间(由不同大小的概念粒形成).在近似空间上,用2个精确的集合(上近似集和下近似集)来逼近一个边界模糊的集合.如果近似空间的粒度较粗,被近似的集合的边界域较宽,而如果近似空间的粒度较细,被近似集合的边界域较窄.给定集合X上的一个划分等价于在X上给定一个等价关系R.X/R表示U上由R导出的所有等价类,[x]R表示包含元素x的等价类,其中x%U. Paw lak称之为在论域上给定了一个知识基(X,R),然后讨论一个一般的概念X(U中的一个子集)如何用知识基中的知识来表示.对那些无法用(X,R)中的集合的并来表示的集合,借用拓扑中的内核和闭包的概念,引入下近似和上近似的概念:R-(X)= {x%U|[x]R X}和R-(X)={x%U|[x]R&X∋ }.当R-(X)∋R-(X)时,就称X为粗糙集,从而创立了!粗糙集理论∀.粗糙集理论是一种软计算方法.软计算(soft computing)概念是由模糊集创始人Zadea提出的[61-65].传统的计算方法即所谓硬计算,使用精确、固定和不变的算法来表达和解决问题;而软计算的指导原则是利用所允许的不精确、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调.粗糙集理论的研究,已经经历了20多年的时间,无论是在系统理论、计算模型的建立和应用系统的研制开发上,都已经取得了很多成果,也建立了一套较为完善的粗糙集理论体系[74-75].目前粗糙集理#12#智 能 系 统 学 报 第2卷。
粒子群算法的研究现状及其应用
智能控制技术课程论文中文题目: 粒子群算法的研究现状及其应用姓名学号:指导教师:年级与专业:所在学院:XXXX年XX月XX日1 研究的背景优化问题是一个古老的问题,可以将其定义为:在满足一定约束条件下,寻找一组参数值,使系统的某些性能指标达到最大值或最小值。
在我们的日常生活中,我们常常需要解决优化问题,在一定的范围内使我们追求的目标得到最大化。
为了解决我们遇到的最优化问题,科学家,们进行了不懈的努力,发展了诸如牛顿法、共轭梯度法等诸多优化算法,大大推动了优化问题的发展,但由于这些算法的低运行效率,使得在计算复杂度、收敛性等方面都无法满足实际的生产需要。
对此,受达尔文进化论的影响,一批新的智能优化算法相继被提出。
粒子群算法(PSO )就是其中的一项优化技术。
1995 年Eberhart 博士和Kennedy 博士[1]-[3]通过研究鸟群捕食的行为后,提出了粒子群算法。
设想有一群鸟在随机搜索食物,而在这个区域里只有一块食物,所有的鸟都不知道食物在哪里。
那么找到食物最简单有效的办法就是鸟群协同搜寻,鸟群中的每只鸟负责离其最近的周围区域。
粒子群算法是一种基于群体的优化工具,尤其适用于复杂和非线性问题。
系统初始化为一组随机解,通过迭代搜寻最优值,通过采用种群的方式组织搜索,同时搜索空间内的多个区域,所以特别适合大规模并行计算,具有较高的效率和简单、易操作的特性。
目前使用的粒子群算法的数学描述[3]为:设粒子的寻优空间是m 维的,粒子的数目为ps ,算法的最大寻优次数为Iter 。
第i 个粒子的飞行速度为T i i1i2im v [v v ]= ,,,v ,位置为T i i1i2im x [x x x ]= ,,,,粒子的个体极值T i i1i2im Pbest [,]P = ,P ,P ,全局极值为T i i1i2im Gbest [,]g = ,g ,g 。
粒子群算法的寻优过程主要由粒子的速度更新和位置更新两部分组成,其更新方式如下:i+11122v ()()i i i i i v c r Pbest x c r Gbest x =+−+−;i+1i+1i x x v =+,式中:12c c ,为学习因子,一般取2;12r r ,是均与分布着[0,1]上的随机数。
粒计算理论的研究及其应用
粒计算理论的研究及其应用在现代科技越来越发达的时代,我们的生活中充满了科技的影响。
科技的进步不仅给我们的生活带来了更多的便利,同时也改变了我们的生活方式。
粒计算理论作为一种新兴的计算模型,其应用将给我们的生活带来更多的可能性。
1. 粒计算理论的研究粒计算理论是一种计算理论模型,与传统的图灵计算模型相比,其主要特点是在计算处理中具有模糊性、不确定性、粗糙性和近似性。
该理论的研究起初是为了解决现实问题中的模糊性和不确定性,而后逐渐发展为一种新的计算模型。
粒计算理论的主要研究内容包括:粗糙集理论、模糊集理论、格理论、近似推理算法等。
这些理论的研究为粒计算的应用提供了坚实的基础。
2. 粒计算理论在人工智能中的应用粒计算理论在人工智能领域中的应用非常广泛,其主要应用包括:模糊控制、模糊逻辑、人工神经网络、智能优化算法等。
模糊控制是指利用模糊数学理论来进行控制的方法。
通过对模糊控制系统的研究,可以使得控制系统的效果更加优良,并且能够适应更多的场景。
模糊逻辑是将模糊数学中的模糊概念引入到逻辑中,从而使得我们可以用更贴近人类思维的方式来进行推理。
利用模糊逻辑进行推理的方式非常符合人类思维方式,因此可以帮助我们更好地理解环境和问题,并且能够在问题处理中对结果进行更准确的预测。
人工神经网络是一种模仿人脑神经活动的计算系统,其主要采用了模拟神经元之间的相互作用来解决问题。
通过引入粒计算理论,我们可以更好地处理具有不确定性和模糊性的问题。
智能优化算法是指一种可以求取最优解的算法。
常见的智能优化算法包括遗传算法、粒子群算法、蚁群算法等。
将粒计算理论引入到这些算法中,可以更好地解决一些经典的优化问题。
3. 粒计算理论在其他领域中的应用除了在人工智能领域中的应用之外,粒计算理论在其他领域中也有着广泛的应用。
例如,在医疗领域中,可以利用粒计算理论来预测疾病的治疗效果和预后情况;在金融领域中,可以利用该理论来进行金融风险评估和股票预测等。
面向低质数据的粒计算与特征选择研究
面向低质数据的粒计算与特征选择研究面向低质数据的粒计算与特征选择研究是一项具有挑战性的任务。
在现实生活中,我们经常面临大量的低质量数据,这些数据可能存在噪声、异常值或缺失值等问题,使得数据质量不高。
因此,如何从这些低质数据中提取有用的信息并进行有效的特征选择成为了一个亟待解决的问题。
粒计算是一种处理大规模复杂系统的方法,它可以将一个复杂的问题分解成若干个较小的、更容易处理的子问题,从而简化问题的求解过程。
在面向低质数据的特征选择中,粒计算可以发挥重要作用。
通过将数据集划分为不同的粒度,我们可以从不同的角度观察数据,发现数据中的隐藏模式和规律,从而选择出更具有代表性和预测能力的特征。
具体而言,我们可以采用粒度矩阵等方法对数据进行粒化处理,将数据集划分为不同的粒度。
然后,我们可以通过比较不同粒度下的特征选择结果来确定最终的特征子集。
在比较过程中,可以采用不同的评估指标,如分类准确率、召回率、F1值等来评估特征选择的效果。
除了粒计算外,特征选择也是处理低质数据的关键技术之一。
特征选择可以帮助我们减少数据的维度,降低过拟合的风险,提高模型的泛化能力。
在面向低质数据的特征选择中,我们需要注意一些问题。
首先,由于数据质量不高,我们需要采用更加稳健的特征选择方法来
避免噪声和异常值的影响。
其次,由于低质数据中可能存在较多的冗余特征和无关特征,我们需要采用更加有效的特征选择方法来去除这些特征。
综上所述,面向低质数据的粒计算与特征选择研究是一项重要的任务。
通过采用粒计算和特征选择技术,我们可以从低质数据中提取有用的信息,提高数据的利用率和处理效率。
粒子群聚类算法综述_李峻金
收稿日期:2009-04-02;修回日期:2009-06-13作者简介:李峻金(1985-),男,安徽阜阳人,硕士研究生,主要研究方向为人工智能与聚类分析(ts p ace1985@g m ai.l co m );向阳(1968-),女,湖南长沙人,副教授,硕士,主要研究方向为计算机与数据库安全;芦英明(1985-),男,陕西西安人,助理工程师,主要研究方向为装备系统工程;吴朔桐(1985-),女,内蒙古通辽人,助理工程师,主要研究方向为通信工程.粒子群聚类算法综述李峻金1,向 阳1,芦英明2,吴朔桐3(1.西安通信学院,西安710106;2.中国特种车辆研究所,北京100072;3.中国人民解放军61516部队,北京100094)摘 要:聚类分析是数据挖掘的重要技术之一,它能够通过无监督的学习过程发现隐藏的模式,具有独立发现知识的能力。
对现有文献中基于粒子群优化算法的聚类分析技术作了全面的介绍,对几种主要的粒子群聚类算法的基本原理及其特点进行了总结,并分析比较了它们的优点和不足,概述了粒子群聚类算法的常见应用领域;最后探讨了粒子群聚类算法进一步的研究方向。
关键词:聚类分析;群智能;粒子群优化算法中图分类号:TP301 文献标志码:A 文章编号:1001-3695(2009)12-4423-05do:i 10.3969/.j i ssn .1001-3695.2009.12.006Survey of parti cle s w arm cl usteri ng al gorit h m sL I Jun -ji n 1,X I ANG Y ang 1,LU Y i ng -m ing 2,W U Shuo -tong 3(1.X i .an Co mmun ic a tions Instit u te ,X i .an 710106,C hina;2.China .s Speci a l Vehicle R ese arc h In stit u t e ,Be i jing 100072,Ch i na;3.PLA 61516Un it ,Be i jing 100094,Ch i na )Abstract :C l ustering analysis i s one of t he m i portant datam i ning techn i ques t hat can d i scover h i dden m odes by unsupervi sed learn i ng and has t he ab ility of acquiri ng kno w ledge i ndependentl y .This paper presented an al-l around i n troduction of PSO-based cl ustering met hods i n existing literatures ,descri bed t he basic pri nci ples and the characteristics of t he existi ng popular particle s war m cl usteri ng al gorith m s ,and m ade the co m parison about theirm erits and de m erits .Then su mm arized the app lica -ti ons of particle s w ar m clusteri ng al gorith m s .F i nall y ,poi nted out t he future research d irections of parti cle s w ar m cl usteri ng a-l gorith m s .Key words :cl ustering analysis ;s w ar m i ntelli gence ;particl e s w ar m op tm i izati on(PS O)0 引言聚类(c l uste ri ng)是将一批现实或抽象的数据对象分组成为多个类或簇的过程[1]。
粒计算研究综述
摘
要: 粒计算 (rn l o uig 是当前计算智能研究领域 中模拟人类思维和解决复 杂问题的新方法. gaua cmp t ) r n 它覆盖 了
所有有 关粒度的理论 、 方法和技术 , 是复杂问题 求解 、 海量数 据挖掘 、 模糊 信息处 理的有效 工具. 首先 回顾 了粒计算 研 究和发展状况 , 绍了粒计算 的基本组成 和问题 , 介 综述 了粒计算 的基本模 型和方法 , 并讨 论 了它们 之间 的相互关 系, 最后探讨了构建统一的粒计算模 型、 复杂 问题 空间 的粒化 、 粒层之 问的转换 、 高效 的粒计算 方法 、 的粒计 算模 新 型、 动态粒计算模型 、 自主粒计算模型 、 粒计算方法 的模糊 化以及粒计算模 型的应用 和推广等几个方面 的关键问题. 关键词 : 粒计算 ; 数据挖掘 ; 智能信 息处 理; 粗糙集 ; 模糊集 ; 商空间
中 图 分 类 号 : P 8 文 献标 识 码 : 文章 编 号 :6 34 8 (0 7 0 —0 81 T 1 A 1 7—7 5 2 0 )60 0 —9
An o e v e o r nu a o pu i v r i w f g a l r c m tng
W ANG o yn , HANG n — u ,HU n ・ Gu  ̄ i Z Qi g h a J u 。
i a i o es a d m e h d u t b scm d l n t o s s mm a ie . F n l s r d z ial y,s me f t r e e r h t p c b u C r r s n e o u u e r s a c o is a o tGr a e p e e t d, s c s n f r r n lr c m p tn d l r n l t n o o p e r b e s a e ta so ma i n b — u h a ,u i m g a u a o o u i g mo e ,g a u a i f c m l x p o lm p c , r n f r t e o o
不完美数据中的知识发现研究综述
不确定数据在普通数据基础上,再加上概率,从而更客观得描述数据的原貌,从这个角 度来讲,这里的概率实际上是增加了数据的完美性;但是,我们加概率是因为数据原貌是不 确定的,是无法以完全确定的方式加以描述的,从这个角度来讲,不确定数据仍然是一种不 完美数据。
表 1 两种粒度的不确定数据
f1
f2
...
fn
不纯数据通常是指数据错误或偏差,而且这种不纯的成分往往有随机因素。不纯数据中 的随机因素是我们想要去除的,而不确定数据中的随机因素是我们要保留、而且利用的;前 者是数据产生和收集过程中意外产生的、或者是无法避免的,而后者往往是刻意产生的。
数据异常是一个比较模糊的说法,通常是相对于正常数据的一个概念,换言之,先存在 一个正常数据,才会通过比较之后发现异常数据。问题在于,很多时候,数据是否正常是人 们根据主观判断和经验获得,因此这种异常数据一般是指超出人们预期的情况。异常数据可 能、但并不总是错误数据,在某些领域中(如,入侵检测[36]),发现的异常数据需要引起人 们更多的重视、具有更高的价值。
z 参数迁移:发现两个领域中可以共享的参数信息,继而用于迁移[15][16][19];
z 关系知识迁移:在两个领域中建立关系知识影射,继而用于迁移[17][18]。
对应图 1,实例和特征表示迁移属于中观粒度,参数和关系知识迁移主要是围绕整个数 据集内在的属性,因此应该属于宏观粒度。上述分类基本涵盖了目前的主流研究方向,虽然 在机器学习、数据挖掘、自然语言处理、互联网等相关领域不断涌现出各种新的理论和方法, 但是对于迁移背后的机理、迁移的反效果(也就是负迁移,Negative Transfer)、迁移的关 键应用(Killer Application)等方面的研究尚未完善。
端粒综述
摘要端粒是真核生物染色体末端的一种特殊结构,对于维持染色体稳定性具有十分重要的意义.端粒长度的维持则需要端粒酶催化完成,端粒的长短和端粒酶的功能异常与细胞衰老和癌变有密切关联。
关键词端粒端粒酶抗衰老对于真核生物而言.一个细胞核内往往存在多条染色体.而每条染色体末端都存在一个特殊结构——端粒( t e l o me r e s ) .该结构对于防止不同染色体之间末端的融合和维持染色体的完整性具有十分重要的意义.一些研究还发现端粒长度与衰老和癌症存在密切关系.成为当前生命科学领域的研究热点之一。
一、端粒与端粒酶的研究历史早在2 0世纪3 O年代,缪勒( He r ma n n Mu l l e r1 9 4 6年的诺贝尔生理或医学奖获得者) 发现被x线打断的果蝇染色体末端极不稳定,因而提出染色体末端结构可能是为了维持染色体的稳定性和完整性,并将希腊文末端( t e l o ) 和部分( me r o s ) 组成一词将其命名为端粒( t e l o me r e ) (1).Mu l l e r H J .Th e r e ma k i n g o f c h r o mo s o me s { J ]Co l l e c t i n g Ne t ,1 93 8,1 3:1 81 —19 8 ..几乎在同一时期,麦克林托克女士( B a r b a r a Mc Cl i n t o c k,因为发现玉米的转座子获得 1 9 8 3年的诺贝尔生理或医学奖) 在研究玉米的染色体时也发现断裂染色体的末端处经常发生随机的相互粘连和融合而改变染色体的结构,但染色体的天然末端却从不与其他断裂处连接,染色体彼此之间的末端也不会相互连接(2)[3 ] Mc C l i n t o c k B .T h e s t a b i l i t y o f b r o k e n e n d s o f c h r o mo s o me s i n z e a na y s [ J ] .Ge n e t i c s,1 9 4 1,2 6 ( 2):23 4 —2 82在学术会议上相识后,布莱克本与绍斯塔克合作进行了一个大胆的但又似乎很怪异的实验实验的结果十分令人惊喜,线性质粒能够在酵母细胞内稳定地复制[ 7 ] .测序发现酵母的端粒序列为不太规则的TGGG重复序列组成【8 ] .随后人们发现端粒序列不管是在单细胞生物,还是在高等植物和动物中都表现出保守性,序列长度和序列组成在各物种间还存在差异,如人的端粒序列为TTAGGG[ 9 ] Z a k i a n V A.T e l o me r e s :b e gi n n i n g t o u n d e r s t a n d t h e e n d .S c i e n c e [ J ] .1 9 9 5 ,2 7 0 ( 5 24 2 ) :1 6 0 1 —1 6 0 7 .[10 ] Mo r i n G B .Th e h u ma n t e l o me r e t e r mi n a l t r a n s —f e r a s e e nz yme i s a r | b 0n uc l e opr ot e i n t ha t s yn t he s i z e s TTAGGG r e p e a t s [ J ] .C e l l ,1 9 8 9,5 9 ( 3 ) :5 2 1 —5 2 9通过进一步研究,布莱克本和绍斯塔克很自然地推测可能存在一种末端转移酶来把重复序列添加到端粒的末端.1 9 8 4年,格雷德作为布莱克本的博士生进入其课题.经过精心细致的实验和反复的确认,他们利用四膜虫的核抽提液在体外实验中检测到末端转移酶的活性,[ 1 1 ] G r e i d e r C W,B l a c k b u r n E H.I d e n t i f i c a t i o n o f as p e c i f i c t e l ome r e t e r mi n al t r a ns f e r a s e a c t i v i t y i nTe t r a h y me n a e x t r a c t s [ J ] .C e l l ,1 9 8 5 ,4 3 ( 2 Pt 1 ):4 05 —41 3 .随后他们把这种酶正式命名为“端粒酶”端粒具有重要的生物学功能:①保护染色体不被核酸酶降解;②防止染色体相互融合;③为端粒酶提供底物,解决D N A复制的末端隐缩,保证染色体的完全复制;④决定细胞的寿命。
端粒长度计算
端粒长度计算全文共四篇示例,供读者参考第一篇示例:端粒是真核细胞染色体末端的一段特殊DNA序列,它在细胞分裂的过程中承担着保护染色体末端的重要功能。
端粒长度的测定对于了解染色体稳定性、细胞老化以及癌症等疾病的发生有着重要的意义。
端粒长度计算是一种常见的生物学实验技术,通过测定端粒在某一时点的长度,可以揭示细胞的老化程度和疾病发展的风险。
以下将介绍端粒长度计算的原理、方法和意义。
一、端粒长度的计算原理端粒长度的计算原理实际上是基于端粒末端的DNA序列的重复结构。
在端粒的DNA序列中,存在一种称为端粒酶的酶类来维持端粒的完整性。
端粒酶能够向终端方向合成端粒序列的新DNA,从而保护染色体末端免受短期的端粒脱落危险。
端粒的重复结构会随着细胞的分裂而逐渐减少,进而导致端粒长度的缩短。
端粒长度的计算可以通过测定端粒DNA序列的重复次数来估计。
端粒长度计算的方法主要有两种,一种是末端限制性酶消化-聚合酶链反应(telomere restriction fragment-T-RF),另一种是荧光原位杂交(fluorescence in situ hybridization-FISH)。
在T-RF方法中,首先利用端粒酶酶附加到端粒的末端部分,然后使用限制性酶将端粒DNA切割成不同长度的DNA片段。
通过聚合酶链反应来测定不同长度的端粒DNA。
而在FISH方法中,通过特异性的探针与端粒DNA序列结合,用荧光染料标记后,在显微镜下观察端粒的长度。
这两种方法都能准确地测定端粒的长度,并且各有优缺点,需要根据实验的要求选择相应的方法。
端粒长度计算可以在许多方面得到应用。
在细胞老化和衰老过程中,端粒长度的缩短与细胞的衰老程度呈正相关关系。
通过测定端粒长度,可以判断细胞的老化程度,进而推断出个体的生理状态和年龄。
在染色体不稳定性和癌症等疾病的发生中,端粒长度的变化也具有重要意义。
染色体端粒的缩短会导致染色体的断裂和融合,从而引起染色体不稳定性和细胞恶性转化。
二进制粒计算模型
二进制粒计算模型郑鹭斌;陈玉明;曾志强;卢俊文【期刊名称】《计算机科学》【年(卷),期】2016(43)1【摘要】粒计算是一种处理不确定性数据的理论方法,涵盖粗糙集、模糊集、商空间、词计算等.目前,数据的粒化与粒的计算主要涉及集合的运算与度量,集合运算的低效制约着粒计算相关算法的应用领域.为此,提出了一种二进制粒计算模型,给出了粒的三层结构,包括粒子、粒群与粒库,并定义了二进制粒子及二进制粒子的运算,将传统的集合运算转化为二进制数的计算,进一步给出了二进制粒子的距离度量,将等价类的集合表示方式转化为粒子的距离度量表示方式,给出了粒子距离的相关性质.该模型定义了二进制粒群距离的概念,给出了二进制粒群距离的计算方法,提出了基于二进制粒群距离的属性约简方法,证明了该方法与经典粗糙集约简方法的等价性,并以二进制粒群距离作为启发式信息,给出了两种约简算法.【总页数】5页(P270-274)【作者】郑鹭斌;陈玉明;曾志强;卢俊文【作者单位】厦门理工学院计算机与信息工程学院厦门361024;厦门理工学院计算机与信息工程学院厦门361024;江西省高性能计算重点实验室江西师范大学国家网络化支撑软件国际科技合作基地南昌330027;厦门理工学院计算机与信息工程学院厦门361024;厦门理工学院计算机与信息工程学院厦门361024;江西省高性能计算重点实验室江西师范大学国家网络化支撑软件国际科技合作基地南昌330027【正文语种】中文【中图分类】TP181【相关文献】1.基于二进制粒与粒计算的属性约简 [J], 陈玉明;苗夺谦;焦娜2.基于粒计算的二进制矩阵及在决策树算法的应用 [J], 徐健锋;刘斓;邱桃荣;刘清3.基于二进制粒与粒计算的属性约简 [J], 陈玉明;邱桃荣;万长林4.划分序乘积空间:基于划分的粒计算模型 [J], 徐怡;姚一豫5.决策系统的商空间粒计算模型数学刻画 [J], 王会芳;孙爱玲因版权原因,仅展示原文概要,查看原文内容请购买。
粒子群算法论文
VS
详细描述
组合优化问题是指在一组离散的元素中寻 找最优解的问题,如旅行商问题、背包问 题等。粒子群算法通过模拟群体行为进行 寻优,能够有效地求解这类问题。例如, 在旅行商问题中,粒子群算法可以用来寻 找最短路径;在背包问题中,粒子群算法 可以用来寻找最大化的物品价值。
粒子群算法在组合优化问题中的应用
粒子群算法论文
目录
CONTENTS
• 粒子群算法概述 • 粒子群算法的理论基础 • 粒子群算法的改进与优化 • 粒子群算法的实际应用 • 粒子群算法的未来展望
01 粒子群算法概述
粒子群算法的基本原理
粒子群算法是一种基于群体智能的优化算法,通过模拟鸟群、鱼群等生物群体的行 为规律,利用粒子间的信息共享和协作机制,寻找最优解。
高模型的决策能力和性能。
05 粒子群算法的未来展望
粒子群算法与其他智能算法的融合研究
融合遗传算法
通过引入遗传算法的变异、交叉和选 择机制,增强粒子群算法的搜索能力 和全局寻优能力。
混合粒子群优化
结合其他优化算法,如模拟退火、蚁 群算法等,形成混合优化策略,以处 理多目标、约束和大规模优化问题。
粒子群算法的理论基础深入研究
通过对粒子群算法的收敛性进行分析, 可以发现算法在迭代过程中粒子的分 布规律以及最优解的稳定性,有助于 优化算法参数和提高算法性能。
粒子群算法的参数优化
参数优化是提高粒子群算法性能 的关键步骤之一,主要涉及粒子 数量、惯性权重、学习因子等参
数的调整。
通过对参数进行优化,可以改善 粒子的搜索能力和全局寻优能力,
总结词
粒子群算法在机器学习中可以用于特征选择、模型选择 和超参数调整等方面。
详细描述
机器学习是人工智能领域的一个重要分支,旨在通过训 练数据自动地学习和提取有用的特征和规律。粒子群算 法可以应用于机器学习的不同方面,如特征选择、模型 选择和超参数调整等。通过模拟群体行为进行寻优,粒 子群算法可以帮助机器学习模型找到最优的特征组合、 模型参数和超参数配置,从而提高模型的性能和泛化能 力。
粒子群算法研究综述
粒子群算法综述控制理论与控制工程09104046 吕坤一、粒子群算法的研究背景人工智能经过半个世纪的发展,经历了由传统人工智能、分布式人工智能到现场人工智能等阶段的发展。
到二十世纪九十年代,一些学者开始从各种活动和现象的交互入手,综合地由个体的行为模型开始分析社会结构和群体规律,于是90年代开始,就产生了模拟自然生物群体(swarm)行为的优化技术。
Dorigo等从生物进化的机理中受到启发, 通过模拟蚂蚁的寻径行为, 提出了蚁群优化方法;Eberhar 和Kennedy于1995年提出的粒子群优化算法是基于对鸟群、鱼群的模拟。
这些研究可以称为群体智能(swarm-intelligenee)。
通常单个自然生物并不是智能的,但是整个生物群体却表现出处理复杂问题的能力,群体智能就是这些团体行为在人工智能问题中的应用。
粒子群优化(Particle Swarm Optimization , PSC)最初是处理连续优化问题的, 目前其应用已扩展到组合优化问题。
由于其简单、有效的特点,PSC已经得到了众多学者的重视和研究。
二、粒子群算法的研究现状及研究方向粒子群算法(PSC)自提出以来,已经历了许多变形和改进,包括数学家、工程师、物理学家、生物学家以及心理学家在内的各类研究者对它进行了分析和实验,大量研究成果和经验为粒子群算法的发展提供了各许多合理的假设和可靠的基础,并为实际的工业应用指引了新的方向。
目前,PSC的研究也得到了国内研究者的重视,并已取得一定成果。
十多年来,PSC的研究方向得到发散和扩展,已不局限于优化方面研究。
PSC 算法按其研究方向分为四部分:算法的机制分析研究、算法性能改进研究、算法的应用研究及离散性PSC算法研究。
算法的机制分析主要是研究PSC算法的收敛性、复杂性及参数设置。
算法性能改进研究主要是对原始PSC算法的缺陷和不足进行改进,以提高原始PSC算法或标准PSC算法的一些方面的性能。
粒计算的发展现状与应用研究
中 分 号 T3 圈 类 :P1 1
粒 计 算 的发展 现 状 与应 用研 究
赵小 龙 ,杨 燕
( 西南交通大学信息科学与技术学院 ,成都 6 0 3 ) 1 1 0 摘 要:粒计算是处理信 息和知识过程的一种新的研究方法,覆盖 了所有粒度的理论、方法、技术和工具的研究 。该文综述了粒计 算发展
21 粒计算中量基本问置 . 粒计算中最基本概念 是粒 、粒化和粒度 。粒 是指一些个 体( 元素 、点等)通过不分 明关系( dsn usait) i i i i bly 、相似 n tg h i
关 系 ( m l i )、 邻 近 关 系 (rxm t)或 功 能 关 系 s iry i at po i i y
is e e a s i e s u sa l o g v n. r
[ yw rs rn l mp t g fzystru hstd t nn Ke o d !ga ua c ui ;uz ;og ; a miig r o n e e a
19 9 7年 ,美国 SnJs Sae a oe t 大学教授 TYLn第 1次在 t ..i 他 的论文中提 出了粒计算…(rn l o p t g GR ) 志 gaua c m ui , C ,标 r n 着涉及多学科的一个应用研究领域产生。此后 ,国外 的诸 多
现状、粒 计算的理论、粒计算模型与方法、粒 计算在数据挖掘 中的应用研究 ,并给出了粒计算未来可能的研究方向。 关健词:粒计算 ;fzy ;r g 集 ;数据挖掘 uz 集 o h u
De eo m e t t t sa d Ap l a i n Re e a h o v lp n a u n p i to s r c n S c Gr n l rCo p t g a ua m u i n
基于粒计算的大数据处理_徐计_王国胤_于洪
网络出版时间:2014-11-28 19:00 网络出版地址:/kcms/detail/11.1826.TP.20141128.1900.001.html
XU Ji, WANG Guo-Yin , YU Hong,Review of Big Data Processing Based on Granular Computing,Chinese Journal of
Computers,2014, Vol.37: Online Publis014 年
feasibility and advantages of applying GrC to process big data are discussed subsequently, and the related key problems rising in GrC-based big data processing framework are discussed at last. Key words granular computing; big data; cloud computing; deep learning 们试图从人类思维和生物界的一些规律中得到启 发 , 创建相应的计算模型 , 应用到信息科学中去 . 1 引言 人工神经网络、基因计算、群体智能等都是成功的 范例. 粒计算则在更高层次上模拟了人类的思维规 随着人类对客观世界各领域数字化程度的不 律, 也可以将其运用到当前世界面临的大数据挑战 断提高, 每天都有大量的数据产生 , 并且其产生的 中. 最近, 如何将粒计算应用于大数据处理得到了 速度也越来越快. 这些数据来源广泛, 其中最主要 国际国内粒计算研究者的重视. 的有:科学研究(天文学、生物学、高能物理等)、 社交网络、电子商务、物联网、移动通信等 [1]. 根 据 IDC 公司的研究, 全球数字信息总量将在 2009 年到 2020 年期间增长 44 倍, 达到大约 35.2 ZB[2]. 对于如此急剧增长的数据, 各个国家、各个领 域的人们都意识到了其中蕴含着的巨大价值 ; 同 时, 信息技术领域的研究者也感受到由此带来的巨 大挑战. 传统的计算平台、通信网络、DBMS 都变 得难以满足需求的时候, 人们需要在存储技术、下 一代网络、处理器、编程语言和计算模型等领域寻 求新的解决方案. 粒计算作为一种方法论, 旨在有效地建立基于 外部世界、并以用户为中心的概念, 进而简化我们 对物理世界和虚拟世界的认识. 并以此为基础, 在 求解问题的过程中, 用粒度合适的“粒”作为处理 对象, 从而在保证求得满意解的前提下 , 提高解决 问题的效率. 自 1979 年 Zadeh 发表第一篇关于信息 粒度的论文以来, 国内外研究人员对粒计算理论和 模型进行了深入的研究, 同时也将这些理论和模型 与其他计算智能、机器学习的技术相结合, 取得了 大量研究成果. 合适的粒度常常是由问题本身及问题背景决 定的, 这一点对设计基于粒计算的数据处理框架有 重要意义. 举一个关于时间的例子 . 例如张先生问 他的朋友: “你什么时候回国的”, 回答这个问题所 选择的时间粒度其实是由他朋友回国的时间到现 在有多久决定的 . 如果没超过一天 , 那么他会说: “昨天中午”; 如果有十天左右了, 他可以说: “上 周”; 再如果是朋友回国好几年了, 张先生才得知 消息, 那么“2009 年”就可以是一个满意的答案了. 注意到上面几个答案具有不同的粒度, 分别是午、 周和年. 如果不采用合适的粒度 , 统一都用计算机 上常见的时间戳格式来回答, 如: “2013 年 4 月 29 日下午 3 时 25 分”, 就不太合理, 让人觉得别扭. 人工智能和计算智能等学科的诞生, 是因为人
粒子群算法实验报告
算法分析与设计实验报告专业班号组别指导老师姓名同组者实验日期第十四周第 3 次实验实验名称基于粒子群算法的函数优化问题一、实验项目基于粒子群算法的函数优化问题实验,在Windows下基于Matlab完成编程。
二、实验目的粒子群算法,也称粒子群优化算法(Particle Swarm Optimization),缩写为PSO,是近年来发展起来的一种新的进化算法((Evolu2tionary Algorithm - EA)。
这种算法以其实现容易、精度高、收敛快等优点引起了学术界的重视,并且在解决实际问题中展示了其优越性。
为学习其算法思想,有必要掌握并实现基于粒子群算法的函数优化问题实验。
三、实验原理粒子群优化算法(PSO)是一种进化计算技术(evolutionary computation),1995 年由Eberhart 博士和kennedy 博士提出,源于对鸟群捕食的行为研究。
PSO同遗传算法类似,是一种基于迭代的优化算法。
系统初始化为一组随机解,通过迭代搜寻最优值。
但是它没有遗传算法用的交叉(crossover)以及变异(mutation),而是粒子在解空间追随最优的粒子进行搜索。
同遗传算法比较,PSO的优势在于简单容易实现并且没有许多参数需要调整。
目前已广泛应用于函数优化,神经网络训练,模糊系统控制以及其他遗传算法的应用领域。
四、实验内容1、首先编写通用代码粒子群测试各个函数的主代码写出来,对于不同的测试函数,只需要调用相应的测试函数即可,将各个函数做成.m的文件。
matlab源代码程序如下:clear all;clc;format long;%------给定初始化条件----------------------------------------------c1=1.4902; %学习因子1c2=1.4901; %学习因子2w=0.7281; %惯性权重MaxDT=1000; %最大迭代次数D=5; %搜索空间维数(未知数个数)N=40;eps=10^(-6); %设置精度(在已知最小值时候用)%------初始化种群的个体(可以在这里限定位置和速度的范围)------------fori=1:Nfor j=1:Dx(i,j)=randn; %随机初始化位置v(i,j)=randn; %随机初始化速度endend%------先计算各个粒子的适应度,并初始化Pi和Pg----------------------fori=1:Np(i)=function(x(i,:));y(i,:)=x(i,:);end教师评阅意见签名:年月日pg=x(1,:); %Pg为全局最优fori=2:Nif function(x(i,:))<function(pg)pg=x(i,:);end%------进入主要循环,按照公式依次迭代,直到满足精度要求------------for t=1:MaxDTfori=1:Nv(i,:)=w*v(i,:)+c1*rand*(y(i,:)-x(i,:))+c2*rand*(pg-x(i,:));x(i,:)=x(i,:)+v(i,:);if function(x(i,:))<p(i)p(i)=function(x(i,:));y(i,:)=x(i,:);endif p(i)<function(pg)pg=y(i,:);endendPbest(t)=function(pg);end%------最后给出计算结果disp('*************************************************************') disp('函数的全局最优位置为:')Solution=pg'plot(Solution)disp('最后得到的优化极值为:')Result=function(pg)disp('*************************************************************')2、对指定函数的优化(1)Rastrigins.m文件代码如下,即Rastrigins测试函数;function [out]=Rastrigin(x)x=-5.12:0.01:5.12;cos_in = cos(2*pi*x);out= sum((x.^2-10*cos_in + 10), 2); 在matlab中运行结果如下:函数的全局最优位置为:Solution =0.576475699699576-0.8607542255463701.2205658276826261.4207354825753010.552791439208896最后得到的优化极值为:Result =1.899896389267265e+004(2)函数2:使用粒子群算法对Griewank函数进行优化:将下面代码保存成Griewank.m文件,代码如下:Dx=length(in(1,:));tlenx=length(in(:,1));if isempty(D) | D~=Dx | tlen~=tlenxD=Dx; % dimension of probtlen=tlenx; % how many separate statesd=repmat([1:D],tlen,1);sqrtd=sqrt(d);enddat1= sum([(in-100).^2],2)./4000;dat2 = prod( (cos( (in-100)./sqrtd )) ,2);out = dat1 - dat2 + 1;然后将主函数中的function替换成Griewank,然后在matlab中运行即可,运行结果如下:函数的全局最优位置为:Solution =1.0e+002 *0.0893938350249221.3550750755471630.9456676451135421.188118773920475 0.929927307049068最后得到的优化极值为:Result =2.497904795831135 (3)函数3:使用粒子群算法对Foxhole函数进行优化:将下面代码保存成Foxhole.m文件,代码如下:function [out]=Foxhole(in)%x=in(,1);%y=in(,2);term_sum=0;x=in(:,1);y=in(:,1);a{1} = [...-32 -16 0 16 32 ;...-32 -16 0 16 32 ;...-32 -16 0 16 32 ;...-32 -16 0 16 32 ;...-32 -16 0 16 32 ;...];a{2} = [...-32 -32 -32 -32 -32 ;...-16 -16 -16 -16 -16 ;...0 0 0 0 0 ;...16 16 16 16 16 ;...32 32 32 32 32 ;...];term_sum=0;for j=1 :numel((a{1}))ax=a{1} (j);ay=a{2} (j);term_sum = (x - ax).^6 + (y - ay).^6;term_sum=term_sum+ 1.0/(j+term_sum);endout = .002 + term_sum;运行结果如下:函数的全局最优位置为:Solution =31.9995033209264196.742047876319869-4.28812078367820514.91807014291851313.732644871242318最后得到的优化极值为:Result =0.042000000000000。
知识空间理论综述
知识空间理论综述
李金海;张瑞;智慧来;孙文
【期刊名称】《模式识别与人工智能》
【年(卷),期】2024(37)2
【摘要】知识空间理论是一种研究教育规律的科学方法,已取得一系列研究成果.文中旨在全面综述知识空间理论的研究工作.首先,阐述构建知识结构的方法和原则,介绍良级性的研究内容,并强调其在知识空间理论研究中的重要性,归纳总结推测关系
的相关工作,并介绍问题之间、项目之间推测关系的研究方法.然后,分别从技能映射、技能函数、能力-绩效方法三方面梳理基于能力的知识空间理论的研究进展.进一步地,概述知识空间理论与概率模型、粒计算等结合的研究现状,并介绍知识空间理论
在辅助学习与自适应测试方面的应用.最后,探讨上述研究中存在的关键科学问题,并提出初步的研究思路,为该领域的后续研究提供有益的参考.
【总页数】22页(P106-127)
【作者】李金海;张瑞;智慧来;孙文
【作者单位】昆明理工大学数据科学研究中心;昆明理工大学理学院;泉州师范学院
数学与计算机科学学院;闽南师范大学数学与统计学院
【正文语种】中文
【中图分类】TP182
【相关文献】
1.知识外溢当地化、企业家精神与产业集中——国外一个基于知识生产函数视角的理论综述
2.中国新型城镇化的空间理论反思——“马克思主义空间理论与中国新型城镇化”高层论坛综述
3.知识图谱综述——表示、构建、推理与知识超图理论
4.以创造性理论研究迎接知识经济的到来和挑战——山东省经济学会第七届会员代表大会暨知识经济理论研讨会综述
5.知识外溢与创新的集聚——基于知识产品函数的一个理论综述
因版权原因,仅展示原文概要,查看原文内容请购买。
粒子群优化算法及其相关研究综述【精品文档】(完整版)
粒子群优化算法及其相关研究综述摘要:粒子群优化是一种新兴的基于群体智能的启发式全局搜索算法,通过粒子间的竞争和协作以实现在复杂搜索空间中寻找全局最优点。
它具有易理解、易实现、全局搜索能力强等特点,倍受科学与工程领域的广泛关注,已经成为发展最快的智能优化算法之一。
本文围绕粒子群优化算法的原理、特点、改进与应用等方面进行全面综述,侧重于粒子群的改进算法,简短介绍了粒子群算法在典型理论问题中的应用,最后对其未来的研究提出了一些建议及研究方向的展望。
关键词:粒子群优化;PSO;群智能优化;智能算法Abstract: Particle swarm optimization is a new swarm intelligence-based heuristic global search algorithm, through competition and collaboration between the particles in order to achieve the advantages of looking at complex global search space. It has easy to understand, easy to implement, strong global search ability and other characteristics, much attention in the field of science and engineering, has become one of the fastest growing intelligent optimization algorithms. This paper focuses on aspects of the principle of particle swarm optimization, characteristics, improvement and application of a comprehensive review, focusing on improved PSO algorithm, a brief description of the particle swarm algorithm in a typical problem in the theory, and finally presented its future research Looking for some advice and research directions.Key Words: Particle Swarm optimization; PSO; Swarm intelligence optimization;Intelligent algorithm1 引言粒子群算法(Particle Swarm optimization,PSO)的基本概念源于对于鸟群捕食行为的简化社会模型的模拟,由Kenndy和Eberhart等人提出[1-2],1995年IEEE国际神经网络学术会议发表了题为“Particle Swarm Optimization”的论文,标志着PSO算法诞生。
粒子群算法研究及其工程应用案例
粒子群算法研究及其工程应用案例一、概述随着现代制造业对高精度生产能力和自主研发能力需求的提升,优化指导技术在精确生产制造领域中的应用日益广泛。
粒子群优化算法(Particle Swarm Optimization,PSO)作为一种基于群体智能的优化算法,因其结构简单、参数较少、对优化目标问题的数学属性要求较低等优点,被广泛应用于各种工程实际问题中。
粒子群算法起源于对鸟群捕食行为的研究,通过模拟鸟群或鱼群等群体行为,利用群体中的个体对信息的共享,使整个群体的运动在问题求解空间中产生从无序到有序的演化过程,从而找到最优解。
自1995年由Eberhart博士和kennedy博士提出以来,粒子群算法已成为一种重要的进化计算技术,并在工程应用中展现出强大的优势。
在工程应用中,粒子群算法可用于工艺参数优化设计、部件结构轻量化设计、工业工程最优工作路径设计等多个方面。
通过将粒子群算法与常规算法融合,可以形成更为强大的策略设计。
例如,在物流路径优化、机器人路径规划、神经网络训练、能源调度优化以及图像分割等领域,粒子群算法都取得了显著的应用成果。
本文旨在深入研究粒子群算法的改进及其工程应用。
对优化理论及算法进行分析及分类,梳理粒子群算法的产生背景和发展历程,包括标准粒子群算法、离散粒子群算法(Discrete Particle Swarm Optimization, DPSO)和多目标粒子群算法(Multi Objective Particle Swarm Optimization Algorithm, MOPSO)等。
在此基础上,分析粒子群算法的流程设计思路、参数设置方式以及针对不同需求得到的改进模式。
结合具体工程案例,探讨粒子群算法在工程实际中的应用。
通过构建基于堆栈和指针概念的离散粒子群改进方法,分析焊接顺序和方向对高速铁路客车转向架构架侧梁的焊接残余应力和变形的影响。
同时,将粒子群算法应用于点云数据处理优化设计,提高曲面重建和粮食体积计算的精度和效率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2卷第6期 智 能 系 统 学 报 V ol.2 .62007年12月 CAAI T ransactions on Intelligent Systems D ec.2007粒计算研究综述王国胤1,2,张清华1,2,胡 军1,3(1.重庆邮电大学计算机科学与技术研究所,重庆400065; 2.西南交通大学信息科学与技术学院,四川成都610031;3.西安电子科技大学电子工程学院,陕西西安710071)摘 要:粒计算(gr anular computing)是当前计算智能研究领域中模拟人类思维和解决复杂问题的新方法.它覆盖了所有有关粒度的理论、方法和技术,是复杂问题求解、海量数据挖掘、模糊信息处理的有效工具.首先回顾了粒计算研究和发展状况,介绍了粒计算的基本组成和问题,综述了粒计算的基本模型和方法,并讨论了它们之间的相互关系,最后探讨了构建统一的粒计算模型、复杂问题空间的粒化、粒层之间的转换、高效的粒计算方法、新的粒计算模型、动态粒计算模型、自主粒计算模型、粒计算方法的模糊化以及粒计算模型的应用和推广等几个方面的关键问题.关键词:粒计算;数据挖掘;智能信息处理;粗糙集;模糊集;商空间中图分类号:T P18 文献标识码:A 文章编号:1673 4785(2007)06 0008 19An overview of granular computingWAN G Guo yin 1,2,ZHANG Qing hua 1,2,HU Jun 1,3(1.Institute of Comput er Science &T echno lo gy ,Cho ng qing U niversit y of Po st s and T eleco mmunications,Chong qing 400065,China;2.Scho ol of Infor matio n Science &T echnolog y,Southwest Jiao tong U niv ersit y,Chengdu 610031,China; 3.School of Electro nic Engineer ing,Xidian U niver sity,Xi an 710071,China)Abstract:In the field of com putational intelligence,granular computing (GrC)is a new w ay to simulate hu m an thinking to help solve co mplicated problems.Gr C involv es all the theories,methodo logies and tech niques o f granularity,pr oviding a pow erful to ol for the so lution of complex problems,m assiv e data min ing,and fuzzy information pr ocessing.In this paper,first the current situation and the developm ent pros pects of GrC are introduced,then the fundamental and ex isting problem s r elated to GrC ar e presented and its basic models and metho ds summ arized.Finally,som e future research topics abo ut GrC are presented,such as,uniform granular co mputing mo del,granulation of complex pro blem space,transform ation be tw een granule spaces,efficient g ranular co mputing algor ithm,nov el g ranular co mputing model,dy namic granular co mputing m odel,data driven g ranular co mputing m odel,fuzzy gr anular co mputing method,and the applications of gr anular computing models,etc.Keywords:g ranular computing;data m ining;intelligent inform ation processing;roug h sets;fuzzy sets;quotient space收稿日期:2007 04 02.基金项目:国家自然科学基金资助项目(60573068);新世纪优秀人才支持计划;重庆市教委科学技术研究资助项目(KJ060517).自Zadeh 1979年发表论文!Fuzzy sets and in form ation granularity ∀以来[1],研究人员对信息粒度化的思想产生了浓厚的兴趣.Zadeh 认为很多领域都存在信息粒的概念,只是在不同领域中的表现形式不同.自动机与系统论中的!分解与划分∀、最优控制中的!不确定性∀、区间分析里的!区间数运算∀、以及D S 证据理论中的!证据∀都与信息粒密切相关.H obss 在1985年直接用!粒度(granularity)∀作为论文题目发表论文[2],讨论了粒的分解和合并,以及如何得到不同大小的粒,并提出了产生不同大小粒的模型.Lin 在1988年提出邻域系统并研究了邻域系统与关系数据库之间的关系[3].1996年,他在U C Berkeley 大学访问时,向Zadeh 提出作!granular computing∀的研究,Zadeh称之为!g ranular mathematics∀,Lin改称为!granular co mputing∀,并缩写成Gr C.他发表了一系列关于粒计算与邻域系统的论文[4-10],主要是研究二元关系(邻域系统、Rough集和信任函数)下的粒计算模型,论述基于邻域系统的粒计算在粒结构、粒表示和粒应用等方面的问题,讨论了粒计算中的模糊集和粗糙集方法,并将粒计算方法引入数据挖掘和机器发现.依据人们在解决问题时能从不同的粒度世界去分析和观察同一问题,并且很容易地从一个粒度世界转到另一个粒度世界,张钹和张铃在1990年针对复杂问题求解,建立了一种复杂问题求解的商结构形式化体系,给出了一套解决信息融合、启发式搜索、路径规划和推理等问题的理论和算法[11-12].1997年,Zadeh进一步指出[13],世上有3个基本概念构成人类认知的基础:粒化、组织及因果关系.其中,粒化是整体分解为部分,组织是部分结合为整体,而因果关系则涉及原因与结果间的联系.物体的粒化产生一系列的粒子,每个粒子即为一簇点(物体),这些点难以区别,或相似、或接近、或以某种功能结合在一起.一般来说,粒化在本质上是分层次的,时间可粒化为年、月、日、小时、分、秒就是大家熟悉的例子.在Lin的研究基础上,Yao结合邻域系统对粒计算进行了详细的研究[14-16],发表了一系列研究成果[17-22],并将它应用于知识挖掘等领域,建立了概念之间的if then规则与粒度集合之间的包含关系,提出利用由所有划分构成的格求解一致分类问题,为数据挖掘提供了新的方法和视角.结合粗糙集理论,Yao探讨了粒计算方法在机器学习、数据分析、数据挖掘、规则提取、智能数据处理和粒逻辑等方面的应用.Yao给出了粒计算的3种观点[22]:1)从哲学角度看,粒计算是一种结构化的思想方法;2)从应用角度看,粒计算是一个通用的结构化问题求解方法;3)从计算角度看,粒计算是一个信息处理的典型方法.随着粒计算研究的发展,近年来国内外又有很多学者加入到了粒计算研究的领域.为了探讨粗糙集理论在各种环境下的应用,Skow r on[23-27]以包含度概念来研究粒近似空间上的Rough下近似和Rough上近似.刘清[28-30]在Roug h逻辑的基础上,提出了粒-逻辑的概念(G 逻辑),构造了这种逻辑的近似推理系统,并应用于医疗诊断.近几年来,在掀起粒计算研究的热潮中,商空间理论被人们广泛认识和推广,2003年张铃和张钹将模糊概念与商空间理论结合,提出模糊商空间理论,为粒计算提供了新的数学模型和工具,并成功应用于数据挖掘等领域[31-35].2002年苗夺谦等人[36]对知识的粒计算进行探讨,引入属性的重要度,并在求最小属性约简方面得到应用.王飞跃等人[37]对词计算和语言动力学进行了探讨,以词计算为基础,对问题进行动态描述、分析和综合,提出了设计、控制和评估的语言动力学系统.王国胤等人[38-44]提出了基于容差关系的粒计算模型,利用属性值上的容差关系给出了不完备信息系统的粒表示、粒运算规则和粒分解算法,同时结合粗糙集中的属性约简问题,提出了不完备信息系统在粒表示下属性必要性的判定条件,对粒计算方法在规则提取方面进行了探索.郑征等人[45-47]提出了相容粒度空间模型,并在图像纹理识别和数据挖掘中取得了成功,他们认为,人类具有根据具体的任务特性把相关数据和知识泛化或者特化成不同程度、不同大小的粒的能力,以及进一步根据这些粒和粒之间的关系进行问题求解的能力.卜东波等人[48]从信息粒度的角度剖析聚类和分类技术,试图使用信息粒度原理的框架来统一聚类和分类,指出从信息粒度的观点来看,聚类是在一个统一的粒度下进行计算,而分类却是在不同的粒度下进行计算,并根据粒度原理设计了一种新的分类算法,大规模中文文本分类的应用实践表明,这种分类算法有较强的泛化能力.Zhang等人[49-50]对粒神经网络进行了探讨,并在高效知识发现中得到很好的应用.李道国等人[51]研究了基于粒向量空间的人工神经网络模型,在一定程度上提高了人工神经网络的时效性、知识表达的可理解性.杜伟林等人[52]根据概念格[53]与粒度划分在概念聚类的过程中都是基于不同层次的概念结构来进行分类表示,而且粒度划分本身构成一个格结构的特点,研究了概念格与粒度划分格在概念描述与概念层次转换之间的联系,通过对概念的分层递阶来进行概念的泛化与例化,使概念在递阶方面忽略不必要的冗余信息.Yager[54]探讨了基于粒计算的学习方法和应用.Lin[55]在2006年粒计算国际会议上提出了新的研究思路!infrastruc tures for AI engineering∀.同时,Bargiela和Pe dry cz[56]也从各个侧面对粒计算的根源和实质进行了详细的探讨和总结.Yag er指出,发展信息粒的操作方法是当前粒计算研究的一个重要任务[57].1 粒计算的基本组成粒计算的基本组成主要包括3部分:粒子、粒层#9#第6期 王国胤,等:粒计算研究综述和粒结构.1 1 粒 子粒子是构成粒计算模型的最基本元素[58-59],是粒计算模型的原语.一个粒可以被解释为许多小颗粒构成的一个大个体,现实生活中,粒子无处不在,如在地图上观察洲、国家、海洋、大陆和山脉等是一些粗的粒子(大的粒子),观察省、市、区等是一些中等的粒子,而观察街道、饭店、机场等是一些相对较小的粒子.一个粒子可以被同时看作是由内部属性描述的个体元素的集合,以及由它的外部属性所描述的整体.一个粒子的存在仅仅在一个特定的环境中才有意义.一个粒子的元素可以是粒子,一个粒子也可以是另外一个粒子的元素.而衡量粒子!大小∀的概念是粒度,一般来讲,对粒子进行!量化∀时用粒度来反映粒化的程度[59].1 2 粒 层按照某个实际需求的粒化准则得到的所有粒子的全体构成一个粒层,是对问题空间的一种抽象化描述.根据某种关系或算子,问题空间产生相应的粒子.同一层的粒子内部往往具有相同的某种性质或功能.由于粒化的程度不同,导致同一问题空间会产生不同的粒层.粒层的内部结构是指在该粒层上的各个粒子组成的论域的结构,即粒子之间的相互关系.在问题求解中,选择最合适的粒层对于问题求解尤为关键,因为,在不同粒层求解同一问题的复杂度往往不同.在高一级粒层上的粒子能够分解成为下一级粒层上的多个粒子(增加一些属性),在低一级粒层上的多个粒子可以合并成高一级粒层上的粒子(忽略一些属性).粒计算模型的主要目标是能够在不同粒层上进行问题求解,且不同粒层上的解能够相互转化.1 3 粒结构一个粒化准则对应一个粒层,不同的粒化准则对应多个粒层,它反应了人们从不同角度、不同侧面来观察问题、理解问题、求解问题.所有粒层之间的相互联系构成一个关系结构,称为粒结构[20].粒结构给出了一个系统或者问题的结构化描述.通过从系统思维、复杂系统理论和层次结构理论(技术)中得到的启发至少需要确定一个粒结构网[20]中3个层次的结构:粒子的内部结构、粒子集结构和粒子网的层次结构.粒子集的集体结构可以看作是全部层次结构中一个层次或者一个粒度视图中的结构.它本身可以看作是粒的内部连接网络.对于同一个系统或者同一个问题,许多解释和描述可能是同时存在的.所以,粒结构需要被模型化为多种层次结构,以及在一个层次结构中的不同层次.虽然一个粒子在某个粒层上被视为一个整体,但粒子内部元素(子粒子)的结构在问题求解时也很重要,因为它能提供粒子更为详细的特性.而在同一层上的粒子之间也具有某种特殊的结构,它们可能是相互独立,或者部分包含.如果同一粒层上的粒子之间的独立性越好,可能问题求解后合并起来越方便;反之,如果粒子之间的相关性越好,则问题求解后的合并工作相对越繁杂.粒子网的层次结构是对整个问题空间的概括,它的复杂性在一定程度上决定了问题求解的复杂程度.2 粒计算的基本问题粒计算中存在2个最基本的问题,即粒化和粒的计算.问题空间的粒化是指将问题空间分解为许多子空间,或是基于有用的信息和知识将问题空间中的个体聚集成不同的类,这些类称之为粒.粒中的元素可以理解为对应概念的实例.可以把粒计算和概念生成、知识发现和数据挖掘联系起来,因为概念生成的目的之一是对具有某些概念的粒的表示、特征化、描述和解释,而知识发现和数据挖掘就是在粒之间建立关联和因果等联系.2 1 粒 化粒化是问题求解空间的一个构造性过程,它可以简单理解为在给定粒化准则下得到一个粒层的过程,是粒计算基础单元的构建,包括粒子、粒视图、粒网和层次结构.在不同的粒化准则下就得到多个粒层,进而得到粒层的网络结构.通常的粒化方法有自顶而下通过分解粗粒子得到细粒子的方法,和自底向上将细粒子通过合并得到粗粒子的方法.粒化过程是粒计算的必要过程.问题空间的粒化过程主要涉及粒化准则、粒化算法(方法)、粒子和粒结构的表示(描述)以及粒子和粒结构的定性(定量)描述等问题[59].粒化准则主要是语义方面的问题,解决为什么2个对象能放进同一个粒子内的问题.它是根据实际问题求解的具体需求和具体精度要求得到的.粒化准则的一个基本要求是忽略掉那些无关紧要的细节,从而达到降低问题求解复杂度的目的.粒化方法面对实际问题,回答如何对问题空间进行粒化,采用什么算法或工具实现粒层的构造,它属于算法方面的问题.如在粗糙集理论中,如何对对象集进行划分产生粒层,如何高效实现属性的约简等问题.粒子的结构描述主要是用粒化方法得到的粒子,如何用形式化的语言表述出来,以便后面进行计算.例如在粗糙集理论模型中,粒子的表示可能是一个子集.而#10#智 能 系 统 学 报 第2卷在概念格理论中,粒子的表述就是一个概念,它包括概念的外延(一个对象子集)和内涵(一个属性子集) 2部分.粒结构的描述往往形式多样,在商空间理论模型中,粒结构是一种分层递阶的结构,在概念格模型中,粒结构是一种H asse图.粒子和粒结构的定性、定量描述主要指粒子和粒结构的大小(主要是指粒度的结果)和复杂性度量.当前,成功的粒化方法往往都是以将解空间形成划分空间为主要的目标,这样便于将子空间上的解合成原问题空间的解,商空间理论就是这样一个成功的实例.当然,如果用某种粒化方法形成的解空间不是划分(如覆盖),这将增加合成的复杂度.2 2 粒的计算以粒子为运算对象进行问题的求解或推理,是狭义的粒计算.粒计算可以通过系统访问粒结构来解决问题,包括在层次结构中向上和向下2个方向的交互,以及在同一层次内的移动,主要分为2种[59]:同一粒层上粒子之间相互转换和推理,不同粒层上粒子之间的转换或推理.不同粒层之间的联系可以由映射来表示,在不同粒层上同一问题以不同的粒度、不同的细节表示,粒层之间的映射就建立了同一问题的不同细节描述之间的关系.商空间理论模型就是通过自然投影建立了分层递阶的商空间链式结构.粒计算的主要特点是同一问题的解可以在不同粒层之间自由转化.正是基于这一点,人们才能用粒计算方法高效地实现复杂问题的求解.模糊商空间上的分层递阶结构可以通过模糊等价关系的截关系建立相应的转化联系;粗糙集理论中的划分粒度可以通过属性的增加或删减来控制;而概念格理论模型中的概念粒子的相互转化可以通过改变概念的内涵来实现.这些转化虽然方式不同,但一个共同的特点是在转化的过程中,问题求解的重要性质必须能在不同粒层上表现出来,这也是评价粒化方法好坏的一个重要指标.如果在粒化后粒层之间的相互转化过程中,某些重要属性不能体现出来,这不但不利于问题的求解,反而会导致问题求解过程发散,从而增加问题求解的复杂度.商空间理论模型中的!保真∀和!保假∀原理使得粒化后形成的商空间具有!保序∀性,使得问题求解的搜索空间大大减少,复杂度由相乘变为相加.粒计算的2个基本问题中,粒化是关键,它直接决定粒计算的成功与否.因此,粒化方法是人们研究的热点问题.目前,粒化方法很多,如基于等价关系的划分产生粒子[17],基于模糊集产生模糊信息粒[1],基于模糊等价关系截集产生分层递阶粒空间[35],基于概念格产生概念信息粒和概念知识粒[60],基于邻域系统产生邻域粒子[3]等等.总之,粒计算是一个多准则学科,它从许多领域中获得其基本的思想、准则和方法,是基于不同层次粒度和细节的问题求解的一般性理论.在粒计算的!大伞∀下进行统一的研究,可以发现不同学科之间原理的关联,它与具体的学科研究是相互独立的[59].一旦掌握了粒计算中的结构化思维和结构化问题求解的抽象思想,就可以很容易地在任何领域中运用.3 粒计算的主要模型与理论方法3 1 词计算模型高标准的精确表达,普遍存在于数学、化学、工程学和另外一些!硬∀科学之中,而不精确表达却普遍存在于社会、心理、政治、历史、哲学、语言、人类学、文学、文艺及相关的领域中[61].针对复杂且非明晰定义的现象,无法用精确的数学方法来描述,但可以用一些程度词语,如不很可能、十分不可能、极不可能等,来对某些模糊概念进行修饰.尽管普通的精确方法(如数学)在某些科学领域应用相当广泛,也一直尝试着应用到人文学科中,但人们在长期的实践中已经清楚地认识到精确的方法应用到人文学科有很大的局限性.面对巨大而又复杂的人文学科系统,区别于传统方法的新方法∃∃∃模糊计算方法被Zadeh提出.在人类的认识中,粒的模糊性直接源于无区别、相似性、接近性以及功能性等这些概念的模糊性.人类具有在不精确性、部分知识、部分确定以及部分真实的环境下作出合理决策这一不同寻常的能力,而模糊信息粒化正是这种能力的基础.在模糊逻辑中,模糊信息粒化是语言变量、模糊!if then∀规则以及模糊图的基础.词计算(com puting w ith w o rds)是用词语代替数进行计算及推理的方法[62].如何利用语言进行推理判断,这就要进行词计算.信息粒化为词计算提供了前提条件,词计算在信息粒度、语言变量和约束概念上产生了自己的理论与方法,意在解决模糊集合论的数值化隶属度函数表示法的局限性、表达的概念缺乏前后联系、逻辑表达和算子实现的复杂性等问题,使它们能够更符合人类的思维特点.词计算有狭义和广义2个方面的概念.狭义的模糊词计算理论是指利用通常意义下的数学概念和运算(如加、减、乘、除等)构造的带有语义的模糊数值型的词计算的理论体系;广义的词计算理论统指用词进行推理、用词构建原型系统和用词编程,前者是后者的基#11#第6期 王国胤,等:粒计算研究综述础[63].模糊逻辑在词计算中起中心作用,它可以近似地被认为与词计算相同[62].在词计算中存在2个核心问题:模糊约束的表现问题和模糊约束的繁殖问题,它们是模糊信息粒化的基本准则.信息粒化(infor mation granulation)是粒化的一种形式.在众多的信息粒化中,非模糊粒化的方法很多,如将问题求解空间形成划分空间,每个粒子都是精确的.但这种粒化方法不能解决很多现实问题,如将人的头部粒化为脸、鼻子、额头、耳朵、头盖、脖子等粒子,这些粒子之间没有明确的分界线,它们都是模糊的粒子.模糊信息粒化是传统信息粒化的一种推广.模糊信息粒化理论[64-65](theor y of fuzzy information g ranulation,TFIG)建立在模糊逻辑和信息粒化方法基础之上,是从人类利用模糊信息粒化方式中获得的启发,其方法的实质是数学.Zadeh指出[64],除模糊逻辑外,没有一种方法能提供概念框架及相关技术,它能在模糊信息粒化起主导作用.继Zadeh之后,许多学者开始了有关词计算的研究工作,Wang[66]编写了词计算一书.广义词计算理论的研究工作,中国刚刚起步,李征等人[67-68]通过研究模糊控制器的结构,认为模糊控制实际上是应用了信息粒化和词计算技术,但却只是应用了该技术的初级形式,而基于信息粒化和词计算(IGCW)的模糊控制系统,将具有更强的信息处理和推理判断能力,是对人类智能更高程度的模拟.他们指出,基于信息粒化和词计算的模糊控制系统是通过信息粒化和重组、多层次的思维决策,动态地改变下层控制器的参数和推理方法或控制规则,因而使控制器具有变结构和多模态的特性.信息太多会延误推理计算的时间,给系统带来不必要的处理任务;而信息太少,则会降低推理结果的完善性.因此,提出了合理重新组织信息的研究课题.随着近年来智能信息处理的不断深入与普及,特别是处理复杂系统分析与评估时的迫切需要,人们越来越发现排除自然语言的代价太大了.首先,从应用角度来看,人类已习惯于用自然语言描述和分析事物,特别是涉及社会、政治、经济和管理中的复杂过程.人类可以方便地利用以自然语言表示的前提进行推理和计算,并得到用自然语言表达的结果;其次,从理论角度来看,不利用自然语言,现有的理论很难甚至不能够处理感性信息,而只能处理测度信息.感性信息或知识通常只能用自然语言来描述,由于人类分辨细节和存储信息的认知能力的内在限制,感性信息在本质上是不精确的[69-72].W ang利用自然语言知识和信息,建立以词计算为基础的语言动力学系统(linguistic dynamic system s,LDS),并通过融合几个不同领域的概念和方法[37],提出基于词计算的语言动力学系统的计算理论框架,根据这个计算理论框架,利用常规或传统数值动力学系统中已有的成熟概念和方法,对语言动力学系统进行动力学分析、设计、控制和性能评估.这些研究的目的是建立连接人类的语言知识表示与计算机的数字知识表示的桥梁,成为下一代智能化人机交互的理论基础之一.总之,词计算理论和方法对于复杂信息系统的模糊推理和控制非常重要,但由于自身的局限性,它必须和其他理论体系相结合,才能更有效地处理复杂信息.3 2 粗糙集模型一个对象属于某个集合的程度随着属性粒度的不同而不同,为了更好地刻画集合边界的模糊性,波兰学者Paw lak[73]在20世纪80年代提出了粗糙集理论,其本质思想是利用不可分辨关系(等价关系)来建立论域的一个划分,得到不区分的等价类(即不同属性粒度下的概念粒),从而建立一个近似空间(由不同大小的概念粒形成).在近似空间上,用2个精确的集合(上近似集和下近似集)来逼近一个边界模糊的集合.如果近似空间的粒度较粗,被近似的集合的边界域较宽,而如果近似空间的粒度较细,被近似集合的边界域较窄.给定集合X上的一个划分等价于在X上给定一个等价关系R.X/R表示U上由R导出的所有等价类,[x]R表示包含元素x的等价类,其中x%U. Paw lak称之为在论域上给定了一个知识基(X,R),然后讨论一个一般的概念X(U中的一个子集)如何用知识基中的知识来表示.对那些无法用(X,R)中的集合的并来表示的集合,借用拓扑中的内核和闭包的概念,引入下近似和上近似的概念:R-(X)= {x%U|[x]R X}和R-(X)={x%U|[x]R&X∋ }.当R-(X)∋R-(X)时,就称X为粗糙集,从而创立了!粗糙集理论∀.粗糙集理论是一种软计算方法.软计算(soft computing)概念是由模糊集创始人Zadea提出的[61-65].传统的计算方法即所谓硬计算,使用精确、固定和不变的算法来表达和解决问题;而软计算的指导原则是利用所允许的不精确、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调.粗糙集理论的研究,已经经历了20多年的时间,无论是在系统理论、计算模型的建立和应用系统的研制开发上,都已经取得了很多成果,也建立了一套较为完善的粗糙集理论体系[74-75].目前粗糙集理#12#智 能 系 统 学 报 第2卷。