浅谈粒度计算
浅谈粒度计算
![浅谈粒度计算](https://img.taocdn.com/s3/m/ed77417dbd64783e08122b2c.png)
浅谈粒度计算摘要:粒度计就是新近兴起得人工智能研究领域得一个方向,本文简单介绍粒度计算得要紧三个方法,以及之间得关系.关键词:粒度计算、模糊逻辑、商空间理论、粗糙集理论.一.引言人们在考虑咨询题时,或者是先从总体进行观看,然后再逐步深入地研究各个部分得情况;或先从各个方面对同一咨询题进行不同侧面得了解,然后对它们进行综合;或是上面两种方法得组合,即时而从各侧面对事物进行了解,然后进行综合观看,时而综合观看后,对不甚了解得部分再进行观看……总之,依照需要从不同侧面、不同角度反复对事物进行了解、分析、综合、推理最后得出事物本质得性质和结论人工智能研究者对人类这种能力进行了深入地研究,并建立了各种形式化得模型本文要介绍得粒度计算,确实是对上述咨询题得研究得一个方面人工智能最要紧得目得是,为人类得某些智能行为建立适当得形式化模型,以便利用计算机能再显人得智能得部分功能.什么是人类得最要紧得智能,或者讲智能得最重要表现形式是什么.各家有不同得看法,如simon等认为人得智能表现为,对咨询题求解目标得搜索(search)能力.比如学生在证明一道平面几何题目时,进行考虑,“聪慧得小孩”能非常快地寻到证明该结论得有关得定理性质,并非常快地应用上去,从而就得到证明.wwwM“数学能力差得学笨赡芏椅餮埃也坏胶鲜实亩ɡ砗托灾剩评慈迫ィ艿貌坏街っ鞯囊欤籔awlak[p1]则认为人得智能表现为对事物(事件、行为、感知等)得分类(classification)能力.如平常我们讲某大夫本领大,确实是这位大夫能从病人得症状中,正确地诊断出病人是患什么病(分类能力!分出患什么病来)等等.我们认为“人类智能得公认特点,确实是人们能从极不相同得粒度(granularity)上观看和分析同一咨询题.人们不仅能在不同粒度得世界上进行咨询题求解,而且能够非常快地从一个粒度世界跳到另一个粒度得世界,往返自如,毫无困难.这种处理不同世界得能力,正是人类咨询题求解得强有力得表现”[zh1].还有非常多不同得理解,人们正是从这些不同得理解分不建立各自得模型和相关得理论和方法.粒度计算目前国际上有三个要紧得模型和方法,下面简单进行介绍.二三种不同得模型下面简单介绍有关“粒度计算”得三个不同得模型和方法.什么是粒度,顾名思义,确实是取不同大小得对象.也确实是讲,将原来“粗粒度”得大对象分割为若干“细粒度”得小对象,或者把若干小对象合并成一个大得粗粒度对象,进行研究.最近zadeh在[za1]-[za3]中,讨论模糊信息粒度理论时,提出人类认知得三个要紧概念,即粒度(granulation)、组织(organization)、因果(causation)(粒度包括将全体分解为部分,组织包括从部分集成为全体,因果包括因果得关联).并进一步提出粒度计算.他认为,粒度计就是一把大伞它覆盖了所有有关粒度得理论、方法论、技术和工具得研究.指出:“粗略地讲,粒度计就是模糊信息粒度理论得超集,而粗糙集理论和区间计就是粒度数学得子集”.zadeh 得工作激起了学术界对粒度计算研究得兴趣,yyyao和他得合作者对粒度计算进行了一系列得研究[y1]-[y3]并将它应用于数据挖掘等领域,其工作得要点是用决策逻辑语言(dl-语言)来描述集合得粒度(用满足公式f元素得集合,来定义等价类m(f)),建立概念之间得if-then关系与粒度集合之间得包含关系得联系,并提出利用由所有划分构成得格,来求解一致分类咨询题.这些研究为知识挖掘提供了一些新得方法和角度.按zadeh粒度计算得定义,我们提出得商空间理论和pawlak得粗糙集理论都属于“粒度计算”范畴.目前有关粒度计算得理论与方法,要紧有三个.一是zadeh得“词计算理论”(theory of works computing),一是pawlak得“粗糙集理论”(theory of rough set),另一个是我们提出得“商空间理论”(theory of quotient space).下面简单介绍三者得内容:1 词计算理论:zadeh认为人类在进行考虑、推断、推理时要紧是用语言进行得,而语言是一个非常粗得“粒度”,如我们讲“九寨沟得风景非常美”,其中“非常美”那个词就比较“庞统”,也确实是讲其粒度非常粗,如何利用语言进行推理推断,这确实是要进行“词计算”,早在二十世纪六十年代zadeh提出模糊集理论,确实是“词计算”得雏型.沿zadeh得模糊集论得方向,用模糊数学得方法进行有关粒度计算得方法和理论得研究,就构成“粒度计算”得一个特别重要得方法和方向.这也是人们比较熟悉得一个方法.2 粗糙集理论:波兰学者pawlak[p1]在二十世纪八十年代,提出得粗糙集理论,他提出一个假设:人得智能(知识)确实是一种分类得能力,那个假设可能不是非常完备,但却特别精练.在此基础上提出,概念能够用论域中得子集来表示,因此在论域中给定一组子集族,或讲给定一个划分(所谓划分,是指将x分成两两不相交得子集之并).从数学上明白,给定x上得一个划分,等价于在x上给定一个等价关系r.pawlak称之为在论域上给定了一个知识基(x,r).然后讨论一个一般得概念x(x中得一个子集),如何用知识基中得知识来表示,确实是用知识基中得集合得并来表示.对那些无法用(x,r)中得集合得并来表示得集合,他借用拓扑中得内核和闭包得概念,引入r-下近似r-(x)(相当于x得内核)和r-上近似r-(x)(相当于x得闭包),当r-(x)¹r-(x)时,就称x为粗糙集从而创立了“粗糙集理论”.目前粗糙集理论已被广泛应用于各个领域,专门是数据挖掘领域,并获得成功.3基于商空间得粒度计算我们认为概念能够用子集来表示,不同粒度得概念就体现为不同粒度得子集,一簇概念就构成空间得一个划分----商空间(知识基),不同得概念簇就构成不同得商空间故粒度计算,确实是研究在给定知识基上得各种子集合之间得关系和转换以及对同一咨询题,取不同得适当得粒度,从对不同得粒度得研究中,综合猎取对原咨询题得了解这种对粒度得理解与模糊集对粒度得理解不完全一样下面简单介绍基于商空间得粒度计算.31商空间模型下得推理模型商空间得模型用一个三元组来表示,即(x,f,t),其中x是论域,f是属性集,t是x上得拓扑结构当我们取粗粒度时,即给定一个等价关系r (或讲一个划分),因此我们讲得到一个对应于r 得商集记为[x],它对应于得三元组为([x],[f],[t]),称之为对应于r得商空间商空间理论确实是研究各商空间之间得关系、各商空间得合成、综合、分解和在商空间中得推理.在那个模型下,可建立对应得推理模型,并有如下得性质a 商空间模型中推理得“保假原理”(或“无解保持原理”)b 商空间模型中推理合成得“保真原理”所谓“保假原理”是指若一命题在粗粒度空间中是假得,则该命题在比它细得商空间中一定也无解.所谓“保真原理”,是指,若命题在两个较粗粒度得商空间中是确实,则(在一定条件下),在其合成得商空间中对应得咨询题也是确实.这两个原理在商空间模型得推理中起到非常重要得作用,如若我们要对一个咨询题进行求解,当咨询题十分复杂时,常先进行初步分析,即取一个较粗粒度商空间,将咨询题化成在该空间上得对应得咨询题,然后进行求解,若得出该咨询题在粗粒度空间中是无解,则由“保假原理”,马上得原咨询题是无解得.因为粗粒度得空间规模小,故计算量也少,如此我们就能够以非常少得计算量得出所要得结果,达到“事半功倍”得目得.同样利用“保真原理”也可达到落低求解得复杂性目得,设在两个较粗空间x1、x2上进行求解,得出对应得咨询题有解利用“保真原理”可得,在其合成得空间x3上咨询题也有解.设x1、x2得规模分不为s1、s2.因为一般情况下,x3得规模最大可达到s1s2.因此将原来要求解规模为s1s2空间中得咨询题,化成求解规模分不为s1、s2得两个空间中得咨询题.马上复杂性从“相乘”落为“相加”.四.商空间理论、粗糙集理论和模糊集理论之间得关系41在模型上三者基本上描述人类能按不同粒度来处理事物得能力得模型商空间理论、粗糙集理论认为概念能够用子集来表示,不同粒度得概念能够用不同大小得子集来表示,所有这些表示能够用等价关系来描述.词计算理论认为概念是用“词”来表示,而描述“词”得有效得方法确实是模糊集理论. 42研究得对象商空间理论、粗糙集理论、词计算理论都将所讨论得对象得集合构成论域,但讨论对象之间得关系时,却各有不同.粗糙集理论得原型可能是由关系数据库抽象而得得,故其模型为(x,f)(其中x是论域,f是属性集),即通过元素得不同属性值,来描述元素之间得关系,并用元素按不同属性进行得分类来表示不同得概念粒度.商空间理论得原型是分层递阶方法,故其模型为(x,f,t)(其中x是论域,f是属性集,t是x 上得拓扑结构)即除了元素得属性外,还引入元素之间得关系t(用拓扑来描述),从那个意义上来讲,粗糙集理论是商空间理论得一个简单得特例.所以各自研究得着重点和侧重点不同.当给定一个等价关系时,粗糙集理论认为是给定一个知识基,然后讨论任给得一个概念(集合)在那个知识基上如何被表示为知识基上集合之并,以及之间得关系.粗糙集理论要紧利用集合得基数(元素个数)之间得关系,来描述概念之间得隶属关系,如此在一定程度上与模糊集概念联系起来.另外,粗糙集理论还讨论如何利用属性来最简单地表示所对应得知识基,这确实是所谓“简约”咨询题.但因模型缺乏描述元素之间得相互关系得手段,故非常难提取有结构论域中有关结构所提供得信息.所以结构在一定意义下也能够看成是元素得某种属性,但这种属性是多元属性(要用多元函数来表达),一般不能表示为f(x),而要用f(x,y,)表示,如距离要用d(x,y)表示商空间理论着重点不同,它不是只针对给定得商空间(知识基)来讨论知识得表达咨询题,而是在所有可能得商空间中,寻出最合适得商空间,利用从不同商空间(从不同角度)观看同一咨询题,以便得到对咨询题不同角度得理解,最终综合成对咨询题总得理解(解)它得求解过程是在“由所有商空间组成得半序格”中运动转换得过程故可看成是宏观得粒度计算而粗糙集理论是在给定得商空间中得运动,故可看成是微观得粒度计算词计算理论与商空间理论、粗糙集理论稍为不同,它要紧研究(从粒度计算得观点来看它)如何描述由词界定得不同粒度得对象,它更擅长描述由形容词、副词表达得不同粒度得概念,如特别好、非常好、好、非常不错、还好,…等等因为这些词有程度不同得差不,故在一定意义下,词计算理论也给出了描述元素之间得关系,但只限于由属性得强弱程度不同所形成得关系从理论上讲,将商空间理论、粗糙集理论看成是“精确”得粒度计算,那么都可在其模型上引入模糊得概念,得模糊得商空间理论,和模糊得粗糙集理论在[zh2]中我们证明:模糊得等价关系,等价于在某个商空间上得归一等腰距离.即,可将它化成有结构得商空间.因此这三者都可统一地用多尺度得商空间理论来表示如设商空间理论中原来得结构是一距离d1(x,y),那个d1是元素在空间”位置”关系得描述, 而由模糊概念引入得距离d2,能够看成是元素之间得属性关系得描述属性是对元素个体性质得描述,而尺度是对元素之间关系得描述(所以也可看成是多元属性)若属性值是取值于一个良序集上时,多可用模糊集来描述将三者有机地结合起来,对进展粒度计算将有重大意义.43 结构得重要性最后阐述在粒度计算中结构得重要性,在咨询题求解时,人们多从一组前提动身,盼望由它通过一系列得推导,得到结论.若将每个步骤用箭头相连,则得到由前提到目标得一条有向路.或更一般,咨询题求解可看成是在某有结构得空间中,求一条由前提到目标得有向路(或一条路径),因此当空间得结构是拓扑空间时,关于咨询题求解得解得存在性咨询题,就等价于在空间中回答“前提与目标是否处在同一线连通成份中”.而求解咨询题,确实是在有解情况下,求从前提到目标得一条有向路径.利用商空间中粗空间对细空间得“保假性”,(即:若咨询题在粗空间中无解,则在比它细得空间一定也无解)通过合理得分层递阶,可大大落低咨询题求解得复杂性.我们对常遇到得结构如:半序结构、距离结构以及一般拓扑结构,其对应得商空间得构成及不同商空间得综合都给出有效得构造性得算法.对什么情况下分层递能够落低计算复杂性,能落低多少等,我们在[z1]中也进行了详细地论述.在[zh3]中还把统计推断方法引入商空间模型,为多层信息综合、不确定推理、定性推理等,建立数学模型和相应算法,有效落低了计算复杂性.有结构得模型在实际咨询题求解中是经常遇到得,如地理信息中其地理位置之间得关系确实是一个距离结构;在数据仓库中各数据之间得关系可用半序来描述,它也是一种结构;又在路径规划中对象所处空间得位置关系,确实是一种距离得结构;在数据挖掘中得规则发觉,所有得规则全体按其包含关系就构成半序结构等等.在这些有结构得对象中进行咨询题求解利用基于商空间理论得粒度计算将是非常有效得.商空间得方法与目前流行得“粗糙集”方法相同之处在于:基本上利用等价类来描述“粒度”,基本上用“粒度”来描述概念.但讨论得着重点有所不同,我们得着重点是研究不同粒度世界之间得互相转换、互相依存得关系,是描述空间关系学得理论;而目前得粒度计算(如粗糙集理论等)要紧是研究粒度得表示、刻划和粒度与概念之间得依存关系.更要紧得不同在于:我们得理论是在论域元素之间存在有拓扑关系得情况下进行研究得,即论域是一个拓扑空间,而现在得粗糙集理论,其论域只是简单得点集,元素之间没有拓扑关系(只是商集理论,而不是商空间理论),故它们讨论得是无结构得特别情况.另外,粗糙集是在给定得知识基上求解对应得咨询题,如求集合得r-上近似和r-下近似,我们是在(x,t)中讨论各商空间之间得关系,求相应得(各种意义下)上近似空间和下近似空间.从那个角度看,能够讲粗糙集是微观得粒度计算,商空间理论是宏观得粒度计算.这两个理论基本上建立在等价关系之上,所有能够将两者结合起来.zadeh 所讨论得粒度计算与pawlak和我们所讨论得粒度咨询题又有些不同,他要紧是讨论粒度得表示咨询题,他们认为人类是用语言进行各种考虑和推理得,不同得词就表示不同得粒度,那么如何表示它们呢?一般来讲用“语言”、“词(word)”来表示得概念,牵涉到“词计算”咨询题.而词计算,现在最流行得方法是“模糊数学”得方法,因此他得出得结论是:模糊数学应是粒度计算得要紧工具之一.依zadeh得看法,pawlak和我们讨论得粒度是“清楚得粒度”,而他自己讨论得是“模糊粒度”.如何将模糊集得方法引入商空间理论中来,这可从几方面着手进行,一是在论域x上引入模糊集;二是在结构t上引入模糊拓扑结构;三是对我们得核心概念等价关系,引入模糊概念.以上简单介绍了商空间理论、词计算理论、粗糙集等粒度计算方法之间得关系.能够看出这三个不同得粒度计算理论,从考虑咨询题得动身点和解决咨询题得任务,都不尽相同,各有千秋.然而三者都有一个共同得特点,那确实是都考虑到人类智能中,有从不同粒度考虑咨询题得这一特点.如何将三者得优点结合起来,形成更强有力得粒度计算得方法和理论,是今后一个重要得研究课题.一个明显可进行得研究是:将商空间理论与粗糙集方法相结合,或讲将粗糙集方法引入商空间理论中来,或讲在商空间理论中同时讨论微观得粒度计算咨询题,将微观和宏观得粒度计算统一起来,构成一个更加完整得粒度计算理论和方法,将会更有效得.参考文献[p1] z pawlak, rough sets theoretical aspects of reasoning about data, kluwer academic publishers, dordrecht, boston, london, 1991[y1] y y yao, granular computing: basic issues and possible solutions proc of fifth joint conference on information sciences, voli, atlantic city, new jersey, usa, 2000:186-189[y2] yy yao, and x li, comparison of rough-set and interval-srt models for uncertain reasoning, fundamental informatics, 27,1996:289-298[y3] yy yao and ning zhong, granular computing using information table, in ty lin, yy yao, and l a zadeh (editors) data miming, rough sets and granular computing, physica-verlag, 2000:102-124 [za1] l a zadeh, fuzzy logic=computing with words, ieee transactions on fuzzy systems, 4, 1996:103-111[za2] l a zadeh, towards a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic, fuzzy sets and systems, 19, 1997:111-127[za3] l a zadeh, announcement of grc, 1997, csureginaca/~yyao/grc/[zh1] 张钹,张铃《咨询题求解得理论及应用》,清华大学出版社,1990)(英文版bo zhang and ling zhang, theory and application of problem solving, north-holland, elsevier science publishers bv 1992)[zh2] 张铃张钹模糊商空间理论(模糊粒度计算方法)“软件学报”,14(4)2003:770-776 [zh3] zhang ling,zhang bo,statistical genetic algorithm, chinese journal of software vol8,no5:335-344(张铃,张钹,统计遗传算法《软件学报》8(5),1997:335-344.。
粒度分析原理
![粒度分析原理](https://img.taocdn.com/s3/m/791d3b7da22d7375a417866fb84ae45c3b35c2d9.png)
粒度分析原理
粒度分析是一种常用的材料表征方法,通过对材料颗粒的大小
分布进行研究,可以揭示材料的颗粒结构特征,为材料的性能和应
用提供重要参考。
粒度分析原理是基于颗粒在不同尺度下的分布情况,通过一系列实验和数据处理方法,得出材料颗粒的大小分布规律,为材料科学研究和工程应用提供重要依据。
首先,粒度分析原理基于颗粒的尺度效应。
在材料中,颗粒的
尺度效应是指颗粒在微观尺度下的特性和行为。
颗粒的大小分布对
材料的性能和行为有重要影响,因此需要进行粒度分析来揭示颗粒
在不同尺度下的分布规律。
其次,粒度分析原理基于颗粒的形态特征。
颗粒的形态特征包
括颗粒的形状、表面特性等,这些特征对材料的性能和应用具有重
要影响。
通过粒度分析,可以得出颗粒的形态特征参数,为材料的
设计和改进提供科学依据。
另外,粒度分析原理还基于颗粒的分布规律。
颗粒在材料中的
分布规律对材料的性能和行为有重要影响,通过粒度分析可以得出
颗粒在不同尺度下的分布规律,为材料的制备和加工提供重要参考。
总之,粒度分析原理是基于颗粒的尺度效应、形态特征和分布规律,通过一系列实验和数据处理方法,揭示材料颗粒的大小分布规律,为材料科学研究和工程应用提供重要依据。
粒度分析在材料科学、化工、土木工程等领域具有重要应用,对于揭示材料的微观结构特征、改进材料的性能和应用具有重要意义。
综上所述,粒度分析原理是一种重要的材料表征方法,通过揭示材料颗粒的大小分布规律,为材料科学研究和工程应用提供重要依据。
粒度分析在材料领域具有广泛的应用前景,对于推动材料科学的发展和促进工程技术的进步具有重要意义。
流程梳理颗粒度计算公式
![流程梳理颗粒度计算公式](https://img.taocdn.com/s3/m/3a97b560657d27284b73f242336c1eb91a373336.png)
流程梳理颗粒度计算公式颗粒度计算公式流程梳理。
颗粒度是指物质的粒子大小或颗粒的大小分布。
在工程和科学领域中,颗粒度的计算对于材料的性质和应用具有重要意义。
颗粒度计算公式是用来确定材料颗粒大小的数学表达式,通过这些公式可以得出材料的颗粒大小分布情况,从而为工程设计和科学研究提供重要参考。
颗粒度计算公式的梳理包括了颗粒度的定义、常用的颗粒度计算公式以及计算流程。
本文将从这三个方面对颗粒度计算公式进行详细的梳理,希望能够对读者有所帮助。
一、颗粒度的定义。
颗粒度是描述材料颗粒大小和分布的参数,通常用来表示材料颗粒的粗细程度。
在工程和科学领域中,颗粒度对于材料的性质和应用具有重要的影响。
颗粒度可以通过颗粒度分析仪器进行测试和测量,也可以通过计算公式进行估算和预测。
二、常用的颗粒度计算公式。
1. 平均颗粒直径计算公式。
在颗粒度分析中,常用的一个参数是平均颗粒直径。
平均颗粒直径可以通过颗粒度分布曲线来计算,也可以通过以下公式进行估算:D = Σ(ni di^2)/Σni。
其中,D表示平均颗粒直径,ni表示第i个颗粒级别的颗粒数,di表示第i个颗粒级别的颗粒直径。
2. 颗粒度分布计算公式。
颗粒度分布是描述材料颗粒大小分布情况的参数,通常通过颗粒度分布曲线来表示。
颗粒度分布可以通过以下公式进行计算:n(x) = kx^m。
其中,n(x)表示颗粒直径为x的颗粒数,k和m为常数。
3. 最大颗粒直径计算公式。
最大颗粒直径是描述材料中最大颗粒的大小,可以通过以下公式进行计算:Dmax = Σ(ni di)/Σni。
其中,Dmax表示最大颗粒直径,ni表示第i个颗粒级别的颗粒数,di表示第i 个颗粒级别的颗粒直径。
三、颗粒度计算公式的流程梳理。
1. 收集颗粒度数据。
首先需要收集材料的颗粒度数据,包括颗粒分布情况和颗粒直径数据。
可以通过颗粒度分析仪器进行测试,也可以通过实验和观察进行数据收集。
2. 计算平均颗粒直径。
根据收集到的颗粒度数据,可以使用平均颗粒直径计算公式进行计算,得出材料的平均颗粒直径。
云计算的核心技术——粒度计算
![云计算的核心技术——粒度计算](https://img.taocdn.com/s3/m/3ef8b3a4b0717fd5360cdc09.png)
2、云计算的服务是非常个性化的,是多粒度和可变粒度 的。
粒度计算的理论, 模型与方法
![粒度计算的理论, 模型与方法](https://img.taocdn.com/s3/m/cc118edea58da0116c174947.png)
第43卷 第5期2004年10月复旦学报(自然科学版)Journal of Fudan University(Natural Science)Vol.43No.5Oct.2004 文章编号:042727104(2004)0520837205Ξ粒度计算的理论、模型与方法李道国1,2,苗夺谦1,张红云1(1.同济大学计算机科学与工程系,上海 200092;2.太原理工大学阳泉学院,阳泉 045001)摘 要:粒度计算(Granular Computing,GrC)是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究.它是词计算理论、粗糙集理论、商空间理论、区间计算等的超集,也是软计算科学的一个分支.它已成为模糊的、不完整的、不精确的及海量的信息处理的重要工具和人工智能研究领域的热点之一.另着重介绍了粒度计算的研究现状、基本问题、主要模型与方法,并提出了进一步的研究方向.关键词:粒度计算;词计算理论;粗糙集理论;商空间理论中图分类号:TP393 文献标识码:A1 粒度计算的研究现状粒度计算是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究1,现已成为人工智能领域研究的热点之一.20世纪60年代,美国著名数学家Zadeh提出模糊集合论,在此基础上,于1979年首次提出并讨论了模糊信息粒度化问题,推动了模糊逻辑理论及其应用的发展,但在当时未引起足够的重视.接着,Zadeh在1996年提出“词计算理论”2,标志着模糊粒度化理论的诞生.其旨在解决利用自然语言,进行模糊推理和判断,以实现模糊智能控制.随后,美国多特蒙德大学的Helmut Thiele教授于1998年发表了“词计算理论的语义模型”3,促进了词计算理论的发展.词计算理论对因特网上的海量信息资源的高效利用有着深远的影响.基于Zadeh的模糊集论,进行粒度计算理论和方法的研究,已成为“粒度计算”的重要研究方向之一.波兰学者Pawlak于1982年提出了粗糙集理论4.由于粗糙集理论具有很强的定性分析能力,能够有效地表达不确定的或不精确的知识,善于从数据中获取知识,并能利用不确定、不完整的经验知识进行推理等,因此在知识获取、机器学习、规则生成、决策分析、智能控制等领域获得了广泛应用,特别是在数据挖掘领域,获得了巨大成功,业已成为粒度计算研究领域的主要方向之一.加拿大Regina大学教授Y.Y. Yao在研究粗糙集理论的基础上,提出了基于邻域系统的粒度计算模型5,并成功应用于知识发现领域.粒度计算作为专门的术语,首次出现在Zadeh的文献6中.后来,T.Y.Lin、Y.Y.Yao和Zadeh又在文献7中着重描述了粒度计算的重要性,这激发了人们对它的研究兴趣.随后,大量的关于粒度计算研究的文献相继发表,而且在国际上形成了专门的研究群体,定期召开关于粒度计算的国际研讨会.在国内,张钹院士和张铃教授提出了基于商空间的粒度计算模型8.其利用子集来表示概念,不同粒度的概念就体现为不同粒度的子集,一簇概念就构成空间的一个划分———商空间(知识基),不同的概念簇就构成不同的商空间.而粒度计算问题,也就等价于研究在给定知识基上的各种子集合之间的关系和转换.对同一问题,可以采取不同的粒度,通过对不同的粒度的分析,综合获取对原问题的求解.在此基础上,张铃、张钹于2003年提出了模糊商空间理论9.总的来看,粒度计算的研究在国内属于起步阶段,尚Ξ收稿日期:2004205212基金项目:国家自然科学基金资助项目(60175016)作者简介:李道国(1965—),男,副教授,博士生;苗夺谦(1964—),男,教授,博士生导师.838复旦学报(自然科学版) 第43卷未引起广泛关注.但我们相信,不久的将来会有越来越多的学者加入到该领域的研究中来.2 粒度计算的基本问题粒度计算的基本问题包括两个主要的方面,一个是如何构建信息粒度,另一个是如何利用粒度去计算.前者处理粒度的形成、粗细、表示和语义解释,而后者处理怎样利用粒度去求解问题.信息粒度的形成、表示、粗细、语义解释;信息粒子的大小;信息粒度粗细与求解有效度的关系;信息粒度的运算法则;信息粒度之间及其与外部环境的关系等,这些内容构成一个粒度世界.粒度世界是否构造得合理极大地影响着问题求解的效率.定义1 (粒度)设给定论域U和U上的一个关系R∶U P(U),]U=∪G i,则称每一个G i为一i∈τ个信息粒子,{G i}i∈τ是论域的一种粒度.其中,P(U)表示论域U的幂集;R可代表等价关系、不可区分关系、功能相近关系、相似关系、相等关系、约束、相容关系、复合关系、模糊关系、属性、投影、结构关系和一般的函数等.当Πi,j∈τ,i≠j]G i∩G j= ,则称{G i}i∈τ是论域的无重叠粒度划分,简记为{G i}i∈τ=[U;当ϖi,j∈τ,i≠j]G i∩G j≠ ,则称{G i}i∈τ是论域的一种覆盖,简记为{G i}i∈τ=<U>.定义2 (粒子的大小)设U是给定的一个论域,粒度划分U=∪G i,则称粒子G的大小为d(G)=i∈τCard(G)=|G|=∫G d x.注意:当论域为离散情形时,积分表示信息粒子G所含个体的总个数,也可能是可列个;当论域为连续状态时,积分表示信息粒子G长度的度量值,也可能是无穷大或不可数;当G为模糊信息粒子时,公式中的G表示集合{x|μG(x)>0,Πx∈U}.定义3 (信息粒度粗细)设 是论域上关系的全体,且R1,R2∈ ,若对Πx,y∈U,x R1y]x R2y,则称R1比R2细,简记为R2<R1.一个关系代表一种分类,因此,也可表示粒度粗细.设R0<R1<R2<…<R end,表示一个嵌套关系簇,其中R0代表论域本身是一个等价类,即最粗的划分;R end代表Πx,y∈U,x R end yΖx=y,即最细的划分;其他的表示中间层次的划分.注意:同一论域的粒度之间存在不能比较粗细的情形.我们知道,信息粒度的粗细影响着计算复杂度和问题的求解效度.在问题求解过程中,同一个粒度世界或不同粒度世界所要求描述的信息含量和相互变换决定了信息粒度的粗细优化.粒度计算的目的就是在误差允许的范围内,尽量找到计算复杂度最小的足够满意的可行近似解.因此,可以认为粒度计算是降低计算复杂度的有效工具.总之,如何在问题求解时选择恰当的粒度层次,以使求解效度达到最佳,这是粒度计算的一个关键内容之一.3 粒度计算的主要模型与方法3.1 基于模糊集合论的词计算模型Zadeh认为人类在进行思考、判断、推理时主要是用语言进行的,而语言是一个很粗的粒度,如何利用语言进行推理判断,这就是要进行“词计算”.狭义的模糊词计算理论是指利用通常意义下的数学概念和运算,诸如,加、减、乘、除等构造的带有不确定或模糊值的词计算的数学体系.它借助模糊逻辑概念和经典的群、环、域代数结构,构造出以词为定义域的类似结构.例如,模糊数及其运算2.尽管这种数值型模糊粒度的理论体系,在模糊控制、图像识别、语言处理、故障诊断、信息检索、人工智能等领域获得了较大的成功.但是由于自身存在的不足限制了它的应用范围.广义的模糊词计算理论统指用词进行推理、用词构建原型系统和用词编程.总之,基于词计算理论的推理、决策和识别方式是最贴近人类的思维形式来求解问题,它对复杂的系统的信息处理有着广阔的应用前景.3.2 基于粗糙集理论的粒度计算模型基于知识代表分类的能力的观点,Pawlak创立了粗糙集理论.粗糙集理论的核心思想是给定一个论域U (有限的非空集合),及论域U 上的一个等价关系R ΑU ×U ,称序对(U ,R )是一个近似空间或知识库.在近似空间中,等价关系将论域U 分割成两两互不相交的等价类,每一个等价类对应一个粒子,等价关系的实质是从论域U 到论域U 的幂集2U 上的一个映射R ∶U 2U ,同时称商集U/R ={x ]R |Πx ∈U}是近似空间的一组知识基,也代表了论域的一种粒度.这样对于论域上的任何一个子集X (近似空间的一个概念)就可以用它的上、下近似算子来刻画,其中,(1)apr (X )=R (X )={x |x ∈X ,x ]R ΑX }为X 的下近似,表示论域中完全肯定隶属于X 的元素组成的集合,即代表X 包含的最大内核;(2)apr (X )= R (X )={x |x ∈U ,x ]R ∩X ≠ }为X 的上近似,表示论域中所有肯定和有可能隶属于X 的元素组成的集合,即代表包含X 的最小闭包.在粗糙集理论中,一个对象是否隶属于某一集合(概念),不是该元素的客观性质,而是取决于我们对它的了解程度,同样,集合的相等和包含也没有绝对的意义,也是取决于我们对所研究的问题中的集合的了解程度,这更符合人类的认知过程.而且对一些特殊类型的信息系统,例如数据挖掘等,Pawlak 的粗糙集理论获得了巨大成功.但它同样存在着“瓶颈”问题,诸如,(1)知识表示依赖于论域上的关系;(2)缺少有效处理现实问题的代数运算体系;(3)缺乏基本粒度的语义解释;(4)缺乏描述粒度之间结构信息的方法等.3.3 基于商空间的粒度计算模型张钹院士和张铃教授在研究问题求解时,独立地提出了商空间理论.该模型是用一个三元组(U ,F ,T )来描述一个问题,其中U 表示论域,F 是属性集,T 是U 上的拓扑结构.在该模型中,论域的一种粒度化就等同于给定一个等价关系R 或一个划分,于是得到一个对应于R 的商集[U ,对应的三元组为([U ,F ,T ]),称之为对应于R 的商空间.商空间理论就是研究各商空间之间的关系、合成、综合、分解和推理.它的最重要的性质是同态原则,即保真原理(或保假原理).当面对一个复杂问题时,常先将问题化成在一个较粗粒度商空间对应的问题进行初步分析,若得出该问题在粗粒度空间中是无解,则由“保假原理”,立即得原问题是无解的.这样我们就可以以很少的计算量得出所要的结果,达到“事半功倍”的目的.同样利用“保真原理”也可达到降低求解的复杂性目的.在此基础上建立了“粒度世界模型”以及一整套理论和相应的算法,并将其应用于启发式搜索、路径规划等方面,取得一定成效.他们又将模糊集合论引入商空间,利用模糊等价关系实现了商空间模型的推广,这必将有助于粒度计算的发展,能够更好地反映人类处理不确定问题的若干特点,诸如信息的确定与不确定、概念的清晰与模糊等都是相对的,都与问题的粒度有关.因此,构造合理的分层递阶的粒度结构,可以高效地求解问题和处理信息.另一方面,商空间理论同样缺少实现粒度与粒度之间、粒度与粒度世界之间、粒度世界与粒度世界之间转换的手段和技术方法.如果能够探索出有效的技术和方法来解决这个问题,将会拓宽商空间的应用范围,极大丰富粒度计算的理论.另外,基于模糊集合论产生的Shadowed Sets 7,用三元组(0,1,0,1)描述一个模糊集合,将模糊性局限在影集中,优越于隶属函数的表示方法,减少了运算过程中有用信息的损失,缩短了模糊集与粗糙集的概念和算法的距离,使它更有效地求解一些特殊类型的问题.区间理论、定性分析理论、量化理论和证据理论都是粒度计算的一种工具,对它们的研究也不可忽视.经典的分组、聚类和分类方法在许多应用领域获得了不少成功,形成了比较完善的理论体系,对粒度计算有着重要的指导意义和借鉴价值.4 模型之间的关系分析对三种主要模型的比较分析,有益于我们深刻理解它们之间的联系与区别,有益于我们找到它们的融合点,实现构建统一的更加有效的处理复杂和模糊的信息系统的理论平台.模糊集和粗糙集理论都能够处理不确定和不精确的问题.然而它们的侧重点不同,模糊集合论中的对象x 的隶属度不依赖于论域中的其他对象,一般是由专家直接给出,因此带有很强的主观性且缺乏精度的概念;而粗糙集理论中对象的隶属函数值却依赖于知识库,它可以从所需处理的数据中直接得到,所938第5期 李道国等:粒度计算的理论、模型与方法048复旦学报(自然科学版) 第43卷以用它来反映知识的模糊性是比较客观的.同时二者也存在着联系,因为近似空间中的任何一个子集A (概念)实际上都对应于一个模糊集μA,其上下近似分别等价于该模糊集的核和支撑,即:R(A)= core(μA)={x|μA(x)=1}, R(A)=supp(μA)={x|μA(x)>0}.由此可见,下近似是μA的12截集,上近似是μA的强02截集.总之,模糊集合论与粗糙集理论有很强的互补性,这两个理论优化、整合去处理知识的不确定性和不完全性已显示出更强的功能.例如,Shadowed Sets是在模糊集合的框架体系上发展起来的,但处理信息的方法却类似于粗糙集,在一些领域的应用显示出了优势.还有许多的模糊粗糙集混合模型解决了一些单一模型无法解决的实际问题.这说明,理论的融合是求解复杂问题的一种有效途径.商空间理论与粗糙集理论都是利用等价类来描述“粒度”,再用“粒度”来描述概念.但是,讨论的出发点有所不同.商空间理论的着重点是研究不同粒度世界之间的互相转换、互相依存的关系,是描述空间关系学说的理论,而粗糙集理论主要是研究粒度的表示、刻画和粒度与概念之间的依存关系;商空间理论是在论域元素之间存在有拓扑关系的前提下进行研究的,即论域是一个拓扑空间,而粗糙集理论的论域只是对象的点集,元素之间拓扑关系不在考虑之内,这些差异对问题求解都有一定的影响.模糊集合论的粒度计算模型与商空间理论讨论的粒度问题也不尽相同.模糊集合论模型主要讨论粒度的表示问题,即当人类进行各种思考和推理时,都离不开粒度.粒度一般就是用语言、词来表示,这就涉及到“词计算”问题.对于词计算,目前主要是基于模糊集合论的方法.商空间模型主要论述的是,当一个问题很复杂时,人们常从比较“粗”的粒度层次出发来考察问题,一步步细化,直到问题得到确定解答.从商空间的观点看,三者之间表面上完全不同,但本质上有着紧密的联系.粗糙集理论相当于无拓扑结构的商空间理论,模糊粒度计算理论与商空间理论有许多等价之处.所以,商空间理论是粒度计算的重要工具之一.5 结论这些主要模型纵向的扩展和横向的融合是推动粒度计算发展的先决条件.因此,进一步的研究在于: (1)如何借鉴模糊数及其运算的成功经验,构建出有效的非数值型词计算的语义描述、推理机制、代数结构,以实现因特网上的海量信息资源的高效利用;(2)如何从等价关系的泛化、知识表示的拓广、代数结构的延伸三个方面推广粗糙集理论;(3)探索商空间理论中不同粒度层次的转换技术与方法,实现与模糊集及粗糙集的粒度计算模型的结合;(4)构造出基于粒度计算的求解问题的高效算法,寻找理论模型融合的技术和方法,最终实现构建统一的、更加有效的、能够处理复杂的和模糊的信息的粒度计算的理论平台.总之,粒度计算从实际出发,用可行的满意近似解替代精确解,改变了传统的计算观念,使信息的处理更科学、合理、经济和易于操作.它必将会成为信息处理的一种高效实用的技术和方法,在人工智能、问题求解、知识发现、图像压缩、神经网络、语义Web服务等众多领域有广阔的应用前景,而且随着信息科学和数字技术的飞速发展,它必将发挥越来越重要的作用. 参考文献:1 Y ao Y Y.Granular computing:Basic issues and possible solutions A.In:Paul P,ed.Proceedin gs of the5th Joint Conference on Information Sciences A:Elsevier Publishin g Company,2000.1862189.2 Zadeh L A.Fuzzy logic=Computing with words J.I EEE T ransactions on Fuzzy S ystems,1996,2:1032111.3 Thiele Helmut.On semantic models for investigating computing with words A.In:Jain L C,ed.Proceedin gs of the Second International Conference on Knowled ge Based Intelligent Electronic Systems(KES’98)C.USA:Institution of Electrical and Electronic Engineers Inc,1998.32298.4 Pawlak Z.Rough sets J.International Journal of Com puter and Inf orm ation Seience,1982,11:3412356.5 Y ao Y Y.Granular computing using neighborhood systems A.In:Ro y R,ed.Advances in soft com puting: Engineering design and manufacturing M.London:S pringer2Verlag Company,1999.5392553.6 Zadeh L A.The key roles of information granulation and fuzzy logic in human reasoning A .In :H yatt R ,ed.Proceedings of the Fifth IEEE International Conference on Fuzz y Systems ,FUZZ ———IEEE ’96C.G erman y :Physica 2Verlag GmbH Heidelberg ,1996.1002106.7 Zadeh L A.S ome reflections on information granulation and its centrility in granular computing ,computing withwords ,the computational theory of perceptions and precisiated natural language A .In :Lin T Y ,ed.Data Min 2ing ,Rough Sets and Granular Com puting M .G erman y :Physica 2Verlag GmbH Heidelberg ,2002.1102153.8 张 铃,张 钹.问题求解理论及应用M .北京:清华大学出版社,1990.9 张 铃,张 钹.模糊商空间理论(模糊粒度计算方法)J .软件学报,2003,14(4):7702776.The Theory Models and Approaches of G ranular ComputingLI Dao 2guo 1,2,MI AO Duo 2qian 1,ZH ANG H ong 2yun 1(1.Depart ment of Com puter Science and Technology ,Tongji U niversity ,S hanghai 200092,China ;2.Yangquan College of Tai Y uan U niversity of Technology ,S hanxi ,Yangquan 045001,China )Abstract :Granular computing is an emerging conceptual and computing paradigm of information processing.J ust as a great umbrella ,it may be regarded as a label of theories ,methodologies ,techniques ,and tools that make use of granules ,i. e.,groups ,classes ,or clusters of a universe.“GrC ”is a superset of the theory of fuzzy information granulation ,rough set theory ,the theory of quotient space and interval computing etc ,which is a branch of soft com puting science.It plays a important role in information processing for fuzzy ,uncertainty ,partial truth and unnumbered and becomes one of the main study stream in A I.It lays stress on the introduction of the research status ,the basic problems and main approaches of GrC.Finally ,the further investigation objects are proposed.K eyw ords :granular computing ;fuzzy sets ;rough sets ;the theory of quotient space~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~(上接第836页)Possibilistic Entropy ClusteringWANGLei ,J I H ong 2bing ,G AO X in 2bo(School of Elect ronic Engineering ,Xidian U niversity ,Xi ’an 710071,China )Abstract :It deals with clustering analysis within the framework of possibilistic entropy theory.First ,the possibilistic entropy is defined with brief discussion.Then the Possibilistic Entro py Clustering (PEC )algorithm is developed ,which takes into account both global effect and local effect of entropy based clustering and is of clear physical meaning and well 2defined mathematical features.Besides ,it can automatically control the resolution parameter during the clus 2tering proceeds and overcome the sensitivity to noise and outliers.Simulation ex periments show that even when the clusters vary significantly in size and shape ,and the data set is contaminated by heavy noise ,this novel algorithm can provides efficient and accurate estimation of the cluster centers.K eyw ords :possibilistic entropy ;unsupervised learning ;clustering ;automatically controlled parameter 148第5期 李道国等:粒度计算的理论、模型与方法。
粒度参数计算方法对比
![粒度参数计算方法对比](https://img.taocdn.com/s3/m/bd276471f5335a8102d2201a.png)
1.粒度参数计算方法:
图解法(福克):用沉积物概率累计曲线上一些特定百分比处的粗细
特征来计算。
该法提出时还没有激光粒度测试技术不能完全地含有沉积
物粒度特征。
矩法(Mc):沉积物各个粒级所含的组分比例计算。
含有各粒级信息,粒度信息丰富完整,反映粒度信息有更明显的优势。
2.沉积物粒度反映沉积环境:
物源特征、搬运距离、沉积水动力3.粒度论文写作工具:
Excel:公式计算
Surfer10:粒度参数等值线作图Grapher7:概率曲线分类
SPSS: 聚类分析
4.聚类分析结果:
图解法较之于矩法类别少且清楚。
粒度分析原理与应用
![粒度分析原理与应用](https://img.taocdn.com/s3/m/af39f36c4a73f242336c1eb91a37f111f1850dd8.png)
粒度分析原理与应用粒度分析是一种用于衡量和描述材料或颗粒的大小分布的方法。
它广泛应用于物料科学、环境科学、地质学、化学工程等领域。
粒度分析的原理是基于不同颗粒的尺寸导致其在特定条件下的沉降速度不同,通过测量颗粒的沉降速度来推断颗粒的大小。
本文将介绍粒度分析的基本原理和应用。
粒度分析的基本原理是根据斯托克斯定律,颗粒在流体中的沉降速度与颗粒大小成正比。
斯托克斯定律的公式为:V=K(D-d)g/η,其中V是颗粒的沉降速度,K是介质的粘度,D是颗粒的直径,d是介质的密度,g是重力加速度,η是介质的动力粘度。
通过测量颗粒的沉降速度,可以根据斯托克斯公式推算出颗粒的大小。
粒度分析主要有两种方法:筛分法和沉降法。
筛分法是将颗粒按照一定的尺寸范围,通过筛网进行筛分,根据颗粒在不同筛孔大小的筛网上的通过情况来确定颗粒的大小分布。
沉降法是将颗粒悬浮在液体中,测量颗粒的沉降速度,然后根据斯托克斯公式计算颗粒的大小分布。
粒度分析的应用通常需要一套完整的仪器设备。
现代粒度分析仪器主要包括激光粒度仪、蒸发法粒度仪、遮光法粒度仪等。
激光粒度仪通过激光原理来测量颗粒的沉降速度,具有高精度、快速测量等优点;蒸发法粒度仪通过测量颗粒悬浮液在一定时间内蒸发的速度来推算颗粒的大小;遮光法粒度仪则通过测量颗粒悬浮液在一定时间内遮光的程度来推算颗粒的大小。
这些仪器不仅可以测量颗粒的大小,还可以测量颗粒的形状、表面积等相关参数。
总的来说,粒度分析是一种重要的实验方法,可以用于研究材料、环境、地质、化学等领域中颗粒的大小分布。
通过粒度分析,可以获得材料或颗粒重要的物理参数,为科学研究和工程设计提供基础数据。
随着仪器设备的日益先进和科学方法的不断发展,粒度分析在各个领域的应用将会越来越广泛和重要。
粒度估算法问题回答
![粒度估算法问题回答](https://img.taocdn.com/s3/m/dd4074541fd9ad51f01dc281e53a580216fc50f9.png)
粒度估算法
粒度估算法是一种用于图像处理和计算机视觉领域的算法,它可以将
图像中的物体分解成不同的粒度层次,从而实现对物体的更精细的分
析和处理。
粒度估算法的应用范围非常广泛,包括图像分割、目标检测、图像识别等领域。
粒度估算法的基本原理是将图像中的物体分解成不同的粒度层次,每
一层次都包含不同的物体信息。
这些层次可以通过不同的方法来生成,例如基于像素的分割、基于区域的分割、基于边缘的分割等。
在生成
这些层次的过程中,需要考虑到不同的因素,例如物体的大小、形状、颜色等。
粒度估算法的优点在于它可以提供更加精细的物体信息,从而实现更
加准确的图像分析和处理。
例如,在目标检测中,粒度估算法可以将
物体分解成不同的层次,从而实现对物体的更加精细的检测和识别。
在图像识别中,粒度估算法可以提供更加准确的特征信息,从而实现
更加准确的识别结果。
然而,粒度估算法也存在一些挑战和限制。
首先,粒度估算法需要大
量的计算资源和时间,因此在实际应用中需要考虑到计算效率的问题。
其次,粒度估算法对图像质量和噪声的敏感性较高,因此需要对图像
进行预处理和优化。
最后,粒度估算法的应用范围和效果也受到算法
本身的限制,因此需要根据具体的应用场景进行选择和优化。
总之,粒度估算法是一种非常重要的图像处理和计算机视觉算法,它
可以提供更加精细的物体信息,从而实现更加准确的图像分析和处理。
在实际应用中,需要根据具体的应用场景进行选择和优化,以实现最
佳的效果和性能。
粒度计算
![粒度计算](https://img.taocdn.com/s3/m/a0090e1da216147917112843.png)
(二)粒度计算的内容和目标
2 粒计算的目标
粒度计算有两个目的(1)人类问题求解(2)实 现机器问题求解。人类智能与机器智能之间存在某 种共同的原则,尽管两者两者的实现机制有差异。 其基本思想是寻求统一的框架来整合人类智能与机 器机器智能的认知系统。求得机器问题求解与人类 问题的求解的一个统一模型。
粒度计算原理方法
屈文建
目录
(一)粒度计算的基本思想
1 粒 2 粒度
(二)粒度计算研究的内容及目标
1 内容 2 目标
•屈文建 Email: wjqu11@
பைடு நூலகம்
(一)粒度计算的思想 1粒
粒,目前尚无明确的概念解释,粒可以看成是 构成事物现象的一个层次,我们可以称最小的,不 可再分的粒为基本粒 。 在集合理论的研究中(如粗糙集理论,商空间 理论,聚类分析理论等)粒被定义为论域的子集。 在规划问题中,较小的粒是指将较大的规划问题分 解成若干较小的子规划问题中的每个小步骤。在程 序设计中,基本粒就是一个程序模块。
•屈文建 Email: wjqu11@
(二)粒度计算的内容和目标
1 粒计算的内容
基于粒计算的商空间问题求解理论,基于信息粒 度的模糊集的问题求解理论,基于覆盖粗糙集粒度 计算,粒度计算在进化计算,机器学习中的应用, 基于粒度计算的信息检索等。
•屈文建 Email: wjqu11@
•屈文建 Email: wjqu11@
(一)粒度计算的思想
3 粒之间的关系
描述粒之间的关系常使用二元关系,往往根据粒 的大小定义粒之间的序关系,特定问题中这种序关 系可以被定义“大于或等于”,“比…更抽象”, “比…更粗糙”。这种序关系是自反的,传递的, 但不一定是对称的,这个序关系将粒连接在一起。
粒度计算
![粒度计算](https://img.taocdn.com/s3/m/a0090e1da216147917112843.png)
•屈文建 Email: wjqu11@
(一)粒度计算的思想 1粒
粒,目前尚无明确的概念解释,粒可以看成是 构成事物现象的一个层次,我们可以称最小的,不 可再分的粒为基本粒 。 在集合理论的研究中(如粗糙集理论,商空间 理论,聚类分析理论等)粒被定义为论域的子集。 在规划问题中,较小的粒是指将较大的规划问题分 解成若干较小的子规划问题中的每个小步骤。在程 序qu11@
(二)粒度计算的内容和目标
1 粒计算的内容
基于粒计算的商空间问题求解理论,基于信息粒 度的模糊集的问题求解理论,基于覆盖粗糙集粒度 计算,粒度计算在进化计算,机器学习中的应用, 基于粒度计算的信息检索等。
•屈文建 Email: wjqu11@
(二)粒度计算的内容和目标
2 粒计算的目标
粒度计算有两个目的(1)人类问题求解(2)实 现机器问题求解。人类智能与机器智能之间存在某 种共同的原则,尽管两者两者的实现机制有差异。 其基本思想是寻求统一的框架来整合人类智能与机 器机器智能的认知系统。求得机器问题求解与人类 问题的求解的一个统一模型。
wjqu11163com粒目前尚无明确的概念解释粒可以看成是构成事物现象的一个层次我们可以称最小的不可再分的粒为基本粒在集合理论的研究中如粗糙集理论商空间理论聚类分析理论等粒被定义为论域的子集
粒度计算原理方法
屈文建
目录
(一)粒度计算的基本思想
1 粒 2 粒度
(二)粒度计算研究的内容及目标
1 内容 2 目标
•屈文建 Email: wjqu11@
(一)粒度计算的思想
2粒度
粒度是指粒的大小, 粒存在不同的粒度(即粒 的大小), 这些粒结合在一起构成对问题特定层次 的描述,我们基于特定的视角用较小的粒观察研究 研究较大的粒。 研究不同问题时,粒度的大小常常可以解释为 :不同抽象程度,不同正确程度,不同详细程度。 集合中粒的大小用集合的势来衡量。
第二讲粒度
![第二讲粒度](https://img.taocdn.com/s3/m/c469c669360cba1aa811dad0.png)
(五)粒度资料整理分析
• 1.粒度分布特征
• 河口和海滩沉积物粒度分布一般属正态分布 或对数正态分布,其密度函数为:
(Xa)2
(X)
1
e 22
2
• 式中a为平均值,为标准差。当a=0,=1时称
为标准正态分布。
• 在坐标图上,a为曲线最高点的横坐标,的大
30
20
10
0
-1.75 -1.00 -0.25
0.50 1.25 2.00 2.75 3.50 4.25 5.00 5.75 6.50 7.25 8.00 8.75 9.50 10.25 11.00 11.75
粒度(phi)
• 概率累积曲线
– 纵坐标选用概率尺度。 – 常由三条或四条斜度不等并互相截接的直线段组成。直
• 激光粒度仪
– 法国Cilas公司生产的Cilas 940L型(930)激光粒度仪。它的主要 部件是一个注水罐(包含机械搅拌器),超声波振荡仪和抽、排 水泵。测试时将经过预处理,即样品采用0.5N的六偏磷酸钠溶液 浸泡24小时,用超声波振荡仪振荡20-30分钟,之后将样品放入注 水罐,经超声波和机械分散后形成悬浮溶液,并由泵带动形成连 续的悬浮颗粒流,颗粒流由样品室,穿过激光束,发生衍射的光 线,由探测板上的环形探测器记录,记录的信号输入微机,最终 测试结果由微机计算并输出。整个操作过程由微机控制,平均每 个样品的测试时间约5-7分钟。
• 海滩和破浪带样品由四个直线段组成,除最细的悬 浮组分和最粗的滚动组分外,曲线有两个分选很好 的跳跃组分,两者的平均粒径和分选性中有不同, 这是由于在潮间带环境中存在着方向相反,速度不 等的往复水流的搬运作用。
粒度分析原理与应用
![粒度分析原理与应用](https://img.taocdn.com/s3/m/a6ad2c4fa9114431b90d6c85ec3a87c240288aa6.png)
Stokes重力沉降公式
考察一个球体在无界流体受重力、浮力和阻力的运动情况: mdu/dt=W-f-F
其中阻力 F=3Du
其中为流体粘滞系数,D为球体直径。当F=W-f时,du/dt=0,球体 达到一恒定的最终沉降速度ust,又称Stokes速度。可求出Stokes 速度与球直径的关系为: D=[18ust/(s-f)]1/2
设在时间t,深度h,测量出悬浮液的颗粒重量浓度或 与之成正比的任何性质,概以C(h,t)表示;对于原均匀 悬浮液,以C0表示。这样,样品对应于Stokes直径 D(h,t)的重量累计分数为:
(D)=C(h,t)/C0 (D)对D求微商,可以获得分布函数F(D)即频率分布.
消光沉降法
消光沉降法原理:对于单位体积中含有n个迎光面积都同为a的悬浮液, 若以悬浮液的浊度表示
粒度与颗粒形状
粒度是颗粒在空间范围所占据大小的线性尺度。 粒度越小,颗粒的微细程度越大。 表面光滑的球形颗粒只有一个线性尺度,即其
直径,粒度就是直径。
非球形颗粒或虽然大体上球形,但表面不光滑 的颗粒,则可按某种规定的线性尺度表示粒度。 其中有一些规定是以某种意义的相当球或相当 圆的直径作为其粒度的。有些规定的粒度并不 是相当球或圆的直径,也可统称为颗粒的直径。
ln(I0/I)/l=niKiiDi2 若令消光度
G log(I0/I) 定义各Gij=G始-G1,G1-G2,…,Gj-Gk,…,则
Gij = Gj-Gk==logIk-logIj 将粒度DjDk的平均粒度Di=(Dj+Dk)/2作为粒级中所有颗粒不同粒度的代表,此粒级
对消光度的贡献
Gi= Gij = (l/2.303)niKiiDi2 迎光截面积形状系数I常可以假设与粒度Di无关,则
第二讲 粒度分析
![第二讲 粒度分析](https://img.taocdn.com/s3/m/261a4819a300a6c30c229f72.png)
• 沉积物的搬运方式有三种:悬移、跳跃和滚动。每 一搬运方式下碎屑物粒度分布,各成一对数正态分 布,它们以自己的平均粒度和分选性区别于其它搬 运方式,一个沉积物样品可以从一种、两种或三种 搬运方式中沉积下来形成混合沉积物。该曲线可以 将这种沉积物按照它们原来的搬运方式有效地区分 开来。 • 海滩和破浪带样品由四个直线段组成,除最细的悬 浮组分和最粗的滚动组分外,曲线有两个分选很好 的跳跃组分,两者的平均粒径和分选性中有不同, 这是由于在潮间带环境中存在着方向相反,速度不 等的往复水流的搬运作用。
重量(%) 0 2 3 4 5 6 (-2)-(-1.75) (-1.25)-(-1) (-0.5)-(0.25) 0.25-0.5 1-1.25 1.75-2 2.5-2.75 3.25-3.5 4-4.25 粒度phi 4.75-5 5.5-5.75 6.25-6.5 7-7.25 7.75-8 8.5-8.75 9.25-9.5 10-10.25 10.75-11 11.5-11.75 粒度频率分布图 md42 md43 md44 md45 md46 md47 1 7 8
• 其他:LISST-100(B)现场激光粒度分析仪。
(五)粒度资料整理分析
• 1.粒度分布特征 • 河口和海滩沉积物粒度分布一般属正态分布 或对数正态分布,其密度函数为:
Φ( X ) = 1 2π σ
− ( X − a) 2 2σ 2
e
σ • 式中a为平均值,为标准差。当a=0, =1时称 为标准正态分布。 σ • 在坐标图上,a为曲线最高点的横坐标, 的大 小代表颗粒的分选度。
• 3 光电分析法 • 对于更细颗粒的悬浮物质来说,其粒度的分析可 以采用光电法,这种悬浮物的主要成分为石英碎 屑、粘土颗粒及有机物等,出现的形式有颗粒、 团状或集合体等,由于粘土的絮凝作用,有机物 对沉积颗粒的作用等,使细颗粒悬浮物形成多种 多样的结构,这些结构的形状、密度、凝聚程度 和电阻率都产生变化。 • A.光透法 根据光通过混浊的水,强度减弱、吸 收和散射性质来测定粒度。原理是入射光和透射 光强度的关系。 • B.电法测定粒度 库尔特计数器。原理是在电解 质中维持一个电场,若颗粒所带的电性与电解质 不同,当其进入电场时,颗粒就占据了电解质与 其体积相等的空间,从而引起电场的变化。变化 程度与颗粒的体积成正比。
粒度分布计算公式(一)
![粒度分布计算公式(一)](https://img.taocdn.com/s3/m/bf93263677c66137ee06eff9aef8941ea76e4bc8.png)
粒度分布计算公式(一)粒度分布计算公式粒度分布计算公式是用来描述和计算不同粒度的分布情况的公式,可以通过对数据进行统计和分析,来得到粒度分布的各项指标。
下面将列举一些常用的粒度分布计算公式,并给出解释和示例。
1. 平均粒度平均粒度是指在一组数据中,所有粒度值的平均数。
它可以用来衡量数据的整体粒度水平。
公式:$ = $示例:假设有一组数据包含5个粒度值,分别为3、4、5、6、7,则平均粒度为:$ = = 5 $2. 最大粒度最大粒度是指在一组数据中,粒度值的最大值。
它可以用来表示数据中的最大粒度。
公式:$ = () $示例:假设有一组数据包含5个粒度值,分别为3、4、5、6、7,则最大粒度为7。
3. 最小粒度最小粒度是指在一组数据中,粒度值的最小值。
它可以用来表示数据中的最小粒度。
公式:$ = () $示例:假设有一组数据包含5个粒度值,分别为3、4、5、6、7,则最小粒度为3。
4. 中位数粒度中位数粒度是指在一组数据中,粒度值按照从小到大的顺序排列之后,位于中间位置的值。
它可以用来表示数据中的中间粒度。
公式:当数据个数为偶数时,$ = ;当数据个数为奇数时, = (/2 + ) $示例:假设有一组数据包含8个粒度值,分别为3、4、5、6、7、8、9、10,则中位数粒度为。
5. 粒度分布比例粒度分布比例是指在一组数据中,每个粒度值出现的比例。
它可以用来表示不同粒度值在整体数据中的重要程度。
公式:$ = % $示例:假设有一组数据包含8个粒度值,其中粒度值为5的出现了3次,则粒度分布比例为:$ = % = % $以上是一些常用的粒度分布计算公式和示例,通过这些计算公式,可以更好地了解和描述数据的粒度分布情况。
根据实际需求,还可以结合其他统计方法和指标进行更深入的分析。
粒度分析方法
![粒度分析方法](https://img.taocdn.com/s3/m/eb907e5352ea551810a687ee.png)
粒度分析方法颗粒是在一定尺寸范围内具有特定形状的几何体。
粒径就是颗粒的直径,一般以微米为单位。
不同的方法将会给出不同的平均径,一般来说平均径的计算方法有以下几种:由于实际颗粒的形状通常并非为球形,因而常常采用等效径的概念,即当一个颗粒的某一物理特性与同质球形颗粒相同或相近时,采用该球形颗粒的直径来代表这个实际颗粒的直径。
由于全氟丙烷人血白蛋白微球几乎全部为球形颗粒,可以认为仪器测得的等效径即为实际颗粒直径。
粒度测试的基本方法有筛分法、显微镜(图像)法、重力沉降法、离心沉降法、库尔特(电阻)法、激光衍射/散射法、电镜法、超声波法,透气法等。
其优缺点如下:1.筛分法:优点:简单、直观、设备造价低、常用于大于40μm的样品。
缺点:不能用于40μm以下细的样品,不能测定喷雾或乳剂等液体样品;2.显微镜法:所测的粒径为等效投影面积径,计算出的为长度平均径。
优点:简单、直观、可进行形貌分析,可以准确得到球形度、长径比等特殊数据。
缺点:代表性差,速度慢,无法测超细颗粒,不宜分析粒度范围宽的样品,只检查相对较少的颗粒。
这种方法只能作为质量或生产控制的简单判断方法。
3.沉降法(包括重力沉降和离心沉降):沉降法是根据不同粒径的颗粒在液体中的沉降速度不同测量粒度分布的一种方法。
它的基本过程是把样品放到某种液体中制成一定浓度的悬浮液,悬浮液中的颗粒在重力或离心力作用下将发生沉降。
大颗粒的沉降速度较快,小颗粒的沉降速度较慢,沉降速度与粒径的关系有Stokes定律来描述。
所测的粒径为等效沉速粒径,优点:操作简便,仪器可以连续运行,价格低,准确性和重复性较好,测试范围较大。
缺点:测试时间较长,不能处理不同密度的样品。
结果受环境因素和人为因素影响较大。
不能用于材料不沉淀的乳剂或者密度很高快速沉淀的材料。
4.库尔特(电阻)法:所测的粒径为等效电阻径。
其测定原理是电阻增量正比于颗粒体积,再将体积换算成圆球直径。
需要对照标准来校准仪器。
粒度分布计算公式(二)
![粒度分布计算公式(二)](https://img.taocdn.com/s3/m/e84d8b9b294ac850ad02de80d4d8d15abe230095.png)
粒度分布计算公式(二)粒度分布计算公式1. 粒度分布概述粒度分布是指在一组数据中,不同粒度或级别的值出现的频率情况。
它可以用来分析和描述数据的分布特征,帮助我们了解数据的变化趋势以及各个粒度的重要程度。
2. 统计学中的粒度分布计算公式在统计学中,常用的粒度分布计算公式主要包括:频数(Frequency)频数是指某一特定数值在数据集中出现的次数。
计算频数的公式为:频数 = 某一特定数值出现的次数例子:假设有一个数据集包含以下数据:[1, 2, 3, 4, 2, 3, 2, 1, 3, 4]。
我们想计算数字2在数据集中出现的频数。
通过计算,我们可以得到:频数(2)= 3,即数字2在数据集中出现了3次。
相对频数(Relative Frequency)相对频数是指某一特定数值在数据集中出现的频率或比例。
计算相对频数的公式为:相对频数 = 某一特定数值出现的次数 / 数据集的总数例子:假设有一个数据集包含以下数据:[1, 2, 3, 4, 2, 3, 2, 1, 3, 4]。
我们想计算数字2在数据集中的相对频数。
通过计算,我们可以得到:相对频数(2)= 3 / 10 = ,即数字2在数据集中的相对频数为。
累积频数(Cumulative Frequency)累积频数是指小于等于某一特定数值的数据出现的次数。
计算累积频数的公式为:累积频数 = 小于等于某一特定数值的数据出现的次数例子:假设有一个有序数据集包含以下数据:[1, 2, 2, 3, 3, 3, 4, 4, 5, 6]。
我们想计算小于等于3的数据出现的累积频数。
通过计算,我们可以得到:累积频数(小于等于3)= 6,即小于等于3的数据在数据集中出现了6次。
相对累积频数(Relative Cumulative Frequency)相对累积频数是指小于等于某一特定数值的数据出现的频率或比例。
计算相对累积频数的公式为:相对累积频数 = 小于等于某一特定数值的数据出现的次数 / 数据集的总数例子:假设有一个有序数据集包含以下数据:[1, 2, 2, 3, 3, 3, 4, 4, 5, 6]。
粒度占比计算
![粒度占比计算](https://img.taocdn.com/s3/m/3bdd543a0622192e453610661ed9ad51f01d54b6.png)
粒度占比计算粒度计算,信息处理的一种新的概念和计算范式,覆盖了所有与粒度相关的理论、方法、技术和工具,主要用于不确定、不完整的模糊海量信息的智能处理。
粒度就是取不同大小的对象。
也就是说,将原来“粗粒度”的大对象分割成为若干“细粒度”的小对象,或者把若干小对象合并成一个大的粗粒度对象,进行研究。
我国学者张钹院士曾经指出:“人类智能的一个公认的特点,就是人们能从极不相同的粒度上观察和分析同一问题。
人们不仅能在不同粒度的世界上进行问题的求解,而且能够很快地从一个粒度世界调到另一个粒度世界,往返自如,毫无困难。
”粒度计算是模仿人类思考问题的方式,用来处理不完全、不可靠、不精确、不一致和不确定的知识粒度计算是新近兴起的人工智能研究领域的一个方向。
粒度计算是一把大伞它覆盖了所有有关粒度的理论,方法论,技术和工具的研究。
粗略地说,粒度计算是模糊信息粒度理论的超集,而粗糙集理论和区间计算是粒度数学的子集。
粒计算作为一种方法论,旨在有效地建立基于外部世界、并以用户为中心的概念,同时简化我们对物理世界和虚拟世界的认识并以此为基础,在求解问题的过程中,用粒度合适的粒"作为处理的对象,从而在保证求得满意解的前提下,提高解决问题的效率。
合适的粒度常常是由提出的问题及问题的环境来决定的,这一点对设计基于粒计算的数据处理框架有重要意义举一个关于时间的例子例如张先生问他的朋友;“你什么时候回国的”,回答这个问题所选择的时间粒度其实是由朋友回国的时间到现在有多久决定的如果没超过一天,那么他会说:“昨天中午;如果有十来天”、他可以说:“上周”;再如果是朋友回国了好几年,张先生才得知消息,那么年就可以是一个满意的答案了注意到上面几个答案具有不同的粒度,分别是午、周和年如果不采用合适的粒度,统一都用计算机上常见的时间戳格式来回答:年月日下午时分,显然不太合理,让人觉得十分别扭。
粒度分析的基本原理
![粒度分析的基本原理](https://img.taocdn.com/s3/m/db73cba9c850ad02df8041b3.png)
粒度分析的基本原理粒度分析的基本原理( Malvern仪器Alan Rawle博士,翻译:焉志东,整理:董青云)什么叫颗粒?颗粒其实就是微小的物体,是组成粉体的能独立存在的基本单元。
这个问题似乎很简单,但是要真正了解各种粒度测试技术所得出的测试结果,明确颗粒的定义又是十分重要的。
各种颗粒的复杂形状使得粒度分析比原本想象的要复杂得多。
粒度测试复杂的原因比如,我们用一把直尺量一个火柴盒的尺寸,你可以回答说这个火柴盒的尺寸是20×10×5mm。
但你不能说这个火柴盒是20mm或10mm或5mm,因为这些只是它大小尺寸的一部分。
可见,用单一的数值去描述一个三维的火柴盒的大小是不可能的。
同样,对于一粒砂子或其它颗粒,由于其形状极其复杂,要描述他们的大小就更为困难了。
比如对一个质保经理来说,想用一个数值来描述产品颗粒的大小及其变化情况,那么他就需要了解粉体经过一个处理过程后平均粒度是增大了还是减小了,了解这些有助于正确进行粒度测试工作。
那么,怎样仅用一个数值描述一个三维颗粒的大小?这是粒度测试所面临的基本问题。
等效球体只有一种形状的颗粒可以用一个数值来描述它的大小,那就是球型颗粒。
如果我们说有一个50μ的球体,仅此就可以确切地知道它的大小了。
但对于其它形状的物体甚至立方体来说,就不能这样说了。
对立方体来说,50μ可能仅指该立方体的一个边长度。
对复杂形状的物体,也有很多特性可用一个数值来表示。
如重量、体积、表面积等,这些都是表示一个物体大小的唯一的数值。
如果我们有一种方法可测得火柴盒重量的话,我们就可以公式(1)把这一重量转化为一球体的重量。
重量=4/3π×r3×ρ--(1)由公式(1)可以计算出一个唯一的数(2r)作为与火柴盒等重的球体的直径,用这个直径来代表火柴盒的大小,这就是等效球体理论。
也就是说,我们测量出粒子的某种特性并根据这种特性转换成相应的球体,就可以用一个唯一的数字(球体的直径)来描述该粒子的大小了。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈粒度计算
摘要:粒度计算是新近兴起的人工智能研究领域的一个方向,本文简单介绍粒度计算的主要三个方法,以及之间的关系。
关键词:粒度计算、模糊逻辑、商空间理论、粗糙集理论。
;一.引言人们在思考问题时,或者是先从总体进行观察,然后再逐步深入地研究各个部分的情况;或先从各个方面对同一问题进行不同侧面的了解,然后对它们进行综合;或是上面两种方法的组合,即时而从各侧面对事物进行了解,然后进行综合观察,时而综合观察后,对不甚了解的部分再进行观察……总之,根据需要从不同侧面、不同角度反复对事物进行了解、分析、综合、推理.最后得出事物本质的性质和结论. ; 人工智能研究者对人类这种能力进行了深入地研究,并建立了各种形式化的模型.本文要介绍的粒度计算,就是对上述问题的研究的一个方面. ; 人工智能最主要的目的是,为人类的某些智能行为建立适当的形式化模型,以便利用计算机能再显人的智能的部分功能。
什么是人类的最主要的智能,或者说智能的最重要表现形式是什么。
各家有不同的看法,如Simon等认为人的智能表现为,对问题求解目标的搜索(Search)能力。
比如学生在证明一道平面几何题目时,进行思考,“聪明的小孩”能很快地找到证明该结论的有关的定理性质,并很快地应用上去,从而就得到证明。
“数学能力差的学笨赡芏椅餮埃
也坏胶鲜实亩ɡ砗托灾剩评慈迫ィ艿貌坏街っ鞯囊欤籔awlak[P1]则认为人的智能表现为对事物(事件、行为、感知等)的分类(Classification)能力。
如平时我们说某医生本事大,就是这位医
生能从病人的症状中,正确地诊断出病人是患什么病(分类能力!分出患什么病来)等等。
我们认为“人类智能的公认特点,就是人们能从极不相同的粒度(Granularity)上观察和分析同一问题。
人们不仅能在不同粒度的世界上进行问题求解,而且能够很快地从一个粒度世界跳到另一个粒度的世界,往返自如,毫无困难。
这种处理不同世界的能力,正是人类问题求解的强有力的表现”[ZH1]。
还有很多不同的理解,人们正是从这些不同的理解分别建立各自的模型和相关的理论和方法。
粒度计算目前国际上有三个主要的模型和方法,下面简单进行介绍。
;二. 三种不同的模型; 下面简单介绍有关“粒度计算”的三个不同的模型和方法。
什么是粒度,顾名思义,就是取不同大小的对象。
也就是说,将原来“粗粒度”的大对象分割为若干“细粒度”的小对象,或者把若干小对象合并成一个大的粗粒度对象,进行研究。
; 最近Zadeh在[ZA1]-[ZA3]中,讨论模糊信息粒度理论时,提出人类认知的三个主要概念,即粒度(granulation)、组织(organization)、因果(causation)(粒度包括将全体分解为部分,组织包括从部分集成为全体,因果包括因果的关联)。
并进一步提出粒度计算。
他认为,粒度计算是一把大伞它覆盖了所有有关粒度的理论、方法论、技术和工具的研究。
指出:“粗略地说,粒度计算是模糊信息粒度理论的超集,而粗糙集理论和区间计算是粒度数学的子集”。
Zadeh 的工作激起了学术界对粒度计算研究的兴趣,Y.Y.Yao和他的合作者对粒度计算进行了一系列的研究[Y1]-[Y3]并将它应用于数据挖掘等领域,其工作的要点是用决策逻辑语言(DL-语言)来描述集合的粒度(用满足公式f元素
的集合,来定义等价类m(f)),建立概念之间的IF-THEN关系与粒度集合之间的包含关系的联系,并提出利用由所有划分构成的格,来求解一致分类问题。
这些研究为知识挖掘提供了一些新的方法和角度。
; 按Zadeh粒度计算的定义,我们提出的商空间理论和Pawlak的粗糙集理论都属于“粒度计算”范畴。
目前有关粒度计算的理论与方法,主要有三个。
一是Zadeh的“词计算理论”(Theory of Works Computing),一是Pawlak的“粗糙集理论”(Theory of Rough Set),另一个是我们提出的“商空间理论”(Theory of Quotient Space)。
下面简单介绍三者的内容:1. ; 词计算理论:; Zadeh认为人类在进行思考、判断、推理时主要是用语言进行的,而语言是一个很粗的“粒度”,如我们说“九寨沟的风景很美”,其中“很美”这个词就比较“庞统”,也就是说其粒度很粗,如何利用语言进行推理判断,这就是要进行“词计算”,早在二十世纪六十年代Zadeh提出模糊集理论,就是“词计算”的雏型。
沿Zadeh的模糊集论的方向,用模糊数学的方法进行有关粒度计算的方法和理论的研究,就构成“粒度计算”的一个非常重要的方法和方向。
这也是人们比较熟悉的一个方法。
2. 粗糙集理论:; 波兰学者Pawlak[P1]在二十世纪八十年代,提出的粗糙集理论,他提出一个假设:人的智能(知识)就是一种分类的能力,这个假设可能不是很完备,但却非常精练。
在此基础上提出,概念可以用论域中的子集来表示,于是在论域中给定一组子集族,或说给定一个划分(所谓划分,是指将X分成两两不相交的子集之并)。
从数学上知道,给定X上的一个划分,等价于在X上给定一个等价关系R。
Pawlak称之为在论域上给
定了一个知识基(X,R)。
然后讨论一个一般的概念x(X中的一个子集),如何用知识基中的知识来表示,就是用知识基中的集合的并来表示。
对那些无法用(X,R)中的集合的并来表示的集合,他借用拓扑中的内核和闭包的概念,引入R-下近似R-(x)(相当于x的内核)和R-上近似R-(x)(相当于x的闭包),当R-(x)¹R-(x)时,就称x为粗糙集.从而创立了“粗糙集理论”。
目前粗糙集理论已被广泛应用于各个领域,特别是数据挖掘领域,并获得成功。
3.基于商空间的粒度计算. ; 我们认为概念可以用子集来表示,不同粒度的概念就体现为不同粒度的子集,一簇概念就构成空间的一个划分----商空间(知识基),不同的概念簇就构成不同的商空间. 故粒度计算,就是研究在给定知识基上的各种子集合之间的关系和转换.以及对同一问题,取不同的适当的粒度,从对不同的粒度的研究中,综合获取对原问题的了解.这种对粒度的理解与模糊集对粒度的理解不完全一样.下面简单介绍基于商空间的粒度计算。
3.1商空间模型下的推理模型商空间的模型用一个三元组来表示,即(X,F,T),其中X是论域,F是属性集,T是X上的拓扑结构.当我们取粗粒度时,即给定一个等价关系R (或说一个划分),于是我们说得到一个对应于R的商集记为[X],它对应于的三元组为([X],[F],[T]),称之为对应于R的商空间.商空间理论就是研究各商空间之间的关系、各商空间的合成、综合、分解和在商空间中的推理。
在这个模型下,可建立对应的推理模型,并有如下的性质.A. 商空间模型中推理的“保假原理”(或“无解保持原理”).B. ; 商空间模型中推理合成的“保真原理”.所谓“保假原理”是指若一命题在粗粒度空间中是假的,则该命题在比
它细的商空间中一定也无解。
所谓“保真原理”,是指,若命题在两个较粗粒度的商空间中是真的,则(在一定条件下),在其合成的商空间中对应的问题也是真的。
; 这两个原理在商空间模型的推理中起到很重要的作用,如若我们要对一个问题进行求解,当问题十分复杂时,常先进行初步分析,即取一个较粗粒度商空间,将问题化成在该空间上的对应的问题,然后进行求解,若得出该问题在粗粒度空间中是无解,则由“保假原理”,立即得原问题是无解的。
因为粗粒度的空间规模小,故计算量也少,这样我们就可以以很少的计算量得出所要的结果,达到“事半功倍”的目的。
同样利用“保真原理”也可达到降低求解的复杂性目的,设在两个较粗空间X1、X2上进行求解,得出对应的问题有解.利用“保真原理”可得,在其合成的空间X3上问题也有解。
设X1、X2的规模分别为s1、s2。
因为一般情况下,X3的规模最大可达到s1s2。
于是将原来要求解规模为s1s2空间中的问题,化成求解规模分别为s1、s2的两个空间中的问题。
即将复杂性从“相乘”降为“相加”。
;四.商空间理论、粗糙集理论和模糊集理论之间的关系4.1在模型上三者都是描述人类能按不同粒度来处理事物的能力的模型.商空间理论、粗糙集理论认为概念可以用子集来表示,不同粒度的概念可以用不同大小的子集来表示,所有这些表示可以用等价关系来描述。
词计算理论认为概念是用“词”来表示,而描述“词”的有效的方法就是模糊集理论。