粗糙集综述word版
模糊粗糙集理论介绍和研究综述
Ξ 收稿日期:2006-03-10作者简介:姚红霞(1979-),女,硕士研究生,主要从事粗糙集理论和模糊集理论研究.【数理科学】模糊粗糙集理论介绍和研究综述Ξ姚红霞(西北师范大学数学与信息科学学院,兰州 730070)摘要:回顾了粗糙集理论,引出了模糊粗糙集的产生背景,介绍了模糊粗糙集模型的一些主要概念和性质,并给出了模糊粗糙集属性重要性的定义,探讨了模糊粗糙集合的应用和发展现状.关 键 词:粗糙集;模糊集;模糊粗糙集中图分类号:TH164 文献标识码:A 文章编号:1671-0924(2006)08-0132-04I ntroduction to and Survey for the Studies of Fuzzy R ough Sets TheoryY AO H ong-xia(Department of Mathematics and In formation Sciences ,N orthwest N ormal University ,Lanzhou 730070,China )Abstract :This paper firstly reviews the theory of rough set and brings out the generation background aboutfuzzy rough sets ,secondly ,introduces the main concept and property of fuzzy rough sets and proposes its significance ,and finally ,discusses the application and recent studies for this theory.K ey w ords :rough sets ;fuzzy sets ;fuzzy rough sets0 引言 粗糙集(R ough Sets )理论最初是由波兰数学家Z.Pawlak 于1982年[1]提出的,是一种处理不完整和不确定性知识的数学工具[1-2].经过多年的发展,该理论已被成功的用于决策支持系统、人工智能、模式识别与分类、故障检测、金融、医学、知识发现、数据挖掘和专家系统等领域.但由于其严格的等价关系,限制了粗糙模型的发展和应用.针对这个问题,Dub ois 和Prade [3-4]提出模糊粗糙集的概念,作为粗糙集的一个模糊推广.模糊集理论首先是由美国控制论专家L ・A ・扎德(L.A.Z adeh )教授于1965年[5]提出的.也是一种处理模糊和不确定性知识的数学工具,它已成功的应用于模糊控制、模糊识别、模糊聚类分析、模糊决策、模糊评判、系统理论、信息检索、医学、生物学等各个方面.虽然2者都可以用来处理模糊和不确定问题,但2者的着眼点不同.粗糙集理论在处理模糊和不确定性问题方面着眼于知识的粗糙性,强调的是集合对象间的不可分辨性;而模糊集在处理不确定性问题时,主要着眼于知识的模糊性,强调的是集合边界的不分明性.由于这2种理论在处理不确定和模糊问题时具有一定的相似性,因此把它们结合起来的研究前景或许更有实际价值,Dubois 和Prade 是最早研究粗糙模糊集和模糊粗糙集问题的代表人物之一.当知识库中的知识模块是清晰概念,而被近似的概念是一个模糊概念时,就得到粗糙模糊集;当知识库中的知识模块是模糊概念,而被近似的概念是模糊概念时,则可得到模糊粗糙集.粗糙模糊集是模糊粗糙集的特殊情况,因此一般只讨论模糊粗糙集.于是根据问题的实际需要,在文献[3-4]中,用论域上的模糊关系代替分明的二元关系,提出模糊粗糙集合的概念,作为粗糙集合的模糊推广.第20卷 第8期Vol.20 No.8重 庆 工 学 院 学 报Journal of Chongqing Institute of T echnology2006年8月Aug.20061 粗糙集理论的发展 自1992年在波兰召开了RS理论的第一届国际学术会议以来,现在每年都召开以RS为主题的国际会议,大大推动了RS理论的发展.参加的成员主要来自波兰、美国、加拿大、日本、俄罗斯等国家.在Pawlak粗糙集模型中,等价关系是关键概念,等价类是构成上下近似结构的构造性知识块,用任意的二元关系取代等价关系,就得到Pawlak粗糙集模型的不同推广,即一般关系下的RS模型、变精度RS模型、概率RS模型、基于随机集的RS模型[9],而且在一个分明的,自反和传递关系下,一对上下近似算子正好是一个拓扑空间的内部封闭的算子[10-12].在RS集理论中,基本的运算符是近似的.对RS理论发展的研究至少有2种方法,即构造性方法和公理化方法.在构造性方法下,论域上的二元关系、论域的划分、领域体系、布尔代数都是最原始的概念.文献[1,13-15]用这些概念构造了下近似和上近似算子,构造性方法尤其对RS的实际应用有重要的实用价值.另一方面,公理化方法,是一种研究粗糙代数结构近似的,用上下近似算子作为最初的概念,在这种方法下,用一个公理化集合刻画的近似算子和用构造性方法产生的算子是一样[15-16].比较构造性和公理化这2种方法,对分明粗糙集最典型的公理化研究是文献[15],在文献[17]中,用不同的公理化集合刻画了不同类型的粗糙集代数.2 模糊粗糙集的产生背景 粗糙集理论最初和主要的研究采用的是构造性方法.在Z.Pawlak粗糙集模型中,等价关系是关键和原始的概念.然而,等价关系是一个过于严格的条件,其限制了粗糙集模型的一些主要应用.针对这个问题,文献[12-13,18]用非等价二元关系推广了粗集近似算子,这一成果的出现,引起了学术界研究其它不同类型近似算子的热潮.另一方面,用U上的一个等价关系,在模糊关系理论下,引入上下近似,就得到了一个推广的概念,称为粗糙模糊集[4,17,19],相反的,用模糊相似关系代替等价关系,就得到模糊粗糙集合[4-8,19].因此后来有很多模糊粗糙集合的类型,如基于模糊T相似关系的一般结构[21],基于U上弱模糊划分的结构[22-23],以及基于模糊集合上的布尔子代数[7],等等.3 模糊粗糙集合的基本概念和理论3.1 等价关系下的模糊粗糙集定义定义1[9] 设(U,R)是Pawlak近似空间,R是论域U 上的一个等价关系,若A是U上的一个模糊集合,则A关于(U,R)的一对下近似A R和上近似 A R定义为U上的一对模糊集合,其隶属度函数分别定义为:A R(x)=in f{A(y)|y∈[x]R},x∈U,A R(x)=sup{A(y)|y∈[x]R},x∈U,其中[x]R为元素x在关系R下的等价类.若A R= A R,则称A是可定义的,否则称A是模糊粗糙集(Fuzzy rough set).称A R是A关于(U,R)的正域,称 A R是A关于(U,R)的负域,称 A R∩( A R)为A的边界.3.2 一般关系下的模糊粗糙集合及其属性重要性定义2[24] 称I=(U,A)是一个决策表信息系统,若有:①U是一个非空对象集合;②A={C,D}是一个有限非空属性集合,其中C是条件属性的非空集合,D是决策属性的非空集合;③对每个属性a∈A,定义了一个从U到V a的映射: a:U→V a,其中V a是属性a的值集.定义3[25] 设U是一个非空集合,称U上的模糊二元关系是相似关系,当且仅当R是:①自反的:R(x,x)=1对所有x∈U;②对称的:R(x,y)=R(y,x),对所有x,y∈U,U上的每个条件属性子集决定了一个U上的相似关系;③传递的:R(x,y)∧R(y,z)ΦR(x,z),对所有x, y,z∈U.则称R是U上的一个等价关系.在文献[4-8]中,用论域上的模糊关系代替分明的二元关系,提出了模糊粗糙集合的概念,粗糙集合研究对象是分明的等价类,而模糊粗糙集合研究对象是模糊等价类.将论域U上的元素在相似关系下划分模糊等价类,以下记论域U上的模糊关系为S,对象x和y之间的相似度记为u s(x,y)=u s(y,x),它同样满足定义3的条件,即自反性:u s(x,x)=1;对称性u s(x,y)=u s(y,x);传递性u s (x,z)Εu s(x,y)∧u s(y,z).因此对对象x∈U的等价类[x]s定义为:u[x]s(y)=u s(x,y)定义4[26] 模糊P上近似和P下近似定义为:uP X(F i)=sup x min{u Fi(x),u X(x)}Πi. uPX(F i)=in f x max{1-u Fi(x),u X(x)}Πi.其中F i是属于U/P的模糊等价类,PΑA,XΑU,u X (x)是对象x属于U上的任意模糊集合X的程度,则称序对(u P X(F i),u PX(F i))为模糊粗糙集合.由于模糊上下近似的定义和分明的定义有一些差异,个体对象的隶属度的近似不是十分有用的,由于这个原因,模糊上下近似可以定义为:uP X(x)=sup F∈U/P min(u F(x),sup y∈U min{u F(y),u x (y)})uPX(x)=sup F∈U/P min(u F(x),in f y∈U max{1-u F(y),u x (y)})定义5[26] 条件属性C关于决策属性D的正域为:uPOSC(D)(x)=sup u CX(x) X∈U/D定义6[26] 根据模糊正域的定义,可以求出模糊粗糙集合条件下决策属性D对条件属性集合C的依赖性:331姚红霞:模糊粗糙集理论介绍和研究综述γC (D)=∑x∈U uPOSC(D)(x)|U|定义7 令C和D分别为模糊粗糙集的条件属性和决策属性集,属性子集C′ΑC关于D的重要性定义为:σCD(C′)=γC(D)-γC-C′(D)特别当C′={a}时,属性a∈C关于D的重要性为σCD(a)=γC(D)-γC-{a}(D).4 模糊粗糙集属性约简 为了对模糊粗糙集合进行属性约简,必须先对属性模糊化.在粗糙集合中,属性对应的等价类是普通集合,而在模糊粗糙集合中,属性对应的等价类是模糊集,因此,往往把属性的等价类划分过程称为属性模糊化过程.在粗糙集中,每个对象属于且仅属于一个等价类,在模糊粗糙集中,每个对象可以属于多个模糊等价类.为了进行属性约简,必须求出复合属性的模糊等价类,具体模糊化的过程见文献[26].在文献[17]中给出了模糊粗糙集基于属性依赖性的属性约简的降维算法和例子,在文献[24]中研究了一种面向连续属性空间的模糊粗糙约简算法.5 模糊粗糙集发展现状 在文献[4-8]中,用论域上的模糊关系代替分明的二元关系,提出了模糊粗糙集合的概念,作为粗糙集合的模糊推广.在RS集理论中,基本的运算符是近似.对RS理论发展的研究至少有2种方法,即构造性方法和公理化方法.因此对模糊粗糙集的研究很多也是建立在这2种方法上的.在文献[17]中研究了模糊粗糙集上的一系列公理化集合,但他们的研究局限与用模糊T相似关系定义的模糊T 粗糙集上,而当模糊关系退化为分明关系时,就是一般的等价关系.然而,到目前为止,对一般关系下模糊粗糙集公理化方法的研究还不是很多,在文献[21]中给出了公理化的模糊粗糙集模型,在文献[25]中运用构造性和公理化方法,给出了模糊粗糙集研究的一般结构.在构造性方法下,基于一个任意的模糊关系定义了一对一般关系下的模糊粗糙集上下近似算子,在公理化方法下,用不同的公理集合刻画了不同类型的模糊粗糙近似算子,这些公理保证了确定类型的模糊关系的存在产生相同的算子.在文献[28]中,应用扩展原理,定义了依靠模糊关联和模糊隐含算子的模糊粗糙集合,并考虑了3个常用的算子,即S-,R-,Q L-算子,用其定义了3种类型的模糊粗糙集,并讨论了各自的性质,使其更好的用于不完全和不确定信息系统.在文献[27]中,讨论了在有限论域上模糊粗糙集模型和模糊拓扑空间之间的关系,提出了模糊拓扑空间上的T C 公理,并证明了所有基于自反和对称模糊关系的上下近似集合包含了一个满足T C公理的模糊拓扑空间,并且相反的,一个满足T C公理的模糊拓扑空间正好是在自反和对称模糊关系下的所有的上下近似集合.即在所有自反和对称模糊关系下的集合和所有满足T C公理的模糊拓扑空间之间,存在一个一对一的关系.但这只是在有限论域情况下的结论,在无限论域上的还不确定成立,需要进一步探讨.粗糙集理论已经被广泛和成功的应用许多领域,主要是由于它能发现隐藏在数据中的事实,而不需要额外的如专家系统或者阈值之类的信息,能在无监督条件下,挖掘出数据库里的最小知识表示.但粗糙理论在应用过程中,主要的载体是信息表,信息表中的对象是处理和挖掘的对象,而信息表中的对象的属性值要么是分明的,或者是实值的,虽然连续的属性值可以通过属性离散化方法离散,但势必会丢失一些重要信息,而且在粗糙理论下,无法判断2个属性值是相似的,或者在某种扩展意义下是相同的.因此,针对这个问题,文献[29-30]用模糊粗糙集来解决这些不确定问题,并将这个理论用于网络数据分类和挖掘上,收到了很好的效果.文献[26]将其进行了推广和完善.目前,国外学者主要从不同角度考虑模糊粗糙集的性质,根据模糊集近似推理方式的不同,主要形成了从3种不同角度研究的模糊粗糙集:基于形式逻辑的模糊粗糙集,基于三角模的模糊粗糙集,基于-截集的模糊粗糙集.6 模糊粗糙集发展展望 虽然模糊粗糙集已经发展了十几年,但作为一种理论,它还有很多的不完善,尤其是目前研究属性约简的算法还是相当少,而属性约简在实际生活中具有重要的意义.今后,模糊粗糙集还有很大的发展空间,它可能更广泛的应用于数据挖掘,知识发现等重要领域.参考文献:[1] Pawlak Z.R ough[J].International Journal of C omputerand in formation Science,1982,11:341-356.[2] Pawlak Z.R ough sets:theoretical aspects of reas oning aboutdata[M].Boston:K luwer Academic Publishers,1991:66-90.[3] Dubois D,Prade H.R ough fuzzy sets and fuzzy rough sets[J].International Journal of G eneral System,1990,17:191-208.[4] Dubois D,Prade H.Putting rough sets and fuzzy sets to2gether[C]∥S lowinski R,Intelligent Decision Support.[S.l.]:K luwer Academic,D ordrecht,1992:203-232. [5] Z adeh L A.Fuzzy sets[J].In formation and C ontrol,1965(8):338-353.[6] Nakamura A.Fuzzy rough sets[J].N ote on Multiple-Val2ued Logic in Japan,1988,9(8):1-8.[7] Nanda S.fuzzy rough sets[J].Fuzzy Sets and Systems,1992(45):157-160.[8] Thiele H.on the definition of m odel operators in fuzzy logic[C]∥Proc.IS M V L-93.Sacramento,C A:[s.n.],1993:62-67.431重庆工学院学报[9] 张文修.粗糙集理论与方法[M].北京:科学出版社,2001.[10]K ortelainen J.on the relationship beween m odified sets,topological spaces and rough sets[J].Fuzzy Sets and Sys2tem,1994(61):91-95.[11]Y ao Y Y.T w o views of the theory of rough sets in finiteuni2verses[J].InternetJ.Approx.Reas ons,1996(15):291-317.[12]Y ao Y Y,Lin T Y.G eneralization of rough sets using m odallogics[J].Intell.Automat.S oft C omputer,1996(2):103-120.[13]K ryszkiewicz M.R ough set approach to incomplete in forma2tion systems[J].In formation Sciences,1998(112):39-49.[14]P omykala J A.Approximation operations in Approximationspaces[J].Bullerin of the P olish Academy of sciences:Mathmatics,1987(35):653-662.[15]Y ao Y Y.C onstrctive and algebraic methods of the theory ofrough sets[J].Journal of In formation Sciences,1998(109):21-27.[16]Lin T Y,Liu Q.R ough approximate operators:axiomaticrough sets theory[M]∥Z iarko W,R ough Sets,Fuzzy Setsand K nowledge Discovery.Berlin:S pringer,1994:256-260.[17]Pal S K.R oughness of a fuzzy set[J].In formation Sciences,1996(93):235-246.[18]Y ao Y Y.Relational interpretations of neighborhood opera2tors and rough set approximation operators[J].In formationSciences,1998(111):239-259.[19]Chakrabarty K,Biswas R,Nanda S.Fuzziness in rough sets[J].Fuzzy Sets And Systems,2000(110):247-251. [20]Y ao Y Y.C ombination of rough and fuzzy sets based on-level sets[C]∥Lin T Y,Cercone N.R ough Sets and DataMining:Analysis for Imprecise Data.Boston:K luwer Aca2demic Publishers,1997:301-321.[21]M orsi N N,Y akout M M.Axiomatics for fuzzy rough sets[J].Fuzzy sets And Systemss,1998(100):327-342. [22]Bodjanova S.Approximation of a fuzzy concepts in decisionmaking[J].Fuzzy Ses and Systems,1997(85):23-29.[23]K uncheva L I.Fuzzy rough sets:Application to feature selec2tion[J].Fuzzy Sets and System,1992(51):147-153. [24]聂作先,刘建成.一种面向连续属性空间的模糊粗糙约简[J].计算机工程,2005,31(6):88-90.[25]WeiZhi Wu,JuSheng Mi,WenX iu Zhang.G eneralized fuzzyrough sets[J].In formation Sciences,2003(151):263-282.[26]Richard Jensen,Qiang Shen.Fuzzy rough attribute reductinwith application to web categ orization[J].Fuzzy sets andSystem,2004(141):469-485.[27]K eyun Qin,Zheng Pei.On the topological properties of fuzzyrough sets[J].Fuzzy Sets and System,2005(151)601-613.[28]K erre E,E tienne A.Anna Maria Radzikowska[J].C om2parative study of fuzzy rough sets,2002(126):137-155.[29]Jensen R,Shen Q.A rough set-aided system for s ortingWWW bookmarks[M]∥Zhong N.Web Intelligence:Re2search and Development.[S.l.]:[s.n.],2001:95-105.[30]Jensen R,Shen Q.Fuzzy-rough sets for descriptive dimen2sionality reduction[C]∥Proc,11th Internat.C on f.onFuzzy Systems.[S.l.]:[s.n.],2002,29-34.(责任编辑 刘 舸)(上接第129页)systems with product recovery[J].C omputers&IndustrialEngineering,2004,46:431-441.[4] 陈秋双,刘东红.再制造系统的库存控制研究[J].南开大学学报:自然科学版,2003,36(3):67-72. [5] Inderfurth K.Optimal policies in hybrid manu facturing/re2manu facturing systems with product substitution[J].Inter2 national Journal of Production economics,2004,90:325-343.[6] 赵昱卿,王东,奚立峰.制造与再制造决策的优化[J].工业工程与管理,2003,8(2):18-21.[7] 厉以宁.西方经济学[M].北京:高等教育出版社,2000,33-37.[8] Petruzzi N,Dada M.Pricing and the new-vendor problem:A review with extension[J].Operations Research,1999,47(2):183-194.[9] Jinn-Tsair T eng,Chun-T ao Chang.Economic productionquantity m odels for deteriorating items with price and stock-dependent demand[J].C omputers&operations research, 2005(32):297-308.[10]G upate D,Arthur V H,T atiana Bouzdine-Chameeva.Apricing m odel for clearing end-of-seas on retail inventory [J].European Journal of Operational Research,2006(170):518-540.(责任编辑 刘 舸)531姚红霞:模糊粗糙集理论介绍和研究综述。
粗糙集
粗糙集理论建立在这样一个前提上:即所考虑的 论域中的每一个对象都包含某种信息(数据和知 识)。
条件属性集:
数学定义是:P={P1,P2,…,Pm} 解释:就是对象的各种属性总和(也就是数据库中 的字段) Pm 就是这个对象的一个属性
基本集(基本粒度):
定义:所有不可区分的对象形成的集合 解释:可区分(可分辨):如果Ui ≠Uj 就称这两个 对象在其条件P下是可区分的(对于两个不同的对 象至少有一个属性是不同的)否则即为不可区分
集合O 的下逼近(即正区) 为 I 3 (O ) = PO S (O ) = {刘保,赵 凯} 集合O 的负区为 N EG (O ) = {李得} 集合O 的边界区为 BND (O ) = {王治, 马丽} 集合O 的上逼近为 I 3 (O ) = PO S (O ) + BND (O ) = {刘保,赵凯,王治,马 丽} 根据表1, 可以归纳出下面几条规则, 揭示了教育程度与 是否能找到好工作之间的关 RUL E 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作) RUL E 2: IF (教育程度= 小学) THEN (找不到好工作) RUL E 3: IF (教育程度= 高中) THEN (可能找到好工作)
例
对于上表来说,U中有四个对象(概念),而现 在条件集合中只有一个属性,对于U1和U2来说, 它们的p不同所以可以通过p来区分,即u1,u2在p 下可区分;而U2和U3虽然是不同的对象但是在P 下却是相同的,即在p下不可区分,就成为不可ห้องสมุดไป่ตู้区分
粗糙集:
一个集合若恰好等于基本集的任意并集称为一个清晰 (crisp)集(精确集),否则称为粗糙(rough)集(不 精确集)。 解释:都可区分的是清晰集,有不可区分的对象为粗糙 集 主要特点:以不完全信息或知识去处理一些不分明现象的 能力,或依据观察、度量到的某些不精确的结果而进行分 类数据的能力. 粗糙集体现了集合中元素间的不可区分性. 主要优势:它不需要提供问题所需处理的数据集合之外的 任何先验知识,而且与处理其它不确定性问题的理论有很 强的互补性.
粗糙集
粗糙集(Rough Set)理论是由波兰数学家Pawlak在1982年提出的一种数据分析理论,常用于处理模糊和不精确的问题。
RS可以从大量的数据中挖掘潜在的、有利用价值的知识,它与概率方法、模糊集方法和证据理论方法等其他处理不确定性问题理论的最显著的区别在于:它无需提供问题所需处理的数据集合之外的任何先验信息(即无需指定隶属度或隶属函数)。
粗糙集是提供了严格的数学理论方法。
它把知识理解为对对象的分类能力。
它包含了知识的一种形式模型,这种模型将知识定义为不可区分关系的一个族集。
在信息检索过程中,由于文档中存在大量的多义和近义现象,导致不确定性出现,这将影响检索的性能。
为此采用基于互信息的粗糙集理论来处理这类不确定性问题。
动态约简技术探讨:利用标准的粗糙集方法来产生约简,即直接在原决策表的基础上计算所有的约简集,然后利用这些约简计算决策规则集合来分类未知对象。
这种方法对于未知对象的分类不总是足够充分的,因为该方法没有考虑到约简集的属性部分可能是混乱、不规则的。
动态约简是来自于在决策表的众多随机采样的子表中具有最大的出现频率的约简,在此意义上来说,利用动态约简来分类位置对象是最为稳定、可靠的。
经典粗糙集理论是建立在对象空间的等价类之上,采用上近似、下近似和边界的概念来分析对象的空间中不能由等价关系定义的子集的性质,是一种利用三值逻辑处理不精确或不完全信息的形式化方法。
有“智慧”,实际上是它们将外部环境和内部状态的传感信号分类,得出可能的情况,并由此支配行动,知识直接与真实或抽象世界有关的不同分类模式联系在一起。
因此,任何一个物种都是由一些知识来描述,对物种可以产生不同的分类。
从而如何在知识库中进行本质特征提取,发现最简决策表及最简分类规则集成为知识描述的关键。
从理论上看,智能信息处理的重要任务就是要从大量观察和实验数据中获取知识、表达知识、推理决策规则,特别是对于不精确、不完整的知识。
RS是处理不精确信息的有力工具。
粗糙集理论及其应用综述
粗糙集理论及其应用综述摘要、粗糙集理论是一种新的分析和处理不精确、不一致、不完整信息与知识的数学工具,为智能信息处理提供了有效的处理技术,近年来,被广泛应用于专家系统、图像处理、模式识别、决策分析等领域。
文中介绍了关于粗糙集的基本理论,并对其在各领域的应用情况进行了综述。
关键词、粗糙集理论;不确定性;知识约简;粗糙模糊集中图分类号、TP18文献标识码、A文章编号、2095-1302(2017)06-00-020引言粗糙集理论由波兰华沙理工大学Z.Pawlak教授于1982年首先提出,通过结合逻辑学和哲学中对不精确、模糊的定义,针对知识和知识系统提出了知识简约、知识依赖、知识表达系统等概念,并在此基础上形成了完整的理论体系――粗糙集理论。
粗糙集理论把知识看作关于论域的划分,认为知识是有粒度的,而知识的不精_性是由知识的粒度过大引起的。
从1992年至今,每年都要以粗糙集为主题召开国际会议,近两年,召开的关于粗糙集的会议有2015年国际粗糙集联合会议(IJCRS2015)和2016年第十六届中国粗糙集与软计算联合学术会议(CRSSC2016)。
粗糙集越来越受到各行业专家和科研人员的重视,随着对粗糙集理论研究的不断加深,越来越多的领域开始运用粗糙集解决问题。
1粗糙集理论1.1知识与知识系统将研究对象构成的集合记为U,这是一个非空有限集,称为论域U,任何子集,称其为U中的一个概念或范畴。
把U中任何概念族都称为关于U的抽象知识,简称知识。
一个划分定义为、X={X1,X2,…,Xn},,Xi≠φ,Xi∩Xj=φ,且i≠j,i,j=1,2,…,n;∪niXi=U。
U上的一簇划分称为关于U的一个知识系统。
R是U上的一个等价关系,由它产生的等价类可记为[x]R={y|xRy,y∈U},这些等价类构成的集合U/R={[x]R|x∈U}是关于U的一个划分。
若PR,且P≠φ,则∩P也是一种等价关系,称为P上不可分辨关系,记为ind(P)、。
粗糙集理论及其应用综述
粗糙集理论及其应用综述3韩祯祥 张 琦 文福拴(浙江大学电机系・杭州,310027) 摘要:粗糙集理论是一种较新的软计算方法,可以有效地分析和处理不完备信息.该理论近年日益受到国际学术届的重视,已经在模式识别、机器学习、决策支持、过程控制、预测建模等许多科学与工程领域得到成功的应用.本文介绍了粗糙集理论的基本概念,对其在各领域的应用情况进行了综述.关键词:粗糙集;不确定性;数据分析;软计算;粗糙控制A Survey on R ough Set Theory and Its ApplicationHan Zhenxiang , Zhang Qi and Wen Fushuan(Department of E lectrical Engineering ,Zhejiang University ・Hangzhou ,310027,P.R.China )Abstract :R ough set theory is a relatively new s oft com putingtool to deal with vagueness and uncertainty.I t has received much attention of the researchers around the w orld.R ough set theory has been applied to many areas success fully including pattern recognition ,machine learning ,decision support ,process control and predictive m odeling.This paper introduces the basic concepts of rough set.A survey on its applicatoins is als o given.K ey w ords :rough set ;uncertainty ;data analysis ;s oft com puting ;rough control1 引言(Introduction )粗糙集(R ougn Set ,RS )理论是一种刻划不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[1].RS 理论是由波兰学者Pawlak Z 在1982年[2]提出的.1991年Pawlak Z 出版了专著[3],系统全面地阐述了RS 理论,奠定了严密的数学基础.该书与1992年出版的RS 理论应用专集[4]较好地总结了这一时期RS 理论与实践的研究成果,促进了它的进一步发展,现已成为学习和应用RS 理论的重要文献.从1992年至今,每年都召开以RS 为主题的国际会议,推动了RS 理论的拓展和应用.国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家.目前RS 理论已成为人工智能领域中一个较新的学术热点,引起了越来越多的科研人员的关注.2 粗糙集理论的基本概念(Basic concepts of rough settheory )2.1 知识与不可分辨关系(K nowledge and indiscernibility rela 2tion )在RS 理论中,“知识”被认为一种将现实或抽象的对象进行分类的能力[3].假定我们具有关于论域的某种知识,并使用属性(attribute )及其值(value )来描述论域中的对象.例如:空间物体集合U 具有“颜色”、“形状”这两种属性,“颜色”的属性值取为红、黄、绿,“形状”的属性值取为方、圆、三角形.从离散数学的观点看,“颜色”、“形状”构成了U 上的一族等效关系(equivalent relation ).U 中的物体,按照“颜色”这一等效关系,可以划分为“红色的物体”、“黄色的物体”、“绿色的物体”等集合;按照“形状”这一等效关系,可以划分为“方的物体”、“圆的物体”、“三角形的物体”等集合;按照“颜色+形状”这一合成等效关系,又可以划分为“红色的圆物体”、“黄色的方物体”、“绿色的三角形物体”…等集合.如果两个物体同属于“红色的圆物体”这一集合,它们之间是不可分辨关系(indiscernibility relation ),因为描述它们的属性都是“红”和“圆”.不可分辨关系的概念是RS 理论的基石,它揭示出论域知识的颗粒状结构.2.2 粗糙集合的下逼近、上逼近、边界区和粗糙隶属函数(Lower and upper approximation of rough set ,boundary region and rough membership function )给定一个有限的非空集合U 称为论域,R 为U 上的一族等效关系.R 将U 划分为互不相交的基本等效类,二元对K=(U ,R )构成一个近似空间(approximation space ).设X 为U的一个子集,a 为U 中的一个对象,[a ]R 表示所有与a 不可分辨的对象所组成的集合,即由a 决定的等效类.当集合X 能表示成基本等效类组成的并集时,则称集合X 是可以精确定义的;否则,集合X 只能通过逼近的方式来刻划.集合X 关于R 的下逼近(lower approximation )定义为:R 3(X )={a ∈U :[a ]R ΑX}.(1)R 3(X )实际上是由那些根据已有知识判断肯定属于X 的对象所组成的最大的集合,也称为X 的正区(positive region ),记 3国家自然科学基金资助项目(59777011).本文于1997年9月3日收到.1998年11月18日收到修改稿.第16卷第2期1999年4月控制理论与应用CONTROL THEORY AND APPLICATIONS Vol.16,No.2Apr.,1999作POS (X ).由根据已有知识判断肯定不属于X 的对象组成的集合称为X 的负区(negative region ).记作NEG (X ).集合X 关于R 的上逼近(upper approximation )定义为R 3(X )={a∈U :[a ]R ∩X ≠ }.(2)R 3(X )是由所有与X 相交非空的等效类[a ]R 的并集,是那些可能属于X 的对象组成的最小集合.显然,R 3(X )+NEG (X )=论域U.集合X 的边界区(boundary region )定义为:BN (X )=R 3(X )-R 3(X ).(3)BN (X )为集合X 的上逼近与下逼近之差.如果BN (X )是空集,则称X 关于R 是清晰的(crisp );反之如果BN (X )不是空集,则称集合X 为关于R 的粗糙集(rough set ).图1为粗糙集概念的示意图.下逼近、上逼近及边界区等概念刻划了一个不能精确定义的集合的逼近特性.逼近精度定义为αR (X )=|R 3(X )||R 3(X )|.(4)式中|R 3(X )|表示集合R 3(X )的基数或势(cardinality ),对有限集合来说表示集合中所包含元素的个数.显然,0≤αR (X )≤1,如果αR (X )=1,则称集合X 相对于R 是清晰的;αR (X )<1,则称集合X 相对于R 是粗糙的.αR (X )可认为是在等效关系R 下逼近集合X 的精度.RS 理论中定义了粗糙隶属函数(rough membership func 2tion ).通过使用不可分辨关系,定义元素a 对集合X 的粗糙隶属函数如下μRX (a )=|X ∩[a ]R ||[a ]R |.(5)显然0≤μRX ≤1,粗糙隶属函数也可以用来定义集合X 的上、下逼近和边界区.现举例说明粗糙集的概念.论域U 及等效关系R ={R 1,R 2}采用如下定义:U ={x 1,x 2,x 3,x 4,x 5,x 6,x 7,x 8,x 9,x 10},U/R 1={{x 1,x 2,x 3,x 4},{x 5,x 6,x 7,x 8,x 9,x 10}},U/R 2={{x 1,x 2,x 3},{x 4,x 5,x 6,x 7},{x 8,x 9,x 10}},U/R ={{x 2,x 3},{x 4},{x 5,x 6,x 7},{x 8,x 9,x 10}}.则关于集合X ={x 1,x 2,x 3,x 4,x 5}的逼近为POS (X )={x 4},NEG (X )={x 8,x 9,x 10},BN (X )={x 1,x 2,x 3,x 5,x 6,x 7}.{x 4}是集合X 的正区,因为x 4肯定属于X ;{x 8,x 9,x 10}肯定不属于X ,因此为X 的负区;{x 1,x 2,x 3,x 5,x 6,x 7}是否属于X 在等效关系R 下无法确定,构成了X 的边界区.2.3 决策表、约简与核(Decision table ,reduct and core )RS 理论中应用决策表来描述论域中对象.它是一张二维表格,每一行描述一个对象,每一列描述对象的一种属性.属性分为条件属性和决策属性,论域中的对象根据条件属性的不同,被划分到具有不同决策属性的决策类.表1为一张决策表,论域U 有5个对象,编号1~5,{a ,b ,c}是条件属性集,d 为决策属性.对于分类来说,并非所有的条件属性都是必要的,有些是多余的,去除这些属性不会影响原来的分类效果.约简(reduct )定义为不含多余属性并保证分类正确的最小条件属性集.一个决策表可能同时存在几个约简,这些约简的交集定义为决策表的核(core ),核中的属性是影响分类的重要属性.表1化简后得到了两个约简:{a ,c}和{b ,c},见表2和表3.它们维持了与原有条件属性集{a ,b ,c}相同的分类能力.{c}是核,表明c 是影响分类的重要属性.表1 决策表T able 1 Decision tableUabcd110212210232123412215123表2 约简{a ,c}T able 2 Reduct {a ,c}Uacd112122023223513表3 约简{b ,c}T able 3 Reduct {b ,c}Ubcd10312102312342215203 从另一个角度看,决策表中每一个对象都蕴含着一条分类规则,决策表实际上也是一组逻辑规则的集合.例如表1中的对象1蕴含的规则是a 1b 0c 2]d 1.化简决策表的过程也就是抽取分类规则的过程.表2中对象4在去掉属性b 后154 控制理论与应用16卷 与对象1蕴含相同的分类规则,为避免重复而被除去.约简中的规则还可进一步化简,删除那些与分类无关的次要属性.表3第一行中的“3”表示属性c的取值不重要,即只要b =0,d一定为1(b0]d1).“约简”和“核”这两个概念很重要,是RS方法的精华. RS理论提供了搜索约简和核的方法.计算约简的复杂性随着决策表的增大呈指数增长,是一个典型的NP完全问题,当然实际中没有必要求出所有的约简.引入启发式的搜索方法如遗传算法[10]有助于找到较优的约简,即所含条件属性最少的约简.3 粗糙集理论的特点(Features of rough set theory)1)RS不需要先验知识.模糊集和概率统计方法是处理不确定信息的常用方法,但这些方法需要一些数据的附加信息或先验知识,如模糊隶属函数和概率分布等,这些信息有时并不容易得到.RS分析方法仅利用数据本身提供的信息,无须任何先验知识.2)RS是一个强大的数据分析工具.它能表达和处理不完备信息;能在保留关键信息的前提下对数据进行化简并求得知识的最小表达;能识别并评估数据之间的依赖关系,揭示出概念简单的模式;能从经验数据中获取易于证实的规则知识,特别适于智能控制.3)RS与模糊集分别刻划了不完备信息的两个方面[5]: RS以不可分辨关系为基础,侧重分类,模糊集基于元素对集合隶属程度的不同,强调集合本身的含混性(vagueness).从RS的观点看,粗糙集合不能清晰定义的原因是缺乏足够的论域知识,但可以用一对清晰集合逼近.有关RS和模糊集内在联系的阐述及模糊粗糙集(fuzzy2rough set)的概念,请参见文[6~8].RS和证据理论也有一些相互交叠之处[9],在实际应用中可以相互补充.4 粗糙集理论的应用(Applications of rough set theo2 ry)RS理论的生命力在于它具有较强的实用性,从诞生到现在虽然只有十几年的时间,但已经在许多领域取得了令人鼓舞的成果.1)股票数据分析.文[11]应用RS方法分析了十年间股票的历史数据,研究了股票价格与经济指数之间的依赖关系,获得的预测规则得到了华尔街证券交易专家的认可.2)模式识别.文[12]应用RS方法研究了手写字符识别问题,提取出了特征属性.3)地震预报.文[13]研究了地震前的地质和气象数据与里氏地震级别的依赖关系.4)冲突分析.文[14]应用RS方法建立了反映以色列、巴勒斯坦、约旦、埃及、叙利亚和沙特阿拉伯等六国关于中东和平问题各自立场的谈判模型.5)从数据库中知识发现(knowledge discovery in database, K DD)[15,16].K DD又称数据发掘(data mining),是当前人工智能和数据库技术交叉学科的研究热点之一.RS方法现已成为K DD的一种重要方法,其导出的知识精练且更便于存储和使用.6)粗糙控制(rough control)[17~23].RS根据观测数据获得控制策略的方法被称为从范例中学习(learning from exam2 ples),属于智能控制的范畴.基本步骤是:把控制过程中的一些有代表性的状态以及操作人员在这些状态下所采取的控制策略都记录下来,形成决策表,然后对其分析化简,总结出控制规则[17,18].形式为:IF C ondition=N满足THE N采取De2 cision=M.RS方法是一类符号化分析方法,需要将连续的控制变量离散化,为此Pawlak Z提出了粗糙函数(rough func2 tion)的概念[19],为粗糙控制打下了理论基础.文[20,21]应用粗糙控制研究了“小车—倒立摆系统”这一经典控制问题,取得了较好的结果.在过程控制领域,文[22]应用RS方法成功地提取出了水泥窑炉的控制规则.粗糙控制的优点是简单迅速、实现容易,不需要象Fuzzy控制那样进行模糊化和去模糊化.因此在特别要求控制器结构与算法简单的场合,采取粗糙控制较为合适.另外,由于控制算法完全来自观测数据本身,其决策和推理过程可以很容易被检验和证实.一种新的有吸引力的控制策略“模糊2粗糙控制(fuzzy2rough control)”正悄然兴起,其主要思路是利用RS获取模糊控制规则.7)医疗诊断.RS方法根据以往的病例归纳出诊断规则,用来指导新的病例.现有的人工预测早产的准确率只有17%~38%,应用粗糙集理论则可提高到68%~90%[1].8)专家系统(ES).RS抽取规则的特点,为构造ES知识库提供了一条崭新的途径[24].9)人工神经元网络(ANN).训练时间过于漫长的固有缺点是制约ANN实用化的因素之一.文[25]应用RS化简神经网络训练样本数据集,在保留重要信息的前提下消除了多余的数据,使训练速度提高了4177倍,获得了较好的效果.文[26,27]将RS与ANN结合起来,充分利用RS处理不确定性的特长以增强ANN的信息处理能力.10)决策分析[28~30].RS的决策规则是在分析以往经验数据的基础上得到的.RS允许决策对象中存在一些不太明确、不太完整的属性,弥补了常规决策方法的不足.希腊工业发展银行ETE VA应用RS理论协助制订信贷政策,是RS多准测决策方法的一个成功范例.RS理论的应用领域还包括:近似推理[31,32]、软件工程数据分析[33]、图象处理[34]、材料科学中的晶体结构分析[35]、预测建模[36,37]、结构建模[38]、投票分析[39]、电力系统[40,42]等. RS在我国的研究刚刚起步,有关文献还不多[43~44].5 结束语(C onclusion)虽然RS至今只有十几年的发展历史,但取得的研究成果是令人瞩目的.它是一种较有前途的软计算方法,为处理不确定性信息提供了有力的分析手段[45].我们相信RS具有广阔的发展空间,今后会在更多的实际领域中发挥作用.致谢 波兰华沙工业大学计算机科学研究所(Institute of C om puter Science,Warsaw University of T echnology)的Zdzislaw Pawlak教授和Bozena Skalska博士赠送了部分研究报告,在此向他们表示感谢. 1期粗糙集理论及其应用综述155参考文献(References)1 Pawlak Z et al.R ough sets.C ommunications of AC M,1995,38(11):89 -952 Pawlak Z.R ough sets.International Journal of In formation and C om puter Science,1982,(11):341-3563 Pawlak Z.R ough set-theoretical aspects of reas oning about data.D or2 drecht:K luwer Academ ic Publishers,19914 S lowinski R.Intelligent decision support-handbook of applications and advances of the rough sets theory.D ordrecht:K luwer Academ ic Publish2 ers,19925 Pawlak Z.Vagueness and uncertainty-a rough set perspective.C om puta2 tional Intelligence,1995,11(2):227-2326 W ygralak M.R ough sets and fuzzy sets-s ome remarks on interrelations.Fuzzy Sets and Systems,1989,29(3):241-2437 Nanda S et al.Fuzzy rough sets.Fuzzy Sets and Systems,1992,45(2): 157-1608 Banerjee M and Pal S K.R oughness of a fuzzy set.In formation Sciences, 1996,93(3,4):235-2469 Skowton A et al.From rough set theory to evidence theory.Advances in the Dem pster Shafer Theory of Evidence.New Y ork:John W iley&S ons Inc.,1994,193-23610 Jakub W.Finding m inimal reducts using genetic alg orithm.Institute ofC om puter Science Reports,W arsaw University of T echnology,W arsaw,199511 G olan R and Z iarko W.M ethodology for stock market analysis utilizing rough set theory.Proc.of IEEE/IAFE C on ference on C om putational In2 telligence for Financial Engineering,New Jersey,1995,32-4012 Nejman D.A rough set based method of handwritten numerals classifica2 tion.Institutc of C om puter Science Reports,W arsaw University of T ech2 nology,W arsaw,199413 T eghem J et e of rough sets method to draw prem onitory factors for earthquakes by em phasizing gas geochem istry.In:Intelligent Decision Support-Handbook of applications and Advances of the R ough Sets Theory.D ordrecht:K luwer Academ ic Publishers,1992,165-17914 Deja R.C on flict m odel with neg otiations.In:Institute of C om puter Sci2 ence Reports.W arsaw University of T echnlolgy,W arsaw,199515 Hu X iaohua et al.M ining knowledge rules from databases-a rough set approach.Proc.of IEEE International C on ference on Data Engineering, Los Alam itos,1996,96-10516 Tsum oto Sh et al.Extraction of domain knowledge from databases based on rough set theory.IEEE International C on ference on Fuzzy Systems, New Jersey,1996,748-75417 S ienkiewicz J.R ough set and rough function approaches to the control al2g orithm reconstruction.Institute of C om puter Science Reports,W arsaw U2niversity of T echnology,W arsaw,199618 Mrozek A et al.M ethodology of rough controller synthesis.Proc.of IEEE International C on ference on Fuzzy Systems,New Jersey,1996,1135-113919 Pawlak Z.R ough sets,rough relations and rough functions.Fundamenta In formaticae,1996,27(2,3):103-10820 Plonka L and Mrozek A.Rule2based stabilization of the inverted pendu2lum.C om putational Intelligence,1995,11(2):348-35621 C z ogala E et al.Idea of a rough fuzzy controller and its application to the stabilization of a pendulum2car system.Fuzzy Sets and systems,1995,72(1):6127322 Mrozek A.R ough sets and dependency analysis am ong attributes in com2 puter im plementations of expert’s in ference m odels.International Journal of M an2M achine S tudies,1989,30(4):457-47323 Arima M et al.Fuzzy logic and rough sets controller for HVAC systems.Proc.of IEEE WESCANEX C ommunications,P ower,and C om puting, New Y ork,1995,133-13824 Tsum oto S et al.Automated discovery of medical expert system rules from clinical databases based on rough sets.Proc.of Second InternationalC on f.on K nowledge Discovery and Data M ining,US A,1996,63-7225 Jelonek J et al.R ough set reduction of attributes and their domains for neural netw orks.C om putational Intelligence,1995,11(2):339-34726 Peng C et al.Multi2valued neural netw ork and the knowledge acquisition method by the rough sets for ambiguous recognition problem.Proc.of the IEEE International C on ference on Systems,M an and Cybernetics,Bei2 jing,1996,736-74027 Y asdi R.C ombining rough sets learning and neural learning2method to deal with uncertain and im precise in formation.Neurocom puting,1995,7(1):61-8428 S lowinski R.R ough set approach to decision analysis.AI Expert,M arch 1995,19-2529 Pawlak Z.R ough set approach to knowledge2based decision support.In2 stitute of C om puter Science Reports,W arsaw University of T echnology, W arsaw,199530 S lowinski R et al.R ough set s orting of firms according to bankruptcy risk.In:Applying Multiple Criteria aid for Decision to Environment M an2 agement,D ordrecht:K luwer Academ ic Publishers,1994,339-35731 S lowinski R et al.R ough set reas oning about uncertain data.Fundamenta In formaticae,1996,27(2,3):229-24332 Pars ons S et al.A rough set approach to reas oning under uncertainty.Journal of Exprimental and Theoretical AI,1995,7(2):175-19333 Ruhe Gand G esselschaft F.R ough set based data analysis in g oal2orient2 ed s oftware measurement.Proc.of IEEE International s oftware M etrics Sym posium,Los Alam itos,1996,10-1934 W ojcik Z et al.Application of rough sets for edge enhancing image fil2 ters.Proc.of IEEE International C on ference on Image Processing,Los Alam itos,1994,525-52935 Jacks on A et al.R ough sets applied to materials data.Acta M aterialia, 1996,44(11):4475-448436 C ollette T and S zladow e rough sets and spectral data for building predictive m odels of reaction rate constants.Applied S pectroscopy, 1994,48(11):1379-138637 Aijun A et al.Discovering rules for water demand prediction-an en2 hanced rough set approach.Engineering Applications of Artificial Intelli2 gence,1996,9(6):645-65338 W ojcik Z et al.S tructural m odeling using rough sets.Proc.of IEEE Inter2 national C on ference on Fuzzy Systems,New Jersey,1996,761-76639 Nurm i H et al.Probabilistic,fuzzy and rough concepts in s ocial choice.European Journal of Operational Research,1996,95(2):264-277156 控制理论与应用16卷 40 Lambert2T orres G et al.Data M ining into a C ontrol Center Database via R ough Set T echniques.Proc.of the International C on ference on Intelli2 gent Systems Applications to P ower Systems(IS AP’97),Seoul,1997, 246-25041 Zhang Q,Han Z X and W en F S.A new approach for fault diagnosis in power systems based on rough set theory.Proceedings of APSCOM’97,H ong K ong,1997,597-60242 张琦,韩祯祥,文福拴.一种基于粗糙集方法的电力系统故障诊断/警报处理的新方法.中国电力,1998,31(4):32-3843 王珏,苗夺谦,周育键.关于R ough Set理论与应用的综述.模式识别与人工智能,1996,9(4):337-34444 曾黄麟.粗集理论及其应用.重庆:重庆大学出版社,199845 E wa Orlowska(ed.).Incom plete in formation2rough set analysis.New Y ork:Physica2Verlag,1998本文作者简介韩祯祥 1930年生.浙江大学教授,博士生导师.研究领域为软计算方法及其在电力系统中的应用.张 琦 1971年生.浙江大学在读博士生.研究方向为粗糙集理论在电力系统中的应用.文福拴 1965年生.浙江大学教授,博士生导师.研究领域为软计算方法在电力系统中的应用. 1期粗糙集理论及其应用综述157。
粗糙集理论综述 收藏
粗糙集理论综述收藏进入网络信息时代,随着计算机技术和网络技术的飞速发展,使得各个行业领域的信息急剧增加,如何从大量的、杂乱无章的数据中发现潜在的、有价值的、简洁的知识呢?数据挖掘(Data Mining)和知识发现(KDD)技术应运而生。
粗糙集理论作为一种数据分析处理理论,在1982年由波兰科学家Z.Pawlak创立[1]。
最开始由于语言的问题,该理论创立之初只有东欧国家的一些学者研究和应用它,后来才受到国际上数学界和计算机界的重视。
1991年,Pawlak出版了《粗糙集—关于数据推理的理论》这本专著,从此粗糙集理论及其应用的研究进入了一个新的阶段,1992年关于粗糙集理论的第一届国际学术会议在波兰召开。
1995年ACM将粗糙集理论列为新兴的计算机科学的研究课题。
粗糙集理论作为一种处理不精确(imprecise)、不一致(inconsistent)、不完整(incomplete)等各种不完备的信息有效的工具,一方面得益于他的数学基础成熟、不需要先验知识;另一方面在于它的易用性。
由于粗糙集理论创建的目的和研究的出发点就是直接对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,因此是一种天然的数据挖掘或者知识发现方法,它与基于概率论的数据挖掘方法、基于模糊理论的数据挖掘方法和基于证据理论的数据挖掘方法等其他处理不确定性问题理论的方法相比较,最显著的区别是它不需要提供问题所需处理的数据集合之外的任何先验知识,而且与处理其他不确定性问题的理论有很强的互补性(特别是模糊理论)。
目前,粗糙集理论的研究方向主要是三个方面:理论上,①利用抽象代数来研究粗糙集代数空间这种特殊的代数结构[2~7]。
②利用拓扑学描述粗糙空间[8]。
③还有就是研究粗糙集理论和其他软计算方法或者人工智能的方法相接合,例如和模糊理论、神经网络、支持向量机、遗传算法等[9~19]。
④针对经典粗糙集理论框架的局限性,拓宽粗糙集理论的框架,将建立在等价关系的经典粗糙集理论拓展到相似关系甚至一般关系上的粗糙集理论[20~23]。
粗糙集理论及其应用发展综述
粗糙集理论及其应用发展综述模糊粗糙集理论第21卷第6期Vol.21 No.6重庆工商大学学报(自然科学版)JChongqingTechnolBusinessUniv.(NatSciEd)____年12月Dec.____ 文章编号:1672-058_(____)05-0575-05粗糙集理论及其应用发展综述代春艳1,2(1.重庆工商大学计算机科学与信息工程学院,重庆400067;2重庆大学经济与工商管理学院,重庆400044)摘要:介绍了粗糙集理论的基本概念、研究对象,,并对它和模糊集、证据理论等相关理论,领域的关系进行了阐述。
关键词:粗糙集;不确定性;;中图分类号:TP粗糙集(RoughZ.Pawlak在1982年提出的,该理论是一种刻画不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[1]。
1992年至今,每年都召开以RS为主题的国际会议,推动了RS理论的拓展和应用。
国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家。
目前,粗糙集这一新的数学理论已经成为信息科学领域的研究热点之一,它在机器学习、知识获取、决策分析、过程控制等许多领域得到了广泛的应用。
1 粗糙集理论的基本概念1.1 知识的含义粗糙集理论建立在分类机制的基础上,并将等价关系对空间的划分与知识等同。
粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似)刻画。
在粗糙集理论中“,知识”被认为是一种分类能力,也就是将知识理解为对数据的划分。
用集合的概念表示就是使用等价关系集R对离散表示的空间U进行划分,知识就是R对U划分的结果。
由此,在U和R的意义 (1)下,知识库可以定义为:属于R中的所有可能的关系对U的划分,记为K=(U,R)这样给定一组数据U与等价关系集R,在R下对U的划分,称为知识,记为U/R。
粗糙集理论辅助现代医疗诊断研究综述
Science and Technology&Innovation┃科技与创新2019年第11期文章编号:2095-6835(2019)11-0025-03粗糙集理论辅助现代医疗诊断研究综述*高静,程铭(首都经济贸易大学,北京100070)摘要:传统医疗面临着信息繁杂且冗余的问题,医学图像的清晰度也达不到标准,这种情况下,传统医疗同粗糙集理论相结合,可以有效地对数据属性约简,得到利于诊断的信息;医学图像的后期处理也可保留感兴趣的图像。
近年来,对于人工智能的研究热度只增不减,粗糙集和各种数据挖掘算法相结合的思路不断应用在医学方面,对于医疗诊断提供了新的想法,也提高了诊断精度,为智能医疗提供了新的可能。
对近十年粗糙集理论应用于医学方面的研究进行比对分析与展望。
关键词:粗糙集理论;医疗诊断;医疗图像;数据挖掘中图分类号:TP18文献标识码:A DOI:10.15913/ki.kjycx.2019.11.0091前言粗糙集理论是一种数学工具,用于处理20世纪80年代早期Prof.Pawlak在波兰提出的不确定性问题,作为一种能够探索不完整、不确定的知识并有效分析这些信息的工具。
保有同样分类实力的同时,把知识减少作为基础,推理和综合推导问题决策或分类规则是其根本思想。
粗糙集分析数据的显著优势在于撇开需要处理的数据,不用提供额外其他先验知识,可以直接从需要分析的问题开始,划分问题的近似域以找出发现不确定数字时隐含的基本法则。
粗糙集理论应用于医学诊断领域已日渐成熟,由于临床诊疗信息种类多样,信息繁多,还有很强的不完整性或冗余性,对于不同病情需要的属性也不同,所以需要粗糙集理论通过属性约简,来保留有助于诊断的属性。
面对不同的疾病,粗糙集也可以选择合适的算法互相补充达到提高医疗诊断的效果。
近十年来,越来越多的国内外研究者将重点放在粗糙集上,提出了粗糙集应用在医学诊断中的种种研究想法。
2粗糙集基本理论2.1知识表达系统针对医疗信息系统(U,A,F),其中U=(x1,x2,…x n)为待训练病例样本集合,A=C∪D为所提取的病人症状特征属性集,C,D分别表示条件属性和决策属性,条件属性用于反映对象特征,决策属性用于反映对象类别,F为病例样本U与症状特征集属性A之间的映射集,也就是对于症状的描述。
粗糙集理论及应用研究综述
粗糙集理论及应用研究综述【摘要】针对粗糙集理论及应用的研究,是学术界一直在研究的课题,本文对目前粗糙集理论及应用的研究情况首先进行了总结,然后对粗糙集理论及应用的研究热点进行了简单的概括和分析,同时还对粗糙集理论及应用今后的发展趋势提出一些展望。
【关键词】粗糙集;属性约简;规则提取;数据挖掘【Abstract】Based on the rough set theory and its application research, academic circles has been the subject of study, this paper summarizes the rough set theory and its application research status, analysis of the rough set theory and its application research hotspot, and the rough set theory and its application in the future research prospect was put forward.【Key words】Rough set;Attribute reduction;Rule extraction;Data mining0.引言粗糙集理论是用来分析和处理不确定、不完整和模糊数据的一种新型数学思想,它在诸多领域有着广泛的应用。
在理论研究方面,粗糙集自从诞生以来就一直是学术界十分关注的研究课题。
基于粗糙集的应用研究更是引起了学术界越来越多人的兴趣。
为了方便人们今后在该领域作更深入的探索,本人首先对目前粗糙集理论及应用的具体情况作一些归纳和总结,然后对粗糙集理论及应用目前的研究热点进行一些简单的概括和分析,同时对粗糙集理论及应用在以后的发展趋势进行一些展望。
1.粗糙集在国内外的研究现状波兰数学家Z.Pawlak在1982年第一次提出粗糙集理论,由于当时该理论是用波兰国家的文字来刊登和发表的,所以除了懂得波兰文的学者外,大多数的学者对粗糙集理论根本没有什么了解,因此没有引起学术界多数研究者的足够的重视。
粗糙集理论与应用研究综述
, 该
理 论 已经 在 机 器 学 习 与 知 识 发 现 、 数 据 挖 掘、 决策 目前 , 有 3 个有关 支持与分析等方面得到广泛应用 . 即R 粗糙 集 的 系 列 国 际 会 议 , S C T C、 R S F D G r C和 中国学者在这方面也 取 得 了 很 大 的 成 果 , 从 R S KT. 2 0 0 1 年开始每 年 召 开 中 国 粗 糙 集 与 软 计 算 学 术 会 议; R S F D G R C 2 0 0 3、 I E E E G r C 2 0 0 5、 R S KT 2 0 0 6、 I F KT 2 0 0 8、 R S KT 2 0 0 8、 I E E EG r C 2 0 0 8 等一 系 列 国 际学术会议在中国召开 . 粗糙集理论与应用的核心基础是从近似空间导 出的一对近似算子 , 即上近似算子和下近似算子 ( 又 下近 似 集 ) 经典 P 称上 、 . a w l a k模型中的不分明关 系是一种等价关系 , 要求很高 , 限制了粗糙集模型的 应用 . 因此 , 如何推广定义近似算子成为了粗糙集理 论研究的一个重点 . 目前, 常见的关于推广粗糙集理论的研究方法 有两种 , 即构造化方法和公理化方法 . 构造化方法是 以论域上的二元关系 、 划分 、 覆盖 、 邻域系统 、 布尔子 代数等作为基本要素 , 进而定义粗糙近似算子 , 从而 公理化方法的基本要素是一 导出粗糙集代数系 统 . 近似算子的某些 对满足某些公理的 一 元 集 合 算 子 , 公理能保证有一些 特 殊 类 型 的 二 元 关 系 的 存 在 ; 反 过来 , 由二元关系通 过 构 造 性 方 法 导 出 的 近 似 算 子 一定满足某些公理 . 事实上 , 有两种形式来描述粗糙集 , 一个是从集 合的观点来 进 行 , 一 个 是 从 算 子 的 观 点 来 进 行. 那 么, 从不同观点采用 不 同 的 研 究 方 法 就 得 到 粗 糙 集 扩展模型的研究以及基于其上的 的各种扩展模型 . 应用研究已经成为新的研究热点 . 粗糙集理论与其它处理不确定和不精确问题理 论的最显著的区别是它无需提供问题所需处理的数 据集合之外的任何 先 验 信 息 , 所以对问题的不确定 性的描述或处理可 以 说 是 比 较 客 观 的 , 由于这个理 论未能包含处理 不 精 确 或 不 确 定 原 始 数 据 的 机 制 , 所以这个理论与概 率 论 、 模糊数学和证据理论等其 它处理不 确 定 或 不 精 确 问 题 的 理 论 有 很 强 的 互 补 因此 , 研究粗糙集理论和其它理论的关系也是粗 性. 糙集理论研究的重点之一 . 基于粗糙集理论的应用研究主要集中在属性约 简、 规则获取 、 基于粗糙集的计算智能算法研究等方 面. 由于属性 约 简 是 一 个 N 许多学者 P H a r d 问 题, 进行了系统的研究 . 基于粗糙集的约简理论发展为 数据挖掘提供了许多有效的新方法 . 比如 , 针对不同
粗糙集理论综述
粗糙集理论综述作者:袁红杰陆永耕程松辽贾竹青来源:《科学与财富》2018年第18期摘要:粗糙集理论是一种新的分析和处理不精确、不一致、不完整信息与知识的数学工具,为智能信息处理提供了有效的处理技术,近年来,被广泛应用于专家系统、图像处理、模式识别、决策分析等领域。
文中介绍了关于粗糙集的基本理论,并对其在各领域的应用情况进行了综述。
关键词:粗糙集理论;不确定性;知识约简0 引言粗糙集理论由波兰华沙理工大学Z.Pawlak教授于1982年首先提出,通过结合逻辑学和哲学中对不精确、模糊的定义,针对知识和知识系统提出了知识简约、知识依赖、知识表达系统等概念,并在此基础上形成了完整的理论体系——粗糙集理论。
粗糙集理论把知识看作关于论域的划分,认为知识是有粒度的,而知识的不精确性是由知识的粒度过大引起的。
从 1992年至今,每年都要以粗糙集为主题召开国际会议,近两年,召开的关于粗糙集的会议有2015年国际粗糙集联合会议和2016年第十六届中国粗糙集与软计算联合学术会议。
粗糙集越来越受到各行业专家和科研人员的重视,随着对粗糙集理论研究的不断加深,越来越多的领域开始运用粗糙集解决问题。
(一).粗糙集理论1.1 知识与知识系统将研究对象构成的集合记为U,这是一个非空有限集,称为论域U,任何子集,称其为U中的一个概念或范畴。
把U中任何概念族都称为关于U的抽象知识,简称知识。
R是U上的一个等价关系,由它产生的等价类可记为,这些等价类构成的集合是关于U 的一个划分。
若,且P≠φ,则∩P也是一种等价关系,称为P上不可分辨关系,记为ind (P):。
1.2 粗糙集与不精确范畴给定知识库K=(U,Q),对于每个子集和一个等价关系 R ind(Q),定义在知识系统U/R下集合X 的下近似为:上近似表示属于X的对象组成的最小集合,即X的正域,记为,而肯定不属于X的对象组成的集合称为X的负域,记为。
在知识系统U/R下集合 X 的上近似为:上近似是可能属于X的对象组成的最小集合。
粗糙集理论介绍和研究综述
X n}是由 U 的子集所构成的集类, 则 F 关于近似空间A 的下近似 ap rF 和上近似 ap rF 定
义为
ap rF = {ap rX 1, ap rX 2, …, ap rX n}
ap rF = {ap rX 1, ap rX 2, …, ap rX n}
F 关于 A 的近似精度 ΑA (F ) 和近似质量 rA (F ) 分别定义为
例3. 1 (无决策情形) S = (U , A , V , Θ) , 其中 U = {x 1, x 2, …, x 8}, 属性集 A = {c1, c2, c3, c4}, V 1= V 2= V 3= {1, 2, 3}, V 4= {1, 2}, 信息函数 Θ见表3. 1。
表311 一个信息系统
关于决策属性D 1Α D
是协调的, 这时也称决策表 (U , C 1∪D 1, V , Θ) 是协调的, 否则为不协调。如果用包含度理
论[48]来解释, 则决策表 (U , C 1∪D 1, V , Θ) 是协调的当且仅当包含度
ap rX = ∪ { [ x ] [ x ] ∩ X ≠ } = {x ∈ U [ x ] ∩ X ≠ } 其中[x ]是 x 所在的 R 2等价类。
下近似 ap r 也称作 X 关于A 的正域, 记作 PO S (X ) , 它可以解释为由那些根据现有
知识判断出肯定属于 X 的对象所组成的最大集合, 上近似 ap r 可以解释为由那些根据现 有知识判断出可能属于 X 的对象所组成的最小集合。U ap rX 称作 X 关于 A 的负域, 记 作 N EG (X ) , 可以解释为由那些根据现有知识判断出肯定不属于 X 的对象所组成的集 合。ap r ap rX 称作 X 的边界 (域) , 记作 B N (X ) , 它可以解释为由那些根据现有知识判断 出可能属于 X 但不能完全肯定是否一定属于 X 的对象中所组成的集合。
粗糙集理论的基本概念ppt文档
方 形
x
,
2
x
6
;
三
角
形
x
,
3
x
,
4
x
,
7
x
8
。
按 体 积 分 类 : 大
x
,
2
x
,
7
x8
;
小
x1,
x
,
3
x
,
4
x
,
5
x
6
。
换 言 之 , 三 个 属 性 定 义 了 三 个 等 价 关 系 : 颜 色 R1,
形
状
R
,
2
体
积
R
,
3
通
过
这
些
等
价
关
系
,
可
以
得
到
下
面
用集合表示的论域的不同划分。
在粗糙集理论中,主要讨论的是那些 能够在论域U上形成划分或覆盖的知识。
我们知道U的划分{X1, X2,…, Xn}与U上 的等价关系R一一对应,即给定U的一个划 分{X1, X2,…, Xn}等同于给定U上的一个等 价关系R,从数学的角度讲,关系的表示和 处理比分类的表示和处理简单得多,因此,
我们通常用等价关系或关系来表示分类及知 识。因此知识也可以定义为,设R是U上的 一个等价关系,U/R ={X1, X2,…, Xn} 表示 R产生的分类,称为关于U的一个知识。
这就意味着可以用不同的属性集对论域的对象进行
描述,以表达关于论域完全相同的知识。如果 IND(S1)IND(S2),我们称知识库K1(知识S1)比 知识库K1(知识S2)更精细,或者说K2(知识S2) 比K1(知识S1)更粗糙。当S1比S2更精细时,我们 也称S1为S2的转化,或S2为S1的泛化。泛化意味着 将某些范畴组合在一起,而特化则是将范畴分割成
粗糙集理论与应用研究综述
粗糙集理论与应用研究综述王国胤1Yiyu Yao2 于洪1,2(1重庆邮电大学计算机科学与技术研究所重庆400065)(2Department of Computer Science, University of Regina, Regina, Canada S4S 0A2){wanggy,yuhong}@,***************.ca摘要本文在阐释粗糙集理论基本体系结构的基础上,从多个角度探讨粗糙集模型的研究思路,分析粗糙集理论与模糊集、证据理论、粒计算、形式概念分析、知识空间等其他理论之间的联系,介绍国内外关于粗糙集理论研究的主要方向和发展状况,讨论当前粗糙集理论研究的热点研究领域,以及将来需要重点研究的主要问题。
关键词粗糙集,模糊集,粒计算,形式概念分析,知识空间,智能信息处理A Survey on Rough Set Theory and Its ApplicationWang Guo-Yin1Yao Yi-Yu2 Yu Hong1,21 Institute of Computer Science and Technology, Chongqing University of Posts and Telecommunications, Chongqing, 4000652 Department of Computer Science, University of Regina, Regina, Saskatchewan, Canada, S4S 0A2Abstract This paper introduces the basic ideas and framework of rough set theory and the different views of knowledge representation in rough set theory, and then discusses the relations between the rough set theory and the other theories, such as fuzzy set, evidence theory, granular computing, formal concept analyzing, knowledge space, etc. Furthermore, the paper reviews the recent studies for this theory and a survey on its applications is also given. The future development trend of rough set theory is also discussed.Keywords rough set, fuzzy set, granular computing, formal concept analyzing, knowledge space, intelligent information processing1 引言智能信息处理是当前信息科学理论和应用研究中的一个热点领域。
经典粗糙集理论资料共32页
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·吐 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
40、人类法律,事物有规律,这是不 容忽视 的。— —爱献 生
谢谢你的阅读
❖ 知识就是财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
粗糙集理论介绍共43页文档
6、法律的基础有两个,而且只有两个……公平和实用。——伯克 7、有两种和平的暴力,那就是法律和礼节。——歌德
8、法律就是秩序,有好的法律才有好的秩序。——亚里士多德 9、上帝把法律和公平凑合在一起,可是人类却把它拆开。——查·科尔顿 10、一切法律都是无用的,因为好人用不着它们,而坏人又不会因为它们而变得规矩起来。——德谟耶克斯
粗糙集理论介绍
66、节制使快乐增加并使享受加强。 ——德 谟克利 特 67、今天应做的事没有做,明天再早也 是耽误 了。——裴斯 泰洛齐 68、决定一个人的一生,以及整个命运 的,只 是一瞬 之间。 ——歌 德 69、懒人无法享受休息之乐。——拉布 克 70、浪费时间是一桩大罪过。——卢梭
粗糙集理论资料共112页文档
51、山气日夕佳,飞鸟相与还。 52、木欣欣以向荣,泉涓涓而始流。
53、富贵非吾愿,帝乡不可期。 54、雄发指危冠,猛气冲长பைடு நூலகம்。 55、土地平旷,屋舍俨然,有良田美 池桑竹 之属, 阡陌交 通,鸡 犬相闻 。
41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
44、卓越的人一大优点是:在不利与艰 难的遭遇里百折不饶。——贝多芬
45、自己的饭量自己知道。——苏联
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
粗糙集论文题目 粗糙集综述1 粗糙集属性约简1.1 经典粗糙集属性约简对于经典粗糙集我们可以用上下近似来描述。
给定知识库()R U K ,=,对于每个子集U X ⊆和一个等价关系()K ind R ∈,定义两个上下近似:{}{}.|/,|/ U U φ≠⋂∈=⊆∈=X Y R U Y X R X Y R U Y X R 另外上下近似还可以用以下的等式表达:[]{}[]{}.|,| U U φ≠⋂∈=⊆∈=X x U x X R X x U x X R R R 当利用区分矩阵来表达知识时有许多优点,特别是他能很容易计算约简和核。
约简是满足能区别由整个属性集区别的所有对象的属性极小子集。
如果A 包含B 是满足B 交区别对象x 和y 的所有属性集合的极小子集不为空,且区别对象x 和y 的所有属性集合的极小子集不为空,则B 是A 的一个约简。
核是区分矩阵中所有单个元素组成的集合。
对于决策表,C 为条件属性集,D 为决策属性集,决策表S 的区分矩阵是一个n n ⨯矩阵,其任一元素为},x ),(),(|{),(a *)(且y a y f a x f C a y x ω≠∈=对于满足),(,,x y x U y ω∈)(y )(x D pos D pos C C ∉∈且,或者)(y )(x D pos D pos C C ∈∉且,或者).(),()(,D ind y x D pos y x C ∉∈且如果φφ≠∀≠⋂⊆),(,),(C C C **''y x a y x a 满足条件的极小子集(关于包含),则'C 是C 的D 约简(相对约简).D 核(相对核)是决策表S 的区分矩阵中所有单个元素组成的集合,即}.,},{),(a |{)(core *U y x a y x C a C D ∈=∈=其中1.2 变精度粗糙集属性约简变精度粗糙集是粗糙集的扩充,它是在基本粗糙集模型的基础上引入)5.00(<≤ββ,即允许一定程度的错误分类率存在。
这一方面完善了近似空间的概念,另一方面也有利于粗糙集理论从认为不相关的数据中发现相关数据。
当β=0时,经典粗糙集模型是变精度粗糙集模型的一个特例。
X 和Y 表示有限论域U 的非空子集,且Y ⊆X 。
令⎩⎨⎧>>⋂=0,|X |0,0,|X | |,X |/|Y X |1-Y)c(X, 多数包含关系定义为ββ≤⇔⊇),(Y Y X c X 。
约简是保持和决策属性Q 的依赖性相同的最小条件属性子集。
通过近似以来的定义来引入近似约简概念。
条件属性集P 关于据测属性集Q 的β约简是P 的一个子集),,(βQ P red ,且满足:),),,,((),,()1(ββγβγQ Q P red Q P =. 不成立。
都将是中去掉任何一个属性,从)1(),,()2(βQ P red引入)5.00(<≤ββ参数后,扩充了基本粗糙集理论,更好体现了数据分析中的数据相关性,从而为获取近似决策规则奠定了基础。
1.3 概率粗糙集属性约简概率是对不确定的随机事件的一种客观的反映。
经典粗糙集模型是基于可利用信息的完全性的,因而忽视了可利用信息的不完全性和可能存在的统计信息,从概率论的观点出发来研究粗糙集理论,为研究不确定信息系统提供了新的粗糙集模型。
设U 是有限对象构成的论域,R 是U 上的等价关系,其构成的等价类为},,{/U 21n X X X R ,=。
令P 为定义在U 的子集类构成的σ代数上的概率测度,三元组),,(A P R U p =称为概率近似空间。
U 中的每个自己称为概念,它代表一个随机事件。
定义X 关于概率近似空间),,(A P R U p =依参数βα,概率()I 型下近似)(PI X a 和上近似)(PI X β如下:}{)][|(|)(a x X P U x X PI a ≥∈=, }{)][|(|)(ββ≥∈=x X P U x X PI 。
当)(PI )(PI X X a β=时,称X 依参数βα,关于p A 是概率()I 型可定义,否则称X 依参数βα,关于p A 是概率()I 型粗糙集。
同样概率粗糙集模型还有很多其他形式如概率()II 型,概率()III 型,概率()IV 型。
设),,,(ρV A U K =为一个信息系统,},,,{/21*n X X X R U R ==为等价关系R 在U 上导出的划分,S 为U 上另一个等价关系,且},,,{S 21*m Y Y Y =,则在已知知识*R 时知识*S 的正则条件熵定义为m X Y P X Y P X P R S n i mj i j i j i log /)|(log )|()()|(H 11**0∑∑==-= 显然1)|(H 0**0≤≤R S 。
系统K 中的属性子集A M ⊆称为关于属性集A B ⊆是统计依赖的,若存在M 的一个真子集L 使)|()|(**0**0L B H M B H =,否则称M 关于B 是统计独立的。
N称为M 关于B 的所有相对约简记为)(sred M B ,所有这些约简的交集称为M 关于B 的相对核,记为)(score M 。
系统K 中的属性子集A M ⊆称为关于属性集A B ⊆是统计依赖的,若存在M 的一个真子集L 使)|()|(**0**0L B H M B H =,否则称M 关于B 是统计独立的。
N 称为M 关于B 的一个相对约简,若N 是M 关于B 的一个极大统计独立子集,M 关于B 的相对约简记为)(score B M 。
属性a 在A 中称为统计可省略的,若)|()}){\(|(**0**0A A H a A A H =,否则称a 在A 中为统计不可省略的。
属性a 在A 中称为关于属性集D 是统计不可省略的,若)|()}){\(|(**0**0A D H a A D H =,否则称a 在A 中关于属性集D 是统计不可省略的。
1.4 模糊粗糙集及其发展情况在人们的实际生活中,涉及更多的是模糊概念和模糊知识。
反映在粗糙集模型中主要有两类,一类是知识库的知识是清晰的,而被近似的概念是模糊的,另一类是知识库的知识和被近似的概念都是模糊的。
在经典粗糙集模型中,论域U 上任意一个经典集合A 不一定能用知识库()R U ,中的知识来精确描述,这时就用A 关于()R U ,的一对上下近似来描述。
但在实际生活中,人们涉及到的知识火概念往往是模糊的不确定的,即A 是U 上的一个模糊集合,于是提出了模糊粗糙集模型。
设()R U ,是经典近似空间,即R 是论域U 上的一个等价关系。
若A 是U 上的一个模糊集合,贼A 关于()R U ,的一堆下近似R A 和上近似R A 定义为U 上的一对模糊集合,其隶属函数分别定义为,},][|)(sup{)(,},][|)(inf{)(U x x y y A x A U x x y y A x A R R R R ∈∈=∈∈=其中[]R x 为元素x 在关系R 下的等价类。
若)()(x A x A R R =,则称A 是可定义的,否则称A是模糊粗糙集。
当A是U上的经典集合时,AA和就退化为A在经典意义下关于()RU,的下近似和上近似,因此模糊粗糙集就是在经典粗糙集下的推广。
在经典粗糙集模型中知识库中的知识都是清晰的,即近似空间中的集合都是经典集合。
但是在实际问题中知识库往往是模糊的,也可用知识库中的模糊知识来近似的粗糙集模型来讨论模糊集,称之为基于三角模的模糊粗糙集模型。
同样,我们知道知识表示系统中,论域中的概念是用知识库中的知识来描述的,在决策表中还可以提取决策规则。
从协调的决策表中可以提取额确定性规则,而从不协调的决策表中只能抽取不确定规则或可能性规则,这是因为在不协调的系统中存在着矛盾的事例。
这种从决策表中抽取规则的推理的实质是一种广义的包含关系。
因此,从包含度的概念可以定义出基于包含度的粗糙集模型。
2粗糙集的推广2.1 从关系来对粗糙集进行推广目前从R这方面的推广主要有:把R定义为等价关系,也就是经典粗糙集。
R同样可以定义为一般关系、相似关系、黄金关系、多关系、灰色关联、优势关系、余等价关系、强对称关系、约束关系、限制容差关系、相容关系、类传递关系、自相关关系等。
2.2 从包含来对粗糙集进行推广从包含关系来推广主要有:完全包含、部分包含、概率包含等。
2.3从论域来对粗糙集进行推广从论域来推广主要有:多论域、可测空间、随机集、模糊论域等。
2.4从子集来对粗糙集进行推广从子集对粗糙集推广主要有:模糊、不完备等。
2.5从取值来对粗糙集进行推广从点对粗糙集进行推广主要有:点、区间、模糊数等。
3总结通过一学期的学习对粗糙集有比较深入的了解。
虽然粗糙集在各个领域都有了很深入的研究,但仍旧有很多发展的空间。
这门课不光学到了许多关于粗糙集理论的相关知识和内容,也同样学到了很多思维方式和学习方法,对一个已知的知识进行推广想像,从各个领域推广,均有很大的发展空间。
通过粗糙集的学习,加深了我对粗糙集理论基础内容的认识,同时为我后续的学习奠定了基础,拓展了我的知识面,增强了自己的专业修养,学无止尽,还需在后续的课程学习中,多学,多看,多写。
参考文献[1]张文修,吴伟志,梁吉业,李德玉.粗糙集理论与方法. 北京:科学出版社.[2] 苗夺谦,李道国. 清华大学出版社.。