集合代数与粗糙集之间的关系研究【文献综述】

合集下载

模糊粗糙集理论介绍和研究综述

模糊粗糙集理论介绍和研究综述

Ξ 收稿日期:2006-03-10作者简介:姚红霞(1979-),女,硕士研究生,主要从事粗糙集理论和模糊集理论研究.【数理科学】模糊粗糙集理论介绍和研究综述Ξ姚红霞(西北师范大学数学与信息科学学院,兰州 730070)摘要:回顾了粗糙集理论,引出了模糊粗糙集的产生背景,介绍了模糊粗糙集模型的一些主要概念和性质,并给出了模糊粗糙集属性重要性的定义,探讨了模糊粗糙集合的应用和发展现状.关 键 词:粗糙集;模糊集;模糊粗糙集中图分类号:TH164 文献标识码:A 文章编号:1671-0924(2006)08-0132-04I ntroduction to and Survey for the Studies of Fuzzy R ough Sets TheoryY AO H ong-xia(Department of Mathematics and In formation Sciences ,N orthwest N ormal University ,Lanzhou 730070,China )Abstract :This paper firstly reviews the theory of rough set and brings out the generation background aboutfuzzy rough sets ,secondly ,introduces the main concept and property of fuzzy rough sets and proposes its significance ,and finally ,discusses the application and recent studies for this theory.K ey w ords :rough sets ;fuzzy sets ;fuzzy rough sets0 引言 粗糙集(R ough Sets )理论最初是由波兰数学家Z.Pawlak 于1982年[1]提出的,是一种处理不完整和不确定性知识的数学工具[1-2].经过多年的发展,该理论已被成功的用于决策支持系统、人工智能、模式识别与分类、故障检测、金融、医学、知识发现、数据挖掘和专家系统等领域.但由于其严格的等价关系,限制了粗糙模型的发展和应用.针对这个问题,Dub ois 和Prade [3-4]提出模糊粗糙集的概念,作为粗糙集的一个模糊推广.模糊集理论首先是由美国控制论专家L ・A ・扎德(L.A.Z adeh )教授于1965年[5]提出的.也是一种处理模糊和不确定性知识的数学工具,它已成功的应用于模糊控制、模糊识别、模糊聚类分析、模糊决策、模糊评判、系统理论、信息检索、医学、生物学等各个方面.虽然2者都可以用来处理模糊和不确定问题,但2者的着眼点不同.粗糙集理论在处理模糊和不确定性问题方面着眼于知识的粗糙性,强调的是集合对象间的不可分辨性;而模糊集在处理不确定性问题时,主要着眼于知识的模糊性,强调的是集合边界的不分明性.由于这2种理论在处理不确定和模糊问题时具有一定的相似性,因此把它们结合起来的研究前景或许更有实际价值,Dubois 和Prade 是最早研究粗糙模糊集和模糊粗糙集问题的代表人物之一.当知识库中的知识模块是清晰概念,而被近似的概念是一个模糊概念时,就得到粗糙模糊集;当知识库中的知识模块是模糊概念,而被近似的概念是模糊概念时,则可得到模糊粗糙集.粗糙模糊集是模糊粗糙集的特殊情况,因此一般只讨论模糊粗糙集.于是根据问题的实际需要,在文献[3-4]中,用论域上的模糊关系代替分明的二元关系,提出模糊粗糙集合的概念,作为粗糙集合的模糊推广.第20卷 第8期Vol.20 No.8重 庆 工 学 院 学 报Journal of Chongqing Institute of T echnology2006年8月Aug.20061 粗糙集理论的发展 自1992年在波兰召开了RS理论的第一届国际学术会议以来,现在每年都召开以RS为主题的国际会议,大大推动了RS理论的发展.参加的成员主要来自波兰、美国、加拿大、日本、俄罗斯等国家.在Pawlak粗糙集模型中,等价关系是关键概念,等价类是构成上下近似结构的构造性知识块,用任意的二元关系取代等价关系,就得到Pawlak粗糙集模型的不同推广,即一般关系下的RS模型、变精度RS模型、概率RS模型、基于随机集的RS模型[9],而且在一个分明的,自反和传递关系下,一对上下近似算子正好是一个拓扑空间的内部封闭的算子[10-12].在RS集理论中,基本的运算符是近似的.对RS理论发展的研究至少有2种方法,即构造性方法和公理化方法.在构造性方法下,论域上的二元关系、论域的划分、领域体系、布尔代数都是最原始的概念.文献[1,13-15]用这些概念构造了下近似和上近似算子,构造性方法尤其对RS的实际应用有重要的实用价值.另一方面,公理化方法,是一种研究粗糙代数结构近似的,用上下近似算子作为最初的概念,在这种方法下,用一个公理化集合刻画的近似算子和用构造性方法产生的算子是一样[15-16].比较构造性和公理化这2种方法,对分明粗糙集最典型的公理化研究是文献[15],在文献[17]中,用不同的公理化集合刻画了不同类型的粗糙集代数.2 模糊粗糙集的产生背景 粗糙集理论最初和主要的研究采用的是构造性方法.在Z.Pawlak粗糙集模型中,等价关系是关键和原始的概念.然而,等价关系是一个过于严格的条件,其限制了粗糙集模型的一些主要应用.针对这个问题,文献[12-13,18]用非等价二元关系推广了粗集近似算子,这一成果的出现,引起了学术界研究其它不同类型近似算子的热潮.另一方面,用U上的一个等价关系,在模糊关系理论下,引入上下近似,就得到了一个推广的概念,称为粗糙模糊集[4,17,19],相反的,用模糊相似关系代替等价关系,就得到模糊粗糙集合[4-8,19].因此后来有很多模糊粗糙集合的类型,如基于模糊T相似关系的一般结构[21],基于U上弱模糊划分的结构[22-23],以及基于模糊集合上的布尔子代数[7],等等.3 模糊粗糙集合的基本概念和理论3.1 等价关系下的模糊粗糙集定义定义1[9] 设(U,R)是Pawlak近似空间,R是论域U 上的一个等价关系,若A是U上的一个模糊集合,则A关于(U,R)的一对下近似A R和上近似 A R定义为U上的一对模糊集合,其隶属度函数分别定义为:A R(x)=in f{A(y)|y∈[x]R},x∈U,A R(x)=sup{A(y)|y∈[x]R},x∈U,其中[x]R为元素x在关系R下的等价类.若A R= A R,则称A是可定义的,否则称A是模糊粗糙集(Fuzzy rough set).称A R是A关于(U,R)的正域,称 A R是A关于(U,R)的负域,称 A R∩( A R)为A的边界.3.2 一般关系下的模糊粗糙集合及其属性重要性定义2[24] 称I=(U,A)是一个决策表信息系统,若有:①U是一个非空对象集合;②A={C,D}是一个有限非空属性集合,其中C是条件属性的非空集合,D是决策属性的非空集合;③对每个属性a∈A,定义了一个从U到V a的映射: a:U→V a,其中V a是属性a的值集.定义3[25] 设U是一个非空集合,称U上的模糊二元关系是相似关系,当且仅当R是:①自反的:R(x,x)=1对所有x∈U;②对称的:R(x,y)=R(y,x),对所有x,y∈U,U上的每个条件属性子集决定了一个U上的相似关系;③传递的:R(x,y)∧R(y,z)ΦR(x,z),对所有x, y,z∈U.则称R是U上的一个等价关系.在文献[4-8]中,用论域上的模糊关系代替分明的二元关系,提出了模糊粗糙集合的概念,粗糙集合研究对象是分明的等价类,而模糊粗糙集合研究对象是模糊等价类.将论域U上的元素在相似关系下划分模糊等价类,以下记论域U上的模糊关系为S,对象x和y之间的相似度记为u s(x,y)=u s(y,x),它同样满足定义3的条件,即自反性:u s(x,x)=1;对称性u s(x,y)=u s(y,x);传递性u s (x,z)Εu s(x,y)∧u s(y,z).因此对对象x∈U的等价类[x]s定义为:u[x]s(y)=u s(x,y)定义4[26] 模糊P上近似和P下近似定义为:uP X(F i)=sup x min{u Fi(x),u X(x)}Πi. uPX(F i)=in f x max{1-u Fi(x),u X(x)}Πi.其中F i是属于U/P的模糊等价类,PΑA,XΑU,u X (x)是对象x属于U上的任意模糊集合X的程度,则称序对(u P X(F i),u PX(F i))为模糊粗糙集合.由于模糊上下近似的定义和分明的定义有一些差异,个体对象的隶属度的近似不是十分有用的,由于这个原因,模糊上下近似可以定义为:uP X(x)=sup F∈U/P min(u F(x),sup y∈U min{u F(y),u x (y)})uPX(x)=sup F∈U/P min(u F(x),in f y∈U max{1-u F(y),u x (y)})定义5[26] 条件属性C关于决策属性D的正域为:uPOSC(D)(x)=sup u CX(x) X∈U/D定义6[26] 根据模糊正域的定义,可以求出模糊粗糙集合条件下决策属性D对条件属性集合C的依赖性:331姚红霞:模糊粗糙集理论介绍和研究综述γC (D)=∑x∈U uPOSC(D)(x)|U|定义7 令C和D分别为模糊粗糙集的条件属性和决策属性集,属性子集C′ΑC关于D的重要性定义为:σCD(C′)=γC(D)-γC-C′(D)特别当C′={a}时,属性a∈C关于D的重要性为σCD(a)=γC(D)-γC-{a}(D).4 模糊粗糙集属性约简 为了对模糊粗糙集合进行属性约简,必须先对属性模糊化.在粗糙集合中,属性对应的等价类是普通集合,而在模糊粗糙集合中,属性对应的等价类是模糊集,因此,往往把属性的等价类划分过程称为属性模糊化过程.在粗糙集中,每个对象属于且仅属于一个等价类,在模糊粗糙集中,每个对象可以属于多个模糊等价类.为了进行属性约简,必须求出复合属性的模糊等价类,具体模糊化的过程见文献[26].在文献[17]中给出了模糊粗糙集基于属性依赖性的属性约简的降维算法和例子,在文献[24]中研究了一种面向连续属性空间的模糊粗糙约简算法.5 模糊粗糙集发展现状 在文献[4-8]中,用论域上的模糊关系代替分明的二元关系,提出了模糊粗糙集合的概念,作为粗糙集合的模糊推广.在RS集理论中,基本的运算符是近似.对RS理论发展的研究至少有2种方法,即构造性方法和公理化方法.因此对模糊粗糙集的研究很多也是建立在这2种方法上的.在文献[17]中研究了模糊粗糙集上的一系列公理化集合,但他们的研究局限与用模糊T相似关系定义的模糊T 粗糙集上,而当模糊关系退化为分明关系时,就是一般的等价关系.然而,到目前为止,对一般关系下模糊粗糙集公理化方法的研究还不是很多,在文献[21]中给出了公理化的模糊粗糙集模型,在文献[25]中运用构造性和公理化方法,给出了模糊粗糙集研究的一般结构.在构造性方法下,基于一个任意的模糊关系定义了一对一般关系下的模糊粗糙集上下近似算子,在公理化方法下,用不同的公理集合刻画了不同类型的模糊粗糙近似算子,这些公理保证了确定类型的模糊关系的存在产生相同的算子.在文献[28]中,应用扩展原理,定义了依靠模糊关联和模糊隐含算子的模糊粗糙集合,并考虑了3个常用的算子,即S-,R-,Q L-算子,用其定义了3种类型的模糊粗糙集,并讨论了各自的性质,使其更好的用于不完全和不确定信息系统.在文献[27]中,讨论了在有限论域上模糊粗糙集模型和模糊拓扑空间之间的关系,提出了模糊拓扑空间上的T C 公理,并证明了所有基于自反和对称模糊关系的上下近似集合包含了一个满足T C公理的模糊拓扑空间,并且相反的,一个满足T C公理的模糊拓扑空间正好是在自反和对称模糊关系下的所有的上下近似集合.即在所有自反和对称模糊关系下的集合和所有满足T C公理的模糊拓扑空间之间,存在一个一对一的关系.但这只是在有限论域情况下的结论,在无限论域上的还不确定成立,需要进一步探讨.粗糙集理论已经被广泛和成功的应用许多领域,主要是由于它能发现隐藏在数据中的事实,而不需要额外的如专家系统或者阈值之类的信息,能在无监督条件下,挖掘出数据库里的最小知识表示.但粗糙理论在应用过程中,主要的载体是信息表,信息表中的对象是处理和挖掘的对象,而信息表中的对象的属性值要么是分明的,或者是实值的,虽然连续的属性值可以通过属性离散化方法离散,但势必会丢失一些重要信息,而且在粗糙理论下,无法判断2个属性值是相似的,或者在某种扩展意义下是相同的.因此,针对这个问题,文献[29-30]用模糊粗糙集来解决这些不确定问题,并将这个理论用于网络数据分类和挖掘上,收到了很好的效果.文献[26]将其进行了推广和完善.目前,国外学者主要从不同角度考虑模糊粗糙集的性质,根据模糊集近似推理方式的不同,主要形成了从3种不同角度研究的模糊粗糙集:基于形式逻辑的模糊粗糙集,基于三角模的模糊粗糙集,基于-截集的模糊粗糙集.6 模糊粗糙集发展展望 虽然模糊粗糙集已经发展了十几年,但作为一种理论,它还有很多的不完善,尤其是目前研究属性约简的算法还是相当少,而属性约简在实际生活中具有重要的意义.今后,模糊粗糙集还有很大的发展空间,它可能更广泛的应用于数据挖掘,知识发现等重要领域.参考文献:[1] Pawlak Z.R ough[J].International Journal of C omputerand in formation Science,1982,11:341-356.[2] Pawlak Z.R ough sets:theoretical aspects of reas oning aboutdata[M].Boston:K luwer Academic Publishers,1991:66-90.[3] Dubois D,Prade H.R ough fuzzy sets and fuzzy rough sets[J].International Journal of G eneral System,1990,17:191-208.[4] Dubois D,Prade H.Putting rough sets and fuzzy sets to2gether[C]∥S lowinski R,Intelligent Decision Support.[S.l.]:K luwer Academic,D ordrecht,1992:203-232. [5] Z adeh L A.Fuzzy sets[J].In formation and C ontrol,1965(8):338-353.[6] Nakamura A.Fuzzy rough sets[J].N ote on Multiple-Val2ued Logic in Japan,1988,9(8):1-8.[7] Nanda S.fuzzy rough sets[J].Fuzzy Sets and Systems,1992(45):157-160.[8] Thiele H.on the definition of m odel operators in fuzzy logic[C]∥Proc.IS M V L-93.Sacramento,C A:[s.n.],1993:62-67.431重庆工学院学报[9] 张文修.粗糙集理论与方法[M].北京:科学出版社,2001.[10]K ortelainen J.on the relationship beween m odified sets,topological spaces and rough sets[J].Fuzzy Sets and Sys2tem,1994(61):91-95.[11]Y ao Y Y.T w o views of the theory of rough sets in finiteuni2verses[J].InternetJ.Approx.Reas ons,1996(15):291-317.[12]Y ao Y Y,Lin T Y.G eneralization of rough sets using m odallogics[J].Intell.Automat.S oft C omputer,1996(2):103-120.[13]K ryszkiewicz M.R ough set approach to incomplete in forma2tion systems[J].In formation Sciences,1998(112):39-49.[14]P omykala J A.Approximation operations in Approximationspaces[J].Bullerin of the P olish Academy of sciences:Mathmatics,1987(35):653-662.[15]Y ao Y Y.C onstrctive and algebraic methods of the theory ofrough sets[J].Journal of In formation Sciences,1998(109):21-27.[16]Lin T Y,Liu Q.R ough approximate operators:axiomaticrough sets theory[M]∥Z iarko W,R ough Sets,Fuzzy Setsand K nowledge Discovery.Berlin:S pringer,1994:256-260.[17]Pal S K.R oughness of a fuzzy set[J].In formation Sciences,1996(93):235-246.[18]Y ao Y Y.Relational interpretations of neighborhood opera2tors and rough set approximation operators[J].In formationSciences,1998(111):239-259.[19]Chakrabarty K,Biswas R,Nanda S.Fuzziness in rough sets[J].Fuzzy Sets And Systems,2000(110):247-251. [20]Y ao Y Y.C ombination of rough and fuzzy sets based on-level sets[C]∥Lin T Y,Cercone N.R ough Sets and DataMining:Analysis for Imprecise Data.Boston:K luwer Aca2demic Publishers,1997:301-321.[21]M orsi N N,Y akout M M.Axiomatics for fuzzy rough sets[J].Fuzzy sets And Systemss,1998(100):327-342. [22]Bodjanova S.Approximation of a fuzzy concepts in decisionmaking[J].Fuzzy Ses and Systems,1997(85):23-29.[23]K uncheva L I.Fuzzy rough sets:Application to feature selec2tion[J].Fuzzy Sets and System,1992(51):147-153. [24]聂作先,刘建成.一种面向连续属性空间的模糊粗糙约简[J].计算机工程,2005,31(6):88-90.[25]WeiZhi Wu,JuSheng Mi,WenX iu Zhang.G eneralized fuzzyrough sets[J].In formation Sciences,2003(151):263-282.[26]Richard Jensen,Qiang Shen.Fuzzy rough attribute reductinwith application to web categ orization[J].Fuzzy sets andSystem,2004(141):469-485.[27]K eyun Qin,Zheng Pei.On the topological properties of fuzzyrough sets[J].Fuzzy Sets and System,2005(151)601-613.[28]K erre E,E tienne A.Anna Maria Radzikowska[J].C om2parative study of fuzzy rough sets,2002(126):137-155.[29]Jensen R,Shen Q.A rough set-aided system for s ortingWWW bookmarks[M]∥Zhong N.Web Intelligence:Re2search and Development.[S.l.]:[s.n.],2001:95-105.[30]Jensen R,Shen Q.Fuzzy-rough sets for descriptive dimen2sionality reduction[C]∥Proc,11th Internat.C on f.onFuzzy Systems.[S.l.]:[s.n.],2002,29-34.(责任编辑 刘 舸)(上接第129页)systems with product recovery[J].C omputers&IndustrialEngineering,2004,46:431-441.[4] 陈秋双,刘东红.再制造系统的库存控制研究[J].南开大学学报:自然科学版,2003,36(3):67-72. [5] Inderfurth K.Optimal policies in hybrid manu facturing/re2manu facturing systems with product substitution[J].Inter2 national Journal of Production economics,2004,90:325-343.[6] 赵昱卿,王东,奚立峰.制造与再制造决策的优化[J].工业工程与管理,2003,8(2):18-21.[7] 厉以宁.西方经济学[M].北京:高等教育出版社,2000,33-37.[8] Petruzzi N,Dada M.Pricing and the new-vendor problem:A review with extension[J].Operations Research,1999,47(2):183-194.[9] Jinn-Tsair T eng,Chun-T ao Chang.Economic productionquantity m odels for deteriorating items with price and stock-dependent demand[J].C omputers&operations research, 2005(32):297-308.[10]G upate D,Arthur V H,T atiana Bouzdine-Chameeva.Apricing m odel for clearing end-of-seas on retail inventory [J].European Journal of Operational Research,2006(170):518-540.(责任编辑 刘 舸)531姚红霞:模糊粗糙集理论介绍和研究综述。

粗糙集代数

粗糙集代数

粗糙集代数(Rough Set Algebra)是一种数学框架,建立在粗糙集理论的基础上,用于粗糙集不确定性和近似推理的形式化描述和处理。

其基本概念包括属性约简、近似集
和粗糙等价类等,可以应用于数据挖掘、模式识别、智能推理等领域。

在粗糙集代数中,属性约简是一个重要的概念。

假设有一个包含m个属性的数据集,
每个属性具有不同的取值,可以将数据集表示为一个m维属性空间。

属性约简就是从
这个属性空间中找出其中最重要的属性子集,使得这个子集可以保留原始数据集的所
有决策信息。

具体来说,属性约简可以看作是通过去掉不必要的属性,减少决策规则
的数量,提高规则表达的精度和通用性。

近似集和粗糙等价类等概念则是用于描述粗糙集中的不确定性和近似性质的重要概念。

在粗糙集中,数据对象的属性值通常是不完备的或不精确的,因此需要使用近似集来
描述数据对象的属性分布情况。

而粗糙等价类则是将原始数据集中存在相似或不同的
数据对象划分为等价类,从而建立起数据对象之间粗略的等价关系。

总的来说,粗糙集代数是一种基于粗糙集理论的形式化描述和处理框架,可以用于处
理不完备、不精确的数据,提高数据挖掘、模式识别、智能推理等任务的效果和精度。

粗糙集理论及其应用研究

粗糙集理论及其应用研究

粗糙集理论的核心内容
知识的约简与核
知识的约简: 通过删除不重 要的知识,保 留关键信息
核的概念:核 是知识的最小 表示,包含所 有必要信息
核的性质:核 具有独立性、 完备性和最小 性
核的求取方法: 基于信息熵、 信息增益等方 法进行求取
0
0
0
0
1
2
3
4
决策表的简化
决策表:用于描述决策问题的表格 简化目标:减少决策表的规模,提高决策效率 简化方法:合并条件属性,删除冗余属性 简化效果:提高决策表的可读性和可理解性,降低决策复杂度
粗糙集理论在聚类分析中的应用:利用粗糙集理论处理不确定和不完整的数据,提高聚类 分析的准确性和效率。
聚类分析在数据挖掘中的应用:可以帮助发现数据中的模式和趋势,为决策提供支持。
粗糙集理论在其他领域的应用
决策支持系统
粗糙集理论可以帮助决策者 处理不确定性和模糊性
粗糙集理论在决策支持系统 中的应用
粗糙集理论可以提高决策支 持系统的准确性和效率
粗糙集理论在决策支持系统 中的实际应用案例分析
智能控制
粗糙集理论在模糊控制中的 应用
粗糙集理论在智能控制中的 应用
粗糙集理论在神经网络控制 中的应用
粗糙集理论在自适应控制中 的应用
模式识别
粗糙集理论在模式 识别中的应用
粗糙集理论在图像 识别中的应用
粗糙集理论在语音 识别中的应用
粗糙集理论在生物 信息学中的应用
添加标题
添加标题
ห้องสมุดไป่ตู้添加标题
添加标题
机器学习
粗糙集理论在机器学习中的应用 粗糙集理论在数据挖掘中的应用 粗糙集理论在模式识别中的应用 粗糙集理论在自然语言处理中的应用

粗糙集综述word版

粗糙集综述word版

粗糙集论文题目 粗糙集综述1 粗糙集属性约简1.1 经典粗糙集属性约简对于经典粗糙集我们可以用上下近似来描述。

给定知识库()R U K ,=,对于每个子集U X ⊆和一个等价关系()K ind R ∈,定义两个上下近似:{}{}.|/,|/ U U φ≠⋂∈=⊆∈=X Y R U Y X R X Y R U Y X R 另外上下近似还可以用以下的等式表达:[]{}[]{}.|,| U U φ≠⋂∈=⊆∈=X x U x X R X x U x X R R R 当利用区分矩阵来表达知识时有许多优点,特别是他能很容易计算约简和核。

约简是满足能区别由整个属性集区别的所有对象的属性极小子集。

如果A 包含B 是满足B 交区别对象x 和y 的所有属性集合的极小子集不为空,且区别对象x 和y 的所有属性集合的极小子集不为空,则B 是A 的一个约简。

核是区分矩阵中所有单个元素组成的集合。

对于决策表,C 为条件属性集,D 为决策属性集,决策表S 的区分矩阵是一个n n ⨯矩阵,其任一元素为},x ),(),(|{),(a *)(且y a y f a x f C a y x ω≠∈=对于满足),(,,x y x U y ω∈)(y )(x D pos D pos C C ∉∈且,或者)(y )(x D pos D pos C C ∈∉且,或者).(),()(,D ind y x D pos y x C ∉∈且如果φφ≠∀≠⋂⊆),(,),(C C C **''y x a y x a 满足条件的极小子集(关于包含),则'C 是C 的D 约简(相对约简).D 核(相对核)是决策表S 的区分矩阵中所有单个元素组成的集合,即}.,},{),(a |{)(core *U y x a y x C a C D ∈=∈=其中1.2 变精度粗糙集属性约简变精度粗糙集是粗糙集的扩充,它是在基本粗糙集模型的基础上引入)5.00(<≤ββ,即允许一定程度的错误分类率存在。

基于集对分析下的粗糙集理论模型研究论文 精品

基于集对分析下的粗糙集理论模型研究论文 精品

基于集对分析下的粗糙集理论模型研究摘要:粗糙集理论是一种新的处理模糊和不确定性知识的数学工具,其主要思想就是在保持分类能力不变的前提下,通过知识简约,导出问题的决策分析或分类规则。

而用集对分析理论的方法来建立概率粗糙集理论的模型,是一种研究粗糙集模型的新方法,它为处理不确定信息方面提供了一种新的途径和方法。

本文是用概率粗糙集模型,然后引入集对分析理论,把两者结合起来,提出一个新的集对分析下的粗糙集模型,并且讨论和研究该模型的一些性质。

关键字:集对,基对分析,粗糙集,概率粗糙集ABSTRACTRough set theory is one kind of new deal with the fuzzy andnon-deterministic mathematical tool, the main idea of Jiu Shi Zai Bao Chi Xia premise constant classification ability, through knowledge and simple, export issues of Juecefenxi 或classification rules. The use of set pair analysis theory is applied to establish the probability model of rough set theory, rough set model is a study of new methods for handling uncertain information that it provides a new approach and methods. This article is a rough set model with a probability, then the introduction of set pair analysis theory, the two together with a new set on the analysis of the rough set model, and discuss and study some properties of themodel.Key words:Set right, Based On The Analysis, Rough Sets, Probabilistic Rough Set一.引入集对分析的概念1.集对的概念集对是由一定联系的两个集合组成的基本单位。

粗糙集信息观与代数观联系研究

粗糙集信息观与代数观联系研究

., , Y= Y ,Y , ., , X1 f z .. Y J
2 相容 决策 表 中两种 观点 的关 系
由于相容决策表和不相容决策表的数据有不同特征, 因此 首 先分析相容决策表 中信息观和代数观的关系。
定义9设U 为一个论 域 ,、 为定义在 U 的两个 等价 关 PO 上 系族 , 为P Q独立子族( c )且 P S( )P S( )则 当s 的 S P , O Q = O Q , 族s 称为 P Q约简。 的
Ke r s:r u h s t i f r a i n v e ; ag b a v e ; r l t e e u to y wo d o g e; no m to i w le r iw e a i r d c i n v
0 引言
粗 糙集理 论是近 年来发 展起来 的一种 处理不 确定信 息 的
பைடு நூலகம்
在一 定 的问题 , 本文 主要 针对相 对 约简 中两种观 点 的关 系进
行讨论 。
数 学工具 , 它能有效地分析和 处理不精确 、 不一致 、 不完整等各 1粗糙 集 的基本 概 念 种不 完备信息 , 并从 中发现隐含 的知识 , 揭示潜在的规律 , 广泛 11粗糙集代数观 中的基本概念 . 应用 于机 器学 习 、 数据挖掘等领域 。 粗糙集代数观 是由集合理论发展而来 的 , 该理论 的所有概 目 , 前 粗糙集理论存在两种观点 , —种是基于等价关系的代数 念和 计算 都 以等价关系为 基础 , 通过 引入 上近 似集 合 、 下近似 观, —种是基于信 息 论的信息观。其中代数观是指ZP w a提 出 . l a k 集合来定义粗糙集 , 并通过不可 区分关系定义决策表 中条件属 的粗糙集理论 , 该理论的所有概念和计算 都是以 等价 关系 为基 性的必要性 , 找到核屙 陛及决策表 的约简 。 础, 通过引入上近似集和下近似集 , 并进行集合运算来定义 定义 1设u为一个论域, 、 PQ为定义在u上的两个等价关

粗糙集理论及其应用综述

粗糙集理论及其应用综述

粗糙集理论及其应用综述3韩祯祥 张 琦 文福拴(浙江大学电机系・杭州,310027) 摘要:粗糙集理论是一种较新的软计算方法,可以有效地分析和处理不完备信息.该理论近年日益受到国际学术届的重视,已经在模式识别、机器学习、决策支持、过程控制、预测建模等许多科学与工程领域得到成功的应用.本文介绍了粗糙集理论的基本概念,对其在各领域的应用情况进行了综述.关键词:粗糙集;不确定性;数据分析;软计算;粗糙控制A Survey on R ough Set Theory and Its ApplicationHan Zhenxiang , Zhang Qi and Wen Fushuan(Department of E lectrical Engineering ,Zhejiang University ・Hangzhou ,310027,P.R.China )Abstract :R ough set theory is a relatively new s oft com putingtool to deal with vagueness and uncertainty.I t has received much attention of the researchers around the w orld.R ough set theory has been applied to many areas success fully including pattern recognition ,machine learning ,decision support ,process control and predictive m odeling.This paper introduces the basic concepts of rough set.A survey on its applicatoins is als o given.K ey w ords :rough set ;uncertainty ;data analysis ;s oft com puting ;rough control1 引言(Introduction )粗糙集(R ougn Set ,RS )理论是一种刻划不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[1].RS 理论是由波兰学者Pawlak Z 在1982年[2]提出的.1991年Pawlak Z 出版了专著[3],系统全面地阐述了RS 理论,奠定了严密的数学基础.该书与1992年出版的RS 理论应用专集[4]较好地总结了这一时期RS 理论与实践的研究成果,促进了它的进一步发展,现已成为学习和应用RS 理论的重要文献.从1992年至今,每年都召开以RS 为主题的国际会议,推动了RS 理论的拓展和应用.国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家.目前RS 理论已成为人工智能领域中一个较新的学术热点,引起了越来越多的科研人员的关注.2 粗糙集理论的基本概念(Basic concepts of rough settheory )2.1 知识与不可分辨关系(K nowledge and indiscernibility rela 2tion )在RS 理论中,“知识”被认为一种将现实或抽象的对象进行分类的能力[3].假定我们具有关于论域的某种知识,并使用属性(attribute )及其值(value )来描述论域中的对象.例如:空间物体集合U 具有“颜色”、“形状”这两种属性,“颜色”的属性值取为红、黄、绿,“形状”的属性值取为方、圆、三角形.从离散数学的观点看,“颜色”、“形状”构成了U 上的一族等效关系(equivalent relation ).U 中的物体,按照“颜色”这一等效关系,可以划分为“红色的物体”、“黄色的物体”、“绿色的物体”等集合;按照“形状”这一等效关系,可以划分为“方的物体”、“圆的物体”、“三角形的物体”等集合;按照“颜色+形状”这一合成等效关系,又可以划分为“红色的圆物体”、“黄色的方物体”、“绿色的三角形物体”…等集合.如果两个物体同属于“红色的圆物体”这一集合,它们之间是不可分辨关系(indiscernibility relation ),因为描述它们的属性都是“红”和“圆”.不可分辨关系的概念是RS 理论的基石,它揭示出论域知识的颗粒状结构.2.2 粗糙集合的下逼近、上逼近、边界区和粗糙隶属函数(Lower and upper approximation of rough set ,boundary region and rough membership function )给定一个有限的非空集合U 称为论域,R 为U 上的一族等效关系.R 将U 划分为互不相交的基本等效类,二元对K=(U ,R )构成一个近似空间(approximation space ).设X 为U的一个子集,a 为U 中的一个对象,[a ]R 表示所有与a 不可分辨的对象所组成的集合,即由a 决定的等效类.当集合X 能表示成基本等效类组成的并集时,则称集合X 是可以精确定义的;否则,集合X 只能通过逼近的方式来刻划.集合X 关于R 的下逼近(lower approximation )定义为:R 3(X )={a ∈U :[a ]R ΑX}.(1)R 3(X )实际上是由那些根据已有知识判断肯定属于X 的对象所组成的最大的集合,也称为X 的正区(positive region ),记 3国家自然科学基金资助项目(59777011).本文于1997年9月3日收到.1998年11月18日收到修改稿.第16卷第2期1999年4月控制理论与应用CONTROL THEORY AND APPLICATIONS Vol.16,No.2Apr.,1999作POS (X ).由根据已有知识判断肯定不属于X 的对象组成的集合称为X 的负区(negative region ).记作NEG (X ).集合X 关于R 的上逼近(upper approximation )定义为R 3(X )={a∈U :[a ]R ∩X ≠ }.(2)R 3(X )是由所有与X 相交非空的等效类[a ]R 的并集,是那些可能属于X 的对象组成的最小集合.显然,R 3(X )+NEG (X )=论域U.集合X 的边界区(boundary region )定义为:BN (X )=R 3(X )-R 3(X ).(3)BN (X )为集合X 的上逼近与下逼近之差.如果BN (X )是空集,则称X 关于R 是清晰的(crisp );反之如果BN (X )不是空集,则称集合X 为关于R 的粗糙集(rough set ).图1为粗糙集概念的示意图.下逼近、上逼近及边界区等概念刻划了一个不能精确定义的集合的逼近特性.逼近精度定义为αR (X )=|R 3(X )||R 3(X )|.(4)式中|R 3(X )|表示集合R 3(X )的基数或势(cardinality ),对有限集合来说表示集合中所包含元素的个数.显然,0≤αR (X )≤1,如果αR (X )=1,则称集合X 相对于R 是清晰的;αR (X )<1,则称集合X 相对于R 是粗糙的.αR (X )可认为是在等效关系R 下逼近集合X 的精度.RS 理论中定义了粗糙隶属函数(rough membership func 2tion ).通过使用不可分辨关系,定义元素a 对集合X 的粗糙隶属函数如下μRX (a )=|X ∩[a ]R ||[a ]R |.(5)显然0≤μRX ≤1,粗糙隶属函数也可以用来定义集合X 的上、下逼近和边界区.现举例说明粗糙集的概念.论域U 及等效关系R ={R 1,R 2}采用如下定义:U ={x 1,x 2,x 3,x 4,x 5,x 6,x 7,x 8,x 9,x 10},U/R 1={{x 1,x 2,x 3,x 4},{x 5,x 6,x 7,x 8,x 9,x 10}},U/R 2={{x 1,x 2,x 3},{x 4,x 5,x 6,x 7},{x 8,x 9,x 10}},U/R ={{x 2,x 3},{x 4},{x 5,x 6,x 7},{x 8,x 9,x 10}}.则关于集合X ={x 1,x 2,x 3,x 4,x 5}的逼近为POS (X )={x 4},NEG (X )={x 8,x 9,x 10},BN (X )={x 1,x 2,x 3,x 5,x 6,x 7}.{x 4}是集合X 的正区,因为x 4肯定属于X ;{x 8,x 9,x 10}肯定不属于X ,因此为X 的负区;{x 1,x 2,x 3,x 5,x 6,x 7}是否属于X 在等效关系R 下无法确定,构成了X 的边界区.2.3 决策表、约简与核(Decision table ,reduct and core )RS 理论中应用决策表来描述论域中对象.它是一张二维表格,每一行描述一个对象,每一列描述对象的一种属性.属性分为条件属性和决策属性,论域中的对象根据条件属性的不同,被划分到具有不同决策属性的决策类.表1为一张决策表,论域U 有5个对象,编号1~5,{a ,b ,c}是条件属性集,d 为决策属性.对于分类来说,并非所有的条件属性都是必要的,有些是多余的,去除这些属性不会影响原来的分类效果.约简(reduct )定义为不含多余属性并保证分类正确的最小条件属性集.一个决策表可能同时存在几个约简,这些约简的交集定义为决策表的核(core ),核中的属性是影响分类的重要属性.表1化简后得到了两个约简:{a ,c}和{b ,c},见表2和表3.它们维持了与原有条件属性集{a ,b ,c}相同的分类能力.{c}是核,表明c 是影响分类的重要属性.表1 决策表T able 1 Decision tableUabcd110212210232123412215123表2 约简{a ,c}T able 2 Reduct {a ,c}Uacd112122023223513表3 约简{b ,c}T able 3 Reduct {b ,c}Ubcd10312102312342215203 从另一个角度看,决策表中每一个对象都蕴含着一条分类规则,决策表实际上也是一组逻辑规则的集合.例如表1中的对象1蕴含的规则是a 1b 0c 2]d 1.化简决策表的过程也就是抽取分类规则的过程.表2中对象4在去掉属性b 后154 控制理论与应用16卷 与对象1蕴含相同的分类规则,为避免重复而被除去.约简中的规则还可进一步化简,删除那些与分类无关的次要属性.表3第一行中的“3”表示属性c的取值不重要,即只要b =0,d一定为1(b0]d1).“约简”和“核”这两个概念很重要,是RS方法的精华. RS理论提供了搜索约简和核的方法.计算约简的复杂性随着决策表的增大呈指数增长,是一个典型的NP完全问题,当然实际中没有必要求出所有的约简.引入启发式的搜索方法如遗传算法[10]有助于找到较优的约简,即所含条件属性最少的约简.3 粗糙集理论的特点(Features of rough set theory)1)RS不需要先验知识.模糊集和概率统计方法是处理不确定信息的常用方法,但这些方法需要一些数据的附加信息或先验知识,如模糊隶属函数和概率分布等,这些信息有时并不容易得到.RS分析方法仅利用数据本身提供的信息,无须任何先验知识.2)RS是一个强大的数据分析工具.它能表达和处理不完备信息;能在保留关键信息的前提下对数据进行化简并求得知识的最小表达;能识别并评估数据之间的依赖关系,揭示出概念简单的模式;能从经验数据中获取易于证实的规则知识,特别适于智能控制.3)RS与模糊集分别刻划了不完备信息的两个方面[5]: RS以不可分辨关系为基础,侧重分类,模糊集基于元素对集合隶属程度的不同,强调集合本身的含混性(vagueness).从RS的观点看,粗糙集合不能清晰定义的原因是缺乏足够的论域知识,但可以用一对清晰集合逼近.有关RS和模糊集内在联系的阐述及模糊粗糙集(fuzzy2rough set)的概念,请参见文[6~8].RS和证据理论也有一些相互交叠之处[9],在实际应用中可以相互补充.4 粗糙集理论的应用(Applications of rough set theo2 ry)RS理论的生命力在于它具有较强的实用性,从诞生到现在虽然只有十几年的时间,但已经在许多领域取得了令人鼓舞的成果.1)股票数据分析.文[11]应用RS方法分析了十年间股票的历史数据,研究了股票价格与经济指数之间的依赖关系,获得的预测规则得到了华尔街证券交易专家的认可.2)模式识别.文[12]应用RS方法研究了手写字符识别问题,提取出了特征属性.3)地震预报.文[13]研究了地震前的地质和气象数据与里氏地震级别的依赖关系.4)冲突分析.文[14]应用RS方法建立了反映以色列、巴勒斯坦、约旦、埃及、叙利亚和沙特阿拉伯等六国关于中东和平问题各自立场的谈判模型.5)从数据库中知识发现(knowledge discovery in database, K DD)[15,16].K DD又称数据发掘(data mining),是当前人工智能和数据库技术交叉学科的研究热点之一.RS方法现已成为K DD的一种重要方法,其导出的知识精练且更便于存储和使用.6)粗糙控制(rough control)[17~23].RS根据观测数据获得控制策略的方法被称为从范例中学习(learning from exam2 ples),属于智能控制的范畴.基本步骤是:把控制过程中的一些有代表性的状态以及操作人员在这些状态下所采取的控制策略都记录下来,形成决策表,然后对其分析化简,总结出控制规则[17,18].形式为:IF C ondition=N满足THE N采取De2 cision=M.RS方法是一类符号化分析方法,需要将连续的控制变量离散化,为此Pawlak Z提出了粗糙函数(rough func2 tion)的概念[19],为粗糙控制打下了理论基础.文[20,21]应用粗糙控制研究了“小车—倒立摆系统”这一经典控制问题,取得了较好的结果.在过程控制领域,文[22]应用RS方法成功地提取出了水泥窑炉的控制规则.粗糙控制的优点是简单迅速、实现容易,不需要象Fuzzy控制那样进行模糊化和去模糊化.因此在特别要求控制器结构与算法简单的场合,采取粗糙控制较为合适.另外,由于控制算法完全来自观测数据本身,其决策和推理过程可以很容易被检验和证实.一种新的有吸引力的控制策略“模糊2粗糙控制(fuzzy2rough control)”正悄然兴起,其主要思路是利用RS获取模糊控制规则.7)医疗诊断.RS方法根据以往的病例归纳出诊断规则,用来指导新的病例.现有的人工预测早产的准确率只有17%~38%,应用粗糙集理论则可提高到68%~90%[1].8)专家系统(ES).RS抽取规则的特点,为构造ES知识库提供了一条崭新的途径[24].9)人工神经元网络(ANN).训练时间过于漫长的固有缺点是制约ANN实用化的因素之一.文[25]应用RS化简神经网络训练样本数据集,在保留重要信息的前提下消除了多余的数据,使训练速度提高了4177倍,获得了较好的效果.文[26,27]将RS与ANN结合起来,充分利用RS处理不确定性的特长以增强ANN的信息处理能力.10)决策分析[28~30].RS的决策规则是在分析以往经验数据的基础上得到的.RS允许决策对象中存在一些不太明确、不太完整的属性,弥补了常规决策方法的不足.希腊工业发展银行ETE VA应用RS理论协助制订信贷政策,是RS多准测决策方法的一个成功范例.RS理论的应用领域还包括:近似推理[31,32]、软件工程数据分析[33]、图象处理[34]、材料科学中的晶体结构分析[35]、预测建模[36,37]、结构建模[38]、投票分析[39]、电力系统[40,42]等. RS在我国的研究刚刚起步,有关文献还不多[43~44].5 结束语(C onclusion)虽然RS至今只有十几年的发展历史,但取得的研究成果是令人瞩目的.它是一种较有前途的软计算方法,为处理不确定性信息提供了有力的分析手段[45].我们相信RS具有广阔的发展空间,今后会在更多的实际领域中发挥作用.致谢 波兰华沙工业大学计算机科学研究所(Institute of C om puter Science,Warsaw University of T echnology)的Zdzislaw Pawlak教授和Bozena Skalska博士赠送了部分研究报告,在此向他们表示感谢. 1期粗糙集理论及其应用综述155参考文献(References)1 Pawlak Z et al.R ough sets.C ommunications of AC M,1995,38(11):89 -952 Pawlak Z.R ough sets.International Journal of In formation and C om puter Science,1982,(11):341-3563 Pawlak Z.R ough set-theoretical aspects of reas oning about data.D or2 drecht:K luwer Academ ic Publishers,19914 S lowinski R.Intelligent decision support-handbook of applications and advances of the rough sets theory.D ordrecht:K luwer Academ ic Publish2 ers,19925 Pawlak Z.Vagueness and uncertainty-a rough set perspective.C om puta2 tional Intelligence,1995,11(2):227-2326 W ygralak M.R ough sets and fuzzy sets-s ome remarks on interrelations.Fuzzy Sets and Systems,1989,29(3):241-2437 Nanda S et al.Fuzzy rough sets.Fuzzy Sets and Systems,1992,45(2): 157-1608 Banerjee M and Pal S K.R oughness of a fuzzy set.In formation Sciences, 1996,93(3,4):235-2469 Skowton A et al.From rough set theory to evidence theory.Advances in the Dem pster Shafer Theory of Evidence.New Y ork:John W iley&S ons Inc.,1994,193-23610 Jakub W.Finding m inimal reducts using genetic alg orithm.Institute ofC om puter Science Reports,W arsaw University of T echnology,W arsaw,199511 G olan R and Z iarko W.M ethodology for stock market analysis utilizing rough set theory.Proc.of IEEE/IAFE C on ference on C om putational In2 telligence for Financial Engineering,New Jersey,1995,32-4012 Nejman D.A rough set based method of handwritten numerals classifica2 tion.Institutc of C om puter Science Reports,W arsaw University of T ech2 nology,W arsaw,199413 T eghem J et e of rough sets method to draw prem onitory factors for earthquakes by em phasizing gas geochem istry.In:Intelligent Decision Support-Handbook of applications and Advances of the R ough Sets Theory.D ordrecht:K luwer Academ ic Publishers,1992,165-17914 Deja R.C on flict m odel with neg otiations.In:Institute of C om puter Sci2 ence Reports.W arsaw University of T echnlolgy,W arsaw,199515 Hu X iaohua et al.M ining knowledge rules from databases-a rough set approach.Proc.of IEEE International C on ference on Data Engineering, Los Alam itos,1996,96-10516 Tsum oto Sh et al.Extraction of domain knowledge from databases based on rough set theory.IEEE International C on ference on Fuzzy Systems, New Jersey,1996,748-75417 S ienkiewicz J.R ough set and rough function approaches to the control al2g orithm reconstruction.Institute of C om puter Science Reports,W arsaw U2niversity of T echnology,W arsaw,199618 Mrozek A et al.M ethodology of rough controller synthesis.Proc.of IEEE International C on ference on Fuzzy Systems,New Jersey,1996,1135-113919 Pawlak Z.R ough sets,rough relations and rough functions.Fundamenta In formaticae,1996,27(2,3):103-10820 Plonka L and Mrozek A.Rule2based stabilization of the inverted pendu2lum.C om putational Intelligence,1995,11(2):348-35621 C z ogala E et al.Idea of a rough fuzzy controller and its application to the stabilization of a pendulum2car system.Fuzzy Sets and systems,1995,72(1):6127322 Mrozek A.R ough sets and dependency analysis am ong attributes in com2 puter im plementations of expert’s in ference m odels.International Journal of M an2M achine S tudies,1989,30(4):457-47323 Arima M et al.Fuzzy logic and rough sets controller for HVAC systems.Proc.of IEEE WESCANEX C ommunications,P ower,and C om puting, New Y ork,1995,133-13824 Tsum oto S et al.Automated discovery of medical expert system rules from clinical databases based on rough sets.Proc.of Second InternationalC on f.on K nowledge Discovery and Data M ining,US A,1996,63-7225 Jelonek J et al.R ough set reduction of attributes and their domains for neural netw orks.C om putational Intelligence,1995,11(2):339-34726 Peng C et al.Multi2valued neural netw ork and the knowledge acquisition method by the rough sets for ambiguous recognition problem.Proc.of the IEEE International C on ference on Systems,M an and Cybernetics,Bei2 jing,1996,736-74027 Y asdi R.C ombining rough sets learning and neural learning2method to deal with uncertain and im precise in formation.Neurocom puting,1995,7(1):61-8428 S lowinski R.R ough set approach to decision analysis.AI Expert,M arch 1995,19-2529 Pawlak Z.R ough set approach to knowledge2based decision support.In2 stitute of C om puter Science Reports,W arsaw University of T echnology, W arsaw,199530 S lowinski R et al.R ough set s orting of firms according to bankruptcy risk.In:Applying Multiple Criteria aid for Decision to Environment M an2 agement,D ordrecht:K luwer Academ ic Publishers,1994,339-35731 S lowinski R et al.R ough set reas oning about uncertain data.Fundamenta In formaticae,1996,27(2,3):229-24332 Pars ons S et al.A rough set approach to reas oning under uncertainty.Journal of Exprimental and Theoretical AI,1995,7(2):175-19333 Ruhe Gand G esselschaft F.R ough set based data analysis in g oal2orient2 ed s oftware measurement.Proc.of IEEE International s oftware M etrics Sym posium,Los Alam itos,1996,10-1934 W ojcik Z et al.Application of rough sets for edge enhancing image fil2 ters.Proc.of IEEE International C on ference on Image Processing,Los Alam itos,1994,525-52935 Jacks on A et al.R ough sets applied to materials data.Acta M aterialia, 1996,44(11):4475-448436 C ollette T and S zladow e rough sets and spectral data for building predictive m odels of reaction rate constants.Applied S pectroscopy, 1994,48(11):1379-138637 Aijun A et al.Discovering rules for water demand prediction-an en2 hanced rough set approach.Engineering Applications of Artificial Intelli2 gence,1996,9(6):645-65338 W ojcik Z et al.S tructural m odeling using rough sets.Proc.of IEEE Inter2 national C on ference on Fuzzy Systems,New Jersey,1996,761-76639 Nurm i H et al.Probabilistic,fuzzy and rough concepts in s ocial choice.European Journal of Operational Research,1996,95(2):264-277156 控制理论与应用16卷 40 Lambert2T orres G et al.Data M ining into a C ontrol Center Database via R ough Set T echniques.Proc.of the International C on ference on Intelli2 gent Systems Applications to P ower Systems(IS AP’97),Seoul,1997, 246-25041 Zhang Q,Han Z X and W en F S.A new approach for fault diagnosis in power systems based on rough set theory.Proceedings of APSCOM’97,H ong K ong,1997,597-60242 张琦,韩祯祥,文福拴.一种基于粗糙集方法的电力系统故障诊断/警报处理的新方法.中国电力,1998,31(4):32-3843 王珏,苗夺谦,周育键.关于R ough Set理论与应用的综述.模式识别与人工智能,1996,9(4):337-34444 曾黄麟.粗集理论及其应用.重庆:重庆大学出版社,199845 E wa Orlowska(ed.).Incom plete in formation2rough set analysis.New Y ork:Physica2Verlag,1998本文作者简介韩祯祥 1930年生.浙江大学教授,博士生导师.研究领域为软计算方法及其在电力系统中的应用.张 琦 1971年生.浙江大学在读博士生.研究方向为粗糙集理论在电力系统中的应用.文福拴 1965年生.浙江大学教授,博士生导师.研究领域为软计算方法在电力系统中的应用. 1期粗糙集理论及其应用综述157。

粗_糙_集_理_论

粗_糙_集_理_论


则X关于R是精确的。
相反地,Rough隶属函数可用来定义一个集合 的上、下近似集及边界集
R x 1 apr X x U , X
X U


R x 0 apr X x U , X

R bn X x U ,0 X

x 1
粗糙集理论的基本概念
RS理论认为知识即是将对象进行分类的能力, 假定我们起初对全域里的元素(对象)具有必要的 信息、或知识,通过这些知识能够将其划分到不同 的类别。若我们对两个元素具有相同的信息,则它 们就是不可区分的(即根据已有的信息不能够将其 划分开)。显然这是一种等价关系。不可区分关系 是RS理论最基本概念。在此基础上引入了成员关系, 上近似和下近似等概念来刻划不精确性与模糊性[1, 2,4,5]。


粗糙集的几种表示(续)

R X
card apr X card apr X

称 R ( X )为X的近似精度, 0 R X 1 (粗糙程度。 于是也可用 R ( X ) 来定义Rough集。 当 R X 1 ,称U上子集X关于U上不分明关系R是 Rough的; 当 R X 1 ,称X关于R是精确的;
粗糙集的几种表示(续)
无论哪一种Rough集的表示形式都离不开全域U 上的不分明关系R以及由R定义的下和上近似集。因 此对Rough集理论中的不分明关系以及下和上近似 集的研究尤其重要。定义观点的不同往往带来研究 的侧重面的不同。
X关于A的度量
X关于A的近似质量: apr X card apr X rA X card U U 近似质量 rA ( X ) 反映了知识X中肯定在知识库中的部 分在现有知识中的百分比。 apr X X关于A的粗糙性测度: A X 1 apr X 则 0 A X 1 ,且X是可定义的 A X 0 X是粗糙的 A X 0 。 粗糙性测度反映了知识的不完全程度。

粗糙集理论综述 收藏

粗糙集理论综述 收藏

粗糙集理论综述收藏进入网络信息时代,随着计算机技术和网络技术的飞速发展,使得各个行业领域的信息急剧增加,如何从大量的、杂乱无章的数据中发现潜在的、有价值的、简洁的知识呢?数据挖掘(Data Mining)和知识发现(KDD)技术应运而生。

粗糙集理论作为一种数据分析处理理论,在1982年由波兰科学家Z.Pawlak创立[1]。

最开始由于语言的问题,该理论创立之初只有东欧国家的一些学者研究和应用它,后来才受到国际上数学界和计算机界的重视。

1991年,Pawlak出版了《粗糙集—关于数据推理的理论》这本专著,从此粗糙集理论及其应用的研究进入了一个新的阶段,1992年关于粗糙集理论的第一届国际学术会议在波兰召开。

1995年ACM将粗糙集理论列为新兴的计算机科学的研究课题。

粗糙集理论作为一种处理不精确(imprecise)、不一致(inconsistent)、不完整(incomplete)等各种不完备的信息有效的工具,一方面得益于他的数学基础成熟、不需要先验知识;另一方面在于它的易用性。

由于粗糙集理论创建的目的和研究的出发点就是直接对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律,因此是一种天然的数据挖掘或者知识发现方法,它与基于概率论的数据挖掘方法、基于模糊理论的数据挖掘方法和基于证据理论的数据挖掘方法等其他处理不确定性问题理论的方法相比较,最显著的区别是它不需要提供问题所需处理的数据集合之外的任何先验知识,而且与处理其他不确定性问题的理论有很强的互补性(特别是模糊理论)。

目前,粗糙集理论的研究方向主要是三个方面:理论上,①利用抽象代数来研究粗糙集代数空间这种特殊的代数结构[2~7]。

②利用拓扑学描述粗糙空间[8]。

③还有就是研究粗糙集理论和其他软计算方法或者人工智能的方法相接合,例如和模糊理论、神经网络、支持向量机、遗传算法等[9~19]。

④针对经典粗糙集理论框架的局限性,拓宽粗糙集理论的框架,将建立在等价关系的经典粗糙集理论拓展到相似关系甚至一般关系上的粗糙集理论[20~23]。

粗糙集理论与应用研究综述

粗糙集理论与应用研究综述

粗糙集理论与应用研究综述粗糙集理论是不确定性信息处理的一种数学工具,是由波兰科学家佩德罗泽文斯基于1982年提出的。

粗糙集理论通过将数据划分成不同的等价类,来描述不确定性的知识和推理过程。

在实际应用中,粗糙集理论被广泛应用于模式识别、数据挖掘、决策支持系统等领域。

粗糙集理论的核心思想是基于粗糙近似。

在数据集中,有些数据可能存在不确定性,即一个数据对象可能属于多个等价类。

为了处理这种不确定性,粗糙集理论引入了下近似集和上近似集的概念。

下近似集是所有能包含该数据对象的最小等价类的集合,上近似集是能被该数据对象覆盖的最大等价类的集合。

通过对下近似集和上近似集的分析,可以获得对不确定性的更准确的描述。

粗糙集理论的核心内容包括等价关系的建立和精化、下近似集和上近似集的计算、知识规约等。

等价关系的建立和精化主要是通过观察数据集中的属性值之间的关系,构建等价关系矩阵,并通过矩阵的交叉点进行精化。

下近似集和上近似集的计算是通过迭代和剪枝操作,依次计算各个属性的下近似集和上近似集。

知识规约是利用粗糙集理论对数据集进行简化,去除不必要的属性,提取出核心属性和决策规则。

在模式识别中,粗糙集理论可以用于特征选择和特征提取。

特征选择是指从原始数据集中选择出最具有代表性和判别能力的特征子集,以便提高分类器的性能。

特征提取是通过对原始特征进行数学变换,将其转化为新的特征空间,以便更好地区分和分类数据。

粗糙集理论可以帮助识别出具有决策不确定性的特征,并提供精确的决策规则。

在数据挖掘中,粗糙集理论可以用于发现数据之间的相互关系和规律。

通过对数据集进行粗糙集分析,可以得到不同属性之间的依赖关系,以及属性与决策之间的关系。

基于这些关系,可以发现隐藏在数据集中的模式和规律,帮助用户进行预测和决策。

在决策支持系统中,粗糙集理论可以用于辅助决策过程中的信息处理和决策分析。

通过对决策问题进行粗糙集建模,可以对决策过程中的不确定性进行量化,并提供决策规则和优化方案。

模糊软集合与软粗糙集模型研究

模糊软集合与软粗糙集模型研究

Science &Technology Vision科技视界0引言Pawlak 粗糙集理论是研究病态数据的集合理论的推广[1],它主要研究不完备信息数据。

在粗糙集理论中,论域的子集通过上、下近似来描述。

集合的下近似是包含在集合中的所有等价类的并集,上近似是所有与集合有非空交的集合的并集。

等价类是粗糙集理论中构造上、下近似的基本单元。

集合的划分导出了等价类,反之亦然。

因此,既可以通过集合的划分也可通过集合的等价关系来研究粗糙集的属性。

模糊集理论由Zadeh 于1965开创,它主要研究模糊不确定性问题。

在文献[2]中,Chakrabarty 等讨论了粗糙集的模糊度,他们介绍了粗糙集模糊度的度量概念。

Molodtsov 定义的软集合理论[3],是讨论模糊性的新方法,正在成为学者研究的热点[4-6]。

软集合中的元素由完备参数确定,粗糙集中由等价类确定,而模糊集中由隶属度决定。

三种理论尽管不同但均可处理模糊性,论文将主要集中研究软集合与模糊软集合、软集合与软粗糙集之间的关系。

1预备知识全文中除开特殊的声明外,U 表示非空的有限集。

定义1设U 是一个非空的有限集,E 是一个参数集,A ⊂E ,P (U )是U 的幂集。

若F :A →P (U ),则称(F ,A )为U 上的软集合,即U 上的软集合是U 的参数化子集族。

定义2设(F ,A )与(G ,B )是U 上的任意两个软集合。

若1)B ⊆A ;2)∀β∈B ,G (β)⊆F (β);则称(G ,B )是(F ,A )的一个软子集。

U ×U 上的任何子集称为U 上的二元关系。

设R 是U 上的一个二元关系,若:1)∀x ∈U ,有(x ,x )∈R ,则称R 是自反的;2)∀x ,y ∈U ,当(x ,y )∈R 时,有(y ,x )∈R ,则称R 是对称的;3)∀x ,y ,z ∈U ,当(x ,y )∈R 且(y ,z )∈R 时,有(x ,z )∈R ,则称R 是传递的。

粗糙集理论与应用研究综述

粗糙集理论与应用研究综述

, 该
理 论 已经 在 机 器 学 习 与 知 识 发 现 、 数 据 挖 掘、 决策 目前 , 有 3 个有关 支持与分析等方面得到广泛应用 . 即R 粗糙 集 的 系 列 国 际 会 议 , S C T C、 R S F D G r C和 中国学者在这方面也 取 得 了 很 大 的 成 果 , 从 R S KT. 2 0 0 1 年开始每 年 召 开 中 国 粗 糙 集 与 软 计 算 学 术 会 议; R S F D G R C 2 0 0 3、 I E E E G r C 2 0 0 5、 R S KT 2 0 0 6、 I F KT 2 0 0 8、 R S KT 2 0 0 8、 I E E EG r C 2 0 0 8 等一 系 列 国 际学术会议在中国召开 . 粗糙集理论与应用的核心基础是从近似空间导 出的一对近似算子 , 即上近似算子和下近似算子 ( 又 下近 似 集 ) 经典 P 称上 、 . a w l a k模型中的不分明关 系是一种等价关系 , 要求很高 , 限制了粗糙集模型的 应用 . 因此 , 如何推广定义近似算子成为了粗糙集理 论研究的一个重点 . 目前, 常见的关于推广粗糙集理论的研究方法 有两种 , 即构造化方法和公理化方法 . 构造化方法是 以论域上的二元关系 、 划分 、 覆盖 、 邻域系统 、 布尔子 代数等作为基本要素 , 进而定义粗糙近似算子 , 从而 公理化方法的基本要素是一 导出粗糙集代数系 统 . 近似算子的某些 对满足某些公理的 一 元 集 合 算 子 , 公理能保证有一些 特 殊 类 型 的 二 元 关 系 的 存 在 ; 反 过来 , 由二元关系通 过 构 造 性 方 法 导 出 的 近 似 算 子 一定满足某些公理 . 事实上 , 有两种形式来描述粗糙集 , 一个是从集 合的观点来 进 行 , 一 个 是 从 算 子 的 观 点 来 进 行. 那 么, 从不同观点采用 不 同 的 研 究 方 法 就 得 到 粗 糙 集 扩展模型的研究以及基于其上的 的各种扩展模型 . 应用研究已经成为新的研究热点 . 粗糙集理论与其它处理不确定和不精确问题理 论的最显著的区别是它无需提供问题所需处理的数 据集合之外的任何 先 验 信 息 , 所以对问题的不确定 性的描述或处理可 以 说 是 比 较 客 观 的 , 由于这个理 论未能包含处理 不 精 确 或 不 确 定 原 始 数 据 的 机 制 , 所以这个理论与概 率 论 、 模糊数学和证据理论等其 它处理不 确 定 或 不 精 确 问 题 的 理 论 有 很 强 的 互 补 因此 , 研究粗糙集理论和其它理论的关系也是粗 性. 糙集理论研究的重点之一 . 基于粗糙集理论的应用研究主要集中在属性约 简、 规则获取 、 基于粗糙集的计算智能算法研究等方 面. 由于属性 约 简 是 一 个 N 许多学者 P H a r d 问 题, 进行了系统的研究 . 基于粗糙集的约简理论发展为 数据挖掘提供了许多有效的新方法 . 比如 , 针对不同

基于代数观点的邻域区间集粗糙集模型研究

基于代数观点的邻域区间集粗糙集模型研究

基于代数观点的邻域区间集粗糙集模型研究姚红 1 蒋洁芳 2 袁滔 3 郝宇 1 朱蓥 1 杨健 1 王鹏飞 1(1.空军都江堰特勤疗养中心 四川成都 611800; 2.四川师范大学数学科学学院 四川成都 610066; 3.成都市郫都区人民法院 四川成都 611700)摘要: 描述部分已知概念的区间集粗糙集是对经典粗糙集的拓展,其属性值概念由上下边界集来描述,具有较好的不确定性刻画能力,能够有效促进数据挖掘、信息度量和知识发现等实际应用。

现有研究主要针对离散型数据对象,不能很好地处理现实世界中大量存在的连续型数据对象,因此区间集粗糙集具有改进的空间。

该文引入邻域关系,通过Hausdorff 距离函数定义区间集邻域粒子,由此构造邻域区间集粗糙集模型,并从代数观点研究其相关概念及性质,最后用实例分析验证其有效性。

关键词: 邻域区间集粗糙集 三支域 单调性 代数观点中图分类号: TP393文献标识码: A文章编号: 1672-3791(2023)14-0208-05Research on the Neighborhood Interval-set Rough Set ModelBased on Algebraic ViewpointsYAO Hong 1 JIANG Jiefang 2 YUAN Tao 3 HAO Yu 1 ZHU Ying 1 YANG Jian 1 WANG Pengfei 1(1.Dujiangyan Special Service Sanatorium of Air Force, Chengdu, Sichuan Province, 611800 China; 2.School of Mathematical Sciences, Sichuan Normal University, Chengdu, Sichuan Province, 610066 China; 3.People'sCourt of Pidu District, Chengdu, Sichuan Province, 611700 China)Abstract: The interval-set rough set which describes some known concepts is an extension of the classical rough set, and its attribute value concept is described by upper and lower boundary sets, which has good uncertainty de‐scription ability and can effectively promote the practical applications of data mining, information measurement and knowledge discovery. The existing research mainly focuses on discrete data objects, and it can not deal with a large number of continuous data objects in the real world, so the interval-set rough set has room for improvement. In this paper, neighborhood relation is introduced, the neighborhood particles ofthe interval set are defined by the Hausdorff distance function, the neighborhood interval-set rough set model of is constructed, its related concepts and properties are studied from algebraic viewpoints, and finally its effectiveness is verified by case analysis.Key Words: Neighborhood interval set rough set; Three branches; Monotonicity; Algebraic viewpointDOI: 10.16661/ki.1672-3791.2211-5042-9246作者简介: 姚红(1994—),女,硕士,助理工程师,研究方向为粗糙集。

粗糙集理论介绍和研究综述

粗糙集理论介绍和研究综述

X n}是由 U 的子集所构成的集类, 则 F 关于近似空间A 的下近似 ap rF 和上近似 ap rF 定
义为
ap rF = {ap rX 1, ap rX 2, …, ap rX n}
ap rF = {ap rX 1, ap rX 2, …, ap rX n}
F 关于 A 的近似精度 ΑA (F ) 和近似质量 rA (F ) 分别定义为
例3. 1 (无决策情形) S = (U , A , V , Θ) , 其中 U = {x 1, x 2, …, x 8}, 属性集 A = {c1, c2, c3, c4}, V 1= V 2= V 3= {1, 2, 3}, V 4= {1, 2}, 信息函数 Θ见表3. 1。
表311 一个信息系统
关于决策属性D 1Α D
是协调的, 这时也称决策表 (U , C 1∪D 1, V , Θ) 是协调的, 否则为不协调。如果用包含度理
论[48]来解释, 则决策表 (U , C 1∪D 1, V , Θ) 是协调的当且仅当包含度
ap rX = ∪ { [ x ] [ x ] ∩ X ≠ } = {x ∈ U [ x ] ∩ X ≠ } 其中[x ]是 x 所在的 R 2等价类。
下近似 ap r 也称作 X 关于A 的正域, 记作 PO S (X ) , 它可以解释为由那些根据现有
知识判断出肯定属于 X 的对象所组成的最大集合, 上近似 ap r 可以解释为由那些根据现 有知识判断出可能属于 X 的对象所组成的最小集合。U ap rX 称作 X 关于 A 的负域, 记 作 N EG (X ) , 可以解释为由那些根据现有知识判断出肯定不属于 X 的对象所组成的集 合。ap r ap rX 称作 X 的边界 (域) , 记作 B N (X ) , 它可以解释为由那些根据现有知识判断 出可能属于 X 但不能完全肯定是否一定属于 X 的对象中所组成的集合。

粗糙集理论与应用研究综述

粗糙集理论与应用研究综述

粗糙集理论与应用研究综述王国胤1Yiyu Yao2 于洪1,2(1重庆邮电大学计算机科学与技术研究所重庆400065)(2Department of Computer Science, University of Regina, Regina, Canada S4S 0A2){wanggy,yuhong}@,***************.ca摘要本文在阐释粗糙集理论基本体系结构的基础上,从多个角度探讨粗糙集模型的研究思路,分析粗糙集理论与模糊集、证据理论、粒计算、形式概念分析、知识空间等其他理论之间的联系,介绍国内外关于粗糙集理论研究的主要方向和发展状况,讨论当前粗糙集理论研究的热点研究领域,以及将来需要重点研究的主要问题。

关键词粗糙集,模糊集,粒计算,形式概念分析,知识空间,智能信息处理A Survey on Rough Set Theory and Its ApplicationWang Guo-Yin1Yao Yi-Yu2 Yu Hong1,21 Institute of Computer Science and Technology, Chongqing University of Posts and Telecommunications, Chongqing, 4000652 Department of Computer Science, University of Regina, Regina, Saskatchewan, Canada, S4S 0A2Abstract This paper introduces the basic ideas and framework of rough set theory and the different views of knowledge representation in rough set theory, and then discusses the relations between the rough set theory and the other theories, such as fuzzy set, evidence theory, granular computing, formal concept analyzing, knowledge space, etc. Furthermore, the paper reviews the recent studies for this theory and a survey on its applications is also given. The future development trend of rough set theory is also discussed.Keywords rough set, fuzzy set, granular computing, formal concept analyzing, knowledge space, intelligent information processing1 引言智能信息处理是当前信息科学理论和应用研究中的一个热点领域。

基于邻域的粗糙集近似【文献综述】

基于邻域的粗糙集近似【文献综述】

文献综述信息与计算科学基于邻域的粗糙集近似粗糙集理论作为一种数据分析处理理论, 由波兰科学家Z.Pawlak[1]于1982年所创立, 它是经典集合理论的扩展, 是继概率论、模糊集、证据理论之后一种处理不精确、不一致、不完整等各种不完备信息的有效新型数学工具[2], 是一种天然的数据挖掘、知识发现方法. 作为一种较新的计算方法, 粗糙集近年来越来越受到重视, 已在许多科学与工程领域的成功应用中得到证实, 是当前国际上人工智能理论及其应用领域中的研究热点之一[3].在自然科学、社会科学、工程技术等很多领域中, 都有不同程度地涉及到对不确定因素和对不完备信息的处理. 实际系统中采集到的数据常常包含着噪声, 不够精确甚至不完整. 采用纯数学上的假设来消除、回避这种不确定性, 效果往往不理想, 反之, 如果正视它, 对这些信息进行合适地处理, 常常有助于相关实际系统问题的解决. 多年来, 研究人员一直在努力寻找科学地处理不完整性和不确定性的有效途径. 模糊集和基于概率方法的证据理论是处理不确定信息的两种方法, 已应用于一些实际领域. 但这些方法有时需要一些数据的附加信息或先验知识, 如模糊隶属函数, 基本概率指派函数和有关统计概率分布等, 而这些信息有时并不容易得到. 1982 年, 波兰学者Z. Paw lak 提出了粗糙集理论, 它是一种刻划不完整性和不确定性的数学工具, 能有效地分析不精确、不一致、不完整等各种不完备的信息, 还可以对数据进行分析和推理, 从中发现隐含的知识, 揭示潜在的规律. 粗糙集理论是建立在分类机制的基础上的, 它将分类理解为在特定空间上的等价关系, 而等价关系构成了对该空间的划分.粗糙集理论将知识理解为对数据的划分. 粗糙集理论的主要思想是利用已知的知识库, 将不精确或不确定的知识用在已知的知识库中的知识经行近似刻画. 该理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息, 所以对问题的不确定性的描述或处理可以说是比较客观的, 由于这个理论未能包含处理不精确或不确定原始数据的机制, 所以这个理论与概率论、模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性[4].粗糙集能有效地处理下列问题: 不确定或不精确知识的表达; 经验学习并从经验中获取知识; 不一致信息的分析; 根据不确定, 不完整的知识进行推理; 在保留信息的前提下进行数据化简; 近似模式分类; 识别并评估数据之间的依赖关系.粗糙集理论的主导思想是保持分类能力不变的情况下[6], 通过知识约简得出问题的决策和分类方法. 对于分类, 可以找到不确定数据或者噪声数据内在结构; 对于特征归约, 可以用来识别、删除给定数据的属性; 对于分析, 可以根据分类而评估出每个属性的意义或贡献. 由于Z.Pawlak的理论存在一定的局限性, 比如当属性过多时, 对论域的不可分辨划分的过多多少而产生过多的规则; 不能处理同时具有不同重要性的元素等. 因此, 对其的扩展一直是粗糙集研究的重要方向, 目前主要有构造性方法和代数性方法. 目前, 很多学者已经对这个问题进行了一些研究, 得到了不同于Pawlak的粗糙集合模型. 当知识模块是清晰(近似空间为经典二元等价关系)而被近似的概念是一个模糊的时, 可以得到粗糙模糊集;当知识模块是模糊(近似空间为模糊二元等价关系)而被近似的概念是经典集时, 则可得到模糊粗糙集[7][8][9].因此, 粗糙集理论的一个主要研究方向通过Pawlak的粗糙集合近似化得而推广[10][11]. 本文主要进行了基于邻域算子系统的粗糙近似算子系统的研究, 提出了k-步邻域的概念和粗糙集近似. 首先, 介绍了二元关系基本概念和性质, 导出了六种不同的关系, 再由它们导出六个邻域系统. 然后, 从二元关系关系出发, 结合粗糙近似算子系统, 同样导出了六种不同族的关系, 并且再由它们的关系导出了六个相应的粗糙近似算子系统. 最后讨论了粗糙近似算子系统的性质, 得到了二元关系和k-步近似算子的等价刻画.参考文献[1]Pawlak Z. Rough sets [J] . International Journal of Computer and Information Science, 1982,11: 341~356.[2]Chan C C. A rough set approach to attribute generalization in data mining [J]. Journal ofInformation Sciences, 1998, 107: 169~176.[3]张文修, 吴伟志. 粗糙集理论介绍和研究综述[J]. 模糊系统与数学, 2000, 14(04): 1~12.[4]Lin T Y. Neighborhood systems and relational database [C], In: Proceedings of CSC’88,1988.[5]徐优红. 二元关系的复合与近似算子的合成[J]. 计算机科学, 2009, 36(2): 194~198.[6]张文修, 吴伟志, 梁吉业, 李德玉. 粗糙集理论与方法[M]. 北京: 科学出版社, 2001.[7]徐优红, 杨晓平. 欧几里得模糊关系[J]. 河北师范大学学报(自然科学版), 2003, 27(3):32~41.[8]徐优红. 模糊环境下粗糙近似算子的表示[J]. 工程数学学报, 2003, 20(01): 99~103.[9]杨晓平. 邻域系统与k 步粗糙模糊集[J]. 工程数学学报, 2004, 21(05):829~832.[10]杨富平, 莫智文. 粗糙集中的近似精确问题[J]. 四川师范大学学报(自然科学版), 2004,27(2): 155~159.[11]张文修, 王国俊, 刘旺金, 方锦暄. 模糊数学引论[M]. 西安: 西安交通大学出版社,1991.。

粗糙集理论及应用研究综述

粗糙集理论及应用研究综述

粗糙集理论及应用研究综述【摘要】针对粗糙集理论及应用的研究,是学术界一直在研究的课题,本文对目前粗糙集理论及应用的研究情况首先进行了总结,然后对粗糙集理论及应用的研究热点进行了简单的概括和分析,同时还对粗糙集理论及应用今后的发展趋势提出一些展望。

【关键词】粗糙集;属性约简;规则提取;数据挖掘【Abstract】Based on the rough set theory and its application research, academic circles has been the subject of study, this paper summarizes the rough set theory and its application research status, analysis of the rough set theory and its application research hotspot, and the rough set theory and its application in the future research prospect was put forward.【Key words】Rough set;Attribute reduction;Rule extraction;Data mining0.引言粗糙集理论是用来分析和处理不确定、不完整和模糊数据的一种新型数学思想,它在诸多领域有着广泛的应用。

在理论研究方面,粗糙集自从诞生以来就一直是学术界十分关注的研究课题。

基于粗糙集的应用研究更是引起了学术界越来越多人的兴趣。

为了方便人们今后在该领域作更深入的探索,本人首先对目前粗糙集理论及应用的具体情况作一些归纳和总结,然后对粗糙集理论及应用目前的研究热点进行一些简单的概括和分析,同时对粗糙集理论及应用在以后的发展趋势进行一些展望。

1.粗糙集在国内外的研究现状波兰数学家Z.Pawlak在1982年第一次提出粗糙集理论,由于当时该理论是用波兰国家的文字来刊登和发表的,所以除了懂得波兰文的学者外,大多数的学者对粗糙集理论根本没有什么了解,因此没有引起学术界多数研究者的足够的重视。

粗糙集理论及其应用综述

粗糙集理论及其应用综述

粗糙集理论及其应用综述摘要、粗糙集理论是一种新的分析和处理不精确、不一致、不完整信息与知识的数学工具,为智能信息处理提供了有效的处理技术,近年来,被广泛应用于专家系统、图像处理、模式识别、决策分析等领域。

文中介绍了关于粗糙集的基本理论,并对其在各领域的应用情况进行了综述。

关键词、粗糙集理论;不确定性;知识约简;粗糙模糊集中图分类号、TP18文献标识码、A文章编号、2095-1302(2017)06-00-020引言粗糙集理论由波兰华沙理工大学Z.Pawlak教授于1982年首先提出,通过结合逻辑学和哲学中对不精确、模糊的定义,针对知识和知识系统提出了知识简约、知识依赖、知识表达系统等概念,并在此基础上形成了完整的理论体系――粗糙集理论。

粗糙集理论把知识看作关于论域的划分,认为知识是有粒度的,而知识的不精_性是由知识的粒度过大引起的。

从1992年至今,每年都要以粗糙集为主题召开国际会议,近两年,召开的关于粗糙集的会议有2015年国际粗糙集联合会议(IJCRS2015)和2016年第十六届中国粗糙集与软计算联合学术会议(CRSSC2016)。

粗糙集越来越受到各行业专家和科研人员的重视,随着对粗糙集理论研究的不断加深,越来越多的领域开始运用粗糙集解决问题。

1粗糙集理论1.1知识与知识系统将研究对象构成的集合记为U,这是一个非空有限集,称为论域U,任何子集,称其为U中的一个概念或范畴。

把U中任何概念族都称为关于U的抽象知识,简称知识。

一个划分定义为、X={X1,X2,…,Xn},,Xi≠φ,Xi∩Xj=φ,且i≠j,i,j=1,2,…,n;∪niXi=U。

U上的一簇划分称为关于U的一个知识系统。

R是U上的一个等价关系,由它产生的等价类可记为[x]R={y|xRy,y∈U},这些等价类构成的集合U/R={[x]R|x∈U}是关于U的一个划分。

若PR,且P≠φ,则∩P也是一种等价关系,称为P上不可分辨关系,记为ind(P)、。

第二章 关联集与粗糙集

第二章 关联集与粗糙集

第二章关2.1 双格经典的集合代数是基于通常的二值逻辑的,它作为不完备信息和不一致信息的模型是不适宜的。

为了克服二值逻辑的不足,1977年Belnap 在经典的逻辑真值(真和假(,t f ))中,增加了两个新值,即一点不知和完全知道(,⊥T ),构成了四值逻辑,这样的逻辑框架既可以度量真值,又可以刻画信息的完全性和一致性。

1986年,Ginsberg 推广了Belnap 的四值逻辑结构,建立了双格概念,这为知识表示提供了方便。

事实上,对于某一个集合,根据已有的信息对其中的每一个元素划分到已经确定的区域内并不可能,为此,Mousavi 于2001年把双格的概念引入到集代数中,他用一对相对集来表示每一个概念,即用正区域和负区域两个区域来表示每一个概念。

2.1.1 双格的概念设{,,,}V t f =⊥T ,而V 上的Belnap 四值逻辑的真值有两个自然序:一个是真值序t ≤,用它记录真值度,在这个序下,假(f )是最小元,真(t )是最大元,一点不知(⊥)和完全知道(T )是两个不可比较的中间值;(,)t V ≤是具有逆序对合⌝的格,且,⌝⊥=⊥⌝Т=Т,格上的交与并分别用,∧∨表示,在相同的集合V 上还有一个是反映信息或知识程度的序k ≤,关于k ≤的交与并分别用,⊗⊕表示,它们分别表示一致的和易受骗的。

(,)k V ≤是一个保序k ≤的格,所以代数结构(,,,)t k V ≤≤⌝是一个具有四个元素{,,,t f ⊥Т}、五个运算(,,,,)∧∨⌝⊗⊕的双格。

定义1 一个双格是一个结构В(,,,)t k B =≤≤⌝,这里的B 是至少包含两个元素的非空集,(,),(,)t k B B ≤≤是完备格,而⌝是满足下列性质的一元运算:1) 如果t a b ≤,则t b a ⌝≤⌝,2) 如果k a b ≤,则k b a ⌝≤⌝,3) a a ⌝⌝=。

2.2 相对真值及其运算根据Fitting 的思想,Mousavi 把Belnap 四值逻辑的每一个真值用一对有序数表示(,)a b ,,{0,1}a b ∈,其中1a =表示有一些证据支持一个句子是真的,而1b =有证据说明一个句子是假的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文献综述
信息与计算科学
集合代数与粗糙集之间的关系研究
粗糙集理论是波兰数学家Pawlak于1982年提出的用于数据分析的理论. 由于该理论能够处理模糊和不确定性信息, 因此作为一种有效的知识获取工具受到了人工智能研究者的关注. 目前粗糙集理论已被成功应用在机器学习与知识发现、过程控制、数据挖掘、决策分析、模式识别等领域, 成为信息科学的研究热点之一.
1965年, 美国加利福尼亚大学控制论专家扎德(L. A. Zadeh)教授在《信息与控制》杂志上发表了一篇开创性论文<模糊集合>, 这标志着模糊数学的诞生. L. A. Zadeh教授多年来致力于“计算机”与“大系统”的矛盾研究, 集中思考了计算机为什么不能象人脑那样进行灵活的思维与判断问题. 计算机为什么不能象人脑思维那样处理模糊信息呢? 其原因在于传统的数学. 例如精确数学, 是建立在经典集合论的基础之上, 一个研究的对象对于某个给定的经典集合的关系要么是属于, 要么是不属于, 二者必居其一. [2]19世纪, 由于英国数学家布尔(Bool)等人的研究, 这种基于二值逻辑的绝对思维方法抽象后成为布尔代数, 它的出现促使数理逻辑成为一门很有适用价值的学科, 同时也成为计算机科学的基础. 但是, 1923年, 大哲学家罗素(Russell)就在其著名论文<论模糊性>中提出“整个语言或多或少是模糊的”及“所有二值逻辑都习惯上假定使用精确符号. 因此它仅适用于虚幻的存在. 而不适用于现实生活. 逻辑比其他学科使我们更接近天堂”[1]时认识到二值逻辑的不足. 二值逻辑无法解决一些逻辑悖论, 如著名的罗素(Russell)“理发师悖论”、“秃头悖论”、“克利特岛人说谎悖论”等等悖论问题. 这就是目前计算机不能象人脑思维那样灵活、敏捷地处理模糊信息的重要原因. 为克服这一障碍, L. A. Zadeh教授提出了“模糊集合论”. 在此基础上, 现在已形成一个模糊数学体系.
1960年柏克莱加州大学电子工程系扎德(L. A. Zadeh)教授, 提出“模糊”的概念. 1965年发表关于模糊集合理论的论文. 1966年马里诺斯(P. N. Marinos)发表关于模糊逻辑的研究报告. 以后, 扎德(L. A. Zadeh)又提出关于模糊语言变量的概念. 1974年扎德(L. A. Zadeh)进行有关模糊逻辑推理的研究. 1978年, 国际上第一本以模糊数学为主题的学术刊物《Fuzzy Sets
and Systems》在欧洲创刊. 模糊数学于1976年传入我国后得到了迅速发展: 1980年成立了中国模糊数学与模糊系统学会, 1981年创办了《模糊数学》(武汉, 华中工学院)杂志, 1987年创办了《模糊系统与数学》(长沙, 国防科技大学)杂志. 2005年8月20日, 中国运筹会Fuzzy信息与工程分会正式成立, Fuzzy数学的创始人扎德教授的出席会议. 同年经国际模糊系统协会(IFSA)专家评审, 最终授予中国四川大学副校长刘应明院士“FuzzyFellow奖”. 中国科研人员在Fuzzy领域中取得了卓越成就.
模糊数学是一门新兴学科, 可是由于模糊数学突破了传统精确数学绝不允许模棱两可的约束, 使过去那些与数学毫不相关或关系不大的学科都有可能用定量化和数学化加以描述和处理, 从而显示了强大的生命力和渗透力. 自1965年以来, 模糊集理论几乎已经渗入到基于经典集合理论的纯数学的所有分支中: 拓扑、代数结构、几何、算术、测皮论、概率论、范畴论等, 更引人注目的是这一新理论应用领域的广泛性: 近似推理模型、专家系统、语言学、定理证明技术以及逻辑编程、学习系统、信息检索、数据库、病理诊断、模式识别、聚类与分类技术、图像处理与计算机视觉、控制论与系统论、决策与偏好结构、可靠性理论、心理学、社会学等. 而且在模糊数学最重要的应用领域是计算机智能, 不少人认为它与新一代计算机的研制有密切的联系.
关系是一个基本概念. 在日常生活中有“朋友关系”、“师生关系”等, 在数学上有“大于关系”、“等于关系”等, 而序对又可以表达两个对象之间的关系. 普通关系是序偶的经典集合, 模糊关系则是序偶的模糊集合. 所以关系是集合论中的一个重要概念, 同时在模糊集合论中, 模糊关系也是很重要的一部分. 模糊关系是模糊理论中最重要的内容之一, 其应用范围十分广泛, 几乎遍及模糊数学的所有应用领域. 事实上, 模糊关系, 作为集论中普通关系概念的推广, 不仅描述客观事物之间有无关系, 而且描述其程度. 诸如“x比y大得多”, “x熟悉y”, “x与y相似”等用模糊语言表达的关系, 都是模糊关系.
因为模糊关系应用的广泛性, 如模糊聚类分析、模糊选择、模糊量排序、模糊偏好结构等, 其研究都是建立在模糊关系基础之上的. 而在对模糊关系及其应用的研究中, 模糊关系性质的讨论又占据着举足轻重的地位, 如前面所提及的应用中, 均须讨论模糊关系性质中的传递性. 本文首先定义了各种类型的经典二元关系和模糊二元关系, 再给出了它们的多种性质并予以证明, 同时说明二者的联系.
集合代数是经典命题演算形式系统的语义解释[4], 而经典命题演算系统(CPC)的公式只是一些形式符号, 其意义是由具体的解释给出的. 逻辑代数和集合代数都是布尔代数, 都
是CPC的解释. 集合代数是CPC的集合语义, 其中对联结词的解释就是集合运算;对形式公式的解释就是集合函数; 对逻辑蕴涵、逻辑等价的解释就是集合包含和集合相等. 标准概率逻辑是在标准概率集合语义上建立的逻辑体系, 命题表示随机事件, 随机事件是集合, 开率空间中的事件域是集合代数, 概率逻辑就是CPC集合语义的实际应用.
在粗糙集理论中有两种方式来推广定义近似算子: 构造性方法和公理化方法. 构造性方法是以论域上的二元关系[6]、领域系统或布尔子代数作为基本要素构造性地定义近似算子, 然后导出粗糙集代数系统. 由于二元关系常用来表示信息系统中的可利用信息, 所以目前所见的粗糙集在数据分析中的应用基本上都是用构造性方法去定义近似算子. 公理化方法的基本要素是满足某些公理集的近似算子, 即粗糙集代数系统是事先给定的, 然后定义二元关系使得由二元关系通过构造性方法定义的近似算子及其导出的粗糙集代数系统恰好就是事先给定的近似算子和粗糙集代数系统. 这种粗糙集代数[5]系统是由集合代数系统中的三个集合算子(交、并、补)加上两个粗糙近似算子(下近似算子和上近似算子)形成. 在这种意义, 粗糙集理论可以看成是集合论的又一推广形式. 另外粗糙集理论中的下近似算子和上近似算子与模态逻辑学中必然性(box)算子和可鞥性(diamond)算子、拓扑空间中的内部算子和闭包算子、Dempster-Shafer证据理论中的信任函数与似然都有着密切的联系. 因此, 公理化方法更有助于我们深入了解粗糙集和数学结构.
参考文献
[1] Etienne E Kerre. Fuzzy Sets and Approximate Reasoning (English Edition) [M]. 西安:
西安交通大学出版社, 1999.
[2] 李洪兴, 汪培庄. 模糊数学[M]. 北京: 国防工业出版社, 1994.
[3] 杨纶标, 高英仪. 模糊数学原理及应用[M]. 广州: 华南理工大学出版社, 2005.
[4] 刘宏岚, 高庆狮, 杨炳儒. 集合代数是经典命题演算形式系统的语义解释[J]. 计算
机学报, 2010, 09.
[5] 徐优红. 模糊粗糙集代数[J]. 计算机学, 2007, 02.
[6] 徐优红. 二元关系的复合与近似算子的合成[J]. 计算机科学, 2009, 36(2): 194~198.
[7] 韩立岩, 汪培庄. 应用模糊数学[M]. 北京: 首都经济贸易大学出版社, 1989.
[8] 张文修, 吴伟志, 梁吉业, 李德玉. 粗糙集理论与方法[M]. 北京: 科学出版社,
2001.。

相关文档
最新文档