模糊粗糙集粒度计算及应用案例
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模糊粗糙集粒度计算及应用案例
1.引言 粒度计算(Granular Computing,缩写为GrC)是信息处理的一种新的观念和
计算范式,主要用于处理精确的、模糊的、不确定的、部分真实的和海量的信息。 在1979年,Zadeh首先提出了信息粒度的概念,并且认为模糊集理论在粒度计算 方面具有极大潜力。在1982年,Pawlak提出了粗糙集理论,这实际上时为粒度计 算提供了一个具体实例。在1997年,Zadeh将模糊信息粒化问题扩展为“词计算 理论”;同年,T.Y.Lin正式对“粒度计算”命名,并且提出在邻域系统下的粒 度计算模型,这是对基于划分的粗糙集理论的延伸。随后,大量关于粒度计算的 文献相继发表。在国内,张钹院士和张铃教授提出了商空间理论,王飞跃教授开 发了以词计算为基础的语言动力系统,刘清教授将粒度计算用于医疗诊断专家系 统等。粒度计算的思想是用简单易求、低成本的足够满意的近似解代替精确解。 凡是在分析问题和求解问题中,应用了分组、分类和聚类手段的一切理论和方法 均属于粒度计算的范畴。粒度计算的主要理论模型有:基于模糊集的词计算模型, 粗糙集模型,基于商空间的粒度计算模型及一些粒度的混合模型。粒度计算覆盖 了所有有关粒度的理论、方法、技术和工具的研究,现已成为智能处理领域研究 的热点之一。 2.理论基础 2.1 粗糙集理论面临的主要问题
(3)时空动态时空数据:以往的粗集理论研究的都是静态数据,而动态变 化的数据库是事实存在的,并且在实际生活中占有很大的比例,因此时空动态变 化的数据也是粗糙集理论所面临的一个主要问题。 2.2 粒计算思想无处不在
信息粒在客观世界中无处不在并且粒计算的基本思想已经出现在诸多研究 领域,如图像处理中建立空间粒、信号处理中建立时间粒、系统建模等都是粒计 算的具体表现。粒计算是一种看待客观世界的世界观和方法论,信息粒化旨在建 立基于外部世界的有效的并以用户为中心的概念,同时简化我们对物理世界和虚
拟世界的认识。 人可以在不同程度的粒上来感知、抽象、表示和理解和解决客观世界的问
题。我国商空间理论的研究者张玲、张钹兄弟就提出了人类智能的最本质特征就 是能够从一个粒度跳到另一个粒度上,往返自如,毫无困难。粒计算本质上是分 层次的,人们根据实际问题的需要,将问题分解,从不同层次、不同角度来解决 问题。但是并非粒化的程度越细越好,当需要从整体上把握一个问题时,使用较 粗的粒度将会比细粒度取得更好的效果。例如一位思考全厂生产规划的计划人 员,当他考虑全厂的初步生产计划时,就应该忽略掉工厂的许多细节,而应该以 全局性的思考方式来考虑问题。在实际问题求解中,粒度的划分有时是动态的, 即先进行一次分类,在这个粒度上进行推理与分析,得到一定的性质,问题初步 明朗后,在进一步分类,直至问题的解决。 2.3 粒计算的基本问题
可以确定域。在经典粗糙集理论中,粒化的标准是集合中对象之间的等价关系, 而等价关系又是根据信息表或决策表中属性集合的值判定的。简单来说,粒对应 于粗集中的等价类(基本元素粒)。 3.模糊粗糙集 3.1Dubois模糊粗糙集的定义
Dubois模型起源于Willaeys和Malvache对模糊等价关系与模糊分类的讨论。 与Pawlak粗糙集相比,其不同之处有两点:一为被近似对象由精确集换为模糊集; 二为等价关系推广为模糊等价关系。
对于粒计算的研究一般来说可以从两方面考虑:构造粒和使用粒进行计算。 粒的构造着重于粒的形成、表示和解释;而是用粒的计算则着重于使用粒和粒的 结构进行计算和推理。从另一层面进行展开。算法层面上考虑粒的解释和各种物 理意义,如为什么对象会在同一个粒中,为什么不同的粒之间会存在联系等等。
一般来说,粒的结构可以看做是对论域中元素的划分问题,这是一个复杂的 问题,通常是由提出的目标而定,并且与具体的论域有关。常用的元素划分法有: 属性划分法,投影划分法,结构划分法,以及约束划分法。Pawlak 教授提出的 粗糙集理论中对于论域的划分方法其实就是属性划分法。 2.4信息粒化模型
粗糙集理论虽然在诸多领域取得了不俗的表现,但是在实际应用中,仍然会 碰到很多具体的困难:
(1)数据灾难:在现实生活中,高维数据对于数据挖掘和知识发现领域来 说一直是一个很大的挑战。同样,粗糙集理论也没有解决这个问题,因为粗糙集 理论是基于分类,当数据维数很高的时候,分类的计算量将非常大。
(2)混合数据类型:粗糙集理论主要面对的是量化信息系统,然而在实际 应用中,存在着大量的不同的数据类型,因此数据离散化问题也是目前很多学者 所关心的主要问题之一。
定义1 设 (U , P) 是模糊近似空间, P {P1, P2 ,, Pm} 为论域U 上的模糊等
价关系簇, P /U {Fik 1,2,, m; k 1,2,, ci} 是对论域U 进行模糊划分所得的
模糊等价类,对 A F(U ) ( F(U ) 表示U 上的模糊集构成的集合),用模糊等价
信息粒化的形式框架表示为A:X→G(X)其中A为粒,G是粒的形式表示 框架,X为某空间。目前常见的形式表示框架有集合论、区间分析、模糊集、粗 糙集以及概率粒等,实际上,诸多处理信息粒的方法就组成了一个新的处理信息 粒的聚合体,即粒计算。其中基于粗糙集的粒计算的基本特点有:利用上、下近 似集来定义信息粒;通过粗糙边界域来表示问题的不确定方面;无需概念知识就
粒计算由 T.Y.Lin 与 1997 年提出,短短几年以来,粒计算发展迅猛,许多专 家和学者提出了不同的wk.baidu.com计算的模型和方法。Y.Y.Yao 目前正在试图从各种不同 的粒计算模型中找出共性,然后系统地、形式地研究在一个统一模型下的粒计算 方法。
粒计算的基本思想是在问题求解中使用粒子,粒式元素的群、类或者聚类。 信息粒化就是一个建立信息粒的过程。信息粒中的元素根据不同的分类标准(等 价关系、容差关系、相似关系、异同关系等二元关系)组成了一个对象的集合。 例如在集合论中,信息粒可以被看做是论域中的一个子集,这个子集既可以是模 糊也可以是清晰的。
1.引言 粒度计算(Granular Computing,缩写为GrC)是信息处理的一种新的观念和
计算范式,主要用于处理精确的、模糊的、不确定的、部分真实的和海量的信息。 在1979年,Zadeh首先提出了信息粒度的概念,并且认为模糊集理论在粒度计算 方面具有极大潜力。在1982年,Pawlak提出了粗糙集理论,这实际上时为粒度计 算提供了一个具体实例。在1997年,Zadeh将模糊信息粒化问题扩展为“词计算 理论”;同年,T.Y.Lin正式对“粒度计算”命名,并且提出在邻域系统下的粒 度计算模型,这是对基于划分的粗糙集理论的延伸。随后,大量关于粒度计算的 文献相继发表。在国内,张钹院士和张铃教授提出了商空间理论,王飞跃教授开 发了以词计算为基础的语言动力系统,刘清教授将粒度计算用于医疗诊断专家系 统等。粒度计算的思想是用简单易求、低成本的足够满意的近似解代替精确解。 凡是在分析问题和求解问题中,应用了分组、分类和聚类手段的一切理论和方法 均属于粒度计算的范畴。粒度计算的主要理论模型有:基于模糊集的词计算模型, 粗糙集模型,基于商空间的粒度计算模型及一些粒度的混合模型。粒度计算覆盖 了所有有关粒度的理论、方法、技术和工具的研究,现已成为智能处理领域研究 的热点之一。 2.理论基础 2.1 粗糙集理论面临的主要问题
(3)时空动态时空数据:以往的粗集理论研究的都是静态数据,而动态变 化的数据库是事实存在的,并且在实际生活中占有很大的比例,因此时空动态变 化的数据也是粗糙集理论所面临的一个主要问题。 2.2 粒计算思想无处不在
信息粒在客观世界中无处不在并且粒计算的基本思想已经出现在诸多研究 领域,如图像处理中建立空间粒、信号处理中建立时间粒、系统建模等都是粒计 算的具体表现。粒计算是一种看待客观世界的世界观和方法论,信息粒化旨在建 立基于外部世界的有效的并以用户为中心的概念,同时简化我们对物理世界和虚
拟世界的认识。 人可以在不同程度的粒上来感知、抽象、表示和理解和解决客观世界的问
题。我国商空间理论的研究者张玲、张钹兄弟就提出了人类智能的最本质特征就 是能够从一个粒度跳到另一个粒度上,往返自如,毫无困难。粒计算本质上是分 层次的,人们根据实际问题的需要,将问题分解,从不同层次、不同角度来解决 问题。但是并非粒化的程度越细越好,当需要从整体上把握一个问题时,使用较 粗的粒度将会比细粒度取得更好的效果。例如一位思考全厂生产规划的计划人 员,当他考虑全厂的初步生产计划时,就应该忽略掉工厂的许多细节,而应该以 全局性的思考方式来考虑问题。在实际问题求解中,粒度的划分有时是动态的, 即先进行一次分类,在这个粒度上进行推理与分析,得到一定的性质,问题初步 明朗后,在进一步分类,直至问题的解决。 2.3 粒计算的基本问题
可以确定域。在经典粗糙集理论中,粒化的标准是集合中对象之间的等价关系, 而等价关系又是根据信息表或决策表中属性集合的值判定的。简单来说,粒对应 于粗集中的等价类(基本元素粒)。 3.模糊粗糙集 3.1Dubois模糊粗糙集的定义
Dubois模型起源于Willaeys和Malvache对模糊等价关系与模糊分类的讨论。 与Pawlak粗糙集相比,其不同之处有两点:一为被近似对象由精确集换为模糊集; 二为等价关系推广为模糊等价关系。
对于粒计算的研究一般来说可以从两方面考虑:构造粒和使用粒进行计算。 粒的构造着重于粒的形成、表示和解释;而是用粒的计算则着重于使用粒和粒的 结构进行计算和推理。从另一层面进行展开。算法层面上考虑粒的解释和各种物 理意义,如为什么对象会在同一个粒中,为什么不同的粒之间会存在联系等等。
一般来说,粒的结构可以看做是对论域中元素的划分问题,这是一个复杂的 问题,通常是由提出的目标而定,并且与具体的论域有关。常用的元素划分法有: 属性划分法,投影划分法,结构划分法,以及约束划分法。Pawlak 教授提出的 粗糙集理论中对于论域的划分方法其实就是属性划分法。 2.4信息粒化模型
粗糙集理论虽然在诸多领域取得了不俗的表现,但是在实际应用中,仍然会 碰到很多具体的困难:
(1)数据灾难:在现实生活中,高维数据对于数据挖掘和知识发现领域来 说一直是一个很大的挑战。同样,粗糙集理论也没有解决这个问题,因为粗糙集 理论是基于分类,当数据维数很高的时候,分类的计算量将非常大。
(2)混合数据类型:粗糙集理论主要面对的是量化信息系统,然而在实际 应用中,存在着大量的不同的数据类型,因此数据离散化问题也是目前很多学者 所关心的主要问题之一。
定义1 设 (U , P) 是模糊近似空间, P {P1, P2 ,, Pm} 为论域U 上的模糊等
价关系簇, P /U {Fik 1,2,, m; k 1,2,, ci} 是对论域U 进行模糊划分所得的
模糊等价类,对 A F(U ) ( F(U ) 表示U 上的模糊集构成的集合),用模糊等价
信息粒化的形式框架表示为A:X→G(X)其中A为粒,G是粒的形式表示 框架,X为某空间。目前常见的形式表示框架有集合论、区间分析、模糊集、粗 糙集以及概率粒等,实际上,诸多处理信息粒的方法就组成了一个新的处理信息 粒的聚合体,即粒计算。其中基于粗糙集的粒计算的基本特点有:利用上、下近 似集来定义信息粒;通过粗糙边界域来表示问题的不确定方面;无需概念知识就
粒计算由 T.Y.Lin 与 1997 年提出,短短几年以来,粒计算发展迅猛,许多专 家和学者提出了不同的wk.baidu.com计算的模型和方法。Y.Y.Yao 目前正在试图从各种不同 的粒计算模型中找出共性,然后系统地、形式地研究在一个统一模型下的粒计算 方法。
粒计算的基本思想是在问题求解中使用粒子,粒式元素的群、类或者聚类。 信息粒化就是一个建立信息粒的过程。信息粒中的元素根据不同的分类标准(等 价关系、容差关系、相似关系、异同关系等二元关系)组成了一个对象的集合。 例如在集合论中,信息粒可以被看做是论域中的一个子集,这个子集既可以是模 糊也可以是清晰的。