粗糙集的不确定性度量准则_胡军

合集下载

粗糙集理论

粗糙集理论

粗糙集理论与应用研究综述王国胤1Yiyu Yao2 于洪1,2(1重庆邮电大学计算机科学与技术研究所重庆400065)(2Department of Computer Science, University of Regina, Regina, Canada S4S 0A2){wanggy, yuhong}@, yyao@cs.uregina.ca摘要本文在阐释粗糙集理论基本体系结构的基础上,从多个角度探讨粗糙集模型的研究思路,分析粗糙集理论与模糊集、证据理论、粒计算、形式概念分析、知识空间等其他理论之间的联系,介绍国内外关于粗糙集理论研究的主要方向和发展状况,讨论当前粗糙集理论研究的热点研究领域,以及将来需要重点研究的主要问题。

关键词粗糙集,模糊集,粒计算,形式概念分析,知识空间,智能信息处理A Survey on Rough Set Theory and Its ApplicationWang Guo-Yin1Yao Yi-Yu2 Yu Hong1,21 Institute of Computer Science and Technology, Chongqing University of Posts and Telecommunications, Chongqing, 4000652 Department of Computer Science, University of Regina, Regina, Saskatchewan, Canada, S4S 0A2Abstract This paper introduces the basic ideas and framework of rough set theory and the different views of knowledge representation in rough set theory, and then discusses the relations between the rough set theory and the other theories, such as fuzzy set, evidence theory, granular computing, formal concept analyzing, knowledge space, etc. Furthermore, the paper reviews the recent studies for this theory and a survey on its applications is also given. The future development trend of rough set theory is also discussed.Keywords rough set, fuzzy set, granular computing, formal concept analyzing, knowledge space, intelligent information processing1 引言智能信息处理是当前信息科学理论和应用研究中的一个热点领域。

粗糙集

粗糙集


对于上表来说,U中有四个对象(概念),而现 在条件集合中只有一个属性,对于U1和U2来说, 它们的p不同所以可以通过p来区分,即u1,u2在p 下可区分;而U2和U3虽然是不同的对象但是在P 下却是相同的,即在p下不可区分,就成为不可 区分
粗糙集:
一个集合若恰好等于基本集的任意并集称为一个清晰 (crisp)集(精确集),否则称为粗糙(rough)集(不 精确集)。 解释:都可区分的是清晰集,有不可区分的对象为粗糙 集 主要特点:以不完全信息或知识去处理一些不分明现象的 能力,或依据观察、度量到的某些不精确的结果而进行分 类数据的能力. 粗糙集体现了集合中元素间的不可区分性. 主要优势:它不需要提供问题所需处理的数据集合之外的 任何先验知识,而且与处理其它不确定性问题的理论有很 强的互补性.
粗糙集理论所处理的问题
•不确定或不精确知识的表达; •经验学习并从经验中获取知识; •不一致信息的分析; •根据不确定,不完整的知识进行推理; •在保留信息的前提下进行数据化简; •近似模式分类; •识别并评估数据之间的依赖关系
三、粗糙集的应用
粗糙集理论在许多领域得到了应用: ①临床医疗诊断;
②电力系统和其他工业过程故障诊断;
3. 如果P中的任何一条属性都是不 可简约的,那么就称P是独立的 解释:P是独立的说明P中的任何一个属性都是必 不可少的,它独立的表达一个系统分类的特征。
属性约简的算法分析:
初始状态:所有数据已存入数据库(以下为模拟数据)
u 1 2 3 4 5 6
a 1 1 0 1 1 2
b 0 0 0 1 1 1
集合O 的下逼近(即正区) 为 I 3 (O ) = PO S (O ) = {刘保,赵 凯} 集合O 的负区为 N EG (O ) = {李得} 集合O 的边界区为 BND (O ) = {王治, 马丽} 集合O 的上逼近为 I 3 (O ) = PO S (O ) + BND (O ) = {刘保,赵凯,王治,马 丽} 根据表1, 可以归纳出下面几条规则, 揭示了教育程度与 是否能找到好工作之间的关 RUL E 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作) RUL E 2: IF (教育程度= 小学) THEN (找不到好工作) RUL E 3: IF (教育程度= 高中) THEN (可能找到好工作)

粗糙集理论RS

粗糙集理论RS

RS理论一、定义:粗糙集理论,是继概率论、模糊集、证据理论之后的又一个处理不确定性的数学工具。

它是当前国际上人工智能理论及其应用领域中的研究热点之一。

在自然科学、社会科学和工程技术的很多领域中,都不同程度地涉及到对不确定因素和对不完备(imperfect) 信息的处理。

从实际系统中采集到的数据常常包含着噪声,不够精确甚至不完整,对这些信息进行合适地处理,常常有助于相关实际系统问题的解决。

二、对比的理论:模糊集和基于概率方法的证据理论是处理不确定信息的两种方法,已应用于一些实际领域。

但这些方法有时需要一些数据的附加信息或先验知识,如模糊隶属函数、基本概率指派函数和有关统计概率分布等,而这些信息有时并不容易得到。

概率与统计、证据理论:理论上还难以令人信服,不能处理模糊和不完整的数据。

模糊集合理论:能处理模糊类数据,但要提供隶属函数(先验知识)。

RS理论与其他处理不确定和不精确问题理论的最显著的区别是:它无需提供问题所需处理的数据集合之外的任何先验信息,所以对问题的不确定性的描述或处理可以说是比较客观的。

由于这个理论未能包含处理不精确或不确定原始数据的机制,所以这个理论与概率论、模糊数学和证据理论等其他处理不确定或不精确问题的理论有很强的互补性。

三、不足:粗糙集理论还处在继续发展之中,尚有一些理论上的问题需要解决,诸如用于不精确推理的粗糙逻辑(Rough logic) 方法,粗糙集理论与非标准分析(Nonstandard analysis) 和非参数化统计(Nonparametric statistics)等之间的关系等。

四、由来:1982年波兰学者Z. Paw lak 提出了粗糙集理论——它是一种刻画不完整性和不确定性的数学工具,能有效地分析不精确,不一致(inconsistent)、不完整(incomplete) 等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。

粗糙集理论介绍

粗糙集理论介绍
粗糙集理论介绍
问题的提出:知识的含糊性
术语的模糊性,如高矮 数据的不确定性,如噪声 知识自身的不确定性,如规则的前后件间的 依赖关系不完全可靠 不完备性,数据缺失
由此,提出了包括
概率与统计、证据理论:理论上还难以令人信服,
不能处理模糊和不完整的数据
模糊集合理论:能处理模糊类数据,但要提供隶属
函数(先验知识)
so
例2: (表2)
R1(颜色) R2(形状) R3(体积) class
X1

圆形

1
X2

方形

1
X3

三角形

1
X4

三角形

1
X5

圆形

2
X6

方形

2
X7

三角形

2
X8

三角形

2
等价类IND(R1)={{x1,x3,x7}, {x2,x4}, {x5,x6,x8}}
X={X1,X2,X3,X4}
Step2. 针对各个属性下的初等集合寻找下近似和上近似。
以“头疼+肌肉痛+体温”为例,设集合X为患流感的 人的集合,I为3个属性构成的一个等效关系: {p1},{p2,p5},{p3},{p4},{p6}, 则
X={P1,P2,P3,P6} I={{p1},{p2,p5},{p3},{p4},{p6}}
粗糙集在数据挖掘中的应用 基于粗糙集的数据约简
返回
1. 粗糙集在数据挖掘中的应用
粗糙集对不精确概念的描述是通过上、下近似这两 个精确概念来表示的。
粗糙集理论的的数学基础:假定所研 究的每一个对象都涉及到一些信息(数据、 知识),如果对象由相同的信息描述,那 么它们就是相似的或不可区分的。

粗糙集理论及其应用研究

粗糙集理论及其应用研究

粗糙集理论及其应用研究一、粗糙集理论概述粗糙集是一种用于解决不确定性问题的数学工具。

粗糙集理论中知识被理解为对事物进行区分的能力,在形式上表现为对论域的划分,因而通过论域上的等价关系表示。

粗糙集通过一对上、下近似算子来刻画事物,它不需要数据以外的任何先验知识,因此具有很高的客观性。

目前,粗糙集被广泛用于决策分析、机器学习、数据挖掘等领域[1~6]。

二、粗糙集中的基本概念[7]定义1 论域、概念。

设U是所需研究的对象组成的非空有限集合,称为一个论域,即论域U。

论域U的任意一个子集XU,称为论域U的一个概念。

论域U中任意一个子集簇称为关于U的知识。

定义2 知识库。

给定一个论域U和U上的一簇等价关系S,称二元组K=(U,S)是关于论域U的知识库或近似空间。

定义3 不可分辨关系。

给定一个论域U和U上的一簇等价关系S,若PS,且P≠?,则∩P仍然是论域U上的一个等价关系,称为P上的不可分辨关系,记做IND(P)。

称划分U/IND(P)为知识库K=(U,S)中关于论域U的P-基本知识。

定义4 上近似、下近似。

设有知识库K=(U,S)。

其中U为论域,S为U 上的一簇等价关系。

对于X∈U和论域U上的一个等价关系R∈IND(K),则X关于R的下近似和上近似分别为:下近似R(X)=∪{Y∈U/R|YX}上近似R(X)=∪{Y∈U/R|Y∩X=?}集合的上近似和下近似是粗糙集中最核心的概念,粗糙集的数字特征以及拓扑特征都是由它们来描述和刻画的。

当R=(X)时,称X是R-精确集;当R(X)≠(X)时,称X是R-粗糙集,即X是粗糙集。

三、粗糙集理论的优势随着人们对粗糙集理论的不断研究,它的应用领域在不断扩大,粗糙集理论的优势在于:1)他不需要专家的经验知识,而仅利用现实实例数据本身提供的信息;2)能搜索数据的最小集合,能从实例数据中获取易于证实的规则知识,最后,它同时允许使用定性和定量的数据。

近年来,粗糙集理论应用到了许多领域。

粗糙集理论及其应用

粗糙集理论及其应用
特点:(1)集合的边界没有宽度; (2)每个元素要么属于S,要么不属于S,具有确定性。
x1
x2
S
粗糙集的基本理论介绍
(2)“含糊”(Vague)问题的提出 1904年谓词逻辑创始人G. Frege (弗 雷格)首次提出将含糊性归结到 “边界线 区域” (Boundary region): 在论域上存在一些个体,它既不能被 分类到某一个子集上,也不能被分类到该 子集的补集上。
– 使用等价关系集R对离散表示的空间U进行划 分,知识就是R对U划分的结果,记为U|R。
• “知识库”的形式化定义
– 等价关系集R中所有可能的关系对U的划分 – 表示为:K = (U, R)
粗糙集理论的基本概念
• “信息系统”的形式化定义 – S = {U, A, V, f}, – U:对象的有限集 – A:属性的有限集,A=CD,C是条件属性子集, D是决策属性子集 – V: V pAVP , Vp是属性P的域 – f:U × A → V是总函数,使得 对每个xi U, q A, 有f(xi, q) Vq • 一个关系数据库可看作一个信息系统,其“列”为 “属性”,“行”为“对象”。
主要内容
• • • • • • • • 1.粗糙集发展历程 2.粗糙集的基本理论介绍 3.粗糙集对集合理论的扩展 4.粗糙集对数理逻辑的拓展 5.粗糙集的不确定性度量方法研究 6.粗糙集的属性约简算法研究 7.粗糙集的扩展模型 8.粗糙集的典型应用
粗糙集的基本理论介绍
1980年,《数学:确 定性的丧失》
CRSSC2005, Anshan RSKT2008, Chengdu CRSSC2001, Chongqing CRSSC2003, RSFDGrC2003, Chongqing RSKT2006, Chongqing IFKT2008, Chongqing CRSSC2010, Chongqing

粗糙集理论与模糊集理论的异同及结合应用

粗糙集理论与模糊集理论的异同及结合应用

粗糙集理论与模糊集理论的异同及结合应用引言:在现实生活和学术研究中,我们经常面临着信息不完备、模糊和不确定的情况。

为了更好地处理这些问题,粗糙集理论和模糊集理论应运而生。

本文将探讨粗糙集理论和模糊集理论的异同,并探讨它们如何结合应用于实际问题中。

一、粗糙集理论粗糙集理论是由波兰学者Pawlak于1982年提出的一种数学工具,用于处理信息不完备和不确定的问题。

粗糙集理论的核心思想是通过分析决策属性和条件属性之间的关系,进行信息的粗糙度度量和信息的约简。

粗糙集理论的主要特点是能够处理不完备和不确定的信息,具有较强的可解释性和可操作性。

二、模糊集理论模糊集理论是由日本学者石原和田原于1973年提出的,用于处理模糊和不确定的问题。

模糊集理论的核心思想是引入隶属度函数来描述事物的模糊性,通过模糊集的运算和推理,对模糊信息进行处理和分析。

模糊集理论的主要特点是能够处理模糊和不确定的信息,具有较强的灵活性和适应性。

三、粗糙集理论与模糊集理论的异同1. 异同之处:(1)描述方式:粗糙集理论通过信息的分区和约简来描述信息的粗糙度,而模糊集理论通过隶属度函数来描述事物的模糊性。

(2)处理方式:粗糙集理论通过分析属性之间的关系来进行信息的约简,而模糊集理论通过模糊集的运算和推理来进行信息的处理和分析。

(3)可解释性:粗糙集理论具有较强的可解释性,能够直观地描述信息的粗糙度,而模糊集理论具有较强的灵活性,能够处理更加复杂的模糊信息。

2. 结合应用:粗糙集理论和模糊集理论在实际问题中可以相互结合,以充分发挥各自的优势。

例如,在医学诊断中,可以使用模糊集理论来描述病情的模糊性,同时使用粗糙集理论来进行信息的约简,从而提高诊断的准确性和可解释性。

在金融风险评估中,可以使用粗糙集理论来处理不完备的信息,同时使用模糊集理论来描述风险的模糊性,从而更好地评估风险的大小和影响。

结论:粗糙集理论和模糊集理论是两种有效的数学工具,用于处理信息不完备、模糊和不确定的问题。

粗糙集理论的基本概念与原理

粗糙集理论的基本概念与原理

粗糙集理论的基本概念与原理粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它的提出源于20世纪80年代初期的波兰学者Zdzisław Pawlak。

粗糙集理论的核心思想是通过将数据划分成不同的等价类,来描述和处理不完全和不确知的信息。

本文将介绍粗糙集理论的基本概念与原理。

1. 粗糙集的定义与等价关系粗糙集是指将一个数据集划分成若干个等价类,其中每个等价类称为一个粗糙集。

在粗糙集理论中,等价关系是一个重要的概念。

等价关系是指具有自反性、对称性和传递性的关系。

在粗糙集理论中,等价关系用来描述数据中的相似性和差异性。

2. 上近似集与下近似集上近似集是指在一个粗糙集中,包含了所有与该粗糙集中的元素相似的元素。

下近似集是指在一个粗糙集中,包含了所有与该粗糙集中的元素不相似的元素。

上近似集和下近似集是粗糙集理论中的两个重要概念,它们用来描述数据的粗糙性和不确定性。

3. 约简与精确度约简是粗糙集理论中的一个重要操作,它的目的是通过删除一些不必要的属性或条件,从而减少数据集的复杂性,提高数据的处理效率。

约简可以通过删除一些不重要或不相关的属性来实现。

精确度是用来评估数据集的质量和可靠性的指标,粗糙集理论通过约简来提高数据集的精确度。

4. 粗糙集与模糊集粗糙集理论与模糊集理论有一些相似之处,但也存在一些差异。

模糊集理论是一种用来处理模糊和不确定性问题的数学工具,它通过给每个元素赋予一个隶属度来描述元素的模糊性。

而粗糙集理论是一种用来处理不完全和不确知信息的数学工具,它通过将数据划分成不同的等价类来描述数据的粗糙性。

5. 粗糙集的应用领域粗糙集理论在许多领域中都有广泛的应用。

在数据挖掘领域,粗糙集理论可以用来处理不完全和不确定的数据。

在人工智能领域,粗糙集理论可以用来处理模糊和不确定性问题。

在决策支持系统领域,粗糙集理论可以用来辅助决策过程。

在模式识别领域,粗糙集理论可以用来提取和分类模式。

总结:粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它通过将数据划分成不同的等价类来描述和处理不完全和不确知的信息。

粗糙集理论及其应用研究

粗糙集理论及其应用研究

粗糙集理论的核心内容
知识的约简与核
知识的约简: 通过删除不重 要的知识,保 留关键信息
核的概念:核 是知识的最小 表示,包含所 有必要信息
核的性质:核 具有独立性、 完备性和最小 性
核的求取方法: 基于信息熵、 信息增益等方 法进行求取
0
0
0
0
1
2
3
4
决策表的简化
决策表:用于描述决策问题的表格 简化目标:减少决策表的规模,提高决策效率 简化方法:合并条件属性,删除冗余属性 简化效果:提高决策表的可读性和可理解性,降低决策复杂度
粗糙集理论在聚类分析中的应用:利用粗糙集理论处理不确定和不完整的数据,提高聚类 分析的准确性和效率。
聚类分析在数据挖掘中的应用:可以帮助发现数据中的模式和趋势,为决策提供支持。
粗糙集理论在其他领域的应用
决策支持系统
粗糙集理论可以帮助决策者 处理不确定性和模糊性
粗糙集理论在决策支持系统 中的应用
粗糙集理论可以提高决策支 持系统的准确性和效率
粗糙集理论在决策支持系统 中的实际应用案例分析
智能控制
粗糙集理论在模糊控制中的 应用
粗糙集理论在智能控制中的 应用
粗糙集理论在神经网络控制 中的应用
粗糙集理论在自适应控制中 的应用
模式识别
粗糙集理论在模式 识别中的应用
粗糙集理论在图像 识别中的应用
粗糙集理论在语音 识别中的应用
粗糙集理论在生物 信息学中的应用
添加标题
添加标题
ห้องสมุดไป่ตู้添加标题
添加标题
机器学习
粗糙集理论在机器学习中的应用 粗糙集理论在数据挖掘中的应用 粗糙集理论在模式识别中的应用 粗糙集理论在自然语言处理中的应用

经典粗糙集理论

经典粗糙集理论
粗糙集理论能够处理不确定性和模糊性,而神经网络则能够通过学习过 程找到数据中的模式。将粗糙集与神经网络结合,可以利用粗糙集对数 据的不确定性进行建模,并通过神经网络进行分类或预测。
粗糙集可以用于提取数据中的决策规则,这些规则可以作为神经网络的 训练样本。通过训练,神经网络可以学习到决策规则,并用于分类或预 测。
边界区域
近似集合中的不确定性区 域,即既不属于正域也不 属于负域的元素集合。
粗糙集的度量
精确度
描述了集合中元素被近似集合 包含的程度,即属于近似集合
的元素比例。
覆盖度
描述了近似集合能够覆盖的元 素数量,即近似集合的大小。
粗糙度
描述了集合被近似程度,是精 确度和覆盖度的综合反映。
知识的不确定性
描述了知识表达系统中属性值 的不确定性程度,与粗糙度相
经典粗糙集理论
目录
• 粗糙集理论概述 • 粗糙集的基本概念 • 粗糙集的运算与性质 • 粗糙集的决策分析 • 粗糙集与其他方法的结合 • 经典粗糙集理论案例研究
01 粗糙集理论概述
定义与特点
定义
粗糙集理论是一种处理不确定性和模 糊性的数学工具,通过集合近似的方 式描述知识的不完全性和不确定性。
粗糙集理论中的属性约简可以用于简化神经网络的输入特征,降低输入 维度,提高分类或预测的准确率。
粗糙集与遗传算法
01
遗传算法是一种全局优化算法,能够通过模拟自然界的进化过程来寻找最优解 。将粗糙集与遗传算法结合,可以利用粗糙集对数据的分类能力,结合遗传算 法的全局搜索能力,寻找最优的分类规则或决策规则。
02
粗糙集可以用于生成初始的分类规则或决策规则,然后利用遗传算法对这些规 则进行优化,通过选择、交叉、变异等操作,寻找最优的规则组合。

粗糙集理论及其应用综述

粗糙集理论及其应用综述

粗糙集理论及其应用综述3韩祯祥 张 琦 文福拴(浙江大学电机系・杭州,310027) 摘要:粗糙集理论是一种较新的软计算方法,可以有效地分析和处理不完备信息.该理论近年日益受到国际学术届的重视,已经在模式识别、机器学习、决策支持、过程控制、预测建模等许多科学与工程领域得到成功的应用.本文介绍了粗糙集理论的基本概念,对其在各领域的应用情况进行了综述.关键词:粗糙集;不确定性;数据分析;软计算;粗糙控制A Survey on R ough Set Theory and Its ApplicationHan Zhenxiang , Zhang Qi and Wen Fushuan(Department of E lectrical Engineering ,Zhejiang University ・Hangzhou ,310027,P.R.China )Abstract :R ough set theory is a relatively new s oft com putingtool to deal with vagueness and uncertainty.I t has received much attention of the researchers around the w orld.R ough set theory has been applied to many areas success fully including pattern recognition ,machine learning ,decision support ,process control and predictive m odeling.This paper introduces the basic concepts of rough set.A survey on its applicatoins is als o given.K ey w ords :rough set ;uncertainty ;data analysis ;s oft com puting ;rough control1 引言(Introduction )粗糙集(R ougn Set ,RS )理论是一种刻划不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[1].RS 理论是由波兰学者Pawlak Z 在1982年[2]提出的.1991年Pawlak Z 出版了专著[3],系统全面地阐述了RS 理论,奠定了严密的数学基础.该书与1992年出版的RS 理论应用专集[4]较好地总结了这一时期RS 理论与实践的研究成果,促进了它的进一步发展,现已成为学习和应用RS 理论的重要文献.从1992年至今,每年都召开以RS 为主题的国际会议,推动了RS 理论的拓展和应用.国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家.目前RS 理论已成为人工智能领域中一个较新的学术热点,引起了越来越多的科研人员的关注.2 粗糙集理论的基本概念(Basic concepts of rough settheory )2.1 知识与不可分辨关系(K nowledge and indiscernibility rela 2tion )在RS 理论中,“知识”被认为一种将现实或抽象的对象进行分类的能力[3].假定我们具有关于论域的某种知识,并使用属性(attribute )及其值(value )来描述论域中的对象.例如:空间物体集合U 具有“颜色”、“形状”这两种属性,“颜色”的属性值取为红、黄、绿,“形状”的属性值取为方、圆、三角形.从离散数学的观点看,“颜色”、“形状”构成了U 上的一族等效关系(equivalent relation ).U 中的物体,按照“颜色”这一等效关系,可以划分为“红色的物体”、“黄色的物体”、“绿色的物体”等集合;按照“形状”这一等效关系,可以划分为“方的物体”、“圆的物体”、“三角形的物体”等集合;按照“颜色+形状”这一合成等效关系,又可以划分为“红色的圆物体”、“黄色的方物体”、“绿色的三角形物体”…等集合.如果两个物体同属于“红色的圆物体”这一集合,它们之间是不可分辨关系(indiscernibility relation ),因为描述它们的属性都是“红”和“圆”.不可分辨关系的概念是RS 理论的基石,它揭示出论域知识的颗粒状结构.2.2 粗糙集合的下逼近、上逼近、边界区和粗糙隶属函数(Lower and upper approximation of rough set ,boundary region and rough membership function )给定一个有限的非空集合U 称为论域,R 为U 上的一族等效关系.R 将U 划分为互不相交的基本等效类,二元对K=(U ,R )构成一个近似空间(approximation space ).设X 为U的一个子集,a 为U 中的一个对象,[a ]R 表示所有与a 不可分辨的对象所组成的集合,即由a 决定的等效类.当集合X 能表示成基本等效类组成的并集时,则称集合X 是可以精确定义的;否则,集合X 只能通过逼近的方式来刻划.集合X 关于R 的下逼近(lower approximation )定义为:R 3(X )={a ∈U :[a ]R ΑX}.(1)R 3(X )实际上是由那些根据已有知识判断肯定属于X 的对象所组成的最大的集合,也称为X 的正区(positive region ),记 3国家自然科学基金资助项目(59777011).本文于1997年9月3日收到.1998年11月18日收到修改稿.第16卷第2期1999年4月控制理论与应用CONTROL THEORY AND APPLICATIONS Vol.16,No.2Apr.,1999作POS (X ).由根据已有知识判断肯定不属于X 的对象组成的集合称为X 的负区(negative region ).记作NEG (X ).集合X 关于R 的上逼近(upper approximation )定义为R 3(X )={a∈U :[a ]R ∩X ≠ }.(2)R 3(X )是由所有与X 相交非空的等效类[a ]R 的并集,是那些可能属于X 的对象组成的最小集合.显然,R 3(X )+NEG (X )=论域U.集合X 的边界区(boundary region )定义为:BN (X )=R 3(X )-R 3(X ).(3)BN (X )为集合X 的上逼近与下逼近之差.如果BN (X )是空集,则称X 关于R 是清晰的(crisp );反之如果BN (X )不是空集,则称集合X 为关于R 的粗糙集(rough set ).图1为粗糙集概念的示意图.下逼近、上逼近及边界区等概念刻划了一个不能精确定义的集合的逼近特性.逼近精度定义为αR (X )=|R 3(X )||R 3(X )|.(4)式中|R 3(X )|表示集合R 3(X )的基数或势(cardinality ),对有限集合来说表示集合中所包含元素的个数.显然,0≤αR (X )≤1,如果αR (X )=1,则称集合X 相对于R 是清晰的;αR (X )<1,则称集合X 相对于R 是粗糙的.αR (X )可认为是在等效关系R 下逼近集合X 的精度.RS 理论中定义了粗糙隶属函数(rough membership func 2tion ).通过使用不可分辨关系,定义元素a 对集合X 的粗糙隶属函数如下μRX (a )=|X ∩[a ]R ||[a ]R |.(5)显然0≤μRX ≤1,粗糙隶属函数也可以用来定义集合X 的上、下逼近和边界区.现举例说明粗糙集的概念.论域U 及等效关系R ={R 1,R 2}采用如下定义:U ={x 1,x 2,x 3,x 4,x 5,x 6,x 7,x 8,x 9,x 10},U/R 1={{x 1,x 2,x 3,x 4},{x 5,x 6,x 7,x 8,x 9,x 10}},U/R 2={{x 1,x 2,x 3},{x 4,x 5,x 6,x 7},{x 8,x 9,x 10}},U/R ={{x 2,x 3},{x 4},{x 5,x 6,x 7},{x 8,x 9,x 10}}.则关于集合X ={x 1,x 2,x 3,x 4,x 5}的逼近为POS (X )={x 4},NEG (X )={x 8,x 9,x 10},BN (X )={x 1,x 2,x 3,x 5,x 6,x 7}.{x 4}是集合X 的正区,因为x 4肯定属于X ;{x 8,x 9,x 10}肯定不属于X ,因此为X 的负区;{x 1,x 2,x 3,x 5,x 6,x 7}是否属于X 在等效关系R 下无法确定,构成了X 的边界区.2.3 决策表、约简与核(Decision table ,reduct and core )RS 理论中应用决策表来描述论域中对象.它是一张二维表格,每一行描述一个对象,每一列描述对象的一种属性.属性分为条件属性和决策属性,论域中的对象根据条件属性的不同,被划分到具有不同决策属性的决策类.表1为一张决策表,论域U 有5个对象,编号1~5,{a ,b ,c}是条件属性集,d 为决策属性.对于分类来说,并非所有的条件属性都是必要的,有些是多余的,去除这些属性不会影响原来的分类效果.约简(reduct )定义为不含多余属性并保证分类正确的最小条件属性集.一个决策表可能同时存在几个约简,这些约简的交集定义为决策表的核(core ),核中的属性是影响分类的重要属性.表1化简后得到了两个约简:{a ,c}和{b ,c},见表2和表3.它们维持了与原有条件属性集{a ,b ,c}相同的分类能力.{c}是核,表明c 是影响分类的重要属性.表1 决策表T able 1 Decision tableUabcd110212210232123412215123表2 约简{a ,c}T able 2 Reduct {a ,c}Uacd112122023223513表3 约简{b ,c}T able 3 Reduct {b ,c}Ubcd10312102312342215203 从另一个角度看,决策表中每一个对象都蕴含着一条分类规则,决策表实际上也是一组逻辑规则的集合.例如表1中的对象1蕴含的规则是a 1b 0c 2]d 1.化简决策表的过程也就是抽取分类规则的过程.表2中对象4在去掉属性b 后154 控制理论与应用16卷 与对象1蕴含相同的分类规则,为避免重复而被除去.约简中的规则还可进一步化简,删除那些与分类无关的次要属性.表3第一行中的“3”表示属性c的取值不重要,即只要b =0,d一定为1(b0]d1).“约简”和“核”这两个概念很重要,是RS方法的精华. RS理论提供了搜索约简和核的方法.计算约简的复杂性随着决策表的增大呈指数增长,是一个典型的NP完全问题,当然实际中没有必要求出所有的约简.引入启发式的搜索方法如遗传算法[10]有助于找到较优的约简,即所含条件属性最少的约简.3 粗糙集理论的特点(Features of rough set theory)1)RS不需要先验知识.模糊集和概率统计方法是处理不确定信息的常用方法,但这些方法需要一些数据的附加信息或先验知识,如模糊隶属函数和概率分布等,这些信息有时并不容易得到.RS分析方法仅利用数据本身提供的信息,无须任何先验知识.2)RS是一个强大的数据分析工具.它能表达和处理不完备信息;能在保留关键信息的前提下对数据进行化简并求得知识的最小表达;能识别并评估数据之间的依赖关系,揭示出概念简单的模式;能从经验数据中获取易于证实的规则知识,特别适于智能控制.3)RS与模糊集分别刻划了不完备信息的两个方面[5]: RS以不可分辨关系为基础,侧重分类,模糊集基于元素对集合隶属程度的不同,强调集合本身的含混性(vagueness).从RS的观点看,粗糙集合不能清晰定义的原因是缺乏足够的论域知识,但可以用一对清晰集合逼近.有关RS和模糊集内在联系的阐述及模糊粗糙集(fuzzy2rough set)的概念,请参见文[6~8].RS和证据理论也有一些相互交叠之处[9],在实际应用中可以相互补充.4 粗糙集理论的应用(Applications of rough set theo2 ry)RS理论的生命力在于它具有较强的实用性,从诞生到现在虽然只有十几年的时间,但已经在许多领域取得了令人鼓舞的成果.1)股票数据分析.文[11]应用RS方法分析了十年间股票的历史数据,研究了股票价格与经济指数之间的依赖关系,获得的预测规则得到了华尔街证券交易专家的认可.2)模式识别.文[12]应用RS方法研究了手写字符识别问题,提取出了特征属性.3)地震预报.文[13]研究了地震前的地质和气象数据与里氏地震级别的依赖关系.4)冲突分析.文[14]应用RS方法建立了反映以色列、巴勒斯坦、约旦、埃及、叙利亚和沙特阿拉伯等六国关于中东和平问题各自立场的谈判模型.5)从数据库中知识发现(knowledge discovery in database, K DD)[15,16].K DD又称数据发掘(data mining),是当前人工智能和数据库技术交叉学科的研究热点之一.RS方法现已成为K DD的一种重要方法,其导出的知识精练且更便于存储和使用.6)粗糙控制(rough control)[17~23].RS根据观测数据获得控制策略的方法被称为从范例中学习(learning from exam2 ples),属于智能控制的范畴.基本步骤是:把控制过程中的一些有代表性的状态以及操作人员在这些状态下所采取的控制策略都记录下来,形成决策表,然后对其分析化简,总结出控制规则[17,18].形式为:IF C ondition=N满足THE N采取De2 cision=M.RS方法是一类符号化分析方法,需要将连续的控制变量离散化,为此Pawlak Z提出了粗糙函数(rough func2 tion)的概念[19],为粗糙控制打下了理论基础.文[20,21]应用粗糙控制研究了“小车—倒立摆系统”这一经典控制问题,取得了较好的结果.在过程控制领域,文[22]应用RS方法成功地提取出了水泥窑炉的控制规则.粗糙控制的优点是简单迅速、实现容易,不需要象Fuzzy控制那样进行模糊化和去模糊化.因此在特别要求控制器结构与算法简单的场合,采取粗糙控制较为合适.另外,由于控制算法完全来自观测数据本身,其决策和推理过程可以很容易被检验和证实.一种新的有吸引力的控制策略“模糊2粗糙控制(fuzzy2rough control)”正悄然兴起,其主要思路是利用RS获取模糊控制规则.7)医疗诊断.RS方法根据以往的病例归纳出诊断规则,用来指导新的病例.现有的人工预测早产的准确率只有17%~38%,应用粗糙集理论则可提高到68%~90%[1].8)专家系统(ES).RS抽取规则的特点,为构造ES知识库提供了一条崭新的途径[24].9)人工神经元网络(ANN).训练时间过于漫长的固有缺点是制约ANN实用化的因素之一.文[25]应用RS化简神经网络训练样本数据集,在保留重要信息的前提下消除了多余的数据,使训练速度提高了4177倍,获得了较好的效果.文[26,27]将RS与ANN结合起来,充分利用RS处理不确定性的特长以增强ANN的信息处理能力.10)决策分析[28~30].RS的决策规则是在分析以往经验数据的基础上得到的.RS允许决策对象中存在一些不太明确、不太完整的属性,弥补了常规决策方法的不足.希腊工业发展银行ETE VA应用RS理论协助制订信贷政策,是RS多准测决策方法的一个成功范例.RS理论的应用领域还包括:近似推理[31,32]、软件工程数据分析[33]、图象处理[34]、材料科学中的晶体结构分析[35]、预测建模[36,37]、结构建模[38]、投票分析[39]、电力系统[40,42]等. RS在我国的研究刚刚起步,有关文献还不多[43~44].5 结束语(C onclusion)虽然RS至今只有十几年的发展历史,但取得的研究成果是令人瞩目的.它是一种较有前途的软计算方法,为处理不确定性信息提供了有力的分析手段[45].我们相信RS具有广阔的发展空间,今后会在更多的实际领域中发挥作用.致谢 波兰华沙工业大学计算机科学研究所(Institute of C om puter Science,Warsaw University of T echnology)的Zdzislaw Pawlak教授和Bozena Skalska博士赠送了部分研究报告,在此向他们表示感谢. 1期粗糙集理论及其应用综述155参考文献(References)1 Pawlak Z et al.R ough sets.C ommunications of AC M,1995,38(11):89 -952 Pawlak Z.R ough sets.International Journal of In formation and C om puter Science,1982,(11):341-3563 Pawlak Z.R ough set-theoretical aspects of reas oning about data.D or2 drecht:K luwer Academ ic Publishers,19914 S lowinski R.Intelligent decision support-handbook of applications and advances of the rough sets theory.D ordrecht:K luwer Academ ic Publish2 ers,19925 Pawlak Z.Vagueness and uncertainty-a rough set perspective.C om puta2 tional Intelligence,1995,11(2):227-2326 W ygralak M.R ough sets and fuzzy sets-s ome remarks on interrelations.Fuzzy Sets and Systems,1989,29(3):241-2437 Nanda S et al.Fuzzy rough sets.Fuzzy Sets and Systems,1992,45(2): 157-1608 Banerjee M and Pal S K.R oughness of a fuzzy set.In formation Sciences, 1996,93(3,4):235-2469 Skowton A et al.From rough set theory to evidence theory.Advances in the Dem pster Shafer Theory of Evidence.New Y ork:John W iley&S ons Inc.,1994,193-23610 Jakub W.Finding m inimal reducts using genetic alg orithm.Institute ofC om puter Science Reports,W arsaw University of T echnology,W arsaw,199511 G olan R and Z iarko W.M ethodology for stock market analysis utilizing rough set theory.Proc.of IEEE/IAFE C on ference on C om putational In2 telligence for Financial Engineering,New Jersey,1995,32-4012 Nejman D.A rough set based method of handwritten numerals classifica2 tion.Institutc of C om puter Science Reports,W arsaw University of T ech2 nology,W arsaw,199413 T eghem J et e of rough sets method to draw prem onitory factors for earthquakes by em phasizing gas geochem istry.In:Intelligent Decision Support-Handbook of applications and Advances of the R ough Sets Theory.D ordrecht:K luwer Academ ic Publishers,1992,165-17914 Deja R.C on flict m odel with neg otiations.In:Institute of C om puter Sci2 ence Reports.W arsaw University of T echnlolgy,W arsaw,199515 Hu X iaohua et al.M ining knowledge rules from databases-a rough set approach.Proc.of IEEE International C on ference on Data Engineering, Los Alam itos,1996,96-10516 Tsum oto Sh et al.Extraction of domain knowledge from databases based on rough set theory.IEEE International C on ference on Fuzzy Systems, New Jersey,1996,748-75417 S ienkiewicz J.R ough set and rough function approaches to the control al2g orithm reconstruction.Institute of C om puter Science Reports,W arsaw U2niversity of T echnology,W arsaw,199618 Mrozek A et al.M ethodology of rough controller synthesis.Proc.of IEEE International C on ference on Fuzzy Systems,New Jersey,1996,1135-113919 Pawlak Z.R ough sets,rough relations and rough functions.Fundamenta In formaticae,1996,27(2,3):103-10820 Plonka L and Mrozek A.Rule2based stabilization of the inverted pendu2lum.C om putational Intelligence,1995,11(2):348-35621 C z ogala E et al.Idea of a rough fuzzy controller and its application to the stabilization of a pendulum2car system.Fuzzy Sets and systems,1995,72(1):6127322 Mrozek A.R ough sets and dependency analysis am ong attributes in com2 puter im plementations of expert’s in ference m odels.International Journal of M an2M achine S tudies,1989,30(4):457-47323 Arima M et al.Fuzzy logic and rough sets controller for HVAC systems.Proc.of IEEE WESCANEX C ommunications,P ower,and C om puting, New Y ork,1995,133-13824 Tsum oto S et al.Automated discovery of medical expert system rules from clinical databases based on rough sets.Proc.of Second InternationalC on f.on K nowledge Discovery and Data M ining,US A,1996,63-7225 Jelonek J et al.R ough set reduction of attributes and their domains for neural netw orks.C om putational Intelligence,1995,11(2):339-34726 Peng C et al.Multi2valued neural netw ork and the knowledge acquisition method by the rough sets for ambiguous recognition problem.Proc.of the IEEE International C on ference on Systems,M an and Cybernetics,Bei2 jing,1996,736-74027 Y asdi R.C ombining rough sets learning and neural learning2method to deal with uncertain and im precise in formation.Neurocom puting,1995,7(1):61-8428 S lowinski R.R ough set approach to decision analysis.AI Expert,M arch 1995,19-2529 Pawlak Z.R ough set approach to knowledge2based decision support.In2 stitute of C om puter Science Reports,W arsaw University of T echnology, W arsaw,199530 S lowinski R et al.R ough set s orting of firms according to bankruptcy risk.In:Applying Multiple Criteria aid for Decision to Environment M an2 agement,D ordrecht:K luwer Academ ic Publishers,1994,339-35731 S lowinski R et al.R ough set reas oning about uncertain data.Fundamenta In formaticae,1996,27(2,3):229-24332 Pars ons S et al.A rough set approach to reas oning under uncertainty.Journal of Exprimental and Theoretical AI,1995,7(2):175-19333 Ruhe Gand G esselschaft F.R ough set based data analysis in g oal2orient2 ed s oftware measurement.Proc.of IEEE International s oftware M etrics Sym posium,Los Alam itos,1996,10-1934 W ojcik Z et al.Application of rough sets for edge enhancing image fil2 ters.Proc.of IEEE International C on ference on Image Processing,Los Alam itos,1994,525-52935 Jacks on A et al.R ough sets applied to materials data.Acta M aterialia, 1996,44(11):4475-448436 C ollette T and S zladow e rough sets and spectral data for building predictive m odels of reaction rate constants.Applied S pectroscopy, 1994,48(11):1379-138637 Aijun A et al.Discovering rules for water demand prediction-an en2 hanced rough set approach.Engineering Applications of Artificial Intelli2 gence,1996,9(6):645-65338 W ojcik Z et al.S tructural m odeling using rough sets.Proc.of IEEE Inter2 national C on ference on Fuzzy Systems,New Jersey,1996,761-76639 Nurm i H et al.Probabilistic,fuzzy and rough concepts in s ocial choice.European Journal of Operational Research,1996,95(2):264-277156 控制理论与应用16卷 40 Lambert2T orres G et al.Data M ining into a C ontrol Center Database via R ough Set T echniques.Proc.of the International C on ference on Intelli2 gent Systems Applications to P ower Systems(IS AP’97),Seoul,1997, 246-25041 Zhang Q,Han Z X and W en F S.A new approach for fault diagnosis in power systems based on rough set theory.Proceedings of APSCOM’97,H ong K ong,1997,597-60242 张琦,韩祯祥,文福拴.一种基于粗糙集方法的电力系统故障诊断/警报处理的新方法.中国电力,1998,31(4):32-3843 王珏,苗夺谦,周育键.关于R ough Set理论与应用的综述.模式识别与人工智能,1996,9(4):337-34444 曾黄麟.粗集理论及其应用.重庆:重庆大学出版社,199845 E wa Orlowska(ed.).Incom plete in formation2rough set analysis.New Y ork:Physica2Verlag,1998本文作者简介韩祯祥 1930年生.浙江大学教授,博士生导师.研究领域为软计算方法及其在电力系统中的应用.张 琦 1971年生.浙江大学在读博士生.研究方向为粗糙集理论在电力系统中的应用.文福拴 1965年生.浙江大学教授,博士生导师.研究领域为软计算方法在电力系统中的应用. 1期粗糙集理论及其应用综述157。

基于优势关系和可变精度粗糙集的多准则决策方法_胡军华

基于优势关系和可变精度粗糙集的多准则决策方法_胡军华

第32卷 第4期系统工程与电子技术Vol .32 No .42010年4月Systems Engineering and Electronics April 2010文章编号:1001-506X (2010)04-0759-05收稿日期:20081009;修回日期:20090708。

基金项目:国家自然科学基金重点项目(70631004);国家创新研究群体科学基金(70921001)资助课题作者简介:胡军华主要研究方向为决策理论与技术、知识管理。

E -mail :hujunhua @mail .csu .edu .cn基于优势关系和可变精度粗糙集的多准则决策方法胡军华,陈晓红(中南大学商学院,湖南长沙410083) 摘 要:针对不确定性决策问题,提出了一种基于优势关系和可变精度粗糙集理论的多准则决策方法。

该方法把基于优势关系的粗糙集模型和基于可变精度粗糙集模型结合起来,在可变精度粗糙集模型中把规则的置信度阈值当作可变精度参数值。

首先,给出全部方案的成对比较表。

然后,从一部分方案的成对比较表中,利用优势关系粗糙集和可变精度粗糙集的扩展粗糙集理论提取两类优势规则。

最后,定义打分函数给全部方案打分,并进行排序,选出最优方案。

通过一个简单算例论证了该方法的可行性。

关键词:优势关系粗糙集;可变精度粗糙集;多准则决策;成对比较表;打分函数中图分类号:C 934 文献标志码:AMulti -criteria decision making method based on dominance relationand variable precision rou gh setH U Jun -hua ,CH EN Xiao -hong(Business S chool ,Central South Univ .,Changsha410083,China ) Abstract :A m ulti -criteria dec ision making method based on dominance relation and variable prec ision roughset is proposed w ith respect to u ncert ain decision making p roblem s .In this method ,the dominance relationbased rough set model is combined w ith the variable precision rough set (VPRS )model w hile t he confidence threshold of a rule is regarded as the value of variable prec ision parameters .Firstly ,the pairw ise com parison table (PC T )of the w hole alternative is given .T hen tw o kinds of rules are ext racted from the partial PC T of the given PC T by using dom inanc e relation and variable precision rough set theory .Finally ,a score function is defined to sort all t he alternatives and select the best one .The feasibility of the m ethod is dem onst rated by a simple illust rative exam ple .Keywords :dominance relation rough set ;variable precision rough set ;m ulti -criteria decision making ;pair -w ise com parison table ;score f unction0 引 言 多准则决策问题需要决策者给出每一个准则的偏好信息。

粗糙集理论

粗糙集理论

2012-2-21
陕西师范大学计算机科学学院xjy
21
2012-2-21
陕西师范大学计算机科学学院xjy
22
例 4: :
的信息系统为例, 以表 1 的信息系统为例,令 X = {x1 , x3 , x4 , x5 , x9 } ,
属性子集 B = {a1 , a2 , a3 } 。则根据表 2,可计算 X 的下近似 ,
a∈ A
f : U × A 是一个信息函数,对 →V 定义了一个信息函 x ∈U
数 f ( x, a ) ∈ Va ,即信息函数 的属性值。
f
指定
U 中每一个对象 x
2012-2-21
陕西师范大学计算机科学学院xjy
4
信息系统的定义
如果信息系统 IS 的属性集合 A 可分为分为条件属性集合 C
两部分, 和决策属性集合 D 两部分,即 A = C ∪ D 且 C ∩ D = φ , 这种信息系统也可称为决策表。 这种信息系统也可称为决策表。
2012-2-21
陕西师范大学计算机科学学院xjy
20
粗集中还有如下概念: 粗集中还有如下概念: 定义为: 集合 X 的 B 边界 BN B ( X ) 定义为:BN B ( X ) = BX − BX 。它是所有 根据知识 B 不能确定地划入集合 X , 也不能确定地划入集合 中对象的集合。 ∼ X 的 U 中对象的集合。也就是 B 上近似 BX 内无法确定属于 X 的对象。 的对象。
不可辨识关系
例 2∶以表 1 的信息系统为例, 则属性集 A 对应的不可辨识 关系 Ind
( A)
导出的划分 U / Ind ( A) 见表 2。表 2 中的每
一行表示一全域 U 在空间 A 上基本集,简称为 A 基本集。

覆盖近似空间中粗糙集的不确定性度量研究

覆盖近似空间中粗糙集的不确定性度量研究

c( =c( u{ X) ) KEMd ) ∈X—c x) ( I ( }
其 中 C X 和 C X 分别是 在 近似空间 s中的上 、 () () 下近似 。特
别 地 , C )=C X 称 是 s可定义 的 , 若 ( ( ), 或粗糙集 c ) ( 是 精 确 的。否 则 , 称 是 s不 可 定 义 的 , 粗 糙 集 c )是 粗 或 (
个 对象 , 则 在该 近似空间上 的描述集 和最小描述集为 : 朋 ) K∈CI ∈K^V c ∈L^L jK= ) ( ={ x ( K L} 对象的描述集是对 象在 给定知识 下不 可分 辨对象 的簇 集 , 而最小描述集则是描 述对象 分辨 能力 的最 小集 , 即在描述 集 中 对 于该 对象可分辨 的对象 组在最小描述集 中也是可分辨 的。 定义 3
相 比, 盖近似空间 中概念不一定是分离 的 , 覆 因而论域 中的每个 对象不一定仅仅 属于一个分块 , 而有可能属 于多个分块 。
收稿 日期 :0 1— 9一叭 。2 1 21 0 0 1中国计 算机大会论文。重庆市教育
委员会科学技 术研 究项 目( J 15 2 K 10 2 ) K 10 1 , J 15 2 。胡 军, 讲师 , 主研 领 域: 智能信 息处理 , 粒计算 , 粗糙集 。
e to y a d f z y d g e .T ru h a ay i g t e e u c r i t a u n t o s ti e e ld t a h y alb a o rai n l y u d r n r p n u z e r e h o g n l zn h s n e t ny me s r g me h d ,i s rv ae h tt e l e r s me i t a i n e a i r o t s e i e i a in .A u z e r e o u h s t i p o o e h l sr lt e p o e i sa ep o ie n ai ae .An lssh s p o e a p cf d st t s i u o f z y d ge f o g e s s r p s d w i i ea i r p r e t r vd d a d v l td r et v t d ay i a r v n t t h t e u c rany me s r g a p o c v r o ste i a in l iso r ra p o c e , Oi p o i e t o o a u i gt e u c ran y o h n e ti t a u i p r a h o ec me h r t a i e f o me p r a h s S t r vd sameh d f r n r o t f me s rn n et i t f h

《粗糙集理论简介》课件

《粗糙集理论简介》课件

05
粗糙集的应用实例
数据挖掘中的粗糙集应用
分类
利用粗糙集理论对数据进行分类,通过确定数据的属性重要性和 类别关系,实现高效准确的分类。
聚类
通过粗糙集理论,可以发现数据中的相似性和差异性,从而将数 据分成不同的聚类。
关联规则挖掘
利用粗糙集理论,可以发现数据集中项之间的有趣关系和关联规 则。
机器学习中的粗糙集应用
粗糙集的补运算
总结词
粗糙集的补运算是指求一个集合的所有 可能补集的运算。
VS
详细描述
补运算在粗糙集理论中用于确定一个集合 的所有可能补集。补集是指不属于该集合 的所有元素组成的集合。通过补运算,我 们可以了解一个集合之外的所有可能性, 这在处理不确定性和模糊性时非常重要。
04
粗糙集的扩展理论
决策粗糙集
多维粗糙集
多维粗糙集是粗糙集理论在多维空间下的扩展,它考虑了多个属性或特征对数据 分类的影响。多维粗糙集可以更准确地描述多维数据的分类和聚类问题,因此在 处理多特征和多属性问题时具有更大的优势。
多维粗糙集的主要概念包括多维下近似、多维上近似、多维边界等,通过这些概 念可以度量多维数据的不确定性,从而为多维分类和聚类提供支持。
决策分析
粗糙集理论可以用于决策支持系 统,通过建立决策模型来分析不 确定性和模糊性条件下的最优决 策。
知识获取
粗糙集理论可以用于从数据中提 取隐含的知识和规则,尤其在处 理不完整和不精确信息时具有显 著效果。
02
粗糙集的基本概念
知识的分类
知识表达
通过数据表中的属性值来表达知识,将对象进 行分类。
概率粗糙集
概率粗糙集是粗糙集理论在概率框架下的扩展,它引入了 概率测度的概念,用于描述数据的不确定性。概率粗糙集 可以更准确地描述数据的不确定性和随机性,因此在处理 不确定性和随机性问题时具有更大的灵活性。

不同知识粒度下粗糙集的不确定性研究_王国胤

不同知识粒度下粗糙集的不确定性研究_王国胤

第31卷 第9期2008年9月计 算 机 学 报CH INESE JOURNA L OF COM PU TERSVo l.31N o.9Sept.2008收稿日期:2008-07-14.本课题得到国家自然科学基金(60573068,60773113)、重庆市教委科学技术研究项目(KJ060517)和重庆市自然科学基金重点项目(2008BA2017)资助.王国胤,男,1970年生,博士,教授,博士生导师,主要研究领域为粗糙集理论、粒计算、数据挖掘、知识技术等.E -mail:w anggy@cqu .张清华,男,1974年生,博士研究生,主要研究方向为智能信息处理、粒计算等.不同知识粒度下粗糙集的不确定性研究王国胤1),2)张清华1),2)1)(西南交通大学信息科学与技术学院 成都 610031)2)(重庆邮电大学计算机科学与技术研究所 重庆 400065)摘 要 粗糙集的不确定性度量方法,目前主要包括粗糙集的粗糙度、粗糙熵、模糊度和模糊熵.在不同知识粒度下,从属性的角度,给出了分层递阶的知识空间链,发现在分层递阶的知识粒度下部分文献中定义的粗糙集的粗糙熵和模糊度随知识粒度的变化规律不一定符合人们的认识规律.从信息熵的角度提出了一种粗糙集不确定性的模糊度度量方法,证明了这种模糊度随知识粒度的减小而单调递减,弥补了现有粗糙熵和模糊度度量粗糙集不确定性的不足.最后,分析了在不同知识粒度下粗糙度和模糊度的变化关系.关键词 粗糙度;粗糙熵;模糊度;知识粒度;商空间中图法分类号T P 18Uncertainty of Rough Sets in Different Knowledge GranularitiesWANG Guo -Yin1),2)ZH ANG Q ing -H ua1),2)1)(S choolof I nf ormation Sc ienc e &T echnolog y ,S outh w est J iaotong Univ er sity ,Ch engd u 610031)2)(In stitute of Compu ter S cience &T ech nology ,Chongqing Unive rsity of P osts and Te lec ommunications ,Chong qing 400065)Abstract Rougness,rough entropy,fuzziness,and fuzzy entro py are major m ethods fo r measur -ing the uncertainty o f r oug h sets.In different know ledge g ranularity levels,a hierar chical kno w -l edg e space chain is proposed based o n the attributes in information sy stems.Some regularities of the changing of rough entr opy and fuzziness of a ro ug h set w ith the know ledge g ranularity are found to be inconsistent w ith hum an cog nition.A new m ethod for measuring the fuzziness of rough sets is pro posed based on info rmatio n entropy.T he fuzziness m easured by the new method is m onotonously decr easing w ith the refining o f know ledg e g ranularity in appo riximation spaces.It overcomes the problem of roughness and rough entr opy.Finally,the r elations o f the chang ing of roughness and fuzziness are analyzed in different know ledg e gr anular ities.Keywords roughness;rough entropy;fuzziness;know ledge granularity;quotient space1 引 言进入21世纪以来,不确定性问题的研究工作受到越来越多的关注[1].如何对不确定性信息和数据进行更加有效的处理,从而发现不确定性信息中蕴涵的知识和规律,是一个重要的研究课题[2].Zadeh在1965年提出的模糊集(Fuzzy sets )理论[3],Paw lak 在1982年提出的粗糙集(Ro ug h sets)理论[4]和张钹、张铃在1990年提出的商空间理论[5]是粒计算(granular co mputing )的三大基础数学理论,是处理不确定性问题的有效方法,已广泛应用于模式识别、知识发现、问题求解以及不确定推理等领域.模糊集作为经典康托集的推广,利用隶属函数来表示对象关于集合的隶属程度,重在区分属于同一集合的不同对象间的隶属程度,其不足之处在于其隶属函数往往需由专家给出,带有一定的主观性;粗糙集理论是处理不完全和不精确信息的一种有效数学工具[6],建立在对论域分类的基础上,将不确定知识用已知知识库中的知识来刻画,对不确定问题的描述和处理比较客观,但粗糙集理论是研究在给定的空间(知识基)上不同概念的表示、转换和相互依存问题的,其论域是点集,元素之间没有拓扑关系;商空间理论基于复杂问题粒化的思想,建立了一种商结构的形式化问题求解理论体系,利用保真、保假原理来高效地获得问题的解或近似解,它不仅针对给定的商空间(知识基)来讨论知识的表达问题,而且利用对象之间的结构(偏序结构或拓扑结构),在所有可能的商空间中找出最合适的商空间,从不同商空间(不同角度)观察同一问题,以便得到对问题不同角度的理解,最终合成对原问题总的解(近似解)[5].可以说,模糊集理论是一种/软0计算方法,粗糙集理论是/硬0计算方法,而商空间理论是介于模糊集和粗糙集之间的一种问题求解(近似解)的计算方法,模糊商空间可以利用分层递阶结构/廉价0地描述问题的不确定性[7].另外,Gau和Buehrer提出的Vague集理论,通过对模糊对象赋予真、假隶属函数来处理模糊性,是模糊集理论的扩充[8].依靠各自的特点和优势,这些方法已经广泛应用于对不确定、不精确、不完整信息的处理以及对大规模海量数据的挖掘和对复杂问题的求解[9].李德毅认为[1]:在主、客观世界普遍存在的不确定性中,随机性和模糊性是最重要的两种形式,不确定性和确定性并非完全对立,在一定程度上可以相互转化.例如,某一层次的不确定性可能是更高层次上的确定性,种种不确定性中还可能隐藏着某些确定的规律等.人工智能研究人员的任务,就是寻找并且能够形式化地表示不确定性中的规律性,至少是在某种程度上的规律性,从而使机器能够模拟人类认识客观世界、认识人类本身的认知过程.当前,对于粗糙集的不确定性度量的方法主要有粗糙度、粗糙熵、模糊度和模糊熵.在同一知识粒度的近似空间下,Chakrabarty[10]等人较为详细地讨论了粗糙集的模糊性度量问题; Baner jee[11]和H uy nh[12]对模糊集的粗糙度进行了研究;王国胤[13-15]等人从信息观的角度分析了决策信息系统的不确定性,并讨论了代数观和信息观意义下粗糙集的不确定性的异同;梁吉业[16-18]等人从信息熵、条件熵、互信息和知识粒度的角度分析了粗糙集的不确定性,并给出了一种新的粗糙集的粗糙熵;苗夺谦[19-21]等人从粒计算和信息表示等角度研究了知识的粒度、知识的粗糙度与信息熵之间的关系.然而,随着属性个数的变化,论域空间形成一个分层递阶结构(金字塔结构,即商空间).当知识空间中的知识粒度严格递减时,一个粗糙集的粗糙度、粗糙熵、模糊度和模糊熵将怎样变化?它们之间的关系又是如何?关于这方面的研究工作,已有一定的研究基础,特别是研究粗糙精度、粗糙度、分类精度、粗糙熵和条件熵在不同知识粒度的近似空间下的变化已经比较详尽[11-16,18-21].综合分析上述研究工作可以发现,粗糙集的粗糙度随着知识粒度的减小而单调递减,这符合人们的认知直觉.但是,很多实际例子表明,当属于一个集合的正域或负域中的知识颗粒被细分时,粗糙集的粗糙度将不发生变化;而且当属于集合边界域中的知识颗粒被细分时,它的粗糙度可能也不发生变化,这与人们的认知直觉不吻合.为了克服这个问题,有的研究者提出了粗糙熵,如Liang[18]等人定义了一种粗糙熵,它是集合X的粗糙度与近似空间中的知识粒度之积,并得到结论:这种粗糙熵随着知识颗粒的细分严格单调递减.这个结论在一定程度上弥补了用粗糙度度量粗糙集不确定性的不足.但是,我们分析发现,如果对集合X 负域的知识颗粒(与X无关)进行细分,粗糙度将不变(符合人们的认知规律),但粗糙熵却严格递减(不符合人们的认知规律).这说明与集合X无关的知识颗粒的变化也会导致X的粗糙熵的变化,这与人们对不确定性问题的认知不符.为此,需要进一步研究粗糙集不确定性的另一度量方式)))粗糙集的模糊度.虽然在同一知识粒度的近似空间下粗糙集的模糊性得到研究者的关注[10,16,18-21],但是关于粗糙集的模糊度在不同知识粒度的近似空间(分层递阶的近似空间)下将如何变化的研究工作甚少.粗糙集的模糊度随着近似空间中知识颗粒的细分将如何变化?对这个问题的探索,有利于发现不确定性问题中隐藏的某些确定规律.从认知角度来讲,集合X随着与它有关的知识颗粒的细分,它的不确定性要降低,模糊度也应该降低.但是,文献[10]给出的粗糙集模糊度在知识粒度细化的过程中可能反而会逐渐增加,这与人们认知15899期王国胤等:不同知识粒度下粗糙集的不确定性研究不确定性问题的直觉相悖.本文从属性空间的角度,主要讨论不同知识粒度的近似空间下(即不同层次的商空间)粗糙集的模糊度的变化问题,提出一种基于信息熵的粗糙集的模糊性度量方法,证明这种模糊度随着知识粒度的减小而单调递减,弥补粗糙度和粗糙熵对粗糙集不确定性度量的不足.这种模糊度的物理背景非常清楚,它既刻画出集合X的边界域中属于X的那部分元素/贡献0的不确定性,也刻画出不属于X的那部分元素/贡献0的不确定性,更精确地描述了粗糙集的不确定性.通过分析发现,如果集合X的边界域中的知识颗粒被/成比例0地细分,这种粗糙集的模糊度不会发生变化;如果集合X的边界域中的知识颗粒被/不成比例0地细分,这种粗糙集的模糊度将严格递减.这个结论克服了现有部分度量粗糙集不确定性方法的不足,与人们对不确定性问题的认知规律非常吻合.本文第2节介绍相关基本概念;第3节讨论不同知识粒度下粗糙集的不确定性度量问题;第4节提出一种基于信息熵的粗糙集模糊度度量方法;第5节讨论不同知识粒度下粗糙集的粗糙度和模糊度的变化关系;第6节是结束语.2相关基本概念2.1知识的粒度定义1[6]设一个信息系统是四元组S=(U,A, V,f),其中U={x1,x2,,,x n}是非空有限对象集,称为/论域0,A={a1,a2,,,a m}是属性集,V= Ga I CV a,V a称为属性a的/值域0,f a:U y V a是信息函数.不可分辨关系:I N D(B)={(x,y)I U@U| P a I B(f a(x)=f a(y))}是U上的等价关系,所有等价类的集合记为U/I ND(B),简写为U/B.一个论域的划分构成粗糙集的一个近似空间,划分中的每一个分块称为一个知识颗粒,度量知识粒度的方法很多,这里我们采用Liang等人给出的知识粒度的度量方法[18].设U={x1,x2,,,x n},属性集B(B A A)对论域的划分U/B={X1,X2,,, X m},则U/B的知识粒度定义为G(U/B)=1|U|2E mi=1|X i|2(1)容易证明:1nF G(U/B)F1(|#|表示集合的元素个数,下同).2.2分层递阶的近似空间任给一个信息系统S=(U,A,V,f),A={a1, a2,,,a m}是属性集,任给一个属性子集B(B A A),我们可以得到论域U的一个划分U/B.U/B中的每个元素[x]B([x]B表示元素x(x I U)的等价类)表示近似空间的一个知识颗粒.设P(A)表示集合A={a1,a2,,,a m}的幂集.不难得出:代数系统3P(A),A4构成一个完备的偏序格.其中,Á是这个偏序格的最小元,A是最大元.定义2.在格3P(A),A4对应的H asse图中,从Á到A的一条路径称为属性链.例1.A={a1,a2,a3},3P(A),A4对应的H asse图如图1所示.图1格3P(A),A4如ÁA{a1}A{a1,a2}A{a1,a2,a3},ÁA{a1}A {a1,a3}A{a1,a2,a3}和ÁA{a3}A{a1,a3}A {a1,a2,a3}等都是属性链.定义3[21].设U={x1,x2,,,x n}为非空有限论域,P c={P c1,P c2,,,P c l}和P d={P d1,P d2,,,P d m}为U上的两个划分空间,如果P P ciI P c(v P d j I P d(P c i A P d j)),则称P c是P d的细划分空间,记为P c M P d.定义4[22].设U={x1,x2,,,x n}为非空有限论域,P c={P c1,P c2,,,P c l}和P d={P d1,P d2,,, P d m}为U上的两个划分空间,如果P c M P d,且v P ciI P c(v P d j I P d(P c i<P d j)),则称P c是P d的严格细划分空间,记为P c;P d.定理1.设格3P(A),A4中的任意一条属性链为Á=B0<B1<B2<,<B m=A,则U/B m M U/B m-1M,M U/B1M U/B0={U}.在任何一条属性链下,对象集U被分成不同的划分,这些划分在/M0关系下构成一个金字塔结构,称为分层递阶的近似空间.例2.一个信息系统U={x1,x2,,,x10}, A={a1,a2,a3},如表1所示.1590计算机学报2008年表1一个信息系统x1x2x3x4x5x6x7x8x9x10x11x12 a1111111122333a2011111122333a3000000123445如果取属性链ÁA{a1}A{a1,a2}A{a1,a2, a3},可得到如下的分层递阶近似空间:U/Á={{x1,x2,,,x10}};U/{a1}={{x1,x2,x3,x4,x5,x6,x7},{x8,x9},{x10,x11,x12}};U/{a1,a2}={{x1},{x2,x3,x4,x5,x6,x7},{x8,x9},{x10,x11,x12}};U/{a1,a2,a3}={{x1},{x2,x3,x4,x5,x6},{x7},{x8},{x9},{x10,x11},{x12}}.在这个分层递阶的近似空间中,随着属性个数的增加,知识颗粒逐渐/细化0.2.3粗糙集不确定性的几种度量方法2.3.1粗糙集的粗糙度定义5[6].在一个信息系统中,I N D(B)是U 上的一个不可分辨关系,[x]B表示对象x的等价类,对象子集X A U,X的下近似集(BX)、上近似集(B X)和边界域(BN B(X))分别定义如下:BX={x I U|[x]B A X},B X={x I U|[x]B H X XÁ},B N B(X)=B(X)-B(X).定义6[22].在一个信息系统中,I N D(B)是U 上的一个不可分辨关系,[x]B表示对象x的等价类,对象子集X A U,X的粗糙精度和粗糙度为粗糙精度:A B(X)=R(X)R(X);粗糙度:Q B(X)=1-A B(X)=1-R(X)R(X)=B N B(X)R(X).显然,对于任意的X A U,都有0F A B(X)F1且0F Q B(X)F1.如果B(X)=B(X)=X,即Q B(X)=0(或A B(X)=1),称X关于B是精确的;如果B(X)<B(X),即0<Q B(X)F1(或0FA B(X)<1),称X关于B是粗糙的.2.3.2粗糙集的粗糙熵关于粗糙集的粗糙熵的定义形式很多,这里我们采用Liang提出的粗糙熵.定义7[18].设U={x1,x2,,,x n},属性子集B(B A A)对论域的划分U/B={X1,X2,,,X m},X A U,则属性集合B的熵定义为E(B)=-E m i=1|X i||U|lo g1|X i|2(2) X在划分U/B上的粗糙熵定义为E B(X)=Q B(X)E(B)(3)集合X的粗糙熵是粗糙度与属性集合B的熵之积.2.3.3粗糙集的模糊度设U={x1,x2,,,x n}是非空有限集,A是U 上的模糊集,A(x i)是模糊集的隶属函数.用P(U)表示集合U上的所有经典集合,F(U)表示集合U 上的所有模糊集合.显然,P(U)A F(U).定义8[23].P A I F(U),若映射d:F(U)y [0,1]满足条件:(1)d(A)=0当且仅当A I P(U);(2)d(A)=1当且仅当P xiI U A(x i)=12;(3)P xiI U B(x i)F A(x i)F12D B(x i)E A(x i)E12y d(B)F d(A);(4)d(A)=d(A c),这里A c是A的补集,则称映射d是F(U)上的一个模糊度,记为d(#).设U是非空对象集,对象子集X A U,则对于任意的x(x I U),x属于集合X的隶属函数为L B X(x)=|X H[x]B||[x]B|(4)显然,0F L B X(x)F1,它表示任意一个元素属于集合X的程度.令F B X={L B X(x1),L B X(x2),,, L B X(x n)},则F B X是集合U上的一个模糊集(即F B X I F(U)).由粗糙集上、下近似和边界的概念,不难得出:BX={x I U|L B X(x)=1};B X={x I U|0<L B X(x)F1}.模糊度是度量不确定问题的有力工具,很多研究者对粗糙集的模糊度进行了分析,Chakrabar ty[10]等人提出粗隶属函数可以导出模糊集,并利用模糊集与它的最邻近清晰集间的距离来度量粗糙集的模糊性.定义9[10].设A是U上的模糊集,与A有关A,其定义为AA(x i)<015A(x i)>015或1,A(x i)=015.15919期王国胤等:不同知识粒度下粗糙集的不确定性研究一般地,当A(x i)=015时,取A(x i)=1,这时A=A015,这里A015表示A的015截集.Chakrabarty[10]等人利用模糊集F B X和它的最邻近清晰集F B X之间的距离给出了粗糙集的两种模糊性度量.(1)线性模糊度:d K l(F B X)=2nE ni=1|L B X(x i)-L B X(x i)|(5)(2)二次模糊度:d K q(F B X)=2nE ni=1(L B X(x i)-L B X(x i))2(6)其中,L B X(x i)表示x i在模糊集F B X中的隶属函数. 2.3.4粗糙集的模糊熵定义10[24].P A I F(U),若映射e:F(U)y [0,+])满足条件:(1)e(A)=0当且仅当A I P(U);(2)e(A)取得最大值当且仅当P xi I U A(x i)=12;(3)P xi I U B(x i)F A(x i)F12D B(x i)E A(x i)E12y e(B)F e(A);(4)e(A)=e(A c),这里A c是A的补集,则称映射e是F(U)上的一个模糊熵,记为e(#).梁吉业[16-18]等人建立了粗糙集的一种模糊熵:E L(F B X)=E n i=1L B X(x i)(1-L B X(x i))(7)并得出了相应的结论:一个精确集的模糊熵等于0,一个粗糙集合与它的补集具有相同的模糊性.2.3.5信息熵信息熵是一个非常广泛的概念,1948年Shanno n 信息熵[25]的提出为信息的不确定度量奠定了理论基础,Klir基于Shannon熵提出了一种度量不确定性的信息熵[26]:H(F B X)=-2nE ni=1L B X(x i)log L B X(x i)2(8)容易验证,H(#)不满足模糊度的定义(定义8),不是模糊度.3不同知识粒度下粗糙集的不确定性度量目前,度量粗糙集不确定性的方法主要有粗糙度、粗糙熵、模糊度和模糊熵.在分层递阶的近似空间下,随着知识颗粒的细分,不同层次上的知识粒度有何变化规律?定理2和定理3揭示了这个变化规律.定理2[21].设格3P(A),A4中的任意一条链为Á=B0<B1<B2<,<B m=A,则G(U/B i+1)F G(U/B i)(i=0,1,2,,,m-1;下同).定理3[21].设格3P(A),A4中的任意一条链为Á=B0<B1<B2<,<B m=A,如果U/B i+1; U/B i,则G(U/B i+1)<G(U/B i).在分层递阶的近似空间上,随着知识粒度的减小,粗糙集的粗糙度将如何变化?定理4回答了这个问题.定理4[6].设格3P(A),A4中的任意一条链为Á=B0<B1<B2<,<B m=A,对于任意的X A U,有Q Bi+1(X)F Q Bi(X).定理4揭示了集合X的粗糙度随知识粒度减小而单调递减.注意:如果U/B i+1;U/B i(严格的细分关系),不一定有Q Bi+1(X)<Q Bi(X)(严格单调递减).如例2中,X={x1,x2,x3,x4,x5,x6,x7,x8, x9},取属性链Á<{a1}<{a1,a2}<{a1,a2,a3},则U/{a1,a2,a3};U/{a1,a2},而Q{a1,a2,a3}(X)= Q{a1,a2}(X).这表明集合X在不同知识粒度的近似空间中可能得到相同的粗糙度.为了克服这个问题, Liang[18]给出一种粗糙熵E B(X)=Q B(X)E(B),该粗糙熵随着近似空间中知识粒度减小会有何变化规律呢?定理5[21].设格3P(A),A4中的任意一条链为Á=B0<B1<B2<,<B m=A,对于任意的X AU,若G(U/B i+1)<G(U/B i),则E Bi+1(X)<E Bi(X).定理5表明,随着分层递阶的近似空间中知识粒度的减小,E B(X)严格单调递减.这个结论在一定程度上弥补了粗糙度的缺陷.但是,我们分析发现,当近似空间中知识粒度的减小是由于集合X负域中的知识颗粒(与X无关)被细分时,粗糙度不会改变(符合认知规律),但粗糙熵E B(X)却严格递减(不符合认知规律).这表明与集合X无关的知识颗粒(X的负域中的知识颗粒)细分时,粗糙集的粗糙熵会减小,与人们的认知规律不吻合.例3.设U={x1,x2,,,x10},U/B i={{x1, x2,x3},{x4,x5,x6,x7},{x8,x9,x10}},U/B i+1= {{x1,x2,x3},{x4,x5,x6,x7},{x8,x9},{x10}},X={x3,x4,x5,x6,x7},则Q Bi(X)=Q Bi+1(X)=37;1592计算机学报2008年E B i (X )=370(8+log 7292),E B i +1(X )=370(8+log 1082),所以E B i (X )>E B i +1(X ).因此,用粗糙熵度量粗糙集的不确定性还是存在一定的局限性.根据商空间理论中解释/模糊0和/清晰0之间粒度变化的关系/模糊在一定粒度下会变得清晰,而清晰在一定粒度下会变得模糊0和李德毅指出的[1]/不确定性和确定性并非完全对立,在一定程度上可以相互转化0,本文接下来重点讨论,在分层递阶的近似空间中,粗糙集模糊度随着知识粒度的变化而变化的情况.设格3P (A ),A 4中的任意一条链为Á=B 0<B 1<B 2<,<B m =A ,对于任意的X A U,模糊集F B i X与FB i +1X 的模糊度的大小关系如何呢?对这个问题的讨论要比粗糙度和粗糙熵复杂得多.(1)如果U/B i =U/B i +1,对任意的模糊性度量方法,F B i X与FB i +1X的模糊度都相等;(2)如果U/B i +1;U/B i ,容易证明:d K l (F B i +1X)Fd K l (F B i X ).但d K q (FB i +1X)和d K q (F B i X)的大小关系不确定.如例2中取X ={x 6,x 7,x 8,x 9},U/{a 1,a 2};U/{a 1},则F {a 1}X =27,27,27,27,27,27,27,1,1,0,0,0;F {a 1,a 2}X =0,26,26,26,26,26,26,1,1,0,0,0;d K l (F {a 1,a 2}X )=d K l (F {a 1}X )=21227@7=13;d K q (F {a 1)X )=212272@7=473;d K q (F {a 1,a 2)X )=212262@6=463.这个例子说明,如果用d K l (#)和d K q (#)来测量粗糙集的模糊度有以下缺陷:用d K l (#)来测量X ={x 6,x 7,x 8,x 9}的模糊度,U/{a 1,a 2};U/{a 1},G(U/{a 1,a 2})<G (U/{a 1}),且68=Q {a 1,a 2}(X )<Q {a 1}(X )=79,这表明随着知识粒度的减小,粗糙度在降低,然而X 的线性模糊度却不变d K l (F {a 1,a 2}X )=d K l (F {a 1}X ),二次模糊度反而增加d K q (F {a 1,a 2}X )>d K q (F {a 1}X ),这与人们的直觉相悖.4 基于信息熵的粗糙集模糊度为了能够将信息熵应用来测量粗糙集的模糊度,我们进一步分析发现:粗糙集的模糊性来自边界域的两个部分,一部分是边界域中属于集合X 的元素,一部分是边界域中不属于集合X 的元素,而式(8)的信息熵只考虑了前面一部分,没有涉及第二部分.为此,我们提出一种新的基于信息熵的粗糙集的模糊度度量方法:d Z (F BX)=-1n ln2E ni =1[L B X (x i )ln L BX (x i )+(1-L B X (x i ))ln (1-L BX (x i ))](9)直观上讲,式(9)由L B X (x i )ln L BX (x i )和(1-L B X (x i ))ln (1-L BX (x i ))两部分信息熵构成,前者主要反映属于集合X 的元素/贡献0的不确定性,后者主要反映不属于集合X 的元素/贡献0的不确定性,这两部分同时考虑才能更精确地刻画粗糙集的不确定性.接下来,我们验证d Z (#)满足定义8.证明. d Z (F B X )=0当且仅当P x iI U (L B X (x i )=0D L B X (x i )=1),即F B X 是普通的康托集,F BX I P(U).定义8的条件(1)满足.对于任意的x i (x i I U ),令L BX (x i )=t i (0Ft i F 1),令f (t i )=t i ln t i +(1-t i )ln (1-t i ),易证,函数f (t i )在唯一的极值点t i =12处取得最小值-ln2.所以,d Z (F BX )在点L BX (x i )=12处取得最大值1.定义8的条件(2)满足.对于任意的x i (x i I U),由于f (t i )=t i ln t i +(1-t i )ln (1-t i )在区间0,12单调递减,在12,1单调递增,在t i =12处取得最小值,所以,d Z (F BX)=-1n ln2E ni =1f (t i )在区间0,12单调递增,在12,1单调递减,在t i =12处取得最大值.因此,当L BX (x i )=t i F t c i =L B cX (x i )F 12或L BX (x i )=t i E t ci =L B cX (x i )E12时,有d Z (F B X )F d Z (F B cX ).定义8的条件(3)满足.d Z ((F B X )c )=d Z (F BX )显然成立,定义8的条件(4)满足.综上所述,d Z (#)是粗糙集的一种模糊度.下面,我们讨论模糊度d Z (#)随近似空间中知识粒度的减小的变化趋势.定理6. 设格3P (A ),A 4中的任意一条链为15939期王国胤等:不同知识粒度下粗糙集的不确定性研究Á=B0<B1<B2<,<B m=A,如果U/B i+1; U/B i,则对于任意的X A U,都有d Z(F B i+1X)F d Z(F B i X).证明.设U/B i={P1,P2,,,P r},U/B i+1= {Q1,Q2,,,Q t}(r<t).因为,U/B i+1;U/B i,令$B i=B i-B i+1表示属性增量.则属性增量$B i一定对U/B i={P1,P2,,,P r}中的至少一个元素进行细分.为简化证明,我们不妨设U/B i中只有P1被$B i分为两个部分(分为多个部分的证明情况类似),P1=Q i G Q j(Q i,Q j I U/B i+1),U/B i的其它元素不变(其它情况可以根据这种情况进行证明).下面分情况讨论:(1)当P1H X=Á时,对于任意的x(x I P1),L B i X(x)=|P1H X||P1|=0.因为P1=Q i G Q j(Q i H Q j=Á),所以,对于任意x(x I Q i或者x I Q j),L B i+1X(x)=|Q i H X| |Q i|=|Q j H X||Q j|=0.因此,属性增量$B i对U/B i={P1,P2,,,P r}的细分不改变模糊集F B i X的隶属函数值,即F B i X=F B i+1X,所以d Z(F Bi+1 X)=d Z(F B i X).(2)当P1A X时,对于任意的x(x I P1),L B i X(x)= |P1H X||P1|=1.由于P1=Q i G Q j(Q i H Q j=Á),所以,对于任意的x(x I Q i或者x I Q j),L B i+1X(x)=|Q i H X| |Q i|=|Q j H X||Q j|=1.因此,属性增量$B i对U/B i={P1,P2,,,P r}的细分不改变模糊集F B i X的隶属函数值,即F B i X=F B i+1X,即d Z(F Bi+1X)=d Z(FBiX).(3)当P1H X XÁ,且P1H X X P1时,因为P1=Q i G Q j,则|P1|=|Q i|+|Q j|(Q i H Q j=Á),d Z(F B i X)=1n ln2E ni=1[-L B i X(x i)ln L B i X(x i)-(1-L B i X(x i))ln(1-L B i X(x i))]=1n ln2ExiI P1[-L B i X(x i)ln L B i X(x i)-(1-L B i X(x i))ln(1-L B i X(x i))]+ ExjP1[-L B iX(x j)ln L B iX(x j)-(1-L B i X(x j))ln(1-L B i X(x j))],下面分类讨论:¹如果Q i H X=Á,设|P1H X|=a且|P1|-|P1H X|=b,则公式Ex i I P1[-L B i X(x i)ln L B i X(x i)-(1-L B i X(x i))ln(1-L B i X(x i))]=-a ln aa+b-b ln ba+b,ExiI QiG Qj[-L B i+1X(x i)ln LBi+1X(x i)-(1-L B i+1X(x i))ln(1-LBi+1X(x i))]=E xiI Qj[-L B i+1X(x i)ln LBi+1X(x i)-(1-L B i+1X(x i))ln(1-LBi+1X(x i))]=-a lnaa+b1-b1lnb1a+b1,这里|Q j H X|=a1=a,|Q j|-|Q j H X|=b1< b.令函数f(a,b)=-a lnaa+b-b lnba+b,因为9f9b= lna+bb>0,所以f(a,b)关于b是增函数.因为b1<b,所以-a lnaa+b-b lnba+bE-a ln aa+b1-b1lnb1a+b1.º如果Q j A X,则|Q i H X|=a1<a,|Q i|-|Q i H X|=b1=b,ExiI QiG Qj[-L B i+1X(x i)ln LBi+1X(x i)-(1-L B i+1X(x i))ln(1-LBi+1X(x i))]=E xiI Qi[-L B i+1X(x i)ln LBi+1X(x i)-(1-L B i+1X(x i))ln(1-LBi+1X(x i))]=-a1lna1a1+b-b ln ba1+b.因为9f9a=lna+ba>0,所以f(a,b)关于a是增函数.又因为a1<a,所以-a lnaa+b-b lnba+bE -a1lna1a1+b-b lnba1+b.»如果Q i H X XÁ且Q i H X X Q i,Q j H X XÁ且Q j H X X Q j,令|X H Q i|=a1>0,|X H Q j|= a2>0,|Q i|-|X H Q i|=b1>0,|Q j|-|X H Q j|= b2>0,此时,a1+a2=a,b1+b2=b.ExiI P1[-L B i X(x i)ln L B i X(x i)-(1-L B i X(x i))# ln(1-L B i X(x i))]=-a lnaa+b-b lnba+b;ExiI QiG Qj[-L B i+1X(x i)ln LB i+1X(x i)-(1-L B i+1X(x i))ln(1-LBi+1X(x i))]=-a1lna1a1+b1-b1lnb1a1+b1-1594计算机学报2008年(a -a 1)ln a -a 1a -a 1+b -b 1-(b -b 1)lnb -b 1a -a 1+b -b 1.又令F(a 1,b 1)=-a 1ln a 1a 1+b 1-b 1ln b 1a 1+b 1-(a -a 1)lna -a 1a -a 1+b -b 1-(b -b 1)ln b -b 1a -a 1+b -b 1,求解F (a 1,b 1)的最大值.对F (a 1,b 1)求偏导数,得方程组:9F 9a 1=09F 9b 1=0.解该方程组得:a 1b 1=a b .此时,a 2b 2=a b,这表明函数F(a 1,b 1)在a 1b 1=a 2b 2=a b 处取得最大值-a ln aa +b -b lnb a +b .所以,F(a 1,b 1)F -a ln a a +b -b ln b a +b .根据以上¹,º和»,有E x iI P1[-L Bi X(x i)ln LB i X(x i )-(1-L B i X (x i ))ln (1-L BiX (x i ))]EEx iI Q iG Qj[-L B i X (x i )ln L B i X (x i )-(1-L BiX (x i ))#ln (1-L Bi X (x i ))].所以,d Z (F B i +1X)F d Z (F B i X).综上所述,定理6得证.证毕.当属性增量$B i 将P 1划分为Q i ,Q j (Q i X Á,Q j X Á,Q i H Q j X Á)两个细的知识颗粒时,即P 1=Q i G Q j ,X A U,如果|P 1H X ||P 1|-|P 1H X |=|Q i H X ||Q i |-|Q i H X |=|Q j H X ||Q j |-|Q j H X |,则称P 1被属性增量$B i /成比例0细分.特别地,当Q i =Á或者Q j =Á(即P 1没有被分解)时,我们视为一种特殊的/成比例0细分.推论1. 当且仅当属性增量$B i 将U/B i ={P 1,P 2,,,P r }中的每个知识颗粒进行/成比例0细分时,有d Z (F B i X)=d Z (FB i +1X).如果属性增量$B i 将U/B i ={P 1,P 2,,,P r }中的某个知识颗粒进行/不成比例0细分后,粗糙集的模糊性将严格递减.续例2. 设X ={x 6,x 7,x 8,x 9},U/{a 1,a 2};U/{由第3节可知,d K q (F {a 1,a 2}X )=463>d Kq (F {a 1}X )=473,这与人们的认知相悖.用d Z (#)计算得d Z (F {a 1}X )=-112ln227ln 27+57ln 57@7+0=112ln2@65188;d Z (F {a 1,a 2}X )=-112ln226ln 26+46ln 46@6+0=112ln2@45156.可见,d Z (F {a 1}X )>d Z (F {a 1,a 2}X ).这说明二次模糊度随着知识粒度的减小反而增加,d Z (#)随着知识粒度的减小而单调递减.续例3.设U ={x 1,x 2,,,x 10},U/B i ={{x 1,x 2,x 3},{x 4,x 5,x 6,x 7},{x 8,x 9,x 10}},U/B i +1={{x 1,x 2,x 3},{x 4,x 5,x 6,x 7},{x 8,x 9},{x 10}},X ={x 3,x 4,x 5,x 6,x 7},则Q B i (X )=Q B i +1(X )=37;E B i (X )=370(8+log 7292),E B i +1(X )=370(8+log 1082),所以,E B i (X )>E B i +1(X );而模糊集F Bi X 和F Bi +1X 相等(F Bi X =F Bi +1X =13,13,13,1,1,1,1,0,0,0),所以,d Z (F B i X )=d Z (F Bi +1X ).这说明与集合X 无关的知识颗粒的细化导致粗糙熵严格递减,但模糊度d Z (#)不变.式(9)依赖两部分信息熵,既利用了度量不确定性的Shanno n 熵,也结合粗糙集的特点,同时构造集合X 的边界域中属于X 的那部分元素/贡献0的不确定性和不属于X 的那部分元素/贡献0的不确定性,非常直观.随着集合X 的边界域上的知识颗粒的/不成比例0的细分,粗糙集的模糊度将严格递减;而集合X 边界域上的知识颗粒被/成比例0细分时,粗糙集的模糊度不变.这更加准确地刻画出人们对不确定性问题的认知规律.5 不同知识粒度下粗糙集的粗糙度和模糊度的变化关系这里主要讨论粗糙度Q B (#)和模糊度d Z (#)在分层递阶的近似空间中随知识粒度的变化而变化的关系.性质1. 设信息系统S =(U,A ,V ,f )中,B A15959期王国胤等:不同知识粒度下粗糙集的不确定性研究A,X A U,如果X 是关于B 精确的,则d K l (F B X )=d K q (F B X )=d Z (F B X )=0.这个性质表明,任何关于B 的精确集的模糊度都等于0.除了用数值来表示粗糙集的不确定特征外,也可以用拓扑特征[22]来刻画.(1)如果B (X )X Á, B (X )X U,称X 是粗糙可定义的;(2)如果B (X )=Á, B (X )X U,称X 是内不可定义的;(3)如果B (X )X Á, B (X )=U,称X 是外不可定义的;(4)如果B (X )=Á, B (X )=U,称X 是全不可定义的.性质2. 设信息系统S =(U,A ,V,f )中,B A A,X A U,如果d Z (F B X)=1,则Q B (X )=1,且X 关于B 是全不可定义的.这个性质的逆不一定成立.即一个集合X 关于B 是全不可定义时,它的粗糙度等于1,但是模糊度不一定等于1.性质3. 设信息系统S =(U,A ,V ,f )中,B 1<B 2A A ,X A U,且Q B 1(X )>Q B 2(X ),则d Z (F B 1X)>d Z (F B2X ).该性质说明,在一条属性链上,如果粗糙度降低,必然导致粗糙集的模糊度降低.该性质的逆不一定成立,即如果d Z (F B1X)>d Z (F B2X)时,Q B 1(X )>Q B 2(X )不一定成立.这说明粗糙集的模糊度降低时,粗糙度未必降低.性质4. 设信息系统S =(U,A ,V ,f )中,B 1<B 2A A,X A U,如果d Z (F B1X )=d Z (F B2X ),则Q B 1(X )=Q B 2(X ).随着分层递阶的近似空间中知识粒度的减小,如果粗糙集的模糊度不变,则粗糙集的粗糙度也不变.性质3和性质4表明模糊度比粗糙度对知识粒度的变化更/灵敏0.性质5. 设信息系统S =(U,A ,V ,f )中,B 1<B 2A A,且G(U/B 1)>G(U/B 2),则Q B 1(X )E Q B 2(X ),d Z (F B 1X )E d Z (F B 2X ).随着近似空间中的知识粒度的减小,粗糙集的粗糙度、模糊度不一定严格递减.性质6. 设信息系统S =(U,A ,V ,f )中,B 1<B 2A A,X A U,如果Q B 1(X )>Q B 2(X )或者d Z (F B 1X)>d Z (F B2X),则G(U/B 1)>G(U/B 2).在分层递阶的近似空间中,知识粒度随着粗糙集的粗糙度或模糊度的降低而必然降低.性质7. 设信息系统S =(U,A ,V ,f )中,B A A ,X A U,若Q B (X )<1,则d Z (F BX )<1.在分层递阶的近似空间中,这些性质刻画了粗糙度、模糊度随知识粒度的变化而变化的规律.本文给出的粗糙集模糊度d Z (#)随知识粒度的变化规律更加符合人们的认知规律.6 结束语粗糙集的粗糙度、粗糙熵、模糊度和模糊熵虽然都是度量粗糙集的不确定性的,但它们之间有一定的联系和区别.粗糙性从集合的边界区域的角度来刻画粗糙集的不确定性,随着知识粒度的减小,如果集合的边界区域变小,粗糙度降低,粗糙集的不确定性下降,具有很好的直观性;而粗糙集的模糊性用元素属于某个集合的隶属函数的大小来刻画粗糙集的不确定性,与集合的边界区域大小和知识粒度的大小有关.粗糙集的粗糙性具有一定的/几何0特点,而模糊性具有一定的/代数0特点,它们从直观和抽象两个方面分别刻画出粗糙集的不确定性,具有一定的互补性.本文从信息熵的角度提出了一种新的粗糙集的模糊性度量方法d Z (#),该方法用/两个0方面的信息熵来刻画粗糙集的不确定性,具有非常形象和直观的特点.这种模糊度既有信息熵度量不确定性的优势(是两部分信息熵构成),又能克服粗糙度和Liang [18]定义的粗糙熵对粗糙集不确定性度量的不足,也能弥补Chakrabarty [10]等人提出的粗糙集模糊度随着知识粒度减小反而可能增加的缺陷.在研究中,我们发现不是满足定义8的任意模糊度都会随着知识颗粒的细分而严格单调递减,因此,在构造测量粗糙集的模糊度的测量方法时,除了满足定义8外,还应该增加一个约束条件:随着知识颗粒的细分,粗糙集的模糊度单调递减.参考文献[1]Li De -Yi,Liu Chang -Yu,Du Yi,H an Xu.Artificial intell-i gen ce w ith u ncertainty.Journal of Softw are,2004,15(11):1583-1594(in Ch ines e)(李德毅,刘常昱,杜鹢,韩旭.不确定性人工智能.软件学报,2004,15(11):1583-1594)1596计 算 机 学 报2008年。

基于严凹函数的粗糙集不确定性度量

基于严凹函数的粗糙集不确定性度量
Tel:+86—10—62562563
基 于 严 凹 函数 的 粗 糙 集 不 确 定 性 度 量
黄国顺, 文 翰
(佛 山 科 学 技 术 学 院 数 学 』犬 数 院 ,广 尔 佛 山 528000) 通 讯 作 :越 顺 ,E—mail:fshgs 72@ 163.cor n
摘 要 : 通 过 语 义 分析 ,提 出 了一 种 拓 展 的粗 糙 集 不确 定 性 度 量 公 理 化 定 义 :将 香农 熵 函 数 推 广到 严 凹 函数 ,提 出 了一 类 以 条 件 概 率 为 自变量 、 基 于严 凹 函 数 的 粗 糙 集 不确 定性 度 量 公 式 ,它 是 严 凹 函数 值 的 加 权 平 均 .在 此 基 础 上 , 得到 一 系列粗糙 集不确定性度量 方法.从严 凹函数视 角讨论 了基 于模 糊熵的 不确 定性 度量方法,发现现 有 多种 能够 用 于度 量 粗 糙 集 不 确 定 性 的 模 糊 熵 函数 都 是 所提 出方 法 的 特 殊 情 形 .比较 了粗 糙 度 、改进 粗 糙 度 和 所提 出方 法 的 区 别和 联 系 ,最 后 设 计 了一 些 算 例 ,比 较 了 各种 方 法 的 异 同,验 证 了基 于严 凹 函 数 的 粗 糙 集 不 确 定性 度 量 与 粗 糙 集 不确 定性 语 义 是 一 致 的 . 关键 词 : 不 确 定 性 度 量 :严 凹 函 数 :模 糊 熵 ;粗 糙 度 中 图 法 分 类 号 :TP18
软 件 学报 ISSN 1000.9825,CODEN RUXUEW
Journal olSqllu’are,201 8,29(I1):3484 3499[dot:l0.13328/j.cnki.jos.005292】 @r}1 l 科 学 院软 f t研 究 所 版权 所 仃

覆盖粗糙集的模糊度

覆盖粗糙集的模糊度

覆盖粗糙集的模糊度
胡军;王国胤
【期刊名称】《重庆邮电大学学报(自然科学版)》
【年(卷),期】2009(021)004
【摘要】粗糙集的不确定性度量是粗糙集理论中的关键问题之一.粗糙隶属函数为粗糙集提供了新的解释,并为粗糙集的不确定性度量提供了方法.Tsang对覆盖近似空间中的近似算子进行了研究,提出了一种较已有模型更合理的覆盖粗糙集模型.但是,该覆盖粗糙集的不确定性度量却没有被研究.针对第三类覆盖粗糙集模型,定义了第三类覆盖粗糙集的粗糙隶属函数,并据此定义了第三类覆盖粗糙集的模糊度.【总页数】4页(P490-493)
【作者】胡军;王国胤
【作者单位】重庆邮电大学,计算机科学与技术研究所,重庆,400065;西安电子科技大学电子工程学院,西安,710071;重庆邮电大学,计算机科学与技术研究所,重
庆,400065
【正文语种】中文
【中图分类】TP18
【相关文献】
1.邻域关系下的覆盖粗糙集及其模糊性度量 [J], 王璐;李巧艳;王小改
2.覆盖多粒度梯形模糊数决策理论粗糙集模型 [J], 巩增泰;柴润丽
3.一种新的覆盖粗糙集及其模糊性度量 [J], 杨勇;朱英丽;李廉
4.变精度粗糙集与基于变精度粗糙集的知识模糊度量(英文) [J], 菅利荣;达庆利;陈伟达
5.变精度粗糙集与基于变精度粗糙集的知识模糊度量 [J], 菅利荣; 达庆利; 陈伟达因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可以证明, / M0 是一个偏序关系. 知识的偏序 关系从知识粒度的角度为比较知识 的含量提供方
法, 即知识越细, 知识含量越丰富, 知识的不确定性
越小. 并且, 若 R 为恒等关系 X, 即
U / X = {X X = { u }, u I U },
知 识 最 细; 若 R 为 全 域 关 系 D, 即
U / D= {X X = U}, 知识最粗. 定义 2[ 2 ] 设 ( U, R ) 为 Paw lak近似空间, 对于
任 意 集合X A U, 也称 为 U中 的一 个概 念, 有 下列
定义:
R (X ) = { x I U [ x ] R H X X ª } = G { [ x ] R I U R [ x ] R H X X ª }, ( 1)
上述研究为粗糙集的不确定性度量提供方法, 但是这些不确定性的度量方法中有些定义在某种情 况下并不合理, 即不符合认知规律. 比如, 王国胤等 指出粗糙集的不确定性度量在正域或负域的知识粒 进行细分时, 其值应该不变, 但粗糙熵却严格递减; 另外, 随着知识粒度的减小, 可能存在粗糙集的线性 模糊度不变或者二次模糊度反而增加的问题 . [ 15] 除 此之外, 我们还发现当粗糙集的下近似为空时, 粗糙 集的粗糙度与粗糙集的上近似无关. 那么, 不确定性 度量必须满足哪些条件. 满足什么条件的不确定性 度量是合理有效的. 如何设计合理有效的不确定性 度量方法. 针对这些问题, 本文从直观的认知角度, 给出粗糙集不确定性度量的基本准则和扩展准则, 并基于此对已有的不确定性度量进行分析, 为已有 的不确定性度量的合理性 ( 或不合理性 ) 提供理论 说明, 也为设计新的不确定性度量方法提供依据.
K ey W ords Uncertainty, Roughness, Rough Entropy, Fuzziness, Fuzzy Entropy, Rough Set
* 国家自然科学基金项目 ( N o. 60573068, 60773113)、重庆市自 然科学 基金重 点项目 ( N o. 2008BA 2017) 和重庆 市杰出 青年科
粗糙集理论是由波兰科学家 P aw lak在 1982年 提出的一种处理不确定性的有效工具 [ 8] . 该理论基于 等价关系, 将论域中的对象分割成一些不相交的等价 类, 并且这些等价类构成论域上的一个划分. 论域中 的子集若能够表示为这些等价类的并, 则称该子集是 确定的 ( 同时该子集也称为论域中的可定义集 ) , 否则 称该子集是粗糙的. 若某个子集是粗糙的, 则可用两 个可定义集来近似描述它, 即上、下近似. 其中, 下近 似是包含于该子集的最大可定义集, 上近似是包含该 子集的最小可定义集. 粗糙集理论由于具有不依赖于 领域先验知识的优点, 现已被广泛应用到知识获取、 机器学习和模式识别等多个领域.
2 Paw lak粗糙集基本概念
有序对 (U, R ) 称为 P aw lak 近似空间, 其中, U 是有限非空论域, R 为 U 上的一个等价关系 (即自 反, 对称, 传递 ). 根据 R 可将 U分割成一些不相交的
60 8
模式识别与人工智能
23 卷
等价类, 这些等价类构成论域上的知识, 记为 U /R.
人们分别用概率论、模糊集理论和粗糙集理论
去研究随机性、模糊性和粗糙性, 是从不同的角度去 认识不确定性. 在实际问题中, 有可能同时存在多种 形式的不确定性, 这就要求将几种不同的理论工具 进行结合, 比如模糊粗糙集或粗糙模糊集就是模糊 集理论与粗糙 集理论的结合 [ 3] . 并且, 这些不同形 式的不确定性还可以相互转化, 从而可用处理某种 不确定性的理论工具对其它的不确定性进行处理, 比如粗糙集的模糊性就是用模糊集的方法来研究粗 糙集的不确定性 [ 4- 5] , 而模糊集的粗糙性则是用粗 糙集的方法来研究模糊集的不确定性 [ 6- 7] .
求属性重要性、属性核和属性约简是粗糙集理 论中的几个主要问题, 而不确定性度量又是这些问 题的关键. 在粗糙集理论中, 根据度量的对象, 不确 定性度量可分为, 知识的不确定性度量、粗糙集 ( 概 念 ) 的不确定性度量和 决策规则的不确定性度量. 知识的不确定性度量从数量上反映近似空间的知识 含量, 比如知识的信息熵 [ 9 - 10] 、粗糙熵 [ 11- 12] 等即是 对知识不确定性的度量. 粗糙集的不确定性度量反
第 23卷 第 5 期 2010年 10月
模式识别与人工智能 PR & A I
V o.l 23 N o. 5 O ct 2010
粗糙集的不确定性度量准则*
胡 军 1, 2
王国胤 1
1 (重庆邮电大学 计算机科学与技术研究所 重庆 400065) 2 (西安电子科技大学 电子工程学院 西安 710071)
Chongqing 400065) 2 ( School of E lectronic Engineering, X id ian University, X ia'n 710071)
ABSTRACT
S ince som e uncertainty m easures o f rough sets are unreasonab le under som e circum stances, a basic rule set o f uncerta inty m easure o f rough set is proposed from the perspective of intuition. A ll the uncertain ty m easures ex cept the quadratic fuzziness satisfy the basic rule se.t T he uncerta inty m easures satisfy ing the basic rule set st ill have unreasonab ility, and thus an ex tended rule set is further developed. The fuzzy entropy and rev ised fuzziness are the uncertainty m easures satisfy ing the ex tended ru le se,t w hile the roughness, rough entropy and linear fuzziness are no.t T he results prov ide theo retica l basis o f the reasonab ility or unreasonab ility for the ex isting uncerta inty m easures, and it is a foundat ion for design ing new uncertainty m easures.
[ x ] R 表示包含对象 x 的等价类, 称为知识粒. 定义 1[ 19] 设 R 1 和 R2 是论域 U 上的两个等价
关系, 若 P x I U ( [ x ] R 1 A [ x ] R2 ), 则称知识 U /R 1 较 U /R 2 细, 记为 U /R 1 M U /R2, 简记 为 R 1 M R 2. 若 P xI U ( [ x ] R1 = [ x ] R 2 ), 则称知识 U /R 1 与 U /R 2 相 等, 记为 U /R 1 U U /R2, 简记为 R1 U R2. 若 U /R1 M U /R 2 且 U /R1 X U /R 2, 则称知识 U /R 1 较 U /R2 严格 细, 记为 U /R 1 ; U /R 2, 简记为 R1 ; R 2.
映给定近似空间对概念的近似能力, 对此研究者提 出粗糙度 [ 2] 、粗 糙熵 [ 13- 14] 、模 糊度 [ 4 ] 、模糊熵 [ 5] 和 修正模糊度 [ 15] 等. 决策规则的不确定性度量有近似 分类精度 [ 16] 、近似分类质量 [ 16] 和条件信息熵 [ 17 - 18] 等, 它反映近似空间对决策的分类能力. 可见, 知识 的不确定性对概念的不确定性和决策规则的不确定 性有决定作用. 反之, 粗糙集的不确定性和决策规则 的不确定性也一定程度反映知识的不确定性.
关键词 不确定性, 粗糙度, 粗糙 熵, 模糊度, 模糊熵, 粗糙集 中图法分类号 T P 181
Uncertainty M easure R ule Sets of R ough Sets
HU Jun1, 2, WANG G uo-Y in1 1 ( Institute of Com puter Science and T echnology, Chongqing University of Posts and T elecomm unications,
关于粗糙集的不确定性度量, 目前主要有粗糙 度、粗糙 熵、模 糊度 ( 包括 线性模糊 度和二次 模糊 度 ) 、模糊熵和修正模糊度. 其中, 粗糙度基 于粗糙 集的代数特征, 它在数量上等于边界域与上近似中 元素个数的比值 [ 2 ] . 粱吉业等借 用熵的称谓, 将粗 糙熵定义为知识粗糙熵与粗糙度的乘积 [ 13] , 该定义 和 Beaubouef 等 所 提 出 的 粗 糙 熵 本 质 上 是 一 致 的 [ 14] . Chakrabarty等通过量化论域中对象与目标集 合的隶属关系, 基于模糊性与粗糙性在反映不确定 性上的一致性, 提出粗糙集的模糊度, 从而用模糊集 的方法间接对粗糙集的不确定性进行量化分析, 为 粗糙集的不确定性度量 提供新思路 [ 4] . 此后, 基于 和 Chakrabarty 同样的思路, L iang 等提出 粗糙集的 模糊熵 [ 5] , 王国胤等提出一种模 糊度, 这里 将其称 为修正模糊度 [ 15] .
国胤, 男, 1970年生, 教授, 博士生导师, 主要研究方向为粗糙集理论、粒计算、知识技术、神经网络、数据挖掘等.
相关文档
最新文档