第七章粗糙集理论

合集下载

粗糙集理论优质获奖课件

点之
若rij＝1, 且 i≠j, 则rji＝0
对M2中1所在位置,M 中相应位置都是1
假如两假如顶
点之
点xi
间有边, 到xj有边,
一定
xj
13
4、等价关系
等价关系旳定义：设R是非空集合A上旳关系，假如满足 ⑴ R是自反旳; ⑵ R是对称旳; ⑶ R是传递旳; 则称R是A上旳等价关系。
21
内容提要
一、概述二、知识分类三、知识旳约简四、决策表旳约简五、粗糙集旳扩展模型六、粗糙集旳试验系统七、粒度计算简介
22
一、概述
现实生活中有许多模糊现象并不能简朴地用真、假值来表达﹐怎样表达和处理这些现象就成为一种研究领域。早在1923年谓词逻辑旳创始人G.Frege就提出了模糊(Vague)一词，他把它归结到边界线上，也就是说在全域上存在某些个体既不能在其某个子集上分类，也不能在该子集旳补集上分类。
自反性反自反性对称性反对称性传递性
12
关系性质旳三种等价条件
体现式
关系矩阵
关系图
自反性 IAR
主对角线元素全是1
每个顶点都有环
反自反性 R∩IA=
主对角线元素全是 0
每个顶点都没有环
对称性 R=R1
反对称性 R∩R1 IA
传递性 RRR
矩阵是对称矩阵
假如两个顶
定义假如一种集合满足下列条件之一：（1）集合非空, 且它旳元素都是有序对（2）集合是空集则称该集合为一种二元关系, 简称为关系，记作R. 如<x,y>∈R, 可记作 xRy；假如<x,y>R, 则记作xRy
实例：R={<1,2>,<a,b>}, S={<1,2>,a,b}. R是二元关系, 当a, b不是有序对时，S不是二元关系根据上面旳记法，能够写1R2, aRb, aSb等.

粗糙集理论

粗糙集理论与应用研究综述王国胤1Yiyu Yao2 于洪1,2(1重庆邮电大学计算机科学与技术研究所重庆400065)(2Department of Computer Science, University of Regina, Regina, Canada S4S 0A2){wanggy, yuhong}@, yyao@cs.uregina.ca摘要本文在阐释粗糙集理论基本体系结构的基础上，从多个角度探讨粗糙集模型的研究思路，分析粗糙集理论与模糊集、证据理论、粒计算、形式概念分析、知识空间等其他理论之间的联系，介绍国内外关于粗糙集理论研究的主要方向和发展状况，讨论当前粗糙集理论研究的热点研究领域，以及将来需要重点研究的主要问题。

关键词粗糙集，模糊集，粒计算，形式概念分析，知识空间，智能信息处理A Survey on Rough Set Theory and Its ApplicationWang Guo-Yin1Yao Yi-Yu2 Yu Hong1,21 Institute of Computer Science and Technology, Chongqing University of Posts and Telecommunications, Chongqing, 4000652 Department of Computer Science, University of Regina, Regina, Saskatchewan, Canada, S4S 0A2Abstract This paper introduces the basic ideas and framework of rough set theory and the different views of knowledge representation in rough set theory, and then discusses the relations between the rough set theory and the other theories, such as fuzzy set, evidence theory, granular computing, formal concept analyzing, knowledge space, etc. Furthermore, the paper reviews the recent studies for this theory and a survey on its applications is also given. The future development trend of rough set theory is also discussed.Keywords rough set, fuzzy set, granular computing, formal concept analyzing, knowledge space, intelligent information processing1 引言智能信息处理是当前信息科学理论和应用研究中的一个热点领域。

粗糙集的简单应用解析

pos (C ?{P }) ( D ) ? {t1, t2 , t3 , t4 , t6 , t8} ? posC (D) pos (C ?{Q}) ( D ) ? {t1 , t2 , t3 , t4 } ? pos C ( D )
pos(C ?{ R}) ( D) ? ? ? pos C (D)
第二十一页，编辑于星期三：二点三十分。
规则提取
提取决策规则可以得到以下确定性规则：
(购买Q)且(不购买 R)—— (不购买 S) (购买 Q)且(购买 R) ——(购买S)
不确定规则为：
(不购买 Q)且(购买 R) —— (购买 S) ? (不买 Q买R，买 S ) ? 0.5
(不购买Q)且(购买 R)——(不购买 S)
论域， U 中的每个 xi (i ? n) 称为一个对象；
（2）A 是属性的非空有限集合，即 A ? {a1 , a2 ,? , an } ， A 中
的每个 a j ( j ? m) 称为一个属性；
（3）V
?
?
a?
A
Va，Va
是属性的值域；
（ 4） f :U ? A ? V 称为信息函数，它为每个对象关于每个
i Cij 表示分辨矩阵中第行，第 j 列的元素，Cij 被定义为：
C ij
?
??{a ? ? ??
A a ( xi ) ? a ( xj )}, D( xi ) ?
? , D (xi ) ? D( x j )
D(xj )
其中 i, j ? 1,2,? , n; n ? U
定义2.10 区分函数是从分辨矩阵中构造的。约简算法的方法
定理2 core ( A) ? ? red ( A)，其中 red ( A) 表示 A 的所有约简。

粗糙集

例
对于上表来说，U中有四个对象（概念），而现在条件集合中只有一个属性，对于U1和U2来说，它们的p不同所以可以通过p来区分，即u1,u2在p 下可区分；而U2和U3虽然是不同的对象但是在P 下却是相同的，即在p下不可区分，就成为不可区分
粗糙集：
一个集合若恰好等于基本集的任意并集称为一个清晰（crisp）集（精确集），否则称为粗糙（rough）集（不精确集）。解释：都可区分的是清晰集，有不可区分的对象为粗糙集主要特点:以不完全信息或知识去处理一些不分明现象的能力,或依据观察、度量到的某些不精确的结果而进行分类数据的能力. 粗糙集体现了集合中元素间的不可区分性. 主要优势:它不需要提供问题所需处理的数据集合之外的任何先验知识,而且与处理其它不确定性问题的理论有很强的互补性.
粗糙集理论所处理的问题
•不确定或不精确知识的表达; •经验学习并从经验中获取知识; •不一致信息的分析; •根据不确定,不完整的知识进行推理; •在保留信息的前提下进行数据化简; •近似模式分类; •识别并评估数据之间的依赖关系
三、粗糙集的应用
粗糙集理论在许多领域得到了应用： ①临床医疗诊断；
②电力系统和其他工业过程故障诊断；
3. 如果P中的任何一条属性都是不可简约的，那么就称P是独立的解释：P是独立的说明P中的任何一个属性都是必不可少的，它独立的表达一个系统分类的特征。
属性约简的算法分析：
初始状态：所有数据已存入数据库(以下为模拟数据)
u 1 2 3 4 5 6
a 1 1 0 1 1 2
b 0 0 0 1 1 1
集合O 的下逼近(即正区) 为 I 3 (O ) = PO S (O ) = {刘保,赵凯} 集合O 的负区为 N EG (O ) = {李得} 集合O 的边界区为 BND (O ) = {王治, 马丽} 集合O 的上逼近为 I 3 (O ) = PO S (O ) + BND (O ) = {刘保,赵凯,王治,马丽} 根据表1, 可以归纳出下面几条规则, 揭示了教育程度与是否能找到好工作之间的关 RUL E 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作) RUL E 2: IF (教育程度= 小学) THEN (找不到好工作) RUL E 3: IF (教育程度= 高中) THEN (可能找到好工作)

粗糙集理论介绍

粗糙集理论介绍
问题的提出：知识的含糊性
术语的模糊性，如高矮数据的不确定性，如噪声知识自身的不确定性，如规则的前后件间的依赖关系不完全可靠不完备性，数据缺失
由此，提出了包括
概率与统计、证据理论：理论上还难以令人信服，
不能处理模糊和不完整的数据
模糊集合理论：能处理模糊类数据，但要提供隶属
函数（先验知识）
so
例2：（表2）
R1(颜色) R2(形状) R3(体积) class
X1
红
圆形
小
1
X2
蓝
方形
大
1
X3
红
三角形
小
1
X4
蓝
三角形
小
1
X5
黄
圆形
小
2
X6
黄
方形
小
2
X7
红
三角形
大
2
X8
黄
三角形
大
2
等价类IND(R1)={{x1,x3,x7}, {x2,x4}, {x5,x6,x8}}
X={X1,X2,X3,X4}
Step2. 针对各个属性下的初等集合寻找下近似和上近似。
以“头疼＋肌肉痛＋体温”为例，设集合X为患流感的人的集合，I为3个属性构成的一个等效关系： {p1},{p2,p5},{p3},{p4},{p6}，则
X={P1,P2,P3,P6} I={{p1},{p2,p5},{p3},{p4},{p6}}
粗糙集在数据挖掘中的应用基于粗糙集的数据约简
返回
1. 粗糙集在数据挖掘中的应用
粗糙集对不精确概念的描述是通过上、下近似这两个精确概念来表示的。
粗糙集理论的的数学基础：假定所研究的每一个对象都涉及到一些信息（数据、知识），如果对象由相同的信息描述，那么它们就是相似的或不可区分的。

粗糙集理论及其应用研究

粗糙集理论及其应用研究一、粗糙集理论概述粗糙集是一种用于解决不确定性问题的数学工具。

粗糙集理论中知识被理解为对事物进行区分的能力，在形式上表现为对论域的划分，因而通过论域上的等价关系表示。

粗糙集通过一对上、下近似算子来刻画事物，它不需要数据以外的任何先验知识，因此具有很高的客观性。

目前，粗糙集被广泛用于决策分析、机器学习、数据挖掘等领域[1~6]。

二、粗糙集中的基本概念[7]定义1 论域、概念。

设U是所需研究的对象组成的非空有限集合，称为一个论域，即论域U。

论域U的任意一个子集XU，称为论域U的一个概念。

论域U中任意一个子集簇称为关于U的知识。

定义2 知识库。

给定一个论域U和U上的一簇等价关系S，称二元组K=(U，S)是关于论域U的知识库或近似空间。

定义3 不可分辨关系。

给定一个论域U和U上的一簇等价关系S，若PS，且P≠?，则∩P仍然是论域U上的一个等价关系，称为P上的不可分辨关系，记做IND(P)。

称划分U/IND(P)为知识库K=(U，S)中关于论域U的P-基本知识。

定义4 上近似、下近似。

设有知识库K=(U，S)。

其中U为论域，S为U 上的一簇等价关系。

对于X∈U和论域U上的一个等价关系R∈IND(K)，则X关于R的下近似和上近似分别为：下近似R(X)=∪{Y∈U/R|YX}上近似R(X)=∪{Y∈U/R|Y∩X=?}集合的上近似和下近似是粗糙集中最核心的概念，粗糙集的数字特征以及拓扑特征都是由它们来描述和刻画的。

当R=(X)时，称X是R-精确集;当R(X)≠(X)时，称X是R-粗糙集，即X是粗糙集。

三、粗糙集理论的优势随着人们对粗糙集理论的不断研究，它的应用领域在不断扩大，粗糙集理论的优势在于:1)他不需要专家的经验知识，而仅利用现实实例数据本身提供的信息;2)能搜索数据的最小集合，能从实例数据中获取易于证实的规则知识，最后，它同时允许使用定性和定量的数据。

近年来，粗糙集理论应用到了许多领域。

粗糙集理论的基本概念与原理

粗糙集理论的基本概念与原理粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具，它的提出源于20世纪80年代初期的波兰学者Zdzisław Pawlak。

粗糙集理论的核心思想是通过将数据划分成不同的等价类，来描述和处理不完全和不确知的信息。

本文将介绍粗糙集理论的基本概念与原理。

1. 粗糙集的定义与等价关系粗糙集是指将一个数据集划分成若干个等价类，其中每个等价类称为一个粗糙集。

在粗糙集理论中，等价关系是一个重要的概念。

等价关系是指具有自反性、对称性和传递性的关系。

在粗糙集理论中，等价关系用来描述数据中的相似性和差异性。

2. 上近似集与下近似集上近似集是指在一个粗糙集中，包含了所有与该粗糙集中的元素相似的元素。

下近似集是指在一个粗糙集中，包含了所有与该粗糙集中的元素不相似的元素。

上近似集和下近似集是粗糙集理论中的两个重要概念，它们用来描述数据的粗糙性和不确定性。

3. 约简与精确度约简是粗糙集理论中的一个重要操作，它的目的是通过删除一些不必要的属性或条件，从而减少数据集的复杂性，提高数据的处理效率。

约简可以通过删除一些不重要或不相关的属性来实现。

精确度是用来评估数据集的质量和可靠性的指标，粗糙集理论通过约简来提高数据集的精确度。

4. 粗糙集与模糊集粗糙集理论与模糊集理论有一些相似之处，但也存在一些差异。

模糊集理论是一种用来处理模糊和不确定性问题的数学工具，它通过给每个元素赋予一个隶属度来描述元素的模糊性。

而粗糙集理论是一种用来处理不完全和不确知信息的数学工具，它通过将数据划分成不同的等价类来描述数据的粗糙性。

5. 粗糙集的应用领域粗糙集理论在许多领域中都有广泛的应用。

在数据挖掘领域，粗糙集理论可以用来处理不完全和不确定的数据。

在人工智能领域，粗糙集理论可以用来处理模糊和不确定性问题。

在决策支持系统领域，粗糙集理论可以用来辅助决策过程。

在模式识别领域，粗糙集理论可以用来提取和分类模式。

总结：粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具，它通过将数据划分成不同的等价类来描述和处理不完全和不确知的信息。

粗糙集 (ppt)

一、概述二、知识分类三、知识的约简四、决策表的约简五、粗糙集的扩展模型六、粗糙集的实验系统七、粒度计算简介
2
一、概述
现实生活中有许多含糊现象并不能简单地用真、假值来表示﹐如何表示和处理这些现象就成为一个研究领域。早在1904年谓词逻辑的创始人G.Frege就提出了含糊(Vague) 一词，他把它归结到边界线上，也就是说在全域上存在一些个体既不能在其某个子集上分类，也不能在该子集的补集上分类。
12
Issues in the Decision Table
• The same or indiscernible objects may be represented several times. • Some of the attributes may be superfluous.
13
不可区分性Indiscernibility
二、知识分类
为数学处理方便起见，在下面的定义中用等价关系来代替分类。一个近似空间(approximate space)（或知识库）定义为一个关系系统（或二元组）
K=(U,R)
其中U（为空集）是一个被称为全域或论域(universe) 的所有要讨论的个体的集合，R是U上等价关系的一个族集。
7
二、知识分类
设PR，且P ，P中所有等价关系的交集称为P上的一种不可区分关系(indiscernbility relation) 记作IND(P)，即
[x]IND(p)= ∩[x]R RP 注意，IND(P)也是等价关系且是唯一的。
8
二、知识分类
给定近似空间K=(U, R)，子集XU称为U上的一个概念 (concept)，形式上，空集也视为一个概念；非空子族集 PR所产生的不可区分关系IND(P)的所有等价类关系的集合即U/IND(P)，称为基本知识(basic knowledge)，相应的等价类称为基本概念(basic concept)；特别地，若关系QR，则关系Q就称为初等知识(elementary knowledge)，相应的等价类就称为初等概念(elementary concept)。根据上述定义可知，概念即对象的集合，概念的族集（分类）就是U上的知识，U上分类的族集可以认为是U上的一个知识库，或说知识库即是分类方法的集合。

粗糙集理论简介及基本概念解析

粗糙集理论简介及基本概念解析粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具，它由波兰学者Pawlak于1982年提出。

粗糙集理论的核心思想是通过对数据进行粗糙化处理，将不完全、不确定的信息转化为可处理的粗糙集，进而进行数据分析和决策。

粗糙集理论的基本概念包括：粗糙集、等价关系、下近似集和上近似集。

首先，粗糙集是指在不完全信息条件下，通过将数据进行粗糙化处理得到的集合。

粗糙集可以看作是原始数据的一个近似描述，它包含了原始数据的一部分信息。

粗糙集的构建是通过等价关系来实现的。

其次，等价关系是粗糙集理论中的一个重要概念。

等价关系是指在给定的数据集中，将数据划分为若干等价类的关系。

等价关系的划分可以通过相似性度量来实现，相似性度量可以是欧氏距离、余弦相似度等。

等价关系的划分可以将原始数据进行分类，从而构建粗糙集。

下面，我们来介绍下近似集和上近似集。

下近似集是指在给定的粗糙集中，对于某个特定的属性或条件，能够确定的元素的集合。

换句话说，下近似集是能够满足某个条件的元素的集合，它是粗糙集的一个子集。

而上近似集是指在给定的粗糙集中，对于某个特定的属性或条件，可能满足的元素的集合。

上近似集是包含下近似集的最小集合，它是粗糙集的一个超集。

粗糙集理论的应用非常广泛，特别是在数据挖掘和模式识别领域。

通过粗糙集理论，可以对大量的数据进行处理和分析，从中发现隐藏的规律和模式。

粗糙集理论可以用于特征选择、属性约简、数据分类等任务，为决策提供有力支持。

总结起来，粗糙集理论是一种处理不确定性和模糊性问题的数学工具。

它通过粗糙化处理将不完全、不确定的信息转化为可处理的粗糙集，进而进行数据分析和决策。

粗糙集理论的基本概念包括粗糙集、等价关系、下近似集和上近似集。

粗糙集理论在数据挖掘和模式识别领域有着广泛的应用，可以用于特征选择、属性约简、数据分类等任务。

通过粗糙集理论，我们可以更好地理解和处理不确定性和模糊性问题，为决策提供有力支持。

粗糙集理论的使用方法与步骤详解

粗糙集理论的使用方法与步骤详解引言：粗糙集理论是一种用来处理不确定性和模糊性问题的数学工具，它在数据分析和决策支持系统中得到了广泛的应用。

本文将详细介绍粗糙集理论的使用方法与步骤，帮助读者更好地理解和应用这一理论。

一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的，它是一种基于近似和粗糙程度的数学理论。

粗糙集理论的核心思想是通过对属性间的关系进行分析，识别出数据集中的重要特征和规律。

它主要包括近似集、正域、决策表等概念。

二、粗糙集理论的使用方法1. 数据预处理在使用粗糙集理论之前，首先需要对原始数据进行预处理。

这包括数据清洗、数据变换和数据归一化等步骤，以确保数据的准确性和一致性。

2. 构建决策表决策表是粗糙集理论中的重要概念，它由属性和决策构成。

构建决策表时，需要确定属性集和决策集，并将其表示为一个矩阵。

属性集包括原始数据中的各个属性，而决策集则是属性的决策结果。

3. 确定正域正域是指满足某一条件的样本集合，它是粗糙集理论中的关键概念。

通过对决策表进行分析，可以确定正域，即满足给定条件的样本集合。

正域的确定可以通过计算属性的约简度或者使用启发式算法等方法。

4. 近似集的计算近似集是粗糙集理论中的核心概念，它是指属性集在正域中的近似表示。

通过计算属性集在正域中的近似集，可以确定属性之间的关系和重要程度。

近似集的计算可以使用不同的算法，如基于粒计算、基于覆盖算法等。

5. 属性约简属性约简是粗糙集理论中的一个重要问题，它是指从属性集中选择出最小的子集，保持属性集在正域中的近似表示不变。

属性约简的目标是减少属性集的复杂性，提高数据分析和决策的效率。

属性约简可以通过计算属性的重要度、使用启发式算法或者遗传算法等方法实现。

6. 决策规则的提取决策规则是粗糙集理论中的重要结果，它是从决策表中提取出来的一组条件和决策的组合。

决策规则可以帮助我们理解数据集中的规律和特征，从而做出更好的决策。

粗糙集理论及其应用研究

粗糙集理论的核心内容
知识的约简与核
知识的约简：通过删除不重要的知识，保留关键信息
核的概念：核是知识的最小表示，包含所有必要信息
核的性质：核具有独立性、完备性和最小性
核的求取方法：基于信息熵、信息增益等方法进行求取
0
0
0
0
1
2
3
4
决策表的简化
决策表：用于描述决策问题的表格简化目标：减少决策表的规模，提高决策效率简化方法：合并条件属性，删除冗余属性简化效果：提高决策表的可读性和可理解性，降低决策复杂度
粗糙集理论在聚类分析中的应用：利用粗糙集理论处理不确定和不完整的数据，提高聚类分析的准确性和效率。
聚类分析在数据挖掘中的应用：可以帮助发现数据中的模式和趋势，为决策提供支持。
粗糙集理论在其他领域的应用
决策支持系统
粗糙集理论可以帮助决策者处理不确定性和模糊性
粗糙集理论在决策支持系统中的应用
粗糙集理论可以提高决策支持系统的准确性和效率
粗糙集理论在决策支持系统中的实际应用案例分析
智能控制
粗糙集理论在模糊控制中的应用
粗糙集理论在智能控制中的应用
粗糙集理论在神经网络控制中的应用
粗糙集理论在自适应控制中的应用
模式识别
粗糙集理论在模式识别中的应用
粗糙集理论在图像识别中的应用
粗糙集理论在语音识别中的应用
粗糙集理论在生物信息学中的应用
添加标题
添加标题
ห้องสมุดไป่ตู้添加标题
添加标题
机器学习
粗糙集理论在机器学习中的应用粗糙集理论在数据挖掘中的应用粗糙集理论在模式识别中的应用粗糙集理论在自然语言处理中的应用

经典粗糙集理论

粗糙集理论能够处理不确定性和模糊性，而神经网络则能够通过学习过程找到数据中的模式。将粗糙集与神经网络结合，可以利用粗糙集对数据的不确定性进行建模，并通过神经网络进行分类或预测。
粗糙集可以用于提取数据中的决策规则，这些规则可以作为神经网络的训练样本。通过训练，神经网络可以学习到决策规则，并用于分类或预测。
边界区域
近似集合中的不确定性区域，即既不属于正域也不属于负域的元素集合。
粗糙集的度量
精确度
描述了集合中元素被近似集合包含的程度，即属于近似集合
的元素比例。
覆盖度
描述了近似集合能够覆盖的元素数量，即近似集合的大小。
粗糙度
描述了集合被近似程度，是精确度和覆盖度的综合反映。
知识的不确定性
描述了知识表达系统中属性值的不确定性程度，与粗糙度相
经典粗糙集理论
目录
• 粗糙集理论概述 • 粗糙集的基本概念 • 粗糙集的运算与性质 • 粗糙集的决策分析 • 粗糙集与其他方法的结合 • 经典粗糙集理论案例研究
01 粗糙集理论概述
定义与特点
定义
粗糙集理论是一种处理不确定性和模糊性的数学工具，通过集合近似的方式描述知识的不完全性和不确定性。
粗糙集理论中的属性约简可以用于简化神经网络的输入特征，降低输入维度，提高分类或预测的准确率。
粗糙集与遗传算法
01
遗传算法是一种全局优化算法，能够通过模拟自然界的进化过程来寻找最优解。将粗糙集与遗传算法结合，可以利用粗糙集对数据的分类能力，结合遗传算法的全局搜索能力，寻找最优的分类规则或决策规则。
02
粗糙集可以用于生成初始的分类规则或决策规则，然后利用遗传算法对这些规则进行优化，通过选择、交叉、变异等操作，寻找最优的规则组合。

粗糙集理论及其应用综述

粗糙集理论及其应用综述3韩祯祥　张　琦　文福拴(浙江大学电机系・杭州,310027) 摘要:粗糙集理论是一种较新的软计算方法,可以有效地分析和处理不完备信息.该理论近年日益受到国际学术届的重视,已经在模式识别、机器学习、决策支持、过程控制、预测建模等许多科学与工程领域得到成功的应用.本文介绍了粗糙集理论的基本概念,对其在各领域的应用情况进行了综述.关键词:粗糙集;不确定性;数据分析;软计算;粗糙控制A Survey on R ough Set Theory and Its ApplicationHan Zhenxiang ,　Zhang Qi and Wen Fushuan(Department of E lectrical Engineering ,Zhejiang University ・Hangzhou ,310027,P.R.China )Abstract :R ough set theory is a relatively new s oft com putingtool to deal with vagueness and uncertainty.I t has received much attention of the researchers around the w orld.R ough set theory has been applied to many areas success fully including pattern recognition ,machine learning ,decision support ,process control and predictive m odeling.This paper introduces the basic concepts of rough set.A survey on its applicatoins is als o given.K ey w ords :rough set ;uncertainty ;data analysis ;s oft com puting ;rough control1　引言(Introduction )粗糙集(R ougn Set ,RS )理论是一种刻划不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[1].RS 理论是由波兰学者Pawlak Z 在1982年[2]提出的.1991年Pawlak Z 出版了专著[3],系统全面地阐述了RS 理论,奠定了严密的数学基础.该书与1992年出版的RS 理论应用专集[4]较好地总结了这一时期RS 理论与实践的研究成果,促进了它的进一步发展,现已成为学习和应用RS 理论的重要文献.从1992年至今,每年都召开以RS 为主题的国际会议,推动了RS 理论的拓展和应用.国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家.目前RS 理论已成为人工智能领域中一个较新的学术热点,引起了越来越多的科研人员的关注.2　粗糙集理论的基本概念(Basic concepts of rough settheory )2.1　知识与不可分辨关系(K nowledge and indiscernibility rela 2tion )在RS 理论中,“知识”被认为一种将现实或抽象的对象进行分类的能力[3].假定我们具有关于论域的某种知识,并使用属性(attribute )及其值(value )来描述论域中的对象.例如:空间物体集合U 具有“颜色”、“形状”这两种属性,“颜色”的属性值取为红、黄、绿,“形状”的属性值取为方、圆、三角形.从离散数学的观点看,“颜色”、“形状”构成了U 上的一族等效关系(equivalent relation ).U 中的物体,按照“颜色”这一等效关系,可以划分为“红色的物体”、“黄色的物体”、“绿色的物体”等集合;按照“形状”这一等效关系,可以划分为“方的物体”、“圆的物体”、“三角形的物体”等集合;按照“颜色+形状”这一合成等效关系,又可以划分为“红色的圆物体”、“黄色的方物体”、“绿色的三角形物体”…等集合.如果两个物体同属于“红色的圆物体”这一集合,它们之间是不可分辨关系(indiscernibility relation ),因为描述它们的属性都是“红”和“圆”.不可分辨关系的概念是RS 理论的基石,它揭示出论域知识的颗粒状结构.2.2　粗糙集合的下逼近、上逼近、边界区和粗糙隶属函数(Lower and upper approximation of rough set ,boundary region and rough membership function )给定一个有限的非空集合U 称为论域,R 为U 上的一族等效关系.R 将U 划分为互不相交的基本等效类,二元对K=(U ,R )构成一个近似空间(approximation space ).设X 为U的一个子集,a 为U 中的一个对象,[a ]R 表示所有与a 不可分辨的对象所组成的集合,即由a 决定的等效类.当集合X 能表示成基本等效类组成的并集时,则称集合X 是可以精确定义的;否则,集合X 只能通过逼近的方式来刻划.集合X 关于R 的下逼近(lower approximation )定义为:R 3(X )={a ∈U :[a ]R ΑX}.(1)R 3(X )实际上是由那些根据已有知识判断肯定属于X 的对象所组成的最大的集合,也称为X 的正区(positive region ),记　3国家自然科学基金资助项目(59777011).本文于1997年9月3日收到.1998年11月18日收到修改稿.第16卷第2期1999年4月控制理论与应用CONTROL THEORY AND APPLICATIONS Vol.16,No.2Apr.,1999作POS (X ).由根据已有知识判断肯定不属于X 的对象组成的集合称为X 的负区(negative region ).记作NEG (X ).集合X 关于R 的上逼近(upper approximation )定义为R 3(X )={a∈U :[a ]R ∩X ≠ }.(2)R 3(X )是由所有与X 相交非空的等效类[a ]R 的并集,是那些可能属于X 的对象组成的最小集合.显然,R 3(X )+NEG (X )=论域U.集合X 的边界区(boundary region )定义为:BN (X )=R 3(X )-R 3(X ).(3)BN (X )为集合X 的上逼近与下逼近之差.如果BN (X )是空集,则称X 关于R 是清晰的(crisp );反之如果BN (X )不是空集,则称集合X 为关于R 的粗糙集(rough set ).图1为粗糙集概念的示意图.下逼近、上逼近及边界区等概念刻划了一个不能精确定义的集合的逼近特性.逼近精度定义为αR (X )=|R 3(X )||R 3(X )|.(4)式中|R 3(X )|表示集合R 3(X )的基数或势(cardinality ),对有限集合来说表示集合中所包含元素的个数.显然,0≤αR (X )≤1,如果αR (X )=1,则称集合X 相对于R 是清晰的;αR (X )<1,则称集合X 相对于R 是粗糙的.αR (X )可认为是在等效关系R 下逼近集合X 的精度.RS 理论中定义了粗糙隶属函数(rough membership func 2tion ).通过使用不可分辨关系,定义元素a 对集合X 的粗糙隶属函数如下μRX (a )=|X ∩[a ]R ||[a ]R |.(5)显然0≤μRX ≤1,粗糙隶属函数也可以用来定义集合X 的上、下逼近和边界区.现举例说明粗糙集的概念.论域U 及等效关系R ={R 1,R 2}采用如下定义:U ={x 1,x 2,x 3,x 4,x 5,x 6,x 7,x 8,x 9,x 10},U/R 1={{x 1,x 2,x 3,x 4},{x 5,x 6,x 7,x 8,x 9,x 10}},U/R 2={{x 1,x 2,x 3},{x 4,x 5,x 6,x 7},{x 8,x 9,x 10}},U/R ={{x 2,x 3},{x 4},{x 5,x 6,x 7},{x 8,x 9,x 10}}.则关于集合X ={x 1,x 2,x 3,x 4,x 5}的逼近为POS (X )={x 4},NEG (X )={x 8,x 9,x 10},BN (X )={x 1,x 2,x 3,x 5,x 6,x 7}.{x 4}是集合X 的正区,因为x 4肯定属于X ;{x 8,x 9,x 10}肯定不属于X ,因此为X 的负区;{x 1,x 2,x 3,x 5,x 6,x 7}是否属于X 在等效关系R 下无法确定,构成了X 的边界区.2.3　决策表、约简与核(Decision table ,reduct and core )RS 理论中应用决策表来描述论域中对象.它是一张二维表格,每一行描述一个对象,每一列描述对象的一种属性.属性分为条件属性和决策属性,论域中的对象根据条件属性的不同,被划分到具有不同决策属性的决策类.表1为一张决策表,论域U 有5个对象,编号1～5,{a ,b ,c}是条件属性集,d 为决策属性.对于分类来说,并非所有的条件属性都是必要的,有些是多余的,去除这些属性不会影响原来的分类效果.约简(reduct )定义为不含多余属性并保证分类正确的最小条件属性集.一个决策表可能同时存在几个约简,这些约简的交集定义为决策表的核(core ),核中的属性是影响分类的重要属性.表1化简后得到了两个约简:{a ,c}和{b ,c},见表2和表3.它们维持了与原有条件属性集{a ,b ,c}相同的分类能力.{c}是核,表明c 是影响分类的重要属性.表1　决策表T able 1　Decision tableUabcd110212210232123412215123表2　约简{a ,c}T able 2　Reduct {a ,c}Uacd112122023223513表3　约简{b ,c}T able 3　Reduct {b ,c}Ubcd10312102312342215203 从另一个角度看,决策表中每一个对象都蕴含着一条分类规则,决策表实际上也是一组逻辑规则的集合.例如表1中的对象1蕴含的规则是a 1b 0c 2]d 1.化简决策表的过程也就是抽取分类规则的过程.表2中对象4在去掉属性b 后154　控制理论与应用16卷　与对象1蕴含相同的分类规则,为避免重复而被除去.约简中的规则还可进一步化简,删除那些与分类无关的次要属性.表3第一行中的“3”表示属性c的取值不重要,即只要b =0,d一定为1(b0]d1).“约简”和“核”这两个概念很重要,是RS方法的精华. RS理论提供了搜索约简和核的方法.计算约简的复杂性随着决策表的增大呈指数增长,是一个典型的NP完全问题,当然实际中没有必要求出所有的约简.引入启发式的搜索方法如遗传算法[10]有助于找到较优的约简,即所含条件属性最少的约简.3　粗糙集理论的特点(Features of rough set theory)1)RS不需要先验知识.模糊集和概率统计方法是处理不确定信息的常用方法,但这些方法需要一些数据的附加信息或先验知识,如模糊隶属函数和概率分布等,这些信息有时并不容易得到.RS分析方法仅利用数据本身提供的信息,无须任何先验知识.2)RS是一个强大的数据分析工具.它能表达和处理不完备信息;能在保留关键信息的前提下对数据进行化简并求得知识的最小表达;能识别并评估数据之间的依赖关系,揭示出概念简单的模式;能从经验数据中获取易于证实的规则知识,特别适于智能控制.3)RS与模糊集分别刻划了不完备信息的两个方面[5]: RS以不可分辨关系为基础,侧重分类,模糊集基于元素对集合隶属程度的不同,强调集合本身的含混性(vagueness).从RS的观点看,粗糙集合不能清晰定义的原因是缺乏足够的论域知识,但可以用一对清晰集合逼近.有关RS和模糊集内在联系的阐述及模糊粗糙集(fuzzy2rough set)的概念,请参见文[6～8].RS和证据理论也有一些相互交叠之处[9],在实际应用中可以相互补充.4　粗糙集理论的应用(Applications of rough set theo2 ry)RS理论的生命力在于它具有较强的实用性,从诞生到现在虽然只有十几年的时间,但已经在许多领域取得了令人鼓舞的成果.1)股票数据分析.文[11]应用RS方法分析了十年间股票的历史数据,研究了股票价格与经济指数之间的依赖关系,获得的预测规则得到了华尔街证券交易专家的认可.2)模式识别.文[12]应用RS方法研究了手写字符识别问题,提取出了特征属性.3)地震预报.文[13]研究了地震前的地质和气象数据与里氏地震级别的依赖关系.4)冲突分析.文[14]应用RS方法建立了反映以色列、巴勒斯坦、约旦、埃及、叙利亚和沙特阿拉伯等六国关于中东和平问题各自立场的谈判模型.5)从数据库中知识发现(knowledge discovery in database, K DD)[15,16].K DD又称数据发掘(data mining),是当前人工智能和数据库技术交叉学科的研究热点之一.RS方法现已成为K DD的一种重要方法,其导出的知识精练且更便于存储和使用.6)粗糙控制(rough control)[17～23].RS根据观测数据获得控制策略的方法被称为从范例中学习(learning from exam2 ples),属于智能控制的范畴.基本步骤是:把控制过程中的一些有代表性的状态以及操作人员在这些状态下所采取的控制策略都记录下来,形成决策表,然后对其分析化简,总结出控制规则[17,18].形式为:IF C ondition=N满足THE N采取De2 cision=M.RS方法是一类符号化分析方法,需要将连续的控制变量离散化,为此Pawlak Z提出了粗糙函数(rough func2 tion)的概念[19],为粗糙控制打下了理论基础.文[20,21]应用粗糙控制研究了“小车—倒立摆系统”这一经典控制问题,取得了较好的结果.在过程控制领域,文[22]应用RS方法成功地提取出了水泥窑炉的控制规则.粗糙控制的优点是简单迅速、实现容易,不需要象Fuzzy控制那样进行模糊化和去模糊化.因此在特别要求控制器结构与算法简单的场合,采取粗糙控制较为合适.另外,由于控制算法完全来自观测数据本身,其决策和推理过程可以很容易被检验和证实.一种新的有吸引力的控制策略“模糊2粗糙控制(fuzzy2rough control)”正悄然兴起,其主要思路是利用RS获取模糊控制规则.7)医疗诊断.RS方法根据以往的病例归纳出诊断规则,用来指导新的病例.现有的人工预测早产的准确率只有17%～38%,应用粗糙集理论则可提高到68%～90%[1].8)专家系统(ES).RS抽取规则的特点,为构造ES知识库提供了一条崭新的途径[24].9)人工神经元网络(ANN).训练时间过于漫长的固有缺点是制约ANN实用化的因素之一.文[25]应用RS化简神经网络训练样本数据集,在保留重要信息的前提下消除了多余的数据,使训练速度提高了4177倍,获得了较好的效果.文[26,27]将RS与ANN结合起来,充分利用RS处理不确定性的特长以增强ANN的信息处理能力.10)决策分析[28～30].RS的决策规则是在分析以往经验数据的基础上得到的.RS允许决策对象中存在一些不太明确、不太完整的属性,弥补了常规决策方法的不足.希腊工业发展银行ETE VA应用RS理论协助制订信贷政策,是RS多准测决策方法的一个成功范例.RS理论的应用领域还包括:近似推理[31,32]、软件工程数据分析[33]、图象处理[34]、材料科学中的晶体结构分析[35]、预测建模[36,37]、结构建模[38]、投票分析[39]、电力系统[40,42]等. RS在我国的研究刚刚起步,有关文献还不多[43～44].5　结束语(C onclusion)虽然RS至今只有十几年的发展历史,但取得的研究成果是令人瞩目的.它是一种较有前途的软计算方法,为处理不确定性信息提供了有力的分析手段[45].我们相信RS具有广阔的发展空间,今后会在更多的实际领域中发挥作用.致谢　波兰华沙工业大学计算机科学研究所(Institute of C om puter Science,Warsaw University of T echnology)的Zdzislaw Pawlak教授和Bozena Skalska博士赠送了部分研究报告,在此向他们表示感谢.　1期粗糙集理论及其应用综述155参考文献(References)1　Pawlak Z et al.R ough sets.C ommunications of AC M,1995,38(11):89 -952　Pawlak Z.R ough sets.International Journal of In formation and C om puter Science,1982,(11):341-3563　Pawlak Z.R ough set-theoretical aspects of reas oning about data.D or2 drecht:K luwer Academ ic Publishers,19914　S lowinski R.Intelligent decision support-handbook of applications and advances of the rough sets theory.D ordrecht:K luwer Academ ic Publish2 ers,19925　Pawlak Z.Vagueness and uncertainty-a rough set perspective.C om puta2 tional Intelligence,1995,11(2):227-2326　W ygralak M.R ough sets and fuzzy sets-s ome remarks on interrelations.Fuzzy Sets and Systems,1989,29(3):241-2437　Nanda S et al.Fuzzy rough sets.Fuzzy Sets and Systems,1992,45(2): 157-1608　Banerjee M and Pal S K.R oughness of a fuzzy set.In formation Sciences, 1996,93(3,4):235-2469　Skowton A et al.From rough set theory to evidence theory.Advances in the Dem pster Shafer Theory of Evidence.New Y ork:John W iley&S ons Inc.,1994,193-23610　Jakub W.Finding m inimal reducts using genetic alg orithm.Institute ofC om puter Science Reports,W arsaw University of T echnology,W arsaw,199511　G olan R and Z iarko W.M ethodology for stock market analysis utilizing rough set theory.Proc.of IEEE/IAFE C on ference on C om putational In2 telligence for Financial Engineering,New Jersey,1995,32-4012　Nejman D.A rough set based method of handwritten numerals classifica2 tion.Institutc of C om puter Science Reports,W arsaw University of T ech2 nology,W arsaw,199413　T eghem J et e of rough sets method to draw prem onitory factors for earthquakes by em phasizing gas geochem istry.In:Intelligent Decision Support-Handbook of applications and Advances of the R ough Sets Theory.D ordrecht:K luwer Academ ic Publishers,1992,165-17914　Deja R.C on flict m odel with neg otiations.In:Institute of C om puter Sci2 ence Reports.W arsaw University of T echnlolgy,W arsaw,199515　Hu X iaohua et al.M ining knowledge rules from databases-a rough set approach.Proc.of IEEE International C on ference on Data Engineering, Los Alam itos,1996,96-10516　Tsum oto Sh et al.Extraction of domain knowledge from databases based on rough set theory.IEEE International C on ference on Fuzzy Systems, New Jersey,1996,748-75417　S ienkiewicz J.R ough set and rough function approaches to the control al2g orithm reconstruction.Institute of C om puter Science Reports,W arsaw U2niversity of T echnology,W arsaw,199618　Mrozek A et al.M ethodology of rough controller synthesis.Proc.of IEEE International C on ference on Fuzzy Systems,New Jersey,1996,1135-113919　Pawlak Z.R ough sets,rough relations and rough functions.Fundamenta In formaticae,1996,27(2,3):103-10820　Plonka L and Mrozek A.Rule2based stabilization of the inverted pendu2lum.C om putational Intelligence,1995,11(2):348-35621　C z ogala E et al.Idea of a rough fuzzy controller and its application to the stabilization of a pendulum2car system.Fuzzy Sets and systems,1995,72(1):6127322　Mrozek A.R ough sets and dependency analysis am ong attributes in com2 puter im plementations of expert’s in ference m odels.International Journal of M an2M achine S tudies,1989,30(4):457-47323　Arima M et al.Fuzzy logic and rough sets controller for HVAC systems.Proc.of IEEE WESCANEX C ommunications,P ower,and C om puting, New Y ork,1995,133-13824　Tsum oto S et al.Automated discovery of medical expert system rules from clinical databases based on rough sets.Proc.of Second InternationalC on f.on K nowledge Discovery and Data M ining,US A,1996,63-7225　Jelonek J et al.R ough set reduction of attributes and their domains for neural netw orks.C om putational Intelligence,1995,11(2):339-34726　Peng C et al.Multi2valued neural netw ork and the knowledge acquisition method by the rough sets for ambiguous recognition problem.Proc.of the IEEE International C on ference on Systems,M an and Cybernetics,Bei2 jing,1996,736-74027　Y asdi R.C ombining rough sets learning and neural learning2method to deal with uncertain and im precise in formation.Neurocom puting,1995,7(1):61-8428　S lowinski R.R ough set approach to decision analysis.AI Expert,M arch 1995,19-2529　Pawlak Z.R ough set approach to knowledge2based decision support.In2 stitute of C om puter Science Reports,W arsaw University of T echnology, W arsaw,199530　S lowinski R et al.R ough set s orting of firms according to bankruptcy risk.In:Applying Multiple Criteria aid for Decision to Environment M an2 agement,D ordrecht:K luwer Academ ic Publishers,1994,339-35731　S lowinski R et al.R ough set reas oning about uncertain data.Fundamenta In formaticae,1996,27(2,3):229-24332　Pars ons S et al.A rough set approach to reas oning under uncertainty.Journal of Exprimental and Theoretical AI,1995,7(2):175-19333　Ruhe Gand G esselschaft F.R ough set based data analysis in g oal2orient2 ed s oftware measurement.Proc.of IEEE International s oftware M etrics Sym posium,Los Alam itos,1996,10-1934　W ojcik Z et al.Application of rough sets for edge enhancing image fil2 ters.Proc.of IEEE International C on ference on Image Processing,Los Alam itos,1994,525-52935　Jacks on A et al.R ough sets applied to materials data.Acta M aterialia, 1996,44(11):4475-448436　C ollette T and S zladow e rough sets and spectral data for building predictive m odels of reaction rate constants.Applied S pectroscopy, 1994,48(11):1379-138637　Aijun A et al.Discovering rules for water demand prediction-an en2 hanced rough set approach.Engineering Applications of Artificial Intelli2 gence,1996,9(6):645-65338　W ojcik Z et al.S tructural m odeling using rough sets.Proc.of IEEE Inter2 national C on ference on Fuzzy Systems,New Jersey,1996,761-76639　Nurm i H et al.Probabilistic,fuzzy and rough concepts in s ocial choice.European Journal of Operational Research,1996,95(2):264-277156　控制理论与应用16卷　40　Lambert2T orres G et al.Data M ining into a C ontrol Center Database via R ough Set T echniques.Proc.of the International C on ference on Intelli2 gent Systems Applications to P ower Systems(IS AP’97),Seoul,1997, 246-25041　Zhang Q,Han Z X and W en F S.A new approach for fault diagnosis in power systems based on rough set theory.Proceedings of APSCOM’97,H ong K ong,1997,597-60242　张琦,韩祯祥,文福拴.一种基于粗糙集方法的电力系统故障诊断/警报处理的新方法.中国电力,1998,31(4):32-3843　王珏,苗夺谦,周育键.关于R ough Set理论与应用的综述.模式识别与人工智能,1996,9(4):337-34444　曾黄麟.粗集理论及其应用.重庆:重庆大学出版社,199845　E wa Orlowska(ed.).Incom plete in formation2rough set analysis.New Y ork:Physica2Verlag,1998本文作者简介韩祯祥　1930年生.浙江大学教授,博士生导师.研究领域为软计算方法及其在电力系统中的应用.张　琦　1971年生.浙江大学在读博士生.研究方向为粗糙集理论在电力系统中的应用.文福拴　1965年生.浙江大学教授,博士生导师.研究领域为软计算方法在电力系统中的应用.　1期粗糙集理论及其应用综述157。

粗糙集理论

2012-2-21
陕西师范大学计算机科学学院xjy
21
2012-2-21
陕西师范大学计算机科学学院xjy
22
例 4：：
的信息系统为例，以表 1 的信息系统为例，令 X = {x1 , x3 , x4 , x5 , x9 } ，
属性子集 B = {a1 , a2 , a3 } 。则根据表 2，可计算 X 的下近似，
a∈ A
f : U × A 是一个信息函数，对 →V 定义了一个信息函 x ∈U
数 f ( x, a ) ∈ Va ，即信息函数的属性值。
f
指定
U 中每一个对象 x
2012-2-21
陕西师范大学计算机科学学院xjy
4
信息系统的定义
如果信息系统 IS 的属性集合 A 可分为分为条件属性集合 C
两部分，和决策属性集合 D 两部分，即 A = C ∪ D 且 C ∩ D = φ ，这种信息系统也可称为决策表。这种信息系统也可称为决策表。
2012-2-21
陕西师范大学计算机科学学院xjy
20
粗集中还有如下概念：粗集中还有如下概念：定义为：集合 X 的 B 边界 BN B ( X ) 定义为：BN B ( X ) = BX − BX 。它是所有根据知识 B 不能确定地划入集合 X ，也不能确定地划入集合中对象的集合。 ∼ X 的 U 中对象的集合。也就是 B 上近似 BX 内无法确定属于 X 的对象。的对象。
不可辨识关系
例 2∶以表 1 的信息系统为例，则属性集 A 对应的不可辨识关系 Ind
( A)
导出的划分 U / Ind ( A) 见表 2。表 2 中的每
一行表示一全域 U 在空间 A 上基本集，简称为 A 基本集。

粗糙集理论简介

红色的圆表示.
仅使用第一个属性进行划分的情形. 正区域为空. 蓝色区域为负区域.
使用两个属性进行划分的情况
加入第二个属性
负区域
正区域(下近似)
边界区域
上近似
综合表示
Rough Set 的应用
(一)知识发现
RD {(x, y); gk (x) gk (y)(k q)} 是按照决策集D产生的
X1
正常
是
否
x2
高
是
是
x3
高
是
是
x4
正常
否
否
x5
高
否
否
x6
高
否
是
x7
高
否
是
x8
正常
否
否
取B为各种属性组合, 则得到不同等价类取B=A,则等价类为：{{x1},{x2,x3},{x4,x8},{x5,x6,x7}}
基本概念(三) 上下近似
X U 它在关系 RB下的上下近似集 RB(X ) {x;[x]B X} 为 X 的下近似集
粗糙集理论的基本概念
不可区分关系/等价类. 上近似和下近似.
基本概念(一) 信息系统
称为(U, A,F,D,G) 一个信息系统, 其中为对象集, U {x1,x2,...xn} 为属性集, A {a1,a2,...ap} 为决策集, D {d1,d2,...dq} F 为U 和 A的关系集, F { f j : j p} G 为U 和 D的关系集, G {g j : j q}
求约简是属性选择问题. 约简有各种各样的标准(保持属性集合分类能力不变,保证分布函数不变, 保证决策上下近似不变.etc) 协调集与约简
RB(X ) {x;[x]B X }为 X 的上近似集如果上下近似是相等的, 则这是一个精确集合, 否则它是一个粗糙集, 其中下近似称为该概念的正区域, 上下近似的差称为边界.上近似以外的区域称为负区域.

粗糙集理论的核心算法及其在实际问题中的应用

粗糙集理论的核心算法及其在实际问题中的应用粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具，它能够在信息不完备或不准确的情况下进行决策和推理。

本文将介绍粗糙集理论的核心算法，并探讨其在实际问题中的应用。

一、粗糙集理论的核心算法粗糙集理论的核心算法主要包括粗糙集近似算法和粗糙集约简算法。

粗糙集近似算法是粗糙集理论最基本的算法之一，它用于将不完备或不准确的数据集划分为若干个等价类。

该算法基于属性重要性的概念，通过计算属性的正域和反域来确定属性的重要性，从而实现数据集的划分。

粗糙集约简算法是粗糙集理论中的关键算法，它用于从原始数据集中提取出最小的、具有相同决策规则的子集。

该算法通过计算属性的依赖度来确定属性的重要性，从而实现数据集的约简。

二、粗糙集理论在实际问题中的应用粗糙集理论在实际问题中有着广泛的应用，尤其在数据挖掘、模式识别和决策支持等领域。

在数据挖掘中，粗糙集理论可以用于特征选择和数据预处理。

通过粗糙集约简算法，可以从原始数据集中提取出最重要的特征，减少数据维度，提高数据挖掘的效率和准确性。

在模式识别中，粗糙集理论可以用于特征提取和模式分类。

通过粗糙集近似算法，可以对模式进行划分和分类，从而实现对复杂模式的识别和分析。

在决策支持中，粗糙集理论可以用于决策规则的生成和评估。

通过粗糙集约简算法，可以从原始数据集中提取出最简化的决策规则，为决策制定提供支持和指导。

除了以上应用，粗糙集理论还可以用于知识发现、智能推理和不确定性推理等领域。

它的优势在于能够处理不完备或不准确的信息，提供一种有效的决策和推理方法。

总结起来，粗糙集理论的核心算法包括粗糙集近似算法和粗糙集约简算法，它们在实际问题中有着广泛的应用。

通过粗糙集理论，可以处理不完备或不准确的信息，提高数据挖掘、模式识别和决策支持等领域的效率和准确性。

粗糙集理论为我们解决实际问题提供了一种有效的数学工具。

如何运用粗糙集理论解决多目标优化问题

如何运用粗糙集理论解决多目标优化问题引言：多目标优化问题是现实生活中常见的一类问题，例如在工程设计、金融投资和物流规划等领域都存在着需要同时优化多个目标的情况。

然而，由于多目标优化问题的复杂性，传统的优化方法往往难以找到全局最优解。

为了解决这一问题，粗糙集理论被提出并广泛应用于多目标优化问题的求解中。

本文将介绍粗糙集理论的基本概念和原理，并探讨其在多目标优化问题中的应用。

一、粗糙集理论的基本概念粗糙集理论是由波兰学者Zdzislaw Pawlak于1982年提出的一种数学工具，用于处理不确定性和不完备性信息。

粗糙集理论的核心思想是通过对数据集进行粗糙划分，找到属性间的依赖关系，从而实现对数据的分类和决策。

1.1 上近似与下近似在粗糙集理论中，上近似和下近似是两个基本概念。

上近似是指用属性集合A 来描述目标集合B的能力，即用A的属性来近似B。

下近似是指用属性集合A来刻画目标集合B的不确定性，即用A的属性来低估B。

1.2 粗糙集的约简粗糙集的约简是指在保持粗糙集属性的情况下，通过删除冗余属性来降低属性集合的复杂性。

粗糙集的约简可以提高数据集的处理效率，并减少决策过程中的不确定性。

二、粗糙集理论在多目标优化问题中的应用多目标优化问题的特点是存在多个冲突的目标，传统的优化方法往往难以找到全局最优解。

粗糙集理论通过对数据的粗糙划分和属性的约简，可以有效地处理多目标优化问题。

2.1 数据的粗糙划分粗糙集理论可以将多目标优化问题中的数据集进行粗糙划分，找到目标之间的依赖关系。

通过对数据的粗糙划分，可以降低问题的复杂性，并减少搜索空间。

2.2 属性的约简多目标优化问题中存在多个目标，每个目标都有一组属性。

粗糙集理论可以通过属性的约简，找到目标之间的关联性，从而减少目标之间的冲突。

属性的约简可以降低问题的维度，提高优化效率。

2.3 求解多目标优化问题在利用粗糙集理论求解多目标优化问题时，可以采用遗传算法、模拟退火算法等优化算法。

概述粗糙集方法与应用

上一页下一页返回本章首页
粗糙集的基础理论
1.2 粗糙集的特点
作为一种软计算方法，作为一种软计算方法，粗糙集理论与其他处理不确定和不精确问题理论的最显著的区别是它无需提供问题所需处理的数据集合之外的任何先验信息，如统计学中的概率分布、信息，如统计学中的概率分布、模糊集理论中的隶属度等，论中的隶属度等，所以对问题的不确定性的描述或处理可以说是比较客观的。的描述或处理可以说是比较客观的。
上一页下一页返回本章首页
粗糙集的基础理论
1.2 粗糙集的特点
RS方法已被成功地应用于机器学习、方法已被成功地应用于机器学习、方法已被成功地应用于机器学习知识获取、决策分析、知识发现、模式识别、知识获取、决策分析、知识发现、模式识别、专家系统和决策支持系统等领域。专家系统和决策支持系统等领域。有趣的结果已激励各个领域的专家研究RST及它的应果已激励各个领域的专家研究RST及它的应用。它的成功是由于具有如下特征：它的成功是由于具有如下特征：发现最小知识表示；不修正不一致性，小知识表示；不修正不一致性，将生成的不一致规则划分为确定性规则和可能性规则；一致规则划分为确定性规则和可能性规则；约简冗余的属性，且约简算法较为简单。约简冗余的属性，且约简算法较为简单。
粗糙集的基础理论
粗糙集方法与应用
粗糙集的基础理论粗糙集的扩展理论
变精度粗糙集理论基于优势关系的粗糙集理论
粗糙集与其它方法的杂合
粗糙集与模糊集的杂合粗糙集与神经网络的杂合
开始上一页
下一页
返回目录返回本章首页
粗糙集的基础理论
1. 粗糙集概述
1.1 软技术产生的时代背景和意义
随着Internet和数据库技术的迅猛发展和广泛应用，和数据库技术的迅猛发展和广泛应用，随着和数据库技术的迅猛发展和广泛应用数据库中存储的数据量以惊人的速度在增加，数据库中存储的数据量以惊人的速度在增加，庞大的数据量渗透到社会生活和生产的各个领域，量渗透到社会生活和生产的各个领域，其结果导致传统的统计技术及数据管理工具不再适用于分析这些巨量的数据海量的数据被描述为“丰富的数据，贫乏的知识” 集。海量的数据被描述为“丰富的数据，贫乏的知识”。人们需要采用自动化程度更高、人们需要采用自动化程度更高、效率更高的数据处理方法来处理大量数据，并提供有用的知识。从金融业到制造业，来处理大量数据，并提供有用的知识。从金融业到制造业，越来越多的公司正依赖于巨量数据的分析获得竞争优势，越来越多的公司正依赖于巨量数据的分析获得竞争优势，知识已成为社会生活和生产的第一推动力。知识已成为社会生活和生产的第一推动力。为了帮助人们智能化地分析海量数据，自动地分析一些事例，智能化地分析海量数据，自动地分析一些事例，出现了新一代的技术和工具，一代的技术和工具，这些技术和工具主要用于数据挖掘（data mining，DM）和知识发现，）和知识发现(Knowledge discovery in database，KDD)领域。如粗糙集理论、领域。，领域如粗糙集理论、模糊集理论、灰色系统、模糊集理论、灰返回本章首页

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

属性对象 x1 x2 x3 x4 x5 x6 头疼r1 是是是否否否条件属性C 肌肉疼r2 是是是是否是体温r3 正常高很高正常高很高决策属性D 流感否是是否否是
12
• （3）不可分辨关系
– 在粗糙集中，论域U中的对象可用多种信息（知识）来描述。当两个不同的对象由相同的属性来描述时，这两个对象在该系统中被归于同一类，它们的关系称之为不可分辨关系。即对于任一属性子集 B⊆R ，如果对象 xi,xj∊U ，∀ r∊B ，当且仅当 f(xi,r)=f(xj,r) 时，xi 和xj 是不可分辨的，简记为Ind(B)。不可分辨关系称为等价关系。 – 例如：只用黑白两种颜色把空间中的一些物体划分成两类： { 黑色物体} 、 { 白色物体}，那么同为黑色的物体就是不可分辨的，因为描述它们特征属性的信息是相同的，都是黑色。如果引入方、圆的属性，可将物体进一步划分为4 类：{黑色方物体}、{黑色圆物体}、{白色方物体}、{白色圆物体}。这时，如果有两个同为黑色方物体，则它们还是不可分辨的。 – 不可分辨关系这一概念在 RS 中十分重要，它反映了我们对世界观察的不精确性。 – 另一方面，不可分辨关系反映了论域知识的颗粒性。知识库中的知识越多，知识的颗粒度就越小，随着新知识不断加入到知识库中，粒度会不断减小，直致将每个对象区分开来。但知识库中的知识粒度越小，则导致信息量增大，存储知识库的费用越高。
第八届中国粗糙集与软计算学术会议 , 2008 年 8 月 22 5 日至 8 月 24日在河南省新乡市召开中国
粗糙集的理论及应用的文章主要发表在以下杂志
国际： 1．Information Sciences 2．Fuzzy sets and systems 3．International Journal of Computer and Information Sciences 4．Communication of the ACM 5．Computational Intelligence 6．Journal of computer and system sciences 国内： 1．模式识别与人工智能 2．软件学报 3．科学通报 4．计算机科学 5．计算机学报 6．模糊系统与数学 7．计算机应用与软件 8．计算机研究与发展 9．计算技术与自动化
BUN（X )
H(Xபைடு நூலகம்)
NEG (
X)
X 的边界线
16
•
（7）粗糙度（近似精确度）
– 对于知识R（即属性子集），样本子集X的不确定程度可以用粗糙度α R(X)来表示为 Card R X R X Card R X
8
（2）经典集合、模糊集合、粗糙集的关系
– 经典集合认为一个集合完全有其元素所决定，一个元素要么属于这个集合，要么不属于这个集合。其隶属函数μ X(x)∊{0,1}是二值逻辑。 – 模糊集合认为事物具有中介过渡性质，而非突然改变，集合中每一个元素的隶属函数μ X(x)∊[0,1]，即在闭区间[0,1]可以任意取值，隶属函数可以是连续光滑的，因此模糊集合对不确定信息的刻划是精细而充分的。但隶属函数不可计算，凭人的主观经验给定。 – 粗糙集合把用于分类的知识引入集合。一个元素x是否属于集合X，需要根据现有知识来判定，可分为三个情况：①x肯定不属于X；②x肯定属于X；③x可能属于也可能不属于 X 。到达属于哪种情况依赖于我们所掌握的关于论域的知识。粗糙集的隶属函数为阶梯状，对不确定性信息的描述是粗糙的， 1.0 但粗糙隶属函数是可计算的。粗糙集主 0.8 要用于对信息系统进行约简和分类。
7． AI Magazine 8． AI Communications 9． European Journal of Operational Research 10．International Journal of Approximate Reasoning 11．Theoretical computer sciences 12．Decision support Systems 13．International Journal of Man-Machine studies 14．Fundamenta Informaticae 15．Intelligent Automation Sciences
4
1998年，国际信息科学杂志（Information Sciences）为粗糙集理论的研究出了一期专辑[2，3]。
第一届中国RS理论与软计算学术研讨会，于2001年5月在重庆举行。
第二届中国RS理论与软计算学术研讨会，于2002年10月在苏州大学举行。第三届中国RS理论与软计算学术研讨会，于2003年8月在重庆举行。第四届中国RS理论与软计算学术研讨会，将于2004年在舟山举行。
11
（2）知识表达系统
– 一个知识表达系统或信息系统S可以表示为有序四元组 S={U,R,V,f} 其中，U={x1,x2,…,xn}为论域，它是全体样本的集合； R＝C∪D 为属性集合，其中子集C是条件属性集，反映对象的特征，D为决策属性集，反映对象的类别； V Vr 为属性值的集合，V 表示属性r的取值范围； r rR f:U×R→V 为一个信息函数，用于确定U中每一个对象x的属性值，即任一xi∊U，r∊R，则f(xi,r)=Vr
0.6 0.4 0.2 0.0
0.2
0.4
0.6
0.8
1.0
9
2、粗糙集的基本理论与方法
1
粗糙集的基本概念
2
粗糙集的基本思想
3
粗糙集的基本特点
10
1）粗糙集的基本概念
（1）知识与分类
– 在粗糙集理论中，知识被认为是一种分类能力。人们的行为基本是分辨现实的或抽象的对象的能力。 – 假定我们起初对论域内的对象（或称元素、样本、个体）已具有必要的信息或知识，通过这些知识能够将其划分到不同的类别。若我们对两个对象具有相同的信息，则它们是不可区分的，即根据已有的信息不能将其划分开。 – 粗糙集理论的核心是等价关系，通常用等价关系替代分类，根据这个等价关系划分样本集合为等价类。基本思想：从知识库的观点看，每个等价类被称为一个概念，即一条知识（规则)。即，每个等价类唯一地表示了一个概念，属于一个等价类的不同对象对该概念是不可区分的。
–随机性：因为事物的因果关系不确定，从而导致事件发生的结果不确定性。用概率来度量。概率表示事件发生可能性的大小。概率论的运用是从随机性中去把握广义的因果律——概率规律。 –模糊性：因为事件在质上没有明确的含义，在量上没有明确的界限，导致事件呈现“亦此亦彼”的性态，是事物类属的不确定性，用隶属度来度量。隶属度表示事物多大程度属于某个分类。模糊集合论的运用从模糊性中去确立广义的排中律——隶属规律。 –粗糙性：因为描述事件的知识（或信息）不充分、不完全，导致事件间的不可分辨性。粗糙集把那些不可分辨的事件都归属一个边界域。因此，粗糙集中的不确定性是基于一种边界的概念，当边界域为一空集时，则问题变为确定性的。
13
（4）基本集合
– 由论域中相互不可分辨的对象组成的集合称之为基本集合，它是组成论域知识的颗粒。决策属属性条件属性C 性D – 例如：考虑条件属性：头疼和对象头疼r1 肌肉疼r2 体温r3 流感肌肉疼。对于x1,x2,x3这三个 x1 是是正常否对象是不可分辨的。x4,x6在这 x2 是是高是两个属性上也是不可分辨的。 x3 是是很高是由此构成的不可分辨集{x1,x2, x4 否是正常否 x3},{x4,x6},{x5}被称为基本 x5 否否高否 x6 否是很高是集合。 – 设论域U为有限集，R是U的等价关系簇，则K={U,R}称为知识库，知识库的知识粒度由不可分辨关系Ind(R)的等价类反映。
优点：除数据集之外，无需任何先验知识（或信息）对不确定性的描述与处理相对客观
……
【说明】：Bayes理论、模糊集理论、证据理论等都需要先验知识，具有很大的主观性。
7
1、不确定性理论
• 自然界和人类的社会活动的各种现象：确定性现象和不确定性现象。 • 确定性现象：在一定条件下必然会出现的现象。（1）不确定性的分类：
人工智能
Artificial Intelligence
粗糙集理论与应用
董春游(Chunyou Dong) PhD,Professor
Email:chunyoudong@
研究生学院
1
第十七讲粗糙集与数据约简
1 2
不确定性理论
粗糙集的基本理论与方法
3
4 5 6
知识的约简
决策表的约简
粗糙集数据约简的具体实现与应用
15
（6）正域、负域和边界域 – 正域： Pos(X)=R-(X) ，即根据知识 R ， U中能完全确定地归入集合X的元素的集合。 – 负域： Neg(X)=U-R-(X) ，即根据知识 R ， U 中不能确定一定属于集合 X 的元素的集，它们是属于X的补集。 – 边界域： Bnd(X)= R-(X) - R-(X) ，图 6.1 粗糙集概念示意图边界域是某种意义上论域的不确定域，根据知识R，U中既不是肯定归入集合其中， H ( X ) = H ( X ) +BUN ( X )； U 为整个方框区域。 X ，又不能肯定归入集合 ~X ，的元素构成的集合。 – 边界域为集合 X 的上近似与下近似之差，如果 Bnd(X) 是空集，则称集合 X 关于 R 是清晰的；反之，如果 Bnd(X) 不是空集，则称集合X为关于R的粗糙集。因此，粗糙集中的“粗糙”（不确定性）主要体现在边界域的存在。集合 X 的边界域越大，其确定性程度就越小。
粗糙集的研究现状与展望
2
概论：粗糙集理论的提出及发展
粗糙集（Rough Sets）是波兰数学家Z. Pawlak于1982年提出的[1]（为开发自动规则生成系统及研究软计算问题而引入）。由于最初关于粗糙集理论的研究大部分是用波兰语发表的，因此当时没有引起国际计算机学界和数学界的重视。研究地域也局限在东欧一些国家，直到80年代末才引起各国学者的注意。九十年代初，人们才逐渐认识到它的意义。 1992年在波兰Kiekrz召开了第一届国际RS研讨会。这次会议着重讨论了集合近似定义的基本思想及应用，其中RS环境下的机器学习基础研究是这次会议的四个专题之一。