粗糙集 (ppt)
粗糙集理论优质获奖课件
若rij=1, 且 i≠j, 则rji=0
对M2中1所 在位置,M 中相应位置 都是1
假如两 假如顶
点之
点xi
间有边, 到xj有边,
一定
xj
13
4、等价关系
等价关系旳定义:设R是非空集合A上旳关系,假如满足 ⑴ R是自反旳; ⑵ R是对称旳; ⑶ R是传递旳; 则称R是A上旳等价关系。
21
内容提要
一、概述 二、知识分类 三、知识旳约简 四、决策表旳约简 五、粗糙集旳扩展模型 六、粗糙集旳试验系统 七、粒度计算简介
22
一、 概述
现实生活中有许多模糊现象并不能简朴地 用真、假值来表达﹐怎样表达和处理这些现 象就成为一种研究领域。早在1923年谓词逻 辑旳创始人G.Frege就提出了模糊(Vague)一 词,他把它归结到边界线上,也就是说在全 域上存在某些个体既不能在其某个子集上分 类,也不能在该子集旳补集上分类。
自反性 反自反性 对称性 反对称性 传递性
12
关系性质旳三种等价条件
体 现 式
关系 矩阵
关系图
自反性 IAR
主对角 线元素 全是1
每个顶 点都有 环
反自反性 R∩IA=
主对角线 元素全是 0
每个顶点 都没有环
对称性 R=R1
反对称性 R∩R1 IA
传递性 RRR
矩阵是对称 矩阵
假如 两个 顶
定义 假如一种集合满足下列条件之一: (1)集合非空, 且它旳元素都是有序对 (2)集合是空集 则称该集合为一种二元关系, 简称为关系,记作R. 如<x,y>∈R, 可记作 xRy;假如<x,y>R, 则记作xRy
实例:R={<1,2>,<a,b>}, S={<1,2>,a,b}. R是二元关系, 当a, b不是有序对时,S不是二元关系 根据上面旳记法,能够写1R2, aRb, aSb等.
粗糙集 (ppt)
2
一、 概述
现实生活中有许多含糊现象并不能简单 地用真、假值来表示﹐如何表示和处理这些 现象就成为一个研究领域。早在1904年谓词 逻辑的创始人G.Frege就提出了含糊(Vague) 一词,他把它归结到边界线上,也就是说在 全域上存在一些个体既不能在其某个子集上 分类,也不能在该子集的补集上分类。
12
Issues in the Decision Table
• The same or indiscernible objects may be represented several times. • Some of the attributes may be superfluous.
13
不可区分性Indiscernibility
二、 知识分类
为数学处理方便起见,在下面的定义中用等价关系 来代替分类。 一个近似空间(approximate space)(或知识库)定义 为一个关系系统(或二元组)
K=(U,R)
其中U(为空集)是一个被称为全域或论域(universe) 的所有要讨论的个体的集合,R是U上等价关系的一 个族集。
7
二、 知识分类
设PR,且P ,P中所有等价关系的交集称为P上 的一种不可区分关系(indiscernbility relation) 记作IND(P),即
[x]IND(p)= ∩[x]R RP 注意,IND(P)也是等价关系且是唯一的。
8
二、 知识分类
给定近似空间K=(U, R),子集XU称为U上的一个概念 (concept),形式上,空集也视为一个概念;非空子族集 PR所产生的不可区分关系IND(P)的所有等价类关系的集合 即U/IND(P),称为基本知识(basic knowledge),相应的等 价类称为基本概念(basic concept);特别地,若关系QR, 则关系Q就称为初等知识(elementary knowledge),相应的 等价类就称为初等概念(elementary concept)。 根据上述定义可知,概念即对象的集合,概念的族集(分类) 就是U上的知识,U上分类的族集可以认为是U上的一个知识 库,或说知识库即是分类方法的集合。
粗糙集
粗糙集简述1、什么是粗糙集2、粗糙集与经典集合的关系经典集合论的“成员关系”是“非此即彼”粗糙集合论的“成员关系”是“亦此亦彼”3、模糊集合论VS粗糙集合论(1)模糊集合论着眼于模糊性粗糙集合论着眼于知识的粗糙性3、模糊集合论VS粗糙集合论如:《应用模糊数学》里说过,“高个子的男生”、“漂亮的女孩”假如刘备、关羽、张飞、曹操、诸葛亮五人在一间房子里开会,现在知道关羽和曹操患了感冒,而其他人是否感冒不知。
但是他们或多或少地有一些症状,刘备肌肉痛,张飞肌肉痛&头痛,诸葛亮体温高。
到底是体温高的感冒了,还是头痛的感冒了,不得而知,若非得回答谁感冒了,那么这个问题就是具有粗糙性的问题。
在这里把集合{关羽、曹操}称作精确集,{刘备、关羽、张飞、曹操、诸葛亮}叫作粗糙集。
(2)从知识描述方法上来看,模糊集合论是通过对象关于集合的隶属度来近似描述。
粗糙集合论通过信息库的一对上下近似来描述的。
(3)从对象间的关系来看,模糊集合论强调边界的不分明。
粗糙集合论强调对象间的不可区分性。
(4)从研究对象来看,模糊集合论研究的是同一类的不同对象的隶属关系,重在隶属程度。
粗糙集合论研究的是不同类中的对象组成的集合之间的关系,重在分类。
(1)什么是“知识”【标准定义】设U是我们感兴趣的对象组成的非空有限集合,称为论域。
U的任何一个子集X U,称为论域U的一个概念。
论域U中的任何子集簇称为关于U的抽象知识,简称知识。
【我的理解】曹操、关羽等是对象,{头痛}、{头痛、肌肉痛}、{头痛、肌肉痛、体温高}、∅这些集合就是知识(2)为什么要约简信息系统中的属性并不是同等重要的,甚至其中某些属性是冗余的。
在保证信息系统分类能力不变的条件下,删除其中不必要的、不重要的或不相关的属性。
小例子-银行信贷风险之后结合小例子为大家介绍粗糙集,数据和例子均来自中国期刊杂志一、选择指标体系根据个人消费信贷指标体系的选择方法及数据的可获取性,初选10个指标变量,个人信用评分指标体系共由10个条件属性构成,分别由个人自然特征变量、经济状况变量及信用状况变量三部分组成。
粗糙集基本知识PPT课件
21
差别矩阵
U\A a b c d e u1 1 0 2 1 0 u2 0 0 1 2 1 u3 2 0 2 1 0 u4 0 0 2 2 2 u5 1 1 2 1 0
u1 u2 u3 u4 u5
3
Y
Y
Y
NY
8,9,15
N
N
N
Y
NY N
4
Y
Y
Y
NY
10,11,12,14
N
N
Y
Y
YY N
5
Y
Y
Y
NY
YY
13
N
N
Y
N
N
6
Y
Y
Y
NY
YY
16
Y
N
N
Y
N
7
N
Y
Y
NY
NY
17
Y
N
Y
N
N
8
N
N
N
YY
NN
9
N
N
N
YY
YN
实例集 10 群居 N 会飞 N 产卵 Y 肺呼吸NY 鸟类Y N
肺呼吸 热血动物 食物 鸟类
13
约简理论
主要思想:保持分类能力不变的条件下, 删除冗余的、不必要的属性或属性值,达 到知识简化的目的。
14
示例:一种动物是否是鸟类
实例集 群居 会飞 产卵 肺哺呼乳吸 会游鸟泳类
实例集
群居 会飞 产卵 肺呼吸 鸟类
1
N
Y
Y
NY
粗糙集理论方法及其应用ppt课件
粗糙集概念示意图
粗糙集理论方法及其应用 病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程
2 粗粗糙糙集集理理论论思思想想
粗糙集理论方法及其应用 病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程
2.3 粗糙近似
定义 给定一个知识表示系统 S (U, A,V, f ) , P A,X U ,x U ,集合 X 关于 I 的下近似、 上近似、负区及边界区分别为
apr (X ) {x U : I(x) X} p
aprP (X ) {x U : I(x) X }
neg p ( X ) {x U : I (x) X }
2.2 不可分辨关系 (Indiscribility relation)
❖ 不可分辨关系是一个等 价关系(自反 的、对称 的、传递的)。
❖ 包含对象x的等价类 记为I(x)。等价类与知 识粒度的表达相对应, 它是粗糙集主要概念, 如近似、依赖及约简等, 定义的基础
粗糙集理论方法及其应用 病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程
决策属性(D)
U
a1
a2
a3
d
n1
High
Low
Low
Low
n2
Medium
High
Low
High
n3
High
High
High
High
粗糙集理论方法及其应用 病原体侵入机体,消弱机体防御机能,破坏机体内环境的相对稳定性,且在一定部位生长繁殖,引起不同程度的病理生理过程
粗糙集理论与算法初步.ppt
PQk
posPQ
U
PX
XUQ
U
第一节
粗糙集理论
3、R0.5理论
粗糙集的近似集R0.5的提出
集合的相似度 A,B是论域U上的两个子集定义从U×U→[0,1]
的映射(A,B)→s(A,B),称s(A,B)为A,B的相似 度,如果满足如下条件: 1)任意U中的集合 A,B,s(A,B)有界; 2)对称性,即s(A,B)=s(B,A); 3)s(A,A)=1,且s(A,B)=0的充要条件是A∩B为 空集。
系族PS,对于任意P中的R,若 IND(P)≠IND(P-{R})成立,称R为P中必要的。 独立性
如果对每一个P中R,R都是P中必要的, 称P是独立的,否则称P是依赖的。 显然,若P独立,则其任何子集G都是独立的。
知识约简
知识的约简 知识库K和其上的一族等价关系PS,对
任意的GP,若: 1)G是独立的 2)IND(G)=IND(P) 称G是P的一个约简,记作G∈RED(P)。
注:知识表达系统主要有两种类型,信息 系统以及决策系统。
知识表达系统的知识约简
信息系统中知识约简的一般步骤 Step 1:删除表中重复对象 Step 2:删除冗余的条件属性 Step 3:删除每个对象的冗余属性值 Step 4:求出其约减
决策表中知识约简的一般步骤 Step 5:根据约简,求出决策规则
的一组或单个系统参数。U中任意的概念X 以及独立于系统参数R的划分,有
参数R的重要度 sigRXUbU nRX
划分关于系统参数R的重要度 n UbnRXi sigR(U) i1 nU
粗糙集的数值特征
知识的依赖度 知识库K=(U,S),以及任意P,QIND(K),
定义知识Q依赖于知识P的依赖度:
粗糙集
23
粗糙集的提出
20世纪80年代初,波兰的 Pawlak 针对 G.Frege 的边界线区域思想提出了粗糙集 (Rough Set)﹐ 他把那些无法确认的个体 都归属于边界线区域,而这种边界线区域被 定义为上近似集和下近似集之差集。由于它 有确定的数学公式描述,完全由数据决定, 所以更有客观性 。
2014-6-9
粗糙集 石峰
6
上面这些所有的分类合在一起就形成了一 个基本的知识库。那么这个基本知识库 能表示什么概念呢?
2014-6-9
粗糙集 石峰
7
除了红的{x1,x2,x6}、大的{x1,x2,x5}、三角形的 {x1,x2}这样的概念以外还可以表达例如 大的且是三角形的 {x1,x2,x5}∩{x1,x2}={x1,x2},
2014-6-9
粗糙集 石峰
14
下面我们考虑,对于决策属性来说是否所 有的条件属性都是有用的呢?
2014-6-9
粗糙集 石峰
15
考虑所有决策属性是“稳定”的集合 {x1,x2,x5},它在知识系统U/R中的上下 近似都是{x1,x2,x5}本身,“不稳定”的 集合{x3,x4,x6,x7,x8},在知识系统U/R中 的上下近似也都是{x3,x4,x6,x7,x8}它本 身。说明该知识库能够对这个概念进行 很好的描述。
2014-6-9 粗糙集 石峰 16
考虑是否所有的基本知识:颜色、形状、大小都 是必要的? 如果我们把这个集合在知识系统中去掉颜色这个基 本知识,那么知识系统变成 U/(R-R1)={{x1,x2},{x3,x4,x7},{x5},{x6},{x8}}以及 这些子集的并集。 如果用这个新的知识系统表达“稳定”概念得到上 下近似仍旧都是:{x1,x2,x5},“不稳定”概念的 上下近似也还是{x3,x4,x6,x7,x8},由此看出去掉 颜色属性我们表达稳定性的知识不会有变化,所 以说颜色属性是多余的可以删除。
《粗糙集理论简介》课件
05
粗糙集的应用实例
数据挖掘中的粗糙集应用
分类
利用粗糙集理论对数据进行分类,通过确定数据的属性重要性和 类别关系,实现高效准确的分类。
聚类
通过粗糙集理论,可以发现数据中的相似性和差异性,从而将数 据分成不同的聚类。
关联规则挖掘
利用粗糙集理论,可以发现数据集中项之间的有趣关系和关联规 则。
机器学习中的粗糙集应用
粗糙集的补运算
总结词
粗糙集的补运算是指求一个集合的所有 可能补集的运算。
VS
详细描述
补运算在粗糙集理论中用于确定一个集合 的所有可能补集。补集是指不属于该集合 的所有元素组成的集合。通过补运算,我 们可以了解一个集合之外的所有可能性, 这在处理不确定性和模糊性时非常重要。
04
粗糙集的扩展理论
决策粗糙集
多维粗糙集
多维粗糙集是粗糙集理论在多维空间下的扩展,它考虑了多个属性或特征对数据 分类的影响。多维粗糙集可以更准确地描述多维数据的分类和聚类问题,因此在 处理多特征和多属性问题时具有更大的优势。
多维粗糙集的主要概念包括多维下近似、多维上近似、多维边界等,通过这些概 念可以度量多维数据的不确定性,从而为多维分类和聚类提供支持。
决策分析
粗糙集理论可以用于决策支持系 统,通过建立决策模型来分析不 确定性和模糊性条件下的最优决 策。
知识获取
粗糙集理论可以用于从数据中提 取隐含的知识和规则,尤其在处 理不完整和不精确信息时具有显 著效果。
02
粗糙集的基本概念
知识的分类
知识表达
通过数据表中的属性值来表达知识,将对象进 行分类。
概率粗糙集
概率粗糙集是粗糙集理论在概率框架下的扩展,它引入了 概率测度的概念,用于描述数据的不确定性。概率粗糙集 可以更准确地描述数据的不确定性和随机性,因此在处理 不确定性和随机性问题时具有更大的灵活性。
10.粗糙集方法
可知有:
A ( X ) { f }
A ( X ) {a, b, c} { f } {a, b, c, f }
PosA ( X ) A ( X ) { f }
NEGA ( X ) U A ( X ) {d , e}
BNDA ( X ) A ( X ) A ( X ) {a, b, c}
计算减少一个条件属性相对决策属性的正域
Pos(C \{a1}) (D) {2,5,9,10,11 U } Pos(C \{a2 }) (D) U Posc (D) Pos(C \{a3 }) (D) U Posc (D)
Pos(C \{a4 }) (D) {1,2,3,7,8,9,10,11,12,13} U
a R, x U , fa ( x) Va
(2)等价关系定义
对 于 a A A 中 包 含 一 个 或 多 个 属 ( A 性), R, x U , y U ,它们的属性值相同, f ( x) f ( y ) 即: 成立,称对象x和y是对属性A的等价关系, 表示为:
a a
(2)集合X的上近似定义
对任意一个子集 X U ,属性A的等价类 Ei [ x]A 有: A ( X ) Ei | Ei A Ei X 或 A ( X ) x | [ x] A X 表示等价类 Ei [ x]A 中的元素x可能属于X, 即x A (X ),则x可能属于X,也可能不属于X。
第 8 章 集合论方法 (一) 粗糙集方法
8.1粗糙集方法
8.1.1粗糙集概念 8.1.2属性约简的粗糙集理论 8.1.3属性约简的粗糙集方法 8.1.4粗糙集方法的规则获取 8.1.5粗糙集方法的应用实例
粗糙集
一个对象a是否属于集合X根据现有知识来判断,
可分为三种情况:
a肯定属于集合X a可能属于也可能不属于集合X a肯定不属于集合X
15/39
Let U为论域(非空对象集合 ),I为U中的一组等价关系,
Then
集合X关于I的下近似(Lower approximation)是由那些根据现有 知识判断肯定属于X的对象所组成的最大集合,有时也称为X的正 区(positive region),记做POS(X)
不一致信息的分析;
根据不确定,不完整的知识进行推理;
在保留信息的前提下进行数据化简;
近似模式分类;
识别并评估数据之间的依赖关系。
7/39
粗糙集在应用中的优点
粗糙集分析数据不需要先验知识。
粗糙集理论是适合大数据集分析的强大工具。
粗糙集提供了含糊概念的数学描述, 并可计算。
一个二元组K=(U,R) 称为一个近似空间(approximate space)
(或知识库)。 其中U (为空集)是一个被称为全域或论域(universe) 的所有要讨论的个体的集合,R是U上等价关系的一个族集。
R1(颜色) X1 X2 红 蓝 R2(形状) 圆形 方形 R3(体积) 小 大
不清楚。
uncertainty(粗糙隶属函数):描述元素,指某
个元素是否属于某集合是不确定的。
三、粗糙集的应用领域
Skowron列出了下面这些应用领域:声学、生物信息学、
商业和金融、化学、计算机工程(例如数据压缩、数字图 像处理、数字信号处理、并行分布式计算机系统、传感器 融合、分形工程)、决策分析和系统、经济学、电子工程 (例如:控制、信号分析、电力系统)、环境研究、信息 学、医学、分子生物学、音乐学、神经学、机器人学、社 会科学、软件工程、空间可视化、WEB工程和WEB挖掘。
数据仓库与数据挖掘PPT第9章 粗糙集理论
如果再考虑是否能去掉大小属性呢?这个时候知识系统就变为:
A/(R-R1-R3)=A/R2={{x1,x2},{x5,x8},{x3,x4,x6,x7}}。同样考虑“稳定”在 知识系统A/R2中的上下近似分别为:{x1,x2}和{x1,x2,x5,x8},已经和原 来知识系统中的上下近似不一样了,同样考虑“不稳定”的近似表示也 变化了,所以删除属性“大小”是对知识表示有影响的故而不能去掉。
• 目前,粗糙集理论已经广泛的应用于知识发现、数据挖掘、智能 决策、电子控制等多个领域。
9.1.2 粗糙集理论的特点
粗糙集理论是一种数据分析工具。 粗糙集理论不需要先验知识。 粗糙集理论是一种软计算方法。
9.1.3 粗糙集理论在数据挖掘中的应用
在数据预处理过程中,粗糙集理论可以用于对特征更 准确的提取 在数据准备过程中,利用粗糙集理论的数据约简特性, 对数据集进行降维操作。 在数据挖掘阶段,可将粗糙集理论用于分类规则的发 现。 在解释与评估过程中,粗糙集理论可用于对所得到的 结果进行统计评估。
假设有8个积木构成了一个集合A: A={x1,x2,x3,x4,x5,x6,x7,x8},
每个积木块都有颜色属性,按照颜色的不同,我们能够把这 堆积木分成 R1={红,黄,兰}三个大类:
红颜色的积木构成集合X1={x1,x2,x6}, 黄颜色的积木构成集合X2={x3,x4}, 兰颜色的Slowinski主编的《Intelligence decision support: handbook of applications and advances of rough sets theory》 的出版,奠定了粗糙集理论的基础,有力地推动了国际粗糙 集理论与应用的深入研究。
同样的讨论对于“形状”属性也一样,它是不能去掉的。 最后我们得到化简后的知识库R2,R3,从而能得到下面的决策规则:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• The non-empty subsets of the condition attributes are {Age}, {LEMS}, and {Age, LEMS}. • IND({Age}) = {{x1,x2,x6}, {x3,x4}, {x5,x7}} • IND({LEMS}) = {{x1}, {x2}, {x3,x4}, {x5,x6,x7}} • IND({Age,LEMS}) = {{x1}, {x2}, {x3,x4}, {x5,x7}, {x6}}.
Issues in the Decision Table
• The same or indiscernible objects may be represented several times. • Some of the attributes may be superfluous.
13
不可区分性Indiscernibility
11
Decision Systems/Tables
Age x1 x2 x3 x4 x5 x6 x7 16-30 16-30 31-45 31-45 46-60 16-30 46-60 LEMS Walk 50 yes 0 no 1-25 no 1-25 yes 26-49 no 26-49 yes 26-49 no
9
二、 知识分类
粗糙集理论与传统的集合理论有着相似之处,但是它们的 出发点完全不同。传统集合论认为,一个集合完全是由其 元素所决定,一个元素要么属于这个集合,要么不属于这 个集合,即它的隶属函数X(x){0,1}。模糊集合对此做了 拓广,它给成员赋予一个隶属度,即X(x)[0,1],使得模 糊集合能够处理一定的模糊和不确定数据,但是其模糊隶 属度的确定往往具有人为因素,这给其应用带来了一定的 不便。而且,传统集合论和模糊集合论都是把隶属关系作 为原始概念来处理,集合的并和交就建立在其元素的隶属 度max和min操作上,因此其隶属度必须事先给定(传统集 合默认隶属度为1或0)。在粗糙集中,隶属关系不再是一 个原始概念,因此无需人为给元素指定一个隶属度,从而 避免了主观因素的影响。 10
17
粗糙集的基本定义
知识的分类观点
粗糙集理论假定知识是一种对对象进行分 类的能力。而知识必须与具体或抽象世界的 特定部分相关的各种分类模式联系在一起, 这种特定部分称之为所讨论的全域或论域 (universe)。 为数学处理方便起见,在下面的定义中用 等价关系来代替分类。
18
粗糙集的基本定义
粗糙集
1
内容
一、概述 二、知识分类 三、知识的约简 四、决策表的约简 五、粗糙集的扩展模型 六、粗糙集的实验系统 七、粒度计算简介
2
一、 概述
现实生活中有许多含糊现象并不能简单 地用真、假值来表示﹐如何表示和处理这些 现象就成为一个研究领域。早在1904年谓词 逻辑的创始人G.Frege就提出了含糊(Vague) 一词,他把它归结到边界线上,也就是说在 全域上存在一些个体既不能在其某个子集上 分类,也不能在该子集的补集上分类。
INDIS (B) {( x, x' ) U 2 | a B, a( x) a( x' )}
where INDIS (B) is called the B-indiscernibility relation. • If ( x, x' ) INDIS ( B), then objects x and x’ are indiscernible from each other by attributes from B. • The equivalence classes of the B-indiscernibility relation are denoted by [ x]B .
• DS: T (U , A {d}) • d A is the decision attribute (instead of one we can consider more decision attributes). • The elements of A are called the condition attributes.
[ x]
IND ( P )
[ x]
R P
R
19
粗糙集的基本定义
定义3 给定近似空间K=(U, R),子集XU称为U上 的一个概念(concept),形式上,空集也视为一个 概念;非空子族集PR所产生的不分明关系 IND(P) 的所有等价类关系的集合即U/IND(P),称为基本 知识(basic knowledge),相应的等价类称为基本 概念(basic concept);特别地,若关系QR,则 关系Q就称为初等知识(elementary knowledge), 相 应 的 等 价 类 就 称 为 初 等 概 念 (elementary concept)。
二、 知识分类
为数学处理方便起见,在下面的定义中用等价关系 来代替分类。 一个近似空间(approximate space)(或知识库)定义 为一个关系系统(或二元组)
K=(U,R)
其中U(为空集)是一个被称为全域或论域(universe) 的所有要讨论的个体的集合,R是U上等价关系的一 个族集。
20
上近似、下近似和边界区域
定义5:
X的下近似:R*(X)={x:(xU) ([x]RX ) } X的上近似:R*(X)={x:(xU) ([x]RX )} X的边界区域:BNR(X)=R*(X)–R*(X) 若BNR(X) ,则集合X就是一个粗糙概念。下 近似包含了所有使用知识R可确切分类到X的元 素,上近似则包含了所有那些可能是属于X的 元素。概念的边界区域由不能肯定分类到这个 概念或其补集中的所有元素组成。 POSR(X)=R*(X)称为集合X的R-正区域, NEGR(X)=U–R*(X)称为集合X的R-反区域。 21
Lower & Upper Approximations (2)
Upper Approximation:
RX {Y U / R : Y X }
Lower Approximation:
RX {Y U / R : Y X }
22
新型的隶属关系
传统集合论中,一个元素的隶属函数X(x){0,1}。 而粗糙集理论中,X(x)[0,1] 定义4 设XU且xU,集合X的粗糙隶属函数(rough membership function) 定义为
16
概念的边界
著名哲学家Frege认为“概念必须有明确的边界。 没有明确边界的概念,将对应于一个在周围没有明 确界线的区域”。粗糙集理论中的模糊性就是一种 基于边界的概念,即一个不精确的概念具有模糊的 不可被明确划分的边界。为刻画模糊性,每个不精 确概念由一对称为上近似与下近似的精确概念来表 示,它们可用隶属函数定义
• The equivalence class [ x]R of an element x X consists of all objects y X such that xRy.
14
不可区分性Indiscernibility (2)
• Let IS = (U, A) be an information system, then with any B A there is an associated equivalence relation:
Information Systems/Tables
Age x1 x2 x3 x4 x5 x6 x7 16-30 16-30 31-45 31-45 46-60 16-30 46-60 LEMS 50 0 1-25 1-25 26-49 26-49 26-49 • IS is a pair (U, A) • U is a non-empty finite set of objects. • A is a non-empty finite set of attributes such that for every a A. a : U Va • Va is called the value set of a. • No redundancy, Relational database
5
二、 知识分类
基本粗糙集理论认为知识就是人类和其他物种所固有 的分类能力。分类是推理、学习与决策中的关键问题。 因此,粗糙集理论假定知识是一种对对象进行分类的 能力。这里的“对象”是指我们所能言及的任何事物, 比如实物、状态、抽象概念、过程和时刻等等。即知 识必须与具体或抽象世界的特定部分相关的各种分类 模式联系在一起,这种特定部分称之为所讨论的全域 或论域(universe)。对于全域及知识的特性并没有任 何特别假设。事实上,知识构成了某一感兴趣领域中 各种分类模式的一个族集(family),这个族集提供了 关于现实的显事实,以及能够从这些显事实中推导出 隐事实的推理能力。 6
3
模糊集
1965年,Zadeh提出了模糊集,不少理 论计算机科学家和逻辑学家试图通过这一理 论解决G.Frege的含糊概念,但模糊集理论 采用隶属度函数来处理模糊性,而基本的隶 属度是凭经验或者由领域专家给出,所以具 有相当的主观性。
4
粗糙集的提出
20世纪80年代初,波兰的Pawlak针对 G.Frege的边界线区域思想提出了粗糙集 (Rough Set)﹐他把那些无法确认的个体 都归属于边界线区域,而这种边界线区域被 定义为上近似集和下近似集之差集。由于它 有确定的数学公式描述,完全由数据决定, 所以更有客观性 。粗糙集理论的主要优势 之一是它不需要任何预备的或额外的有关数 据信息。
7
二、 知识分类
设PR,且P ,P中所有等价关系的交集称为P上 的一种不可区分关系(indiscernbility relation) 记作IND(P),即
[x]IND(p)= ∩[x]R RP 注意,IND(P)也是等价关系且是唯一的。