粗糙集 (ppt)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[ x]
IND ( P )
[ x]
R P
R
19
粗糙集的基本定义
定义3 给定近似空间K=(U, R),子集XU称为U上 的一个概念(concept),形式上,空集也视为一个 概念;非空子族集PR所产生的不分明关系 IND(P) 的所有等价类关系的集合即U/IND(P),称为基本 知识(basic knowledge),相应的等价类称为基本 概念(basic concept);特别地,若关系QR,则 关系Q就称为初等知识(elementary knowledge), 相 应 的 等 价 类 就 称 为 初 等 概 念 (elementary concept)。
• The non-empty subsets of the condition attributes are {Age}, {LEMS}, and {Age, LEMS}. • IND({Age}) = {{x1,x2,x6}, {x3,x4}, {x5,x7}} • IND({LEMS}) = {{x1}, {x2}, {x3,x4}, {x5,x6,x7}} • IND({Age,LEMS}) = {{x1}, {x2}, {x3,x4}, {x5,x7}, {x6}}.
7
二、 知识分类
设PR,且P ,P中所有等价关系的交集称为P上 的一种不可区分关系(indiscernbility relation) 记作IND(P),即
[x]IND(p)= ∩[x]R RP 注意,IND(P)也是等价关系且是唯一的。
8
二、 知识分类
给定近似空间K=(U, R),子集XU称为U上的一个概念 (concept),形式上,空集也视为一个概念;非空子族集 PR所产生的不可区分关系IND(P)的所有等价类关系的集合 即U/IND(P),称为基本知识(basic knowledge),相应的等 价类称为基本概念(basic concept);特别地,若关系QR, 则关系Q就称为初等知识(elementary knowledge),相应的 等价类就称为初等概念(elementary concept)。 根据上述定义可知,概念即对象的集合,概念的族集(分类) 就是U上的知识,U上分类的族集可以认为是U上的一个知识 库,或说知识库即是分类方法的集合。
定义1 一个近似空间(approximate space)(或知 识库)定义为一个关系系统(或二元组)K=(U, R), 其 中 U( 为 空 集 ) 是 一 个 被 称 为 全 域 或 论 域 (universe)的所有要讨论的个体的集合,R是U上 等价关系的一个族集。 定义2 设PR,且P ,P中所有等价关系的交集 称 为 P 上 的 一 种 不 分 明 关 系 (indiscernbility relation)(或称不可区分关系),记作IND(P)
3
模糊集
1965年,Zadeh提出了模糊集,不少理 论计算机科学家和逻辑学家试图通过这一理 论解决G.Frege的含糊概念,但模糊集理论 采用隶属度函数来处理模糊性,而基本的隶 属度是凭经验或者由领域专家给出,所以具 有相当的主观性。
4
粗糙集的提出
20世纪80年代初,波兰的Pawlak针对 G.Frege的边界线区域思想提出了粗糙集 (Rough Set)﹐他把那些无法确认的个体 都归属于边界线区域,而这种边界线区域被 定义为上近似集和下近似集之差集。由于它 有确定的数学公式描述,完全由数据决定, 所以更有客观性 。粗糙集理论的主要优势 之一是它不需要任何预备的或额外的有关数 据信息。
20
上近似、下近似和边界区域
定义5:
X的下近似:R*(X)={x:(xU) ([x]RX ) } X的上近似:R*(X)={x:(xU) ([x]RX )} X的边界区域:BNR(X)=R*(X)–R*(X) 若BNR(X) ,则集合X就是一个粗糙概念。下 近似包含了所有使用知识R可确切分类到X的元 素,上近似则包含了所有那些可能是属于X的 元素。概念的边界区域由不能肯定分类到这个 概念或其补集中的所有元素组成。 POSR(X)=R*(X)称为集合X的R-正区域, NEGR(X)=U–R*(X)称为集合X的R-反区域。 21
5
二、 知识分类
基本粗糙集理论认为知识就是人类和其他物种所固有 的分类能力。分类是推理、学习与决策中的关键问题。 因此,粗糙集理论假定知识是一种对对象进行分类的 能力。这里的“对象”是指我们所能言及的任何事物, 比如实物、状态、抽象概念、过程和时刻等等。即知 识必须与具体或抽象世界的特定部分相关的各种分类 模式联系在一起,这种特定部分称之为所讨论的全域 或论域(universe)。对于全域及知识的特性并没有任 何特别假设。事实上,知识构成了某一感兴趣领域中 各种分类模式的一个族集(family),这个族集提供了 关于现实的显事实,以及能够从这些显事实中推导出 隐事实的推理能力。 6
17
粗糙集的基本定义
知识的分类观点
粗糙集理论假定知识是一种对对象进行分 类的能力。而知识必须与具体或抽象世界的 特定部分相关的各种分类模式联系在一起, 这种特定部分称之为所讨论的全域或论域 (universe)。 为数学处理方便起见,在下面的定义中用 等价关系来代替分类。
18
粗糙集的基本定义
11
Decision Systems/Tables
Age x1 x2 x3 x4 x5 x6 x7 16-30 16-30 31-45 31-45 46-60 16-30 46-60 LEMS Walk 50 yes 0 no 1-25 no 1-25 yes 26-49 no 26-49 yes 26-49 no
二、 知识分类
为数学处理方便起见,在下面的定义中用等价关系 来代替分类。 一个近似空间(approximate space)(或知识库)定义 为一个关系系统(或二元组)
K=(U,R)
其中U(为空集)是一个被称为全域或论域(universe) 的所有要讨论的个体的集合,R是U上等价关系的一 个族集。
15
不可区分性实例 Indiscernibility
Age x1 x2 x3 x4 x5 x6 x7 16-30 16-30 31-45 31-45 46-60 16-30 46-60 LEMS Walk 50 yes 0 wk.baidu.como 1-25 no 1-25 yes 26-49 no 26-49 yes 26-49 no
16
概念的边界
著名哲学家Frege认为“概念必须有明确的边界。 没有明确边界的概念,将对应于一个在周围没有明 确界线的区域”。粗糙集理论中的模糊性就是一种 基于边界的概念,即一个不精确的概念具有模糊的 不可被明确划分的边界。为刻画模糊性,每个不精 确概念由一对称为上近似与下近似的精确概念来表 示,它们可用隶属函数定义
• The equivalence class [ x]R of an element x X consists of all objects y X such that xRy.
14
不可区分性Indiscernibility (2)
• Let IS = (U, A) be an information system, then with any B A there is an associated equivalence relation:
Lower & Upper Approximations (2)
Upper Approximation:
RX {Y U / R : Y X }
Lower Approximation:
RX {Y U / R : Y X }
22
新型的隶属关系
传统集合论中,一个元素的隶属函数X(x){0,1}。 而粗糙集理论中,X(x)[0,1] 定义4 设XU且xU,集合X的粗糙隶属函数(rough membership function) 定义为
Information Systems/Tables
Age x1 x2 x3 x4 x5 x6 x7 16-30 16-30 31-45 31-45 46-60 16-30 46-60 LEMS 50 0 1-25 1-25 26-49 26-49 26-49 • IS is a pair (U, A) • U is a non-empty finite set of objects. • A is a non-empty finite set of attributes such that for every a A. a : U Va • Va is called the value set of a. • No redundancy, Relational database
粗糙集
1
内容
一、概述 二、知识分类 三、知识的约简 四、决策表的约简 五、粗糙集的扩展模型 六、粗糙集的实验系统 七、粒度计算简介
2
一、 概述
现实生活中有许多含糊现象并不能简单 地用真、假值来表示﹐如何表示和处理这些 现象就成为一个研究领域。早在1904年谓词 逻辑的创始人G.Frege就提出了含糊(Vague) 一词,他把它归结到边界线上,也就是说在 全域上存在一些个体既不能在其某个子集上 分类,也不能在该子集的补集上分类。
12
Issues in the Decision Table
• The same or indiscernible objects may be represented several times. • Some of the attributes may be superfluous.
13
不可区分性Indiscernibility
• DS: T (U , A {d}) • d A is the decision attribute (instead of one we can consider more decision attributes). • The elements of A are called the condition attributes.
INDIS (B) {( x, x' ) U 2 | a B, a( x) a( x' )}
where INDIS (B) is called the B-indiscernibility relation. • If ( x, x' ) INDIS ( B), then objects x and x’ are indiscernible from each other by attributes from B. • The equivalence classes of the B-indiscernibility relation are denoted by [ x]B .
• The equivalence relation
A binary relation R X X which is reflexive (xRx for any object x) , symmetric (if xRy then yRx), and transitive (if xRy and yRz then xRz).
9
二、 知识分类
粗糙集理论与传统的集合理论有着相似之处,但是它们的 出发点完全不同。传统集合论认为,一个集合完全是由其 元素所决定,一个元素要么属于这个集合,要么不属于这 个集合,即它的隶属函数X(x){0,1}。模糊集合对此做了 拓广,它给成员赋予一个隶属度,即X(x)[0,1],使得模 糊集合能够处理一定的模糊和不确定数据,但是其模糊隶 属度的确定往往具有人为因素,这给其应用带来了一定的 不便。而且,传统集合论和模糊集合论都是把隶属关系作 为原始概念来处理,集合的并和交就建立在其元素的隶属 度max和min操作上,因此其隶属度必须事先给定(传统集 合默认隶属度为1或0)。在粗糙集中,隶属关系不再是一 个原始概念,因此无需人为给元素指定一个隶属度,从而 避免了主观因素的影响。 10