粗糙集
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
INDIS (B) {( x, x' ) U 2 | a B, a( x) a( x' )}
where INDIS ( B) is called the B-indiscernibility relation. • If ( x, x' ) INDIS ( B), then objects x and x’ are indiscernible from each other by attributes from B. • The equivalence classes of the B-indiscernibility relation are denoted by [ x]B .
17
Issues in the Decision Table
• 相同或不可区分的对象可能被表示多次 The same or indiscernible objects may be represented several times. • 有些属性可能是多余的 Some of the attributes may be superfluous.
2015-4-9 20
不可区分性实例 Indiscernibility
Age x1 x2 x3 x4 x5 x6 x7
2015-4-9
LEMS Walk 50 yes 0 no 1-25 no 1-25 yes 26-49 no 26-49 yes 26-49 no
16-30 16-30 31-45 31-45 46-60 16-30 46-60
201本粗糙集理论认为知识就是人类和其他物种所固有的分类能力。 例如,在现实世界中关于环境的知识主要表明了生物根据其生存观来对 各种各样的情形进行分类区别的能力。每种生物根据其传感器信号形成 复杂的分类模式,就是这种生物的基本机制。 分类是推理、学习与决策中的关键问题。因此,粗糙集理论假定知识是 一种对对象进行分类的能力。这里的“对象”是指我们所能言及的任何 事物,比如实物、状态、抽象概念、过程和时刻等等。即知识必须与具 体或抽象世界的特定部分相关的各种分类模式联系在一起,这种特定部 分称之为所讨论的全域或论域(universe)。对于全域及知识的特性并没 有任何特别假设。 事实上,知识构成了某一感兴趣领域中各种分类模式的一个族集 (family),这个族集提供了关于现实的显事实,以及能够从这些显事实 中推导出隐事实的推理能力。
2015-4-9 11
二、 知识分类
为数学处理方便起见,在下面的定义中用等价关系 来代替分类。 一个近似空间(approximate space)(或知识库)定义 为一个关系系统(或二元组)
K=(U,R)
其 中 U ( 为 空 集 ) 是 一 个 被 称 为 全 域 或 论 域 (universe)的所有要讨论的个体的集合,R是U上等 价关系的一个族集。
• The equivalence class [ x]R of an element x X consists of all objects y X such that xRy.
2015-4-9 19
不可区分性Indiscernibility (2)
• Let IS = (U, A) be an information system, then with any B A there is an associated equivalence relation:
• DS: T (U , A {d}) • d A is the decision attribute (instead of one we can consider more decision attributes). • The elements of A are called the condition attributes.
2015-4-9 14
二、 知识分类
粗糙集理论与传统的集合理论有着相似之处,但是它们的 出发点完全不同。传统集合论认为,一个集合完全是由其 元素所决定,一个元素要么属于这个集合,要么不属于这 个集合,即它的隶属函数X(x){0,1}。模糊集合对此做了 拓广,它给成员赋予一个隶属度,即X(x)[0,1],使得模 糊集合能够处理一定的模糊和不确定数据,但是其模糊隶 属度的确定往往具有人为因素,这给其应用带来了一定的 不便。而且,传统集合论和模糊集合论都是把隶属关系作 为原始概念来处理,集合的并和交就建立在其元素的隶属 度max和min操作上,因此其隶属度必须事先给定(传统集 合默认隶属度为1或0)。在粗糙集中,隶属关系不再是一 个原始概念,因此无需人为给元素指定一个隶属度,从而 避免了主观因素的影响。 2015-4-9 15
知识工程
粗
糙
集
Set
Rough
2015-4-9
1
内容提要
一、概述 二、知识分类 三、知识的约简 四、决策表的约简 五、粗糙集的扩展模型 六、粗糙集的实验系统 七、粒度计算简介
2015-4-9 2
一、 概述
现实生活中有许多含糊现象并不能简单 地用真、假值来表示﹐如何表示和处理这些 现象就成为一个研究领域。早在1904年谓词 逻辑的创始人G.Frege就提出了含糊(Vague) 一词,他把它归结到边界线上,也就是说在 全域上存在一些个体既不能在其某个子集上 分类,也不能在该子集的补集上分类。
2015-4-9 9
研究现状分析
曾黄麟. 粗集理论及其应用(修订版). 重庆: 重庆大学出版社, 1998 刘清. Rough Set及Rough推理. 北京: 科学出版社, 2001 张文修等. Rough Set理论与方法. 北京: 科学出版社, 2001 王国胤. Rough Set理论与知识获取. 西安: 西安交通大学出版 社, 2001 史忠植. 知识发现. 北京: 清华大学出版社, 2002 苗夺谦//王国胤//刘清//林早阳//姚一 豫. 粒计算--过去现在与 展望. 科学出版社, 2007
2015-4-9 8
研究现状分析
2007年粗糙集与软计算、Web智能、粒计算联合学术 会议, 山西大学 2008年第8届中国粗糙集与软计算学术会议、第2届 中国Web智能学术研讨会、第2届中国粒计算学术研 讨会联合学术会议(CRSSC-CWI-CGrC2008), 河南 师范大学 中科院计算所、中科院自动化所、重庆邮电学院、 南昌大学、西安交通大学、山西大学、合肥工业大 学、北京工业大学 、上海大学
2015-4-9 7
研究现状分析
2001年5月在重庆召开了“第1届中国Rough集与软计 算学术研讨会”,邀请了创始人Z. Pawlak教授做大 会报告; 2002年10月在苏州第2届中国粗糙集与软计算学术研讨会 2003年5月在重庆 第3届中国粗糙集与软计算学术研讨会
2004年10月中下旬在浙江舟山召开第4届中国粗糙集与软计算 学术研讨会 2005年8月1日至5日在鞍山科技大学召开第五届中国Rough集 与软计算学术研讨会(CRSSC2005) 2006第六届中国粗糙集与软计算学术研讨会在 浙江师范大学
2015-4-9
3
模糊集
1965年,Zadeh提出了模糊集,不少理 论计算机科学家和逻辑学家试图通过这一理 论解决G.Frege的含糊概念,但模糊集理论 采用隶属度函数来处理模糊性,而基本的隶 属度是凭经验或者由领域专家给出,所以具 有相当的主观性。
2015-4-9
4
粗糙集的提出
20世纪80年代初,波兰的Pawlak针对 G.Frege的边界线区域思想提出了粗糙集 (Rough Set)﹐他把那些无法确认的个体 都归属于边界线区域,而这种边界线区域被 定义为上近似集和下近似集之差集。由于它 有确定的数学公式描述,完全由数据决定, 所以更有客观性 。
16
Decision Systems/Tables
Age x1 x2 x3 x4 x5 x6 x7
2015-4-9
LEMS Walk 50 yes 0 no 1-25 no 1-25 yes 26-49 no 26-49 yes 26-49 no
16-30 16-30 31-45 31-45 46-60 16-30 46-60
2015-4-9
18
不可区分性Indiscernibility
• The equivalence relation
A binary relation R X X which is reflexive (xRx for any object x) , symmetric (if xRy then yRx), and transitive (if xRy and yRz then xRz).
2015-4-9
6
粗糙集的研究
1991年波兰Pawlak教授的第一本关于粗 糙集的专著《Rough Sets:Theoretical Aspects of Reasoning about Data 》和 1992年R.Slowinski主编的关于粗糙集应用 及其与相关方法比较研究的论文集的出版, 推动了国际上对粗糙集理论与应用的深入研 究。1992年在波兰Kiekrz召开了第1届国际 粗糙集讨论会。从此每年召开一次与粗糙集 理论为主题的国际研讨会。
2015-4-9 12
二、 知识分类
设PR,且P ,P中所有等价关系的交集称为P上 的一种不可区分关系(indiscernbility relation) (或称难区分关系),记作IND(P),即
[x]IND(p)= ∩[x]R
R P
注意,IND(P)也是等价关系且是唯一的。
2015-4-9
2015-4-9
5
粗糙集的研究
粗糙集理论的主要优势之一是它不需要 任何预备的或额外的有关数据信息。自提出 以来,许多计算机科学家和数学家对粗糙集 理论及其应用进行了坚持不懈的研究,使之 在理论上日趋完善,特别是由于20世纪80年 代末和90年代初在知识发现等领域得到了成 功的应用而越来越受到国际上的广泛关注。
• The non-empty subsets of the condition attributes are {Age}, {LEMS}, and {Age, LEMS}. • IND({Age}) = {{x1,x2,x6}, {x3,x4}, {x5,x7}} • IND({LEMS}) = {{x1}, {x2}, {x3,x4}, {x5,x6,x7}} • IND({Age,LEMS}) = {{x1}, {x2}, {x3,x4}, {x5,x7}, {x6}}.
13
二、 知识分类
给定近似空间K=(U, R),子集XU称为U上的一个概念 (concept),形式上,空集也视为一个概念;非空子族集 PR所产生的不分明关系IND(P)的所有等价类关系的集合即 U/IND(P),称为基本知识(basic knowledge),相应的等价 类称为基本概念(basic concept);特别地,若关系QR, 则关系Q就称为初等知识(elementary knowledge),相应的 等价类就称为初等概念(elementary concept)。 一般用大写字母P,Q,R等表示一个关系,用大写黑体字母 P,Q,R等表示关系的族集;[x]R或R(x)表示关系R中包含元素 xU 的概念或等价类。为了简便起见,有时用 P 代替 IND(P) 。 根据上述定义可知,概念即对象的集合,概念的族集 (分类)就是U上的知识,U上分类的族集可以认为是U上的 一个知识库,或说知识库即是分类方法的集合。
Information Systems/Tables
Age x1 x2 x3 x4 x5 x6 x7
2015-4-9
LEMS 50 0 1-25 1-25 26-49 26-49 26-49
16-30 16-30 31-45 31-45 46-60 16-30 46-60
• IS is a pair (U, A) • U is a non-empty finite set of objects. • A is a non-empty finite set of attributes such that a : U Va for every a A. • Va is called the value set of a.
where INDIS ( B) is called the B-indiscernibility relation. • If ( x, x' ) INDIS ( B), then objects x and x’ are indiscernible from each other by attributes from B. • The equivalence classes of the B-indiscernibility relation are denoted by [ x]B .
17
Issues in the Decision Table
• 相同或不可区分的对象可能被表示多次 The same or indiscernible objects may be represented several times. • 有些属性可能是多余的 Some of the attributes may be superfluous.
2015-4-9 20
不可区分性实例 Indiscernibility
Age x1 x2 x3 x4 x5 x6 x7
2015-4-9
LEMS Walk 50 yes 0 no 1-25 no 1-25 yes 26-49 no 26-49 yes 26-49 no
16-30 16-30 31-45 31-45 46-60 16-30 46-60
201本粗糙集理论认为知识就是人类和其他物种所固有的分类能力。 例如,在现实世界中关于环境的知识主要表明了生物根据其生存观来对 各种各样的情形进行分类区别的能力。每种生物根据其传感器信号形成 复杂的分类模式,就是这种生物的基本机制。 分类是推理、学习与决策中的关键问题。因此,粗糙集理论假定知识是 一种对对象进行分类的能力。这里的“对象”是指我们所能言及的任何 事物,比如实物、状态、抽象概念、过程和时刻等等。即知识必须与具 体或抽象世界的特定部分相关的各种分类模式联系在一起,这种特定部 分称之为所讨论的全域或论域(universe)。对于全域及知识的特性并没 有任何特别假设。 事实上,知识构成了某一感兴趣领域中各种分类模式的一个族集 (family),这个族集提供了关于现实的显事实,以及能够从这些显事实 中推导出隐事实的推理能力。
2015-4-9 11
二、 知识分类
为数学处理方便起见,在下面的定义中用等价关系 来代替分类。 一个近似空间(approximate space)(或知识库)定义 为一个关系系统(或二元组)
K=(U,R)
其 中 U ( 为 空 集 ) 是 一 个 被 称 为 全 域 或 论 域 (universe)的所有要讨论的个体的集合,R是U上等 价关系的一个族集。
• The equivalence class [ x]R of an element x X consists of all objects y X such that xRy.
2015-4-9 19
不可区分性Indiscernibility (2)
• Let IS = (U, A) be an information system, then with any B A there is an associated equivalence relation:
• DS: T (U , A {d}) • d A is the decision attribute (instead of one we can consider more decision attributes). • The elements of A are called the condition attributes.
2015-4-9 14
二、 知识分类
粗糙集理论与传统的集合理论有着相似之处,但是它们的 出发点完全不同。传统集合论认为,一个集合完全是由其 元素所决定,一个元素要么属于这个集合,要么不属于这 个集合,即它的隶属函数X(x){0,1}。模糊集合对此做了 拓广,它给成员赋予一个隶属度,即X(x)[0,1],使得模 糊集合能够处理一定的模糊和不确定数据,但是其模糊隶 属度的确定往往具有人为因素,这给其应用带来了一定的 不便。而且,传统集合论和模糊集合论都是把隶属关系作 为原始概念来处理,集合的并和交就建立在其元素的隶属 度max和min操作上,因此其隶属度必须事先给定(传统集 合默认隶属度为1或0)。在粗糙集中,隶属关系不再是一 个原始概念,因此无需人为给元素指定一个隶属度,从而 避免了主观因素的影响。 2015-4-9 15
知识工程
粗
糙
集
Set
Rough
2015-4-9
1
内容提要
一、概述 二、知识分类 三、知识的约简 四、决策表的约简 五、粗糙集的扩展模型 六、粗糙集的实验系统 七、粒度计算简介
2015-4-9 2
一、 概述
现实生活中有许多含糊现象并不能简单 地用真、假值来表示﹐如何表示和处理这些 现象就成为一个研究领域。早在1904年谓词 逻辑的创始人G.Frege就提出了含糊(Vague) 一词,他把它归结到边界线上,也就是说在 全域上存在一些个体既不能在其某个子集上 分类,也不能在该子集的补集上分类。
2015-4-9 9
研究现状分析
曾黄麟. 粗集理论及其应用(修订版). 重庆: 重庆大学出版社, 1998 刘清. Rough Set及Rough推理. 北京: 科学出版社, 2001 张文修等. Rough Set理论与方法. 北京: 科学出版社, 2001 王国胤. Rough Set理论与知识获取. 西安: 西安交通大学出版 社, 2001 史忠植. 知识发现. 北京: 清华大学出版社, 2002 苗夺谦//王国胤//刘清//林早阳//姚一 豫. 粒计算--过去现在与 展望. 科学出版社, 2007
2015-4-9 8
研究现状分析
2007年粗糙集与软计算、Web智能、粒计算联合学术 会议, 山西大学 2008年第8届中国粗糙集与软计算学术会议、第2届 中国Web智能学术研讨会、第2届中国粒计算学术研 讨会联合学术会议(CRSSC-CWI-CGrC2008), 河南 师范大学 中科院计算所、中科院自动化所、重庆邮电学院、 南昌大学、西安交通大学、山西大学、合肥工业大 学、北京工业大学 、上海大学
2015-4-9 7
研究现状分析
2001年5月在重庆召开了“第1届中国Rough集与软计 算学术研讨会”,邀请了创始人Z. Pawlak教授做大 会报告; 2002年10月在苏州第2届中国粗糙集与软计算学术研讨会 2003年5月在重庆 第3届中国粗糙集与软计算学术研讨会
2004年10月中下旬在浙江舟山召开第4届中国粗糙集与软计算 学术研讨会 2005年8月1日至5日在鞍山科技大学召开第五届中国Rough集 与软计算学术研讨会(CRSSC2005) 2006第六届中国粗糙集与软计算学术研讨会在 浙江师范大学
2015-4-9
3
模糊集
1965年,Zadeh提出了模糊集,不少理 论计算机科学家和逻辑学家试图通过这一理 论解决G.Frege的含糊概念,但模糊集理论 采用隶属度函数来处理模糊性,而基本的隶 属度是凭经验或者由领域专家给出,所以具 有相当的主观性。
2015-4-9
4
粗糙集的提出
20世纪80年代初,波兰的Pawlak针对 G.Frege的边界线区域思想提出了粗糙集 (Rough Set)﹐他把那些无法确认的个体 都归属于边界线区域,而这种边界线区域被 定义为上近似集和下近似集之差集。由于它 有确定的数学公式描述,完全由数据决定, 所以更有客观性 。
16
Decision Systems/Tables
Age x1 x2 x3 x4 x5 x6 x7
2015-4-9
LEMS Walk 50 yes 0 no 1-25 no 1-25 yes 26-49 no 26-49 yes 26-49 no
16-30 16-30 31-45 31-45 46-60 16-30 46-60
2015-4-9
18
不可区分性Indiscernibility
• The equivalence relation
A binary relation R X X which is reflexive (xRx for any object x) , symmetric (if xRy then yRx), and transitive (if xRy and yRz then xRz).
2015-4-9
6
粗糙集的研究
1991年波兰Pawlak教授的第一本关于粗 糙集的专著《Rough Sets:Theoretical Aspects of Reasoning about Data 》和 1992年R.Slowinski主编的关于粗糙集应用 及其与相关方法比较研究的论文集的出版, 推动了国际上对粗糙集理论与应用的深入研 究。1992年在波兰Kiekrz召开了第1届国际 粗糙集讨论会。从此每年召开一次与粗糙集 理论为主题的国际研讨会。
2015-4-9 12
二、 知识分类
设PR,且P ,P中所有等价关系的交集称为P上 的一种不可区分关系(indiscernbility relation) (或称难区分关系),记作IND(P),即
[x]IND(p)= ∩[x]R
R P
注意,IND(P)也是等价关系且是唯一的。
2015-4-9
2015-4-9
5
粗糙集的研究
粗糙集理论的主要优势之一是它不需要 任何预备的或额外的有关数据信息。自提出 以来,许多计算机科学家和数学家对粗糙集 理论及其应用进行了坚持不懈的研究,使之 在理论上日趋完善,特别是由于20世纪80年 代末和90年代初在知识发现等领域得到了成 功的应用而越来越受到国际上的广泛关注。
• The non-empty subsets of the condition attributes are {Age}, {LEMS}, and {Age, LEMS}. • IND({Age}) = {{x1,x2,x6}, {x3,x4}, {x5,x7}} • IND({LEMS}) = {{x1}, {x2}, {x3,x4}, {x5,x6,x7}} • IND({Age,LEMS}) = {{x1}, {x2}, {x3,x4}, {x5,x7}, {x6}}.
13
二、 知识分类
给定近似空间K=(U, R),子集XU称为U上的一个概念 (concept),形式上,空集也视为一个概念;非空子族集 PR所产生的不分明关系IND(P)的所有等价类关系的集合即 U/IND(P),称为基本知识(basic knowledge),相应的等价 类称为基本概念(basic concept);特别地,若关系QR, 则关系Q就称为初等知识(elementary knowledge),相应的 等价类就称为初等概念(elementary concept)。 一般用大写字母P,Q,R等表示一个关系,用大写黑体字母 P,Q,R等表示关系的族集;[x]R或R(x)表示关系R中包含元素 xU 的概念或等价类。为了简便起见,有时用 P 代替 IND(P) 。 根据上述定义可知,概念即对象的集合,概念的族集 (分类)就是U上的知识,U上分类的族集可以认为是U上的 一个知识库,或说知识库即是分类方法的集合。
Information Systems/Tables
Age x1 x2 x3 x4 x5 x6 x7
2015-4-9
LEMS 50 0 1-25 1-25 26-49 26-49 26-49
16-30 16-30 31-45 31-45 46-60 16-30 46-60
• IS is a pair (U, A) • U is a non-empty finite set of objects. • A is a non-empty finite set of attributes such that a : U Va for every a A. • Va is called the value set of a.