粗糙集理论第1章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
绪论
●20世纪80年代,波兰数学家Z.Pawlak提出粗糙集理论
概率论(Probabilistic Theory)刻画概念发生的随机性(Stochastic),
模糊集理论(Fuzzy Set Theory)刻画概念的模糊性(Vagueness),刻画概念的粗糙性(Coarseness),即分类能力(Classification Ability)。
粗糙集理论简称为粗集理论,粗糙集,或粗集。
●一个概念越粗糙,其分类能力越差,分类得到的对象组的
颗粒(granularity)越大(越粗),对象之间的可辨识性(discernibility)越差。
相反地,一个概念越精细(fine),其分类能力越强,分类所得的对象组的颗粒越小,对象之间的可辨识性越好。
●例子
图像的分辨率刻画了图像质量的粗糙程度,类似粗糙集刻画了知识或概念的粗糙程度。
图像中的分辨率越高,图像的可辨识性就越好,反之就越差。
像素灰度刻画了图像黑白的不同程度,类似模糊集刻画了概念的模糊性。
而图像上的内容则反映了某个物体出现的随机性。
第一章 知识
有关知识的理论已有长远和丰富的历史,Pawlak 提议把粗集理论作为讨论知识的理论框架,特别在关注不精确知识的时候。
本章对“知识”这一术语给出形式化的定义,并讨论了它的一些基本特性。
粗集理论对知识的基本看法:知识是人类关于事物之分类能力的深层次刻画。
论域(universe of discourse ):真实世界或抽象世界被称为论域.
定义1.1 设论域U 是非空有限集合,U 中元素是论域中感兴趣的对象。
对∀X ⊆ U ,称其为U 的一个概念或范畴(category )。
称U 的任意概念簇为U 的抽象知识或知识。
为便于形式推理,允许空集 ∅ 作为一个概念。
本书我们的主要兴趣在于形成某论域的一个划分(partition )或分类(classification )的概念。
(在本书中有:划分分类,划分与分类是两个等价的概念)
定义1.2 U 为论域,若概念簇C = {X i | X i ⊆U ,X i ≠ ∅,i = 1,2,…,n} 满足:
⑴ 对于i ,j = 1,2,…,n ,i≠j ,X i ∩X j = ∅
⑵ 1 n
i i X U == 则称C 为U 的一个划分或分类。
通常我们不处理论域U 上的单个分类,而是处理论域U 上的一些分类簇(划分簇). 称U 上的一个分类簇为U 上的一个知识库。
概念 −→ 概念簇 −→ (满足定义1.2要求的概念簇)分类 −→ 分类族 ⇔ 知识库
因此,知识库表示了多种基本分类能力。
为了便于推理,我们经常利用等价关系(equivalence relation)
处理。
定义1.3 设R 是论域U 上的一个等价关系,[x ]R 表示包含x ∈U 的R 中的一个概念或范畴——一个等价类,U/R 表示R 的所有等价类的簇(或U 上的分类),称其为R 的概念组或范畴组。
一个等价关系 ⇔ 一个分类
定义1.4 称K =(U , R )为知识库,其中U 是一个被称之为论域的非空有限集合,R 是U 上的等价关系构成的簇。
如果∅⊂ P ⊆ R ,令∩P 表示所有属于P 的等价关系的交集,则∩P 也是U 上的等价关系。
定义 1.5 称IND (P )=∩P 为 P 上的不可分辨关系(indiscernibility ),且有()[]IND x Ρ=
[]∈x P p p .
这样,U/IND (P )就是等价关系IND (P )的等价类族,表示了与等价关系族P 相关的知识,称做K 中关于U 的P 基本知识(P-basic knowledge),简称基本知识。
定义1.6 设K =(U ,R )是一个知识库 , ∅⊂ P ⊆ R , 称U/IND (P )是K 中关于U 的P 基本知识(P-basic knowledge),并简记为U/P . 在不引起混乱的情况下,P 也可称为基本知识.
X∈U/P称为P基本概念(P-basic concept)。
特别地,称Q∈R(一个等价关系)为Q初等知识(elementary knowledge) . X∈U/Q,X(一个等价类)为Q初等概念(elementary concept)。
定义1.7 初等概念的交(系指集合论意义下的交运算)组成基本概念。
例子:例如年老和生病都可能是某知识库的初等概念,但年老且生病(年老与生病的交集)就是该知识库的一个基本概念。
定义1.8 对任意∅⊂P⊆R,所有的P基本概念的簇为知识库K =(U,R)的基本概念族。
定义1.9 设K=(U,R)是知识库,定义IND(K)= { IND(P):∅≠P⊆R} 为K上所有等价关系的集合。
注意IND(K)包含K的所有初等关系和由初等关系派生出来的不可分辨关系的最小等价关系集合,并且在集合论下,等价关系的交运算是封闭的.
定义 1.10 任意有限个P-基本范畴的并称为P-范畴(P-category).
定义1.11 知识库K=(U,R)中的全部范畴构成的簇称为K范畴簇(K-categories)。
Note: 区分如下概念:
Knowledge、Elementary knowledge、Basic knowledge Concept\Category、Elementary concept\Category、Basic concept\Category
例1.设U = {x1,x2,…,x8} 为玩具积木集合,共有红、蓝、绿三种颜色,圆形、方形和三角形等三种形状,分大、小两种型号。
具体见下表:
这样,我们可以定义三个等价关系R1(颜色相同)、R2(形状相同)和R3(型号相同). 则有如下等价类:
U/R1={{x1,x3,x7},{x2,x4},{x5,x6,x8}}
U/R2={{ x1,x5}园形,{x2,x6}方形,{x3,x4,x7,x8}三角形} U/R3={{x1,x3,x4,x5,x6}小号,{x2,x7,x8}大号} 上面的等价类就是知识库K=(U,{R1,R2,R3})的初等概念。
集合论意义下,初等概念的交为基本概念。
例如:
{x1,x3,x7}红∩{x3,x4,x7,x8}三角形={x3,x7}红色三角形{x2,x4}蓝∩{x2,x6}正方形={x2}蓝色正方形
{x5,x6,x8}绿∩{x3,x4,x7,x8}三角形={x8}绿色三角形
分别表示关于{R1,R2}的基本概念“红色三角形”、“蓝色正方形”和“绿色三角形”。
集合:
{x1,x3,x7}红色∩{x3,x4,x7,x8}三角形∩{x2,x7,x8}大={x7}红色大三角形
{x2,x4}∩{x2,x6}∩{x2,x7,x8}
={x2}蓝色大正方形
{x5,x6,x8}∩{x3,x4,x7,x8}∩{x2,x7,x8}
={x8}绿色大三角形
分别表示关于{R1,R2,R3}的基本概念“红色大三角形”、“蓝色大正方形”和“绿色大三角形”。
集合:
{ x1,x3,x7}红色⋃{ x2,x4}蓝色={ x1,x2,x3,x4,x7} { x2,x4}蓝色⋃{ x5,x6,x8}绿色={ x2,x4,x5,x6,x8} { x1, x3, x7}红色⋃{ x5, x6, x8}绿色={ x1, x3, x5, x6, x7, x8}
分别表示关于{R1}的初等概念“红色或蓝色(非绿)”、“蓝色或绿色(非红)”及“红色或绿色(非蓝)”。
注意,在这个知识库中,有些概念是无效的。
例如
{x2,x4}⋂{ x1,x5}= ∅和{ x1,x3,x7}⋂{ x2,x6}= ∅,这意味着基本概念蓝色圆形和红色正方形在这个知识库中是不存在的(或为空概念)。
第1.4节知识库等价、泛化和特化
定义1.12 设K=(U,P),K'=(U,Q)是两个知识库。
如果IND(P)=IND(Q)或U/P=U/Q,则K与K'(P与Q)等价(两个知识库等价Equivalent),记为K≅K'(P≅Q)。
定义1.12表明,如果K和K'有相同的初等概念集合,从而相应的所有概念的集合也是相同的,则K≅K'. 这意味着无论用知识库K中的知识还是用知识库K'中的知识,我们都能精确表示有关论域的相同事实。
定义1.13 设K=(U,P),=(U,Q)是两个知识库,
如果IND(P)⊂IND(Q),则说知识P比知识Q更精细(finer)或Q比P更粗糙(coarser),或者说P是Q的特化(specialization)或Q是P的泛化(generalization)。
例如,设P, Q∈R,U/P,U/Q都是基于颜色对论域的分类,但U/P只含有一个绿色对象类,而U/Q则含有更多的绿色对象类,譬如每个对象都涉及一个特定色度(波长)的绿色(其它颜色与此类似),那么Q是P的特化而P是Q的泛化。
在U/Q中的每一个特定色度的绿色类都包含在U/P的绿色类中。
而特化,与集合的交运算相联系,存在于将类分成更小的单位(即更小的类)。
定义1.14若某等价关系的任意等价类都是由一个元素构成的集合(单元素集合),那么这个等价关系是一个相等关系(equality relation).
且它代表的知识是最精确的,分类能力最强的。
讨论:分类能力是否越强越好?
分类能力强,往往泛化能力弱。
习题:
1.计算关系R1∩R2∩R3的所有等价类,即U/(R1∩R2∩R3)。
此处R1、R2和R3与例1一致。
2.判断如下集合是否是上述知识库中的概念:
{ x5}
{ x2,x6,x8}
{ x1,x5,x6,x7}
3.验证知识库K=(U,R1,R2,R3)和K'=(U,R1,R2)等价与否,此处U={x1,x2,x3,x4,x5}并且
U/R1={{x1,x3},{x2,x4,x5}}
U/R2={{x1},{x2,x3,x4,x5}}
U/R3={{x1,x4},{x2,,x3},{x5}}
4.是举例给出两个知识库K1与K2 并且满足K1比K2更确细。