粗糙集综述word版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
粗糙集论文
题目 粗糙集综述
1 粗糙集属性约简
1.1 经典粗糙集属性约简
对于经典粗糙集我们可以用上下近似来描述。
给定知识库()R U K ,=,对于每个子集U X ⊆和一个等价关系()K ind R ∈,定义两个上下近似:
{}{}.
|/,|/ U U φ≠⋂∈=⊆∈=X Y R U Y X R X Y R U Y X R 另外上下近似还可以用以下的等式表达:
[]{}[]{}.
|,| U U φ≠⋂∈=⊆∈=X x U x X R X x U x X R R R 当利用区分矩阵来表达知识时有许多优点,特别是他能很容易计算约简和核。约简是满足能区别由整个属性集区别的所有对象的属性极小子集。如果A 包含B 是满足B 交区别对象x 和y 的所有属性集合的极小子集不为空,且区别对象x 和y 的所有属性集合的极小子集不为空,则B 是A 的一个约简。核是区分矩阵中所有单个元素组成的集合。
对于决策表,C 为条件属性集,D 为决策属性集,决策表S 的区分矩阵是一个n n ⨯矩阵,其任一元素为
},x ),(),(|{),(a *)(且y a y f a x f C a y x ω≠∈=
对于满足),(,,x y x U y ω∈
)(y )(x D pos D pos C C ∉∈且,
或者
)(y )(x D pos D pos C C ∈∉且,
或者
).(),()(,D ind y x D pos y x C ∉∈且
如果φφ≠∀≠⋂⊆),(,),(C C C **''y x a y x a 满足条件的极小子集(关于包含),则'C 是C 的D 约简(相对约简).
D 核(相对核)是决策表S 的区分矩阵中所有单个元素组成的集合,即
}.,},{),(a |{)(core *U y x a y x C a C D ∈=∈=其中
1.2 变精度粗糙集属性约简
变精度粗糙集是粗糙集的扩充,它是在基本粗糙集模型的基础上引入
)5.00(<≤ββ,即允许一定程度的错误分类率存在。这一方面完善了近似空间的概念,另一方面也有利于粗糙集理论从认为不相关的数据中发现相关数据。当β=0时,经典粗糙集模型是变精度粗糙集模型的一个特例。
X 和Y 表示有限论域U 的非空子集,且Y ⊆X 。
令
⎩⎨⎧>>⋂=0,|X |0,0,|X | |,X |/|Y X |1-Y)c(X, 多数包含关系定义为ββ
≤⇔⊇),(Y Y X c X 。
约简是保持和决策属性Q 的依赖性相同的最小条件属性子集。通过近似以来的定义来引入近似约简概念。
条件属性集P 关于据测属性集Q 的β约简是P 的一个子集),,(βQ P red ,且满足:
),),,,((),,()1(ββγβγQ Q P red Q P =. 不成立。都将是中去掉任何一个属性,从)1(),,()2(βQ P red
引入)5.00(<≤ββ参数后,扩充了基本粗糙集理论,更好体现了数据分析中的数据相关性,从而为获取近似决策规则奠定了基础。
1.3 概率粗糙集属性约简
概率是对不确定的随机事件的一种客观的反映。经典粗糙集模型是基于可利用信息的完全性的,因而忽视了可利用信息的不完全性和可能存在的统计信息,从概率论的观点出发来研究粗糙集理论,为研究不确定信息系统提供了新的粗糙集模型。
设U 是有限对象构成的论域,R 是U 上的等价关系,其构成的等价类为
},,{/U 21n X X X R ,=。
令P 为定义在U 的子集类构成的σ代数上的概率测度,三元组),,(A P R U p =称为概率近似空间。U 中的每个自己称为概念,它代表一个随机事件。
定义X 关于概率近似空间),,(A P R U p =依参数βα,概率()I 型下近似)(PI X a 和上近似)(PI X β如下:
}
{)][|(|)(a x X P U x X PI a ≥∈=, }
{)][|(|)(ββ≥∈=x X P U x X PI 。 当)(PI )(PI X X a β=时,称X 依参数βα,关于p A 是概率()I 型可定义,否则称X 依参数βα,关于p A 是概率()I 型粗糙集。同样概率粗糙集模型还有很多其他形式如概率()II 型,概率()III 型,概率()IV 型。
设),,,(ρV A U K =为一个信息系统,},,,{/21*n X X X R U R ==为等价关系R 在U 上导出的划分,S 为U 上另一个等价关系,且},,,{S 21*m Y Y Y =,则在已知知识*R 时知识*S 的正则条件熵定义为
m X Y P X Y P X P R S n i m
j i j i j i log /)|(log )|()()|(H 11*
*0∑∑==-= 显然1)|(H 0**0≤≤R S 。
系统K 中的属性子集A M ⊆称为关于属性集A B ⊆是统计依赖的,若存在M 的一个真子集L 使)|()|(**0**0L B H M B H =,否则称M 关于B 是统计独立的。N
称为M 关于B 的所有相对约简记为)(sred M B ,所有这些约简的交集称为M 关于B 的相对核,记为)(score M 。
系统K 中的属性子集A M ⊆称为关于属性集A B ⊆是统计依赖的,若存在M 的一个真子集L 使)|()|(**0**0L B H M B H =,否则称M 关于B 是统计独立的。N 称为M 关于B 的一个相对约简,若N 是M 关于B 的一个极大统计独立子集,M 关于B 的相对约简记为)(score B M 。
属性a 在A 中称为统计可省略的,若)|()}){\(|(**0**0A A H a A A H =,否则称a 在A 中为统计不可省略的。属性a 在A 中称为关于属性集D 是统计不可省略的,若)|()}){\(|(**0**0A D H a A D H =,否则称a 在A 中关于属性集D 是统计不可省略的。
1.4 模糊粗糙集及其发展情况
在人们的实际生活中,涉及更多的是模糊概念和模糊知识。反映在粗糙集模型中主要有两类,一类是知识库的知识是清晰的,而被近似的概念是模糊的,另一类是知识库的知识和被近似的概念都是模糊的。
在经典粗糙集模型中,论域U 上任意一个经典集合A 不一定能用知识库()R U ,中的知识来精确描述,这时就用A 关于()R U ,的一对上下近似来描述。但在实际生活中,人们涉及到的知识火概念往往是模糊的不确定的,即A 是U 上的一个模糊集合,于是提出了模糊粗糙集模型。
设()R U ,是经典近似空间,即R 是论域U 上的一个等价关系。若A 是U 上的一个模糊集合,贼A 关于()R U ,的一堆下近似R A 和上近似R A 定义为U 上的一对模糊集合,其隶属函数分别定义为
,},][|)(sup{)(,
},][|)(inf{)(U x x y y A x A U x x y y A x A R R R R ∈∈=∈∈=
其中[]R x 为元素x 在关系R 下的等价类。若)()(x A x A R R =,则称A 是可定义的,