第一讲 Pawlak粗糙集模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
则 ( N ( A), , , , ,(, ),(U ,U )) 为剩余格.
( N ( A), , , , , , I ) 是正则双Stone代数。
剩余格是一个代数系统 ( L, , , , ,0,1) ,其中 (1) ( L, , ,0,1) 为有界格, 0,1 分别为其最小元与最大元; (2) ( L, ,1) 是以 1 为单位元的交换半群且对于任意 a, b, c L ,
一般情况下,下列等式不成立:
R( X Y ) R( X ) R(Y )
R( X Y ) R( X ) R(Y )
设 (U , R) 是 Pawlak 近似空间, A, B U 。 若 R( A) R( B) ,则称 A 与 B 下粗相等,记为 A « B ; 若 R( A) R(B) ,则称 A 与 B 上粗相等,记为 A 若A
iI iI iI
从而 R ( X i ) T ,即 T 对于任意并封闭。
iI
讨论题2:粗糙集的表示
定理 设 (U , R) 是一个 Pawlak 近似空间。对于任意 ( X , Y ) P(U ) P(U ) ,
( X , Y ) 是一个粗糙集表示(即存在 Z U 使得 R( Z ) X , R(Z ) Y )
U
R
{[ x]R ; x U }
称等价类 [ x ]R 为 R 初等概念。 若 X U ,则称 X 为一概念。
设 S 是 U 上若干等价关系构成的集合,称二元组 K (U , S) 为一个知识库。 若 F S 且 F ,则 F 称为 F 不可区分关系, 记为 ind (F ) ,即 ind (F ) F.
讨论题1:粗糙集的拓扑结构
定理 设 (U , R) 是一个近似空间,则
T {R( X ); X U } 是 U 上的一个拓扑。
证明 (1)由 R(U ) U , R() 即知 U T , T . (2)由 R( X ) R(Y ) R( X Y ) 知 T 对于有限交封闭。 (3)设对于任意 i I , X i U ,其中 I 是一指标集。 由于 R ( X i ) 是可定义集,故 R ( R ( X i )) R ( X i ) ,
a b a c bc; (3) 是 L 上的一个二元运算且与 构成伴随对,即对于
任意 a, b, c L , a b c 当且仅当 a b c.
六 信息系统知识发现
定义 一个信息系统是一个四元组 S (U , A,V , f ) ,其中 (1) U 是非空有限集合,称为论域,其中元素称为对象; (2) A 是非空有限集合,其中元素称为属性; (3) V Va , Va 是属性 a 的取值构成的集合,称为 a 的值域;
的充分必要条件是 X , Y A , X Y 且 (Y X ) S . 其中 A 是所有 可定义集的集合, S {x U ;[ x]R {x}} 。 注: ( A, , , ~,U , ) 是幂集布尔代数 B ( P(U ), , , ~,U , ) 的子代数。
一 知识与知识库
1 粗糙集理论的基本观点: 知识是对对象进行分类的能力,即区分对象的能力。
例 考虑玩具积木的集合 U {x1, x2 , 按颜色分类: 红颜色积木: x1, x2 , x3 黄颜色积木: x4 , x5 , x6 兰颜色积木: x7 , x8
, x8} 。
按形状分类: 三角形积木: x1, x2 , x4 , x8 园形积木: x3 , x5 方形积木: x6 , x7 按体积大小分类: 大: x1 , x2 , x4 , x6 , x8 小: x3 , x5 , x7
粗糙集与软计算学术年会 (2001)
主要参考书:
Pawlak Z, Rough sets: Theoretical Aspects of Reasoning about Data, Kluwer Academic Publishers, Boston, 1991 曾黄麟,粗集理论及其应用,重庆大学出版社,1998 刘清,Rough集与Rough推理,科学出版社,2001 王国胤,Rough集理论与知识获取,西安交通大学出版社, 2001 张文修等,粗糙集理论与方法,科学出版社,2001 张文修等,信息系统与知识发现,科学出版社,2003 史开泉等, S粗集与粗决策, 科学出版社,2006 张文修等,基于粗糙集的不确定决策,清华大学出版社, 2005
( X1 , Y1 ) ( X 2 , Y2 ) ( X1 X 2 , Y1 Y2 )
则 ( N ( A), , ) 构成格. 令
( X1 , X 2 ) (Y1 , Y2 ) ((~ X1 Y2 ) Y1 (~ X 2 ),~ X1 Y2 )
( X1 , X 2 ) (Y1 , Y2 ) ( X1 Y1 ,( X1 Y1 ) X 2 Y2 ).
{ X1 , X 2 ,
, X m}
五 近似分类的不精确性度量
对于近似分类 {X1, X 2 , , X m} 的近似分类精度
R
( )
m i 1 m i 1
R( X i ) R( X i )
近似分类质量
R
( )
m i 1
R( X i ) U
粗糙集理论的基本特点:(李德毅院士:不确定性人工智能, 国防工业出版社,2005) 1. 粗糙集理论认为,知识是有粒度的。知识的粒度性是造成使用已有知识 不能精确表示某些概念的原因;属性集合的不同子集对论域构成不同的划分, 形成不同的知识粒度。 2. 不可区分关系是粗糙集理论的基础。由于我们对问题认识的深入程度有限, 使得我们缺乏足够的知识去区分论域中的某些对象。通过不可区分关系构造 上、下近似,边界等,可以有效地表达和计算分类问题中的不确定性。 3. 模糊集理论研究模糊性(客观事物差异的中介过度性) ,从集合与元素的 关系入手,从概念内涵的角度进行研究;粗糙集理论从知识分类入手, 从概念外延的角度研究不确定性,粗糙集理论中的成员关系是客观计算的, 只和已知数据有关。 4. 不足之处:背景知识库是完全确定的,对样本本身的随机性和模糊性缺乏 处理能力。
目前已发展成为人工智能的一个重要研究方向,在 数据挖掘 (data mining) 与信息系统知识发现 (KDD) 中具有非常广泛的潜在的应用背景,并已获得许多 成功的应用。
IRSS: International Rough Set Society, 1997 中国人工智能学会,粗糙集与 软计算专业委员会,2003,11
R( X ) {x U ;[ x]R X } ,
R( X ) {x U ;[ x]R X } 。
下近似、上近似具有下面的等价表达形式:
R( X ) {Y U ; Y X } , R R( X ) {Y U ; Y X } 。 R
其中 [ x]R { y;( x, y) R} 是 x 关于 R 的等价类,
讨论题3:粗糙集与非经典逻辑代数
N ( A) {( X ,Y );( X ,Y ) A A, X Y ,(Y X ) S }.
对于任意 ( X1 ,Y1 ),( X 2 ,Y2 ) N ( A) 令
( X1 , Y1 ) ( X 2 , Y2 ) ( X1 X 2 , Y1 Y2 )
在近似空间中,若 X 能表示为某些 R 等价类的并, 则称 X 是 R 精确集,或 R 可定义的,简称为可定义的; 否则称 X 是 R 不可定义的,或 R 粗糙集。粗糙集所表示的概念 具有不确定性。对于粗糙集 X ,可以借助两个精确集 R( X ) 与 R( X ) 近似地刻画。
关于粗糙集的概念,还有另外一种观点。有些文献将上、下近似集 构成的二元组 (R( X ), R( X )) 称为近似空间 (U , R) 中的粗糙集。
第一讲: Pawlak粗糙集模型
粗糙集理论是一种新的处理不确定性知识的数学工 具,是由波兰科学家Pawlak在1982年首先提出的:
Pawlak Z, Rough sets, International Journal of Computer and Information Sciences, 11(1982)
对于 F S ,显然有 [ x]ind ( F ) [ x]R .
RF
称U
ind (F )
{[ x]ind ( F ) ; x U } 为 U 的 F 基本
知识,其中元素称为 F 基本概念。
二 基本定义
设 U 是一个非空有限集合,称为论Fra Baidu bibliotek, R 为 U 上的一个等价关系, 称二元组 (U , R) 为一个 Pawlak 近似空间,简称为近似空间。 对于任意 X U , X 关于近似空间 (U , R) 的下近似 R( X ) 与上近似 R( X ) 分别定义为:
B 当且仅当 ~ A « ~ B 。
定理 对于任意等价关系 R ,有 (1) R( X ) 是 U 中所有与 X 下粗相等的子集之交; (2) R( X ) 是 U 中所有与 X 上粗相等的子集之并。
四 粗糙集的不确定性度量
X的近似精度:
R (X )
R( X ) R( X )
X的粗糙度
R ( X ) 1 R ( X )
按颜色、形状分类: 红颜色三角形积木: x1 , x2 红颜色园形积木: x3 黄颜色三角形积木: x4 黄颜色园形积木: x5 黄颜色方形积木: x6 兰颜色三角形积木: x8 兰颜色方形积木: x7
知识越多、越强,分类越细。
2 知识的数学表示:等价关系
设 U 是对象构成的非空有限集合,以下称为论域。 Pawlak 粗糙集理论仅讨论能对论域形成划分的知识。由于划分与 等价关系可以互相确定,因此,一个知识就是 U 上的一个等价关系。 设 R 是 U 上的一个等价关系,等价类集合为:
三 性质
设 (U , R) 为一近似空间,对于任意 X , Y U (1) R( X ) X R( X ) (2) R() R() R(U ) R(U ) U (3) X Y R( X ) R(Y ) X Y R( X ) R(Y ) (4) R( X Y ) R( X ) R(Y ) R( X Y ) R( X ) R(Y ) (5) R( X Y ) R( X ) R(Y ) R( X Y ) R( X ) R(Y ) R(~ X ) ~ R( X ) (6) R(~ X ) ~ R( X )
B;
B 且 A « B ,则称 A 与 B 粗相等,或 R 相等,记为 A B .
显然, « 、 与 都是 P (U ) 上的等价关系,
设 (U , R) 是 Pawlak 近似空间,则对于任意 A, B, C , D P(U ) , (1) A « B 当且仅当 A B « A 且 A B « B (2) A B 当且仅当 A B A 且 A B B ; (3)若 A « B 且 C « D ,则 A C « B D ; (4)若 A B 且 C D ,则 A C B D ; (5) A « U 当且仅当 A U ; (6) A 当且仅当 A ; (7) A
U U
R R
{[ x]R ; x U } 是所有 R 等价类的集合,
恰好构成对论域 U 的划分。
对于 X U ,分别称集合
bnR ( X ) R( X ) R( X ) 为 X 的 R 边界域,
posR ( X ) R( X ) 为 X 的 R 正域,
negR ( X ) U R( X ) 为 X 的 R 负域。