文童编号1000-8152(20(Y7)05-0766-05 属性约简矩阵特 …

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中图分类号; T P 1 8 T P 3 9 1 文献标识码: A
S t r u c t u r a l f e a t u r e s o f a t t r i b u t e r e d u c t i o n ma t r i x a n d
l a y e r f a s t a l g o r i t h m X U N i n g 1 , 2 , Z H A N G Y u n 1 , S U N H a i - w e i 3 , X I O N G H o n g - y a n l
对N P 问 题的 获解研究以及计算理论的发展具有着
重要的意义. 本文从一定规模数据集出发, 寻求有效算法的设
计, 在 广度上进行 属性约简研究: 首先 提出 源于 数据 集的属性 约简矩阵; 依据 此矩阵, 将数 据集的 属性约 简问题抽象成为整 数规划问题;
( 1 . A u o t m a i t o n F a c u l y t , G u a n g d o n g U n i v e r s i yo t f T m h n o l o g y , G u a n g z h o u G u a n g d o n g 5 1 0 0 9 0 , C h i n a ; 2 . D e p a r t m e n t o f C o m p u t e r S c i e n c e a n d I n f o r m a i t o n E n g i n e e r i n g , S h a n g h a i I n s i t t u t e o f T e c h n o l o g y , S h a n g h a i 2 0 0 2 3 3 , C h i n a ;
3 . F a c u l y t o f S c i e n c e a n d T e c h n o l o g y , Un i v e r s i y t o f Ma c a u , Ma c a u , Ch i n a )
证 设
信息系统 S = { U , A , V , f } , 其中论域 U = { u i , u 2 , . . . , u} 为对象 集合; A =C U D 为属 性集 合 , 其中 C ={ , 1 e 2 C , , 二, c - } 为条 件属 性集 合 , D={ d i , d 2 , 一, 呜 } 为 决策属性 集合; f:
1 引言( I n t r o d u c t i o n )
R o u g h 集( 又译粗 糙集 ) 于2 0 世 纪8 0 年代初提出[ I l i 十年后受到 世界范围的关注! 2 " ' 4 1 . R o u g h 集研究的核 ' f " 是数据集的属性约简, 提出 了基于数据分类的约 简理论. 该理论现已 广泛的应用于 数据分析、 数据预 处理的 属性约简中 , 成为属性约简的重要数学工具. 关于高维数 据集的属性约简, 因 属性组合将出现爆 炸性增长, 运用广度 优先的方法来获得最小约简解, 在理论上已 被证明 是N P - h a r d 问 题[ [ 5 ]因 此多 采用深 度优先的 方法. 深度优先通常可获 得一个可行解. 但 这个解不一定是完备解1 6 1 , 而且 这个解与最小解的 关系, 从理论上和计算上现都缺乏有效的 证明 或说
由 此采用矩阵 代数的方法 , 得到了一个快速且可获
取全最小约简集的分层约简算法,
基金项目 : 广东省自 然科学基金资助项日 ( 0 4 0 0 9 4 8 0 , 0 6 3 0 1 2 9 9 ) .
万方数据
第5 期
徐宁等: 属性约简矩阵特征结构及分层约简快速算法
2 问题描述 ( P r o b l e m s t a t e m e n t )
第2 4卷第 5期 2 0 0 ,年 1 0月
文童编 号: 1 0 0 0 -8 1 5 2 ( 2 0 ( Y 7 ) 0 5 -0 7 6 6 - 0 5
控制 理 论 与 应 用
C o n t r o l T h e o y r & A p p l i c a t i o n s
V o l . 2 4 No . 5 Oc t . 2 0 0 7
属性约简矩阵特征结构及分层约简快速算法
徐 宁1 , 2 ,章 云1 ,孙海卫3 熊 红艳‘
( 1 . 广东工业大学 自动化学院, 广东 广州5 1 0 0 9 0 ; 上海应用技术学院计算机科学与信息工程系. 上海 2 0 0 2 3 3 ; 3 . 澳门大学利技学院, 澳门)
R _ ( X ) =U { Y〔 U / RI YC X I =
{ 。 〔U} [ u 1 R C X} , R - ( X ) =U { Y E U / R l y n x Ao = i = { 。 〔U I [ u 1 R f 1 X } , 0 } . 称R _ ( X ) 为X的 R 下近似集, R - ( X) 为X的R 上
C o s t .
K e y wo r d s : o r u g h s e t s ; a t t r i b u t e e r d u c t i o n ; r e d u c t i o n m a t r i x ; s t u r c ur t a l f e a t u r e s ; l a y e r r e d u c t i o n ; f a s t a l g o r i t h m
r I R =U / i n d ( R ) = , I X { X 2 , , 一, X , } , 7 r D 二 U / i n d ( D ) = { Y 1 , Y 2 , , 一 , Y d 1 ,
f d ( u i , d k ) E蛛 根据正域和划 分的 定义, 式( ( 1 ) 可等 效为 : 设R 为论域 U 上所有等价 关系组成 的集合 . ' d u E U , 3 i , j , s . t . 同R =X i C巧, p
Ab s t r a t c : C u r r e n t a l g o r i t h m s p ov r i d e o n l y f e a s i b l e a t t r i b u t e r e d u c t i o n s , t h e y a r e n o t n e es c s a r i 妙t h e m i n i mu m o n e s . T h u s , i t i s s i g n i i f c a n t t o a n a l y z e t h e c h a r a c t e r i s t i c s o f a t t r i b u t e e r d u c t i o n a n d g e t t h e mi n i m u m o n e f r o m a u r e d u c t i o n s . F r i s t l y , a n a t t r i b u t e r e d u c t i o n m a t r i x i s d e i f n e d b a s e d o n t h e i n f o r m a t i o n s y s t e m . T h e a t r i b u t e r e d u c t i o n c a n b e c h a r a c t e r i z e d b y t h e s t uc r t u r a l f e a ur t e s o f t h e ma t r i x . T h e n , a l a y e r f a s t a l g o r i t h m b y m a t r i x a l g e b r a i c t h e o y r i s p r o p o s e d t o s o l v e t h e p r o b l e m. F i n a l l y , n u me r i c a l r e s u l t s a r e g i v e n t o s h o w t h e a d v a n t a g e o f o u r me t h o d b y h i g h l y r e d u c i n g t h e c o mp u t a t i o n a l
2 . 1 几个概念( B a s i c c o n c e p t s ) 依据R o u g h 集 理论 定 义一 个 数据集 上 的
每 个A ‘ 都是 ' / r 2 中 某 个 B j 的 子 集 , 则 称 划分 二 , 是 划
分7 7 2 的一个细分 ( r e i f n e m e n t ) , 表示为: 7 r 1 , - < 7 2 . 引理 1 如果信息系统 S 的论域 U = U #= P O S c ( U , D) , R CC 则: P O S R ( U , D ) =P O S c ( U , D ) a二 。1二 。 .( 1 )
v i , 刃 , s . t . 弋C 沁 ,
i =1 , 2 , …, r ; j =1 , 2 , …, d . ( 2 ) 1 )如果式 ( 2 ) 右边成立, 则d u〔U , 3 i , u〔
定义 1 X CU , RE R , 设:
摘要: 己有的属性约简算法往 往只能 提供一个可行解, 并且不能保证是 最小 约简解. 因 此, 详细分析 属性约简 特 征井 获得最小约简解具有重要意 义. 本文针 对信息系统数据集提出 属性约简 矩阵 , 通过 矩阵的结构特征分析得到属 性的 约简特征 因此采用矩阵代数的方法求解属性约简问题, 并得到分 层约简 快速算 法 经实例运算7A R " , 矩阵代 数的 处理和算法大 大降 低了 最小约简 解获 取的 计算量. 关 键词: R o u g h 集; 属性约简; 约简 矩阵 ; 特征结构; 分层约简; 快速算法
明} 刀 .
收稿 日期: 2 0 0 4 -1 0 -2 6 ; 收修改 稿日期二 2 0 0 6 -1 0 -2 0
在R o u g h 集约简理论下, 一个数据集的约简 解不 唯一, 而且最小约简 解也不唯一 不同的约简解含 有不同的知识 , 有必要对获得数据集的所有最小 约
简 解 进 行 讨论 , 文 献 [ 8 ] 介绍 了 广 度 优 先 算 法的 研究
U xA、 V 是映射关系;V = V U V d 是属性取
值 值 域 , 其中 V ( i , 7 ) =f . ( u i , c a ) E V , V d ( i , k ) = RER , 同R 表示 包 含元 素 。 的 R 等价 类 . U / R 表
示R的所有等价类 构成的集合, 是 U的一个划分.
相关文档
最新文档