基于可辨识矩阵的快速粗糙集属性约简算法
基于分辨相似矩阵的相似粗糙集的属性约简算法
基于 等价 关系的经 典粗糙集 是在保持知识系统分类能力 不变的条件下 , 通过求取核 与约简挖掘出信息系统 中潜在 的、 简洁的知识,从而为知识获取提供 了一套 全新 的方法。但对 于实际问题等价关系要求过于严格 ,如要描述一个对象通常 是通 过该对象 的一些属性 ,这些属性 中有 的是单值属性 ,而 有些则为多值属性 。单值属性对应论域 上的一个等价关系 , 而多值属性则对应论域 上的一个相似关系 ( 满足 自反性和对 称性)。另外 ,在数据收集时可能不知道某属性 的具体值 , 而只知道 它町能取几个值之 中的一个 ,即 多值粗糙 集 ,这也 是相似关系 ;还有 ,由于数据测最 的误差 、对数据理解或获 取的限制等原 因,使得在知识获取时可能存在对象 的一些属 性值未知 ,即知识 系统有空值或缺省值 ,这时面临 的是不完
d s e n b ea d sm i rma rx a e d fn d i h i l ri t r t n s tm s An a e n i t e a g rt m fa ti u er du to n o e i i lr i c r i l n i l ti r e i e t e s mi n o ma i yse . d b s d o t h l o i a n a o , h o t b t e c i n a d c r n smia r
维普资讯
第 3 卷 第 1 期 2 O
I L3 1 2 o
・
计
算 机
工
程
Байду номын сангаас
20 0 6年 5月
M ay 20 6 0
D
Co mp t rEn i e rn u e gn e i g
软件技术与数据库 ・
基于Rough Set的属性值约简算法研究
(c o l f o ue d o mu i t n L z o i r t eh oo y L nh u7 0 5 , C ia S h o o mp t a m nc i , a h u v s y fTc n lg, az o 3 0 0 h ) C rn C ao n Un e i o n
Ab t a t Th au e a d t ep o e so ti u ev l er d ci n fo t ev e o g c a ea ay e d b s d o i a d s e n b l y sr c : e n t r n h r c s f t b t au e u to r m iw fl i r l s d a a e n t s ic r i i t ar h o n n h i
新算 法 , 并对 此进行 了证 明 。该算 法比 以往 的 算法更 简便 、 直观 , 易于编程 实现 , 更 易从 本质 上理解 属性值 约 简的 实质 及 也 过程 , 且算 法不破 坏决 策 系统 中的不一致规 则 所蕴含 的信 息量 。 实例 分析表 明该 算 法是有效 可行 的 。 并 关键词 : o g e;属性值 约简; 辨识 矩阵 ;决策 系统 ;决 策规则 R u hSt 中图法分 类号 : P 8 T 1 文献标 识码 : A 文章 编号 :0 07 2 20 ) 32 2.3 10.0 4(0 6 1.3 40
基于粗集可辨识矩阵的属性频率约简算法
基于粗集可辨识矩阵的属性频率约简算法1 粗集可辨识矩阵粗集可辨识矩阵作为一种不精确、但可以提取较好特征的聚类方法,在数据挖掘任务中得到了广泛的应用。
它的核心是分布式的,也就是说,可以利用大量的类内数据来构建实例和属性之间的关系。
它的主要操作是将内部元素的属性频率应用于矩阵,然后利用频率约简算法把矩阵约简成一个稀疏的矩阵表示。
2 属性频率约简算法属性频率约简算法是一种使用统计学的技术,通过收集类内的特征频率,来构建属性间的关联,有效地对属性进行频率约简,从而获得较精确的特征聚类。
它的基本原理是,根据给定的特征计算来计算每个特征的频率,然后使用一种统计学技术来将它们抽象成一个稀疏的矩阵。
它的主要步骤如下:首先通过计算每个特征出现的频率来填充矩阵,然后使用最大熵原则对矩阵进行约简,最后利用聚类算法将不同的特征聚类,从而获得一种更有效的特征形式。
综上,属性频率约简算法可以使特征简化,矩阵简化,并且可以提取出一种有效的特征。
3 属性频率约简的优势属性频率约简算法的优势有:首先,它可以构建出有效的聚类,从而使分析任务更加容易;其次,它还可以用于建立稀疏的特征,这样可以更好地减少冗余的特征和噪声;最后,它可以有效地处理高维数据中的大量元素,并使其聚类更有效。
4 属性频率约简的应用属性频率约简算法在很多领域都有广泛的应用,如文本分类、图像分类、软件推荐等。
比如,在自然语言处理中,可以使用属性频率约简来提取文本的关键词,从而帮助文本分类。
另外,它还可以用来提取图像中的特征,从而方便图像分类。
此外,它还可以用于大规模数据访问和软件推荐,从而更加有效地实现软件任务。
5 结论从上文可以看出,基于粗集可辨识矩阵的属性频率约简算法可以有效提取出有效特征,并有很多应用。
它可以简化特征,减少运算量,有效地提取特征,从而实现数据挖掘的目的。
另外,属性频率约简的优势可以极大提升数据挖掘的性能,使算法更加有效。
基于粗糙集的属性约简算法
第2 2卷
a= 表示不包含条件属性 a, a =1 0 而 表示包 含条件 属性 a。如果要识别所有 决策不同的记 录 , a( =12 …, ) 则 i ,, 与 ( =12 … , 之 中必然 至少各有 一个 条件属性 不能 ,, ) 被 删除 , 否则新决策表将与原决策表具 有不同的不科技开发项 目( 013) 2 435 0 作者简介 : 赵青杉(92 , 山西五 台 , 州师 范学院计算机 系讲师 , 17 一)男, 人 忻 从事数据挖掘 、 集理论研 究。 粗糙
维普资讯
忻 州 师 范 学 院 学 报
x 关于 R 的下近似集是 U 中根据 已有知识 判断必 定属于 X 的对象所组成 的最大集合 , =U{ ∈ U R1 即』 y / y∈X}
定义 2 设 R C称 R 为 C的 D一 : 约简当且仅 当 R 是 C
属性组合以布尔值表示其中是否包含某个条件属性。 比如
收稿 日期 :0 6 1 5 20 0 —0
的最小约简是 N P—hr a d问题 。解决 这类 问题 的方法一 般
的值, “ 是 “ D( ) 在属性D上的值, 可识别矩阵记为:
f a∈ A : ( 1 ≠ a “ )D( ≠ D( , a “) ( , , “) “)
是启发式搜索 , 进而获得最优解或近似最优解。 本文研究 了可辨识矩 阵的约简 , 从属性依赖度角度给 出
粗糙集理论是波兰数学家 Z P wl .a a k在 2 0世纪 8 o年代 初首先提 出 的一种 可 以分析 模糊 和不 确定 问 题 的数 学理
定义 3 C的所有 必要属 性组成 的集 合称 为 C 的核 , : 记
为 ∞ R C)它是 C的所 有约简 的交 , C RE( =n E( , 即 O C) R D( , 中 R D( 表示 的约 简。 E C)其 E C) 三、 基于可识别矩阵的约简方法 可辨识矩 阵由华 沙大学数学家  ̄o o 出 , wrn提 定义 为系 统 S=( A) U= { 1 “ , “ }a( ) “在属性 a上 U, , “ ,2… , “ 是
粗糙集属性约简的方法
WANG P i, AO Y l , VJa fn . w meh do t iuerd c o ae nr u hstCo ue n ier ga dAp e iZH ui L ine g Ne to f t b t ut nb sdo o g e. mp tr gn ei n — j n ar e i E n piain , 0 2 4 ( )131 5 l t s2 1, 8 2 :1 —1 . c o Ab tat Obet c sict ni sit xes e n osn iv nn i . miga eio s m wi n e a c ra l src: jcs l s ai tc e csi l a dt s i o os Ai n t c ins t t u cr i f t .na・ a f o s r i vy o e te e d s ye h tn a o
的决 策系统 , 为 S, } d是 带不确定 因子 (-. ) 记 D= , 0I <t 1 的结论属性 , =1 示该元 素对 结论有 完全肯定 的判断 , 表 即该
识 库 中的知识 ( 属性 ) 并不 是同等重要 的 , 还存在 冗余 , 不利 这 于 做出正确 而简洁的决策 。属性约简要求 在保持知识库 的分 类和 决策 能力 不变 的 条件 下 , 除不 相关 或不 重要 的属 性 。 删 般而言, 较优 的属 性 约简 有如 下指 标 : 简后 属性 个 数较 约 少; 约简后规则数 目较少 ; 最终范化规 则数 目较少等 。已证明
Ke r s o g e; e e d bl ; t iuerd cin i lme tt n ywo d :ru hst d p n a i t at b t e u t ;mpe n ai i y r o o
基于可辨识矩阵的属性约简算法
数据分析 、数据挖掘、机器学 习和知识发现等多个领域 中得 到较广泛 的应用。决策表信息系统是 R u h集理论的主 要研 og 究对象,其约简是所有 R u h集理论和应用研究的焦点 问题 og 之一 。一般来讲 ,一 个决策表 的知识相对约简不唯一 ,人 J
们期望 找到一个 具有最少属性 的约简 ,即最小约简 。但 文 献【】 2已经证 明找 出一个决策表 的最小约简是 N —ad问题 。 Phr
定义 2 (a lk 约 简 )给 定 S ( U { , ) Pwa : c } } ,对 {
V C,如果 R满足如下 2个条件 ,则 R是一个 P w a R a lk 约简 :
c n o e ee T ssi d c t t h t o e f m sf se a t e s a n t lt . e t i a et e me dp ror a trt n o r . d n ha t h h h
[ ywo d lR uhst; a a d cin dsenblymar ; tiuef un y Ke r s o g s Pwlkr ut ; i riit tx a r t e ec e e o c i i tb r q
fe e c n ted seniit ti.I re O fn pi m a a e u t n o e ii n tbe ,i d st ec n es lmiaea to ni rqu n y i c r bly marx n o d rt d o t h i i i mu P wlk rd ci fd cso a ls ta d o v reei n t cin u t o h l
I srclAtiuerd cinio eo e rbe ete rt arsac f o g t a dmaya oi ms aebe rp sdt d Abta t tb t u t n f ypo l i t oei leerho u hs sn n g r r e o s k msn h h c R e, l h h t v e n o oe s y p Ot u
基于粗糙集的属性约简的矩阵方法
基于粗糙集的属性约简的矩阵方法
任艳玲;朱明放
【期刊名称】《陕西理工学院学报(自然科学版)》
【年(卷),期】2006(022)003
【摘要】粗糙集理论中,属性约简是知识挖掘的核心.知识获取是根据对象间的某种关系如等价关系、相似关系等来定义.受关系的矩阵表示的启发,本文提出知识的矩阵表示以及属性约简的矩阵方法,这种表示和约简方法具有形式简单规范、运算工整的特点.实例验证了该方法的合理性和有效性.
【总页数】5页(P76-80)
【作者】任艳玲;朱明放
【作者单位】陕西理工学院,电子信息系,陕西,汉中,723003;陕西理工学院,计算机科学与技术系,陕西,汉中,723003
【正文语种】中文
【中图分类】TP18
【相关文献】
1.采用粗糙集中可辨识矩阵方法的概念格属性约简 [J], 吴强
2.基于辨识矩阵的多伴随模糊粗糙集属性约简 [J], 梁美社
3.基于改进辨识矩阵的变精度邻域粗糙集属性约简 [J], 沈林
4.基于模糊粗糙集的辨识矩阵属性约简方法 [J], 赵晋欢; 王长忠
5.基于矩阵保留策略的邻域粗糙集属性约简算法 [J], 高阳; 刘遵仁; 纪俊
因版权原因,仅展示原文概要,查看原文内容请购买。
基于简化分辨矩阵的粗糙集属性约简算法
基于简化分辨矩阵的粗糙集属性约简算法
田卫东;周创德;胡学钢;周红鹃;李培培
【期刊名称】《计算机科学》
【年(卷),期】2008(35)3
【摘要】针对改进的经典算法求取属性约简存在的时间和空间性能不理想问题,本文提出了一种新的属性约简算法ARSDM.该算法先将决策表按决策属性的类别划分,后采用边生成矩阵元素边约简边排序的思想求取属性约简,有效地加快了约简速度.实验表明ARSDM算法与经典算法相比具有较好的时间和空间性能.
【总页数】4页(P209-212)
【作者】田卫东;周创德;胡学钢;周红鹃;李培培
【作者单位】合肥工业大学计算机与信息学院,合肥,230009;合肥工业大学计算机与信息学院,合肥,230009;合肥工业大学计算机与信息学院,合肥,230009;合肥工业大学计算机与信息学院,合肥,230009;合肥工业大学计算机与信息学院,合
肥,230009
【正文语种】中文
【中图分类】TP3
【相关文献】
1.一种基于分辨矩阵的属性约简改进算法 [J], 吕林霞
2.基于分辨矩阵和约简树的增量式属性约简算法 [J], 侯枫;刘丰年
3.改进的基于简化二进制分辨矩阵的属性约简方法 [J], 王亚琦;范年柏
4.基于改进的二进制分辨矩阵属性约简算法 [J], 郭洪涛;黄广君;张孝国
5.一种基于分辨矩阵的新的属性约简算法 [J], 汪小燕;杨思春
因版权原因,仅展示原文概要,查看原文内容请购买。
基于可辨识布尔矩阵和分类系数的属性约简算法
2 粗 糙 集理 论 中的 主 要概 念
个信 息 系统 s可 以表示成 S=U, V f>, 中 , 表示 对 象 的非 空 有 限集 合 , 为论 域 ; A, , 其 称 A是 属性 的非 空有 限集 合 ; V= , 属 性 a的值 域 ; : 是 厂 U×A— 是 一 个 信息 函数 , 指定 中每一 个 它
可 以证 明 c ( =一 r ( ) 即 A 的核等 于 A的所 有约 简的交 集 . o A) e A , d
3 可 辨 识 布 尔 矩 阵
3 1 辨 识 布 尔 矩 阵 ห้องสมุดไป่ตู้ 定 义 .可
定义 5 设 S=( , ,) : A, 是一 个信 息 系 统 , 性集 n={ n , n } 出 的对 的 分类 为 X= 属 n , … 导 { , , 。 … } 布尔矩 阵 C=( ) 称 为 . . : s的可辨 识 布尔矩 阵 . 中 : 其
定 义 3 在信 息系统 s中 , , : 如果 i ( a ) n ( ) 则 称 属性 a多余 , n A{ } =i A , d d 否则 , a是 必 要 的 . 称 如果 A的属性都 是必要 的 , 称 A是独 立 的 . 则 A中所有 必要 属性 组成 的集合 称为 A 的核 , 为 cr( . 记 o A) e
1 引 言
粗糙集 是 由波 兰数学 家 Z.a l P wa k提 出的 一种 处理 不 精 确 、 确 定 与 不 完 全数 据 的新 的数 学理 论 . 不 其主要 思想 是 , 保 持 信 息 系 统 分 类 能 力 不 变 的 前 提 下 , 过 属 性 约 简 导 出 问 题 的 决 策 或 分 类 规 在 通 则n . 】 粗糙集 理论 中的概念 与运算 都是通 过代 数学 的等 价关 系和集 合运 算 来定 义 的 , 多概 念与 运算 的 许 直 观性较 差 , 人们不 容易理 解其本 质 , 粗糙 集方 法建 立 的属 性约 简模 型 描 述能 力 一般 , 用 目前还 没有 高 效 的属性 约简算法 . 本文 定义 了信息 系统 的可 辨 识 布 尔矩 阵 的概 念 , 讨 论 了 它与 属 性 约简 之 间 的关 并 系, 定义 了度量属 性或属 性子集 分类能 力 的分类 系数 的概念 , 出了使用 分类 系数描 述粗糙 集 中概 念与 给 运算 的方 法 . 可辨识 布 尔矩 阵上作业 , 照分类 系数 的大小 使用 贪婪算 法 , 在 依 得到 了一种新 的简 明、 高效 的属性 约简算法 .
一种基于粗糙集的属性值约简方法
摘
要
利用矩 阵的可操作性等优点 , 将决策表 中的知识通过 区分矩阵反映 出来 , 对决策表 的值 约简操作转换 为对 矩阵 的运算。
提 出基 于区分矩 阵的一些重要性质及在此基础上 的属性值约简方法 , 最后通过 实验和 实例验证 了该 算法是有 效可行 的。
关 键 词 粗 糙 集 区分 矩 阵 属 性 值 约 简 属 性 重 要 度
ATTRI BUTE VALUE REDUCTI oN ALGoRI THM BAS ED oN RoUGH SET TH Eo RY
Ch n Xio u e ay n La n h a , n Co g u
Ke wo d y rs
Ro g e D s e n b e marx A t b t au e u t n At iu e sg i c n e u h st ic r a l t t i u e v le r d ci i r o t b t inf a c r i
U 如果 Va∈P, , 都有 f , )=f Y a 。说 明仅 仅根据 条件 ( a (,)
0 引 言
粗糙集理论是一种新 型的处理不 确定 的 、 模糊 的和不完 整
属性子集 P提供的信息 , 无法将对 象 , Y区分开来 , 称对象 , Y 在条件属性子集 P上是不可 区分 的 , 记为 : D( I P):{ ,)∈ N ( Y U×UI Va∈ P , ) 厂 Y a }I D( 是 U上的等价关 系。 a :_ , ) , ( N P)
信息 的数学工具。在粗糙集 理论 中, 知识被 看作是关 于论域 的 划分 , 是一种对对象进行分类 的能力 , 理论是建立 在集 合的基 该
基于可辨识矩阵的快速粗糙集属性约简算法
基于可辨识矩阵的快速粗糙集属性约简算法
薛安荣;韩红霞;潘雨青
【期刊名称】《计算机工程与设计》
【年(卷),期】2007(28)20
【摘要】Karno Bozi提出的Core Searching算法在向约简中插入候选属性的时候,根据属性出现次数需要循环查找可辨识矩阵中的所有剩余项,直至矩阵为空,导致计算量较大和结果中冗余属性存在的可能.基于Core Searching算法提出通过给属性设立计数器的基于可辨识矩阵的快速属性约简算法,实例分析表明,该算法与Core Searching算法相比,在计算量减少和循环次数减少的同时能得到更简约的结果,是一种快速、高效的属性约简算法.
【总页数】4页(P4987-4989,4993)
【作者】薛安荣;韩红霞;潘雨青
【作者单位】江苏大学,计算机科学与通信工程学院,江苏,镇江,212013;江苏大学,计算机科学与通信工程学院,江苏,镇江,212013;江苏大学,计算机科学与通信工程学院,江苏,镇江,212013
【正文语种】中文
【中图分类】TP311
【相关文献】
1.基于属性值集合链的粗糙集快速属性约简算法 [J], 武友新;李文晶;钟子岳
2.基于粗糙集的快速属性约简算法研究 [J], 瞿彬彬;卢炎生
3.一种基于粗糙集理论的快速并行属性约简算法 [J], 肖大伟;王国胤;胡峰
4.基于可辨识矩阵的属性约简算法及应用 [J], 陈志恩;田彦山;马旭
5.基于邻域粗糙集的快速属性约简算法 [J], 高阳;刘遵仁;彭潇然;林芷欣
因版权原因,仅展示原文概要,查看原文内容请购买。
基于粗糙集理论的属性约简算法研究
基于粗糙集理论的属性约简算法研究
聂林娣
【期刊名称】《《电脑知识与技术》》
【年(卷),期】2009(005)009
【摘要】数据挖掘是近年来数据库领域中出现的一个新兴研究热点,它是从大量数据中获取知识。
进行数据挖掘的方法很多,粗糙集方法便是其中的主要方法之一。
属性约简算法是基于粗糙集理论的数据挖掘模型中的关键步骤,同时也是粗糙集理论研究中的一个研究重点。
通过对粗糙集理论的属性约简算法的深入研究,本文提出了一种改进的属性约简启发式算法。
该算法建立在可辨识矩阵计算基础上。
改进算法基于Hu的算法与Jelonek算法,在计算可辨识矩阵的基础上,保证最终能够找到决策信息系统的一个约简,同时较Jelonek算法相比,运算时间明显减少。
【总页数】2页(P2428-2429)
【作者】聂林娣
【作者单位】南京航空航天大学信息科学与技术学院江苏南京 210016; 南京工业大学信息科学与工程学院江苏南京 210009
【正文语种】中文
【中图分类】TP301
【相关文献】
1.基于粗糙集理论的属性约简算法研究 [J], 史运平
2.基于粗糙集的数据挖掘改进属性约简算法研究 [J], 卢秀芸
3.基于粗糙集理论的遗传属性约简算法研究 [J], 孙玲芳;许锋;周家波;侯志鲁
4.基于属性相容度和重要度的粗糙集属性约简混合算法研究 [J], 付光远;吴汉钊;杨小冈
5.基于差别矩阵的启发式粗糙集属性约简算法研究 [J], 田志军;李芳芳
因版权原因,仅展示原文概要,查看原文内容请购买。
基于粗集可辨识矩阵的属性频率约简算法
基于粗集可辨识矩阵的属性频率约简算法
逄玉俊;李爽
【期刊名称】《现代电子技术》
【年(卷),期】2009(32)4
【摘要】针对信息系统在属性约简过程中存在属性频率值相同的问题进行改进.改进后的算法在基于可辨识矩阵属性频率约简算法的基础上.引进强等价集概念,以属性在可辨识矩阵中出现的次数越多其重要性越大为启发式信息,利用强等价集中的属性是可以约简的特性,在属性频率约简过程中判断具有相同属性频率属性是否最终包含在核属性集里,提出改进的属性频率约简算法.通过理论和实例的分析证明,该算法在保持时间复杂度不变的情况下,处理具有相同属性频率信息系统的属性约简,使其准确性得到提高,与原算法相比,改进后的算法可以得到一个更为精准的约简结果.
【总页数】3页(P145-147)
【作者】逄玉俊;李爽
【作者单位】沈阳化工学院,辽宁,沈阳 110142;沈阳化工学院,辽宁,沈阳 110142【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于可辨识矩阵的快速粗糙集属性约简算法 [J], 薛安荣;韩红霞;潘雨青
2.基于粗集可辨识矩阵的属性约简算法 [J], 范敏;刘文奇;朱兴东
3.基于可辨识矩阵的属性频率约简算法 [J], 任小康;吴尚智;马如云
4.一种基于粗集理论的增量式属性约简算法 [J], 高晓红;李兴奇
5.基于属性频率函数的粗糙集属性约简算法 [J], 卢佳华
因版权原因,仅展示原文概要,查看原文内容请购买。
基于可辨识矩阵的启发式属性约简方法及其应用_芦晓红
录区分出来, 即该属性是必须保留的, 与Rough集决策表中核 属性一致。因此,矩阵中所有属性组合数为 1的属性均为决 策表的核属性核属性可能为空。令 ( ) C0 M是中所有属性组合
C 数为1的属性均为决策表的核属性则有 , 0 ⊆A 且 Card( C0 ) = 1 。
由于可辨识矩阵包含了决策表中的所有属性区分信息, 因此除核属性外,其余需保留的属性应从属性组合数不为 1 的元素中取得。令 a1a 2 Λ a m , b1b2 Λ bn 表示除C0 外所有剩余的 属性组合。为进行数学逻辑运算,将该属性组合以布尔值表 示其中是否包含某个条件属性。例如 a1 = 0 表示不包含条件 属性 a1 ,而 a1 = 1 表示包含条件属性 a1 。 根据可辨识矩阵的定义可知,如果要识别所有决策不同 的记录,则 ai (i = 1,Λ , m) 与 b j( j =1,Λ , n) 之中必然至少各有一 条属性不能被删除,否则新决策表将与原决策表具有不同的 不可分辨关系。构造表达式 P = ( a1 ∨ a2 ∨ Λ ∨ am) ∧ (b1 ∨ b2 ∨ Λ bn) , 由以上分析可知 P=1,该表达式表明 P=1 时必可将所有决策 [3] 区分出来。由于析取范式 由多个合取式构成,因此究竟采 用哪组属性组合须根据需要而定,所选定的属性组合与核属 性一起构成在制定要求下的最佳属性约简。 表1是一个信息系统[6],应用基于可辨识矩阵的约简算 法对该信息系统进行属性约简。 根据可辨识矩阵的定义,我们知道该矩阵的对角线元素 均为0 ,且矩阵为对称矩阵。则表1对应的可辨识矩阵如表 2 所示。
是属性值的集合, Vr 表示
属性 r∈R的属性值范围,即属性r 的值域, f : U × R → V 是 一个信息函数,它指定U中每一个对象x的属性值。r(x)是 对 象x在属性 r上的值, D(x)是记录x在 D上的值,则可辨识矩 阵记为:
粗糙集理论中的属性约简方法介绍
粗糙集理论中的属性约简方法介绍粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在数据挖掘、机器学习和模式识别等领域得到了广泛应用。
属性约简是粗糙集理论中的一个重要概念,它能够帮助我们从大量的属性中找到最为重要的属性,减少数据处理的复杂性。
本文将介绍粗糙集理论中的一些常用属性约简方法。
1. 正域约简方法正域约简方法是粗糙集理论中最为常用的一种属性约简方法。
其基本思想是通过比较不同属性对决策类别的区分能力,来确定最为重要的属性。
具体步骤如下:首先,计算每个属性与决策类别之间的依赖度,依赖度越大表示属性对决策类别的区分能力越强。
然后,根据依赖度的大小进行排序,选择依赖度最大的属性作为初始约简。
接下来,逐步添加其他属性,并计算约简后的属性集对决策类别的依赖度。
如果添加属性后的依赖度没有显著提高,则停止添加,得到最终的约简属性集。
2. 相关属性约简方法相关属性约简方法是一种基于属性之间相关性的约简方法。
它通过计算属性之间的相关系数或互信息量来评估属性之间的相关性,并选择相关性较低的属性进行约简。
具体步骤如下:首先,计算属性之间的相关系数或互信息量。
然后,根据相关系数或互信息量的大小进行排序,选择相关性较低的属性作为初始约简。
接下来,逐步添加其他属性,并计算约简后的属性集的相关系数或互信息量。
如果添加属性后的相关性没有显著提高,则停止添加,得到最终的约简属性集。
3. 基于粒计算的约简方法基于粒计算的约简方法是一种基于粒度理论的属性约简方法。
它通过将属性集划分为不同的粒度,来减少属性的数量。
具体步骤如下:首先,将属性集划分为不同的粒度。
每个粒度包含一组相关性较高的属性。
然后,选择每个粒度中最为重要的属性作为初始约简。
接下来,逐步添加其他粒度,并计算约简后的属性集的重要性。
如果添加粒度后的重要性没有显著提高,则停止添加,得到最终的约简属性集。
4. 基于遗传算法的约简方法基于遗传算法的约简方法是一种基于进化计算的属性约简方法。
一种基于分辨矩阵的属性约简改进算法
一种基于分辨矩阵的属性约简改进算法吕林霞【摘要】运用粗糙集理论,对基于分辨矩阵的属性约简,提出了一种改进算法.该算法通过对分辨矩阵的简化处理,化简分辨函数,快速求解分辨函数的最小析取范式,从而得到决策表的核和所有约简.该算法简化了分辨函数的求解过程,经实例验证该算法简单、快速、有效.【期刊名称】《兰州工业学院学报》【年(卷),期】2013(020)003【总页数】4页(P18-21)【关键词】分辨矩阵;属性约简;粗糙集;决策系统【作者】吕林霞【作者单位】兰州工业学院软件工程系,甘肃兰州730050【正文语种】中文【中图分类】TP391.10 引言波兰科学家Z·Pawlak教授于1982年提出了一种处理不精确、不确定知识的粗糙集理论[1],它是一种在保持分类能力不变的情况下,通过知识约简,导出问题的决策和分类规则,客观揭示潜在规律的数学工具.经过多年的研究与发展,粗糙集理论已在理论和实际应用上取得了长足的发展,特别是近二十年间,在知识发现等领域得到了成功的应用,受到国际学术界广泛关注.目前正被广泛应用于规则提取、机器学习、决策分析、过程控制、模式识别和数据挖掘等领域[2-5].属性约简是粗糙集理论中的重要研究内容之一.常见的有Z·Pawlak提出的基于正区域的属性约简[1],基于信息熵的属性约简[3],基于分辨矩阵的属性约简[6-10].由于基于分辨矩阵的属性约简定义直观,易于理解,能快速求出核和所有约简,故这种属性约简得到成功应用.基于分辨矩阵的属性约简算法,首先计算分辨矩阵,由分辨矩阵生成分辨函数,求分辨函数的最小析取分量,以此推出决策表的属性约简.但是分辨函数的最小析取分量的计算,常常较为复杂.对此,本文提出了一种改进算法,可以大大简化分辨函数,快速求得最小析取分量.1 粗糙集基本理论1.1 决策表在粗糙集中,信息系统是对知识进行表达和处理的基本工具。
决策表是一类特殊而重要的信息系统,它表示当满足某些条件时,决策(行为、操作、控制)应当如何进行.定义1 S=(U,A,V,f)是一个信息系统,其中U表示对象的非空有限集合,统称为论域;A表示属性的非空有限集合;,其中Va是属性a∈A的值域;f:U×A→V是一个信息函数,它为每个对象的每个属性赋予唯一的信息值,即:对∀u∈U,∀a∈A ,有f(u,a)∈Va.定义2 在信息系统S=(U,A,V,f)中,如果A=C∪D,D={d},且C∩D=∅,子集C和D分别称为条件属性和决策属性,那么信息系统S则称为决策信息系统,简称为决策表,简记为S=(U,A)或S=(U,C∪D).1.2 属性约简基于粗糙集的知识获取,主要是通过对决策表的属性约简.定义3 在决策表S=(U,A)中,对a∈A,如果IND(A-{a})=IND(A),则称属性a在A中是不必要的;否则称属性a在A中是必要的.定义4 在决策表S=(U,A)中,A=C∪D, C∩D=∅,C中所有必要属性组成的集合称为属性集A的核,记作:Core(A).定义5 在决策表S=(U,A)中,P⊆A,如果对每个a∈P在P中都是必要的,则称P 是独立的;否则,称P是相关的.相关属性集中含有冗余属性,而独立属性集去掉任何一个属性,都将破坏决策信息系统的分类能力.定义6 在决策表S=(U,A)中,对于P⊆A, 如果:IND(P)=IND(A),且P是独立的,则称P是A的一个约简.核是所有约简的子集.1.3 基于分辨矩阵的属性约简定义7 在决策表S=(U,C∪D)中,U={u1,u2,…,un}为论域,C={a1,a2,…,am}为条件属性,D={d}为决策属性,C∩D=∅,决策表S的分辨矩阵M(S)=(mij)n×n由下式定义.mij=i,j=1,2,…,n.(1)显然,分辨矩阵是一个对角矩阵,其对角线元素全为∅,所以在分辨矩阵中一般只需考虑其下三角部分.性质1 决策表S=(U,A)中,A=C∪D,C={a1,a2,…,am}为条件属性,D={d}为决策属性,且C∩D=∅,S的分辨矩阵为M(S)=(mij)n×n,则下式成立.Core(A)=∧{mij|mij≠∅且mij=aτ aτ∈C,1≤τ≤m,i=2,…,n,j=1,…,i-1}.(2)定义8 在决策表S=(U,C∪D)中,C={a1,a2,…,am}为条件属性,D={d}为决策属性,且C∩D=∅,M(S)=(mij)n×n为其分辨矩阵,则决策表S的分辨函数由下式定义. f(a1,a2,…,am)=∧{∨a|a∈mij, 其中mij≠∅, i=2,…,n, j=1,…,i-1}.(3)分辨函数的每个析取分量即对应于决策表的一个约简.但是,整理分辨函数,求解分辨函数的最小析取分量常常比较复杂.本文通过对分辨矩阵的简化,简化分辨函数,求解最小析取分量.2 基于分辨矩阵属性约简的改进算法2.1 分辨矩阵的简化根据合取的吸收律,可以得到如下性质.性质2 S是一个决策表,M(S)=(mij)n×n为其分辨矩阵.找出分辨矩阵中属性个数最少的元素,逐一对矩阵的所有其它非空且属性个数等于或多于此项的元素进行检查和简化:如果其中包含此项的所有属性,则将被检查的元素置为空.对简化后的分辨矩阵,再找到属性个数最少的元素,同样处理,直到矩阵中再无包含其它元素所有属性的元素为止,此时得到的矩阵记作M(S)',通过M(S)',可将(3)式简化整理,得到f(a1,a2,…,∨a|a∈,≠∅}.(4)由性质2,可以直接由M(S)'实现分辨函数简化,简化后的分辨函数更便于求解最小析取范式.2.2 算法描述输入:决策表S=(U,C∪D).输出:决策表S的核与所有约简.步骤1:由(1)式计算M(S);步骤2:由(2)式计算Core(A);步骤3:按照性质2,计算M(S)';步骤4:由(4)式生成分辨函数;步骤5:求解分辨函数的最小析取范式,过程如下:① if Core(A)≠∅ then T={Core(A)}, |T|=1 else T=∅,|T|=0;② 取≠∅且∉Core(A).设,at2,…,atk, 其中:at1,at2,…,atk∈C, 1≤k≤m.首先将中每个属性分别组成一个单元素集合,即{at1},{at2},…,{atk},其次将它们与T集合进行分配合并处理:若T≠∅,则将这些单元素集合分别与T集合中的每一元素进行并运算,运算的结果合并组成一T×k个元素的集合;若T=∅,则将这些单元素集合组合成{{at1},{at2},…,{atk}}.再将分配合并处理组合后得到的集合记为T,并将项标记为“已分配”;③ if 存在未标记“已分配”的,满足≠∅且∉Cor e(A) then go to ② else go to ④;④ 设T={T1,T2,…,TS} 其中:Ti={ai1,ai2,…,airi}, ai1,ai2,…,airi∈C,则:f(a1,a2,…,∧Ti},其中s正是约简的个数.步骤6:根据分辨函数的每个析取分量生成所有约简.2.3 实例计算以文[11]中项目评估决策表信息系统为例,记作S=(U,A,V,f).其中,U={u1,u2,…,u8},指8位不同审查(评估)人员(专家);A={a1,a2,…,a6,y}为属性集,C={a1,a2,…,a6}为条件属性,包括质量、成本、进度、风险、环境及综合管理水平等因素;D={y},y是专家根据审查标准对审查对象做出的综合评估结论.属性赋值采用5分制,即最好到最差,取5到0的整数,即V={0,1,2,3,4,5}.信息函数f:U×A→V由决策表给出,如表1所示.表1 决策表Ua1a2a3a4a5a6yu15243323u24533334u34243322u43454323u53454344u6 3243322u74533333u85354344输入:决策表S.步骤1:M(S)计算结果如表2示;表2M(S)u1u2u3u4u5u6u7u8u1u2a1,a2,a3,a6u3a1a2,a3,a6u4a1,a2,a3,a4,a6a1,a 2,a3,a4u5a1,a2,a3,a4,a6a1,a2,a3,a4,a6a6u6a1a1,a2,a3,a6a2,a3,a4a2,a3,a4,a6 u7a2,a3,a6a1,a2,a3,a4,a6a1,a2,a3,a6u8a2,a3,a4,a6a1,a2,a3,a4,a6a1,a2,a6a1, a2,a3,a4,a6a1,a2,a3,a4,a6步骤2:Core(A)={a1,a6};步骤3:M(S)'计算结果如表3所示;表3 M(S)'u1u2u3u4u5u6u7u8u1u2u3a1u4u5a6u6a2,a3 ,a4u7u8步骤4:分辨函数:f(a1,a2,…,a6)=a1∧a6∧(a2∨a3∨a4);步骤5:分辨函数的最小析取范式:f(a1,a2,…,a6)=(a1∧a6∧a2)∨(a1∧a6∧a3)∨(a1∧a6∧a4);步骤6:生成约简:{a1,a2,a6}、{a1,a3,a6}、{a1,a4,a6};输出:核为{a1,a6},约简为{a1,a2,a6}、{a1,a3,a6}、{a1,a4,a6}.计算结果与文[11]中的计算结果一致.3 结语经过案例计算可知,对基于分辨矩阵的属性约简,通过对分辨矩阵的简化处理,简化了分辨函数,可以快速求解分辨函数的最小析取范式,得到决策表的核和所有约简,这大大简化了分辨函数的求解过程.由案例计算可知该算法简单、快速、有效. 参考文献:[1] Z·Pawlak.Rough Sets[J].International Journal of Computer andInformation Science,1982(11):341-356.[2] 王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009(7):1229-1246.[3] 王国胤.Rough集理论与知识获取[M].西安:西安交通大学出版社,2001.[4] 曾黄麟.粗集理论及其应用[M].重庆:重庆大学出版社,1996.[5] 张文修,吴伟志,梁吉业,等.粗糙集理论与方法[M].北京:科学出版社,2005.[6] 李银花,张继福,梁吉业.基于区分矩阵的属性约简算法[J].山西大学学报,2004(2):135-138.[7] 马翔,张继福,杨海峰.基于区分矩阵的启发式属性约简算法[J].计算机应用,2010(8):1999-2002,2037.[8] 胡彧,李智玲,李春伟.一种基于区分矩阵的属性约简算法[J].计算机工程与应用,2007(9):178-180.[9] 刘文军,谷云东,李洪兴.基于区分矩阵求决策算法的约简[J].北京师范大学学报:自然科学版,2003(6):311-315.[10] 田卫东,周创德,胡学钢.基于简化分辨矩阵的粗糙集属性约简算法[J].计算机科学,2008(3):209-212.[11] 蓝敏.用粗集理论挖掘项目审查(评估)中的专家共识[J].西南交通大学学报,2005(2):85-89.。
粗糙集属性约简算法综述
随着计算机 网络 的高速 发展,人们所要 处理 的数据越来 越多 。在大量 数据 中会伴有 不确定 问题 。 目前处 理不确定性 问题的方法主要包括概率统计、模糊理论、证据 理论等…。但
这 些 方 法 必 须 依 靠 大 量 的 先 验 知 识 。粗 糙 集 理 论 很 好 弥 补 了 以上 方 法 缺 点 , 可 以有 效 处 理 不 确 定 信 息 , 却不 需 要 任 何 先
【 文章编号 】1 0 0 8 — 1 1 5 1 ( 2 0 1 5 ) 1 1 - 0 0 1 7 — 0 3
A s ur ve y o f r o ug h s e t r e d uc t i o n pr o c e s s a l g o r i t hm
I 为:
H ( K I M) = 一 ∑p ( ) ∑P ( Y i I X , ) l o g ( p (  ̄ ) I ) ( 4 )
属 性 集 同属 性 集 的 互 信 息 为 :
对 于信 息 表/ ( u , A 1 ,如 果有 属 性集B A , 且 满 足 i n d ( B ) = i n d ( A ) ,则 称 曰 为 的 一 个 约 简 ,记 为 r e d ( A ) 。i n d ( A ) , i n d ( B ) 代 表 着 和 上 的 不 可 分 辨 关 系 。
验 知 。
核属性就会影 响属性约简 的前后一致性 。
1 粗糙集约筒算法初探
1 . 1 基 于信 息熵 的约 简算 法
定义 1 设 、 K  ̄ UA z 划 分为 Y , 其中: { Y= { Y I , Y z , …, Y m } , 则 属 性 集 合M 的熵
上
, … } ;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设 立计 数 器的基 于可辨识 矩 阵的快速 属性 约 简算法 , 实例分 析表 明 , 算法 与 C rSa h g 该 o e ci 算法相 比 , 计算量 减 少和循环 e r n 在
次数减 少 的同时 能得 到 更 简约的结 果 , 一种快速 、 是 高效的属 性 约简算法 。
关 键 词 : 辨 识 矩 阵 ; 不 可 分 辨 关 系 ; 属 性 约 简 ; 核 ; 粗 糙 集 可
中图法分 类号 : P 1 T章编 号: 0072 2 0) 04 8 -3 10 .0 4( 7 2 .9 70 0
F s t i u er d cin ag rtm f o g e a e n d s e nb l ym arx a t t b t u t l o h o u h s t s do ic r i i t t ar e o i r b i i
tn eo rd d n t iue ers l T ei r v dfs lo tm ae ntedse iit ti, ist pc u tr r i ee t e c f e u a t tb tsi t ut h n ar nh e . mp o e t g r h b sdo ic r bl marx t e o e s o f rn a a i h n i y u n f d
维普资讯
第 2卷 8
VoI28 .
第 2 期 0
N O 20 .
计 算 机 工程 与设 计
Co p trE g n e n n sg m u e n ie r ga dDe in i
20 年 l 月 07 0
0c .2 0 t 0 7
e ot a o es ac igag rtm, i i l de e t eatiuerd cinag r h . f r t nc r e hn lo h h r i s smp ea f ci t b t e u t lo tm a n v r o i
Ke r s dse iit t x id se iii lto ; at b t d cin c r; r u hst ywo d : ic r bl mar ; n ic m bl r ain n i y i y t e t uer u t ; o e o g e i r e o
at b t s Th o ei a ay i d i s n er s l h w a ea g rt , b an gt e o er d ci er s l r q ii gl s o u i n t i u e . e r t l a l ss r c n n n a a t c u t s o t th l o i e s h t m h o t i i r u t u t e urn s mp to a n h m e v e , e c l
0 引 言
粗 糙 集 理 论 ( uhstR ) 波 兰 科 学 家 Pwa r g , S 是 o e a l k在 18 92 年 提 出 的一 种 处 理 模 糊 和 不 确 定 性 问题 的 数 学 工 具 “ 该 理 。 论 已经 在 数 据 挖 掘 、 器 学 习 、 程 控 制 、 策 分 析 和 模 式 识 机 过 决 别 等 领 域 得 到 了 广 泛 的应 用 , 取 得 了 良好 的 效 果 。 属 性 约 并 简 就 是 在 保 持信 息 系 统 分类 能 力 不 变 的基 础 上 , 除 冗 余 或 删 者 可 以 忽 略 的知 识 , 粗 糙 集 理 论 的重 要 组 成 部 分 之 一 。 a 是 K- moB z 提 出 的 C r e cig算 法 简 单 、 速 并 具 有较 好 的 oi o Sa h e r n 迅 属 性 约 简 效 果 。 但 C r e ci 算 法 在 寻 找 候 选 约 简 属 性 oeS a h g r n 的 时候 , 要 搜 索 完 可辨 识 矩 阵 中剩 余 的 所 有 项 , 至 矩 阵 为 需 直 空 , 样 算 法 不 仅 会 增 加 一 些 额 外 的 查 找 次数 , 算 量较 大 并 这 计 且得到 的约简属性集 也会有冗 余属性存 在 。 本文基 于不可分辨关 系和可辨 识矩阵 , 改进 了 C rS a o e- e r ci hn 法 中 的 搜 索 控 制 条 件 ,减 少 了 循 环 次 数 和 冗 余 属 性 ; g算 并 且 给 属 性 设 立 计 数 器 , 免 了重 新 计 算 剩 余 属 性 在 矩 阵 中 避 出现的次数 。 实 例 分 析 表 明 , 算 法 在 计 算 量 减 少 的 同 时 能 得 到 更 约 本
i ms n d s e i i t ti a e nt ea p a a c me f a d d t t i u e , u t emarxb c mee t , t i i d c dt ee i- t e ic r b l y marx b s d o p e rn et s c n i aeat b t s n it ti e a mp y h s n u e x s i n i h i o r lh h
基于可辨识矩阵的快速粗糙集属性约简算法
薛安 荣 , 韩 红 霞 , 潘 雨青
( 苏 大学 计 算机科 学与通 信 工程 学 院 ,江 苏 镇 江 22 1) 江 103
摘 要 : an oi 出的 C r Sacig算 法在 向约 简中插入候 选属 性 的时候 , K roB z 提 oe erh n 根据 属 性 出现 次数 需要循 环查找 可辨识 矩阵 中的所有 剩余 项 , 直至矩 阵为 空 , 导致 计 算量较 大和 结果 中冗余属 性存 在 的可能 。基 于 C r e c i o S a hn e r g算法提 出通过给 属性
Ab t a t W h n c r ac i ga g rt m to u e y Ka oBo i x e d dt er d ci n t e d dt i u a l e c lh ma e t sr c : e o s r h n o h i r d c db m z t n e u t ,in e e cr l ys a h a er e e l i n e h e o o c r r lt e n n
XUE -o g HAN n - i, P An r n , Ho g x a AN 【qn l ig -
(c o l f o ue c n e n e cmmu i t nE gne n ,J n s nv r t h ̄i g2 2 1,C i ) Sh o o C mp t Si c dT l o r e a e nc i n ier g i gu i sy ao i a U e i ,Z e a 10 3 hn n a