一种完备的最小属性约简方法
基于量子云模型演化的最小属性约简增强算法
制属 性约 简空 间搜 索范 围 , 并采 用量 子云 变异和 云 纠缠操 作 算 子较 好 地避 免 了在 属 性 演 化 约简 中易陷入 局部 最优和 早 熟收敛 等 问题 , 使 算法 快速 搜 索到全 局 最 优属 性 约 简 集. 仿 真 实验 表 明,
提 出的最 小属 性约 简增 强算法具 有 收敛速度 快 、 约简 精度 高和稳 定性 强等优 点.
摘 要 :为提 高决 策表 中最 小属 性约简 的效 率 、 稳定 性 和鲁 棒 性 , 基 于云 模 型在 非 规 范知 识定 性 、
定 量 表 示及 其相 互 转换 过 程 中的优 良特 征 对量 子进 化算 法进 行 算 子设 计 , 提 出 了一种 基 于量 子
云模 型演 化 的最 小属 性约 简增 强算法 ( QC ME AR E ) . 该 算法 采 用量 子 基 因云 对进 化 种 群进 行 编 码, 基 于 约简属 性熵权 逆 向云进 行量 子旋 转 f - j 自适 应调 整 , 使 其在 定 性知识指 导 下能够 自适 应控
w e i g h t i s d e s i g n e d t o a d a p i t v e l y a d j u s t he t q u a n t u m r e v o l v i n g g a t e , S O he t s c o p e o f t h e s e a r c h s p a c e
第 2期
丁卫 平 , 等: 基 于量子 云模 型 演化 的最 小属性 约 简增 强算 法
2 9 1
属 性 约 简 是 粗 糙 集 理 论 中 一 个 重 要 的 研 究 内容 , 其 主 要任 务 是 在 保 证 知 识 库 分 类 和决 策
基于集合枚举树的最小属性约简算法
基于集合枚举树的最小属性约简算法蒋瑜【摘要】为了寻找一种有效的最小属性约简方法,给出了条件属性集上的属性重要度序关系,基于此序关系构建了属性集上的集合枚举树,提出了一种快速的最小属性约简算法,该算法采用至上而下、层次优先策略搜索集合枚举树寻找属性最小约简.为了提高算法性能,该算法采用核和父集剪枝策略减少搜索空间,采用优化计算来确保同一集合的正域只计算一次.基于UCI数据的实验结果表明,该算法是有效的.【期刊名称】《计算机工程与应用》【年(卷),期】2013(049)011【总页数】4页(P101-104)【关键词】粗糙集;最小约简;集合枚举树;属性重要度;剪枝【作者】蒋瑜【作者单位】成都信息工程学院软件工程学院,成都610225【正文语种】中文【中图分类】TP311粗糙集理论是由波兰学者Pawlak于1982年提出的[1-2],是一种刻划具有不完整性和不确定性信息的全新数学工具。
其主要思想是在保证知识库的分类能力不变的前提下,通过知识约简导出问题的决策或分类规则。
知识约简问题是粗糙集理论的一个核心问题[3-4]。
所谓知识约简,就是在保证知识库分类能力不变的条件下删除其中不相关或不重要的冗余知识。
一般来讲,一个决策表的属性约简不是唯一的,通常人们往往希望能够找到一个冗余度最小的属性约简,该属性约简被称为最小属性约简。
对任一给定决策表,若属性约简算法能确保找到其最小属性约简,则该算法称为最小属性约简完备算法。
然而,S.K.M Wong和W.Ziarko已经证明了找一个决策表的最小约简是NP-hard问题[3]。
导致NP-hard问题的主要原因是属性的组合爆炸问题。
目前已存在一些属性约简算法能够找到决策表的最小属性约简[4-12],但它们要么不是完备的最小属性约简算法,要么通过穷举求出问题的所有约简或所有最小约简。
本文重新定义了属性重要度,给出了条件属性集上的序关系,基于该序关系构建集合枚举树,提出了一种基于集合枚举树的最小属性约简算法。
二进制可分辨矩阵的最小属性约简算法
二进制可分辨矩阵的最小属性约简算法
李龙澍;王慧萍;徐怡
【期刊名称】《计算机技术与发展》
【年(卷),期】2010(020)006
【摘要】指出传统分辨矩阵的不足,给出了二进制可分辨矩阵的定义以及二进制可分辨矩阵元素集合的形成算法.精简了分辨矩阵元素.在此基础上,提出了一种基于二进制可分辨矩阵的最小属性约简算法.该约简算法以属性频率为选择条件,按照普通可分辨矩阵生成属性约简的原理,但以不同的形式,更少的存储空间,最终可以获得一个最小属性约简.通过对一个汽车数据库的数据进行属性约简,并将结果与其他算法的结果进行比较,证明该算法是可行有效的.
【总页数】5页(P93-96,100)
【作者】李龙澍;王慧萍;徐怡
【作者单位】安徽大学,计算机科学与技术学院,安徽,合肥,230039;安徽大学,计算机科学与技术学院,安徽,合肥,230039;安徽大学,计算机科学与技术学院,安徽,合肥,230039
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.改进的基于简化二进制分辨矩阵的属性约简方法 [J], 王亚琦;范年柏
2.基于改进的二进制分辨矩阵属性约简算法 [J], 郭洪涛;黄广君;张孝国
3.二进制分辨矩阵在连续属性约简中的研究 [J], 杨云霞;杨占勇
4.一种新的基于二进制分辨矩阵的属性约简方法 [J], 陈宸;赵军
5.一种改进的基于二进制可分辨矩阵属性约简算法 [J], 葛浩;杨传健;李龙澍
因版权原因,仅展示原文概要,查看原文内容请购买。
属性约简方法概述
属性约简方法概述属性约简又称维规约或特征选择,从数学的角度考虑,就是有p 维数据 x =(x 1,x 2……x p ),通过某种方法,得到新的数据 x’=(x’1,x’2…… x’k ) , k ≤p , 新的数据在某种评判标准下,最大限度地保留原始数据的特征。
属性约简主要是为了解决高维数据计算的复杂性和准确性问题。
目标是消除冗余和不相关属性对计算过程和最终结果造成的影响。
对数据进行属性约简的意义,主要从以下几个方面考虑:a) 从机器学习的角度来看,通过属性约简去除噪音属性是非常有意义的; b) 对一些学习算法来说,训练或分类时间随着数据维数的增加而增加,经过属性约简可以降低计算复杂度,减少计算时间;c) 假如不进行属性约简,噪音或不相关属性和期望属性对分类的作用一样,就会对最终结果产生负面影响;d) 当用较多的特征来描述数据时,数据均值表现得更加相似,难以区分。
为了描述属性约简方法,这里假设数据集合为D ,D ={x 1,x 2….x n }, x i 表示D 中第i 个实例,1≤i≤n ,n 为总的实例个数。
每个实例包含p 个属性{|x i |=p }。
从机器学习的角度来看,属性约简方法可以分为监督的和非监督的两类。
下面是几种常用的方法。
(1) PCA 主成分分析主成分概念是Karl parson 于1901年最先引进。
1933年,Hotelling 把它推广到随机变量。
主成分分析把高维空间的问题转换到低维空间来处理,有效的降低了计算的复杂度。
通过主成分的提取,降低了部分冗余属性的影响,提高了计算的精度。
主成分分析的基本思想为:借助一个正交变换,将分量相关的原随机变量转换成分量不相关的新变量。
从代数角度,即将原变量的协方差阵转换成对角阵;从几何角度,将原变量系统变换成新的正交系统,使之指向样本点散布最开的正交方向,进而对多维变量系统进行降维处理[43]。
定义4-1[44]:设12(,,...,)'p X X X X =为p 维随机向量,它的第i 主成分分量可表示'i i Y u X =,i =1,2,…, p 。
一种完备的最小属性约简方法
一种完备的最小属性约简方法于海燕;乔晓东【期刊名称】《计算机工程》【年(卷),期】2012(038)004【摘要】为解决粗糙集中的属性约简问题,提出一种完备的最小属性约简方法.将差别矩阵中所有有关属性区分的信息都浓缩进一个差别向量组,计算每个属性在区分2个对象的属性集合中出现的概率,作为属性重要性的启发式信息,建立最小属性约简树,得到属性约简.分析结果表明,该方法可以获得所有的最小属性约简.%Attribute reduction is the basic problem of rough sets theory. A method for minimal attributes reduction in consistent decision table is proposed in this paper. The discernible information in consistent decision tables is described with discernible vector array. A minimal attribute reduction tree is generated based on the probability of the attributes which discern two objects. All minimal attribute reductions are got from minimal attributes reduction tree. The result of the method is proved to be complete and minimal.【总页数】3页(P46-48)【作者】于海燕;乔晓东【作者单位】中国科学技术信息研究所信息技术支持中心,北京100038;中国科学技术信息研究所信息技术支持中心,北京100038【正文语种】中文【中图分类】TP311.12【相关文献】1.一种改进的不完备熵属性约简在装备故障诊断中应用 [J], 苏艳琴;张光轶;徐廷学2.一种基于冲突域的不完备决策表属性约简算法 [J], 周建华;徐章艳;章晨光3.不完备决策表的一种属性约简方法 [J], 周玉华;李景杰4.不完备系统中一种增量式属性约简算法 [J], 王光琼5.不完备邻域决策粗糙集的最小化代价属性约简算法 [J], 姚晟;李初宴;吴照玉因版权原因,仅展示原文概要,查看原文内容请购买。
基于知识粒度的最小属性约简算法
定义 3 在决策表 5 < A uD = , =C ,
I )∑p (-( ) ( : ( 1 X), P ) p
其中 表 示集合X 基数,X)l l f 示等 的 p X /U 表 价类X在U 的 ( : f 中 概率。
() 3
2 知识粒度 、 息量 和类别 特征矩 阵的关 系 信
U 用 表示 的 尺一 的下近似集 , , 决策
。 () 1
定义 2 设 K ( , 是一个知识库 , R为论域 上的等价关系, = U R) R∈ 称为知识。 知识 R∈ R的粒度, 记
为G ( , D R)定义 为
收 稿 日期 : 0 80 —4 2 0 — 3 1
基金项 目: 江苏技术师范学 院青年基金项 目( y00 0 ky 7 3 ) 作者简介 : 吕萍( 90 )女 , 18 一 , 江苏常州人 , 助理实验师 , 在读硕士 , 研究方 向为数据挖掘 、 粗糙集理论 。
i= 1 i= 1 i= 1 = 1
)lI故 / , U
ID) 1 G D) ( = 一 R( 。
22 知识 粒 度与 类别 特征 矩 阵的关 系 .
差别矩阵里面仍然存在许多空集元素 , 这显然浪费了大量存储空间。 因此 , 同决策对象的比较结果 相
以 )成的 自 有I ∑l }所 RD: I}( DI/ 。 ()∑PD) 相同组 ,然 D D 2 以G()IIU ∑l 11 而I : ( I , : D/ : )U。 D
=
1
i= l
i= I
( ) ∑ / ( l f )∑ / 一 / )1( 1 ( ) 1 / = ∑( 一∑ = 一D =
21 知识 粒 度与 信息 量 的关 系 .
基于二进制可辨矩阵属性重要度的属性约简算法
基于二进制可辨矩阵属性重要度的属性约简算法
汪小燕
【期刊名称】《安徽工业大学学报(自然科学版)》
【年(卷),期】2007(024)001
【摘要】粗糙集理论是一个新的数据挖掘方法,是在保持分类能力不变的情况下,利用等价类,通过属性约简和规则约简,达到挖掘知识并简化知识的目的.但属性约简是一个NP难题,需要通过启发式知识实现.文中提出了一种利用二进制可辨矩阵的属性重要度实现属性约简的算法,该算法能快速求最少属性且实现简单,并通过理论和实例证明了其正确性.
【总页数】4页(P76-78,97)
【作者】汪小燕
【作者单位】安徽工业大学,计算机学院,安徽,马鞍山,243002
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于二进制可辨矩阵的属性约简算法的改进 [J], 周海岩;杨汀
2.二进制可辨矩阵的变换及高效属性约简算法的构造 [J], 支天云;苗夺谦
3.基于核搜索和二进制可辨识矩阵的属性约简算法 [J], 崔建华;褚蕾蕾;常文波
4.一种基于二进制可辨矩阵的属性约简算法 [J], 王希雷;马永军
5.基于可辨识矩阵的属性约简算法及应用 [J], 陈志恩;田彦山;马旭
因版权原因,仅展示原文概要,查看原文内容请购买。
基于免疫粒子群优化的最小属性约简算法
一
0 引 言
计算 决策 表 的 属 性 约简 是粗 糙 集 理 论 的 一 个 重 要 部 分… 。 目前提 出的一些 属性约 简算 法大都 属于 启发 式 的搜 索算 法【 , 2 尽管它们 的计算速度快 , 但求 出的不一定是最 小 的属性约 简。在实际应用 中 , 人们 往往期望 得到属性 数最少
U Ir p stre h w a h rp s d a g rt a u c l o v r e t e e o u o n ls u t n ti e r C e o i i ss o t t e p o e o h c n q ik y c n eg o a b t r s l t n i e s r n i a d w h n fwe o h t o l im i me i g n r t n .I fe t e e s a d f a i i t r s e fe n t e c mp rs n w t e e a t e g r h . e e a i s t e c i n s e s l y a e a ov r id i h o a io h s v r l h ra o t ms o s v n bi l i i o l i Ke r s y wo d :mu h s t t i ue r d c in i a y p ril w r p i z t n mmu i g e ;at b t e u t ;b n r a t e s a l o t r o c [ n mia o ;i i nt y
一种增量式约简方法求解最小顶点覆盖问题
一种增量式约简方法求解最小顶点覆盖问题
Zhan Shanhua;Xie Xiaojun
【期刊名称】《计算机应用研究》
【年(卷),期】2018(035)012
【摘要】最小顶点覆盖问题是一个应用很广泛的NP难题,针对该问题给出一种增量式属性约简方法.首先将最小顶点覆盖问题转换为一个决策表的最小属性约简问题;利用增量式属性约简思想,随着图中边数的增多,提出一种更新最小顶点覆盖的增量式属性约简算法;该算法时间复杂度低于计算整个图的最小顶点覆盖的时间复杂度,同时针对大规模图问题,可随着边的增加动态更新最小顶点覆盖,因此降低了属性约简的方法求解最小顶点覆盖问题的运行时间.实验结果表明了该算法的可行性和有效性.
【总页数】4页(P3685-3688)
【作者】Zhan Shanhua;Xie Xiaojun
【作者单位】
【正文语种】中文
【中图分类】TP391.6
【相关文献】
1.一种求解平面图的最小顶点覆盖算法 [J], 吴春;朱国魂;谢玉忠;林宏
2.一种混合化学反应优化算法求解最小顶点覆盖问题 [J], 郑光勇;徐雨明;李肯立;孙士兵
3.一种基于粗集理论的增量式属性约简算法 [J], 高晓红;李兴奇
4.不完备系统中一种增量式属性约简算法 [J], 王光琼
5.一种高效的复杂信息系统增量式属性约简 [J], 段海玲;王光琼
因版权原因,仅展示原文概要,查看原文内容请购买。
一种改进的最小属性约简算法
定 义 6 如果 有 相 同条 件属 性 的数 据 同时 其 决 策属性 的 值 也 相 等 , 称 该 决 策表 为相 容 决 策 则
定 义 1 设 S一 ( R, , , 于 每 个 属 性 U, F) 对
基于 正区域 的求解 算法 , 时在求解 的过程 中会 结 有 合属性 的重要性 、 信息等 ;2 基于 差别矩 阵 的求 互 ()
解算法 ;3 ( )基 于智 能 计算 的求 解 方法 , 基 于 遗 如 传算法 和神经 网络 . 着 问题 规模 的增 大 , 于 差 随 基 别矩 阵求 解算法 的缺陷会愈 加凸显. 有时在 利用 正 区域或差别 矩 阵求解 时 , 结合 属 性 的重 要性 、 常 J
第 3 6卷 第 3期 21 0 2年 6月
武 汉理 工大 学学 报 ( 交通 科学 与工 程版 )
J u n lo u a i e st fTe h o o y o r a fW h n Un v r iy o c n l g
( a s o tt nS in e& En ie r g Tr n p rai ce c o gn ei ) n
子 集 P R, 义 属 性 P 的 不 可 区 分 关 系 定
I ND( 一{ . ) P) ( , ∈U。 Vr 2 2 { ∈P, ( r 一f( 厂 ,) Y,
r )如 果 ( ) I ), z, ∈ ND( , 称 z 与 . 是 P 不 P) 则 y
基于量子粒子群优化的最小属性约简算法
基于量子粒子群优化的最小属性约简算法
王加阳;谢颖
【期刊名称】《计算机工程》
【年(卷),期】2009(035)012
【摘要】属性约简是粗糙集理论中的一个核心问题,为了有效获取属性最小相对约简,提出一种基于量子粒子群优化算法的粗糙集属性约简算法.该算法通过引入自适应参数使得算法在保证取得的是一个约简的情况下尽可能地减少所包含的属性数目,并期望能够获得理想的约简结果.试验结果证明该算法能有效地进行属性约简,并取得良好的约简结果.
【总页数】4页(P148-150,153)
【作者】王加阳;谢颖
【作者单位】中南大学信息科学与工程学院,长沙,410083;中南大学信息科学与工程学院,长沙,410083
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.基于免疫量子粒子群优化的测试代价敏感属性约简算法 [J], 谢小军;俞春强;王博;何弦;徐章艳
2.基于遗传粒子群和粗糙集的最小属性约简算法 [J], 吴尚智;罗艺纯;翟敬鹏
3.基于量子粒子群优化算法的最小交叉熵多阈值图像分割 [J], 赵勇;方宗德;庞辉;王侃伟
4.基于0-1规划的最小属性约简算法 [J], 詹婉荣;于海
5.基于最小化邻域互信息的邻域熵属性约简算法 [J], 刘正;陈雪勤;张书锋
因版权原因,仅展示原文概要,查看原文内容请购买。
一种增量式属性最小约简的粗糙集算法
( < t , 于 i∈ { , ,… , : ( ,t ,n + 1) = s ) 对 12 n} b ( )
曰中的一个元素 , 对应 着属性 i 和决 策表 中 的一 对记 录 ( , )
{ 警 ,s { , 警
并且提 出了各种增量式算 法来 进行 最小属 性约 简 , 并且 取得 了
[] 表示 U中所有与 在关 系 ID P 下是等价 的元 素构成 的 。 N () 集合 。
定义 3 ( 近似精度 ) 设 P C 对划 分 U I D( P一 , /N D):
{ 1 y… , } 的 y ,2
机器学习。
28 5
计 算机 应用 与软件
输出 : 新增属性 的信息 系统 中的属性约简 。
2 1 丘 01
c
( D) 且不存在 R U, , C R使得 ( D)= ( , , U, U D)则称 R
为 C的属性 约简( 相对于决策属性 D的) 所有 C的属性约简的 。 交称 为 C的核即 c中所有 必要 的知识组 成的集合 称为 C的核 ,
P 近 似 精 度 为 一
(, = U D)
很大的进步 , 但对于增加 条件属性 引起 的数据 库变化 的研究 不 是很 多。本 文研 究的是增 加条件 属性 引起 数据 库变 化的情形 ,
是在 S o rn提出的差别矩 阵的基础上 构造 出的过渡相对 差异 kw o 比较表来进 行的属性 的最小约简 ( 本文 只 限于新增条 件属性 的 个数少 于原 条件属性 的个数 , 决策 属性 只 有一个 ) 且 。该 算 法 是对新增条 件属性通过原修正差异 比较表得 到过渡相对差异 比
基于遗传粒子群和粗糙集的最小属性约简算法
基于遗传粒子群和粗糙集的最小属性约简算法
吴尚智;罗艺纯;翟敬鹏
【期刊名称】《计算机工程与科学》
【年(卷),期】2016(38)5
【摘要】阐述了粗糙集理论、遗传约简算法和粒子群约简算法.属性约简是知识发现的关键问题之一.传统的属性约简算法都是串行搜索的,算法效率低且收敛速度慢.将计算智能和粗糙集相结合,提出了一种基于遗传粒子群和粗糙集的最小属性约简算法.该算法利用属性依赖度计算属性核,并在种群初始化时引入属性核作为限制条件,动态调整适应度函数,以达到求得最小属性约简的目的.实验表明,对于数据量大、属性维度高的属性约简问题,该算法具有高效的处理能力.
【总页数】7页(P1007-1013)
【作者】吴尚智;罗艺纯;翟敬鹏
【作者单位】西北师范大学计算机科学与工程学院,甘肃兰州 730070;中国移动通信集团甘肃有限公司,甘肃兰州 730070;西北师范大学计算机科学与工程学院,甘肃兰州 730070
【正文语种】中文
【中图分类】O159
【相关文献】
1.基于离散粒子群算法的粗糙集属性约简 [J], 李志豪
2.一种基于改进遗传算法的粗糙集属性约简算法磁 [J], 李玉龙;张亚光;毕聪聪
3.基于免疫遗传算法的粗糙集属性约简算法 [J], 时光;智军;陈军;
4.高斯核模糊粗糙集中基于粒子群算法的属性约简 [J], 刘东君;陈红梅
5.基于混沌离散粒子群的粗糙集属性约简算法 [J], 栾雨雨;王锡淮;肖健梅
因版权原因,仅展示原文概要,查看原文内容请购买。
一种改进的最小属性约简算法
一种改进的最小属性约简算法
薛胜军;郭强
【期刊名称】《武汉理工大学学报(交通科学与工程版)》
【年(卷),期】2012(036)003
【摘要】最小属性约简是粗糙集理论中的一个重要内容,通过对属性约简算法的研究,指出基于U/{a}划分的最小属性约简算法中的不足,并提出了一种改进的最小属性约简算法.该算法以基于等价类的方法对论域进行压缩,有效地降低了算法的空间复杂度,用基于核的方法求解最小约简,从而保证可获得最小约简.实验结果表明,该算法具有复杂性低、存储空间小和效率高的特点,是一种有效的最小属性约简算法.【总页数】4页(P515-518)
【作者】薛胜军;郭强
【作者单位】武汉理工大学计算机科学与技术学院武汉430063;南京信息工程大学计算机与软件学院南京210044;武汉理工大学计算机科学与技术学院武汉430063
【正文语种】中文
【中图分类】TP18
【相关文献】
1.基于改进关系积的最小属性约简算法 [J], 叶明全;伍长荣
2.最小相关性最大依赖度属性约简的改进算法 [J], 毛华;赵书峰
3.一种新的决策粗糙集最小化决策代价属性约简算法 [J], 徐道磊;陈培林;唐轶轩;
吴尚;路宇;卞显福
4.一种求粗糙集中最小属性约简的新算法 [J], 刘文军;王加银;冯艳宾;谷云东;李洪兴
5.一种有效的基于风险最小化的属性约简算法 [J], 于洪;姚园;赵军
因版权原因,仅展示原文概要,查看原文内容请购买。
一种增量式属性最小约简的粗糙集算法
一种增量式属性最小约简的粗糙集算法刘德银;刘文奇【摘要】当信息系统的对象和决策属性不变而不断增加条件属性时,为了获得该系统的最小约简属性,一般方法是对决策表的所有数据进行重新计算,很显然这种方法不可取.在粗糙集理论的基础上,给出了过渡相对差异比较表的定义,提出一种新的增加条件属性的最小约简算法.实例说明:该算法节省了大量的时间和空间的资源,并且结论与传统的算法得到的属性最小约简的结论是一致的,所以该算法具有一定的适用价值.%In order to obtain minimum attribute reduction of the information system when its condition attributes are added continually while its object and decision attributes are invariant, general method is to recalculate all the data in the decision table. Clearly it is not applicable. In this paper, the definition of transitive relative difference comparative tables is given based on rough set theory and a new minimum attributes reduction algorithm of condition attributes increment is proposed as well. From the specific examples, we can know that the algorithm saves a lot of time and space resources, and this conclusion accords with the condition of minimum attribute reduction obtained from traditional algorithm. Therefore, the new algorithm is of certain application value.【期刊名称】《计算机应用与软件》【年(卷),期】2011(028)008【总页数】3页(P257-259)【关键词】粗糙集;属性约简;过渡相对差异比较表【作者】刘德银;刘文奇【作者单位】昆明理工大学理学院,云南,昆明,650093;昆明理工大学理学院,云南,昆明,650093【正文语种】中文【中图分类】TP180 引言粗糙集理论是波兰华沙理工大学Z.Pawlak教授等一批科学家提出的,它是一种处理不确定信息的新型数学工具。
一种新颖的最小属性约简模型
一种新颖的最小属性约简模型
杨明;倪魏伟;孙志挥
【期刊名称】《东南大学学报(自然科学版)》
【年(卷),期】2004(034)005
【摘要】传统的基于粗集的属性约简须计算差别矩阵并生成大量的条件属性类,效率低,且很多算法还不完备.为此,本文引入分类关联规则和相容分类关联规则的概念,给出基于分类关联规则的求解下近似和正区域的等价方法,从而提出基于分类关联规则的属性约简模型和算法,该模型将属性约简问题转化为求解一类特殊的分类关联规则集的问题,因而使得相应的算法可有效地改进属性约简挖掘效率, 克服传统算法依赖于主存的限制,为属性约简提供了一种新的框架.理论分析表明该算法是有效且可行的.
【总页数】5页(P604-608)
【作者】杨明;倪魏伟;孙志挥
【作者单位】安徽工程科技学院计算机科学与工程系,芜湖,241000;东南大学计算机科学与工程系,南京,210096;东南大学计算机科学与工程系,南京,210096;东南大学计算机科学与工程系,南京,210096
【正文语种】中文
【中图分类】TP311
【相关文献】
1.一种改进的最小属性约简算法 [J], 薛胜军;郭强
2.一种完备的最小属性约简方法 [J], 于海燕;乔晓东
3.一种新颖的概念格属性约简算法 [J], 李金海;吕跃进
4.一种新的决策粗糙集最小化决策代价属性约简算法 [J], 徐道磊;陈培林;唐轶轩;吴尚;路宇;卞显福
5.一种有效的基于风险最小化的属性约简算法 [J], 于洪;姚园;赵军
因版权原因,仅展示原文概要,查看原文内容请购买。
高可信度最小约简属性启发策略
高可信度最小约简属性启发策略尹林子;李勇刚;阳春华;桂卫华【期刊名称】《自动化学报》【年(卷),期】2012(038)011【摘要】为提高启发式算法计算最小约简的可信度,基于可辨识矩阵,研究了属性之间存在的吸收、排斥以及互斥等特征,分析其与最小约简的关联,提出了对应的最小约简属性启发策略,建立了各个特征下属性启发策略的可信度计算模型.在此基础上,按照可信度排序,形成了一种综合的高可信度最小约简属性启发策略,并给出了具体的约简算法.理论和实验分析表明,本文策略具有可信度高且可信度可以估计等优点,能有效提升最小约简算法的性能.%In order to improve the confidence of minimal reducts calculated by heuristic methods, some important characters of attributes, such as absorption, repulsion, and mutex etc., are presented based on the discernibility matrix. Then the related heuristic strategies are proposed by analyzing the relation between these characters and the minimal reducts. Some confidence models of these strategies are established to order these strategies. On the basis, an integrated strategy and a related reduction algorithm are proposed to calculate a minimal redcut. Theoretic and experimental analyses show that the proposed strategies are of high confidence and effectiveness.【总页数】6页(P1751-1756)【作者】尹林子;李勇刚;阳春华;桂卫华【作者单位】中南大学信息科学与工程学院长沙410083;中南大学物理与电子学院长沙410083;中南大学信息科学与工程学院长沙410083;中南大学信息科学与工程学院长沙410083;中南大学信息科学与工程学院长沙410083【正文语种】中文【相关文献】1.基于联合属性重要度的决策风险最小化属性约简 [J], 徐菲菲;毕忠勤;雷景生2.变精度粗糙集的属性核和最小属性约简算法 [J], 陈昊;杨俊安;庄镇泉3.属性重要性的启发式属性约简算法 [J], 何英;何丹4.基于启发式二分策略的属性约简方法 [J], 黄治国; 杨清琳5.一种基于属性重要性的属性约简启发式算法 [J], 叶明全;胡学钢因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Doh 1.9 9 .s 0 03 2 . 1 . .1 O3 6 /i n10 —4 8 O 2 40 5 js 2 0
1 概 述
粗糙集理论是一种新型的处理模 糊和 不确 定知识 的数学
。
工具 ,属性约简是它的核心内容 之一 ,目前国内外 已经提 出
了许多属性约简方法。 基于差别矩 阵 的属性约简是属性约简 的方法之一 ,该
rd cint eig nrt ae ntepo a it fh tiue i i ent bet. l nma tiuerd cin r g trm mii l e ut e e eae b sdo rb blyo eatb ts c ds r ojcsAlmii l tb t e u t s e o o nma o r s d h i t r wh h c wo ar o a f
的,也就是说这 2 种属性约简是不等价的 ,文献 [】 8进一步研
究指 出产 生这个 问题 的根本原 因:由于决策表 信息系统的不 相容 性导致 了 H 的方法出错 ,因此对于一致决策表基于差 u 别矩阵的属性约筒与基于正 区域的属性 约简是等价 的。 对一 个信 息系统 ,一般而言求 出所有约简与求最小约筒 都是 N P难 问题 ,因此 ,常借助于某种启 发式信息来求近优 解 ,但很多方法都 是不完备 的。本文根据差别矩阵 的求核原
at i u e e u to r e T e r s l ft eme h d i o e o b o trb t sr d c i n te . h e u t t o s o h pr v d t ec mp ee a d mi i l l t n n ma
第3 8卷 第 4期
V0 _8 13
・
计
算
机
工
程
21 0 2年 2月
Fe ua y 01 br r 2 2
NO4 .
Co p t rEn i e rn m ue gn eig
软 件 技术 与数 据库 ・
一
文章编号:1 0-2( 1)— 06_ 文献标识码: 0 —3 8 024 4—0 0 4 2 0 3 A
决策属性集 。对于 每个属性 a R, 为 它的值域 。每个属
性有一个决策函数 f: R_ 。 Ux ÷
约简。
定义 2把 一个给定 的决策表 的属性 区分 的信 息用一个 差别 向量组来表示 ,即 E =( 日 E …, ), 的任一项 E , , E 它 元素 E =(i O, , 1 , n , G )( , …,) 其中 , 2 0为可 区分对象对 ;
定义 3在一个决策表 S= U, ,, < RV f>中, R= CuD , 设 M =( 为差别矩阵 ,V m) PcC,若 P满足 :
() ≠m ∈M ,有 P , ; 1V nm, ≠
() a 2 V ∈P, P =P一 Ⅱ 均 不 满 足() {} 1。
方法将信息系统中所有有关属性 的区分信 息都浓缩进一个矩
阵中, 目前很 多属性约简算法都是基于区分矩阵或在 此基础 上进行改进 的 。文献[】 7指出 由 H u提 出的基于差别矩阵的 求核 方法 求 出的核与基 于正 区域 的属 性约 简的核 是不等价
则称 P是 C关于 D 的一个属性约简。
定理 在一个概 率向量中 , 如果其 中的某一项元素取值为 1 ,则该元素所对应 的属性为原信息表 的核属性 。
[ src]At b trd cini tebsc rbe o u hstter. to r nma atb ts eu t ni c nie t e io bei Abta t tiue e ut sh ai o lm f o g s hoy Ame df i lt iue d ci o s tn cs nt l r o p r e h o mi r r o n s d i a s
向量组 ,计算每个属性在 区分 2 个对象 的属性集合 中出现 的概率 ,作为属性重要性 的启发式信息 ,建立最小属性约简树 ,得到属性约筒 。
分析结果表 明,该方法可 以获得 所有 的最小属性约筒 。 关健词 :粗糙集 ;决策表 ;差 别属性集 ;差 别向量组 ;最小属性 约简树 ;最小属性约 筒
2 相关概念
定义 1决策表定义为 S= RV f>, R=CuD为属 <U,, ,
性集合 ,其中 ,U是对 象的有限集 ;C是条件属性集 ;D是
所 以,一个属性约筒即能将 所有对象 区分开 的属性 的集合 ,
一
个最小属性约简即能将对象 区分 开的属性个数最少 的属性
本文讨论的方法是根据差 别矩 阵的求核原理 ,所 以,只
第3 卷 8
第 4期
于海燕 ,乔晓东 :一种 完备 的最 小属 性约简方法
4 7
10 0 %地 覆盖整个 训练集 ,且对象之 间都能 区分开 。
() , 1C 只能将 C对应 的对 象区分,则新属性集合为一个约 i 简 ,且 属 性个 数 与 { C } 等 ,原 约 简为 最 小属 性 C c, n 相 , …, 约简。 () , 2 C 不能将 C对应 的对象 区分 , i 则新属性集合不是一个
约简 ,需要另外选择属性 区分 ,这 时属性约简 中的属性个 数大于约 筒 { C } c c, 中的属性 个数 ,所 以原属性 约简仍 , …,
为最小 属性 约简。
根据这个思路 ,首先将核属性加入约简 ,将包含核属性 的元素删除 ,在剩余 的元素 中继续寻找能 区分其余对象 的属 性 。在 剩余的元素 中,每个元素包含 的属性 中至少要有一个
证 明: 令概率 向量 中的任意一项 fa) ,, ,, m, ( =1 =I …, 2
因 为 F =( ( ,(: …, (,) fa) ll ,,所 以 I , )fa) . a ) , (,= /C l . , f Cl = 1 也 就 是 在 相 应 的 区 分 对 象 的差 别 属 性 集 只 有 该 概 率 向 量 ,
[ ywo d ru hst d cs ntbe dsenbeatb t st i enbe vco r y mii l tiuerd cint e mii l tiue Ke r s o g e; eii al; i ril t iue e;ds ril e trar ; nma atb t e ut r ; nma atb t I o c r c a r o e r
属性来区分其对应 的 2个对 象 ,即属 性约简中至少 要包含其 中的一个属性 ,属性个数越少 ,被选 中的概率越大 ,以此概
() 3 C不仅能 区分 C,且能 区分其他对象 ,设被 区分 的对 ,
象对 为 O ,则 C 必属于能将 区分开 的属性子 集 ,且 C 在 k , , 这里的对应概率为 P ,即 P =P ,因为 P ≥P ≥P , , ,对于 概 率大于 等于 P 的属性 都在 最小属性 约简树 中处理过 , 所以 不属于新 的约简情况 。
织 ,数据挖掘 ,粒 度计算;乔晓东,研究员、硕士
量 ,F=( (. .a) f a ) ,它的每一项表示该属性出现 , “)f , ( ) , ( …,
的概率 , m为属性个数 ,令 / ,, m: =1 …, 2
收稿 日 :2 1 0—6 期 01 82 —
Ema :yh a6 @13 o ・ i uynቤተ መጻሕፍቲ ባይዱ 6 . m l c
中图分类号:T312 P11 .
种 完备 的 最 小属 性 约 简 方 法
于海燕 ,乔 晓东
( 中国科 学技术信 息研究所信息技 术支持 中心,北京 10 3) 00 8
摘
要 :为解决粗糙集 中的属性 约简问题 , 出一种 完备 的最小属性约简 方法 。将差别矩阵中所有有关属性 区分的信息都浓缩进一个差别 提
率作为属性的重要性 ,每个属性被选 中的概率为该元素包含 的属 性个数分之一 ,选择重要性大 的属性加入约简 ,然后删 除包含该属性的元素 ,重复这个过程 ,直到所有对象都被 区
分开 。
综上所述 ,该方法得到的属性 约简是属性个数最少的 ,
即为最 小属性约筒 。 42 完备性证 明 . 证明: 根据 P wl a a k的定义 ,若属性集 P亡C是给定决策
在差别矩 阵中, 属性组合数为 1的元素表 明除该属性外 , 其余条件属性无法将该元素对应 2条 决策属性 不同的对 象区
分开 ,即该属性必须保 留,与决策表 中核属性 的概念一致 , 所以 ,矩阵中所有属性组合 数为 1的属性 均为决策 表的核属 性 ,所有包含核属性 的元素所对应 的对象都可 以由核属性 与 其他对象 区分开 。
Co p e eM i i a t i u eRe u to e h d m l t n m l Atr b t d c i n M t o
YU H i a . AO a - o g a - n QI Xiod n y
(nomainT cn lg u p rC ne,ntueo cet ia dT c n a Ifr t no hn , e ig10 3 , ia Ifr t eh oo yS p ot e t Istt f inic n eh i lnomai f ia B in 0 0 8 Chn ) o r i S f c o C j
最小 属性约简 ,并证明该方法是完备 的,且用该方法能得到 所有最小属性约简 。
() 2对任意 的 ∈P, P S- } ≠P S ( 。 O e aD) O D) l( 如果一 个属性 约简 算法求得 的属性 集 同时满足条 件() 1
最小属性约简算法的具体步骤如下 : 输入 训练数据
p o os d i h s p p r r p e n t i a e Th ic r i l n o ma i n i o it n e i i n t b e s d s rb d wi ic r i l e t r a r y e d s e n b e i f r t n c nsse td c s o a l s i e c i e t d s e n b e v c o ra .A ni la ti u e o h mi ma trb t