一种改进的基于差别矩阵属性约简算法及其应用
基于简化差别矩阵的完备属性约简算法
( eat e to o p t , u n x N r a U ies y G in 5 0 ) D p r n fC m ue G a gi om l nvri , ul 4 4 m r t i 1 0
( o e eo nom t n E g e r g B in nv r t o c n e a d T c nlg , e n 0 3 C l g fIfr ai ni ei , e ig U i s y fS i c n eh o y B i g 1 0 8 ) l o n n j e i e o j 0
Ab t a t B c u e t e d f i o f at b t n r d ci n a e n o d d s e n b l y s r c : e a s h e n t n o t u i e u t b s d o l ic r i i t mar s o h s me a h e- i i i r o o i tx i i Байду номын сангаас t t e a s t e d f ii o f a t b t n r d ci n b s d o o i v e in, i l ic r ii t n t n o t u i e u t a e n p s ie r go a smpe d s e b l y i i r o o t n i mar n h o r s o d n e n t n o tx a d te c r p n ig d f io f i e i i at b t n e u t n a e p o i e , h s me t t u i r d ci r rv d d At t e a i i r o o me, s r v d t a h b v e n in o t b t n e u t n s t e ii t p o e h t t e a o e d f h o f a t u i rd ci i h i i r o o
基于差别矩阵的动态约简及规则提取算法
Y e gl 1 N uj g .HU X eh o, N i i U F n — n, WA G R -n Z u —a 2WA G Hu— a i 2 i qo
( . fi n tue f nel e t 1Hee I s tt o Itlg n Mahn s C iee i i c ie , hn s Ac d my f S in e , fi 3 0 , hn ; . p nme t f Au a e o ce cs Hee 2 0 3 C ia 2De a t n o — 1
应用 的研究 领域 。对 于人 工 智能 和认 知科 学 也是 十
2 纪 8 代末 期 人们 就 意识 到 ,信 息 系统 0世 0年 中的信 息量 积累 越来越 大 ,以致造 成信 息量爆 炸 的 危险, 尤其 进 入信 息 时代 , 这个 问题 尤为 突 出。为此 解决 信 息系统 中信息量 膨 胀 问题 不 仅是信 息 系统本
并 给予 很 高 的评 价 ,把 它列人 了他 新 提倡 的软计 算
基 础理 论之 一 。由此 可见 , og R u h集 理论 及其 广泛 应 用 越来 越得 到重 视 。
。
自问世 以来 , 论是 在理 论 或应 用上 都是 一种 新 无
的、最 重要 的并 且 是迅 速发 展 的一 门既有 理 论又 有
tmain U iest ce c n e h oo y o hn , fi2 0 2 C ia o t , nv ri o S in e a d T c n lg fC ia Hee 3 0 6, hn ) o yf
Ab t a t Ru e e ta t g a d r d c d t i u e r mp ra t t s s o te r s a c o o g s t.T i p p r p t sr c : l - x r ci n e u e at b ts a e i o tn a k fr h e e r h f r u h e s h s a e u n r f r a d a mp o e l o t m a e n n ay ig Ru e e t ci g a g r h o ic r i i t t x i r v n n n ow r n i r v d a g r h b s d o a lzn l - x r t oi m f d s e n bl y mar ,mp o i g mi ig i a n l t i i e f in y f r r l s rc i i g mu h s lr d c s n r l s Th x mp e r s l h w t a h g r h i o f ci- f ce c u e ,e e vn c i e e ii u e . e e a l e u t s o h t te a o t m s f e e t i o mp o s l i v i e n sg . t sa d u a e i Ke r s d s e i i t t x; t b t e u t n;a u e u t n y wo d : i r b l y mar at u e r d c i v l e r d ci cn i i i r o o
一种改进的基于区分矩阵的属性约简算法
域, 即 由对 象组 成 的 有 限集 合 , A= C Y D 为 有 限属
② 的上近似集 ,
R ( )= { ∈ U I [ ] I ≠ }
第 3 3 卷 期 2 0 1 4 年 第2 6 月
成 都 大 学 学 报( 自然 科 学版 )
J o u r n a l o f C h e n g d u U n i v e r s i t y ( N a t u r a l S c i e n c e E d i t i o n )
② 的 R负 域 , N E G R ( X)= U —R( ) ;
性集合且A≠ , C是条件属性集合 , D是决策属性 集合 ; V: U 是属性集合 的值域 , m 为条件属性
和决策属性数之和; . 厂 是信息函数 , , : U X A— 为 单一 映射 , 即. 厂 ( , 口 )∈ , 指定 中每一个属性
=
{ [ ] I [ ] I X≠ }
在上述定义中 , 下近似集 ( ) 为包含于 的 最大 R精确集 ; 上近似集 R ( ) 为包含 的最小 精确集 . 定义 4 . s= ( , A , , . 厂 ) 是一个信息 系统 , R 是 上 的一个等价关系 , ∈ , 有, ① 的R正域 , P O S R ( X )=R ( X ) ;
第3 3卷
③ 的 边界 域 , B %( )= R( )一 ( ) .
S t e p 3 , 把所 得合 区 范式化 为极小 析取 范式 ; s t e p 4 , 极 小析 取 范 式 中每个 合取 范 式项 就 是 约
基于差别函数的属性约简算法在电子商务中的应用
y= )
ቤተ መጻሕፍቲ ባይዱ
, 的确定 性 因子 。 然O1≤1 为 肛为r 显 < . , t
1 , 时 称决 策 规 ̄ r l 是确 定 的 ,  ̄ r 不确定 的。 l l 否 l是 J l
^ P =(, ∈ × Va∈P (, ( ) { y l fx )
Uf Po
, , D( ) 等价 关 }I P 是 N
第9 第 l期 卷 2
2 1年 1 00 2月
软 件 导 刊
Sot r i fwae Gude
VO . o 1 19N .2
Twe 2 0 . 01
基于差别 函数 的属性 约简 算法在 电子 商务 中的应 用
金 玲玲 朱 紫焱 苏 莉 , ,
( . 南师 范大 学 数 学与 统计 学院 , 南 海 1 5 15 ;. 州大 学, 1海 海 : 7 1 8 2郑 7 河南 郑 州 4 0 0 ) 5 0 1 摘 要 : 着电子 商务 的发展 , 领域 已积 累 了大 量商务 数据 , 是 这些数 据 中往往 存在 许 多冗余 的信 息。结合粗糙 随 该 但
,
lU , Va∈CU , 是论 域 与属 性的 映射 函数 d () 示对 象 = 厂 o 表 x
关 于属性n的取 值 , 7 £ ⅡVa 户{ 『 ( ∈CUD } _ ) 。 定 义2 根 据定 义 1 令A=CUD, A, 决 定 了一 个 : , 若P 则
上 的不 可 分 辨 关 系I D( ) N P:
如s[] — 出s[] []f[]≠ ( c ( D 3 。 ) ),
其 中 , 基 于 属 性集 C,所 在 的等 价 类 , ( ]) 对 [ ]是 如s 是
[] 的描述 , 即对于 []各 条件 属性 的 特定取 值 。 定 义6 确 定性 因子 。根 据定 义5 对于 给定 的决策 规则r令 : , , ∈[ cY∈[ D习 么 : ], ],B
一种改进的属性约简算法
输入: 一个决策表信息系统S = ( U , R , V , . 厂 ) ,R = C U D, 这里 : 论域;C: 条件属. 集;D: 决
策属性集 。 输出: 的一个 约简 R e d 。 算 法步骤 如下 :
第 l 步 :初 始化 R e d : ,S i g ( a ) =0,c o u n t ( a ) =0;
长l e n ,并 更新相应 屙 陛频率值 S i g( a i ) 和属 陛出现 次数 c o u n t ( a i ) ; 。
第 5步 :按属性重要度 ( a i ) 排序 ,选择属性重要度最大 ( 若属性重要度 ( a) 值 相 同 ,则 选择
.
齐 齐 哈 尔 大 学 学 报
c o u n t ( 口 , ) 较大 的 )的属 性 a并人 R e d中 ,即 R e d = R e d U{ a i } ;
中图分 类 号 :T P 3 0 I . 6 文 献 标 志 码 :A 文 章 编号 : 1 0 0 7 — 9 8 4 X ( 2 0 1 3 ) 0 3 — 0 0 1 2 - 0 3
属性约 简是粗糙集 理论 及应用 研究 的重要组成 部分 ,它是知识 获取 的关 键步骤 。信息 系统 中知识的重
【 3 1 胡成祥 ,李天瑞 ,邹维丽 ,等.基于限制容差关系的粗糙集模型中近似集增量更新方法研究f J 1 _两南 族大学学报 :自
然科 学 版 ,2 0 0 9 ( 3 1 :4 8 0 — 4 8 4 .
f 4 1苗夺谦 ,李道 国.粗糙集理论 、算法 与应用[ MI .北京 :清华大学出版礼 。2 0 0 8 .
S i g( a j ) = ( / l e n , ) ( 小 于决策表 中属 性个数 )
一种基于改进区分矩阵的属性约简算法
E—ma lt 65 321 @ 1 e m i:8 4 3 63.o
T Z iL U i g z e g L W e — n. lo i m fr t i ue e u t n a e o i r v d d se nbl y AO h 。 I Q n - h n , I i mi A g r h t o at b t r d ci b sd n mp o e i r iit ma r . r o c i ti x C mp tr E gn e ig a d A pi t n . 0 7 4 ( 2 :3 8 . o u e n i e r n p l ai s 2 0 .3 3 ) 8 — 5 n c o
f ncin u t m eh d o r trbu e e c in a e o S wr n’ dic r bi t marx o t o f a ti t r du to b s d n ko o s s e ni l y i ti whc t r s u t b e o o ic nsse de i ih u n o t o e r r f r n o itnt e- so t b e,hi p pe p o o e a i p o e dic r i lt m arx in a l t s a r r p s s n m r v d s e nbii y ti an t e o p ai n d h c m utto m eho o i, c s t fr o sse t r t d n t whih ui o c n itn o s ic n itn d t a d s n o sse t aa n i wih owe c mplxt e p ca t i on it n daa,t l e s re m arx,O t s smp e t l r o e iy, s e il o nc sse t t i wil t pa s r g ti S i a i l an e i Ma e r
分类算法中基于差别矩阵的属性约简方法
基 金 项 目:河 北 省 自然科 学 基 金 资助 项 目 ( 2 1 0 19 ) F 00 0 2 8
作 者简 介 : 何 海 涛 (9 8) 16 一,女 ,云 南 昆 明人 ,博 士 ,教 授 , 主要 研 究 方 向为 计 算 机 智 能控 制 、计 算机 仿真 、数 据 挖 掘 ,E i m ̄l
素 的合取 范式转化为极小析取范式 , 但其 过程是相 当复杂的。
阵中非 空元 素的个数 , 利用单个属性 的不可辨识性 来计算 出现 频率最多 的属性 。 高鹏利 用基于等价类 的差别矩 阵进 行属性重要性计算 , 规则相容度 的 从 角度 出发 , 属性 约简过程可 以看作不 断剔 除论域 中 不相容规则 的过程 , 出了基于差别矩 阵和 动态划 提 分域 的属性约 简算 法 。 刘洋 口 将信 息论 定义 的属 性重要 性作为启 发 式信 息 , 并通过构造一个 条件 信息熵算子对 差别集
Байду номын сангаас
点仅 又满足点 的所有对象的个数,I ) ) 示 u l 表
满足 点6 c 满足点 或者 的所有对 象的个数 ,称劲 属
性相似度 。
为所考 虑对象 的非空有 限集合 ,称 为论域 ;A为属
u , 是屙 陛口 的取值构 成 的集 合 ,称 为a 的值 域 ;厂  ̄ :U A一陧 一 个信 息
阵, 本文 利用数据化简算法先 对数据进行处理 ,以
为信息表 的核 , 但在 定义差 别矩阵 中的每个矩 阵元 素时增加 了计算 量。
一
种 新的改进 的差别矩 阵及其 求核方法 对
上述 两种算 法进 行 了补充 与完善 同时有效地 降低
基于改进差别矩阵的知识约简启发式算法
作者: 杜发兴 吕翠美 徐刚
作者机构: 三峡大学水利与环境学院,湖北宜昌443002
出版物刊名: 科技资讯
页码: 5-6页
年卷期: 2010年 第36期
主题词: 粗糙集理论 决策表 改进差别矩阵 知识约简 启发式算法
摘要:知识约简是粗糙集理论中的核心内容之一。
提出一种改进差别矩阵,在对象比较过程中一次性提取核与用于求约简的所有分辨信息,并保证分辨信息之间不存在包含关系。
在此分辨信息基础上,以属性频度为启发式信息给出了一种基于改进差别矩阵的启发式约简及增量式更新方法。
理论分析与仿真实验表明,算法在效率上较现有的算法有显著的提高。
说明算法的有效性。
一种改进的属性约简方法
学 术 论 坛
SIC &T H LG l西 N面 CNE E N OY 0 O 2 E C O 28 亍 0 . 3
一
种改进的属性约简方法
赵 征
( 武汉理工大学 计算机应用技术 湖北武汉
4 06 ) 3 0 3
.
摘 要: 属性约简是粗糙集理论的核心问题之一,现已证明寻找最优约简是 NP—h a d问题。本文在连接差别矩阵的基础上,采用贪 r 心算法的策略 ,提出了一种启发式算法来寻求最优约简。该算法不仅能在有核的决策表中通过核进行属性扩充求得最优约简,而且 在无核的决策表中也能根据属性在连接差别矩阵中出现的频率求得最优约简。经实例验证该算法是有效的。
属性的值域集, ,是信息函数 ,它为每个对象 的 每个 属性 赋 予一 个信 息 值 , 即
V a∈A, X∈U, ( ) - , EV ,
定义 2 】 7 U, D) . 设 ( CU 是一 个决策 表 ,D 的 正域可 记为 J0 ( ,即 D D) P S D) Oo = ( 定义 3 【 , 称 为 的D .啵 RcC I - 约简当且 仅当 月是 的独立子集 , ( )鳓 且尸 D= ( 定 义 4 】 . C的所有必要属性组 成的集合 称为 C 的核 ,记 为 尼 c,它是 C的所有 ) 约简 的交 ,即C R ( ) P ̄ ( O E C :N JD C1( 中 其 ‘C R c 表示 C的约简) 0 . ) 。
.
3决策表中数据的预处理
3 1冲突噪声数据的处理 .
’ 设 有决策 表 =f ) U。 , A=C UD, 、 , 置
为决策表中的任意两对象。 对应的条件属
. 性值为(,, V) 决策属性值为D ) vv…, , 12 ( ,
基于差别矩阵的启发式属性约简算法及其应用
O 引 言
属性 约简是粗 糙集理 论 中 的一个核 心部分 。 至 今 人 们 已 经 提 出 了基 于 S o rn差 别 矩 阵 的属 性 约 kwo
从 相 对 D 核 出发 。 用 属 性 重 要 度 将 相 对 D 核 利 扩展 为一个 属性约简 . 将其 浓缩为最佳 属性 约简. 再
c {, ()fx A () , l fx#vj Zx = o ( ) ) (
一
( 2 )
,
( ( . ) )
从 上述定 义 中易得 出 , 当差 别矩 阵的元 素 为
时 , 示 论 域 中 的两 个 对 象 所 有 属 性 值 相 同 , 决 表 但 策值 不 同 , 该两个对象对应 的决策树不相容 的 , 即 从 而该决 策表为不相容 的 ; 当 为 一 , 示 两 个 对 象 时 表 的决 策 值 相 同 ,即决 策 属 性 在 同一 个 等 价 类 中就 没
广 东技 术 师范学 院 学报 ( 自然科 学 ) 21 0 0年第 2期 Ju a o u n dn o tcncN r l nvri o r l f ag o gP l e h i oma iest n G y U y N .,0 0 o 2 1 2
基 于差别矩 阵的启发式属性 约简算法及 其应用
11决 策 表 的 差 别 矩 阵 . 是 对 象 的 一 个 非 空 有 限 集 合 则 定 义
C l l 木
…
设 D =UCUD V 是 一个 决 策 表 , 中 , T (, , 其 论域 。 , …x}Iln , n, = , U
水 水
I
.
终 得 到 的 最 简 规则 , 全 部 数 据 约 简 量 最 大 . 或 为 了获 得 最 佳 属 性 约 简 ,我 们 从 不 同 的角 度 人 手 对 其 进 行 研 究 .覃 政 仁 从 粗 糙 集 理 论 出 发 给 出 了 最 佳 分 割 的定 义 。使 得 应 用 粗 糙 集 理 论 对 海 量 数 据 进 行 合 理 处 理 提 供 了理 论 依 据 ; 献 [] 处 理 在 决 文 1对 策 支持 系 统 中动 态 地 添 加 一 个 新 的知 识 时 ,提 出增 量 式 属 性 约 简 算 法 ,很 好 地 处 理 了知 识 的动 态 增 长
基于差别矩阵的属性约简算法
i ms rh . t
Ke wo d Ro g es D senbl ymarx Die c t x Re u t n y rs u hs t ic riit t i i f  ̄n emar i d ci o
1 引言
上世纪 8 O年代由波兰教 授 z a l .P wa 一批科学 家提 k等 出的粗糙集 ( og e) R uhSt理论… 目前 正受 到国 内外学 者 的广 泛关 注。粗糙集 的主要思想是 : 为知识是通 过等价类来 表 认
和数据挖掘提供 了强大 的支持 。
属性约 简是粗 糙集 数据挖 掘 中的关键 性 问题 。所谓 属
2 属性约简的相关概念
为后面算法提 出的方便 , 首先引入如下的几个定义。
一
个信 息 系统 S是 指 由 , , ,构 成 的一 个 四元 组 尺 ,
性 约简就是在保持知识 的分类能力不 变的条件下 , 删除 其中
戴凌 霄 韩业红 马英 红
DA ig—x a H N e— h n MA Y n — o g IL n - io A Y - og 阵 提出 差 矩阵 定义研究了 别矩 的 性质, 述了 类 性 简 法并 可 矩 首次 了 别 的 , 差 阵 基本
合 ; 集 C和 D 分 别 称 为条 件 属 性 集 和 决 策属 性 集 , 子 V=
u 是属性 r , 的值域 是 U× 一 上的一个信息函数 , 尺 它 为每个对象的每个属性赋予一个信息值, e , 即r R e U
基于差别矩阵属性约简算法的改进
兵 工 -动 化
啊叠与■■技m
Ne wo k a d I f r t n T c n l g t r n n o ma i e h o o y o
o . . u om a i IA t ton
2 0 年 第 2 第 9期 07 a o h eiinma ig tbe jd ig c r n ekn oeb f r at b t rd cin i rn ema i oepo rm fted cs — kn a l, u gn o ea d se ig cr eoe tiue e u t . f r o r o
O 引 言
数 据 的 预 处 理 分 析 直 接 影 响 后 续 分 析 能 否 得 到 预 期 结 果 。 故 基 于 差 别 矩 阵 的 粗 糙 集 属 性 约 简 , 改 进 其 算 法 原 理 ,并 用 例 子 说 明 约 简 流 程 。
有 影 响 对 象 u和 U不 同决 策 的条 件 属 性 集 合 。 i ; 定 义 2 决 策 表 可 定 义 为 S ( C, Vp。 其 : = u, D,') 中 :u 是 论 域 ;C 为条 件 属 性 集 ;D 为 决 策 属 性 集 ; p U×F : —V 是 信 息 函 数 ,F =CuD,V=ua a ∈V ,
摘 要 :基 于 差别 矩 阵的粗 糙 集 属性 约 简改 进 算法 ,先 判 断差 别矩 阵核 是 否 为 空 ,再 根 据判 断结 果采取 求 差 别矩 阵、求 核 、属 性约 简等 步骤 ,完 成其 相对 约 简 。 即通 过构 造 决策表 的差 别矩 阵核 心 程序 求 差别 矩 阵 ,在对 属 性进 行 约 简前 先对 核 进行 判 断 并求核 。最后 根据 输 入输 出进行 属 性 约 简。该 方 法 能节 约属 性 约 简时 间 ,提 高算 法效 率 。 关 键 词 :粗糙 集; 差别 矩 阵;属 性 约 简; 改进 算 法 中图 分 类号 :O2 16 文 献标 识码 :A 4.
基于改进差别矩阵的知识约简启发式算法
Sj0 &丁 H0OY CNE E NLG E C
匪圈
基于改进差别矩 阵的知识约简启发式 算法①
杜发 兴 吕翠美 徐 刚 ( 三峡 大学 水利 与环境 学 院 湖北 宜 昌 430 4 0 2) 摘 要 : 识约 简是 粗糙 集理论 中的核 心 内容之 一 。 出一种改进 差别 矩阵 , 知 提 在对 象比较过 程 中一次性提 取核 与 用于求 约 筒的所有 分辨 信息, 并保 证分 辨信息之 间不存 在 包含 关 系。 在此 分辨信 息基础 上, 以属性频度 为启 发式 信息给 出 了一种 基于 改进 差 别矩阵 的启发式 约 简及增 量 式更新 方 法 。 理论 分析 与仿真 实验表 明 , 算法在 效 率上 较现 有 的算 法有 显著 的提 高 。 明算 法 的有效 性 。 说 关 键 词 : 糙 集 理 论 决 策 表 改 进 差 别 矩 阵 知 识 约 简 粗 启 发 式 算 法 中 图分 类 号 : 1 1 2 O .1 5 文献标识码 : A 文章 编号 : 6 2 3 9 ( 0 O 1 () 0 0 - 2 1 7 - 7 1 2 l ) c一 0 5 0 2
提 、 粗 糙 集 理 论 是 由波 兰 学 者 P wl k a a 于 算 算 法 , 出一 种 非 指 数 级 的 所 有 约 简 计 如 l 。 输入 : ( , ,, ) R =妒C r=妒; S: U AV f , ,oe 1 8 年 提 出 的 处 理 含 糊 和 不 确 定性 问题 的 算方 法 , 于 已 有 文 献 l 提 出 的 约 简 计 算 92 基 3 l 输出 : 策信息系统最优约简 ; 决 新 型数 学 工 具 。, 直 是 人 工 智 能 领 域 的 复杂 度 。 论 分 析 与 仿 真 实 验表 明 , 1一 理 算法 在 步 骤 1 定 义 选 择 对 象 计 算 分 辨 属 性 按 个 的学 术 热 点 。 目前 , 糙集 理论 已被 成 效 率 上 较 现 有 的算 法 有 显 著 的 提 高 。 粗 集 合 。 功 地 应 用 于 机 器 学 习 、 策 分 析 、 程 控 决 过 步骤2 将 f加 入 , 保 持 尺 集 合 元 , 并
一种改进的区分矩阵属性约简算法
⼀种改进的区分矩阵属性约简算法
⼀种改进的区分矩阵属性约简算法
李智玲;胡彧
【摘要】属性约简是粗糙集理论研究的关键问题之⼀.⽂章以属性在区分矩阵中出现的频率作为启发,对HORAFA算法做了⼀些改进.提出了HORAFA-
AFVDM(HORAFA basg on Attribute frequency value of discernibility matrix)算法.它是以核为基础,加⼊属性重要性最⼤的属性,直到不能再加.为了能找到信息系统的最优约简,在此基础上加了⼀个反向消除过,.直到不能再删为⽌.最后在MATLAB环境下进⾏了实验,通过⽐较改进前后两种算法,表明HORAFA-AFVDM 算法在属性约简情况和算法运⾏时间上都⽐HORAFA算法有明显的改进.
【期刊名称】《计算机系统应⽤》
【年(卷),期】2008(017)010
【总页数】5页(P51-55)
【关键词】粗糙集;属性约简;区分矩阵;最优约简;MATLAB
【作者】李智玲;胡彧
【作者单位】⼭西财经⼤学,信息管理学院,⼭西太原,030031;太原理⼯⼤学,计算机与软件学院,⼭西,太原,030024;⼭西财经⼤学,信息管理学院,⼭西太原,030031;太原理⼯⼤学,计算机与软件学院,⼭西,太原,030024
【正⽂语种】中⽂
【中图分类】⼯业技术。
一种基于分辨矩阵的属性约简改进算法
一种基于分辨矩阵的属性约简改进算法吕林霞【摘要】运用粗糙集理论,对基于分辨矩阵的属性约简,提出了一种改进算法.该算法通过对分辨矩阵的简化处理,化简分辨函数,快速求解分辨函数的最小析取范式,从而得到决策表的核和所有约简.该算法简化了分辨函数的求解过程,经实例验证该算法简单、快速、有效.【期刊名称】《兰州工业学院学报》【年(卷),期】2013(020)003【总页数】4页(P18-21)【关键词】分辨矩阵;属性约简;粗糙集;决策系统【作者】吕林霞【作者单位】兰州工业学院软件工程系,甘肃兰州730050【正文语种】中文【中图分类】TP391.10 引言波兰科学家Z·Pawlak教授于1982年提出了一种处理不精确、不确定知识的粗糙集理论[1],它是一种在保持分类能力不变的情况下,通过知识约简,导出问题的决策和分类规则,客观揭示潜在规律的数学工具.经过多年的研究与发展,粗糙集理论已在理论和实际应用上取得了长足的发展,特别是近二十年间,在知识发现等领域得到了成功的应用,受到国际学术界广泛关注.目前正被广泛应用于规则提取、机器学习、决策分析、过程控制、模式识别和数据挖掘等领域[2-5].属性约简是粗糙集理论中的重要研究内容之一.常见的有Z·Pawlak提出的基于正区域的属性约简[1],基于信息熵的属性约简[3],基于分辨矩阵的属性约简[6-10].由于基于分辨矩阵的属性约简定义直观,易于理解,能快速求出核和所有约简,故这种属性约简得到成功应用.基于分辨矩阵的属性约简算法,首先计算分辨矩阵,由分辨矩阵生成分辨函数,求分辨函数的最小析取分量,以此推出决策表的属性约简.但是分辨函数的最小析取分量的计算,常常较为复杂.对此,本文提出了一种改进算法,可以大大简化分辨函数,快速求得最小析取分量.1 粗糙集基本理论1.1 决策表在粗糙集中,信息系统是对知识进行表达和处理的基本工具。
决策表是一类特殊而重要的信息系统,它表示当满足某些条件时,决策(行为、操作、控制)应当如何进行.定义1 S=(U,A,V,f)是一个信息系统,其中U表示对象的非空有限集合,统称为论域;A表示属性的非空有限集合;,其中Va是属性a∈A的值域;f:U×A→V是一个信息函数,它为每个对象的每个属性赋予唯一的信息值,即:对∀u∈U,∀a∈A ,有f(u,a)∈Va.定义2 在信息系统S=(U,A,V,f)中,如果A=C∪D,D={d},且C∩D=∅,子集C和D分别称为条件属性和决策属性,那么信息系统S则称为决策信息系统,简称为决策表,简记为S=(U,A)或S=(U,C∪D).1.2 属性约简基于粗糙集的知识获取,主要是通过对决策表的属性约简.定义3 在决策表S=(U,A)中,对a∈A,如果IND(A-{a})=IND(A),则称属性a在A中是不必要的;否则称属性a在A中是必要的.定义4 在决策表S=(U,A)中,A=C∪D, C∩D=∅,C中所有必要属性组成的集合称为属性集A的核,记作:Core(A).定义5 在决策表S=(U,A)中,P⊆A,如果对每个a∈P在P中都是必要的,则称P 是独立的;否则,称P是相关的.相关属性集中含有冗余属性,而独立属性集去掉任何一个属性,都将破坏决策信息系统的分类能力.定义6 在决策表S=(U,A)中,对于P⊆A, 如果:IND(P)=IND(A),且P是独立的,则称P是A的一个约简.核是所有约简的子集.1.3 基于分辨矩阵的属性约简定义7 在决策表S=(U,C∪D)中,U={u1,u2,…,un}为论域,C={a1,a2,…,am}为条件属性,D={d}为决策属性,C∩D=∅,决策表S的分辨矩阵M(S)=(mij)n×n由下式定义.mij=i,j=1,2,…,n.(1)显然,分辨矩阵是一个对角矩阵,其对角线元素全为∅,所以在分辨矩阵中一般只需考虑其下三角部分.性质1 决策表S=(U,A)中,A=C∪D,C={a1,a2,…,am}为条件属性,D={d}为决策属性,且C∩D=∅,S的分辨矩阵为M(S)=(mij)n×n,则下式成立.Core(A)=∧{mij|mij≠∅且mij=aτ aτ∈C,1≤τ≤m,i=2,…,n,j=1,…,i-1}.(2)定义8 在决策表S=(U,C∪D)中,C={a1,a2,…,am}为条件属性,D={d}为决策属性,且C∩D=∅,M(S)=(mij)n×n为其分辨矩阵,则决策表S的分辨函数由下式定义. f(a1,a2,…,am)=∧{∨a|a∈mij, 其中mij≠∅, i=2,…,n, j=1,…,i-1}.(3)分辨函数的每个析取分量即对应于决策表的一个约简.但是,整理分辨函数,求解分辨函数的最小析取分量常常比较复杂.本文通过对分辨矩阵的简化,简化分辨函数,求解最小析取分量.2 基于分辨矩阵属性约简的改进算法2.1 分辨矩阵的简化根据合取的吸收律,可以得到如下性质.性质2 S是一个决策表,M(S)=(mij)n×n为其分辨矩阵.找出分辨矩阵中属性个数最少的元素,逐一对矩阵的所有其它非空且属性个数等于或多于此项的元素进行检查和简化:如果其中包含此项的所有属性,则将被检查的元素置为空.对简化后的分辨矩阵,再找到属性个数最少的元素,同样处理,直到矩阵中再无包含其它元素所有属性的元素为止,此时得到的矩阵记作M(S)',通过M(S)',可将(3)式简化整理,得到f(a1,a2,…,∨a|a∈,≠∅}.(4)由性质2,可以直接由M(S)'实现分辨函数简化,简化后的分辨函数更便于求解最小析取范式.2.2 算法描述输入:决策表S=(U,C∪D).输出:决策表S的核与所有约简.步骤1:由(1)式计算M(S);步骤2:由(2)式计算Core(A);步骤3:按照性质2,计算M(S)';步骤4:由(4)式生成分辨函数;步骤5:求解分辨函数的最小析取范式,过程如下:① if Core(A)≠∅ then T={Core(A)}, |T|=1 else T=∅,|T|=0;② 取≠∅且∉Core(A).设,at2,…,atk, 其中:at1,at2,…,atk∈C, 1≤k≤m.首先将中每个属性分别组成一个单元素集合,即{at1},{at2},…,{atk},其次将它们与T集合进行分配合并处理:若T≠∅,则将这些单元素集合分别与T集合中的每一元素进行并运算,运算的结果合并组成一T×k个元素的集合;若T=∅,则将这些单元素集合组合成{{at1},{at2},…,{atk}}.再将分配合并处理组合后得到的集合记为T,并将项标记为“已分配”;③ if 存在未标记“已分配”的,满足≠∅且∉Cor e(A) then go to ② else go to ④;④ 设T={T1,T2,…,TS} 其中:Ti={ai1,ai2,…,airi}, ai1,ai2,…,airi∈C,则:f(a1,a2,…,∧Ti},其中s正是约简的个数.步骤6:根据分辨函数的每个析取分量生成所有约简.2.3 实例计算以文[11]中项目评估决策表信息系统为例,记作S=(U,A,V,f).其中,U={u1,u2,…,u8},指8位不同审查(评估)人员(专家);A={a1,a2,…,a6,y}为属性集,C={a1,a2,…,a6}为条件属性,包括质量、成本、进度、风险、环境及综合管理水平等因素;D={y},y是专家根据审查标准对审查对象做出的综合评估结论.属性赋值采用5分制,即最好到最差,取5到0的整数,即V={0,1,2,3,4,5}.信息函数f:U×A→V由决策表给出,如表1所示.表1 决策表Ua1a2a3a4a5a6yu15243323u24533334u34243322u43454323u53454344u6 3243322u74533333u85354344输入:决策表S.步骤1:M(S)计算结果如表2示;表2M(S)u1u2u3u4u5u6u7u8u1u2a1,a2,a3,a6u3a1a2,a3,a6u4a1,a2,a3,a4,a6a1,a 2,a3,a4u5a1,a2,a3,a4,a6a1,a2,a3,a4,a6a6u6a1a1,a2,a3,a6a2,a3,a4a2,a3,a4,a6 u7a2,a3,a6a1,a2,a3,a4,a6a1,a2,a3,a6u8a2,a3,a4,a6a1,a2,a3,a4,a6a1,a2,a6a1, a2,a3,a4,a6a1,a2,a3,a4,a6步骤2:Core(A)={a1,a6};步骤3:M(S)'计算结果如表3所示;表3 M(S)'u1u2u3u4u5u6u7u8u1u2u3a1u4u5a6u6a2,a3 ,a4u7u8步骤4:分辨函数:f(a1,a2,…,a6)=a1∧a6∧(a2∨a3∨a4);步骤5:分辨函数的最小析取范式:f(a1,a2,…,a6)=(a1∧a6∧a2)∨(a1∧a6∧a3)∨(a1∧a6∧a4);步骤6:生成约简:{a1,a2,a6}、{a1,a3,a6}、{a1,a4,a6};输出:核为{a1,a6},约简为{a1,a2,a6}、{a1,a3,a6}、{a1,a4,a6}.计算结果与文[11]中的计算结果一致.3 结语经过案例计算可知,对基于分辨矩阵的属性约简,通过对分辨矩阵的简化处理,简化了分辨函数,可以快速求解分辨函数的最小析取范式,得到决策表的核和所有约简,这大大简化了分辨函数的求解过程.由案例计算可知该算法简单、快速、有效. 参考文献:[1] Z·Pawlak.Rough Sets[J].International Journal of Computer andInformation Science,1982(11):341-356.[2] 王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[J].计算机学报,2009(7):1229-1246.[3] 王国胤.Rough集理论与知识获取[M].西安:西安交通大学出版社,2001.[4] 曾黄麟.粗集理论及其应用[M].重庆:重庆大学出版社,1996.[5] 张文修,吴伟志,梁吉业,等.粗糙集理论与方法[M].北京:科学出版社,2005.[6] 李银花,张继福,梁吉业.基于区分矩阵的属性约简算法[J].山西大学学报,2004(2):135-138.[7] 马翔,张继福,杨海峰.基于区分矩阵的启发式属性约简算法[J].计算机应用,2010(8):1999-2002,2037.[8] 胡彧,李智玲,李春伟.一种基于区分矩阵的属性约简算法[J].计算机工程与应用,2007(9):178-180.[9] 刘文军,谷云东,李洪兴.基于区分矩阵求决策算法的约简[J].北京师范大学学报:自然科学版,2003(6):311-315.[10] 田卫东,周创德,胡学钢.基于简化分辨矩阵的粗糙集属性约简算法[J].计算机科学,2008(3):209-212.[11] 蓝敏.用粗集理论挖掘项目审查(评估)中的专家共识[J].西南交通大学学报,2005(2):85-89.。
基于差别矩阵的属性约简算法及其应用
基于差别矩阵的属性约简算法及其应用
苏志同;李晋宏;林满山
【期刊名称】《计算机工程与应用》
【年(卷),期】2010(046)007
【摘要】铝电解过程中存在着各种相互影响的工艺参数,如何从中选择一部分参数进行分析,对铝电解生产有着重要的意义.提出了一种改进的基于差别矩阵的属性约简算法,避免了普通差别矩阵中的重复元素.用真实的铝电解生产数据对提出的算法进行了验证,效果良好.
【总页数】3页(P221-222,248)
【作者】苏志同;李晋宏;林满山
【作者单位】北方工业大学信息工程学院,北京,100144;北方工业大学信息工程学院,北京,100144;北方工业大学信息工程学院,北京,100144
【正文语种】中文
【中图分类】TP301
【相关文献】
1.一种基于混合差别矩阵的属性约简算法及其在入侵检测中的应用 [J], 邱玉祥;杨明
2.一种改进的基于差别矩阵属性约简算法及其应用 [J], 纪赖恩;李秀娟;许晓东;王湘予
3.基于差别矩阵的启发式属性约简算法及其应用 [J], 李三乐;肖政宏
4.基于差别矩阵的启发式属性约简算法及其应用 [J], 李三乐;肖政宏
5.基于优化可辨识矩阵和改进差别信息树的属性约简算法 [J], 徐怡; 唐静昕
因版权原因,仅展示原文概要,查看原文内容请购买。
一种基于改进差别矩阵的属性约简增量式更新算法
一种基于改进差别矩阵的属性约简增量式更新算法
杨明
【期刊名称】《计算机学报》
【年(卷),期】2007(30)5
【摘要】粗糙集方法提供了一种新的处理不精确、不完全与不相容知识的数学工具.属性约简是粗糙集理论的重要研究内容之一,已有的大多数属性约简算法主要考虑信息系统(或决策表)不变的情况,有关属性约简的增量式更新算法却报道不多.为此,文中提出一种基于改进差别矩阵的属性约简增量式更新算法,主要考虑对象动态增加情况下属性约简的更新问题.该算法可通过快速更新差别矩阵,在动态求解核的基础上,利用原有的属性约简有效地进行属性约简的增量式更新,因而可提高属性约简的更新效率.理论分析表明,该文提出的算法是有效可行的.
【总页数】8页(P815-822)
【作者】杨明
【作者单位】南京师范大学计算机科学系,南京,210097
【正文语种】中文
【中图分类】TP311
【相关文献】
1.基于改进差别矩阵的属性约简增量式更新算法 [J], 龙浩;徐超
2.一种基于改进差别矩阵的核增量式更新算法 [J], 杨明
3.一种改进的基于差别矩阵属性约简算法及其应用 [J], 纪赖恩;李秀娟;许晓东;王
湘予
4.基于改进差别矩阵的核增量式更新算法 [J], 赖桃桃;冯少荣;张东站
5.基于改进差别矩阵的增量式属性约简算法 [J], 冯少荣;张东站
因版权原因,仅展示原文概要,查看原文内容请购买。
基于改进分辨矩阵的属性约简方法
基于改进分辨矩阵的属性约简方法
黄治国;杨晓骥
【期刊名称】《计算机仿真》
【年(卷),期】2014(31)9
【摘要】在分辨矩阵的属性约简算法的研究中,需比较决策系统中各对象生成矩阵元素,导致所得分辨矩阵过于庞大,且造成较大的时间开销.为降低利用分辨矩阵求取属性约简算法的复杂度,依据条件等价类将原决策系统分解为一相容对象集与一非相容对象集,给出条件相对于决策的可辨识关系定义与改进的分辨矩阵定义,将条件相对于决策的可辨识关系变化作为属性约简的判定标准,结果证明改进分辨矩阵的属性约简与保持正域不变的属性约简等价.推理证明与仿真实例说明,改进方法的高效性与完备性.
【总页数】5页(P305-309)
【作者】黄治国;杨晓骥
【作者单位】河南工程学院软件学院,河南郑州451191;武汉市教育科学研究院,湖北武汉430068
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.一种基于分辨矩阵的属性约简改进算法 [J], 吕林霞
2.改进的基于简化二进制分辨矩阵的属性约简方法 [J], 王亚琦;范年柏
3.基于改进的二进制分辨矩阵属性约简算法 [J], 郭洪涛;黄广君;张孝国
4.一种新的基于二进制分辨矩阵的属性约简方法 [J], 陈宸;赵军
5.一种改进的基于二进制可分辨矩阵属性约简算法 [J], 葛浩;杨传健;李龙澍
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ab t a t F ro t i i g t eo t l ra r lt e o t s r c o b a n n h p i ea i p i l e u to ft ed cso - a i g t b e n i r v d r d c in ma o v ma d c in o h e ii n m k n a l ,a r mp o e e u t o
价 决策 规则 。基 于差 别 矩 阵属 性 约 简算 法 能 够 容
易 地计算 出知识 系统 的核 和 知识 系 统 的约 简 , 计 但
算 结果并 不 唯 一 , 了得 到 更 好 的约 简 结 果 , 过 为 通 研究 已经实 际应 用 的 约简 算 法 _ , 出 了一种 改 3 提 ]
a g r h i r s n e n t e p p r Fi ty h o e r d c in s t i c l u a e y t e r d c i n ag rt m a e n d s l o i m s p e e t d i h a e . r l ,t e wh l e u t e s a c l t d b h e u t l o i t s o o h b sdo e—
进 的基 于 S o o k wrn差 别 矩 阵_ 的 约简算 法 。 5 ]
复杂 系 统 的 评 价 方 法 中_ 。该 方 法 首 先 找 出所 1 卅] 有 对 系统性 能 有 影 响 的 因素 , 其 进 行 分 类 ; 用 对 利 粗糙 集 的方 法 滤 除有 噪音 的 、 含 不 确定 因素 的数 包
c n ii n n y t m.Th x e i e t i u ta e h l o i m s e f c ie o dt ig s se o ee p r m n l s r t s t e ag rt l h i fe tv .
Ke o d d s e n b l y ma rx r d b l y o h e u t n,i o t n e o h t r u e yW rs ic r iii t i ,c e i i t ft e r d c i t i o mp r a c f t e a t i t s b
i o t n eo h trb t s wh c e a i et h o e n su e h e ii n t b eo h n r y s v n fc n r l i- mp r a c ft e a t i u e ih r l t O t e c r ,a d i i s d i t e d cso a l ft ee e g a ig o e t a r v t n a
J L i n L uu n XuXi d n W a gXin y i a’ i ja c Xi a og o n agu
( l g fElc rc l g n e i g Co l e o e tia e En i e rn ,H e a i e st fTe h oo y n n Un v r i o c n l g ,Z e g h u 4 0 0 ) y h n z o 5 0 7
中图分类号 T 1 P8
An I p o e t i ut e uc i n Al o ihm m r v d At r b e R d to g r t
Bas d o i c r n D s e ni iiy M t i n t plc to
Cls m b r TP1 a s Nu e 8
1 引 言
对复 杂系 统 进 行 评 价 一 般 依 靠 专 家 经 验 进 行
评测 , 由于受 主观 因素 、 知识 和 经 验 的 限制 , 价 结 评 果存 在不 确定 性 。粗 糙 集 理 论 与方 法 能 够 有 效 地 处理 复杂 系统 中 的数据 和信 息 , 因此 被广 泛 应 用 在
总 第 2 8期 4
计 算 机 与 数 字 工 程
C mp tr& Dii l gn eig o ue gt a En ie r n
Vo. 8No 6 13 .
1 3
21 第 6 0 0年 期
一
种 改进 的 基 于 差 别 矩 阵属 性 约 简 算 法 及 其 应 用
纪赖恩 李 秀娟 许晓东 王 湘 予
c r i i t ti .S c n l e n b l y ma rx e o d y,t e r d c i n d cso a l o u e y t e d f i o ft ec e i i t fr d c i n a d t e i h e u t e ii n t b e i c mp t d b h e i t n o h r d b l y o e u t n h o s n i i o
400 ) 50 7 ( 河南 工 业 大 学 电气 工 程 学 院 郑州
摘
要
为 得 到 决 策 表 的一 个 最 优 约 简 或 相 对 最 优 约 简 , 出 了一 种 改 进 的 约 简 算 法 , 利 用 差 别 矩 阵 约 简 算 法 得 出 提 先
约 简 全 集 , 后 通 过 定 义 约 简 的 可 信 度 、 对 于 核 的 属 性 重 要 度 , 算 出 决 策 表 的 约 简 , 在 中 央 空 调 系 统 节 能 决 策 表 中应 然 相 计 并 用 , 果 表 明 了该 算 法 的有 效 性 。 结 关 键 词 差 别 矩 阵 ;约 简 的 可 信 度 ; 性 重 要 度 属