一种基于粗糙集启发式的特征选择算法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定义 2 ( [ 可辨识矩阵) 可辨识矩阵由华沙大学数学家
关键词 特征 选择 , 粗糙集理论 , 启发式算法 , 不确定性 系数 , 互信息
A v lFe t r e e to H e itc Al o ih s d n u h e No e a u eS lc in urs i g r t m Ba e o Ro g S tThe r oy
1
I
’I置
l 古
行 的。
.
特征选择 (g 属性 约简 ) t称 是数 据挖 掘 中的基 本 问题 之
一
2 粗糙 集理 论
粗 糙集理论从集合 的视角对 知识进行 定义 , 把知 识看 作
是 关于论域的划分 , 而对知识进 行分析和处理 。 从 定 义 1 ] 信息 系统 L一( A, F) [ 5 U, V, 。其 中 U= { 1 z,
。
通过对样本数据进行 特征选择 , 以去掉 不相关 的和冗 可
余的特征 , 使机器学 习过程 复杂度 和时间 降低 。特征选 择是 根据某种标准 , 通过选择相关特征和丢弃不相关 、 冗余特征来
形成一个优化 特征 子集 的处 理过 程[ 。特征选 择也是一个搜 1 ] 索和ห้องสมุดไป่ตู้价 的过程 。特征选择 能为特定 的应用 在不失去数据原
维普资讯
计算机科学 20 Vo. 4 o 6 0 7 13 N.
一
种 基 于粗 糙 集启 发 式 的特 征 选 择 算 法
梁 琰 何 中市 ( 重庆大 学计 算机 学 院 重庆 4 0 4 ) 0 0 4
摘
要
本文基于粗糙集 中关于非精确集和精确 集理论 思想 , 出了一个新 的特征度 量指标 , 提 即相对 互信 息 比 R , MI
ag rt e td O h lo i m S h i tse n t eUCId ts t ,e p rme tr s lss o t a aa es x e i n eu t h W h tM M1UC e sbea dc nfn o dfa u e _ i f il n a id ag o e tr Sa
由此 , 设计 了一种基 于粗糙 集的启发 式特征 选择 算法 MR - 。首先利 用可辨识 矩阵 , 算出条件 属性相 对于决 策 MIUC 计 属性的核 , 以核形成 当前候 选特征 子集作 为基 准点 , 以最 大化 相对 互信 息和 不确 定性 系数 为原则 , 筛选剩余 特征 。通
过 对比实验 , 结果表 明, 文提 出的算法在 多数情况 下能够得到较优 的特征 子集, 本 算法是有效 的, 实可行的。 切
z , , 是论域 , 是属性 集合 , … z } A A—RUD, 是条件 属性 R 集 , 是决 策属性 集 , 是属性 值集 合 , D F是 U×A— 的 映
射。
有价值 的基础 上选择最 小 的属 性子集 , 除不相 关和冗余 的 去
属性 ; 它提 高了数据 的质 量 , 加快 了数据挖掘 的速度 。特征选
LI ANG n H E Z o g S i Ya h n - h
( l g fC mpue ce c Col eo e o trS in e,Ch g ig Unv r iy,Ch ng i g4 0 4 on qn ie st o qn 0 0 4)
Ab ta t I hsp p r e fa u eme s rme tRM I( t fM uu l no main i rsn e a e nt ec n src nt i a e .an w et r a u e n Rai o t a f r t )Sp e e td b sdo h o — o I o cp fr u hs tt e r b u e ti e n n eti e.Th n an v lh u it lo i m ,MRM I e to o g e h o ya o tc ran sta d u cran s t e o e e rsi ag rt c h _ UC ( g rt m Alo i h b sd o a i l t fRM Ia d Un e tit o fiin ) Sp o o e rF t r ee t nb s dO o g e h — ae nM xma i o Ra o n c ran yC ef e t .i r p sdf e u eS lci a e nr u hs tte c o a o o y Fr t r . isl h r So tie y ds enbe marx a d fr d a a dd t e tr u st W i h trig y,t eC e i b an d b ic r il ti n c me sa c n iae f u e s b e. o ) a t t e satn h o n fC e h etfau e r i ee tr t l O ma i z h RM Ia d Un e tit efce t Fn l h p ito r .ter s e t r sa ef trd ieaiey t xmieb t o l v o n c ran yC fiin. ial t e o y
s b e n mo tc s s u s ti s a e .
Kewo d F t r eeto y rs a e u e slcin,Ro g e h o y,He rsi lo ih ,Un etit o fiin ,M u u lif r to u h s tt e r u itcag rtm cran yc ef e t c t a no main