基于特征辨别能力和二进制可辨矩阵的特征选择
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( hn d ntu o p t A pi tn C i s A a e yo  ̄i csC eg u60 4 ,w u n C ia C eg uIsi to m u r p lai , hn e cdm f e e,hn d 10 1 S h a ,hn ) te fC e c o e n (h rd aeSho teC iee cdm Si cs& T eGau t col ^ hns Aa e yo c ne, f o f e
第2 7卷 第 1 0期
21 0 0年 l 月 0
计 算机 应 用与软件
Co u e p iai n n ot r mp t rAp l t sa d S fwa e c o
Vo. 7 No 1 12 . 0
Oc. 2 0 t 01
基 于特 征 辨别 能 力和 二 进 制 可 辨矩 阵 的特 征 选 择
FEATURE ELECTI S oN BAS ED oN FEATURE S NGUI H ABⅡ TY DI TI S I
AND NARY SCERNI LI BI DI BI TY ATRI M X
ຫໍສະໝຸດ Baidu
Z u Ha d n Zh u S u h o og o h
Z n n ho g Yo g 10 3 , hn ) 0 0 9 C ia
朱颢东 周 姝 钟 勇
( 中国科学院成都计算机应用研究所 四川 成都 6 041 10 )
( 中国科学院研究生院 北 京 10 3 ) 0 0 9
摘 要
为 了提 高分 类算法 的运行速度 , 降低 占用 的内存 空间, 必须使用特征选择算法。首先分 析 了几种 经典特征选择方法并总
结 了它们的不足 , 然后提 出了特征 辨别 能力 的概念 , 紧接着把粗糙集 引进来并 给 出了一个基 于二进制可辨 矩阵的属性约简算法 , 最 后把该属性约简算法同所提特征辨别能力结合起来 , 出了一个综合的特征选择 方法。该方法首先利用 所提特征辨别 能力进 行特 给 征初选 以过滤掉一些词条 , 然后利用所提属性约简算法消除冗余。实验结果表明此种特征选择 方法效果 良好。 关键词 文本 分类 特 征选择 特征 辨别 能力 二进制可辨矩阵
Ab t a t s r c
I r e n a c h p r t g s e d o ot g ag r h a d t e u e t e me r p c c u id,e t r ee t n a g ・ n o d rt e h n e t e o e ai p e fs r n l o t m n o r d c h moy s a e o c p e f au e s lci lo o n i i o
rtm s b s d I h a e , e f sl ay e o pe o ls i e t r e e t n meh d n a e a s mmaiai n o h i d f in i h mu t e u e . n t e p p r w rt a l z d a c u l f a scf au e s lc i t o s a d g v u i yn c o r t n t er e ce — s o i c e , n h n p e e td te c n e to au e d sig i a i t . x , n r d c d te r u h s t a d p o ie n at b t r d cin ag — i s a d t e r s ne h o c p f e t r i n u s bl y Ne t we i t u e h o g es n r vd d a t u e e u t o f t h i o i r o l r h b s d o i a y d s en b l y mar . ial , o i e h t b t e u t n ag r h w t h e t r it g ih b l y a d p o i m a e n b n r ic r i i t t x F n l we c mb n d te at u e r d c i oi m i t e fa u e d s n u s a i t n r— t i i y i r o l t h i i p s d a c mp e e sv e t r ee t n me h d T i to rtu e h e t r i i g ih bl y me t n d a o e t r l n r y s lc o e o r h n ie f au e s l ci t o . h s meh d f s s s t e f au e d s n us a i t n i e b v o p e i a i ee t o i t i o mi l t e fa u e o l r g o ts me tr , n e mp o st e at b t e u t n ag r h t l n t h e u d n y E p r na e u t h e t r sfrf ti u o e ms a d t n e ly h t u e r d c i o t m o ei ae t e r d n a c . x e i i en h i r o l i mi me tlr s l s s o h t I sf au e s lc in meh d h sp miig ef c . h w t a l e t r e e t to a r sn f t ti o o e Ke wo d y rs T x ae o z t n F au e s lci n F au e d si g ih bl y B n r ic r i i t t x e t tg r ai e t r ee t e tr i n s a i t i a ds e b l y mar c i o o t u i y n i i