基于逐级均值聚类的信息熵的离散化算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
刘 静 罗 卫敏 刘 井 波 , ,
( 重庆三峡 学院 a 实验 中心 ; . 学与计 算机科 学学 院,重庆 4 4 0 . b数 0 10) 摘 要 : 目前 基于 R u h集 的 离散 化算 法很 难做到 高效 率和 高识 别率兼顾 , 对粗糙 集给 出了基 于逐 级均值 聚 og 针
I f r t n e to y d s r t a i n a g rt m a e n r n i g me n l se i g n o ma i n r p ic e i to l o i o z h b s d o a k n a s cu t rn
L U i g .L e. n .L U Jn - o I Jn 。 UO W i mi I i g b
l e . F n ly,smua in e p rme trs lss w h tt e meho a o rtmec mplxt h n ta to l to . u s i al i lto x e i n e ut ho ta h t d h slwe i o e i t a rdi na meh ds y i Ke y wor ds: r u h s t o g e ;dic eiain;c ni u u trbue v l s;r n i g me n l se n s r tzto o tn o sa t i t aue a k n a sc u tr g;i o main e to y i f n r to nr p
的选择 , 易造成局 部最优 解等不 足 ; 容 同时该算 法要取 得 Nhomakorabea0 引言
信息熵是一个数学上颇 为抽象 的概念 , 以把信息熵理解 可 成某种特定信息的出现概率 。对 于信 息系统来说信 息熵是信 息系统有序化程度 的一个度量 。一个信息系统越是有序 , 信息 熵就越低 ; 反之 , 个信 息 系统越 是 混乱 , 息熵 就 越 高… 。 一 信 基于信息熵 的离散化算法的主要思想 是通过计算 每个断点 的
Absr c : T e e tds ee a g rt ms ae v r ifc tt c i v g f ce c n ih r c g iin r t fb t Th s ta t her c n icrt lo h r ey dfiul o a h e e hih e i n y a d hg e o n t ae o oh. i i o i pa rprpo e n ifr ain e to y d s rtz to l o i m sd o a kig me nscu t rn pe o s d a n om to n rp ic eia in ag rt ba e n r n n a l se ig.Fisl h rty,u e a kig me ns sdrn n a
关键 词 :粗糙 集 ;离散 化 ;连续值 属性 ;逐级均值 聚类 ; 息熵 信
中图分 类号 :T 1 ; P 0 . P8 T 316
文献标志 码 :A
文章 编号 :1 0 — 6 5 2 1 ) 9 3 6 —4 0 13 9 ( 0 0 0 —3 8 0
di1 .9 9 ji n 10 —6 5 2 1 .9 0 4 o:0 3 6 /.s .0 13 9 .0 0 0 .4 s
第2 7卷 第 9期
21 0 0年 9月
计 算 机 应 用 研 究
Ap l ai n R s a c fCo u e s p i t e e r h o mp t r c o
Vo . 7 No 9 12 . Sp 2 0 e . 01
基 于 逐 级 均 值 聚 类 的信 息 熵 的 离 散 化 算 法
cu tr g me h d fra ay ig i fr t n e t p au f a h c n i ae c t ,a d g n rt d a n w c n i aec t s t e l s i t o n lzn o mai nr y v le o c a dd t u s n e e ae e a dd t us e .S - en o n o o e c n l ,u e no mai n e t p t o rc mp eig t e s lci n o u sfrt e d s r t ain o o t u u t b t sv - o dy s d if r t nr y me h d f o lt h ee t fc t h i ei t fc n i o sat u e a o o o n o o c z o n i r
类 的信 息熵 的离散 化 算法。首先使 用改进 的逐级均值 聚类 算 法分别 对单 个属 性 的候 选断 点按其 信 息熵值 进行 聚类分析 , 生成 新的规模 更 小的候 选 断点集 , 然后 用基 于信 息熵 的 离散 化 算法 完成 断点 的 选取并 对连 续值 属性 进行 离散化 。 实验 结果表 明, 该方 法在识别 率相 当的情况 下比传统 的 离散 化 方法的 时间代 价更低 。
( . xe m na et , . ol efMahm ts& C m u r c ne hn q gT r ogsU i rt,C og ig4 40 C ia a Epr etl ne b Clg i C r e o te ai c o p t i c,C ogi he G re nv sy hnqn 0 10, hn ) eS e n e ei
相关文档
最新文档