子空间聚类改进算法研究综述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
grh C I U l rh a, i spat ai n i f i c ,g a yf it e ed vlp et f u — oi m, LQ Ea o tm hs wt i rcc t adhg e ie y r t cla dt eeom n o b t gi ht i y l h fc n e l a it h s
1 引言
所谓 聚类 , 是将一个 数据集 中的数 据进行分 组 , 就 使得
每 一 组 内 的数பைடு நூலகம்据 尽 可 能 相 似 而不 同组 内的 数 据 尽 可 能 不 同 。
S A 等 。由于高维数据 的稀疏 性 、 CN 空空 间现象 以及 维度 效应的影响 , 在高维数据空间 中使用传统算法会 遇到 以下 问
第2卷 第5 7 期
文 章 编号 :0 6—94 ( 00)5—07 0 10 3821 0 14— 4
计
算
机
仿
真
20 月 0 年5 1
子 空 间聚 类 改进 算 法研 究 综 述
李 霞 , 徐树 维
( .同济大学建筑 与城市规划学院 , 1 上海 2 0 9 2 00 2;.河南大学计算 中心, 河南 开封 4 50 ) 7 0 1 摘要 : 高维数据聚类是 聚类技术 的难点和重点 , 子空问聚类是实现高维数据集 聚类 的有效途径。C IU LQ E算法是最早提 出的
dt n,t i p p ras i u s s t e d v l p n e d o u s a e cu tr g ag r h io i h s a e o d s s e h e eo me tt n f b p c lse n l o t m. l c r s i i KEYW ORDS:Daa mi i g l se n t nn ;C u tr g;Hih d me s n aa es u s a e i g i n i a d t s t ;S b p c ol
题 : 随着维数增长 , ① 聚类 的时 间和空 间复杂度 迅速上 升从 而导致算法的性能下降 ; ②高维数据集 中存在大 量无 关的属 性, 并且在这些不相关 的维上 十分稀 疏 , 这就使 得在所有 维 中存在簇的可能性 几乎 为零 , 所以传统 的聚类算 法不适合对
des h m tin f LQ Ea o tm adte f ei poe ee c nyadacrc r ls r g ?I d rs tel i t s I U l rh n r o rvdt f i c cuayf ut i . na— i ao o C gi h er m h i e n oc en
saec s r ga o tm ?T ipp r n ye et teavn gs n m ti s f LQ E a o tm ad pc l t i l rh . hs ae?aa zsi d p d at e dl i tn I U grh n u e n gi l n hh a a i ao o C l i
中 图分 类 号 :P 1 T 31 文 献标 识 码 : A
S m m a y o ub p c u t rn g rt m s u r fS s a e Cl se i g Alo ih
Ree rhBae n C I E sac sdo L QU
L a I XU h IXi I . S u—we l
ito u e e e a u s a e cu trn g r h ? p t owa d i e e ty aswh c a e al e n u d t d t ? a — n r d c ss v r ls b p c l s i g a o t ms e l i u r r n rc n e r i h h v l b e ? p ae f o d
基 于密度和 网格的子空间聚类算法 , 自动子空 间聚类算法的实用性和高效性 , 带来 了子空间聚类算法的空前 发展。深入分
析 C IU LQ E算法 的优点和局限性 ; 介绍 了一些近几年提 出的子空间聚类算法 , 并针对 C I U LQ E算法 的局 限性作 了改进 , 聚类 的效率和精确性得 到了提高 ; 最后对子空间聚类算法的发展趋势进行 了讨论。 关键词 : 数据挖掘; 聚类 ; 高位数据集 ; 子空 间
ABS RACT: h lse i g o ih d me so a aa i ak y p o lm n cu tr g meh d .S b p c lse n s T T e cu tr fh g i n in l t e r b e i l s i to s u s a e cu t r g i n d s en i a f cie a p o c e iec u t r g i ih d me so a a a sa p o e rd n i d g i a e l s r ga ・ n ef t p r a h t r a z l se n h g i n i n l t .A in e e st a r b s d cu t i e v o l i n d yn d en l
( .C l g f rh etr n ra l nn , og nvr t,Sag a2 0 9 ,C ia 1 ol eo A ci c eadUb nPa i T njU i sy hnhi 00 2 hn ; e t u n g i ei
2 o p t et , e a nvr t,K i n e a 70 1 C ia .C m ue C ne H n nU i sy a egH nn4 50 , h ) r r ei f n