K-means算法初始聚类中心选择的优化
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t e r i n g p e r f o r ma n c e , g e t s t a b l e c l u s t e r i n g i n a h i g h e r a c c u r a c y . Ke y wo r d s : K- me a n s a l g o r i t h m; c l u s t e r i n g ; i n i t i a l c l u s t e r i n g c e n t e r s ; T DKM a l g o r i t h m
文 献标 志码 : A 中图 分类号 : T P 1 8 1 d o i : 1 0 . 3 7 7 8  ̄ . i s s n . 1 0 0 2 — 8 3 3 1 . 1 1 1 1 — 0 2 8 9
a n d Ap p l i c a t i o n s , 2 0 1 3 , 4 9 ( 1 4 ) : 1 8 2 — 1 8 5 .
Abs t r a c t :T o s o l v e t h i s p r o b l e ms t h a t t h e t r a d i t i o n a l K- me a n s a l g o r i t h m h a s s e n s i t i v i t y t o t h e i n i t i a l c l u s t e r c e n t e r s . a n e w i mp r o v e d K- me a ns a l g o r i t h m i s p r o p os e d . Th e a l g o r i t h m b u i l d s mi n i mu m s p a n n i n g t r e e a n d t h e n s p l i t s i t t o g e t K i n i t i a l c l u s t e r s a n d t h e r e l e v a n t i n i t i a l c l u s t e r c e n t e r s . Th e i n i t i a l c l us t e r c e n t e r s a r e ou f n d t o b e v e r y c l o s e d t o t h e d e s i r e d c l u s t e r c e n t e r s f o r i t e r a t i v e c l u s t e r i n g a l g o r i t h ms . Th e o y r a n a l y s i s a n d e x p e r i me n t a l r e s u l t s d e mo n s t r a t e t h a t t he i mp r o v e d a l g o r i t h ms c a n e n h a n c e t h e c l u s ・
C o m p u t e r E n g i n e e r i n g a n d A p p l i c a t i o n s 计算 机工 程与应 用
K- me a n s 算 法 初始 聚 类 中 心选 择 的优 化
冯 波 , 郝文宁, 陈 刚 , 占栋 辉
F ENG Bo , HAO We n n i n g , CHE N Ga n g , ZHAN Do n g h u i
解 放军 理工 大学 工 程兵 工程 学院 , 南京 2 1 0 0 0 7
E n g i n e e r i n g I n s t i t u t e o f Co r p s o f E n g i n e e r s , P L A Un i v e r s i t y o f S c i e n c e& T e c h n o l o g y , Na n j i n g 2 1 0 0 0 7 . C h i n a
FENG Bo ,HAO We n n i n g ,CHEN Ga n g , e t a 1 .Op t i mi z a t i o n t o K- me a n s i n i t i a l c l us t e r c e n t e r s .Co mp u t e r En g i n e e r i n g
摘
要: 针对 传统 K - me a n s 算法对 初始 聚类 中心敏 感 的 问题 , 提 出 了基 于数据样 本 分布 情况 的动态选取 初 始聚 类 中心的 改
进K . m e a n s 算法 。该 算法根据 数据 点 的距 离构造 最 小生成树 , 并对 最 小生成树 进行 剪枝得 到 个 初始数 据 集合 , 得 到初始 的 聚 类 中 心 。 由 此 得 到 的初 始 聚 类 中 心 非 常 地 接 近 迭 代 聚类 算 法 收 敛 的 聚 类 中 心 。理 论 分析 与 实验 表 明 , 改进 的 K - me a n s 算法能改善 算法的聚类性 能, 减少聚类 的迭代 次数 , 提 高效率 , 并 能得 到稳定的聚类 结果 , 取得较 高的分类准确率 。 关键 词 : K — me a n s 算 法; 聚类 ; 初 始聚 类 中心; T D K M 算 法
文 献标 志码 : A 中图 分类号 : T P 1 8 1 d o i : 1 0 . 3 7 7 8  ̄ . i s s n . 1 0 0 2 — 8 3 3 1 . 1 1 1 1 — 0 2 8 9
a n d Ap p l i c a t i o n s , 2 0 1 3 , 4 9 ( 1 4 ) : 1 8 2 — 1 8 5 .
Abs t r a c t :T o s o l v e t h i s p r o b l e ms t h a t t h e t r a d i t i o n a l K- me a n s a l g o r i t h m h a s s e n s i t i v i t y t o t h e i n i t i a l c l u s t e r c e n t e r s . a n e w i mp r o v e d K- me a ns a l g o r i t h m i s p r o p os e d . Th e a l g o r i t h m b u i l d s mi n i mu m s p a n n i n g t r e e a n d t h e n s p l i t s i t t o g e t K i n i t i a l c l u s t e r s a n d t h e r e l e v a n t i n i t i a l c l u s t e r c e n t e r s . Th e i n i t i a l c l us t e r c e n t e r s a r e ou f n d t o b e v e r y c l o s e d t o t h e d e s i r e d c l u s t e r c e n t e r s f o r i t e r a t i v e c l u s t e r i n g a l g o r i t h ms . Th e o y r a n a l y s i s a n d e x p e r i me n t a l r e s u l t s d e mo n s t r a t e t h a t t he i mp r o v e d a l g o r i t h ms c a n e n h a n c e t h e c l u s ・
C o m p u t e r E n g i n e e r i n g a n d A p p l i c a t i o n s 计算 机工 程与应 用
K- me a n s 算 法 初始 聚 类 中 心选 择 的优 化
冯 波 , 郝文宁, 陈 刚 , 占栋 辉
F ENG Bo , HAO We n n i n g , CHE N Ga n g , ZHAN Do n g h u i
解 放军 理工 大学 工 程兵 工程 学院 , 南京 2 1 0 0 0 7
E n g i n e e r i n g I n s t i t u t e o f Co r p s o f E n g i n e e r s , P L A Un i v e r s i t y o f S c i e n c e& T e c h n o l o g y , Na n j i n g 2 1 0 0 0 7 . C h i n a
FENG Bo ,HAO We n n i n g ,CHEN Ga n g , e t a 1 .Op t i mi z a t i o n t o K- me a n s i n i t i a l c l us t e r c e n t e r s .Co mp u t e r En g i n e e r i n g
摘
要: 针对 传统 K - me a n s 算法对 初始 聚类 中心敏 感 的 问题 , 提 出 了基 于数据样 本 分布 情况 的动态选取 初 始聚 类 中心的 改
进K . m e a n s 算法 。该 算法根据 数据 点 的距 离构造 最 小生成树 , 并对 最 小生成树 进行 剪枝得 到 个 初始数 据 集合 , 得 到初始 的 聚 类 中 心 。 由 此 得 到 的初 始 聚 类 中 心 非 常 地 接 近 迭 代 聚类 算 法 收 敛 的 聚 类 中 心 。理 论 分析 与 实验 表 明 , 改进 的 K - me a n s 算法能改善 算法的聚类性 能, 减少聚类 的迭代 次数 , 提 高效率 , 并 能得 到稳定的聚类 结果 , 取得较 高的分类准确率 。 关键 词 : K — me a n s 算 法; 聚类 ; 初 始聚 类 中心; T D K M 算 法