一种基于改进人工蜂群的K-means聚类算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键词:聚类;人工蜂群算法;K-means算法;适应度函数;位置更新公式;WEKA平台 DOI:10.3969/j.issn.1002-2279.2016.02.013 中图分类号:TP301.6 文献标识码:A 文章编号:1002-2279(2016)02-0047-04
AK-meansClusteringAlgorithm BasedonImproved ArtificialBeeColo的 选 择 进 行 了 研 究,文 献 [2]中 作 者 提出一种通过计算每个数据对象的密度,从中选取 k个高密度分布的点作为初始聚类中心,有效提高 了 K-means聚 类 算 法 的 准 确 率 和 稳 定 性。文 献 [3]运用 最 大 最 小 距 离 法 选 择 初 始 聚 类 中 心,将 原 始数据集分割成各个小类,然后用合并算法形成最 终类,聚类性能也优于 K-means算法。文献[4]作 者在基于密度概念的基础上,采用最大距离积法选 取初始聚类中心,使得改进的 K-means算法有更
2 相关算法介绍
第 2期
2016年 4月
微 处 理 机
MICROPROCESSORS
No.2 Apr.,2016
一种基于改进人工蜂群的 K-means聚类算法
刘川川,丁海军
(河海大学物联网工程学院,常州 213022)
摘 要:针对 K-means算法对初始的聚类中心选择敏感,全局搜索能力较差,聚类精度低以 及稳定性不高,算法的鲁棒性较差等缺点,提出了一种基于改进的人工蜂群算法来对 K-means聚 类算法进行优化。算法构造了新的适应度函数,改进了食物源的位置更新公式来提高迭代效率。 利用改进的人工蜂群算法良好的全局寻优能力,搜索速度快等优点,再加上 K-means收敛速度快 的优点,二者结合来提高算法的鲁棒性。将改进后的算法嵌入到 WEKA这一数据挖掘平台中,充 分利用了开源 WEKA中的类和可视化功能,与 WEKA中已有的聚类算法对比分析,可以获得更好 的聚类结果。
作者简介:刘川川(1989-),男,河南省洛阳市人,硕士研究生,主研方向:数据挖掘,智能数据处理。 收稿日期:2015-05-25
·48·
微 处 理 机
2016年
高的准确率和准度,并且稳定性也有一定提高。文 献[5]提出的算法中 K的个数不需要预先给定就可 以完成聚类。
人工蜂群智能算法(ABC)是 Karabog受到蜜蜂 启发提出的一种基于蜜蜂群体采蜜行为的群体智能 算法。人工蜂群算法具有搜索速度快、全局寻优能 力强、适用领域广泛等优点。但是人工蜂群算法存 在迭代后期收敛速度较慢,容易陷入局部最优等问 题。文献[6]通 过 引 入 了 人 工 蜂 群 的 粒 子 算 法,利 用人工蜂群的全局搜索能力和粒子群的局部搜索能 力,使得优化后的算法收敛速度较快,跳出局部最优 能力也比较强。文献[7]通过引入反向学习的初始 化,提高了求解效率和质量。
LiuChuanchuan,DingHaijun
(CollegeofInternetofThingsEngineering,HohaiUniversity,Changzhou213022,China)
Abstract:AstheK-meansclusteringmethodhasdisadvantagesofsensitivetotheinitialclustering centers,poorglobalsearchability,lowaccuracyandstabilityandpoorrobustnessofalgorithm,basedon animprovedArtificialBeeColonyalgorithm,thispaperproposesanalgorithm tooptimizetheK-means clusteringalgorithm.Itwillconstructanewfitnessfunctionandimprovethefoodsourcelocationupdate formulatoenhancetheefficiencyofiteration.Theadvantagesofgoodglobaloptimizationability,fast searchandconvergenceratearecombinedtoimprovetherobustnessofthealgorithm.Theimproved algorithmisembeddedintheWEKA platform,comparedwiththeexistingclusteringalgorithmsinthe WEKA,thebetterclusteringresultscanbeobtained.
Keywords:Clustering;ArtificialBeeColony;K-meansalgorithm;Fitnessfunction;Positionupdate rule;WEKAplatform
1 引 言
聚类分析是一种无监督的学习,它不需要数据 集的先验知识,在图像识别、机器学习等领域有广泛 的应用,是 数 据 挖 掘 领 域 中 的 一 个 重 要 研 究 方 向。 聚类算法就是将数据对象划分为不同的多个簇,同 一个簇中的对象尽可能相似,不同簇中的对象尽可 能相异。K-means算法是目前使用广泛的一种基 于划分的聚类算法[1],该算法对初始聚类中心点的 选择较为敏感,选择不同的初始聚类中心点,对聚类
基于 K-means和 ABC算法的各自优缺点,首 先对传统的人工蜂群算法进行了改进,提出了改进 的人工 蜂 群 算 法 (ImprovedABC,IABC),修 改 了 食 物源的搜索公式,并在迭代过程中使用新的适应度 函数公式来加快算法的收敛速度,并将改进后的人 工蜂群算法与 K-means聚类算法相结合,具有良 好的聚类效果。
相关文档
最新文档