基于网格近邻优化的密度峰值聚类算法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于网格近邻优化的密度峰值聚类算法
刘继;杨金瑞
【期刊名称】《计算机应用研究》
【年(卷),期】2024(41)4
【摘要】密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。
为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG-DPC算法)。
首先对数据空间进行网格化,减少了样本数据点之间距离的计算量;在计算局部密度时不仅考虑了网格自身的密度值,而且考虑了周围k 个近邻的网格密度值,降低了主观选择截断距离对聚类结果的影响,提高了聚类准确率,设定网格密度阈值,保证了聚类结果的稳定性。
通过实验结果表明,KG-DPC算法比DBSCAN、DPC和SDPC算法在聚类准确率上有很大提升,在聚类平均消耗时间上DPC、SNN-DPC和DPC-NN算法分别降低38%、44%和44%。
在保证基本聚类准确率的基础上,KG-DPC算法在聚类效率上有特定优势。
【总页数】6页(P1058-1063)
【作者】刘继;杨金瑞
【作者单位】新疆财经大学统计与数据科学学院;新疆财经大学新疆社会经济统计与大数据应用研究中心
【正文语种】中文
【中图分类】TP311.13
【相关文献】
1.基于网格的快速搜寻密度峰值的聚类算法优化研究
2.基于密度峰值和近邻优化的聚类算法
3.自然反向最近邻优化的密度峰值聚类算法
4.基于K近邻和优化分配策略的密度峰值聚类算法
5.基于双重密度和簇间近邻度的密度峰值聚类算法
因版权原因,仅展示原文概要,查看原文内容请购买。