大规模数据集聚类的K邻近均匀抽样数据预处理算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大规模数据集聚类的K邻近均匀抽样数据预处理算法
吉成恒;雷咏梅
【期刊名称】《上海大学学报(自然科学版)》
【年(卷),期】2016(022)001
【摘要】为解决基于密度的聚类算法处理大规模数据集效率低和存储开销大的问题,提出一种分片的基于K邻近关系的空间均匀抽样算法作为聚类应用的数据预处理过程,将数据集分片,按密度降序方式去除数据集中部分样本的K邻居,将剩余样本作为抽样样本,在保证精度的同时,可以降低数据规模,提升计算效率.实验结果表明,在数据规模较大且保证聚类结果准确性的前提下,通过降低聚类数据规模,可以有效提升聚类效率.
【总页数】8页(P28-35)
【作者】吉成恒;雷咏梅
【作者单位】上海大学计算机工程与科学学院,上海200444;上海大学计算机工程与科学学院,上海200444
【正文语种】中文
【中图分类】TP391
【相关文献】
1.大规模数据集下基于DBSCAN算法的增量并行化快速聚类 [J], 王兴;吴艺;蒋新华;廖律超
2.适合大规模数据集的增量式模糊聚类算法 [J], 李滔;王士同
3.大规模数据集聚类算法的研究进展 [J], 何玉林;黄哲学
4.大规模数据集谱聚类并行优化算法 [J], 郝笑弘;尹青山
5.大规模数据集聚类算法的研究进展分析 [J], 邢春燕
因版权原因,仅展示原文概要,查看原文内容请购买。

相关文档
最新文档