常见的划分式聚类算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

常见的划分式聚类算法
常见的划分式聚类算法有k-means算法、CLARA算法和k-medoids 算法。

首先,k-means算法是一种常用的划分式聚类算法。

该算法的基本思想是随机选取k个中心点,将数据集中的点按照离它们最近的中心点进行分类,再计算每个簇的新中心,重复以上步骤直到簇的中心不再变化或者达到预设的迭代次数。

该算法的优点在于它的速度快且容易实现,而缺点是它对k值的选择要求比较高,且对于数据集中有噪声和离群点的情况表现不佳。

其次,CLARA算法是一种改进了k-means算法的方法。

该算法是在多次随机抽样的基础上运行k-means算法,以避免出现单次随机抽样得到的聚类结果的不确定性。

该算法的优点在于它对于噪声点的容忍性更高,缺点是它的时间复杂度比较高。

最后,k-medoids算法是一种基于中心点的划分式聚类算法。

该算法与k-means算法最大的不同在于,它的中心点不再是各个簇中心点的平均值,而是簇中最能代表该簇的数据点。

该算法的优点在于它对噪声和离群点表现良好,缺点是它的计算复杂度高于k-means算法。

综上所述,常见的划分式聚类算法有k-means算法、CLARA算法和k-medoids算法。

每种算法都有其优点和限制,选择哪一种算法应该根据具体问题的特点和需要考虑。

相关文档
最新文档