相似度矩阵 聚类 代码

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

相似度矩阵聚类代码
相似度矩阵是一种基于数据相似度进行聚类的方法,常用于机器学习和数据挖掘领域。

下面是一份相似度矩阵聚类的 Python 代码示例:
```
import numpy as np
from scipy.cluster.hierarchy import dendrogram, linkage from matplotlib import pyplot as plt
# 构建相似度矩阵
similarity_matrix = np.array([[1.0, 0.2, 0.1],
[0.2, 1.0, 0.5],
[0.1, 0.5, 1.0]])
# 使用 linkage 函数进行层次聚类
Z = linkage(similarity_matrix, 'ward')
# 绘制树状图
plt.figure(figsize=(8, 5))
dendrogram(Z)
plt.show()
```
在上述代码中,我们首先构建了一个 3x3 的相似度矩阵,每个元素表示两个数据之间的相似度。

然后使用 `linkage` 函数进行层次聚类,并将结果传递给 `dendrogram` 函数绘制树状图。

在树状图
中,每个叶子节点代表一个数据点,每个非叶子节点代表一个聚类。

树状图的高度表示聚类的距离,即聚类中所有数据点之间的平均距离。

通过观察树状图,我们可以确定聚类的数量和每个聚类包含的数据点。

相关文档
最新文档