统计模式识别中的聚类方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

模式识别

第五章:统计模式识别中的聚类方法

1.请简述几种聚类准则函数。

(1) 误差平方和

(2)权平均平方距离和

(3)类间距离和

(4)离散度

-基于迹、行列式、特征值

2.聚类算法可分为哪几类?影响聚类算法性能优劣的因素有哪些?

(1) 增类聚类算法(基于分裂的聚类算法)

(2) 减类聚类算法(基于合并的聚类算法)

(3) 动态聚类算法

因素:聚类中心的选择与更新、聚类策略和聚类准则的选择、控制阈值和类别数的设置等

3.请给出C-均值聚类算法的流程图。书上第196~203页

初始化:类别计数器

类间距离阈值T=充分大的数

迭代计数器k=0

(1)计算各样本间的欧式距离,构造矩阵D

6.已知一个样本集合:试用近邻函数法进行聚类分析(1)计算距离矩阵D

{(0,0),(1,1),(2,1),(4,4),(5,3),(5,4),(6,3),(6,5)}t t t t t t t

t

(3)计算近邻函数值矩阵

7.请给出最下张树聚类算法的具体过程,并分析其优缺点。

课本第218~221页

优点:简洁、明快,特别适用于距离较远的两个密集样本点集之间的区分。

缺点:1)当样本集合中存在噪声样本时可能造成错分2)对于相距较近的两个密集样本点集的区分能力

较弱。

相关文档
最新文档