统计模式识别中的聚类方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模式识别
第五章:统计模式识别中的聚类方法
1.请简述几种聚类准则函数。
(1) 误差平方和
(2)权平均平方距离和
(3)类间距离和
(4)离散度
-基于迹、行列式、特征值
2.聚类算法可分为哪几类?影响聚类算法性能优劣的因素有哪些?
(1) 增类聚类算法(基于分裂的聚类算法)
(2) 减类聚类算法(基于合并的聚类算法)
(3) 动态聚类算法
因素:聚类中心的选择与更新、聚类策略和聚类准则的选择、控制阈值和类别数的设置等
3.请给出C-均值聚类算法的流程图。书上第196~203页
初始化:类别计数器
类间距离阈值T=充分大的数
迭代计数器k=0
(1)计算各样本间的欧式距离,构造矩阵D
6.已知一个样本集合:试用近邻函数法进行聚类分析(1)计算距离矩阵D
{(0,0),(1,1),(2,1),(4,4),(5,3),(5,4),(6,3),(6,5)}t t t t t t t
t
(3)计算近邻函数值矩阵
7.请给出最下张树聚类算法的具体过程,并分析其优缺点。
课本第218~221页
优点:简洁、明快,特别适用于距离较远的两个密集样本点集之间的区分。
缺点:1)当样本集合中存在噪声样本时可能造成错分2)对于相距较近的两个密集样本点集的区分能力
较弱。