最新第四章聚类分析法复习进程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章聚类分析法
聚类分析
将具有相似(similarity)性质(或距离) 的个体(样本)聚为一类,具有不同性 质的个体聚为不同的类。
方法包括:
系统聚类法 非系统聚类法 分解法 模糊聚类等
基本思想
将n个样品各自看成一类,并规定样品与 样品之间的距离和类与类之间的距离;
在所有的类中,选择距离最小的一对合 并成一个新类,并计算出所得新类和其 他各类的距离;
(4)计算新类与其它类的距离
D 6 3m d 1 i,3 d n 23 1 .03
D 6 4m d 1 i,4 d n 24 1
D 6 5m d 1 i,5 d n 25 1 .33
G6 D(1) G3
G4 G5
G6 G3 G4 G5
0 1.03 1 1.33
0 0.63 1.30
0 0.67
1.37 0
1.34 0.63
0
1.67
1.30
0.67
0
0
D(2)
1.37 0
1.67 1.30
0
0 1.67
D(3)
0
G1 G2 G3 G4 G5
0.4
0.8 1.2 1.6 2.0
聚类距离
G1 G2 G3 G4 G5
0.2 0.4 0.6 0.8 1.0
G1 G2 G3 G4 G5
0
5)重复以上步骤,直到所有样品都成一 类为止。
0 1 1.33
D( 2 )
0 0.67
0
0 1
D(3)
0
(6)将聚类过程作出聚类谱系图,根据 谱系图进行分类。
G1 G2 G3 G4 G5
0.2 0.4 0.6 0.8 1.0
聚类距离
最长距离法
最长距离法对类之间距离的定义与最短 距离法正好相反,类与类之间的距离为 他们之间两个最远样品之间的距离。并 类步骤与最短距离法完全一样。
(2)计算样品的距离。
dijxi xj yi yj
G1
D(0)
G2 G3
G4
G5
G1 G2 G3 G4 G5
0 0.34 1.37 1.34 1.33
0 1.03 1 1.67
0 0.63 1.3
0 0.67
0
(3)找出D(0)非对角线上的最小元素, 将其对应的两个类合并为一个新类。
0
D(0)
0.34 0
1.37 1.03
0
1.34 1
0.63 0
1.33 1.67 1.3 0.67
0
D 6 3m d 1 a ,3 d 2 x 3 1 .37
D 6 4m d 1 a ,4 d 2 x 4 1 .34
D 6 4m d 1 a ,4 d 2 x 4 1 .67
0
Байду номын сангаас
D(1)
重复2,直至将所有的样品都合并成一类; 绘制聚类谱系图 。
最短距离法
把一个类的所有样品与另一个类的所有 样品的两两样品之间的最短距离找出来, 并将其定义为两个类之间的距离。
推销员 1 2 3 4 5
推销能力 1.2 1.2 7.1 9.6 9.6
教育程度 1.2 2.4 3.6 2.4 0
(1)数据变换处理。
x ijm 1 i n x ix a ji1 m j i x n 1 m x i iin jx n iij,n i 1 ,2 , ,n ;j 1 ,2 , ,p
推销 1 2 3 4 5 员
推销 0 0 0.70 1 1 能力
教育 0.33 0.67 1 0.67 0 程度
0.4
0.8
1.2
1.6
2.0
聚类距离
聚类距离
某村对5个地块就其土壤质地和土壤有机 质含量进行了评估,结果如下。请分别 使用最长距离法和最短距离法对这5个地 块进行聚类分析,要求分为两类。
地块 A
B
C
D
E
质地 8
3
6
6
4
有机质 5
7
4
9
7
含量
此课件下载可自行编辑修改,仅供参考! 感谢您的支持,我们努力做得更好! 谢谢!
相关文档
最新文档