第四章聚类分析法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
D(2)
0 =
1 0
1 .33 0 .67 0
D(3)
0 =
1 0
(6)将聚类过程作出聚类谱系图,根据 )将聚类过程作出聚类谱系图, 谱系图进行分类。 谱系图进行分类。
G1 G2 G3 G4 G5 0.2 0.4 0.6 0.8 1.0 聚类距离
1 0 0.33
2 0 0.67
3 0.70 1
4 1 0.67
5 1 0
(2)计算样品的距离。 计算样品的距离。 计算样品的距离
d ij = x i − x j + y i − y j
G1 D( 0 ) = G2 G3 G4 G5
G1 G2 G3 G4 0 0.34 1.37 1.34 0 1.03 1 0 0.63 0
基本思想
个样品各自看成一类, 将n个样品各自看成一类,并规定样品与 个样品各自看成一类 样品之间的距离和类与类之间的距离; 样品之间的距离和类与类之间的距离; 在所有的类中, 在所有的类中,选择距离最小的一对合 并成一个新类, 并成一个新类,并计算出所得新类和其 他各类的距离; 他各类的距离; 重复2,直至将所有的样品都合并成一类; 重复 ,直至将所有的样品都合并成一类; 绘制聚类谱系图 。
最短距离法
把一个类的所有样品与另一个类的所有 样品的两两样品之间的最短距离找出来, 样品的两两样品之间的最短距离找出来, 并将其定义为两个类之间的距离。 并将其定义为两个类之间的距离。
推销员 1 2 3 4 5
推销能力 1.2 1.2 7.1 9.6 9.6
教育程度 1.2 2.4 3.6 2.4 0
G5 1.33 1.67 1 .3 0.67 0
(3)找出 (0)非对角线上的最小元素, 找出D 非对角线上的最小元素, 找出 将其对应的两个类合并为一个新类。 将其对应的两个类合并为一个新类。
(4)计算新类与其它类的距离 计算新类与其它类的距离 计算新类
D63 = min(d 13 , d 23 ) = 1.03
(1)数据变换处理。 数据变换处理。 数据变换处理
′ xij
{ } = , i = 1,2, L , n; j = 1,2, L , p max {x }− min {x }
xij − min xij
1≤ i ≤ n ij 1≤ i ≤ n 1≤ i ≤ n ij
推销 员 推销 能力 教育 程度
1 .34 1 0 .63 0
1 .33 1 .67 1 .3 0 .67 0
D63 = max(d13 , d 23 ) = 1.37
D64 = max(d14 , d 24 ) = 1.34
D64 = max(d14 , d 24 ) = 1.67
D(1)
0 1.37 1.34 1.67 0 0.63 1.30 = 0 0.67 0
最长距离法
最长距离法对类之间距离的定义与最短 距离法正好相反, 距离法正好相反,类与类之间的距离为 他们之间两个最远样品之间的距离。 他们之间两个最远样品之间的距离。并 类步骤与最短距离法完全一样。 类步骤与最短距离法完全一样。
D (0)
0 =
0 .34 0
1 .37 1 .03 0
D( 2)
0 1 .37 = 0
1 .67Байду номын сангаас 1 .30 0
D(3)
0 1 .67 = 0
G1 G2 G3 G4 G5 0.4 0.8 1.2 1.6 2.0
聚类距离
G1 G2 G3 G4 G5 0.2
G1 G2 G3 G4 G5 0.4 0.8 1.2 1.6 2.0 聚类距离
0.4
0.6
0.8
1.0
聚类距离
某村对5 某村对5个地块就其土壤质地和土壤有机 质含量进行了评估,结果如下。 质含量进行了评估,结果如下。请分别 使用最长距离法和最短距离法对这5 使用最长距离法和最短距离法对这5个地 块进行聚类分析,要求分为两类。 块进行聚类分析,要求分为两类。
地块 质地 有机质 含量 A 8 5 B 3 7 C 6 4 D 6 9 E 4 7
聚类分析法
Cluster Analysis
聚类分析
将具有相似(similarity)性质(或距离) 性质(或距离) 将具有相似 性质 的个体(样本)聚为一类, 的个体(样本)聚为一类,具有不同性 质的个体聚为不同的类。 质的个体聚为不同的类。 方法包括: 方法包括:
系统聚类法 非系统聚类法 分解法 模糊聚类等
D64 = min (d 14 , d 24 ) = 1
D65 = min(d15 , d 25 ) = 1.33
D(1)
G6 = G3 G4 G5
G6 G3 G4 1 0 1.03 0 0.63 0
G5 1.33 1.30 0.67 0
5)重复以上步骤,直到所有样品都成一 )重复以上步骤, 类为止。 类为止。