第2章 模糊聚类分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
(x
k 1
m
ik
xi )
(x
k 1
m
jk
xj)
2
距离法 rij = 1 – c d (xi , xj ) 其中c为适当选取的参数. 海明距离 d ( xi , x j ) | xik x jk |
k 1 m
欧氏距离 d ( xi , x j ) 切比雪夫距离
第2章 模糊聚类分析
重点:理解模糊聚类分析的原理 掌握建立模糊相似矩阵的方法 难点:选择最佳分类
2.1 模糊矩阵
2.1.1 模糊矩阵的概念
2.1.2 模糊矩阵的运算及其性质
模糊矩阵的并、交、余运算规律
模糊矩阵的合成
0.8 0.2 0.6 A= 0.5 0.6 0.3
蠓的分类与模糊识别
几何识 别方法
模糊分类 首先将已知类型蠓重新进行分类.
模糊聚类判别方法 然后将未知和已知类型蠓混合一起分类.
研究生招生中的模糊聚类分析方法
DNA序列分类与模糊识别 2000网易杯全国大学生数学建模竞赛题: 生物学家发现DNA序列是由四种碱基A,T,C,G 按一定顺序排列而成,其中既没有“断句”,也 没有标点符号,同时也发现DNA序列的某些片段 具有一定的规律性和结构. 由此人工制造两类 序列(A类编号为1~10;B类编号为11~20). 网址:www.mcm.edu.cn. 现在的问题是,如何找出比较满意的方法来 识别未知的序列(编号为21~40), 并判断它们 那些属于A类,那些属于B类, 那些既不属于A类 又不属于B类.(P74-80)
O
5 ●6 ●
8
选择满意分类
实际上,最佳分类的确定方法与选择聚类方 法无关,但是选择较好的聚类方法,可以较快地 找到比较满意的分类.
第2章 重要概念与公式方法 模糊矩阵 – 截矩阵 模糊关系 模糊等价关系 模糊等价矩阵 模糊等价矩阵的基本定理 数据标准化 模糊相似矩阵建立方法 聚类方法:传递闭包法 Boole矩阵法 最佳分类的确定 F – 统计量
0.5 0.9 B = 0.7 0.1 0.4 0.5
模糊方阵的幂
合成运算的性质
验证分配律不成立
合成运算性质1的证明
模糊矩阵的转置及其性质
转置运算性质的证明
模糊矩阵的-截矩阵
1 0.5 A= 0.2 0
1 1 A0.3= 0 0 1 0 0 1 0 1 0 1 1 1 1 1 1 1 A0.5= 0 0
m
(x
k 1
m
ik
x jk )
2
d (xi , xj ) = ∨ | xik- xjk |
k =1
Boole矩阵法 定理 设 R 是论域 X ={x1, x2, …, xn}上的一个 相似的 Boole 矩阵,则 R 具有传递性 (当R是等价 Boole矩阵时) 矩阵 R 在任一排列下的矩阵都 没有形如
证明如下:
分类的关系
2.3.2 模糊相似关系
模糊相似矩阵的性质
2.4 模糊聚类分析
数据标准化
平移 • 标准差变换
模糊相似矩阵建立方法
相似系数法 – – 夹角余弦法
相似系数法适用于种群分类.
相似系数法 相关系数法
rij
|x
k 1
m
ik
xi | | x jk x j |
0.5 0.2 0 1 0.1 0.3 , Baidu Nhomakorabea.1 1 0.8 0.3 0.8 1
1 0 0 1 0 0 0 1 1 0 1 1
-截矩阵的性质
下面证明性质1和性质3.
性质3的证明
2.2 模糊关系
2.2.1 模糊关系的定义
模糊关系例子 例 设身高论域 X ={140, 150, 160, 170, 180} (单位:cm), 体重论域Y ={40, 50, 60, 70, 80}(单 位:kg),下表给出了身高与体重的模糊关系. 40 50 60 70 80
F- 统计量
F
|| x
j 1 k 1
j 1 r nj
( j) 2 n j || x x || /( r 1)
( j) k
r
( j) 2 x || /( n r )
~ F (r 1, n r )
F- 统计量的几何解释 ° ° °° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° °°
1 0 0 1 1 1 1 1
的特殊子矩阵,则将R 中上述特殊形式子矩阵 的0改为1,直到在任一排列下R 中不再产生上 述特殊形式子矩阵为止.
最佳分类的确定 在模糊聚类分析中,对于各个不同的∈[0,1], 可得到不同的分类,从而形成一种动态聚类图,这 对全面了解样本分类情况是比较形象和直观的. 但在许多实际问题中,需要给出样本的一个具 体分类,这就提出了如何确定最佳分类的问题.
140
150
1
0.8
0.8
1
0.2
0.8
0.1
0.2
0
0.1
160
170
0.2
0.1
0.8
0.2
1
0.8
0.8
1
0.2
0.8
180
0
0.1
0.2
0.8
1
模糊关系的运算
模糊关系的矩阵表示
2.2.2 模糊关系的合成
模糊关系合成运算的性质
2.3 模糊等价矩阵
2.3.1 模糊等价关系
模糊等价矩阵的基本定理
°
F
|| x
j 1 k 1
j 1 r nj
° ° ° ° ° ° r ° ( j) ° 2 n || x x || /( r 1) j
°
( j) k
°
1 ●2
● ●
● ●
3
●
4
°
( j) 2 x || /( n r )
7 ~ F (r 1, n r )
1 1 1 1 1 0 0 1 1 0 0 1 1 1 1 1
的特殊子矩阵.
Boole矩阵法的步骤 (1)求模糊相似矩阵的 -截矩阵R ; (2) 若R在某一排列下的矩阵有形如
1 1 1 1 1 0 0 1
(x
k 1
m
ik
xi )
(x
k 1
m
jk
xj)
2
距离法 rij = 1 – c d (xi , xj ) 其中c为适当选取的参数. 海明距离 d ( xi , x j ) | xik x jk |
k 1 m
欧氏距离 d ( xi , x j ) 切比雪夫距离
第2章 模糊聚类分析
重点:理解模糊聚类分析的原理 掌握建立模糊相似矩阵的方法 难点:选择最佳分类
2.1 模糊矩阵
2.1.1 模糊矩阵的概念
2.1.2 模糊矩阵的运算及其性质
模糊矩阵的并、交、余运算规律
模糊矩阵的合成
0.8 0.2 0.6 A= 0.5 0.6 0.3
蠓的分类与模糊识别
几何识 别方法
模糊分类 首先将已知类型蠓重新进行分类.
模糊聚类判别方法 然后将未知和已知类型蠓混合一起分类.
研究生招生中的模糊聚类分析方法
DNA序列分类与模糊识别 2000网易杯全国大学生数学建模竞赛题: 生物学家发现DNA序列是由四种碱基A,T,C,G 按一定顺序排列而成,其中既没有“断句”,也 没有标点符号,同时也发现DNA序列的某些片段 具有一定的规律性和结构. 由此人工制造两类 序列(A类编号为1~10;B类编号为11~20). 网址:www.mcm.edu.cn. 现在的问题是,如何找出比较满意的方法来 识别未知的序列(编号为21~40), 并判断它们 那些属于A类,那些属于B类, 那些既不属于A类 又不属于B类.(P74-80)
O
5 ●6 ●
8
选择满意分类
实际上,最佳分类的确定方法与选择聚类方 法无关,但是选择较好的聚类方法,可以较快地 找到比较满意的分类.
第2章 重要概念与公式方法 模糊矩阵 – 截矩阵 模糊关系 模糊等价关系 模糊等价矩阵 模糊等价矩阵的基本定理 数据标准化 模糊相似矩阵建立方法 聚类方法:传递闭包法 Boole矩阵法 最佳分类的确定 F – 统计量
0.5 0.9 B = 0.7 0.1 0.4 0.5
模糊方阵的幂
合成运算的性质
验证分配律不成立
合成运算性质1的证明
模糊矩阵的转置及其性质
转置运算性质的证明
模糊矩阵的-截矩阵
1 0.5 A= 0.2 0
1 1 A0.3= 0 0 1 0 0 1 0 1 0 1 1 1 1 1 1 1 A0.5= 0 0
m
(x
k 1
m
ik
x jk )
2
d (xi , xj ) = ∨ | xik- xjk |
k =1
Boole矩阵法 定理 设 R 是论域 X ={x1, x2, …, xn}上的一个 相似的 Boole 矩阵,则 R 具有传递性 (当R是等价 Boole矩阵时) 矩阵 R 在任一排列下的矩阵都 没有形如
证明如下:
分类的关系
2.3.2 模糊相似关系
模糊相似矩阵的性质
2.4 模糊聚类分析
数据标准化
平移 • 标准差变换
模糊相似矩阵建立方法
相似系数法 – – 夹角余弦法
相似系数法适用于种群分类.
相似系数法 相关系数法
rij
|x
k 1
m
ik
xi | | x jk x j |
0.5 0.2 0 1 0.1 0.3 , Baidu Nhomakorabea.1 1 0.8 0.3 0.8 1
1 0 0 1 0 0 0 1 1 0 1 1
-截矩阵的性质
下面证明性质1和性质3.
性质3的证明
2.2 模糊关系
2.2.1 模糊关系的定义
模糊关系例子 例 设身高论域 X ={140, 150, 160, 170, 180} (单位:cm), 体重论域Y ={40, 50, 60, 70, 80}(单 位:kg),下表给出了身高与体重的模糊关系. 40 50 60 70 80
F- 统计量
F
|| x
j 1 k 1
j 1 r nj
( j) 2 n j || x x || /( r 1)
( j) k
r
( j) 2 x || /( n r )
~ F (r 1, n r )
F- 统计量的几何解释 ° ° °° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° °°
1 0 0 1 1 1 1 1
的特殊子矩阵,则将R 中上述特殊形式子矩阵 的0改为1,直到在任一排列下R 中不再产生上 述特殊形式子矩阵为止.
最佳分类的确定 在模糊聚类分析中,对于各个不同的∈[0,1], 可得到不同的分类,从而形成一种动态聚类图,这 对全面了解样本分类情况是比较形象和直观的. 但在许多实际问题中,需要给出样本的一个具 体分类,这就提出了如何确定最佳分类的问题.
140
150
1
0.8
0.8
1
0.2
0.8
0.1
0.2
0
0.1
160
170
0.2
0.1
0.8
0.2
1
0.8
0.8
1
0.2
0.8
180
0
0.1
0.2
0.8
1
模糊关系的运算
模糊关系的矩阵表示
2.2.2 模糊关系的合成
模糊关系合成运算的性质
2.3 模糊等价矩阵
2.3.1 模糊等价关系
模糊等价矩阵的基本定理
°
F
|| x
j 1 k 1
j 1 r nj
° ° ° ° ° ° r ° ( j) ° 2 n || x x || /( r 1) j
°
( j) k
°
1 ●2
● ●
● ●
3
●
4
°
( j) 2 x || /( n r )
7 ~ F (r 1, n r )
1 1 1 1 1 0 0 1 1 0 0 1 1 1 1 1
的特殊子矩阵.
Boole矩阵法的步骤 (1)求模糊相似矩阵的 -截矩阵R ; (2) 若R在某一排列下的矩阵有形如
1 1 1 1 1 0 0 1