模糊聚类分析模板
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模糊聚类分析
1.1 模糊聚类分析法的基本原理
模糊聚类分析是根据事物间的不同特征、亲疏程度和相似性等关系,通过建立模糊相似关系对客观事物进行分类的一种数学方法。
用模糊聚类分析方法处理带有模糊性的聚类问题更为客观、灵活、直观,计算也更加简捷。
1.2 模糊聚类分析的简要流程
1.3 模糊聚类分析的一般步骤
Step1:数据标准化
(1) 获取数据
设论域12{,,,}n X x x x =为被分类对象,每个对象又有m 个指标表示其性状,即:12{,,,}(1,2,,)i i i im x x x x i n ==。
于是,得到原始数据矩阵为:
111212122212
()m m ij n m n n nm x x x x x x A x x x x ⨯⎛⎫ ⎪ ⎪== ⎪ ⎪⎝⎭ 其中,nm x 表示第n 个分类对象的第m 个指标的原始数据。
(2)数据的标准化处理
在实际问题中,不同的数据一般有不同的量纲,为了使不同的量纲也能进行比较,通常需要对数据做适当的变换。
但是,即使这样,得到的数据也不一定在区间[0,1]上。
因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间[0,1]上。
通常有以下几种变换:标准差变换与极差变换,本文采用极差变换对原始数据标准化处理,其数学模型模型为:
'111min{}max{}min{}ik ik i n ik ik ik i n
i n x x x x x ≤≤≤≤≤≤-=-,(1,2,,)k m =
显然有01ik
x ''≤≤,且消除了量纲的影响,从而可以得到模糊矩阵: ''()ij n m R x ⨯=
Step2:建立模糊相似矩阵
设论域12{,,,}n X x x x =,12{,,(1,2,..,,)}.i i i im x x x x i n ==,即数据矩阵()ij n m A x ⨯=。
如果i x 与j x 的相似程度(,)ij i j r R x x =,则称之为相似系数。
确定相似系数ij r 值的方法很多,主要有欧式距离法、余弦夹角法、相关系数法、最大最小法、最小算术平均法、最小几何平均法等。
以上方法究竟选用哪种,不能一概而论,要视问题的实际情况而定,本文采用最大最小法,其数学模型为:
11()(,1,2,...,)()m ik jk k ij m ik
jk k x
x r i j n x
x ==∧==∨∑∑
Step3:建立模糊等价矩阵
一般情形下,上面所求得的矩阵,只是一个模糊相似关系矩阵,仅满足自反性与对称性,不一定具有传递性,然而要进行聚类,矩阵R 必须是模糊等价关系才行,即要满足传递性。
为了进行分类,所以需要将其改造成为模糊等价矩阵*R 。
本文采用平方法计算传递闭包,即将R 自乘:242......,k R R R R →→→→,如此下去,直至某一步出现2k k R R =,一般经过有限次运算后存在k 使2k k R R =,于是*2k R R =,*R 即为模糊等价矩阵。
Step4:聚类分析
在建立模糊相似矩阵之后,可直接从相似矩阵出发求聚类图,其步骤如下:
(1)取11λ=(最大值),对每个i x 做相似类[]i r x ,且{}[]1i r ij x r ==,即将满足1ij r =的i x 和j x 放在一类,以构成相似类。
(2)取2λ为次大值,从R 中直接找出相似程度为2λ的元素对(,)i j x x (即2ij r λ=),将对应于11λ=的等价分类中i x 所在的类与j x 所在的类合并,合并后,即得到对应于2λ的等价分类。
(3)取3λ为第三大值,从R 中直接找出相似程度为3λ的元素对(,)i j x x (即3ij r λ=),类似地,将对应于2λ的等价分类中i x 所在类与j x 所在类合并,将所有这些情况合并后,得到对应3λ的等价分类。
(4)依次类推,直到合并到X 成为一类为止。