评估模型研究_模糊聚类
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2 模糊聚类
2.2.1 模糊聚类分析方法简介及基本概念
聚类分析是近代发展起来的一种数学分类方法,它的数学基础是数理统计的多元分析方法。任何一门学科都要通过分类来建立若干概念,也要通过分类来发现和总结规律。分类是建立和识别模型的重要基础和手段。分类的方法有多种,这里介绍的聚类分析是根据事物间的不同特征、亲疏程度和相似性等关系、对它们进行分类的一种数学方法。
在现实世界中,一组事物根据某亲疏程度和相似性是否形成一个类群,或一个事物是否属于某一个类别,其界限往往是不分明的,具有很大程度的模糊性,模糊集合理论正是刻画和解决这类聚类问题的数学方法。模糊聚类分析是依据客观事物的特征、亲疏程度和相似性,通过建立模糊关系对客观事物进行分类的数学方法。用聚类分析方法处理带有模糊性的聚类问题更为客观、灵活、直观和计算更加简捷。
下面介绍模糊聚类分析方法中的一些基本概念。 (1)模糊矩阵
如果对于任意=i 1,2,…,m ;=j 1,2,…,n ,都有∈ij r [0,1],则称矩阵n m ij r R ⨯=)(为模糊矩阵。例如:
⎥⎦
⎤⎢⎣⎡=3.07.05.01.001
R 就是一个2⨯3模糊矩阵。若∈ij r {0,1},则模糊矩阵变成布尔矩阵。
为了方便,我们用n m ⨯μ表示n m ⨯模糊矩阵全体,若R 是一个n m ⨯模糊矩阵,
则记为n m R ⨯∈μ。 (2)-λ截矩阵
设n m ij a A ⨯∈=μ)(,对于任意的∈λ[0,1],称)(λλij a A =为模糊矩阵)(ij a A =的
-λ截矩阵,其中
⎪⎩
⎪⎨⎧<≥=。λλλij ij ij
a a a ,0,,1)
( (5)
显然,截矩阵为布尔矩阵。 (3)传递闭包
设n n A S Q ⨯∈μ,,,满足: a ))(2S S A S ≤≥,
b ))(2Q Q A Q ≤≥∀,总有S Q ≥,
则称S 为A 的传递闭包,记为)(A t ,即)(A t S =。
该定义的含义为:包含A 而且被任何包含A 的传递矩阵所包含的传递矩阵称
为A 的传递闭包,或包含A 的最小的模糊传递矩阵称为A 的传递闭包。 (4)模糊等价矩阵 设论域},,,{21n x x x U Λ=,n n R ⨯∈μ,I 为单位矩阵,若R 满足: ① 自反性 )1(=⇔≤ii r R I , ② 对称性 )(ji ij T r r R R =⇔=,
③ 传递性 ))((1
ij n
kj ik k r r r R R R ≤∧∨⇔≤=ο,
则称R 为模糊等价矩阵。 模糊等价矩阵具有如下定理所述的性质。
①R 是模糊等价矩阵∈∀⇔λ[0,1],λR 是等价的布尔矩阵。
② 设n n R ⨯∈μ是模糊等价矩阵,则对λ,∈μ[0,1],且μλ<,μR 所决定的
分类中的每一个类是λR 决定的分类中的某个类的子类。
当μλ<时,μR 的分类是λR 分类的加细。因此,当λ由1变到0时, λR 的分类由细变粗,形成一个动态的聚类图,称之为模糊分类。 (5)模糊相似矩阵
设论域},,,{21n x x x U Λ=,n n R ⨯∈μ,I 为单位矩阵,若R 满足: ① 自反性 )1(=⇔≤ij r R I , ② 对称性 )(ji ij T r r R R =⇔=, 则称R 为模糊相似矩阵。
需要指出的是,在实际应用中要建立一个模糊等价矩阵往往是不容易的,这主要是由于传递性不易满足。但是,要建立一个自反的、对称的模糊矩阵(称之为模糊相似矩阵),则是比较容易的。然后将它改造成满足传递性而又保持自反性与对称性的模糊等价关系或模糊等价矩阵,就可以进行分类。
通过求传递闭包)(R t ,可将模糊相似矩阵改造称为模糊等价矩阵,它具有传
递性,同时又保留了自反性与对称性。包含A 而且被任何包含A 的传递矩阵所包含的传递矩阵称为A 的传递闭包,或包含A 的最小的模糊传递矩阵称为A 的传递闭包。下面是一个实用的简捷法——二次方法求传递闭包)(R t 。
从模糊相似矩阵R 出发,依次求二次方,即
ΛΛ→→→→→i
R
R R R 24
2
当第一次出现k k k R R R =ο时(表明k R 具有传递性),k R 就是所求的传递闭包
)(R t 。
2.2.2 模糊聚类分析的一般步骤 (1)数据标准化
① 数据矩阵 设论域U={n x x x ,...,,21}为被分类的对象,每个对象又由m 个指标表示其
形状:
),...,,(21im i i i x x x x = ),...,2,1(n i =, (6)
于是得到原始矩阵为
⎥⎥⎥⎥⎦⎤
⎢⎢⎢⎢⎣⎡nm n n m m x x x x x x x x x ΛM M M Λ21
2222111211... (7) ②数据标准化
在实际问题中,不同的数据一般有不同的量纲。为了使不同量纲的量也能进行比较,通常需要对数据作适当的变换。但是,即使这样,得到的数据也不一定在区间[0,1]上。因此,这里所说的数据标准化,就是要根据模糊矩阵的要求,将
数据压缩到[0,1]上。通常需要作如下几种变换。
a )平移•标准差变换
j
j
ij ij x x x δ-=
'
(8)
式中∑==n
i ij j x n x 1m ax 1,∑=--=n
i j ij j x x n 1
2)(11δ 显然,经过变化后的每个指标值的平均值为零,方差为1。
b )极大值标准化
m ax
'j ij ij x x x =
(9)
式中),,,max (21max nj j j j x x x x Λ=
c )均值标准化
j
ij
ij x x σ=
' (10)
j δ的意义同上。
d )中心规格化
j ij ij x x x -=' (11)
j x 的意义同上。
e )对数规格
ij ij x x log '= (12)
(2)标定(建立模糊相似矩阵)
设论域},...,,{21n x x x U =,},...,,{21im i i i x x x x =,依照传统聚类方法确定相似系数,建立模糊相似矩阵,i x 与j x 的相似程度),(j i ij x x R r =。确定),(j i ij x x R r =的方法主要借用传统聚类分析的相似系数法、距离法以及其他方法。具体用什么方法,可根据问题的性质,选取下列公式之一计算ij r 。
① 相似系数法 a )数量积法