灰关联聚类方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

灰关联聚类方法

以往,人们对多因素的复杂系统进行多维综合评估分析,已作了大量的理论研究和实践探索。如因素关联分析,模糊聚类,系统聚类,灰色聚类等。这里把灰关联分析和聚类思想方法进行融会、扩充,创立了“灰关联聚类方法”,既区别于关联分析,又非是一般的聚类方法,它是把灰关联度演化成刻划待评对象之间的亲和度,进行聚类分析的新方法。该方法与一般的聚类方法相比,具简洁性、有效性、灵活性、普适性等特点。

(一)聚类原理简介

该方法是以灰色相似矩阵为基本信息的聚类分析方法,灰色相似矩阵记为G:

G= g11g12 (1)

g21g22 (2)

┇┇g m1g m2…g mm

其中:

g ij=(γij+γji)/2 (8-7)由于矩阵G中的元素显然满足:

①自反性:g ii=1;

②对称性:g ij=g ji;

则{γij }i,j=1,2,…,m;定义为关联矩阵Г

Г= γ11γ12 (1)

γ21γ22 (2)

┇┇γm1γm2…γmm

其中,γij即是以第i个评估对象的指标序列为参考序列,以第j个评估对象的指标序列为比较序列的关联度。

设对待分析评估系统S i(i=1,2,…,m),其特征参量(指标)序列为X i;

X i=(x i1,x i2,…,x in)

又有参考特征参量(指标)序列X0;

X 0=(x 01,x 02,…,x 0n ) 则实数ζi (k )=

|

)()(|max max |)()(||

)()(|max max |)()(|min min 0000k X k X k X k X k X k X k X k X i k

i

i i k

i

i k

i

-+--+-σσ (8-8)

为X i 对X 0在第k 点的关联系数。σ为分辨系数,一般在0到1之间选取。称实数γi 为X i 对于X 0和关联度。

γi =

∑=n

j i

k n

1

)(1

ξ (8-9)

(二)示例

以《卫生统计》(1993.6)数据为基本信息资料(表8-10),对其10个少数民族人口素质进行聚类分析。

(1) 聚类基础的构成

表8-10 少数民族人口素质基本指标数据

注:“↑”表示指标值越大越好;“↓”表示指标值越小越好。

根据待分析问题的实质,有分析域S S =(S 1,S 2,…,S 10)

且S i,当i=1,2,…,10时顺次代表满族、朝鲜族、蒙古族、回族、维吾尔族、藏族、彝族、白族、哈尼族和苗族。记为S1,S2,S3,S4,S5,S6,S7,S8,S9,S10。对任一少数民族S i,有其特征指标,因为具体的聚类分析问题都是在给定指标体系下来做的,因此选择适当的指标体系对于达到合理、贴切的分类非常重要。而依据的指标体系过于简单,不能真实反映事物内涵,而指标过繁又无从处理,最终还是人为臆断。

我们选取四项指标,即:

X i=(X i1,X i2,X i3,X i4)

根据选定的指标,收集原始数据见表8-10。

最优(参考)序列的确定:

依某指标的属性,对于指标属性是“↑”则:

X oj=max(X†ij)

i∈I

对于指标属性是“↓”则:

X ij=min(X†ij)

i∈I

算例:指标“标准化总死亡率”,其属性是“↓”越大越好。

X01=min(6.06,6.93,7.64,8.16,11.12,

10.29,9.99,8.49,11.08,8.95)=6.06

余类推。

故得:

X0=(6.06,652.5,89.5,33.26)1×4

根据各特征指标的属性,以参予分析的原始数据按下式作统一测度处理,并同时作同一化处理,将各分析数据压缩至[0,1]区间。

对指标属性越大越好的指标:

X ij=X†ij/max X†ij(8-10)对指标属性越小越好的指标:

X ij=min X†ij/X†ij

(8-11)

例如:表8-10中第一个指标属性为越小越好。

min X †ij =min (6.06,6.93,7.64,8.16,10.29,

9.99,8.49,11.08,8.95)=6.06

X 11=min X †i1/X †11 =6.06/6.06=1 X 21=6.06/6.93=0.8745 余类推。

经上述处理后,分析体系的数据见表8-10。 (2)灰色相似矩阵的建立

分别以X 1,X 2,…,X 10,X 0为参考序列,以这m +1个序列为比较序列,按灰色关联度分析方法(即按公式(8-8)、(8-9),分辨系数取0.50)计算出关联矩阵Г。

表8-12 分析体系数据

1 0.7803 0.6118 0.516

2 0.5054 0.3948 0.4475 0.5427 0.4158 0.4608 0.860

3 0.7968 1 0.6162 0.5339 0.4892 0.4186 0.4631 0.5528 0.432

4 0.4820 0.9266 0.5644 0.5492 1

0.7522 0.6571

0.4892 0.6142 0.8553 0.5435 0.6388 0.4898 0.4788 0.4737 0.7481 1 0.7347 0.6229 0.7818 0.5817 0.7206 0.8218 0.4314

0.5079 0.4653 0.6924 0.7588 1 0.7075 0.7075 0.7533 0.7186 0.6872 0.4429 Г=

0.4383 0.4363 0.5958 0.756

0.7521

1

0.8223

0.6478 0.8837 0.7848 0.4104 0.4274 0.4179 0.6457 0.8007 0.6977 0.7726 1 0.7180 0.8673 0.9360 0.3920 0.4715 0.4591 0.8185 0.8369 0.7086 0.5304 0.6691 1

0.5832 0.7101

0.4189 0.4060 0.3972 0.5860 0.7354 0.7101 0.8314 0.3559 0.6393 1

0.8258

0.3742 0.4482 0.4452 0.6742 0.8436 0.6810 0.7337 0.9376 0.7610 0.8339 1 0.4113

0.8702 0.9266

0.5703 0.4958 0.4669

0.3938 0.4365

0.6165 0.4094 0.4503

1

相关文档
最新文档