灰色最优聚类理论模型及其应用_肖新平
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6卷 第1期1997年3月 O PERA T ION S RESEA RCH A N D M A N AG EM EN T SCIEN CE
Vol.6,No.1
M ar.,1997灰色最优聚类理论模型及其应用
肖新平
(武汉交通科技大学基础部)湖北 武汉 430063
肖 伟
(西南石油学院计算机科学系)
四川 南充 637001
摘 要 本文根据灰色关联度的定义,运用广义加权距离构造目标函数,建立了一种灰色最优聚类理论模型,并结合实例说明了该模型的应用。关键词 灰色聚类;灰色关联度;最优化模型
0 引 言
实际问题中存在着大量的聚类(归类)问题,如环境质量综合评价,医学病类的诊断及海面溢油模式的鉴别等。灰色聚类法是建立在灰数的白化函数生成基础上的一种新的聚类方法[1]
,其最大的特点是该方法中一直包含着人的定性定量控制作用。但实践表明这种方法也有局限性:1)灰色聚类中,由于没有进行指标预处理和统一目标测度,这就存在着量纲,量级的差异;2)灰色聚类没有考虑各评估指标对评估目标而言的重要性,即权重;3)灰色聚类中每一类别的白化函数仅与相邻的上下两个类别存在隶属关系,当指标值分布过于离散时,可能会损失很多有用的信息。本文根据灰色聚类的基本原理,运用灰色关联度和最优化理论,建立了灰色最优聚类的新模型,并结合劳动力素质综合评价实例进行了评判。结果表明,该模型数学推导严谨,科学合理,便于使用。
1 灰色最优聚类理论模型
对某聚类问题的求解可归结为:根据该问题的分类标准,对以n 个指标表示的样品j 作聚类的最优识别。
设有p 个样品,m 个类别,每个样品有n 个指标,其权重分别为w 1,w 2,…,w n 满足1>
w i >0,
∑n
i =1
w i
=1。样品指标值和指标分类标准值见表1。
表1 指标分类标准值与样品指标值指标分类标准值
第1类第2类…第m 类样品j 的指标值
y 11-y 12y 12-y 13…y 1m -y 1,m +1x 1j y 21-y 22
y 22-y 23
…y 2m -y 2,m +1
x 2j ……………y n 1-y n 2
y n 2-y n 3
…
y nm -y n ,m +1
x nj
收稿日期:1996-08-29;修订日期:1996-11-14
其中y ih ,y i ,h +1分别为第i 个指标的第h 类标准值的上、下限,i =1,2,…,n ,h =1,2,…,m 。x ij 为样品j 的第i 个指标值,j =1,2,…,p 。显然对于固定的i 有
y i 1 或 y i 1>y i 2>y i 3>…>y im >y i ,m +1 (顺序 ) 1.1 白化函数的确定 如果用f ih 表示第i 个指标对第h 类别的白化函数,则f ih (x ij )为样品j 的第i 个指标隶属于第h 类别的程度(白化函数值)。 对于满足顺序Ⅰ的指标i ,显然y i 1最小,y i ,m +1最大,白化函数f ih 可按如下公式确定。 f i 1(x )= 1 y i 1≤x ≤y i 2y i ,m +1-x y i ,m +1-y i 2 y i 2≤x ≤y i ,m +1 f im (x )= x -y i 1y im -y i 1 y i 1≤x ≤y im 1 y im ≤x ≤y i ,m +1 f ih (x )= x -y i 1y ih -y i 1 y i 1≤x ≤y ih 1y ih ≤x ≤y i ,h +1y i ,m +1-x y i ,m +1-y i ,h +1 y i ,h +1≤x ≤y i ,m +1 (h =2,3,…,m -1)这样的白化函数有一个特点:每一级别的白化函数不只是与相邻的上、下两个类别存在着关系,而是与每个类别的标准值均有关,从而使得样品指标的任何实测值对每个类别都有不为零的隶属度(除端点及以外的值外)。 同理可确定满足顺序Ⅱ指标所对应的白化函数。1.2 灰色关联度的计算 记从属度f ih (x ij )为z j h (i ),从属度序列为z jh 则 z j h (i )=f ih (x ij ) (1) z j h =(z jh (1),z jh (2),…,z j h (n )) 如果对任意i 都有z jh (i )=1,即样品j 的每个指标值都属于第h 类,那么该样品应被判为第h 类。所以若取 z 0h =(1,1, (1) 则z 0h 是一个清晰的综合评判。 以z 0h 为参考序列,以z 1h ,z 2h ,…,z p h 为比较序列,则它们之间的灰色关联系数和关联度为 N jh (i )=min j min i $j h (i )+0.5max j max i $j h (i )$jh (i )+0.5max j max i $jh (i )(2)r jh = ∑n i =1 w i ・N j h (i ) (3) 22运筹与管理 1997年第6卷 其中 $jh (i )=ûz jh (i )-1û 令h =1,2,…,m ,得样品j 与每个类别的灰色关联度r j 1,r j 2,…,r j m (j =1,2,…,p ),它们分别刻划的是样品j 与每个类别的几何相似程度。 1.3 优化模型 为全面更合理地描述样品j 与第h 类标准间的接近程度,将该接近程度用以样品与各 类标准间的差异程度u j h 为权的加权广义距离来表示[2] ,即 d jh =u jh ∑n i =1 w i N jh (i ) u j h 满足 0≤u jh ≤1 ∑m h =1 u j h =1 显然d jh 总是愈小愈好,为此,构造如下多目标最优化模型。 V —m in D =(d 11,d 12,…,d 1m ,…,d p 1,d p 2,…,d pm ) s.t. ∑m h =1 u j h =1 (j =1,2,…,p ) 0≤u j h ≤1 将上述多目标最优化模型化为如下等价的单目标最优化模型 m in{F (u j h )}=m in ∑p j =1∑m h =1 d 2j h = ∑p j =1 m in ∑m h =1 u 2j h õ ∑n i =1 w i N jh (i ) 2 s .t . ∑m h =1 u j h =1 0≤u j h ≤1 作拉格朗日函数 L = ∑m h =1 u 2jh ∑n i =1 w i N jh (i ) 2 -K ∑m h =1u jh -1 令5L /5u j h =0并联立求得 u j h = 1 ∑n i =1 w i N jh (i ) 2 ×∑ m h =1 1 ∑n i =1 w i N jh (i ) 2 = 1 ∑ m k =1 ∑n i =1w i N j h (i ) ∑n i =1 w i N jk (i ) 2 = 1∑m k =1r j h r jk 2 上式即为本文所建立的灰色最优聚类理论模型。如果 min h u j h =u j h 0 则样品j 应划归为第h 0类。 2 应用实例 华东地区三省的劳动力素质评价指标的实际数据及分类标准[3]见表2。 23 第1期 肖新平等:灰色最优聚类理论模型及其应用