聚类系数无显著性差异下的灰色综合聚类方法研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期 :2004 - 03 - 16 ; 修订日期 :2005 - 04 - 07 基金项目 :国家自然科学基金资助项目 (70473037) ;国家教育部
博士点基金资助 (20020287001) ;江苏省自然科学基 金重点项目 (B K2003211) ;南京航空航天大学博士创 新基金资助项目 (019004) 作者简介 :党耀国 (1964 - ) ,男 (汉族) ,河南省驻马店市人 ,南京 航空航天大学经济与管理学院 ,教授 ,博士 , 研究方 向 :灰色系统理论 、区域经济的研究 1
定理 2 当聚类对象的显著性差异系数θ ≥1 - 2/ s 时 , 则灰色综合聚类法与一般聚类法所得的 聚类结果是完全相同的 。
第 4 期 党耀国等 :聚类系数无显著性差异下的灰色综合聚类方法研究
·71 ·
证明 由于聚类对象的显著性差异系数θ = δ(1) - δ(2) ,
1) ( s - 1) / s ,1 + k ( s - 1) / s) 因此
ωi ≥ (1 - θ1) / 2 + k ·(1 +θ1) / 2 ≥1 + ( k -
1) ( s - 1) / s 解得 θ1 ≥1 - 2/ s
要使ωi 最大 ,只有δi = (0 , …,δki , 0 , …, 0 ,δsi) , 并且 δki - δsi 的差最小 。由于聚类对象 i 属于第 k 灰 类
定理 1 如果按一般聚类方法进行判定时 , 则
任一对象所在的综合聚类系数的取值区间长度小于
015 ( s - 1) 。 证明 :由于归一化聚类系数向量 δi = (δ1i ,δ2i ,
…,δsi) ( i = 1 ,2 , …, n) 的定义知 ,0 ≤δki ≤1 ,若聚 类对象 i 属于第 k 灰类 ,则它的综合聚类系数 ωi = δi ·η( i = 1 ,2 , …, n) 的最大值应为 (0 ,0 , …015 ,0 , …0 ,015) (1 ,2 , …, s - 1 , s) T = 015 ( k + s) (即归一 化聚类系数向量δi 中的第 k 个与第 s 个分量为 015 , 其余的全为零) 。而综合聚类系数ωi = δi ·η的最小 值为 (015 ,0 , …,015 ,0 , …,0) (1 ,2 , …, s - 1 , s) T = 015 (1 + k) (即归一化聚类系数向量 δi 中的第 1 个 与第 k 个分量为 015 ,其余的全为零) 。
= 1 ,2 , …, s)
为聚类指标
j 关于 k 灰类的白化权函数 。若聚类指标 j 关于 k 灰
类的聚类权与 k 无关 , 即 w j ( j = 1 ,2 , …, m ) 为聚
m
∑ 类指标 j 的聚类权 ,且 w j = 1 ,则称 j =1
·70 ·
中国管理科学 2005 年
m
∑ σki =
f
k j
(
x ij )
wj
j =1
为聚类对象 i 属于 k 灰类的聚类系数 。
定义 2 令δki =
σki
s
,称δki 为聚类对象 i 属于
∑σki
k =1
k 灰类的归一化聚类系数 。
称δi = (δ1i ,δ2i , …,δsi) ; ( i = 1 , 2 , …, n) 为聚
π = (ωi) =
ω12 δ22 ……
… ωs2 ……
δ11 δ21
ω1n δ2n … δs1
… ωsn
δ12 δ22
=
… δs2 (1 , 2 , …, s - 1 , s) T
…………
δ1n δ2n … δsn 为综合聚类系数向量 。其中称η = (1 ,2 , …, s -
1 , s) T 为综合聚类系数的权向量 。
2 一般灰色聚类方法
定义 1[11 ,12 ] 设有 n 个聚类对象 , m 个聚类指
标 , s 个不同的灰类 ,聚类对象 i 关于聚类指标 j 的量
化评 价 值 为 x ij , i = 1 ,2 , …, n , j = 1 ,2 , …, m 。
f
k j
(
3
)
(
j
= 1 ,2 ,
…, m ; k
4 两种灰色聚类方法结果相同的条件
定义 7 设聚类系数向量δ = (δ1 ,δ2 , …,δs) , 对聚类系数向量中的元素按从大到小重新排列 , 排 列顺序为δ(1) ,δ(2) , …,δ( s) δ(1) ≥δ(2) ≥ … ≥ δ( s) 。
称δ′= (δ(1) ,δ(2) , …,δ( s) ) 为顺序聚类系数向 量。
3 综合灰类聚类方法
定义 4 设有 n 个聚类对象 , s 个不同灰类 , 令
s
∑ η = (1 ,2 , …, s - 1 , s) T ,则称 ωi = δi ·η = k · k =1
δki ( i = 1 ,2 , …, n) 为聚类对象 i 的综合聚类系数 。
定义 5 称
ω11 ω21 … ωs1
- 1) / s 解得 θ2 ≥1 - 2/ s
因此当显著差异系数θ ≥1 - 2/ s 时 ,综合聚类 方法与一般聚类方法的聚类结果是相同的 。
定义 9 当聚类对象 i 的显著性差异系数θi =
对于一般聚类方法 ,若聚类对象 i 属于第 k 类 ,
s
∑ 即 δki = 1m≤al ≤xδs li ,由于 k =1δki = 1 , 由于综合聚类系数
s
∑ ωi = δi ·η = k ·δki ,因此 ,要使 ωi 最小 ,只有当 k =1
δi = (δ1i , 0 , …,δki , 0 , …, 0) 并且 δki - δ1i 的差最小
定义 8 设聚类对象 i 的聚类系数向量δi = (δ1i ,δ2i , …,δsi) , 它 的 顺 序 聚 类 系 数 向 量 为 δ′i = (δ(i1) ,δ(i2) , …,δ(i s) ) , 令 θi = δ(i1) - δ(i2) , 我们称 θi 为聚类对象 i 的显著性差异系数 。
1 引言
灰色系统理论自 1982 年邓聚龙教授创立以来 得到了迅速发展 ,灰色聚类评估分析一直是灰色系 统理论讨论较多的灰色技术之一 。邓聚龙教授创立 的灰色变权聚类方法[1 ] ,它是以白化权函数临界值 计算各指标的权重 ,该权重受样本值的数量级影响 较大 ,同时若指标间的量纲不同 ,权重的计算没有实 际意义 ; 刘思峰教授提出了定权灰色聚类评估分 析[2 ] ,它是通过定性分析的结果来确定各指标的权 重 ,然后利用白化权函数进行灰色聚类 ;肖新平提出 了灰色最优聚类[3 ] ,它所构造的白化权函数与每一 类的标准值都有关系 ,使得样本指标的任何实测值 对每个类别都不为零 ,然后计算各类别间的关联度 、 差异度和广义加权距离的方法进行聚类 ;许秀莉讨 化了灰色聚类分析的改进措施[4 ] ,它是在灰色最优 聚类的基础上进行的改进 ,在计算关联度时考虑了 各指标的权重 ;刘思峰还提出了基于三角白化权函
故聚类对象 i 属于第 k 类的综合聚类系数取值 区间长度为
Δ ≤015 ( k + s) - 015 (1 + k) = 015 ( s - 1) 。 由 k 的任意性 , 则任一对象所在的综合聚类系 数的取值区间长度小于 015 ( s - 1) 。 由于聚类对象被分为 s 类 , 而综合聚类系数 1 ≤ωi ≤ s ,因此我们可以把综合聚类系数的取值范 围平均分为 s 个互不相交的等长区间 , 即[1 ,1 + ( s - 1) / s) , [1 + ( s - 1) / s ,1 + 2 ( s - 1) / s) , …, [1 + ( k - 1) ( s - 1) / s ,1 + k ( s - 1) / s) , …, [ s - ( s 1) / s , s ] 。 定义 6 当聚类对象 i 的聚类系数无显著性差 异时 ,若对象 i 的综合聚类系数ωi ∈[1 + ( k - 1) ( s - 1) / s ,1 + k ( s - 1) / s) 时 ,我们称对象 i 属于第 k 灰类 。 我们称这种灰色聚类方法为灰色综合聚类方 法。
数的灰色聚类评估[5 ] ,熊和金等讨论了预测灰色聚 类问题[6 ] ,张岐山研究了灰色聚类分析结果灰性的 测度[7 ] ,作者讨论了综合聚类评估方法[8 - 10 ] 。以上 讨论从不同的方面对灰色聚类分析进行了研究 ,上 述各种灰色聚类分析的方法 ,它们都是在灰色聚类 系数向量分量的最大原则的基础上进行集结的方法 来判定聚类对象属于某一灰类 ,而在实际应用中 ,往 往会遇到灰色聚类系数无显著性差异 ,当聚类系数 无显著性差异时 ,上述方法就无法判定聚类对象应 属于何灰类 。因此 ,本文在上述灰色聚类分析研究 的基础上 ,研究了当灰色聚类系数无显著性差异时 , 灰色综合聚类评估模型的建立方法 ,而且当聚类对 象的聚类系数差异大于 1 - 2/ S 时 ,证明了一般灰色 聚类方法与灰色综合聚类方法所得聚类结果完全相 同。
聚类系数无显著性差异下的灰色 综合聚类方法研究
党耀国 ,刘思峰 ,刘 斌 ,翟振杰
(南京航空航天大学经济与管理学院 ,江苏省 南京市 210016)
摘 要 :在灰色聚类评估分析中 ,当灰色聚类系数无显著性差异时 ,按照已有的灰色聚类方法无法对聚类对象进行 准确的聚类 ,而在实际研究中经常会遇到聚类系数无显著性差异这类问题 。因此本文提出了一种新的灰色综合聚 类方法 。具体步骤是 :首先计算各聚类对象的聚类系数 ,并对其进行归一化处理 ;再根据对象中每一灰类的灰色聚 类系数在聚类过程中的作用 ,计算聚类对象的综合聚类系数 ;最后根据综合聚类系数对聚类对象进行聚类 ,确定聚 类对象应属的灰类 。并且证明了当聚类对象的聚类系数差异大于 1 - 2/ S 时 ,一般灰色聚类方法与灰色综合聚类 方法所得聚类结果完全相同 。最后 ,以江苏省第二产业内部主导产业选择为例进行了实证分析 。 关键词 :灰色聚类 ;聚类系数 ;显著性差异 中图分类号 :N94 文献标识码 :A
类对象 i 的归一化聚类系数向量 。
∏ 称
= (δki ) =
δ11 δ21 δ12 δ22 ……
… δs1 … δs2 为归一化 ……
聚类系数矩阵 。
δ1n δ2n … δsn
定义 3 若1m≤ak ≤xs{δki } = δki 3 时 ,则称对象 i 属于 灰类 k 3 。
此聚类方法称为一般聚类方法 。
第 13 卷 第 4 2005 年 8
期 月
Chinese
中国管理科学 Journal of Management
Science
ห้องสมุดไป่ตู้
Vol. 13 Aug. ,
, No. 4 2005
文章编号 :1003 - 207 (2005) 04 - 0070 - 05
此时有不等式方程组 δsi + δki = 1 δki - δsi ≥θ2
解得 δsi ≤ (1 - θ2) / 2 δki ≥ (1 + θ2) / 2
所以 ωi ≤ k ·(1 + θ2) / 2 + s ·(1 - θ2) / 2 , 得 ωi ≤s ·(1 - θ2) / 2 + k ·(1 +θ2) / 2 ≤1 + k ( s
命题 1 聚类对象 i 的综合聚类系数 1 ≤ωi ≤ s。
证明 由于归一化聚类系数向量δi = (δ1i ,δ2i , …,δsi) ( i = 1 , 2 , …, n) 的定义知 ,0 ≤δki ≤1 ,聚类 对象 i 的综合聚类系数ωi = δi ·η( i = 1 ,2 , …, n) 的最大值应为 s ,最小值应为 1 。所以有 :1 ≤ωi ≤s 。
时 ,才使 ωi 达到最小 。由于聚类对象 i 属于第 k 灰
类。
此时有不等式方程组 δ1i + δki = 1 δki - δ1i ≥θ1
解得
δ1i δki
≤(1 ≥(1
- θ1) / + θ1) /
2 2
(0
≤θ1
≤1)
因此
ωi = δki - δ1i ≥ (1 - θ1) / 2 + k ·(1 + θ1) / 2 由于聚类对象 i 属于第 k 类 ,则 ωi ∈[1 + ( k -
博士点基金资助 (20020287001) ;江苏省自然科学基 金重点项目 (B K2003211) ;南京航空航天大学博士创 新基金资助项目 (019004) 作者简介 :党耀国 (1964 - ) ,男 (汉族) ,河南省驻马店市人 ,南京 航空航天大学经济与管理学院 ,教授 ,博士 , 研究方 向 :灰色系统理论 、区域经济的研究 1
定理 2 当聚类对象的显著性差异系数θ ≥1 - 2/ s 时 , 则灰色综合聚类法与一般聚类法所得的 聚类结果是完全相同的 。
第 4 期 党耀国等 :聚类系数无显著性差异下的灰色综合聚类方法研究
·71 ·
证明 由于聚类对象的显著性差异系数θ = δ(1) - δ(2) ,
1) ( s - 1) / s ,1 + k ( s - 1) / s) 因此
ωi ≥ (1 - θ1) / 2 + k ·(1 +θ1) / 2 ≥1 + ( k -
1) ( s - 1) / s 解得 θ1 ≥1 - 2/ s
要使ωi 最大 ,只有δi = (0 , …,δki , 0 , …, 0 ,δsi) , 并且 δki - δsi 的差最小 。由于聚类对象 i 属于第 k 灰 类
定理 1 如果按一般聚类方法进行判定时 , 则
任一对象所在的综合聚类系数的取值区间长度小于
015 ( s - 1) 。 证明 :由于归一化聚类系数向量 δi = (δ1i ,δ2i ,
…,δsi) ( i = 1 ,2 , …, n) 的定义知 ,0 ≤δki ≤1 ,若聚 类对象 i 属于第 k 灰类 ,则它的综合聚类系数 ωi = δi ·η( i = 1 ,2 , …, n) 的最大值应为 (0 ,0 , …015 ,0 , …0 ,015) (1 ,2 , …, s - 1 , s) T = 015 ( k + s) (即归一 化聚类系数向量δi 中的第 k 个与第 s 个分量为 015 , 其余的全为零) 。而综合聚类系数ωi = δi ·η的最小 值为 (015 ,0 , …,015 ,0 , …,0) (1 ,2 , …, s - 1 , s) T = 015 (1 + k) (即归一化聚类系数向量 δi 中的第 1 个 与第 k 个分量为 015 ,其余的全为零) 。
= 1 ,2 , …, s)
为聚类指标
j 关于 k 灰类的白化权函数 。若聚类指标 j 关于 k 灰
类的聚类权与 k 无关 , 即 w j ( j = 1 ,2 , …, m ) 为聚
m
∑ 类指标 j 的聚类权 ,且 w j = 1 ,则称 j =1
·70 ·
中国管理科学 2005 年
m
∑ σki =
f
k j
(
x ij )
wj
j =1
为聚类对象 i 属于 k 灰类的聚类系数 。
定义 2 令δki =
σki
s
,称δki 为聚类对象 i 属于
∑σki
k =1
k 灰类的归一化聚类系数 。
称δi = (δ1i ,δ2i , …,δsi) ; ( i = 1 , 2 , …, n) 为聚
π = (ωi) =
ω12 δ22 ……
… ωs2 ……
δ11 δ21
ω1n δ2n … δs1
… ωsn
δ12 δ22
=
… δs2 (1 , 2 , …, s - 1 , s) T
…………
δ1n δ2n … δsn 为综合聚类系数向量 。其中称η = (1 ,2 , …, s -
1 , s) T 为综合聚类系数的权向量 。
2 一般灰色聚类方法
定义 1[11 ,12 ] 设有 n 个聚类对象 , m 个聚类指
标 , s 个不同的灰类 ,聚类对象 i 关于聚类指标 j 的量
化评 价 值 为 x ij , i = 1 ,2 , …, n , j = 1 ,2 , …, m 。
f
k j
(
3
)
(
j
= 1 ,2 ,
…, m ; k
4 两种灰色聚类方法结果相同的条件
定义 7 设聚类系数向量δ = (δ1 ,δ2 , …,δs) , 对聚类系数向量中的元素按从大到小重新排列 , 排 列顺序为δ(1) ,δ(2) , …,δ( s) δ(1) ≥δ(2) ≥ … ≥ δ( s) 。
称δ′= (δ(1) ,δ(2) , …,δ( s) ) 为顺序聚类系数向 量。
3 综合灰类聚类方法
定义 4 设有 n 个聚类对象 , s 个不同灰类 , 令
s
∑ η = (1 ,2 , …, s - 1 , s) T ,则称 ωi = δi ·η = k · k =1
δki ( i = 1 ,2 , …, n) 为聚类对象 i 的综合聚类系数 。
定义 5 称
ω11 ω21 … ωs1
- 1) / s 解得 θ2 ≥1 - 2/ s
因此当显著差异系数θ ≥1 - 2/ s 时 ,综合聚类 方法与一般聚类方法的聚类结果是相同的 。
定义 9 当聚类对象 i 的显著性差异系数θi =
对于一般聚类方法 ,若聚类对象 i 属于第 k 类 ,
s
∑ 即 δki = 1m≤al ≤xδs li ,由于 k =1δki = 1 , 由于综合聚类系数
s
∑ ωi = δi ·η = k ·δki ,因此 ,要使 ωi 最小 ,只有当 k =1
δi = (δ1i , 0 , …,δki , 0 , …, 0) 并且 δki - δ1i 的差最小
定义 8 设聚类对象 i 的聚类系数向量δi = (δ1i ,δ2i , …,δsi) , 它 的 顺 序 聚 类 系 数 向 量 为 δ′i = (δ(i1) ,δ(i2) , …,δ(i s) ) , 令 θi = δ(i1) - δ(i2) , 我们称 θi 为聚类对象 i 的显著性差异系数 。
1 引言
灰色系统理论自 1982 年邓聚龙教授创立以来 得到了迅速发展 ,灰色聚类评估分析一直是灰色系 统理论讨论较多的灰色技术之一 。邓聚龙教授创立 的灰色变权聚类方法[1 ] ,它是以白化权函数临界值 计算各指标的权重 ,该权重受样本值的数量级影响 较大 ,同时若指标间的量纲不同 ,权重的计算没有实 际意义 ; 刘思峰教授提出了定权灰色聚类评估分 析[2 ] ,它是通过定性分析的结果来确定各指标的权 重 ,然后利用白化权函数进行灰色聚类 ;肖新平提出 了灰色最优聚类[3 ] ,它所构造的白化权函数与每一 类的标准值都有关系 ,使得样本指标的任何实测值 对每个类别都不为零 ,然后计算各类别间的关联度 、 差异度和广义加权距离的方法进行聚类 ;许秀莉讨 化了灰色聚类分析的改进措施[4 ] ,它是在灰色最优 聚类的基础上进行的改进 ,在计算关联度时考虑了 各指标的权重 ;刘思峰还提出了基于三角白化权函
故聚类对象 i 属于第 k 类的综合聚类系数取值 区间长度为
Δ ≤015 ( k + s) - 015 (1 + k) = 015 ( s - 1) 。 由 k 的任意性 , 则任一对象所在的综合聚类系 数的取值区间长度小于 015 ( s - 1) 。 由于聚类对象被分为 s 类 , 而综合聚类系数 1 ≤ωi ≤ s ,因此我们可以把综合聚类系数的取值范 围平均分为 s 个互不相交的等长区间 , 即[1 ,1 + ( s - 1) / s) , [1 + ( s - 1) / s ,1 + 2 ( s - 1) / s) , …, [1 + ( k - 1) ( s - 1) / s ,1 + k ( s - 1) / s) , …, [ s - ( s 1) / s , s ] 。 定义 6 当聚类对象 i 的聚类系数无显著性差 异时 ,若对象 i 的综合聚类系数ωi ∈[1 + ( k - 1) ( s - 1) / s ,1 + k ( s - 1) / s) 时 ,我们称对象 i 属于第 k 灰类 。 我们称这种灰色聚类方法为灰色综合聚类方 法。
数的灰色聚类评估[5 ] ,熊和金等讨论了预测灰色聚 类问题[6 ] ,张岐山研究了灰色聚类分析结果灰性的 测度[7 ] ,作者讨论了综合聚类评估方法[8 - 10 ] 。以上 讨论从不同的方面对灰色聚类分析进行了研究 ,上 述各种灰色聚类分析的方法 ,它们都是在灰色聚类 系数向量分量的最大原则的基础上进行集结的方法 来判定聚类对象属于某一灰类 ,而在实际应用中 ,往 往会遇到灰色聚类系数无显著性差异 ,当聚类系数 无显著性差异时 ,上述方法就无法判定聚类对象应 属于何灰类 。因此 ,本文在上述灰色聚类分析研究 的基础上 ,研究了当灰色聚类系数无显著性差异时 , 灰色综合聚类评估模型的建立方法 ,而且当聚类对 象的聚类系数差异大于 1 - 2/ S 时 ,证明了一般灰色 聚类方法与灰色综合聚类方法所得聚类结果完全相 同。
聚类系数无显著性差异下的灰色 综合聚类方法研究
党耀国 ,刘思峰 ,刘 斌 ,翟振杰
(南京航空航天大学经济与管理学院 ,江苏省 南京市 210016)
摘 要 :在灰色聚类评估分析中 ,当灰色聚类系数无显著性差异时 ,按照已有的灰色聚类方法无法对聚类对象进行 准确的聚类 ,而在实际研究中经常会遇到聚类系数无显著性差异这类问题 。因此本文提出了一种新的灰色综合聚 类方法 。具体步骤是 :首先计算各聚类对象的聚类系数 ,并对其进行归一化处理 ;再根据对象中每一灰类的灰色聚 类系数在聚类过程中的作用 ,计算聚类对象的综合聚类系数 ;最后根据综合聚类系数对聚类对象进行聚类 ,确定聚 类对象应属的灰类 。并且证明了当聚类对象的聚类系数差异大于 1 - 2/ S 时 ,一般灰色聚类方法与灰色综合聚类 方法所得聚类结果完全相同 。最后 ,以江苏省第二产业内部主导产业选择为例进行了实证分析 。 关键词 :灰色聚类 ;聚类系数 ;显著性差异 中图分类号 :N94 文献标识码 :A
类对象 i 的归一化聚类系数向量 。
∏ 称
= (δki ) =
δ11 δ21 δ12 δ22 ……
… δs1 … δs2 为归一化 ……
聚类系数矩阵 。
δ1n δ2n … δsn
定义 3 若1m≤ak ≤xs{δki } = δki 3 时 ,则称对象 i 属于 灰类 k 3 。
此聚类方法称为一般聚类方法 。
第 13 卷 第 4 2005 年 8
期 月
Chinese
中国管理科学 Journal of Management
Science
ห้องสมุดไป่ตู้
Vol. 13 Aug. ,
, No. 4 2005
文章编号 :1003 - 207 (2005) 04 - 0070 - 05
此时有不等式方程组 δsi + δki = 1 δki - δsi ≥θ2
解得 δsi ≤ (1 - θ2) / 2 δki ≥ (1 + θ2) / 2
所以 ωi ≤ k ·(1 + θ2) / 2 + s ·(1 - θ2) / 2 , 得 ωi ≤s ·(1 - θ2) / 2 + k ·(1 +θ2) / 2 ≤1 + k ( s
命题 1 聚类对象 i 的综合聚类系数 1 ≤ωi ≤ s。
证明 由于归一化聚类系数向量δi = (δ1i ,δ2i , …,δsi) ( i = 1 , 2 , …, n) 的定义知 ,0 ≤δki ≤1 ,聚类 对象 i 的综合聚类系数ωi = δi ·η( i = 1 ,2 , …, n) 的最大值应为 s ,最小值应为 1 。所以有 :1 ≤ωi ≤s 。
时 ,才使 ωi 达到最小 。由于聚类对象 i 属于第 k 灰
类。
此时有不等式方程组 δ1i + δki = 1 δki - δ1i ≥θ1
解得
δ1i δki
≤(1 ≥(1
- θ1) / + θ1) /
2 2
(0
≤θ1
≤1)
因此
ωi = δki - δ1i ≥ (1 - θ1) / 2 + k ·(1 + θ1) / 2 由于聚类对象 i 属于第 k 类 ,则 ωi ∈[1 + ( k -