灰色聚类评估详解PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x
k j
(2)]
1 ,
x
x
k j
( 2)
第19页/共33页
:1、对于图1所示的j指标k子类白化权函数,
令子类白化权函kj 数 ,12 (令xkj (;22)、 x对kj (3于))图kj2所 示xkj的(3j)指标k
则称λjk为j指标kkj 子类xkj临(2界) 值。
设λjk 为j指标k子类临界值,则称
(
i1,
2 i
,
,
s i
)
(
f
1 j
(
xij
)
•1j
,
f
2 j
(
xij
)
•
2 j
,
,
f
s j
(
xij
)
•
s j
)
j 1
j 1
j 1
为对象i属于k灰类的灰色变权聚类系数。
2、
(
k i
)
1 1
1 2
2 1
2 2
s 1
s 2
1 n
2 n
s n
为聚类系数矩阵。
第22页/共33页
定义 设 于灰类k*
灰色聚类评估
古语: “物以类聚”,找出特征相似的类别,研究其规律性
主要内容:
1.灰色关联聚类
2.灰色变权聚类
3.灰色定权聚类
第1页/共33页
灰色聚类评估
灰色聚类是根据灰色关联矩阵或灰数的白 化权函数将一些观测指标或观测对象聚集成 若干个可以定义类别的方法。按聚类对象划 分,可以分为灰色关联聚类和灰色白化权函 数聚类。
第2页/共33页
1 灰色关联聚类
设有 n 个观测对象,每个观测对象m个特征数据,得到序列如下
X1 (x1(1), x1(2), , x1(n)) X 2 (x2 (1), x2 (2), , x2 (n))
X m (xm (1), xm (2), , xm (n))
对所有的 i j,i, j 1, 2, , m, 计算出 Xi 与 X j的绝对关联度
解决上述问题有两条途径:1、采用初 值化算子或均值化算子将指标样本值化 为无量纲数据,然后进行聚类。这种方 式不能反映不同指标在聚类过程中的差 异性。2、对各聚类指标事先赋权,即定 权聚类。
第24页/共33页
设xij(i=1,…n;j=1…,m)为对象i关于指标j
的样本值,
f
k j
(•)(
j
1,
2,
第16页共33页定义1若白化权函数无第一和第二个转折为下限测度白化权函数记为2若白化权函数的第二和第三个转折点重为适中测度白化权函数记为无第三和第四个转折点则称为上限测度白化权函数记为第17页共33页命题对于典型白化权函数有相应地下限测度白化权函数适中测度白化权函数为上限测度白化权函数为第19页共33页ij为对象i关于指标j的标本f第21页共33页定义称第22页共33页定义灰色变权聚类适用于指标的意义量纲皆相同的情形当指标的意义量纲不同且指标的样本值在数量上悬殊较大时不宜采用灰色变权聚类
x
k j
(1)
x
k j
(4)
x
x
k j
(4)
x
k j
(2)
x [xkj (1), xkj (4)]
x
[
xkj
(1),
x
k j
(2)]
x
[
x
k j
(2),
x
k j
(4)]
上限测度白化 权函数为
0,
f
k j
(
x)
x
k j
x (2)
x
k j
(1)
x
k j
(1)
,
x
x
k j
(1)
x
[
x
k j
(1),
第16页/共33页
定义1、若白化权函数 无f第jk (•一) 和第二个转折
点
, xkj (1),则xkj称(2)
为下f jk (限•) 测度白化权函数,
记为
f
k j
[,
,
xkj
(3),
xkj
(4)].
2、若白化权函数
f
k j
(•)
的第二和第三个转折点重
合,则称
f
k j
(•) 为适中测度白化权函数,
,m;k 1,2,
, s)
为j指标k子类白化权函数。若j指标关于k子
类的权 kj ( j 1, 2, , m;k 1, 2, , s)与k无
关,即对任意的
k1, k2
j
1, 2, m
, m ,有
ηjk1= ηjk2,记为ηj,并称
k i
f
k j
(
xij
)
•为
j
j 1
对象j属于k灰类的灰色定权聚类系数。
色聚类.
定义 将n个对象关于指标j的取值相应地分
为s个灰类,我们称之为j指标子类.j指标k
子类的白化权函数记为
f
k j
(•)
第11页/共33页
第12页/共33页
定义 设j指标k子类的白化权函数 为f如jk (•下) 图
所示的典型白化权函,则称 x,kj (1) x,kj (2)
x
k j
(3)
,x
ij 得上三角矩阵
11 12
A
22
1m
2m
mm
第3页/共33页
其中 ii 1; i 1, 2, , m
定义 上述矩阵A称为特征变量关联矩阵.
取定临界值 r [0,1], 一般要求 r 0.5. 当 ij r(i j) 时
则视 Xi 与 X j 为同类特征.
定义 特征变量在临界值 下的r分类称为特征变量的 灰色r 关联聚类. 可以根据实际问题的需要确定, r 越接近于1,分类 越细; r 越小,分类越粗糙.
灰色关联聚类主要用于同类因素的归并,以使复杂系 统简化。由此,我们可以检查许多因素中是否有若干个 因素关系十分密切,使我们既能够用这些因素的综合平 均指标或其中的某一个因素来代表这几个因素,又可以 使信息不受到严重损失。灰色白化权函数聚类主要用于 检查观测对象是否属于事先设定的不同类别,以区别对 待。
k i
m1kax,s 则 ik称对象i属
灰色变权聚类适用于指标的意义、量纲 皆相同的情形,当指标的意义、量纲不 同,且指标的样本值在数量上悬殊较大 时,不宜采用灰色变权聚类。
第23页/共33页
5.3 灰色定权聚类
当聚类指标的意义、量纲不同,且在 数量上悬殊较大时,采用灰色变权聚类 可能导致某些指标参与聚类的作用十j 分 微弱。
第4页/共33页
例 评定某一职位的任职资格。评委们提出 了15个指标:1申请书印象,2学术能力, 3讨人喜欢,4自信程度,5精明,6诚实, 7推销能力,8经验, 9积极性,10抱负, 11外貌,12理解能力,13潜力,14交际 能力,15适应能力。 大家认为某些指标可能是相关或混同 的,希望通过对少数对象的观测结果, 将上述指标适当归类,删去一些不必要 的指标,简化考察标准。对上述指标采 取打分的办法使之定量化,9名考察对象 各个指标所得的分数如表所示。
(4)]
0
x [0, xkj (4)]
相应地,下限测
度白化权函数 为
f
k j
(
x)
1
xkj (4) x
xkj (4) xkj (3)
x [0, xkj (3)] x [xkj (3), xkj (4)]
第18页/共33页
适中测度白化 权函数为
0
x
x
k j
(1)
f
k j
(
x)
x
k j
(2)
x
第17页/共33页
0
命题对于典型白
x xkj (1)
化权函数,有
f
k j
x
k j
(2) 1
xkj (1)
x [xkj (1), xkj (4)]
x [xkj (1), xkj (2)]
x
[
x
k j
(2),
xkj
(3)]
x
k j
(4)
x
x
k j
(4)
xkj
(3)
x
[
x
k j
(3),
xkj
第5页/共33页
第6页/共33页
第7页/共33页
第8页/共33页
第9页/共33页
第10页/共33页
5.2 灰色变权聚类
定义 设有n个聚类对象,m个聚类指标,s个
不同灰类,根据第i(i=1,…,n)个对象关于
j(j=1,…,m)指标的样本值xij 将第i个对 象归入第k(k=1,…,s)个灰类之中,称为灰
第26页/共33页
灰色定权聚类按下列步骤进行:
1、给出j指标k子类白化权函数:
f
k j
(•)(
j
1,
2,
,m;k 1,2,
, s)
2、根据定性分析结论确定各指标的聚
类权:j ( j 1, 2, , ;) 3、由前两步得到的结果以及对象j关于
k数指:标的ik 样 本m 值f jk x(xiijj算) •出 j 灰色定权聚类系
第25页/共33页
定义设
xij (i 1, 2, , n; j 1, 2,为对, m象) i
关于指标j的样本值,
f
k j
(•)(
j
1,
2,
,m;k 1,2,
, s)
为j指标k子类白化权函数。若对任意的j
总 为有 对象 j i属m1 于,ikk则灰称j类m1 f的jk (灰xij )色•等j 权m1聚jm类1 f系jk (x数ij )。
记为
f
k j
[xkj
(1),
xkj
(2),
,
xkj
(4)]
3为、上若限f测jk (•度) 无白第化三权和函第数四,个记转为折f j点k[x,kj (1则),称xkj (f2jk)(•,), ]
f
k j
1
f
k j
1
f
k j
1
0
xkj (3)
x
k j
(4)
xkj (1) xkj (2)
x
k j
(4)
x
0 xkj (1) xkj (2)
第14页/共33页
例 图中白化权函数 表示
什么是白化权函数?
贷款额这一灰数及其f (x受) “偏爱” 程度。其中,直线用来表示
“正常愿望”,即“偏爱”程
度与资金(万元)成比例增加。
不同的斜率表示欲望的强烈程
度望不,同认,为贷给表1示0较万f1(为元x)平不缓行的,欲贷
给20万元就比较满意,贷给30
万元就足够了; 表示愿望强f2(x) 烈,贷给35万元也只有20%的
满意程度; 表明即使f3(x贷) 给40
万元,满意程度才达到10%,
但贷50万元就行了,即非要接
近50万元不可,没有减少的余
地。
第15页/共33页
什么是白化权函数?
定义起点、终点确定左升、右降连续函数称为典 型白化权函数。
典型白化权函数一般如图(a)所示。
4、若
灰类k
j 1
max{
1k s
k i
}
k ,则对象i属于
i
第27页/共33页
第28页/共33页
第29页/共33页
第30页/共33页
第31页/共33页
Thank you!
第32页/共33页
感谢您的观看。
第33页/共33页
为j指标关于k子类的权。
k j
k j m
k j
j 1
第20页/共33页
ij 为对象i关于指标j的标本,fjk(·)为j
指标k子类白化权函数,ηjk为j指标关于
k子类的权,则称
m
k i
f
k j
(
xij
)
•
k j
为对象i属于k灰j类1 的灰色变权聚类系数。
第21页/共33页
定义称 1、
m
m
m
i
k j
(4)
为
f
k j
(•)的转折点,典型白化权函数
记为
f
k j
[
xkj
(1),
xkj
(2),
xkj
(3),
xkj
(4)]
f
k j
1
0 xkj (1) xkj (2)
xkj (3)
x
xkj (4)
第13页/共33页
什么是白化权函数?
在灰数的分布信息已知时,往往采取非等 权白化。例如某人2005年的年龄可能是30岁到 45岁,[30, 45] 是个灰数。根据了解,此人受 初、中级教育共12年,并且是在80年代中期考 入大学的,故此人年龄到2005年为38岁左右的 可能性较大,或者说在36岁到40岁的可能性较 大。这样的灰数,如果再作等权白化,显然是 不合理的。为此,我们用白化权函数来描述一 个灰数对其取值范围内不同数值的“偏爱”程 度。