灰色聚类评估
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x
[
xkj
(1),
x
k j
(4)]
x
[
x
k j
(1),
x
k j
(2)]
x
[
灰色聚类评估
杨昆鹏 2014.4.12
灰色聚类评估
古语: “物以类聚”,找出特征相似的类别,研究其规律性 主要内容:
1.灰色关联聚类 2.灰色变权聚类 3.灰色定权聚类
灰色聚类评估
灰色聚类是根据灰色关联矩阵或灰数的白 化权函数将一些观测指标或观测对象聚集成 若干个可以定义类别的方法。按聚类对象划 分,可以分为灰色关联聚类和灰色白化权函 数聚类。
f
k j
(•)
无第一和第二
个转折点 xkj (1)
,xkj (2)
,则称
f
k j
(•)
为下限测度白化
权函数,记为
f
k j
[,
,
xkj
(3),
xkj
(4)].
2、若白化权函数
f
k j
(•)
的第二和第三个转折点重
合,则称
f
k j
(•) 为适中测度白化权函数,
记为
f
k j
[xkj
(1),
xkj
(2),
,
xkj
1 灰色关联聚类
设有 n 个观测对象,每个观测对象m个特征数据,得到序列如下
X1 ( x1 (1), x1 (2), , x1(n)) X 2 ( x2 (1), x2 (2), , x2 (n))
X m ( xm (1), xm (2), , xm (n))
对所有的 i j,i, j 1, 2, , m, 计算出 X i 与 X j的绝对关联度
关联聚类. 可以根据实际问题的需要确定, r 越接近于1,分类 越细; r 越小,分类越粗糙.
例5.1.1 评定某一职位的任职资格。评委 们提出了15个指标:1申请书印象,2学术 能力,3讨人喜欢,4自信程度,5精明, 6诚实,7推销能力,8经验, 9积极性, 10抱负,11外貌,12理解能力,13潜力, 14交际能力,15适应能力。
(4)]
3为、上若限f测jk (•度) 无白第化三权和函第数四,个记转为折f j点k[x,kj (1则),称xkj (f2jk)(,•), ]
f
k j
1
f
k j
1
f
k j
1
0
xkj (3)
xkj (4)
x
k j
(1)
xkj (2)
xkj (4)
x
0
x
k j
(1)
xkj (2)
x
0
命题5.2.1 对于
灰色关联聚类主要用于同类因素的归并,以使复杂系 统简化。由此,我们可以检查许多因素中是否有若干个 因素关系十分密切,使我们既能够用这些因素的综合平 均指标或其中的某一个因素来代表这几个因素,又可以 使信息不受到严重损失。灰色白化权函数聚类主要用于 检查观测对象是否属于事先设定的不同类别,以区别对 待。
x
x
k j
(1)
典型白化权函 数,有
f
k j
xkj (2) 1
x
k j
(1)
x [xkj (1), xkj (4)]
x [xkj (1), xkj (2)]
x
[
x
k j
(2),
xkj
(3)]
x
k j
(4)
x
xkj (4) xkj (3)
x
[
x
k j
(3),
xkj
(4)]
0
x
[0,
x
k j
例 图1.4.1中白化权函数
什么是白化权函数?
表示贷款额这一灰数f (x及) 其受 “偏爱”程度。其中,直线用
来表示“正常愿望”,即“偏
爱”程度与资金(万元)成比
例增加。不同的斜率表示欲望
的平强缓烈的程欲度望不,同认,为f1 贷( x) 给表1示0较万为元
不行,贷给20万元就比较满意,
贷给30万元就足够了; 表示f2 (x) 愿望强烈,贷给35万元也只有
ij 得上三角矩阵
11 12
A
22
1m
2m
mm
其中 ii 1; i 1, 2, , m
定义5.1.1 上述矩阵A称为特征变量关联矩阵.
取定临界值 r [0,1], 一般要求 r 0.5. 当 ij r(i j) 时
则视 X i 与 X j 为同类特征.
定义5.1.2 特征变量在临界值r 下的分类称为特征变量的r 灰色
(4)]
相应地,下限测 度白化权函数 为
f
k j
(
x)
1
xkj (4) x
xkj
(4)
x
k j
(3)
x [0, xkj (3)] x [xk来自百度文库 (3), xkj (4)]
适中测度白化 权函数为
0
x xkj (1)
f
k j
(
x)
xkj
(2)
xkj
(1)
xkj (4) x
xkj (4) xkj (2)
下图所示的典型白化权函,则称 xkj (1) , xkj (2) ,
xkj (3)
,xkj (4)
为
f
k j
(•)的转折点,典型白化权函数
记为
f
k j
[
xkj
(1),
xkj
(2),
xkj
(3),
xkj
(4)]
f
k j
1
0
x
k j
(1)
xkj (2)
xkj (3)
x
xkj (4)
什么是白化权函数?
在灰数的分布信息已知时,往往采取非等 权白化。例如某人2005年的年龄可能是30岁到 45岁,[30, 45]是个灰数。根据了解,此人受 初、中级教育共12年,并且是在80年代中期考 入大学的,故此人年龄到2005年为38岁左右的 可能性较大,或者说在36岁到40岁的可能性较 大。这样的灰数,如果再作等权白化,显然是 不合理的。为此,我们用白化权函数来描述一 个灰数对其取值范围内不同数值的“偏爱”程 度。
象关于j(j=1,…,m)指标的样本值xij 将第 i个对象归入第k(k=1,…,s)个灰类之中,
称为灰色聚类.
定义5.2.2 将n个对象关于指标j的取值相
应地分为s个灰类,我们称之为j指标子
类.j指标k子类的白化权函数记为
f
k j
(•)
定义5.2.3
设j指标k子类的白化权函数
f
k j
(•)为如
20%的满意程度; 表f3明(x)即使
贷给40万元,满意程度才达到
10%,但贷50万元就行了,即
非要接近50万元不可,没有减
少的余地。
什么是白化权函数?
定义1.4.4 起点、终点确定左升、右降连续函数 称为典型白化权函数。
典型白化权函数一般如图1.4.2(a)所示。
定义5.2.4:1、若白化权函数
大家认为某些指标可能是相关或混同 的,希望通过对少数对象的观测结果, 将上述指标适当归类,删去一些不必要 的指标,简化考察标准。对上述指标采 取打分的办法使之定量化,9名考察对象 各个指标所得的分数如表5.1.1所示。
5.2 灰色变权聚类
定义5.2.1 设有n个聚类对象,m个聚类指
标,s个不同灰类,根据第i(i=1,…,n)个对