灰色聚类评估详解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 灰色关联聚类 设有 n 个观测对象,每个观测对象 m个特征数据,得到序列如下
X 1 ( x1 (1), x1 (2),, x1 (n)) X 2 ( x2 (1), x2 (2),, x2 (n)) X m ( xm (1), xm (2),, xm (n))
时
定义5.1.1 上述矩阵A称为特征变量关联矩阵. 取定临界值 r [0,1], 一般要求 r 0.5. 当 ij
则视 X i 与 X j 为同类特征.
关联聚类. 越细;
定义5.1.2 特征变量在临界值 r 下的分类称为特征变量的 r 灰色 可以根据实际问题的需要确定,
r 越小,分类越粗糙.
例 图1.4.1中白化权函数 f ( x) 表示贷款额这一灰数及其受 什么是白化权函数? “偏爱”程度。其中,直线用 来表示“正常愿望”,即“偏 爱”程度与资金(万元)成比 例增加。不同的斜率表示欲望 f1 ( x) 表示较为 的强烈程度不同, 平缓的欲望,认为贷给10万元 不行,贷给20万元就比较满意, f 2 ( x) 贷给30万元就足够了; 表示 愿望强烈,贷给35万元也只有 f3 ( x) 20%的满意程度; 表明即使 贷给40万元,满意程度才达到 10%,但贷50万元就行了,即 非要接近50万元不可,没有减 少的余地。
什么是白化权函数?
定义1.4.4 起点、终点确定左升、右降连续函数 称为典型白化权函数。 典型白化权函数一般如图1.4.2(a)所示。
定义5.2.4:1、若白化权函数 f jk () 无第一和第二
个转折点 xkj (1) ,x kj (2) ,则称 f jk () 为下限测度白化 权函数,记为 f jk [, , xkj (3), xkj (4)]. 2、若白化权函数 f jk () 的第二和第三个转折点重 合,则称 f jk () 为适中测度白化权函数, 记为 f jk [ xkj (1), xkj (2), , xkj (4)] 3、若 f jk () 无第三和第四个转折点,则称 f jk () k 为上限测度白化权函数,记为f jk [ xk j (1), x j (2), , ]
f jk
f
k j
f jk
1
1
1
0
xk j (3)
xk j (4)
xk xk j (2) j (1)
xk j (4)
x
0 x k (1) j
xk j (2)
x
命题5.2.1 对于 典型白化权函 数,有
相应地,下限测 度白化权函数 为
0 x [ x kj (1), x kj (4)] k x x j (1) k k x [ x (1), x j j (2)] x k (2) x k (1) j j k fj k k 1 x [ x (2), x j j (3)] x k (4) x k k k j x [ x (3), x j j (4)] k x j (4) x j (3) 0 x [0, x kj (4)] k x [0, x kj (3)] f j ( x) 1 k k k x j (4) x x [ x (3), x (4)] j j k k x (4) x (3) j j
r
越接近于1,分类
例5.1.1 评定某一职位的任职资格。评委 们提出了15个指标:1申请书印象,2学术 能力,3讨人喜欢,4自信程度,5精明, 6诚实,7推销能力,8经验, 9积极性, 10抱负,11外貌,12理解能力,13潜力, 14交际能力,15适应能力。 大家认为某些指标可能是相关或混同 的,希望通过对少数对象的观测结果, 将上述指标适当归类,删去一些不必要 的指标,简化考察标准。对上述指标采 取打分的办法使之定量化,9名考察对象 各个指标所得的分数如表5.1.1所示。
f ()
k j
k f 定义5.2.3 设j指标k子类的白化权函数 j ()为如
k k x x (1) 下图所示的典型白化权函,则称 j , j (2) , k xk xk (4) j (3) , 为 f j ()的转折点,典型白化权函数 j 记为 f k [ xk (1), xk (2), xk (3), xk (4)]
5.2 灰色变权聚类
定义5.2.1 设有n个聚类对象,m个聚类指
标,s个不同灰类,根据第i(i=1,…,n)个对
象关于j(j=1,…,m)指标的样本值xij 将第
i个对象归入第k(k=1,…,s)个灰类之中,
称为灰色聚类.
定义5.2.2 将n个对象关于指标j的取值相
应地分为s个灰类,我们称之为j指标子 类.j指标k子类的白化权函数记为
对所有的
ij
i j, i, j 1, 2,, m, 计算出 X i 与 X j的绝对关联度
11 A
得上三角矩阵
12 பைடு நூலகம் 22
mm
1m 2m
其中
ii 1; i 1, 2,, m
r (i j )
灰色聚类评估
杨昆鹏 2014.4.12
灰色聚类评估
古语: “物以类聚”,找出特征相似的类别,研究其规律性 主要内容: 1.灰色关联聚类
2.灰色变权聚类
3.灰色定权聚类
灰色聚类评估
灰色聚类是根据灰色关联矩阵或灰数的白 化权函数将一些观测指标或观测对象聚集成 若干个可以定义类别的方法。按聚类对象划 分,可以分为灰色关联聚类和灰色白化权函 数聚类。 灰色关联聚类主要用于同类因素的归并,以使复杂系 统简化。由此,我们可以检查许多因素中是否有若干个 因素关系十分密切,使我们既能够用这些因素的综合平 均指标或其中的某一个因素来代表这几个因素,又可以 使信息不受到严重损失。灰色白化权函数聚类主要用于 检查观测对象是否属于事先设定的不同类别,以区别对 待。
j
j
j
j
j
f jk
1
0
k x (1) x j (2)
k j
x kj (3)
x (4)
k j
x
什么是白化权函数?
在灰数的分布信息已知时,往往采取非等 权白化。例如某人2005年的年龄可能是30岁到 [30, 45] 是个灰数。根据了解,此人受 45岁, 初、中级教育共12年,并且是在80年代中期考 入大学的,故此人年龄到2005年为38岁左右的 可能性较大,或者说在36岁到40岁的可能性较 大。这样的灰数,如果再作等权白化,显然是 不合理的。为此,我们用白化权函数来描述一 个灰数对其取值范围内不同数值的“偏爱”程 度。