灰色关联度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若系统 因素 X i 与系统主行为 X 0 呈负相关关
系,我们可以将其逆化或倒数化后进行计算。
逆化
X '' 1 x (k), x (k ) [0,1], k 1,2,...,n
i
i
i
倒数化
X '' i
1/ x (k), i
X (k) 0, i
k 1,2,...,n
3.关联系数的计算
设经过数据处理后的参考数列为:
灰色关联度
一、灰色关联度简述
1.灰色系统
部分信息已知而部分信息未知的系统,灰色系统 理论所要考察和研究的是对信息不完备的系统, 通过已知信息来研究和预测未知领域从而达到了 解整个系统的目的。
2.关联度
事物之间、因素之间关联性大小的量度。它定量 地描述了事物或因素之间相互变化的情况,即变 化的大小、方向与速度等的相对性。如果事物或 因素变化的态势基本一致,则可以认为它们之间 的关联度较大,反之,关联度较小。
0.2489
0.9994
0.1810)
0.5460
1 r02 5 (0.6008 0.7673 0.3478 0.5588 0.2956) 0.5141
r03
1 5
(0.2919
0.7546
0.8115
0.4104
0.8382)
0.6213
1
n
,
0i
n k 1
0i
按关联度数值的大小排序,便组成关联序。 它反映了各比较数列对同一参考数列的” 主次”、“优劣”关系
均值化
X ' i
xi
k
X1
X
1
n
x
k
1
n k1 i
k 1,2,...,n
一般说来,均值化方法比较适合于没有明显升降趋势现象
的数据处理。
区间化
X'
x (k ) min x (k )
i
i
k 1,2,...,n
i max x (k ) min x (k )
i
i
一般地,三种方法不宜混合、重叠作用,在进行系统因 素分析时,可根据实际情况选用其中一个。
3.基本思想
根据序列曲线几 何形状的相似程 度来判断其联系 是否紧密,曲线 越接近,相应序 列之间的关联度 就越大,反之就 越小。
100
90 80 70
90 80
887505
60
60
50
周阿舍 劉阿華 蕭阿薔
總成績 考試成績 出席率
圖一 某老師給學生的評分表曲線圖
二、灰色关联度——因素分析
1. 确定参考数列; 2. 处理原始数据; 3. 计算关联系数; 4. 关联度的计算与比较。
式中 为分辩系数,用来削弱Δ(max)过大而使关联系数 失真的影响。人为引入这个系数是为了提高关联系数之间 的差异显著性。
从几何角度看,关联程度实质上是参考数列与比较数列曲线 形状的相似程度。凡比较数列与参考数列的曲线形状接近, 则两者间的关联度较大;反之,如果曲线形状相差较大,则 两者间的关联度较小。因此,可用曲线间的差值大小作为关 联度的衡量标准。 则:
1
n
,
0i
n k 1
0i
i 1,2,...,m
例1:分析研究某公路施工企业年收入的 主要影响因素
年份 工资总额 计时工资 档案工资 承包工资
2003 13974.2 3831.0 6587.2 3556.0 2004 15997.6 4228.0 7278.0 4491.6 2005 17681.3 5017.0 7717.4 4946.9 2006 20188.3 5288.6 9102.2 5797.5 2007 24020.3 5744.0 11575.2 6701.0
设 Xi (xi (1), xi (2),, xn (n)) 为因素 X i 的行为序列
初值化
wk.baidu.comx X X x x x x '
(1) ( ' (1), ' (2),..., ' (n)),
i
ii
i
i
i
(1) 0,i 0,1,2,...,m
i
一般地,初值化方法适用于较稳定的社会经济 现象的无量纲化,因为这样的数列多数呈稳定 增长趋势,通过初值化处理,可使增长趋势更 加明显。
1.确定参考数列
对一个抽象系统或现象进行分析,首先要选准反映系统 行为特征的数据序列(参考序列)。我们称之为找系统行 为的映射量,用映射量来间接地表征系统行为。比如:
教育的发达程度
国民平均受教育的年限
社会治安面貌和社会秩序
刑事案件的发案率
2.原始数据的处理
由于各因素各有不同的计量单位,因而原始数据 存在量纲和数量级上的差异,不同的量纲和数量 级不便于比较,或者比较时难以得出正确结论。 因此,在计算关联度之前,通常要对原始数据进 行无量纲化处理。
对例1中数据做均值化处理
X ' i
xi
k
X1
X
1
n
x
k
1
n k1 i
计算例1中各比较数列同参考数列在同一时期的绝对差
(k) x' (k) x' (k),
i
0
0
第三步 找出两极最大差与最小差
max 0.1161 min 0.002
第四步 计算关联系数,取分辨系数 0.2 ,则计算公式为:
(k) x' (k) x' (k) , k 1,2,...,n
i
0
0
两极最大差与最小差:
(max) max max (k),
i
k
i
(min) min max (k)
i
k
i
4.关联度的计算与比较
由于每个比较数列与参考数列的关联程度是通过n 个关联系数来反映的, 关联信息分散,不便于从整体上进行比较。因此,有必要对关联信息作集 中处理。而求平均值便是一种信息集中的方式。即用比较数列与参考数列 各个时期的关联系数之平均值来定量反映这两个数列的关联程度,其计算 公式为:
oi
(t)
(min) 0.2(max) oi (t) 0.2(max)
0.002 0.2 0.1161 oi (t) 0.2 0.1161
0.02522 oi (t) 0.02322
计算关联度
利用表4,分别求各个数列每个时期的关联系数的平均值即得关联 度:
r01
1 5
(0.4414
0.8596
X ' {x' (1), x' (2),...., x' (n)}
0
0
0
0
比较数列为:
X ' {x' (1), x' (2),..., x' (n)},
i
i
i
i
i 1,2,...,m
关联系数:
(k ) (min) (max) ,
0i
(k ) (max)
i
1,2,...,n; i 1,2,...,m
排关联序
由关联度数值可看出,r03>r01>r02。这表明,三种工 资对工资总额的关联程度的排列顺序为:承包工资、计时 工资、档案工资。即该公路施工企业的工资发展方向是以 承包工资为主导,计时工资和档案工资对工资总额的影响 属于同一水平。