第七章:灰色关联度评价方法(10)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
首页 上页 下页 尾页
(min) 0.0006, (max) 0.1857
01(2000)
0.0006 0.1044
0.4 0.1857 0.4 0.1857
0.4191
同样可计算出表6-4中其余关联系数.
表6-4
年份t 2000
01 (t )
0.4191
02 (t)
0.6067
03 (t)
1.0237
0.9847
2004 1.2356 1.1073
1.2833
1.2363
2005 1.4013 1.2156
1.5405
1.3182
首页 上页 下页 尾页
两序列变化的态势是表现在其对应点的间距上.如 果各对应点间距均较小,则两序列变化态势的一致 性强,否则,一致性弱.分别计算各产业产值与GDP 在对应期的间距(绝对差值),结果见表6-3所示.
R&D经费投入强度是指R&D经费占GDP的比重, 是世界各国和国际组织评价科技实力或竞争力 的首选核心指标.下面通过对重庆市1997~ 2003年全社会科技经费投入、R&D经费投入以 及科技活动人数的运行状况进行了全面分析, 并与同期内全国的情况作比较分析.
首页 上页 下页 尾页
表1 1997~2003年期间重庆全社会科技经费投入的运行状况表
年份 项目
1997 1998 1999 2000 2001 2002 2003
重庆全社会科技经费投
入(亿元)
16.01 17.13 19.23 30.2 33.34 36.32 44.48
名义(按现价)增长率
(%)
—
7
12.3
57
10.4 8.94 22.47
重庆国内生产总值(亿
元)(GDP)
1350.1 1429.26 1479.71 1589.34 1749.77 1971.3 2250.56
名义(按现价)增长率
(%)
—
5.86 3.53 7.41 10.1 12.7 14.17
重庆全社会科技经费投
入占GDP的比重
1.19ቤተ መጻሕፍቲ ባይዱ
1.2
1.3
1.9
首页 上页 下页 尾页
重庆市科技投入状况分析及其与经济增长 的灰色关联研究
重庆作为我国长江上游富有活力的经济中心,科 技活动和科技进步的总体态势良好,对重庆市社 会经济发展的贡献越来越大,有力地推动了经济 增长和社会进步。 通过对重庆市1997~2003年科技投入状况的全面 分析,论证了科技投入与经济增长的灰色关联关系
1.000 0.4758) 0.7209
首页 上页 下页 尾页
r0i称为序列x0和xi(i=1,2,3)的灰色关联度.由于
r03 r02 r01, 因而第三产业产值与GDP的关
联度最大,其次是第二产业、第一产业. 可以看出,灰色关联分析需要经过以下几个步骤:
1.确定分析序列
在对研究问题定性分析的基础上,确定一个因变量 因素和多个自变量因素.设因变量数据构成参考序 列 X 0 ,各自变量数据构成比较序列Xi(i 1, 2, , n), n+1个数据序列成成如下矩阵:
首页 上页 下页 尾页
绝对差值阵中最大数和最小数即为最大差和最小
差:
max
1in
0i (k)
(max)
(6.7)
1k N
min
1in
0i (k)
(min)
(6.8)
1k N
4.计算关联系数
对绝对差值阵中数据作如下变换:
0i (k)
(min) (max) 0i (k) (max)
(6.9)
平均可得
r01
1 6
(0.4191
0.3796
0.5808
0.7055
0.3696 0.2881) 0.4571 1
r02 6 (0.6067 0.5178 0.4903 0.8761
0.6141 0.3510) 0.5760
r03
1 6
(0.8687
0.7257
0.5213
0.7338
1 重庆市1997~2003年科技投入情况
首页 上页 下页 尾页
科技投入是反映一个国家和地区的科技实力的 重要指标.科技投入主要由科技财力投入和科技 人力投入两部分组成.科技投入水平,特别是研 究与开发(R&D)经费投入的水平如何,不仅 反映了一个国家或地区的科技实力,而且体现 了政府及全社会对科技事业的支持程度.
首页 上页 下页 尾页
从上边也可以看出,关联度的几何含义为比较序 列与参考序列曲线的相似与一致程度.如果两序 列的曲线形状接近,则两者关联度就较大,反之, 两者关联度就较小.
2. 用灰色关联分析进行综合评价
灰色关联分析的目的是揭示因素间关系的强弱. 其操作对象是因素的时间序列.最终的结果表现 为通过关联度对各比较序列做出排序.综合评价 的对象也可以看作是时间序列(每个被评事物对 应的各项指标值),并且往往需要对这些时间序列 做出排序.因而可以借助于灰色关联分析来进行. 比较序列自然是由被评事物的各项指标值构成
年份 国内生产总值 第一产业 第二产业 第三产业
2000
1988
386
839
763
2001
2061
408
846
808
2002
2335
422
960
953
2003 2750
482
1258
1010
2004
3356
511
1577 1268
2005
3806
561
1893 1352
首页 上页 下页 尾页
这样的问题很有实际意义,一个自然的想法就是分 别将三次产业产值的时间序列与GDP的时间序列 进行比较,为了能够比较,先对各序列进行无量纲化, 这里采用均值化法.各序列的均值分别为:2716, 461.5,1228.83,1025.67,上表中每列数据除以其均值 可得均值化序列(如表6-2所示)
0.8687
2001 0.3796
0.5178
0.7257
2002 0.5808
0.4903
0.5213
2003 0.7055
0.8761
0.7338
2004 0.3696
0.6141
1.000
2005 0.2881
0.3510
0.4758
首页 上页 下页 尾页
最后分别对各产业与GDP的关联系数序列求算术
年份t GDP x0(t) 一产业 x1(t) 二产业 x2(t) 三产业 x3(t)
2000 0.7320 0.8364
0.6828
0.7440
2001 0.7588 0.8819
0.6885
0.7878
2002 0.8597 0.9144
0.7812
0.9291
2003 1.0125 1.0444
GRA分析的核心是计算关联度,下面通过一个例子 来说明计算关联度的思路和方法.
首页 上页 下页 尾页
表6-1是某地区2000-2005年国内生产总值的统计 资料.现在提出这样的问题:该地区三次产业中, 哪一产业的变化与该地区国内生产总值(GDP)的 变化态势更一致?也就是哪一产业与GDP的关联 度最大呢?表6-1 某地区国内生产总值统计资料(百万元)
(min) / (max)
0i (t) / (max)
由于在一般情况下, (min)可能为零(即某个0i (t)
为零)故将上式改进为
(min) / (max)
0i (t) / (max)
在0和1之间取值.
0i (t)
首页 上页 下页 尾页
上式可变形为
0i
(t)
(min) (max) 0i (t) (max)
年份t 2000
01(t)
x0(t) x1(t)
0.1044
02 (t)
x0(t) x2(t)
0.0492
03 (t)
x0(t) x3(t)
0.0119
2001 0.1231
0.0704
0.0289
2002 0.0547
0.0785
0.0694
2003 0.0319
0.0112
0.0278
个比较序列Xi与参考序列X0在第k个期关联程度.
首页 上页 下页 尾页
5.计算关联度
比较序列Xi与参考序列X0的关联程度是通过N个关 联系数(即(6.10)中第i列)来反映的,求平均就可得
到Xi与X0的关联度
r0i
1 N
N
0i (k)
k 1
(6.11)
6.依关联度排序
对各比较序列与参考序列的关联度从大到小 排序,关联度越大,说明比较序列与参考序列 变化的态势越一致.
(6.1)
i 1, 2,3;t 2000, , 2005
0i (t)称为序列xi和序列x0在第t期的灰色关联系 数(或简称为关联系数).
由(6.1)式可以看出, 取值的大小可以控制(max)
对数据转化的影响, 取较小的值,可以提高关联 系数间差异的显著性,因而称 为分辨系数.
利用(6.1)对表6-3中绝对差值0i (t) 进行规范化,取 0.4, 结果见表6-4,以01(2000)计算为例:
第七章 灰色关联度评价法
首页 上页 下页 尾页
首页 上页 下页 尾页
1. 灰色关联分析(GRA)方法
灰色关联分析是一种多因素统计分析方法,它是以 各因素的样本数据为依据用灰色联度来描述因素 间关系的强弱、大小和次序的.
如果样本数据列反映出两因素变化的态势(方向、 大小、速度等)基本一致,则它们之间的关联度较 大;反之关联度较小. 与其他传统的多因素分析 方法相比,灰色关联分析对数据要求较低且计算 量小,便于广泛应用.
计算(6.3)中第一列(参考序列)与其余各列(比较序 列)对应期的绝对差值,形成如下绝对差值矩阵:
01(1)
01 (2)
01(N )
02 (1) 02 (2)
02 (N )
0n (1)
0n
(2)
0n (N ) Nn
其中 0i (k) x0(k) xi (k) (6.6)
i 0,1, , n; k 1, 2, , N
首页 上页 下页 尾页
2.对变量序列进行无量纲化
一般情况下,原始变量序列具有不同的量纲或数量
级,为了保证分析结果的可靠性,需要对变量序列
进行无量纲化.无量纲化后各因素序列形成如下矩
阵:
(X0, X1,
x0 (1)
,
Xn)
x0 (2)
x1(1) x1(2)
xn (1)
xn
(2)
(6.3)
x0 (N ) x1(N )
首页 上页 下页 尾页
得到关联系数矩阵:
01(1)
01
(2)
02 (1) 02 (2)
0n (1)
0n
(2)
(6.10)
01
(
N
)
02 (N )
0n
(
N
)
Nn
式中分辨系数 在(0,1)内取值,一般情况下依据 (6.10)中数据情况多在0.1至0.5取值, 越小越能
提高关联系数间的差异.关联系数 0i (k ) 是不超 过1的正数, 0i (k )越小, 0i (k ) 越大,它反映第i
首页 上页 下页 尾页
( X0, X1,
其中
x0 (1)
,
X n )
x0 (2)
x0
(
N
)
x1(1) x1(2)
x1(N )
xn (1)
xn
(2)
(6.2)
xn
(
N
)
N(
n1)
Xi (xi(1), xi(2), , xi(N ))T ,i 0,1, 2, , n
N为变量序列的长度.
首页 上页 下页 尾页
的序列,那么参考序列是什么呢?考虑到要用 比较序列与参考序列的关联度来对各比较序列 排序,参考序列应该是一个理想的比较标准.受 到距离评价方法的启示,可选最优样本数据作为 参考序列,与其关联度越大则越好.
设用p个指标 x1, x2 , (不, x失p 一般性,设其均为正向
指标),对n个样本进行评价,无量纲化后形成如 下数据矩阵:
xn (N ) N(n1)
常用的无量纲化方法有均值化法(6.4)、初值化法 (6.5)等.
首页 上页 下页 尾页
xi (k)
1 N
xi(k )
N
xi(k )
k 1
(6.4)
xi (k)
xi(k ) xi(1)
(6.5)
i 0,1, , n; k 1, 2, , N
首页 上页 下页 尾页
3.求差序列、最大差和最小差
设(max)和(min)分别表示表6-3中绝对值0i (t)
的最大数和最小数,则
0 (min) 0i (t) (max)
因而 0 (min) 0i (t) 1 (max) (max)
首页 上页 下页 尾页
显一然致性(m弱0i (at,x)反) 越之大,一,说致明性两强序,因列此(x可i和考x0虑)的将变化(m0i (态atx))势取 倒反向,为了规范化后数据在[0,1]内,可考虑
2004 0.1284
0.0477
0.0006
2005 0.1857
0.1392
0.0832
首页 上页 下页 尾页
接下来应该是三个绝对值序列分别求平均再进行 比较,就可以解决问题了.但仔细观察表6-3中的数 据会发现绝对差值数据序列的数据间存在着较大 的数量级差异(最大为0.1587,最小的为0.0006,相差 300多倍),不能直接进行综合,还需要对其进行一次 规范化.
(min) 0.0006, (max) 0.1857
01(2000)
0.0006 0.1044
0.4 0.1857 0.4 0.1857
0.4191
同样可计算出表6-4中其余关联系数.
表6-4
年份t 2000
01 (t )
0.4191
02 (t)
0.6067
03 (t)
1.0237
0.9847
2004 1.2356 1.1073
1.2833
1.2363
2005 1.4013 1.2156
1.5405
1.3182
首页 上页 下页 尾页
两序列变化的态势是表现在其对应点的间距上.如 果各对应点间距均较小,则两序列变化态势的一致 性强,否则,一致性弱.分别计算各产业产值与GDP 在对应期的间距(绝对差值),结果见表6-3所示.
R&D经费投入强度是指R&D经费占GDP的比重, 是世界各国和国际组织评价科技实力或竞争力 的首选核心指标.下面通过对重庆市1997~ 2003年全社会科技经费投入、R&D经费投入以 及科技活动人数的运行状况进行了全面分析, 并与同期内全国的情况作比较分析.
首页 上页 下页 尾页
表1 1997~2003年期间重庆全社会科技经费投入的运行状况表
年份 项目
1997 1998 1999 2000 2001 2002 2003
重庆全社会科技经费投
入(亿元)
16.01 17.13 19.23 30.2 33.34 36.32 44.48
名义(按现价)增长率
(%)
—
7
12.3
57
10.4 8.94 22.47
重庆国内生产总值(亿
元)(GDP)
1350.1 1429.26 1479.71 1589.34 1749.77 1971.3 2250.56
名义(按现价)增长率
(%)
—
5.86 3.53 7.41 10.1 12.7 14.17
重庆全社会科技经费投
入占GDP的比重
1.19ቤተ መጻሕፍቲ ባይዱ
1.2
1.3
1.9
首页 上页 下页 尾页
重庆市科技投入状况分析及其与经济增长 的灰色关联研究
重庆作为我国长江上游富有活力的经济中心,科 技活动和科技进步的总体态势良好,对重庆市社 会经济发展的贡献越来越大,有力地推动了经济 增长和社会进步。 通过对重庆市1997~2003年科技投入状况的全面 分析,论证了科技投入与经济增长的灰色关联关系
1.000 0.4758) 0.7209
首页 上页 下页 尾页
r0i称为序列x0和xi(i=1,2,3)的灰色关联度.由于
r03 r02 r01, 因而第三产业产值与GDP的关
联度最大,其次是第二产业、第一产业. 可以看出,灰色关联分析需要经过以下几个步骤:
1.确定分析序列
在对研究问题定性分析的基础上,确定一个因变量 因素和多个自变量因素.设因变量数据构成参考序 列 X 0 ,各自变量数据构成比较序列Xi(i 1, 2, , n), n+1个数据序列成成如下矩阵:
首页 上页 下页 尾页
绝对差值阵中最大数和最小数即为最大差和最小
差:
max
1in
0i (k)
(max)
(6.7)
1k N
min
1in
0i (k)
(min)
(6.8)
1k N
4.计算关联系数
对绝对差值阵中数据作如下变换:
0i (k)
(min) (max) 0i (k) (max)
(6.9)
平均可得
r01
1 6
(0.4191
0.3796
0.5808
0.7055
0.3696 0.2881) 0.4571 1
r02 6 (0.6067 0.5178 0.4903 0.8761
0.6141 0.3510) 0.5760
r03
1 6
(0.8687
0.7257
0.5213
0.7338
1 重庆市1997~2003年科技投入情况
首页 上页 下页 尾页
科技投入是反映一个国家和地区的科技实力的 重要指标.科技投入主要由科技财力投入和科技 人力投入两部分组成.科技投入水平,特别是研 究与开发(R&D)经费投入的水平如何,不仅 反映了一个国家或地区的科技实力,而且体现 了政府及全社会对科技事业的支持程度.
首页 上页 下页 尾页
从上边也可以看出,关联度的几何含义为比较序 列与参考序列曲线的相似与一致程度.如果两序 列的曲线形状接近,则两者关联度就较大,反之, 两者关联度就较小.
2. 用灰色关联分析进行综合评价
灰色关联分析的目的是揭示因素间关系的强弱. 其操作对象是因素的时间序列.最终的结果表现 为通过关联度对各比较序列做出排序.综合评价 的对象也可以看作是时间序列(每个被评事物对 应的各项指标值),并且往往需要对这些时间序列 做出排序.因而可以借助于灰色关联分析来进行. 比较序列自然是由被评事物的各项指标值构成
年份 国内生产总值 第一产业 第二产业 第三产业
2000
1988
386
839
763
2001
2061
408
846
808
2002
2335
422
960
953
2003 2750
482
1258
1010
2004
3356
511
1577 1268
2005
3806
561
1893 1352
首页 上页 下页 尾页
这样的问题很有实际意义,一个自然的想法就是分 别将三次产业产值的时间序列与GDP的时间序列 进行比较,为了能够比较,先对各序列进行无量纲化, 这里采用均值化法.各序列的均值分别为:2716, 461.5,1228.83,1025.67,上表中每列数据除以其均值 可得均值化序列(如表6-2所示)
0.8687
2001 0.3796
0.5178
0.7257
2002 0.5808
0.4903
0.5213
2003 0.7055
0.8761
0.7338
2004 0.3696
0.6141
1.000
2005 0.2881
0.3510
0.4758
首页 上页 下页 尾页
最后分别对各产业与GDP的关联系数序列求算术
年份t GDP x0(t) 一产业 x1(t) 二产业 x2(t) 三产业 x3(t)
2000 0.7320 0.8364
0.6828
0.7440
2001 0.7588 0.8819
0.6885
0.7878
2002 0.8597 0.9144
0.7812
0.9291
2003 1.0125 1.0444
GRA分析的核心是计算关联度,下面通过一个例子 来说明计算关联度的思路和方法.
首页 上页 下页 尾页
表6-1是某地区2000-2005年国内生产总值的统计 资料.现在提出这样的问题:该地区三次产业中, 哪一产业的变化与该地区国内生产总值(GDP)的 变化态势更一致?也就是哪一产业与GDP的关联 度最大呢?表6-1 某地区国内生产总值统计资料(百万元)
(min) / (max)
0i (t) / (max)
由于在一般情况下, (min)可能为零(即某个0i (t)
为零)故将上式改进为
(min) / (max)
0i (t) / (max)
在0和1之间取值.
0i (t)
首页 上页 下页 尾页
上式可变形为
0i
(t)
(min) (max) 0i (t) (max)
年份t 2000
01(t)
x0(t) x1(t)
0.1044
02 (t)
x0(t) x2(t)
0.0492
03 (t)
x0(t) x3(t)
0.0119
2001 0.1231
0.0704
0.0289
2002 0.0547
0.0785
0.0694
2003 0.0319
0.0112
0.0278
个比较序列Xi与参考序列X0在第k个期关联程度.
首页 上页 下页 尾页
5.计算关联度
比较序列Xi与参考序列X0的关联程度是通过N个关 联系数(即(6.10)中第i列)来反映的,求平均就可得
到Xi与X0的关联度
r0i
1 N
N
0i (k)
k 1
(6.11)
6.依关联度排序
对各比较序列与参考序列的关联度从大到小 排序,关联度越大,说明比较序列与参考序列 变化的态势越一致.
(6.1)
i 1, 2,3;t 2000, , 2005
0i (t)称为序列xi和序列x0在第t期的灰色关联系 数(或简称为关联系数).
由(6.1)式可以看出, 取值的大小可以控制(max)
对数据转化的影响, 取较小的值,可以提高关联 系数间差异的显著性,因而称 为分辨系数.
利用(6.1)对表6-3中绝对差值0i (t) 进行规范化,取 0.4, 结果见表6-4,以01(2000)计算为例:
第七章 灰色关联度评价法
首页 上页 下页 尾页
首页 上页 下页 尾页
1. 灰色关联分析(GRA)方法
灰色关联分析是一种多因素统计分析方法,它是以 各因素的样本数据为依据用灰色联度来描述因素 间关系的强弱、大小和次序的.
如果样本数据列反映出两因素变化的态势(方向、 大小、速度等)基本一致,则它们之间的关联度较 大;反之关联度较小. 与其他传统的多因素分析 方法相比,灰色关联分析对数据要求较低且计算 量小,便于广泛应用.
计算(6.3)中第一列(参考序列)与其余各列(比较序 列)对应期的绝对差值,形成如下绝对差值矩阵:
01(1)
01 (2)
01(N )
02 (1) 02 (2)
02 (N )
0n (1)
0n
(2)
0n (N ) Nn
其中 0i (k) x0(k) xi (k) (6.6)
i 0,1, , n; k 1, 2, , N
首页 上页 下页 尾页
2.对变量序列进行无量纲化
一般情况下,原始变量序列具有不同的量纲或数量
级,为了保证分析结果的可靠性,需要对变量序列
进行无量纲化.无量纲化后各因素序列形成如下矩
阵:
(X0, X1,
x0 (1)
,
Xn)
x0 (2)
x1(1) x1(2)
xn (1)
xn
(2)
(6.3)
x0 (N ) x1(N )
首页 上页 下页 尾页
得到关联系数矩阵:
01(1)
01
(2)
02 (1) 02 (2)
0n (1)
0n
(2)
(6.10)
01
(
N
)
02 (N )
0n
(
N
)
Nn
式中分辨系数 在(0,1)内取值,一般情况下依据 (6.10)中数据情况多在0.1至0.5取值, 越小越能
提高关联系数间的差异.关联系数 0i (k ) 是不超 过1的正数, 0i (k )越小, 0i (k ) 越大,它反映第i
首页 上页 下页 尾页
( X0, X1,
其中
x0 (1)
,
X n )
x0 (2)
x0
(
N
)
x1(1) x1(2)
x1(N )
xn (1)
xn
(2)
(6.2)
xn
(
N
)
N(
n1)
Xi (xi(1), xi(2), , xi(N ))T ,i 0,1, 2, , n
N为变量序列的长度.
首页 上页 下页 尾页
的序列,那么参考序列是什么呢?考虑到要用 比较序列与参考序列的关联度来对各比较序列 排序,参考序列应该是一个理想的比较标准.受 到距离评价方法的启示,可选最优样本数据作为 参考序列,与其关联度越大则越好.
设用p个指标 x1, x2 , (不, x失p 一般性,设其均为正向
指标),对n个样本进行评价,无量纲化后形成如 下数据矩阵:
xn (N ) N(n1)
常用的无量纲化方法有均值化法(6.4)、初值化法 (6.5)等.
首页 上页 下页 尾页
xi (k)
1 N
xi(k )
N
xi(k )
k 1
(6.4)
xi (k)
xi(k ) xi(1)
(6.5)
i 0,1, , n; k 1, 2, , N
首页 上页 下页 尾页
3.求差序列、最大差和最小差
设(max)和(min)分别表示表6-3中绝对值0i (t)
的最大数和最小数,则
0 (min) 0i (t) (max)
因而 0 (min) 0i (t) 1 (max) (max)
首页 上页 下页 尾页
显一然致性(m弱0i (at,x)反) 越之大,一,说致明性两强序,因列此(x可i和考x0虑)的将变化(m0i (态atx))势取 倒反向,为了规范化后数据在[0,1]内,可考虑
2004 0.1284
0.0477
0.0006
2005 0.1857
0.1392
0.0832
首页 上页 下页 尾页
接下来应该是三个绝对值序列分别求平均再进行 比较,就可以解决问题了.但仔细观察表6-3中的数 据会发现绝对差值数据序列的数据间存在着较大 的数量级差异(最大为0.1587,最小的为0.0006,相差 300多倍),不能直接进行综合,还需要对其进行一次 规范化.