模糊聚类分析法在经济区域划分中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浙江 11,安徽 12,福建 13,江西 14,山东 15,河南 16,湖北 17,湖南 18,广东 19,广 西 20,海南 21,四川 22,贵州 23,云南 24,西藏 25,陕西 26,甘肃 27,青海 28,宁夏 29,新疆 30。 (2)对各经济指标进行说明
Y :GDP, X1 :居民消费水平, X 2 :固定资产投资, X 3 :职工平均工资, X 4 :货
1. 引 言
“十一五”期间我国区域经济发展仍面临区域发展不平衡这一核心问题。目前东中西部 人均差距不断扩大;外贸和利用外资不平衡,东部地区处于绝对优势地位;市场经济体制发 展和产业结构调整不均衡,东部地区逐渐与国际接轨的同时,中西部地区却在所有制结构和 产业结构上的调整缓慢。缓慢的经济发展和区域经济发展不平衡等因素严重制约了我国的经 济建设,因而必须坚持从实际出发,深入分析各个地区经济发展的历史过程与现状,贯彻因 时、因地制宜的原则,对处于不同发展阶段的地区经济采取不同的管理策略和方法。正确把 握我国经济发展规律,找准经济发展的薄弱环节和经济发展的不平衡区域,宏观上给予倾斜 性政策调控促使我国经济快速发展。
则称 R = (rij )n×n 是一个模糊相似关系。
定义 3 设给定模糊矩阵 R = (rij ), 对任意 λ ∈[0,1] ,记 Rλ = (λrij ) ,其中:
⎧1 λrij = ⎨⎩0
rij ≥ λ rij < λ
则称 Rλ = (λrij ) 为 R 的 λ 截矩阵。
定义 4 记 ( A, B) = [ AiB + (1− A B)] 2 ,则 ( A, B) 称之为 A 和 B 的贴近度。
物周转量, X 5 :居民消费价格指数, X 6 :商品零售价格指数, X 7 :工业总产值。 kmn :
第 n 个省市的第 m 个经济指标的数值。其中 n = (1,2,3,…,30), m = (1,2,…,8)。
-3-
http://www.paper.edu.cn
3.2 影响我国经济发展的主要因素 利用已知数据建立矩阵 Y = [ y1 , y2 , y3 … y30 ]T , X = [xn1, xn2 , xn3 … xn7 ]T ,
2.1 相关定义与定理 定义 1 设给定的论域U 上的一个模糊关系 R = (rij )n×n 如果它满足: (1)自反性 rii = 1。 (2)对称性 rij = rji (i, j = 1, 2 n) 。 (3)传递性 R R ⊆ R 。 则称 R = (rij )n×n 是一个模糊等价关系。 在这个定义中直观地看,自反性是矩阵的对角线上的元素全是 1。对称性是 R 为对称矩
8144 6501 4839 4721 4134 4911 4430 4145 9279 5943 6619 4609 5857 4211 5154 4344 4685 4797 8250 5105 5340 4645 4475 5149 7382 4396 5493 5753 5079 5348
373.9 342.8 2033.3 717.3 781.7 1371.1 497.4 824.8 207.4 1025.5 754.4 908.3 609.3 411.7 1196.6 1574.4 849.0 1011.8 656.5 556.0 232.1 902.3 301.1 310.4
编网法的主要步骤:
(1)通过样本的特征数据,根据实际问题,选择恰当的计算公式计算出 rij ;
(2)建立相似矩阵的截矩阵 Rλ ; (3)选取恰当的 λ 值进行编网,得出符合要求的分类。
3. 模糊聚类分析法经济区域划分中的应用
3.1 符号说明
(1)对各省市编号 北京 1,天津 2,河北 3,山西 4,内蒙 5,辽宁 6,吉林 7,黑龙江 8,上海 9,江苏 10,
-1-
http://www.paper.edu.cn
阵,即 rij = rji 。而传递性却不易直接看出,需要计算 R R (并记作 R2 ),它表示 R 和它
Βιβλιοθήκη Baidu
自身的合成,然后看其是否满足: R R ⊆ R 。
表 1 某年 30 个省市自治区(重庆)除外的经济发展指标
省份
居民消 商品零
居民消 固定资产 职工平 货物周转
843.43 582.51 1234.85 697.25 419.39 1840.55 762.47 1240.37 1642.95 2026.64 916.59 824.14 433.67 571.84 2207.69 1367.92 1220.72 843.83 1396.35 554.97 64.33 1431.81 324.72 716.65
定理 1 若模糊关系矩阵 R 是模糊等价关系,则对于任意 λ ∈[0,1] ,所截得 λ 截矩阵 Rλ
也是等价关系。
根据这个定理可以知道,模糊等价关系 R 确定之后,对给定的 λ ∈[0,1] ,便可相应得
到一普通等价关系 Rλ ,这也就是说可以决定一个 λ 水平的分类。
定理 2 若 0 ≤ λ1 ≤ λ2 ≤ 1 则 Rλ2 所分出的每一类必是 Rλ1 的某一类的子类。 该定理所述的性质是说明 Rλ2 的分法比 Rλ1 的分法细。
为了对我国各经济区域经济发展水平有较清晰、较具体的认识,本文根据某年我国 30 个省市自治区(重庆除外)经济发展情况的八项指标的统计数据(来源于中国统计年鉴)采 用模糊聚类分析方法按各省市自治区经济发展济发展指标对我国的经济区域进行聚类分析。
2. 模糊聚类分析方法
聚类分析是指对事物按一定要求进行分类的数学方法。聚类分析是数理统计中研究“物 以类聚”的一种多元分析方法,即用数学定量地确定样品的亲疏关系,从而客观地分型划类。 由于事物本身在很多情况下都带有模糊性,因此把模糊数学的方法引入聚类分析,就能使分 类更切合实际。模糊聚类分析应用广泛,如在气象预报、地质、环境、林业、农业科学、经 济等多方面已取得可喜的成果。如:王立新和刘华民利用模糊聚类法对我国城市内河水质污 染分类作出了研究[1];田丽等利用模糊聚类法对水环境质量进行了评价[2];王云峰和杨冬利 用模糊聚类分析法对山东区域经济进行了分类与研究[3]。
3.3 经济区域划分
3.3.1 建立模糊集合
设 An 表示第 n 个省市的经济指标的信息量,按照模糊集的定义,各信息量可看成正态
模糊集。建立其正态型的隶属函数有:
−( k −an )2
μAn (k ) = e bn
其中:
∑ ∑ an
=
1 10
8
kmn ,
m=1
bn =
1 9
8 m=1
(kmn
−
an
)2
http://www.paper.edu.cn
模糊聚类分析法在经济区域划分中的应用
徐鹏1,杨甲2,蔡成标1
1 西南交通大学 牵引动力国家重点实验室,四川 成都 (610031) 2 同济大学 交通运输工程学院,上海 (201804)
E-mail: gslzxupeng@163.com
摘 要:本文针对经济区域划分问题,利用 Matlab 软件绘制出经济指标所占 GDP 权重的分布 图,得出影响经济发展的主要因素。同时采用模糊数学原理利用贴近度建立模糊相似矩阵, 由编网法聚类得到经济区域划分的结果。 关键词:模糊聚类分析;经济区域划分;模糊数学;编网法 中图分类号:F224.7
5.57 600.98 468.79 105.80 114.40 428.76
定义 2 设给定的论域U 上的一个模糊关系 R = (rij )n×n 如果它满足: (1)自反性 rii = 1。
-2-
http://www.paper.edu.cn
(2)对称性 rij = rji (i, j = 1, 2 n) 。
4.2 500.9 507.0 61.6 121.8 339.0
117.3 115.2 115.2 116.9 117.5 116.1 115.2 116.1 118.7 115.8 116.6 114.8 115.2 116.9 117.6 116.5 120.0 119.0 114.0 118.4 113.5 118.5 121.4 121.3 117.3 119.0 119.8 118.0 117.1 119.7
2505 2720 1258 1250 1387 2397 1872 2334 5343 1926 2249 1254 2320 1182 1527 1034 1527 1408 2699 1314 1814 1261 942 1261 1110 1208 1007 1445 1355 1469
519.01 345.46 704.87 290.90 250.23 387.99 320.45 435.73 996.48 1434.95 1006.39 474.00 553.97 282.84 1229.55 670.35 571.68 422.61 1639.83 382.59 198.35 822.54 150.84 334.00 17.87 300.27 114.81 47.76 61.98 376.95
式(3.2)中 an 及 bn 为经济指标的均值与均方差。
n = (1,2,3,…,30)(3.1) m = (1,2,3,…,30)(3.2)
3.3.2 利用贴近度建立模糊相似矩阵
设 Ai , Aj ( i, j = 1,2,3,…,30)来自于以 30 个省市信息量为论域中的任意两个正
态型模糊集合有:
n =(1,2,3,…,30),通过 Matlab 软件编程,求解经济指标矩阵 X 相对于 GDP 矩阵Y 的
权重的分布图如下:
图 1 经济指标矩阵 X 相对于 GDP 矩阵 Y 的权重的分布图
图 2 分布图的拟合程度
由图 1 知前两个指标即居民消费水平,固定资产投资所占权重大,故这是影响我国经济 发展的主要因素。居民消费水平是经济活动的起点和归宿,也是推动经济增长的重要因素。 一国一地的经济要实现持续性的有效增长,居民消费才是真正的原动力。特别是提高农村居 民的生活水平,缩小城乡差距,以保证居民消费水平的提高,居民消费和固定资产投资是经 济增长的两大助推器,对经济发展水平用决定性的作用。
2.2 编网法
对于模糊聚类我们一般选取一种标定方法来构成模糊矩阵,往往只满足自反性和对称 性,而不一定满足传递性,即这种模糊关系属于模糊相似关系。这就要求我们首先由模糊相 似关系改造成模糊等价关系,然后再完成聚类分析。为此有不少人企图寻求直接由模糊相似 矩阵直接进行聚类的方法,在 1979 年吴望名曾提出最大树的方法,在 1980 年赵汝怀又提出 编网法[4][5],这两种方法都避免了矩阵自乘,因此显得很方便。本文主要采用编网法进行聚 类。
112.6 110.6 115.8 115.6 116.8 114.0 114.2 114.3 113.0 114.3 113.5 112.7 114.4 115.9 114.2 114.9 116.6 115.5 111.6 116.4 111.3 117.0 117.2 118.1 114.9 117.0 116.5 116.3 115.3 116.7
工业总产
GDP
费价格 售价格
费水平
投资
均工资
量
值
指数
指数
北京 天津 河北 山西 内蒙 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆
1394.89 920.11 2849.52 1092.48 832.88 2793.37 1129.20 2014.53 2462.57 5155.25 3524.79 2003.58 2160.52 1205.11 5002.34 3002.74 2391.42 2195.70 5381.72 1606.15 364.17 3534.00 630.07 1206.68 55.98 1000.03 553.35 165.31 169.75 834.57
由定义 4 有:
−⎛⎜
k
−ai
⎞2 ⎟
Ai = e ⎝ bi ⎠
A i A = e i j
⎛ −⎜⎜⎝
ai bi
−a j +bj
⎞2 ⎟⎠⎟
A =e ⎛ −⎜⎜⎝
Y :GDP, X1 :居民消费水平, X 2 :固定资产投资, X 3 :职工平均工资, X 4 :货
1. 引 言
“十一五”期间我国区域经济发展仍面临区域发展不平衡这一核心问题。目前东中西部 人均差距不断扩大;外贸和利用外资不平衡,东部地区处于绝对优势地位;市场经济体制发 展和产业结构调整不均衡,东部地区逐渐与国际接轨的同时,中西部地区却在所有制结构和 产业结构上的调整缓慢。缓慢的经济发展和区域经济发展不平衡等因素严重制约了我国的经 济建设,因而必须坚持从实际出发,深入分析各个地区经济发展的历史过程与现状,贯彻因 时、因地制宜的原则,对处于不同发展阶段的地区经济采取不同的管理策略和方法。正确把 握我国经济发展规律,找准经济发展的薄弱环节和经济发展的不平衡区域,宏观上给予倾斜 性政策调控促使我国经济快速发展。
则称 R = (rij )n×n 是一个模糊相似关系。
定义 3 设给定模糊矩阵 R = (rij ), 对任意 λ ∈[0,1] ,记 Rλ = (λrij ) ,其中:
⎧1 λrij = ⎨⎩0
rij ≥ λ rij < λ
则称 Rλ = (λrij ) 为 R 的 λ 截矩阵。
定义 4 记 ( A, B) = [ AiB + (1− A B)] 2 ,则 ( A, B) 称之为 A 和 B 的贴近度。
物周转量, X 5 :居民消费价格指数, X 6 :商品零售价格指数, X 7 :工业总产值。 kmn :
第 n 个省市的第 m 个经济指标的数值。其中 n = (1,2,3,…,30), m = (1,2,…,8)。
-3-
http://www.paper.edu.cn
3.2 影响我国经济发展的主要因素 利用已知数据建立矩阵 Y = [ y1 , y2 , y3 … y30 ]T , X = [xn1, xn2 , xn3 … xn7 ]T ,
2.1 相关定义与定理 定义 1 设给定的论域U 上的一个模糊关系 R = (rij )n×n 如果它满足: (1)自反性 rii = 1。 (2)对称性 rij = rji (i, j = 1, 2 n) 。 (3)传递性 R R ⊆ R 。 则称 R = (rij )n×n 是一个模糊等价关系。 在这个定义中直观地看,自反性是矩阵的对角线上的元素全是 1。对称性是 R 为对称矩
8144 6501 4839 4721 4134 4911 4430 4145 9279 5943 6619 4609 5857 4211 5154 4344 4685 4797 8250 5105 5340 4645 4475 5149 7382 4396 5493 5753 5079 5348
373.9 342.8 2033.3 717.3 781.7 1371.1 497.4 824.8 207.4 1025.5 754.4 908.3 609.3 411.7 1196.6 1574.4 849.0 1011.8 656.5 556.0 232.1 902.3 301.1 310.4
编网法的主要步骤:
(1)通过样本的特征数据,根据实际问题,选择恰当的计算公式计算出 rij ;
(2)建立相似矩阵的截矩阵 Rλ ; (3)选取恰当的 λ 值进行编网,得出符合要求的分类。
3. 模糊聚类分析法经济区域划分中的应用
3.1 符号说明
(1)对各省市编号 北京 1,天津 2,河北 3,山西 4,内蒙 5,辽宁 6,吉林 7,黑龙江 8,上海 9,江苏 10,
-1-
http://www.paper.edu.cn
阵,即 rij = rji 。而传递性却不易直接看出,需要计算 R R (并记作 R2 ),它表示 R 和它
Βιβλιοθήκη Baidu
自身的合成,然后看其是否满足: R R ⊆ R 。
表 1 某年 30 个省市自治区(重庆)除外的经济发展指标
省份
居民消 商品零
居民消 固定资产 职工平 货物周转
843.43 582.51 1234.85 697.25 419.39 1840.55 762.47 1240.37 1642.95 2026.64 916.59 824.14 433.67 571.84 2207.69 1367.92 1220.72 843.83 1396.35 554.97 64.33 1431.81 324.72 716.65
定理 1 若模糊关系矩阵 R 是模糊等价关系,则对于任意 λ ∈[0,1] ,所截得 λ 截矩阵 Rλ
也是等价关系。
根据这个定理可以知道,模糊等价关系 R 确定之后,对给定的 λ ∈[0,1] ,便可相应得
到一普通等价关系 Rλ ,这也就是说可以决定一个 λ 水平的分类。
定理 2 若 0 ≤ λ1 ≤ λ2 ≤ 1 则 Rλ2 所分出的每一类必是 Rλ1 的某一类的子类。 该定理所述的性质是说明 Rλ2 的分法比 Rλ1 的分法细。
为了对我国各经济区域经济发展水平有较清晰、较具体的认识,本文根据某年我国 30 个省市自治区(重庆除外)经济发展情况的八项指标的统计数据(来源于中国统计年鉴)采 用模糊聚类分析方法按各省市自治区经济发展济发展指标对我国的经济区域进行聚类分析。
2. 模糊聚类分析方法
聚类分析是指对事物按一定要求进行分类的数学方法。聚类分析是数理统计中研究“物 以类聚”的一种多元分析方法,即用数学定量地确定样品的亲疏关系,从而客观地分型划类。 由于事物本身在很多情况下都带有模糊性,因此把模糊数学的方法引入聚类分析,就能使分 类更切合实际。模糊聚类分析应用广泛,如在气象预报、地质、环境、林业、农业科学、经 济等多方面已取得可喜的成果。如:王立新和刘华民利用模糊聚类法对我国城市内河水质污 染分类作出了研究[1];田丽等利用模糊聚类法对水环境质量进行了评价[2];王云峰和杨冬利 用模糊聚类分析法对山东区域经济进行了分类与研究[3]。
3.3 经济区域划分
3.3.1 建立模糊集合
设 An 表示第 n 个省市的经济指标的信息量,按照模糊集的定义,各信息量可看成正态
模糊集。建立其正态型的隶属函数有:
−( k −an )2
μAn (k ) = e bn
其中:
∑ ∑ an
=
1 10
8
kmn ,
m=1
bn =
1 9
8 m=1
(kmn
−
an
)2
http://www.paper.edu.cn
模糊聚类分析法在经济区域划分中的应用
徐鹏1,杨甲2,蔡成标1
1 西南交通大学 牵引动力国家重点实验室,四川 成都 (610031) 2 同济大学 交通运输工程学院,上海 (201804)
E-mail: gslzxupeng@163.com
摘 要:本文针对经济区域划分问题,利用 Matlab 软件绘制出经济指标所占 GDP 权重的分布 图,得出影响经济发展的主要因素。同时采用模糊数学原理利用贴近度建立模糊相似矩阵, 由编网法聚类得到经济区域划分的结果。 关键词:模糊聚类分析;经济区域划分;模糊数学;编网法 中图分类号:F224.7
5.57 600.98 468.79 105.80 114.40 428.76
定义 2 设给定的论域U 上的一个模糊关系 R = (rij )n×n 如果它满足: (1)自反性 rii = 1。
-2-
http://www.paper.edu.cn
(2)对称性 rij = rji (i, j = 1, 2 n) 。
4.2 500.9 507.0 61.6 121.8 339.0
117.3 115.2 115.2 116.9 117.5 116.1 115.2 116.1 118.7 115.8 116.6 114.8 115.2 116.9 117.6 116.5 120.0 119.0 114.0 118.4 113.5 118.5 121.4 121.3 117.3 119.0 119.8 118.0 117.1 119.7
2505 2720 1258 1250 1387 2397 1872 2334 5343 1926 2249 1254 2320 1182 1527 1034 1527 1408 2699 1314 1814 1261 942 1261 1110 1208 1007 1445 1355 1469
519.01 345.46 704.87 290.90 250.23 387.99 320.45 435.73 996.48 1434.95 1006.39 474.00 553.97 282.84 1229.55 670.35 571.68 422.61 1639.83 382.59 198.35 822.54 150.84 334.00 17.87 300.27 114.81 47.76 61.98 376.95
式(3.2)中 an 及 bn 为经济指标的均值与均方差。
n = (1,2,3,…,30)(3.1) m = (1,2,3,…,30)(3.2)
3.3.2 利用贴近度建立模糊相似矩阵
设 Ai , Aj ( i, j = 1,2,3,…,30)来自于以 30 个省市信息量为论域中的任意两个正
态型模糊集合有:
n =(1,2,3,…,30),通过 Matlab 软件编程,求解经济指标矩阵 X 相对于 GDP 矩阵Y 的
权重的分布图如下:
图 1 经济指标矩阵 X 相对于 GDP 矩阵 Y 的权重的分布图
图 2 分布图的拟合程度
由图 1 知前两个指标即居民消费水平,固定资产投资所占权重大,故这是影响我国经济 发展的主要因素。居民消费水平是经济活动的起点和归宿,也是推动经济增长的重要因素。 一国一地的经济要实现持续性的有效增长,居民消费才是真正的原动力。特别是提高农村居 民的生活水平,缩小城乡差距,以保证居民消费水平的提高,居民消费和固定资产投资是经 济增长的两大助推器,对经济发展水平用决定性的作用。
2.2 编网法
对于模糊聚类我们一般选取一种标定方法来构成模糊矩阵,往往只满足自反性和对称 性,而不一定满足传递性,即这种模糊关系属于模糊相似关系。这就要求我们首先由模糊相 似关系改造成模糊等价关系,然后再完成聚类分析。为此有不少人企图寻求直接由模糊相似 矩阵直接进行聚类的方法,在 1979 年吴望名曾提出最大树的方法,在 1980 年赵汝怀又提出 编网法[4][5],这两种方法都避免了矩阵自乘,因此显得很方便。本文主要采用编网法进行聚 类。
112.6 110.6 115.8 115.6 116.8 114.0 114.2 114.3 113.0 114.3 113.5 112.7 114.4 115.9 114.2 114.9 116.6 115.5 111.6 116.4 111.3 117.0 117.2 118.1 114.9 117.0 116.5 116.3 115.3 116.7
工业总产
GDP
费价格 售价格
费水平
投资
均工资
量
值
指数
指数
北京 天津 河北 山西 内蒙 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆
1394.89 920.11 2849.52 1092.48 832.88 2793.37 1129.20 2014.53 2462.57 5155.25 3524.79 2003.58 2160.52 1205.11 5002.34 3002.74 2391.42 2195.70 5381.72 1606.15 364.17 3534.00 630.07 1206.68 55.98 1000.03 553.35 165.31 169.75 834.57
由定义 4 有:
−⎛⎜
k
−ai
⎞2 ⎟
Ai = e ⎝ bi ⎠
A i A = e i j
⎛ −⎜⎜⎝
ai bi
−a j +bj
⎞2 ⎟⎠⎟
A =e ⎛ −⎜⎜⎝