基于主成分分析和聚类分析的三角洲制造业发展水平研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表 3 主成分与各个指标的相关性 Component Matrixa
Component
1
2
3
VAR00002 VAR00003 VAR00004 VAR00005 VAR00006 VAR00007 VAR00008 VAR00009 VAR00010 VAR00011
.913 .892 .887 .925 .632 -.009 -.326 -.105 .093 .149
144242
51830
52419
扬州
94169
52557
33145
泰州
87660
43971
26654
杭州
188871
72638
52171
宁波
248750
73492
71776
嘉兴
40564
36160
16948
湖州
53133
53522
24526
绍兴
206723
81654
69162
舟山
29501
43885
积(万 积(万 额(万 额(万 产率按 备率 备率 筑面积 润率
平方 米)
平方 米)
元)
元)
总产值 计算 (元/
(元/ 人)
(千瓦 /人)
竣工率 (%)
(%)
人)
上海 15868 6506 1066600 804600 208368 11970 4.0
41.0
4.7
南京 5187 2056 137996 223189 187397 9325
3.8
46.5
1.8
杭州 13612 5031 267628 380702 182136 6539
2.8
40.0
2.1
宁波 9345 3644 449485 475431 158693 6622
2.6
39.0
3.5
嘉兴 2364 1271 39318 46386 116659 5162
2.6
53.7
1
2
3
VAR00002 VAR00003 VAR00004 VAR00005 VAR00006 VAR00007 VAR00008
.239 .234 .232 .242 .166 -.002 -.085
-.113 -.159 .008 .054 .275 .335 .166
-.185 -.169 .101 .025 .093 .314 -.350
根据表 4 我们可以算出每一个主成分用各个变量表示的线性组合。比如第一主成分
Y1=0.239×X1+0.234×X2+0.232×X3+0.242×X4+0.166×X5-0.002×X6-0.85×X7-0.27×X8+0.24×X9+
0.39×X10,进一步我们可以算出各个城市在每个公因子上的得分。
17809
台州
108765
52767
34353
广州
157757
79416
52684
深圳
134281
85260
43817
珠海
39784
48296
18834
佛山
94133
47353
35722
江门
21050
22703
10062
东莞
36392
34320
16757
中山
39139
41457
19744
惠州
28913
表 2 主成分分析的输出结果 Total Variance Explained
Compon ent
Total
Initial Eigenvalues % of Variance Cumulative %
Extraction Sums of Squared Loadings
Total
% of Variance Cumulative %
2. 方法介绍
主成分分析法其原理是降维的思想,把众多变量转化为少数几个综合指标[1]。综合指标保 留了原始变量的主要信息,彼此间又不相关,能使复杂的问题简单化,便于抓住主要特征进行 分析。它是通过适当数学变换,使新变量主成分成为原变量的线性组合,并选取在总信息量中 比例较大的主成分来分析事物的一种特殊的特征提取方法。
地区 上海
表 5 各城市的主成分得分
主成分 1 得分
主成分 2 得分
482034
578283
主成分 3 得分 145857
南京
118835
42796
38566
苏州
80459
44291
33632
无锡
90878
53395
32884
常州
74532
48820
28657
镇江
107045
51543
46140
南通
4.0
39.6
1.9
苏州 5245 2947 182834 52037 141675 6328
4.0
47.2
3.5
无锡 3124 1757 131263 138347 155445 8238
4.1
56.2
5.1
常州 4127 1889 106056 100201 146200 9322
4.1
45.8
3.2 实证分析
3.2.1 主成分分析 本文所采用的主成分分析法具有以下优点。首先,客观性较强。制造业企业发展水平的
评价,属于多指标综合评价问题。传统上大都采用主观赋权的方法, 即根据主观经验或专家评
-2-
中国科技论文在线
http://www.paper.edu.cn
判, 事先设定好综合评价指标体系中各项指标的权重,是一种定性评价方法。主观赋权法尽管
VAR00009
-.027
-.360
.275
VAR00010
.024
-.147
.471
VAR00011
.039
.314
.144
Extraction Method: Principal Component Analysis. Component Scores.
http://www.paper.edu.cn
6.3
38.9
2.5
肇庆 537
167
5738 16244 121341 7074 97.8 31.1
1.4
数据来源:中华人民共和国国家统计局http://www.stats.gov.cn/
产值利 税率 (%)
8.2 5.0 6.6 5.3 6.0 8.0 6.1 4.9 4.2 5.1 6.6 5.7 4.7 6.2 7.4 0.4 7.7 15.3 4.7 3.3 9.0 3.3 9.0 3.3 5.2
施工面积 X1 ,竣工面积 X2 ,利润总额 X3 ,税金总额 X4 ,劳动生产率按总产值计算 X5 ,技术装 备率 X6 ,劳动装备率 X7 ,房屋建筑面积竣工率 X8 ,产值利润率 X9 ,产值利税率 X10 。各地区的 各个指标取值如下表所示:
表 1 长江三角洲与珠江三角洲地区制造业发展水平评价指标原始数据 地区 施工面 竣工面 利润总 税金总 劳动生 技术装 动力装 房屋建 产值利
2.9
44.6
3.1
广州 5463 1520 219390 291917 208349 16302 5.9
27.6
3.2
深圳 5164 1775 128600 253362 249994 7964
8.3
34.4
1.8
珠海 703
301 25357 21755 171078
42.7
4.2
佛山 3264 1343 201945 86716 151408
3.1
镇江 1011 493 265532 92663 148919 10911 4.6
48.8
4.3
南通 17203 6183 381808 90381 170132 6.29
3.6
35.9
3.1
扬州 6425 3306 143257 136386 154437 8443
5.0
51.5
2.5
泰州 8324 3868 116585 151821 126473 4825
41.2 10.7
江门 1257
520
11600 26270 69836 6602
5.7
32.8
2.7
东莞 1485
641
42419 31415 111939 5288
3.1
43.9
4.5
中山 833
386
44009 24641 136689 6987
5.8
46.4
5.8
惠州 857
333 12326 16090 131790
2.5
湖州 1824 651 42795 59818 169654 10760 4.1
35.7
2.5
绍兴 21524 9481 412379 635661 168484 4887
2.3
44.1
2.5
舟山 519
228
8119 15003 143564 10819 4.9
43.9
1.7
Biblioteka Baidu
台州 5669 2529 152424 194326 144331 6861
聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。 它们讨论的对象是一大堆样品,要求能合理地按它们各自的特性来进行合理的分类,这里没有 任何模式可供参考或依循,也就是说是在没有先验知识的情况下进行的。具体进行聚类时,由 于目的、要求不同,因而产生各种不同的聚类方法。常用的聚类方法有: C- 均值聚类法、K- 均 值聚类法、层次聚类分析法等。
-.223 -.315 .016 .108 .544 .662 .328 -.712 -.290 .621
-.297 -.271 .162 .041 .150 .505 -.563 .443 .758 .232
Extraction Method: Principal Component Analysis. a. 3 components extracted.
运用聚类分析将上述地区分为三类。最后,文章对分类结果做了分析,并根据分析结果提出
了提高制造业发展水平的建议。
关键词:制造业,主成分分析,聚类分析
中图分类号:F270
1. 引言
制造业是指经物理变化或化学变化后成为了新的产品,不论是动力机械制造,还是手工 制作;也不论产品是批发销售,还是零售,均视为制造。我国目前处于工业化的中期。纵观 世界各国,大中型国家经济发展过程中工业化阶段不可逾越。我国目前经济增长主要还是依 靠工业,工业占 GDP40%以上,并且每年增长速度比 GDP 增速快 23 个百分点。工业中采 掘业由于受资源的限制,不可能快速增长,因此制造业仍是今后相当长一段时期内经济增长 的主要支柱。因此,研究制造业的发展水平对研究我国经济的发展有重要的意义。
中国科技论文在线
http://www.paper.edu.cn
基于主成分分析和聚类分析的三角洲地区制造业发展 水平研究
张翠翠
东南大学经济管理学院,南京(211189)
E-mail:cuicui_0531@126.com
摘 要:研究制造业发展水平对于研究我国经济发展水平有重要意义。文章首先采用主成分
分析对长江三角洲和珠江三角洲地区的制造业发展水平进行了数据分析,在此基础上,本文
本文首先采用主成分分析对长江三角洲与珠江三角洲地区各个城市制造业发展水平进 行数据分析,并在此基础上,运用 K-均值聚类法将二十五个城市进行分类。
3. 实证过程
3.1 指标建立
-1-
中国科技论文在线
http://www.paper.edu.cn
本着科学性客观性和系统性的原则选取了反映制造业企业发展水平的十个指标,分别为
36994
13688
肇庆
25558
36574
14364
-4-
中国科技论文在线
3.2.2 聚类分析
http://www.paper.edu.cn
运用 SPSS16.0 的 K-Means 聚类方法对上表进行聚类可以得出以下结果:
3.818 1.979 1.610
38.181 19.787 16.095
38.181 57.969 74.064
Extraction Method: Principal Component Analysis.
根据所选主成分所代表的主轴长度之和占了所有主轴长度的之和的大部分的原则我们选 取了三个主成分[3],分别用 Y1 ,Y2 ,Y3 表示。
简单好用, 但由于其存在着赋权的主观性,不考虑指标之间的相关性等明显缺陷,使其评价的
科学性受到质疑, 从而使评价结果缺乏说服力。而主成分分析法是一种客观赋权的评价方法,
克服了上述缺陷。其次, 资料收集容易。各种指标数据可从统计年鉴中获得。因此, 本文所 采用的主成分分析法是可行的[2]。
利用 SPSS16.0 对相关数据进行主成分分析可得到以下结果:
1
3.818
2
1.979
3
1.610
4
.857
5
.750
6
.458
7
.316
8
.116
9
.092
10
.004
38.181 19.787 16.095 8.573 7.496 4.579 3.160 1.164 .921 .045
38.181 57.969 74.064 82.637 90.133 94.711 97.871 99.034 99.955 100.000
从上表我们可以看出主成分一与变量 2、3、4、5、6 相关性较强,主成分二与变量 6、7、 9、11 相关性较强,主成分三与变量 7、8、9、10 相关性较强。
-3-
中国科技论文在线
表 4 主成分与各个指标的线性关系 Component Score Coefficient Matrix
Component