厦门大学《应用多元统计分析》习题第05章 聚类分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

21.75
6.04
上海
221.11
38.64
12.53
115.65
50.82
5.89
江苏
144.98
29.12
11.67
42.6
27.3
5.74
浙江
169.92
32.75
12.72
47.12
34.35
5
安徽
135.11
23.09
15.62
23.54
18.18
6.39
福建
144.92
21.26
16.96
11001 21081 111 407 14.7 6999 10892 46 294 12.5 6458 9518 76 423 17.7 7212 63861 899 2274 21.0 16790 14805 136 794 15.4 21349 16815 150 717 11.8 24938 13797 139 555 10.9 6034 4641 36 245 8.3 9680 8250 67 376 11.8 4441 3055 70 238 38.6 5728 4454 31 210 11.0 5810 14354 76 429 13.5 14666 30553 120 548 14.5 10709 7847 66 373 12.7 11882 16610 80 623 17.4 10609 10631 60 434 10.0 29751 28859 275 1089 25.1 10989 6793 291 875 69.6 7016 5893 36 170 8.3 13284 3304 12 99 16.5 58290 32450 162 1187 6.5 72793 28798 90 788 11.9 18511 5318 40 231 15.8 5126 12338 60 342 14.6 11413 9392 65 446 15.9 2209 5581 21 203 18.0 2788 2037 8 76 10.1 2146 2127 12 134 21.9 2188 12754 41 180 26.1 30520 30671 593 2000 37.8 3507 34679 205 934 18.8
方法与人们观察到的实际情况较接近。
城市
北京 天津 石家庄 太原 呼和浩特 沈阳
x1
31886 26433 15134 15752 18991 23268
x2
33168 43732 13159 15831 11257 15446
x3
x4
x5
x6
x7
x8
x9
30520 30671 593 2000 37.8 25312 6441 3507 34679 205 934 18.8 18648 1825 11843 10008 49 416 9.5 12306 1044 2975 15248 33 197 22.8 12679 660 3508 4155 21 182 13.5 14116 255 6612 14636 81 557 14.8 14961 1423
5.11 下表是我国 1991-2003 年的固定资产投资价格指数,试对这段时期 进行分段,并据此对我国固定资产投资的价格变化情况进行分析。
年份 指数
1991 1992 1993 1994 1995 1996 1997 109.5 115.3 126.6 110.4 105.9 104.0 101.7
2
大连 长春 哈尔滨 上海 南京 杭州 宁波 合肥 福州 厦门 南昌 济南 青岛 郑州 武汉 长沙 广州 深圳 南宁 海口 重庆 成都 贵阳 昆明 西安 兰州 西宁 银川 乌鲁木齐 南宁 海口
29145 18630 14825 46586 27547 32667 32543 10621 22281 53590 14221 23437 24705 16674 21278 15446 48220 191838 8176 16442 7190 17914 11046 16215 13140 14459 7066 11787 22508 31886 26433
公司 编号
净资产 每股净 总资产 资产负 流动负 每股净 收益率 利润 周转率 债率 债比率 资产
净利润 增长率
总资产 增长率
1
11.09 0.21 0.05 96.98 70.53 1.86 -44.04 81.99
2
11.96 0.59 0.74 51.78 90.73 4.95
7.02
16.11
ຫໍສະໝຸດ Baidu
4.7
-11.56 0.85
7
10.49 0.11 0.35 82.98 99.87 1.02 100.23 30.32
8
11.12 -1.69 0.12 132.14 100 -0.66 -4454.39 -62.75
9
3.41 0.04
0.2 67.86 98.51 1.25 -11.25 -11.43
14
16.55 0.35
0.93 72.31 84.05 2.14 115.95 123.41
15 -24.18 -1.16 0.79 56.26 97.8 4.81 -533.89 -27.74
5.9 下表是某年我国 16 个地区农民支出情况的抽样调查数据,每个地区
调查了反映每人平均生活消费支出情况的六个经济指标。试通过统计分析软
1310 831 1154 6055 1134 1466 1060 359 876 397 483 758 908 1048 1286 705 3727 2199 451 284 1897 1494 345 709 1211 468 175 193 420 6441 1825
资料来源:《中国统计年鉴 2004》
思考与练习
5.1 判别分析与聚类分析有何区别? 5.2 试述系统聚类的基本思想。 5.3 对样品和变量进行聚类分析时,所构造的统计量分别是什么?简要 说明为什么这样构造? 5.4 在进行系统聚类时,不同的类间距离计算方法有何区别?选择距离 公式应遵循哪些原则? 5.5 试述 K-均值法与系统聚类法的异同。 5.6 有序聚类法与系统聚类法有何区别?试述有序聚类法的基本思想。 5.7 检测某类产品的重量,抽了六个样品,每个样品只测了一个指标, 分别为 1,2,3,6,9,11。试用最短距离法、重心法进行聚类分析。 5.8 下表是 15 个上市公司 2001 年的一些主要财务指标,使用系统聚类 法和 K-均值法分别对这些公司进行聚类,并对结果进行比较分析。
城市1x2x3x4x5x6x7x8x9x北京天津石家庄太原呼和浩特沈阳318863316830520306715932000378253126441186481825123061044126796601411625514961142326433437323507346792059341881513413159118431000849416951575215831297515248331972281899111257350841552118213523268154466612146368155714823大连长春哈尔滨上海南京杭州宁波合肥福州厦门南昌济南青岛郑州武汉长沙广州深圳南宁海口重庆成都贵阳昆明西安兰州西宁银川乌鲁木齐南宁海口291452761511001210811114071471756013101387083112451115427305605522190113424667146623691106013901359150538761902439713913483160277581533590813538104813730128616987705288053727310532199131714511481928412440189715274149412181345142557091350512111348946814629175134971931650942025312644118648182518630210456999108924629412514825756164589518764231774658677083721263861899227421027547438531679014805136794154326674982321349168151507171183254347904249381379713955510910621117146034464136245832228121310968082506737611853590931264441305570238386142219205572844543121011023437226345810143547642913524705355061466630553120548145166741402310709784766373127212781708311882166108062317415446887310609106316043410048220
27615 21045 7561 77083 43853 49823 47904 11714 21310 93126 9205 22634 35506 14023 17083 8873 55404 347519 3390 14553 5076 9289 10350 11601 8913 17136 5605 11013 17137 33168 43732
1
件用不同的方法进行系统聚类分析,并比较何种方法与人们观察到的实际情
况较接近。
地区 北京
食品 190.33
衣着 43.77
燃料 9.73
住房 60.54
交通和 通讯
49.01
娱乐教 育文化
9.04
天津
135.2
36.4
10.47
44.16
36.49
3.94
河北
95.21
22.83
9.3
22.44
22.81
3
0
0.03 0.03 181.99 100 -2.98 103.33 21.18
4
11.58 0.13 0.17 46.07 92.18 1.14
6.55 -56.32
5
-6.19 -0.09 0.03 43.3 82.24 1.52 -1713.5 -3.36
6
10
0.47 0.48 68.4
86
年份 1998 1999 2000 2001 2002 2003
指数 99.8 99.6 101.1 100.4 100.2 100.2
3
19.52
21.75
6.73
江西
140.54
21.5
17.64
19.19
15.97
4.94
山东
115.84
30.26
12.2
33.6
33.77
3.85
河南
101.18
23.26
8.46
20.2
20.5
4.3
5.10 根据上题数据通过 SPSS 统计分析软件进行快速聚类运算,并与系 统聚类分析结果进行比较。
17560 13870 12451 27305 22190 24667 23691 13901 15053 19024 13913 16027 15335 13538 13730 16987 28805 31053 13171 14819 12440 15274 12181 14255 13505 13489 14629 13497 16509 25312 18648
5.11 下表是 2003 年我国省会城市和计划单列市的主要经济指标:人均
GDP x1(元)、人均工业产值 x2 (元)、客运总量 x3(万人)、货运总量 x4 (万 吨)、地方财政预算内收入 x5 (亿元)、固定资产投资总额 x6 (亿元)、在岗 职工占总人口的比例 x7 (%)、在岗职工人均工资额 x8(元)、城乡居民年底 储蓄余额 x9 (亿元)。试通过统计分析软件进行系统聚类分析,并比较何种
10
1.16 0.01 0.54 43.7
100
1.03 -87.18 -7.41
11
30.22 0.16
0.4 87.36 94.88 0.53 729.41 -9.97
12
8.19
0.22
0.38 30.31 100
2.73 -12.31 -2.77
13
95.79 -5.2
0.5 252.34 99.34 -5.42 -9816.52 -46.82
2.8
山西
104.78
25.11
6.4
9.89
18.17
3.25
内蒙
128.41
27.63
8.94
12.58
23.99
2.27
辽宁
145.68
32.83
17.79
27.29
39.09
3.47
吉林
159.37
33.38
18.37
11.81
25.29
5.22
黑龙江 116.22
29.57
13.24
13.76
相关文档
最新文档