SPSS聚类分析实验报告

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS聚类分析实验报告

一.实验目的:

1、理解聚类分析的相关理论与应用

2、熟悉运用聚类分析对经济、社会问题进行分析、

3、熟练SPSS软件相关操作

4、熟悉实验报告的书写

二.实验要求:

1、生成新变量总消费支出=各变量之和

2、对变量食品支出和居住支出进行配对样本T检验,并说明检验结果

3、对各省的总消费支出做出条形图(用EXCEL做图也行)

4、利用K-Mean法把31省分成3类

5、对聚类分析结果进行解释说明

6、完成实验报告

三.实验方法与步骤

准备工作:把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中。

分析:由于本实验中要对31个个案进行分类,数量比较大,用系统聚类法当然也可以得出结果,但是相比之下在数据量较大时,K均值聚类法更快速高效,而且准确性更高。

四、实验结果与数据处理:

1.用系统聚类法对所有个案进行聚类:

生成新变量总消费支出=各变量之和如图所示:

2. 对变量食品支出和居住支出进行配对样本T检验,如图所示:

得出结论:

3. 对各省的总消费支出做出条形图,如图所示:

4.对聚类分析结果进行解释说明:

K均值分析将这样的城市分为三类:

第一类北京、上海、广东

第二类除第一类第三类以外的

第三类天津、福建、内蒙古、辽宁、山东

第一类经济发展水平高,各项支出占总支出比重高,人民生活水平高。第二类城市位于中西部地区,经济落后,人民消费水平低。第三类城市位于中东部地区,经济发展较好。

迭代历史记录a

迭代 聚类中心内的更改

1 2 3 1 1250.592 1698.865 1216.114 2 416.864 70.786 173.731 3 138.955 2.949 24.819 4 46.318 .123 3.546 5 849.114 319.179 1362.411 6 805.004 15.199 606.915 7 161.001 .724 75.864 8 32.200 .034 9.483 9 6.440 .002 1.185 10

1.288

7.815E-5

.148

初始聚类中心

聚类 1 2 3 食品支出 7776.98 3052.57 5790.72 衣着支出 1794.06 1205.89 1281.25 居住支出

2166.22 1245.00 1606.27 家庭设备及服务支出 1800.19 612.59 972.24 医疗保健支出 1005.54 774.89 617.36 交通和通信支出 4076.46 1340.90 2196.88 文化与娱乐服务支出 3363.25 1229.68 1786.00 其它商品和服务支出 1217.70 331.14 499.30 总消费支出

23200.40

9792.66

14750.02

迭代历史记录a

迭代

聚类中心内的更改

1 2 3

1 1250.59

2 1698.865 1216.114

2 416.864 70.786 173.731

3 138.955 2.949 24.819

4 46.318 .123 3.546

5 849.114 319.179 1362.411

6 805.004 15.199 606.915

7 161.001 .724 75.864

8 32.200 .034 9.483

9 6.440 .002 1.185

10 1.288 7.815E-5 .148

a. 迭代已停止,因为完成了最大次数的迭代。迭代无法收敛。任何中心的最大绝对坐标更改为

1.193。当前迭代为 10。初始中心间的最小距离为578

2.189。

聚类成员

案例号地区聚类距离

1 北京 1 640.096

2 浙江 1 2214.882

3 天津 3 2632.528

4 福建 3 1136.449

5 广东 1 1566.989

6 河北 2 979.543

7 山西 2 1491.089

8 吉林 2 1075.390

9 黑龙江 2 599.152

10 河南 2 598.222

11 甘肃 2 1100.435

12 青海 2 1340.603

13 宁夏 2 667.823

14 新疆 2 850.725

15 内蒙古 3 1033.683

16 辽宁 3 1046.739

17 山东 3 1402.822

18 西藏 2 1676.670

19 广西 2 989.535

20 海南 2 1131.085

21 四川 2 1481.307

22 云南 2 927.830

23 安徽 2 811.211

24 江西 2 420.381

25 湖北 2 777.322

26 湖南 2 1073.337

27 重庆 3 1086.871

28 贵州 2 876.796

29 陕西 2 1161.344

30 上海 1 3635.950

31 江苏 3 616.506

最终聚类中心

聚类

1 2 3

食品支出6758.74 4083.34 5008.89

衣着支出1728.75 1257.76 1649.65

居住支出1771.69 1087.12 1405.68

家庭设备及服务支出1325.54 703.17 977.20

医疗保健支出1073.99 751.25 973.12

交通和通信支出3588.56 1412.74 1950.42

文化与娱乐服务支出2806.81 1155.73 1680.80

其它商品和服务支出816.58 394.99 553.85

总消费支出19870.66 10846.11 14199.60

最终聚类中心间的距离

聚类 1 2 3

1 9870.163 6286.100

2 9870.16

3 3615.509

3 6286.100 3615.509

ANOVA

聚类误差

均方df 均方df

F Sig.

食品支出12552971.192 2 339637.584 28 36.960 .000 衣着支出635822.817 2 66083.731 28 9.621 .001 居住支出894351.288 2 36596.097 28 24.438 .000 家庭设备及服务支出724161.235 2 29902.411 28 24.217 .000 医疗保健支出250143.461 2 36490.474 28 6.855 .004

相关文档
最新文档