完整word版,SPSS聚类分析实验报告.docx
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS 聚类分析实验报告
一.实验目的:
1、理解聚类分析的相关理论与应用
2、熟悉运用聚类分析对经济、社会问题进行分析、
3、熟练 SPSS软件相关操作
4、熟悉实验报告的书写
二.实验要求:
1、生成新变量总消费支出=各变量之和
2、对变量食品支出和居住支出进行配对样本T 检验,并说明检验结果
3、对各省的总消费支出做出条形图(用EXCEL做图也行)
4、利用 K-Mean法把 31 省分成 3 类
5、对聚类分析结果进行解释说明
6、完成实验报告
三.实验方法与步骤
准备工作:把实验所用数据从 Word文档复制到 Excel ,并进一步导入到 SPSS数据文件中。
分析:由于本实验中要对 31 个个案进行分类,数量比较大,用系统聚类法当然也
可以得出结果,但是相比之下在数据量较大时, K 均值聚类法更快速高效,而且准确性更高。
四、实验结果与数据处理:
1.用系统聚类法对所有个案进行聚类:
生成新变量总消费支出 =各变量之和如图所示:
2.对变量食品支出和居住支出进行配对样本 T 检验,如图所示:
得出结论:
3.对各省的总消费支出做出条形图,如图所示:
4.对聚类分析结果进行解释说明:
K均值分析将这样的城市分为三类:
第一类北京、上海、广东
第二类除第一类第三类以外的
第三类天津、福建、内蒙古、辽宁、山东
第一类经济发展水平高,各项支出占总支出比重高,人民生活水平高。第二类城市位于中西部地区,经济落后,人民消费水平低。第三类城市位于中东部地区,经济发展较好。
初始聚类中心
聚类
123
食品支出7776.983052.575790.72衣着支出1794.061205.891281.25居住支出2166.221245.001606.27家庭设备及服务支出1800.19612.59972.24医疗保健支出1005.54774.89617.36交通和通信支出4076.461340.902196.88文化与娱乐服务支出3363.251229.681786.00其它商品和服务支出1217.70331.14499.30总消费支出23200.409792.6614750.02
迭代历史记录a
聚类中心内的更改
迭代123
11250.5921698.8651216.114
2416.86470.786173.731
3138.955 2.94924.819
446.318.123 3.546
5849.114319.1791362.411
6805.00415.199606.915
7161.001.72475.864
832.200.0349.483
9 6.440.002 1.185
10 1.2887.815E-5.148
迭代历史记录a
聚类中心内的更改
迭代123 11250.5921698.8651216.114 2416.86470.786173.731 3138.955 2.94924.819 446.318.123 3.546 5849.114319.1791362.411 6805.00415.199606.915 7161.001.72475.864 832.200.0349.483
9 6.440.002 1.185
10 1.2887.815E-5.148
a.迭代已停止,因为完成了最大次数的迭代。迭
代无法收敛。任何中心的最大绝对坐标更改为
1.193 。当前迭代为10 。初始中心间的最小距离为578
2.189 。
聚类成员
案例号地区聚类距离
1北京1640.096 2浙江12214.882 3天津32632.528 4福建31136.449 5广东11566.989 6河北2979.543 7山西21491.089 8吉林21075.390 9黑龙江2599.152 10河南2598.222 11甘肃21100.435 12青海21340.603 13宁夏2667.823 14新疆2850.725 15内蒙古31033.683 16辽宁31046.739 17山东31402.822 18西藏21676.670 19广西2989.535 20海南21131.085
21四川21481.307
22云南2927.830
23安徽2811.211
24江西2420.381
25湖北2777.322
26湖南21073.337
27重庆31086.871
28贵州2876.796
29陕西21161.344
30上海13635.950
31江苏3616.506
最终聚类中心
聚类
123
食品支出6758.744083.345008.89
衣着支出1728.751257.761649.65
居住支出1771.691087.121405.68
家庭设备及服务支出1325.54703.17977.20
医疗保健支出1073.99751.25973.12
交通和通信支出3588.561412.741950.42
文化与娱乐服务支出2806.811155.731680.80
其它商品和服务支出816.58394.99553.85
总消费支出19870.6610846.1114199.60
最终聚类中心间的距离
聚类123
19870.1636286.100
29870.1633615.509
36286.1003615.509
ANOVA
聚类误差
均方df均方df F Sig.
食品支出12552971.1922339637.5842836.960.000衣着支出635822.817266083.731289.621.001居住支出894351.288236596.0972824.438.000家庭设备及服务支出724161.235229902.4112824.217.000医疗保健支出250143.461236490.47428 6.855.004