系统工程实验报告--基于SPSS的聚类分析实验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
西南交通大学
交通运输及物流学院
实验报告
《系统工程》
2014~2015学年第二学期
实验名称:基于SPSS的聚类分析实验
学号姓名: 20121986 罗静
指导教师:蒋赛
实验时间: 2014年4月25号
实验一基于SPSS的聚类分析实验
一、实验背景
数据表示我国商业主要银行的10个综合竞争力指标,人均净利润、净利润率、资产回报率、核心资本充足率、人均费用额、资产负债率、股东权益乘数、不良贷款比率、存款市场份额和贷款市场份额。本实验是基于SPSS利用系统聚类法对这些商业银行的综合竞争力进行评价分析。
二、实验步骤
1.建立SAV格式的数据
2.点击【分析】……【分类】……【系统聚类】,开始进行系统聚类分析。
3.将要分析的变量x1到x10移入变量的列表框中,将Y移入标注个案,用于标注每一个个案。分群中点选个案,表示对样品进行聚类。
4.点击【统计量】,点选“单一方案”,结合实际分析,将银行分为3类较合适,所以在聚类数的方框中填写3,表示此次聚类把样品分为3类。点击“继续”返回系统聚类分析对话框。
5.点击【绘制】,点选“树状图”,以形象地显示聚类的整个过程,点击“继续”返回系统聚类分析对话框。
6.点击【方法】,在转换值框中,下拉对话框,选择Z得分,表示数据标准化到Z分数,其余项保持系统默认状态,点击“继续”返回系统聚类分析对话框。
7.各选项设置完成后,点击确定进行系统聚类。
三、实验结果分析
1. 聚类分析过程表
在表3-1中,根据聚类系数的变化可以得到,第6步的聚类系数是8.1,第5步是6.764,它们相差1.336个单位,第7步和第6步相差3.32个单位,可见,从理论上来说,聚类过程结束于第7步是合理的,此时所有的数据被分为2类,可是当结合实际时,分类数太少,没有办法更好的反映银行之间的差异性,因此我们决定聚类数为3。
表3-1
2.树状图
树状图3-1表示了整个聚类过程
图3-1
3.聚类分析结果显示表
表3-2表示了此次聚类分析的结果,可以看到聚类分析最终分为以下几类:第Ⅰ类:工商银行,建设银行,中国银行。
第Ⅱ类:交通银行,光大银行,深发银行,浦发银行。
第Ⅲ类:中信银行,民生银行,招商银行。
表3-2
四、实验心得
通过本次实验,我学会了使用SPSS对样本进行系统聚类分析,在实验的过程中收获颇多,但仍然存在很多问题,对于实验结果的树状图冰柱图的读解还存在一定的问题,对实验结果中系数的实际含义理解上也存在一些问题。在本次实验数据中,指标有10个,变量数目过多,我认为在做聚类分析之前也可以结合主成分分析,先对变量做一个降维过程,在对样本做聚类分析,这样的结果会更加优越,然而由于主成分分析对数据要求较高,我在用此次数据做主成分分析时,发现结果并不是很理想,提取的两个公因子对变量的贡献率只有81.596%,在贷款市场份额,存款市场份额,不良贷款比率,核心资本充足率指标上的解释,两个因子显得含糊不清,它们的载荷系数区别并不明显,因此,我认为该结合实际情况适当将因子分析和聚类分析相结合。
聚类分析在物流领域中应用广泛,例如物流园区空间类型定位中的应用,区域物流中心综合评价,多级物流配送中心选址中的应用等等。
五、参考资料
[1] 汪应洛,《系统工程(第4版)》,机械工业主板社,北京,2008
[2] 西南交通大学交通运输及物流学院,系统工程,《案例及实验指导》,2011
[3] 王璐,王沁,《统计软件SPSS完全学习手册及实战精粹》,化学工业出版社,北京,2013
西南交通大学
交通运输及物流学院
实验报告
《系统工程》
2014~2015学年第二学期
实验名称:基于SPSS的主成分分析实验
学号姓名: 20121986 罗静
指导教师:蒋赛
实验时间: 2014年4月25号
实验二基于SPSS主成分分析实验
一、实验背景
数据表示某市居民2000年到2007年的消费结构,具体表示为食品,衣着,家庭设备用品及服务、医疗保健、交通和通信、文化娱乐服务、居住及杂项商品及服务。据此定量得研究该市居民的消费结构。
二、实验步骤
1.建立实验数据,输入实验数据
2.对数据进行主成分分析,具体步骤为:
【分析】……【降维】……【因子分析】
3.将要分析的变量移入变量的对话框中
4.点击【描述】进行设置,勾选“单变量描述性”以为主成分分析提供一个直观的分析结果,其余项保持系统默认状态,点击“继续”返回因子分析对话框。
5.点击【抽取】进行设置,方法选择“主成分”,其余项保持系统默认状态,点击“继续”返回因子分析对话框。
6.点击【旋转】进行设置,使得因子变量更具有解释性,方法选择“最大方差法”,使每个因子具有最高载荷的变量数最小,以简化对因子的解释,点击“继续”返回因子分析对话框。
7.点击【得分】进行设置,勾选“保存为变量”,将因子得分作为新变量保存在数据文件中,此时激活方法选项,再勾选“回归”,此方法使得因子得分的均值为“0”,勾选“显示因子得分系数矩阵”,点击“继续”返回因子分析对话框。
8.点击【选项】进行设置,系数显示格式中勾选“按大小排序”,将载荷系数按大小排列构成矩阵,使在同一因子上具有较高载荷的变量排列在一起,以便于得出结论,其余项保持系统默认状态,点击“继续”返回因子分析对话框。
9.各选项设置完成后,单击“确认”进行主成分分析。
三、实验结果分析
1.描述性统计表
表3-1显示了食品、衣着等八个消费指标的描述性统计量,从中可以看出,食品消费所占的比重最大,其均值为39.475%。其次是文化娱乐服务和居住,医疗保健和杂项占的比重则比较小。