SPSS作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
物流统计实验作业
<一>:试述聚类分析的基本思想以及SPSS操作的基本步骤?
系统聚类的基本思想是
聚类分析法又称集群分析法,它是研究样品或指标分类问题的一种多元统计方法。寻找一种能客观反应事物之间亲疏关系或合理评价事物性质相似程度的统计量,然后根据这种统计量和规定的分类准则把事物进行分类。
操作步骤:
1. 在SPSS窗口中选择Analyze→Classify→Hierachical Cluster,调出系统聚类分析主界面,并将变量移入Variables框中。在Cluster栏中选择Cases单选按钮,即对样品进行聚类(若选择Variables,则对变量进行聚类)。在Display栏中选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。
2. 点击Statistics按钮,设置在结果输出窗口中给出的聚类分析统计量。这里我们选择系统默认值,点击Continue按钮,返回主界面。
3. 点击Plots,设置结果输出窗口给出的聚类分析统计图。选中Dendrogram复选框和Icicle栏中的None单选按钮,即只给出聚类树形图,而不给出冰柱图。单击Continue,返回主界面。
4. 点击Method,设置系统聚类的方法选项。Cluster Method下拉列表用于指定聚类的方法,包括组间连接法、组内连接法、最近距离法、最远距离法等;Measure栏用于选择对距离和相似性的测度方法;剩下的Transform Values和Transform Measures栏用于选择对原始数据进行标准化的方法。这里我们仍然均沿用系统默认选项。单击Continue,返回主界面。
5. 点击Save按钮,指定保存在数据文件中的用于表明聚类结果的新变量。None表示不保存任何新变量;Single solution表示生成一个分类变量,在其后的矩形框中输入要分成的类数;Range of solutions表示生成多个分类变量。这里我们选择Range of solutions,并在后面的两个矩形框中分别输入2和4,即生成三个新的分类变量,分别表明将样品分为2类、3类和4类时的聚类结果。点击Continue,返回主界面。
6. 点击OK按钮,运行系统聚类过程。
<二>:利用2001年全国31个省自治区各类小康和现代化指数的数据,利用K-均值聚类方法对地区进行聚类分析。并且对SPSS分析的结果进行分析。文件名为“小康指数.sav”。
31个省市自治区小康和现代化指数的K-Means聚类分析结果(一)
这张表展示了3类的初始类中心点的情况。由表可知第二类各指数均是最优的,第一类次之,第三类各指数最不理想。
31个省市自治区小康和现代化指数的K-Means聚类分析结果(二)
表中展示了3个类中心点每次迭代时的偏移情况。由表可知,第一次迭代后,3个类的中心点分别偏移了24.387,6.307.23.579,第三类中心点偏移最大;第二次迭代后,3个类的中心点的偏移均小于指定的判定标准(0.02),聚类分析结束。
31个省市自治区小康和现代化指数的K-Means聚类分析结果(三)
展示了3个类的最终类中心点的情况。由表可知,第二类各指数均是最优的,第一类次之,第三类各指数最不理想。
31个省市自治区小康和现代化指数的K-Means聚类分析结果(四)
表中展示了3个类的类成员情况。第1类(中游水平)有7个省市自治区,第2类(上游水平)有3个省市自治区,第3类(下游水平)有21个省市自治区。
31个省市自治区小康和现代化指数的K-Means聚类分析结果(五)
展示了各指数在不太类的均值比较情况,通过该表可以看出各指数的均值在3类中差异是最著。
31个省市自治区小康和现代化指数的K-Means聚类分析结果(六)
<三>:根据“高校科研研究.sav”的数据,利用层次聚类分析对各省市的高校科研情况进行聚类分析。(1)根据凝聚状态表,利用碎石图对聚类类数进行研究
(2)绘制聚类树形图,说明哪些省市聚在一起。
(3)绘制各类科研指标的均值对比图。
(4)利用方差分析方法分析各类在哪些科研指标上存在差异。
凝聚状态表
碎石图
通过碎石图可以得出:随着类的不断凝聚,类目数的不断减少,类间的距离在逐渐增大。在聚成7类之前,类距增大的幅度较小,形成极为“陡峭的山峰”,但到3类后,类间的距离迅速增大形成极为“平坦的碎石路”。根据类间距离小形成类的相似性大,类间距离大形成类的相似性小的原则,可以找到“山脚”下的“拐点”碎石,以它作为确定分类数目的参考。在本例中,可以考虑聚成3类或4类。
2、31个省市自治区小康和现代化指数的层次聚类分析结果
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
青海 29 ⇩
宁夏 30 ⇩▫
西藏 26 ⇩▫
贵州 24 ⇩▫
海南 21 ⇩▫
云南 25 ⇩⇳⇩
新疆 31 ⇩▫⇔
广西 20 ⇩▫⇔
甘肃 28 ⇩▫⇔
黑龙江 8 ⇩▫⇔
重庆 22 ⇩▫▫⇩⇩⇩⇩⇩⇩⇩⇩⇩
内蒙 5 ⇩⇔⇔
山西 4 ⇩⇔⇔
福建 13 ⇩▫⇔⇔
安徽 12 ⇩▫⇔⇔
吉林 7 ⇩⇳⇩⇔
四川 23 ⇩▫⇔
陕西 27 ⇩▫⇔
河北 3 ⇩▫▫⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩⇩
江西 14 ⇩▫⇔⇔