(整理)多元统计分析-实验三.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验三
一、实验内容
1、实验背景
近几年,中国房地产业得到了长足的发展,但房地产价格的上涨一直饱受争议,甚至有逃离“北、上、广”的言论,这也从侧面反映了房地产价格的区域性特征。
2、实验目的
根据2008年中国31个省、市、自治区房地市场的房屋平均销售价格、住宅平均销售价格、别墅与高档公寓平均销售价格、经济适用房平均销售价格等九项指标的统计数据(见下表3),对各省市进行区域性分类。
3、实验要求
试根据这些数据分别进行R型和Q型聚类分析。
二、实验报告
1、实验数据
选取全国31个省市地区的房屋平均销售价格、住宅平均销售价格、别墅与高档公寓平均销售价格、经济适用房平均销售价格、办公楼平均销售价格、商业营业用房平均销售价格、其他平均销售价格、商品房销售面积、住宅销售面积等9项指标作为观测量进行分析。数据见下表3。
表3
注:X1:房屋平均销售价格;X2:住宅平均销售价格;X3:别墅、高档公寓平均销售价格;X4:经济适用房平均销售价格;X5:办公楼平均销售价格;X6:商业营业用房平均销售价格;X7:其他平均销售价格;X8:商品房销售面积;X9:住宅销售面积。
2、数据处理
数据中无异常值或缺失值,因此不需要进行处理。
3、数据分析
1)、Q型聚类分析
操作步骤如下:
(1)打开SPSS统计软件,将数据输入数据文件中。
(2)在菜单的选项中选择Analyze→Classify命令,在Classify命令下选择Hierarchical cluster(系统聚类法)。
(3)Cluster下选择Cases单选框。将9个变量移入Variables框中,将省份变量移入Label Cases by框中作为标识变量。
(4)选择Statistics选项,选中Agglomeration schedule复选框;Cluster Membership 栏中选择Range of solution并在其后两个小矩形框中分别填入2和8。单击Continue继续。
(5)选择Plots选项,选中Dendrogram复选框,其他默认,单击Continue继续。(6)选择Method选项,Cluster Method下拉列表中分别选择Between—groups linkage (组间联结法,即类平均法)、Nearest Neighbor(最短距离法)和Furthest Neighbor(最
长距离法);在Measure的Interval下拉列表中选择Squared Euclidean distance;在Transform value栏中Standardize下拉列表中选择range 0 to 1;其他默认,单击Continue 继续。
(7)其他为默认项,单击OK,得到聚类结果如下。
表 3-1-1 聚类凝聚过程表(Q型聚类)
Agglomeration Schedule
Stage Cluster Combined Coefficients Stage Cluster First Appears Next Stage
Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 7 8 .011 0 0 12
2 20 27 .020 0 0 4
3 16 18 .020 0 0 10
4 17 20 .023 0 2 11
5 5 12 .023 0 0 8
6 28 29 .026 0 0 13
7 4 31 .030 0 0 15
8 5 22 .035 5 0 10
9 10 15 .046 0 0 21
10 5 16 .047 8 3 16
11 17 25 .047 4 0 14
12 7 24 .052 1 0 14
13 28 30 .054 6 0 15
14 7 17 .063 12 11 18
15 4 28 .080 7 13 17
16 3 5 .104 0 10 18
17 4 14 .117 15 0 20
18 3 7 .139 16 14 20
19 6 23 .171 0 0 21
20 3 4 .213 18 17 22
21 6 10 .280 19 9 27
22 3 13 .332 20 0 24
23 11 19 .399 0 0 26
24 3 26 .473 22 0 25
25 3 21 .528 24 0 27
26 9 11 .561 0 23 28
27 3 6 .837 25 21 29
28 2 9 .977 0 26 29
29 2 3 1.372 28 27 30
30 1 2 4.491 0 29 0
表 3-1-2 分为2~8类的聚类结果
Cluster Membership
Case 8 Clusters 7 Clusters 6 Clusters 5 Clusters 4 Clusters 3 Clusters 2 Clusters 1:北京 1 1 1 1 1 1 1 2:天津 2 2 2 2 2 2 2 3:河北 3 3 3 3 3 3 2 4:山西 3 3 3 3 3 3 2 5:内蒙古 3 3 3 3 3 3 2 6:辽宁 4 4 4 4 3 3 2 7:吉林 3 3 3 3 3 3 2 8:黑龙江 3 3 3 3 3 3 2 9:上海 5 5 5 5 4 2 2 10:江苏 4 4 4 4 3 3 2 11:浙江 6 6 6 5 4 2 2 12:安徽 3 3 3 3 3 3 2 13:福建 3 3 3 3 3 3 2 14:江西 3 3 3 3 3 3 2 15:山东 4 4 4 4 3 3 2 16:河南 3 3 3 3 3 3 2 17:湖北 3 3 3 3 3 3 2 18:湖南 3 3 3 3 3 3 2 19:广东 6 6 6 5 4 2 2 20:广西 3 3 3 3 3 3 2 21:海南7 7 3 3 3 3 2 22:重庆 3 3 3 3 3 3 2 23:四川 4 4 4 4 3 3 2 24:贵州 3 3 3 3 3 3 2 25:云南 3 3 3 3 3 3 2 26:西藏8 3 3 3 3 3 2 27:陕西 3 3 3 3 3 3 2 28:甘肃 3 3 3 3 3 3 2 29:青海 3 3 3 3 3 3 2 30:宁夏 3 3 3 3 3 3 2 31:新疆 3 3 3 3 3 3 2