使用SPSS软件进行因子分析和聚类分析的方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
使用SPSS软件进行因子分析和聚类分析的方法
一、方法原理
1.因子分析(FactorAnalysis )
因子分析是从多个变量指标中选择出少数几个综合变量指标的一种降维的多元统计方法。
我们在多元分析中处理的是多指标的问题,观察指标的增加是为了使研究过程趋于完整,但由于指标太多,使得分析的复杂性增加;同时在实际工作中,指标间经常具备一定的相关性,使得观测数据所放映的信息有重叠,故人们希望用较少的指标代替原来较多的指标,但依然能放映原有的全部信息,于是就产生了因子分析方法。
2.聚类分析(ClusterAnlysis )
聚类分析是根据事物本身特性来研究个体分类的统计方法,是按照物以类聚的原则来研究的事物分类。
3.市场细分方法的流程图
1理■業2凳| 1因子A
因孑A
1園不&A
1…因€ i zld
W余五头冒卓巨云奈蓉跻门彳耳字
、实证分析
总人口d生产总值
〔亿J 消费忌霰
〔亿)
人均年工資
(千)
年度总储番
额丿忑亿
年屢阳政
总收入/亿
1启东币U4 33 153 63 50.27io. as ⑵551O.02 2江郡币10S. 69139. ZB 43.3610. &4119.4211用3丹阳币80. 2E 174 T546. 0113.50 95 81 16.62 4如皋市143 S7 他.7& 37.3611.M33 18gm 5Xft市154. 99103. 29 26.00 10.3T 76.61 7.K 6东台市116. 24135 03 36.02 101.60 35.39 3.30 7 如东县109. 36 102. 57 36.8011.&£33.68 3.37 fi沐阳县174. 54 87. 05 21.35 9.15 空⑷ 3 81 Q邳州市158 0492. 6323.798.664J0.24S.70 10海妄县95. 5493 54 26.4411.5S111.7& 8.51 11油县119. 5086. 60IB. 53 8.8453.51 5. W IL姜堰市90. TO36. 33 31.51 10.96 76.40 3.S2 13 射阳县104. TO96. 15 25.509.60 46.43 5 90 14105. 0073. 50 1^.70g.2S40.61 3 85 15丈丰市73. 3T go. so 21芒一9.8€53 33& 31 1&91. gg S7. 8&20.35 9.7S 47.39 4.83 17建湖县79. L2ei. az 23.269.5146.£1 5.82 10 东海县114. 35 5S 2816.24 a.24S8.O4 3.00 10高邯市03 06 TO. SI 20.95 10.2051.53 5 5C 20107.筍SI. 73 19.29 9.5627.4T 3 0E 21丰县LOQ. 0054 2016.80 8.2S28.8& 2 53 22103. DO56. 70 14 60 9 3927 19 3.00 23琵都县35. 0090. 6022.009,7S12.75 5.01 24枚征市50. 35724Q29.0014.56S2 35 11 2S £5m洪103. 00sa go 12.30T.9E22.0& 3
ZE新沂市S5. GO54 £01T.S0 3 31 Z6 15 3 33 2T谨水县103. 0052. 60 14. TO S.D3 1^.41 2.51 2?谨云县107. 23 10. 02 14.51 7.95 1^.65 1 97 29杼中币27 2480. Id i甘.1813.坨51.22 8.31 ?0肝胎县T3. 2256. 6513^810.00 le.^r 3.06 31踝水县40. E3&】,E5 19.71 13. 9T Z2.23 6. H 芳曜南72. T1 瓯470S6 T .95 11.53 2 W 33响水县57. 00瓯47 a. 9T 3.94 15.3& 2.04 34金湖县36. 0431. 4510.409.3517.5& 2.7^
已调查35个城市的总人口、生产总值、消费总额、人均年工资、年度储蓄总额、年度财政总收入等数据,试对上述城市进行分类研究。
1.因子分析:
•选用Analyze —DataReduction —Factor ......
•引入因子分析的6个变量(总人口、生产总值、消费总额、人均年工资、年度总储蓄额、年度财政总收入)
•提取公因子的方法(Method):主成分分析法
•提取(Extract )可选:提取特征值大于1的因子
•旋转(Rotation )的方法:方差最大正交旋转
•因子得分(FactorScores ):作为新变量存入
表 1 方差解释表(Total Variance Explained )
: 我们从阑冶袈格中的5个变蚩中提取出2个公因子,爲弦2个公:
:因干就可臥懈释原姑叢桁申如隔的信息重:
■I
表2旋转后的因子负荷矩阵(Rotated Component Matrix )
■ ----- : 根据原始衷格中的5个变童与新生的2个亞因干之何的
7
:相关程厦,我们为这2牛公因干取名为消寶因于和人口因干:
2.
聚类分析:
•选用 Analyze — Classify —K -MeansCluster ........ •引入聚类分析的2个变量(即上面的2个公因子) -聚类的数目(NumberofClusters ) : 3 类 -聚类方法(Method ):仅分类
-储存新变量(SaveNewVariables ):聚类成员
表 3 各类数量分布表(Number of Cases in each Cluster )
3.
均值多重比较: