SPSS因子分析实例操作步骤
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS因子分析实例操作步骤
实验目的:
引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。
实验变量:
以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。
实验方法:因子分析法
软件:spss19.0
操作过程:
第一步:导入Excel数据文件
1.open data document——open data——open;
2. Opening excel data source——OK.
第二步:
1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量).
2.降维:在最上面菜单里面选中Analyze——Dimension
Reduction——Factor ,变量选择标准化后的数据.
3.点击右侧Descriptive,勾选Correlation Matrix选项组中的Coefficients和
KMO and Bartlett’s text of sphericity,点击Continue.
4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue.
5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue.
6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue.
7.点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为0.60,点击Continue.
8.返回主对话框,单击OK.
输出结果分析:
1.描述性统计量
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
农、林、牧、渔业11 3.27 9.73 7.6645 1.97515
采矿业11 .6 9.5 5.008 2.7092
制造业11 .44 7.07 2.6900 2.22405
电力、热力、燃气及水生产和
11 3.36 15.05 10.3545 3.22751
供应业
建筑业11 1.79 23.51 7.8955 6.18302
批发和零售业11 2.10 18.52 9.1018 5.50553
交通运输、仓储和邮政业11 .82 8.39 2.7891 2.20903
Valid N (listwise) 11
该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。
2.KMO和球形Bartlett检验
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .744
Bartlett's Test of Sphericity Approx. Chi-Square 97.122
df 21
Sig. .000
该表给出了因子分析的KMO和Bartlett检验结果。
从表中可以看出,Bartlett球度检验的概率p值为0.000,即假设被拒绝,也就是说,可以认为相关系数矩阵与单位矩阵有显著差异。
同时,KMO值为0.744,根据KMO 度量标准可知,原变量适合进行因子分析。
3.因子分析的共同度
Communalities
Initial Extraction
Zscore(农、林、牧、渔业) 1.000 .883
Zscore: 采矿业 1.000 .741
Zscore: 制造业 1.000 .974
Zscore(电力、热力、燃气及
1.000 .992
水生产和供应业)
Zscore: 建筑业 1.000 .987
Zscore(批发和零售业) 1.000 .965
Zscore(交通运输、仓储和邮
1.000 .935
政业)
Extraction Method: Principal Component Analysis.
表格所示是因子分析的共同度。
表格第二列显示初始共同度,全部为1.000;第三列是按照提取3个公因子得到的共同度,可以看到只有“采矿业”的共同度稍低,说明其信息丢失量稍严重。
4.因子分析的总方差解释
该表由3部分组成,分别为初始因子解的方差解释、提取因子解的方差解释和旋转因子解的方差解释。
Initial Eigenvalues部分描述了初始因子解的状况。
第一个因子的特征根为3.079,解释7个原始变量总方差的43.992%;第二个因子的特征根为
6. 旋转前的因子载荷矩阵
该表空白处表示相应载荷小于0.3。
因子载荷矩阵中给出每一个变量在三个因子上的载荷。
在旋转前的载荷矩阵中所有变量在第一个因子上的载荷都较高,即与第一个因子的相关程度较高,第一个因子解释了大部分变量的信息;而后面两个因子与原始变量的相关程度较小,对原始变量的解释效果不明显,没有旋转的因子的含义很难解释。
7. 旋转后的因子载荷矩阵
Component Matrix a
Component
1
2
3
Zscore(电力、热力、燃气及水生产和供应业)
.871
Zscore(交通运输、仓储和邮政业) -.860 Zscore: 采 矿 业 .857 Zscore(农、林、牧、渔业) .704 Zscore(批发和零售业) .726 .569 Zscore: 建 筑 业 .687 .364 Zscore: 制 造 业
.600
.793
Extraction Method: Principal Component Analysis. a. 3 components extracted.
该表空白处表示相应载荷小于0.3。
因子载荷矩阵中给出每一个变量在三个因子上的载荷。
在旋转后的载荷矩阵中可以看出,与第一产业相关的产业在第一个因子上的载荷较高,与第二产业相关的产业在第二个因子上的载荷较高,与第三产业相关的产业在第三个因子上的载荷较高。
和没旋转相比,因子的含义清楚很多。
8.旋转空间的因子图
该图为可以看做是旋转后的载荷矩阵的图形表示。
从图中又一次验证了前面旋转后的载荷矩阵对因子的解释。
8.因子得分系数
Component Score Coefficient Matrix
Component
1 2 3
Zscore(农、林、牧、渔业) .445 .075 -.350
Zscore: 采矿业.261 -.054 .093
Zscore: 制造业-.180 .008 .761
Zscore(电力、热力、燃气及
.201 .182 .263
水生产和供应业)
Zscore: 建筑业-.074 .429 .156
Zscore(批发和零售业) .071 .402 -.130
Zscore(交通运输、仓储和邮
-.322 .204 .050
政业)
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
Component Scores.
列出了采用回归法估算的因子得分系数,根据表中的内容可以写出因子得分函数F1=0.445*Zscore1+0.261*Zscore2-0.180*Zscore3+0.201*Zscore4-0.074*Zscore 5+0.071*Zscore6-0.322*Zscore7
F2=0.075*Zscore1-0.054*Zscore2+0.008*Zscore3+0.182*Zscore4-0.429*Zscore 5+0.402*Zscore6-0.204*Zscore7
F3=-0.350*Zscore1+0.093*Zscore2+0.761*Zscore3+0.263*Zscore4+0.156*Zscor e5-0.130*Zscore6+0.050*Zscore7
不仅如此,原数据文件中增加了变量FAC_1和FAC_2、FAC_3,表示3个因子在不同年份的得分值。
9.总因子得分及排序
附件:
原始数据:
标准化后的数据:。