spss案例分析报告报告材料---详细演示

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

spss案例分析---详细演示
1 研究问题
石家庄18个县市14个指标因子,具体来说有人均GDP(元/人)、人均全社会固定资产投资额、人均城镇固定资产投资额、人均一般预算性财政收入、第三产业占GDP比重(%)、人均社会消费品零售额、人均实际利用外资额(万美元/人)、人均城乡居民储蓄存款、农民人均纯收入、在岗职工平均工资、人才密度指数、科技支出占财政支出比重(%)、每万人拥有执业医师数量、每千人拥有病床数。

要求根据这14项内容进行因子分析,得到维度较少的几个因子。

2 实现步骤
【1】在“Analyze”菜单“Data Reduction”中选择“Factor”命令,如下图所示。

【2】在弹出的下图所示的Factor Analysis对话框中,从对话框左侧的变量列表中选择这14个变量,使之添加到Variables框中。

【3】点击“Descriptives”按钮,弹出“Factor Analysis:Descriptives”对话框,如图所示。

Statistics框用于选择哪些相关的统计量,其中:
Univariate descriptives(变量描述):输出变量均值、标准差;
Initial solution (初始结果)
Correlation Matrix框中提供了几种检验变量是否适合做引子分析的检验方法,其中:
Coefficients (相关系数矩阵)
Significance leves (显著性水平)
Determinant (相关系数矩阵的行列式)
Inverse (相关系数矩阵的逆矩阵)
Reproduced (再生相关矩阵,原始相关与再生相关的差值)
Anti-image (反影像相关矩阵检验)
KMO and Bartlett’s test of sphericity (KMO检验和巴特利特球形检
验)
本例中,选中该对话框中所有选项,单击Continue按钮返回Factor Analysis对话框。

【4】单击“Extraction”按钮,弹出“Factor Analysis:Extraction”对话框,选择因子提取方法,如下图所示:
因子提取方法在Method下拉框中选取,SPSS共提供了7种方法:Principle Components Analysis (主成分分析)
Unweighted least squares(未加权最小平方法)
Generalized least squares (综合最小平方法)
Maximum likelihood (最大似然估价法)
Principal axis factoring (主轴因子法)
Alpha factoring (α因子)
Image factoring (影像因子)
Analyze框中用于选择提取变量依据,其中:
Correlation matrix (相关系数矩阵)
Covariance matrix (协方差矩阵)
Extract框用于指定因子个数的标准,其中:
Eigenvaluse over (大于特征值)
Number of factors (因子个数)
Display框用于选择输出哪些与因子提取有关的信息,其中:
Unrotated factor solution (未经旋转的因子载荷矩阵)
Screen plot (特征值排列图)
Maximun interations for Convergence框用于指定因子分析收敛的最大迭代次数,系统默认的最大迭代次数为25。

本例选用Principal components方法,选择相关系数矩阵作为提取因子变量的依据,选中Unrotated factor solution和Scree plot项,输出未经过旋转的
因子载荷矩阵与其特征值的碎石图;选择Eigenvaluse over项,在该选项后面可以输入1,指定提取特征值大于1的因子。

单击Continue按钮返回Factor Analysis对话框。

【5】单击Factor Analysis对话框中的Rotation按钮,弹出Factor Analysis: Rotation对话框,如下图所示:
该对话框用于选择因子载荷矩阵的旋转方法。

旋转目的是为了简化结构,以帮助我们解释因子。

SPSS默认不进行旋转(None)。

Method框用于选择因子旋转方法,其中:
None(不旋转)
Varimax(正交旋转)
Direct Oblimin(直接斜交旋转)
Quanlimax(四分最大正交旋转)
Equamax(平均正交旋转)
Promax(斜交旋转)
Display框用于选择输出哪些与因子旋转有关的信息,其中:
Rotated solution(输出旋转后的因子载荷矩阵)
Loading plots(输出载荷散点图)
本例选择方差极大法旋转Varimax,并选中Rotated solution和Loading plot项,表示输出旋转后的因子载荷矩阵和载荷散点图,单击Continue按钮返回Factor Analysis对话框。

【6】单击Factor Analysis对话框中的Scores按钮,弹出Factor Analysis: Scores对话框,如下图所示:
该对话框用以选择对因子得分进行设置,其中:
Regression(回归法):因子得分均值为0,采用多元相关平方;
Bartlett (巴特利法):因子得分均值为0,采用超出变量范围各因子平方和被最小化;
Anderson-Rubin (安德森-洛宾法):因子得分均值为0,标准差1,彼此不相关;
Display factor score coefficient matrix:选择此项将在输出窗口中显示因子得分系数矩阵。

【7】单击Factor Analysis对话框中的Options按钮,弹出Factor Analysis: Options对话框,如下图所示:
该对话框可以指定其他因子分析的结果,并选择对缺失数据的处理方法,其中:
Missing Values框用于选择缺失值处理方法:
Exclude cases listwise:去除所有缺失值的个案
Exclude cases pairwise:含有缺失值的变量,去掉该案例
Replace with mean:用平均值代替缺失值
Cofficient Display Format框用于选择载荷系数的显示格式:
Sorted by size:载荷系数按照数值大小排列
Suppress absolute values less than:不显示绝对值小于指定值的载荷量本例选中Exclude cases listwise项,单击Continue按钮返回Factor Analysis对话框,完成设置。

单击OK,完成计算。

3 结果与讨论
(1)SPSS输出的第一部分如下:
第一个表格中列出了18个原始变量的统计结果,包括平均值、标准差和分析的个案数。

这个是步骤3中选中Univariate descriptives项的输出结果。

(2)SPSS输出结果文件中的第二部分如下:
该表格给出的是18个原始变量的相关矩阵
Correlation Matrix
人均GDP(元/人) 人均全社会固定
资产投资额
人均城镇固定资
产投资额
Correlation 人均GDP(元/人) 1.000 .503 .707 人均全社会固定资产投资额.503 1.000 .883
人均城镇固定资产投资额.707 .883 1.000 人均一般预算性财政收入.776 .571 .821 第三产业占GDP比重(%) .567 .507 .759 人均社会消费品零售额.737 .247 .600 人均实际利用外资额(万美元/
人)
.454 .356 .648 人均城乡居民储蓄存款.707 .480 .780 农民人均纯收入.559 -.073 .130 在岗职工平均工资.789 .325 .544 人才密度指数.741 .470 .737 科技支出占财政支出比重(%).582 .378 .486 每万人拥有执业医师数量.434 .520 .733 每千人拥有病床数.573 .565 .761
Correlation Matrix
人均一般预算性财政收入第三产业占GDP
比重(%)
人均社会消费品
零售额
Correlation 人均GDP(元/人) .776 .567 .737 人均全社会固定资产投资额.571 .507 .247
人均城镇固定资产投资额.821 .759 .600
人均一般预算性财政收入 1.000 .830 .693
第三产业占GDP比重(%) .830 1.000 .646
人均社会消费品零售额.693 .646 1.000
人均实际利用外资额(万美元/
人)
.797 .822 .616 人均城乡居民储蓄存款.907 .882 .839
农民人均纯收入.132 .278 .516
在岗职工平均工资.736 .548 .609
人才密度指数.795 .745 .812
科技支出占财政支出比重(%).729 .575 .490
每万人拥有执业医师数量.818 .844 .627
每千人拥有病床数.911 .806 .629
人均实际利用外资额(万美元/人)人均城乡居民储
蓄存款农民人均纯收入
Correlation 人均GDP(元/人) .454 .707 .559 人均全社会固定资产投资额.356 .480 -.073
人均城镇固定资产投资额.648 .780 .130
人均一般预算性财政收入.797 .907 .132
第三产业占GDP比重(%) .822 .882 .278
人均社会消费品零售额.616 .839 .516
人均实际利用外资额(万美元/
人)
1.000 .792 -.007
人均城乡居民储蓄存款.792 1.000 .264
农民人均纯收入-.007 .264 1.000
在岗职工平均工资.388 .647 .411
人才密度指数.752 .868 .315
科技支出占财政支出比重(%).570 .626 .210
每万人拥有执业医师数量.795 .885 -.075
每千人拥有病床数.784 .866 .000
Correlation Matrix
在岗职工平均工
资人才密度指数科技支出占财政支出比重(%)
Correlation 人均GDP(元/人) .789 .741 .582 人均全社会固定资产投资额.325 .470 .378
人均城镇固定资产投资额.544 .737 .486
人均一般预算性财政收入.736 .795 .729
第三产业占GDP比重(%) .548 .745 .575
人均社会消费品零售额.609 .812 .490
人均实际利用外资额(万美元/
人)
.388 .752 .570 人均城乡居民储蓄存款.647 .868 .626
农民人均纯收入.411 .315 .210
在岗职工平均工资 1.000 .539 .421
人才密度指数.539 1.000 .577
科技支出占财政支出比重(%).421 .577 1.000
每万人拥有执业医师数量 .477 .739 .519 每千人拥有病床数
.575
.719
.769
Correlation Matrix
每万人拥有执业医师数量
每千人拥有病床

Correlation 人均GDP(元/人)
.434 .573 人均全社会固定资产投资额 .520 .565 人均城镇固定资产投资额 .733 .761 人均一般预算性财政收入 .818 .911 第三产业占GDP 比重(%) .844 .806 人均社会消费品零售额 .627 .629 人均实际利用外资额(万美元/人)
.795
.784
人均城乡居民储蓄存款 .885 .866 农民人均纯收入 -.075 .000 在岗职工平均工资 .477 .575 人才密度指数
.739 .719 科技支出占财政支出比重(%) .519 .769 每万人拥有执业医师数量 1.000 .912 每千人拥有病床数
.912
1.000
(3)SPSS 输出结果的第四部分如下:
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .551
Bartlett's Test
of Sphericity
Approx. Chi-Square 324.227
df 91 Sig.
.000
该部分给出了KMO 检验和Bartlett 球度检验结果。

其中KMO 值为0.551,根据统计学家Kaiser 给出的标准,KMO 取值小于0.6,不太适合因子分析。

Bartlett 球度检验给出的相伴概率为0.00,小于显著性水平0.05,因此拒绝Bartlett 球度检验的零假设,认为适合于因子分析。

(4)SPSS 输出结果文件中的第六部分如下:
Communalities
Initial
Extraction
人均GDP(元/人)
1.000 1.000 人均全社会固定资产投资额 1.000 1.000 人均城镇固定资产投资额 1.000 1.000 人均一般预算性财政收入 1.000 1.000 第三产业占GDP 比重(%) 1.000 1.000 人均社会消费品零售额 1.000 1.000 人均实际利用外资额(万美元/人)
1.000
1.000
人均城乡居民储蓄存款 1.000 1.000 农民人均纯收入
1.000 1.000 在岗职工平均工资 1.000 1.000 人才密度指数
1.000 1.000 科技支出占财政支出比重(%) 1.000 1.000 每万人拥有执业医师数量 1.000 1.000 每千人拥有病床数
1.000
1.000
Extraction Method: Principal Component Analysis.
这是因子分析初始结果,该表格的第一列列出了18个原始变量名;第二列
是根据因子分析初始解计算出的变量共同度。

利用主成分分析方法得到18个特征值,它们是银子分析的初始解,可利用这18个出世界和对应的特征向量计算出银子载荷矩阵。

由于每个原始变量的所有方差都能被因子变量解释掉,因此每个变量的共同度为1;第三列是根据因子分析最终解计算出的变量共同度。

根据最终提取的m 个特征值和对应的特征向量计算出因子载荷矩阵。

(此处由于软件的原因有点小问题)
这时由于因子变量个数少于原始变量的个数,因此每个变量的共同度必然小于1。

(5表格
Component列和Initial Eigenvalues列(第一列到第四列)描述了因子分析初始解对原有变量总体描述情况。

第一列是因子分析13个初始解序号。

第二列是因子变量的方差贡献(特征值),它是衡量因子重要程度的指标,例如第一行的特征值为9.139,后面描述因子的方差依次减少。

第三列是各因子变量的方差贡献率(% of Variance),表示该因子描述的方差占原有变量总方差的比例。

第四列是因子变量的累计方差贡献率,表示前m个因子描述的总方差占原有变量的总方差的比例。

第五列和第七列则是从初始解中按照一定标准(在前面的分析中是设定了提取因子的标准是特征值大于1)提取了3个公共因子后对原变量总体的描述情况。

各列数据的含义和前面第二列到第四列相同,可见提取了5个因子后,它们反映了原变量的大部分信息。

第八列到第十列是旋转以后得到的因子对原变量总体的刻画情况。

各列的含义和第五列到第七列是一样的。

(6)SPSS输出的该部分的结果如下:
表格可以得到如下因子模型:X=AF+aε
x 1=0.959F
1
-0.075F
2
+0.015F
3
+0.158
F 4-0.140F
5
-0.023F
6
-0.096F
7
+0.017F
8
-0.117F
9 +0.004F
10
-0.062F
11
-0.040 F
12
+0.021 F
13

该表格是按照前面设定的方差极大法对因子载荷矩阵旋转后的结果。

未经过旋转的载荷矩阵中,因子变量在许多变量上都有较高的载荷。

经过旋转之后,第一个因子含义略加清楚,基本上放映了“每万人拥有执业医师数量”、“第三产业占GDP比重(%)”、“人均实际利用外资额(万美元/人)”;第二个因子基本上反映了“人均全社会固定资产投资额”、“人均城镇固定资产投资额”;第三个因子反映了“在岗职工平均工资”……
(8)SPSS输出的该部分的结果如下:
该部分输出的是因子转换矩阵,表明了因子提取的方法是主成分分析,旋转的方法是方法极大法。

(9)SPSS输出的该部分的结果如下:
该部分是载荷散点图,这里为3个因子的三维因子载荷散点图,以三个因子为坐标,给出各原始变量在该坐标中的载荷散点图,该图是旋转后因子载荷矩阵的图形化表示方式。

如果因子载荷比较复杂,则通过该图则较容易解释。

Component Score Coefficient Matrix
Component
1 2 3 4 5 6
人均GDP(元/人) -.054 .003 .100 -.090 .046 -.083 人均全社会固定资产投资额-.237 .814 -.049 .044 -.064 .141 人均城镇固定资产投资额-.115 .520 -.158 -.164 .205 .065 人均一般预算性财政收入.045 -.143 .164 .148 -.191 -.083 第三产业占GDP比重(%) .522 -.062 -.111 -.161 .088 -.193 人均社会消费品零售额-.217 .017 -.092 .033 -.194 2.033
.198 -.063 -.026 -.105 .057 -.231 人均实际利用外资额(万美元/
人)
人均城乡居民储蓄存款.251 -.056 -.057 -.091 .018 -.055 农民人均纯收入.125 .045 -.251 -.036 1.119 -.657 在岗职工平均工资-.197 -.079 1.205 -.096 -.183 -.179
Component Score Coefficient Matrix
Component
12 13
人均GDP(元/人) -.549 1.365 人均全社会固定资产投资额.486 .766 人均城镇固定资产投资额-.099 -2.722 人均一般预算性财政收入-1.261 -2.680
第三产业占GDP比重(%) -1.929 4.533
人均社会消费品零售额-1.786 .949
人均实际利用外资额(万美元/
人)
1.034 -1.360
人均城乡居民储蓄存款 5.461 1.572
农民人均纯收入.508 -2.484
在岗职工平均工资.217 -.428
人才密度指数-.435 1.450
科技支出占财政支出比重(%)-.302 -2.555
每万人拥有执业医师数量-2.036 -7.602
每千人拥有病床数.651 6.858
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser
Normalization.
Component Scores.
该表格是因子得分矩阵。

这是根据回归算法计算出来的因子得分函数的系数,根据这个表格可以看出下面的因子得分函数。

F 1=-0.054x
1
+0.003x
2
+0.100x
3
-0.090x
4
+0.046x
5
-0.083x
6
-0.068x
7
+0.000x
8
+3.170
x
9
+ 0.495x
10
-2.090x
11
-0.549x
12
+1.365x
13
……
SPSS根据这13个因子的得分函数,自动计算2-个样本的3个引子得分,并且将3个引子得分作为新变量,保存在SPSS数据编辑窗口中(分别为FAC1_1、FAC2_1、FAC3_1、FAC4_1、FAC5_1、FAC6_1、FAC7_1、FAC8_1、FAC9_1、FAC10_1、FAC11_1、FAC12_1、FAC13_1)
该输出部分是因子变量的协方差矩阵。

在前面已经说明,所得到的因子变量应该是正交、不相关的。

从协方差矩阵看,不同因子之间的数据为0,因而也证实了银子之间是不相关的。

相关文档
最新文档