《统计分析与SPSS的应用(第五版)》课后练习答案(第11章).doc

合集下载

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第10章SPSS的聚类分析1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。

要求:1)根据凝聚状态表利用碎石图对聚类类数进行研究。

2)绘制聚类树形图,说明哪些省市聚在一起。

3)绘制各类的科研指标的均值对比图。

4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。

采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。

大约聚成4类。

步骤:分析分类系统聚类按如下方式设置……结果:凝聚计划阶段组合的集群系数首次出现阶段集群下一个阶段集群1集群2集群1集群212630002 22629107 32025005 44120015 5820036 6816509 724260210 87110011 9580622 1024317022 11270816 1222280019 136230017 1410190025 154214021 162311021 1761313020 189180025 19142201224 2061517023 2124161526 2252491024 2362720026 24514221928 25910181427 2626212328 2791725029 2825262429 2929282730 30120290将系数复制下来后,在EXCEL中建立工作表。

选中数据列,点击“插入”菜单拆线图……碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。

其他略。

接下来,添加一个变量CLU4_1,其值为类别值。

(1、2、3、4),再数据汇总设置……确定。

均值对比,依据聚类解,利用分类汇总,计算各个聚类变量的均值方差分析结果:分析比较均值单因素ANOVA设置……确定不同组在各个聚类变量上的均值均存在显著差异。

2、试说明当变量存在数量级上的差异,进行层次聚类分析时为什么要对数据进行标准化处理因为数量级将对距离产生较大影响,并影响最终聚类结果。

《统计分析与SPSS的应用(第五版)》课后练习答案(第11章).doc

《统计分析与SPSS的应用(第五版)》课后练习答案(第11章).doc

《统计分析与SPSS的应用(第五版)》课后练习答案第11章SPSS的因子分析1、简述因子分析的主要步骤是什么?因子分析的主要步骤:一、前提条件:要求原有变量之间存在较强的相关关系。

二、因子提取。

三、使因子具有命名解释性:使提取出的因子实际含义清晰。

四、计算样本的因子得分。

2、对“基本建设投资分析.sav”数据进行因子分析。

要求:1)利用主成分方法,以特征根大于1为原则提取因子变量,并从变量共同度角度评价因子分析的效果。

如果因子分析效果不理想,再重新指定因子个数并进行分析,对两次分析结果进行对比。

2)对比未旋转的因子载荷矩阵和利用方差极大法进行旋转的因子载荷矩阵,直观理解因子旋转对因子命名可解释性的作用。

“基本建设投资分析”因子分析步骤:分析→降维→因子分析→导入全部变量到变量框中→详细设置……描述、抽取的设置如下:旋转、得分、选项的设置如下:(1)相关系数矩阵国家预算内资金(1995年、亿元)国内贷款利用外资自筹资金其他投资相关系数国家预算内资金(1995年、亿1.000 .458 .229 .331 .211元)国内贷款.458 1.000 .746 .744 .686利用外资.229 .746 1.000 .864 .776自筹资金.331 .744 .864 1.000 .928其他投资.211 .686 .776 .928 1.000表一是原有变量的相关系数矩阵。

由表可知,一些变量的相关系数都较高,呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。

KMO 和巴特利特检验KMO 取样适切性量数。

.706Bartlett 的球形度检验上次读取的卡方119.614自由度10显著性.000由表二可知,巴特利特球度检验统计量的观测值为119.614,相应的概率P-值接近0.如果显著性水平为0.05,由于概率P-值小于显著性水平α,则应拒绝原假设,认为相关系数矩阵与单位阵有显著差异,原有变量适合做因子分析。

统计分析与SPSS课后习题课后习题答案汇总(第五版)

统计分析与SPSS课后习题课后习题答案汇总(第五版)

第一章练习题答案1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案)英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。

数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据;结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。

3、SPSS的数据集:SPSS运行时可同时打开多个数据编辑器窗口。

每个数据编辑器窗口分别显示不同的数据集合(简称数据集)。

活动数据集:其中只有一个数据集为当前数据集。

SPSS只对某时刻的当前数据集中的数据进行分析。

4、SPSS的三种基本运行方式:完全窗口菜单方式、程序运行方式、混合运行方式。

完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简洁和直观。

程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。

该方式适用于大规模的统计分析工作。

混合运行方式:是前两者的综合。

5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名.spv是结果查看器窗口中的SPSS分析结果文件的扩展名.sps是语法窗口中的SPSS程序6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。

7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。

概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。

《统计分析与SPSS的应用第五版》课后练习答案

《统计分析与SPSS的应用第五版》课后练习答案

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第2章SPSS数据文件的建立和管理1、SPSS中有哪两种基本的数据组织形式各自的特点和应用场合是什么SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。

●原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标。

●计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总后的数据。

2、什么是SPSS的个案什么SPSS的变量个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。

变量:数据编辑器窗口中的一列。

3、在定义SPSS数据结构时,默认的变量名和变量类型是什么如果希望增强SPSS 统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明默认的变量名:VAR------;默认的变量类型:数值型。

变量名标签和变量值标签可增强统计分析结果的可读性。

4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料问:在SPSS中应如何组织该数据数据文件如图所示:5、什么是SPSS的用户缺失值为什么要对用户缺失值进行定义如何在SPSS中指定用户缺失值缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing Value)。

用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。

用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。

系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“”。

在变量视图中定义。

6、从计量尺度角度看,变量包括哪三种主要类型请各举出一个相应的实际数据。

如何在SPSS中指定变量的计算尺度变量类型包括:数值型(身高)、定序型(受教育程度)以及定类型(性别)。

《统计分析与SPSS的应用(第五版)》课后练习答案-(1)

《统计分析与SPSS的应用(第五版)》课后练习答案-(1)

《统计分析与S P S S的应用(第五版)》课后练习答案第一章练习题答案1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案)英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。

●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据;●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。

3、SPSS的数据集:●SPSS运行时可同时打开多个数据编辑器窗口。

每个数据编辑器窗口分别显示不同的数据集合(简称数据集)。

●活动数据集:其中只有一个数据集为当前数据集。

SPSS只对某时刻的当前数据集中的数据进行分析。

4、SPSS的三种基本运行方式:●完全窗口菜单方式、程序运行方式、混合运行方式。

●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简洁和直观。

●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。

该方式适用于大规模的统计分析工作。

●混合运行方式:是前两者的综合。

5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名.spv是结果查看器窗口中的SPSS分析结果文件的扩展名.sps是语法窗口中的SPSS程序6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。

7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。

《统计分析与SPSS的应用(第五版)》课后练习答案

《统计分析与SPSS的应用(第五版)》课后练习答案

《统计分析与SPSS的应用(第五版)》课后练习答案第一章练习题答案1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案)英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。

●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据;●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。

3、SPSS的数据集:●SPSS运行时可同时打开多个数据编辑器窗口。

每个数据编辑器窗口分别显示不同的数据集合(简称数据集)。

●活动数据集:其中只有一个数据集为当前数据集。

SPSS只对某时刻的当前数据集中的数据进行分析。

4、SPSS的三种基本运行方式:●完全窗口菜单方式、程序运行方式、混合运行方式。

●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简洁和直观。

●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。

该方式适用于大规模的统计分析工作。

●混合运行方式:是前两者的综合。

5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名.spv是结果查看器窗口中的SPSS分析结果文件的扩展名.sps是语法窗口中的SPSS程序6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。

7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。

统计分析与SPSS的应用第五版课后练习答案精编版

统计分析与SPSS的应用第五版课后练习答案精编版

统计分析与S P S S的应用第五版课后练习答案公司内部编号:(GOOD-TMMT-MMUT-UUPTY-UUYY-DTTI-《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第3章SPSS数据的预处理1、利用第2章第7题数据,采用SPSS数据筛选功能将数据分成两份文件。

其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。

第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。

第二份文件:选取数据数据——选择个案——随机个案样本——输入70。

2、利用第2章第7题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。

排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。

3、利用第2章第9题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。

计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。

4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。

同时,计算男生和女生各科成绩的平均分。

方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。

分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。

先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。

方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。

数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定5、利用第2章第7题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。

统计分析与SPSS的应用第五版课后练习答案第章

统计分析与SPSS的应用第五版课后练习答案第章

统计分析与S P S S的应用第五版课后练习答案第章Company number:【0089WT-8898YT-W8CCB-BUUT-202108】《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第3章SPSS数据的预处理1、利用第2章第7题数据,采用SPSS数据筛选功能将数据分成两份文件。

其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。

第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。

第二份文件:选取数据数据——选择个案——随机个案样本——输入70。

2、利用第2章第7题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。

排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。

3、利用第2章第9题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。

计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。

4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。

同时,计算男生和女生各科成绩的平均分。

方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。

分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。

先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。

方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。

数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定5、利用第2章第7题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。

最新《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

最新《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第10章SPSS的聚类分析1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。

要求:1)根据凝聚状态表利用碎石图对聚类类数进行研究。

2)绘制聚类树形图,说明哪些省市聚在一起。

3)绘制各类的科研指标的均值对比图。

4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。

采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。

大约聚成4类。

步骤:分析→分类→系统聚类→按如下方式设置……结果:凝聚计划阶段 组合的集群系数 首次出现阶段集群 下一个阶段集群 1集群 2集群 1集群 21 26 30 328.189 0 02 2 26 29 638.295 1 0 73 20 25 1053.423 0 0 54 4 12 1209.922 0 0 15 5 8 201505.035 0 3 6 6 8 16 1760.170 5 0 9 7 24 26 1831.926 0 2 10 8 7 11 1929.891 0 0 11 9 5 8 2302.024 0 6 22 10 24 31 2487.209 7 0 22 11 2 7 2709.887 0 8 16 12 22 28 2897.106 0 0 19 13 6 23 2916.551 0 0 17 14 10 19 3280.752 0 0 25 15 4 21 3491.585 4 0 21 16 2 3 4229.375 11 0 21 17 6 13 4612.423 13 0 20 18 9 18 5377.253 0 0 25 19 14 22 5622.415 0 12 24 20 6 15 5933.518 17 0 23 21 2 4 6827.276 16 15 26 22 5 24 7930.765 9 10 24 23 6 27 9475.498 20 0 26 24 5 14 14959.704 22 19 28 25 9 10 19623.050 18 14 27 26 2 6 24042.669 21 23 28 27 9 17 32829.466 25 0 29 28 2 5 48360.854 26 24 29 29 2 9 91313.530 28 27 30 3012293834.50329选中数据列,点击“插入”菜单 拆线图……碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。

《统计分析与SPSS的应用第五版》课后练习答案

《统计分析与SPSS的应用第五版》课后练习答案

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第2章SPSS数据文件的建立和管理1、SPSS中有哪两种基本的数据组织形式?各自的特点和应用场合是什么?SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。

●原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标。

●计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总后的数据。

2、什么是SPSS的个案?什么SPSS的变量?个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。

变量:数据编辑器窗口中的一列。

3、在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS 统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明?默认的变量名:VAR------;默认的变量类型:数值型。

变量名标签和变量值标签可增强统计分析结果的可读性。

4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料?问:在SPSS中应如何组织该数据?数据文件如图所示:5、什么是SPSS的用户缺失值?为什么要对用户缺失值进行定义?如何在SPSS中指定用户缺失值?缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing Value)。

用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。

用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。

系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“?”。

在变量视图中定义。

6、从计量尺度角度看,变量包括哪三种主要类型?请各举出一个相应的实际数据。

如何在SPSS中指定变量的计算尺度?变量类型包括:数值型(身高)、定序型(受教育程度)以及定类型(性别)。

《统计分析与SPSS的应用(第五版)》课后练习答案

《统计分析与SPSS的应用(第五版)》课后练习答案

《统计分析与SPSS的应用(第五版)》课后练习答案第一章练习题答案1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案)英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。

●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据;●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。

3、SPSS的数据集:●SPSS运行时可同时打开多个数据编辑器窗口。

每个数据编辑器窗口分别显示不同的数据集合(简称数据集)。

●活动数据集:其中只有一个数据集为当前数据集。

SPSS只对某时刻的当前数据集中的数据进行分析。

4、SPSS的三种基本运行方式:●完全窗口菜单方式、程序运行方式、混合运行方式。

●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简洁和直观。

●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。

该方式适用于大规模的统计分析工作。

●混合运行方式:是前两者的综合。

5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名.spv是结果查看器窗口中的SPSS分析结果文件的扩展名.sps是语法窗口中的SPSS程序6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。

7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。

统计分析与SPSS课后习题课后习题答案汇总

统计分析与SPSS课后习题课后习题答案汇总

《统计分析与SPSS的应用(第五版)》课后练习答案第一章练习题答案1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案)英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。

数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据;结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。

3、SPSS的数据集:SPSS运行时可同时打开多个数据编辑器窗口。

每个数据编辑器窗口分别显示不同的数据集合(简称数据集)。

活动数据集:其中只有一个数据集为当前数据集。

SPSS只对某时刻的当前数据集中的数据进行分析。

4、SPSS的三种基本运行方式:完全窗口菜单方式、程序运行方式、混合运行方式。

完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简洁和直观。

程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。

该方式适用于大规模的统计分析工作。

混合运行方式:是前两者的综合。

5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名.spv是结果查看器窗口中的SPSS分析结果文件的扩展名.sps是语法窗口中的SPSS程序6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。

7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。

最新《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

最新《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第10章SPSS的聚类分析1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。

要求:1)根据凝聚状态表利用碎石图对聚类类数进行研究。

2)绘制聚类树形图,说明哪些省市聚在一起。

3)绘制各类的科研指标的均值对比图。

4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。

采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。

大约聚成4类。

步骤:分析→分类→系统聚类→按如下方式设置……结果:凝聚计划阶段 组合的集群系数 首次出现阶段集群 下一个阶段集群 1集群 2集群 1集群 21 26 30 328.189 0 02 2 26 29 638.295 1 0 73 20 25 1053.423 0 0 54 4 12 1209.922 0 0 15 5 8 201505.035 0 3 6 6 8 16 1760.170 5 0 9 7 24 26 1831.926 0 2 10 8 7 11 1929.891 0 0 11 9 5 8 2302.024 0 6 22 10 24 31 2487.209 7 0 22 11 2 7 2709.887 0 8 16 12 22 28 2897.106 0 0 19 13 6 23 2916.551 0 0 17 14 10 19 3280.752 0 0 25 15 4 21 3491.585 4 0 21 16 2 3 4229.375 11 0 21 17 6 13 4612.423 13 0 20 18 9 18 5377.253 0 0 25 19 14 22 5622.415 0 12 24 20 6 15 5933.518 17 0 23 21 2 4 6827.276 16 15 26 22 5 24 7930.765 9 10 24 23 6 27 9475.498 20 0 26 24 5 14 14959.704 22 19 28 25 9 10 19623.050 18 14 27 26 2 6 24042.669 21 23 28 27 9 17 32829.466 25 0 29 28 2 5 48360.854 26 24 29 29 2 9 91313.530 28 27 30 3012293834.50329选中数据列,点击“插入”菜单 拆线图……碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。

《统计分析与SPSS的应用(第五版)》课后练习答案(第11章)复习课程

《统计分析与SPSS的应用(第五版)》课后练习答案(第11章)复习课程

《统计分析与S P S S的应用(第五版)》课后练习答案(第11章)《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第11章SPSS的因子分析1、简述因子分析的主要步骤是什么?因子分析的主要步骤:一、前提条件:要求原有变量之间存在较强的相关关系。

二、因子提取。

三、使因子具有命名解释性:使提取出的因子实际含义清晰。

四、计算样本的因子得分。

2、对“基本建设投资分析.sav”数据进行因子分析。

要求:1)利用主成分方法,以特征根大于1为原则提取因子变量,并从变量共同度角度评价因子分析的效果。

如果因子分析效果不理想,再重新指定因子个数并进行分析,对两次分析结果进行对比。

2)对比未旋转的因子载荷矩阵和利用方差极大法进行旋转的因子载荷矩阵,直观理解因子旋转对因子命名可解释性的作用。

“基本建设投资分析”因子分析步骤:分析→降维→因子分析→导入全部变量到变量框中→详细设置……描述、抽取的设置如下:旋转、得分、选项的设置如下:(1)相关系数矩阵国家预算内资金(1995年、亿元)国内贷款利用外资自筹资金其他投资相关系数国家预算内资金(1995年、1.000 .458 .229 .331 .211亿元)国内贷款.458 1.000 .746 .744 .686利用外资.229 .746 1.000 .864 .776自筹资金.331 .744 .864 1.000 .928其他投资.211 .686 .776 .928 1.000 表一是原有变量的相关系数矩阵。

由表可知,一些变量的相关系数都较高,呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。

KMO 和巴特利特检验KMO 取样适切性量数。

.706Bartlett 的球形度检验上次读取的卡方119.614自由度10显著性.000由表二可知,巴特利特球度检验统计量的观测值为119.614,相应的概率P-值接近0.如果显著性水平为0.05,由于概率P-值小于显著性水平α,则应拒绝原假设,认为相关系数矩阵与单位阵有显著差异,原有变量适合做因子分析。

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)(可打印修改)

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)(可打印修改)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第10章SPSS的聚类分析1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。

要求:1)根据凝聚状态表利用碎石图对聚类类数进行研究。

2)绘制聚类树形图,说明哪些省市聚在一起。

3)绘制各类的科研指标的均值对比图。

4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。

采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。

大约聚成4类。

步骤:分析→分类→系统聚类→按如下方式设置……结果:凝聚计划首次出现阶段集群系数集群 1集群 2下一个阶段选中数据列,点击“插入”菜单 拆线图……碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。

其他略。

接下来,添加一个变量CLU4_1,其值为类别值。

(1、2、3、4),再数据→汇总→设置……→确定。

均值对比,依据聚类解,利用分类汇总,计算各个聚类变量的均值方差分析结果:分析→比较均值→单因素ANOVA→设置……→确定若采用层次聚类法(个体间距离定义为平方欧氏距离,类间距离定义为组间平均链锁距离),绘制的碎石图如下:(1)依据上图,数据聚成几类较为恰当?(2)试采用K-MEANS聚类方法,从类内相似性和类间差异性角度分析将数据聚成几类较为恰当。

(1)聚成3类较为恰当。

注:碎石图可按第9章第1题方式绘制,也可按如下方式绘制。

步骤:分析→降维→因子分析→导入全部变量到变量框中(地区变量除外)→抽取:选中碎石图→继续→确定。

得到:(可以看出,分成3类恰当)(2)用K-MEANS聚类方法进行分类,比较分类数为2、3、4时的差别。

步骤:分析→分类→K-平均聚类→地区变量导入到标注个案,其他变量全部导入到变量框中→聚类数填2→选项:选中初始聚类中心和ANOVA→继续→确定。

得到:ANOVA聚类错误均方df均方df 食品13927902.9671246753.779再看F值,F值大表明组间差大,组内差小,即类内相似性大,类间差异性大,经比较可以看出,分类2类时,组间方差和组内方差均较大,而分为4类时,组间方差和组内方差相对来说,组内方差缩小得明显一些。

统计分析与SPSS课后习题课后习题答案汇总(第五版)

统计分析与SPSS课后习题课后习题答案汇总(第五版)

《统计分析与SPSS的应用(第五版)》课后练习答案第一章练习题答案1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案)英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。

●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据;●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。

3、SPSS的数据集:●SPSS运行时可同时打开多个数据编辑器窗口。

每个数据编辑器窗口分别显示不同的数据集合(简称数据集)。

●活动数据集:其中只有一个数据集为当前数据集。

SPSS只对某时刻的当前数据集中的数据进行分析。

4、SPSS的三种基本运行方式:●完全窗口菜单方式、程序运行方式、混合运行方式。

●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简洁和直观。

●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。

该方式适用于大规模的统计分析工作。

●混合运行方式:是前两者的综合。

5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名.spv是结果查看器窗口中的SPSS分析结果文件的扩展名.sps是语法窗口中的SPSS程序6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。

7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第10章SPSS的聚类分析1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。

要求:1)根据凝聚状态表利用碎石图对聚类类数进行研究。

2)绘制聚类树形图,说明哪些省市聚在一起。

3)绘制各类的科研指标的均值对比图。

4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。

采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。

大约聚成4类。

步骤:分析→分类→系统聚类→按如下方式设置……结果:凝聚计划阶段组合的集群系数首次出现阶段集群下一个阶段集群 1 集群 2 集群 1 集群 21 26 30 328.189 0 0 22 26 29 638.295 1 0 73 20 25 1053.423 0 0 54 4 12 1209.922 0 0 155 8 20 1505.035 0 3 66 8 16 1760.170 5 0 97 24 26 1831.926 0 2 108 7 11 1929.891 0 0 119 5 8 2302.024 0 6 2210 24 31 2487.209 7 0 2211 2 7 2709.887 0 8 1612 22 28 2897.106 0 0 1913 6 23 2916.551 0 0 1714 10 19 3280.752 0 0 2515 4 21 3491.585 4 0 2116 2 3 4229.375 11 0 2117 6 13 4612.423 13 0 20碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。

其他略。

接下来,添加一个变量CLU4_1,其值为类别值。

(1、2、3、4),再数据→汇总→设置……→确定。

均值对比,依据聚类解,利用分类汇总,计算各个聚类变量的均值方差分析结果:分析→比较均值→单因素ANOVA→设置……→确定ANOVA平方和df 均方 F 显著性投入人年数组之间59778341.196 3 19926113.732 26.428 .000组内20357294.159 27 753973.858总计80135635.355 30投入高级职称的人年数组之间16485966.820 3 5495322.273 34.553 .000组内4294074.147 27 159039.783总计20780040.968 30投入科研事业费(百元)组之间132451401880.884 344150467293.628324.318 .000组内3675602946.794 27 136133442.474总计136127004827.67730课题总数组之间16470536.564 3 5490178.855 32.181 .000组内4606273.436 27 170602.720总计21076810.000 30专著数组之间7203690.385 3 2401230.128 61.327 .000组内1057167.809 27 39154.363总计8260858.194 30论文数组之间219675698.219 3 73225232.740 17.693 .000组内111743385.717 27 4138643.915总计331419083.935 30获奖数组之间169882.049 3 56627.350 3.619 .026组内422436.790 27 15645.807总计592318.839 30不同组在各个聚类变量上的均值均存在显著差异。

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第10章SPSS的聚类分析1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。

要求:1)根据凝聚状态表利用碎石图对聚类类数进行研究。

2)绘制聚类树形图,说明哪些省市聚在一起。

3)绘制各类的科研指标的均值对比图。

4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。

采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。

大约聚成4类。

步骤:分析→分类→系统聚类→按如下方式设置……结果:凝聚计划阶段组合的集群系数首次出现阶段集群下一个阶段集群 1 集群 2 集群 1 集群 21 26 30 328.189 0 0 22 26 29 638.295 1 0 73 20 25 1053.423 0 0 54 4 12 1209.922 0 0 155 8 20 1505.035 0 3 66 8 16 1760.170 5 0 97 24 26 1831.926 0 2 108 7 11 1929.891 0 0 119 5 8 2302.024 0 6 2210 24 31 2487.209 7 0 2211 2 7 2709.887 0 8 1612 22 28 2897.106 0 0 1913 6 23 2916.551 0 0 1714 10 19 3280.752 0 0 2515 4 21 3491.585 4 0 2116 2 3 4229.375 11 0 2117 6 13 4612.423 13 0 20碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。

其他略。

接下来,添加一个变量CLU4_1,其值为类别值。

(1、2、3、4),再数据→汇总→设置……→确定。

均值对比,依据聚类解,利用分类汇总,计算各个聚类变量的均值方差分析结果:分析→比较均值→单因素ANOVA→设置……→确定ANOVA平方和df 均方 F 显著性投入人年数组之间59778341.196 3 19926113.732 26.428 .000组内20357294.159 27 753973.858总计80135635.355 30投入高级职称的人年数组之间16485966.820 3 5495322.273 34.553 .000组内4294074.147 27 159039.783总计20780040.968 30投入科研事业费(百元)组之间132451401880.884 344150467293.628324.318 .000组内3675602946.794 27 136133442.474总计136127004827.67730课题总数组之间16470536.564 3 5490178.855 32.181 .000组内4606273.436 27 170602.720总计21076810.000 30专著数组之间7203690.385 3 2401230.128 61.327 .000组内1057167.809 27 39154.363总计8260858.194 30论文数组之间219675698.219 3 73225232.740 17.693 .000组内111743385.717 27 4138643.915总计331419083.935 30获奖数组之间169882.049 3 56627.350 3.619 .026组内422436.790 27 15645.807总计592318.839 30不同组在各个聚类变量上的均值均存在显著差异。

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第10章SPSS的聚类分析1、根据“高校科研研究.sav”数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。

要求:1)根据凝聚状态表利用碎石图对聚类类数进行研究。

2)绘制聚类树形图,说明哪些省市聚在一起。

3)绘制各类的科研指标的均值对比图。

4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。

采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。

大约聚成4类。

步骤:分析→分类→系统聚类→按如下方式设置……结果:凝聚计划阶段组合的集群系数首次出现阶段集群下一个阶段集群 1 集群 2 集群 1 集群 21 26 30 328.189 0 0 22 26 29 638.295 1 0 73 20 25 1053.423 0 0 54 4 12 1209.922 0 0 155 8 20 1505.035 0 3 66 8 16 1760.170 5 0 97 24 26 1831.926 0 2 108 7 11 1929.891 0 0 119 5 8 2302.024 0 6 2210 24 31 2487.209 7 0 2211 2 7 2709.887 0 8 1612 22 28 2897.106 0 0 1913 6 23 2916.551 0 0 1714 10 19 3280.752 0 0 2515 4 21 3491.585 4 0 2116 2 3 4229.375 11 0 2117 6 13 4612.423 13 0 20碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。

其他略。

接下来,添加一个变量CLU4_1,其值为类别值。

(1、2、3、4),再数据→汇总→设置……→确定。

均值对比,依据聚类解,利用分类汇总,计算各个聚类变量的均值方差分析结果:分析→比较均值→单因素ANOVA→设置……→确定ANOVA平方和df 均方 F 显著性投入人年数组之间59778341.196 3 19926113.732 26.428 .000组内20357294.159 27 753973.858总计80135635.355 30投入高级职称的人年数组之间16485966.820 3 5495322.273 34.553 .000组内4294074.147 27 159039.783总计20780040.968 30投入科研事业费(百元)组之间132451401880.884 344150467293.628324.318 .000组内3675602946.794 27 136133442.474总计136127004827.67730课题总数组之间16470536.564 3 5490178.855 32.181 .000组内4606273.436 27 170602.720总计21076810.000 30专著数组之间7203690.385 3 2401230.128 61.327 .000组内1057167.809 27 39154.363总计8260858.194 30论文数组之间219675698.219 3 73225232.740 17.693 .000组内111743385.717 27 4138643.915总计331419083.935 30获奖数组之间169882.049 3 56627.350 3.619 .026组内422436.790 27 15645.807总计592318.839 30不同组在各个聚类变量上的均值均存在显著差异。

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)教学资料

《统计分析与SPSS的应用(第五版)》课后练习答案(第10章)教学资料

《统计分析与SPSS 的应用(第五版)》课后练习答案(第 1 0 章)《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第10章SPSS的聚类分析1、根据高校科研研究.sav数据,利用层次聚类分析对各省市的高校科研情况进行层次聚类分析。

要求:1)根据凝聚状态表利用碎石图对聚类类数进行研究。

2)绘制聚类树形图,说明哪些省市聚在一起。

3)绘制各类的科研指标的均值对比图。

4)利用方差分析方法分析各类在哪些科研指标上存在显著差异。

采用欧氏距离,组间平均链锁法利用凝聚状态表中的组间距离和对应的组数,回归散点图,得到碎石图。

大约聚成4类。

步骤:分析分类系统聚类按如下方式设置结果:阶段组合的集群系数首次岀现阶段集群下一个阶段集群1 集群2 集群1 集群21 26 30 328.189 0 02 '2 26 29 638.295 1 0 73 20 25 1053.423 0 0 54 4 12 1209.922 0 0 155 8 20 1505.035 0 3 66 8 16 1760.170 5 0 97 24 26 1831.926 0 2 108 7 11 1929.891 0 0 11 19 5 8 2302.024 0 6 22 110 24 31 2487.209 7 0 22 111 2 7 2709.887 0 8 1612 22 28 2897.106 0 0 1913 6 23 2916.551 0 0 1714 10 19 3280.752 0 0 2515 4 21 3491.585 4 0 21 116 2 3 4229.375 11 0 21 117 6 13 4612.423 13 0 2018 9 18 5377.253 0 0 25 19 14 22 5622.415 0 12 24 20 6 15 5933.518 17 0 23 21 2 4 6827.276 16 15 26 22 5 24 7930.765 9 10 24 23 6 27 9475.498 20 0 26 24 5 14 14959.704 22 19 28 25 9 10 19623.050 18 14 27 26 2 6 24042.669 21 23 28 27 9 17 32829.466 25 0 29 28 2 5 48360.854 26 24 29 29 2 9 91313.530 28 27 30 3012293834.50329r.J ;.-::r■-」r+浙江MJ .-1士u 西SI怛i南®wo-23..NH ls、r-::-'lrI G llr.— £,•';v l''l 5一蚩«07:-亠特;rK >5;,II -勲■■■— I I I I I I I I k I I I I I I k I I k I I I U 1 I I J I k I I k I5-10-1520■一30选中数据列,点击“插入”菜单拆线图碎石图:由图可知,北京自成一类,江苏、广东、上海、湖南、湖北聚成一类。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《统计分析与SPSS的应用(第五版)》
课后练习答案
第11章SPSS的因子分析
1、简述因子分析的主要步骤是什么?
因子分析的主要步骤:
一、前提条件:要求原有变量之间存在较强的相关关系。

二、因子提取。

三、使因子具有命名解释性:使提取出的因子实际含义清晰。

四、计算样本的因子得分。

2、对“基本建设投资分析.sav”数据进行因子分析。

要求:
1)利用主成分方法,以特征根大于1为原则提取因子变量,并从变量共同度角度评价因子分析的效果。

如果因子分析效果不理想,再重新指定因子个数并进行分析,对两次分析结果进行对比。

2)对比未旋转的因子载荷矩阵和利用方差极大法进行旋转的因子载荷矩阵,直观理解因子旋转对因子命名可解释性的作用。

“基本建设投资分析”因子分析
步骤:分析→降维→因子分析→导入全部变量到变量框中→详细设置……
描述、抽取的设置如下:
旋转、得分、选项的设置如下:
(1)
相关系数矩阵
国家预算内资金
(1995年、亿元)国内贷款利用外资自筹资金其他投资相关系数国家预算内资金(1995年、亿
1.000 .458 .229 .331 .211
元)
国内贷款.458 1.000 .746 .744 .686
利用外资.229 .746 1.000 .864 .776
自筹资金.331 .744 .864 1.000 .928
其他投资.211 .686 .776 .928 1.000
表一是原有变量的相关系数矩阵。

由表可知,一些变量的相关系数都较高,呈较强的线
性关系,能够从中提取公共因子,适合进行因子分析。

KMO 和巴特利特检验
KMO 取样适切性量数。

.706
Bartlett 的球形度检验上次读取的卡方119.614
自由度10
显著性.000
由表二可知,巴特利特球度检验统计量的观测值为119.614,相应的概率P-值接近0.如果显著性水平为0.05,由于概率P-值小于显著性水平α,则应拒绝原假设,认为相关系数矩阵与单位阵有显著差异,原有变量适合做因子分析。

同时,KMO值为0.706,根据KMO 度量标准可知原有变量可以进行因子分析。

公因子方差
初始值提取
国家预算内资金(1995年、亿
1.000 .196
元)
国内贷款 1.000 .769
利用外资 1.000 .820
自筹资金 1.000 .920
其他投资 1.000 .821
提取方法:主成份分析。

由表三可知,利用外资、自筹资金、其他投资等变量的绝大部分信息(大于80%)可被因子解释,这些变量的信息丢失较少。

但国家预算内资金这个变量的信息丢失较为严重(近80%)。

总的来说,本次因子提取的总体效果还不错。

为了达到更好的效果,可以重新指定提取特征值的标准,指定提取2个因子。

补充说明如下:
故由表四可知,第1个因子的特征值很高,对解释原有变量的贡献最大;第三个以后的因子特征值都较小,对解释原有变量的贡献很小,可以忽略,因此选取两个因子是合适的。

在上述“抽取”选项中,选择“因子的固定数量(N)”并修改其值为2,其他不变。

表五:重新提取因子后的公因子方差表
公因子方差
初始值提取
国家预算内资金(1995年、亿
元)
1.000 .975
国内贷款 1.000 .795
利用外资 1.000 .860
自筹资金 1.000 .937
其他投资 1.000 .882
提取方法:主成份分析。

表五是指定提取2个特征值下的变量共同度数据。

由第二列数据可知,此时所有变量的共同度均较高,各个变量的信息丢失都较少。

因此,本次因子提取的总体效果比较理想。

总方差解释
组件
初始特征值提取载荷平方和
总计方差百分比累积 % 总计方差百分比累积 %
1 3.526 70.518 70.518 3.526 70.518 70.518
2 .92
3 18.452 88.970
3 .306 6.112 95.082
4 .200 3.993 99.075
5 .04
6 .925 100.000
提取方法:主成份分析。

总方差解释
表六中,第一个因子的特征值为3.526,解释原有5个变量总方差的70.5%,累计方差贡献率为70.5%;第二个因子的特征值为0.923,解释原有7个变量总方差的18%,累计方差贡献率为88.97%.
(2)
成分矩阵a
组件
1 2
国家预算内资金(1995年、亿
.443 .882
元)
国内贷款.877 .160
利用外资.906 -.199
自筹资金.959 -.132
其他投资.906 -.247
提取方法:主成份分析。

a. 已提取 2 个成分。

表七显示了因子载荷矩阵。

由表可知,自筹资金、其他投资、利用外资和国内贷款四个变量在第一个因子上的载荷都较高,意味着它们与第一个因子的相关程度高,第一个因子很重要;第二个因子除了与国家预算内资金相关程度较高外,与其他的原有变量相关性较小,对原有变量的解释作用不明显。

下表采用方差极大法对因子载荷矩阵实行正交旋转以使因子具有命名解释性。

指定按第一个因子载荷降序的顺序输出旋转后的因子载荷,并绘制旋转后的因子载荷图。

旋转后的成分矩阵a
组件
1 2
国家预算内资金(1995年、亿
.128 .979
元)
国内贷款.775 .440
利用外资.921 .110
自筹资金.949 .190
其他投资.937 .064
提取方法:主成份分析。

旋转方法:Kaiser 标准化最大方差法。

a. 旋转在 3 次迭代后已收敛。

由表可知,自筹资金、其他投资和利用外资在第1个因子上有较高的载荷,第一个因子主要解释了这几个变量,可解释为外部投资;国内贷款和国家预算内资金在第2个因子上有较高的载荷,第二个因子主要解释了这几个变量,可解释为内部投资。

与旋转前相比,因子含义较清晰。

3、利用“消费结构.sav”数据进行因子分析的部分结果如下:
成分矩阵a
组件
1 2
食品.843 -.435
衣着.596 .687
居住.886 -.057
家庭设备用品及服务.893 -.090
医疗保健.720 .478
交通和通信.898 -.329
教育文化娱乐服务.965 -.070
杂项商品和服务.894 .120
提取方法:主成份分析。

a. 已提取 2 个成分。

旋转后的成分矩阵a
组件
1 2
食品.945 .087
衣着.132 .899
居住.777 .429
家庭设备用品及服务.801 .405
医疗保健.349 .791
交通和通信.934 .206
教育文化娱乐服务.851 .460
杂项商品和服务.689 .583
提取方法:主成份分析。

旋转方法:Kaiser 标准化最大方差法。

a. 旋转在 3 次迭代后已收敛。

(1)根据成分矩阵计算各变量的变量共同度以及各因子变量的方差贡献,并以此评价本次因子分析的总体效果是否理想。

(2)根据旋转成分矩阵说明两个变量的含义。

“消费结构”因子分析
(1)各变量共同度如下:
食品的变量共同度为0.8432+(-0.435)2=0.8999,其他类似。

衣着为0.827
居住为0.788
家庭设备用品及服务为0.806
医疗保健为0.747
交通和通信为0.915
教育文化娱乐服务为0.936
杂项商品和服务为0.814
变量共同度刻画了因子全体对变量信息解释的程度。

此题中大多数原有变量的变量共同度均较高(全部变量共同度都大于70%,大部分大于80%),说明提取的因子可以解释原有变量的大部分信息,仅有较少的信息丢失,因子分析的效果较好。

个因子变量的方差贡献如下:
第一个因子的方差贡献为S12=0.8432+0.5962+0.8862+```+=5.704
第二个为1.029
因子的方差贡献反映了因子对原有变量总方差的解释能力。

由题中可知,第一个变量解释能力更强,更重要。

(2)由旋转成分矩阵可知,食品、居住、家用设备用品及服务、交通和通信、教育文化娱乐服务以及杂项商品和服务在第1个因子上有较高的载荷,第1个因子主要解释了这几个变量,可解释为刚性消费需求;衣着、医疗保健这两个变量在第2个因子上有较高的载荷,第2个因子主要解释了这几个变量,可解释为弹性消费需求。

因此消费结构可以分为刚性和弹性消费两个部分。

相关文档
最新文档