spss复习资料整理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章

1.SPSS是软件英文名称的首字母缩写,其最初为Statistical Package for the Social Sciences的缩写,即“社会科学统计软件包”。

2.SPSS系统运行管理方式(SPSS的几种基本运行方式)有:

(1)完全窗口菜单运行方式

(2)程序运行管理方式

(3)混合运行管理方式

3.SPSS的界面提供的五个窗口:数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。

第二章

1.SPSS的文件类型:语法文件(*.sps)、数据文件(*.sav)、结果输出文件(*.spv)。

2.SPSS数据编辑器的每一行数据称为一个个案(Case),每一个数据代表个体的属性,即变量(V ariable)。

3.SPSS变量名的命名规则:

1)必须以英文字母开头,其他部分可以含有字母、数字、下划线(即“-”);

2)变量名尽量避免和SPSS已有的关键字重复,例如sum、compute、anova等;

3)SPSS13及以后版本支持变量名最长为64Byte,即变量名最长为64个英文字符,或者32个中文字符;

4)SPSS变量名不区分大小写,即SPSS认为Name、name、nAme这三个变量名没有区别。

4.变量度量类型:定量(个数、高度、温度等)、定序(“十分重要”、“重要”、“一般”、“不重要”)、定类(名字、地址、电话等)。

5.列和宽度的区别:

变量宽度:对字符型变量,该数值决定了你能输入的字符串的长度;

列:设定该变量数据视图中列的宽度。

7.默认的缺失值类型:数值型类型(.)、字符串类型(空格)。

8.数据文件的合并包括:纵向合并和横向合并(合并个案和合并变量),合并变量包括一对一合并和一对多合并。

9.SPSS用“(*)”表示变量来自于当前活动数据文件中的变量,而用“(+)”表示将要和当前数据文件进行合并的数据文件中的变量。

10.在合并数据文件之前,所有需要合并的数据文件必须预先按照关键变量进行升序排列。否则,合并文件程序将失败。

11.(选择题)一对一合并变量时,两个文件都要提供个案;一对多合并时,活动的和非活动的文件都可以作为关键字。

课后练习题:

6.下列可以作为SPSS变量名的是

A).PRENTS12 B).1Name C).NOT TRUE D).@result

7.SPSS中可以设置工作目录,具体设置可以按照以下菜单:

A).【选项】→【设置】

B).【编辑】→【选项】→【设置】

C).【编辑】→【选项】→【文件位置】

D).【文件】→【选项】→【设置】

8.当合并Student-Infor.sav(参见表2-1)和Student-Scores.sav(参见表2-2)两个数据文件为一个数据集Student-Records.sav时,是增加记录还是增加变量?(表略,参见P67)

A).增加记录B).增加变量C).都不是D).都正确

9.对上题的文件合并中,那个变量是关键变量:(对应知识点11)

A)学生ID B).性别C).年龄和班级D).科目E).成绩

10.在合并两个SPSS文件时,正确的说法是:

A).如果是添加变量,SPSS可以显示变量是来源于那个数据文件

B).如果是添加个案,SPSS可以显示变量是来源于那个数据文件

C).合并两个SPSS文件后,将无法辨别个案来自于哪一个文件

D).以上都不正确

第三章

1.可是离散化的作用以及两类方法

作用:可视离散化用于为定量变量创建分类变量,从而实现连续变量的离散化。在统计分析中,有时候需要了解总体的大致分布状况,而不需要了解属性的具体信息。

两类方法:直接输入分割点和根据条件自动生成分割点。

2.数据缺失的可能原因,缺失值的定义以及如何处理缺失值?

1)原因:○1在数据收集阶段,收集者没有收集到相应数据;

○2应答着拒绝回答该问题,比如该问题涉及个人隐私;

○3该问题对该应答者不适用,比如该问题是针对女性的,而应答者为男性。

2)定义:缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类,分组,删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。

3)如何处理:首先应该想到重新回到数据收集阶段尽量收集到该数据,如果实在收集不到该数据,再考虑怎么处理缺失值,如果缺失数据不影响到具体的统计分析,则不对缺失值作任何处理(即缺失数据还是作为缺失数据处理),如果缺失数据影响到了具体的统计分析,则必须考虑采取适当方法来填补缺失数据。

3.SPSS提供的填补缺失值的方法有哪些?(作简要说明)

1)序列均值为取整列数据的均值;

2)临近点均值为去该缺失值临近的几个点的均值,具体几个点由附近点的跨度来设定;3)临近点的中位数为取该缺失值邻近的几个点的中位数,具体几个点由附近点的跨度来设定;

4)线性插值法应用线性插值法填补缺失值。用该列数据缺失值前一个数据和后一个数据建立插值直线,然后用缺失点在线性插值函数的函数值填充该缺失值;

5)点处的线性趋势法应用缺失值所在的整个序列建立线性回归方程,然后用该回归方程在缺失点的预测值填充缺失值。

4.什么叫数据校验,作用是什么?

数据校验即查找错误数据或者不一致数据的过程。

作用:如果数据没有收集到则尽量想办法补全;如果是录入错误则重新录入;如果数据确实错误,则可将这些数据设置成缺失值(即丢弃这些数据不进行分析)。

5.在选择个案If对话框中,构建选择“‘男性1’、‘黑种人2’、‘东北地区1’”的表达式:性别=1&种族=2&地区=1

第四章

1.统计分析的目的,描述性统计分析方法与推断性统计分析方法有什么不同?

目的:是研究观察对象总体的特点。

相关文档
最新文档