spss数据处理基础

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一篇 SPSS数据处理基础

本篇要点导读:

第1章 SPSS数据的录入

数据录入的一般步骤,数据结构的定义,文件合并,文本数据的导入;

第2章数据文件的操作和预处理

【Data】菜单中对变量和案例的操作,【Transform】菜单中计数和分类赋值的操

作。

本篇说明:

1. 本篇重点说明数据录入和文件整理的整个过程,以及过程中特别需要读者注意的问题,对于SPSS操作简明扼要,没有对每一个选项进行详细说明,只是配合例题针对常用和重点选项进行说明,如读者想了解详细说明请查阅相关书籍,本书会给出标示。在以后的章节中我们也会遵循这一原则,不再特别说明;

2. 如果读者是有一定的SPSS使用基础,了解SPSS的一些基本操作,对数据录入和预处理比较清楚,可以简略浏览本篇,重点了解数据录入的一般流程和预处理中注意的问题。也可直接略过本篇从第二篇开始学习;

3. 如果读者是SPSS初学者,由于本篇在软件操作上的介绍比较简略,请初学者在学习此篇的时候一定遵循我们的例题操作并注意图例标示,必要时查阅书中列出的相关参考书籍,并完成课后两道以上的习题操作,务求掌握此篇内容,为以后SPSS软件学习奠定基础。

『 2 』

第1章SPSS数据的录入

第1章SPSS数据的录入

SPSS既是Statistical Package for the Social Science(社会科学统计软件包)的缩写,也是Statistical Product and Service Solution (统计产品与服务解决方案)的缩写,是世界上几大统计分析软件(SPSS、SAS、S-plus/R、STA TA、GUASS)中使用最广泛,界面最友好,操作最方便的统计软件,其强大的功能和易掌握性对于非统计专业特别是经济和管理专业的学生和工作人员,是一个不可多得的统计分析和数据处理的好工具、好助手。本书将基于SPSS 17.0给读者介绍SPSS的强大功能,关于SPSS的安装和一般Windows应用软件没有什么不同,让我们从SPSS的基础——建立数据文件和录入数据开始吧。

1.1 SPSS数据文件的建立和数据录入

在本节中我们从一个简单例题入手,让读者了解SPSS是如何建立数据文件,以及如何录入数据的。

表1.1车险投保人的数据1

性别年龄交通事故数性别年龄交通事故数

男23 2 女25 1

男35 1 女24 3

男26 1 女31 1

男25 0 女26 0

男28 2 女26 0

男31 1 女29 0

男23 1 女22 2

男31 3 女25 5

首先,进入SPSS软件,双击桌面上的SPSS图标,或者从“开始”菜单→“所有程序”→“SPSS Statistics”→“SPSS Statistics”图标进入软件,将会看到如图1-1的软件界面:

在启动SPSS后,一般先进入一个导航框,其中有一些常用操作和上次使用过的数据文件和结

果文件等,不用太过理会导航框,直接选择Cancel就可以进入软件主界面。

1为节省篇幅,表中仅列出部分投保人案例,完整数据请见光盘中的数据集1-1

第一篇 SPSS 数据处理基础

在软件界面中,除了看到与一般软件相同的菜单、快捷按钮以外,还可以看到灰色的“变量(英文界面是Var )”和“1、2、3”分别代表变量和案例,由于我们还没有建立任何变量和案例,所以这些都是灰色的。在界面的右上角可以看到“Visible :0 of 0 Variables ”表明数据中共有0个变量,可见的是0个变量。接下来我们就在这个操作界面中建立变量和案例。

关于变量和案例,分别对应操作界面的列和行,这与一般的数据库软件相同,有些书称为变量和记录,统计上通常称为指标和样本,意思大同小异。

图 1-1 SPSS 软件界面

建立SPSS 数据文件和一般的数据库文件建立的考虑基本相同,主要是两个步骤:

Step1:定义文件的数据结构;

Step2:录入数据。

在Step1中,重点需要考虑用多少个变量,每个变量的结构,例如是整数型变量还是浮点小数型变量,小数位数取多少合适,变量取值是否代表某种分类,需要如何显示等等;在Step2中,主要考虑根据案例的多少来决定是一个人单独输入所有数据还是多人分别输入然后合成完整的数据。下面我们结合例题具体讲解。

1.1.1 SPSS 的数据文件结构

在本例中,我们主要考虑三个变量,分别是投保人的性别、年龄和发生的交通事故次数。其中性别是一个分类变量,它只有男、女两个值;对于年龄,是一个整数型变量;而交通事故次数也是一个整数型变量。以上就是对变量的考虑。对于案例,由于总共有500个案例,单独输入工作量过大,因此可以考虑分别录入再进行合并。

接下来我们就在SPSS 中定义变量的结构。图1-1的软件操作界面左下角有两个类似Excel 工作表一样的选项卡,分别叫做【Data View 】和【Variable View 】,其作用和Excel 工作表的平行数据表大不相同,有着严格的分工:【Variable View 】称为【变量视图】,专门用于定义SPSS 变量的结构,而【Data View 】称为【数据视图】,用于对案例的录入;换言之,变量视图只用于定义结构,不能用于录入数据,相反数据视图只用于录入数据,不能定义变量结构,对于不同的操作要在不同的视图中完成,这一点请读者务必明确。例如,接下来我们要先定义变量的结构,就应该在【Variable View 】中定义。 案例1、案例2… 变量

总共有多少个变量,其中可见的

有多少个变量

数据视图和变量视图

第1章 SPSS 数据的录入

『 4 』

点击【Variable View 】选项卡,进图1-2如下操作界面:

可以看到在此视图中,每一行代表一个变量,本例题定义3个变量,因此有3行,列名称中分别有“Name ”、“Type ”等,我们已经在图上做出了标示,此处就不赘述了,只是对于重点的几个列进行说明:

“Name ”菜单表示变量名称,可以用英文字母、数字和下划线给变量命名,也可用中文命名,但是不推荐使用中文作为变量名。

从SPSS 10.07后,就可以用汉字给变量命名,以前要求变量名长度不超过8个字符,即4个汉字,在SPSS 13.0以后放宽到64个字符,所以可以用汉字命名;但是SPSS 的汉字兼容性不太好,以前笔者使用汉字命名时,不止一次分析结果的变量名出现乱码,因此不推荐使用汉字作为变量名,强烈推荐用英文命名变量,变量名标签用汉字说明变量的含义。

图 “Type ”表示变量类型,总共有“Numeric ”数值型、“Comma ”逗号型、“String ” 字符串型等八种类型供选择,一般使用数值型就可以了2;需要特别说明的是,字符串型变量不能用SPSS 进行分析,只能起案例名称标注的作用,因此要分析的变量都要转化为数值型变量,例如,本例题中性别这个变量就要转化为取值为1和2的变量,不能直接使用“男”、“女”作为变量值。

“Label ”变量名标签的作用非常巨大,由于变量名标签和变量是绑定显示的,在变量分析和显示分析结果时可以一目了然了解变量的含义,对于SPSS 的使用者都要养成给变量添加变量名标签的习惯,本例中,对每个变量我们都根据其含义指定了变量名标签,在以后的学习中读者将体会到变量名标签的方便。

“Value ”变量值标签也是非常重要的,对于分类变量和定序变量,一般只能取有限的几个值,前面已经了解必须要对其进行编码才能用于SPSS 分析,这可以通过编制变量值标签来实现,还可以说明每个取值代表什么含义,例如,本例题性别变量中,我们用1代表“男”,用2代表“女”,这就需要在变量值标签中说明,一旦编制了变量值标签,软件在分析时按照数字进行分析,在显示时按照变量值对应的文字进行显示,这样大大方便对结果的理解。我们通过下述操作编制变量值标签:

点击变量值标签“V alue ”下对应变量的单元格,出现,点击右边的三个小点,出现如图1-3所示对话框,在Value 框中填写“1”,在Label 框中填写“男”,说明在SPSS 性别变量中取值为1代

2关于变量类型的说明,可以参看薛薇编著,《统计分析与SPSS 应用》,北京人民大学出版社

相关文档
最新文档