第 2 章 SPSS 数据文件的建立和管理

合集下载

统计SPSS数据文件的建立和管理

第2章 SPSS数据文件的建立和管理学习目标1．明确SPSS数据的基本组织形式和数据行列的含义。

2．掌握应从哪些方面描述SPSS数据文件的结构特征。

3．熟练掌握建立SPSS数据文件以及管理SPSS数据的基本操作。

4．熟练掌握在SPSS中读取Excel工作表数据的基本操作，了解读取文本和数据库数据的基本方法。

建立SPSS数据文件是利用SPSS软件进行数据分析的首要工作。

没有完整且高质质的数据，也就没有值得信赖的数据分析结论。

2.1 SPSS数据文件建立SPSS数据文件，应首先了解SPSS数据文件的特点、数据组织的基本方式和相关概念等。

只有这样才能够建立一个完整且全面的数据环境，服务于以后的数据分析工作。

2.1.1SPSS数据文件的特点SPSS数据文件是一种有别于其他文件（如Word文档、文本文件）的有特殊性的文件。

从应用角度理解，这种特殊性表现在两方面。

第一，SPSS数据文件的扩展名是.sav；第二，SPSS数据文件是一种有结构的数据文件。

它由数据的结构和内容两部分组成。

其中，数据的结构记录了数据的类型、取值说明、数据缺失情况等的必要信息，数据的内容是那些待分析的具体数据。

SPSS数据文件与一般文本数据的不同在于：一般文本文件仅有纯数据部分，而没有关于结构的描述。

正是如此，SPSS数据文件不能像一般文件那样可以直接被大多数编辑软件读取，而只能在SPSS软件中打开。

基于上述特点，建立SPSS数据文件时应完成两项任务，第一，描述SPSS数据的结构；第二，录入编辑SPSS的数据内容。

这两部分工作分别在SPSS数据编辑窗口的变量视图中完成。

2.1.2 SPSS数据的基本组织方式SPSS的数据将直观地显示在数据编辑窗口中，形成一张平面二维表格。

待分析的数据将按原始数据方式和计数数据方式组织。

一、原始数据的组织方式如果待分析的数据是一些原始的调查问卷数据，或是一些基本的统计指标，那么这些数据就可按原始数据的方式组织。

SPSS统计分析- 第2章数据文件建立和管理

4．读取“*.txt”数据文件
现需将“人居收入.txt”文件中的数据读入SPSS，如图所示： (1) 打开“数据编辑器”对话框，选择“文件”|“打开文本数据”命令，打开“打开数据”对话框。选择文本文件，单击“打开”按钮，打开“文本导入向导”对话框，如图所示：
(2) 在“您的文本文件与预定义的格式匹配吗？ ” 选项组中选择 “ 是 ” 单选按钮，可单击“浏览” 按钮，选择已预定义好的格式；单击 “ 否 ” 则需要建立一个新格式。
2.1.1 打开定义变量视图
• 按前一章所述打开SPSS主界面，视图切换标签处单击“变量视图”，即打开“变量视图”窗口，如图所示。在该视图可对变量的以下属性进行定义：名称、类型、宽度、小数、标签、值、缺失、列、对齐、度量标准和角色。
2.1.2 定义变量名称
• 在“变量视图”变量栏的“名称”栏中定义变量名称，用户可根据数据需要或个人习惯进行定义，如果不对变量进行定义，系统将自动默认变量名为var00001、var00002、 var00003等。一般根据变量的实质意义来命名，例如：年龄、性别、年级等变量，可用Age,Gender,Grade命名，也可用中文意义命名，但当出现变量数量较大时，一般使用流水编号，即防混淆又方便。虽然变量可根据用户的需求自行编辑，但仍有其需共同遵循的原则： • 若用英文命名，变量名首字必须为英文字母，其后方可接数字、英文字母、@等。若用中文命名，则可直接使用。 • 不可使用空格和特殊字符（如键盘上的！、#、$、%、&、 ^、*、（、）、？等字符）。
(9) 之后进入下一步，如图所示。在“变量之间有哪些分隔符？”中，可根据文本数据中变量间的分隔符，可选择“制表符”、 “空格”、“逗号 ”、“分号” 和“其他”复选框。在“文本限定符是什么？”中，可选择“无”、“单引号”、“ 双引号”和“其他”单选按钮，一般默认为“无”，选择完毕后单击“下一步” 。

SPSS数据文件的建立和管理实验报告

6.对第二个表格进行保存，并且命名为“学生成绩二.sav”
第二题：
1.先打开常用软件里的SPSS 11.5 for Windows.exe,在Variable View中根据题目输入相关数据,如下图所示
2.在Data View中根据题目输入相关数据,结果如下图所示
3.对这个表格进行保存,并且命名为“减肥产品.sav”
3.选中“Match cases on key variables in sorted files”，将“学号”放入“Key Variables”中，结果如下所示
第二题：
因为题中要求将数据文件转换为EXCEL文件,所以通过【File】→【Save As】可实现
输入文件名“减肥产品”，再修改保存类型，选择EXCEL保存类型，即可得到升序排列，结果如下图所示
3.对第一个表格进行保存，并且命名为“学生成绩一.sav”
4.重新打开一个表格，在Variable View中根据题中要求输入数据，如下图所示
5.在Data View中先输入数据,再选中“学号”一列，选择升序排列，结果如下图所示
表1学生语文成绩
学号
1
3
4
5
8
9
10
2
6
7
姓名
张三
李四
王燕
赵宇
白艳
王洁
李丽
成功
孙昌
章建
语文成绩
89
76
87
65
97
74
82
90
67
88
表2学生数学成绩
学号
1
2
3
8
9
7
6
5
4
10
姓名
张三
成功

SPSS数据分析教程-2-数据文件的建立和管理

最新课件
14
数据的输入操作（2）
ID号(id) 性别(sex)：1：男； 2：女
1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 2
身高(height)
76，59，67，65，63，72，70，68，69，74，68，63
参加活动以前的体重(before)
185 113 145 156 109 191 155 165 175 180 135 118
如果一个文件中的某个个案在另一个文件中找不到个案来匹配，则该个案于第二个文件的变量上的取值为缺失值。反之亦然。
如果一个文件中的某个个案在另一个文件中找到两个或者两个以上的个案来匹配，则该个案只取第二个文件中第一个相匹配的个案来连接。反之亦然。
最新课件
38
合并变量示意图：一对一
最新课件
39
最新课件
3
本章学习目标
理解信息、数据与数据处理的基本概念；了解SPSS数据编辑器的特点，熟悉SPSS的变
量视图和数据视图，掌握SPSS常用的工具按钮；
掌握数据录入SPSS软件的方法；
掌握把电子表格、数据库、文本文件等格式的数据文件读入SPSS软件的方法；
掌握SPSS数据集的数据字典；学习合并两个数据文件的方法；明确分割SPSS数据文件的方法。
分析的目的是比较不同收益类型客户的概要特征。
最新课件
42
先按照关键变量“orgntype”（客户工作单位的类型）进行合并文件。选择【数据】→ 【排序个案】，首先按照关键变量
“orgntype”排序。
然后选择【数据】→【合并文件】→【添加变量】进行合并。
最新课件
43
2.7 数据的拆分

实验一SPSS数据文件的建立和管理一.实验目的1.掌握spss数据的结构

实验一SPSS数据文件的建立和管理一.实验目的1.掌握spss数据的结构和定义方法；2.掌握spss数据的录入与编辑：数据的录入、数据的定位、插入和删除一个个案、插入和删除一个变量、数据的移动、复制和删除；3.掌握spss数据的保存，保存为excel文件格式和spss文件格式；4.掌握读取excel文件格式和txt文件格式的数据；5.掌握spss数据文件的纵向与横向的合并。

二.实验基本方法1. spss数据的结构和定义方法操作步骤：参阅教材第24页。

2. spss数据的录入与编辑操作步骤：（1）数据的录入：参阅教材第29页。

（2）数据的定位：参阅教材第30页。

（3）插入和删除一个个案：参阅教材第31页。

（4）插入和删除一个变量：参阅教材第31页。

（5）数据的移动、复制和删除：参阅教材第32页。

3. spss数据的保存操作步骤：参阅教材第33页。

4. 读取excel文件格式和txt文件格式的数据操作步骤：参阅教材第35页。

5. spss数据文件的纵向与横向的合并操作步骤：（1）纵向合并数据文件：参阅教材第40页。

（2）横向合并数据文件：参阅教材第42页。

三.实验内容（一）验证性实验（1）教材第25页“关于居民储户调查问卷的spss变量的设计”（2）教材第38页“职工基本情况数据的纵向合并和横向合并”（二）实践性实验（1）针对“零散数据”文件夹中的若干excel数据和txt数据，将其转换为spss的数据文件，要求转换为spss数据后，根据变量的类型正确定义数据结构。

（2）针对“经管学院考试成绩”文件夹中的数据，首先，通过spss软件将“成绩1”和“成绩2”的excel文档打开，并保存为相同文件名的spss数据文件。

要求：spss读取excel的变量名，数据结构定义准确。

其次，利用横向合并的功能，将“成绩1”和“成绩2”进行合并，并存为“三次考试成绩汇总表.sav”的文件。

最后，将“三次考试成绩汇总表.sav”的文件保存一份txt本文数据和excel文件数据。

spss数据文件的建立与管理

SPSS数据文件的结构
2 、字符型(String): 存储字符数据 8位如：beijing 处理时用双引号扩起来 3、日期型（Date):存储日期数据格式很多，如：20-AUG-1999 4、其他: 如：圆点数值型(dot)、用户自定义型(customer) 注意：显示宽度不影响数据的存储
SPSS数据文件的结构
(二)横向数据合并 (3)菜单选项: data -> merge file -> add variable (4)选项说明: – math cases on key variables in sorted files:以关键字作为合并标志。 – Both files provide cases:合并后的文件的数据由两个文件共同提供。 – External file is keyed table:以data editor的数据为基础。 – Working data file is keyed table:以磁盘文件的数据为基础。
（二）变量的类型(type)和显示宽度(width) 1、数值型：

标准数值型(Numeric):默认类型列宽8位；小数点2位如： 12345678、12345.67、-1234.56 带逗号的数值型(Comma): 从个位开始三位一个逗号如：1,234.56 科学计数法(Scientific Notation):表示很大或很小的数据如：1.2E+05 带美元符号(Dollar):表示货币格式很多，如：$12.30
事先指定：指定某个特定值为缺失值（用户缺失值）其他处理方法，如：以均值、众数替代等
3、SPSS缺失值用户缺失值系统缺失值：点 (•)
SPSS数据文件的结构
（七）变量计量尺度(Measurement)

1-2(文件的建立和编辑)

删除变量
(1)在欲删除的变量名上单击鼠标左键
( 2) 右键选择Cut
定义日期时间变量 Define Dates
步骤
(1) Define Dates
(2)设臵日期时间
二、个案管理
主要内容：个案定位插入和删除一个个案个案排序个案选取个案加权
个案定位将当前数据单元定位到特定单元两种定位方式:人工定位和自动定位人工定位方法: 用鼠标拖动数据编辑窗口右边滚动钮或 Page Up Page Down
说明 SPSS早期版本数据文件 Systat数据文件 Spss Portable数据文件 Excel文件 Lotus l—2—3 x.0 (wk3) 格式数据文件 SYLK(符号链接)格式文件 dBase数据库文件 SAS长文件名数据文件 SAS短文件名数据文件
SAS v6 for Windows (*．sd2)
例如：变量名变量标签 W weight或体重 H Height或身高
变量值标签 Value Lables
对变量取值含义进一步解释说明
例如变量值 Sex f m 值标签 Female Male
缺失数据 Missing
说明缺失数据的基本方法指定用户缺失值用户缺失值可以是字符型或数值型变量----1至3个特定的离散值数值型变量---一个连续的闭区间加一个区间以外的离散值
五
数据的编辑
数据编辑功能表（Edit菜单）
命令
Undo Redo Cut Copy Paste Clear Find
功能
删除刚输入的数据或者恢复刚修改的数据恢复刚撤消的操作将选定数据剪切到剪贴板将选定数据拷贝到剪贴板将剪贴板的数据粘贴到指定位置清除选定的变量和观测值查找数据

第2章 SPSS 17.0 基本操作与数据管理

(2)字符型:
字符型编变量由字符串组成，可以包含数字、字母和一些特殊符号。字符型变量的默认长度为8，大于8个字符的称为长字符型变量，少于8个字符的称为短字
符型变量，字符型变量最长为32767个字符。他不能参与运算，区分大小写字母。
(3)日期型: 日期型变量用于表示日期和时间,他有29种不同的日期和时间格式,不能参与运算 ,要参与必须通过日期函数进行转换。如：1-12-2009、29.12.99等
2.1.2 常量、变量、操作符和表达一、常量与变量式
1.SPSS常量 SPSS中的常量在一定阶段内其取值不随观测而改变的值。有3种类型 (1)数值型：数据型常量是一个数值。他有两种书写方式: 一是普通书写方式，如:53、74.2等；二是科学计数书写方式，其使用指数表示数值，通常用于表示贴别大或特别小的数值。如：1.2E+05 表示1.2×105 (2)字符型: 字符型常量是被单引号或双引号括起来的一串字符。如果本身带有单引号或半个单引号，则必须使用双引号括起来。如：beijing 处理时用双引号扩起来，即“beijing” (3)日期型: 按特定格式存储日期数据，一般使用较少格式很多，如：20-AUG-1999
（2）比较表达式
比较表达式是利用关系运算符建立起的两个变量间的比较关系，要求相互比较的两个量类型一致，他的结果一般逻辑型。
如：x=2，则表达式“x>0”为真，系统返回1(true)。
（3）逻辑表达式
逻辑表达式由逻辑运算符、逻辑型的变量或取值为逻辑型的比较表达式构成。他的值为逻辑型常量。如：对于表达式“true AND true” 系统返回“true ” ， “true OR false” 系统返回“true ” 。

《SPSS数据分析与应用》SPSS数据文件的建立与管理

（3）系统保留字（如ALL、BY、AND、NOT、OR等）不能作为变量名。（4）当英文字母作为变量名时，系统不区分大小写字母。（5）SPSS有默认的变量名。当没有为变量命名时，会以字母“VAR”开头，后面补足5位数字，如VAR00001、VAR00012等。
2. 变量类型
变量类型
说明
数字逗
2.2.2导入其他类型的数据文件
1.使用Excel向导读入Excel文件
第一步：启动SPSS，在菜单栏中选择【文件(F)】→【导入数据(D)】→【Excel】，将弹出“打开数据”对话框，在该对话框中选择数据所在的路径，选择文件“招聘数据.xlsx”，如图所示，单击【打开(O)】。
1.使用Excel向导读入Excel文件
2.使用文本向导导入文本文件
第二步：在“文本导入向导-第1/6步”对话框中，需要观察文本文件与预定义的格式是否匹配，如果不匹配，则需要设置文本导入格式，如图所示，单击向导导入文本文件
第三步：在弹出的“文本导入向导-第2/6步”对话框中，主要需要关注数据文件的第一行是否有变量名，如果有，则需要在【文件开头是否包括变量名？】框内勾选【是】，设置【包含变量名称的行号(L)】为“1”，如图所示，单击【下一步(N)】按钮。
2.2.1 SPSS数据的录入
第二步：单击数据编辑器窗口左下角的【变量视图】按钮，切换到变量视图窗口，根据要录入的数据定义变量属性。
2.2.1 SPSS数据的录入
第三步：在左下角单击【数据视图】按钮，就可以直接在SPSS数据编辑器窗口里以电子表格的方式直接录入数据，建立SPSS文件，录入样例如图所示。
第一步：准备好需要合并的数据文件，注意，个案合并的SPSS数据文件的变量数量必须完全一致。两个数据文件均包含9个变量，如图所示。

第2章数据文件的建立和管理PPT教学课件

第2章 SPSS数据文件的建立和管理
2.1 数据文件的特点和结构 2.2 定义数据文件的结构 2.3 数据的录入与保存 2.4 数据的编辑 2.5 读取其他格式的数据文件
1
SPSS数据文件的特点
SPSS数据文件的特殊性：其扩展名是.sav；它是一种有结构的数据文件。
SPSS数据文件由数据的结构和内容两部分组成。其中数据的结构记录数据类型、取值说明、数据缺失情况等必要信息，数据的内容才是待分析的具体数据。
数据中错误或者漏填的数据。如果不特意说明，SPSS会把缺失数据参与分析，因此要对缺失数据进行说明。对缺失数据进行说明的三种方法（P14）：
对于漏填的数值型数据，系统默认的缺失值用一个圆点来表示，字符型变量中的空格或控不是系统缺失值。
11
度量尺度
定距型数据（Scale）定序型数据（Ordinal）定类型数据(Nominal)
14
SPSS数据的录入与保存
录入:逐行录入按Tab键,逐列输入按Enter键（例：职工基本情况数据P49）录入带有变量值标签的数据： View→Value Labels (单元格将显示对应的变量值标签) 数据的保存： data 保存成其他格式的文件：Save as
15
第2章 SPSS数据文件的建立和管理
建立SPSS 数据文件应完成两项任务
描述SPSS数据的结构录入编辑SPSS数据
SPSS数据文件的结构
个案、变量、单元格、当前单元格
SPSS数据文件以二维表的形式组织数据。一行为一个样品（CASE）或个案，一列为一个变量（VARIABLE），行与列交叉之处为一个单元格，可在其中输入变量值。
9
变量值标签（Value Lable）

单元一 SPSS数据文件的建立和管理

（2）计数数据的组织方式
第一节 SPSS的发展及使用基础
（二）SPSS数据结构的基本方式
（2）计数数据的组织方式
第二节 SPSS的数据结构和定义方法
（一）变量名
变量名是变量访问和分析的唯一标识。
变量命名原则：
SPSS 变量名由不多于64(32个汉字)个字符组成；首字母是字母或汉字也可以是@字符；不能使用?,!和*；注意不能以下划线_和圆点“.”作为变量名的最后一个字符；
第一节 SPSS的发展及使用基础
（二）SPSS数据结构的基本方式
第一节 SPSS的发展及使用基础
（二）SPSS数据结构的基本方式
在计数数据的组织方式中，数据编辑窗口中的一行为变量的一个分组（或多变量交叉分组下的一个分组）。所有行囊括了该变量的所有分组情况（或多变量交叉下的所有分组情况）。数据编辑器窗口中的一列仍为一个变量，代表某个问题（或者某个方面的特征）以及相应的计数结果。
第五节数据文件合并
数据文件合并的介绍
（2）横向合并-案例
职工数据和职工奖金数据的合并
①打开“职工数据.sav”②选择菜单【数据】→ 【合并文件】 → 【添加变量】
学业进步！
基本操作步骤如下：
【文件】→【导入数据】→【文本数据】
（二）使用导向导入其他格式的数据

第五节数据文件合并
数据文件合并的介绍
当数据量较大时，经常会把一份大的数据分成几个小的部分，分别录入，录入完毕后，就必须将若干个小的数据文件合并起来。数据文件的合并分为纵向合并和横向合并。
（1）纵向合并
将一个SPSS数据文件的内容追加到当前数据编辑器窗口中数据的后面，依据两份数据文件中的变量名进行数据对接。
字符串型简称字符串（R），是SPSS中较常用的数据类型，它有由一串字符组成。如职工号码、姓名、地址等变量都可以定义为字符串数据。

第二章 SPSS应用基础(数据文件的建立与管理)

（下面分别说明）
第二章 SPSS数据文件的建立、编辑与保存
SPSS数据文件的结构
数据文件的每一行代表一条记录，即每一行代表一个个体、一个个案、一个样品(Case)
每一列代表一个变量或一个被观测量的特征 (Variable)
单元(Cell)是某个个体与某个变量的交叉。即每个单元是一个观测或测定值。单元与电子表格不同，单元只包括数据值而不能含公式。（在数据编辑器中可以输入和编辑数据，但是不能输入数学表达式和函数)
设置数值型变量的宽度，默认8位，当变量为日期型时无效。默认类型8 ， 2 。如：12345678、12345.67、-
1234.56
第二章 SPSS数据文件的建立、编辑与保存
[Decimal]：变量小数点位数
设置数值型变量的小数位数，变量为日期型时无效。
[Label]：变量标签
第二章 SPSS数据文件的建立、编辑与保存
数据文件的范围是由记录和变量的数目决定的。可以在
任一单元中输入数据。如果在定义好的数据文件边界以外
键入数据，SPSS 将数据长方形延长到包括那个单元和文
件边界之间的任何行和列。
单元编辑器
如果要分析的数据还没有录入，可用数
变量Variable
据编辑器来键入数据
空格和特殊字符（如！、？、`和*等），不区分大小写
不能用作变量名的关键词有：ALL、NE、EQ、 TO、LE、GE、BY、OR、GT、AND、NOT、 WITH
第二章 SPSS数据文件的建立、编辑与保存
[Type]：定义变量类型
单击[Type]相应单元中的按钮，显示下图对话框，主要变量类型有：Numeric（标准数值型，默认）、 Comma（逗点型数值型）、Dot（句点数值型）、 Scientific Notation （科学记数型） Date（日期型）、 Dollar（带美元符数值型）、 Custom Currency（自定义型）、 String （字符串型）。选择合适的变量类型并单击[OK]确定。

spss数据的录入与管理

标识重复个案标识异常个案
计算变量
“目标变量”文本框：用于输入需要
赋值的变量名
“转换” “计算变量”
“数字表达式”文本框：用于给目标变量赋值
候选变量列表
函数解释文字文本框
“函数组” 列表框
“函数和特殊变量”列表框
3.2 已有变量值的分组合并
将连续变量转换为等级变量或将分类变量不同的变量等级进行合并。
“重新编码为相同变量”：对原始变量的取值直接进行重编码 “重新编码为不同变量”：根据原始变量的取值生成一个新变量来记录重编码的结果。
B交叉变量规则：交叉变量规则是用户定义的涉及多个变量间逻辑关系的规则，由标记无效值的逻辑表达式定义，可以应用于单个
1、定义验证规则 “数据” “验证” “定义规则” 2、进行数据验证 “数据” “验证” “验证数据” 3、加载预定义规则 “数据” “验证” “加载预定义规则” Predefined Validation Rules.sav
（4）文件合并向导：将几个数据文件合并为一个大的SPSS数据文件，含横向合并和纵向合并两种情况。
（5）数据字典相关向导：包括定义变量属性，复制变量属性，以及新建设定属性三个向导界面。
4.1 几个常用的过程
1、排序个案数据编辑窗口中的记录的前后次序在默认情
况下由录入时的先后顺序决定。（1）单变量排序：变量名处右击，“升序排列 ”“降序排列” （2）多变量排序：使用“排序个案”对话框 2、分割文件（Split File） 3、选择个案：用于只分析部分数据 4、加权个案：（1）以频数格式录入的数据
最优离散化过程:是对前述可视化离散过程的进一步自动化，根据某些作为“关键指示变量”的分类变量，将原有的一个或多个连续性变量按照该分类变量类间差异最大化的

《统计分析与SPSS的应用(第5版)》第二章

(二)横向数据合并 (3)菜单选项:
数据 -> 合并文件 -> 添加变量 (4)选项说明:
以关键字作为合并标志。合并后的文件的数据由两个文件共同提供。以当前数据编辑器中的数据为基础添加。以磁盘文件或其他编辑器窗口中的数据为基础
添加。
SPSS数据文件的合并
(二)横向数据合并 (1)含义:
将磁盘或其他数据编辑器窗口中的SPSS数据中的若干个变量增加到当前数据编辑器窗口中的数据文件中。
(2)前提: a.两个数据文件必须有一个共同的变量名为关键字段---合并的依据；
b. 两个数据文件应事先按关键字段升序排序。
SPSS数据文件的合并
定义源数据块鼠标右键：选择相应菜单项确定目标单元鼠标右键：选择相应菜单项
与其他软件数据共享
数据共享 xls格式文件的共享是否有存放变量名的单元文本数据的读入利用文本向导读入数据数据库文件的共享利用ODBC共享数据
SPSS数据文件的合并
目的: 将两个SPSS数据文件合并到一个数据文件中。
带逗号的数值型(Comma): 从个位开始三位一个逗号8.2 如：1,234.56
科学计数法(Scientific Notation):表示很大或很小的数据 8.2 如：1.2E+05
带美元符号(Dollar):表示货币格式很多，如：$12.30
SPSS数据的结构
变量类型(type)与存储宽度(width) 字符型(String): 存储字符数据 8位
SPSS数据的编辑
(三)插入和删除一个个案插入：编辑-> 插入个案删除：选定待删行，鼠标右键选择清除
(四)插入和删除一个变量插入：光标定位到某列变量上 -> 编辑 -> 插入变

spss教程第二章

第二章数据文件的管理（上）（医学统计之星：张文彤）最后一次更新时间：2.1建立与保存数据文件-File菜单2.1.1 新建数据文件2.121 直接打开2.122 使用数据库查询打开2.1.2.3 使用文本导入向导读入文本文件2.1.2 打开其他格式的数据文件2.1.3保存数据文件2.1.4 File菜单中的其他条目2.2 编辑数据文件2.2.1 定义新变量2.2.1.1 直接定义新变量2.2.1.2 从原有变量计算新变量-Transform菜单2.2.2 数据的录入2.2.2.1 直接录入2.2.2.2 数据录入技巧2.3 进一步整理数据文件-Data菜单不言而喻，一切统计分析都是以数据为基础的，因此统计软件的数据管理能力非常重要。

SPSS以其豪华的界面为依托，为用户提供的便捷的数据管理功能，下面我们就来具体看一下。

§2.1建立与保存数据文件和大多数应用软件相同，SPSS中数据文件的管理功能基本上都集中在了File菜单上，该菜单的组织结构和WORD等也极为相似，因此这里我们只介绍比较有特色的几个菜单项。

I SPSS 10.0有三个主要窗口界面：数据管理窗口、程序编辑窗口和结果浏览窗口；另有两个不常用的窗口：结果草稿浏览窗口和VBs脚本语言编辑窗口。

他们共享许多菜单项，如File菜单就大部分相同，这里介绍的许多内容在五个窗口中都是通用的。

2.1.1 新建数据文件如果你正从头开始进行一个新的课题，刚刚把数据收集上来，要做统计分析，自然需要新建一个数据库，然后将所有的数据从纸上请到计算机里。

在SPSS中，新建一个数据库容易的不得了一一已经到了什么都不用做的地步！是这样，当你进入SPSS系统时，系统就已经生成了一个空数据文件，即你看到的空白的数据管理界面。

你只要按自己的需要定义变量，输入数据然后存盘就是了（这些操作马上会讲到）。

2.1.2 打开其他格式的数据文件凡是做过数据输入工作的人都知道：这活又费眼睛又累人，出错太多了还要挨批评，非常影响个人的光辉形象算了，还是在有限的经费里划几百美元出来雇个打字小姐吧（怎么用美元？因为我请了个老外！）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

定类型(如民族、性别)变量尤其重要。
12
5、缺失值

缺失数据：明显错误或明显不合理的数据、漏填的数据项

SPSS中识别缺失数据的方法：指定用户缺失值

先填入某个特定的标记数据再指明这个特定的标记数据为缺失值

SPSS的默认缺失值，也称为系统缺失值：数值型：用点 (•)表示对缺失数据删除、修正：以均值、中位数替代等
3
2.1.2 SPSS 数据的组织方式
（1）原始数据的组织方式

如果待分析的数据是一些原始的调查问卷，或是一些基本的统计指标，那么这些数据应该以原始数据的组织形式。数据编辑窗口中的一行称为一个个案或观测 (Case)，所有个案组成 SPSS数据文件的内容。数据编辑窗口的一列称为一个变量(Variable)，每个变量都有一个名字，称为变量名，它是访问和分析SPSS每个变量的唯一标志。SPSS数据文件的结构就是对每个变量及相关特征进行描述。例：大学生职业生涯规划.sav
4
（2）计数数据的组织方式

如果待分析的数据不是原始的调查问卷数据，而是经过分组汇总后的汇总数据，那么应该以计数数据的组织形式。数据编辑窗口中的一行为变量的一个分组（或多变量交叉分组下的一个分组），所有行包括变量的所有分组。数据编辑窗口的一列仍为一个变量,代表某个问题及相应的计数结果。例：血压和年龄.sav

SPSS的默认变量名，以字母“VAR”开头，后面补足5位数字，如VAR00001，VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名，如ALL，BY，AND， NOT，OR等。
变量名最好与其代表的数据含义相对应，每个变量名必须具有唯一性。
7

3、变量名标签变量名标签是对变量名含义的进一步解释说明，

它可以增强变量名的可视性和统计分析结果的可
读性。（可以省略）

变量名标签可用中文，总长可达120个字符。
8
2、变量类型、宽度、小数、列

变量类型是指每个变量的取值类型。SPSS 中有三种基本变量类型：数值型、字符串型和日期型。数值型：如身高，体重，收入，支出等

数值：默认类型如： 12345678、12345.67、-1234.56 科学计数法:表示很大或很小的数据如：1.2E+05 逗号: 从个位开始三位一个逗号如：1,234.56 美元: 表示货币格式很多，如：$12.30

2.5.2 使用文本导向读入文本文件
2.5.3 使用数据库向导读入数据
16
2.6 SPSS 数据文件的合并

目的：将两个或多个SPSS数据文件合并到一个数据文件中方法：首先将其中的某个数据文件读入数据编辑

窗口中，然后依次与其它数据文件合并

合并方式：纵向合并和横向合并
17
2.6.1 纵向合并数据文件
13

2.3 SPSS 数据的录入和编辑

2.3.1 SPSS 数据的录入：和 Excel 类似 2.3.2 SPSS 数据的编辑 1、SPSS 数据的定位
2、插入和删除个案
3、插入和删除变量
4、数据的移动、复制和删除
14
2.4 SPSS 数据的保存

2.4.1 SPSS 支持的数据格式 1、SPSS文件格式，扩展名为 .sav 2、Excel格式文件，扩展名为 .xls 或 .xlsx
(1)含义:
•
将两个数据文件首尾对接，其依据是变量名。两个SPSS数据文件应有可以合并的内容，且含义相同的数据项最好取相同的变量名和变量类型，含义不同的数据项其变量名最好不同。
(2)前提:
•
(3)菜单选项: 数据 -> 合并文件 -> 添加个案
例：“职工数据.sav ”和 “追加职工.sav”
18
2.6.2 横向合并数据文件
(1) 含义: 将两个数据文件左右对接。 (2) 前提: a.两个数据文件必须有一个共同的变量名作为关键变量---合并的依据； b.两个数据文件应事先按关键变量的升序排序； c.不同数据文件含义不同的数据项，变量名应不同. (3) 菜单选项: 数据 -> 合并文件 -> 添加变量例：“职工数据.sav ”和 “职工奖金.sav”

SPSS数据文件也称为数据集，是一种有结构的数据文件，它由数据结构和内容两部分组成，其中的数据结构记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等必要信息，数据的内容才是那些待分析的具体数据。基于上述特点，建立SPSS数据文件时应完成两项任务，即描述数据的结构和录入编辑数据。
定序型变量（Ordinal），如职称、职务、对某事
物的赞同程度；定类型数据（Nominal），如民族、宗教信仰、性别、党派。

11
4、变量值标签

变量值标签是对变量取值含义的解释说明信息，不但可以明确数据的含义，也增强了最后统计分
析结果的可读性，变量值标签可以用中文。

变量值标签对于定序型(如收入的高、中、低)和
第二章
SPSS 数据文件的建立和管理
1
第二章 SPSS数据文件的建立与管理
• SPSS 数据文件
• SPSS 数据的结构和定义方法
• SPSS 数据的录入和编辑
• SPSS 数据的保存
• 读取其他格式的数据文件
• SPSS 数据文件的合并
2
2.1 SPSS 数据文件
2.1.1 SPSS数据文件的特点
3、文本格式文件，扩展名为 .dat

2.4.2 保存 SPSS 数据的基本操作
15
2.5 读取其他格式的数据文件

2.5.1 直接读入其它格式的数据文件 1、SPSS文件格式，扩展名为 .sav 2、Excel格式文件，扩展名为 .xls 或 .xlsx
3、SAS格式文件，扩展名为 .sas7bdat
9
2、变量类型、宽度、小数、列

字符串型：由一串字符组成，不能进行算术运算

如身份证号，姓名，国家，地址等

日期型：表示日期或时间
显示格式：dd-mmm-yyyy；mm/dd/yyyy

宽度：是变量允许的最大字符位数
列：是数据编辑窗口中显示每列的字符位数
10

6、度量标准

统计学依据变量的度量尺度将变量划分为三大类: 数值型变量（Scale），如身高、体重；
5
2.2 SPSS 数据的结构和定义方法

SPSS 数据的结构是对 SPSS 每个变量及其相关属性的描述，在数据编辑器窗口的变量视图中定义，主要包括变量名、变量类型、变量宽度、变量名标签、变量值标签、显示宽度、缺失值、对齐方式、度量标准和角色等信息。
6
1、变量名变量的命名规则如下：

首字符应以英文字母开头，后面可以跟除了！、？、*之外的字母或数字；下划线、圆点不能为变量名的最后一个字符；SPSS允许用汉字作为变量名。变量名不区分大小写字母。
19
小结

熟悉SPSS的两个主要窗口：数据编辑窗口和结果输出窗口
了解数据内容中行列的含义

掌握数据结构的定义方法
掌握数据文件的录入、编辑、保存、合并操文本）
20