第二章 SPSS数据文件的建立和管理

合集下载

统计SPSS数据文件的建立和管理

第2章 SPSS数据文件的建立和管理学习目标1．明确SPSS数据的基本组织形式和数据行列的含义。

2．掌握应从哪些方面描述SPSS数据文件的结构特征。

3．熟练掌握建立SPSS数据文件以及管理SPSS数据的基本操作。

4．熟练掌握在SPSS中读取Excel工作表数据的基本操作，了解读取文本和数据库数据的基本方法。

建立SPSS数据文件是利用SPSS软件进行数据分析的首要工作。

没有完整且高质质的数据，也就没有值得信赖的数据分析结论。

2.1 SPSS数据文件建立SPSS数据文件，应首先了解SPSS数据文件的特点、数据组织的基本方式和相关概念等。

只有这样才能够建立一个完整且全面的数据环境，服务于以后的数据分析工作。

2.1.1SPSS数据文件的特点SPSS数据文件是一种有别于其他文件（如Word文档、文本文件）的有特殊性的文件。

从应用角度理解，这种特殊性表现在两方面。

第一，SPSS数据文件的扩展名是.sav；第二，SPSS数据文件是一种有结构的数据文件。

它由数据的结构和内容两部分组成。

其中，数据的结构记录了数据的类型、取值说明、数据缺失情况等的必要信息，数据的内容是那些待分析的具体数据。

SPSS数据文件与一般文本数据的不同在于：一般文本文件仅有纯数据部分，而没有关于结构的描述。

正是如此，SPSS数据文件不能像一般文件那样可以直接被大多数编辑软件读取，而只能在SPSS软件中打开。

基于上述特点，建立SPSS数据文件时应完成两项任务，第一，描述SPSS数据的结构；第二，录入编辑SPSS的数据内容。

这两部分工作分别在SPSS数据编辑窗口的变量视图中完成。

2.1.2 SPSS数据的基本组织方式SPSS的数据将直观地显示在数据编辑窗口中，形成一张平面二维表格。

待分析的数据将按原始数据方式和计数数据方式组织。

一、原始数据的组织方式如果待分析的数据是一些原始的调查问卷数据，或是一些基本的统计指标，那么这些数据就可按原始数据的方式组织。

SPSS统计分析- 第2章数据文件建立和管理

4．读取“*.txt”数据文件
现需将“人居收入.txt”文件中的数据读入SPSS，如图所示： (1) 打开“数据编辑器”对话框，选择“文件”|“打开文本数据”命令，打开“打开数据”对话框。选择文本文件，单击“打开”按钮，打开“文本导入向导”对话框，如图所示：
(2) 在“您的文本文件与预定义的格式匹配吗？ ” 选项组中选择 “ 是 ” 单选按钮，可单击“浏览” 按钮，选择已预定义好的格式；单击 “ 否 ” 则需要建立一个新格式。
2.1.1 打开定义变量视图
• 按前一章所述打开SPSS主界面，视图切换标签处单击“变量视图”，即打开“变量视图”窗口，如图所示。在该视图可对变量的以下属性进行定义：名称、类型、宽度、小数、标签、值、缺失、列、对齐、度量标准和角色。
2.1.2 定义变量名称
• 在“变量视图”变量栏的“名称”栏中定义变量名称，用户可根据数据需要或个人习惯进行定义，如果不对变量进行定义，系统将自动默认变量名为var00001、var00002、 var00003等。一般根据变量的实质意义来命名，例如：年龄、性别、年级等变量，可用Age,Gender,Grade命名，也可用中文意义命名，但当出现变量数量较大时，一般使用流水编号，即防混淆又方便。虽然变量可根据用户的需求自行编辑，但仍有其需共同遵循的原则： • 若用英文命名，变量名首字必须为英文字母，其后方可接数字、英文字母、@等。若用中文命名，则可直接使用。 • 不可使用空格和特殊字符（如键盘上的！、#、$、%、&、 ^、*、（、）、？等字符）。
(9) 之后进入下一步，如图所示。在“变量之间有哪些分隔符？”中，可根据文本数据中变量间的分隔符，可选择“制表符”、 “空格”、“逗号 ”、“分号” 和“其他”复选框。在“文本限定符是什么？”中，可选择“无”、“单引号”、“ 双引号”和“其他”单选按钮，一般默认为“无”，选择完毕后单击“下一步” 。

SPSS数据文件的建立和管理实验报告

6.对第二个表格进行保存，并且命名为“学生成绩二.sav”
第二题：
1.先打开常用软件里的SPSS 11.5 for Windows.exe,在Variable View中根据题目输入相关数据,如下图所示
2.在Data View中根据题目输入相关数据,结果如下图所示
3.对这个表格进行保存,并且命名为“减肥产品.sav”
3.选中“Match cases on key variables in sorted files”，将“学号”放入“Key Variables”中，结果如下所示
第二题：
因为题中要求将数据文件转换为EXCEL文件,所以通过【File】→【Save As】可实现
输入文件名“减肥产品”，再修改保存类型，选择EXCEL保存类型，即可得到升序排列，结果如下图所示
3.对第一个表格进行保存，并且命名为“学生成绩一.sav”
4.重新打开一个表格，在Variable View中根据题中要求输入数据，如下图所示
5.在Data View中先输入数据,再选中“学号”一列，选择升序排列，结果如下图所示
表1学生语文成绩
学号
1
3
4
5
8
9
10
2
6
7
姓名
张三
李四
王燕
赵宇
白艳
王洁
李丽
成功
孙昌
章建
语文成绩
89
76
87
65
97
74
82
90
67
88
表2学生数学成绩
学号
1
2
3
8
9
7
6
5
4
10
姓名
张三
成功

薛薇-《SPSS统计分析方法及应用》第2章-SPSS-数据文件的建立和管理

10
2.4 SPSS数据的录入与编辑（1）录入在数据视图中，输入数据。（2）编辑在数据视图中，进行编辑数据。
2.5 SPSS数据的保存文件保存或另保存选择目录路径选择文件类型（.sav，.xls，.dbf，.dat）输入文件名保存
11
2.6 读取数据文件
文件打开数据选择目录路径选择文件类型（ .sav，.xls，.dbf，.dat）选择文件名打开
2.2.7 结构定义的基本操作步骤:1、打开SPSS编辑窗口新建数据单击“变量视图” 2、输入：变量名称、类型、宽度、标签、值等。
9
2.3 SPSS结构定义的应用案例 1、设计调查问卷标题、引言部分、主体部分、结束语。如，表2-3。 2、建立数据文件结构调查问卷中，一份卷为一个个案，一个题目作为一个变量（也称指标）如，表2-4。（度量水平：有序（序号、定序）、名义（定类）、定距（度量）） 3、录入数据单选择题录入、多选题的录入
变量值标签
对变量取值含义的2）解。释说明信息。如，1表示男，2表注示意女，。相应列的数据只显
缺失值
示的个数为显示宽度（如明计显量错尺误度或（明即显度不量合标理，准、2）存。分在三漏大填类的：数定据距。型
计量尺度
（度量）、定序型（数序据号类）型、有定：类数型值（型名、字
义）。
符串型、日期型。
8
2.2 SPSS数据的结构和定义方法
个
变量
案
5
2.1 SPSS数据文件
（2）频数数据的组织方式
频数数据的组织：分组汇总后的汇总数据作为待分析数据。
频数数据的组织分为:行与变量。如，在研究职称和年龄的关系时得到下表数据（表2-1）
年龄段

SPSS

第一章 SPSS概述1. SPSS有哪些主要窗口？它们的作用和特点各是什么？答：①数据编辑窗口主要功能：定义SPSS数据的结构、录入编辑和管理待分析的数据。

特点：SPSS的所有统计分析功能都是针对该窗口中的数据的。

这些数据通常以SPSS数据文件的形式保存在计算机磁盘上，其文件扩展名为.sav。

sav文件格式是SPSS独有的，一般无法通过Word、Excel等其它软件打开。

②结果输出窗口主要功能：显示管理SPSS统计分析结果、报表及图形。

特点：SPSS统计分析的所有输出结果都显示在该窗口中。

输出结果通常以SPSS输出文件的形式保存在计算机磁盘上，其文件扩展名为.spv。

spv文件格式是SPSS独有的，一般无法通过Word、Excel等其它软件打开。

2. SPSS有哪三种主要使用方式？各自的特点是什么？答：三种主要使用方式为：完全窗口菜单方式、程序运行方式、混合运行方式①完全窗口方式的特点：所有的分析操作都通过菜单按钮、输入对话框等方式来完成②程序运行方式的特点：它能够依照程序自动进行多步骤的复杂数据分析，分析过程中无须人工干预③混合运行方式：在使用菜单的同时编辑SPSS程序3. .sav，.spo，.sps分别是哪类文件的扩展名？答：.sav是SPSS数据文件的扩展名；.spo是SPSS输出文件的扩展名；.sps是SPSS程序文件的扩展名4.在SPSS的输出窗口中应如何操作才能将不同的分析结果保存到不同的文件中？答：以不同命名方式保存，其文件扩展名均为.spo5.SPSS的数据加工和管理功能主要集中在哪些菜单中？统计绘图和分析功能主要集中在哪些菜单中？答：数据加工和管理功能主要集中在Data和Transform；统计绘图和分析功能主要集中在Analyze和Graphs。

6.利用SPSS进行数据分析的一般基本步骤是什么？答：（1）SPSS数据的准备（2）SPSS数据加工整理（3）SPSS数据的分析（4）SPSS分析结果的阅读和解释第二章SPSS数据文件的建立和管理1. SPSS中有哪两种基本数据组成方式？各自的特点和应用场合是什么？答：原始数据的组织方式和计数数据的组织方式如果待分析的数据是一些原始的调查问卷数据，或是一些基本的统计指标，这些数据就可按原始数据的方式组织；如果待分析的数据不是原始的调查问卷数据，而是经过分组汇总后的计数数据，这些数据按计数数据的方式组织。

SPSS数据分析教程-2-数据文件的建立和管理

最新课件
14
数据的输入操作（2）
ID号(id) 性别(sex)：1：男； 2：女
1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 2
身高(height)
76，59，67，65，63，72，70，68，69，74，68，63
参加活动以前的体重(before)
185 113 145 156 109 191 155 165 175 180 135 118
如果一个文件中的某个个案在另一个文件中找不到个案来匹配，则该个案于第二个文件的变量上的取值为缺失值。反之亦然。
如果一个文件中的某个个案在另一个文件中找到两个或者两个以上的个案来匹配，则该个案只取第二个文件中第一个相匹配的个案来连接。反之亦然。
最新课件
38
合并变量示意图：一对一
最新课件
39
最新课件
3
本章学习目标
理解信息、数据与数据处理的基本概念；了解SPSS数据编辑器的特点，熟悉SPSS的变
量视图和数据视图，掌握SPSS常用的工具按钮；
掌握数据录入SPSS软件的方法；
掌握把电子表格、数据库、文本文件等格式的数据文件读入SPSS软件的方法；
掌握SPSS数据集的数据字典；学习合并两个数据文件的方法；明确分割SPSS数据文件的方法。
分析的目的是比较不同收益类型客户的概要特征。
最新课件
42
先按照关键变量“orgntype”（客户工作单位的类型）进行合并文件。选择【数据】→ 【排序个案】，首先按照关键变量
“orgntype”排序。
然后选择【数据】→【合并文件】→【添加变量】进行合并。
最新课件
43
2.7 数据的拆分

spss数据文件的建立与管理

SPSS数据文件的结构
2 、字符型(String): 存储字符数据 8位如：beijing 处理时用双引号扩起来 3、日期型（Date):存储日期数据格式很多，如：20-AUG-1999 4、其他: 如：圆点数值型(dot)、用户自定义型(customer) 注意：显示宽度不影响数据的存储
SPSS数据文件的结构
(二)横向数据合并 (3)菜单选项: data -> merge file -> add variable (4)选项说明: – math cases on key variables in sorted files:以关键字作为合并标志。 – Both files provide cases:合并后的文件的数据由两个文件共同提供。 – External file is keyed table:以data editor的数据为基础。 – Working data file is keyed table:以磁盘文件的数据为基础。
（二）变量的类型(type)和显示宽度(width) 1、数值型：

标准数值型(Numeric):默认类型列宽8位；小数点2位如： 12345678、12345.67、-1234.56 带逗号的数值型(Comma): 从个位开始三位一个逗号如：1,234.56 科学计数法(Scientific Notation):表示很大或很小的数据如：1.2E+05 带美元符号(Dollar):表示货币格式很多，如：$12.30
事先指定：指定某个特定值为缺失值（用户缺失值）其他处理方法，如：以均值、众数替代等
3、SPSS缺失值用户缺失值系统缺失值：点 (•)
SPSS数据文件的结构
（七）变量计量尺度(Measurement)

1-2(文件的建立和编辑)

删除变量
(1)在欲删除的变量名上单击鼠标左键
( 2) 右键选择Cut
定义日期时间变量 Define Dates
步骤
(1) Define Dates
(2)设臵日期时间
二、个案管理
主要内容：个案定位插入和删除一个个案个案排序个案选取个案加权
个案定位将当前数据单元定位到特定单元两种定位方式:人工定位和自动定位人工定位方法: 用鼠标拖动数据编辑窗口右边滚动钮或 Page Up Page Down
说明 SPSS早期版本数据文件 Systat数据文件 Spss Portable数据文件 Excel文件 Lotus l—2—3 x.0 (wk3) 格式数据文件 SYLK(符号链接)格式文件 dBase数据库文件 SAS长文件名数据文件 SAS短文件名数据文件
SAS v6 for Windows (*．sd2)
例如：变量名变量标签 W weight或体重 H Height或身高
变量值标签 Value Lables
对变量取值含义进一步解释说明
例如变量值 Sex f m 值标签 Female Male
缺失数据 Missing
说明缺失数据的基本方法指定用户缺失值用户缺失值可以是字符型或数值型变量----1至3个特定的离散值数值型变量---一个连续的闭区间加一个区间以外的离散值
五
数据的编辑
数据编辑功能表（Edit菜单）
命令
Undo Redo Cut Copy Paste Clear Find
功能
删除刚输入的数据或者恢复刚修改的数据恢复刚撤消的操作将选定数据剪切到剪贴板将选定数据拷贝到剪贴板将剪贴板的数据粘贴到指定位置清除选定的变量和观测值查找数据

第2章 SPSS 17.0 基本操作与数据管理

(2)字符型:
字符型编变量由字符串组成，可以包含数字、字母和一些特殊符号。字符型变量的默认长度为8，大于8个字符的称为长字符型变量，少于8个字符的称为短字
符型变量，字符型变量最长为32767个字符。他不能参与运算，区分大小写字母。
(3)日期型: 日期型变量用于表示日期和时间,他有29种不同的日期和时间格式,不能参与运算 ,要参与必须通过日期函数进行转换。如：1-12-2009、29.12.99等
2.1.2 常量、变量、操作符和表达一、常量与变量式
1.SPSS常量 SPSS中的常量在一定阶段内其取值不随观测而改变的值。有3种类型 (1)数值型：数据型常量是一个数值。他有两种书写方式: 一是普通书写方式，如:53、74.2等；二是科学计数书写方式，其使用指数表示数值，通常用于表示贴别大或特别小的数值。如：1.2E+05 表示1.2×105 (2)字符型: 字符型常量是被单引号或双引号括起来的一串字符。如果本身带有单引号或半个单引号，则必须使用双引号括起来。如：beijing 处理时用双引号扩起来，即“beijing” (3)日期型: 按特定格式存储日期数据，一般使用较少格式很多，如：20-AUG-1999
（2）比较表达式
比较表达式是利用关系运算符建立起的两个变量间的比较关系，要求相互比较的两个量类型一致，他的结果一般逻辑型。
如：x=2，则表达式“x>0”为真，系统返回1(true)。
（3）逻辑表达式
逻辑表达式由逻辑运算符、逻辑型的变量或取值为逻辑型的比较表达式构成。他的值为逻辑型常量。如：对于表达式“true AND true” 系统返回“true ” ， “true OR false” 系统返回“true ” 。

《SPSS数据分析与应用》SPSS数据文件的建立与管理

（3）系统保留字（如ALL、BY、AND、NOT、OR等）不能作为变量名。（4）当英文字母作为变量名时，系统不区分大小写字母。（5）SPSS有默认的变量名。当没有为变量命名时，会以字母“VAR”开头，后面补足5位数字，如VAR00001、VAR00012等。
2. 变量类型
变量类型
说明
数字逗
2.2.2导入其他类型的数据文件
1.使用Excel向导读入Excel文件
第一步：启动SPSS，在菜单栏中选择【文件(F)】→【导入数据(D)】→【Excel】，将弹出“打开数据”对话框，在该对话框中选择数据所在的路径，选择文件“招聘数据.xlsx”，如图所示，单击【打开(O)】。
1.使用Excel向导读入Excel文件
2.使用文本向导导入文本文件
第二步：在“文本导入向导-第1/6步”对话框中，需要观察文本文件与预定义的格式是否匹配，如果不匹配，则需要设置文本导入格式，如图所示，单击向导导入文本文件
第三步：在弹出的“文本导入向导-第2/6步”对话框中，主要需要关注数据文件的第一行是否有变量名，如果有，则需要在【文件开头是否包括变量名？】框内勾选【是】，设置【包含变量名称的行号(L)】为“1”，如图所示，单击【下一步(N)】按钮。
2.2.1 SPSS数据的录入
第二步：单击数据编辑器窗口左下角的【变量视图】按钮，切换到变量视图窗口，根据要录入的数据定义变量属性。
2.2.1 SPSS数据的录入
第三步：在左下角单击【数据视图】按钮，就可以直接在SPSS数据编辑器窗口里以电子表格的方式直接录入数据，建立SPSS文件，录入样例如图所示。
第一步：准备好需要合并的数据文件，注意，个案合并的SPSS数据文件的变量数量必须完全一致。两个数据文件均包含9个变量，如图所示。

第2章数据文件的建立和管理PPT教学课件

第2章 SPSS数据文件的建立和管理
2.1 数据文件的特点和结构 2.2 定义数据文件的结构 2.3 数据的录入与保存 2.4 数据的编辑 2.5 读取其他格式的数据文件
1
SPSS数据文件的特点
SPSS数据文件的特殊性：其扩展名是.sav；它是一种有结构的数据文件。
SPSS数据文件由数据的结构和内容两部分组成。其中数据的结构记录数据类型、取值说明、数据缺失情况等必要信息，数据的内容才是待分析的具体数据。
数据中错误或者漏填的数据。如果不特意说明，SPSS会把缺失数据参与分析，因此要对缺失数据进行说明。对缺失数据进行说明的三种方法（P14）：
对于漏填的数值型数据，系统默认的缺失值用一个圆点来表示，字符型变量中的空格或控不是系统缺失值。
11
度量尺度
定距型数据（Scale）定序型数据（Ordinal）定类型数据(Nominal)
14
SPSS数据的录入与保存
录入:逐行录入按Tab键,逐列输入按Enter键（例：职工基本情况数据P49）录入带有变量值标签的数据： View→Value Labels (单元格将显示对应的变量值标签) 数据的保存： data 保存成其他格式的文件：Save as
15
第2章 SPSS数据文件的建立和管理
建立SPSS 数据文件应完成两项任务
描述SPSS数据的结构录入编辑SPSS数据
SPSS数据文件的结构
个案、变量、单元格、当前单元格
SPSS数据文件以二维表的形式组织数据。一行为一个样品（CASE）或个案，一列为一个变量（VARIABLE），行与列交叉之处为一个单元格，可在其中输入变量值。
9
变量值标签（Value Lable）

单元一 SPSS数据文件的建立和管理

（2）计数数据的组织方式
第一节 SPSS的发展及使用基础
（二）SPSS数据结构的基本方式
（2）计数数据的组织方式
第二节 SPSS的数据结构和定义方法
（一）变量名
变量名是变量访问和分析的唯一标识。
变量命名原则：
SPSS 变量名由不多于64(32个汉字)个字符组成；首字母是字母或汉字也可以是@字符；不能使用?,!和*；注意不能以下划线_和圆点“.”作为变量名的最后一个字符；
第一节 SPSS的发展及使用基础
（二）SPSS数据结构的基本方式
第一节 SPSS的发展及使用基础
（二）SPSS数据结构的基本方式
在计数数据的组织方式中，数据编辑窗口中的一行为变量的一个分组（或多变量交叉分组下的一个分组）。所有行囊括了该变量的所有分组情况（或多变量交叉下的所有分组情况）。数据编辑器窗口中的一列仍为一个变量，代表某个问题（或者某个方面的特征）以及相应的计数结果。
第五节数据文件合并
数据文件合并的介绍
（2）横向合并-案例
职工数据和职工奖金数据的合并
①打开“职工数据.sav”②选择菜单【数据】→ 【合并文件】 → 【添加变量】
学业进步！
基本操作步骤如下：
【文件】→【导入数据】→【文本数据】
（二）使用导向导入其他格式的数据

第五节数据文件合并
数据文件合并的介绍
当数据量较大时，经常会把一份大的数据分成几个小的部分，分别录入，录入完毕后，就必须将若干个小的数据文件合并起来。数据文件的合并分为纵向合并和横向合并。
（1）纵向合并
将一个SPSS数据文件的内容追加到当前数据编辑器窗口中数据的后面，依据两份数据文件中的变量名进行数据对接。
字符串型简称字符串（R），是SPSS中较常用的数据类型，它有由一串字符组成。如职工号码、姓名、地址等变量都可以定义为字符串数据。

第二章 SPSS应用基础(数据文件的建立与管理)

（下面分别说明）
第二章 SPSS数据文件的建立、编辑与保存
SPSS数据文件的结构
数据文件的每一行代表一条记录，即每一行代表一个个体、一个个案、一个样品(Case)
每一列代表一个变量或一个被观测量的特征 (Variable)
单元(Cell)是某个个体与某个变量的交叉。即每个单元是一个观测或测定值。单元与电子表格不同，单元只包括数据值而不能含公式。（在数据编辑器中可以输入和编辑数据，但是不能输入数学表达式和函数)
设置数值型变量的宽度，默认8位，当变量为日期型时无效。默认类型8 ， 2 。如：12345678、12345.67、-
1234.56
第二章 SPSS数据文件的建立、编辑与保存
[Decimal]：变量小数点位数
设置数值型变量的小数位数，变量为日期型时无效。
[Label]：变量标签
第二章 SPSS数据文件的建立、编辑与保存
数据文件的范围是由记录和变量的数目决定的。可以在
任一单元中输入数据。如果在定义好的数据文件边界以外
键入数据，SPSS 将数据长方形延长到包括那个单元和文
件边界之间的任何行和列。
单元编辑器
如果要分析的数据还没有录入，可用数
变量Variable
据编辑器来键入数据
空格和特殊字符（如！、？、`和*等），不区分大小写
不能用作变量名的关键词有：ALL、NE、EQ、 TO、LE、GE、BY、OR、GT、AND、NOT、 WITH
第二章 SPSS数据文件的建立、编辑与保存
[Type]：定义变量类型
单击[Type]相应单元中的按钮，显示下图对话框，主要变量类型有：Numeric（标准数值型，默认）、 Comma（逗点型数值型）、Dot（句点数值型）、 Scientific Notation （科学记数型） Date（日期型）、 Dollar（带美元符数值型）、 Custom Currency（自定义型）、 String （字符串型）。选择合适的变量类型并单击[OK]确定。

spss数据的录入与管理

标识重复个案标识异常个案
计算变量
“目标变量”文本框：用于输入需要
赋值的变量名
“转换” “计算变量”
“数字表达式”文本框：用于给目标变量赋值
候选变量列表
函数解释文字文本框
“函数组” 列表框
“函数和特殊变量”列表框
3.2 已有变量值的分组合并
将连续变量转换为等级变量或将分类变量不同的变量等级进行合并。
“重新编码为相同变量”：对原始变量的取值直接进行重编码 “重新编码为不同变量”：根据原始变量的取值生成一个新变量来记录重编码的结果。
B交叉变量规则：交叉变量规则是用户定义的涉及多个变量间逻辑关系的规则，由标记无效值的逻辑表达式定义，可以应用于单个
1、定义验证规则 “数据” “验证” “定义规则” 2、进行数据验证 “数据” “验证” “验证数据” 3、加载预定义规则 “数据” “验证” “加载预定义规则” Predefined Validation Rules.sav
（4）文件合并向导：将几个数据文件合并为一个大的SPSS数据文件，含横向合并和纵向合并两种情况。
（5）数据字典相关向导：包括定义变量属性，复制变量属性，以及新建设定属性三个向导界面。
4.1 几个常用的过程
1、排序个案数据编辑窗口中的记录的前后次序在默认情
况下由录入时的先后顺序决定。（1）单变量排序：变量名处右击，“升序排列 ”“降序排列” （2）多变量排序：使用“排序个案”对话框 2、分割文件（Split File） 3、选择个案：用于只分析部分数据 4、加权个案：（1）以频数格式录入的数据
最优离散化过程:是对前述可视化离散过程的进一步自动化，根据某些作为“关键指示变量”的分类变量，将原有的一个或多个连续性变量按照该分类变量类间差异最大化的

SPSS数据分析实例详解

第一章 SPSS概览－－数据分析实例详解1.1 数据的输入和保存1.1.1 SPSS的界面1.1.2 定义变量1.1.3 输入数据1.1.4 保存数据1.2 数据的预分析1.2.1 数据的简单描述1.2.2 绘制直方图1.3 按题目要求进行统计分析1.4 保存和导出分析结果1.4.1 保存文件1.4.2 导出分析结果欢迎加入SPSS使用者的行列，首先祝贺你选择了权威统计软件中界面最为友好，使用最为方便的SPSS来完成自己的工作。

由于该软件极为易学易用（当然还至少要有不太高的英语水平），我们准备在课程安排上做一个新的尝试，即不急于介绍它的界面，而是先从一个数据分析实例入手：当你将这个例题做完，SPSS的基本使用方法也就已经被你掌握了。

从下一章开始，我们再详细介绍SPSS各个模块的精确用法。

我们教学时是以SPSS 10.0版为蓝本讲述的－－什么？你还在用7.0版！那好，由于10.0版在数据管理的界面操作上和以前版本有较大区别，本章我们将特别照顾一下老版本，在数据管理界面操作上将按9.0及以前版本的情况讲述，但具体的统计分析功能则按10.0版本讲述。

没关系，基本操作是完全一样的。

好，说了这么多废话，等急了吧，就让我们开始吧！希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。

例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同（卫统第三版例4.8）？患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87让我们把要做的事情理理顺：首先要做的肯定是打开计算机（废话），然后进入瘟98或瘟2000（还是废话，以下省去废话2万字），在进入SPSS后，具体工作流程如下：1.将数据输入SPSS，并存盘以防断电。

《统计分析与SPSS的应用(第五版)》课后练习答案(第2章)

《统计分析与SPSS的应用（第五版）》（薛薇）课后练习答案第2章SPSS数据文件的建立和管理1、SPSS中有哪两种基本的数据组织形式？各自的特点和应用场合是什么？SPSS中两个基本的数据组织方式：原始数据的组织方式和计数数据的组织方式。

原始数据的组织方式：待分析的数据是一些原始的调查问卷数据，或是一些基本的统计指标。

计数数据的组织方式：所采集的数据不是原始的调查问卷数据，而是经过分组汇总后的数据。

2、什么是SPSS的个案？什么SPSS的变量？个案：在原始数据的组织方式中，数据编辑器窗口中的一行称为一个个案或观测。

变量：数据编辑器窗口中的一列。

3、在定义SPSS数据结构时，默认的变量名和变量类型是什么？如果希望增强SPSS统计分析结果的易读性，还需要对数据结构的哪些方面进行必要说明？默认的变量名：VAR------ ；默认的变量类型：数值型。

变量名标签和变量值标签可增强统计分析结果的可读性。

4、收集到以下关于两种减肥产品试用情况的调查数据，请问在SPSS中应如何组织该份资料？体重变化情况产品类型明显减轻无明显变化第一种产品27 19第二种产品20 33问：在SPSS中应如何组织该数据？数据文件如图所示：5、什么是SPSS的用户缺失值？为什么要对用户缺失值进行定义？如何在SPSS中指定用户缺失值？缺失值分为用户缺失值（User Missing Value ）和系统缺失值（System MissingValue ）。

用户缺失值指在问卷调查中，将无回答的一些数据以及明显失真的数据当作缺失值来处理。

用户缺失值的编码一般用研究者自己能够识别的数字来表示，如“0”、“9”、“99”等。

系统缺失值主要指计算机默认的式，如果在输入数据时空缺了某些数据或输入了非法的字符，算机就把其界定为缺失值，这时的数为“?”。

在图中定义。

6、从计量尺度角度看，变量包括哪三种主要类型？请各举出一个相际数据在 SPSS 中指定变量的计算尺度？变量类型包括：数值、定序型（受教育程度）以及定类型（性别）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

（2）删除一条个案：即删除数据编辑窗口中的某条个案。 ★在要删除的个案号码上单击左键，于是待删除的个案数据全部反色显示。 ★单击右键，从弹出菜单中选择 cut选项。
3、插入和删除一个变量（1）插入一个新变量：即在数据编辑窗口的某个变量前插入一个新变量。 ★ 将当前数据单元确定在某变量上 ★选择菜单：编辑 -> 插入变量
一行为一个个案
一列为一个变量
二、计数数据的组织方式有时所采集的数据不是原始的调查问卷数据，而是经过分组汇总后的计数数据。在研究职称和年龄的关系时汇总得到如表所示的数据。其中职称的分组值分别为1～4，年龄段的分组值为1～3。职称教授（1）副教授（2）讲师（3）助教（4）年龄段 35岁以下（1） 36～49岁（2） 50岁以上（3） 0 10 20 35 15 20 10 2 8 1 1 0
例有两份关于职工基本情况的SPSS数据文件，文件名分别为“职工数据.sav”和“追加职工.sav”。两份数据文件中的数据项不尽相同，且同一数据项的变量名也不完全一致。现需要将这两份数据合并到一起。
纵向合并数据文件的基本操作步骤
1、在数据编辑窗口中打开一个需要合并的SPSS数据文件。 2、选择菜单：数据 -> 合并文件 -> 添加个案
基本操作步骤如下：（1）选择菜单：文件 -> 打开 -> 数据（2）选择数据文件的类型，并输入数据文件名。
注意：
如果读入的是Excel格式文件，SPSS默认将它的所有数据读到SPSS数据编辑窗口中，也可以指定读取工作表中某个区域内的数据（A5:B10，表示仅读取以A5单元为左上角，B10单元为右下角的矩形区域内的数据）。工作表上的一行数据为SPSS的个案。如果Excel工作表文件第一行或指定读取区域内的第一行上存储了变量名信息，则应选择读取变量名选项。
纵向合并SPSS数据时，通常要注意以下两个问题： ★ 两个待合并的SPSS数据文件的内容合并起来应是有实际意义的。换句话说，如果两份完全不相干的数据，虽然操作上能够实现他们的纵向合并，但却是毫无意义的。
★为方便SPSS数据文件的纵向合并，在不同数据文件中数据含义相同的数据项最好用相同的变量名，且数据类型也最好相同，利于SPSS对变量的自动匹配。
（2）删除一个变量：即删除数据编辑窗口中的某列变量。 ★ 在要删除列的变量名上单击左键，于是待删除列的数据全部反色显示。
★单击右键，从弹出菜单中选择 cut选项。
4、数据的移动、复制和删除
数据的移动、复制和删除：与一般的应用程序相同（1）选择操作对象（变量、个案、若干连续单元等）（2）剪切：Edit+Cut(Ctrl+X) 复制：Edit+Copy(Ctrl+C) 粘贴：Edit+Paste(Ctrl+V)
频数数据举例
2-2 数据文件的结构和定义方法
SPSS数据的结构是对SPSS每列变量及其相关属性的描述，它的定义是通过数据编辑窗口中的变量视图实现的。一、变量名二、数据类型三、变量名标签四、变量值标签五、缺失数据六、计量尺度
一、变பைடு நூலகம்名（Name）
变量名是变量存取的惟一标志。在定义SPSS数据文件结构时应首先给出每列变量的变量名。为了方便记忆，变量名最好与代表的数据含义相对应。变量名一般的起名规则： 1、变量名的字符个数不多于8个；变量名不区分大小写字母。允许汉字作为变量名，汉字总数不能超过4个； 2、首字符应以英文字母开头，后面可以跟除了！，？，*之外的字母或数字。下划线、圆点不能为变量名的最后一个字母； 3、变量名不能与SPSS内部特有的具有特定含义的保留字相同，如ALL，BY，NOT，OR等；SPSS有默认的变量名，它以字母“VAR”开头，后面补足5位数字，如VAR00001， VAR00012等。
纵向合并数据文件的基本操作步骤
3、新的活动数据集中的变量：框中显示的变量名是两个数据文件中的同名变量，SPSS 默认它们有相同的数据含义，并将它们作为合并后新数据文件中的变量。如果不接受这种默认，可以按按钮将它们剔除到非成对变量框中。
4、非成对变量：框中显示的变量名是两个文件中的不同变量。SPSS默认这些变量的含义不同，且不放入合并后的新文件中。如果不接受这种默认，可选择其中的两个变量名并按指定配对，表示虽然它们的名称不同，但数据含义是相同的。可进入合并后的数据文件中。或者，对某变量按改名后再指定配对。
定距型数据（Scale）：通常是指诸如年龄、身高、体重、血压等连续数值型数据，也包括“人数”、“商品件数”等离散数值型数据；定序型数据（Ordinal）：具有内在固有大小或高低顺序，一般可以用数值或字符表示，它取值的大小能够表示观测对象的某种顺序关系（等级、方位或大小等），但是相邻级别之间的差距是不相等。例如，职称变量可以有低级、中级、高级三个取值，可分别用1,2,3表示。年龄段变量可以有老、中、青三个取值，分别用A、B、C表示等。定类型数据（Nominal）：是指没有内在固有大小或高低顺序，而只是一种名义上的指代，一般以数值或字符表示的分类数据。如性别变量中的男、女取值，可以分别用1，2表示。民族变量中的各个民族，可以分别用汉、回、满等字符表示。
逗号型
Comma
圆点型
Dot
美元符号型
Dollar
字符型
String
8
无
一串字符
dd-mmm-yyyy、mm/dd/yyyy 等
日期型
Date
2、字符型（String）字符型也是SPSS较常用的数据类型，由一串字符串组成。如职工号码、姓名、地址等变量都可以定义为字符型数据。 3、日期型（Date）日期型用来表示日期或者时间数据，如生日、成立日期等变量可以定义为日期型。
SPSS用户缺失值是： ★ 对字符型或数值型变量，用户缺失值可以是1～3个特定的离散值。 ★ 对一个数值型变量，用户缺失值可以在一个连续的闭区间内并同时附加一个区间以外的离散值。
SPSS系统缺失值：是用一个圆点表示，它不等于0或.00，通常出现在数值型变量数据中。
六、计量尺度（Measure）
四、变量值标签（Values）
变量值标签是对变量取值含义的解释说明信息，对于定类型和定序型数据尤为总要。例，用数值1表示男，用数值2表示女。
可见，变量值标签对于定序数据（如收入的高、中、低）和定类数据（如民族、性别）来说是必不可少的，它不但明确了数据的含义，也增强了最后统计分析结果的可读性。变量值标签可以用中文。
第二章
SPSS数据文件－－建立与管理
2-1
SPSS数据文件
一、SPSS数据文件的特点
1、SPSS数据文件的扩展名是.sav； 2、SPSS数据文件是一种有结构的数据文件。（结构＋内容）二、SPSS数据的基本组织方式 1、原始数据的组织方式如果待分析的数据是一些原始的调查问卷数据，或是一些基本的统计指标，那么这些数据就可按原始数据的方式组织。打开住房状况调查：桌面－>培训->住房状况调查
数据的剪切、粘贴与复制
若想恢复，打开Edit---Undo
2-4 读取其他格式的数据文件
一、直接读入其他格式的数据文件
dBase(*.dbf) Text(*.txt) data(*.dat) SPSS(*.sav) dBase系列数据文件，（从dBase II～IV）纯文本格式的数据文件纯文本格式的数据文件 spss系列数据文件
二、数据的类型、宽度、小数位数 Type、 Width、Decimals
数据类型是指每个变量取值的类型。SPSS中有三种基本数据类型，分别为数值型、字符型和日期型。相应的类型会有默认的列宽或小数位数等。
1、数值型数值型是SPSS最常用的数据类型，通常由阿拉伯数字（0 ～9）和其他特殊符号（如美元符号、逗号、圆点）等组成。SPSS中数值型有以下五种不同的标识方法：（1）标准型（Numeric）（2）科学记数法型（Scientific Notation）（3）逗号型（Comma）（4）圆点型（Dot）（5）美元符号型（Dollar）
五、缺失数据（Missing）
数据中明显错误或明显不合理的数据以及漏填的数据都可看做缺失数据。例，在某项客户满意度的问卷调查数据中，某个被调查者的年龄是213岁。这个数据显然是一个不符合实际情况的失真数据。
例，在某项客户满意度的问卷调查数据中，某个被调查者的年收入没有填，是空缺的。
SPSS中说明缺失数据的基本方法是指定用户缺失值。在SPSS中处理的方式是：首先，在遗漏的数据处填入某个特定的标记数据，例，将遗漏的年收入数据用特定的标记数据（如9999999）来替代；然后，再指明这个特定的标记数据（如9999999）或那些明显的失真的数据（如213）等为用户缺失值。这样，在进行统计分析时，SPSS就能将这些用户缺失值与正常的数据区分开来，并依据用户选择的处理策略对其进行处理或分析等。
二、使用文本导向读入文本文件
（1）选择菜单：文件 -> 检索
数据间如何分割
数据文件的第一行上是否有变量名
数据部分从文本文件的第几行开始个案数据在文本文件中是如何安排的
指定文本文件的分割符号
字符型数据表示方法
2-5 SPSS数据文件合并
一、纵向合并数据文件纵向合并数据文件就是将数据编辑窗口中的数据与另一个 SPSS数据文件中的数据进行首尾对接，即将一个SPSS数据文件的内容追加到数据编辑窗口中当前数据的后面，依据两个数据文件中的变量名进行数据对接。
变量结构定义的基本操作单击Variable View 进入；定义变量名
定义显示宽度
定义对齐方式
定义变量类型
变量值定义变量名标签定义度量尺度标签