第 2 章 SPSS 数据文件的建立和管理
统计SPSS数据文件的建立和管理

第2章 SPSS数据文件的建立和管理学习目标1.明确SPSS数据的基本组织形式和数据行列的含义。
2.掌握应从哪些方面描述SPSS数据文件的结构特征。
3.熟练掌握建立SPSS数据文件以及管理SPSS数据的基本操作。
4.熟练掌握在SPSS中读取Excel工作表数据的基本操作,了解读取文本和数据库数据的基本方法。
建立SPSS数据文件是利用SPSS软件进行数据分析的首要工作。
没有完整且高质质的数据,也就没有值得信赖的数据分析结论。
2.1 SPSS数据文件建立SPSS数据文件,应首先了解SPSS数据文件的特点、数据组织的基本方式和相关概念等。
只有这样才能够建立一个完整且全面的数据环境,服务于以后的数据分析工作。
2.1.1SPSS数据文件的特点SPSS数据文件是一种有别于其他文件(如Word文档、文本文件)的有特殊性的文件。
从应用角度理解,这种特殊性表现在两方面。
第一,SPSS数据文件的扩展名是.sav;第二,SPSS数据文件是一种有结构的数据文件。
它由数据的结构和内容两部分组成。
其中,数据的结构记录了数据的类型、取值说明、数据缺失情况等的必要信息,数据的内容是那些待分析的具体数据。
SPSS数据文件与一般文本数据的不同在于:一般文本文件仅有纯数据部分,而没有关于结构的描述。
正是如此,SPSS数据文件不能像一般文件那样可以直接被大多数编辑软件读取,而只能在SPSS软件中打开。
基于上述特点,建立SPSS数据文件时应完成两项任务,第一,描述SPSS数据的结构;第二,录入编辑SPSS的数据内容。
这两部分工作分别在SPSS数据编辑窗口的变量视图中完成。
2.1.2 SPSS数据的基本组织方式SPSS的数据将直观地显示在数据编辑窗口中,形成一张平面二维表格。
待分析的数据将按原始数据方式和计数数据方式组织。
一、原始数据的组织方式如果待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标,那么这些数据就可按原始数据的方式组织。
SPSS统计分析- 第2章 数据文件建立和管理

4.读取“*.txt”数据文件
现需将“人居收入.txt”文件中的数据读入SPSS,如图所示: (1) 打开“数据编辑器”对话框,选择“文件”|“打开文本数据”命令,打 开“打开数据”对话框。选择文本文件,单击“打开”按钮,打开“文本导入向 导”对话框,如图所示:
(2) 在“您的文本文件与 预定义的格式匹配吗? ” 选项组中选择 “ 是 ” 单选 按钮,可单击“浏览” 按 钮,选择已预定义好的 格式;单击 “ 否 ” 则需要 建立一个新格式。
2.1.1 打开定义变量视图
• 按前一章所述打开SPSS主界面,视图切换标签处单击“变 量视图”,即打开“变量视图”窗口,如图所示。在该视 图可对变量的以下属性进行定义:名称、类型、宽度、小 数、标签、值、缺失、列、对齐、度量标准和角色。
2.1.2 定义变量名称
• 在“变量视图”变量栏的“名称”栏中定义变量名称,用 户可根据数据需要或个人习惯进行定义,如果不对变量进 行定义,系统将自动默认变量名为var00001、var00002、 var00003等。一般根据变量的实质意义来命名,例如:年 龄、性别、年级等变量,可用Age,Gender,Grade命名,也 可用中文意义命名,但当出现变量数量较大时,一般使用 流水编号,即防混淆又方便。虽然变量可根据用户的需求 自行编辑,但仍有其需共同遵循的原则: • 若用英文命名,变量名首字必须为英文字母,其后方可接 数字、英文字母、@等。若用中文命名,则可直接使用。 • 不可使用空格和特殊字符(如键盘上的!、#、$、%、&、 ^、*、(、)、?等字符)。
(9) 之后进入下一步,如图所示。在“变量之间有哪些分隔符?”中,可根据 文本数据中变量间的分隔符,可选择“制表符”、 “空格”、“逗号 ”、“分号” 和“其他”复选框。在“文本限定符是什么?”中,可选择“无”、“单引号”、“ 双引号”和“其他”单选按钮,一般默认为“无”,选择完毕后单击“下一步” 。
SPSS数据文件的建立和管理实验报告

第二题:
1.先打开常用软件里的SPSS 11.5 for Windows.exe,在Variable View中根据题目输入相关数据,如下图所示
2.在Data View中根据题目输入相关数据,结果如下图所示
3.对这个表格进行保存,并且命名为“减肥产品.sav”
3.选中“Match cases on key variables in sorted files”,将“学号”放入“Key Variables”中,结果如下所示
第二题:
因为题中要求将数据文件转换为EXCEL文件,所以通过【File】→【Save As】可实现
输入文件名“减肥产品”,再修改保存类型,选择EXCEL保存类型,即可得到升序排列,结果如下图所示
3.对第一个表格进行保存,并且命名为“学生成绩一.sav”
4.重新打开一个表格,在Variable View中根据题中要求输入数据,如下图所示
5.在Data View中先输入数据,再选中“学号”一列,选择升序排列,结果如下图所示
表1学生语文成绩
学号
1
3
4
5
8
9
10
2
6
7
姓名
张三
李四
王燕
赵宇
白艳
王洁
李丽
成功
孙昌
章建
语文成绩
89
76
87
65
97
74
82
90
67
88
表2学生数学成绩
学号
1
2
3
8
9
7
6
5
4
10
姓名
张三
成功
SPSS数据分析教程-2-数据文件的建立和管理

最新课件
14
数据的输入操作(2)
ID号(id) 性别(sex):1:男; 2:女
1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 2
身高(height)
76,59,67,65,63,72,70,68,69,74,68,63
参加活动以前的体重(before)
185 113 145 156 109 191 155 165 175 180 135 118
如果一个文件中的某个个案在另一个文件中找不到 个案来匹配,则该个案于第二个文件的变量上的取 值为缺失值。反之亦然。
如果一个文件中的某个个案在另一个文件中找到两 个或者两个以上的个案来匹配,则该个案只取第二 个文件中第一个相匹配的个案来连接。反之亦然。
最新课件
38
合并变量示意图:一对一
最新课件
39
最新课件
3
本章学习目标
理解信息、数据与数据处理的基本概念; 了解SPSS数据编辑器的特点,熟悉SPSS的变
量视图和数据视图,掌握SPSS常用的工具按 钮;
掌握数据录入SPSS软件的方法;
掌握把电子表格、数据库、文本文件等格式的 数据文件读入SPSS软件的方法;
掌握SPSS数据集的数据字典; 学习合并两个数据文件的方法; 明确分割SPSS数据文件的方法。
分析的目的是比较不同收益类型客户的概要特征。
最新课件
42
先按照关键变量“orgntype”(客户工作单 位的类型)进行合并文件。选择【数据】→ 【排序个案】 ,首先按照关键变量
“orgntype”排序。
然后选择【数据】→【合并文件】→【添加变 量】 进行合并。
最新课件
43
2.7 数据的拆分
实验一SPSS数据文件的建立和管理一.实验目的1.掌握spss数据的结构

实验一SPSS数据文件的建立和管理一.实验目的1.掌握spss数据的结构和定义方法;2.掌握spss数据的录入与编辑:数据的录入、数据的定位、插入和删除一个个案、插入和删除一个变量、数据的移动、复制和删除;3.掌握spss数据的保存,保存为excel文件格式和spss文件格式;4.掌握读取excel文件格式和txt文件格式的数据;5.掌握spss数据文件的纵向与横向的合并。
二.实验基本方法1. spss数据的结构和定义方法操作步骤:参阅教材第24页。
2. spss数据的录入与编辑操作步骤:(1)数据的录入:参阅教材第29页。
(2)数据的定位:参阅教材第30页。
(3)插入和删除一个个案:参阅教材第31页。
(4)插入和删除一个变量:参阅教材第31页。
(5)数据的移动、复制和删除:参阅教材第32页。
3. spss数据的保存操作步骤:参阅教材第33页。
4. 读取excel文件格式和txt文件格式的数据操作步骤:参阅教材第35页。
5. spss数据文件的纵向与横向的合并操作步骤:(1)纵向合并数据文件:参阅教材第40页。
(2)横向合并数据文件:参阅教材第42页。
三.实验内容(一)验证性实验(1)教材第25页“关于居民储户调查问卷的spss变量的设计”(2)教材第38页“职工基本情况数据的纵向合并和横向合并”(二)实践性实验(1)针对“零散数据”文件夹中的若干excel数据和txt数据,将其转换为spss的数据文件,要求转换为spss数据后,根据变量的类型正确定义数据结构。
(2)针对“经管学院考试成绩”文件夹中的数据,首先,通过spss软件将“成绩1”和“成绩2”的excel文档打开,并保存为相同文件名的spss数据文件。
要求:spss读取excel的变量名,数据结构定义准确。
其次,利用横向合并的功能,将“成绩1”和“成绩2”进行合并,并存为“三次考试成绩汇总表.sav”的文件。
最后,将“三次考试成绩汇总表.sav”的文件保存一份txt本文数据和excel文件数据。
spss数据文件的建立与管理

SPSS数据文件的结构
2 、字符型(String): 存储字符数据 8位 如:beijing 处理时用双引号扩起来 3、日期型(Date):存储日期数据 格式很多,如:20-AUG-1999 4、其他: 如:圆点数值型(dot)、用户自定义型(customer) 注意:显示宽度不影响数据的存储
SPSS数据文件的结构
(二)横向数据合并 (3)菜单选项: data -> merge file -> add variable (4)选项说明: – math cases on key variables in sorted files:以关键字作为 合并标志。 – Both files provide cases:合并后的文件的数据由两个文件共 同提供。 – External file is keyed table:以data editor的数据为基础。 – Working data file is keyed table:以磁盘文件的数据为基础。
(二)变量的类型(type)和显示宽度(width) 1、数值型:
标准数值型(Numeric):默认类型 列宽8位;小数点2位 如: 12345678、12345.67、-1234.56 带逗号的数值型(Comma): 从个位开始三位一个逗号 如:1,234.56 科学计数法(Scientific Notation):表示很大或很小的数据 如:1.2E+05 带美元符号(Dollar):表示货币 格式很多,如:$12.30
事先指定:指定某个特定值为缺失值(用户缺失值) 其他处理方法,如:以均值、众数替代等
3、SPSS缺失值 用户缺失值 系统缺失值:点 (•)
SPSS数据文件的结构
(七)变量计量尺度(Measurement)
1-2(文件的建立和编辑)

删除变量
(1)在欲删除的变量名上单击鼠标左键
( 2) 右键选择Cut
定义日期时间变量 Define Dates
步骤
(1) Define Dates
(2)设臵日期时间
二、个案管理
主要内容: 个案定位 插入和删除一个个案 个案排序 个案选取 个案加权
个案定位 将当前数据单元定位到特定单元 两种定位方式:人工定位和自动定位 人工定位方法: 用鼠标拖动数据编辑窗口右边滚动钮 或 Page Up Page Down
说明 SPSS早期版本数据文件 Systat数据文件 Spss Portable数据文件 Excel文件 Lotus l—2—3 x.0 (wk3) 格式数 据文件 SYLK(符号链接)格式文件 dBase数据库文件 SAS长文件名数据文件 SAS短文件名数据文件
SAS v6 for Windows (*.sd2)
例如: 变量名 变量标签 W weight或体重 H Height或身高
变量值标签 Value Lables
对变量取值含义进一步解释说明
例如 变量 值 Sex f m 值标签 Female Male
缺失数据 Missing
说明缺失数据的基本方法指定用户缺失值 用户缺失值可以是 字符型或数值型变量----1至3个特定的离散值 数值型变量---一个连续的闭区间 加一个区间以外的离散值
五
数据的编辑
数据编辑功能表(Edit菜单)
命令
Undo Redo Cut Copy Paste Clear Find
功能
删除刚输入的数据或者恢复刚修改 的数据 恢复刚撤消的操作 将选定数据剪切到剪贴板 将选定数据拷贝到剪贴板 将剪贴板的数据粘贴到指定位置 清除选定的变量和观测值 查找数据
第2章 SPSS 17.0 基本操作与数据管理

(2)字符型:
字符型编变量由字符串组成,可以包含数字、字母和一些特殊符号。字符型变 量的默认长度为8,大于8个字符的称为长字符型变量,少于8个字符的称为短字
符型变量,字符型变量最长为32767个字符。他不能参与运算,区分大小写字母。
(3)日期型: 日期型变量用于表示日期和时间,他有29种不同的日期和时间格式,不能参与运算 ,要参与必须通过日期函数进行转换。 如:1-12-2009、29.12.99等
2.1.2 常量、变量、操作符和表达 一 、 常量与变量 式
1.SPSS常量 SPSS中的常量在一定阶段内其取值不随观测而改变的值。有3种类型 (1)数值型: 数据型常量是一个数值。他有两种书写方式: 一是普通书写方式,如:53、74.2等; 二是科学计数书写方式,其使用指数表示数值,通常用于表示贴别大 或特别小的数值。如:1.2E+05 表示1.2×105 (2)字符型: 字符型常量是被单引号或双引号括起来的一串字符。如果本身带有单 引号或半个单引号,则必须使用双引号括起来。 如:beijing 处理时用双引号扩起来,即“beijing” (3)日期型: 按特定格式存储日期数据 ,一般使用较少 格式很多,如:20-AUG-1999
(2)比较表达式
比较表达式是利用关系运算符建立起的两个变量间的比较关系,要求相 互比较的两个量类型一致,他的结果一般逻辑型。
如:x=2,则表达式“x>0”为真,系统返回1(true)。
(3)逻辑表达式
逻辑表达式由逻辑运算符、逻辑型的变量或取值为逻辑型的比较表达式 构成。他的值为逻辑型常量。如:对于表达式“true AND true” 系统 返回“true ” , “true OR false” 系统返回“true ” 。
《SPSS数据分析与应用》SPSS数据文件的建立与管理

2. 变量类型
变量类型
说明
数字 逗
2.2.2导入其他类型的数据文件
1.使用Excel向导读入Excel文件
第一步:启动SPSS,在菜单栏中选择【文件(F)】→【导入数据(D)】→【Excel】, 将弹出“打开数据”对话框,在该对话框中选择数据所在的路径,选择文件“招聘数 据.xlsx”,如图所示,单击【打开(O)】。
1.使用Excel向导读入Excel文件
2.使用文本向导导入文本文件
第二步:在“文本导入向导-第1/6步”对话框中,需要观察文本文件与预定义 的格式是否匹配,如果不匹配,则需要设置文本导入格式,如图所示,单击向导导入文本文件
第三步:在弹出的“文本导入向导-第2/6步”对话框中,主要需要关注数据文件的第一 行是否有变量名,如果有,则需要在【文件开头是否包括变量名?】框内勾选【是】,设置 【包含变量名称的行号(L)】为“1”,如图所示,单击【下一步(N)】按钮。
2.2.1 SPSS数据的录入
第二步:单击数据编辑器窗口左下角的【变量视图】按钮,切换到变量视图 窗口,根据要录入的数据定义变量属性。
2.2.1 SPSS数据的录入
第三步:在左下角单击【数据视图】按钮,就可以直接在SPSS数据编辑器窗口 里以电子表格的方式直接录入数据,建立SPSS文件,录入样例如图所示。
第一步:准备好需要合并的数据文件,注意,个案合并的SPSS数据文件的变量数量必须完 全一致。两个数据文件均包含9个变量,如图所示。
第2章 数据文件的建立和管理PPT教学课件

2.1 数据文件的特点和结构 2.2 定义数据文件的结构 2.3 数据的录入与保存 2.4 数据的编辑 2.5 读取其他格式的数据文件
1
SPSS数据文件的特点
SPSS数据文件的特殊性:其扩展名是.sav; 它是一种有结构的数据文件。
SPSS数据文件由数据的结构和内容两部分组 成。其中数据的结构记录数据类型、取值说 明、数据缺失情况等必要信息,数据的内容 才是待分析的具体数据。
数据中错误或者漏填的数据。如果不特意 说明,SPSS会把缺失数据参与分析,因此 要对缺失数据进行说明。 对缺失数据进行说明的三种方法(P14):
对于漏填的数值型数据,系统默认的缺失 值用一个圆点来表示,字符型变量中的空格 或控不是系统缺失值。
11
度量尺度
定距型数据(Scale) 定序型数据(Ordinal) 定类型数据(Nominal)
14
SPSS数据的录入与保存
录入:逐行录入按Tab键,逐列输入按Enter键 (例:职工基本情况数据P49) 录入带有变量值标签的数据: View→Value Labels (单元格将显示对应的变量值标签) 数据的保存: data 保存成其他格式的文件:Save as
15
第2章 SPSS数据文件的 建立和管理
建立SPSS 数据文件应 完成两项任 务
描述SPSS数据的结 构 录入编辑SPSS数据
SPSS数据文件的结构
个案、变量、单元格、当前单元格
SPSS数据文件以二维表的形式组织数 据。一行为一个样品(CASE)或个案, 一列为一个变量(VARIABLE),行与列 交叉之处为一个单元格,可在其中输入变 量值。
9
变量值标签(Value Lable)
单元一 SPSS数据文件的建立和管理

第一节 SPSS的发展及使用基础
(二)SPSS数据结构的基本方式
(2)计数数据的组织方式
第二节 SPSS的数据结构和定义方法
(一)变量名
变量名是变量访问和分析的唯一标识。
变量命名原则:
SPSS 变量名由不多于64(32个汉字)个字符组成;首字母是字母或汉字也可以是@字符;不能使用?,!和*;注意不能以下划线_和圆点“.”作为变量名的最后一个字符;
第一节 SPSS的发展及使用基础
(二)SPSS数据结构的基本方式
第一节 SPSS的发展及使用基础
(二)SPSS数据结构的基本方式
在计数数据的组织方式中,数据编辑窗口中的一行为变量的一个分组(或多变量交叉分组下的一个分组)。所有行囊括了该变量的所有分组情况(或多变量交叉下的所有分组情况)。数据编辑器窗口中的一列仍为一个变量,代表某个问题(或者某个方面的特征)以及相应的计数结果。
第五节 数据文件合并
数据文件合并的介绍
(2)横向合并-案例
职工数据和职工奖金数据的合并
①打开“职工数据.sav”②选择菜单【数据】→ 【合并文件】 → 【添加变量】
学 业 进 步!
基本操作步骤如下:
【文件】→【导入数据】→【文本数据】
(二)使用导向导入其他格式的数据
第五节 数据文件合并
数据文件合并的介绍
当数据量较大时,经常会把一份大的数据分成几个小的部分,分别录入,录入完毕后, 就必须将若干个小的数据文件合并起来。数据文件的合并分为纵向合并和横向合并。
(1)纵向合并
将一个SPSS数据文件的内容追加到当前数据编辑器窗口中数据的后面,依据两份数据文件中的变量名进行数据对接。
字符串型简称字符串(R),是SPSS中较常用的数据类型,它有由一串字符组成。如职工号码、姓名、地址等变量都可以定义为字符串数据。
第二章 SPSS应用基础(数据文件的建立与管理)

第二章 SPSS数据文件的建立、编辑与保存
SPSS数据文件的结构
数据文件的每一行代表一条记录,即每一行代 表一个个体、一个个案、一个样品(Case)
每一列代表一个变量或一个被观测量的特征 (Variable)
单元(Cell)是某个个体与某个变量的交叉。即 每个单元是一个观测或测定值。单元与电子表 格不同,单元只包括数据值而不能含公式。 (在数据编辑器中可以输入和编辑数据,但是 不能输入数学表达式和函数)
设置数值型变量的宽度,默认8位,当变量为日期型 时 无 效 。 默认类型8 , 2 。 如:12345678、12345.67、-
1234.56
第二章 SPSS数据文件的建立、编辑与保存
[Decimal]:变量小数点位数
设置数值型变量的小数位数,变量为日期型时无效。
[Label]:变量标签
第二章 SPSS数据文件的建立、编辑与保存
数据文件的范围是由记录和变量的数目决定的。可以在
任一单元中输入数据。如果在定义好的数据文件边界以外
键入数据,SPSS 将数据长方形延长到包括那个单元和文
件边界之间的任何行 和列。
单元编辑器
如果要分析的数据 还没有录入,可用数
变量Variable
据编辑器来键入数据
空格和特殊字符(如!、?、`和*等),不区 分大小写
不能用作变量名的关键词有:ALL、NE、EQ、 TO、LE、GE、BY、OR、GT、AND、NOT、 WITH
第二章 SPSS数据文件的建立、编辑与保存
[Type]:定义变量类型
单击[Type]相应单元中的按钮,显示下图对话框, 主要变量类型有:Numeric(标准数值型,默认)、 Comma(逗点型数值型)、Dot(句点数值型)、 Scientific Notation (科学记数型) Date(日期 型)、 Dollar(带美元符数值型)、 Custom Currency(自 定 义 型 ) 、 String ( 字 符串型)。选择合适的变 量类型并单击[OK]确定。
spss数据的录入与管理

标识重复个案 标识异常个案
计算变量
“目标变量”文本 框:用于输入需要
赋值的变量名
“转换” “计算变量”
“数字表达式”文 本框:用于给目标 变量赋值
候选变量列表
函数解释文字文本框
“函数组” 列表框
“函数和特 殊变量”列 表框
3.2 已有变量值的分组合并
将连续变量转换为等级变量或将分类变量 不同的变量等级进行合并。
“重新编码为相同变量”:对原始变量的取值 直接进行重编码 “重新编码为不同变量”:根据原始变量的取 值生成一个新变量来记录重编码的结果。
B交叉变量规则:交叉变量规则是用户定义 的涉及多个变量间逻辑关系的规则,由标记 无效值的逻辑表达式定义,可以应用于单个
1、定义验证规则 “数据” “验证” “定义规则” 2、进行数据验证 “数据” “验证” “验证数据” 3、加载预定义规则 “数据” “验证” “加载预定义规则” Predefined Validation Rules.sav
(4)文件合并向导:将几个数据文件合并为一 个大的SPSS数据文件,含横向合并和纵向合并 两种情况。
(5)数据字典相关向导:包括定义变量属性, 复制变量属性,以及新建设定属性三个向导界 面。
4.1 几个常用的过程
1、排序个案 数据编辑窗口中的记录的前后次序在默认情
况下由录入时的先后顺序决定。 (1)单变量排序:变量名处右击,“升序排列 ”“降序排列” (2)多变量排序:使用“排序个案”对话框 2、分割文件(Split File) 3、选择个案:用于只分析部分数据 4、加权个案:(1)以频数格式录入的数据
最优离散化过程:是对前述可视化离散过程 的进一步自动化,根据某些作为“关键指示 变量”的分类变量,将原有的一个或多个连 续性变量按照该分类变量类间差异最大化的
《统计分析与SPSS的应用(第5版)》第二章

数据 -> 合并文件 -> 添加变量 (4)选项说明:
以关键字作为合并标志。 合并后的文件的数据由两个文件共同提供。 以当前数据编辑器中的数据为基础添加。 以磁盘文件或其他编辑器窗口中的数据为基础
添加。
SPSS数据文件的合并
(二)横向数据合并 (1)含义:
将磁盘或其他数据编辑器窗口中的SPSS数据 中的若干个变量增加到当前数据编辑器窗口中 的数据文件中。
(2)前提: a.两个数据文件必须有一个共同的变量名为关键 字段---合并的依据;
b. 两个数据文件应事先按关键字段升序排序。
SPSS数据文件的合并
定义源数据块 鼠标右键:选择相应菜单项 确定目标单元 鼠标右键:选择相应菜单项
与其他软件数据共享
数据共享 xls格式文件的共享 是否有存放变量名的单元 文本数据的读入 利用文本向导读入数据 数据库文件的共享 利用ODBC共享数据
SPSS数据文件的合并
目的: 将两个SPSS数据文件合并到一个数据文件中 。
带逗号的数值型(Comma): 从个位开始三位一个逗号8.2 如:1,234.56
科学计数法(Scientific Notation):表示很大或很小的数据 8.2 如:1.2E+05
带美元符号(Dollar):表示货币 格式很多,如:$12.30
SPSS数据的结构
变量类型(type)与存储宽度(width) 字符型(String): 存储字符数据 8位
SPSS数据的编辑
(三)插入和删除一个个案 插入:编辑-> 插入个案 删除:选定待删行,鼠标右键选择清除
(四)插入和删除一个变量 插入:光标定位到某列变量上 -> 编辑 -> 插入变
spss教程第二章

第二章数据文件的管理(上)(医学统计之星:张文彤)最后一次更新时间:2.1建立与保存数据文件-File菜单2.1.1 新建数据文件2.121 直接打开2.122 使用数据库查询打开2.1.2.3 使用文本导入向导读入文本文件2.1.2 打开其他格式的数据文件2.1.3保存数据文件2.1.4 File菜单中的其他条目2.2 编辑数据文件2.2.1 定义新变量2.2.1.1 直接定义新变量2.2.1.2 从原有变量计算新变量-Transform菜单2.2.2 数据的录入2.2.2.1 直接录入2.2.2.2 数据录入技巧2.3 进一步整理数据文件-Data菜单不言而喻,一切统计分析都是以数据为基础的,因此统计软件的数据管理能力非常重要。
SPSS以其豪华的界面为依托,为用户提供的便捷的数据管理功能,下面我们就来具体看一下。
§2.1建立与保存数据文件和大多数应用软件相同,SPSS中数据文件的管理功能基本上都集中在了File菜单上,该菜单的组织结构和WORD等也极为相似,因此这里我们只介绍比较有特色的几个菜单项。
I SPSS 10.0有三个主要窗口界面:数据管理窗口、程序编辑窗口和结果浏览窗口;另有两个不常用的窗口:结果草稿浏览窗口和VBs脚本语言编辑窗口。
他们共享许多菜单项,如File菜单就大部分相同,这里介绍的许多内容在五个窗口中都是通用的。
2.1.1 新建数据文件如果你正从头开始进行一个新的课题,刚刚把数据收集上来,要做统计分析,自然需要新建一个数据库,然后将所有的数据从纸上请到计算机里。
在SPSS中,新建一个数据库容易的不得了一一已经到了什么都不用做的地步!是这样,当你进入SPSS系统时,系统就已经生成了一个空数据文件,即你看到的空白的数据管理界面。
你只要按自己的需要定义变量,输入数据然后存盘就是了(这些操作马上会讲到)。
2.1.2 打开其他格式的数据文件凡是做过数据输入工作的人都知道:这活又费眼睛又累人,出错太多了还要挨批评,非常影响个人的光辉形象算了,还是在有限的经费里划几百美元出来雇个打字小姐吧(怎么用美元?因为我请了个老外!)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
定类型(如民族、性别)变量尤其重要。
12
5、缺失值
缺失数据:明显错误或明显不合理的数据、漏填 的数据项
SPSS中识别缺失数据的方法:指定用户缺失值
先填入某个特定的标记数据 再指明这个特定的标记数据为缺失值
SPSS的默认缺失值,也称为系统缺失值: 数值型:用点 (•)表示 对缺失数据删除、修正:以均值、中位数替代等
3
2.1.2 SPSS 数据的组织方式
(1)原始数据的组织方式
如果待分析的数据是一些原始的调查问卷,或是 一些基本的统计指标,那么这些数据应该以原始 数据的组织形式。 数据编辑窗口中的一行称为一个个案或观测 (Case),所有个案组成 SPSS数据文件的内容。 数据编辑窗口的一列称为一个变量(Variable), 每个变量都有一个名字,称为变量名,它是访问 和分析SPSS每个变量的唯一标志。SPSS数据文件 的结构就是对每个变量及相关特征进行描述。 例:大学生职业生涯规划.sav
4
(2)计数数据的组织方式
如果待分析的数据不是原始的调查问卷数据, 而是经过分组汇总后的汇总数据,那么应该以 计数数据的组织形式。 数据编辑窗口中的一行为变量的一个分组(或 多变量交叉分组下的一个分组),所有行包括 变量的所有分组。 数据编辑窗口的一列仍为一个变量,代表某个 问题及相应的计数结果。 例:血压和年龄.sav
SPSS的默认变量名,以字母“VAR”开头,后面补足5位数 字,如VAR00001,VAR00012等。变量名不能与SPSS内部 特有的具有特定含义的保留字同名,如ALL,BY,AND, NOT,OR等。
变量名最好与其代表的数据含义相对应,每个变量名必须具 有唯一性。
7
3、变量名标签 变量名标签是对变量名含义的进一步解释说明,
它可以增强变量名的可视性和统计分析结果的可
读性。(可以省略)
变量名标签可用中文,总长可达120个字符。
8
2、变量类型、宽度、小数、列
变量类型是指每个变量的取值类型。SPSS 中有三 种基本变量类型:数值型、字符串型和日期型。 数值型:如身高,体重,收入,支出等
数值:默认类型 如: 12345678、12345.67、-1234.56 科学计数法:表示很大或很小的数据 如:1.2E+05 逗号: 从个位开始三位一个逗号 如:1,234.56 美元: 表示货币 格式很多,如:$12.30
2.5.2 使用文本导向读入文本文件
2.5.3 使用数据库向导读入数据
16
2.6 SPSS 数据文件的合并
目的:将两个或多个SPSS数据文件合并到一个数 据文件中 方法:首先将其中的某个数据文件读入数据编辑
窗口中,然后依次与其它数据文件合并
合并方式:纵向合并和横向合并
17
2.6.1 纵向合并数据文件
13
2.3 SPSS 数据的录入和编辑
2.3.1 SPSS 数据的录入:和 Excel 类似 2.3.2 SPSS 数据的编辑 1、SPSS 数据的定位
2、插入和删除个案
3、插入和删除变量
4、数据的移动、复制和删除
14
2.4 SPSS 数据的保存
2.4.1 SPSS 支持的数据格式 1、SPSS文件格式,扩展名为 .sav 2、Excel格式文件,扩展名为 .xls 或 .xlsx
(1)含义:
•
将两个数据文件首尾对接,其依据是变量名。 两个SPSS数据文件应有可以合并的内容,且含 义相同的数据项最好取相同的变量名和变量类 型,含义不同的数据项其变量名最好不同。
(2)前提:
•
(3)菜单选项: 数据 -> 合并文件 -> 添加个案
例:“职工数据.sav ”和 “追加职工.sav”
18
2.6.2 横向合并数据文件
(1) 含义: 将两个数据文件左右对接。 (2) 前提: a.两个数据文件必须有一个共同的变量名作为关键 变量---合并的依据; b.两个数据文件应事先按关键变量的升序排序; c.不同数据文件含义不同的数据项,变量名应不同. (3) 菜单选项: 数据 -> 合并文件 -> 添加变量 例:“职工数据.sav ”和 “职工奖金.sav”
SPSS数据文件也称为数据集,是一种有结构的数 据文件,它由数据结构和内容两部分组成,其中 的数据结构记录数据变量的名称、类型、变量宽 度、小数位数、变量名标签、变量值标签、缺失 值、显示宽度、对齐方式和度量尺度等必要信息 ,数据的内容才是那些待分析的具体数据。 基于上述特点,建立SPSS数据文件时应完成两项 任务,即描述数据的结构和录入编辑数据。
定序型变量(Ordinal),如职称、职务、对某事
物的赞同程度; 定类型数据(Nominal),如民族、宗教信仰、性 别、党派。
11
4、变量值标签
变量值标签是对变量取值含义的解释说明信息, 不但可以明确数据的含义,也增强了最后统计分
析结果的可读性,变量值标签可以用中文。
变量值标签对于定序型(如收入的高、中、低)和
第二章
SPSS 数据文件的建立和管理
1
第二章 SPSS数据文件的建立与管理
• SPSS 数据文件
• SPSS 数据的结构和定义方法
• SPSS 数据的录入和编辑
• SPSS 数据的保存
• 读取其他格式的数据文件
• SPSS 数据文件的合并
2
2.1 SPSS 数据文件
2.1.1 SPSS数据文件的特点
3、文本格式文件,扩展名为 .dat
2.4.2 保存 SPSS 数据的基本操作
15
2.5 读取其他格式的数据文件
2.5.1 直接读入其它格式的数据文件 1、SPSS文件格式,扩展名为 .sav 2、Excel格式文件,扩展名为 .xls 或 .xlsx
3、SAS格式文件,扩展名为 .sas7bdat
9
2、变量类型、宽度、小数、列
字符串型:由一串字符组成,不能进行算术运算
如身份证号,姓名,国家,地址等
日期型:表示日期或时间
显示格式:dd-mmm-yyyy;mm/dd/yyyy
宽度:是变量允许的最大字符位数
列:是数据编辑窗口中显示每列的字符位数
10
6、度量标准
统计学依据变量的度量尺度将变量划分为三大类: 数值型变量(Scale),如身高、体重;
5
2.2 SPSS 数据的结构和定义方法
SPSS 数据的结构是对 SPSS 每个变量及其相关属 性的描述,在数据编辑器窗口的变量视图中定义 ,主要包括变量名、变量类型、变量宽度、变量 名标签、变量值标签、显示宽度、缺失值、对齐 方式、度量标准和角色等信息。
6
1、变量名 变量的命名规则如下:
首字符应以英文字母开头,后面可以跟除了!、?、*之外 的字母或数字;下划线、圆点不能为变量名的最后一个字符 ;SPSS允许用汉字作为变量名。 变量名不区分大小写字母。
19
小结
熟悉SPSS的两个主要窗口:数据编辑窗口和结果 输出窗口
了解数据内容中行列的含义
掌握数据结构的定义方法
掌握数据文件的录入、编辑、保存、合并操文本)
20