第二章 SPSS数据文件的建立和管理

合集下载

统计SPSS数据文件的建立和管理

统计SPSS数据文件的建立和管理

第2章 SPSS数据文件的建立和管理学习目标1.明确SPSS数据的基本组织形式和数据行列的含义。

2.掌握应从哪些方面描述SPSS数据文件的结构特征。

3.熟练掌握建立SPSS数据文件以及管理SPSS数据的基本操作。

4.熟练掌握在SPSS中读取Excel工作表数据的基本操作,了解读取文本和数据库数据的基本方法。

建立SPSS数据文件是利用SPSS软件进行数据分析的首要工作。

没有完整且高质质的数据,也就没有值得信赖的数据分析结论。

2.1 SPSS数据文件建立SPSS数据文件,应首先了解SPSS数据文件的特点、数据组织的基本方式和相关概念等。

只有这样才能够建立一个完整且全面的数据环境,服务于以后的数据分析工作。

2.1.1SPSS数据文件的特点SPSS数据文件是一种有别于其他文件(如Word文档、文本文件)的有特殊性的文件。

从应用角度理解,这种特殊性表现在两方面。

第一,SPSS数据文件的扩展名是.sav;第二,SPSS数据文件是一种有结构的数据文件。

它由数据的结构和内容两部分组成。

其中,数据的结构记录了数据的类型、取值说明、数据缺失情况等的必要信息,数据的内容是那些待分析的具体数据。

SPSS数据文件与一般文本数据的不同在于:一般文本文件仅有纯数据部分,而没有关于结构的描述。

正是如此,SPSS数据文件不能像一般文件那样可以直接被大多数编辑软件读取,而只能在SPSS软件中打开。

基于上述特点,建立SPSS数据文件时应完成两项任务,第一,描述SPSS数据的结构;第二,录入编辑SPSS的数据内容。

这两部分工作分别在SPSS数据编辑窗口的变量视图中完成。

2.1.2 SPSS数据的基本组织方式SPSS的数据将直观地显示在数据编辑窗口中,形成一张平面二维表格。

待分析的数据将按原始数据方式和计数数据方式组织。

一、原始数据的组织方式如果待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标,那么这些数据就可按原始数据的方式组织。

SPSS统计分析- 第2章 数据文件建立和管理

SPSS统计分析- 第2章  数据文件建立和管理

4.读取“*.txt”数据文件
现需将“人居收入.txt”文件中的数据读入SPSS,如图所示: (1) 打开“数据编辑器”对话框,选择“文件”|“打开文本数据”命令,打 开“打开数据”对话框。选择文本文件,单击“打开”按钮,打开“文本导入向 导”对话框,如图所示:
(2) 在“您的文本文件与 预定义的格式匹配吗? ” 选项组中选择 “ 是 ” 单选 按钮,可单击“浏览” 按 钮,选择已预定义好的 格式;单击 “ 否 ” 则需要 建立一个新格式。
2.1.1 打开定义变量视图
• 按前一章所述打开SPSS主界面,视图切换标签处单击“变 量视图”,即打开“变量视图”窗口,如图所示。在该视 图可对变量的以下属性进行定义:名称、类型、宽度、小 数、标签、值、缺失、列、对齐、度量标准和角色。
2.1.2 定义变量名称
• 在“变量视图”变量栏的“名称”栏中定义变量名称,用 户可根据数据需要或个人习惯进行定义,如果不对变量进 行定义,系统将自动默认变量名为var00001、var00002、 var00003等。一般根据变量的实质意义来命名,例如:年 龄、性别、年级等变量,可用Age,Gender,Grade命名,也 可用中文意义命名,但当出现变量数量较大时,一般使用 流水编号,即防混淆又方便。虽然变量可根据用户的需求 自行编辑,但仍有其需共同遵循的原则: • 若用英文命名,变量名首字必须为英文字母,其后方可接 数字、英文字母、@等。若用中文命名,则可直接使用。 • 不可使用空格和特殊字符(如键盘上的!、#、$、%、&、 ^、*、(、)、?等字符)。
(9) 之后进入下一步,如图所示。在“变量之间有哪些分隔符?”中,可根据 文本数据中变量间的分隔符,可选择“制表符”、 “空格”、“逗号 ”、“分号” 和“其他”复选框。在“文本限定符是什么?”中,可选择“无”、“单引号”、“ 双引号”和“其他”单选按钮,一般默认为“无”,选择完毕后单击“下一步” 。

SPSS数据文件的建立和管理实验报告

SPSS数据文件的建立和管理实验报告
6.对第二个表格进行保存,并且命名为“学生成绩二.sav”
第二题:
1.先打开常用软件里的SPSS 11.5 for Windows.exe,在Variable View中根据题目输入相关数据,如下图所示
2.在Data View中根据题目输入相关数据,结果如下图所示
3.对这个表格进行保存,并且命名为“减肥产品.sav”
3.选中“Match cases on key variables in sorted files”,将“学号”放入“Key Variables”中,结果如下所示
第二题:
因为题中要求将数据文件转换为EXCEL文件,所以通过【File】→【Save As】可实现
输入文件名“减肥产品”,再修改保存类型,选择EXCEL保存类型,即可得到升序排列,结果如下图所示
3.对第一个表格进行保存,并且命名为“学生成绩一.sav”
4.重新打开一个表格,在Variable View中根据题中要求输入数据,如下图所示
5.在Data View中先输入数据,再选中“学号”一列,选择升序排列,结果如下图所示
表1学生语文成绩
学号
1
3
4
5
8
9
10
2
6
7
姓名
张三
李四
王燕
赵宇
白艳
王洁
李丽
成功
孙昌
章建
语文成绩
89
76
87
65
97
74
82
90
67
88
表2学生数学成绩
学号
1
2
3
8
9
7
6
5
4
10
姓名
张三
成功

薛薇-《SPSS统计分析方法及应用》第2章-SPSS-数据文件的建立和管理

薛薇-《SPSS统计分析方法及应用》第2章-SPSS-数据文件的建立和管理
10
2.4 SPSS数据的录入与编辑 (1)录入 在数据视图中,输入数据。 (2)编辑 在数据视图中,进行编辑数据。
2.5 SPSS数据的保存 文件保存或另保存选择目录路径选择文件类 型(.sav,.xls,.dbf,.dat)输入文件名 保存
11
2.6 读取数据文件
文件打开数据选择目录路径选择文件类型( .sav,.xls,.dbf,.dat)选择文件名打开
2.2.7 结构定义的基本操作 步骤:1、打开SPSS编辑窗口 新建数据单击“变量视图” 2、输入:变量名称、类型、宽度、标签、值等。
9
2.3 SPSS结构定义的应用案例 1、设计调查问卷 标题、引言部分、主体部分、结束语。如,表2-3。 2、建立数据文件结构 调查问卷中,一份卷为一个个案,一个题目作为一个 变量(也称指标)如,表2-4。 (度量水平:有序(序号、定序)、名义(定类)、 定距(度量) ) 3、录入数据 单选择题录入、多选题的录入
变量值标签
对变量取值含义的2)解。释说明信息。 如,1表示男,2表注示意女,。相应列的数据只显
缺失值
示的个数为显示宽度(如 明计显量错尺误度或(明即显度不量合标理,准、2)存。分在三漏大填类的:数定据距。型
计量尺度
(度量)、定序型(数序据号类)型、有定:类数型值(型名、字
义)。
符串型、日期型。
8
2.2 SPSS数据的结构和定义方法

变量

5
2.1 SPSS数据文件
(2)频数数据的组织方式
频数数据的组织:分组汇总后的汇总数据作为待分析数 据。
频数数据的组织分为:行与变量。如,在研究职称和年龄 的关系时得到下表数据(表2-1)
年龄段

SPSS

SPSS

第一章 SPSS概述1. SPSS有哪些主要窗口?它们的作用和特点各是什么?答:①数据编辑窗口主要功能:定义SPSS数据的结构、录入编辑和管理待分析的数据。

特点:SPSS的所有统计分析功能都是针对该窗口中的数据的。

这些数据通常以SPSS数据文件的形式保存在计算机磁盘上,其文件扩展名为.sav。

sav文件格式是SPSS独有的,一般无法通过Word、Excel等其它软件打开。

②结果输出窗口主要功能:显示管理SPSS统计分析结果、报表及图形。

特点:SPSS统计分析的所有输出结果都显示在该窗口中。

输出结果通常以SPSS输出文件的形式保存在计算机磁盘上,其文件扩展名为.spv。

spv文件格式是SPSS独有的,一般无法通过Word、Excel等其它软件打开。

2. SPSS有哪三种主要使用方式?各自的特点是什么?答:三种主要使用方式为:完全窗口菜单方式、程序运行方式、混合运行方式①完全窗口方式的特点:所有的分析操作都通过菜单按钮、输入对话框等方式来完成②程序运行方式的特点:它能够依照程序自动进行多步骤的复杂数据分析,分析过程中无须人工干预③混合运行方式:在使用菜单的同时编辑SPSS程序3. .sav,.spo,.sps分别是哪类文件的扩展名?答:.sav是SPSS数据文件的扩展名;.spo是SPSS输出文件的扩展名;.sps是SPSS程序文件的扩展名4.在SPSS的输出窗口中应如何操作才能将不同的分析结果保存到不同的文件中?答:以不同命名方式保存,其文件扩展名均为.spo5.SPSS的数据加工和管理功能主要集中在哪些菜单中?统计绘图和分析功能主要集中在哪些菜单中?答:数据加工和管理功能主要集中在Data和Transform;统计绘图和分析功能主要集中在Analyze和Graphs。

6.利用SPSS进行数据分析的一般基本步骤是什么?答:(1)SPSS数据的准备(2)SPSS数据加工整理(3)SPSS数据的分析(4)SPSS分析结果的阅读和解释第二章SPSS数据文件的建立和管理1. SPSS中有哪两种基本数据组成方式?各自的特点和应用场合是什么?答:原始数据的组织方式和计数数据的组织方式如果待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标,这些数据就可按原始数据的方式组织;如果待分析的数据不是原始的调查问卷数据,而是经过分组汇总后的计数数据,这些数据按计数数据的方式组织。

SPSS数据分析教程-2-数据文件的建立和管理

SPSS数据分析教程-2-数据文件的建立和管理

最新课件
14
数据的输入操作(2)
ID号(id) 性别(sex):1:男; 2:女
1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 2
身高(height)
76,59,67,65,63,72,70,68,69,74,68,63
参加活动以前的体重(before)
185 113 145 156 109 191 155 165 175 180 135 118
如果一个文件中的某个个案在另一个文件中找不到 个案来匹配,则该个案于第二个文件的变量上的取 值为缺失值。反之亦然。
如果一个文件中的某个个案在另一个文件中找到两 个或者两个以上的个案来匹配,则该个案只取第二 个文件中第一个相匹配的个案来连接。反之亦然。
最新课件
38
合并变量示意图:一对一
最新课件
39
最新课件
3
本章学习目标
理解信息、数据与数据处理的基本概念; 了解SPSS数据编辑器的特点,熟悉SPSS的变
量视图和数据视图,掌握SPSS常用的工具按 钮;
掌握数据录入SPSS软件的方法;
掌握把电子表格、数据库、文本文件等格式的 数据文件读入SPSS软件的方法;
掌握SPSS数据集的数据字典; 学习合并两个数据文件的方法; 明确分割SPSS数据文件的方法。
分析的目的是比较不同收益类型客户的概要特征。
最新课件
42
先按照关键变量“orgntype”(客户工作单 位的类型)进行合并文件。选择【数据】→ 【排序个案】 ,首先按照关键变量
“orgntype”排序。
然后选择【数据】→【合并文件】→【添加变 量】 进行合并。
最新课件
43
2.7 数据的拆分

spss数据文件的建立与管理

spss数据文件的建立与管理

SPSS数据文件的结构
2 、字符型(String): 存储字符数据 8位 如:beijing 处理时用双引号扩起来 3、日期型(Date):存储日期数据 格式很多,如:20-AUG-1999 4、其他: 如:圆点数值型(dot)、用户自定义型(customer) 注意:显示宽度不影响数据的存储
SPSS数据文件的结构
(二)横向数据合并 (3)菜单选项: data -> merge file -> add variable (4)选项说明: – math cases on key variables in sorted files:以关键字作为 合并标志。 – Both files provide cases:合并后的文件的数据由两个文件共 同提供。 – External file is keyed table:以data editor的数据为基础。 – Working data file is keyed table:以磁盘文件的数据为基础。
(二)变量的类型(type)和显示宽度(width) 1、数值型:

标准数值型(Numeric):默认类型 列宽8位;小数点2位 如: 12345678、12345.67、-1234.56 带逗号的数值型(Comma): 从个位开始三位一个逗号 如:1,234.56 科学计数法(Scientific Notation):表示很大或很小的数据 如:1.2E+05 带美元符号(Dollar):表示货币 格式很多,如:$12.30
事先指定:指定某个特定值为缺失值(用户缺失值) 其他处理方法,如:以均值、众数替代等
3、SPSS缺失值 用户缺失值 系统缺失值:点 (•)
SPSS数据文件的结构
(七)变量计量尺度(Measurement)

1-2(文件的建立和编辑)

1-2(文件的建立和编辑)

删除变量
(1)在欲删除的变量名上单击鼠标左键
( 2) 右键选择Cut
定义日期时间变量 Define Dates
步骤
(1) Define Dates
(2)设臵日期时间
二、个案管理
主要内容: 个案定位 插入和删除一个个案 个案排序 个案选取 个案加权
个案定位 将当前数据单元定位到特定单元 两种定位方式:人工定位和自动定位 人工定位方法: 用鼠标拖动数据编辑窗口右边滚动钮 或 Page Up Page Down
说明 SPSS早期版本数据文件 Systat数据文件 Spss Portable数据文件 Excel文件 Lotus l—2—3 x.0 (wk3) 格式数 据文件 SYLK(符号链接)格式文件 dBase数据库文件 SAS长文件名数据文件 SAS短文件名数据文件
SAS v6 for Windows (*.sd2)
例如: 变量名 变量标签 W weight或体重 H Height或身高
变量值标签 Value Lables
对变量取值含义进一步解释说明
例如 变量 值 Sex f m 值标签 Female Male
缺失数据 Missing
说明缺失数据的基本方法指定用户缺失值 用户缺失值可以是 字符型或数值型变量----1至3个特定的离散值 数值型变量---一个连续的闭区间 加一个区间以外的离散值

数据的编辑
数据编辑功能表(Edit菜单)
命令
Undo Redo Cut Copy Paste Clear Find
功能
删除刚输入的数据或者恢复刚修改 的数据 恢复刚撤消的操作 将选定数据剪切到剪贴板 将选定数据拷贝到剪贴板 将剪贴板的数据粘贴到指定位置 清除选定的变量和观测值 查找数据

第2章 SPSS 17.0 基本操作与数据管理

第2章 SPSS 17.0 基本操作与数据管理

(2)字符型:
字符型编变量由字符串组成,可以包含数字、字母和一些特殊符号。字符型变 量的默认长度为8,大于8个字符的称为长字符型变量,少于8个字符的称为短字
符型变量,字符型变量最长为32767个字符。他不能参与运算,区分大小写字母。
(3)日期型: 日期型变量用于表示日期和时间,他有29种不同的日期和时间格式,不能参与运算 ,要参与必须通过日期函数进行转换。 如:1-12-2009、29.12.99等
2.1.2 常量、变量、操作符和表达 一 、 常量与变量 式
1.SPSS常量 SPSS中的常量在一定阶段内其取值不随观测而改变的值。有3种类型 (1)数值型: 数据型常量是一个数值。他有两种书写方式: 一是普通书写方式,如:53、74.2等; 二是科学计数书写方式,其使用指数表示数值,通常用于表示贴别大 或特别小的数值。如:1.2E+05 表示1.2×105 (2)字符型: 字符型常量是被单引号或双引号括起来的一串字符。如果本身带有单 引号或半个单引号,则必须使用双引号括起来。 如:beijing 处理时用双引号扩起来,即“beijing” (3)日期型: 按特定格式存储日期数据 ,一般使用较少 格式很多,如:20-AUG-1999
(2)比较表达式
比较表达式是利用关系运算符建立起的两个变量间的比较关系,要求相 互比较的两个量类型一致,他的结果一般逻辑型。
如:x=2,则表达式“x>0”为真,系统返回1(true)。
(3)逻辑表达式
逻辑表达式由逻辑运算符、逻辑型的变量或取值为逻辑型的比较表达式 构成。他的值为逻辑型常量。如:对于表达式“true AND true” 系统 返回“true ” , “true OR false” 系统返回“true ” 。

《SPSS数据分析与应用》SPSS数据文件的建立与管理

《SPSS数据分析与应用》SPSS数据文件的建立与管理
(3)系统保留字(如ALL、BY、AND、NOT、OR等)不能作为变量名。 (4)当英文字母作为变量名时,系统不区分大小写字母。 (5)SPSS有默认的变量名。当没有为变量命名时,会以字母“VAR”开头, 后面补足5位数字,如VAR00001、VAR00012等。
2. 变量类型
变量类型
说明
数字 逗
2.2.2导入其他类型的数据文件
1.使用Excel向导读入Excel文件
第一步:启动SPSS,在菜单栏中选择【文件(F)】→【导入数据(D)】→【Excel】, 将弹出“打开数据”对话框,在该对话框中选择数据所在的路径,选择文件“招聘数 据.xlsx”,如图所示,单击【打开(O)】。
1.使用Excel向导读入Excel文件
2.使用文本向导导入文本文件
第二步:在“文本导入向导-第1/6步”对话框中,需要观察文本文件与预定义 的格式是否匹配,如果不匹配,则需要设置文本导入格式,如图所示,单击向导导入文本文件
第三步:在弹出的“文本导入向导-第2/6步”对话框中,主要需要关注数据文件的第一 行是否有变量名,如果有,则需要在【文件开头是否包括变量名?】框内勾选【是】,设置 【包含变量名称的行号(L)】为“1”,如图所示,单击【下一步(N)】按钮。
2.2.1 SPSS数据的录入
第二步:单击数据编辑器窗口左下角的【变量视图】按钮,切换到变量视图 窗口,根据要录入的数据定义变量属性。
2.2.1 SPSS数据的录入
第三步:在左下角单击【数据视图】按钮,就可以直接在SPSS数据编辑器窗口 里以电子表格的方式直接录入数据,建立SPSS文件,录入样例如图所示。
第一步:准备好需要合并的数据文件,注意,个案合并的SPSS数据文件的变量数量必须完 全一致。两个数据文件均包含9个变量,如图所示。

第2章 数据文件的建立和管理PPT教学课件

第2章 数据文件的建立和管理PPT教学课件
第2章 SPSS数据文件的 建立和管理
2.1 数据文件的特点和结构 2.2 定义数据文件的结构 2.3 数据的录入与保存 2.4 数据的编辑 2.5 读取其他格式的数据文件
1
SPSS数据文件的特点
SPSS数据文件的特殊性:其扩展名是.sav; 它是一种有结构的数据文件。
SPSS数据文件由数据的结构和内容两部分组 成。其中数据的结构记录数据类型、取值说 明、数据缺失情况等必要信息,数据的内容 才是待分析的具体数据。
数据中错误或者漏填的数据。如果不特意 说明,SPSS会把缺失数据参与分析,因此 要对缺失数据进行说明。 对缺失数据进行说明的三种方法(P14):
对于漏填的数值型数据,系统默认的缺失 值用一个圆点来表示,字符型变量中的空格 或控不是系统缺失值。
11
度量尺度
定距型数据(Scale) 定序型数据(Ordinal) 定类型数据(Nominal)
14
SPSS数据的录入与保存
录入:逐行录入按Tab键,逐列输入按Enter键 (例:职工基本情况数据P49) 录入带有变量值标签的数据: View→Value Labels (单元格将显示对应的变量值标签) 数据的保存: data 保存成其他格式的文件:Save as
15
第2章 SPSS数据文件的 建立和管理
建立SPSS 数据文件应 完成两项任 务
描述SPSS数据的结 构 录入编辑SPSS数据
SPSS数据文件的结构
个案、变量、单元格、当前单元格
SPSS数据文件以二维表的形式组织数 据。一行为一个样品(CASE)或个案, 一列为一个变量(VARIABLE),行与列 交叉之处为一个单元格,可在其中输入变 量值。
9
变量值标签(Value Lable)

单元一 SPSS数据文件的建立和管理

单元一 SPSS数据文件的建立和管理
(2)计数数据的组织方式
第一节 SPSS的发展及使用基础
(二)SPSS数据结构的基本方式
(2)计数数据的组织方式
第二节 SPSS的数据结构和定义方法
(一)变量名
变量名是变量访问和分析的唯一标识。
变量命名原则:
SPSS 变量名由不多于64(32个汉字)个字符组成;首字母是字母或汉字也可以是@字符;不能使用?,!和*;注意不能以下划线_和圆点“.”作为变量名的最后一个字符;
第一节 SPSS的发展及使用基础
(二)SPSS数据结构的基本方式
第一节 SPSS的发展及使用基础
(二)SPSS数据结构的基本方式
在计数数据的组织方式中,数据编辑窗口中的一行为变量的一个分组(或多变量交叉分组下的一个分组)。所有行囊括了该变量的所有分组情况(或多变量交叉下的所有分组情况)。数据编辑器窗口中的一列仍为一个变量,代表某个问题(或者某个方面的特征)以及相应的计数结果。
第五节 数据文件合并
数据文件合并的介绍
(2)横向合并-案例
职工数据和职工奖金数据的合并
①打开“职工数据.sav”②选择菜单【数据】→ 【合并文件】 → 【添加变量】
学 业 进 步!
基本操作步骤如下:
【文件】→【导入数据】→【文本数据】
(二)使用导向导入其他格式的数据

第五节 数据文件合并
数据文件合并的介绍
当数据量较大时,经常会把一份大的数据分成几个小的部分,分别录入,录入完毕后, 就必须将若干个小的数据文件合并起来。数据文件的合并分为纵向合并和横向合并。
(1)纵向合并
将一个SPSS数据文件的内容追加到当前数据编辑器窗口中数据的后面,依据两份数据文件中的变量名进行数据对接。
字符串型简称字符串(R),是SPSS中较常用的数据类型,它有由一串字符组成。如职工号码、姓名、地址等变量都可以定义为字符串数据。

第二章 SPSS应用基础(数据文件的建立与管理)

第二章 SPSS应用基础(数据文件的建立与管理)
(下面分别说明)
第二章 SPSS数据文件的建立、编辑与保存
SPSS数据文件的结构
数据文件的每一行代表一条记录,即每一行代 表一个个体、一个个案、一个样品(Case)
每一列代表一个变量或一个被观测量的特征 (Variable)
单元(Cell)是某个个体与某个变量的交叉。即 每个单元是一个观测或测定值。单元与电子表 格不同,单元只包括数据值而不能含公式。 (在数据编辑器中可以输入和编辑数据,但是 不能输入数学表达式和函数)
设置数值型变量的宽度,默认8位,当变量为日期型 时 无 效 。 默认类型8 , 2 。 如:12345678、12345.67、-
1234.56
第二章 SPSS数据文件的建立、编辑与保存
[Decimal]:变量小数点位数
设置数值型变量的小数位数,变量为日期型时无效。
[Label]:变量标签
第二章 SPSS数据文件的建立、编辑与保存
数据文件的范围是由记录和变量的数目决定的。可以在
任一单元中输入数据。如果在定义好的数据文件边界以外
键入数据,SPSS 将数据长方形延长到包括那个单元和文
件边界之间的任何行 和列。
单元编辑器
如果要分析的数据 还没有录入,可用数
变量Variable
据编辑器来键入数据
空格和特殊字符(如!、?、`和*等),不区 分大小写
不能用作变量名的关键词有:ALL、NE、EQ、 TO、LE、GE、BY、OR、GT、AND、NOT、 WITH
第二章 SPSS数据文件的建立、编辑与保存
[Type]:定义变量类型
单击[Type]相应单元中的按钮,显示下图对话框, 主要变量类型有:Numeric(标准数值型,默认)、 Comma(逗点型数值型)、Dot(句点数值型)、 Scientific Notation (科学记数型) Date(日期 型)、 Dollar(带美元符数值型)、 Custom Currency(自 定 义 型 ) 、 String ( 字 符串型)。选择合适的变 量类型并单击[OK]确定。

spss数据的录入与管理

spss数据的录入与管理

标识重复个案 标识异常个案
计算变量
“目标变量”文本 框:用于输入需要
赋值的变量名
“转换” “计算变量”
“数字表达式”文 本框:用于给目标 变量赋值
候选变量列表
函数解释文字文本框
“函数组” 列表框
“函数和特 殊变量”列 表框
3.2 已有变量值的分组合并
将连续变量转换为等级变量或将分类变量 不同的变量等级进行合并。
“重新编码为相同变量”:对原始变量的取值 直接进行重编码 “重新编码为不同变量”:根据原始变量的取 值生成一个新变量来记录重编码的结果。
B交叉变量规则:交叉变量规则是用户定义 的涉及多个变量间逻辑关系的规则,由标记 无效值的逻辑表达式定义,可以应用于单个
1、定义验证规则 “数据” “验证” “定义规则” 2、进行数据验证 “数据” “验证” “验证数据” 3、加载预定义规则 “数据” “验证” “加载预定义规则” Predefined Validation Rules.sav
(4)文件合并向导:将几个数据文件合并为一 个大的SPSS数据文件,含横向合并和纵向合并 两种情况。
(5)数据字典相关向导:包括定义变量属性, 复制变量属性,以及新建设定属性三个向导界 面。
4.1 几个常用的过程
1、排序个案 数据编辑窗口中的记录的前后次序在默认情
况下由录入时的先后顺序决定。 (1)单变量排序:变量名处右击,“升序排列 ”“降序排列” (2)多变量排序:使用“排序个案”对话框 2、分割文件(Split File) 3、选择个案:用于只分析部分数据 4、加权个案:(1)以频数格式录入的数据
最优离散化过程:是对前述可视化离散过程 的进一步自动化,根据某些作为“关键指示 变量”的分类变量,将原有的一个或多个连 续性变量按照该分类变量类间差异最大化的

SPSS数据分析实例详解

SPSS数据分析实例详解

第一章 SPSS概览--数据分析实例详解1.1 数据的输入和保存1.1.1 SPSS的界面1.1.2 定义变量1.1.3 输入数据1.1.4 保存数据1.2 数据的预分析1.2.1 数据的简单描述1.2.2 绘制直方图1.3 按题目要求进行统计分析1.4 保存和导出分析结果1.4.1 保存文件1.4.2 导出分析结果欢迎加入SPSS使用者的行列,首先祝贺你选择了权威统计软件中界面最为友好,使用最为方便的SPSS来完成自己的工作。

由于该软件极为易学易用(当然还至少要有不太高的英语水平),我们准备在课程安排上做一个新的尝试,即不急于介绍它的界面,而是先从一个数据分析实例入手:当你将这个例题做完,SPSS的基本使用方法也就已经被你掌握了。

从下一章开始,我们再详细介绍SPSS各个模块的精确用法。

我们教学时是以SPSS 10.0版为蓝本讲述的--什么?你还在用7.0版!那好,由于10.0版在数据管理的界面操作上和以前版本有较大区别,本章我们将特别照顾一下老版本,在数据管理界面操作上将按9.0及以前版本的情况讲述,但具体的统计分析功能则按10.0版本讲述。

没关系,基本操作是完全一样的。

好,说了这么多废话,等急了吧,就让我们开始吧!希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。

例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)?患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87让我们把要做的事情理理顺:首先要做的肯定是打开计算机(废话),然后进入瘟98或瘟2000(还是废话,以下省去废话2万字),在进入SPSS后,具体工作流程如下:1.将数据输入SPSS,并存盘以防断电。

《统计分析与SPSS的应用(第五版)》课后练习答案(第2章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第2章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第2章SPSS数据文件的建立和管理1、SPSS中有哪两种基本的数据组织形式?各自的特点和应用场合是什么?SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。

原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标。

计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总后的数据。

2、什么是SPSS的个案?什么SPSS的变量?个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。

变量:数据编辑器窗口中的一列。

3、在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明?默认的变量名:VAR------ ;默认的变量类型:数值型。

变量名标签和变量值标签可增强统计分析结果的可读性。

4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料?体重变化情况产品类型明显减轻无明显变化第一种产品27 19第二种产品20 33问:在SPSS中应如何组织该数据?数据文件如图所示:5、什么是SPSS的用户缺失值?为什么要对用户缺失值进行定义?如何在SPSS中指定用户缺失值?缺失值分为用户缺失值(User Missing Value )和系统缺失值(System MissingValue )。

用户缺失值指在问卷调查中, 将无回答的一些数据以及明显失真的数据当作缺失值 来处理。

用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。

系统缺失值主要指计算机默认的式, 如果在输入数据时空缺了某些数据或输入了 非法的字符,算机就把其界定为缺失值,这时的数为“?”。

在图中 定义。

6、从计量尺度角度看,变量包括哪三种主要类型?请各举出一个相际数据在 SPSS 中指定变量的计算尺度? 变量类型包括:数值 、定序型(受教育程度)以及定类型(性别) 。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)删除一条个案:即删除数据编辑窗口中的某条个案。 ★在要删除的个案号码上单击左键,于是待删除的个案数 据全部反色显示。 ★单击右键,从弹出菜单中选择 cut选项。
3、插入和删除一个变量 (1)插入一个新变量:即在数据编辑窗口的某个变量前插 入一个新变量。 ★ 将当前数据单元确定在某变量上 ★选择菜单: 编辑 -> 插入变量
一行为一个个案
一列为一个变量
二、计数数据的组织方式 有时所采集的数据不是原始的调查问卷数据,而是经过分 组汇总后的计数数据。 在研究职称和年龄的关系时汇总得到如表所示的数据。其 中职称的分组值分别为1~4,年龄段的分组值为1~3。 职称 教授(1) 副教授(2) 讲师(3) 助教(4) 年龄段 35岁以下(1) 36~49岁(2) 50岁以上(3) 0 10 20 35 15 20 10 2 8 1 1 0
例 有两份关于职工基本情况的SPSS数据文件,文件名分别 为“职工数据.sav”和“追加职工.sav”。两份数据文件中的 数据项不尽相同,且同一数据项的变量名也不完全一致。现需 要将这两份数据合并到一起。
纵向合并数据文件的基本操作步骤
1、在数据编辑窗口中打开一个需要合并的SPSS数据文件。 2、选择菜单: 数据 -> 合并文件 -> 添加个案
基本操作步骤如下: (1)选择菜单: 文件 -> 打开 -> 数据 (2)选择数据文件的类型,并输入数据文件名。
注意:
如果读入的是Excel格式文件,SPSS默认将它的所有 数据读到SPSS数据编辑窗口中,也可以指定读取工作表中某 个区域内的数据(A5:B10,表示仅读取以A5单元为左上角 ,B10单元为右下角的矩形区域内的数据)。工作表上的一 行数据为SPSS的个案。如果Excel工作表文件第一行或指定 读取区域内的第一行上存储了变量名信息,则应选择读取变 量名选项。
纵向合并SPSS数据时,通常要注意以下两个问题: ★ 两个待合并的SPSS数据文件的内容合并起来应是有实际 意义的。换句话说,如果两份完全不相干的数据,虽然操作上 能够实现他们的纵向合并,但却是毫无意义的。
★为方便SPSS数据文件的纵向合并,在不同数据文件中数 据含义相同的数据项最好用相同的变量名,且数据类型也最好 相同,利于SPSS对变量的自动匹配。
(2)删除一个变量:即删除数据编辑窗口中的某列变量。 ★ 在要删除列的变量名上单击左键,于是待删除列的数据 全部反色显示。
★单击右键,从弹出菜单中选择 cut选项。
4、数据的移动、复制和删除
数据的移动、复制和删除:与一般的应用程序相同 (1)选择操作对象(变量、个案、若干连续单元等) (2)剪切:Edit+Cut(Ctrl+X) 复制:Edit+Copy(Ctrl+C) 粘贴:Edit+Paste(Ctrl+V)
频数数据举例
2-2 数据文件的结构和定义方法
SPSS数据的结构是对SPSS每列变量及其相关属性的描述, 它的定义是通过数据编辑窗口中的变量视图实现的。 一、变量名 二、数据类型 三、变量名标签 四、变量值标签 五、缺失数据 六、计量尺度
一、变பைடு நூலகம்名(Name)
变量名是变量存取的惟一标志。在定义SPSS数据文件结构 时应首先给出每列变量的变量名。为了方便记忆,变量名最好 与代表的数据含义相对应。 变量名一般的起名规则: 1、变量名的字符个数不多于8个;变量名不区分大小写字 母。允许汉字作为变量名,汉字总数不能超过4个; 2、首字符应以英文字母开头,后面可以跟除了!,?,*之 外的字母或数字。下划线、圆点不能为变量名的最后一个字母; 3、变量名不能与SPSS内部特有的具有特定含义的保留字 相同,如ALL,BY,NOT,OR等;SPSS有默认的变量名,它 以字母“VAR”开头,后面补足5位数字,如VAR00001, VAR00012等。
纵向合并数据文件的基本操作步骤
3、新的活动数据集中的变量: 框中显示的变量名是两个数据文件中的同名变量,SPSS 默认它们有相同的数据含义,并将它们作为合并后新数据文 件中的变量。如果不接受这种默认,可以按 按钮将它们 剔除到非成对变量框中。
4、非成对变量:框中显示的变量名是两个文件中的不同 变量。SPSS默认这些变量的含义不同,且不放入合并后的新 文件中。如果不接受这种默认,可选择其中的两个变量名并 按 指定配对,表示虽然它们的名称不同,但数据含 义是相同的。可进入合并后的数据文件中。或者,对某变量 按 改名后再指定配对。
定距型数据(Scale):通常是指诸如年龄、身高、体重、 血压等连续数值型数据,也包括“人数”、“商品件数”等离 散数值型数据; 定序型数据(Ordinal):具有内在固有大小或高低顺序, 一般可以用数值或字符表示,它取值的大小能够表示观测对象 的某种顺序关系(等级、方位或大小等),但是相邻级别之间 的差距是不相等。例如,职称变量可以有低级、中级、高级三 个取值,可分别用1,2,3表示。年龄段变量可以有老、中、青三 个取值,分别用A、B、C表示等。 定类型数据(Nominal):是指没有内在固有大小或高低顺 序,而只是一种名义上的指代,一般以数值或字符表示的分类 数据。如性别变量中的男、女取值,可以分别用1,2表示。民 族变量中的各个民族,可以分别用汉、回、满等字符表示。
逗号型
Comma
圆点型
Dot
美元符号型
Dollar
字符型
String
8

一串字符
dd-mmm-yyyy、mm/dd/yyyy 等
日期型
Date
2、字符型(String) 字符型也是SPSS较常用的数据类型,由一串字符串组成。如 职工号码、姓名、地址等变量都可以定义为字符型数据。 3、日期型(Date) 日期型用来表示日期或者时间数据,如生日、成立日期 等变量可以定义为日期型。
SPSS用户缺失值是: ★ 对字符型或数值型变量,用户缺失值可以是1~3个特 定的离散值。 ★ 对一个数值型变量,用户缺失值可以在一个连续的闭 区间内并同时附加一个区间以外的离散值。
SPSS系统缺失值: 是用一个圆点表示,它 不等于0或.00,通常出现 在数值型变量数据中。
六、计量尺度(Measure)
四、变量值标签(Values)
变量值标签是对变量取值含义的解释说明信息,对于定 类型和定序型数据尤为总要。 例,用数值1表示男, 用数值2表示女。
可见,变量值标签对于定序数据(如收入的高、中、低) 和定类数据(如民族、性别)来说是必不可少的,它不但明确 了数据的含义,也增强了最后统计分析结果的可读性。变量值 标签可以用中文。
第二章
SPSS数据文件 --建立与管理
2-1
SPSS数据文件
一、SPSS数据文件的特点
1、SPSS数据文件的扩展名是.sav; 2、SPSS数据文件是一种有结构的数据文件。(结构+内容) 二、SPSS数据的基本组织方式 1、原始数据的组织方式 如果待分析的数据是一些原始的调查问卷数据,或是一些 基本的统计指标,那么这些数据就可按原始数据的方式组织 。 打开住房状况调查:桌面->培训->住房状况调查
数据的剪 切、粘贴 与复制
若想恢复,打开Edit---Undo
2-4 读取其他格式的数据文件
一、直接读入其他格式的数据文件
dBase(*.dbf) Text(*.txt) data(*.dat) SPSS(*.sav) dBase系列数据文件,(从dBase II~IV) 纯文本格式的数据文件 纯文本格式的数据文件 spss系列数据文件
二、数据的类型、宽度、小数位数 Type、 Width、Decimals
数据类型是指每个变量取值的类型。SPSS中有三种基本数 据类型,分别为数值型、字符型和日期型。相应的类型会有 默认的列宽或小数位数等。
1、数值型 数值型是SPSS最常用的数据类型,通常由阿拉伯数字(0 ~9)和其他特殊符号(如美元符号、逗号、圆点)等组成 。SPSS中数值型有以下五种不同的标识方法: (1)标准型(Numeric) (2)科学记数法型(Scientific Notation) (3)逗号型(Comma) (4)圆点型(Dot) (5)美元符号型(Dollar)
五、缺失数据(Missing)
数据中明显错误或明显不合理的数据以及漏填的数据都可看 做缺失数据。 例,在某项客户满意度的问卷调查数据中,某个被调查者 的年龄是213岁。这个数据显然是一个不符合实际情况的失真 数据。
例,在某项客户满意度的问卷调查数据中,某个被调查者的 年收入没有填,是空缺的。
SPSS中说明缺失数据的基本方法是指定用户缺失值。在SPSS中处理的方 式是:首先,在遗漏的数据处填入某个特定的标记数据,例,将遗漏的年收 入数据用特定的标记数据(如9999999)来替代;然后,再指明这个特定的 标记数据(如9999999)或那些明显的失真的数据(如213)等为用户缺失值 。这样,在进行统计分析时,SPSS就能将这些用户缺失值与正常的数据区 分开来,并依据用户选择的处理策略对其进行处理或分析等。
二、使用文本导向读入文本文件
(1)选择菜单: 文件 -> 检索
数据间如何分割
数据文件的第一行上是否有变量名
数据部分从文本文件的第几行开始 个案数据在文本文件中是如何安排的
指定文本文件的分割符号
字符型数据表示方法
2-5 SPSS数据文件合并
一、纵向合并数据文件 纵向合并数据文件就是将数据编辑窗口中的数据与另一个 SPSS数据文件中的数据进行首尾对接,即将一个SPSS数据文 件的内容追加到数据编辑窗口中当前数据的后面,依据两个数 据文件中的变量名进行数据对接。
变量结构定义的基本操作 单击Variable View 进入; 定义 变量 名
定义显 示宽度
定义 对齐 方式
定义变 量类型
变量值 定义变量名标签 定义度量尺度 标签
相关文档
最新文档