2015-第2章-SPSS数据文件的建立和管理
SPSS统计分析- 第2章 数据文件建立和管理
4.读取“*.txt”数据文件
现需将“人居收入.txt”文件中的数据读入SPSS,如图所示: (1) 打开“数据编辑器”对话框,选择“文件”|“打开文本数据”命令,打 开“打开数据”对话框。选择文本文件,单击“打开”按钮,打开“文本导入向 导”对话框,如图所示:
(2) 在“您的文本文件与 预定义的格式匹配吗? ” 选项组中选择 “ 是 ” 单选 按钮,可单击“浏览” 按 钮,选择已预定义好的 格式;单击 “ 否 ” 则需要 建立一个新格式。
2.1.1 打开定义变量视图
• 按前一章所述打开SPSS主界面,视图切换标签处单击“变 量视图”,即打开“变量视图”窗口,如图所示。在该视 图可对变量的以下属性进行定义:名称、类型、宽度、小 数、标签、值、缺失、列、对齐、度量标准和角色。
2.1.2 定义变量名称
• 在“变量视图”变量栏的“名称”栏中定义变量名称,用 户可根据数据需要或个人习惯进行定义,如果不对变量进 行定义,系统将自动默认变量名为var00001、var00002、 var00003等。一般根据变量的实质意义来命名,例如:年 龄、性别、年级等变量,可用Age,Gender,Grade命名,也 可用中文意义命名,但当出现变量数量较大时,一般使用 流水编号,即防混淆又方便。虽然变量可根据用户的需求 自行编辑,但仍有其需共同遵循的原则: • 若用英文命名,变量名首字必须为英文字母,其后方可接 数字、英文字母、@等。若用中文命名,则可直接使用。 • 不可使用空格和特殊字符(如键盘上的!、#、$、%、&、 ^、*、(、)、?等字符)。
(9) 之后进入下一步,如图所示。在“变量之间有哪些分隔符?”中,可根据 文本数据中变量间的分隔符,可选择“制表符”、 “空格”、“逗号 ”、“分号” 和“其他”复选框。在“文本限定符是什么?”中,可选择“无”、“单引号”、“ 双引号”和“其他”单选按钮,一般默认为“无”,选择完毕后单击“下一步” 。
SPSS数据文件的建立与管理
变量;
Width:变量宽度,默认为8; Decimals: 小数位数,默认为2; Label :变量名标签,对变量名作进一步解释; Values :变量值标签,对变量取值进行解释; Missing :缺失值; Columns :列宽,默认为8; Align :对齐,默认为右对齐(Right); Measure :测量尺度:定类型变量 (Nominal )、
数据导入-电子表格数据(*.xls )
表格第一行是否为变量名? 选择数据表
2.6 数据文件的合并
纵向合并(追加)
【数据D】【合并文件G】【添加个案C】
横向合并(对接) 【数据D】【合并文件G】【添加变量V】
纵向合并(追加)——P37 案例2-3
与已打开的数据集合并
从外部打开数据集合并
002 003
女 男
95 98
Active dataset is key table
学号 001 002 003
性别 男 女 男
成绩 90 95 98
专业 MIS Finance **
数据文件中的个案 必须按升序排列
课堂练习
1.某班花名册部分学生数据如下:
姓名 性别 出生年月
王强
李霞 王涛 刘海 赵晓薇 董俊 Biblioteka 2. 变量可以分为
离散变量:取有限个值 连续变量:可以取无穷多个值
课堂练习
1.某班花名册部分学生数据如下:
姓名 性别 出生年月 年龄
王强
李霞 王涛 刘海 赵晓薇 董俊
男
女 男 男 女 男
1995.1
1994.3 1995.10 1997.6 1994.2 1995.6
20
21 20 18 21 20
SPSS数据分析教程-2-数据文件的建立和管理
最新课件
14
数据的输入操作(2)
ID号(id) 性别(sex):1:男; 2:女
1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 2
身高(height)
76,59,67,65,63,72,70,68,69,74,68,63
参加活动以前的体重(before)
185 113 145 156 109 191 155 165 175 180 135 118
如果一个文件中的某个个案在另一个文件中找不到 个案来匹配,则该个案于第二个文件的变量上的取 值为缺失值。反之亦然。
如果一个文件中的某个个案在另一个文件中找到两 个或者两个以上的个案来匹配,则该个案只取第二 个文件中第一个相匹配的个案来连接。反之亦然。
最新课件
38
合并变量示意图:一对一
最新课件
39
最新课件
3
本章学习目标
理解信息、数据与数据处理的基本概念; 了解SPSS数据编辑器的特点,熟悉SPSS的变
量视图和数据视图,掌握SPSS常用的工具按 钮;
掌握数据录入SPSS软件的方法;
掌握把电子表格、数据库、文本文件等格式的 数据文件读入SPSS软件的方法;
掌握SPSS数据集的数据字典; 学习合并两个数据文件的方法; 明确分割SPSS数据文件的方法。
分析的目的是比较不同收益类型客户的概要特征。
最新课件
42
先按照关键变量“orgntype”(客户工作单 位的类型)进行合并文件。选择【数据】→ 【排序个案】 ,首先按照关键变量
“orgntype”排序。
然后选择【数据】→【合并文件】→【添加变 量】 进行合并。
最新课件
43
2.7 数据的拆分
第二章-SPSS数据文件的建立和管理(ppt文档)
教授(1)
0
15
8
副教授(2)
10
20
1
讲师(3)
20
10
1
助教(4)
35
2
0
频数数据举例
2-2 数据文件的结构和定义方法
SPSS数据的结构是对SPSS每列变量及其相关属性的描述, 它的定义是通过数据编辑窗口中的变量视图实现的。
一、变量名 二、数据类型 三、变量名标签 四、变量值标签 五、缺失数据 六、计量尺度
一、变量名(Name)
变量名是变量存取的惟一标志。在定义SPSS数据文件结构 时应首先给出每列变量的变量名。为了方便记忆,变量名最好 与代表的数据含义相对应。
变量名一般的起名规则: 1、变量名的字符个数不多于8个;变量名不区分大小写字 母。允许汉字作为变量名,汉字总数不能超过4个;
2、首字符应以英文字母开头,后面可以跟除了!,?,*之 外的字母或数字。下划线、圆点不能为变量名的最后一个字母;
3、变量名不能与SPSS内部特有的具有特定含义的保留字 相同,如ALL,BY,NOT,OR等;SPSS有默认的变量名,它 以字母“VAR”开头,后面补足5位数字,如VAR00001, VAR00012等。
二、数据的类型、宽度、小数位数 Type、 Width、Decimals
数据类型是指每个变量取值的类型。SPSS中有三种基本数 据类型,分别为数值型、字符型和日期型。相应的类型会有 默认的列宽或小数位数等。
3、日期型(Date) 日期型用来表示日期或者时间数据,如生日、成立日期 等变量可以定义为日期型。
三、变量名标签(Label)
1、 变量名标签是对变量名含义的进一步解释说明,它 可增强变量名的可视性和统计分析结果的可读性。
spss数据文件的建立与管理
SPSS数据文件的结构
2 、字符型(String): 存储字符数据 8位 如:beijing 处理时用双引号扩起来 3、日期型(Date):存储日期数据 格式很多,如:20-AUG-1999 4、其他: 如:圆点数值型(dot)、用户自定义型(customer) 注意:显示宽度不影响数据的存储
SPSS数据文件的结构
(二)横向数据合并 (3)菜单选项: data -> merge file -> add variable (4)选项说明: – math cases on key variables in sorted files:以关键字作为 合并标志。 – Both files provide cases:合并后的文件的数据由两个文件共 同提供。 – External file is keyed table:以data editor的数据为基础。 – Working data file is keyed table:以磁盘文件的数据为基础。
(二)变量的类型(type)和显示宽度(width) 1、数值型:
标准数值型(Numeric):默认类型 列宽8位;小数点2位 如: 12345678、12345.67、-1234.56 带逗号的数值型(Comma): 从个位开始三位一个逗号 如:1,234.56 科学计数法(Scientific Notation):表示很大或很小的数据 如:1.2E+05 带美元符号(Dollar):表示货币 格式很多,如:$12.30
事先指定:指定某个特定值为缺失值(用户缺失值) 其他处理方法,如:以均值、众数替代等
3、SPSS缺失值 用户缺失值 系统缺失值:点 (•)
SPSS数据文件的结构
(七)变量计量尺度(Measurement)
第二章.SPSS数据文件的建立和管理
候选品牌列表:1、长虹 2、海尔……
2.2.3 SPSS数据的编辑
一、数据的定位
人工定位,人工浏览数据。适用于数据较少的情况 系统定位,系统按照用户指定的条件自动寻找数据单 元。适用于数据量较大的情况 按个案号码定位,Data-Go to case 按变量值定位,Edit-Find
2.3 SPSS数据的录入与编辑
2.3.1 SPSS数据的录入—调查问卷的录入
开放题
原则上按照字符变量自由录入 注意适情况适当放大变量宽度(Width)
单选题
按照选项设定标签,采用数字代码录入
多选题P103
多重二分法(简称:二分法) 多重分类法(简称:多分法)
半开放题
使用两个变量对其进行定义,在第一个变量中,“其他, 请指出”作为选项中的一个进行录入;第二个变量将“其 他,请指出”看作一个独立的开放题进行数据录入将没有 选择该选项的被访者作为缺失值处理
2.4.1 SPSS支持的数据格式
SPSS文件格式(.sav),完整但通用性差; Excel格式(.xls),dbf文件格式(.dbf),文本 文件格式(.dat),变量格式信息丢失但可被相 应软件直接读取
2.4.2 保存SPSS的操作
File-Save/Save as 文件名、文件类型及选择保存变量
2.2.3 变量名标签
对变量名含义的进一步说明,它可增强变 量名的可视性和统计分析结果的可读性。 可用中文,总长度达120个字符。 可省略,但建议给出。 2.2.4 变量值标签 是对变量取值含义的解释说明信息,对定 类型和定序型数据尤为重要。
2.2.5 缺失数据
数据中明显错误或明显不合理的数据以及 漏填的数据都可看作缺失数据。 用户指定缺失值
第二章SPSS数据文件的建立和管理
第二章SPSS数据文件的建立和管理目的1、明确SPSS数据的基本组织方式和数据行列的含义2、掌握应从哪些方面描述SPSS数据文件的结构特征3、熟练掌握建立SPSS数据文件以及管理SPSS数据文件的基本操作4、熟练掌握在SPSS中读取Excel工作表数据的基本操作,了解读取文本和数据库数据的基本方法。
系统的运行及主屏幕介绍开始→程序→SPSS for windowFile文件edit编辑view视图data数据transform转换analyze分析graphs图形utilities实用windows窗口help帮助N3,N7N2,N62.1 SPSS数据文件2.1.1 SPSS数据文件的特点第一,SPSS的数据文件扩展名是.sav.第二,是一种有结构的数据文件。
在建立数据文件时,要做好两方面的任务①描述SPSS的数据结构;②录入编辑SPSS的数据内容。
2.1.2 SPSS数据的基本组织方式一、原始数据的组织方式数据编辑窗口中的一行称为一个个案,所有个案组成SPSS的数据。
一列称为一个变量,每个变量都有一个名字,称为变量名。
它是访问和分析SPSS每个变量的唯一标识。
例2.1:二、计数数据的组织方式有时采集的数据不是原始的调查问卷数据,而是经过分组汇总后的计数数据。
2.2 SPSS数据的结构和定义方法通过variable view定义文件结构2.2.1变量名P72.2.2数据类型、列宽、小数位宽P8-P122.2.3变量名标签P13变量名标签是对变量名含义的进一步解释说明,总长度可达120个字符。
2.2.4变量值标签P142.2.5缺失数据P15-172.2.6计量尺度P19变量结构定义的基本操作,P202.3 SPSS数据的录入与编辑2.3.1录入2.3.2编辑P24-302.4 SPSS数据的保存2.4.1 SPSS支持的数据格式P312.4.2基本操作P322.5读取其他格式的数据文件P332.5.1直接读入其他格式的数据文件P34,基本操作2.5.2使用文本导向读入文本文件P38,基本操作2.6 SPSS数据文件合并2.6.1纵向合并数据文件例2-3:职工数据.sav,追加职工.savP45-47Data—merge file—add case左边显示不同的变量,右边显示相同的变量2.6.2 横向合并数据文件例2-4:职工数据.sav,职工奖金.sav P48-50Data+Merge Files+Add Variables。
第二章SPSS数据文件的建立和管理
SPSS数据文件的特点
SPSS • 其扩展名为.sav • 是一种有结构的数据文件,由结构和内容 两部分组成 • 只能被SPSS软件打开
SPSS
结 构
SPSS
内 容
SPSS
SPSS数据的基本组织方式
• 原始数据的组织方式
• 频数数据的组织方式
原始数据的组织方式
SPSS
第二节SPSS数据的结构和定义方法 SPSS
SPSS
第五节SPSS数据的保存
• SPSS支持的数据格式 • 保存SPSS数据的基本操作
SPSS支持的数据格式
SPSS
• • • •
SPSS文件格式 Excel格式文件 Dbf格式文件 文本格式文件
扩展名
.sav
.xls
.dbf
.dat
SPSS
• 保存SPSS数据的基本操作
• 选择菜单文件
保存或另存为
SPSS
SPSS
添加 完 后 按 确 定
SPSS
得到合 并后 的数 据文 件
SPSS
横向合并数据文件
• 指将数据编辑窗口中的数据与另一个SPSS数 据文件的数据依据个案进行左右对接。 横向合并数据文件应注意:
两个数据文件必须至少有个名称相同的变量; 两个数据文件必须事先按关键变量进行了升序排序
SPSS
SPSS
第三节SPSS结构定义的应用案例
SPSS
第四节 SPSS数据的录入与编辑
• SPSS数据的录入 • SPSS数据的编辑
SPSS • • • •
SPSS数据的录入
按单元格输入数据 按变量输入数据 按个案输入数据 输入带有变量值标签的数据
SPSS数据的编辑
第2章 数据文件的建立和管理PPT教学课件
2.1 数据文件的特点和结构 2.2 定义数据文件的结构 2.3 数据的录入与保存 2.4 数据的编辑 2.5 读取其他格式的数据文件
1
SPSS数据文件的特点
SPSS数据文件的特殊性:其扩展名是.sav; 它是一种有结构的数据文件。
SPSS数据文件由数据的结构和内容两部分组 成。其中数据的结构记录数据类型、取值说 明、数据缺失情况等必要信息,数据的内容 才是待分析的具体数据。
数据中错误或者漏填的数据。如果不特意 说明,SPSS会把缺失数据参与分析,因此 要对缺失数据进行说明。 对缺失数据进行说明的三种方法(P14):
对于漏填的数值型数据,系统默认的缺失 值用一个圆点来表示,字符型变量中的空格 或控不是系统缺失值。
11
度量尺度
定距型数据(Scale) 定序型数据(Ordinal) 定类型数据(Nominal)
14
SPSS数据的录入与保存
录入:逐行录入按Tab键,逐列输入按Enter键 (例:职工基本情况数据P49) 录入带有变量值标签的数据: View→Value Labels (单元格将显示对应的变量值标签) 数据的保存: data 保存成其他格式的文件:Save as
15
第2章 SPSS数据文件的 建立和管理
建立SPSS 数据文件应 完成两项任 务
描述SPSS数据的结 构 录入编辑SPSS数据
SPSS数据文件的结构
个案、变量、单元格、当前单元格
SPSS数据文件以二维表的形式组织数 据。一行为一个样品(CASE)或个案, 一列为一个变量(VARIABLE),行与列 交叉之处为一个单元格,可在其中输入变 量值。
9
变量值标签(Value Lable)
第2章 SPSS数据文件的建立和管理
提纲
1
SPSS数据文件
2
SPSS数据的结构和定义方法
SPSS数据的录入与编辑 SPSS数据的保存
3
4
5
读取其他格式Байду номын сангаас数据文件
SPSS数据文件合并
6
一、SPSS数据文件
• SPSS数据文件是一种有别于其他文件 (如Word文档、文本文件)的特殊格式 的文件。
• 从应用角度理解,这种特殊性表现在两方面:
1、变量名
变量名是变量访问和分析的唯一标志。在定义SPSS 数据结构时应首先给出每列变量的变量名。
• 变量的命名规则
– 英文字母或汉字+字母或数字 – 不能与SPSS内部特有的保留字同名 – 默认变量名:VAR+5位数字
2、数据类型
数据类型是指每个变量取值的类型。SPSS中有三种 基本数据类型,分别为数值型、字符串型和日期型。 每种类型都有默认的宽度、小数位和列宽度。
– SPSS数据文件的扩展名是.sav;
– SPSS数据文件是一种有结构的数据文件,它由数据的结
构和内容两部分组成
SPSS数据的基本组织方式
原始数据的组织方式
如果待分析的数据是一些原始的调查问卷数据,或一些基本的 统计指标,那么这些数据就应以原始数据的组织方式组织。
• 在原始数据的组织方式中,数据编辑窗口中的一行 称为一个个案(Case),所有个案组成SPSS数据文 件的内容。 • 数据编辑窗口中的一列称为一个变量。每个变量 都有一个名字,称为变量名,它是访问和分析SPSS 每个变量的唯一标识。SPSS数据文件的结构就 是关于每个变量及相关特征的描述。
练习1
• 在变量视图中:利用“商品房购买意 向调查问卷示例”或者你自己之前设 计的问卷,建立SPSS文件的数据结构。
第2章 SPSS数据文件的建立与管理[44页]
2.2.1 SPSS数据的录入
第四步:在菜单栏中选择【文件(F)】→【另存为(A)】,会弹出“将数据另存为” 对话框,如图所示,在该对话框中选择保存数据文件的位置;填写数据文件的【文件 名(N)】,如“公司信息.sav”;【保存类型(T)】选择【SPSS Statistics(*.sav)】; 单击【保存(S)】按钮,则完成建立SPSS默认的数据文件。
2.使用文本向导导入文本文件
第四步:在弹出的“文本导入向导-定界,第3/6步”对话框中,需要回答以下3个问 题,第一,第一个数据个案从哪个行号开始;第二,个案的表示方式如何安排的,是一 行一个个案还是一行多个个案,通常以第一种方式安排;第三,导入全部还是部分数据 文件。从第2行开始,每一行表示一个个案,读入全部数据,如图所示,单击【下一步 (N)】按钮。
到此为止,完成了对文本文件的导入操作。接下来,可以对导入的数据进 行必要的加工或处理,并保存为SPSS格式文件。
Part 2.3
SPSS数据文件
SPSS数据合并
字段合并
横向合并(对接)
【数据】【合并文件】【添加变量】
样本合并
纵向合并(追加)
【数据】【合并文件】【添加个案】
2.3.1 字段合并
字段合并的实质是将两个数据文件按照个案对应进行左右对接,因此字段合并也叫横向合 并、变量合并。
2.2.2导入其他类型的数据文件
1.使用Excel向导读入Excel文件
第一步:启动SPSS,在菜单栏中选择【文件(F)】→【导入数据(D)】→【Excel】, 将弹出“打开数据”对话框,在该对话框中选择数据所在的路径,选择文件“招聘数 据.xlsx”,如图所示,单击【打开(O)】。
第2章:SPSS 数据文件的建立和管理
(3) 定类数据(Nominal)
定类数据只能互相区别,不能进行排序,可以用数值或
字母表示。 例如性别可以用男、女表示;民族可以用汉、回、满等
表示,它们可以和数值、字母表示,无法进行排序。
(4) 变量之间的关系与设置
定距变量包含定序变量包含定类变量。
根据分析的需要,可以将变量定义成相应的尺度。计量
建立数据集例:姓名,字符型;生日,日期型;学历,
数值(0中学,1大学,2研究生);工资x,数值。
2.数据宽度
每种数据的类型都有数据宽度和列宽,数据宽度为存储
变量值的最大位数。需要注意的是对于数值型变量,录入数
据的宽度可以大于设置好的宽度,但对于字符型变量却不是 这样。对于字符型变量,你设置几位数,它就显示几位数。
计量尺度:定序变量 列宽: 标签值: 1 小学 2 中学 3 大学 4 研究生 a5. 存款金额 计量尺度:定距变量 列宽: 8 2 显示位置:居中
3) 凡是可以用数值1、2、3表示的变量定义成数值型,
将更有利于数据分析。
4) 不同的数据根据其实际的意义与取值定义计量尺度。
5) 变量标签的作用主要用于变量的解释说明。
5.缺失数据
(1) 数据缺失在数据处理过程中不可避免
在数据分析的过程中,有时某一项数据是空的,没有填; 有时有的数据明显是错误的,例如误将年龄的20岁填成了200 岁。这两种情况在数据处理中是经常遇到的。
(2) 缺失值的种类
SPSS的缺失值有两类:系统缺失值和用户缺失值。
称没有数据的单元格为系统缺失值,用点儿“.”表示;
尺度在变量定义窗口完成。 演示:姓名,定类;学历,定序;工资,定距。
SPSS应用案例
银行为了发展储户,扩大业务范围和业务量,委托咨询 公司对本企业的发展进行评估,设计了居民储蓄调查问卷.
第二章 SPSS数据文件的建立和管理
按个案的号码自动定位
2.5 已输入数据的修改 2.5.1增加一个新的变量列 例如要在第2列前增加一个新的列,使原 来的第2列右移变成第3列。 则(1)可先激活第2列的任一单元格, (2)选Data→Insert Variable命令项。 系统自动为用户在第2列前插入一个新的变 量列,原第2列自动向右移一列成为第3列。
2.2.2 SPSS变量名
变量命名遵循以下原则: SPSS变量的旧式命名由不多于8个字符组成。 首字母是英文字母,其后可为字母或数字或除 “!”、“?”和“*”以外的字符,但应注意不 要以下划线和圆点作为变量名的最后一个字符。 变量名不区分大小字母。允许汉字作为变量名, 汉子总数不能超过4个。 变量名不能与SPSS保留字相同。SPSS的保留字有 ALL、AND、BY、EQ、GE、GT、LE、LT、NE、 NOT、OR、TO、WITH。 SPSS有默认的变量名,以字母VAR开头,后面补 足5位数字。
6.如果目前利率维持不变,您准备? (1)提款购物(2)购买其他证券 (3)继续存款 ...... ……
储蓄调查问卷SPSS的结构
2.4 SPSS数据的录入与编辑
2.4.1 SPSS数据的录入 2.4.1.1 定义一个变量
定义变量要求定义: (1)变量名 (2)变量类型 (3)变量长度(小数位数) (4)变量标签(或值标签) (5)变量的格式(显示宽度、 对齐方式、缺失值标 记等)
2.5.2 增加一个新的观察个案(即增加一个 新的行) (1)例如要在第6个观察单位前增加一个 观察单位(亦即在第6行前增加一行,使原 来的第6行下移成为第7行),则可先激活 第6行的任一单元格。 (2)选Data→Insert Case命令项,系统 自动为用户在第6行前插入一个新的行,原 第6行列自动向下移一行成为第7行。
第2章SPSS数据文件的建立和管理
8
8
2
2
带圆点的数值或 科学记数法
科学记数法 标准格式或 日期格式非常多
逗点做小数点,原点 做三位分割符的数值
科学记数法 显示格式非常多 有效数值前带$以逗点 为分割符
13141567
123456
8
2
可带$或不带$输 入或科学记数法
12343
$12343
Custom Currency String 8 无 一串字符串 一串字符串 believe believe
SPSS
6、宽度与列
• • 宽度与列 宽度指的是变量宽度,是变量值可表示的 最大位数。对于字符型变量,宽度决定了 输入字符串的长度。 列指的是该变量在数据编辑窗口中的显示 位数。
•
SPSS
7、度量标准
统计分析数据的测度方法大致可分为定距度量和非 定距度量对应的数据,即为定距数据和非定距数据。 定距数据(Scale)是指连续性的数据(如年收入,绩 效评分等)。非定距数据包括顺序尺度(Ordinal)和 名义尺度(Nominal).
*.syd 格式的 Systat 数据文件 *.sys 格式的 Systat 数据文件 SPSS 便携格式的数据文件 以逗号作为分隔符的纯文本文件
EXCEL 数据文件(从 97版~ 2003版) EXCEL 数据文件(从 07版~ 2010版) Lotus 数据文件 SYLK 数据文件 Sas各版
dBase(*.dbf)
数据统计分析系统
——IBM SPSS Statistics 20
叶丽萍 计算机科学系
第2章 SPSS数据文件的 建立和管理
SPSS
本章主要内容
• • • • • SPSS数据文件的结构 数据文件的新建、保存和打开 数据文件的编辑 数据文件的合并与拆分 外部数据的获取
第二章 SPSS数据文件的建立和管理
显示格式非常多 有效数值前带$以逗点 为分割符 12343 $12343
Custom Currency String
变量标签与变量值标签
变量标签(Variable Labels)
为为进一步描述变量所表示的意义,特别是当 变量名不能充分描述变量所表述的意义时。
变量值标签 (Value Labels)
三、数据的剪切、
二、插入与删除观 测量
1.插入观测量 单击行头,然后选择 菜单data-cases,或者 单击右键出现左侧对 话框, 单击Insert Case 2.删除观测量 单击行头,然后选择 菜单edit-clear,或者单 击右键出现左侧对话 框, 单击clear,或者直 接按del键。
复制
职工号 001 002
工资 1212 1001
职称 高级 初级
年龄 30 32
职工号 020 021
工资 1311 1120
职称 高级 高级
性别 男 女
职工号 001 002 020 021
工资 1212 1001 1311 1120
职称 高级 初级 高级 高级
年龄 30 32
性别
source 01 1 1
变量标签
no 编号 1 2 3 4 5
06/30/1987 2.80 12/15/1982 3.90 04/21/1993 3.00 11/07/1991 3.35 05/21/1993 2.56
欧阳德仪 初中 程德忠 不详
练习2:
将数据文件“纵向合并.sav”纵向合并到例题1数 据中,要求排除“母亲文化”变量,指定数据来 源变量,形成新的数据文件。
no
编号 6
name
educ
birth
第二章SPSS数据文件的建立和管理解读
2.5 读取其他格式的数据文件
• 2.5.1 直接读入其他格式的数据文件 • 2.5.2 使用文本导向读入文本文件 • 2.5.3 使用数据库向导读入数据读取其他格式据文件
1.打开的数据文件类型 2.基本操作:File-open--data 例:打开“大学生职业生涯规划.xls”
1.数值型 (1)数值 (2)科学计数法 (3)逗号 (4)点 (5)美元 2.字符串型 3.日期型
2.2.3 变量名标签
变量名标签是对变量取值含义的解释说明信息。
2.2.5 缺失数据
1.如何把缺失值和正常值分开? 在变量视图中,缺失进行设置。
2.系统缺失值:通常出现在数值型变量中。 3.缺失值的处理: EM或者回归法进行插值估计。
3.变量名在name下输入。
2.2.2 变量类型、列宽、小数位宽
可供选择的变量类型有:数值型,字符串型,日期型 ➢Numeric (标准数值型); ➢Comma (带逗点的数值型);
; ➢Dot (逗点作小数点的数值型) ; ➢Scientific Notation (科学记数法)
➢Data (日期型); ➢Dollar (带有美元符号的数值型); ➢Custom Currency (用户自定义型); ➢string (字符型) 。
2.2.6 计量尺度
可供选择的变量测度类型有:
2.2.7 变量角色
1.自变量或解释变量(输入变量):解释其他变量 2.因变量或被解释变量(输入变量):被其他变量解释 注:有些变量具有双重角色
2.3 SPSS数据的录入与编辑
• 2.3.1 SPSS数据的录入 • 2.3.2 SPSS数据的编辑
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
38
2.3 SPSS结构定义的应用案例
• SPSS数据文件的建立--练习(第26页)
• 根据居民储蓄调查问卷,建立SPSS
格式的数据文件。
39
2.4 SPSS数据的录入与编辑
• 2.4.1 SPSS数据的录入 • 2.4.2 SPSS数据的编辑
SPSS数据的定位 插入和删除一条个案 插入和删除一个变量 数据的移动、复制和删除
33
3. 数值型数据(metric data)
– 对事物的精确测度 – 结果表现为具体的数值,是最常见的数据类型 – 例如:身高为175cm、168cm、183cm;还有体重 、收入等等
34
35
2.2.7 结构定义的基本操作
单击Variable View 进入; 定义 变量 名
定义显 示宽度
定义 对齐 方式
11
定义时直接 录入即可
2.2.1 变量名(Variable name)
变量名是变量访问和分析的唯一标志。 在定义 SPSS数据结构时应首先给出每列变 量的变量名。
12
定义时直接 录入即可
2.2.1 变量名(Variable name)
变量的命名规则如下:
1. 以前版本的首字符应以英文字母开头, 20 版本的可以直接是汉字开头。后面可以跟 除了!、?、*之外的字母或数字。下划线、 圆点不能为变量名的最后一个字符。 SPSS 允许用汉字作为变量名。
26
• 指定用户缺失值。用户缺失值可以是:
o 对字符型或数值型变量,用户缺失值可以 是1至3个特定的离散值(Discrete missing values); o 对一个数值型变量,用户缺失值可以在一 个连续的闭区间内并同时再附加一个区间 以外的离散值(Range plus one optional discrete)。
15
2.2.2-1 数据类型(Type)
数据类型是指每个变量取值的类型。SPSS中 有三种基本数据类型:数值型、字符型和日期型。
•数值型 (1)标准型(Numeric) (2)科学记数法型(Scientific Notation) (3)逗号型(Comma) (4)圆点型(Dot) (5)美元符号型(Dollar) (6)用户自定义型(Custom Currency) •字符型(String) •日期型(Date)
18
字符型(String)
字符型也是SPSS较常用的数据类型,由 一个字符串组成。如职工号码、姓名、地址 等变量都可以定义为字符型数据。字符型数 据的默认显示宽度为 8 个字符,不能够进行 算术运算,区分大小写字母。字符型数据在 SPSS 命令处理过程中应用一对双引号括起 来,但在输入数据时不应输入双引号,否则 双引号将会作为字符型数据的一部分。
变量值标签是对变量取值含义的解释 说明信息,对于品质型数据(定性数据包括 分类和顺序数据)尤为重要,比如1代表男
性,2代表女性,它不但明确了数据的含义,
也增强了最后统计分析结果的可读性,变
量值标签可以用中文。
23
鼠标单击再单击右边的省略号 弹出值标签定义窗口逐个添加
24
2.2.5 缺失数据(Missing values)
13
2.变量名的字符个数最好不多于8个;变量 名不区分大小写字母。 3. SPSS有默认的变量名,以字母“VAR”开 头,后面补足5位数字,如VAR00001, VAR00012等。变量名不能与SPSS内部特有 的具有特定含义的保留字同名,如ALL, BY,AND,NOT,OR等。
14
4.变量名最好与其代表的数据含义相对应, 每个变量名必须具有唯一性。
7
(2)频数数据的组织方式
例:
职称 年龄段
分组汇总 后的数据
35岁以下(1) 36-49岁(2) 50岁以上(3) 教授(1) 副教授(2) 讲师(3) 助教(4) 0 10 20 35 15 20 10 2 8 2 1 0
频数数据的组织方式中: 一行为变量的一个分组(或多 个变量交叉分组下的一个分组),所有行囊括了该变量 的所有分组情况,一列仍为一个变量,代表某个问题 (或某个方面)及频数。 8
50
2.4.2.3 插入和删除一个变量
• 插入一个变量:
选择菜单菜单 编辑Edit插入变量Insert Variable
• 删除一个变量,在欲删除的变量名上单击鼠 标左键,于是待删除的数据全部反向显示; 单击鼠标右键,从弹出菜单中选择清除cut 选项。
51
2.4.2.4 数据的移动、复制和删除
• 输入定位变量值并确认
于是, SPSS自动对指定的变量进行搜索,并 将当前单元定位于定位变量值相等的第一个个 案上。
48
49
2.4.2.2 插入和删除一个个案
• 插入一个个案,选择菜单 编辑Edit插入个 案Insert Case
• 删除一个个案 ,在欲删除的个案号码上单 击鼠标左键;单击鼠标右键,从弹出菜单中 选择清除cut选项。
19
日期型(Data)
日期型数据用来表示日期或者时间, 如生日、成立日期等变量可以定义为日期 型数据。显示格式:dd-mmm-yyyy; mm/dd/yyyy。
20
2.2.2-2 变量宽度(Width)、显示 宽度(Columns)
每种类型的变量都有自己的变量宽度、小
数位和显示宽度,其中变量宽度是变量允 许的最大字符位数,列宽度是数据编辑窗 口中显示每列的字符位数。通常这两个宽 度是一致的。
数据的移动、复制和删除:与一般的应 用程序相同
统计应用软件
授课教师:邹小林
1
第二章 SPSS数据文件 的建立与管理
2.1 SPSS数据文件 2.2 SPSS数据的结构和定义方法 2.3 SPSS结构定义的应用案例 2.4 SPSS数据的录入和编辑 2.5 SPSS数据的保存
2015-6-22 2
2.1 SPSS数据文件
• 2.1.1 数据文件的特点
频数数据的组织方式—SPSS格式
职称 年龄段 人数
1
1 1 2 2 2 3 3
1
2 3 1 2 3 1 2
0
15 8 10 20 2 20 10
3
4 4
3
1 2
1
35 2
4
3
0
9
2.2 SPSS数据的结构 和定义方法
SPSS数据的结构是对SPSS每列变量 及其相关属性的描述,主要包括变量 名、数据类型、变量宽度、变量名标 签、变量值标签、显示宽度、缺失值、 对齐方式、度量尺度等信息。
• 数据中存在明显错误或明显不合理的数据 或漏填数据项时统计学上称为不完全数据 或缺失数据。 • 数据中如果存在缺失数据,分析时通常不 能直接采用,要进行说明。
25
• SPSS中说明缺失数据的方法是指定用户缺 失值。这样,SPSS在分析时,就能够将这 些缺失值与正常的数据区分开来,并依据 用户指定的缺失值处理策略对其进行处理 或分析。 • SPSS还有一类默认的缺失值,称为系统缺 失值,数值型变量用圆点表示,字符型用 空格表示。
21
定义时直接 录入即可
2.2.3 变量名标签(Variable label)
• 变量名标签是对变量名含义的进一步解释说
明,它可以增强变量名的可视性和统计分析
结果的可读性。
• 变量名标签可用中文,总长度可达 120 个字
符,但在统计分析结果的显示中一般不能显
示如此长的变量名标签信息。
22
2.2.4 变量值标签(Value label)
4
数据 结构
数据 内容
5
基于上述特点,建立SPSS数据文
件时应完成两项任务:
• 描述SPSS数据的结构(变量视图) • 录入编辑SPSS数据的内容(数据视图)
6
2.1.2 SPSS数据的组织方式
(1) 原始数据的组织方式
直接的问 卷数据
• 数据编辑窗口中的一行称为一个个案或记 录(Case),所有个案组成SPSS数据文件 的内容。数据编辑窗口的一列称为一个变 量(Variable),每个变量都有一个名字, 称为变量名,它是访问和分析SPSS每个变 量的唯一标志。 SPSS数据文件的结构就是 对每个变量及相关特征的描述。
27
SPSS用户缺失值定义窗口
鼠标单击再单击右边的省略号 弹出缺失值定义窗口逐个添加
28
SPSS用户缺失值定义窗口
29
变量对齐格式(Align)
• 定义显示对齐方式,对齐方式分为右对齐、 左对齐和中间对齐; • 系统中,数值型变量默认为右对齐,字符 型变量默认为左对齐。
30
2.2.6 度量标准(Measure)
定义变 量类型
变量值 定义变量名标签 定义度量尺度 标签
定义变量类 型对话框
定义变量值标 签对话框
定义变量缺省值 36 对话框
• 通常建立SPSS数据文件时应首先定义 数据的结构部分,然后再输入数据, 但实际应用中,边录入、边分析、边 修改数据结构的情况也是常见的。数 据的结构定义完成之后,可以在变量 视图(Variable View)卡片中浏览,也可 以通过菜单选项实用程序(Utilities) 变量 (Variable)来实现。
10
• 2.2.1 变量名(Name) • 2.2.2 数据类型(Type)、宽度 (Width) 、列宽度(Columns) • 2.2.3 变量名标签(Label) • 2.2.4 变量值标签(Values) • 2.2.5 缺失数据(Missing) • 2.2.6 计量尺度(Measure) • 2.2.7 结构定义的基本操作
40
2.4.1 录入
• 定义好SPSS数据结构后,可将具体的数据 输入到 SPSS 中,最终形成 SPSS 数据文件。
• SPSS数据的录入操作在数据编辑窗口中的 数据视图(Data View)卡片中实现。其操作 方法与EXCEL基本类似,也是以电子表格 的方式进行录入。