第2章 SPSS数据文件的建立和管理(上机1)
SPSS统计分析- 第2章 数据文件建立和管理
4.读取“*.txt”数据文件
现需将“人居收入.txt”文件中的数据读入SPSS,如图所示: (1) 打开“数据编辑器”对话框,选择“文件”|“打开文本数据”命令,打 开“打开数据”对话框。选择文本文件,单击“打开”按钮,打开“文本导入向 导”对话框,如图所示:
(2) 在“您的文本文件与 预定义的格式匹配吗? ” 选项组中选择 “ 是 ” 单选 按钮,可单击“浏览” 按 钮,选择已预定义好的 格式;单击 “ 否 ” 则需要 建立一个新格式。
2.1.1 打开定义变量视图
• 按前一章所述打开SPSS主界面,视图切换标签处单击“变 量视图”,即打开“变量视图”窗口,如图所示。在该视 图可对变量的以下属性进行定义:名称、类型、宽度、小 数、标签、值、缺失、列、对齐、度量标准和角色。
2.1.2 定义变量名称
• 在“变量视图”变量栏的“名称”栏中定义变量名称,用 户可根据数据需要或个人习惯进行定义,如果不对变量进 行定义,系统将自动默认变量名为var00001、var00002、 var00003等。一般根据变量的实质意义来命名,例如:年 龄、性别、年级等变量,可用Age,Gender,Grade命名,也 可用中文意义命名,但当出现变量数量较大时,一般使用 流水编号,即防混淆又方便。虽然变量可根据用户的需求 自行编辑,但仍有其需共同遵循的原则: • 若用英文命名,变量名首字必须为英文字母,其后方可接 数字、英文字母、@等。若用中文命名,则可直接使用。 • 不可使用空格和特殊字符(如键盘上的!、#、$、%、&、 ^、*、(、)、?等字符)。
(9) 之后进入下一步,如图所示。在“变量之间有哪些分隔符?”中,可根据 文本数据中变量间的分隔符,可选择“制表符”、 “空格”、“逗号 ”、“分号” 和“其他”复选框。在“文本限定符是什么?”中,可选择“无”、“单引号”、“ 双引号”和“其他”单选按钮,一般默认为“无”,选择完毕后单击“下一步” 。
SPSS数据文件的建立与管理
变量;
Width:变量宽度,默认为8; Decimals: 小数位数,默认为2; Label :变量名标签,对变量名作进一步解释; Values :变量值标签,对变量取值进行解释; Missing :缺失值; Columns :列宽,默认为8; Align :对齐,默认为右对齐(Right); Measure :测量尺度:定类型变量 (Nominal )、
数据导入-电子表格数据(*.xls )
表格第一行是否为变量名? 选择数据表
2.6 数据文件的合并
纵向合并(追加)
【数据D】【合并文件G】【添加个案C】
横向合并(对接) 【数据D】【合并文件G】【添加变量V】
纵向合并(追加)——P37 案例2-3
与已打开的数据集合并
从外部打开数据集合并
002 003
女 男
95 98
Active dataset is key table
学号 001 002 003
性别 男 女 男
成绩 90 95 98
专业 MIS Finance **
数据文件中的个案 必须按升序排列
课堂练习
1.某班花名册部分学生数据如下:
姓名 性别 出生年月
王强
李霞 王涛 刘海 赵晓薇 董俊 Biblioteka 2. 变量可以分为
离散变量:取有限个值 连续变量:可以取无穷多个值
课堂练习
1.某班花名册部分学生数据如下:
姓名 性别 出生年月 年龄
王强
李霞 王涛 刘海 赵晓薇 董俊
男
女 男 男 女 男
1995.1
1994.3 1995.10 1997.6 1994.2 1995.6
20
21 20 18 21 20
薛薇-《SPSS统计分析方法及应用》第2章-SPSS-数据文件的建立和管理
2.4 SPSS数据的录入与编辑 (1)录入 在数据视图中,输入数据。 (2)编辑 在数据视图中,进行编辑数据。
2.5 SPSS数据的保存 文件保存或另保存选择目录路径选择文件类 型(.sav,.xls,.dbf,.dat)输入文件名 保存
11
2.6 读取数据文件
文件打开数据选择目录路径选择文件类型( .sav,.xls,.dbf,.dat)选择文件名打开
2.2.7 结构定义的基本操作 步骤:1、打开SPSS编辑窗口 新建数据单击“变量视图” 2、输入:变量名称、类型、宽度、标签、值等。
9
2.3 SPSS结构定义的应用案例 1、设计调查问卷 标题、引言部分、主体部分、结束语。如,表2-3。 2、建立数据文件结构 调查问卷中,一份卷为一个个案,一个题目作为一个 变量(也称指标)如,表2-4。 (度量水平:有序(序号、定序)、名义(定类)、 定距(度量) ) 3、录入数据 单选择题录入、多选题的录入
变量值标签
对变量取值含义的2)解。释说明信息。 如,1表示男,2表注示意女,。相应列的数据只显
缺失值
示的个数为显示宽度(如 明计显量错尺误度或(明即显度不量合标理,准、2)存。分在三漏大填类的:数定据距。型
计量尺度
(度量)、定序型(数序据号类)型、有定:类数型值(型名、字
义)。
符串型、日期型。
8
2.2 SPSS数据的结构和定义方法
个
变量
案
5
2.1 SPSS数据文件
(2)频数数据的组织方式
频数数据的组织:分组汇总后的汇总数据作为待分析数 据。
频数数据的组织分为:行与变量。如,在研究职称和年龄 的关系时得到下表数据(表2-1)
年龄段
第二章 SPSS数据文件的建立和管理
SPSS中说明缺失数据的基本方法是指定用户缺 失值。用户缺失值可以是: • 对字符型或数值型变量,用户缺失值可以是1 至3个特定的离散值(Discrete missing values) • 对一个数值型变量,用户缺失值可以在一个连 续的闭区间内并同时再附加一个区间以外的离 散值(Range plus one optional discrete)。
10
字符型(String)
较常用的数据类型, (1)字符型也是 )字符型也是SPSS较常用的数据类型,由一个 较常用的数据类型 字符串组成。 职工号码、姓名、 字符串组成。如:职工号码、姓名、地址等变量 都可以定义为字符型数据。 都可以定义为字符型数据。 个字符, (2)字符型数据的默认显示宽度为 个字符,不能 )字符型数据的默认显示宽度为8个字符 够进行算术运算, 区分大小写字母 字母。 够进行算术运算,并区分大小写字母。 (3)字符型数据在 )字符型数据在SPSS命令处理过程中应用一对 命令处理过程中应用一对 双引号括起来,但在输入数据时不应输入双引号, 双引号括起来,但在输入数据时不应输入双引号, 否则双引号将会作为字符型数据的一部分。 否则双引号将会作为字符型数据的一部分。
3
2.频数数据的组织方式 例:
职称 年龄段 35岁以下(1) 36-49岁(2) 50岁以上(3) 教授(1) 副教授(2) 讲师(3) 助教(4) 0 10 20 35 15 20 10 2 8 2 1 0
4
频数数据的组织方式
职称 1 1 1 2 2 2 3 3 3 4 4 4 年龄段 1 2 3 1 2 3 1 2 3 1 2 3 人数 0 15 8 10 20 2 20 10 1 35 2 0
5
2.2 SPSS数据的结构和定义方法
SPSS数据分析教程-2-数据文件的建立和管理
最新课件
14
数据的输入操作(2)
ID号(id) 性别(sex):1:男; 2:女
1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2, 2
身高(height)
76,59,67,65,63,72,70,68,69,74,68,63
参加活动以前的体重(before)
185 113 145 156 109 191 155 165 175 180 135 118
如果一个文件中的某个个案在另一个文件中找不到 个案来匹配,则该个案于第二个文件的变量上的取 值为缺失值。反之亦然。
如果一个文件中的某个个案在另一个文件中找到两 个或者两个以上的个案来匹配,则该个案只取第二 个文件中第一个相匹配的个案来连接。反之亦然。
最新课件
38
合并变量示意图:一对一
最新课件
39
最新课件
3
本章学习目标
理解信息、数据与数据处理的基本概念; 了解SPSS数据编辑器的特点,熟悉SPSS的变
量视图和数据视图,掌握SPSS常用的工具按 钮;
掌握数据录入SPSS软件的方法;
掌握把电子表格、数据库、文本文件等格式的 数据文件读入SPSS软件的方法;
掌握SPSS数据集的数据字典; 学习合并两个数据文件的方法; 明确分割SPSS数据文件的方法。
分析的目的是比较不同收益类型客户的概要特征。
最新课件
42
先按照关键变量“orgntype”(客户工作单 位的类型)进行合并文件。选择【数据】→ 【排序个案】 ,首先按照关键变量
“orgntype”排序。
然后选择【数据】→【合并文件】→【添加变 量】 进行合并。
最新课件
43
2.7 数据的拆分
第二章.SPSS数据文件的建立和管理
候选品牌列表:1、长虹 2、海尔……
2.2.3 SPSS数据的编辑
一、数据的定位
人工定位,人工浏览数据。适用于数据较少的情况 系统定位,系统按照用户指定的条件自动寻找数据单 元。适用于数据量较大的情况 按个案号码定位,Data-Go to case 按变量值定位,Edit-Find
2.3 SPSS数据的录入与编辑
2.3.1 SPSS数据的录入—调查问卷的录入
开放题
原则上按照字符变量自由录入 注意适情况适当放大变量宽度(Width)
单选题
按照选项设定标签,采用数字代码录入
多选题P103
多重二分法(简称:二分法) 多重分类法(简称:多分法)
半开放题
使用两个变量对其进行定义,在第一个变量中,“其他, 请指出”作为选项中的一个进行录入;第二个变量将“其 他,请指出”看作一个独立的开放题进行数据录入将没有 选择该选项的被访者作为缺失值处理
2.4.1 SPSS支持的数据格式
SPSS文件格式(.sav),完整但通用性差; Excel格式(.xls),dbf文件格式(.dbf),文本 文件格式(.dat),变量格式信息丢失但可被相 应软件直接读取
2.4.2 保存SPSS的操作
File-Save/Save as 文件名、文件类型及选择保存变量
2.2.3 变量名标签
对变量名含义的进一步说明,它可增强变 量名的可视性和统计分析结果的可读性。 可用中文,总长度达120个字符。 可省略,但建议给出。 2.2.4 变量值标签 是对变量取值含义的解释说明信息,对定 类型和定序型数据尤为重要。
2.2.5 缺失数据
数据中明显错误或明显不合理的数据以及 漏填的数据都可看作缺失数据。 用户指定缺失值
第二章SPSS数据文件的建立和管理
第二章SPSS数据文件的建立和管理目的1、明确SPSS数据的基本组织方式和数据行列的含义2、掌握应从哪些方面描述SPSS数据文件的结构特征3、熟练掌握建立SPSS数据文件以及管理SPSS数据文件的基本操作4、熟练掌握在SPSS中读取Excel工作表数据的基本操作,了解读取文本和数据库数据的基本方法。
系统的运行及主屏幕介绍开始→程序→SPSS for windowFile文件edit编辑view视图data数据transform转换analyze分析graphs图形utilities实用windows窗口help帮助N3,N7N2,N62.1 SPSS数据文件2.1.1 SPSS数据文件的特点第一,SPSS的数据文件扩展名是.sav.第二,是一种有结构的数据文件。
在建立数据文件时,要做好两方面的任务①描述SPSS的数据结构;②录入编辑SPSS的数据内容。
2.1.2 SPSS数据的基本组织方式一、原始数据的组织方式数据编辑窗口中的一行称为一个个案,所有个案组成SPSS的数据。
一列称为一个变量,每个变量都有一个名字,称为变量名。
它是访问和分析SPSS每个变量的唯一标识。
例2.1:二、计数数据的组织方式有时采集的数据不是原始的调查问卷数据,而是经过分组汇总后的计数数据。
2.2 SPSS数据的结构和定义方法通过variable view定义文件结构2.2.1变量名P72.2.2数据类型、列宽、小数位宽P8-P122.2.3变量名标签P13变量名标签是对变量名含义的进一步解释说明,总长度可达120个字符。
2.2.4变量值标签P142.2.5缺失数据P15-172.2.6计量尺度P19变量结构定义的基本操作,P202.3 SPSS数据的录入与编辑2.3.1录入2.3.2编辑P24-302.4 SPSS数据的保存2.4.1 SPSS支持的数据格式P312.4.2基本操作P322.5读取其他格式的数据文件P332.5.1直接读入其他格式的数据文件P34,基本操作2.5.2使用文本导向读入文本文件P38,基本操作2.6 SPSS数据文件合并2.6.1纵向合并数据文件例2-3:职工数据.sav,追加职工.savP45-47Data—merge file—add case左边显示不同的变量,右边显示相同的变量2.6.2 横向合并数据文件例2-4:职工数据.sav,职工奖金.sav P48-50Data+Merge Files+Add Variables。
第二章SPSS数据文件的建立和管理
SPSS数据文件的特点
SPSS • 其扩展名为.sav • 是一种有结构的数据文件,由结构和内容 两部分组成 • 只能被SPSS软件打开
SPSS
结 构
SPSS
内 容
SPSS
SPSS数据的基本组织方式
• 原始数据的组织方式
• 频数数据的组织方式
原始数据的组织方式
SPSS
第二节SPSS数据的结构和定义方法 SPSS
SPSS
第五节SPSS数据的保存
• SPSS支持的数据格式 • 保存SPSS数据的基本操作
SPSS支持的数据格式
SPSS
• • • •
SPSS文件格式 Excel格式文件 Dbf格式文件 文本格式文件
扩展名
.sav
.xls
.dbf
.dat
SPSS
• 保存SPSS数据的基本操作
• 选择菜单文件
保存或另存为
SPSS
SPSS
添加 完 后 按 确 定
SPSS
得到合 并后 的数 据文 件
SPSS
横向合并数据文件
• 指将数据编辑窗口中的数据与另一个SPSS数 据文件的数据依据个案进行左右对接。 横向合并数据文件应注意:
两个数据文件必须至少有个名称相同的变量; 两个数据文件必须事先按关键变量进行了升序排序
SPSS
SPSS
第三节SPSS结构定义的应用案例
SPSS
第四节 SPSS数据的录入与编辑
• SPSS数据的录入 • SPSS数据的编辑
SPSS • • • •
SPSS数据的录入
按单元格输入数据 按变量输入数据 按个案输入数据 输入带有变量值标签的数据
SPSS数据的编辑
第2章 SPSS数据文件的建立和管理
提纲
1
SPSS数据文件
2
SPSS数据的结构和定义方法
SPSS数据的录入与编辑 SPSS数据的保存
3
4
5
读取其他格式Байду номын сангаас数据文件
SPSS数据文件合并
6
一、SPSS数据文件
• SPSS数据文件是一种有别于其他文件 (如Word文档、文本文件)的特殊格式 的文件。
• 从应用角度理解,这种特殊性表现在两方面:
1、变量名
变量名是变量访问和分析的唯一标志。在定义SPSS 数据结构时应首先给出每列变量的变量名。
• 变量的命名规则
– 英文字母或汉字+字母或数字 – 不能与SPSS内部特有的保留字同名 – 默认变量名:VAR+5位数字
2、数据类型
数据类型是指每个变量取值的类型。SPSS中有三种 基本数据类型,分别为数值型、字符串型和日期型。 每种类型都有默认的宽度、小数位和列宽度。
– SPSS数据文件的扩展名是.sav;
– SPSS数据文件是一种有结构的数据文件,它由数据的结
构和内容两部分组成
SPSS数据的基本组织方式
原始数据的组织方式
如果待分析的数据是一些原始的调查问卷数据,或一些基本的 统计指标,那么这些数据就应以原始数据的组织方式组织。
• 在原始数据的组织方式中,数据编辑窗口中的一行 称为一个个案(Case),所有个案组成SPSS数据文 件的内容。 • 数据编辑窗口中的一列称为一个变量。每个变量 都有一个名字,称为变量名,它是访问和分析SPSS 每个变量的唯一标识。SPSS数据文件的结构就 是关于每个变量及相关特征的描述。
练习1
• 在变量视图中:利用“商品房购买意 向调查问卷示例”或者你自己之前设 计的问卷,建立SPSS文件的数据结构。
第2章 SPSS数据文件的建立与管理[44页]
2.2.1 SPSS数据的录入
第四步:在菜单栏中选择【文件(F)】→【另存为(A)】,会弹出“将数据另存为” 对话框,如图所示,在该对话框中选择保存数据文件的位置;填写数据文件的【文件 名(N)】,如“公司信息.sav”;【保存类型(T)】选择【SPSS Statistics(*.sav)】; 单击【保存(S)】按钮,则完成建立SPSS默认的数据文件。
2.使用文本向导导入文本文件
第四步:在弹出的“文本导入向导-定界,第3/6步”对话框中,需要回答以下3个问 题,第一,第一个数据个案从哪个行号开始;第二,个案的表示方式如何安排的,是一 行一个个案还是一行多个个案,通常以第一种方式安排;第三,导入全部还是部分数据 文件。从第2行开始,每一行表示一个个案,读入全部数据,如图所示,单击【下一步 (N)】按钮。
到此为止,完成了对文本文件的导入操作。接下来,可以对导入的数据进 行必要的加工或处理,并保存为SPSS格式文件。
Part 2.3
SPSS数据文件
SPSS数据合并
字段合并
横向合并(对接)
【数据】【合并文件】【添加变量】
样本合并
纵向合并(追加)
【数据】【合并文件】【添加个案】
2.3.1 字段合并
字段合并的实质是将两个数据文件按照个案对应进行左右对接,因此字段合并也叫横向合 并、变量合并。
2.2.2导入其他类型的数据文件
1.使用Excel向导读入Excel文件
第一步:启动SPSS,在菜单栏中选择【文件(F)】→【导入数据(D)】→【Excel】, 将弹出“打开数据”对话框,在该对话框中选择数据所在的路径,选择文件“招聘数 据.xlsx”,如图所示,单击【打开(O)】。
单元一 SPSS数据文件的建立和管理
第一节 SPSS的发展及使用基础
(二)SPSS数据结构的基本方式
(2)计数数据的组织方式
第二节 SPSS的数据结构和定义方法
(一)变量名
变量名是变量访问和分析的唯一标识。
变量命名原则:
SPSS 变量名由不多于64(32个汉字)个字符组成;首字母是字母或汉字也可以是@字符;不能使用?,!和*;注意不能以下划线_和圆点“.”作为变量名的最后一个字符;
第一节 SPSS的发展及使用基础
(二)SPSS数据结构的基本方式
第一节 SPSS的发展及使用基础
(二)SPSS数据结构的基本方式
在计数数据的组织方式中,数据编辑窗口中的一行为变量的一个分组(或多变量交叉分组下的一个分组)。所有行囊括了该变量的所有分组情况(或多变量交叉下的所有分组情况)。数据编辑器窗口中的一列仍为一个变量,代表某个问题(或者某个方面的特征)以及相应的计数结果。
第五节 数据文件合并
数据文件合并的介绍
(2)横向合并-案例
职工数据和职工奖金数据的合并
①打开“职工数据.sav”②选择菜单【数据】→ 【合并文件】 → 【添加变量】
学 业 进 步!
基本操作步骤如下:
【文件】→【导入数据】→【文本数据】
(二)使用导向导入其他格式的数据
第五节 数据文件合并
数据文件合并的介绍
当数据量较大时,经常会把一份大的数据分成几个小的部分,分别录入,录入完毕后, 就必须将若干个小的数据文件合并起来。数据文件的合并分为纵向合并和横向合并。
(1)纵向合并
将一个SPSS数据文件的内容追加到当前数据编辑器窗口中数据的后面,依据两份数据文件中的变量名进行数据对接。
字符串型简称字符串(R),是SPSS中较常用的数据类型,它有由一串字符组成。如职工号码、姓名、地址等变量都可以定义为字符串数据。
第2章:SPSS 数据文件的建立和管理
(3) 定类数据(Nominal)
定类数据只能互相区别,不能进行排序,可以用数值或
字母表示。 例如性别可以用男、女表示;民族可以用汉、回、满等
表示,它们可以和数值、字母表示,无法进行排序。
(4) 变量之间的关系与设置
定距变量包含定序变量包含定类变量。
根据分析的需要,可以将变量定义成相应的尺度。计量
建立数据集例:姓名,字符型;生日,日期型;学历,
数值(0中学,1大学,2研究生);工资x,数值。
2.数据宽度
每种数据的类型都有数据宽度和列宽,数据宽度为存储
变量值的最大位数。需要注意的是对于数值型变量,录入数
据的宽度可以大于设置好的宽度,但对于字符型变量却不是 这样。对于字符型变量,你设置几位数,它就显示几位数。
计量尺度:定序变量 列宽: 标签值: 1 小学 2 中学 3 大学 4 研究生 a5. 存款金额 计量尺度:定距变量 列宽: 8 2 显示位置:居中
3) 凡是可以用数值1、2、3表示的变量定义成数值型,
将更有利于数据分析。
4) 不同的数据根据其实际的意义与取值定义计量尺度。
5) 变量标签的作用主要用于变量的解释说明。
5.缺失数据
(1) 数据缺失在数据处理过程中不可避免
在数据分析的过程中,有时某一项数据是空的,没有填; 有时有的数据明显是错误的,例如误将年龄的20岁填成了200 岁。这两种情况在数据处理中是经常遇到的。
(2) 缺失值的种类
SPSS的缺失值有两类:系统缺失值和用户缺失值。
称没有数据的单元格为系统缺失值,用点儿“.”表示;
尺度在变量定义窗口完成。 演示:姓名,定类;学历,定序;工资,定距。
SPSS应用案例
银行为了发展储户,扩大业务范围和业务量,委托咨询 公司对本企业的发展进行评估,设计了居民储蓄调查问卷.
第2章SPSS数据文件的建立和管理
精品资料
(2)按变量值自动定位 将当前单元定位在某变量列的任何一条case上; [编辑(biānjí)]—[查找]
精品资料
4.圆点型(Dot) 整数部分从个位开始每3位以一个圆点分隔
,以逗号作为整数和小数部分的分隔符。 1.234,56 5.美元符号型(Dollar) 表示货币数据,在数据前自动加美元符号$ ,格式可以用户自己选择(xuǎnzé)。 (二)字符型(String) 由一串字符串组成,区分大小写。
(三)日期型
表示日期或时间,格式用户自行选择 (xuǎnzé)
精品资料
三、变量名标签Label 是对变量名的进一步解释说明,增强变量名的可
视性和统计结果的可读性。可省略(shěnglüè) 四、变量值标签Values 对变量取值含义的解释说明信息,对于定类数据
和定序数据尤为重要。
精品资料
精品资料
(二)插入和删除一个case 在某个case前插入一个新case 1.[编辑]—[插入个案] 在当前case前插入一空行 2.在欲插入的case号码上点右键,选择”插入
个案” 3.删除一个case 在欲删除的case号码上点左键,待删除的
case数据全部黄色显示(xiǎnshì);点右键, 从弹出的菜单中选择[剪切]或[清除]
被合并的数据文件名 3.两个(liǎnɡ ɡè)待合并的文件中的所有变量都显示
在[新的活动数据集]框中 4.如果两个(liǎnɡ ɡè)待合并的文件中的case是按顺
序一一对应的,直接按OK 5.共有变量名会显示在[已排除的变量]框中,选择
第二章 SPSS数据文件的建立和管理
按个案的号码自动定位
2.5 已输入数据的修改 2.5.1增加一个新的变量列 例如要在第2列前增加一个新的列,使原 来的第2列右移变成第3列。 则(1)可先激活第2列的任一单元格, (2)选Data→Insert Variable命令项。 系统自动为用户在第2列前插入一个新的变 量列,原第2列自动向右移一列成为第3列。
2.2.2 SPSS变量名
变量命名遵循以下原则: SPSS变量的旧式命名由不多于8个字符组成。 首字母是英文字母,其后可为字母或数字或除 “!”、“?”和“*”以外的字符,但应注意不 要以下划线和圆点作为变量名的最后一个字符。 变量名不区分大小字母。允许汉字作为变量名, 汉子总数不能超过4个。 变量名不能与SPSS保留字相同。SPSS的保留字有 ALL、AND、BY、EQ、GE、GT、LE、LT、NE、 NOT、OR、TO、WITH。 SPSS有默认的变量名,以字母VAR开头,后面补 足5位数字。
6.如果目前利率维持不变,您准备? (1)提款购物(2)购买其他证券 (3)继续存款 ...... ……
储蓄调查问卷SPSS的结构
2.4 SPSS数据的录入与编辑
2.4.1 SPSS数据的录入 2.4.1.1 定义一个变量
定义变量要求定义: (1)变量名 (2)变量类型 (3)变量长度(小数位数) (4)变量标签(或值标签) (5)变量的格式(显示宽度、 对齐方式、缺失值标 记等)
2.5.2 增加一个新的观察个案(即增加一个 新的行) (1)例如要在第6个观察单位前增加一个 观察单位(亦即在第6行前增加一行,使原 来的第6行下移成为第7行),则可先激活 第6行的任一单元格。 (2)选Data→Insert Case命令项,系统 自动为用户在第6行前插入一个新的行,原 第6行列自动向下移一行成为第7行。
第二章 SPSS应用基础(数据文件的建立与管理)
第二章 SPSS数据文件的建立、编辑与保存
SPSS数据文件的结构
数据文件的每一行代表一条记录,即每一行代 表一个个体、一个个案、一个样品(Case)
每一列代表一个变量或一个被观测量的特征 (Variable)
单元(Cell)是某个个体与某个变量的交叉。即 每个单元是一个观测或测定值。单元与电子表 格不同,单元只包括数据值而不能含公式。 (在数据编辑器中可以输入和编辑数据,但是 不能输入数学表达式和函数)
设置数值型变量的宽度,默认8位,当变量为日期型 时 无 效 。 默认类型8 , 2 。 如:12345678、12345.67、-
1234.56
第二章 SPSS数据文件的建立、编辑与保存
[Decimal]:变量小数点位数
设置数值型变量的小数位数,变量为日期型时无效。
[Label]:变量标签
第二章 SPSS数据文件的建立、编辑与保存
数据文件的范围是由记录和变量的数目决定的。可以在
任一单元中输入数据。如果在定义好的数据文件边界以外
键入数据,SPSS 将数据长方形延长到包括那个单元和文
件边界之间的任何行 和列。
单元编辑器
如果要分析的数据 还没有录入,可用数
变量Variable
据编辑器来键入数据
空格和特殊字符(如!、?、`和*等),不区 分大小写
不能用作变量名的关键词有:ALL、NE、EQ、 TO、LE、GE、BY、OR、GT、AND、NOT、 WITH
第二章 SPSS数据文件的建立、编辑与保存
[Type]:定义变量类型
单击[Type]相应单元中的按钮,显示下图对话框, 主要变量类型有:Numeric(标准数值型,默认)、 Comma(逗点型数值型)、Dot(句点数值型)、 Scientific Notation (科学记数型) Date(日期 型)、 Dollar(带美元符数值型)、 Custom Currency(自 定 义 型 ) 、 String ( 字 符串型)。选择合适的变 量类型并单击[OK]确定。
第2章SPSS数据文件的建立和管理
8
8
2
2
带圆点的数值或 科学记数法
科学记数法 标准格式或 日期格式非常多
逗点做小数点,原点 做三位分割符的数值
科学记数法 显示格式非常多 有效数值前带$以逗点 为分割符
13141567
123456
8
2
可带$或不带$输 入或科学记数法
12343
$12343
Custom Currency String 8 无 一串字符串 一串字符串 believe believe
SPSS
6、宽度与列
• • 宽度与列 宽度指的是变量宽度,是变量值可表示的 最大位数。对于字符型变量,宽度决定了 输入字符串的长度。 列指的是该变量在数据编辑窗口中的显示 位数。
•
SPSS
7、度量标准
统计分析数据的测度方法大致可分为定距度量和非 定距度量对应的数据,即为定距数据和非定距数据。 定距数据(Scale)是指连续性的数据(如年收入,绩 效评分等)。非定距数据包括顺序尺度(Ordinal)和 名义尺度(Nominal).
*.syd 格式的 Systat 数据文件 *.sys 格式的 Systat 数据文件 SPSS 便携格式的数据文件 以逗号作为分隔符的纯文本文件
EXCEL 数据文件(从 97版~ 2003版) EXCEL 数据文件(从 07版~ 2010版) Lotus 数据文件 SYLK 数据文件 Sas各版
dBase(*.dbf)
数据统计分析系统
——IBM SPSS Statistics 20
叶丽萍 计算机科学系
第2章 SPSS数据文件的 建立和管理
SPSS
本章主要内容
• • • • • SPSS数据文件的结构 数据文件的新建、保存和打开 数据文件的编辑 数据文件的合并与拆分 外部数据的获取
第二章SPSS数据文件的建立和管理解读
2.5 读取其他格式的数据文件
• 2.5.1 直接读入其他格式的数据文件 • 2.5.2 使用文本导向读入文本文件 • 2.5.3 使用数据库向导读入数据读取其他格式据文件
1.打开的数据文件类型 2.基本操作:File-open--data 例:打开“大学生职业生涯规划.xls”
1.数值型 (1)数值 (2)科学计数法 (3)逗号 (4)点 (5)美元 2.字符串型 3.日期型
2.2.3 变量名标签
变量名标签是对变量取值含义的解释说明信息。
2.2.5 缺失数据
1.如何把缺失值和正常值分开? 在变量视图中,缺失进行设置。
2.系统缺失值:通常出现在数值型变量中。 3.缺失值的处理: EM或者回归法进行插值估计。
3.变量名在name下输入。
2.2.2 变量类型、列宽、小数位宽
可供选择的变量类型有:数值型,字符串型,日期型 ➢Numeric (标准数值型); ➢Comma (带逗点的数值型);
; ➢Dot (逗点作小数点的数值型) ; ➢Scientific Notation (科学记数法)
➢Data (日期型); ➢Dollar (带有美元符号的数值型); ➢Custom Currency (用户自定义型); ➢string (字符型) 。
2.2.6 计量尺度
可供选择的变量测度类型有:
2.2.7 变量角色
1.自变量或解释变量(输入变量):解释其他变量 2.因变量或被解释变量(输入变量):被其他变量解释 注:有些变量具有双重角色
2.3 SPSS数据的录入与编辑
• 2.3.1 SPSS数据的录入 • 2.3.2 SPSS数据的编辑
第二章 spss数据文件的建立和管理
第二章spss数据文件的建立和管理1. SPSS中有哪两种基本的数据组织方式?各自的特点和应用场合是什么?两种基本组织方式:原始数据的组织方式:场合为待分析的数据是一些原始的调查问卷数据或是一些基本的统计指标。
是数据编辑窗口中的一列为一个变量一行为一个个案,每个变量有一个名字,是访问和分析SPSS每个变量的唯一标识。
计数数据的组织方式:场合为采集数据不是原始数据,而是经过分组汇总后的数据时。
特点是数据编辑窗口一行变量为一个分组,一列变量为一个变量。
2.在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的那些方面进行必要说明?定义spss数据结构是,默认的变量名和变量类型分别是var0001和数值型,还可以对变量名标签和变量值标签进行必要的说明。
3.你认为SPSS数据窗口与Excel工作表在基本操作方式和数据组织方式方面有什么异同?相同点:都可以对数据进行输入不同点:excel只是对数据的一些简单处理,而spss可以进行统计学的处理,可以进行统计分析,相比excel更加的方便。
4.现有两个SPSS数据文件,分别名为“学生成绩—. Sav”和“学生成绩二. sav”,存放了关于学生学号、性别和若干门课程成绩的数据。
请将这两份数据文件以学号为关键变量进行横向合并,形成一个完整的数据文件。
横向合并:步骤:数据→合并文件→增加变量→学号导入关键变量→确定。
结果如图所示:5.收集到以下关于两种减肥产品使用情况的调查数据,请问在SPSS中应如何组织该份资料?资料组织如下表:6.有一份关于居民储蓄调查的模拟数据存储在Excel中,文件名为“具名储蓄调查数据.xls”。
该数据的第一行是变量名,格式如下图所示。
请将该份数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签步骤:打开spss,文件→打开→数据→选择居民储蓄调查数据→打开变量和值标签添加如下图所示:。