薛薇,《SPSS统计分析方法及应用》第二章 数据录入与数据获取

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)定序尺度(Ordinal Measurement):定序尺
度是对事物之间的等级或顺序差别的一种测度,可
比较优劣或排序。用:序号(O)表示。

如:1.教授 2.副教授 3.讲师 4.助教。 特点:由于定序变量只能侧度类别之间的顺序,无 法测出类别之间的准确差值,即测量数值不代表绝
对的数量大小,所以其测量结果只能排序,不能进
字符型也是SPSS较常用的数据类型,由一个字
符串组成。如职工号码、姓名、地址等变量都
可以定义为字符型数据。字符型数据的默认显
示宽度为8个字符,不能够进行算术运算,并 区分大小写字母。字符型数据在SPSS命令处理 过程中应用一对双引号括起来,但在输入数据 时不应输入双引号,否则双引号将会作为字符 型数据的一部分。

由于后两种测度尺度在绝大多数统计分析时没有本
质上的区别,在spss中统称为“度量(S)”
通常建立SPSS数据文件时应首先定义数据的结
构部分,然后再输入数据,但实际应用中,边
录入、边分析、边修改数据结构的情况也是常
见的。数据的结构定义完成之后,可以在 Variable View卡片中浏览,也可以通过菜单选 项Utilities/ Variable来实现。
2.3.1

录入
定义好SPSS数据结构后,可将具体的数据输入
到SPSS中,最终形成SPSS数据文件。 SPSS数
据的录入操作在数据编辑窗口中的Data View卡 片中实现。其操作方法与EXCEL基本类似,也 是以电子表格的方式进行录入。录入带有变量 值标签的数据时,可以在下拉按钮中的值标签
列表中选择一个作为输入。

将数据保存为Excel文件格式时,Write variables names to
spreadsheet选项呈可用状态,它的作用是指定是否将
SPSS变量名写入Excel工作表的第一行上。

SPSS能够直接读取其他格式的数据文件,并将其保存为 SPSS格式的数据。 1.直接读取其他格式的数据文件:(1)选择菜单 File+Open+Data;(2)选择数据文件的类型,并输入数 据文件名。 2.使用数据库查询打开 •利用通用数据库ODBC接口读取数据文件 •在9.0及以前版本中非常重要
values);
o
对一个数值型变量,用户缺失值可以在一个 连续的闭区间内并同时再附加一个区间以外 的离散值(Range plus one optional discrete)。

定义显示对齐方式,对齐方式分为右对齐、左 对齐和中间对齐,系统中,数值型变量默认为
右对齐,字符型变量默认为左对齐
统计学依据数据的度量尺度将数据划分为:定
数值型是SPSS最常用的数据类型,通常由阿拉
伯数字和其它特殊符号等组成。其中的标准型
(numeric)是SPSS默认的数据类型,默认的显
示宽度为8位,包括正负符号位、小数点和小数 位在内,小数位默认为2位。如果数据的实际宽 度大于8位,spss将自动按照科学计数法显示, 数据的显示并不影响数据的存储,也不影响数 据的计算。
类数据(Nominal),如民族、宗教信仰、性别、
党派;定序数据(Ordinal),如职称、职务、
对某事物的赞同程度;定距数据(Scale),如 身高、体重。

(1)定类尺度(Nominal Measurement):定类尺 度是对事物的类别或属性的一种测度,按照事物的
某种属性对其进行分类或分组。用:名义(N)表示。


剪切:Edit+Cut(Ctrl+X)
复制:Edit+Copy(Ctrl+C)
粘贴:Edit+Paste(Ctrl+V)
恢复删除或修改前数据 Edit+Undo (或工具栏Undo图标按钮)

2.4.1 SPSS支持的数据格式 1、SPSS文件格式,扩展名为.sav


2、Excel格式文件,扩展名为.xls
如,1.男 2.女

特点:其值仅代表了事物的类别和属性,即能测度 类别差异,不能比较各类之间的大小,所以各类之 间没有顺序和等级。对定类尺度的变量只能计算频 数和频率。

在spss中,能适用定类尺度的数据可以是数值型,
也可以是字符型变量。使用定类变量对事物进行分
类时,必须符合穷尽原则和互斥原则。


数据类型是指每个变量取值的类型。SPSS中有三种 基本数据类型:数值型、字符型和日期型。 数值型 (1)标准型(Numeric) (2)科学记数法型(Scientific Notation) (3)逗号型(Comma) (4)圆点型(Dot) (5)美元符号型(Dollar) (6)用户自定义型(Custom Currency) 字符型(String) 日期型(Date)
【数据视图】表 可以直接输入观
标尺栏
当前数据栏
标题栏
菜单栏
工具栏
数据输入区
数据编辑区
测数据值或存放
数据,表的左端 列边框显示观测 个体的序号,最 上端行边框显示 变量名。
窗口标签
状态栏
显示区滚动条
【变量视图】表用来定义和修改变量的名称、类型及其他属性,如 图所示。
如果输入变量名后回车,将给出变量的默认属性。如果不定义 变量的属性,直接输入数据,系统将默认变量 Var00001,Var00002等。
行运算。

(3)定距尺度(Interval Measurement):定矩尺 度是对事物类别或次序之间间距的测度。如温度。

特点:不仅能将事物区分为不同类型并进行排序,
而且可能准确指出类别之间的差距是多少;定距变
量通常以自然或物理单位为计量尺度,因此测量结 果往往表现为数值,所以计量结果可以进行加减运 算。

(4)定比尺度(Scale Measurement):定比尺度
是能够测算两个测度值之间比值的一种计量尺度,
它的测量结果同定距变量一样表现为数值。如,销 售收入、工资等。

特点:定比变量是测量尺度的最高水平,它除了具 有其他三种测量尺度的全部特点外,还具有可计算 两个测度值之间比值的特点,因此它可以进行加、 减、乘、除运算,而定距变量值可进行加减运算。
些缺失值与正常的数据区分开来,并依据用户指定
的缺失值处理策略对其进行处理或分析。SPSS还有 一类默认的缺失值,称为系统缺失值,数值型变量 用圆点表示,字符型用空格表示。

SPSS中说明缺失数据的基本方法是指定用户缺
失值。用户缺失值可以是:
o
对字符型或数值型变量,用户缺失值可以是
1至3个特定的离散值(Discrete missing
字符位数,列宽度是数据编辑窗口中显示每列
的字符位数。通常这两个宽度是一致的。
变量名标签是对变量名含义的进一步解释说明,
它可以增强变量名的可视性和统计分析结果的
可读性。变量名标签可用中文,总长度可达120
个字符,但在统计分析结果的显示中一般不能 显示如此长的变量名标签信息。

变量值标签是对变量取值含义的解释说明信息, 对于品质型数据尤为重要,比如1代表男性,2
数据必须输入正确才能保证正确的分析结果。
但很难一次输入正确,所以就需要进行修改,
一般包括数据的定位、插入、删除、修改、复
制等。
数据的定位目的是将当前数据单元定位到某个
特定的单元中。有两种定位方式:

1、按个案号码定位:Data+Go to Case 将当前
单元格定位在任何单元格中,选择菜单Data---
(Case),所有个案组成SPSS数据文件的内容。数
据编辑窗口的一列称为一个变量(Variable),每 个变量都有一个名字,称为变量名,它是访问和分 析SPSS每个变量的唯一标志。 SPSS数据文件的结 构就是对每个变量及相关特征的描述。
(2)频数数据的组织方式

SPSS数据的结构是对SPSS每列变量及其相关属性 的描述,主要包括变量名、数据类型、变量宽度、
代表女性,它不但明确了数据的含义,也增强
了最后统计分析结果的可读性,变量值标签可 以用中文。

数据中存在明显错误或明显不合理的数据或漏填数 据项时统计学上称为不完全数据或缺失数据。数据 中如果存在缺失数据,分析时通常不能直接采用, 要进行说明。SPSS中说明缺失数据的方法是指定 用户缺失值。这样,SPSS在分析时,就能够将这
3、dbf格式文件,扩展名为.dbf
4、文本格式文件,扩展名为.dat

将数据保存为SPSS数据文件或其他格式的数据文件的基
本操作是:

File+Save, 对于新的:提示文件名和类型;对于旧的, 覆盖原来的,不再提问;

File+Save As,另存一个数据文件,也有格式(类型)
问题;

Variable按钮允许用户指定保存哪些变量,不保存哪些 变量,变量名前画叉的变量将被保存到磁盘中。
Go to Case ,出现如下对话框,输入欲定位的
个案号码并确认

2、按变量值定位: Edit+Find
将当前单元定位在某变量列的任何一个个案上
选择菜单 Edit---Find ,出现如下对话框
输入定位变量值并确认


于是, SPSS自动对指定的变量进行搜索,并将 当前单元定位于定位变量值相等的第一个个案上。


3.使用文本向导读入文本文件:选择菜单 File+Read Text
Data

SPSS现在可以直接读入许多格式的数据文件,其中就包
括EXCEL各个版本的数据文件。选择菜单 File==>Open==>Data或直接单击快捷工具栏上的Open File按钮,系统就会弹出Open File对话框,单击“文件 类型”列表框,在里面能看到直接打开的数据文件格式, 分别是:
两部分组成,其中的数据结构记录数据变量的名称、类 型、变量宽度、小数位数、变量名标签、变量值标签、
缺失值、显示宽度、对齐方式和度量尺度等必要信息,
数据的内容才是那些待分析的具体数据。

基于上述特点,建立SPSS数据文件时应完成两项任务,ቤተ መጻሕፍቲ ባይዱ即描述数据的结构和录入编辑数据。

(1)原始数据的组织方式 数据编辑窗口中的一行称为一个个案或记录
插入一个变量,即在数据编辑窗口的某个变量前插 入一个新变量:将当前数据单元确定在一个变量上,
选择菜单 Data+Insert Variable

删除一个变量,在欲删除的变量名上单击鼠标左键, 于是待删除的数据全部反向显示;单击鼠标右键, 从弹出菜单中选择cut选项。

数据的移动、复制和删除:与一般的应用程序相同 选择操作对象(变量、个案、若干连续单元等)

插入一个个案,即在数据编辑窗口的某个个案前 插入一个新个案:将当前数据单元确定在一个个案
上,选择菜单 Data+Insert Case(或工具栏插入个案
图标按钮)

删除一个个案,在欲删除的个案号码上单击鼠标左 键,于是待删除的个案数据全部反向显示;单击鼠 标右键,从弹出菜单中选择cut选项。

字作为变量名。 2.变量名的字符个数最好不多于8个;变量名不区分大小写字母。 3. SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如 VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定 含义的保留字同名,如ALL,BY,AND,NOT,OR等。 4.变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。
• • • • • •
SPSS数据文件 SPSS数据的结构和定义方法 SPSS数据的录入和编辑 SPSS数据的保存 读取其他格式的数据文件 SPSS数据文件的合并

2.1.1 SPSS数据文件的特点: SPSS是一个有别于其他文件的特殊格式的文件,SPSS数
据文件是一种有结构的数据文件,它由数据结构和内容
日期型数据用来表示日期或者时间,如生日、
成立日期等变量可以定义为日期型数据。显示 格式:dd-mmm-yyyy;mm/dd/yyyy。
标准 数值型 逗号 数值型 圆点 数值型 科学技术法 数值型 美元 数值型 用户自 定义型 日期型
用户自 定义型

每种类型的变量都有自己的变量宽度、小数位 和显示宽度,其中变量宽度是变量允许的最大
变量名标签、变量值标签、显示宽度、缺失值、对
齐方式、度量尺度等信息。
变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先 给出每列变量的变量名。变量的命名规则如下: 1.首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或
数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉
相关文档
最新文档