薛薇-《SPSS统计分析方法及应用》第二章--数据录入与数据获取PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

由于后两种测度尺度在绝大多数统计分析时没有本 质上的区别,在spss中统称为“度量(S)”
-
25
通常建立SPSS数据文件时应首先定义数据的结 构部分,然后再输入数据,但实际应用中,边 录入、边分析、边修改数据结构的情况也是常 见的。数据的结构定义完成之后,可以在 Variable View卡片中浏览,也可以通过菜单选 项Utilities/ Variable来实现。
-
3
(1)原始数据的组织方式
数据编辑窗口中的一行称为一个个案或记录 (Case),所有个案组成SPSS数据文件的内容。数 据编辑窗口的一列称为一个变量(Variable),每 个变量都有一个名字,称为变量名,它是访问和分 析SPSS每个变量的唯一标志。 SPSS数据文件的结 构就是对每个变量及相关特征的描述。
-
29
数据必须输入正确才能保证正确的分析结果。 但很难一次输入正确,所以就需要进行修改, 一般包括数据的定位、插入、删除、修改、复 制等。
-
30
数据的定位目的是将当前数据单元定位到某个 特定的单元中。有两种定位方式:
1、按个案号码定位:Data+Go to Case 将当前 单元格定位在任何单元格中,选择菜单Data--Go to Case ,出现如下对话框,输入欲定位的 个案号码并确认
-
16
数据中存在明显错误或明显不合理的数据或漏填数 据项时统计学上称为不完全数据或缺失数据。数据 中如果存在缺失数据,分析时通常不能直接采用, 要进行说明。SPSS中说明缺失数据的方法是指定 用户缺失值。这样,SPSS在分析时,就能够将这些 缺失值与正常的数据区分开来,并依据用户指定的 缺失值处理策略对其进行处理或分析。SPSS还有一 类默认的缺失值,称为系统缺失值,数值型变量用 圆点表示,字符型用空格表示。
-
17
SPSS中说明缺失数据的基本方法是指定用户缺 失值。用户缺失值可以是: o 对字符型或数值型变量,用户缺失值可以是 1至3个特定的离散值(Discrete missing values); o 对一个数值型变量,用户缺失值可以在一个 连续的闭区间内并同时再附加一个区间以外
的离散值(Range plus one optional discrete)。
据的计算。
-
10
字符型也是SPSS较常用的数据类型,由一个字 符串组成。如职工号码、姓名、地址等变量都
可以定义为字符型数据。字符型数据的默认显
示宽度为8个字符,不能够进行算术运算,并区 分大小写字母。字符型数据在SPSS命令处理过 程中应用一对双引号括起来,但在输入数据时
不应输入双引号,否则双引号将会作为字符型
-
34
数据的移动、复制和删除:与一般的应用程序相 同
选择操作对象(变量、个案、若干连续单元等) 剪切:Edit+Cut(Ctrl+X) 复制:Edit+Copy(Ctrl+C) 粘贴:Edit+Paste(Ctrl+V) 恢复删除或修改前数据 Edit+Undo (或工具栏Un- do图标按钮) 35
-
1
• SPSS数据文件 • SPSS数据的结构和定义方法 • SPSS数据的录入和编辑 • SPSS数据的保存 • 读取其他格式的数据文件 • SPSS数据文件的合并
-
2
2.1.1 SPSS数据文件的特点: SPSS是一个有别于其他文件的特殊格式的文件,SPSS
数据文件是一种有结构的数据文件,它由数据结构和 内容两部分组成,其中的数据结构记录数据变量的名 称、类型、变量宽度、小数位数、变量名标签、变量 值标签、缺失值、显示宽度、对齐方式和度量尺度等 必要信息,数据的内容才是那些待分析的具体数据。 基于上述特点,建立SPSS数据文件时应完成两项任务, 即描述数据的结构和录入编辑数据。
-
37
SPSS能够直接读取其他格式的数据文件,并将其保存为 SPSS格式的数据。
1.直接读取其他格式的数据文件:(1)选择菜单 File+Open+Data;(2)选择数据文件的类型,并输入数 据文件名。
2.使用数据库查询打开 •利用通用数据库ODBC接口读取数据文件 •在9.0及以前版本中非常重要 3.使用文本向导读入文本文件:选择菜单 File+Read Text
1.首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或 数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉 字作为变量名。
2.变量名的字符个数最好不多于8个;变量名不区分大小写字母。 3. SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如
VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定 含义的保留字同名,如ALL,BY,AND,NOT,OR等。 4.变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。
-
14
变量名标签是对变量名含义的进一步解释说明, 它可以增强变量名的可视性和统计分析结果的 可读性。变量名标签可用中文,总长度可达120 个字符,但在统计分析结果的显示中一般不能 显示如此长的变量名标签信息。
-
15
变量值标签是对变量取值含义的解释说明信息, 对于品质型数据尤为重要,比如1代表男性,2 代表女性,它不但明确了数据的含义,也增强 了最后统计分析结果的可读性,变量值标签可 以用中文。
在spss中,能适用定类尺度的数据可以是数值型,
也可以是字符型变量。使用定类变量对事物进行分
类时,必须符合穷尽原则和互斥原则。
-
22
(2)定序尺度(Ordinal Measurement):定序尺 度是对事物之间的等级或顺序差别的一种测度,可 比较优劣或排序。用:序号(O)表示。
如:1.教授 2.副教授 3.讲师 4.助教。 特点:由于定序变量只能侧度类别之间的顺序,无
-
24
(4)定比尺度(Scale Measurement):定比尺度 是能够测算两个测度值之间比值的一种计量尺度, 它的测量结果同定距变量一样表现为数值。如,销 售收入、工资等。
特点:定比变量是测量尺度的最高水平,它除了具 有其他三种测量尺度的全部特点外,还具有可计算 两个测度值之间比值的特点,因此它可以进行加、 减、乘、除运算,而定距变量值可进行加减运算。
删除一个个案,在欲删除的个案号码上单击鼠标左 键,于是待删除的个案数据全部反向显示;单击鼠 标右键,从弹出菜单中选择cut选项。
-
33
插入一个变量,即在数据编辑窗口的某个变量前插 入一个新变量:将当前数据单元确定在一个变量上, 选择菜单 Data+Insert Variable
删除一个变量,在欲删除的变量名上单击鼠标左键, 于是待删除的数据全部反向显示;单击鼠标右键, 从弹出菜单中选择cut选项。
-
18
-
19
定义显示对齐方式,对齐方式分为右对齐、左 对齐和中间对齐,系统中,数值型变量默认为 右对齐,字符型变量默认为左对齐
-
20
统计学依据数据的度量尺度将数据划分为:定 类数据(Nominal),如民族、宗教信仰、性别、 党派;定序数据(Ordinal),如职称、职务、 对某事物的赞同程度;定距数据(Scale),如 身高、体重。
-
8
数据类型是指每个变量取值的类型。SPSS中有三种 基本数据类型:数值型、字符型和日期型。 数值型 (1)标准型(Numeric) (2)科学记数法型(Scientific Notation) (3)逗号型(Comma) (4)圆点型(Dot) (5)美元符号型(Dollar) (6)用户自定义型(Custom Currency) 字符型(String) 日期型(Date)
-
21
(1)定类尺度(Nominal Measurement):定类尺 度是对事物的类别或属性的一种测度,按照事物的 某种属性对其进行分类或分组。用:名义(N)表示。 如,1.男 2.女
特点:其值仅代表了事物的类别和属性,即能测度 类别差异,不能比较各类之间的大小,所以各类之 间没有顺序和等级。对定类尺度的变量只能计算频 数和频率。
-
26
2.3.1 录入
定义好SPSS数据结构后,可将具体的数据输入 到SPSS中,最终形成SPSS数据文件。 SPSS数 据的录入操作在数据编辑窗口中的Data View卡 片中实现。其操作方法与EXCEL基本类似,也 是以电子表格的方式进行录入。录入带有变量 值标签的数据时,可以在下拉按钮中的值标签 列表中选择一个作为输入。
File+Save As,另存一个数据文件,也有格式(类型) 问题;
Variable按钮允许用户指定保存哪些变量,不保存哪些 变量,变量名前画叉的变量将被保存到磁盘中。
将数据保存为Excel文件格式时,Write variables names to spreadsheet选项呈可用状态,它的作用是指定是否将 SPSS变量名写入Excel工作表的第一行上。
-
4
(2)频数数据的组织方式
-
5
-
6
SPSS数据的结构是对SPSS每列变量及其相关属性 的描述,主要包括变量名、数据类型、变量宽度、 变量名标签、变量值标签、显示宽度、缺失值、对 齐方式、度量尺度等信息。
-
7
变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先 给出每列变量的变量名。变量的命名规则如下:
-
31
2、按变量值定位: Edit+Find 将当前单元定位在某变量列的任何一个个案上 选择菜单 Edit---Find ,出现如下对话框 输入定位变量值并确认
于是, SPSS自动对指定的变量进行搜索,并将 当前单元定位于定位变量值相等的第一个个案上。
-
32
插入一个个案,即在数据编辑窗口的某个个案前 插入一个新个案:将当前数据单元确定在一个个案 上,选择菜单 Data+Insert Case(或工具栏插入个案 图标按钮)
-
27
【数据视图】表 可以直接输入观 测数据值或存放 数据,表的左端 列边框显示观测 个体的序号,最 上端行边框显示 变量名。
标尺栏 当前数据栏
标题栏 菜单栏 工具栏 数据输入区 数据编辑区
窗口标签 -
状态栏
显示区滚动条
28
【变量视图】表用来定义和修改变量的名称、类型及其他属性,如 图所示。
如果输入变量名后回车,将给出变量的默认属性。如果不定义 变量的属性,直接输入数据,系统将默认变量 Var00001,是SPSS最常用的数据类型,通常由阿拉 伯数字和其它特殊符号等组成。其中的标准型
(numeric)是SPSS默认的数据类型,默认的显 示宽度为8位,包括正负符号位、小数点和小数 位在内,小数位默认为2位。如果数据的实际宽 度大于8位,spss将自动按照科学计数法显示, 数据的显示并不影响数据的存储,也不影响数
2.4.1 SPSS支持的数据格式 1、SPSS文件格式,扩展名为.sav 2、Excel格式文件,扩展名为.xls 3、dbf格式文件,扩展名为.dbf 4、文本格式文件,扩展名为.dat
-
36
将数据保存为SPSS数据文件或其他格式的数据文件的基 本操作是:
File+Save, 对于新的:提示文件名和类型;对于旧的, 覆盖原来的,不再提问;
法测出类别之间的准确差值,即测量数值不代表绝 对的数量大小,所以其测量结果只能排序,不能进 行运算。
-
23
(3)定距尺度(Interval Measurement):定矩尺 度是对事物类别或次序之间间距的测度。如温度。
特点:不仅能将事物区分为不同类型并进行排序, 而且可能准确指出类别之间的差距是多少;定距变 量通常以自然或物理单位为计量尺度,因此测量结 果往往表现为数值,所以计量结果可以进行加减运 算。
数据的一部分。
-
11
日期型数据用来表示日期或者时间,如生日、 成立日期等变量可以定义为日期型数据。显示 格式:dd-mmm-yyyy;mm/dd/yyyy。
-
12
标准 数值型
逗号 数值型
圆点 数值型
科学技术法 数值型
美元 数值型
用户自 定义型
-
日期型
用户自 定义型
13
每种类型的变量都有自己的变量宽度、小数位 和显示宽度,其中变量宽度是变量允许的最大 字符位数,列宽度是数据编辑窗口中显示每列 的字符位数。通常这两个宽度是一致的。
相关文档
最新文档