SPSS统计分析- 第2章 数据文件建立和管理
SPSS数据文件的建立和管理实验报告

第二题:
1.先打开常用软件里的SPSS 11.5 for Windows.exe,在Variable View中根据题目输入相关数据,如下图所示
2.在Data View中根据题目输入相关数据,结果如下图所示
3.对这个表格进行保存,并且命名为“减肥产品.sav”
3.选中“Match cases on key variables in sorted files”,将“学号”放入“Key Variables”中,结果如下所示
第二题:
因为题中要求将数据文件转换为EXCEL文件,所以通过【File】→【Save As】可实现
输入文件名“减肥产品”,再修改保存类型,选择EXCEL保存类型,即可得到升序排列,结果如下图所示
3.对第一个表格进行保存,并且命名为“学生成绩一.sav”
4.重新打开一个表格,在Variable View中根据题中要求输入数据,如下图所示
5.在Data View中先输入数据,再选中“学号”一列,选择升序排列,结果如下图所示
表1学生语文成绩
学号
1
3
4
5
8
9
10
2
6
7
姓名
张三
李四
王燕
赵宇
白艳
王洁
李丽
成功
孙昌
章建
语文成绩
89
76
87
65
97
74
82
90
67
88
表2学生数学成绩
学号
1
2
3
8
9
7
6
5
4
10
姓名
张三
成功
SPSS

第一章 SPSS概述1. SPSS有哪些主要窗口?它们的作用和特点各是什么?答:①数据编辑窗口主要功能:定义SPSS数据的结构、录入编辑和管理待分析的数据。
特点:SPSS的所有统计分析功能都是针对该窗口中的数据的。
这些数据通常以SPSS数据文件的形式保存在计算机磁盘上,其文件扩展名为.sav。
sav文件格式是SPSS独有的,一般无法通过Word、Excel等其它软件打开。
②结果输出窗口主要功能:显示管理SPSS统计分析结果、报表及图形。
特点:SPSS统计分析的所有输出结果都显示在该窗口中。
输出结果通常以SPSS输出文件的形式保存在计算机磁盘上,其文件扩展名为.spv。
spv文件格式是SPSS独有的,一般无法通过Word、Excel等其它软件打开。
2. SPSS有哪三种主要使用方式?各自的特点是什么?答:三种主要使用方式为:完全窗口菜单方式、程序运行方式、混合运行方式①完全窗口方式的特点:所有的分析操作都通过菜单按钮、输入对话框等方式来完成②程序运行方式的特点:它能够依照程序自动进行多步骤的复杂数据分析,分析过程中无须人工干预③混合运行方式:在使用菜单的同时编辑SPSS程序3. .sav,.spo,.sps分别是哪类文件的扩展名?答:.sav是SPSS数据文件的扩展名;.spo是SPSS输出文件的扩展名;.sps是SPSS程序文件的扩展名4.在SPSS的输出窗口中应如何操作才能将不同的分析结果保存到不同的文件中?答:以不同命名方式保存,其文件扩展名均为.spo5.SPSS的数据加工和管理功能主要集中在哪些菜单中?统计绘图和分析功能主要集中在哪些菜单中?答:数据加工和管理功能主要集中在Data和Transform;统计绘图和分析功能主要集中在Analyze和Graphs。
6.利用SPSS进行数据分析的一般基本步骤是什么?答:(1)SPSS数据的准备(2)SPSS数据加工整理(3)SPSS数据的分析(4)SPSS分析结果的阅读和解释第二章SPSS数据文件的建立和管理1. SPSS中有哪两种基本数据组成方式?各自的特点和应用场合是什么?答:原始数据的组织方式和计数数据的组织方式如果待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标,这些数据就可按原始数据的方式组织;如果待分析的数据不是原始的调查问卷数据,而是经过分组汇总后的计数数据,这些数据按计数数据的方式组织。
SPSS之数据文件的建立和编辑

在上图所示的窗口中每一行表示一个变量的 定义信息,包括Name、Type、Width、 定义信息,包括 、 、 、 Decimal、Label、Values、Missing、 、 、 、 、 Columns、Align、Measure等。 、 、 等
个学生的高数、 例1、调查 个学生的高数、线代和概率论 、调查10个学生的高数 的成绩,并将数据输入到SPSS文件中。 文件中。 的成绩,并将数据输入到 文件中 定义变量; ( ⅰ )定义变量; 输入数据。 ( 接数值型的常数、变 量和函数构成算术表达式,其运算结果 为数值型常数。 2.运算优先顺序:括号、函数、乘幂、乘 除、加减;同一优先级按照从左到右的 顺序
关系表达式
1. 是比较两个量之间的关系或判断关系是否 成立。如果成立表达式的值为“真”(1), 否则为“假”(0)。 2.比较无论是数值或字符都可以。 3.符号与运算符等价。如:A>5等价于AGT5
• 输入数据前首先要定义变量。定义变量即要定 输入数据前首先要定义变量。 义变量名、变量类型、变量长度(小数位数)、 义变量名、变量类型、变量长度(小数位数)、 变量标签(或值标签)和变量的格式。 变量标签(或值标签)和变量的格式。 • 单击数据编辑窗口左下方的“Variable View” 单击数据编辑窗口左下方的“ 标签或双击列的题头( ),进入如下图所 标签或双击列的题头(Var),进入如下图所 ), 示的变量定义视图窗口, 示的变量定义视图窗口,在此窗口中即可定义 变量。 变量。
SPSS中的表达式 SPSS中的表达式
SPSS中基本运算有三种: 1、算术表达式 2、关系表达式 3、逻辑表达式
三种运算符号
数学运算符 符号 + * / ** () 意义 加 减 乘 除 幂 括号 符号 < > <= >= = ~= 关系运算符 运算符 LT GT LE GE EQ NT 意义 小于 大于 小于等于 大于等于 等于 不等于 符号 & | ~ 逻辑运算符 运算符 AND OR NOT 意义 逻辑与 逻辑或 逻辑非
SPSS1-2章

(5)数据存储
SPSS可以将数据保存为SPSS (*.SAV)、Excel (*.XLS)、 dBASE (*.dbf)、ASCII (*.dat,*txt)等数据文件形式。 保存文件,从菜单选择“File-Save‖(或Save As)命令。在 弹出的保存文件对话框里,指定保存路径,输入文件名,确定 数据类型,最后单击“保存”按钮。
6.数据的裁切、复制和粘贴
三、数据文件的操作
1. 观测值排序(Sort Cases)
从菜单中选择“Data - Sort Cases‖命令,弹出观 测值排序对话框。 Sort by: 选择排序变量,对所选变量的观测值排 序。如果选择了两个以上的变量,其排序结果将 按变量在本栏的选入顺序依次排序。 Sort Order 排 序 方 式
SPSS Viewer 结果输出窗
3.运用SPSS进行统计分析的基本步骤
数据文件夹的建立,编辑,整理 选择统计分析方法 选择分析变量,设置参数 查看解释分析结果
案例分析
某小学60位学生随机分配实验组和控制组,每组30 人。实验组接受自我教导训练,经3个月后,测试 实验组和控制组的成绩如表1-1
⑥ 数据列的显示宽度(Columns)
显示数据的列宽,默认8个字符。
⑦ 对齐方式(Align)
有左中右3种数据显示方式。
⑧ 度量类型(Measure)
按度量精度将变量分为定量变量(Scale)、 等级变量 (Ordinal)和定性变量(Nominal)。该选项仅用于统计绘图 时坐标轴变量的区分以及决策树模块的变量定义。 定量变量,如人口数、死亡率等;等级变量,如调查效果 的好、不好等;定性变量,如民族:汉、满、蒙古族。
Data editor SPSS 术语 窗口 Data file 二维表 一行 行号 一列 列名 case Case number Variable
学会使用SPSS进行数据处理和分析

学会使用SPSS进行数据处理和分析第一章:介绍SPSS及其基本功能SPSS(Statistical Package for the Social Sciences)是一款专业的统计软件,可广泛应用于社会科学、医学、教育、市场营销等领域的数据处理和分析。
SPSS具有强大的数据处理和展示功能,能够帮助用户进行数据清洗、统计描述、统计推断等分析工作。
本章将详细介绍SPSS的基本功能,包括数据导入导出、数据清洗和变量定义等。
第二章:数据导入与导出在使用SPSS进行数据处理和分析前,首先需要将原始数据导入到SPSS中。
SPSS支持多种数据格式的导入,如Excel、CSV、Txt等。
本章将介绍如何进行数据导入,并讲解一些常见的数据导入问题及解决方法。
此外,还将介绍如何将SPSS的分析结果导出到其他格式,如Excel、Word等,以便后续的数据展示和报告撰写。
第三章:数据清洗与变量定义数据清洗是数据处理的基础工作,对于原始数据中存在的异常值、缺失值、重复值等进行处理,以保证数据的准确性和可靠性。
本章将介绍如何使用SPSS进行数据清洗,包括识别与处理异常值、填补缺失值、删除重复值等。
同时,还将讲解如何进行变量的定义和测量水平的设置,以便后续的数据分析。
第四章:数据描述性统计数据描述性统计是对数据整体特征进行描述和总结的方法,可帮助研究者更好地理解数据。
本章将介绍如何使用SPSS进行数据描述性统计,包括计算变量的均值、标准差、频数分布等。
此外,还将讲解如何绘制直方图、散点图、箱线图等图表,以便更直观地展示数据的分布和关系。
第五章:统计推断与假设检验统计推断是在样本数据的基础上对总体参数进行推断的方法,常用于科学研究中的结论判定。
假设检验则用于判断样本数据与总体的差异是否显著。
本章将介绍如何使用SPSS进行统计推断和假设检验,包括T检验、方差分析、相关分析等。
同时,还将讲解如何解读统计结果并进行结果报告。
第六章:数据分析与建模数据分析是根据统计学原理对数据进行深度挖掘和解释的过程,而建模则是基于数据分析结果进行预测和决策的方法。
spss实验一、实验步骤

实验一:SPSS数据文件的建立和管理操作以及数据预处理操作1.有两份关于职工基本情况的SPSS数据文件“职工数据.sav”和“追加职工.sav”,两份数据文件中的数据项不尽相同,且同一数据项的变量名也不完全一致。
请将这两份文件合并到一起。
[实验步骤](1)在数据编辑窗口中打开一个需合并的SPSS数据文件:“职工数据.sav”。
(2)选择菜单:【数据】→【合并文件】→【添加个案】(3)这时将出现以下对话框,点击“浏览”。
(4)打开需进行纵向合并处理的SPSS数据文件“追加职工.sav”。
按“继续”后,显示纵向合并数据文件窗口。
(如下图)(5)对话框右边【新的活动数据集中的变量】框中显示的变量名是两个数据文件中的同名变量,对话框左边【非成对变量】框中显示的变量名是两个文件中的不同名变量。
其中,变量名后面的【*】表示该变量是当前数据编辑窗口中(“职工数据.sav”)的变量,【+】表示该变量是(2)“追加职工.sav”中指定的磁盘文件中的变量。
SPSS默认这些变量的含义不同,且不放入合并后的新文件中。
如果不接受这种默认,可选择其中的两个变量名并按【对】按钮指定配对,表示虽然它们的名称不同但数据含义是相同的,可进入合并后的数据文件中。
本题中,显然职称zc(*)和职称zc1(+)两个变量名需要按【对】按钮指定配对。
方法是:按住“Ctrl键”,同时鼠标点zc(*)和zc1(+),然后按【对】按钮,这时【新的活动数据集中的变量】框中出现“zc&zc1”变量名。
(6)把【非成对变量】框中显示的其他变量名全部标记,按右向箭头。
(7)按【确定】,完成操作。
2.根据“住房状况调查.sav”数据,通过数据排序功能分析本市户口和外地户口家庭的住房面积情况。
(按升序排列)[实验步骤](1)在数据编辑窗口中打开SPSS数据文件:“住房状况调查.sav”。
(2)选择菜单:【数据】→【排序个案】(3)指定主排序变量“户口状况”到【排序依据】框中,并选择【排序顺序】框中的选项指出该变量按升序还是降序排序。
SPSS复习资料

第一章SPSS统计分析系统软件简介1)SPSS的几种基本运行方式:①菜单操作方式:这种方法图形用户界面友好、操作简单、形象直观,能够一步步引导用户完成对数据的描述和模型的建立。
②程序运用方式:是在Syntax编辑窗口输入程序。
也可以用任何文本编辑器中输入,也可以在相应菜单操作的对话框中,用“Paste”按钮可以把相应的操作转化为Syntax语言。
选择所有的语法命令行,单击“Run”运行程序。
或者在SPSS的语法编辑器窗口输入语法。
③ Include运行方式:在编写Syntax命令中,如果要调用其他语法文件时,除了复制粘贴现有的资源外,还可以用Include的命令。
④ Production Facility方式:Production Facility生产作业方式提供了以自动化方式运行SPSS Statistics 的功能。
2)SPSS界面提供的五个窗口:①数据编辑窗口:这个窗口主要用来处理数据和定义数据字典,它分为两个视图。
一个是用来显示数据的数据视图(数据视图用来显示数据集中的记录或个案),另外一个是变量视图(变量视图的功能是定义数据集的数据字典)。
②结果管理窗口:也称为结果视图或者结果浏览器,该窗口用于存放SPSS软件的分析结果。
分为左边目录区,是SPSS分析结果的目录;右边是内容区,显示与目录相应的内容。
③结果编辑窗口:是编辑分析结果的窗口。
选中要编辑的内容,双击或者点击右键选择“编辑内容”,选中的图形就会出现在“图表编辑器”中,可以开始编辑。
④语法编辑窗口:语法编程方式,能够完成窗口操作所能完成的所有任务,还可以完成许多窗口操作所不能完成的其他工作。
在这个窗口中,还可以调用开源软件R中的任何程序。
⑤脚本窗口:是用Sax Basic 语言编写的程序。
脚本可以使SPSS内部操作自动化,可以自定义结果格式,可以连接VB和VBA应用程序。
第二章数据文件的建立和管理1)数据管理的特点:数据编辑器的每一行数据称为一个个案,每一列数据代表个体属性,即变量。
第2章 数据文件的建立和管理PPT教学课件

2.1 数据文件的特点和结构 2.2 定义数据文件的结构 2.3 数据的录入与保存 2.4 数据的编辑 2.5 读取其他格式的数据文件
1
SPSS数据文件的特点
SPSS数据文件的特殊性:其扩展名是.sav; 它是一种有结构的数据文件。
SPSS数据文件由数据的结构和内容两部分组 成。其中数据的结构记录数据类型、取值说 明、数据缺失情况等必要信息,数据的内容 才是待分析的具体数据。
数据中错误或者漏填的数据。如果不特意 说明,SPSS会把缺失数据参与分析,因此 要对缺失数据进行说明。 对缺失数据进行说明的三种方法(P14):
对于漏填的数值型数据,系统默认的缺失 值用一个圆点来表示,字符型变量中的空格 或控不是系统缺失值。
11
度量尺度
定距型数据(Scale) 定序型数据(Ordinal) 定类型数据(Nominal)
14
SPSS数据的录入与保存
录入:逐行录入按Tab键,逐列输入按Enter键 (例:职工基本情况数据P49) 录入带有变量值标签的数据: View→Value Labels (单元格将显示对应的变量值标签) 数据的保存: data 保存成其他格式的文件:Save as
15
第2章 SPSS数据文件的 建立和管理
建立SPSS 数据文件应 完成两项任 务
描述SPSS数据的结 构 录入编辑SPSS数据
SPSS数据文件的结构
个案、变量、单元格、当前单元格
SPSS数据文件以二维表的形式组织数 据。一行为一个样品(CASE)或个案, 一列为一个变量(VARIABLE),行与列 交叉之处为一个单元格,可在其中输入变 量值。
9
变量值标签(Value Lable)
SPSS统计分析方法及应用01-01-01

咨询公司发现这一秘密的手段就是我们课程的关联分析 和频数分析。没有数据挖掘,这一信息将永不见天日!
电信:呼叫指纹识别 银行:逾期贷款、呆滞贷款 证券公司:上市公司是否被特别处理(ST)。 以上例子使用的工具,都是利用统计分析理论和方法研 制的软件系统。行业名称:数据分析、经济分析、数据挖掘
1994-1998年间,SPSS公司兼并了多家从事统计分析软 件研发的公司,对这一市场进行了整合,软件名称也改为: 统计产品与服务解决方案(Statistical Product and Service Solutions),最新版本SPSS17。
3) SPSS的应用领域
现在的SPSS统计分析软件在全球拥有26万家以上的用户, 广泛应用于通信、医疗、银行、证券、保险、军事、商业、 教育、科研和政府等社会的各个领域,是当今世界最流流行 的软件之一。见识
4) 变量值标签
在调查问卷中的选项中,答案经常是英文字母,例如学
历:A,初中以下;B,高中;C,大专…。在数据集中存储
02:20:10
河北工大廊坊分校经济系周玉江
25
是这些英文字母,让人很难读懂和理解。 SPSS可以定义变量值标签,对变量的值进行说明和解释。
在数据集中既可以浏览变量的值,也可以浏览变量值标签; 输出结果也是如此,十分方便。
钮都处于休眠状态。
02:20:10
河北工大廊坊分校经济系周玉江
26
变量的值
变量值标签
02:20:10
河北工大廊坊分校经济系周玉江
27
(2) 删除或修改变量值标签的对应关系
单击列表框中要删除的标签,这时标签的值重新显示在 标签Lable文本框中,在值Value文本框输入原来对应的值, 【Remove】按钮被激活,可以将对应关系移去。
SPSS数据分析实例详解

第一章 SPSS概览--数据分析实例详解1.1 数据的输入和保存1.1.1 SPSS的界面1.1.2 定义变量1.1.3 输入数据1.1.4 保存数据1.2 数据的预分析1.2.1 数据的简单描述1.2.2 绘制直方图1.3 按题目要求进行统计分析1.4 保存和导出分析结果1.4.1 保存文件1.4.2 导出分析结果欢迎加入SPSS使用者的行列,首先祝贺你选择了权威统计软件中界面最为友好,使用最为方便的SPSS来完成自己的工作。
由于该软件极为易学易用(当然还至少要有不太高的英语水平),我们准备在课程安排上做一个新的尝试,即不急于介绍它的界面,而是先从一个数据分析实例入手:当你将这个例题做完,SPSS的基本使用方法也就已经被你掌握了。
从下一章开始,我们再详细介绍SPSS各个模块的精确用法。
我们教学时是以SPSS 10.0版为蓝本讲述的--什么?你还在用7.0版!那好,由于10.0版在数据管理的界面操作上和以前版本有较大区别,本章我们将特别照顾一下老版本,在数据管理界面操作上将按9.0及以前版本的情况讲述,但具体的统计分析功能则按10.0版本讲述。
没关系,基本操作是完全一样的。
好,说了这么多废话,等急了吧,就让我们开始吧!希望了解SPSS 10.0版具体情况的朋友请参见本网站的SPSS 10.0版抢鲜报道。
例1.1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下, 问该地急性克山病患者与健康人的血磷值是否不同(卫统第三版例4.8)?患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87让我们把要做的事情理理顺:首先要做的肯定是打开计算机(废话),然后进入瘟98或瘟2000(还是废话,以下省去废话2万字),在进入SPSS后,具体工作流程如下:1.将数据输入SPSS,并存盘以防断电。
SPSS统计分析方法及应用(第三版)

– 指定计数区间。
分类汇总
• 分类汇总是按照某分类分别进行计算
数据分组
• 数据分组是对定距型数据进行整理和粗略 把握数据分布的重要工具,因而在实际数据 分
• 析中经常使用。数据分组就是根据统计研 究的需要,将数据按照某种标准重新划分为 不的组别。在数据分组的基础上进行的频 数分析,更能够概括和体现数据的分布特征 。另外,分组还能够实现数据的离散化处理 等
– spv文件格式是SPSS独有的,一般无法通过其他 软件如Word、Excel等打开
SPSS软件的三种基本使用方式
• 窗口菜单方式
– 窗口菜单方式是指在使用SPSS过程中所有的 分析操作都可通过菜单、按钮、输入对话框等 方式来完成
SPSS软件的三种基本使用方式
• 程序运行方式
– 程序运行方式是指:在使用SPSS过程中,统计分 析人员首先根据自己的分析需要,将数据分析的 步骤手工编写成SPSS命令程序,然后将编写好 的程序一次性提交给计算机执行。
计算基本描述统计量
• 计算基本描述统计量的基本操作 • 计算基本描述统计量的应用举例
交叉分组下的频数分析
• 交叉分组下的频数分析又称列联表分析,它 包括两大基本任务:第一,根据收集到的样本
SPSS数据的基本组织方式
• 频数数据的组织方式
– 如果待分析的数据不是原始的调查问卷数据,而 是经过分组汇总后的汇总数据,那么这些数据就 应以频数数据的组织方式组织
SPSS数据的结构和定义方法
• SPSS数据的结构是对SPSS每列变量及其 相关属性的描述。包括:变量名、类型、宽 度、列宽度、变量名标签、变量值标签、 缺失值、计量标准等信息。其中有些内容 是必须定义的,有些是可以省略的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.读取“*.txt”数据文件
现需将“人居收入.txt”文件中的数据读入SPSS,如图所示: (1) 打开“数据编辑器”对话框,选择“文件”|“打开文本数据”命令,打 开“打开数据”对话框。选择文本文件,单击“打开”按钮,打开“文本导入向 导”对话框,如图所示:
(2) 在“您的文本文件与 预定义的格式匹配吗? ” 选项组中选择 “ 是 ” 单选 按钮,可单击“浏览” 按 钮,选择已预定义好的 格式;单击 “ 否 ” 则需要 建立一个新格式。
2.1.1 打开定义变量视图
• 按前一章所述打开SPSS主界面,视图切换标签处单击“变 量视图”,即打开“变量视图”窗口,如图所示。在该视 图可对变量的以下属性进行定义:名称、类型、宽度、小 数、标签、值、缺失、列、对齐、度量标准和角色。
2.1.2 定义变量名称
• 在“变量视图”变量栏的“名称”栏中定义变量名称,用 户可根据数据需要或个人习惯进行定义,如果不对变量进 行定义,系统将自动默认变量名为var00001、var00002、 var00003等。一般根据变量的实质意义来命名,例如:年 龄、性别、年级等变量,可用Age,Gender,Grade命名,也 可用中文意义命名,但当出现变量数量较大时,一般使用 流水编号,即防混淆又方便。虽然变量可根据用户的需求 自行编辑,但仍有其需共同遵循的原则: • 若用英文命名,变量名首字必须为英文字母,其后方可接 数字、英文字母、@等。若用中文命名,则可直接使用。 • 不可使用空格和特殊字符(如键盘上的!、#、$、%、&、 ^、*、(、)、?等字符)。
(9) 之后进入下一步,如图所示。在“变量之间有哪些分隔符?”中,可根据 文本数据中变量间的分隔符,可选择“制表符”、 “空格”、“逗号 ”、“分号” 和“其他”复选框。在“文本限定符是什么?”中,可选择“无”、“单引号”、“ 双引号”和“其他”单选按钮,一般默认为“无”,选择完毕后单击“下一步” 。
2.2.3 数据文件的存储
• 选择“文件”|“保存”|“另存为”|“保存所有数据” 命令,即打开“将数据保存为”对话框,如图所示。
• 若要对部分变量进行保存,单击“变量”按钮,打开“数据存 储为:变量”对话框,如图所示,在复选框中勾选需要选择的 变量。或单击“全部保存”按钮,选择全部变量;单击“仅可 视”按钮,选择正在使用中的变量集;单击“全部丢弃”按钮, 撤销对所有变量的选择。单击“继续”按钮,再次打开“将 数据保存为”对话框。单击“保存”按钮,即可完成数据的存 储。
3.读取“*.xls”数据文件
(1) 打开“打开数据”对话框,单击“文件类型”下拉列表框中 的下三角按钮,选择“Excel( *.xls,*.xlsx,*.xlsm )”命令。 (2) 选择需要打开的数据文件,单击“打开”按钮,打开“打开 Excel数据源”对话框。如图所示: (3) 选择需打开的数据文件,单击“确定”按钮,即读取Excel 数据文件。
(3) 单击“下一步”按钮,进入下一步,如图所示。在“变量是如何排列的?” 选项组中,根据原有文本文件的格式,选择“分隔”表示使用分隔格式的数据 结构;选择“固定宽度”表示使用固定格式的数据结构。
(4) 在 “变量名称是 否包含在文件的顶部 ? ” 选项组中,选择 “是”表示文本数据 的第一行,将被作为 变量名读入 “ 数据视 图 ” 窗口的变量栏中 ;选择“否”表示文 本数据的第一行,将 作为个案被读入 “ 数 据视图 ” 窗口的个案 1中。
2.3 编辑数据
• 将数据录入或读入“数据视图”窗口后,需对数据进行初 步加工,为后续统计分析做准备。这一部分将重点讨论, 在加工过程中会使用到的:数据的剪切、复制和粘贴,数 据的查找、替换,个案的增加和删除,数据的排序,数据 的行列互换,选择个案,数据的分类汇总,缺失值的替代, 数据的加权处理。
第2章 数据文件建立和管理
LOGO
• 本章将进一步具体讲解数据的录入、读取和存储,数据的 编辑,数据文件的预处理,以及数据文件的拆分与合并。
2.1 定义变量
• 在介绍对数据的具体操作前,首先需认识数据编辑视图。 数据编辑视图由“数据视图”和“变量视图”两个视图组 成,在视图左下角的视图标签处对以上两个视图进行切换; “数据视图”用于显示、编辑数据;“变量视图”用于显 示、编辑变量。
2.1.5 定义变量标签和数值标签
1.变量标签 • 在处理大量数据的过程中,为方便使用,变量名称越简单 越好。而同时在简化过程中很容易混淆这些变量名称,因 此给变量名称贴上“标签”,对它进行标识和区分就显得 尤为重要了。 2.值 • 由于变量有时可能有几个水平,每个水平代表不同的意义, 而对水平所赋予的“值”本身并不能代表这些意义,这样 就需对“值”进行标识。 • 例如:性别有两个水平(男和女),为便于区分,用 0 代 表男, 1代表女(数值仅是一种符号,无实际意义,可自 行选择数值),如此既能表示变量的不同水平,又便于后 续统计分析。具体操作如下:
• 一些文本框支持预定义的角色,从而对预先选择的变量进 行分析,角色的分配不仅影响文本框,还可影响语法命令。 SPSS 18.0 软件在“变量视图”窗口中增添了对“角色” 的定义,系统提供了6种选择,如图所示。
2.2 数据录入、读取和存储
• 以上介绍了如何在“变量视图”窗口中定义变量的各种属 性,这一部分将把目光转向“数据视图”窗口。定义好数 据的规则后,接下来将具体介绍数据的录入、读取和存储。
• 将光标移至“值”栏的单元格中,单击里面的按钮,即弹出“ 值标签”对话框,如下图所示: • 在 “值 ” 文本框中输入数值,在 “标签 ” 文本框输入标识(字 符串)。单击 “ 确定 ” 按钮,即生成标识语言。如下图所示 。待定义完所有数值标识后,单击“确定”按钮。
2.1.6 定义变量缺失值
• 在实际的调查研究工作中,经常出现被试不答、漏答和错 答的情况,而这些不答、漏答和错答的题目在总体数据中, 就构成了缺失值。 SPSS 18.0 软件提供定义变量缺失值的 功能,如图所示,对不合理的缺失值进行定义,使缺失的 变量值不参与统计分析。
2.1.8 定义变量度量类型
• 在“变量视图”窗口中的“度量标准”栏中定义变量度量 类型, SPSS 18.0 软件将量表分为:度量、序号和名义, 如图所示,分别对应等距 / 等比变量、序列变量和称名变 量使用,系统默认值为“度量”。用户可根据分析变量或 量表的性质进行选择。
2.1.9 定义变量角色
• • • • • *.sav: SPSS for Windows数据文件 *.sys: SPSS/PC+数据文件 *.syd: Systat软件包的系统文件 *.por: SPSS for Windows版本的ASCII码数据文件 *.xls,*.xlsx,*.xlsm: Excel数据文件
• • • •
*.w: Lotus公司的1-2-3格式数据文件 *.slk: Multiplan公司的symbolic格式的数据文件 *.dbf: 数据库dBase,Foxbase格式数据文件 *.sas7dbat,*.sd7,*.sd2,*.ssd01,*.ssd07,*.xpt: SAS软件包 的长文件名的数据文件 • *.txt,*.dat: 纯文本数据文件 • *.dta: 数据管理统计绘图软件(Stata)数据文件 • *.*: 所有文件
2.1.7 定义数据列宽和对齐方式
• 在“变量数据”窗口的“列”栏中,定义数据显示的列宽 (默认值为8 个字符,最大值为256个字符),如图1所示。 在“对齐”列中,定义数据对齐的方式:“左”、“右”、 “居中”(默认“字符串型”数据为“左”,“数值型数 据”和“日期型数据”为“右”),如图2所示。 图1 图2
(10) 之后进入下一步,如图所示。在“数据预览”中选择变量。在“变量名称 ”文本框中输入欲使用的名称,也可使用系统默认的名称。在“数据格式”下拉 列表框中选择数据格式,选完后单击“下一步”。
(11) 之后进入下一步,如图所示。可根据选项组的内容,对该操作的文件格 式和语法进行保存。若勾选“在本地缓存数据 ”,可在磁盘中临时保存数据文 件的完整副本。缓存数据文件可以提高 SPSS 的性能。单击 “完成 ”按钮,即 成功读取文本型数据文件。
其中有3个单选按钮:
没有缺失值:系统默认值,在 “ 数据视图 ” 窗口中用 “.”表示。 离散缺失值:最多可在 3个文本框中分别输入 3个不 同的数值为缺失值。 范围加上一个可选离散缺失值:可在 “低 ”、 “ 高 ”文 本框中输入缺失值的范围,并在 “ 离散值 ” 文本框中 输入一个单独的缺失值。
2.1.3 定义变量类型
• 如图1 所示,单击图中圆圈处按钮,打开“变量类型”对 话框,如图2所示。 图1 图2
• SPSS 18.0软件提供了8种变量类型,如表所示。
2.1.4 定义变量宽度和数据小数位数
• 在“变量视图”的“宽度”栏中(如图所示)定义数据宽 度(默认值为 8个字符,最大值为40个字符),在“小数” 栏中定义小数位数(默认值为 2 个字符,最大值为 16 个字 符)。
• 不能使用相同的字符,英文字符不论大小写,都代表相同 的名称。 • 一般字符宽不超过 8 个字符( 4个中文),在 SPSS 18.0 中 可达到40个字符。 • 变量名不可使用系统保留字,如:All、And、By、Eq、Ge、 Gt、Le、Lt、Ne、Not、Or、To、With等变量名称。 • 变量名结尾不可使用“.”、“—”和“_”结尾。
2.2.2 数据文件的读取
1.读取“*.sav”数据文件 方法一:
启动SPSS 18.0软件时,会自动跳出PASW Statistic 18对话框, 如图所示。 若要选择已存在的数据,单击“打开现有的数据源”单选按钮, 在列表框中进行选择。若在列表框中没有想要找的文件,则双击“更 多文件”选项,弹出“打开数据”对话框,如图所示。
方法二:
进入“数据编辑器”窗口后,若想读取“*.sav”数据文 件,可执行下操作: 选择“文件”|“打开”|“数据”命令,即打开“打开 数据”对话框,如图所示。根据数据的文件格式在列表框中 进行选择,单击“打开”按钮,即打开所需数据。