spss 课件第二讲 数据录入、获取与管理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


打开其他格式的数据文件

表 2.1 SPSS 可以直接打开的数据类型 数据标识 SPSS Statistics (*.sav) SPSS/PC+(*.sys) Systat(*.syd,*.sys) 便携(*.por) EXCEL(*.xls, *.xlsx, *.xlsm) Lotus(*.w*) SYLK(*.slk) dBase(*.dbf) SAS(*.sas7bdat, (*.sd7, …) Stata(*.Dat) 文本格式(*.txt, *.dat) 数据类型 SPSS 各版本的数据文件 SPSS/PC+版本的数据文件 Systat 数据文件 SPSS 便携格式的数据文件 EXCEL 各版本的数据文件 Lotus 各版本的数据文件 SYLK(符号链接)格式保存的数据文件 dBase 系列数据文件(从 dBaseII~IV) SAS 各版本的数据文件 Stata4-8 版的数据文件 纯文本格式的数据文件
数据字典的定义与应用 1.变量属性定义向导 Data----Define Variable Properties 对数据集中已存在的变量进一步定义其属性。
2.复制数据文件 属性向导 Data----Copy Data Properties 将定义好的数 据字典直接应用 到当前文件中。
查找重复记录
Analyze all cases:不拆分文件 Compare groups:按所选变量拆分文件,各组分 析结果放在一起便于比较 Organize output by groups:按所选变量拆分文件, 各组分析结果单独放置 Groups Based on:用于拆分文件的变量 Sort the file by grouping variables:拆分时将数据 按所用的拆分变量排序 File is already sorted:所用的拆分变量已经排过 序了
功能特点



计算新变量:最常用和重要的过程。 变量转换:包括Recode、Visual Binning、 Count、Rank、Automatic Recode这五个过 程,它们实际上都可以被看成是compute过 程在某一方面功能的强化和打包。 专用过程:包括时间序列模型相关过程、自 动数据准备相关过程和设定随机种子等过程 。 Run Pending Transforms:用于执行编程中 被挂起(Pending)的数据整理操作。
5
设计变量


变量设计的基本原则 不同观察对象的数据不能在同一条记录中出现 每一个测量指标/影响因素只能占据一列的位置,即 同一个指标的测量数值都应当录入到同一个变量中去 最终的数据集应当能够包含原始数据的所有信息 可以出现违反这些原则的例外情况,如重复测量数据 具体的设计思路 非调查问卷数据,需要根据具体的情况设计变量结构 对于调查表数据的录入,问题就要简单得多,往往一 张调查表对应了一个受访者,大多数情况下也就对应 了一条记录 但是存在例外情况,特别是当进行重复测量时
3.单选题的录入
多选题的录入
1.多重二分法 2.多重分类法 3.多选题录入在spss中的实现 Analyze---Multiple Response---Define Sets Analyze---Tables--- Multiple Response Sets
外部数据的获取
电子表格数据如何导入spss中 File----Open----Data
第二讲 数据录入、获取与管理
数据的直接录入
操作界面说明
例: 1.序号: 2.性别: 1男 2女 3.姓名: 4.家庭月收入:a.3000以下 b.3000-4999 c.5000-6999 d.7000-9999 e.10000及以上 5.出生年月日: 6.你在选择购物商场的时候,关注以下哪些因素: a.交通 条件 b.促销活动 c.购物环境 d.服务质量 e.其他 7.请问你购物的打折信息主要来自以下哪些渠道(限选项): a.报纸 b.杂志 c.电视 d.收音机 e.网络 f.朋友介绍 g.手机短信 h.其他 8. 每天上网的小时数: 1、3、5、8:开放题 2、4:单选题 6、7:多选题
Biblioteka Baidu
transform菜单的其他功能 Count过程 随机函数
文件级别的数据管理( Data 菜单)
功能列表

对数据进行加工整理,比如根据统计分析的要求对数据 进行分组、合并、加权、筛选等操作 简单命令:包括插入变量、插入个案、到达某条个案 、复制数据集等,它们的功能不言自明。 常用的简单过程:包括排序、拆分文件、个案筛选和 个案加权,这几个过程并不复杂,但使用的极为频繁 ,是大家必须要掌握的内容。 数据重组向导:用于进行数据转置,或者对重复测量 数据进行长型、宽型记录格式间的转换。 文件合并向导:将几个数据文件合并为一个大的 SPSS数据文件,含横向合并和纵向合并两种情况。
计算新变量 1.常用基本概念 SPSS算术表达式 SPSS函数 SPSS条件表达式 2.compute过程的分析实例 Transform---Compute
对变量值进行分组合并 Transform---Recode into Same Variable:对原 始变量的取值进行修改 Transform---Recode into Different Variable:根 据原始变量的取值生成一个新变量来表示分组 情况 1.对连续变量进行分组 2.分类变量类别的合并
File菜单详解

保存数据文件

首次保存 另存为 注意事项

善于使用^S 存为其他格式时注意兼容性

File菜单中的其他条目
变量级别的数据管理( Transform 菜单)
功能特点


转换(Transform)菜单主要集中了一些对 变量数值进行变换的过程,如对原始数据进 行四则运算、对数据重新编码、求出变量的 秩次等 这些功能往往在统计分析的预处理中起着非 常重要的作用
连续变量的可视化分段 Transform---Visual Binning 提供了精确分组的功能。
将字符变量转换为数值变量 Transform---Automatic Recode
变量的编秩 所谓编秩,其实就是对记录按着某个变量值 的大小来排序。用于非参数检验。 Transform---Rank Cases
多个数据文件的合并 1.数据文件的纵向合并 Data----Merge Files----Add Cases
2.数据文件的横向合并 Data----Merge Files----Add Variables
记录排序 1.单变量排序:在变量名处单击右键。 2.多变量排序: Data----Sort Variables:改变变量的顺序。 Data----Sort Cales:改变记录的顺序。
记录拆分 用于将数据文件分组进行处理。如果希望分组 进行相应的统计分析,或者只分析其中的一部 分数据,则可以通过拆分数据集来加以实现。 Data----Split File


名义测量(Nominal Measurement)

等价于无序多分类
8
定义变量

变量名与变量值标签

可用于对变量及变量值含义进行说明,使结果更 易于阅读 除非问卷中有特殊编码,否则按默认情况处理 均按默认值处理,一般不需要更改

缺失值


其它设置

9
1. 在spss中定义变量
2.开放题的录入
记录加权 Data----Weight Cases
数据汇总 就是按指定的分类变 量对观测值进行分 组,对每组记录的 各变量求指定的描 述统计量,结果可 以存入新数据文件, 也可以替换当前数 据文件。 Data----Aggregate
Break Variable(s):指定分类变量 Summaries of Variable(s):指定汇总变量,共提供 5组函数。 Add aggregated variables to active dataset: Create a new dataset containing only the aggregated variables: Write a new data file containing only the aggregated variables: File is already sorted on break variable(s): Sort file before aggregating:
功能列表





数据字典相关向导:包括定义变量属性,复制变量属 性,以及新建设定属性三个向导界面。对于较复杂的 数据管理项目而言,这些都是非常有用的功能。 重复个案与异常个案查找向导:同样用于复杂数据项 目,用于简化数据管理工作。 数据验证模块:同样真正复杂数据管理项目的需求而 开发,用于数据自动查错。 与统计模型密切相关的过程:正交设计过程是结合分 析模块的一部分,用于生成结合分析所需的设计;定 义日期变量过程用于时间序列数据的分析。 其它过程:包括定义多重响应集、数据汇总过程等
文本数据如何导入spss中
File----Open----Data
File菜单详解

新建数据文件


在SPSS中,新建一个数据文件容易的不得了- -已经到了什么都不用做的地步! 数据文件的工作名称与存储名称 SPSS可以直接读入许多常用格式的数据文件 利用通用数据库ODBC接口读取数据文件 使用文本导入向导读入文本文件
记录筛选
Data---Select Cases
All cases:分析所有记录 If condition satisfied:只分析满足条件的记录,需定义筛选条 件 Random sample of cases:按某种条件抽样 Based on time or case range:基于时间或记录序号选择记录 Use filter variable:使用筛选变量选择记录,取值为非0的记 录被选中 Filter out unselected cases:未被选中的变量被隔离,自动产 生一个filter_$变量 Copy selected cases to new dataset:将选中的记录复制到一 个新的数据集 Delete unselected cases:未被选中的变量被删除,一般不要 使用
6
定义变量

变量类型

数值型

应用最为广泛 由于分析、整理都较困难,建议尽量少用,改为编码 录入

字符型


日期型

实际上是特殊的数值型变量,尽量少用
7
定义变量

测量尺度

标度测量(Scale Measurement)

温度 体重 默认字母顺序表示大小顺序,等价于有序分类

有序测量(Ordinal Measurement)
Data---Identifying Duplicate Cases
数据文件的重新排列与转置 1.数据的长型与宽型格式
2.长型格式转换为宽型格式 Data----Restructure
3.宽型格式转换为长型格式 Data----Restructure
4.数据转置 Data----Transpose
如何建立数据库?

操作步骤

设计变量 定义变量 输入数据 存盘以防断电
4
SPSS数据文件的特点
SPSS数据文件是一种有结构的数据文件
变量名 个案case 年级 性别 问题1…… 问题n 文件结构
1
2
1
2
……….
……… …………
4
2 数据
…………………………………... 3 1 1
变量
相关文档
最新文档