Spss数据管理2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
功能特点
Transform菜单主要集中了一些对变量进行变 换的过程,如对原始数据进行四则运算、对数 据重新编码、求出变量的秩次等,这些功能往 往在统计分析的预处理中起着非常重要的作用
功能特点
计算新变量:最常用和重要的过程。 变量转换:包括Recode、Visual Bander、 Count、Rank、Automatic Recode这五个过 程,它们实际上都可以被看成是compute过程 在某一方面功能的强化和打包。 专用过程:包括建立时间序列、缺失值替代和 设定随机种子三个过程。 Run Pending Transforms:用于执行编程中被 挂起(Pending)的数据整理操作
例3.2
分类变量类别的合并 接上题,将变量grade中的优秀,良好和及格三 , grade , 个等级合并为一个等级 “pass”,不及格转 化为:“nopass”
Transform菜单中的其它过程 菜单中的其它过程
将字符变量转换为数值变量 Automatic Record过程 计算变量秩次 Rank Cases过程 连续变量的可视化分段 Visual Bander过程,12版新增
例3.3
在3.1数据集中,将字符型变量city转化为数值型 变量newcity. 根据性别分组计算数学成绩的秩次.
三、文件级别的数据管理 ---Data菜单(一)
功能特点
对数据进行加工整理,比如根据统计分析的要 求对数据进行分组、合并、加权、筛选等操作 简单命令:在数据界面可直接运用鼠标完成 插入变量、插入记录、到达某条记录 常用简单过程:好学,而且非常重要 排序、拆分文件、选择记录和加权记录
Recode过程 Recode into same variable Recode into different variable 对连续型变量进行分组 分类变量类别的合并
例3.2
连续型变量进行分组: 在例3.1数据集中,生成新变量grade,当英语成 绩小于60时取值”不及格”,大于等于60且小 于70时为”及格”,大于等于70小于80为”较 好”,大于80为”优秀”.
功能特点(续)
专用过程:难学,用途比较特殊 12后新增的一些向导主要是针对复杂数据管理 项目的需求,整合了以前已有的一些功能,不 是工作必需的
Байду номын сангаас
记录排序:Sort Cases过程
将记录按排序变量排序,有利于查找、修改 将某个变量按升序或降序排列,可以非常容易 的发现输入错误,因为他们往往就是最大/最小值 缺失值在排序中会排在最小值的前面,可以通 过排序的方法很快发现哪些记录为缺失
数据文件的重新排列与转置
对数据集进行数据排列格式间的变换:行列 转置,长型、宽型格式互换 长型:在重复测量数据中,每一次测量被 单独记录为一个case 宽型:在重复测量数据中,每一个个体被 记录为一个case,他的所有测量被记录在不 同的变量中 例:将长型数据Anxiety.sav转换为宽型格式 数据
变量赋值: 变量赋值:Compute过程 过程
用于计算新变量,或者给老变量赋值 有大量的SPSS函数可供使用 学会如何写相应的语句可能更方便
例3.1
数据transform.sav是某年级学生的数学,英语 和语文的三门成绩,现在需要统计英语成绩在 60分以上的学生的语文和数学的平均成绩
对变量值进行分组合并
Spss数据管理 数据管理
变量级别的数据管理--Transform菜单 文件级别的数据管理--Data菜单(一) 文件级别的数据管理--Data菜单(二)
数据管理包括的内容
信息的录入和保存 数据的整理/清理 数据的排列格式变换 数据文件的拼接、拆分 数据的预处理
一、
变量级别的数据管理 -- -- Transform菜单
数据字典向导
SPSS提供的支持 从11.5版起,SPSS新增了变量属性定义向导、 数据属性复制向导,专门用于定义数据字典, 或者将预定义的数据字典直接引入当前数据文 件。 SPSS中使用的数据字典实际上就是预先设定 好各种变量格式的空数据文件 适用于大型或者连续性数据分析项目
数据字典向导
变量属性定义向导(define variable properties) 对数据集中已存在的变量进一步定义其属性。 实际上,该向导的绝大多数功能都可以在变量 视图中实现 对于复杂的数据管理项目而言,它的可视化能 力可以大大提高工作效率;其次,对初学者而 言,使用该向导进行变量的设置也是非常好的 选择。
记录拆分:Split File过程
将数据文件分组进行处理 Analyze all cases:不拆分文件 Compare groups:按所选变量拆分文件,各 组分析结果紧挨在一起便于相互比较 Organize output by groups:按所选变量拆分 文件,各组分析结果单独放置
记录筛选:Select Cases
多个数据文件的合并
对话框界面下只能两两合并,多个文件一次就 完成合并需要写程序 纵向合并 从外部数据文件中增加记录到当前数据文件 相对而言比较简单,操作上没有需要特别注意 之处 实例:将文件a.sav和b.sav合并
多个数据文件的合并
横向合并 从外部数据文件增加变量到当前数据文件 默认是按照记录号顺序对应起来合并,由于在 许多情况下是需要按照某个ID变量取值相同的 原则进行对应和合并,此时就存在是否正确对 应的问题,需要加以注意 实例:将文件a.sav和c.sav合并
数据字典向导
复制数据文件属性向导(copy data properties) 将定义好的数据字典直接应用到当前文件中 在操作时还可以进行自定义,只选择某些变 量,或者某些属性进行拷贝,这无疑大大提高 了连续性项目对原有资源的利用程度。 对于一些特殊的文件属性,如多选题变量集、 普通变量集、权重变量设定等,使用该向导进 行复制更是会减少许多重复工作
按要求筛选出数据集的一部分 可以使用组合条件进行筛选 可以直接在数据集中抽样
记录加权: Weight Cases过程
分类资料数据录入格式 枚举格式 频数格式 只有先进行加权设定,统计软件才能正确识别 和处理数据
数据汇总:Aggregate过程
指定分类变量(break variables)和汇总变量 (aggregate variables) Spss自动将记录数据分类,并分别进行计算 汇总变量的描述统计值 将汇总计算结果保存到数据文件中
重复记录查找向导
Identifying Duplicate Cases 是SPSS12.0的新 增功能,通过简单的菜单操作,可以迅速地发 现个别变量值重复,或者所有数值完全重复 的记录。
数据字典向导
什么是数据字典? 在大型的数据分析项目中,为了保证工作质 量,数据处理人员往往会事先定义好一个非常 详细的数据格式,包括变量格式、变量标签、 值标签、缺失值定义等等,这被称为数据字典 对于正式的数据管理项目而言,数据字典是必 备的工具
数据汇总:Aggregate过程(续)
根据数据transform.sav中学生的性别变量对英 语水平进行汇总 注意:这里指的是希望将原数据文件分类汇总 为一个新的汇总数据文件进行分析,如果只是 希望进行汇总描述,则有相应的统计分析功能 可以完成,不需要使用本过程
四、文件级别的数据管理 -- -- Data菜单(二)