Spss数据管理2 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

功能特点
Transform菜单主要集中了一些对变量进行变换的过程，如对原始数据进行四则运算、对数据重新编码、求出变量的秩次等，这些功能往往在统计分析的预处理中起着非常重要的作用
功能特点
计算新变量：最常用和重要的过程。变量转换：包括Recode、Visual Bander、 Count、Rank、Automatic Recode这五个过程，它们实际上都可以被看成是compute过程在某一方面功能的强化和打包。专用过程：包括建立时间序列、缺失值替代和设定随机种子三个过程。 Run Pending Transforms：用于执行编程中被挂起（Pending）的数据整理操作
例3.2
分类变量类别的合并接上题,将变量grade中的优秀,良好和及格三 , grade , 个等级合并为一个等级 “pass”,不及格转化为:“nopass”
Transform菜单中的其它过程菜单中的其它过程
将字符变量转换为数值变量 Automatic Record过程计算变量秩次 Rank Cases过程连续变量的可视化分段 Visual Bander过程，12版新增
例3.3
在3.1数据集中,将字符型变量city转化为数值型变量newcity. 根据性别分组计算数学成绩的秩次.
三、文件级别的数据管理 ---Data菜单（一）
功能特点
对数据进行加工整理，比如根据统计分析的要求对数据进行分组、合并、加权、筛选等操作简单命令：在数据界面可直接运用鼠标完成插入变量、插入记录、到达某条记录常用简单过程：好学，而且非常重要排序、拆分文件、选择记录和加权记录
Recode过程 Recode into same variable Recode into different variable 对连续型变量进行分组分类变量类别的合并
例3.2
连续型变量进行分组: 在例3.1数据集中,生成新变量grade,当英语成绩小于60时取值”不及格”,大于等于60且小于70时为”及格”,大于等于70小于80为”较好”,大于80为”优秀”.
功能特点（续）
专用过程：难学，用途比较特殊 12后新增的一些向导主要是针对复杂数据管理项目的需求，整合了以前已有的一些功能，不是工作必需的
Байду номын сангаас
记录排序：Sort Cases过程
将记录按排序变量排序，有利于查找、修改将某个变量按升序或降序排列，可以非常容易的发现输入错误，因为他们往往就是最大/最小值缺失值在排序中会排在最小值的前面，可以通过排序的方法很快发现哪些记录为缺失
数据文件的重新排列与转置
对数据集进行数据排列格式间的变换：行列转置，长型、宽型格式互换长型：在重复测量数据中，每一次测量被单独记录为一个case 宽型：在重复测量数据中，每一个个体被记录为一个case，他的所有测量被记录在不同的变量中例：将长型数据Anxiety.sav转换为宽型格式数据
变量赋值：变量赋值：Compute过程过程
用于计算新变量，或者给老变量赋值有大量的SPSS函数可供使用学会如何写相应的语句可能更方便
例3.1
数据transform.sav是某年级学生的数学,英语和语文的三门成绩,现在需要统计英语成绩在 60分以上的学生的语文和数学的平均成绩
对变量值进行分组合并
Spss数据管理数据管理
变量级别的数据管理--Transform菜单文件级别的数据管理--Data菜单（一）文件级别的数据管理--Data菜单（二）
数据管理包括的内容
信息的录入和保存数据的整理／清理数据的排列格式变换数据文件的拼接、拆分数据的预处理
一、
变量级别的数据管理 -- -- Transform菜单
数据字典向导
SPSS提供的支持从11.5版起，SPSS新增了变量属性定义向导、数据属性复制向导，专门用于定义数据字典，或者将预定义的数据字典直接引入当前数据文件。 SPSS中使用的数据字典实际上就是预先设定好各种变量格式的空数据文件适用于大型或者连续性数据分析项目
数据字典向导
变量属性定义向导(define variable properties) 对数据集中已存在的变量进一步定义其属性。实际上，该向导的绝大多数功能都可以在变量视图中实现对于复杂的数据管理项目而言，它的可视化能力可以大大提高工作效率；其次，对初学者而言，使用该向导进行变量的设置也是非常好的选择。
记录拆分：Split File过程
将数据文件分组进行处理 Analyze all cases：不拆分文件 Compare groups：按所选变量拆分文件，各组分析结果紧挨在一起便于相互比较 Organize output by groups：按所选变量拆分文件，各组分析结果单独放置
记录筛选：Select Cases
多个数据文件的合并
对话框界面下只能两两合并，多个文件一次就完成合并需要写程序纵向合并从外部数据文件中增加记录到当前数据文件相对而言比较简单，操作上没有需要特别注意之处实例：将文件a.sav和b.sav合并
多个数据文件的合并
横向合并从外部数据文件增加变量到当前数据文件默认是按照记录号顺序对应起来合并，由于在许多情况下是需要按照某个ID变量取值相同的原则进行对应和合并，此时就存在是否正确对应的问题，需要加以注意实例：将文件a.sav和c.sav合并
数据字典向导
复制数据文件属性向导(copy data properties) 将定义好的数据字典直接应用到当前文件中在操作时还可以进行自定义，只选择某些变量，或者某些属性进行拷贝，这无疑大大提高了连续性项目对原有资源的利用程度。对于一些特殊的文件属性，如多选题变量集、普通变量集、权重变量设定等，使用该向导进行复制更是会减少许多重复工作
按要求筛选出数据集的一部分可以使用组合条件进行筛选可以直接在数据集中抽样
记录加权： Weight Cases过程
分类资料数据录入格式枚举格式频数格式只有先进行加权设定，统计软件才能正确识别和处理数据
数据汇总：Aggregate过程
指定分类变量（break variables）和汇总变量（aggregate variables） Spss自动将记录数据分类，并分别进行计算汇总变量的描述统计值将汇总计算结果保存到数据文件中
重复记录查找向导
Identifying Duplicate Cases 是SPSS12.0的新增功能，通过简单的菜单操作，可以迅速地发现个别变量值重复，或者所有数值完全重复的记录。
数据字典向导
什么是数据字典? 在大型的数据分析项目中，为了保证工作质量，数据处理人员往往会事先定义好一个非常详细的数据格式，包括变量格式、变量标签、值标签、缺失值定义等等，这被称为数据字典对于正式的数据管理项目而言，数据字典是必备的工具
数据汇总：Aggregate过程（续）
根据数据transform.sav中学生的性别变量对英语水平进行汇总注意：这里指的是希望将原数据文件分类汇总为一个新的汇总数据文件进行分析，如果只是希望进行汇总描述，则有相应的统计分析功能可以完成，不需要使用本过程
四、文件级别的数据管理 -- -- Data菜单（二）