第3章 SPSS数据的预处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.5 分类汇总_例
书中例3-6操作步骤:
– 调用命令:Data\Aggregate – 定义分类变量 – 指定分类汇总计算变量(源变量,目标变量, 变量标签和汇总函数) – 指定计算结果保存形式(原文件或新文件)
3.5 分类汇总_多重分类
分类汇总中的分类变量可以有多个 分类变量定义的顺序决定分类汇总的先 后次序 例:不同户口状况和不同婚姻情况下的 居住面积和计划买房情况统计
– Analyze all cases 不拆分 – Compare groups 分析结果输出在同一表格中 – Organize output by groups 分析结果分别输出 在不同的表格中
注意:数据拆分对以后的数据分析一直起作用, 直到取消拆分.
3.7.4
SPSS变量集
根据统计分析的需要,选择部分变量作为一个 变量集,简化分析过程中变量的选择. SPSS中的变量集
3.6 数据分组_分组变量建立例
书中例3-7步骤:
– 调用命令:Transform\Recode\Into Different Variables – 选择需要分组的变量并定义输出变量名及标 签,点击"Change" – 定义原变量值与新变量值的对应关系 – 定义需要分组的个案范围(需要时)
3.6 数据分组_ Visual Bander
3.6 数据分组
根据统计分析的需要,将数据按照某种 标准划分为不同的组别 分组的作用:为后续的统计分析工作做 准备.
– 例:不同专业毕业生的起始工资分析 – 例:不同收入水平的家庭居住情况分析
3.6 数据分组_分组种类
统计分组
品质分组 (定类定序资料)
数量分组 (定距定比资料)
单项分组 (离散数据)
– 执行菜单命令:Data\Select cases – 选择Random sample of cases,并点击Sample按钮, 输入0.7 – 点击Continue按钮返回, – 选择数据选取结果形式Filtered – 点击OK
3.4 计数(Count)
计数:对于所有或满足某条件的部分个 案,计算选定的变量中满足计数条件的 变量数目并存放在一个指定的变量中 例:
3.7 预处理其他功能
3.7.1 3.7.2 3.7.3 3.7.4 数据转置 加权处理 数据拆分 SPSS变量集
本章练习源自文库
1,3,4,5,6,7
3.7.1
数据转置
命令:Data\Transpose 将数据编辑窗口中的数据行列互换
3.7.2
加权处理
加权处理:将已分组汇总的数据还原为原始数 据 命令:Data\Weight Cases 操作步骤:
组距分组 (连续数据)
等 异 距 式 分 组 组 分 式 距
3.6 数据分组_组距分组步骤
1. 资料排序,计算极差
确定组数经验公式:
2. 确定组数
k = 1+
1 + ln(n) 1 + ln(2)
确定组距:
3. 确定组距
组距=
4. 确定组限和组中值
最大值-最小值 组数
3.6 数据分组_分组变量建立
统计分析与SPSS的应用 统计分析与SPSS的应用
第3章 SPSS数据的预处理 SPSS数据的预处理
数据预处理的含义
预处理的作用
– 初步了解数据的性质 – 产生所需要的变量 – 修补原始数据的缺陷
预处理的形式
变量级的数据整理:新变量的生成和变量类型的转 换等; 文件级的数据整理:数据合并,拆分,汇总,选择 和数据结构的转换等.
Visual Bander命令可以使用户在观察现有变 量的分布情况的同时,根据现有的连续变量进 行分组,产生一个分组变量. 使用步骤:
– 调用命令 – 选择需要分组的变量,点击"Continue" – 选择一个需要分组的变量
如果不等距分组,直接在Grid中输入各个区间的上限 如果是等距分组,可以直接输入区间上限,也可以点击 "Make Cutpoints"定义分组区间
SPSS中需要用一个变量来表示个案所属 的分组_分组变量
– 对于定类变量,或者是只有少数几个值的定 序和定距型变量,变量本身已是分组变量; – 对于连续型的定距变量,利用SPSS命令来 建立分组变量. – 可用以建立分组变量的命令:
Recode,Compute,Count,Visual Bander
SPSS SPSS中数据选取的命令 Data\Select cases
3.3 数据选取_选取方式
条件选取
– 选取满足指定条件的个案
随机选取
– 随机选取一定百分比的个案 – 在前面若干个案随机选取指 定数目的个案
选取指定区域数据 通过过滤变量选取
3.3 数据选取_例
例:对住房状况调查文件中的数据,随机选取 70%的住户,以便以后进行分析. 步骤:
– – – – – 调用命令:Transform\Count 定义目标变量名及标签 选择参与计数的变量 定义计数条件 (需要时)定义个案范围条件
3.4 计数_例
书中例3-5 例:人大准备讨论合同法的实施情况.某咨询 机构电话访问了1500人,调查问卷中除受访 者的基本情况外,还提问了20个有关合同法 的问题,这些问题事先设计的答案均为:非常 赞同,比较赞同,无所谓,比较反对和非常反 对五种,分别编码1-5,现统计受访者对这些 问题的态度(计算每个受访者在20个问题中 表示非常赞同和比较赞同的问题数目).
3.1 数据排序(Sort Case)
排序步骤:
– 命令:Data\Sort Cases – 指定排序关键变量(主,次关键变量) – 指定排序方式(升序或降序) ( )
例:住房状况调查
3.2 变量计算(Compute)
变量计算的目的
– 数据转换处理 – 数据分布状态转换
SPSS SPSS算术表达式 SPSS条件表达式 SPSS的函数
SPSS变量计算命令
变量计算命令:Transform\Compute
– 定义新变量名和变量标签 – 输入计算公式 – 指定计算范围
例:学生各科成绩平均分计算 例:职工数据计算例(案例3-3)
3.3 数据选取 (Select Cases)
数据选取的目的
– 提高数据分析效率 – 检验模型分析结果
– 调用命令 – 选择Weight cases by并选入加权变量
注意:变量加权处理后,将以后的分析工作过 程中一直起作用,直到使用同一命令中Do not weight cases的选择取消加权.
3.7.3
数据拆分
根据某个分类变量将数据文件分为隐含的几个 数据集合,为以后的分组统计分析提供方便. 命令:Data\Split File
– 每个学生各门课程中85分以上的科目数; – 受访者对提问的若干问题给予肯定回答的问 题数;
3.4 计数_计数条件
单个值 系统缺失值 系统缺失值或用户缺失值 给定最大值和最小值的区间 小于或等于指定值的区间 大于或等于指定值的区间
3.4 计数_例
每个学生各门课程中85分以上的科目数(数 据文件:学生成绩.sav) 操作步骤:
– 数据文件:合同法调查.sav(部分数据)
3.5
分类汇总(Aggregate)
分类汇总:根据某分类标准计算某个或某些变 量在各类别中的合计数,平均数或标准差等分 布特征并生成相应的变量. 例:
– 不同学历和性别的收入分布 – 不同地区的居住面积分布
分类变量:Break Variables 汇总变量:Aggregate Variables
– 系统变量集
ALLVARIABLES NEWVARIABLES
– 用户变量集
用户变量集的定义(Utilities\Define Sets)
– 选定变量\定义变量集名称\添加变量集
指定使用用户变量集(Utilities\Use Sets)
– 选定变量集
�