3.SPSS数据整理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2. 选定计数对象(变量)及条件;
(自定义数值,系统缺失和用户缺失,自定义数值范围 )
3. 定义保存计数结果的变量;
(变量名及标签)
4. 输出结果;
P394 (demo.sav)变量计数示例
3.3 变量值重新编码及自动编码
变量值重新编码:根据统计分析的要求,将 某变量观测数值的测量尺度由连续变量变为 称名变量或顺序变量。
(transform – replace missing values)
2. 要替代缺失值的变量以及替代方法;
(为保留原始数据,要生成新变量) (替代表达式:变量名-n=替代方法(变量名w),其中w 为跨度)
3. 输出结果;
替代方法: 1. 用整个序列的有效值的均值作为估计值; 2. 用缺失值邻近的w个有效值的均值作为估计值; 3. 用缺失值邻近的w个有效值的中位数作为估计
值; 4. 线性插值法,若第一个和最后一个观测值缺失,
则无法使用此方法进行估计; 5. 以序列号为自变量,变量值为因变量求解线性
方程,然后根据回归方程计算缺失值处的趋势预测 值来作为估计值;
P409 缺失值替代示例
3.6 观测量排序
基本步骤: 1. 选择观测量排序对话框;
(data – sort case)
拆分:在SPSS中,数据文件的拆分不是将一 个数据文件,而是根据一个或多个变量对数 据进行分组,每一组作为统计分析中的一个 样本。
观测量添加基本步骤:
1. 选择观测量添加对话框;
(data – merge files – add cases)
2. 选择要添加的数据来源;
(已打开数据文件或外部数据文件)
结果: 1. 重新编码结果替换原来的变量值; 2. 生成新的变量来保存编码结果;
基本步骤:
1. 打开重新编码对话框;
(替换原变量值:transform – recode into same variables) (生成新的变量:transform – recode into different variables )
2. 选择要添加的数据来源;
(已打开数据文件或外部数据文件)
3. 对来源数据文件中的变量进行选择;
(非匹配变量列表:*意为此变量属于当前文件;+意为此变量属于数 据来源文件;<意为此变量为字符型变量;)
4. 选择是否生成数据来源指示变量(source-n); 5. 输出结果;
关键变量:
关键变量在两个数据文件中必须有相同的 文件名,必须按照由小到大的顺序排列(顺 序不对,合并失败)。关键变量一般是能够 唯一的确定某个观测值。
P415 数据文件合并示例
数据文件拆分基本步骤: 1. 选择数据文件拆分对话框;
(data – split files)
2. 选择分组关键变量; 3. 选择分组后的输出模式; 4. 输出结果;
百度文库
3.8 数据的分类汇总
数据的分类汇总是指讲观测量分成若干组, 然后计算每组的描述性统计量。 (data - aggregate)
社会科学统计软件SPSS教程 第三章 SPSS数据整理
3.1 变量计算 3.2 变量值计数 3.3 变量值重新编码及其自动编码 3.4 观测量求秩 3.5 缺失值替代处理 3.6 观测量排序与数据文件的转置 3.7 数据文件的合并与拆分 3.8 数据的分类汇总 3.9 观测量选择与加权
SUM(?,?)的使用 NMISS(Variable to Variable)的使用
P389 应用示例
3.2 变量值计数
计算数据文件中某特定变量出现的次数, 变量值计数过程中会产生一个新变量用于保 存计数结果。
基本步骤: 1. 打开变量值计数对话框;
(transform – count values within cases)
2. 确定排序的关键变量;
(可确定多个关键变量,并按其先后顺序执行) (确定排序方法:升序或降序)
3. 输出排序结果;
3.7 数据文件的转置
将数据文件中的行(观测值)、列(变量) 互换,并自动创建一个新的数据文件来存放 转置结果。
3.8 数据文件的合并与拆分
合并:在SPSS中,数据文件的合并是指将一 个外部数据文件中的数据添加到当前工作文 件中去,将它们合并为一个数据文件。包括 添加变量,补充录入观测值。
基本步骤: 1. 打开求秩对话框;
(transform – rank case)
2. 选定求秩变量和分类变量;
3.5 缺失值替代处理
统计数据中有缺失值是难免的,计算中会 出现缺失值为0而出错的情况,为了保证统计 运算的顺利进行,必须对缺失值加以处理。
基本步骤:
1. 选择缺失值替代对话框;
3.1 变量计算
通过对原有变量的数学运算来生成具有其 他意义的新变量。
作用: 1. 满足SPSS对数据处理时的需要; 2. 满足统计分析的前提假设条件;
基本步骤: 1. 打开变量计算对话框;
(transform - compute)
2. 确定目标变量; 3. 定义新变量名、变量类型及变量标签; 4. 确定变量计算公式及数据的选择条件; 5. 输出结果;
2. 选择重编码变量,设定分类条件;
(重编码变量可为多个,但必须为同一类型)
3. 输出结果;
系统自动编码:将字符型或数值型变量转换 成连续的整数型变量值,如果分类变量不是 连续的,会产生空的单元格。
3.4 观测量求秩
观测量的秩是讲观测量按大小顺序排列后, 单个观测值所处的位置,可通俗的理解为观 测量的“名次”。
3.9 观测量选择与加权
观测量的选择:从数据文件所有的观测量中 选出符合统计分析条件的样本,以便于进行 针对于某一类观测值的统计分析。
观测量加权:以观测量的重复数作为该观测 量的权值,并保存在数据文件的权变量中。
3. 对来源数据文件中的变量进行舍弃或匹配;
(非匹配变量列表:*意为此变量属于当前文件;+意为此变量属于数 据来源文件;<意为此变量为字符型变量;)
4. 选择是否生成数据来源指示变量(source-n); 5. 输出结果;
变量添加基本步骤:
1. 选择变量添加对话框;
(data – merge files – add variables)
(自定义数值,系统缺失和用户缺失,自定义数值范围 )
3. 定义保存计数结果的变量;
(变量名及标签)
4. 输出结果;
P394 (demo.sav)变量计数示例
3.3 变量值重新编码及自动编码
变量值重新编码:根据统计分析的要求,将 某变量观测数值的测量尺度由连续变量变为 称名变量或顺序变量。
(transform – replace missing values)
2. 要替代缺失值的变量以及替代方法;
(为保留原始数据,要生成新变量) (替代表达式:变量名-n=替代方法(变量名w),其中w 为跨度)
3. 输出结果;
替代方法: 1. 用整个序列的有效值的均值作为估计值; 2. 用缺失值邻近的w个有效值的均值作为估计值; 3. 用缺失值邻近的w个有效值的中位数作为估计
值; 4. 线性插值法,若第一个和最后一个观测值缺失,
则无法使用此方法进行估计; 5. 以序列号为自变量,变量值为因变量求解线性
方程,然后根据回归方程计算缺失值处的趋势预测 值来作为估计值;
P409 缺失值替代示例
3.6 观测量排序
基本步骤: 1. 选择观测量排序对话框;
(data – sort case)
拆分:在SPSS中,数据文件的拆分不是将一 个数据文件,而是根据一个或多个变量对数 据进行分组,每一组作为统计分析中的一个 样本。
观测量添加基本步骤:
1. 选择观测量添加对话框;
(data – merge files – add cases)
2. 选择要添加的数据来源;
(已打开数据文件或外部数据文件)
结果: 1. 重新编码结果替换原来的变量值; 2. 生成新的变量来保存编码结果;
基本步骤:
1. 打开重新编码对话框;
(替换原变量值:transform – recode into same variables) (生成新的变量:transform – recode into different variables )
2. 选择要添加的数据来源;
(已打开数据文件或外部数据文件)
3. 对来源数据文件中的变量进行选择;
(非匹配变量列表:*意为此变量属于当前文件;+意为此变量属于数 据来源文件;<意为此变量为字符型变量;)
4. 选择是否生成数据来源指示变量(source-n); 5. 输出结果;
关键变量:
关键变量在两个数据文件中必须有相同的 文件名,必须按照由小到大的顺序排列(顺 序不对,合并失败)。关键变量一般是能够 唯一的确定某个观测值。
P415 数据文件合并示例
数据文件拆分基本步骤: 1. 选择数据文件拆分对话框;
(data – split files)
2. 选择分组关键变量; 3. 选择分组后的输出模式; 4. 输出结果;
百度文库
3.8 数据的分类汇总
数据的分类汇总是指讲观测量分成若干组, 然后计算每组的描述性统计量。 (data - aggregate)
社会科学统计软件SPSS教程 第三章 SPSS数据整理
3.1 变量计算 3.2 变量值计数 3.3 变量值重新编码及其自动编码 3.4 观测量求秩 3.5 缺失值替代处理 3.6 观测量排序与数据文件的转置 3.7 数据文件的合并与拆分 3.8 数据的分类汇总 3.9 观测量选择与加权
SUM(?,?)的使用 NMISS(Variable to Variable)的使用
P389 应用示例
3.2 变量值计数
计算数据文件中某特定变量出现的次数, 变量值计数过程中会产生一个新变量用于保 存计数结果。
基本步骤: 1. 打开变量值计数对话框;
(transform – count values within cases)
2. 确定排序的关键变量;
(可确定多个关键变量,并按其先后顺序执行) (确定排序方法:升序或降序)
3. 输出排序结果;
3.7 数据文件的转置
将数据文件中的行(观测值)、列(变量) 互换,并自动创建一个新的数据文件来存放 转置结果。
3.8 数据文件的合并与拆分
合并:在SPSS中,数据文件的合并是指将一 个外部数据文件中的数据添加到当前工作文 件中去,将它们合并为一个数据文件。包括 添加变量,补充录入观测值。
基本步骤: 1. 打开求秩对话框;
(transform – rank case)
2. 选定求秩变量和分类变量;
3.5 缺失值替代处理
统计数据中有缺失值是难免的,计算中会 出现缺失值为0而出错的情况,为了保证统计 运算的顺利进行,必须对缺失值加以处理。
基本步骤:
1. 选择缺失值替代对话框;
3.1 变量计算
通过对原有变量的数学运算来生成具有其 他意义的新变量。
作用: 1. 满足SPSS对数据处理时的需要; 2. 满足统计分析的前提假设条件;
基本步骤: 1. 打开变量计算对话框;
(transform - compute)
2. 确定目标变量; 3. 定义新变量名、变量类型及变量标签; 4. 确定变量计算公式及数据的选择条件; 5. 输出结果;
2. 选择重编码变量,设定分类条件;
(重编码变量可为多个,但必须为同一类型)
3. 输出结果;
系统自动编码:将字符型或数值型变量转换 成连续的整数型变量值,如果分类变量不是 连续的,会产生空的单元格。
3.4 观测量求秩
观测量的秩是讲观测量按大小顺序排列后, 单个观测值所处的位置,可通俗的理解为观 测量的“名次”。
3.9 观测量选择与加权
观测量的选择:从数据文件所有的观测量中 选出符合统计分析条件的样本,以便于进行 针对于某一类观测值的统计分析。
观测量加权:以观测量的重复数作为该观测 量的权值,并保存在数据文件的权变量中。
3. 对来源数据文件中的变量进行舍弃或匹配;
(非匹配变量列表:*意为此变量属于当前文件;+意为此变量属于数 据来源文件;<意为此变量为字符型变量;)
4. 选择是否生成数据来源指示变量(source-n); 5. 输出结果;
变量添加基本步骤:
1. 选择变量添加对话框;
(data – merge files – add variables)