第四讲 数据录入及整理

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Categorize Variables :分位数的分组
在连续变量或变量值较多的情况下, 分位数分组是一种较为有效而快捷的方法 。与Recode不同的是,分位数分组各组的 下限值和上限值由分位数决定。
• 分位数:将全部数据按升序并等分成 n分后在相应分为点上的变量值。
• 点击Categorize cariables后弹出框如下:
第二步:在计算功能下设定输出随机数
第三步:重复上述操作,新生成一列随机数
Count:计算指定变量值出现的次数,并保存为 新变量 • 第一步:在Transform 中点击Count
• 第二步:将参与计数的变量选到Numberic Variables中,在Target Variable框中输入相应 变量名标签。
第四讲
数据整理
Transform菜单
• Transform菜单下的主要功能有: • Compute :变量的计算 • Random Number Seed :设定为随 机函数的随机种子 • Count:计算指定变量值出现的次数 ,并保存为新变量 • Recode :对已有变量值重新编码 • Categorize Variables :分位数的分 组 • Rank Cases:变量偏秩 • Automatic Recode:单变量值分组 • Greate Time Series:建立时间序列 • Replace Missing Values:替换缺失值
• 例题操作
配合随机种子功能实现随机数的生成
• 默认情况下随即种子随着时间在不停的改变,这 样所计算出的随机数值无法重复,在临床试验等 情况中是不符合要求的。此时我们可以利用该功 能指定一个种子,以后所有的伪随机函数在计算 时都以该种子开始计算。
第一步: 利用随 机数字 生成器 设置随 机种子
Greate Time Series:建立时间序列变量
• 顾名思义,即建立时间序列变量 • 功能选项解释: • 1、非季节差分:计算时间序列连续值之间的非季 节性差异 • 2、季节性差异:计算时间序列跨间距间隔恒定值 之间的季节性差异。 • 3、领先移动平均:计算先前的时间序列数值的平 均值 • 4、中心移动平均:计算围绕或包括当前值得时间 序列的平均值 • 5、中位数:计算围绕或包括当前值得时间序列的 中位数 • …
• 点击Define Values按钮定义计数区间
出现了六种选 择分别代表:
1、单个变量值 2、系统缺失值 3、系统缺失值 或用户缺失值 4、给定最大值 和最小值区间 5、小于等预某 指定值得区间 6、大于等预某 指定值得区间
• 如果仅希望对满足某条件的个案进行计数,点击If按 钮输入相应条件表达式即可。
Replace Missing Values:替换缺失值
பைடு நூலகம்
• 当某变量存在较多缺失值时,有的过程不能运行 ,这时,应设法将缺失值填补,所以采用替换缺 失值的操作来实现。 • 第一步:打开对话框
• 第二步:将选取的 变量移到新变量的 选项框中。 • 第三步:选择新变 量的名称以及方式
• 方式: • 1、所选变量所有 值的平均值 • 2、附近几点均值 • 3、附近几点中位 数 • 4、某一缺失值前 一值和后一直线性 插值 • 5、对原有数据进 行线性回归的基础 上的线性预测值
为什么你不要自傲和自卑? 你可以说自己是最好 的,但不能说自己是全校最好的、全北京最好的、全
国最好的、全世界最好的,所以你不必自傲;同样,
你可以说自己是班级最差的,但你能证明自己是全校 最差的吗?能证明自己是全国最差的吗?所以不必自 卑。 —俞洪敏
感谢您的关注
结果:
Recode :对已有变量值重新编码
• 例:一家报纸调查了2000位读者,数据包括读者的年 龄、收入、性别、居住地等。如果希望对不同年龄段 的读者对报纸的评价情况进行比较。但是调查获得数 据中年龄数据没有经过分段,因此可以对不能年龄段 的读者进行分段,如何进行?
• 第一步:
• 第二步: 将年龄从 变量列表 框中选入 到状态窗 口中(必 须为数值 型)
第三步:点击“Old and New Values…”按钮
Old value Value:对指 定某个值 进行重新 编码 Systemmissing: 对系统缺 失值重新 编码 System-or usemissing: 对系统缺 失值与用 户缺失值 重新编码 All other values: 对指定数 值以外的
• 例:我们根据型别分组计算数学成 绩的秩次。
秩的类型
• 对相等观 测量的处 理方式
Automatic Recode:单变量值分组 • 把每一个变量值作为一组,这种分组方法通常只 适用于离散变量且变量值较少的情况。 • 例:按照数学成绩分组
• 第一步:打开相应对话框 • 第二步:把所需分组变量倒入右边窗口中,并通过 “new name”定义新的变量名。 • 第三步:在框中选择单变量值分组按照升序还是降序排 序。Lowest value为升序,highest value为降序。
回顾 Transform • Transform菜单下的主要功能有: • Compute :变量的计算 • Random Number Seed :设定为 随机函数的随机种子 • Count:计算指定变量值出现的次 数,并保存为新变量 • Recode :对已有变量值重新编码 • Categorize Variables :分位数的 分组 • Rank Cases:变量偏秩 • Automatic Recode:单变量值分组 • Greate Time Series:建立时间序 列 • Replace Missing Values:替换缺 失值
Compute :变量的计算
• 变量的计算就是在原有的文 件基础上,根据用户的要求 ,使用SPSS算术表达式及 函数,对所有记录或满足 SPSS条件表达式的记录, 计算出一个新的结果并保存 。 • 例:一家幼儿园使用百分制 评价孩子的表现,相应的 SPSS数据文件包含2个班 共20个孩子的分数,全部变 量有三个,分别是“姓名” 、“性别”、“班级” 、 “英语” 、“数学” 。如 果老师决定给一班孩子追加 5分,其余班不变,如何实
Rank Cases:变量偏秩
• 偏秩就是对记录按照某个变量值的大小来排序。他根据某 个变量的大小来排出次序(秩次),然后将秩次结果存储 到一个新变量中去。 • 在许多时候参数检验的条件不被满足,此时不得不使用非 参数方法,但是稍微复杂些的非参数方法无法直接用对话 框实现,需要先计算秩次在进行分析。
相关文档
最新文档