第三章SPSS数据文件的基本加工和处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

变量计算
(4) SPSS函数


缺失值函数 missing():判断变量是否取系统或用户缺失值 sysmis():判断变量是否取系统缺失值 其他函数: Lag():便于进行差分计算
变量转换
(5)SPSS条件表达式:
• 条件表达式:由SPSS关系运算符、逻辑运算符、SPSS •逻辑运算符: 函数以及SPSS变量名组成的式子。
性别_1 男 女
年龄_1 30 35
奖金_1 600 550
数据文件的分类汇总
(2)菜单选项:
data -> aggregate
(3)说明:
• 多重分组时,变量名的选择顺序。 • 生成的新文件名默认为:aggr.sav。可修改。 • 生成的新变量名默认为原变量名后加_1。可修 改。 • 可以在新文件中存贮个分组个案数.
数据分组
(3)分组结果存入原变量:
• 定义分组区域: 定义某一区间的原变量值分组后所对应 的新值是什么.未定义的原变量值保持不变。 • 菜单选项: transform -> recode -> into same variables…
• 说明:
可以指定对符合一定条件的个案进行分组。
数据分组
(4)分组结果存入新变量:
计数
(1)含义:
对所有或部分个案,计算若干个变量中有几个 变量的值落在指定的区域内,并将结果存入新 变量中。
(2)菜单选项:
transform -> count -> define value
产生计数变量
(3)指定区域的定义
• • • • Value:指定一个值 system-missing:系统缺失值 system-or user missing:系统或用户缺失值 range through:指定一个闭区域,给出最大和 最小值 • range: lowest through n:最小值到某个给定值 • range: n through highest:某个给定值到最大值

关系运算符: > (大于)、 <(小于)、 =(等于)、 ~=(不等于)、 >=(大于等于)、 <=(小于等于) 如:nl>32、sr<=700
&(AND):并且 • |(OR):或者 • ~(NOT):非 • 如:(nl>32) and (sr<=700) • (nl=32) | (sr<>700) • not xb=1
第三章 SPSS数据文件的基本 加工和处理
SPSS数据文件的基本加工和处理
• 数据文件的整理
个案排序、个案选取
• 数据加工
变量计算、计数
• 数据分组
自动分组、手工分组
• 数据文件的其他处理功能
指定加权变量
个案排序
• 目的: 将所有个案按照用户指定的某一个或多个变量 的变量值的升序或降序重新排列。 •排序在数据 分析中的作 • 菜单选项: 用? data -> sort cases • 注意: (1)Ascending:升序、Descending:降序。 (2)多重排序,选择变量名的次序很关键。
• 分位值自动分组
(1)含义:将定距型变量按分位数要求自动划分成相应类 (2)菜单选项:transform->categorize variables
数据分组
(二)手工分组(组距分组)
(1)含义:
人工定义分组区域,对所有个案或符合一定条 件的个案进行等距或非等距分组。
(2)方法:
分组结果存入原变量、分组结果存入新变量
变量计算
(4) SPSS函数


逻辑函数: range():判断变量值是否在指定的区间内 any():判断变量值是否为指定的若干值 字符串函数: index(S1,S2):判断字符串S2在S1中首次出现的位置 length():求字符串长度 lower() upcase():字符串的大小写转换 lpad():用指定字符补齐字符串为指定长度 ltrim():压缩字符串空格 substr():取子串
SPSS变量名组成的式子。
变量计算
(4) SPSS函数
• • • • • • • • 算术函数 统计函数 分布函数 逻辑函数 字符串函数 缺失值函数 日期时间函数 其他函数
变量计算
(4) SPSS函数

算术函数 Abs():求绝对值 sqrt():求平方根 rnd():四舍五入后取整 trunc():截取小数部分取整 mod():取余 Ln():自然对数 Lg10():以10为底的对数
注意:以后的操作和分析都在该个案选取的基础上 进行.
变量计算
目的:产生新变量或对原变量进行必要的转换处理
(如:预测问题 产生比率数据 偏态数据的正态处理 时间序列的平稳处 理等)
(1)含义: 根据用户给出的SPSS算术表达式,对所有或部分样本 数据进行加工。 (2)菜单选项: transform->compute if 按钮 (3)SPSS算术表达式(Numeric Expression): 由算术运算符(+ 、-、 *、 /、 **)、SPSS函数以及
个案选取
• 目的: 从现有数据中挑选出部分数据。
•个案选取在数 据分析中的作 用?
• 菜单选项: data -> select cases • 选取个案的几种不同方式 (1)选择符合一定条件的个案(If condition is satisfied) (2)随机选取个案(Random sample of cases) 近似选取、精确选取 (3)选取某一区域内的个案(Based on time or case range) (4)使用过滤变量(use filter variable)
数据文件的分类汇总
(1)含义:
– 按指定的分类变量的变量值对个案分组; – 计算每组个案的汇总变量的基本统计量; – 将计算结果生成到一新文件中,即:在新文件中对 应分类变量的每一个分类值产生一个个案。
性别 男 女 男 年龄 40 35 20
•原始数据
奖金 1000 550 200
•按性别变量汇总数据
单值区间可以实现数据转换(问卷分析中的反向题重新 计分)
问卷分析中的反向题重新计分举例
•性格打分(内向、一般、外向)
•1、与生人交往会“自来熟”
• (1)从不 (2)偶尔 (3)有时 (4)经常
• 2、与不熟悉的异性交往,会脸红 • • • (1)从不 (2)偶尔 (3)有时 (4)经常 (1)从不 (2)偶尔 (3)有时 (4)经常
数据分组
• 目的:了解数据的总体分布状况 • 思路:
– 指定按哪个变量分组,即:指定分组变量 – 定义分组变量的分组区间(不重、不漏) – 指定一个存放分组结果的标志变量
• 分组方法:
– 自动分组 – 手工分组
数据分组
(一)自动分组
• 单变量值分组
(1)含义: 分组变量值相同的个案分在同一组,同组中的标志变量相同。 标志变量依照分组变量值的大小次序给定。(单变量分组,通常 只适合于离散变量且变量值较少的情况) (2)菜单选项: transform -> automatic recode…
变量计算
(4) SPSS函数

统计函数: mean():均值 sd():标准差 sum():求总和 cfvar():求变异系数 max() min():求最大最小值
变量计算
(4) SPSS函数

分布函数: normal():产生服从标准正态分布的随机数序列 uniform():产生均匀分布的随机数序列 rv.():产生指定分布的随机数序列,如:rv.t(10) cdf.():计算指定分布的累计概率值 idf.():计算指定分布的临界值
• 定义分组区域:定义某一区间的原变量值分组后所对应 的新值是什么.未定义的原变量值在新变量中为系统缺 失值。
• 菜单选项:
transform -> recode -> into different variables… • 定义原变量分组后产生的相应新变量(CHANGE钮)
• 可以指定对符合一定条件的个案进行分组。
来自百度文库
•3、 在公众场合下你会大声发表自己的意见
•极为内向:3分 较为内向:6分 较为外向:9分 极为外向:12分
指定加权变量
(1)含义:
指定某一变量为加权变量。如:平均蔬菜价格、男足打分
(2)菜单选项:
data -> weight case
(3)说明
如果取消加权变量应重新定义:
– data->weight case – do not weight cases
作业
• 根据给定的两个关于学生成绩的SPSS数据文 件做如下处理:
– – – – – 合并两个数据文件(数据不一定是一一对应的) 计算每个同学的总成绩、平均成绩、标准差 计算每个同学的得优率和得良率 根据得优率排名 将各门课程的成绩按优、良、中、及格和不及格重 新分组 – 分别计算男生和女生的各科的平均成绩、标准差, 并保存计算结果到SPSS数据文件。
相关文档
最新文档