第三章SPSS数据文件的基本加工和处理

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

变量计算
(4) SPSS函数

缺失值函数 missing()：判断变量是否取系统或用户缺失值 sysmis()：判断变量是否取系统缺失值其他函数： Lag()：便于进行差分计算
变量转换
(5)SPSS条件表达式:
• 条件表达式:由SPSS关系运算符、逻辑运算符、SPSS •逻辑运算符: 函数以及SPSS变量名组成的式子。
性别_1 男女
年龄_1 30 35
奖金_1 600 550
数据文件的分类汇总
(2)菜单选项:
data -> aggregate
(3)说明:
• 多重分组时，变量名的选择顺序。 • 生成的新文件名默认为:aggr.sav。可修改。 • 生成的新变量名默认为原变量名后加_1。可修改。 • 可以在新文件中存贮个分组个案数.
数据分组
(3)分组结果存入原变量:
• 定义分组区域: 定义某一区间的原变量值分组后所对应的新值是什么.未定义的原变量值保持不变。 • 菜单选项: transform -> recode -> into same variables…
• 说明：
可以指定对符合一定条件的个案进行分组。
数据分组
(4)分组结果存入新变量:
计数
(1)含义:
对所有或部分个案，计算若干个变量中有几个变量的值落在指定的区域内，并将结果存入新变量中。
(2)菜单选项:
transform -> count -> define value
产生计数变量
(3)指定区域的定义
• • • • Value:指定一个值 system-missing:系统缺失值 system-or user missing:系统或用户缺失值 range through:指定一个闭区域，给出最大和最小值 • range: lowest through n:最小值到某个给定值 • range: n through highest:某个给定值到最大值
•
关系运算符: > (大于)、 <(小于)、 =(等于)、 ~=(不等于)、 >=(大于等于)、 <=(小于等于) 如：nl>32、sr<=700
&(AND):并且 • |(OR):或者 • ~(NOT):非 • 如：(nl>32) and (sr<=700) • (nl=32) | (sr<>700) • not xb=1
第三章 SPSS数据文件的基本加工和处理
SPSS数据文件的基本加工和处理
• 数据文件的整理
个案排序、个案选取
• 数据加工
变量计算、计数
• 数据分组
自动分组、手工分组
• 数据文件的其他处理功能
指定加权变量
个案排序
• 目的：将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列。 •排序在数据分析中的作 • 菜单选项: 用？ data -> sort cases • 注意: (1)Ascending:升序、Descending:降序。 (2)多重排序,选择变量名的次序很关键。
• 分位值自动分组
（1）含义：将定距型变量按分位数要求自动划分成相应类（2）菜单选项：transform->categorize variables
数据分组
(二)手工分组（组距分组）
(1)含义：
人工定义分组区域，对所有个案或符合一定条件的个案进行等距或非等距分组。
(2)方法：
分组结果存入原变量、分组结果存入新变量
变量计算
(4) SPSS函数

逻辑函数： range()：判断变量值是否在指定的区间内 any()：判断变量值是否为指定的若干值字符串函数： index(S1，S2)：判断字符串S2在S1中首次出现的位置 length()：求字符串长度 lower() upcase()：字符串的大小写转换 lpad()：用指定字符补齐字符串为指定长度 ltrim()：压缩字符串空格 substr()：取子串
SPSS变量名组成的式子。
变量计算
(4) SPSS函数
• • • • • • • • 算术函数统计函数分布函数逻辑函数字符串函数缺失值函数日期时间函数其他函数
变量计算
(4) SPSS函数

算术函数 Abs()：求绝对值 sqrt()：求平方根 rnd()：四舍五入后取整 trunc()：截取小数部分取整 mod()：取余 Ln()：自然对数 Lg10()：以10为底的对数
注意:以后的操作和分析都在该个案选取的基础上进行.
变量计算
目的：产生新变量或对原变量进行必要的转换处理
(如:预测问题产生比率数据偏态数据的正态处理时间序列的平稳处理等)
(1)含义: 根据用户给出的SPSS算术表达式，对所有或部分样本数据进行加工。 (2)菜单选项： transform->compute if 按钮 (3)SPSS算术表达式(Numeric Expression): 由算术运算符(+ 、-、 *、 /、 **)、SPSS函数以及
个案选取
• 目的：从现有数据中挑选出部分数据。
•个案选取在数据分析中的作用？
• 菜单选项: data -> select cases • 选取个案的几种不同方式 (1)选择符合一定条件的个案(If condition is satisfied) (2)随机选取个案(Random sample of cases) 近似选取、精确选取 (3)选取某一区域内的个案(Based on time or case range) (4)使用过滤变量(use filter variable)
数据文件的分类汇总
(1)含义：
– 按指定的分类变量的变量值对个案分组； – 计算每组个案的汇总变量的基本统计量； – 将计算结果生成到一新文件中，即：在新文件中对应分类变量的每一个分类值产生一个个案。
性别男女男年龄 40 35 20
•原始数据
奖金 1000 550 200
•按性别变量汇总数据
单值区间可以实现数据转换（问卷分析中的反向题重新计分）
问卷分析中的反向题重新计分举例
•性格打分（内向、一般、外向）
•1、与生人交往会“自来熟”
• （1）从不（2）偶尔（3）有时（4）经常
• 2、与不熟悉的异性交往，会脸红 • • • （1）从不（2）偶尔（3）有时（4）经常（1）从不（2）偶尔（3）有时（4）经常
数据分组
• 目的:了解数据的总体分布状况 • 思路：
– 指定按哪个变量分组，即：指定分组变量 – 定义分组变量的分组区间（不重、不漏） – 指定一个存放分组结果的标志变量
• 分组方法：
– 自动分组 – 手工分组
数据分组
(一)自动分组
• 单变量值分组
(1)含义: 分组变量值相同的个案分在同一组，同组中的标志变量相同。标志变量依照分组变量值的大小次序给定。（单变量分组，通常只适合于离散变量且变量值较少的情况） (2)菜单选项: transform -> automatic recode…
变量计算
(4) SPSS函数

统计函数： mean()：均值 sd()：标准差 sum()：求总和 cfvar()：求变异系数 max() min()：求最大最小值
变量计算
(4) SPSS函数

分布函数： normal()：产生服从标准正态分布的随机数序列 uniform()：产生均匀分布的随机数序列 rv.()：产生指定分布的随机数序列，如：rv.t(10) cdf.()：计算指定分布的累计概率值 idf.()：计算指定分布的临界值
• 定义分组区域:定义某一区间的原变量值分组后所对应的新值是什么.未定义的原变量值在新变量中为系统缺失值。
• 菜单选项:
transform -> recode -> into different variables… • 定义原变量分组后产生的相应新变量(CHANGE钮)
• 可以指定对符合一定条件的个案进行分组。
来自百度文库
•3、在公众场合下你会大声发表自己的意见
•极为内向：3分较为内向：6分较为外向:9分极为外向：12分
指定加权变量
(1)含义:
指定某一变量为加权变量。如：平均蔬菜价格、男足打分
(2)菜单选项:
data -> weight case
(3)说明
如果取消加权变量应重新定义:
– data->weight case – do not weight cases
作业
• 根据给定的两个关于学生成绩的SPSS数据文件做如下处理：
– – – – – 合并两个数据文件（数据不一定是一一对应的）计算每个同学的总成绩、平均成绩、标准差计算每个同学的得优率和得良率根据得优率排名将各门课程的成绩按优、良、中、及格和不及格重新分组 – 分别计算男生和女生的各科的平均成绩、标准差，并保存计算结果到SPSS数据文件。