spss第二章 变量计算及转换
SPSS-教程-----第二章2.数据编辑与整理
二、数据编辑与整理1 数据整理在主菜单中点击Data菜单命令,弹出数据文件子菜单,如下图。
主要功能有:定义时间,插入变量或记录,到某一记录,观测值排序,数据转置,合并文件,数据分类汇总,正交设计方案,折分文件,选择观测值单位,变量加权等。
1.1 定义时间变量(Define Dates..)在菜单中选中Data- Define Dates..命令,弹出日期格式设置对话框,在对话框中选中需要的格式。
例如,我们要定义一个以天数为单位的日期变量,就在“Cases Are:”栏里选中“Days”,在“First Case ls”的“Day”输入框输入“1”。
然后单击 ?OK ?按钮。
这样系统就在数据编辑窗口新添加了“DAY_”和“DATE_”两个变量,“DAY_”变量为数值型,“DATE_”变量为字符型。
1.2 插入变量(Insert Variable)在数据编辑窗口选定要插入变量位置的后一个变量,可以从工具条直接点击插入变量按钮,或从菜单中选择Data-Insert Variable命令。
数据编辑窗口产生一个新的变量列。
1.3 插入记录(Insert Case)在数据编辑窗口选定要插入记录位置的后一个记录,可以从工具条直接点击插入记录按钮,或从菜单中选择Data-Insert Case命令。
数据编辑窗口产生一个新的记录行。
1.4 观察值排序(Sort Cases)从菜单中选择Data- Sort Cases命令,弹出观测值排序对话框。
Sort by:选择排序变量。
对所选变量的观测值排序。
如果选择了两个以上的变量,其排序结果将按变量在本栏的选入顺序依次排序。
Sort Order:排序方式:⊙ Ascending:升序排列。
数值型变量由小到大排列,字符型变量按ABCD 字母顺序排列。
系统默认项。
○ Descending:数值型变量由大到小排列,字符型变量按ZYX字母顺序由后向前排列。
1.5 数据转置(Transpose)将工作区数据的行和列互换,使新文件的行是原数据的列,新文件的列是原数据的行。
第2章 SPSS 17.0 基本操作与数据管理PPT教学课件
2020/12C/1C1 E,这只是5种命名,用户可以自行设定这5种类型。
6
(2)字符型: 字符型编变量由字符串组成,可以包含数字、字母和一些特殊符号。字符型变 量的默认长度为8,大于8个字符的称为长字符型变量,少于8个字符的称为短字 符型变量,字符型变量最长为32767个字符。他不能参与运算,区分大小写字母。 (3)日期型: 日期型变量用于表示日期和时间,他有29种不同的日期和时间格式,不能参与运算 ,要参与必须通过日期函数进行转换。
(2)菜单栏
菜单栏,包括 “文件”、“编辑”、“视图”、“数据”、 “转换”、“分析”、“图形”、“实用程序”、“附加内容”、 “窗口”和“帮助” 菜单,这些菜单可以实现编辑数据与变量、定义 系统参数、设计显示方式、绘制图形、进行各项数据分析和查阅帮 助等功(3能)数。据单元格信息显示栏
该显示栏用于显示单元格位置和单元格的内容等信息。灰色显 示的区域为提示区,显示单元格的位置,空白区域为数据编辑器, 该区域内显示当前选中的单元格的内容,用户可以在该区域输入或 修改相应的内容。
如:1-12-2009、29.12.99等
2020/12/11
7
二、变量名与变量标签
变量名和变量标签是用户用于识别变量的标志。
1.变量名
变量名用于区分不同的变量。
起名规则:
• 不能超过64个字符
• 不区分大小写
• 默认变量名为VARn,如:var00001
• 首字符必须是字母、中文或特殊符号“@” 、“$” 、“#” 。
2020/12/11
3
(4)数据编辑显示区
在窗口的中部是编辑显示区,该区最左边列显示单元序列号, 最上边一行显示变量名称。选定的单元格呈反色显示,其内容将出 现在数据和单元格信息显示栏中。用户可以在该区域内输入或修改 单元格内容。
SPSS第二章
• 增加变量有两种方式:
一是两个数据文件按观测量顺序一对一地横向合并; 二是按关键变量合并,即要求两个数据文件必须有一个共同的关键变
量,两个数据文件中关键变量值相同的观测量合并为一个观测量。
1、打开数据a2-1.sav与数据a2-2.sav,我们来演示打开多 个数据文件合并数据的方式。
“变量名称是否包含在文件的顶 部?”选项:如果变量名称包含 在文件的顶部选择“是”;没有 选择“否”。本例中变量名称包 含在文件顶部,选择“是”。
点击“下一步”
5、进入第3步。这里有三个选项需要设置
“第一个数据个案从哪个行号开 始?”选项:该输入框用于选择 数据读取的起始行,如果数据文 件中包含标签,那么该数据文件 的起始行就不是第一行。本例中 由于第一行包含标签故输入 “2”。
– 变量名最多可包含 64 个字节,并且第一个字符必须是字母或字符 @、# 或 $ 之一。后续字符可以是字母、数字、非标点字符和句 点 (.) 的任意组合。在双字节语言(例如中文)中,64 个字节通 常意味着 32 个字符。
• 定义变量包括:变量名、变量类型、变量宽度、小数位数 、变量标签、数值标签、缺失值、变量栏宽度、数据对齐 方式、变量的度量标准。
– 度量标准, 分为度量、有序和名义。这对应于统计上所讲的等距与 等比、顺序、称名变量。
• 在SPSS的数据视图中,数据文件是按个案(行)和变量(列) 组织的。
• 个案表示各个调查对象。
• 变量表示对调查中提出的每个问题的回答。
例子
• 问卷的组成: –指导语 –人口统计学资料 –各个分问卷
例子
在本例中,数据a2-1.sav与数据a2-2.sav的顺序是一一 对应的,我们可以直接按照增加变量的第一种方式,直接 点击确定合并;也可以按照关键变量来进行合并,在正式 合并之前我们已经把数据按照关键变量进行升序排列。我 们下面演示的是第二种按关键变量合并的方法。
2.4 SPSS数据的计算和变换
【Old and New Value】按钮被激活,单击此按钮, 弹出如下图所示的对话框。
Step04:选择样本赋值 如果用户不是对所有的候选变量进行赋值,而是选 择其中符合某些条件的变量值进行赋值操作,此时 需要单击【If】按钮进行操作。按照具体要求指定 观察量的选择条件进行操作。 Step05:最后单击【OK】按钮,此时操作结束。
在数据分析中,经常要根据一些已知的数据变量计算新的 变量。例如,根据历年的产量数据资料计算产量的发展速 度,根据人口数据计算人口出生率、死亡率等。不仅如此, 还需要进行不同类型变量之间的转换,如将数值型变量转 化为字符型变量。这些工作都需要利用【Transform( 转 换)】菜单中的相关命令。
变量计算是数据分析中的重要内容之一。有些时候, 收集到的原始数据并不能直接提供给我们许多有用 的信息,此时,我们需要将原始数据进行计算变换, 生成有用的新的变量。例如,根据职工的基本工资、 各类保险、公积金等,计算职工的实际月收入;根 据购房客户的贷款总额和按揭方案评价客户的潜在 风险等。
在【Numeric Expression( 数值表达式 )】文本框中 输入计算表达式“a=第一产业/国内生产总值”。
单击【OK(确定)】按钮,操作完成。此时,原数据文件 新增加了“a”变量。
SPSS 的 【Transform( 转换 )】菜单中有 【Recode into Same Variable( 重新编码为相同变量 )】和【Recode into Different Variable(重新编码为不同变量)】两个 命令可以实现重新赋值功能,它们分别表示重新赋 值到同一变量或不同变量。 下面以【Recode into Different Variable(重新编码为不 同变量)】命令为例说明重新赋值功能。
非常详细的SPSS实用教程
2.3.8 数据次序确定
选择“Transform”菜单中的“Rank Cases”命令,弹出“Rank Cases”对话框,如图2-18所示,在该对话框中可以改变数据排序的次序。
图2-18 “Rank Cases”对话框
图2-19 “Rank Cases:Types”对话框
01
排序类型如下。
2.3.3 数据的排序
图2-10 “Sort Cases”(排序)对话框
在数据文件中,可根据一个或多个排序变量的值重排个案的顺序。
2.3.4 数据的行列互换
图2-11 “Transpose”对话框
2.3.5 选取个案子集
在数据统计中可从所有资料中选择部分数据进行统计分析。
图2-12 “Select Cases”对话框
图2-7 保存为另外的数据格式文件
SPSS Portable(*.por)
用户确定盘符、路径、文件名以及文件格式后单击“Save”按钮,即可保存为指定类型的数据文件。SPSS支持的常见的数据文件存放格式如下。
SPSS/PC+(*.sys)
SPSS(*.sav)
Tab delimited(*.dat)
2
图2-23 “Compute Variable”(计算变量)对话框
图2-24 条件表达式对话框
2.4.4 产生计数变量
在统计过程中,往往需要进行一些计数工作。产生计数变量就是实现计数功能,它对所有个案或满足一定条件的个案,计算若干个变量中有几个变量的值落在指定的区间内,并将计数结果放入一个新变量中。
定 义 变 量
01
启动SPSS后,出现如图2-1所示数据编辑窗口。由于目前还没有输入数据,因此显示的是一个空文件。
spss第二章变量计算及转换
2.5 变量重新赋值
Range:[ ]through [ ]:
连续取值的变量与编码的对应关系
Range:Lowest through[ ]: 变量值 的上限
Range:[ ]through highest: 变量值的下限
All other value:
剩下的尚未指定的变量可以指定为同
2.4 特定变量值计数
(2)从源变量中选择准备计数的变量移至Numeric栏中 (3)选中Numeric Variable 框中的变量,单击 Define
Values 按钮:打开Count Values within Cases: Value to Count对话框
2.4 特定变量值计数
Define Value
(1) Value: 输入要计数的特定的变量值 (2)System-missing:系统缺损值出现的次数 (3)System-or use-missing:系统缺损值或用户自定义缺损值出现的次数 (4)Range:[ ]through[ ] : 针对数值连续可变的数值型变量的计数 (5)Range: Lowest through :
标变量名,type & label 按钮定义变量类型与标签
2.2 变量计算及其运用
(4)条件表达式(if) 在 Compute Variable对话框中单击if按钮,打开if Cases 条件对话框
实习:
打开数据文件“第二章数据文件/变量计算.sav” 选择飞行员时要选择那身高与体重的比值在一
2.选择进行编码的变量名,送入input Variables——output 矩形框
3.在Output Variable 输入存放编码的新变量名和 标签,点击change按钮, 4.点击old and new values按钮
spss2-数据管理和数据转换
SPSS函数
练习:大学生心理调查数据
请对SCL90量表进行计分。
SCL90计分方法及步骤:
第一步:统计总分和总均分
总分:将所有项目分相加 总均分:总分/90。
第二步:统计各因子分
参照记分键,将各因子的项目评分相加并除以 项目数得因子分。
SCL-90各因子记分键1
因子
项目序号
项目 数
19、44、59、60、64、66、89
7
Count 对话框
用于计算某 个值或某些 值在某个变 量中出现的 次数
指定记录变量值是 否出现的变量名
定义变量值
练习:
请对SCL90量表的阳性项目数和阳性 症状均分进行计数。
阳性项目数:题项选择≥1的题目数 阳性症状均分:总分/阳性项目数
Recode
打开其他格 式的数据文 件
保存数据文 件
File菜单中 的其他条目
新建数据文件
第一步:定义变量属性 具体步骤:
选择Variable View选项卡; 定义变量名(Name); 定义变量类型(Type); 定义宽度(Width)和小数位数(Decimals); 定义变量标签(Label)和值标签(Values); 定义用户缺失值(Missing); 定义变量的显示格式(Columns和Align); 定义变量测度类型(Measure)。
定义用户缺失值对话框:
无缺失值选项, 为系统默认
离散缺失值 选项
范围并附加一个 范围外值
可供选择的变量测度类型:
Scale
(定距定比测量)
Ordinal
(定序测量)
Nominal
(定类测量)
对等间隔测度的变量或表示比值 的变量选此项,如身高、体重;
spss第二讲数据整理data、transform
38
SPSS统计软件
变量清单
将汇总变量 加入当前数
据 替代当前数
据文件 创建汇 总文件
分组变量
汇总统计 量
汇总统计量清单
39
SPSS统计软件 文件级数据整理 4.文件的拆分
操作提示:Data →Split File…
2)按班号对技能成绩大于60分的成绩进行汇总, 另存为新的数据文件。
3)以姓名定义新变量名,进行行列转置,另存为“转置.sav”。
48
SPSS统计软件
数据管理练习
3、数据:新医学生成绩.sav 要求:1)描述不同班级(号)学生的妇科和儿科平均成绩与标准差,结果保 存为“新成绩.spv”。 2)选出内科成绩大于18的学生,描述其外科成绩平均水平,结果保存为 “外科成绩.spv”。
Recode可以用于字符型变量
23
SPSS统计软件
演示:将数据transform.sav中字符型“city”变量转化为数 值型变量“newcity”。(按照字母排序)
24
SPSS统计软件 变量级数据整理:4.Rank Cases
编秩变量 分组变量
操作提示: Transform →Rank Cases
SPSS统计软件
第二讲 SPSS数据整理
课前复习
1
SPSS统计软件
SPSS的特点
SPSS操作界面----三个窗口 SPSS的保存
(新医学生成绩)
2
SPSS统计软件
SPSS数据格式
1.一条记录占一行(反映某个研究对象具体特征的一组观测值。 ) 2.一个变量占一列(测量指标) 3.SPSS数据分析时特殊数据格式(配对设计、重复测量资料数据) 最终的数据集应当包含原始数据的所有信息
SPSS 第二单元 数据文件的编辑与整理
SPSS应用 应用
Compute过程 2、Compute过程 Compute过程可以根据由若干个旧变量组成的表达 Compute过程可以根据由若干个旧变量组成的表达 式建立新变量,也可以使用SPSS函数建立新变量, SPSS函数建立新变量 式建立新变量,也可以使用SPSS函数建立新变量, 例如,在本例中要建立一个新变量, 例如,在本例中要建立一个新变量,以储存语文与 数学成绩中较好者。 数学成绩中较好者。
SPSS应用 应用
三、记录的插入和删除
插入一个记录: 1、插入一个记录:鼠标单击要插入的一行最左边的 序号单元格后,即可单击Data→Insert Cases菜单 序号单元格后,即可单击Data→Insert Cases菜单 项插入一个记录,也可单击鼠标右键,单击Insert 项插入一个记录,也可单击鼠标右键,单击Insert Cases。 Cases。 2、删除一个记录:鼠标单击要删除的记录的序号单 删除一个记录: 元格,单击Edit→Clear菜单项,或单击鼠标右键, Edit→Clear菜单项 元格,单击Edit→Clear菜单项,或单击鼠标右键, 单击Clear或直接按Delete Clear或直接按Delete键 单击Clear或直接按Delete键。
SPSS应用 应用
从左侧变量框中将一个或若干个要进行分组的变 量名选入Group on框 最多可以选择8 量名选入Group Based on框。最多可以选择8个变 量作为分组的依据。 量作为分组的依据。 如果只选择了一个变量, 如果只选择了一个变量,以后的分析会依据该变 量的每一个值分为一组,分别进行分析。例如, 量的每一个值分为一组,分别进行分析。例如,选 择性别变量,分析时分别按性别=1和性别=2 =1和性别=2把记录 择性别变量,分析时分别按性别=1和性别=2把记录 Case)分为两组进行分析。 (Case)分为两组进行分析。 如果选择了若干个变量, 如果选择了若干个变量,以后的分析将会依据所 选变量各水平的组合分组,对每组分别进行分析。 选变量各水平的组合分组,对每组分别进行分析。
spss第二章变量计算及转换
2.选择进行编码的变量名,送入input Variables——output 矩形框
3.在Output Variable 输入存放编码的新变量名和 标签,点击change按钮, 4.点击old and new values按钮
4.建立变量值与编码的对应关系
5.单击弹出对话框
(1)Old Value: 原始变量值
8.单击OK,执行给变量排秩的操作
Mean Low
High
Sequential ranks to unique values
90 1 1
1
1
1
80 2 3
2
4
2
80 3 3
2
4
2
80 4 3
2
4
2
70 5 5
5
5
3
2.7 观测量求秩
一、打开数据文件“变量重新赋值与求 秩.sav”
1.对统计成绩求秩,结的处理方式分别 选择四种mean,low,high,sequential ranks to unique values ,比较其差异。
3. SPSS内部函数(180个) (1) 算术函数 (2) 统计函数 (3) 概率函数
2.2 变量计算及其运用
Compute 命令 (1)打开数据文件,执行Transform—Compute命令
2.2 变量计算及其运用
(2)输入计算表达式。 (3)定义新变量以及类型。在Target(目标)框中定义目
始变量值的编码可以是数值型和字符型变量3如果要将数值型编码成字符型选outputvariablestring4如果原始变量值无定义则编码后产生的新变量中自动指定为系统缺损值5如果剩余的原始变量不需要再进行编码则在oldvalue选择allothervalue6若选convertnumericstringnumbers中选项则可将字符型转换为数值型7可以同时对多个变量值进行编码5
第二章 变量计算及转换
2.8替换缺失值
几种替换缺失值的方法
综合练习1
1.打开数据文件“机械厂数据文件.sav” 公司财务规定,月实发工资按照下列原则发放
(1)出勤满22天或以上者,按照“日基本工资*出勤天数+工龄 *1.8-应扣水电费”计算, 其中应扣水电费:工龄小于10年的工人为50元,工龄在11-15 年的为45元,工龄在16年以上的为40元。 (2)出勤15-21天的按照“日基本工资*出勤天数+工龄*1.2- 应扣水电费”计算 (3)出勤14天及以下的按照“日基本工资*出勤天数+工龄-应 扣水电费”计算。 (4)计算不同车间工人的月实发工资的平均值与总量。并将平均工
实习:
打开数据文件“第二章数据文件/变量计算.sav” 选择飞行员时要选择那身高与体重的比值在一定范 围内的人员,因此需要计算身高与体重的比例。前 提条件是选择身高在175——185cm之间的男生 即可。 选择所有男生中身高与体重的比值大于2.5的观测 量,并计算每个学生8门成绩总和。 对总成绩进行降序排列。
实习:
打开数据文件“变量计算.sav” 计数个案中政治课成绩与英语成绩均大于80 分的同学有哪些同学。分别用命令和语法执 行计数。
2.4 变量重新编码
2.4.1 重新编码为相同变量 2.4.2 重新编码为不同变量
2.4.2 重新编码为不同变量
1.主菜单 转换——重新编码为不同变量
2.选择进行编码的变量名,送入 数字变量→输出变量 矩形框 3.在 输出变量 输入存放编码的新变量名和标签,点击 更改 按钮, 4.点击 旧值和新值 按钮
4.建立变量值编码的对应关系
5.单击弹出对话框 (1)旧值: 原始变量值 (2)新值: 原始变量值的编码,可以是数值型和字符 型变量
《统计分析与SPSS的应用第五版》课后练习答案第3章
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第3章SPSS数据的预处理1、利用第2章第7题数据,采用SPSS数据筛选功能将数据分成两份文件。
其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。
第二份文件:选取数据数据——选择个案——随机个案样本——输入70。
2、利用第2章第7题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。
排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、利用第2章第9题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。
分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。
先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。
方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数m ean完成平均分的计算,标准差用函数SD完成标准差的计算。
数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定5、利用第2章第7题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
SPSS统计实用教程(第2版)
3、数据的排序:“Data”-“Sort Cases” 4、数据的行列互换:“Data”- “Trቤተ መጻሕፍቲ ባይዱnspose”
第二章 变量、数据文件、
5、选取个案子集:“Data”-“Select Cases” 6、数据分类汇总:“Data”-“Aggregate” 7、缺失值的替代:“Transform”- “Replace Missing
within Cases”
第二章 变量、数据文件、
5、变量的重新赋值: 为同一个变量赋值是“Transform”-“Into Same Variables” 为不同的变量赋值是“Transform”-“Into Different Variables”
6、变量的自动赋值:“Transform”-“Automatic Recode” 7、变量定义信息的查询:“Utilities” 8、变量集的定义和使用:
变量集的定义“Utilities”-“Define Variable Sets” 变量集的使用“Utilities”-“Use Variable Sets”
第二章 变量、数据文件、参数
2.5 数据文件的合并和分组
1、数据文件的纵向合并:选择“Data”菜单中 “Merge Files”的“Add cases”命令
SPSS统计分析实用教程
(第2版)
第一章 SPSS简介
社会科学统计软件包(Statistical Package for the Social Science,SPSS)是世界著名的统计 分析软件之一。经过近40年的发展,SPSS在全 球已拥有大量的用户。目前,SPSS使用 Windows的窗口方式展示各种管理和分析数据 的方法,可方便地用于特定的科研统计。
如何使用SPSS进行统计分析教程
如何使用SPSS进行统计分析教程SPSS(Statistical Package for the Social Sciences)是一个专业的统计分析软件,广泛应用于社会科学领域。
本教程将为您介绍如何使用SPSS进行统计分析。
一、数据导入与整理首先,打开SPSS软件,创建一个新的数据文件。
点击“文件”-“新建”-“数据”,命名后保存文件。
接下来,点击“变量视图”-“添加变量”,输入数据的各个字段,并设置每个字段的数据类型。
完成后,点击“数据视图”,输入具体数据,并保存文件。
二、数据描述统计在SPSS中,您可以使用各种方法进行数据描述统计。
其中最常用的是计算变量的均值和标准差。
1. 计算均值:点击“转换”-“计算变量”,在窗口中选择需要计算均值的变量,并输入计算公式(例如,MEAN(variable1, variable2))。
点击“确定”后,系统将生成一个新的变量用于存储均值结果。
2. 计算标准差:同样在“计算变量”窗口中选择需要计算标准差的变量,并输入计算公式(例如,SD(variable1, variable2))。
点击“确定”后,系统将生成一个新的变量用于存储标准差结果。
三、数据可视化除了进行数值计算外,SPSS还支持数据可视化,以便更直观地观察数据的分布情况。
1. 绘制直方图:点击“图表”-“直方图”,选择需要绘制直方图的变量,并设置图表的样式和布局。
点击“确定”后,系统将生成直方图。
2. 绘制散点图:点击“图表”-“散点图”,选择需要绘制散点图的变量,并设置图表的样式和布局。
点击“确定”后,系统将生成散点图。
四、假设检验在进行统计分析时,假设检验是一种常用的方法,用于检验样本与总体之间的差异。
1. 单样本t检验:点击“分析”-“比较手段”-“单样本t检验”,选择要进行检验的变量,并设定总体均值的值。
点击“确定”后,系统将输出检验结果,包括t值、p值等。
2. 相关分析:点击“分析”-“相关”-“双变量”,选择要进行相关分析的两个变量。
SPSS统计分析数据转换与整理
(2)复合条件表达式
又称逻辑表达式,是由逻辑运算符号、圆括
号和简单条件表达式等组成的式子。其中,逻
辑运算符号包括&或AND(并且)、|或OR (或者)、~或NOT(非)。NOT的运算优先 级最高,其次是AND,最低是OR。可以通过圆 括号改变运算的优先级。(nl<=35)and not (zc<3)
(3)在Numeric Expression框给出SPSS算术 表达式。可以手工输入,也可以按窗口的按钮 以及函数下拉菜单输入。
2020/10/17
17
(4)如果希望对符合一定条件的个案进行变量计算,则 单击If按钮,出现下面的窗口,选择Include if case satisfies condition选项,然后输入条件表达式。对 不满足条件的个案,将不进行变量值计算,对新变量 取值为系统缺失值。
SPSS统计分析数据转换与整理
本章主要内容
➢ 第一节 数据的排序 ➢ 第二节 变量计算 ➢ 第三节 数据选取 ➢ 第四节 计数 ➢ 第五节 分类汇总 ➢ 第六节 数据分组 ➢ 第七节 数据处理的其他功能 ➢ 第八节 统计图
2020/10/17
2
2.数据排序的基本操作
SPSS数据排序的基本操作步骤
在变量计算过程中涉及到几个概念:SPSS算 术表达式、SPSS条件表达式和SPSS函数。
2020/10/17
10
2.SPSS算术表达式
指出按照什么方法计算变量;
SPSS算术表达式(Numeric Expression) 是由常量、变量、算术运算符、圆括号、函数 等组成的式子。
• 字符型常量应当用引号括起来
2020/10/17
18
03-2 变量计算的应用举例
spss学习第二章
Step04:单击【确定】按钮完成操作
Step01:打开SPSS软件,选择菜单栏中的【数据】【合并 文件】【添加个案】命令,弹出【将个案添加到】对话框,如图所 示。
Step02:选择合并文件 点选【外部SPSS Statistics数据文件】单选钮,同时单击【浏览】 按钮,选中需要合并的文件,并指定文件路径,然后单击【继续】 按钮。 Step03:选择合并方法。 Step04:单击【确定】按钮,操作结束。
SPSS数据文件的建立可以利用【File(文件)】菜单中的 命令来实现。具体来说,SPSS提供了四种创建数据文件的方法: ● 新建数据文件; ● 直接打开已有数据文件; ● 使用数据库查询; ● 从文本向导导入数据文件。
2.1.1新建数据文件
打开SPSS软件后,现在菜单栏中的【文件】 【新建】【数据】命令,可以创建一个新的SPSS空数据文件。 接着,用户可以进行直接录入数据等后续工作。
SPSS具体操作步骤:
Step01:打开SPSS软件,选择菜单栏中的【数据】 【合并文件】【添加个案】命令,弹出【将个案添加到】 对话框。 Step02:点选【外部SPSS Statistics数据 文件】单选钮,然后单击【浏览】按钮,选中需要合并的文件 “2-5-2.sav,再单击【继续】按钮,如图2-33所 示。
2.2.4变量小数
变量小数位数可以设置变量的小数位数,系统默认为两 位。
2.2.5变量名标签
变量名标签增强变量名的可视性和统计分析结果的可读 性。它可用中文,总长度可达120个字符。同时该属性可以 省略,但建议最好给出变量名的标签。
2.2.6变量值标签
变量值标签是对变量的可能的取值的含义进行进一步说明。变量 值标签特别对于数值型变量表示非数值型变量时尤其有用。 定义和修改变量值标签,可以双击要修改值的单元格,在弹出的 对话框的【值】文本框中输入变量值,在 【标签】文本框中输入变 量值标签,然后单击【添加】按钮将对应关系选入下边的白框中。 同时,可以单击【改变】和【移动】按钮对已有的标签值进行修改和 剔除。最后单击【确定】按钮返回主界面。
spss教程第二章
第二章数据文件的管理(上)(医学统计之星:张文彤)最后一次更新时间:2.1 建立与保存数据文件-File菜单2.1.1 新建数据文件2.1.2.1 直接打开2.1.2.2 使用数据库查询打开2.1.2.3 使用文本导入向导读入文本文件2.1.2 打开其他格式的数据文件2.1.3 保存数据文件2.1.4 File菜单中的其他条目2.2 编辑数据文件2.2.1 定义新变量2.2.1.1 直接定义新变量2.2.1.2 从原有变量计算新变量-Transform菜单2.2.2 数据的录入2.2.2.1 直接录入2.2.2.2 数据录入技巧2.3 进一步整理数据文件-Data菜单不言而喻,一切统计分析都是以数据为基础的,因此统计软件的数据管理能力非常重要。
SPSS以其豪华的界面为依托,为用户提供的便捷的数据管理功能,下面我们就来具体看一下。
§2.1建立与保存数据文件和大多数应用软件相同,SPSS中数据文件的管理功能基本上都集中在了File菜单上,该菜单的组织结构和WORD等也极为相似,因此这里我们只介绍比较有特色的几个菜单项。
SPSS 10.0有三个主要窗口界面:数据管理窗口、程序编辑窗口和结果浏览窗口;另有两个不常用的窗口:结果草稿浏览窗口和VBs脚本语言编辑窗口。
他们共享许多菜单项,如File菜单就大部分相同,这里介绍的许多内容在五个窗口中都是通用的。
2.1.1 新建数据文件如果你正从头开始进行一个新的课题,刚刚把数据收集上来,要做统计分析,自然需要新建一个数据库,然后将所有的数据从纸上请到计算机里。
在SPSS 中,新建一个数据库容易的不得了--已经到了什么都不用做的地步!是这样,当你进入SPSS系统时,系统就已经生成了一个空数据文件,即你看到的空白的数据管理界面。
你只要按自己的需要定义变量,输入数据然后存盘就是了(这些操作马上会讲到)。
2.1.2 打开其他格式的数据文件凡是做过数据输入工作的人都知道:这活又费眼睛又累人,出错太多了还要挨批评,非常影响个人的光辉形象。
SPSS基本操作步骤详解
SPSS基本操作步骤详解本文采用SPSS21.0版本,其它版本操作步骤大体相同一、基本步骤(一)检查数据在进行项目分析或统计分析之前,要检核输入的数据文件有无错误,即检核missing。
例,“XX量表”采用Likert scale五点量表式填答,每个题项的数据只有五个水平:1,2,3,4,5。
1.执行次数分布表的程序Analyze(分析)→Descriptive statistics(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Frequencies(频率)→Statistics(统计量)→Minimum (最小值)、Maximum(最大值)→Continue(继续)→OK(确定)2.执行描述统计量的程序Analyze(分析)→(描述统计)→将题项变量【例,a1—a10】键入至Variables(变量)框中→Descriptives(描述)→Options(选项)→Minimum(最小值)、Maximum(最大值)【此处一般为默认状态即可】→Continue(继续)→OK(确定)(二)反项计分若是分析的预试量表中没有反向题,则此操作步骤可以省略;量表或问卷题中如果有反向题,则在进行题项加总之前将反向题反向计分,否则测量分数所表示的意义刚好相反。
例,“XX量表”采用Likert scale五点量表式填答,反向题重向编码计分:1→5,2→4,3→3【可不写】,4→2,5→1。
Transform(转换)→Recode into same Variables(重新编码为相同变量)→将要反向的题目键入至Variables(变量)框中【例,a1,a3,a5】→Old and new values(旧值和新值)→在左边Old value—value中键入1,在右边New value—value中键入5,Add (添加)→……依次进行此步骤……在左边Old value—value中键入5,在右边New value —value中键入1,Add(添加)→Continue(继续)→OK(确定)【注意不同量表计分方式不同,因而反向编码计分也不同,常见的有四点量表、五点量表和六点量表等】(三)题项加总量表题项加总的目的在于便于进行观察值得高低分组。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
59赋值为1,60~69赋值为2,70~79赋 值为3,80~89赋值为4,大于90分的赋 值为5。 2.大于59分小于80分的取原值,其余值 定义为缺失值
2.6 连续变量离散化
(1)执行Transform---Categorize 命令,打开Categorize 对话框
(2)从源变量列表中选择一个或几个连续的变量移入 Create Categorize,在Number of Categorize输入整数
A 经常见,到处都是 B一般 C 很少见到 D 从来没见过
11.您认为分类垃圾筒上的分类标记容易理解吗?
A非常容易理解 B比较容易理解 C一般 D比较不容易理解 E非常不理解
12.您对现在投入使用的分类垃圾箱满意吗? A非常满意 B比较满意 C一般 D比较不满意 E 非常不满意
一、在学号变量的后面加入下面两个新的变量, 13.您的性别 A男性 B女性 14.您的出生地区:A 省会城市 B地级市 C小城镇
变量值上限 (6)Range:[ ] through highest:
变量值下限
2.4 特定变量值计数
(4)如果按指定的条件计数,单击If按钮,在设置条件 单击Continue返回主对话框,单击OK执行计数。
实习:
打开数据文件“变量计算.sav” 计数观测量中政治课成绩与英语成绩均
大于80分的同学有哪些同学。
(2)出勤15-21天的按照“日基本工资*出勤天数+工 龄*1.2-应扣水电费”计算
(3)出勤14天及以下的按照“日基本工资*出勤天数+ 工龄-应扣水电费”计算。
(4)计算不同车间工人的月实发工资的平均值与总量。
并将平均工资与总工资分别按照在一张表格与分车间的形式分别 输出。
综合实习
下面是一份关于垃圾分类现状的调查,请 根据调查问卷建立一个数据文件,然后 做后面的练习。
3. SPSS内部函数(180个) (1) 算术函数 (2) 统计函数 (3) 概率函数
2.2 变量计算及其运用
Compute 命令 (1)打开数据文件,执行Transform—Compute命令
2.2 变量计算及其运用
(2)输入计算表达式。 (3)定义新变量以及类型。在Target(目标)框中定义目
D 农村 二、到网络课堂的电子课间处下载“垃圾分类”文件
夹,把自己回答问卷的信息以一个观测量的形式录 入到“垃圾分类调查.sav”数据文件中,并以学号为 文件名保存起来,发送到网络课堂的作业“垃圾分 类综合练习”中。进入网络课堂——主题——垃圾 分类综合练习第二步,下载其他同学输入的信息, 并将其他同学的信息合并到你的数据文件中,至少 合并10个观测量。
一个编码
(2)输入原始变量值对应的编码
Value:
原始变量值对应一个具体的编码
System-missing: 原始变量值对应的编码是系统缺损值
(3)单击Continue返回主对话框
5.主对话框中单击“OK”,执行编码操作
2.5.2 变量重新赋值给新的变量
1.主菜单Transform选择Recode-Into Different Variable
A 环保意识差 B 生活习惯 投垃圾 E 其它________
C 国家相关法律法规不健全 D 别人也是乱
9.您认为能促使您将垃圾分类投放的因素是? A环保意识 B生活习惯 C 国家相关法律法规 D 别人是否乱投垃圾 E其它________
10.您在平时生活中经常见到分类垃圾筒吗?(若选D则直接跳到第12题)
6.排秩的类型,单击Rank Type
2.7 观测量求秩
(1)Rank:
普通秩
(2)Savage score: 基于指数分布规律计算出的一种秩
(3)Fractional rank: 分数形式的秩
(4)Fractional rank as %: 百分比形式的秩
(5)Sum of weights: 加权观测量的总和
2.5 变量重新赋值
Range:[ ]through [ ]:
连续取值的变量与编码的对应关系
Range:Lowest through[ ]: 变量值 的上限
Range:[ ]through highest: 变量值的下限
All other value:
剩下的尚未指定的变量可以指定为同
6.是否会自己尝试搜集并学习有关垃圾分类的知识? A会 B看情况 C不会 D无
7.您认为影响你将垃圾分类投放的因素是?
A 我认为没有必要将垃圾分类 B不方便,垃圾分类标准不明确 C找不 到分类垃圾箱 D对分类垃圾箱的标记不理解 E没有这方面的规定 F 其他
8.您认为影响垃圾分类深入人心的最重要的因素是什么?
2.选择进行编码的变量名,送入input Variables——output 矩形框
3.在Output Variable 输入存放编码的新变量名和 标签,点击change按钮, 4.点击old and new values按钮
4.建立变量值与编码的对应关系
5.单击弹出对话框
(1)Old Value: 原始变量值
标变量名,type & label 按钮定义变量类型与标签
2.2 变量计算及其运用
(4)条件表达式(if) 在 Compute Variable对话框中单击if按钮,打开if Cases 条件对话框
实习:
打开数据文件“第二章数据文件/变量计算.sav” 选择飞行 变量重新赋值
4.单击Old and New value 弹出对话框
(1)建立变量值与编码的对应关系
Value: System-missing: System-or user-missing:
输入原始的变量值 系统缺损值与自定义编码的对应关系 系统缺损值或用户自定义的缺损值与 编码的对应关系
(6)若选Convert numeric string to numbers 中选项, 则可将字符型转换为数值型
(7)可以同时对多个变量值进行编码
5.通过条件表达式建立参与编码的观测量子集
6.单击OK执行编码
实习:
打开数据文件“变量重新赋值与求秩.sav” 1.将统计学成绩“stat”重新赋值:小于
二、打开数据文件“变量计算.sav”
1.对所有学生的总成绩进行按降序求秩。
2.对学生的总成绩分班级排列名次。
1.打开数据文件“机械厂数据文件.sav”
公司财务规定,工资按照下列原则发放
(1)出勤满22天或以上者,按照“日基本工资*出勤天 数+工龄*1.8-应扣水电费”计算,
其中应扣水电费:工龄小于10年的工人为50元,工龄 在11-15年的为45元,工龄在16年以上的为40元。
第2章 变量计算及转换
2.1 SPSS内部函数 1、SPSS基本运算
算术运算符及意义 关系运算符及意义 逻辑运算及意义
+
加法 =
等于
&(AND) 与
-
减法 >
大于
|(OR) 或
*
乘法 <
小于
~(NOT) 非
/
除法 ≥ 大于等于
**
乘幂 ≦ 小于等于
( ) 括号 ≠ 不等于
第2章 变量计算及转换
2. SPSS表达式 (1) 算术表达式 A+B (2) 关系表达式 A>B (3) 逻辑表达式 A>b&C=6 逻辑运算中优先级的顺序为:最高级为not, 其次为and,最后为or。
定范围内的人员,因此需要计算身高与体重的 比例。前提条件是选择身高在175——185cm 之间的男生即可。 选择所有男生中身高与体重的比值大于2.5的 观测量,并计算每个学生8门成绩总和。 对总成绩进行降序排列。
2.3 设定随机数种子
Transform---Random Number seed(随机数种子)命令, 打开Random Number seed对话框
(6)Ntiles:
按百分比进行分组
结的处理方式选择: Ties
(1)Mean: 出现同秩变量时,新变量的值取平均 值
(2)Low: 出现同秩变量时,新变量的值取最小值 (3)High: 出现同秩变量时,新变量的值取最大
值 (4)Sequential ranks to value:
出现同秩变量时,新变量连续取值ties
2.4 特定变量值计数
(2)从源变量中选择准备计数的变量移至Numeric栏中 (3)选中Numeric Variable 框中的变量,单击 Define
Values 按钮:打开Count Values within Cases: Value to Count对话框
2.4 特定变量值计数
Define Value
2.6 连续变量离散化
实习:连续变量离散化
打开数据文件“变量计算.sav” 将所有观测量按照身高分成等比例的四
组。 统计四组不同身高同学的平均身高,请
在同一张表格中输出平均身高的值以便 于比较。
2.7 观测量求秩
1.执行Transform ----Rank cases
观测量求秩主对话框
8.单击OK,执行给变量排秩的操作
Mean Low
High
Sequential ranks to unique values
90 1 1
1
1
1