薛薇第四版SPSS第三章
SPSS第三章
3.6 数据分组
► 3.6.1
数据分组的目的
对定距型数据进行整理和粗略把握其分布的工具; 对定距型数据进行整理和粗略把握其分布的工具; 数据分组就是按照统计研究的需要, 数据分组就是按照统计研究的需要,将数据按照某种标准重新 划分为不同组别, 划分为不同组别, 在分组的基础上进行频数分析,可以把握数据的分布, 在分组的基础上进行频数分析,可以把握数据的分布,另外还 能实现数据的离散化处理; 能实现数据的离散化处理;
►菜单 菜单Transform
3.3 数据选取
► 数据选取就是根据分析需要,从大量数据中按 数据选取就是根据分析需要,
照一定规则抽取部分数据参与分析的过程。 照一定规则抽取部分数据参与分析的过程。 3.2.1 数据选取的目的: 数据选取的目的: 提高数据分析效率; 提高数据分析效率; 少量抽取的样本可以大大提高分析效率; 少量抽取的样本可以大大提高分析效率; 要注意偏差; 要注意偏差; 检验模型的需要,一部分样本用于建模, 检验模型的需要,一部分样本用于建模,其 他用于检验模型。 他用于检验模型。
► ►
举例 计算是针对每个个案进行的, 计算是针对每个个案进行的,每个个案都 有计算结果。 有计算结果。
3.2.3 SPSS的条件表达式 SPSS的条件表达式
► 对不同组的个案进行不同的计算,例如,按照职 对不同组的个案进行不同的计算,例如,
称加工资,或者按照收入征缴个人税等等; 称加工资,或者按照收入征缴个人税等等; ► SPSS中的条件表达式就是用来完成这个功能; SPSS中的条件表达式就是用来完成这个功能 中的条件表达式就是用来完成这个功能; ► 简单的条件表达式是用<、>、=、~=、>=、 简单的条件表达式是用< ~=、>=、 <=符号连接的两个量 常量或者变量,例如: <=符号连接的两个量,常量或者变量,例如: 符号连接的两个量, n1>35; n1>35; ► 复合条件表达式又称逻辑表达式,是由逻辑运算 复合条件表达式又称逻辑表达式, 圆括号和简单条件表达式构成; 符、圆括号和简单条件表达式构成; ► 如果给出条件表达式,那么就只对满足条件的个 如果给出条件表达式, 案进行计算,举例。 案进行计算,举例。
数据描述方法
课程大纲 1 统计学基本概念、数据收集和数据描述
2 线性回归分析和广义线性模型SPSS上机 3 聚类分析 + SPSS上机 4 判别分析 + SPSS上机 5 主成份+ 因子分析、 6 对应分析+SPSS上机
统计学的定义
•统计学(statistics) 是‚收集、分析、展 示和解释数据的科学‛
什么地方统计用得上呢?
原始数据(一手数据,Primary data
- 要去收集 - 用科学的方法 书:抽样调查(sampling techniques) -例子:预测美国总统大选结果 某个决策的民意调查 中国人口普查
原始数据收集方法
试验数据(experimental data) 观测数据(observational data) -电话调查(Telephone survey) - 邮寄问卷( Mail questionnaires) -直接观测和面对面访问(Direct observation and personal interview)
5. 多级抽样(multistage sampling)。在群 体很大时,往往在抽取若干群之后,再在 其中抽取若干子群,甚至再在子群中抽取 子群,等等。最后只对最后选定的最下面 一级进行调查。
例:在全国调查时,先抽取省,再抽取市 地,再抽取县区,再抽取乡、村直到户。
抽样方法的选择不能一概而论
• 实际上每个抽样通常都可能是各种抽样方 法的组合。如: 在多级抽样中的每一级也 可采取各种抽样方法。此时,整个抽样计 划可能比较复杂,也称为多级混和型抽样 • 制定抽样方案时既要考虑精确度,还要根 据客观情况考虑方便性、可行性和经济性。 不能一概而论。
普查和抽样框
• 当然,也有可能试图调查所有的人(比 如人口普查), 叫做普查(census).
《统计分析与SPSS的应用总结归纳(第五版)》课后测试答案(第3章)
精心整理《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第3章SPSS数据的预处理1、利用第2章第7题数据,采用SPSS第一份数据文件存储常住地是“至5000之间的调查数据;据。
第一份文件:选取数据数据——存款<5000&常住地=沿海或中心繁华城市。
2、、收入水平(升序)、存款金额排序存款金额作为排序依据分别设置3、按得优课程数的降序排序。
计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。
分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。
先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。
方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。
数据——分类汇总——数据集并命名)——确定5、利用第2章第7限和组距进行组距分组。
设定6、在第“今年的收入比去年增加”且“预计未来SPSS的计数转换————将“今年的收入比去年增加”和“预计未来一两年收入仍会增加”两个变量选中——定义值。
7、对第2章第4题数据,选择恰当的加权变量进行加权处理进而还原为原始数据为后续分析做准备。
数据——加权个案——点击加权个案——将人数作为频率变量——确定。
8、利用SPSS的变量计算功能,随机生成服从标准正态分布的100个样本数据。
⑴在空表中先列100个序号,激活表。
⑵转换✍随机数生成器✍设置起点✍勾选“随机”⑶转换✍计算变量✍目标变量:随机数✍数字表达式:RV.NORMAL(0,1) ✍确定结果:9、简述SPSS排序功能与拆分功能的不同点。
spss第3章
3.9 数据文件求转置
转置改变数据的结构,行列互换
打开【Transpose】对话框:【Data】 【Transpose】
选定转置变量:将源变量表列中的变量移至 【Variable】框中
选定哪个变量为新文件的变量名,如果不选,则 系统自动定为var0001 var0002等
转置时应注意变量的数据类型
第三章数据处理
第三章 数据处理
【Transform】【Rank cases】生成秩变量
【Compute】计算赋值 【Count】计数赋值 【Recode】条件赋值 【Automatic Record】自动赋值
变量 操作 产生 新变量
【Data】【Sort】排序
【Select cases】抽样 【Weight Cases】加权
选择求秩方法:按【Rank Type】按钮
3.1生成秩分变量
Rank Type
Rank. 生成变量为秩分变量。 Savage score. 新变量按指数分布,由负到正,均
值为0。 Fractional rank. 新变量值为秩分数除以有效case
的权重之和。
Fractional rank as percent. 新变量是Fractional rank的百分数。
操作将改变文件中样本的顺序
3.7 样本抽样
样本抽样:选择所需样本 P59 【Data】【Select cases】,打开对话框
选择抽样的方式: 全选: 系统默认方式--(All cases) 条件选择抽样:选择【If condition is satisfied】 【If】按钮设置条件 生成过滤变量 随机抽样: 选择【Random sample of cases】 按【Sample】按钮 生成过滤变量 指定抽样: 选择【Base on time or case range】 按【Range】按钮 过滤抽样: 以某一个变量为过滤变量,其值不为 0被选中,0为未选中.
薛薇-《SPSS统计分析方法及应用》第三章--数据预处理
(3)随机抽样( Random sample of cases ),即对 数据编辑窗口中的所有个案进行随机筛选,包括如 下两种方式:
第一,近似抽样(Approximately) 近似抽样要求用户给出一个百分比数值,SPSS
将按照这个比例自动从数据编辑窗口中随机抽取相 应百分比数目的个案。
注:由于SPSS在样本抽样方面的技术特点,抽 取出的个案总数不一定恰好精确地等于用户指定的 百分比数目,会有小的偏差,因而称为近似抽样。
二、选取的基本方式 (1)选取全部数据(All cases) (2)按指定条件选取( If condition is satisfied ) SPSS要求用户以条件表达式给出数据选取
的条件,SPSS将自动对数据编辑窗口中的所有 个案进行条件判断。那些满足条件的个案,即 条件判断为真的个案将被自动选Байду номын сангаас出来,而那 些条件判断为假的个案则不被选中。
变量排序。
数据计算的目的:数据的转换处理是在原有数据的基础上,计算产 生一些含有更丰富信息的新数据。例如根据职工的基本工资、失业 保险、奖金等数据,计算实际月收入,这些新变量具有更直观更有 效的特点。
SPSS变量计算是在原有数据的基础上,根据用户给出的SPSS算术 表达式以及函数,对所有个案或满足条件的部分个案,计算产生一 系列新变量。(1)变量计算是针对所有个案(或指定的部分个案) 的,每个个案都有自己的计算结果。(2)变量计算的结果应保存 到一个指定变量中,该变量的数据类型应与计算结果的数据类型相 一致。
(5)通过过滤变量选取样本( Use filter variable ), 即依据过滤变量的取值进行样本选取。要求指定一 个变量作为过滤变量,变量值为非0或非系统缺失 值的个案将被选中。这种方法通常用于排除包含系 统缺失值的个案。
薛薇SPSS统计分析方法及应用数据录入与数据获取共48页文档
6、最大的骄傲于最大的自卑都表示心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂,怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿
薛薇SPSS统计分析方法及应用数据 录入与数据获取
16、自己选择的路、跪着也要把它走 完。 17、一般情况后 才能更 辉煌。
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所向披 靡。
Thank you
薛薇-《SPSS统计分析方法及应用》第3章--SPSS-数据的预处理
4) 数据排序应用举例
• 对居民储蓄存款调查数据,利用排序的方法找出城镇居 民和农村居民一次性存款的最大值和最小值。 • 操作:户口,升序;存款额,升序。
6
2 变量的计算
• 在统计分析过程中,为了更有效的反映事物的本质,有 时需要对变量的数据进行加工整理,产生新变量和计算结果。 • 比如计算一个变量的倍数,计算几个变量的和、差,计 算变量的绝对值、平方等等。 • 因此,变量的计算是日常工作中经常遇到的(38-43自 行记忆)
11
2 变量的计算
4) 条件语句编辑 • c) 在这里可以输入筛选条件。需要说明的是, 每次只能编辑一个筛选条件,不能同时编辑多个筛 选条件。 • 对应工资上浮5%的条件是职称值等于1,高级 工程师。在编辑框输入表达式:zc=1
• 点击条件语句编辑窗口的Continue按钮,退回 到表达式编辑框,点击OK按钮,高级工程师的实发 工资计算完成。
2) 定义结果变量
a) 在Target Variable(目标变量)的编辑框中输入生成的 新变量名称,这时的变量可以是新变量,也可以是原有变量。 b) 如果输入的变量名在数据文件中已经存在,满足条件个 案新变量的值将替换旧变量对应的值,其它值不变。 c) 新变量的数据类型默认为数值型,点击Type&Label按 钮,在弹出的对话框中可以定义新变量的数据类型和标签。
无职称
• 这时变量sfgz所在的列将不再有缺失值。
13
2 变量的计算
6) 计算方法的不足
• 变量的计算,无法一次将不同条件的表达式集中编写, 只能一个条件表达式运行一次。
spss第三章课后答案详细步骤
1、利用第2章第7题数据,采用SPSS数据筛选功能将数据分成两份文件。
其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据:第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据数据一选择个案一如果条件满足一存款>= 1000&存款<5000&常住地=沿海或中心繁华城市。
第二份文件:选取数据数据一选择个案一随机个案样本一输入70。
2、利用第2章第7题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。
排序数据一排序个案一把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、利用第2章第9题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算转换一对个案内的值计数输入目标变量及日标标签,把所有课程选取到数字变量,定义值一设分数的区间,之后再排序。
4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法- -:利用描述性统计,数据一转置学号放在名称变量,全部课程放在变量框中,确.定后,完成转置。
分析--描述统计一描述,将所有学生变量全选到变量框中,点击选项勾选均值、标准差。
先拆分数据_ 拆分文件按性别拆分,分析一描述统计一描述,全部课程放在变量框中,选项一均值。
方法二:利用变量计算,转换--计算变量分别输入日标变量名称及标签一--均值用函数mean完成平均分的计算,标准差用的数SD完成标准差的计算。
数据一分类汇总一性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)一确定5、利用第2章第7题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
根据存款金额排序,观察其最大值与最小值,算出组数和组距。
转换重新编码为其他变量一将存款金额作为输出变量一定义输出变量的名称及标签一设定旧值和新值.6、在第2章第7题数据中,如果认为调查中“今年的收入比去年增加”月.预计未来一两年收入仍会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。
《基于spss的数据分析(第四版)》第三章SPSS数据的预处理
SPSS数据的预处理
主要内容
个案排序 变量计算 数据分组 个案选取 计数 分类汇总 指定加权变量
数据排序
目标:排序在数据分析中的作用? 快速找到可能的离群点
手段:将所有个案按照用户指定的某一个或多个变 量的变量值的升序或降序重新排列
菜单选项: 数据 -> 排序个案
注意: (1)排序的次序:升序、降序。 (2)多重排序,选择变量名的次序很关键。
(1)从不 (2)偶尔 (3)有时 (4)经常 3、 在公众场合下你会大声发表自己的意见
(1)从不 (2)偶尔 (3)有时 (4)经常 •极为内向:3分;较为内向:6分;较为外向:9分;极为外向: 12分
个案选取
目标:个案选取的意义? 手段:从现有数据中选出部分数据
按条件选取;随机选取;选取指定区间中的样本
SPSS的区间 狭义区间:
职工工资的分组(850以下,851至900,901至 950,951至1000,1000以上)
广义区间:
用户缺失值的定义;变量类别的重新调整
数据分组
•性格打分(内向、一般、外向) 1、与生人交往会“自来熟”
(1)从不 (2)偶尔 (3)有时 (4)经常 2、与不熟悉的异性交往,会脸红
分类汇总
目标:分析各分组下样本的统计特征 手段:
按指定的分组变量值对样本分组 分别计算各组中汇总变量的基本统计量 例:对比男女职工的平均年龄和平均工资
性别
年龄
奖金
男
40
1000
女
35
550
男
20
200
性别_1 男 女
年龄_1 30 35
奖金_1 600 550
原始数据
按性别变量汇总数据
薛薇SPSS统计分析方法及应用概述PPT课件
IBM成功收购SPSS后,其名称又发生了改变,总 称为 IBM SPSS,包括四个部分:统计分析、数据 挖掘、数据收集、企业应用服务
第15页/共21页
主窗口菜单及功能
菜单名
功能
解释
File
文件操作 对相关文件进行基本管理(如新建、打开、保存、打印等)。
Edit
数据编辑
对数据编辑窗口中的数据进行基本编辑(如撤销/恢复、剪切、复制、粘贴),并 实现数据查找、软件参数设置等功能。
View
窗口外观状 对窗口外观进行设置(如状态栏、表格线、变量值标签等是否显示、字体设置
第1页/共21页
SPSS原是为大中型计算机开发的,面向企事业单 位用户。
20世纪80年代初,微机开始普及以后,它率先推 出了微机版本(统称为SPSS/PC版),占领了微 机市场,大大地扩大了自己的用户量。
20世纪90年代,Microsoft推出操作系统Windows 后,SPSS迅速向Windows移植(统称为SPSSfor Windows版)。
第7页/共21页
3 . SPSS的基本操作环境-4个窗口
(1)数据编辑窗口 (2)结果输出窗口 (3)语法编辑窗口 (4)脚本窗口
第8页/共21页
一 、数据编辑窗口 窗口标题:data editor 功能:对SPSS的数据文件进行录入、 修改、管理等
基本操作的窗口。 组成:窗口主菜单、工具栏、数据编辑区、状态显示
第16页/共21页
《统计分析与SPSS的应用第五版》课后练习答案第3章
《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第3章SPSS数据的预处理1、利用第2章第7题数据,采用SPSS数据筛选功能将数据分成两份文件。
其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。
第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。
第二份文件:选取数据数据——选择个案——随机个案样本——输入70。
2、利用第2章第7题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。
排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。
3、利用第2章第9题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。
计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。
分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。
先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。
方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数m ean完成平均分的计算,标准差用函数SD完成标准差的计算。
数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定5、利用第2章第7题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。
薛薇SPSS统计分析方法及应用数据录入与数据获取共48页文档
END
•
29、在一切能够接受法律支配的人类 的状态 中,哪 里没有 法律, 那里就 没有自 由。— —洛克
•
30、风俗可以造就法律,也可以废除 法律。 ——塞·约翰逊
录入与数据获取
16、业余生活要有意义,不要越轨。——华盛顿 17、一个人即使已登上顶峰,也仍要自强不息。——罗素·贝克 18、最大的挑战和突破在于用人,而用人最大的突破在于信任人。——马云 19、自己活着,就是为了使别人过得更美好。——雷锋 20、要掌握书,莫被书掌握;要为生而读,莫为读而生。——布尔沃
薛薇SPSS统计分析方法及的 ,但是 为了生 存,我 们不得 不为自 己编织 一个笼 子,然 后把自 己关在 里面。 ——博 莱索
•
27、法律如果不讲道理,即使延续时 间再长 ,也还 是没有 制约力 的。— —爱·科 克
•
28、好法律是由坏风俗创造出来的。 ——马 克罗维 乌斯
薛薇-《SPSS统计分析方法及应用》第三章--数据预处理
数据计算的目的:数据的转换处理是在原有数据的基础上,计算产 生一些含有更丰富信息的新数据。例如根据职工的基本工资、失业 保险、奖金等数据,计算实际月收入,这些新变量具有更直观更有 效的特点。
SPSS变量计算是在原有数据的基础上,根据用户给出的SPSS算术 表达式以及函数,对所有个案或满足条件的部分个案,计算产生一 系列新变量。(1)变量计算是针对所有个案(或指定的部分个案) 的,每个个案都有自己的计算结果。(2)变量计算的结果应保存 到一个指定变量中,该变量的数据类型应与计算结果的数据类型相 一致。
二、选取的基本方式 (1)选取全部数据(All cases) (2)按指定条件选取( If condition is satisfied ) SPSS要求用户以条件表达式给出数据选取
的条件,SPSS将自动对数据编辑窗口中的所有 个案进行条件判断。那些满足条件的个案,即 条件判断为真的个案将被自动选取出来,而那 些条件判断为假的个案则不被选中。
达式。 依据职称级别计算实发工资 (sr-bx)*0.5(0.3)
3.3 数据选取
一、数据选取的目的 数据选取就是根据分析的需要,从已收集到的大批
量数据(总体)中按照一定的规则抽取部分数据 (样本)参与分析的过程,通常也称为抽样。 SPSS可根据指定的抽样方法从数据编辑窗口中选 出部分样本以实现数据选取,这样后面的分析操作 就只针对选出的数据,直到用户取消这种选取为止。 提高数据的分析效率,检验模型的需要(部分数据 参与建模,剩余用于模型检验)
(3)随机抽样( Random sample of cases ),即对 数据编辑窗口中的所有个案进行随机筛选,包括如 下两种方式:
第一,近似抽样(Approximately) 近似抽样要求用户给出一个百分比数值,SPSS
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
职工工资的分组(850以下,851至900,901至950,951 至1000,1000以上) 用户缺失值的定义;变量类别的重新调整
广义区间:
数据分组
•性格打分(内向、一般、外向)
1、与生人交往会“自来熟” (1)从不 (2)偶尔 (3)有时 (4)经常
2、与不熟悉的异性交往,会脸红 (1)从不 (2)偶尔 (3)有时 (4)经常
如:(nl>32) and (sr<=700) 如:(nl=32) | (sr<>700) 如: not xb=1
个案选取
目标:个案选取的意义? 手段:从现有数据中选出部分数据
按条件选取;随机选取;选取指定区间中的样本
例:对住房调查数据 挑出本市户口的样本 随机挑出70%的样本 注意:以后的操作都针对选出的数据进行
年龄 40 35 20 奖金 1000 550 200
性别_1 男 女 年龄_1 30 35 奖金_1 600 550
性别 男 女 男
原始数据
按性别变量汇总数据
分类汇总
菜单选项: 数据 -> 分类汇总
说明:
多重分组时,变量名的选择顺序。 生成的新文件名默认为:aggr.sav。可修改。 生成的新变量名默认为原变量名后加_1。可修 改 可以在新文件中存贮各分组个案数.计数Fra bibliotek目标:
例:学生成绩整体状况的分析 例:住房满意程度的粗略分析
手段:对所有或部分个案,计算若干个变量中有 几个变量的值落在指定的区域内,并将结果存入 新变量中 例: 学生成绩得优门次的整体状况分析 住房满意程度的粗略分析
数据分组
目标:更好地了解连续型变量的分布特点 手段:组距分组 指定按哪个变量分组;定义分组区间(不重不漏); 指定存放分组结果的组标志变量 SPSS的区间 狭义区间:
数以及SPSS变量名组成的式子。
变量计算
(4) SPSS函数 算术函数 统计函数 分布函数 逻辑函数 字符串函数 缺失值函数 日期时间函数 其他函数
Abs() sqrt() rnd() trunc() mod() mean() sd() sum() cfvar() max() min() normal() uniform() rv.() cdf.() idf.() range() any() index() length() lower() lpad() ltrim() substr() missing() sysmis()
变量计算
目的:产生新变量或对原变量进行必要的转换 (如:预测问题 产生比率数据 偏态数据的正态处理 时间序列的平稳处理等) (1)含义:根据用户给出的SPSS算术表达式,对所有 或部分样本数据进行加工。 (2)菜单选项: 转换-> 计算变量; 如果按钮 (3)SPSS算术表达式:
由算术运算符(+ 、-、 *、 /、 **)、SPSS函
第三章
SPSS数据的预处理
主要内容
个案排序 变量计算 数据分组 个案选取 计数 分类汇总 指定加权变量
数据排序
目标:排序在数据分析中的作用? 快速找到可能的离群点 手段:将所有个案按照用户指定的某一个或多个 变量的变量值的升序或降序重新排列 菜单选项: 数据 -> 排序个案 注意: (1)排序的次序:升序、降序。 (2)多重排序,选择变量名的次序很关键。
指定加权变量
目标: 例:蔬菜的平均价格、男足打分 手段:指定某一变量为加权变量 例:蔬菜的平均价格 菜单选项: 数据 -> 加权个案 说明:
如果取消加权变量应重新定义
3、 在公众场合下你会大声发表自己的意见
(1)从不 (2)偶尔 (3)有时 (4)经常
•极为内向:3分;较为内向:6分;较为外向:9分;极为外向: 12分
分类汇总
目标:分析各分组下样本的统计特征 手段: 按指定的分组变量值对样本分组 分别计算各组中汇总变量的基本统计量 例:对比男女职工的平均年龄和平均工资
变量计算
(5)SPSS条件表达式:由SPSS关系运算符、逻辑运算 符、SPSS函数以及SPSS变量名组成的式子。
关系运算符: > (大于)、<(小于)、=(等于)、 ~=(不等于)、>=(大于等于)、<=(小于等于)
如:nl>32、sr<=700
逻辑运算符:&(AND):并且、|(OR):或者、 ~(NOT):非