spss软件应用3(1)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变量标签
生成的新变量:
练习
• 用zong.sav数据库练习日期变量计算
– 计算儿童年龄(天) – 计算儿童年龄(月)
通过计算产生新变量
compute
Compute菜单特点
• 目标变量可以是新变量,也可以是已有的变量( 此时系统会弹出提示对话框加以确认)。 • 赋给变量的值可以是一个常数(数值、日期等) ,也可以是从已有变量值或系统函数计算而来的 值。SPSS提供了多达70余种的系统函数(数值变 换、时间变换、统计概率计算等)。 • 操作记录可以是所有case,也可以设定逻辑条件 ,即只对满足条件的记录加以赋值。其余记录的 相应变量或保持原状或被赋为缺失值。
RECODE bmi (28.0 thru Highest=3) (24.0 thru 28.0=2) (18.0 thru 24.0=1) INTO bmi_gr . EXECUTE .
也可以如下赋值:增加小数点位数
练习
• 打开data1.sav数据,根据已产生变量 BMI进行分组:
– 正常 – 超重 – 肥胖
SPSS软件应用(3)
北京大学公共卫生学院
授课教师:张敬旭
变量编辑和转换-2
• • • • 日期的计算 计算产生新变量 赋值产生新变量 统计分析:求变量的频数
日期计算
Date/Time
用日期与时间进行计算
两个日期之间的计算
Date1与Date2之差
以“天”为单位
结果变量:day,单位 为“天”
• 全距=176-144=32cm
• 组距=全距/10=32/10≃3cm(四舍五入) • 组段:上限、下限
– 144~146.99 – 147~149.99 – …… – 174~176
重新赋值(重新编码新变量组段) Recode Into different variables
旧及新的变量值
如果数据Байду номын сангаас 最大值,最大 组应该写出 上限
组段生成方法: a.为变量中表示各组的值加数值标签 b.在结果输出表格中修改
30名儿童身高的频数分布
身高组段(cm) 144~ 147 ~ 150 ~ 频数 1 1 1 频率(%) 3.3 3.3 3.3 累计频率(%) 3.3 6.7 10.0
153 ~ 156 ~ 159 ~ 162 ~ 165 ~ 168 ~ 171 ~ 174 ~177
• SPSS直接输出的是精确频数表 • 传统意义频数表(分布表)的作用: 了解计量资料的分布规律。
– 制作传统意义上的频数表需要利用 Record过程对相应变量进行重新赋值即 可。
• 频数表的编制 编制步骤: 1. 求极差(又称全距)R; 2. 确定组数n、组距i,并写出组段; 3. 列表划记。
合计
4 5 8 3 2 3 1 1 30
13.3 16.7 26.7 10.0 6.7 10.0 3.3 3.3 100.0
23.3 40.0 66.7 76.6 83.3 93.3 96.7 100.0 -
频数分布的两个特征:
集中趋势与离散趋势
频数分布的类型: 对称分布与偏态分布(集中位置偏向小的一 侧叫正偏态,反之叫负偏态) 频数表的主要用途: 1. 揭示分布类型 2. 发现特大值和特小值 3. 计算集中趋势指标与离散趋势指标
定义新的变量名:bmi _ gr
根据BMI判断肥胖与否
新值及旧值变量
根据bmi对记录进行分组,bmi: 正常:18.0-23.9; 超重:24.0-27.9;肥胖:>=28.0。
问题:当bmi=23.91时,bmi_gr的取何值?
根据上述recode方法, bmi_gr为缺失值!
解决办法:从大到小赋值
Compute命令
– 第三步定义已生成变量LBW=2,同时点击 “IF”子对话框。 – 第四步定义条件,即birthw2500克
SPSS对话框如下:
• 计算BMI指数
– 公式BMI=体重(kg)/身高(m)2 – SPSS程序:transform菜单下打开compute 子菜单
产生一个新变量:bmi=体重/((身高)**2)
• 分析组段频数表,结果输出窗口显示结果 (统计描述) • --Analysze → Descriptive Statistics
→frequencies
注意:每一列的涵义 能看出什么规律?
注意:SPSS的输出结果文件为*.spo
组段应该写 成区间,而且 含下限不含 上限
Valid 144~ 147~ 150~ 153~ 166~ 159~ 162~ 165~ 168~ 171~ 174~177 Total Fr equ ency 1 1 1 4 5 8 3 2 3 1 1 30
要求:根据出生体重小于2500克划分低出生体重 组(=1)和正常出生体重组(=0)(系统默认)
• Transform菜单
Compute命令
新变量数据库
• 如果出生体重小于2500克划分低出生体重组(=1)
和正常出生体重组(=2),则需要使用“IF”对话框.
– 第一步同上面操作
– 第二步再次选择Transform菜单
练习
• 计算母亲的BMI指数 • 母亲身高值四舍五入取整后生成新变量 (new_h)。 • 儿童出生体重转换成千克为单位的新变 量(new_bw)。
重新赋值产生新变量
根据已计算产生的变量BMI,判断母亲 为肥胖、超重还是正常。
SPSS程序:
Transform菜单 Recode命令
Recode…….. Into different variables
• 求变量的频数: • analyze---descriptive statistics--frequencies
练习:用SPSS绘制频数表
频数:当汇总大量的原始数据时,把数 据按类型分组,其中每个组的数据个数 ,称为该组的频数。 频数表(频数分布):表示各组及它们 对应的组频数的表格称为频数表或频数 分布。
具体步骤
• 将绘制频数表的变量按从大到小的顺序排 列,(使用排序方法或Frequency过程)求 出变量的最大值、最小值,计算全距(极 差)。 • 根据样本量和极差确定组段数,计算组距 ,写出组段。 • 使用Record过程建立一个新变量用于记录 组段号 • 使用组段号变量对原变量进行统计描述、 绘图等,即可得到需要的频数表。
组段 Percent 3.3 3.3 3.3 13.3 16.7 26.7 10.0 6.7 10.0 3.3 3.3 100.0 Valid P er cent 3.3 3.3 3.3 13.3 16.7 26.7 10.0 6.7 10.0 3.3 3.3 100.0 Cu mu lativ e Percent 3.3 6.7 10.0 23.3 40.0 66.7 76.7 83.3 93.3 96.7 100.0
打开表1.sav数据库
• 找出最大值、最小值(数据排序、描述性统计) -- data → sort cases
sort by-身高
sort order-ascending/decending
最小值为144cm,最大值为176cm,故极差(全距) R=176-144=32cm • 确定组数。一般根据样本量的多少分成8-15组。 理论上组距等于极差除以组数。但不拘泥于计算 结果,而常常取一个比较好处理的数。
常用数学函数
• • • • • • • • • • •
ABS ARSIN ARTAN COS EXP LG10 LN RND SIN SORT TRUNC
绝对值 反正弦值 反正切值 余弦值 e 的数值表达式次幂 以10为底的对数值 自然对数值 四舍五入后得到整数值 正弦值 平方根 截尾以后得到整数值
练习
• 绘制表1.sav数据中儿童身高的频数表。