连续性变量的描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10~14 15~19 20~24 25~29 30~34 35~44 45~54 55~64
患者人数 30 30 75 78 77 49 71 59 56 67 143 77 16 10 12 7 3 1
每岁患者人数 30 30 75 78 77 49 71 59 56 67 28.6 15.4 3.2 2 2.4 0.7 0.3 0.1
➢ 普通线图: 纵轴的尺度为算术尺度 用线条的升降表示事物发展变化的趋势。 纵轴的尺度为对数尺度
➢ 半对数线图: 用线条的升降表示事物发展变化的速度。 26
SPSS12.0统计软件
例:数据Car.sav 考察随着生产年代的变化Miles per Gallon均数
的变化情况,请选择合适的统计图
27
SPSS12.0统计软件
3
SPSS12.0统计软件
Explore过程
Analyze->Descriptive Statistics->Explore… 此过程用于对连续性资料分布状况不清楚时的探索性 分析,它可以计算许多描述统计量,给出各种统计图,并 进行简单的参数估计。
4
SPSS12.0统计软件
Explore过程特点: 是对连续性变量进行探索性分析最有效的工具 提供了丰富的描述统计量和图形,如直方图、茎叶图、箱 线图等
血压状态与冠心病各临床型年龄标化发生率的关系
血压状态
年龄标化发生率(1/10万)
冠状动脉机能不全
猝死 心绞痛
心肌梗死
正常
8.9
12 34.71
44
临界
10.63
18.05 46.18
67.24
异常
19.84
30.55 73.06
116.82
25
SPSS12.0统计软件
线图 (line diagram)
5
SPSS12.0统计软件
茎叶图 是一种文本化的图形,主要用于样本量较小的情况,
描述其数据的整体分布趋势,同时还能够精确的反映出具 体的数值大小。
6
SPSS12.0统计软件
7
SPSS12.0统计软件
主要内容有三列: 第一列为频数:表示所在行的观察值的频数 第二列为茎:表示实际观察值除以图下方的茎宽(Stem Width)后的整数部分; 第三列为叶:表示实际观察值除以茎宽后的小数部分。 图下方注明了叶子中每个数字代表的观察值个数。 8
45-
11.71
13.85
55-
13.51
12.91
65-
15.02
16.77
75-
16
21.04
32
SPSS12.0统计软件
饼图 (pie graph)
➢ 概念: 用于表示各类别某种特征的构成比情况,它以圆
行的总面积为100%,用圆内各扇形面积所占的百分 比来表示各部分所占的百分构成比 。 ➢ 适用资料:构成比资料。
例:数据Car.sav 考察随着年代的变化,Miles per Gallon(mpg)、
Horsepower、Time to Accelerate from 0 to 60 mph (accel) 三个变量的变化情况。
28
SPSS12.0统计软件
垂线图
29
SPSS12.0统计软件
半对数线图
30
SPSS12.0统计软件
44
SPSS12.0统计软件
练习
练习六:研究甲基汞对肝脏脂质过氧化的毒性作用,选用 25 只大白鼠,随机分成五组,按不同剂量染毒一段时期 后测定肝脏LPO 含量(n mol/L),资料如下表,试绘制 箱图。
45
SPSS12.0统计软件
编号
1 2 3 4 5
5 184.3 268.2 22.64 127.52 291.5
per
30
40
G a llon
50 250
50
200 H
150 or sep
100 ower
37
SPSS12.0统计软件
练习
练习四:随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升) 及凝固时间,数据如下表所示。试绘制统计图。
表 15例健康成人凝血酶时间与凝血酶浓度测量值纪录
受试者号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
凝血酶 浓度
1.1 1.2 1.0 0.9 1.2 1.1 0.9 0.6 1.0 0.9 1.1 0.9 1.1 1.0 0.7
凝血时间 14 13 15 15 13 14 16 17 14 16 15 16 14 15 17
38
SPSS12.0统计软件
直方图 (histogram)
➢ 概念: 表示连续性变量的频数分布,实际应用中常
染毒剂量(mg/kg体重)
10
20
30
391.5
1025.4
1897.21
487.25 1289.24 1705.33
345.69 1463.55 1532.46
574.12 1168.47 2015.46
526.78 1356.7
2100.4
40 1821.33 2897.53 2001.4 2748.98 4539.75
Model Year (modu lo 100)
列变量
St ati s t i cs
行变量
Number o f Cy linders
Tot al
4 Cylinders 6 Cylinders 8 Cylinders
Co untry of Origin
A merican 8
Eu rop ean 4
Japanese 10
SPSS12.0统计软件
例题
数据背景:调查对象为某大专院校的大学生,文件名student.sav。 主要调查内容代码如下:性别(1男、2女),出生年、月、日(具体 数字),身高(cm),体重(kg),血型(A、AB、B、O),血型 代码(1A、2B、3AB、4O),教育背景(1重点大学本科、2普通大 学本科、3大专、4中专/职校),学科(1文史、2理工、3其他),男 女身高级别(1低、2中等、3高,两者的划分标准不一样),男女体 重级别(1低、2中等、3高,两者的划分标准不一样)和季度(具体 数字)。
4
1
2
1
0
0
13
5
12
Tot al 22 7 1 30
汇总行
49
SPSS12.0统计软件
SPSS表格类型
➢ 叠加表 (Stacking) ➢ 交叉表 (Cross tabulation) ➢ 嵌套表 (Nesting) ➢ 分层表 (Layers) ➢ 复合表格
误差线图
31
SPSS12.0统计软件
练习
练习二:某地调查居民心理问题的存在现状,资料如下表所示,试绘制 合适的统计图比较不同性别和年龄组的居民心理问题检出情况。
某地男女性年龄别心理问题检出率比较
年龄分组
心理问题检出率(%)
男性
女性
15-
10.57
19.73
25-
11.57
11.98
35-
9.57
15.5
Horsepower
Miles per Gallon
Time to Acceler ate fr om 0 to 60 mph (sec)
Miles per Gallon
Horsepower
Time to Accelerate from 0 to 60 mph (sec)
25
20
15
10
5
10
20 M iles
SPSS12.0统计软件
第五讲 连续变量的统计描述
1
SPSS12.0统计软件
连续变量的统计描述概况
1、集中趋势 如均数、中位数、几何均数、众数、调和均数等
2、离散趋势 如全距、方差和标准差、百分位数、四分位数和四分
位间距、变异系数等
2
SPSS12.0统计软件
Descriptive过程
Analyze->Descriptive Statistics->Descriptive… 此过程主要用于对服从正态分布的连续性变量进行描述。
42
SPSS12.0统计软件
箱图 (box plot)
➢ 用资料的五个数值(最小值、P25、中位数、P75、 最大值)绘制。
➢ 适用于连续型定量资料的分布,可用于多组资料的 比较。
➢ 箱式图作用: 观察分布类型、分布特征 比较多组数据的分布 发现极端值 43
SPSS12.0统计软件
简单箱图 复式箱图
35
SPSS12.0统计软件
散点图 (scatter diagram)
➢ 概念: 表现两个变量或多个变量之间有无相关关系的统
计图,它用点的密集程度和趋势来表示两个变量之间 的相关关系及变化趋势。 ➢ 适用资料:双变量资料
36
SPSS12.0统计软件
简单散点图 散点图矩阵 重叠散点图 三维散点图
Time to Accelerate fr...
16
SPSS12.0统计软件
17
SPSS12.0统计软件
Graphs菜单
18
SPSS12.0统计软件
直条图(Bar Charts)
➢ 概念: 用等宽直条的长短来表示各个相互独立的指标大小的
图形。 ➢ 适用资料 : 相互独立的资料比较
离散型定量资料的频数分布 ➢ 分类:分为单式和复式两种。
19
SPSS12.0统计软件
用于考察变量的分布是否服从某种分布类型。 ➢ 适用资料:连续型定量资料。
39
SPSS12.0统计软件
普通直方图 累积直方图 直方图组
40
SPSS12.0统计软件
练习
练习五:现有某地某年流行性乙型脑炎患者的年龄分布资 料如下表,试绘制直方图。
41
SPSS12.0统计软件
年龄分组 0~ 1~ 2~ 3~ 4~ 5~ 6~ 7~ 8~ 9~
14
SPSS12.0统计软件
统计图的种类
➢ 单变量图:连续性变量:直方图(茎叶图)、箱图 分类变量:简单条图、饼图
➢ 双变量图:连续因变量:线图、散点图 分类因变量:复式条图
➢ 多变量图:散点图矩阵等
15
SPSS12.0统计软件
统计图的基本要求
➢ 应按照资料的性质与分析目的恰当地选用图形; ➢ 标题位于图形正下方; ➢ 统计图的高:宽接近5:7为宜; ➢ 图中不同的事物用不同的图案或颜色区别,并附图例; ➢ 涉及到坐标轴的图形注意标目、尺度和单位等;
0.4
0.2
0
1
2
3
4
Tria l
23
SPSS12.0统计软件
误差条图
Score
15
10
5
0 1
Error Bars show 95.0%Cl of Mean Bars show Means
2
3
4
Tr ial
24
SPSS12.0统计软件
练习
练习一:研究血压状态与冠心病各临床型发生情况的关系,分析资 料如下所示,试绘制统计图。
Mean Score
20 15 10
5 0
1
Biblioteka Baidu
2
3
Trial
Tension 1 2
21
4
SPSS12.0统计软件
分段条图
40 30
Te n s io n
1 2
Mean Score
20
10
0
1
2
3
4
Tr ia l
22
SPSS12.0统计软件
百分条图
1 0.8
Te n s io n
1 2
0.6
Mean Score
46
SPSS12.0统计软件
SPSS表格
47
SPSS12.0统计软件
表格元素的构成
➢ 层(Layer) ➢ 行(Rows) ➢ 列(Columns) ➢ 单元格(Cells)
48
SPSS12.0统计软件
层变量 Num be r o f C ylinders * C o u ntry o f O rigin * Model Year (mo du lo 10 0) C rosstabulation
11
第六讲 SPSS图形
流行病学与卫生统计学教研室
12
SPSS12.0统计软件
SPSS12.0 作图特点
➢ 自由灵活的图形框架 ➢ 自由的元素选择方式 ➢ 方便的模板设计 ➢ 方便的文本编辑功能
13
SPSS12.0统计软件
如何生成SPSS统计图
➢ 判断数据资料的类型,选择正确的统计图 ➢ 定义图形元素,生成统计图 ➢ 对图形进行编辑、修饰
要求对男性和女性身高数据分别进行描述。
9
SPSS12.0统计软件
练习一
用 Descriptive 过 程 , 对 students.sav 中 的 身 高 和 年 龄 变量进行标准正态变换,对变换后的变量进行统计描述。
10
SPSS12.0统计软件
练习二
数据Employee data.sav,对current salary 做探索性分 析,并解释结果。
例:数据Anxiety.sav 欲比较该数据中4次不同时间点测量的得分
(score)之算数均数的变化情况,选择合适的图形。
Mean Score
20 15 10
5 0
1
2
3
Trial
20
4
SPSS12.0统计软件
例:数据Anxiety.sav
欲根据有无紧张症状的病人分别描述不同
时间的得分均数情况,请选择合适的统计图
33
SPSS12.0统计软件
普通饼图 三维饼图 散点饼图
34
SPSS12.0统计软件
练习
练习三:某年某医院用中草药治疗182 例慢性支气管炎患者,其疗效 如下所示,试绘统计图。
疗效 控制 显效 好转 无效 合计
病例数 37 70 60 14 182
百分构成(%) 20.3 39 33 7.7 100
患者人数 30 30 75 78 77 49 71 59 56 67 143 77 16 10 12 7 3 1
每岁患者人数 30 30 75 78 77 49 71 59 56 67 28.6 15.4 3.2 2 2.4 0.7 0.3 0.1
➢ 普通线图: 纵轴的尺度为算术尺度 用线条的升降表示事物发展变化的趋势。 纵轴的尺度为对数尺度
➢ 半对数线图: 用线条的升降表示事物发展变化的速度。 26
SPSS12.0统计软件
例:数据Car.sav 考察随着生产年代的变化Miles per Gallon均数
的变化情况,请选择合适的统计图
27
SPSS12.0统计软件
3
SPSS12.0统计软件
Explore过程
Analyze->Descriptive Statistics->Explore… 此过程用于对连续性资料分布状况不清楚时的探索性 分析,它可以计算许多描述统计量,给出各种统计图,并 进行简单的参数估计。
4
SPSS12.0统计软件
Explore过程特点: 是对连续性变量进行探索性分析最有效的工具 提供了丰富的描述统计量和图形,如直方图、茎叶图、箱 线图等
血压状态与冠心病各临床型年龄标化发生率的关系
血压状态
年龄标化发生率(1/10万)
冠状动脉机能不全
猝死 心绞痛
心肌梗死
正常
8.9
12 34.71
44
临界
10.63
18.05 46.18
67.24
异常
19.84
30.55 73.06
116.82
25
SPSS12.0统计软件
线图 (line diagram)
5
SPSS12.0统计软件
茎叶图 是一种文本化的图形,主要用于样本量较小的情况,
描述其数据的整体分布趋势,同时还能够精确的反映出具 体的数值大小。
6
SPSS12.0统计软件
7
SPSS12.0统计软件
主要内容有三列: 第一列为频数:表示所在行的观察值的频数 第二列为茎:表示实际观察值除以图下方的茎宽(Stem Width)后的整数部分; 第三列为叶:表示实际观察值除以茎宽后的小数部分。 图下方注明了叶子中每个数字代表的观察值个数。 8
45-
11.71
13.85
55-
13.51
12.91
65-
15.02
16.77
75-
16
21.04
32
SPSS12.0统计软件
饼图 (pie graph)
➢ 概念: 用于表示各类别某种特征的构成比情况,它以圆
行的总面积为100%,用圆内各扇形面积所占的百分 比来表示各部分所占的百分构成比 。 ➢ 适用资料:构成比资料。
例:数据Car.sav 考察随着年代的变化,Miles per Gallon(mpg)、
Horsepower、Time to Accelerate from 0 to 60 mph (accel) 三个变量的变化情况。
28
SPSS12.0统计软件
垂线图
29
SPSS12.0统计软件
半对数线图
30
SPSS12.0统计软件
44
SPSS12.0统计软件
练习
练习六:研究甲基汞对肝脏脂质过氧化的毒性作用,选用 25 只大白鼠,随机分成五组,按不同剂量染毒一段时期 后测定肝脏LPO 含量(n mol/L),资料如下表,试绘制 箱图。
45
SPSS12.0统计软件
编号
1 2 3 4 5
5 184.3 268.2 22.64 127.52 291.5
per
30
40
G a llon
50 250
50
200 H
150 or sep
100 ower
37
SPSS12.0统计软件
练习
练习四:随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升) 及凝固时间,数据如下表所示。试绘制统计图。
表 15例健康成人凝血酶时间与凝血酶浓度测量值纪录
受试者号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
凝血酶 浓度
1.1 1.2 1.0 0.9 1.2 1.1 0.9 0.6 1.0 0.9 1.1 0.9 1.1 1.0 0.7
凝血时间 14 13 15 15 13 14 16 17 14 16 15 16 14 15 17
38
SPSS12.0统计软件
直方图 (histogram)
➢ 概念: 表示连续性变量的频数分布,实际应用中常
染毒剂量(mg/kg体重)
10
20
30
391.5
1025.4
1897.21
487.25 1289.24 1705.33
345.69 1463.55 1532.46
574.12 1168.47 2015.46
526.78 1356.7
2100.4
40 1821.33 2897.53 2001.4 2748.98 4539.75
Model Year (modu lo 100)
列变量
St ati s t i cs
行变量
Number o f Cy linders
Tot al
4 Cylinders 6 Cylinders 8 Cylinders
Co untry of Origin
A merican 8
Eu rop ean 4
Japanese 10
SPSS12.0统计软件
例题
数据背景:调查对象为某大专院校的大学生,文件名student.sav。 主要调查内容代码如下:性别(1男、2女),出生年、月、日(具体 数字),身高(cm),体重(kg),血型(A、AB、B、O),血型 代码(1A、2B、3AB、4O),教育背景(1重点大学本科、2普通大 学本科、3大专、4中专/职校),学科(1文史、2理工、3其他),男 女身高级别(1低、2中等、3高,两者的划分标准不一样),男女体 重级别(1低、2中等、3高,两者的划分标准不一样)和季度(具体 数字)。
4
1
2
1
0
0
13
5
12
Tot al 22 7 1 30
汇总行
49
SPSS12.0统计软件
SPSS表格类型
➢ 叠加表 (Stacking) ➢ 交叉表 (Cross tabulation) ➢ 嵌套表 (Nesting) ➢ 分层表 (Layers) ➢ 复合表格
误差线图
31
SPSS12.0统计软件
练习
练习二:某地调查居民心理问题的存在现状,资料如下表所示,试绘制 合适的统计图比较不同性别和年龄组的居民心理问题检出情况。
某地男女性年龄别心理问题检出率比较
年龄分组
心理问题检出率(%)
男性
女性
15-
10.57
19.73
25-
11.57
11.98
35-
9.57
15.5
Horsepower
Miles per Gallon
Time to Acceler ate fr om 0 to 60 mph (sec)
Miles per Gallon
Horsepower
Time to Accelerate from 0 to 60 mph (sec)
25
20
15
10
5
10
20 M iles
SPSS12.0统计软件
第五讲 连续变量的统计描述
1
SPSS12.0统计软件
连续变量的统计描述概况
1、集中趋势 如均数、中位数、几何均数、众数、调和均数等
2、离散趋势 如全距、方差和标准差、百分位数、四分位数和四分
位间距、变异系数等
2
SPSS12.0统计软件
Descriptive过程
Analyze->Descriptive Statistics->Descriptive… 此过程主要用于对服从正态分布的连续性变量进行描述。
42
SPSS12.0统计软件
箱图 (box plot)
➢ 用资料的五个数值(最小值、P25、中位数、P75、 最大值)绘制。
➢ 适用于连续型定量资料的分布,可用于多组资料的 比较。
➢ 箱式图作用: 观察分布类型、分布特征 比较多组数据的分布 发现极端值 43
SPSS12.0统计软件
简单箱图 复式箱图
35
SPSS12.0统计软件
散点图 (scatter diagram)
➢ 概念: 表现两个变量或多个变量之间有无相关关系的统
计图,它用点的密集程度和趋势来表示两个变量之间 的相关关系及变化趋势。 ➢ 适用资料:双变量资料
36
SPSS12.0统计软件
简单散点图 散点图矩阵 重叠散点图 三维散点图
Time to Accelerate fr...
16
SPSS12.0统计软件
17
SPSS12.0统计软件
Graphs菜单
18
SPSS12.0统计软件
直条图(Bar Charts)
➢ 概念: 用等宽直条的长短来表示各个相互独立的指标大小的
图形。 ➢ 适用资料 : 相互独立的资料比较
离散型定量资料的频数分布 ➢ 分类:分为单式和复式两种。
19
SPSS12.0统计软件
用于考察变量的分布是否服从某种分布类型。 ➢ 适用资料:连续型定量资料。
39
SPSS12.0统计软件
普通直方图 累积直方图 直方图组
40
SPSS12.0统计软件
练习
练习五:现有某地某年流行性乙型脑炎患者的年龄分布资 料如下表,试绘制直方图。
41
SPSS12.0统计软件
年龄分组 0~ 1~ 2~ 3~ 4~ 5~ 6~ 7~ 8~ 9~
14
SPSS12.0统计软件
统计图的种类
➢ 单变量图:连续性变量:直方图(茎叶图)、箱图 分类变量:简单条图、饼图
➢ 双变量图:连续因变量:线图、散点图 分类因变量:复式条图
➢ 多变量图:散点图矩阵等
15
SPSS12.0统计软件
统计图的基本要求
➢ 应按照资料的性质与分析目的恰当地选用图形; ➢ 标题位于图形正下方; ➢ 统计图的高:宽接近5:7为宜; ➢ 图中不同的事物用不同的图案或颜色区别,并附图例; ➢ 涉及到坐标轴的图形注意标目、尺度和单位等;
0.4
0.2
0
1
2
3
4
Tria l
23
SPSS12.0统计软件
误差条图
Score
15
10
5
0 1
Error Bars show 95.0%Cl of Mean Bars show Means
2
3
4
Tr ial
24
SPSS12.0统计软件
练习
练习一:研究血压状态与冠心病各临床型发生情况的关系,分析资 料如下所示,试绘制统计图。
Mean Score
20 15 10
5 0
1
Biblioteka Baidu
2
3
Trial
Tension 1 2
21
4
SPSS12.0统计软件
分段条图
40 30
Te n s io n
1 2
Mean Score
20
10
0
1
2
3
4
Tr ia l
22
SPSS12.0统计软件
百分条图
1 0.8
Te n s io n
1 2
0.6
Mean Score
46
SPSS12.0统计软件
SPSS表格
47
SPSS12.0统计软件
表格元素的构成
➢ 层(Layer) ➢ 行(Rows) ➢ 列(Columns) ➢ 单元格(Cells)
48
SPSS12.0统计软件
层变量 Num be r o f C ylinders * C o u ntry o f O rigin * Model Year (mo du lo 10 0) C rosstabulation
11
第六讲 SPSS图形
流行病学与卫生统计学教研室
12
SPSS12.0统计软件
SPSS12.0 作图特点
➢ 自由灵活的图形框架 ➢ 自由的元素选择方式 ➢ 方便的模板设计 ➢ 方便的文本编辑功能
13
SPSS12.0统计软件
如何生成SPSS统计图
➢ 判断数据资料的类型,选择正确的统计图 ➢ 定义图形元素,生成统计图 ➢ 对图形进行编辑、修饰
要求对男性和女性身高数据分别进行描述。
9
SPSS12.0统计软件
练习一
用 Descriptive 过 程 , 对 students.sav 中 的 身 高 和 年 龄 变量进行标准正态变换,对变换后的变量进行统计描述。
10
SPSS12.0统计软件
练习二
数据Employee data.sav,对current salary 做探索性分 析,并解释结果。
例:数据Anxiety.sav 欲比较该数据中4次不同时间点测量的得分
(score)之算数均数的变化情况,选择合适的图形。
Mean Score
20 15 10
5 0
1
2
3
Trial
20
4
SPSS12.0统计软件
例:数据Anxiety.sav
欲根据有无紧张症状的病人分别描述不同
时间的得分均数情况,请选择合适的统计图
33
SPSS12.0统计软件
普通饼图 三维饼图 散点饼图
34
SPSS12.0统计软件
练习
练习三:某年某医院用中草药治疗182 例慢性支气管炎患者,其疗效 如下所示,试绘统计图。
疗效 控制 显效 好转 无效 合计
病例数 37 70 60 14 182
百分构成(%) 20.3 39 33 7.7 100