计量资料与计数资料统计描述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学 (Medical Statistics)
第3讲 计量与计数资料的统计描述
本讲结构
一、数据类型的分类 二、计量资料的统计描述 三、SPSS实现计量资料的统计描述 四、计数资料的统计描述 五、统计表与统计图
一、数据类型的分类
1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
频数表的编制步骤
(1)求极差(range):即最大值与最小值之差,又称为全距。 (2)数据分组: 由样本容量n确定组数、通常分10-15个组; 一般采取等距分 组, 组距=极差/组数。 (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包 含最大值,其它组段上限值忽略。 (4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
住院 天数
5 5 6 5 11 2 4 3 7
职业
无 无 管理员 无 商业 无 无 无 干部
文化 程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
分娩 方式 顺产 助产 顺产 剖宫产 剖宫产 顺产 助产 助产 剖宫产
妊娠 结局 足月 足月 足月 足月 足月 早产 早产 足月 足月
计量资料
计数资料
大学
32

小学
27

中学
29

大学
25
农民
中学
26无小学源自分娩方式 顺产 助产 顺产 顺产 顺产
剖宫产 顺产
剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 工人 管理人员 农民 商业服务 无 知识分子 总计
18
2
0
0
0
3
0
5
20
表2-1: 160名正常成年女子的血清甘油三酯(mmol/L)
编号
血清甘油三脂
编号 血清甘油三脂
1
0.51


2
0.52
153
1.65
3
0.59
154
1.66
4
0.61
155
1.67
5
0.61
156
1.67
6
0.62
157
1.69
7
0.63
158
1.7
8
0.64
159
1.71


160
1.77
组段 (1) 0.5~ 0.6~ 0.7~ 0.8~ 0.9~ 1.0~ 1.1~ 1.2~ 1.3~ 1.4~ 1.5~ 1.6~ 1.7~1.8 合计
三类资料间关系
例:一组2040岁成年人的血压
等级 资料
<8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压
计量资料 计数资料
以12kPa为界分为正常与异常两组,统计每组例数
二、计量资料的统计描述
1、频数分布 (frequency distribution)
为了了解数据的分布情况,可以编制频数表(frequency table).
XX1X2Xn X
n
n
Gn X1X2LXn

Glg1
fi
lgXi fi

Xf1X 1fX 2 fX 3fkX k fX i
f1f2f3fk
fi
Mdxx(nn /21) /2x1n/2 2
n为奇数 n为偶数
3、离散趋势的描述
反映数据的离散度(Dispersion), 即个体观察值的变异 (variation)程度, 常用的统计指标有:
1. 极差(Range) (全距) 2. 四分位数间距 (Quartile range) 3. 方差(Variance) 4. 标准差(Standard Deviation) 5. 变异系数(Coefficient of Variation)
②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++及以上
实例数据
住院号 年龄 身高 体重
27 165 71.5 22 160 74.0 25 158 68.0 23 161 69.0 25 159 62.0 27 157 68.0 20 158 66.0 24 158 70.5 29 154 57.0
段数多.(skewed to the right distribution)
2、集中趋势的描述
统计上使用平均数(average)来反映计量资料的集中趋 势( central tendency ).
常用平均数有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median) 4. 百分位数(percentile)
RXma x Xmin X2 X2 n
S n1
四分位间距:QR=P75- P25
CV S 100% X
三、SPSS实现计量资料的统计描述
四、计数资料的统计描述
1、计数资料数据的整理
住院号 年龄 职业
文化程度
27

中学
22

小学
25 管理人员
大学
24 知识分子
中学
30 管理人员
编制频数表,绘制频数分布图
划记 (2)
频数,f 组中值,X
fX
(3)
(4)
(5)= (3)×(4)
3
0.55
1.65

9
0.65
5.85
正正
12
0.75
9.00
正正
13
0.85
11.05
正正正
17
0.95
16.15
正正正
18
1.05
18.90
正正正正
20
1.15
23.00
正正正
18
1.25
22.50
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形.
特点:无计量单位,如肤色(黑白)、血型(ABO)、职业(工农兵)、 性别(1=男,2=女)等.
3、等级资料 (ordinal data)
半定性或半定量的观察结果,有大小顺序,又称有序分类变量. 如 ①癌症分期:早、中、晚。
正正正
17
1.35
22.95
正正
13
1.45
18.85

9
1.55
12.40

8
1.65
14.85
3
1.75
5.25
160
182.30
对称分布:以频数最多组段为中心左
右大体对称.
右(正)偏态分布: 频数最多组段右侧组
段数多.(skewed to the right distribution)
左(负)偏态分布: 频数最多组段左侧组
9
2
6
10
18
0
45
22 28
7
10
24
70
11
150
24 50
34
28
52
153
44
361
26 50
43
25
45
133
70
366
相关文档
最新文档