医学统计学第3版 第5章_定性资料的统计描述讲解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

年发病频率 50 100% 50% 100
年发病速率

50 501年+50 1 年

1年

50 (100
50)
2
0.67 / 年
2
月发病速率

50
50 12月+50

6月

12月
50 (100

50)
=0.06 / 月 2
速率(rate)
• 特点
– 有量纲 (单位):1/时间 – 根据时间单位不同,可以是任意值,不一定在
59

688

59
650

21

2.97
RR、OR的特点
• 在特定情况下, OR≈RR
– 疾病的发病率(或死亡率)很低 – 研究对象代表性很好
• 反映暴露者患某种疾病的危险性较无暴露 者高的程度
– RR(或OR)=1,认为暴露和疾病无关
定性资料的统计描述指标
• 绝对数:事物每个结果(类别)发生对象数 • 相对数
– 消除绝对数所来自基数不同的影响,便于资料 比较、分析
– 在抽样研究中,更能体现总体的特征
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
• 频率(Frequency) • 速率(Rate)
– 比(Ratio)
构成比(Proportion)
• 说明某一事物内部各组成部分所占整体的 比重,常用百分数表示
相对数之比—RR
• 相对危险度(relative risk, RR) 是指暴露于某 种危险因素的观察对象发病率与非暴露(或 低暴露)的观察对象发病率之间的比值
某锡矿不同生产线工人肺癌发生率(1/10万)
观察总人数 肺癌 肺癌发生率
RR
一线作业
680
5
735.3
2.35
非一线作业
320
1
312.5
合计

282 (92.16)
9 (2.94)
9(2.94)
6(1.96) 306(100.00)
合计 575 (89.98) 19 (2.97) 26 (4.07) 19 (2.97) 639 (100.00)
293 100% 87.99% 333
相对数(Relative Number)
• 概念:两个有关的数据或指标之比 • 意义
333
6
306
19
639
• 将观察对象按两个定性变量的类别交叉分 组,统计相应的频数形成的频数表,也叫 R×C表
– 行变量,有R个类别,一般存放处理因素 – 列变量,有C个类别,一般存放观测指标
绝对数
• 该变量某个类别在群体中的发生次数
– 与基数有关:观察总次数(或观察对象数)
• 不便于相互比较分析
• 频率(Frequency) • 速率(Rate)
– 比(Ratio)
比(Ratio)
• 亦称相对比,是A、B两有关指标之比
相对比

Hale Waihona Puke Baidu
A指标 B指标
– 分类
• 关系指标 • 对比指标
关系指标
• 由两个性质不同而又有联系的指标对比计 算所得的相对数
– 说明现象的强度、密度或普遍程度等 – 一般都具有单位,多为两指标的复合计量单位
平均数之比
• 例5.4 为了解新生儿的锌的营养状况,分别 测量某医院足月儿、早产儿的脐血血清锌 含量,结果显示足月儿及早产儿的脐血血 清 锌 含 量 的 均 数 分 别 为 1.85mg/L 和 1.41mg/L
– 则该医院足月儿与早产儿的脐血血清锌含量之 比为1.85/1.41=1.31,即该医院足月儿脐血血清 锌含量是早产儿的1.31倍
成比代率 • 几个率不能相加求平均率后作为合计率 • 已知样本率或构成比的总体比较中,需假
设检验 • 相对数进行比较时应注意可比性
频率和概率
• 某医生用自制的中药汤剂治疗了10例AIDS 患者,其中7例有效,即报告“该中药汤剂 的有效率为70%”。
– 代表性差 – 指标不稳定,不能用以估计概率 – 样本例数较少时,报告成分数,如:7/10
12
率 10
%8
6
4
2
0
2007
2008
2009
2010
2007~2010年某地区MSM的HIV感染情况
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
• 频率(Frequency) • 速率(Rate)
– 比(Ratio)
速率(rate)
• 某时期单位时间内某事件发生的频率或强 度,反映变量随时间变化的速率
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
• 频率(Frequency) • 速率(Rate)
– 比(Ratio)
频率(Frequency)
• 某时期或时点发生某事件的频数占总观察 次数比值,说明该事件的发生频度
时点发生频率

某时点发生某事件的观察单位数 该时点观察单位总数
经济困难 经济困难 没有时间 经济困难
…… 333 甲县
… 经济困难
…… 306 乙县
… 其它
定性资料频数表
• 以变量的类别作为分组标志(组段),统计相 应的频数
表5.1 甲县应住院者未住院原因情况
原因 经济困难 没有时间 没有必要 其它
合计
频数
293
17
10
13
333
表5.2 乙县应住院者未住院原因情况
构成比和率
• “208例肺不张的病因与临床分析”研究中, 男性152例,占73%,女性56例,占27%, 因此认为“男性肺不张的发病率高于女 性”。
– 指标与结论不一致
合计率的求解
• 某班有男生50人,女生20人,男生英语四 级通过率为80%,女生四级通过率为100%, 请问该班四级通过率为多少?
• 千人口医师、护士、床位数
对比指标
• 同类指标在不同条件下的差异程度或相对 状态
– 说明A指标是B指标的多少倍或几分之几
• 比值=1,说明比较的两指标相等 • 比值1,说明比较的两指标不等
– 指标的表现形式
• 绝对数 • 平均数 • 相对数
绝对数之比

性别比(性比例)=
男性人数 女性人数
100
原因 经济困难 没有时间 没有必要 其它
合计
频数
282
9
9
6
306
列联表(contingency table, cross tabs / tabulations)
表5.3 甲、乙两县应住院者未住院原因情况
县别 经济困难 没有时间 没有必要 其它
合计

293

282
合计
575
17
10
9
9
26
19
13
– 在病例对照研究中,也叫暴露优势
肺癌病例对照研究吸烟史比较
吸烟情况
病例组
对照组
合计

688 (a)
650 (b)
1338

21 (c)
59 (d)
80
合计 暴露优势
709 (m1)
688 678089 21 709
709 (m0)
650657009 5959 709
1418
相对数之比—OR
• 比值比(odds ratio/OR):不同群体比值的比
– 抽样研究中难以说明总体的特征
表5.3 甲、乙两县应住院者未住院原因情况
县别 经济困难 没有必要 没有时间 其它
合计

293
10
17
13
333

282
9
9
6
306
合计
575
19
26
19
639
表11.5 甲、乙两县应住院者未住院原因构成比(%)
县别 经济困难 没有必要 没有时间 其它
合计
甲 293((87.999)) 10(5.11) 17(3.00) 13(3.90) 333(100.00)
– 关注该事件在多次观察中“发生”的频度 – 取值在[0,1]
• 观察次数足够大(观察单位足够多)时, 可用来估计事件的发生概率
频率(Frequency)
• 2007~2010 年 某 地 区 MSM(Men who have Sex with Men)横断面调查HIV感染情况
2007~2010年某地区MSM的HIV感染情况
[0,1]
常见率的实质
• 频率(frequency)
– 发生比例,即发生某事件的对象所占的比重 – 说明某事件在群体中的发生频度
• 速率(rate)
– 是单位时间内事件的发生频率 – 说明事件在群体中某时期内的发生强度
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
– 病例对照研究中,病例组相对于对照组暴露于 某危险因素的优势比,也叫暴露优势比
肺癌病例对照研究吸烟史比较
吸烟情况
病例组
对照组
合计

688 (a)
650 (b)
1338

21 (c)
59 (d)
80
合计 Odds OR
709 (m1)
709 (m0)
1418
688/21
650/59

688
21 650
发生速率

某时期发生对象数 观察对象总数 观察时间
k
某时期发生对象数 观察总人时数(person time) k
某时期发生对象数 该时期平均观察对象数该时期时间 k
某时期发生对象数 (期初观察对象数+期末观察对象数) 2 该时期时间 k
速率(rate)
• 共观察100人,1年内50人发病
– 构成比:将事物每个部分的构成比结合在一起, 说明事物的内部构成情况
–率
• 频率(发生比例):说明事物发生频度 • 速率:说明事物单位时间的发生强度或速度
– 比:说明事物间的对比关系或密度情况
应用相对数应注意的问题
• 率或构成比的计算中,分母数据不宜过小 • 事物发生频度或强度的分析中,不能以构

282 (92.16)
9 (2.94)
9(2.94)
6(1.96) 306(100.00)
合计 575 (89.98) 19 (2.97) 26 (4.07) 19 (2.97) 639 (100.00)
饼图(Pie graph)
5% 4% 3%
88%
经济困难 没有必要 没有时间 其它
甲县应住院者未住院原因构成比(%)
某部分构成比

该部分的观察单位数 各组成部分的观察单位总数
100%
– 取值在[0,1] – 各部分构成比总和为1或100%,此消彼长 – 各部分构成比结合在一起说明该事物的内部构
成情况
构成比
表11.5 甲、乙两县应住院者未住院原因构成比(%)
县别 经济困难 没有必要 没有时间 其它
合计
甲 293(87.99) 10(5.11) 17(3.00) 13(3.90) 333(100.00)
1 甲县
经济困难
1 乙县
没有必要
2 甲县
经济困难
2 乙县
经济困难
3 甲县
经济困难
3 乙县
经济困难
4 甲县
没有必要
4 乙县
经济困难
5 甲县
经济困难
5 乙县
没有时间
6 甲县
经济困难
6 乙县
经济困难
7 甲县 8 甲县 9 甲县 10 甲县
经济困难 没有时间 没有时间 其它
7 乙县 8 乙县 9 乙县 10 乙县
1000
6
600.0
相对数之比—OR
• 1950年,Doll和Hill吸烟与肺癌的关系研究
暴露
疾病状态
吸烟(a) 不吸烟(c) 吸烟(b) 不吸烟(d)
肺癌病例709例 病
(病例组)

回顾过去

吸烟情况

非肺癌个体709例 研
(对照组)

过去
现在
相对数之比—OR
• 比值(Odds):是指事件发生的概率与不发 生的概率之比
定性变量&统计描述
• 定性变量:变量值为定性描述
– 按该变量的特征表现为若干穷尽,且互斥的类 别—分类变量
– 从群体角度出发,考察该变量各类别的观察对 象数—计数变量
• 统计描述:用统计图、表、指标等描述变 量在群体中的分布特征
甲、乙两县应住院者未住院原因情况调查
ID 县别 不住院原因
ID 县别 不住院原因
年份
检查人数
阳性人数
阳性率(%)
2007
356
21
5.90
2008
534
43
8.05
2009
378
66
17.46
2010
622
91
14.63
()
20
18
16
14
感 染
12
率 10
%8
6
4
2
0
2007
2008
2009
2010
2007~2010年某地区MSM的HIV感染情况
()
20
18
16
14
感 染
3% 3% 2% 92%
经济困难 没有必要 没有时间 其它
乙县应住院者未住院原因构成比(%)
百分比条图(Percent bar graph)
100% 90% 80% 70% 60%
构 成 50% 比
40% 30% 20% 10% 0%
甲县
乙县
甲、乙两县应住院者未住院原因构成情况
其它 没有时间 没有必要 经济困难
年龄 出生时 20岁 50岁 60岁 70岁 80岁
性别比 107 100 98 95 85 66
2010 年 第 六 次 人 口 普 查 (2010年11月1日零时为标准时 点):
出 生 性 别 比 105.20 总 人 口 性 别 比 118.06 平均预期寿命(岁) 74.83
男性 72.38 女性 77.37

k
时期(累计)发生频率

某时期内发生某事件的累计观察单位数 该时期期初观察单位总数

k
– k为比例基数, 100%、 1000‰、10000/万……
• 依据习惯
• 使计算结果,保留1到2位整数
– 样本率常用p表示,总体率用表示
频率(Frequency)
• 其实质是发生比例(比重)
– 根据某事件是否发生将观察对象分为:发生、 未发生两类
相关文档
最新文档