医学统计学第3版 第5章_定性资料的统计描述讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
年发病频率 50 100% 50% 100
年发病速率
50 501年+50 1 年
1年
50 (100
50)
2
0.67 / 年
2
月发病速率
50
50 12月+50
6月
12月
50 (100
50)
=0.06 / 月 2
速率(rate)
• 特点
– 有量纲 (单位):1/时间 – 根据时间单位不同,可以是任意值,不一定在
59
688
59
650
21
2.97
RR、OR的特点
• 在特定情况下, OR≈RR
– 疾病的发病率(或死亡率)很低 – 研究对象代表性很好
• 反映暴露者患某种疾病的危险性较无暴露 者高的程度
– RR(或OR)=1,认为暴露和疾病无关
定性资料的统计描述指标
• 绝对数:事物每个结果(类别)发生对象数 • 相对数
– 消除绝对数所来自基数不同的影响,便于资料 比较、分析
– 在抽样研究中,更能体现总体的特征
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
• 频率(Frequency) • 速率(Rate)
– 比(Ratio)
构成比(Proportion)
• 说明某一事物内部各组成部分所占整体的 比重,常用百分数表示
相对数之比—RR
• 相对危险度(relative risk, RR) 是指暴露于某 种危险因素的观察对象发病率与非暴露(或 低暴露)的观察对象发病率之间的比值
某锡矿不同生产线工人肺癌发生率(1/10万)
观察总人数 肺癌 肺癌发生率
RR
一线作业
680
5
735.3
2.35
非一线作业
320
1
312.5
合计
乙
282 (92.16)
9 (2.94)
9(2.94)
6(1.96) 306(100.00)
合计 575 (89.98) 19 (2.97) 26 (4.07) 19 (2.97) 639 (100.00)
293 100% 87.99% 333
相对数(Relative Number)
• 概念:两个有关的数据或指标之比 • 意义
333
6
306
19
639
• 将观察对象按两个定性变量的类别交叉分 组,统计相应的频数形成的频数表,也叫 R×C表
– 行变量,有R个类别,一般存放处理因素 – 列变量,有C个类别,一般存放观测指标
绝对数
• 该变量某个类别在群体中的发生次数
– 与基数有关:观察总次数(或观察对象数)
• 不便于相互比较分析
• 频率(Frequency) • 速率(Rate)
– 比(Ratio)
比(Ratio)
• 亦称相对比,是A、B两有关指标之比
相对比
Hale Waihona Puke Baidu
A指标 B指标
– 分类
• 关系指标 • 对比指标
关系指标
• 由两个性质不同而又有联系的指标对比计 算所得的相对数
– 说明现象的强度、密度或普遍程度等 – 一般都具有单位,多为两指标的复合计量单位
平均数之比
• 例5.4 为了解新生儿的锌的营养状况,分别 测量某医院足月儿、早产儿的脐血血清锌 含量,结果显示足月儿及早产儿的脐血血 清 锌 含 量 的 均 数 分 别 为 1.85mg/L 和 1.41mg/L
– 则该医院足月儿与早产儿的脐血血清锌含量之 比为1.85/1.41=1.31,即该医院足月儿脐血血清 锌含量是早产儿的1.31倍
成比代率 • 几个率不能相加求平均率后作为合计率 • 已知样本率或构成比的总体比较中,需假
设检验 • 相对数进行比较时应注意可比性
频率和概率
• 某医生用自制的中药汤剂治疗了10例AIDS 患者,其中7例有效,即报告“该中药汤剂 的有效率为70%”。
– 代表性差 – 指标不稳定,不能用以估计概率 – 样本例数较少时,报告成分数,如:7/10
12
率 10
%8
6
4
2
0
2007
2008
2009
2010
2007~2010年某地区MSM的HIV感染情况
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
• 频率(Frequency) • 速率(Rate)
– 比(Ratio)
速率(rate)
• 某时期单位时间内某事件发生的频率或强 度,反映变量随时间变化的速率
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
• 频率(Frequency) • 速率(Rate)
– 比(Ratio)
频率(Frequency)
• 某时期或时点发生某事件的频数占总观察 次数比值,说明该事件的发生频度
时点发生频率
某时点发生某事件的观察单位数 该时点观察单位总数
经济困难 经济困难 没有时间 经济困难
…… 333 甲县
… 经济困难
…… 306 乙县
… 其它
定性资料频数表
• 以变量的类别作为分组标志(组段),统计相 应的频数
表5.1 甲县应住院者未住院原因情况
原因 经济困难 没有时间 没有必要 其它
合计
频数
293
17
10
13
333
表5.2 乙县应住院者未住院原因情况
构成比和率
• “208例肺不张的病因与临床分析”研究中, 男性152例,占73%,女性56例,占27%, 因此认为“男性肺不张的发病率高于女 性”。
– 指标与结论不一致
合计率的求解
• 某班有男生50人,女生20人,男生英语四 级通过率为80%,女生四级通过率为100%, 请问该班四级通过率为多少?
• 千人口医师、护士、床位数
对比指标
• 同类指标在不同条件下的差异程度或相对 状态
– 说明A指标是B指标的多少倍或几分之几
• 比值=1,说明比较的两指标相等 • 比值1,说明比较的两指标不等
– 指标的表现形式
• 绝对数 • 平均数 • 相对数
绝对数之比
•
性别比(性比例)=
男性人数 女性人数
100
原因 经济困难 没有时间 没有必要 其它
合计
频数
282
9
9
6
306
列联表(contingency table, cross tabs / tabulations)
表5.3 甲、乙两县应住院者未住院原因情况
县别 经济困难 没有时间 没有必要 其它
合计
甲
293
乙
282
合计
575
17
10
9
9
26
19
13
– 在病例对照研究中,也叫暴露优势
肺癌病例对照研究吸烟史比较
吸烟情况
病例组
对照组
合计
有
688 (a)
650 (b)
1338
无
21 (c)
59 (d)
80
合计 暴露优势
709 (m1)
688 678089 21 709
709 (m0)
650657009 5959 709
1418
相对数之比—OR
• 比值比(odds ratio/OR):不同群体比值的比
– 抽样研究中难以说明总体的特征
表5.3 甲、乙两县应住院者未住院原因情况
县别 经济困难 没有必要 没有时间 其它
合计
甲
293
10
17
13
333
乙
282
9
9
6
306
合计
575
19
26
19
639
表11.5 甲、乙两县应住院者未住院原因构成比(%)
县别 经济困难 没有必要 没有时间 其它
合计
甲 293((87.999)) 10(5.11) 17(3.00) 13(3.90) 333(100.00)
– 关注该事件在多次观察中“发生”的频度 – 取值在[0,1]
• 观察次数足够大(观察单位足够多)时, 可用来估计事件的发生概率
频率(Frequency)
• 2007~2010 年 某 地 区 MSM(Men who have Sex with Men)横断面调查HIV感染情况
2007~2010年某地区MSM的HIV感染情况
[0,1]
常见率的实质
• 频率(frequency)
– 发生比例,即发生某事件的对象所占的比重 – 说明某事件在群体中的发生频度
• 速率(rate)
– 是单位时间内事件的发生频率 – 说明事件在群体中某时期内的发生强度
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
– 病例对照研究中,病例组相对于对照组暴露于 某危险因素的优势比,也叫暴露优势比
肺癌病例对照研究吸烟史比较
吸烟情况
病例组
对照组
合计
有
688 (a)
650 (b)
1338
无
21 (c)
59 (d)
80
合计 Odds OR
709 (m1)
709 (m0)
1418
688/21
650/59
-
688
21 650
发生速率
某时期发生对象数 观察对象总数 观察时间
k
某时期发生对象数 观察总人时数(person time) k
某时期发生对象数 该时期平均观察对象数该时期时间 k
某时期发生对象数 (期初观察对象数+期末观察对象数) 2 该时期时间 k
速率(rate)
• 共观察100人,1年内50人发病
– 构成比:将事物每个部分的构成比结合在一起, 说明事物的内部构成情况
–率
• 频率(发生比例):说明事物发生频度 • 速率:说明事物单位时间的发生强度或速度
– 比:说明事物间的对比关系或密度情况
应用相对数应注意的问题
• 率或构成比的计算中,分母数据不宜过小 • 事物发生频度或强度的分析中,不能以构
乙
282 (92.16)
9 (2.94)
9(2.94)
6(1.96) 306(100.00)
合计 575 (89.98) 19 (2.97) 26 (4.07) 19 (2.97) 639 (100.00)
饼图(Pie graph)
5% 4% 3%
88%
经济困难 没有必要 没有时间 其它
甲县应住院者未住院原因构成比(%)
某部分构成比
该部分的观察单位数 各组成部分的观察单位总数
100%
– 取值在[0,1] – 各部分构成比总和为1或100%,此消彼长 – 各部分构成比结合在一起说明该事物的内部构
成情况
构成比
表11.5 甲、乙两县应住院者未住院原因构成比(%)
县别 经济困难 没有必要 没有时间 其它
合计
甲 293(87.99) 10(5.11) 17(3.00) 13(3.90) 333(100.00)
1 甲县
经济困难
1 乙县
没有必要
2 甲县
经济困难
2 乙县
经济困难
3 甲县
经济困难
3 乙县
经济困难
4 甲县
没有必要
4 乙县
经济困难
5 甲县
经济困难
5 乙县
没有时间
6 甲县
经济困难
6 乙县
经济困难
7 甲县 8 甲县 9 甲县 10 甲县
经济困难 没有时间 没有时间 其它
7 乙县 8 乙县 9 乙县 10 乙县
1000
6
600.0
相对数之比—OR
• 1950年,Doll和Hill吸烟与肺癌的关系研究
暴露
疾病状态
吸烟(a) 不吸烟(c) 吸烟(b) 不吸烟(d)
肺癌病例709例 病
(病例组)
例
回顾过去
对
吸烟情况
照
非肺癌个体709例 研
(对照组)
究
过去
现在
相对数之比—OR
• 比值(Odds):是指事件发生的概率与不发 生的概率之比
定性变量&统计描述
• 定性变量:变量值为定性描述
– 按该变量的特征表现为若干穷尽,且互斥的类 别—分类变量
– 从群体角度出发,考察该变量各类别的观察对 象数—计数变量
• 统计描述:用统计图、表、指标等描述变 量在群体中的分布特征
甲、乙两县应住院者未住院原因情况调查
ID 县别 不住院原因
ID 县别 不住院原因
年份
检查人数
阳性人数
阳性率(%)
2007
356
21
5.90
2008
534
43
8.05
2009
378
66
17.46
2010
622
91
14.63
()
20
18
16
14
感 染
12
率 10
%8
6
4
2
0
2007
2008
2009
2010
2007~2010年某地区MSM的HIV感染情况
()
20
18
16
14
感 染
3% 3% 2% 92%
经济困难 没有必要 没有时间 其它
乙县应住院者未住院原因构成比(%)
百分比条图(Percent bar graph)
100% 90% 80% 70% 60%
构 成 50% 比
40% 30% 20% 10% 0%
甲县
乙县
甲、乙两县应住院者未住院原因构成情况
其它 没有时间 没有必要 经济困难
年龄 出生时 20岁 50岁 60岁 70岁 80岁
性别比 107 100 98 95 85 66
2010 年 第 六 次 人 口 普 查 (2010年11月1日零时为标准时 点):
出 生 性 别 比 105.20 总 人 口 性 别 比 118.06 平均预期寿命(岁) 74.83
男性 72.38 女性 77.37
k
时期(累计)发生频率
某时期内发生某事件的累计观察单位数 该时期期初观察单位总数
k
– k为比例基数, 100%、 1000‰、10000/万……
• 依据习惯
• 使计算结果,保留1到2位整数
– 样本率常用p表示,总体率用表示
频率(Frequency)
• 其实质是发生比例(比重)
– 根据某事件是否发生将观察对象分为:发生、 未发生两类