医学统计 分类变量的描述性统计

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分类变量资料用相对数指标描述。常用的相对数指标有率、 构成比和相对比。
1. 率
率(rate),又称频率指标或强度指标,它说明某现象发
生的频率或强度。
计算公式:率

发生某现象的观察单位总数 可能发生某现象的观察单位总数

K
式中,K为比例基数,常用的K有100%或1000‰、
10000/万、100000/10万等。
或率比(rate ratio)。 RR Ie a /n1 、 Ie a / n1 、 I0 c / n2
I0 c / n0
相对危险度 表示暴露组与非暴露组发病率(或死亡率)的 比值。反映了暴露与疾病发生的关联强度。
RR表明暴露组发病或死亡的危险是非暴露组的多少倍。
优势(odds) 指某病患者(或)非患者中某种因素存在的比例与不 存在的比例之比值。
表 1 某校新生性别构成
性别 男 女 合计
人数 580 470 1050
表 2 某药疗效
疗效 治愈 显效 好转 无效 合计
人数 10 30 50 10 100
分类变量资料的频数表
表 2-6 某市某年各区急性传染病发病数
市区
急性传染病发生数
A
2433
B
3033
C
1650
D
1503
E
1282
F
1853
G
1130
合计
12884
§3.2 常用的比例指标
表 1 某校新生性别构成
表 2 某地某年肠道传染病发病情况
性别 男 女 合计
人数 580 470
1050
构成比(%) 55.24 44.76 100.0
是否发病 发病
未发病 合计
人数 300
29700 30000
率(%) 1.0
99.0 100.0
表1用男、女生所占构成比反映全校性别构成情况,表2用 发病率反映肠道传染病的流行程度,这些指标都是用两个 数值之比计算出来的,此类指标通称相对数或比例指标。 将直接统计得到的频数称为绝对数。实际应用中,常把相 对数与绝对数结合应用。
OR>1,说明 该因素是疾病的危险性增加,为危险因素; OR<1,说明 该因素是疾病的危险性减小,为保护因素;
§3.4 率的标准化法
标准化的目的 标准化法的基本思想 标准组的选择 标准化率的计算
表 2-7 甲、乙两地感染性腹泻年龄别发病率(1/万)比较
年龄 (岁)
0 1 5 10 20 40 合计
人口 数 (1)
1398 5322 5463 8347 12937 10227
43694
甲地 人口
发病 年龄 人数 构成 比(2) (3) 0.0320 25 0.1218 90 0.1250 108 0.1910 66 0.2961 27 0.2341 10
1.0000 326
人口 发病 数 率(4) (5)
4. 标准化率的计算
标准化率(standardized rate),简称标化率,亦称调整率。 应用:标准化率常用于人群性别、年龄构成不同的两
地的出生率、患病率和病死率的比较;也可用于病情 轻重、病程长短不同的两组治愈率的比较等。 计算方法: 直接法
间接法
直接法
直接法:用于已知被标化组的年龄别率,以及 已知标准组的年龄别人口数或年龄别人口构成 比时。 用标准组年龄别人口数计算 用标准组年龄别人口构成比计算
死亡率 某期间 同内 期(因 平某 均病 人)口 死数 亡总数 k
k 100%,1000/ 千,或10000/ 万
死亡率可按病种、年龄、性别、职业等分类计算死亡 专率,用于探讨病因和评价防治措施。
2. 构成比
构成比(proportion),又称构成指标,它说明某事物 (或现象)内部各组成部分所占的比重或分布,常以百 分数表示。
调查方向:追踪收集资料
暴露
疾病 人数
比较
+
研究人群
-
+a -b
+c -d
a/(a+b) c/(c+d)
队列研究原理示意图
病例 非病例
暴露组
a
来自百度文库
b
非暴露组 c
d
合计 n1=a+b n0=c+d
发病率 a/ n1 c/ n0
相对危险度(relative risk, RR)也称危险比(risk ratio)
苗的有效者,不应计入分母内。但实际工作中不易做到,
故分母多用同期平均人口数。
常用的频率指标
患病率(prevalence rate):也称现患率,指某特定时间 内总人口中,曾患有某病(包括新和旧病例)所占的比 例。按观察时间不同分为期间患病率和时点患病率。
时点患病率
某一时点一定人群中现患某病新旧病例数
直接法----用标准组年龄别人口数计算
①选定标准组。本例选用甲地各年龄组的实际人口数为 标准组年龄别人口数;
②将乙地各年龄组实际发病率与相应的标准年龄别人口 数相乘,得出乙地各年龄组的预期(理论)发病数; ③将乙地各年龄组预期发病数之和除以标准人口总数, 得出乙地标准化总发病率。
p' N i pi N
计算公式:
构成比 某一组成部分的观察单位数 100% 同一事物各组成部分的观察单位数
注意:①所有组成部分的构成比之和应等于100%; ②同一事物内部各组成部分的构成比,计算时小数点 后保留位数应相同。
3. 相对比
相对比(relative ratio),亦称比,是A、B 2个有关指 标之比,说明A为B的若干倍或百分之几。两个指标 可以是性质相同的,也可以是性质不同的;两个指 标可以是绝对数,也可以是相对数或平均数。
计算公式为: 相对比 A(或100%) B
相对比
A、B为同类指标时,相对比用以说明两事物的相对水平。 常以百分数或倍数表示,如人口出生性别比、两病区病 床数之比。流行病学中常用的相对危险度(RR)、比数比 (OR)也为此类。 A、B为不同类指标时,如人口密度(人/平方公里)、医生 数/千人口、病床数/千人口、小鼠肝重与体重之比等。 相对比是相对数的最简单形式,常用于动态数列的分析。 动态数列是按时间顺序排列起来的一系列统计指标(包括 绝对数、相对数和平均数),用来说明某事物在时间上的 变化和发展趋势。
1853
0.76
G 153838
1130
0.76
合计 2812647 12884

各区传染病 各区发病率
发病构成(%) (1/10 万)
(5)
(6)
18.9
382
23.5
779
12.8
236
11.6
458
10.0
447
14.4
584
8.8
735
100.0
458
§3.3 相对危险度与优势比
危险度(risk) 发病、患病或死亡的危险度指发病、患病或死亡的危 险性,用发病率、患病率、死亡率表示。
1.0000 287
发病 率(8)
185.92 200.29 208.42 79.21 40.11 11.46 64.79
1. 标准化的目的
标准化(standardization)的目的在于消除混杂因素 (confounding factor)对结果的影响,使资料具有可 比性。 例如,欲比较两地的总死亡率,若两地的年龄、 性别等构成不同,而年龄、性别等又影响死亡率 时,则年龄、性别等为混杂因素,使两地总死亡 率无可比性。为消除年龄、性别等的影响,可用 标准化法。
178.83 169.11 197.69 79.07 20.87
9.78
74.61
1506 2746 2303 7575 21441 8727 44298
乙地 人口
发病 年 龄 人数 构成 比(6) (7) 0.0340 28 0.0620 55 0.0520 48 0.1710 60 0.4840 86 0.1970 10
表 2-6 某市某年各区急性传染病发病数及其相对数
市区 (1)
年平均 急性传染病 各区与 A 区
人口数 发生数 发病数之比
(2)
(3)
(4)
A 636723
2433

B 389540
3033
1.25
C 699712
1650
0.68
D 328363
1503
0.62
E 286967
1282
0.53
F 317504
第三章 分类变量的描述性统计
§3.1 分类变量资料的频数表 §3.2 常用的比例指标 §3.3 相对危险度与优度比 §3.4 率的标准化法 §3.5 应用相对数时应注意的事项
§3.1 分类变量资料的频数表
分类变量资料:将观察单位按属性或类别计数所得的 资料。
各类别及其相应的观察单位数构成频数表。分类变量 资料频数表编制方法简单。
2. 标准化的基本思想
标准化法的基本思想:将所比较的两组或多组 资料的构成按统一的“标准”调整后,计算标 化率,使其具有可比性。 需指定一个标准的人口构成,消除内部构成的 影响。
3. 标准组的选择
应根据研究目的选择有代表性、较稳定和数量较大的人 群作为标准组。例如,世界、全国、全省、本地的数据 作为标准较理想。 选择方法:①以两组资料中任一组的年龄别人口数或构 成比作为标准组;②以两组资料合并的各年龄组的人口 数或构成比作为标准组;③以公认的或便于与他人资料 比较的标准作为标准组, 例如,用全国、全省或本地区 的年龄别人口构成作为标准。 以上三种方法中,最好尽量采用第三种,这样便于与其 他地区进行比较,第一、二种方法只适用于所研究的两 组资料。
选择K的要点:①根据习惯用法以便于比较,如治愈率、 某病病死率、人工流产率等用百分率;出生率、婴儿
死亡率等用千分率;恶性肿瘤死亡率用十万分率;②
使算得的率至少保留1~2位整数。
常用的频率指标
发病率(incidence rate):指在一定期间内、一定人群中某
病新病例出现的频率。用来说明居民在一定时期内某病
b /(a b)
d /(c d )
该暴露因素的优势比: OR = a /(a b) c /(c d ) ad
b /(a b) d /(c d ) bc
相对危险度RR的本质是暴露组与非暴露组发病率之比或发病概率 之比。但病例对照研究不能计算发病率,只能计算比值比OR值。 OR与RR的含义是相同的,也是指暴露组的疾病危险性为非暴露组 的多少倍。当疾病发病率小于5%时,OR是RR的极好近似值。
优势比(odds ratio,OR): 指患者与非患者某因素优势的比值。
优势与优势比常用于病例对照研究。
• 病例对照研究(case-control studies):一种由果及因
的回顾性研究,先按疾病状态确定调查对象,分
为病例(case)和对照(control)两组,然后利用已有
的记录、或采用询问、填写调查表等方式,了解
相对危险度(relative risk, RR) 指暴露于某种危险因素的观察对象其发病、患病或死 亡的危险度与低暴露或无暴露的观察对象的危险度间 的相对比值。 相对危险度常用于队列研究。
• 队列研究(cohort study):也称前瞻性研究、随访研究等。是一种由 因及果的研究,在研究开始时,根据以往有无暴露经历,将研究人 群分为暴露人群和非暴露人群,在一定时期内,随访观察和比较两 组人群的发病率或死亡率。如果两组人群发病率或死亡率差别有统 计学意义,则认为暴露和疾病间存在联系。队列研究验证的暴露因 素在研究开始前已存在,研究者知道每个研究对象的暴露情况。
该时点人口数

k
期间患病率
某观察期间一定人群中现患某病的新旧病例数
同期的平均人口数

k
k 100%,1000/ 千 , 或10000/ 万
常用的频率指标
死亡率(mortality rate):表示在一定期间内,在一定 人群中,死于某病(或死于所有原因)的频率。是测量 人群死亡危险最常用的指标。用于衡量某一时期、一 个地区人群的死亡危险性大小。常以年为单位。
其发病前的暴调露查情方向况:收,集并回顾进性行资料比较,推测疾病与
暴比露较间的关系人。数 暴露
疾病
a/(a+b) c/(c+d)
a
+
b
-
c
+
d
-
病例对照原理示意图
病例 对照
是否暴露 暴露组 未暴露组 合计
病例 a c a+c
对照 b d b+d
合计 a+b(n1) c+d(n2) n
病例组暴露的优势: a /(a b) 、对照组暴露的优势: c /(c d )
的发病水平。
发病率
一定期间内某人群中某病新病例数
同时期暴露人口数

k
k 100%,1000/ 千 , 或10000/ 万
分子是一定期间内的新发病人数,若在观察期间内一个人
多次患病时,则应多次计为新发病例数,如流感等。
分母中所规定的暴露人口是指可能会发生该病的人群,对
那些不可能患该病的人,如传染病的非易感者,已接种疫
相关文档
最新文档