分类变量的描述性统计讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相对危险度(relative risk,简称RR)是指暴露于某种 危险因素的观察对象的发病的危险度与低暴露或无暴 露的观察对象的发病危险度之间的相对比值。相对危 险度常用于队列研究,可用暴露与未暴露于危险因素 的累积发病率(Pl和P0)或人时发病率(F1和F0)估计, 公式为
RR P1 或 RR F1
第三讲 分类变量的统计描述
分类变量的整理(1)
14名成人的原始数据
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
性别 男 女 男 女 男 女 男 女 男 女 男 女 男 女
身高 175 167 187 176 167 178 174 170 167 186 182 159 167 182
OR=odds1/odds2=ad/bc
病人
表3-2 COPD病人与非病人的吸烟情况资料
有吸烟史
无吸烟史
合计
231
125
356
非病人
183
296
479
合计
414
421
835
例3-4 采用例3-1的资料,将基本数据用表3-2表示,试 计算优势与优势比。
病人有吸烟史的优势
odds1
231/ 356 125/ 356
科室 标准组出院
甲院
乙院
病 人 构 成 比 原 治 愈 率 (%) 分 配 治 愈 率 (%) 原 治 愈 率 (%) 分 配 治 愈 率 (%)
Ni/N
pi
⑴
⑵
⑶
(Ni/N)pi
pi
⑷ =⑵ ⑶
⑸
(Ni/N)pi ⑹ =⑵ ⑸
内科
0.2792
妇科
0.2907
小 儿 科 0.1515
外科
0.2786
1376
83.19
一、方法的选择
1. 直接法:各小组率已知,各小组观察 数或构成作为标准
2. 间接法:各小组观察数或构成,以及 平均率已知,以各小组率作为标准
二、标准的选取
1. 选一个具有代表性的、内部构成相对 稳定的较大人群作为标准
2. 将要比较的两组资料内部各相应小组 的观察单位数相加作为标准
(3-7)
仍采用例3-4中COPD病人中吸烟的概率P(A|B)=231/
356 =0.65,非COPD病人中吸烟的概率
B,
据估P(计A |,B) 人 18群3 /中47C9 O 0P.3D8患病率 P(B)=0.012,P( )=
0.988,则
P(B | A)
P(B)P(A| B)
0.012 0.65
内科
687
妇科
456
小 儿 科 239
外科
205
211 398 219 198
30.71 87.28 91.63 96.58
合计
1587
1026
64.65
乙院
出 院 人 数 治 愈 人 数 治 愈 率 (%)
218
69
31.65
486
412
84.77
252
228
90.48
698
667
95.56
1654
已婚
7
男
174
已婚
8
女
170
已婚
9
男
167
离异
10
女
186
离异
11
男
182
分居
12
女
159
分居
13
男
167
分居
14
女
182
分居
不同性别的婚姻状况 性别
婚姻状况 男女
单身 2 1 已婚 2 3 离异 1 1 分居 2 2
第一节 常用的比例指标及其意义
一、率: 1. 速率(rate):与时间有关,如某年某病发病率、死亡率。 2. 比率(proportion):与时间无关,如某病治愈率。
人 数 (n) 4
183 54 53 3 13
构 成 比 (%) 1.29
59.03 17.42 17.10
0.97 4.19
人 数 (n) 23 50 27
125 2
130
构 成 比 (%) 6.44
14.01 7.56
35.01 0.56
36.42
合 计 310
100.00
357
ห้องสมุดไป่ตู้
100.00
相 对 比 (relative ratio) 为两个有关指标之比,说明一个指标 是另一个指标的几倍或百分之几。两个指 标 可 能 性 质 相 同 或 性 质 不 同 。计 算 公 式 为 :
吸烟(事件 A)条件下患COPD(事件 B)的概率P(B|A) 是人们关心的问题。该问题的解决可以采用队列研究来观察, 但也可以根据患 COPD条件下吸烟的概率 P(A|B)推算吸烟 条件下患COPD的概率 P(B|A)。
P(B | A)
P(B)P(A | B)
P(B)P(A | B) P(B)P(A | B)
P0
F0
(3-4)
前瞻性研究(队列研究)的模式:
暴露人群 非暴露人群
结局 结局
发病
未发病 发病
未发病
从时间上来看:
因 现在
果 将来
因素
发病 未发病 发病率
暴露人群 a
b
P1
非暴露人 c
d
P0
群
P1=a/(a+b)
p0=c/(c+d)
RR=p1/p0
例3-3 某锡矿早年用原始方法开采,自1954年起有肺癌 发病和死亡的记录,到1981年止,全公司职工肺癌发病 率为143.34/10万,其中矿工发病率308.39/10万,非 矿工发病率为25.48/10万,试计算矿工与非矿工肺癌发 病的相对危险度。
优势(odds)与优势比(odds ratio,简称OR)也是 医学研究中常用的统计指标之一,一般用于病例-对照研 究中。某病患者(或非患者)中某种因素存在的比例P (E)与不存在的比例(1-P(E))的比值被称作优势。
odds P(E) 1 P(E)
(3 5)
odds大于1,说明某因素存在与不存在相比之下有优势; odds等于 1为势均力敌;odds小于1,说明缺乏优势。
Nipi
pi
⑷ =⑵ ⑶
⑸
Nipi ⑹ =⑵ ⑸
内 科 905 妇 科 942 小 儿 科 491 外 科 903 合 计 3241
30.71 87.28 91.63 96.58 64.65
277.96 822.18 449.91 872.17 2422.22
31.65 84.77 90.48 95.56 83.19
婚姻状况 单身 单身 单身 已婚 已婚 已婚 已婚 已婚 离异 离异 分居 分居 分居 分居
14名成人的婚姻状况
婚姻状况 频数
单身
3
已婚
5
离异
2
分居
4
合计
14
分类变量的整理(2)
14名成人的原始数据
编号
性别
身高 婚姻状况
1
男
175
单身
2
女
167
单身
3
男
187
单身
4
女
176
已婚
5
男
167
已婚
6
女
178
231 125
1.848
非病人有吸烟史的优势
183/ 479 183 odds0 296 / 479 296 0.618
病人和非病人吸烟史的优势比OR=1.848/0.618=2.99
优势比还需要经过统计学检验(见第六章第五节),若 该优势比经检验有统计学意义,可以认为吸烟史与COPD 有一定的关联。
(3-2)
特 点 : 1.各 部 分 构 成 比 的 合 计 等 于 100%或 1。 2.事 物 内 部 某 一 部 分 的 构 成 比 发 生 变 化
时,其它部分的构成比也相应地发生变化。
表 3-1 吸 毒 与 非 吸 毒 人 群 职 业 构 成 对 比 分 析
吸毒组
非吸毒组
职业 学生 无业 个体 工人 司机 其它
矿工与非矿工肺癌发病的危险度(R)分别为两组人群 的10肺万癌,非发矿病工率的(发P)病危。险矿度工P的0=发2病5.危48险/度10P万1=,308.39/
相对危险度 RR 32058..4389//1100万万=12.10
该资料表明,矿工肺癌发病的危险度是非矿工的12.10倍。
二、优势与优势比
例 3-5 欲 研 究 甲 乙 两 家 医 院 的 医 疗 质 量 , 调 查 了 两 院 四 个 科室的出院病人数和治愈数,得到如下资料。试对两院的医疗 质量进行比较,得出正确的结论。
表 3-3 某 市 甲 乙 两 院 各 科 出 院 和 治 愈 人 数 (1997年 )
甲院
科 室 出 院 人 数 治 愈 人 数 治 愈 率 (%)
患者与非患者某因素优势的比值被称作优势比(比值 比)。
OR odds1 odds2
(3 6)
回顾性研究(病例—对照研究)模式:
有
病例
暴露 无
有
对照
暴露 无
从时间上看: 果 现在
因 过去
病人 非病人
合计
有吸烟史 a
c a+c
无吸烟史 b
d b+d
合计 a+b
c+d N
Odds1=(a/a+b)/(b/(a+b)=p(E1)/(1-p(E1)) Odds2=(c/c+d)/(d/(c+d)=p(E2)/(1-p(E2))
合 计 1.0000
30.71 87.28 91.63 96.58 64.65
8.5742 25.3723 13.8819 26.9072 74.7311
31.65 84.77 90.48 95.56 83.19
8.8367 24.6426 13.7077 26.6230 73.8100
表 3-7 按 式 (3-10)间 接 法 计 算 甲 乙 两 院 的 标 准 化 治 愈 率 (%)
286.44 798.57 444.24 862.90 2392.15
甲 院 标 准 化 治 愈 率 p(%)=2422.22/3241=74.74% 乙 院 标 准 化 治 愈 率 p(%)=2392.15/3241=73.81%
直接法(各小组出院人数构成为标准)
表 3- 6 按 式 (3-9)直 接 法 计 算 甲 乙 两 院 的 标 准 化 率 (%)
表 3-2 COPD病 人 与 非 病 人 的 吸 烟 情 况 资 料
有吸烟史 无吸烟史 合计
COPD病 人
231
非病人
183
125
356
296
479
合计
414
421
835
吸烟率 64.89% 38.02% 49.58%
构 成 比 (constituent ratio)
构 成 比 = 事物内部某一部分的观察单位数 × 1 0 0 % 事物内部各部分的观察单位数总和
率 = 实际发生某现象的观察 数 可能发生某现象的观察 单位总数
×K
(3-1)
式中分子是实际发生某种事件的例数,分母是发生与未发 生 某 事 件 的 总 例 数 , K为 比 例 基 数 , 如 100%, 1000‰ ,万 / 万 , 十 万 /十 万 , 等 。
例3-1 某医生研究了慢性阻塞性肺病(COPD)病人的吸烟情 况,自1998~2000年收治COPD病人356人,其中231人有 三十年及以上的经常吸烟史(日平均1支以上),在本院其它 科室收治的同年龄组段的非COPD病人(无其它呼吸系统疾 患)479人,其中有三十年及以上的经常吸烟史的183人,试计 算并比较两组病人的吸烟率。
二、比: 1. 构成比(constituent ratio):部分与全部之比 2. 相对比(relative ratio):两指标之比
一、率 某现象实际发生数与可能发生某现象的总数之比,用 以说明某现象发生的频率或强度,又称频率指标,具有概 率意义。常以百分率、千分率、万分率或十万分率表示。 计算公式为:
3. 从要比较的两组中任选一组作为标准。
直接法(各小组出院人数为标准)
表 3-5 按 式 (3-8)直 接 法 计 算 甲 乙 两 院 的 标 准 化 率 (%)
科室 标准组
甲院
出 院 人 数 原 治 愈 率 (%) 预 期 治 愈 数
乙院 原 治 愈 率 (%) 预 期 治 愈 数
Ni
pi
⑴
⑵
⑶
0.0204
P(B)P(A | B) P(B)P(A | B) 0.012 0.65 0.988 038
故认为吸烟者中患COPD的概率为2.04%。
第三节 率的标准化法
目的: 用统一的标准(如年龄别人口 数、年龄别人口构成比、年龄别人死 亡率),消除内部构成不同对平均率 所产生的影响,使两组平均率具有可 比性。
一、相对危险度
危险度(risk)是医学研究中常用的一个统计指标, 常用概率(或频率)表示。如发病、患病或死亡的危险 度是指发病、患病或死亡的危险性,这种危险性用发病 率(incidence of a disease)。患病率(prevalence rate)、死亡率(death rate)表示。如吸烟者肺癌、 COPD的患病率高,也可以说吸烟是肺癌、COPD的高 危因素,吸烟者患肺癌、COPD的危险度大。
相 对 比 = 甲指标 乙指标
(3-3)
第二节 相对危险度与优势比
一、相对危险度(relative risk,RR): 1. 常用于流行病学的队列研究 2. 暴露组发病危险度与低暴露(或无暴露)组发病危险度之比。
二、优势比(odds ratio,OR): 1. 常用于流行病学的病例对照研究 2. 病例组某危险因素的优势与非病例组某危险因素的优势之比。