分类变量的描述性统计讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
内科
687
妇科
456
小 儿 科 239
外科
205
211 398 219 198
30.71 87.28 91.63 96.58
合计
1587
1026
64.65
乙院
出 院 人 数 治 愈 人 数 治 愈 率 (%)
218
69
31.65
486
412
84.77
252
228
90.48
698
667
95.56
1654
矿工与非矿工肺癌发病的危险度(R)分别为两组人群 的10肺万癌,非发矿病工率的(发P)病危。险矿度工P的0=发2病5.危48险/度10P万1=,308.39/
相对危险度 RR 32058..4389//1100万万=12.10
该资料表明,矿工肺癌发病的危险度是非矿工的12.10倍。
二、优势与优势比
1376
83.19
一、方法的选择
1. 直接法:各小组率已知,各小组观察 数或构成作为标准
2. 间接法:各小组观察数或构成,以及 平均率已知,以各小组率作为标准
二、标准的选取
1. 选一个具有代表性的、内部构成相对 稳定的较大人群作为标准
2. 将要比较的两组资料内部各相应小组 的观察单位数相加作为标准
患者与非患者某因素优势的比值被称作优势比(比值 比)。
OR odds1 odds2
(3 6)
回顾性研究(病例—对照研究)模式:
有
病例
暴露 无
有
对照
暴露 无
从时间上看: 果 现在
因 过去
病人 非病人
合计
有吸烟史 a
c a+c
无吸烟史 b
d b+d
合计 a+b
c+d N
Odds1=(a/a+b)/(b/(a+b)=p(E1)/(1-p(E1)) Odds2=(c/c+d)/(d/(c+d)=p(E2)/(1-p(E2))
(3-2)
特 点 : 1.各 部 分 构 成 比 的 合 计 等 于 100%或 1。 2.事 物 内 部 某 一 部 分 的 构 成 比 发 生 变 化
时,其它部分的构成比也相应地发生变化。
表 3-1 吸 毒 与 非 吸 毒 人 群 职 业 构 成 对 比 分 析
吸毒组
非吸毒组
职业 学生 无业 个体 工人 司机 其它
第三讲 分类变量的统计描述
分类变量的整理(1)
14名成人的原始数据
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
性别 男 女 男 女 男 女 男 女 男 女 男 女 男 女
身高 175 167 187 176 167 178 174 170 167 186 182 159 167 182
例 3-5 欲 研 究 甲 乙 两 家 医 院 的 医 疗 质 量 , 调 查 了 两 院 四 个 科室的出院病人数和治愈数,得到如下资料。试对两院的医疗 质量进行比较,得出正确的结论。
表 3-3 某 市 甲 乙 两 院 各 科 出 院 和 治 愈 人 数 (1997年 )
甲院
科 室 出 院 人 数 治 愈 人 数 治 愈 率 (%)
231 125
1.848
非病人有吸烟史的优势
183/ 479 183 odds0 296 / 479 296 0.618
病人和非病人吸烟史的优势比OR=1.848/0.618=2.99
优势比还需要经过统计学检验(见第六章第五节),若 该优势比经检验有统计学意义,可以认为吸烟史与COPD 有一定的关联。
已婚
7
男
174
已婚
8
女
170
已婚
9
男
167
离异
10
女
186
离异
11
男
182
分居
12
女
159
分居
13
男
167
分居
14
女
182
分居
不同性别的婚姻状况 性别
婚姻状况 男女
单身 2 1 已婚 2 3 离异 1 1 分居 2 2
第一节 常用的比例指标及其意义
一、率: 1. 速率(rate):与时间有关,如某年某病发病率、死亡率。 2. 比率(proportion):与时间无关,如某病治愈率。
3. 从要比较的两组中任选一组作为标准。
直接法(各小组出院人数为标准)
表 3-5 按 式 (3-8)直 接 法 计 算 甲 乙 两 院 的 标 准 化 率 (%)
科室 标准组
甲院
出 院 人 数 原 治 愈 率 (%) 预 期 治 愈 数
乙院 原 治 愈 率 (%) 预 期 治 愈 数
Ni
pi
⑴
⑵
⑶
(3-7)
仍采用例3-4中COPD病人中吸烟的概率P(A|B)=231/
356 =0.65,非COPD病人中吸烟的概率
B,
据估P(计A |,B) 人 18群3 /中47C9 O 0P.3D8患病率 P(B)=0.012,P( )=
0.988,则
P(B | A)
P(B)P(A| B)
0.012 0.65
表 3-2 COPD病 人 与 非 病 人 的 吸 烟 情 况 资 料
有吸烟史 无吸烟史 合计
COPD病 人
231
非病人
183
125
356
296
479
合计
414
421
835
吸烟率 64.89% 38.02% 49.58%
构 成 比 (constituent ratio)
构 成 比 = 事物内部某一部分的观察单位数 × 1 0 0 % 事物内部各部分的观察单位数总和
二、比: 1. 构成比(constituent ratio):部分与全部之比 2. 相对比(relative ratio):两指标之比
一、率 某现象实际发生数与可能发生某现象的总数之比,用 以说明某现象发生的频率或强度,又称频率指标,具有概 率意义。常以百分率、千分率、万分率或十万分率表示。 计算公式为:
科室 标准组出院
甲院
乙院
病 人 构 成 比 原 治 愈 率 (%) 分 配 治 愈 率 (%) 原 治 愈 率 (%) 分 配 治 愈 率 (%)
Ni/N
pi
⑴
⑵
⑶
(Ni/N)pi
pi
⑷ =⑵ ⑶
⑸
(Ni/N)pi ⑹ =⑵ ⑸
内科
0.2792
妇科
0.2907
小 儿 科 0.1515
外科
0.2786
婚姻状况 单身 单身 单身 已婚 已婚 已婚 已婚 已婚 离异 离异 分居 分居 分居 分居
14名成人的婚姻状况
婚姻状况 频数
单身
3
已婚
5
离异
2
分居
4
合计
14
分类变量的整理(2)
14名成人的原始数据
编号
性别
身高 婚姻状况
1
男
175
单身
2
女
167
单身
3
男
187
单身
4
女
176
已婚
5
男来自百度文库
167
已婚
6
女
178
优势(odds)与优势比(odds ratio,简称OR)也是 医学研究中常用的统计指标之一,一般用于病例-对照研 究中。某病患者(或非患者)中某种因素存在的比例P (E)与不存在的比例(1-P(E))的比值被称作优势。
odds P(E) 1 P(E)
(3 5)
odds大于1,说明某因素存在与不存在相比之下有优势; odds等于 1为势均力敌;odds小于1,说明缺乏优势。
Nipi
pi
⑷ =⑵ ⑶
⑸
Nipi ⑹ =⑵ ⑸
内 科 905 妇 科 942 小 儿 科 491 外 科 903 合 计 3241
30.71 87.28 91.63 96.58 64.65
277.96 822.18 449.91 872.17 2422.22
31.65 84.77 90.48 95.56 83.19
率 = 实际发生某现象的观察 数 可能发生某现象的观察 单位总数
×K
(3-1)
式中分子是实际发生某种事件的例数,分母是发生与未发 生 某 事 件 的 总 例 数 , K为 比 例 基 数 , 如 100%, 1000‰ ,万 / 万 , 十 万 /十 万 , 等 。
例3-1 某医生研究了慢性阻塞性肺病(COPD)病人的吸烟情 况,自1998~2000年收治COPD病人356人,其中231人有 三十年及以上的经常吸烟史(日平均1支以上),在本院其它 科室收治的同年龄组段的非COPD病人(无其它呼吸系统疾 患)479人,其中有三十年及以上的经常吸烟史的183人,试计 算并比较两组病人的吸烟率。
相 对 比 = 甲指标 乙指标
(3-3)
第二节 相对危险度与优势比
一、相对危险度(relative risk,RR): 1. 常用于流行病学的队列研究 2. 暴露组发病危险度与低暴露(或无暴露)组发病危险度之比。
二、优势比(odds ratio,OR): 1. 常用于流行病学的病例对照研究 2. 病例组某危险因素的优势与非病例组某危险因素的优势之比。
OR=odds1/odds2=ad/bc
病人
表3-2 COPD病人与非病人的吸烟情况资料
有吸烟史
无吸烟史
合计
231
125
356
非病人
183
296
479
合计
414
421
835
例3-4 采用例3-1的资料,将基本数据用表3-2表示,试 计算优势与优势比。
病人有吸烟史的优势
odds1
231/ 356 125/ 356
合 计 1.0000
30.71 87.28 91.63 96.58 64.65
8.5742 25.3723 13.8819 26.9072 74.7311
31.65 84.77 90.48 95.56 83.19
8.8367 24.6426 13.7077 26.6230 73.8100
表 3-7 按 式 (3-10)间 接 法 计 算 甲 乙 两 院 的 标 准 化 治 愈 率 (%)
吸烟(事件 A)条件下患COPD(事件 B)的概率P(B|A) 是人们关心的问题。该问题的解决可以采用队列研究来观察, 但也可以根据患 COPD条件下吸烟的概率 P(A|B)推算吸烟 条件下患COPD的概率 P(B|A)。
P(B | A)
P(B)P(A | B)
P(B)P(A | B) P(B)P(A | B)
一、相对危险度
危险度(risk)是医学研究中常用的一个统计指标, 常用概率(或频率)表示。如发病、患病或死亡的危险 度是指发病、患病或死亡的危险性,这种危险性用发病 率(incidence of a disease)。患病率(prevalence rate)、死亡率(death rate)表示。如吸烟者肺癌、 COPD的患病率高,也可以说吸烟是肺癌、COPD的高 危因素,吸烟者患肺癌、COPD的危险度大。
人 数 (n) 4
183 54 53 3 13
构 成 比 (%) 1.29
59.03 17.42 17.10
0.97 4.19
人 数 (n) 23 50 27
125 2
130
构 成 比 (%) 6.44
14.01 7.56
35.01 0.56
36.42
合 计 310
100.00
357
100.00
相 对 比 (relative ratio) 为两个有关指标之比,说明一个指标 是另一个指标的几倍或百分之几。两个指 标 可 能 性 质 相 同 或 性 质 不 同 。计 算 公 式 为 :
P0
F0
(3-4)
前瞻性研究(队列研究)的模式:
暴露人群 非暴露人群
结局 结局
发病
未发病 发病
未发病
从时间上来看:
因 现在
果 将来
因素
发病 未发病 发病率
暴露人群 a
b
P1
非暴露人 c
d
P0
群
P1=a/(a+b)
p0=c/(c+d)
RR=p1/p0
例3-3 某锡矿早年用原始方法开采,自1954年起有肺癌 发病和死亡的记录,到1981年止,全公司职工肺癌发病 率为143.34/10万,其中矿工发病率308.39/10万,非 矿工发病率为25.48/10万,试计算矿工与非矿工肺癌发 病的相对危险度。
相对危险度(relative risk,简称RR)是指暴露于某种 危险因素的观察对象的发病的危险度与低暴露或无暴 露的观察对象的发病危险度之间的相对比值。相对危 险度常用于队列研究,可用暴露与未暴露于危险因素 的累积发病率(Pl和P0)或人时发病率(F1和F0)估计, 公式为
RR P1 或 RR F1
0.0204
P(B)P(A | B) P(B)P(A | B) 0.012 0.65 0.988 038
故认为吸烟者中患COPD的概率为2.04%。
第三节 率的标准化法
目的: 用统一的标准(如年龄别人口 数、年龄别人口构成比、年龄别人死 亡率),消除内部构成不同对平均率 所产生的影响,使两组平均率具有可 比性。
286.44 798.57 444.24 862.90 2392.15
甲 院 标 准 化 治 愈 率 p(%)=2422.22/3241=74.74% 乙 院 标 准 化 治 愈 率 p(%)=2392.15/3241=73.81%
直接法(各小组出院人数构成为标准)
表 3- 6 按 式 (3-9)直 接 法 计 算 甲 乙 两 院 的 标 准 化 率 (%)