(卫生统计学)第十八章 病例-对照研究的设计与分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一节 病例-对照研究的基本概念
一、病例-对照研究的定义与类型
病例-对照研究:根据研究对象目前状态(是否有病)将其分到病例组 或对照组,然后回顾性地询问或调查研究对象过去的危险因素接触史,属 回顾性设计,是分析疾病与暴露因素发生之间的果 因关系。
病例-对照研究始于1926年Lane-Claypon的生育史与乳腺癌关系的病例-对 照研究,是流行病学研究最常见的设计模式。
二、分层四格表资料的分析
资料按某个可能的混杂因素(年龄等)分层,如果暴露只有两分类(有暴露与 无暴露),整个资料分解为多个四格表,分析方法采用M-H法。
aidi
(1)计算公共优势O比RMH
ni bici
ni
(2)对公共优势比进行设假检验,统计量为M2 H
ai Ti 2 Vi
其中,Ti
2.匹配设计
为了消除重要的已知混杂因素对研究结果的影响,按病例的混杂因素水 平选择1到数例匹配的对照,共同组成一个匹配(matching)组。保证两组人 群在匹配的混杂因素方面分布一致,避免其混杂影响。
例18-2 Mach等(1976)报道了子宫内膜癌的病例-对照研究,病例是从美 国洛杉矶退休团体收集的63例新发子宫内膜癌病人,按每个病例的婚姻状况 和年龄配取4例对照,对照没有做子宫切除,即仍处于发癌的高危人群。
组别
病例组 对照组 合计
暴露


a
b
c
d
m1
m0
合计
n1 n0 n
an1
1. 优势比的 O计 Rp1算 q1 bn1 ad
p0 q0
cn0 dn0
bc
2.优势比的假设检验
H0:OR1 ,H1:OR1
统计量为2 n1adbc2
n1n0m1m0
1
3.优势比的区间估计
(1)Woolf 法: 根据优势比的自然对数近似正态分布原理先求优势比自然对数的方差:
(3)估计OR的95%置信区间 5.2911.96/ 86.51 3.72 , 7.51
三、多个暴露水平的剂量-反应相关分析
当暴露水平按等级分类时,讨论暴露水平的升高(下降)与与相应的优势比的 升高(下降)的反应关系。 H0:不存在剂量-反应线性关系 ;H1:存在剂量-反应线性关系 。
统计量为 其中:
(1)计算公共优势比
ORM H
58.5386
5.29
11.0715
与简单四格表的OR 5.64比较,表明年龄因素的混杂作用不大。
(2)对公共优势比进行假设检验
2 M H
96 48.53892
26.0437
86.51 3.84
p 0.05 , 可以认为按年龄分层后每日饮酒量仍与食管癌有关。
( H0:OR=1,即发癌与饮酒量之间不存在剂量-反应关系。 )
每日饮酒量
xi 病例数ai(Ti)
对照数bi 合计人数mi 优势比ORi
χ2i
0~39 0
29(85.13) 386 415 1.0 -
40~79 1
75(72.82) 280 355 3.57 32.70
80~119 2
51(28.31) 87 138 7.80
病例-对照研究过程
暴露


未暴露

暴露 未暴露 调查方向
对 照 组
研究开始
病例-对照研究的两种类型
1.成组设计 把患某种疾病的病人作为病例组,不患该种疾病的人作为对照组,比
较这两类人群的暴露史。该类型设计简单,但结果可能会受混杂因素干扰 而影响结论的可靠性。
例18-1 Tuyns等(1977)报道了食管癌与饮食习惯的研究,病例是从当 地医院收集的1972年至1974年治疗的200例男性食管癌病人,对照组是按 选举号顺序随机抽取的778名当地居民,其中有效问卷775份。两组对象的 调查内容包括吸烟、各种含酒精饮料和其它食物等。
15 .92 73.84
结论:按0.05水平,发癌与饮酒量之间存在剂量-反应关系。
第三节 匹配设计资料的分析
一、1︰1配对设计资料的分析
病例暴露水平
+ _ 合计
配对设计资料的四格表格式
对照暴露水平
+
-
缺点:
1.不能直接估计因果关系,特别是无法从时间先后上判断何为因、何为果;
2.暴露信息不是很准确; 3.不适用于罕见暴露的研究;
4.难以选择合适的对照组,常常导致严重的偏倚。
第二节 成组设计资料的分析
一、大样本简单四格表资料的分析
在病例-对照研究中,如果病例组与对照组的暴露史只取有暴露和无暴 露两水平,可将资料整理成四格表的形式。
据题意0051645011282例对照即至少需调查病例963232308725312514三描述疾病与危险因素关联的指标优势比or优势露频率与无暴露频率的为对照组的危险因素暴优势露频率与无暴露频率的为病例组的危险因素暴优势比oddsratio病例对照研究的两个重要命题
(卫生统计学)第十八章 病例-对照研 究的设计与分析
2 22 9 8 8 7 0 4 5 7 1 3 43 8 2 1 1 6 5 535 1 8 3 7.0 53
剂量-反应关系假设检验
220 79 07 7 39 55 970 7 2 25 5 4 02 1 . 9 5 .8 .3 .1 2 5 6 3 .7 . .3 0 44 51 1 ..7 3 5 . .4 3267 2
OR p1 q1 p1q0 p0 q0 p0q1
病例-对照研究的两个重要命题:
1.病例组和对照组暴露的优势比等于暴露组与非暴露组发病的优势比。
即:病例-对照研究中暴露于危险因素的优势比等于追踪研究中不同暴露水 平下发病与否的优势比。
(证明详见“卫生统计学学习指导”,第十八章的思考与练习)
2.当发病率很小时,不同暴露水平下发病与否的优势比接近相对危险度。
p1 100..114455.010.4487 , q1 10.44870.5513
p0.44870.140.2944 , q10.29440.7056, 0.44870.140.3087
2
N'
1.64511/30.29440.70561.2820.44870.55130.140.86/3 0.44870.142
即:当发病率p0和p1很小时(小于1%) ,有q1≈q0 ,
OR p1q0 p1 RR p0q1 p0
(OR≈RR)
因此,通过病例-对照研究,可用病例组和对照组暴露这一事件的优势比OR近似 估计疾病发生的相对危险度RR。这就是病例-对照研究的理论根据。
四、病例-对照研究的优缺点
优点:
1.适用于罕见病的研究; 2.适用于慢病的研究; 3.省时、省钱、样本量相对小。
200775205770 p 0.05 可认为食管癌与每日酒饮量有关。
(3) 估计优势比的置信区间
Wool法 f :Varln OR 1 1 1 1 0.0307
96 104 109 666
5.64e1.96 0.0307 4.00, 7.95 ,而Miettine法 n 的结果:4.08,7.79
2.8593
3.7934
5.67
6.36
11.6620
21.6694
6.8576
10.6701
65+ 病例 对照
i=4
24
18
44
119
13.9317
3.8634
3.61
13.9317
7.4392
合计 病例 对照
96
109
104
666
58.5386
11.0715
5.64
48.5329
26.0437
如 取 i: 2a n 2 d 2 2 2 2 5 2 1 9 2 5 3 1 1 8 3 1.1 8 69,7 b n 2 c 2 2 2 2 2 5 2 9 2 2 9 1 1 1 3 2 .8 859 O 2 2 R a b 2 2 d c 2 2 2 2 1 5 2 9 3 1 5 .6 87
T 2 a 2 c 2 n 2 a 2 b 2 2 2 2 5 2 5 2 9 2 1 1 2 5 1 3 9 4 2 8 5 6 1 4 1 3 .6 162V 2 0 4 2 1 6 2 1 2 6 53 1 1 1 7 4 3 5 6 .8 9576
例18-5的分析求解
k
xi ai Ti 2 n3 n2
2 i0
n1n0 n
k
mi xi2
k
mi
xi
2
i0
i0
1
k 暴露水平数; Ti 病例组第 i暴露水平的理论数
xi 第i暴露水平的赋值
将暴露水平分成四组,试分析每日饮酒 量与食管癌发病是否存在剂量-反应关系。
二、病例-对照研究的设计特点
1. 病例的选择 ⑴明确疾病诊断标准,病例诊断准确
⑵病例来源:医院和自然人群
2. 对照的选择 产生病例的总体中的随机样本(非该病例),可以是自然人群、特殊人群, 甚至可以是患其他疾病(与研究疾病关系不大)的病人
3. 样本含量估计 成组比较时,样本含量的估计(见样本含量估计步骤与例18-3)
2. 计算病例组的样本含量
N,
N
N' 4
1
1
4 N '
2
式中: p1 p0
例18-3
在食管癌的研究中已知对照人群重度饮酒(暴露)率为14% , 设零假设是重度饮酒 与食管癌发病无关 , 即
H0: OR=1.0 ; H1:OR=5.0 。指定单侧α=0.05 , β=0.10 , 试按对照组例数为病例组例数的3倍(C=3)的要求估算病例组例数。 解:据题意 , 已知p0=0.14 , q0=0.86 , OR=5.0 , C=3.0 , Z0.05=1.645 , Z0.1=1.282
75.03
120+ 3
45(13.74) 22 67
27.23 160.41
合计
200(n1) 775(n0) 975(n)
如取 : i2T 21 93 7 28 50 20 .3 81O2 R 0 0 ..1 68 3( (1 1 3 7 0 0 ..1 6 9 58 3 ) ) 3 7 7 .8 9 50
4.偏倚与控制 偏倚有:选择性偏倚、信息偏倚、混杂偏倚。
样本含量估计步骤
1.
计算 N ' Z
1 1 / C pq Z
2
p1q1 p0q0 / C
p1 p0 2
式中:
C 为对照组例数 / 病例组例数,由设计者 事先给定 ;
p
为对照组中有暴露史者
0
所占比率, q0 1 p0 ;
p1为病例组中有暴露史者
所占比率, q1 1 p1
;
p p1 p0 2
,
q 1 p
设 OR 为对立假设中优势比,

p1与
p
的关系有:
0
p1
1
p 0 OR
p0 OR
1
Z 是第一类错误为 时的标准正态分布临界 值, Z 0.05单 1.645 , Z 0.05双 1.96
Z 是第二类错误为 时的标准正态分布临界 值,通常取单侧 Z 0.1单 1.282
Varln OR 1 1 1 1
abcd 再求OR的95%置信区间:OR e1.96 VarlnOR (2) Miettinen法:
在 2检验的基础上计算OR的95%置信区间:OR11.96/ 2
例18-4
在食管癌与饮酒的研究中,将每日饮酒量在80克以上定为暴露组, 80克以下 定为非暴露组,资料整理如下表,对该资料作统计分析。
每日饮 酒量 (g)
80+ 0~79 aidi/ni bici/ni ORi
Ti Vi
25~44 病例 对照
i=1
5
35
5
270
4.2857
0.5556
7.72
1.2698
1.0768
年龄组
45~54 病例 对照
55~64 病例 对照
i=2
i=3
25
29
42
27
21
138
34
139
16.1972
24.1240
ai ci ai bi ni
n1im1i 理论值 ni
,
Vi
n1i n0i m1i m0i ni2 ni 1
(3)OR的95%置信区间为OR11.96/ M2 H
例18-5 在例18-4的食管癌与饮酒关系的分析中,年龄可能是混杂因素。现将每日饮酒量
的资料按年龄组分解成4个四格表,估计各层的OR值。
组别
病例组 对照组
合计
每日饮酒量(克/天)
80+
0~79
96(a)
104(b)
109(c)
666(d)
205
770
合计
200 775 975
暴露频率p
0.48 0.14 0.21
解:(1)优势比的估计值 OR ad 96666 5.64 bc 104109
(2)优势比的假设检验2 9751966661041092 110.14 3.84
2
25.31
25.31
4
2
N
4
1
125.310.3087
32
即至少需调查 32例 病, 例对9照 6例。
三、描述疾病与危险因素关联的指标—优势比OR
1. 优势(odds)
称p1为病例组的危险露因频素率暴与无暴露优频势率的 q1
称p0 为对照组的危险露因频素率暴与无暴露优频势率的 q0
2. 优势比(odds ratio ,OR) 描述疾病与危险因素关联程度:
相关文档
最新文档