第四章队列研究(cohortstudy)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 队列研究 (cohort study)
前瞻性研究(Prospective study);发生率研究(incidence study); 随访研究(follow-up study);纵向研究(longitudinal study)
1. 2. 3. 4. 6. 7.
概述 研究实例 研究设计与实施 资料整理与分析 常见偏倚及其控制 优点与局限性
(一)研究现场:有足量研究对象;领导重视;群众配合; 交通方便;文化水平、医疗卫生条件好
(二)研究人群 1、暴露人群 (1)职业人群:联苯胺致膀胱癌——染料厂工人 石棉致肺癌——石棉作业工人 (2)特殊暴露人群:对某因素有高暴露率的人群(放 射线辐射与白血病之关系:受原子弹爆炸危害 者;接受放射线治疗者) (3)一般人群:吸烟与肺癌;口服避孕药与子宫内膜 癌;饮食与高血压等。 缺点:面访个体而不能从记录中获取资料 注意问题:因素与疾病均应常见;无或不需 特殊暴露人群 (4)有组织的团体:医学、工会会员;参加保险者 (吸烟与肺癌)
求:每组n=? 计算:P1RR•p0=0.0175
q1=1-p1=0.0175
p = 1 / 2(0.007 0.0175 ) = 0.0123 q = 0.9877
代入上式计算: n=2310 如考虑失访: n=2310(1+0.1)=2541
公式:
n = 2 pq (Ua Ub ) /( p1 p0) p = 0.5( p1 p 0) q = 1 p
351(b) 817(d) 1168(m0)
363(n1) 818(n0) 1181(n)
3.31 0.12
中国人畜共患病杂志 1988, 4(3):44
1)卡方检验:c2=20.6 自由度=1 P<0.01 2)U检验:大样本,样本率的频数分布接近于正态分布时
2、发病密度法(incidence density;ID):(适用于动态队列) 发病密度:一定时期内的平均发病率(以人时为分母计算的发病率) ID=D/PT D:观察期间发病数 PT:观察人时数(person time) PT=观察人数×观察时间 观察时间常用年(人年数,person year) 1个月=0.0833年,1天=0.00274年 对发病密度资料,要进行c2 检验。
(一)基线资料收集(baseline information):
待研究的暴露因素和暴露情况的资料,疾病与健康状况的资 料以及个人信息资料
1、记录或档案 2、访问 3、体检及实验室检查 4、环境资料
(二)随访
1、随访期:据疾病的潜伏期(病因作用到临床发现)和暴露与 疾病的联系强度作出 2、随访目的:1)确定研究对象是否处于观察之中(分母) 2)确定人群中事件结局(分子) 3)收集混杂因素的资料 3、随访方法:1)利用记录或档案 2)特殊方法:面谈、电话、通信 3)环境检测 4、观察终点(end point)与终止时间:前者是观察对象出现了预 期的结果;后者是整个研究可得出结论的时间 5、间隔时间:据具体情况而定 6、随访者:培训
第三节 研究设计与实施
确定研究因素 确定研究结局 确定研究现场与研究人群 确定样本量 资料的收集与随访 质量控制
一、确定研究因素:暴露因素(危险因素;保护 因素),一般在描述性研究和病例对照研究基础 上进行 二、确定研究结局(outcome):研究者预期的 结果事件;死亡、发病以及某些试验指标的变化 三、确定研究现场和研究人群
2、对照人群的选择
可比性
(1)内对照:同一队列无暴露或暴露水平低者 如Framingham心脏病研究 (2)外对照:在特殊暴露人群以外的特设对照 放射科医师——五官科医师 (3)一般人群对照:发病或死亡率易得且稳定 缺点:资料粗糙,项目不全 注意:时间和地区应同暴露人群 (4)多重对照:多种对照
四、确定样本量(size of sample)
1、注意问题 (1)抽样方法 (2)暴露组与对照组的比例:相等 (3)失访率:按10%估计 2、影响因素 (1)一般人群中所研究疾病的发病率(p0) (2)暴露人群发病率( p1);d=p1-p0 p1=RR•p0 (3)希望的显著性水平(a=0.05 or =0.01) (4)希望的把握度(power):(1- b=0.9)
(历史性)
研究开始
追溯收集历 史资料
(前瞻性)
继续追踪收 集资料
暴露组
------------------------→
非暴露组
(双向性队列研究)
暴露组
追踪收 集资料
非暴露组
过去
现在
将来
(四)不同研究类型的选用原则
前瞻性队列研究 1、目的明确 2、疾病发病率或死亡率≥5‰ 3、能获得暴露资料 4、确定结局的方法简便可靠 5、有足量样本,且人群稳定 6、有足够的可利用资源 历史性队列研究 要有完整可靠的历史记录或档案 双向性对列研究
二、 基本原理
现在
暴露
无干预
将来
疾病 人数 比较
是否暴露
a
+
a/(a+b)
+
目标 人群
b
+
c d
c/(c+b)_
-
基本特征
属于观察法 设立对照组 由“因及果”的研究 能证明暴露与结局的因果联系(可信性强) 一“因”多“果”的研究
三、研究目的
1、检验病因假设:验证某种因素对某种疾病 发病率、死亡率或某种 健康状态的影响。 2、评价预防效果:“人群的自然实验”。 3、描述疾病的自然史:疾病的全部自然发生、 发展的 过程为疾病的自然史。
4 2 3 2 7 8 3 5 2 1 0 37
30 11 8 19 25 29 73 74 467 819 57
1425.5 1464.0 1504.5 1521.0 1502.0 1481.5 1440.5 1375.5 1112.0 473.5 36.5 1333.6
第一年暴露人年数为: L1=I1+1/2(N1-D1-W1)=1403+1/2(79-4-30)=1425.5 I2=I1+N1-D1-W1=1403+79-4-30=1448 L2=1448+1/2(45-2-11)=1464 以此类推,合计得13336.5人年
2
2
例:放射线与白血病,人群发病率(p0)=0.0001, 暴露组发病率(p1)=0.001。 定:a=0.05(双侧)b=0.1 查表:Ua=1.96 Ub=1.282 代入上式得:每组n≈14266(人) 考虑失访:每组n= 14266+ 14266×10% ≈15693(人)
五、资料的收集与随访
3、计算 公式:
n=
( Z b P q p q Za 2 p q )
0 0 1 1
2
( p1 p0 )
2
q = 1 p
例:评价口服避孕药与子女患先天性心脏病之关系
已知:非暴露组发病率为P0=0.07 q0=1.993 假定 RR=2.5 设 a=0.5 b=0.1 查表 Za=1.96 Z b=1.282
流行病学资料分析原则
1、描述性分析:
研究对象的一般特征 均衡性检验 显著性检验:比较两组率(暴露比例)有无显著性差异 效应估计(联系强度) :用率或暴露比估计
2、推断性分析:
3、控制混杂因素:匹配;分层;多因素分析
二、人时计算(person time)
(一)以个体为单位计算暴露人年(person year): 精确法:以天为单位,计算研究对象被观察的天数,折合成人年。 近似法:以年为单位计算,开始与终止年份各算0.5年,同一年开始 与终止者算0.25年,开始与终止年份之间算1年,累积人年。 (二)动态人群:不知道每个成员进入和退出的准确时间,只有每年横断面调查 的资料。以平均人数乘观察年数得总人年数;平均人数为相邻两时段人口平均 数或年中人数。 表 动态人群人年计算
年龄 (岁) 35~ 45~ 55~64 合计 51.11.1 8836 7117 4094 20097 52.11.1 9149 7257 4212 20618 观察人数 53.11.1 54.11.1 9289 7381 4375 21043 9414 7351 4601 21366 人年数 55.11.1 9710 7215 5057 21982 56.11.1 9796 7191 5243 22230 41211 32156 19909 93276
三、率的计算
(一)常用指标 1. 累积发病率(cumulative incidence): 简单累积法:(适用于固定队列) 观察时间内发病人数 累积发病率 = 观察开始时人数
表
100%
钩体感染与脑动脉炎关系的队列研究
组别
发病人数
未发病人数
总人数
发病率%
暴露组 非暴露组 合计
12(a) 1(c) 13(m1)
从暴露到现在的观察时间还不能满足研究的要求,还需前瞻性观察一段 时间
第二节 研究实例
石棉与肺癌联系的病例对照研究
Mount-Sinai研究:接触石棉粉尘的四个职业人群为暴露组,总人群 为非暴露组。肺癌SMR=5.31;胃肠道肿瘤=2.06;全肿瘤=3.26;全 死因=1.47 数个规模较大的研究证明二者联系有普遍性 特异性:肺癌联系最强;肺腺癌占30%-40%(一般人群=15%20%);病变部位在肺下叶周边部 剂量反应关系:时间:暴露1个月SMR=2.24;1年为SMR=7.84 浓度:男、 >2年、低者SMR=1.6;高者=2.3
六、质量控制 1、调查员的选择 2、调查员的培训 3、制定调查手册 4、监督
重复调查;数值检查或逻辑检错;定期观察调查员的工作; 对不同调查员的数据进行分布比较;变量的时间趋势分析;使 用录音机
第四节 资料的整理与分析
一、队列研究资料整理表
组别 病例 非病例 合计 发病率
暴露组 a b a +b =n 1 a / n 1 = Ie 非暴露组 c d c +d =n 0 c / n 0 = Io 合计 a+c=m1 b+d=m0 a+b+c+d=t m1/ t= It
第一节 概 述 一、概念
1、队列:有共同经历或状态的一群人。 固定队列(fixed cohort):指某特定事件发生时所有的人 作为一个队列,或相对稳定、相对大的人群。原子弹 爆炸后形成的队列。 动态队列(dynamic cohort):是经常增加或减少队列成员 的队列。 2、队列研究:选择暴露于及非暴露于某因素的两组人群,随访观察一定时间, 比较两组人群某种疾病的结局(发病率、死亡率)从而判断该因素与发病 或死亡有无关联及关联的大小。 3、暴露(exposure):研究对象接触过某种待研究的物质、具备某种待研究 的特征或行为。 4、危险因素(risk factor):泛指引起某特定结局(outcome)的发生,后使其 发生的概率增加的因子。
表
观察时间 (年数) x 年初人数 年内进入人数 Ix Nx
寿命表法计算人
年内发病人数 年内失访人数 暴露人年数 Dx Wx Lx
1பைடு நூலகம்2
3
4 5 6 7 8 9 10 11 合计
1403 1448 1480 1529 1513 1519 1472 1409 1342 882 65
79 45 60 5 10 18 13 12 9 3 0
例:35~岁组: 人年数=(8836+9149)/2+(9149+9287)/2+(9287+9414)/2+ (9414+9710)/2+(9710+9796)/2×5/12=41211(人年)
(三)寿命表法:
Lx=Ix+1/2(Nx-Dx-Wx) Ix+1=Ix+Nx-Dx-Wx
其中:Lx为x时间内暴露人年数; Ix为x时间开始时的人数; Nx为x时间内进入队列的人数; Dx为x时间内出现终点结局的人数; Wx为x时间内失访的人数
四、研究类型
(一)前瞻性队列研究(prospective cohort study); 即时性队列研究(concurrent cohort study):开始 时确定对象、分组,经随访得到结局。 优点:资料准确 缺点:样本大;花费大;时间长 (二)历史性队列研究(historical cohort study);非 即时性队列研究(nonconcurrent cohort study): 开始时已得到结局,对象确定、分组在过去某时间。 研究者掌握研究对象过去某时点暴露状况的历史材料 和自此时点到现在的结局材料 优点:省人、物、时 缺点:无混杂因素的资料 (三)双向性队列研究(ambispective cohort study): 历史队列研究后继续进行前瞻性队列研究 具有第一、二类优点而克服其缺点
前瞻性研究(Prospective study);发生率研究(incidence study); 随访研究(follow-up study);纵向研究(longitudinal study)
1. 2. 3. 4. 6. 7.
概述 研究实例 研究设计与实施 资料整理与分析 常见偏倚及其控制 优点与局限性
(一)研究现场:有足量研究对象;领导重视;群众配合; 交通方便;文化水平、医疗卫生条件好
(二)研究人群 1、暴露人群 (1)职业人群:联苯胺致膀胱癌——染料厂工人 石棉致肺癌——石棉作业工人 (2)特殊暴露人群:对某因素有高暴露率的人群(放 射线辐射与白血病之关系:受原子弹爆炸危害 者;接受放射线治疗者) (3)一般人群:吸烟与肺癌;口服避孕药与子宫内膜 癌;饮食与高血压等。 缺点:面访个体而不能从记录中获取资料 注意问题:因素与疾病均应常见;无或不需 特殊暴露人群 (4)有组织的团体:医学、工会会员;参加保险者 (吸烟与肺癌)
求:每组n=? 计算:P1RR•p0=0.0175
q1=1-p1=0.0175
p = 1 / 2(0.007 0.0175 ) = 0.0123 q = 0.9877
代入上式计算: n=2310 如考虑失访: n=2310(1+0.1)=2541
公式:
n = 2 pq (Ua Ub ) /( p1 p0) p = 0.5( p1 p 0) q = 1 p
351(b) 817(d) 1168(m0)
363(n1) 818(n0) 1181(n)
3.31 0.12
中国人畜共患病杂志 1988, 4(3):44
1)卡方检验:c2=20.6 自由度=1 P<0.01 2)U检验:大样本,样本率的频数分布接近于正态分布时
2、发病密度法(incidence density;ID):(适用于动态队列) 发病密度:一定时期内的平均发病率(以人时为分母计算的发病率) ID=D/PT D:观察期间发病数 PT:观察人时数(person time) PT=观察人数×观察时间 观察时间常用年(人年数,person year) 1个月=0.0833年,1天=0.00274年 对发病密度资料,要进行c2 检验。
(一)基线资料收集(baseline information):
待研究的暴露因素和暴露情况的资料,疾病与健康状况的资 料以及个人信息资料
1、记录或档案 2、访问 3、体检及实验室检查 4、环境资料
(二)随访
1、随访期:据疾病的潜伏期(病因作用到临床发现)和暴露与 疾病的联系强度作出 2、随访目的:1)确定研究对象是否处于观察之中(分母) 2)确定人群中事件结局(分子) 3)收集混杂因素的资料 3、随访方法:1)利用记录或档案 2)特殊方法:面谈、电话、通信 3)环境检测 4、观察终点(end point)与终止时间:前者是观察对象出现了预 期的结果;后者是整个研究可得出结论的时间 5、间隔时间:据具体情况而定 6、随访者:培训
第三节 研究设计与实施
确定研究因素 确定研究结局 确定研究现场与研究人群 确定样本量 资料的收集与随访 质量控制
一、确定研究因素:暴露因素(危险因素;保护 因素),一般在描述性研究和病例对照研究基础 上进行 二、确定研究结局(outcome):研究者预期的 结果事件;死亡、发病以及某些试验指标的变化 三、确定研究现场和研究人群
2、对照人群的选择
可比性
(1)内对照:同一队列无暴露或暴露水平低者 如Framingham心脏病研究 (2)外对照:在特殊暴露人群以外的特设对照 放射科医师——五官科医师 (3)一般人群对照:发病或死亡率易得且稳定 缺点:资料粗糙,项目不全 注意:时间和地区应同暴露人群 (4)多重对照:多种对照
四、确定样本量(size of sample)
1、注意问题 (1)抽样方法 (2)暴露组与对照组的比例:相等 (3)失访率:按10%估计 2、影响因素 (1)一般人群中所研究疾病的发病率(p0) (2)暴露人群发病率( p1);d=p1-p0 p1=RR•p0 (3)希望的显著性水平(a=0.05 or =0.01) (4)希望的把握度(power):(1- b=0.9)
(历史性)
研究开始
追溯收集历 史资料
(前瞻性)
继续追踪收 集资料
暴露组
------------------------→
非暴露组
(双向性队列研究)
暴露组
追踪收 集资料
非暴露组
过去
现在
将来
(四)不同研究类型的选用原则
前瞻性队列研究 1、目的明确 2、疾病发病率或死亡率≥5‰ 3、能获得暴露资料 4、确定结局的方法简便可靠 5、有足量样本,且人群稳定 6、有足够的可利用资源 历史性队列研究 要有完整可靠的历史记录或档案 双向性对列研究
二、 基本原理
现在
暴露
无干预
将来
疾病 人数 比较
是否暴露
a
+
a/(a+b)
+
目标 人群
b
+
c d
c/(c+b)_
-
基本特征
属于观察法 设立对照组 由“因及果”的研究 能证明暴露与结局的因果联系(可信性强) 一“因”多“果”的研究
三、研究目的
1、检验病因假设:验证某种因素对某种疾病 发病率、死亡率或某种 健康状态的影响。 2、评价预防效果:“人群的自然实验”。 3、描述疾病的自然史:疾病的全部自然发生、 发展的 过程为疾病的自然史。
4 2 3 2 7 8 3 5 2 1 0 37
30 11 8 19 25 29 73 74 467 819 57
1425.5 1464.0 1504.5 1521.0 1502.0 1481.5 1440.5 1375.5 1112.0 473.5 36.5 1333.6
第一年暴露人年数为: L1=I1+1/2(N1-D1-W1)=1403+1/2(79-4-30)=1425.5 I2=I1+N1-D1-W1=1403+79-4-30=1448 L2=1448+1/2(45-2-11)=1464 以此类推,合计得13336.5人年
2
2
例:放射线与白血病,人群发病率(p0)=0.0001, 暴露组发病率(p1)=0.001。 定:a=0.05(双侧)b=0.1 查表:Ua=1.96 Ub=1.282 代入上式得:每组n≈14266(人) 考虑失访:每组n= 14266+ 14266×10% ≈15693(人)
五、资料的收集与随访
3、计算 公式:
n=
( Z b P q p q Za 2 p q )
0 0 1 1
2
( p1 p0 )
2
q = 1 p
例:评价口服避孕药与子女患先天性心脏病之关系
已知:非暴露组发病率为P0=0.07 q0=1.993 假定 RR=2.5 设 a=0.5 b=0.1 查表 Za=1.96 Z b=1.282
流行病学资料分析原则
1、描述性分析:
研究对象的一般特征 均衡性检验 显著性检验:比较两组率(暴露比例)有无显著性差异 效应估计(联系强度) :用率或暴露比估计
2、推断性分析:
3、控制混杂因素:匹配;分层;多因素分析
二、人时计算(person time)
(一)以个体为单位计算暴露人年(person year): 精确法:以天为单位,计算研究对象被观察的天数,折合成人年。 近似法:以年为单位计算,开始与终止年份各算0.5年,同一年开始 与终止者算0.25年,开始与终止年份之间算1年,累积人年。 (二)动态人群:不知道每个成员进入和退出的准确时间,只有每年横断面调查 的资料。以平均人数乘观察年数得总人年数;平均人数为相邻两时段人口平均 数或年中人数。 表 动态人群人年计算
年龄 (岁) 35~ 45~ 55~64 合计 51.11.1 8836 7117 4094 20097 52.11.1 9149 7257 4212 20618 观察人数 53.11.1 54.11.1 9289 7381 4375 21043 9414 7351 4601 21366 人年数 55.11.1 9710 7215 5057 21982 56.11.1 9796 7191 5243 22230 41211 32156 19909 93276
三、率的计算
(一)常用指标 1. 累积发病率(cumulative incidence): 简单累积法:(适用于固定队列) 观察时间内发病人数 累积发病率 = 观察开始时人数
表
100%
钩体感染与脑动脉炎关系的队列研究
组别
发病人数
未发病人数
总人数
发病率%
暴露组 非暴露组 合计
12(a) 1(c) 13(m1)
从暴露到现在的观察时间还不能满足研究的要求,还需前瞻性观察一段 时间
第二节 研究实例
石棉与肺癌联系的病例对照研究
Mount-Sinai研究:接触石棉粉尘的四个职业人群为暴露组,总人群 为非暴露组。肺癌SMR=5.31;胃肠道肿瘤=2.06;全肿瘤=3.26;全 死因=1.47 数个规模较大的研究证明二者联系有普遍性 特异性:肺癌联系最强;肺腺癌占30%-40%(一般人群=15%20%);病变部位在肺下叶周边部 剂量反应关系:时间:暴露1个月SMR=2.24;1年为SMR=7.84 浓度:男、 >2年、低者SMR=1.6;高者=2.3
六、质量控制 1、调查员的选择 2、调查员的培训 3、制定调查手册 4、监督
重复调查;数值检查或逻辑检错;定期观察调查员的工作; 对不同调查员的数据进行分布比较;变量的时间趋势分析;使 用录音机
第四节 资料的整理与分析
一、队列研究资料整理表
组别 病例 非病例 合计 发病率
暴露组 a b a +b =n 1 a / n 1 = Ie 非暴露组 c d c +d =n 0 c / n 0 = Io 合计 a+c=m1 b+d=m0 a+b+c+d=t m1/ t= It
第一节 概 述 一、概念
1、队列:有共同经历或状态的一群人。 固定队列(fixed cohort):指某特定事件发生时所有的人 作为一个队列,或相对稳定、相对大的人群。原子弹 爆炸后形成的队列。 动态队列(dynamic cohort):是经常增加或减少队列成员 的队列。 2、队列研究:选择暴露于及非暴露于某因素的两组人群,随访观察一定时间, 比较两组人群某种疾病的结局(发病率、死亡率)从而判断该因素与发病 或死亡有无关联及关联的大小。 3、暴露(exposure):研究对象接触过某种待研究的物质、具备某种待研究 的特征或行为。 4、危险因素(risk factor):泛指引起某特定结局(outcome)的发生,后使其 发生的概率增加的因子。
表
观察时间 (年数) x 年初人数 年内进入人数 Ix Nx
寿命表法计算人
年内发病人数 年内失访人数 暴露人年数 Dx Wx Lx
1பைடு நூலகம்2
3
4 5 6 7 8 9 10 11 合计
1403 1448 1480 1529 1513 1519 1472 1409 1342 882 65
79 45 60 5 10 18 13 12 9 3 0
例:35~岁组: 人年数=(8836+9149)/2+(9149+9287)/2+(9287+9414)/2+ (9414+9710)/2+(9710+9796)/2×5/12=41211(人年)
(三)寿命表法:
Lx=Ix+1/2(Nx-Dx-Wx) Ix+1=Ix+Nx-Dx-Wx
其中:Lx为x时间内暴露人年数; Ix为x时间开始时的人数; Nx为x时间内进入队列的人数; Dx为x时间内出现终点结局的人数; Wx为x时间内失访的人数
四、研究类型
(一)前瞻性队列研究(prospective cohort study); 即时性队列研究(concurrent cohort study):开始 时确定对象、分组,经随访得到结局。 优点:资料准确 缺点:样本大;花费大;时间长 (二)历史性队列研究(historical cohort study);非 即时性队列研究(nonconcurrent cohort study): 开始时已得到结局,对象确定、分组在过去某时间。 研究者掌握研究对象过去某时点暴露状况的历史材料 和自此时点到现在的结局材料 优点:省人、物、时 缺点:无混杂因素的资料 (三)双向性队列研究(ambispective cohort study): 历史队列研究后继续进行前瞻性队列研究 具有第一、二类优点而克服其缺点