第四章队列研究
第四章 队列研究
四、研究类型
队列研究依据研究对象进入队列时间及终止观察的时间不同,分为 前瞻性(prospective)队列研究、历史性(historical)队列研究和双向 性(ambispective)队列研究三种。三种队列研究方法示意如图4-3。
暴露组 回顾性地收集已有的历史资料 历史性 队列研究 非暴露组
继续前瞻 性收集资料 双向性 队列研究 暴露组 非暴露组 暴露组 前瞻性收集资料 前瞻性
非暴露组
不出现某种结局
前瞻性地收集结局事件发生的资料 研究开始
图4-2 队列研究的结构模式图
三、研究目的 1. 检验病因假设 由于队列研究检验病因假设的能力较强,因此深入
检验病因假设是队列研究的主要用途和目的。一次队列研究可以只 检验一种暴露与一种疾病之间的因果关联(如吸烟与肺癌),也可 同时检验一种暴露与多种结果之间的关联(如可同时检验吸烟与肺 癌、心脏病、慢性支气管炎等的关联)。 2. 评价预防效果 有些暴露有预防某结局发生的效应,即出现预防效 果。如大量的蔬菜摄入可预防肠癌的发生,戒烟可减少吸烟者肺癌 发生的危险等,这里的预防措施(如蔬菜摄入和戒烟)不是人为给 予的,而是研究对象的自发行为。这种现象又被称为“人群的自然 实验”。 3. 研究疾病自然史 临床上观察疾病的自然史只能观察单个病人从起 病到痊愈或死亡的过程;而队列研究可以观察人群从暴露于某因素 后,疾病逐渐发生、发展,直至结局的全过程,包括亚临床阶段的 变化与表现,这个过程多数伴有各种自然和社会因素的影响,队列 研究不但可了解个体疾病的全部自然史,而且可了解全部人群疾病 的发展过程。
流行病学第四章 队列研究
流行病学第四章队列研究在流行病学的领域中,队列研究是一种重要的研究方法,它对于我们理解疾病的发生、发展以及影响因素有着不可替代的作用。
队列研究,简单来说,就是选定一群人,按照他们是否暴露于某种因素或者具有某种特征,分成不同的组,然后追踪观察一段时间,看看这些组中疾病的发生情况有何不同。
为了更清楚地理解队列研究,我们先来看看它的几个关键要素。
首先是暴露因素,这是队列研究的核心关注点。
它可以是生活习惯,比如吸烟、饮酒;也可以是环境因素,像是空气污染、辐射;还可以是遗传因素、职业因素等等。
确定准确且有研究价值的暴露因素是队列研究成功的第一步。
接下来是队列的确定。
这一群被选定的人要有一定的代表性,能够反映出我们想要研究的总体人群的特征。
队列可以是基于职业的,比如某个工厂的工人;可以是基于地域的,比如某个社区的居民;也可以是基于其他特定特征的,比如某种疾病的高危人群。
在追踪观察的过程中,要准确地记录每个研究对象的健康状况变化以及与暴露因素相关的信息。
这需要有完善的随访机制,确保不丢失任何重要的数据。
队列研究的类型主要有两种,前瞻性队列研究和回顾性队列研究。
前瞻性队列研究是从现在开始,对选定的队列进行追踪观察,一直到未来某个时间点,看看疾病是否发生以及和暴露因素的关系。
这种研究方法的优点是可以直接观察到暴露因素和疾病发生的先后顺序,结果比较可靠。
但它需要耗费较长的时间,而且在随访过程中可能会遇到很多困难,比如研究对象的失访。
回顾性队列研究则是基于过去已经存在的资料,比如过去的病历记录、职业档案等,来分析暴露因素和疾病之间的关系。
这种方法相对省时省力,但可能会因为资料的不完整或者不准确而影响研究结果的可靠性。
队列研究有很多优点。
它可以直接观察到疾病的自然史,了解疾病从暴露到发病的整个过程。
而且,由于是在疾病发生之前就确定了研究对象和暴露因素,所以能够更好地判断因果关系。
此外,队列研究还可以同时研究一种暴露因素与多种疾病的关系,或者多种暴露因素与一种疾病的关系。
队列研究
第四章队列研究探讨疾病的病因、危险因素及预后因素等是流行病学在医学研究中的重要应用之一。
通过描述性研究,可以初步获得研究对象的各种特征,但此时疾病的影响因素与结局是同时观察的,因此需要采用分析性研究方法加以探讨。
队列研究(cohort study)是分析性研究的重要方法之一,它可以直接观察暴露于不同危险因素或不同特征人群的结局,从而探讨危险因素与疾病发生或结局之间的关系。
第一节概述一、概念队列研究是指将某一特定人群按是否暴露于某可疑因索或按不同竑露水平分为亚组,追踪观察一定的时间,比较两组或各组发病率或死亡书的差异,以检验该因素与某疾病有无因果关联及关联强度大小的一种观察性研究方法。
二、研究目的{一)检验病因假设由于队列研究是由因及果的研究,能确证暴錤与疾病的关系,因此检验病因假设是队列研究的主要目的和用途。
一次队列研究可以只检验一种接露与一种疾病之间的因果关联(如吸烟与肺癌),也可检验一种秘錤与多种结局之间的关联(如可同时检验吸烟与肺癌、心脏病、慢性支气忏炎等的关联)。
* '(二)评价预防效果有些域鋸有预防某结局发生的效应,即具有预防效果。
如大蒜的摄入可预防消化道肿瘤如I?癌的发生,戒烟可减少吸烟者肺癌发生的危险等。
这里的预防措施(如大蒜摄人和戒烟)即暴露因素不是人为给予的,而是研究对象的自发行为。
通过这种人群的“自然实验”(natural experiment)也可以评价某因素的预防效果。
(三)研究疾病自然史临床上只能通过观察单个病人从发病到痊愈或死亡的过程来了解疾病的自然史。
在队列研究开始时,研究前研究对象只是具有某种暴谣而不患有相应的疾病,因此可以观察人群中不同个体缺露于某因素后,疾病逐渐发生、发展,直至结局的全过程,包括亚临床阶段的变化与表现,M时还可以观察到各种自然和社会因素对疾病进程的影响。
队列研究不但可了解个体疾病的自然史,而且可了解疾病在人群中的发生发展过程。
三、研究类型(一)前瞻性队列研究(prospective cohort study)研究对象的确定与分组是根据研究开始时研究对象的暴露状况而定的,研究结局的获得®要随访观察一段时间后才能获得,这是队列研究的基本形式。
流行病学复习笔记第四章队列研究
第四章队列研究一、概述概念特点 1 属于观察法〔暴露缺乏人为给予〕2 设计阶段设立对照性〔可来自于同一或不同人群〕目的 3 因→果4确定暴露与结局的因果关系二、研究类型前瞻性 1 应有明确的检验假设,检验的因素必须找准2 所研究的疾病的发病率或死亡率应较高,不低于5‰3 应明确规定暴露因素,并且应有把握获得观察人群的暴露资料4 明确规定结局变量,并且要有确定结局的简便儿可靠的手段5 应有把握的获得足够的观察人群,并将其清楚地分成暴露组和非暴露组6 大局部观察人群应能够长期随访下去,并获得完整可靠的资料7 应有足够的人、财、物力支持该工作历史性除应考虑瞻前性队列研究中所考虑的各点外,还要考虑是否有足够数量的、完整可靠的、在过去某段时间内有关研究对象的暴露和结局的历史性记录或档案材料性质:因→果双向性三、研究设计与实施 1.确定研究因素〔一次一个因素〕2.确定研究结局优点:一果多因,提高了研究效率3.确定研究现场和人群 1 暴露人群:1〕职业〔一般历史性~~〕2〕特殊暴露〔一般历史性~~〕3〕一般4〕有组织的2 对照人群:1〕内对照:当研究暴露变量不为定性而为定量,如高剂量暴露增加疾病的危险性,以最低暴露水平人群为对照,饮水中F,人的血压值优点:省事,总体上把握研究对象疾病情况2〕外对照优点:随访观察时可免受暴露性的影响3〕总人口对照4〕空白对照4. 确定样本量考虑问题:1〕抽样方法2〕暴露与对照比例3〕失访率影响因素:1〕α,〔1—β〕2〕一般人群研究疾病发病率P。
3〕暴露与对照标准之差5. 资料收集及预防6. 质量控制四 资料分析〔一〕表格1)累计发病率:0~1 ,研究人群数量比拟大且比拟稳定,说明累计时间长短〔二〕率的计算(P70) 2)发病密度:0~+∞ ,研究人群不稳定 ,单位:人年3)标准化〔SMR 〕: 多研究对象数目少,结局事件的发生率比拟低时,SPMR〔三〕效率的估计 1相对危险度: RR=0I I e = c/n0a/n1 RR 表示暴露组发病或死亡的危险是对照组的多少倍RR 越大,表示暴露的效应越大,暴露于结局关联的强度越大2 归因危险度〔特异危险度,危险度差,超额危险度〕:AR= Ie —I 0 = a/n 1 —c/n 0Ie =R R ×I 0AR= I 0〔RR-1〕AR 表示危险特异地归因于暴露因素的程度3 归因危险度百分比〔ARP, AR%,EF, AF 〕:Ie —I 0 Ie ×100% =( R R-1)/RR是指暴露人群中的发病率或死亡归因于暴露局部占全部发病或死亡的百分比,如吸烟青年中发生肺癌有90%可归因于吸烟4 人群归因危险度及其百分比(PAR 和PAR%)PAR =It —I 0PAR% =tI 0t I -I ×100%= 1 1)-Re(RR 1)-Pe(RR ×100% PAR 表示总体人群发病率中归因于暴露的局部PAR%表示PAR 占总人群全部发病或死亡的百分比〔四〕常见偏倚与控制 1 选择偏倚:提高研究对象的应答率和依从性2 失访偏倚:如果暴露组和对照组失访人数相等,而且各组中失访者和未失访者的发病率相同,那么可认为通过该研究获得的各组的发病率可以反映该研究人群的实际情况,失访对研究结果没影响比拟方法: 1〕查询失访者是否已经死亡及其死亡原因2〕比拟失访者和未失访者基线调查时获得的某些特征的资料,两者的基线特征越相似,出项不同疾病的发病率越少〔五〕优缺点P74~75。
第四章队列研究(cohortstudy)
4 2 3 2 7 8 3 5 2 1 0 37
30 11 8 19 25 29 73 74 467 819 57
1425.5 1464.0 1504.5 1521.0 1502.0 1481.5 1440.5 1375.5 1112.0 473.5 36.5 1333.6
第一年暴露人年数为: L1=I1+1/2(N1-D1-W1)=1403+1/2(79-4-30)=1425.5 I2=I1+N1-D1-W1=1403+79-4-30=1448 L2=1448+1/2(45-2-11)=1464 以此类推,合计得13336.5人年
六、质量控制 1、调查员的选择 2、调查员的培训 3、制定调查手册 4、监督
重复调查;数值检查或逻辑检错;定期观察调查员的工作; 对不同调查员的数据进行分布比较;变量的时间趋势分析;使 用录音机
第四节 资料的整理与分析
一、队列研究资料整理表
组别 病例 非病例 合计 发病率
暴露组 a b a +b =n 1 a / n 1 = Ie 非暴露组 c d c +d =n 0 c / n 0 = Io 合计 a+c=m1 b+d=m0 a+b+c+d=t m1/ t= It
第四章 队列研究 (cohort study)
前瞻性研究(Prospective study);发生率研究(incidence study); 随访研究(follow-up study);纵向研究(longitudinal study)
1. 2. 3. 4. 6. 7.
概述 研究实例 研究设计与实施 资料整理与分析 常见偏倚及其控制 优点与局限性
流行病学第四章 队列研究
yes
暴露组
目标人群 代表 未患某研究 性样 疾病
No Yes 非暴露组 No
队列研究的结构模式图
本
固定队列
出现结局 未出现结局
研究开始
研究结束
动态队列
出现结局
失访
研究开始
研究结束
队列研究的特点
属于观察性研究
设立对照组 由因及果
能计算发病率,确证暴露与疾病的因果联系
质量控制
培训调查员
制定相应的规章制度 盲法
资料分析
计算各组的发病或死亡率
对组间率的差异进行统计学显著性检验 对差异有统计学显著性的进一步计算关联强
度
累计发病率:观察人群比较稳定
观察期内发病(或死亡 )人数 CI 观察开始时的人口数
发病密度:观察期间人群人数产生了较大的
直接获得暴露组和非暴露组的发病率或死亡率
直接估计危险度
符合时间顺序,验证病因的能力较强 获得一种暴露与多种结局的关系 收集的资料完整可靠,不存在回忆偏倚 可研究疾病的自然史
不适于发病率很低的疾病的病因研究 易发生失访偏倚 耗时,耗人力、物力、财力
设计要求严密,资料的收集和分析难度较大
队列研究的实施—确定研究结局
结局:指研究者预期的结果事件。是队列研
究观察的自然终点。 结局不仅限于发病、死亡还可以是中间变量。
队列研究的实施—确定研究对象
暴露人群的选择: 职业人群 特殊暴露人群 一般人群 有组织的人群团体 对照人群的选择 内对照 外对照 人群对照 多种对照
职业人群
暴露史比较明确,有关暴露与疾病的历史记
流行病学 第四章 队列研究
南京医科大学公共卫生学院流行病与卫生统计学系 电邮:sujing@
流行病学病因研究的一般过程
描述疾病频 度和分布
描述性研究
三间分布 常规资料 临床信息
形成
检验
→ 假设 → 假设
→ 因果 推断
逻辑推理
(Mill’s 准则)
队列研究 病例对照研究
实验研究
结合各方面因
素进行综合分
二、基本原理
选定一组研究人群,根据过去或目前的暴露情 况进行分组 有无暴露因素:暴露组和非暴露组 暴露因素的水平:低、中、高剂量组
随访观察各组的观察结局(发病或死亡) 比较各组发病率或死亡率的差异,从而判定暴
露因素与发病有无因果关联及关联大小
©by Jing Su
暴
露
组
研
究
对
象
对
照
组
发病 未发病 发病 未发病
研究现场: 江苏省海门市(HCC高发区)
研究人群: 35个镇的1008个村的25-64岁居民 海门市防疫站工作人员入户调查
©by Jing Su
四、确定样本量
决定因素: 1、一般人群(非暴露组的)所研究疾病的发病
或死亡率(P0),P0越接近0.5,样本越小 2、暴露组与对照组人群发病率之差d= P1- P0, 暴露组疾病的发病或死亡率(P1),或相对危 险度(RR)估算P1,d越大,样本越小
注意事项: 一般对照组样本数≥暴露组的样本数 估计失访对数据分析的影响,一般按估计样
本量增加10%作为实际样本量
©by Jing Su
例:乙肝病毒感染与原发性肝细胞癌的队列研究
假设HCC发病率P0=0.003/人年(全国水平)
假设HBV感染者的发病率为未感染者的2.5倍,即
流行病 第四章队列研究
5、人群归因危险度百分比 (population attributable risk percent , PAR%)
固定队列 即一个相对稳定的队列,在整个观察 期
内无新成员的加入,人数保持相对稳定。
动态人群 队列在确定以后可以随时增加新的观察
对象。
二、特点
1、属于观察性研究方法
E是自然客观存在的,有别于实验性研究。
2、必须事先设立对照组
与描述流行病学相区别,有均衡的对照组。
3、研究方法是由因及果
前瞻性研究,时间顺序明确。
(3)SMR的可信区间
, (6.3)
式中Lp、Up为观察(实际)死亡数可信区间上、下限。
当观察死亡数D较大时(D>50),用正态近似法求得; 当D≦50时,可用Possion分布查表法求得。
E(D)为预期死亡人数。
(4)SMR的假设检验 可信区间法 (Lp、 Up)包含E,则无显著性;反之则有。
心血管疾病
吸烟者
非吸烟者
(1/10万人年) (1/10万人年)
RR 10.8 1.7
AR
(1/10万人年)
48.33 294.67
4.49 169.54
43.84 125.13
3、归因危险度百分比 (attributable risk percent, AR% )
(1)计算公式
(6. 8)
(2)意义
举例:例如一个人群观察若干年后,观察期内80人死于冠心病。选用
该地全人口的冠心病死亡率作为标准死亡率,计算得到预期死亡人数为71 人,求其SMR。 本例SMR=80/71=1.13 表明该人群死于冠心病的危险超过相应全人群的0.13倍。
第四章 流行病学 队列研究
第四章队列研究定义:队列研究是将人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局频率的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究方法。
主要特点1)观察法2)设立对照3)由因到果,符合时间顺序4)确证暴露和结局因果关系一、研究目的(用途)检验病因假设评价预防措施效果研究疾病的自然史新药的上市后监测二、研究类型1.前瞻性队列研究:研究队列的确定是现在2.历史性队列研究:研究对象在过去某时刻3.双向性队列研究:研究队列的确定是过去,根据研究对象过去某时刻的暴露情况分组,需要随访,部分结局可能已出现三、率的计算1.累积发病率2.发病密度3.标化死亡比(SMR)4.标化比例死亡比(SPMR)计算方法是以全人口中某病因死亡占全部死亡的比例乘以某单位实际全部死亡数而得出某病因的预期死亡数,然后计算实际死亡数与预期死亡数之比。
适用条件:不能得到历年人口资料;仅有死亡人数、原因、日期和年龄。
四、效应的估计1.相对危险度(RR )意义:暴露组发病或死亡的危险是非暴露组的多少倍。
RR值越大,表明暴露的效应越大,暴露与结局关联的强度越大。
2.归因危险度(AR )意义:AR值增加,暴露因素消除后所减少的疾病数量增加。
RR和AR的流行病学意义不同:RR说明暴露者与非暴露者比较相应疾病危险增加的倍数;AR则是指暴露人群与非暴露人群比较,所增加的疾病发生数量,如果暴露因素消除,就可减少这个数量的疾病发生。
前者具有病因学的意义,后者更具有疾病预防和公共卫生学上的意义。
3.归因危险度百分比AR%(病因分值EF)意义:暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。
4.人群归因危险度(PAR)PAR=I t-I0I t:总人群率I o:非暴露组率说明暴露对一个具体人群的危害程度,以及消除这个因素后该人群中的发病率或死亡率可能降低的程度。
意义:暴露人群与一般人群比较,所增加的疾病发生率的大小;PAR值增加,暴露因素消除后所减少的疾病数量增加。
流行病学第四章队列研究
Examples
• Framingham study of cardiovascular disease – Individuals 30 – 62 years old in community at risk for disease – Framingham, MA, 1948 to present – To identify the common factors or characteristics that contribute to CVD
四、研究类型
过去
现在
将来
E E
Prospective cohort study
E E
Historical cohort study
E E
Ambispective cohort study
前瞻性(prospective)队列研究
优点
☺ 偏倚比较小,结果可信
缺点
☺ 花费大、时间长,影响其可行性
重点考虑
一、基本概念
队列 Cohort
Roman legion one of 10 divisions of a Roman legion Group of individuals
–具有共同的经历/暴露 –随访一定的时间 出生队列(birth cohort)
两种类型的队列
• 固定队列( Fixed Cohort )
– A group of individuals recruited and enrolled at a uniform point in the natural history of a disease or by some defining event
第4章 队列研究教案(完整资料).doc
各种效应估计指标的定义、意义及适用情况
第4学时
队列研究中最常见的偏倚为失访
与其他研究偏倚预防方法相同
与其他研究偏倚预防方法相同
与病例对照研究比较记忆
本章要求的英文单词:
cohort study队列研究
cumulative incidence累积发病率
incidence density发病密度
3.由于病因发生在前,疾病发生在后,因果现象发生的时间顺序上合理,加之偏倚较少,又可直接计算各项测量疾病危险关联的指标,故其检验病因假说的能力较强,一般可证实病因联系。
4.有助于了解人群疾病的自然史。有时还可能获得多种预期以外的疾病的结局资料,分析一因与多种疾病的关系。
5.样本量大,结果比较稳定。
二、缺点
1查阅医院、工厂、单位及个人健康保险的记录或档案;
2问研究对象或其它能够提供信息的人;
3研究对象进行体格检查和实验室检查;
4境调查与检测。
(二)随访(掌握)
1.随访对象与方法
2.随访内容
3.观察终点
4.观察的终止时间:
5.随访的间隔
6.随访者
六、质量控制(掌握)
1.调查员的选择:
2.调查员培训:
3.制定调查员手册:
2.失访偏倚的防止
3.信息偏倚的防止
4.混杂偏倚的防止
三、常见偏倚的估计与处理
1.选择偏倚与失访失倚
2.信息偏倚
4.混杂偏倚:
第五节研究的优缺点(熟悉)
一、优点
1.由于研究对象暴露资料的收集在结局发生之前,并且都是由研究者亲自观察得到的,所以资料可靠,一般不存在回忆偏倚。
2.可以直接获得暴露组和对照组人群的发病或死亡率,可直接计算出RR和AR等反映疾病危险关联的指标,可以充分而直接地分析暴露的病因作用。
第四章 队列研究
1.队列研究的基本原理、概念 2.队列研究实施 3.队列研究资料分析 4.常见的偏倚及其控制 5.队列研究的优缺点
第一节 概 述
队列(cohort)
是泛指具有某种共同暴露或特征的一组人群
出生队列(birth cohort)
指特定时期内出生的一组人
暴露队列
暴露:指研究对象接触过某种研究 因素或具有某种特征和行为。
过去 时间
暴露组 非暴露组
现在
将来
历史性队列研究
双向性队列研究
暴露组
前瞻性队列研究
非暴露组
(历史性)
研究开始
(前瞻性)
三种队列研究示意图
队列研究典型实例
Hp与胃癌
吸烟与肺癌
放射治疗与白血病
Hp与胃癌
线索:中国胃溃疡病例报告 Warren成功分离到HP
胃溃疡是胃癌的 重要危险因素
HP与胃溃疡关系确定
Doll &Hill的吸烟与肺癌关系队列研究 1951~1964年 (40701名注册医师)
表5-1 35岁以上人群肺癌死亡率(‰) 与日吸烟量(支/天)的关系 年龄 35~44 45~54 非吸烟者 0.05 0.00 吸烟者 1~14 0.07 0.31 15~24 0.00 0.62 25~ 0.11 0.75
c /(c+d)
-
d
特
点
1.在时序上是由前向后的
2.属于观察性研究 3.研究对象按暴露与否分组 4.由“因”推“果”,时序合理,能 确证暴露与疾病等结局的因果关系
三、队列研究的目的
1.检验病因假设 2.评价预防效果 3.研究疾病自然史 4.研究一种暴露和多种结局的关系
一次研究可有多个结局
第四章:4队列研究
RR= AR= PAR%=
队列研究资料的分析
标化死亡比(standardized mortality ratio SMR)
研究人群中观察发病( 死亡)数 SMR 标准人口(全人口)预 期发病(死亡)数
适用条件:
有些人群特殊暴露人数较少,不便计算出发病率
无法获得发病率或死亡率资料
队列研究资料的分析
p1 RR p0
α值 把握度1-β
队列研究的设计与实施
确定队列大小
q0 = 1 p0
p (p1 p0 )/2
q1 = 1 p1
q = 1 p
p1 RR p0
队列研究的设计与实施
确定队列大小
已知 p0=0.007,RR=2.5,α=0.05,β=0.1,计算样本量 (要求两组样本量相等) 根据上述条件 Zα=1.96, Zβ=1.282 ,q0=0.993 p1=p0×RR=0.0175,q1=0.9825 代入公式得 N=2310
选择研究对象
非暴露组 选择原则:对照人群除暴露因素的影响外 , 其他各种
因素的影响或人群的特征 ( 如年龄 , 性别 , 职业 , 民族等 ) 都应尽可能与暴露组相似.
内对照 外对照 总人口对照 多重对照
队列研究的设计与实施
确定队列大小
有关参数
一般人群中所研究疾病的发病率(P0) 暴露人群的发病水平P1(D=P1-P0),D值越大,N越小 相对危险度(risk ratio, RR)
RR值越大,暴露的效应越大,暴露与结局关联强度越大
队列研究资料的分析
联系强度的计算
1 相对危险度RR( risk ratio)
RR与关联强度
RR 0.9~1.0 0.7~0.8 0.4~0.6 0.1~0.3 <0.1 1.0~1.1 1.2~1.4 1.5~2.9 3.0~9.9 10~ 关联强度 无 弱 中 强 很强
04第四章 队列研究
流行病学第四章 队列研究
流行病学第四章队列研究在流行病学的领域中,队列研究是一种非常重要的研究方法。
它就像是一个时间的追踪者,通过对特定人群的长期观察,来揭示疾病的发生、发展规律以及与各种因素之间的关系。
那么,什么是队列研究呢?简单来说,队列研究就是选定一群人,根据他们是否暴露于某种因素,将其分为不同的组,然后随着时间的推移,观察这些组中疾病的发生情况。
比如说,我们想研究吸烟是否会导致肺癌。
我们可以选择一群不吸烟的人和一群吸烟的人,然后对他们进行长期的跟踪观察。
若干年后,比较这两组人群中肺癌的发病率。
队列研究有很多优点。
首先,它是前瞻性的,这意味着我们是在观察因素暴露在前,疾病发生在后,这样得出的因果关系比较可靠。
其次,它可以同时研究一种因素与多种疾病的关系。
比如,在研究吸烟与肺癌的关系时,我们还可以顺便看看吸烟与心血管疾病、呼吸系统疾病等其他疾病的关联。
再者,队列研究可以计算发病率,这对于评估疾病的危害程度非常重要。
但是,队列研究也不是完美的。
它需要耗费大量的时间和资源。
有时候,等待观察结果的过程可能会很长,而且在这个过程中,研究对象可能会流失,影响研究的准确性。
另外,队列研究对于罕见病的研究可能不太适用,因为需要观察的人数太多,实际操作起来很困难。
队列研究通常分为两种类型:前瞻性队列研究和回顾性队列研究。
前瞻性队列研究就像是我们提前规划好一场实验,然后按照计划去实施和观察。
比如,我们从现在开始选择一群健康的人,记录他们的生活习惯、饮食习惯、运动情况等各种可能影响健康的因素,然后定期对他们进行体检和疾病监测,观察在未来的几年甚至几十年里,哪些因素会导致疾病的发生。
这种研究方法的优点是结果比较准确可靠,但是缺点也很明显,就是需要等待很长时间才能得到结果,而且花费巨大。
回顾性队列研究则是反过来,我们先找到一群已经有了某种因素暴露的人群和没有这种暴露的人群,然后通过回顾过去的资料,比如病历、档案等,来了解他们过去的情况,从而分析因素与疾病之间的关系。
流行病学 第四章队列研究
选择队列研究方法的指征
1、前瞻性队列研究 是否有明确的研究目的和检验假设 所研究疾病的发病率或死亡率不低于5‰ 是否有把握获得观察人群的暴露资料 是否有确定结局的简便而可靠的手段 是否有把握获得足够数量的观察人群并能 被长期随访 是否有足够的人、财、物力
选择队列研究方法的指征
2、历史性队列研究 是否有明确的研究目的和检验假设 所研究疾病的发病率或死亡率不低于5‰ 是否有把握获得观察人群的暴露资料 是否有确定结局的简便而可靠的手段 是否有把握获得足够数量的观察人群 是否有足够数量的完整可靠的资料
4、观察终点: 指观察对象出现了预期的结果,至此不 再继续观察该对象了。 常为规定疾病的发生或死亡,也可为检 测指标。 规定冠心病为终点,得了糖尿病随访否? 死于脑血管意外,到达随访终点否?
5、观察终止时间: 指整个研究工作可得出结论的时间。 以暴露因素作用于人体至产生结局的一 般潜伏期作为确定随访期限的依据。 尽量缩短观察期,节约人财物力,减少 失访
(三)归因危险度百分比(AR%)或病 因分值(EF) 1、定义 暴露人群中由暴露因素引起的 发病在所有发病中所占的百分比。 2、公式 AR%= Ie -I0/ Ie×100% AR%= (RR-1)/RR ×100% 3、当AR%大于75%时,即可认为找到了 主要病因。
(四)人群归因危险度( PAR )与人群 归因危险度百分比(PAR%) 1、 PAR 表示在全人群中由于暴露而 导致的发病率增加。 PAR = It -I0 2、 PAR% 表示全人群中由暴露引起 的发病在全部发病中的比例。 PAR%=(It -I0)/ It×100%
0.1~0.3或3.0~9.0 <0.1或>9.0
弱 中度
强 很强
流行病学的队列研究共36页文档
暴露人 ~ 45~
50~ 合计
86.08.20~87.04.21 共 8 个月 合 0.67 人年
87.04.22~92.04.21 共 5 人年
92.04.22~97.04.21 共 5 人年
97.04.22~97.10.15 共 5 个月 24 天 合 0.48 人年
88.08.20~97.10.15 共 11.15 人年
30.11.2019
81.12.12~85.05.09 共 3 年 4 个月 27 天 合 3.41 人年
85.05.10~90.05.09 共 5 人年
90.05.10~94.01.02 共 3 年 7 个月 22 天 合 3.65 人年
90.03.02~92.12.12 共 2 年 9 个月 10 天 合 2.78 人年
Out -
Migrations
In -
Migrations
时间
7
人 群
30.11.2019
病患排
的研除 暴
个究不 露
体疾能 人
研有 群
究可
疾能
病但
的尚
个未 非
体患 暴
的研排 人 究除
疾已
露 人 群
病患
发生研究 疾病
未发生研 究疾病
发生研究 疾病
未发生研 究疾病
8
特点:
1. 按因素分组 2.按因素分组时,观察对象都是健康 的,要经过一定时间后才会出病例 3.是从因到果,时间上是向将来的
2 暴露组与非暴露组来自于不同人群
可设立 (1)特设对照--又称为外对照 (2)总人口对照
30.11.2019
14
四、样本含量的估计
1 一般人群中所研究疾病的发病率 2 预期的RR值
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表1 CS2 与心肌梗塞关系的定群研究结果
CS2组
观察人数
343
死亡人数
21
死于心肌梗塞者
14
首次心肌梗塞发作者 11
对照组 RR
343
1
9 2.3
3 4.7
4 2.8
表2 接触CS2与心肌梗塞发病关系
接触CS2
有 无
患心肌梗塞 未患者 观察数 %
25
318 343 7.29
7
336 343 2.04
Q1=1 – P1 , Q0=1 – P0
P P0 P1 2
Q 1 P
Zα 、ZΒ 为正态分布值 P0 一般人群发病水平代替, P1较难计算,用相对危险度 RR估计 P1= RR×P0
例:拟用定群研究方法研究暴露于某种药物与
婴儿先天性心脏病之间的联系,假设已知非暴露 组发病率为P0=0.008, 估计RR=2, 当α=0.05 β=0.1 时,估计需要的样本量
若a/a+b > c/c+d, 并有统计学差异,则疾病 与暴露有联系
病例 非病例 合计 发病率
暴露组 a
b
非暴露组 c
d
a+b a/a+b c+d c/c+d
合计 a+c
b+d
队列研究特点: 1.属于观察研究方法; 2.设立对照; 3.观察方向由“因”及“果”; 4.能较确切验证病因。
用途: 1.检验病因假设; 2.描述疾病自然史; 3.评价自发的预防效果。
5.00
5人年
45~ 5.48人年
5.48
合计 11.15
12.06
10.92
34.13
3.统计学检验
如前例2 可用X2检验(四格表)
暴露组 非暴露组
发病
12(a) 1(c)
未发病
351(b) 817(d)
合计%363 3.1 818 0.12合计
13
852
1181
(| ad bc | n)2n
2.选择偏倚 任何非研究因素在研究人群中与一般人群分布不
一致,暴露人群或非暴露人群划分错误。 往往高估或低估联系强度 3.测量偏倚 对疾病诊断缺乏正确标准,或测量仪器精确性差,
造成漏诊或误诊 4.混杂偏倚 如性别、年龄等
(二)偏倚控制
加强对调查员的培训,注意调查方法和调查技巧
1.失访偏倚控制
PAR=It-Iu =0.015 %0 - 0.07%0 =0.008 %0
四、定群研究中的偏倚及控制
(一)常见偏倚 1.失访偏倚 研究对象由于移居外地、外出、不合作或死于其
他疾病未能追踪观察到,以至在研究中丢失。 影响研究真实性,其程度取决于: 1)失访人群的质,即失访人群与未失访人群在所 研究的主要方面区别 2)失访人群的量,小于观察人群总数的5%,偏 倚不大
基本概念: 1.暴露 exposure 指研究对象接触过某种待研究的物质、具备某种待研究 的特征或行为。可以有害也可无害 2.结局 outcome 所研究的疾病、某种健康状况或者死亡 3.队列 cohort 一个特定的研究人群组,可以是特定时期内出生的人群, 也可以是具有某共同暴露或特征的人群 Fix cohort 固定队列 Dynamic cohort 动态人群 4.危险因素 risk factor
5.环境资料 包括家庭环境、居住环境、工作环境、
区域环境等 6.追踪结局
直接法:函件调查、定期检查等 随访
间接法:医院病例、疾病报告等
研究实例
例1.二硫化碳与心肌梗塞关系研究 Tolonen等在芬兰某粘胶纤维厂选择
1942~1969年间具有五年以上二硫化碳接触史 的工人343名为暴露组,在附近纸浆厂选择343 名无二硫化碳接触史的工人为非暴露组。在选 择时注意到年龄、出生地点以及对冠心病有影 响的因素(如吸烟、运动习惯、血脂量)的均 衡性,然后追踪观察二人群在1967~1972年的 发病情况,结果如下:
(Zα=1.96,Zβ=1.282)
P1=RR×P0= 2×0.008=0.016
Q0=0.992 Q1=0.984
p (p0 p1) / 2 (0.008 0.016) / 2 0.012
Q 1 P 0.988
N (1.96
2 0.012 0.988 1.282 0.016 0.984 0.08 0.992)2 (0.016 0.008)2
回顾性定群研究
前瞻性定群研究
暴露因素 发病死亡 暴露因素 发病死亡
病例对照研究
现
况
暴露史 病例对照
调
查
过去
现在
将来
二、研究方法
(一)暴露组选择 1.特殊暴露人群
选择由于职业或其他原因暴露于某危险因 素特别严重的人群。 2.一个地区的全部人群
在一个地区的人群中进行,可疑病因人群 暴露率较高,发病率或死亡率也较高,且便于 研究。 3.便于随访人群
3892
每组样本量为3892人
(四)资料来源与收集
1.人口学资料: 收集年龄、性别、婚姻、文化程度、经
济收入等。
2.查阅现有记录、档案 特殊暴露人群的职业史或医疗记录,了
解暴露的性质和剂量,客观性好
3.调查询问 询问暴露史,如烟、酒、生活习惯,常
采用调查员直接询问或通信调查。
4.医学检查或检验 调查对象的生理特征或生化指标
合计
32
354 684 4.66
例2.脑脉管炎与钩体感染
1953年湖北省雨量较多,一些地区爆发急性钩 端螺旋体病。同年,这些地区的脑脉管炎病人 显著增多,为了验证两者是否有联系,选择钩 体病爆发区确诊为钩体病病人作为暴露组,当 地健康人群为非暴露组,两组在年龄、性别方 面均有可比性,追踪观察一年,结果如下:
b
c
c
d
例2 AR=3.31-0.12=3.19%
RR与AR的区别 RR评价暴露与疾病的联系强度,不说明绝对危险度的大小 用于病因研究
AR表示某因素对疾病的绝对危险,用于公共卫生决策。
例: 吸烟对不同疾病的AR和RR
疾病
死亡率1/105 吸组 不吸组
肺癌
48.33 4.49
心血管病 294.67 169.54
2
2
(a b)(c d)(a c)(b d)
(| 12 817 35 1| 1181)2 1181
2
20.6
131168 363 818
2
2 0.01(1)
6.63
df=1 P<0.01 差异有高度显著性
4. 联系强度的测量
1)相对危险度(relative risk)
也叫危险比(risk ratio)或率比(rate ratio)。是暴露 组发病(死亡)率与非暴露组发病(死亡)率 的比值,简称RR。
第四章
队列研究
Cohort Study
一、概念及设计原理
常常也叫定群研究,即将特定的人群中按 其是否暴露于某因素或按不同暴露水平分成几 个队列,追踪观察一定时间,比较两组或多组 间的发病率或死亡率,以检验该暴露因素与某 病联系的假设。
如果暴露组的发病率或死亡率高于非暴露 组,且经统计学检验有显著性意义,则表示该 病与该因素有联系。
30~
65.4.9~70.4.8
72.11.12~77.11.11
10.00
5人年
5人年
35~ 66.7.19~67.3.20 70.4.9~73.12.1\3年 77.11.12~81.1.1/3年 7.46
8个月,0.67人年 7月22天,3.65人年 1月20天,3.14人年
40~ 67.3.21~72.3.20
选择一个与暴露组在年龄、性别、种族等 方面相似的非暴露组为对照组 4.多种对照
(三)样本大小估计
N (Zα
2PQ Zβ P0Q0 P1Q1 )2 (P1 P0 )2
与病例对照研究的不同之处仅为符号P0与P1分别代 表非暴露组与暴露组的发病率或死亡率。
影响N的因素: 1.暴露组发病(死亡)率的估计P1 2.非暴露组发病(死亡)率的估计值 P0 3.第一类错误概率 α 4.第二类错误概率 β
RR说明暴露组发病或死亡为非暴露组的倍数。
RR>1说明暴露因素与疾病为正联系,暴露可能 是危险因素;
RR<1 说 明 暴 露 因 素 与 疾 病 为 负 联 系 , 暴 露 可 能具有保护意义。 相对危险度与联系强度
RR的大小 0.9~1.0 1.0~1.1 0.7~0.8 1.2~1.4 0.4~0.6 1.5~2.9 0.1~0.3 3.0~9.9 <0.1 10~
联系的强度 无 弱 中等 强 很强
例2 RR=3.31/0.12=27.6 联系很强
2)特异危险度(attributive risk) AR 也称归因危险度,或称率差
(rate difference, RD),是暴露组与非暴露组发病率 的差值。AR表示完全由暴露因素所致的危险度
AR
Ie
Iu= a
a
<45 607 547 471 392 324 246 210 179 148 110
45~54 598 596 604 599 603 625 598 562 538 510
小于45岁组的暴露人年数: (607+547)/2+(547+471)/2+(392+324)/2+ +(148+110)/2 =2875.5
RR AR
10.8
43.48
1.7 125.13
结果说明吸烟对每个受害者来说,患肺癌的 危险性比患心血管病的危险大得多。 但就整个人群来看,吸烟引起心血管病的死亡率 却比肺癌的高。 前者具有病因学的意义,后者更具有疾病预防和 公共卫生上的意义。