同济大学流行病学-第三章队列研究
流行病学中的队列研究设计

流行病学中的队列研究设计队列研究设计在流行病学中的应用流行病学是研究疾病在人群中的分布和影响因素的科学,为了更好地理解和控制疾病,研究设计起着关键作用。
其中一种重要的研究设计是队列研究,它被广泛运用于流行病学研究中。
本文将详细介绍队列研究的设计和应用,以及其在流行病学中所扮演的角色。
一、什么是队列研究队列研究是一种观察性研究,它追踪研究人群中的个体,并记录他们的暴露情况和可能发生的结果,以便研究人员可以辨别暴露与结果之间的联系。
队列研究中,研究人员首先选择一个暴露群体和一个非暴露群体,并收集相关的暴露和结果数据。
然后,在一个相对长的时间段内,观察研究参与者的暴露历史和结果发展情况。
队列研究有两种类型:前瞻性队列研究和回顾性队列研究。
前瞻性队列研究也称为纵向队列研究,研究开始时参与者尚未发生预定结果,随着时间的推移观察结果的发展。
回顾性队列研究也称为历史队列研究,研究开始时参与者已经发生了指定的结果,然后研究人员回顾过去的暴露历史。
二、队列研究的优势队列研究设计有一些独特的优势,使其在流行病学中广泛应用。
首先,队列研究可以提供有关暴露和结果之间因果关系的强有力证据。
由于观察时间较长,研究人员可以确定暴露是否先于结果发生,并排除其他潜在因素的影响,从而更准确地评估暴露与结果的关联性。
其次,队列研究可以测量暴露对结果的影响的相对风险。
通过计算事件风险比或相对危险度,我们可以了解不同暴露组与非暴露组之间结果发生的概率差异。
另外,队列研究也可以同时研究多个结果,从而提供更全面的信息。
通过追踪参与者的多个结果,研究人员可以更好地了解暴露对不同结果的影响,进而提供更准确的流行病学信息。
三、队列研究的应用队列研究被广泛应用于流行病学的各个领域,尤其是慢性疾病的研究。
例如,通过前瞻性队列研究,研究人员可以追踪参与者的长期暴露情况,以评估吸烟与肺癌发生的关系。
此外,队列研究还可以用于研究其他慢性疾病,如心脏病、糖尿病和癌症等。
流行病学队列研究

THANKS
谢谢您的观看
根据研究目的和假设,选 择合适的效应指标,如相 对危险度(RR)、比值比 (OR)等。
效应大小的估计
根据相关文献或预实验结 果,估计暴露因素与结局 指标之间的效应大小。
04
数据收集与整理的方法与技巧
数据收集的方法与技巧
01
问卷调查
通过设计问卷,对目标人群进行调 查,收集所需数据。
观察法
通过观察目标人群的行为、环境等 ,收集相关数据。
01
探索疾病与暴露因素之间的关系
流行病学队列研究可以用来探索疾病与暴露因素之间的关系,帮助确定
危险因素,为预防和治疗提供依据。
02
揭示长期暴露的影响
队列研究可以追踪研究对象的长期暴露情况,揭示长期暴露对疾病发生
发展的影响。
03
相对较高的研究效率
与实验性研究相比,流行病学队列研究可以在自然状态下进行,相对较
数据汇总
将分类后的数据进行汇总,形成统计 表或图表。
数据质量的评估与控制
1 2
数据完整性
评估数据是否完整,是否存在缺失或异常值。
数据准确性
评估数据是否准确,是否存在误差数据是否一致,是否存在矛盾或不一致的情 况。
数据质量的评估与控制
数据可靠性:评估数据是否可靠,是否存在主观偏见或误差 。
推论性统计
通过样本信息来推断总体特征,如假设检验、 方差分析等。
关联性分析
分析两个或多个变量之间的关联程度,如相关系数、回归分析等。
解释的内容与步骤
解释研究背景
解释研究目的
阐述研究问题的背景和意义,为后续分析 提供依据。
明确研究目的和研究问题,为后续分析提 供方向。
流行病学研究中的队列研究设计与分析

流行病学研究中的队列研究设计与分析在流行病学研究中,队列研究是一种常用的研究设计和分析方法。
队列研究是一种观察性研究,旨在探究暴露因素与疾病发生之间的关系。
本文将详细介绍队列研究的设计和分析原理,以及其在流行病学研究中的应用。
一、队列研究的设计队列研究可以根据研究对象的选择分为两类:前向队列研究和后向队列研究。
前向队列研究,也称为前瞻性队列研究或追踪研究,研究对象在研究开始时没有发生疾病,研究者根据暴露情况将研究对象分为暴露组和非暴露组,随后对其进行长期的观察,记录暴露因素与疾病的发生情况。
而后向队列研究,也称为回顾性队列研究或历史队列研究,研究对象在研究开始时已经发生疾病,研究者通过回顾相关数据来判断暴露因素与疾病的关系。
队列研究的优点在于可以确定因果关系,能够观察到疾病发生前的暴露因素情况,能够计算相对危险度,并且可以进行长期的追踪观察。
但是,队列研究也存在一些局限性,如研究周期长、费用高、可能存在记忆偏倚等。
二、队列研究的分析在队列研究中,研究者通常需要进行一系列的数据收集和分析操作。
下面将介绍队列研究中常见的一些分析方法。
1. 累积发生率(cumulative incidence rate)累积发生率是指在一段时间内,某种疾病在暴露组和非暴露组中的发生率。
研究者可以计算出两组的累积发生率,并比较差异。
2. 风险比(relative risk)风险比是队列研究中常用的一种相对危险度指标,用来比较暴露组和非暴露组在患病风险上的差异。
研究者可以通过计算相对风险比来评估暴露因素对疾病的影响程度。
3. 生存分析(survival analysis)生存分析是一种常用的队列研究的时间性质分析方法,用于研究通过时间来评估事件的发生概率。
生存分析可以帮助研究者估计一段时间内某种事件(如疾病发生)的发生率,并进行统计学检验。
4. 卡方检验(chi-square test)卡方检验是队列研究中常用的一种假设检验方法,用于比较观察频数与期望频数之间的差异。
(精品) 流行病学课件:队列研究

32
一次研究可有多个结局
39
➢样本量的计算:
查表 公式计算(条件 暴露组和对照组样本含量相等)
n z
2
2pq z p0q0 p1q1
p1 p0 2
p : 两个发病率的平均值
p1:暴露组预期发病率 p0:对照组预期发病率
40
实例
已知 p0=0.003,RR=2.5,α=0.05,β=0.1 计算样本量 根据上述条件 zα=1.96, zβ=1.282 ,q0=0.997 p1=p0×RR=0.0075,q1=0.9925 代入公式得 n=5420 即HBsAg阳性组与阴性组各需5420人
慢性 支气 管炎
吸吸烟烟
肺癌
冠心 病
结局、确定研究现场与研究人群
1、研究现场
有足够符合条件的研究对象 领导重视、群众支持 医疗条件较好,交通较便利 发病率较高 有代表性 实例的研究现场是江苏省海门市
34
2、研究人群
从目标人群中抽出的具有代表性的人 未患所研究疾病 分为暴露组和对照组
28
第二节 研究设计与实施
确定研究因素 确定研究结局 确定研究现场与研究人群 确定样本量 资料的收集与随访 质量控制
(以一项乙肝病毒(HBV)感染与原发性肝细胞癌 (PHCC)的队列研究为例,以下简称实例)
29
一、确定研究因素
➢主要暴露因素:在描述性研究和病例对照 研究的基础上确定。 ➢可能影响结局的因素:混杂因素及人口学 特征等。
流行病学中的队列研究设计与分析

流行病学中的队列研究设计与分析在流行病学研究中,队列研究是一种常用的观察性研究设计,用于探究某种特定疾病或健康结果与暴露因素之间的关系。
本文将介绍队列研究的基本概念、研究设计和分析方法。
一、队列研究介绍队列研究是一种长期观察个体的疾病发生情况和暴露因素的关联性研究设计,从而推测因果关系。
研究对象可分为前瞻性队列和回顾性队列。
前瞻性队列研究则先选择一群暴露和未暴露于某种因素的个体,再随访观察他们的发病情况;而回顾性队列研究则是在已经发生的事件或疾病群体中追溯暴露因素,然后判断发病的原因。
二、队列研究设计1. 前瞻性队列研究设计前瞻性队列研究的设计包括以下几个步骤:(1)选择研究人群:根据研究目标选择暴露和未暴露于某种因素的个体。
(2)暴露测量:明确暴露因素的测量方法,并且定期收集相关数据。
(3)随访观察:对研究人群定期进行随访,记录他们的暴露情况和疾病发生情况。
(4)结果评估:分析和比较研究人群的发病率,进而评估暴露因素与疾病之间的关系。
2. 回顾性队列研究设计回顾性队列研究的设计包括以下几个步骤:(1)选择研究人群:从已知事件或疾病的个体群体中选取暴露于某种因素的个体。
(2)暴露回溯:通过回顾性的方法收集个体的暴露历史和相关数据。
(3)结果评估:分析和比较研究人群的发病率,进而评估暴露因素与疾病之间的关系。
三、队列研究数据分析在队列研究中,数据分析是非常重要的一步,分析方法应遵循以下原则:1. 计算发病率:根据研究人群的发病情况和随访时间,计算出不同暴露组的发病率。
2. 构建生存曲线:使用卡普兰-迈尔曲线或其他相关方法构建生存曲线,比较不同暴露组的生存曲线是否有差异。
3. 风险评估:根据发病率和生存曲线,计算不同暴露组的风险比、风险差异等风险评估指标。
4. 考虑混杂因素:队列研究中可能存在多种混杂因素,需要进行控制或分层分析来减少混杂效应的影响。
5. 统计学检验:使用适当的统计学方法,如卡方检验、t检验或logistic回归等,评估暴露因素与疾病之间的关系是否具有统计学意义。
同济大学流行病学-第三章队列研究

第三章 队列研究第一节 基本原理一、概念(一)定义队列研究(cohort study)又称群组研究、前瞻性研究(prospective study)、发生率研究(incidence study)、随访研究(follow-up study)及纵向研究(longitudinal study)。
队列研究——是将一个范围明确的人群按是否暴露于某可疑因素分为暴露组和非暴露组,或是按是否不同程度地暴露于某种可疑因素分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局的差异,分析和推断该暴露因素是否是所研究疾病的危险因素或病因的一种研究方法。
(二)关键词1、暴露(exposure):是指研究对象接触过某种待研究的物质(如重金属)、具备某种待研究的特征(如年龄、性别及遗传等)或行为(如吸烟)。
暴露可以是有害的,也可以是无害的。
2、结局(outcome):是指疾病(包括疾病的不同类型和不同程度),或是某种健康状态或是死亡。
3、队列(cohort):是指一个特定的人群(群组)。
它是一组在特定时期出生的人群,或是一组有某种共同暴露或特征的人群。
固定队列(fixed cohort)——对象入队出队自始自终。
动态人群(dynamic population)——新对象随时加入,原成员不断退出。
4、危险因素(risk factor):又称为危险因子,泛指能引起某种疾病或不良健康状态发生或发生率增加的各种环境、行为、社会和遗传等因素。
二、基本原理:在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记各组人群待研究的预期结局的发生情况(如疾病、死亡、或其他健康状况),比较各组结局的发生率,从而评价和检验危险因素与结局的关系。
判定:假使暴露组(或高剂量暴露组)预期结局的发生率显著高于非暴露组(或低剂量组)。
流行病学--队列研究

二、 其他有关概念
6、自然实验:是指观察人群自然暴露于可 疑因素的队列研究。但是其本质是观察
性研究,而不是实验研究。
基本原理
在一个特定人群中选择所需的研究对象,根据目前或过去
某个时期是否暴露于某个待研究的危险因素,或其不同的
暴露水平而将研究对象分成不同的组,如暴露组和非暴露 组,高剂量暴露组和低剂量暴露组等,随访观察一段时间, 检查并登记各组人群待研究的预期结局的发生情况(如疾 病、死亡、或其它健康状况),比较各组结局的发生率,
露于研究因素的研究对象。
(一)暴露组的选择
1、一般人群 2、职业人群
3、特殊暴露人群
4、有组织的人群团体
1、一般人群
在某地一般人群中选择暴露组。 其研究结果具有代表性 但观察费用较高,在追踪观察中易发生失访。
2、职业人群:
从暴露于研究因素的职业人群选择的暴露组。
优点:①职业人群往往暴露于令人感兴趣的假设因素,
四、样本含量的确定
在队列研究开始以前,要确定足够的样本数量, 以保证在规定的显著性水平和把握度水平上, 检出暴露组与非暴露组的发病率差异,确定暴
露因素与疾病之间是否存在因果关系。
(一)估计样本含量时的几个问题:
抽样方法:与其它研究相同。 暴露组与对照组的比例:一般来说对照组的
样本含量不宜少于暴露组的样本含量,通常
3、一般人群对照(总人口对照):
使用暴露人群所在地区的人口,而且时间上
也是一致或相近的,以保证可比性。
1)发病率或死亡率比较稳定且容易得到。 2)可以节省大量的经费和时间。
3)资料比较粗糙,往往不十分精确或缺乏要比
较的项目。
4、多重对照
流行病学队列研究

回顾性研究的优点
易于进行,能快速收集资料;可 充分利用已有的医疗资源;适用 于罕见病和死亡等结局的研究。
回顾性研究的缺点
易受回忆偏倚和失访的影响;无 法判断暴露与结局的因果关系; 耗费人力、物力较大。
04
队列研究的优势与局限
优势
病因推断准确性高
队列研究根据暴露因素与结局的关系 推断病因,能较准确地揭示暴露因素 与结局之间的因果关系。
研究对象失访
由于队列研究需要长时间的追踪调查,可能会出现研究对象失访 的情况,导致样本失真。
与其他流行病学研究方法的比较
与病例对照研究的比较
病例对照研究是回顾性研究,队列研究是 前瞻性研究,病例对照研究的病因推断准 确性较低。
VS
与横断面研究的比较
横断面研究只能反映某一时点的疾病分布 情况,不能反映疾病的发展过程;队列研 究能够反映疾病的发展过程和流行趋势。
描述性研究的优点
易于进行,能快速获得初步结果;适用于大规模、多因素分析;可发现危险因素。
描述性研究的缺点
无法判断暴露与结局的因果关系;易受回忆偏倚和失访的影响;耗费人力、物力较大。
分析性研究
要点一
判断暴露因素与结局 的因果关系
通过对比队列中暴露与未暴露人群的 结局,分析暴露因素对结局的影响, 并计算相对危险度等指标。
影响因素分析全面
队列研究可以同时研究多个暴露因素 与结局的关系,能够全面地分析各影 响因素的作用。
适用于罕见病及长期 效应研究
队列研究可用于研究罕见病及长期效 应,因为其可以扩大样本量,降低研 究成本。
局限
研究耗时长
队列研究需要长时间的追踪调查,耗时较长,人力和物力成本较 高。
信息失真
流行病学-队列研究

➢最初选定参加研究的对象中有人拒绝参加;
➢研究对象由志愿者组成;
➢研究对象迁移、外出、死于非终点疾病导致失访;
➢历史性队列研究中部分档案丢失或记录不全。
控制方法
➢选择便于随访的人群,适当增加样本量,减少失访等
信息偏移
产生原因
➢疾病、暴露标准不明确
➢检验仪器不精确、检验技术不熟练、询问技巧不佳等
概念
队列研究(cohort study)是将研究人群按照是否暴露于某因素或暴露程度分为暴露组和非暴露组,追踪观察并比较两组成员在特定时间内与暴露因素相关结局(如疾病)发生率的差异,从而判定暴露因素与结局之间有无因果关联及关联程度的一种观察性研究方法。
基本原理
主要特点
观察法
设立对照(暴露组与非暴露组)
前瞻性
由因到果
用途
检验病因假设
评价预防效果(自然实验)
研究疾病自然史
预后因素研究和新药上市后监测
类型
前瞻性队列研究、历史性队列研究和历史前瞻性队列研究
研究设计与实施
基本步骤
1.确定研究因素(暴露因素)
2.确定研究结局(可多个结局)
3.确定研究现场与研究人群(稳定、能随访)
4.确定样本量
5.资料的收集与随访(暴露、结局的随访,时间、间隔)
暴露人群的选择:
*特殊暴露人群(如职业暴露)
*一般人群(社区人群)
*有组织的人群
对照人群(非暴露人群)的选择:
*内对照
*外对照
*总人口对照
*多重对照
估计样本
①随访期内对照组(或一般人群)的估计;结局发生率(p0)
②暴露组的估计结局发生率(p1)
③统计学要求的显著性水平(α)
临床流行病学研究设计类型(三)——队列研究

结果说明吸烟对每个受害者来说, 患肺癌的危险性比患心血管病的危险大得多。 但就整 个人群来看,吸烟引起心血管病的死亡率却比肺癌的高。前者具有病因学的意义,后者更具 有疾病预防和公共卫生的意义。
• ⑶归因危险度百分比(attributive risk percent,
ARP):又称病因分值(etiologic fraction, EF), 指暴露人群中归于暴露的发病或死亡占全部发病 或死亡的百分比。
(二)设计与实施
• • • • •
1.确定队列研究工作是否开展(研究目的) 2.暴露人群的选择 3.非暴露人群的选择 4.样本含量 5.资料的收集
1.确定队列研究工作是否开展(研 究目的)
• ⑴是否有明确的假设供检验,检验的因素是否已
• • • • •
找准。 ⑵所研究疾病的发病率或死亡率高低,低于5% 不适宜。 ⑶是否规定了明确的暴露因素,暴露资料能否完 整获得。 ⑷是规定了明确的结局变量,有无简便可的手段 获得结局材料。 ⑸有无足够的研究人群。 ⑹随访人、财、物有无保证,随访依从性如何?
⑵随访
• ①随访对象:所有被选定的研究对象,不论是暴露组或对 • •
照组,都一律同等时间随访至观察终点。观察终点是指研 究的疾病发生和死亡或一项某水准的检测指标。观察绺必 须事先明确规定,并始终保持不变。 ②随访内容与方法:同基线调查。 ③观察终止时间及随方间隔:观察终止时间可长可短,应 以所研究疾病的自然史和潜伏期而定,但应缩短观察期, 以节约人力、物力和减少失访。如果观察期较短,在观察 终止时一次搜集资料即可。反之需要多次随访,其间隔与 次数视具体研究的需求而定。 ④随访执行者:由经过统一专业培训的调查员进行随访, 由操作技术规范化的技术人员和各项检验与测量工作。要 求调查员在各暴露组中查找随访绺信息时应付出相同的努 力。最好采用单盲或双盲方法随访。
分析流行病学-队列研究课件

• 查表法
条件 已知α、 β 、p0、 RR
注意事项: (1)暴露组与对照组的比例:通常采用两组等量的方法。 (2)通常按10%来估计失访率,故计算出来的样本量再
加10%做为实用样本量。
五、资料的收集--随访或追踪
❖基线资料 ❖随访 ❖资料收集
P :两个发病率的平均值
P1:暴露组预期发病率 P0:对照组预期发病率
条件 暴露组和对照组样本含量相等
例:p0=0.007,RR=2.5,α=0.05,β=0.1,计算样本量 根据上述条件 Zα=1.96, Zβ=1.282 ,q0=0.993 p1=p0×RR=0.0175,q1=0.9825 代入公式得 N=2310
SPMR 预期死亡数
适用条件 不能得到历年人口资料,仅有死亡人数、原因、日 期和年龄
标化比例死亡比(2)
预期死亡数的计算 以全人口中某病因死亡占全部死亡之比例乘 以某单位实际全部死亡数
• 例:某厂30-40岁组工人死亡总数为100名,某年有5人死
于肺癌,已知该年全人口30-40岁组肺癌的死亡占全部死 亡的比例为2.2%,求SPMR
历史性队列研究 Historical (Retrospective) Cohort Study
➢ 根据研究开始时研究者掌握的有关研究对象在过 去某时刻的暴露情况的历史材料分组
➢ 不需要随访,研究开始时结局已出现
历史性队列研究
优点
➢ 短期内完成资料的收集和分析 ➢ 时间顺序仍是由因到果 ➢ 省时、省力、出结果快
二、 率的计算
❖累积发病率 ❖发病密度 ❖标化死亡比 ❖标化比例死亡比
累积发病率 (cumulative incidence)
临床流行病学--队列研究

过去
现在
历史性队列
将来
回顾性收集已有的历史资料
双向性队列
继续前瞻性收集资料
前瞻性收集资料
前瞻性队列
时间顺序
13
前瞻性队列研究 (PROSPECTIVE COHORT STUDY)
研究队列的确定是现在(concurrent) 根据研究对象现在的暴露分组 需要随访(follow up) 结局在将来某时刻出现
16
优 点
短期内完成资料的收集和分析 时间顺序仍是由因到果 省时、省力、出结果快
缺 点
资料积累时未受到研究者的控制,内容 上未必 符合要求 需要足够完整可靠的过去某段时间有关 研究对象的暴露和结局的历史记录或档案 材料
17
双向性队列研究
AMBISPECTIVE COHORT STUDY
研究队列的确定是过去 根据研究对象过去某时刻的暴露情况分组 需要随访 部分结局可能已出现
18
优点:是将前瞻性队列研究与历史性队列研究结 合起来的一种设计模式,因此兼有上述二类的优 点。
应用:当基本具备进行历史性队列研究的条件下, 如果从暴露到现在的观察时间还不能满足研究的 要求(人时不够,未满足效应期),还需继续前 瞻性观察一段时间时,则选用双向性队列研究。
19
五、实例
英国Doll & Hill, 1951 - 1976年 共调查59600名人,满意应答者40701人 研究对象:医生
内对照(internal control) :一群研究对象内部
外对照(external control) :一群研究对象外部 总人口对照(total population control):总人口
对照(可以看作是外对照的一种,也可看作不 设对照),是利用了整个地区的现成发病/死亡 的统计资料 多重对照两种或以上的对照形式 实例是从一般人群中选择研究对象,采用内对照
流行病学课件-队列研究

隨訪 觀察終點 研究對象出現了預期結局 即達到了觀察終點(end point)。 終止時間 指全部觀察工作的截止時 間。 隨訪追蹤
率的計算 累積發病率(cumulative incidence)
累積發病率 = 观察期间发病人数 10 万/10 万
观察开始时队列人数
發病密度(incidence density)
❖ 措施 芬蘭當局已於1972年把CS2的車間最高容 許濃度從20ppm降至10ppm
小結
重點掌握: ◆佇列研究的概念、特點 ◆佇列研究的資料分析(包括率的計
算、人年的計算、相對危險度和特異危 險度的計算及意義)
謝謝
佇列研究(cohort study) 是選定暴露 和未暴露於某因素的兩種人群,追蹤其 各自發病的結局,比較兩者發病結局的 差異,從而判斷暴露因素與發病有無因 果關聯及關聯大小的一種觀察性研究方 法。
又稱為人群病因分值(population etiological
fraction,PEF)
PAR%
P0 (RR 1)
P0 RR 1
1
100%
表示人群中由於暴露因素所致的發病率或死
亡率占人群發病率或死亡率的百分比。
(P0人群中某因素的暴露率)
優點:
論證因果關係的能力強 可以獲得不同佇列的發病或死亡資料 一次可以調查多種疾病或衛生行為 暴露因素可分等級便於計算“劑量-反應 關係”
內對照 按人群內部暴露情況分組。 外對照 特設對照、總人口對照 多重對照 一個暴露組多個對照組,或多個
不同水準的暴露組與一個或多個對照組。
資料的收集 基礎資料的收集 隨訪
基礎資料的收集 收集人口學資料 一般人口學資料 查閱記錄和檔案 職業史、暴露水準 和劑量 詢問調查研究對象或知情人 醫學檢查或檢驗以收集客觀資料 收集環境資料 家庭、居住、工作、 區域環境等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 队列研究第一节 基本原理一、概念(一)定义队列研究(cohort study)又称群组研究、前瞻性研究(prospective study)、发生率研究(incidence study)、随访研究(follow-up study)及纵向研究(longitudinal study)。
队列研究——是将一个范围明确的人群按是否暴露于某可疑因素分为暴露组和非暴露组,或是按是否不同程度地暴露于某种可疑因素分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局的差异,分析和推断该暴露因素是否是所研究疾病的危险因素或病因的一种研究方法。
(二)关键词1、暴露(exposure):是指研究对象接触过某种待研究的物质(如重金属)、具备某种待研究的特征(如年龄、性别及遗传等)或行为(如吸烟)。
暴露可以是有害的,也可以是无害的。
2、结局(outcome):是指疾病(包括疾病的不同类型和不同程度),或是某种健康状态或是死亡。
3、队列(cohort):是指一个特定的人群(群组)。
它是一组在特定时期出生的人群,或是一组有某种共同暴露或特征的人群。
固定队列(fixed cohort)——对象入队出队自始自终。
动态人群(dynamic population)——新对象随时加入,原成员不断退出。
4、危险因素(risk factor):又称为危险因子,泛指能引起某种疾病或不良健康状态发生或发生率增加的各种环境、行为、社会和遗传等因素。
二、基本原理:在一个特定人群中选择所需的研究对象,根据目前或过去某个时期是否暴露于某个待研究的危险因素,或其不同的暴露水平而将研究对象分成不同的组,如暴露组和非暴露组,高剂量暴露组和低剂量暴露组等,随访观察一段时间,检查并登记各组人群待研究的预期结局的发生情况(如疾病、死亡、或其他健康状况),比较各组结局的发生率,从而评价和检验危险因素与结局的关系。
判定:假使暴露组(或高剂量暴露组)预期结局的发生率显著高于非暴露组(或低剂量组)。
可推测该暴露因子可能是所预期结局的危险因素或两者之间存在病因学联系。
注意:队列研究开始时,全部的研究对象都还没有发生所研究的预期结局。
也就是说并不是所研究疾病的病人,而是在研究的观察期间,这些对象具有发生这种结局的可能性。
因此,队列研究具有以下特征:(1)观察性——对象的暴露是客观存在的,而不是人为安排的。
(2)比较性——研究比较不同暴露状态下,各组预期结局的发生率。
(3)时序性——观察对象在某种暴露状态下,疾病从无到有,是由“因”及“果”的研究。
(4)可以确证暴露与结局的因果联系,能准确地计算特定数目的暴露人群中结局时间的发生率,估计暴露人群发生结局事件的危险性。
这和描述性研究是不同的。
三、研究目的1. 检验病因假设:由于队列研究具有时序性特征,即由“因”及“果”的研究,并对结局的发生可较为准确的测量。
因此可深入检验一个或多个病因假设。
2. 评价因素的保护性效果:有些暴露有预防某结局发生的效应,即出现预防效果。
如戒烟可减少吸烟者肺癌发生的危险等,这里的预防措施不是人为给予的,而是研究对象自发行为。
这种现象被称为“人群的自然实验”。
3. 研究疾病自然史:队列研究可以观察人群从暴露于某因素后,疾病逐渐发生、发展,直至结局的全过程,不但可了解个体疾病的全部自然史,而且可了解全部人群疾病的发展过程。
四、研究类型队列研究依据研究对象进入队列时间及终止观察的时间不同分为:(一)前瞻性(prospective)队列研究,亦称为同时性或即时性队列研究,前瞻性队列研究的研究对象是在研究开始时即时纳入的,对象的确定和分组是根据其暴露状态分成的。
此时,研究的结局还没有出现,还需要前瞻观察一段时间才能得到。
优点:可以直接获得暴露和结局的资料,结果受偏倚影响小。
缺点:人群样本大,观察时间长,人力和物力消耗多,研究设计和实施较复杂。
(二)回顾性(retrospective)队列研究,亦称为历史性队列研究和非即时性队列研究。
回顾性队列研究的研究对象的确定和分组是根据研究开始时已获得的历史资料中的暴露情况而决定,结局在研究开始时已从历史资料中获得。
由于对象在过去某个时点进入队列,然后又从历史资料中获得的对象从该时点至现时点中结局的发生情况,虽然暴露资料的收集和结局的判断在同时完成,但其性质仍属于前瞻性的。
优点:在较短的时间内完成需要数年或数十年的观察和资料的收集工作,研究时间短,节省人力、物力。
缺点:暴露情况不能为研究者所控制,观察及收集暴露和结局信息受历史资料的限制。
研究的有效性受历史资料的完整性、全面性和准确性的影响。
(三)双向性(ambispective)队列研究,也称混和型队列研究,即在回顾性队列研究之后,继续进行前瞻性队列研究,因而发挥了两者的优点,弥补了两者的不足。
第二节 队列研究的设计和实践一、确定研究因素研究因素又称为暴露因素、暴露因子、暴露变量,通常是在描述性研究和病例对照研究的基础上确定的。
应根据对象的暴露水平、暴露时间等对暴露因素进行定量,即规定具体的标准和方法,并收集有关暴露方式、暴露间歇的信息。
对可能影响暴露因素与疾病结局联系的其他暴露因素和对象的背景资料也应加以收集。
二、确定研究结局结局变量(outcome variable)也叫结果变量,简称为结局,是指观察人群中出现的预期结果事件(疾病、死亡或某种健康状态)。
结局是队列研究的观察终点。
要说明的是,在研究中因其他疾病而死亡,则不是结局。
此外,结局不仅限于发生某种疾病而死亡,还可以是各种检查指标达到了某一水平。
三、确定研究现场与研究人群(一)研究现场由于队列研究要求获得足够的预期结局发生数,并且要求长时间的随访。
因此,既要考虑研究现场具有代表性,又要考虑那些较好的组织管理体系,能够完成长期随访的现场,同时获得调查人群的理解和支持也很重要。
(二)研究人群队列研究的人群包括暴露组和非暴露组,及不同水平的暴露亚组。
1、暴露人群的选择暴露人群是指已经处于某种暴露因子或已有某种暴露史的人群。
(1)职业人群——选择因某种职业原因,暴露于某种特殊危险因素的人群作为暴露人群。
(2)特殊暴露人群——某些特殊的暴露可能与疾病关联。
此时选择有特殊暴露史的人群作为暴露人群。
(3)一般人群——对人群中常见疾病的危险因素研究时,常选择一般行政区域或社区人群为对象。
(4)有组织的人群——是一般人群的特殊形式。
如学生、军人、医生、护士等,这类人群便于医疗就诊和随访观察结果。
2、对照人群的选择对照人群的设立是为了与暴露人群进行比较,这也是分析性流行病学研究的共性之一。
通过与暴露人群的比较,来验证病因假设。
原则要求对照人群除所研究的暴露因素外,其他各种因素或人群特征尽可能与暴露组相似。
(1)内对照——是指在同一人群中,根据某暴露因素的分布的不同,分为暴露组和非暴露组。
(2)外对照——是指先选定暴露因素外,其他方面与暴露组相似的对照组。
(3)特设对照——另选一个除暴露因素外,其他方面与暴露组相似的对照组。
(4)总人口对照——是根据现有的发病或死亡统计资料,以某个地区的总人口的率为对照。
(5)多重对照——是设计不同暴露程度的多组对照组与暴露组进行比较,也可以选择上述两种对照组分别与暴露组比较,旨在减少或去除由于一种对照带来的偏倚。
四、确定队列大小(一)队列研究样本量的决定因素1、一般人群(对照人群)中所研究疾病的发病率(P0),P0越接近0.5,要求样本量越大。
2、暴露组与非暴露组的发病率之差用(d)表示,暴露组的发病率用(P1)表示,两组发病率之差d= P1- P0,d越小,要求的样本量越大。
3.显著性水平即检验假设时的第Ⅰ类错误(假阳性错误)α值。
α值越小,要求样本量越大。
4. 效力又称把握度(1-β),β为检验假设时出现第Ⅱ类错误的概率,而1-β为检验假设时能够避免假阴性的能力。
若要求效力(1-β)越大,即β值越小,则所需样本量越大。
(二)样本量计算公式(详见教材)五、资料的收集和随访(一)基础资料的收集1、收集人口学资料——指收集对疾病的发生或死亡频率可能有影响的一般人口学资料。
2、查阅记录和档案——特殊暴露人群的职业史或医疗记录常有暴露水平或个体暴露剂量的资料。
3、询问队列中的研究对象——通常采用问卷调查表方式。
要注意的是:由于测量方式、应答率和回忆准确度的影响,所提供的资料有可能出现信息偏倚。
4、医学检查和生物标志的信息——有的研究因素需通过检查或检验才能得到数据。
5、环境测量资料——当暴露水平是基于环境中的累积暴露时,往往需要依赖环境监测信息。
(二)随访随访——是指在完成了对象纳入和基础资料收集后,确定各比较组研究结局变量发生情况的过程。
1、观察终点和终止时间观察终点——指一个研究对象出现了预期的结局。
终止时间——是指全部观察工作截止的时间。
失访——指某个研究对象因其他原因死亡或离开观察队列。
2、随访追踪对各比较组对象的追踪随访应持续到对象出现观察终点或达到观察终止时间。
随访观察的时间根据疾病的潜隐期、自然史、暴露时间的累积暴露程度而异,可长可短。
而间隔与次数将视研究结局的变化速度、研究的人力、物力等条件而定。
一般慢性病的随访间隔期定为1~2年。
第三节 数据资料的整理和分析一、 资料整理收集的资料,须经核查后,再输入事先建立的数据库中,并整理成表。
二、 人时的计算常用的人时单位是人年、人月、人日,最常用的是人年。
总人时——是指所观察对象的观察年(月、日)数。
例如100人观察10年等于1000人年。
三、 率的计算及其显著性1、累积发病率(cumulative incidence)累积发病率或死亡率适用于比较稳定的观察队列。
累积发病率=观察期内发病人群/观察开始时队列人数 ×10万/10万2、发病密度(incidence density)发病密度适用于动态队列,以人时为单位估计发病率。
用人时为单位计算发病率具有瞬时频率性质,故称为发病密度。
较常用的是人年发病率。
3、率的显著性检验样本量大,正态分布,疾病发生率不很低——u检验样本量大,正态分布,疾病发生率很低——二项分布或泊松分布也可以用卡方检验。
四、 效应的估计队列研究资料分析:首先是计算各组发病率、发病密度或发病率;然后对组内率的差异进行统计学检验。
差异有统计学意义则进一步确定暴露因素与疾病的关联强度。
1、相对危险度(relative risk,RR)也叫危险比(risk ratio)或率比(rate ratio),是反映暴露组发病率(死亡率)与非暴露组发病率(死亡率)的比值。
也可以是比较不同暴露程度组发病率(死亡率)的比值。
RR说明暴露与某可疑危险因素后,暴露组发生结局的危险性是非暴露组的多少倍。
说明:RR=1,暴露因素与疾病无关联。