队列研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Cohort study
队列研究
概述
设计原理
特点
目的
种类
选择指针
步骤
常见偏倚
优缺点
队列研究(cohort
定群或群组研究。
study)概述
观察性研究,观察研究对象客观存在的暴露,也称
将研究对象按暴露因素的有无或多少分组,前瞻性观
察疾病的结局,判断暴露因素与疾病结局是否有关联及关联强度。
队列研究不进行研究对象的随机分组,研究性质
)(方向)是前瞻性,从因果关系推断角度来说,是由“因”及“果”的研究。
队列研究主要用于检验、验证病因假设,较病例
对照研究能更直接、有力地检验因果关系假说。
但队列研究需要长期随访相当数量的研究对象,
因而耗费大量的人力和财力,随访期间因各种原因可
形成失访,使研究实施困难。
失访率大,可降低研究
价值甚至失败。
基本概念
队列泛指共同接触某因素(如吸烟或从事医
院放射科工作等)或者具有某种共同特征( 如居住在
北京地区或血清胆固醇和血脂水平较高等) 的一组
人群。
简单地说,队列即具有共同暴露特征的人群。
• 固定队列:人群都在某一个短时期内进入(1991)1991年进入) ,整个研究过程只对队列( 例如1991
该人群进行随访,不再加入新成员,直到观(2001)察期终止(2001(2001年止) 。
• 动态人群:在某一时期确定队列后,在随访过程中,可以增加或减少新观察对象,直
到观察期终止。
队列研究的基本设计原理
设计模式
前瞻性
暴露组
研究
人群
非暴露组
未发病
图1
队列研究的一般模式图
未发病
发病
发病(死亡)
统
计
分
析
结
论
队列研究的特点
属于观察法研究对象的暴露非人为给予,而是客
观存在,有别于实验性研究。
设立对照组研究对象分为暴露组与非暴露组,
研究者观察两组疾病结局,与描述性研究区别。
“”“”观察方向由“因”及“果”研究疾病与暴露的关系,是先有暴露,后纵向观察疾病结局,研究方向
是前瞻性的。
能确证疾病与暴露的因果关系队列研究可以观察到由“暴露疾病”的“因果”的发展过程,在
病因推断基础上,可以确证疾病与暴露的因果关联。
队列研究的目的
检验病因假设
队列研究的主要目的是验证暴露因素对疾病结
局的影响,也可同时观察暴露因素对人群健康的多
方面影响。
一因多果。
初步评价预防措施的自发预防效果
吸烟与肺癌的队列研究中,由于未加人工干预,随
访过程中总会有一部分人戒烟,那么本次队列研究中,可以比较吸烟者中戒烟和非戒烟者的肺癌死亡率,以评价戒烟对预防肺癌死亡的作用,即初步评价戒烟的自发预防效果,有时被称为“人群的自然实验”。
描述疾病的自然史,补充临床观察的不足
例如:美国Framingham心脏病研究工作中,发
(现早年具有某些危险因素(如高血压、高血脂、一过
)性脑缺血发作)的人群,将来发生脑卒中的危险性较高,从而对描述脑卒中的自然史提供更多的信息。
其他
例如队列研究可以用于研究某种疾病发生或发
展的长期变动趋势、初步评价疾病预后等,评价不
同的诊疗方式对疾病预后的影响。
队列研究的种类
前瞻性队列研究(prospective cohort study)
含义
又称同期(concurrent)队列研究。
即研究开始时
尚未得到研究对象的暴露和结局(outcome)资料,只
有通过研究者在实施过程中得到。
特点
研究开始时,研究对象未出现预期结局。
举例
吸烟与肺癌关系的研究。
背景:20世纪40~50年代初,英国学者通过现
况和病例对照研究发现,吸烟者(特别是中度吸烟者)
发生肺癌的危险性较高。
因为当时人群中吸烟者比例较高,且由于肺癌
造成的死亡率迅速升高,因此弄清吸烟与肺癌的关
系成为亟待解决的问题。
Doll和Hill于1951年始进行一项队列研究。
研究对象:英国全国男性医生,按照吸烟情况分
组,吸烟者为暴露组,不吸烟者为非暴露组。
选择研究对象的原因:
英国医生都进行登记注册,不会遗漏,从医生登记注册总署可以很容易查到全英国医生名单,并有姓名、性别、年龄、家庭住址及工作单位等,资料准确、可靠,便于随访;医生具有医学知识,应答率和依从性好,回答真实、完整;同时从登记册上可查到医生死亡诊断,即吸烟者和不吸烟者的结局资料很容易得到。
收集资料形式:以信访方式给所有医生寄出调查
表,问题主要围绕吸烟导致肺癌的假设:是否吸烟、吸烟年限、每日吸烟量、吸烟种类、吸入方式、是否戒烟、戒烟后是否再吸、戒烟年限等。
约有35 000人
寄回调查表,并以此方式取得结局资料。
此研究持续20多年(1951年11月-1976年10月) 。
分别于1954、1956、1964、1976年进行阶段小结。
最终结果表明吸烟者的肺癌死亡率(0.71‰)约为不吸烟(0.71‰
者(0.07‰)的10倍,且日吸烟量与肺癌死亡率呈线性(0.07‰
剂量反应关系。
回顾性队列研究(retrospective)
含义
又称非同期(non-concurrent)、历史性(historical)
队列研究。
即研究对象的暴露和结局资料在过去已收集到(或从现有记录中可查到)。
研究人员工作主要是将相关的资料联系起来。
特点
研究开始时,研究对象已出现结局。
例如研究放射治疗与白血病的关系。
早在1905年有人发现,真性红细胞增多症(PV)患
者常会发生急性白血病,考虑急性白血病可能是PV 患者发展的结局?而当时一部分PV患者接受X线或P32治疗,随着放射疗法使用增多,也有人提出放射治疗可引起急性白血病。
医学工作者提出这样一个问题,PV患者中发
生急性白血病究竟是PV的自然转归,还是放射治
疗结果。
如何判断?
为解决这一问题,美国医生Modan和Lilienfeld
于1965年设计一项队列研究。
研究对象选择和分组:研究者在美国巴尔蒂摩、
波士顿、纽约等城市选择7所医院,查阅该7所医院1937-1955年诊断记录,发现512例PV和476例疑似PV 患者;通过病历还查到每位患者的治疗措施。
根据患者诊断和治疗记录(即治疗措施),将研究
对象分为4组:非放射治疗组、X线治疗组、P32治疗组、X线+P32联合治疗组。
结局资料收集:研究者追溯所有988例患者至
1961年12月为止发生急性白血病情况。
对1961年底
尚存活患者进行临床和血象检查,对已死亡患者则
查阅医院病历、死亡证明、尸解报告及死亡前最终
血象检查结果,以确诊。
结果:放射治疗组患者急性白血病发生率
(10.3%)为非放射治疗组(0.2%)的51倍。
联合治疗
组高于P32治疗组,后者又高于X线治疗组。
进一
步分析:放射治疗组患者疾病发生率与照射剂量
有关,剂量越大发生率越高。
表明:PV患者发生急性白血病,非自然转
归,而是放射治疗的结果。
与前瞻性队列研究相比,本法特点:
(1)研究对象结局资料和暴露资料主要靠查阅历史资料获得,部分结局资料可通过调查;
(2)所研究疾病(急性白血病)的发病率高,研究对象数量相对较少;
(3)虽然随访年代较长(24年),但整个研究工作却在较短时间内(1年)完成。
前瞻性与回顾性队列研究的优缺点
前瞻性队列研究
优点:研究者直接、亲自获取暴露和结局的第一手资料,偏倚较少。
缺点:费时、费人力、物力、财力,可能影响可行性(若随访期过长,易导致失访率升高)。
回顾性队列研究
优点:省时、省人力、物力、财力,可将数十年的研究工作压缩在短时间内完成,出结果快。
缺点:研究者对资料收集不能进行质量控制,只有具备完整、准确、可靠资料时才能应用。
(双向性队列研究(ambispective cohort study)是前两种方法的有机结合。
即暴露资料在
过去已经收集到或从现有记录中可查到,但结
局资料不完全了解。
研究人员必须随访,以获
得结局资料。
即在回顾性队列研究基础上,进
行前瞻性的队列研究,以扬长避短。
队列研究的分类
队列研究的选择指针
前瞻性队列研究
明确的病因假设,不能探讨病因;
结局发生率不低于5‰;
能完整获得暴露资料;
结局判断方法简便可靠,结局资料能收集到;
能获得足够数量观察人群,能被长期随访;
有足够的人力、物力、财力支持。
历史性队列研究
具有完整、真实、可靠的历史记录或档案材料。
应考虑上述前瞻性队列研究所列内容,只是人力、
物力、财力和时间等条件,要求不高。
队列研究的步骤
研究对象的选择
样本大小的确定
资料的收集
队列研究资料的分析
研究对象的选择
暴露组的选择
对照组的选择
明确暴露因素
队列研究选择研究对象的前提是确定暴露。
暴
露须定性、定量和分级。
以收集定量资料为佳,或将暴露水平分级,以保证资料可靠和反映剂量反应关系。
暴露组的来源
特殊暴露人群组
即高度暴露。
若暴露有致病作用,高度暴露人群
发病率或死亡率比一般人群高得多,可使样本量较小,且随访期缩短,有利于分析暴露与疾病的关系。
首选特殊暴露人群组。
如研究放射辐射与急性白血病关系,可选择受
原子弹爆炸辐射人群、应用X线治疗的患者作为研究对象。
职业人群也是特殊暴露人群。
如20世纪50年
代初,进行联苯胺、萘胺与膀胱癌关系研究时,选择染料厂工人作为研究队列。
选择特殊暴露人群作为研究队列时,往往可进
行历史性队列研究。
有一定组织的人群组
有共同暴露某因素经历,当该人群组数量较多
或暴露常见(如吸烟)时,作为研究队列意义较大。
某些群众组织或专业团体,如医学会会员、参加人
寿保险或医疗保险人员等,也可构成队列。
有一定
组织人群为研究队列,便于从组织系统中随访。
如研究吸烟与肺癌关系,选择医生登记册上
所有男医生。
如研究出生缺陷,选择医院围产保
健孕妇作为研究队列,产妇在孕期出现各种情况
(如患病、服药、特殊检查)的资料及婴儿出生后
的缺陷和疾病在产妇病历中有详细记载。
地区性人群组
指某行政区划或地理区域内居住的一般人群。
如1979年北京西城区某居委会人群恶性肿瘤死亡率异
常高,经调查,该地居民住宅为染料厂房改建,改建
时未对原环境彻底清除,故怀疑恶性肿瘤超额死亡可
能与环境污染有关。
为检验假设,选择所有曾在染料厂旧址居住3年及
以上居民作为研究队列。
①所研究疾病是人群中常见的;
②就要观察一般人群的发病情况;
③观察环境因素与疾病的关系。
FraminghamFramingham心脏病研究
20世纪40年代末,美国公共卫生署决定追踪人群心
血管疾病发病情况。
同时分析疾病与社会经济、种族及
其它人口学特征关系,选择一般人群为观察对象。
将年
龄限定30-59 岁,以观察到较高发病率。
在美国马萨诸塞州东部选择名为Framingham 小
镇,从该镇随机选取6500名30-59岁居民作为对象。
对照组选择原则
目的:消除混杂对疾病影响,正确判断暴露与疾
病关系。
选择原则:保证两组的可比性。
对照组除暴露因
素外的其他因素,与暴露组尽可能相同。
已知混杂因素,设计阶段用匹配,分析阶段用分层和多因素分析控制。
对照组的来源
内对照
同质人群中,对照组由未暴露于研究因素的组
成;或将研究对象按暴露水平分成不同组,以最低暴露人群作为对照组。
如研究吸烟与肺癌关系时,选择医院里的吸烟的
医生作为研究队列,不吸烟的作为对照组。
优点:
来自同质人群,可保证除暴露因素外的其他因素在
各组间可比,排除未知、潜在的混杂因素;
各组属于同一人群(称联合队列),有利于随访;
内对照最合理,研究结果因果关系的解释最有力。
()特设对照(外对照)
以特殊暴露人群作为暴露组时,需另外选择某人
群作为对照组。
若以放射科医生为暴露队列研究接触X 线与急性白血病的关系,可选择内科医生为对照组。
若居住在染料厂旧址的居民作为研究队列来研究
环境污染与恶性肿瘤的关系时,可以染料厂旧址周围的一般居民作为对照组。
外对照选择原则尽可能选择可比性高的另一
组人群作对照。
如果外对照在许多方面与暴露组显著不同,且这些因素又可能与疾病的发生有联系,研究结果将很难解释。
一般人群对照
在形式上队列研究表现为未设立对照组,而是将
暴露组中的疾病发生数与基于一般人群疾病发生数而计算出的预期发生数进行比较。
适用于暴露组人群中疾病发生率极高,而一般人
群中暴露于研究因素的比例较低的情况(暴露因素作用较强,混杂因素作用相对较弱)。
如以特殊暴露人群作为研究队列(暴露组)时,由
于大多数特殊暴露人群的数量较少,因而不易进一步分组计算年龄别发病(死亡)率或性别发病(死亡)率。
这时可以与总人口的相应发病(死亡)率作比较。
比较的方法根据总人口相应年龄别发病(死亡)率计算暴露组预期发病(死亡)数,将实际观察的发病(死亡)数与预期发病(死亡)数作比较。
注意事项
①总人口与暴露人群在地理上可比,最
好用暴露人群所在地区的总人口率来比较;②应用与研究人群追踪与观察期相同时间的总人口率。
优点
①基于一般人群(一般都很大)计算的某疾病的
发病率资料比较稳定、可靠;②一般人群资料是现存的,可节约大量人、财、物和时间。
多重对照
为减少由于使用一种对照所带来的偏倚,增加因
果判断的依据,在队列研究中可同时设立两个或以上的对照组。
此称之为多重对照(多种对照)。
如采用外对照的同时,又与一般人群进行比较。
样本大小的确定
队列研究所需样本大小取决于四个因素
一般人群中,所研究之疾病的发生率(P0) 。
P0越
接近0.50,所需样本越大。
暴露组与非暴露组组间发病率的差别。
显著性水平
把握度
α通常取0.05或0.01。
把握度(power)或称效力即1-β。
实用样本量的估计:由于队列研究要随访观察
一段时间,因而队列中研究对象的失访将是不可避免的。
因此在研究开始时要估计可能的失访率,并增
加样本量,以避免在资料分析阶段无法进行分析计算。
通常的作法是按估计样本量增加10%作为实用
样本量。
资料的收集
资料收集的成败关系到整个研究的成败,队列
研究不仅要观察并收集与暴露有关的资料,而且还要观察和收集与结局有关的终点材料,同时最好收集一些可能与产生混杂作用有关的协变量(co-variable)资料,以便于在分析因果关系资料时,及
时调整、消除它们在疾病病因上的混杂作用。
基线资料的收集
进行队列研究在随访研究对象前,研究人员要
获取有关研究对象的多种必要的基本资料,以便判
定暴露组与非暴露组,为今后判定研究结局和分析
比较各项资料打下基础,此类基本资料称之为基线
信息(baseline information),也叫本底信息。
基线资料的收集(获取基线信息、暴露资料的来
源)的途径有下列四种:
常规资料
查阅现有的记录或档案。
例如职业健康体检、劳
动卫生监测、环境污染监测、医疗卫生部门工作档案(如医院病历,医院或药房处方)等。
完整的记录是最优的资料来源,可根据记录直接
确定暴露组和对照组,并可将暴露组按暴露程度分为若干亚组;且记录资料的客观性较好。
不足之处:可能不是任何一个研究对象都有这种
记录;即使有的话,研究人员也难以控制资料的质量和详细程度,难以核实某些资料是否准确。
所需信息缺、漏现象难以避免。
[]询问调查[访视(interviews)]
对于无常规记录可查或记录不完整的暴露资料,
则采用直接询问调查方法,包括直接个人访问、邮寄调查表和电话询问等方式。
目前我国以直接个人访问(面对面调查)最常用。
可
获得多方面信息,还可了解研究对象对研究工作的态度,除吸烟外,其它生活习惯,如饮酒、饮食、服药等都常采用询问调查的方法。
即使在提出相当复杂的问题(如有关膳食、心理状况或在紧迫状况下的反应等)时,取得准确的资料。
但也应该认识到访视的资料也不完全可靠,例如研
究对象未仔细回忆或将往事忘掉;研究对象知道研究工作的目的,这样他们提供的资料可能存在着偏倚。
询问调查资料中存在的最大问题是容易受主观因
素(包括调查员和被调查者两方面)的影响而产生偏性,因此提高询问调查技术是获得比较可靠资料的重要保证。
医学检查
在队列研究中常需作生理、心理或其他特殊检验
以便获得研究对象也不了解的某些信息。
对有些暴露资料,如血脂、血压、体液等,只有通过对观察对象进行医学检查来获得,这种方法在心血管病的研究中运用得较为广泛。
许多对象愿意参加这种检验,因而可提高应答率(response rate)。
通过特定指标的检测还可验证询问调查时所获得的信息是否可靠,如在吸烟研究中可当场检验尿硫氰酸盐,以证实询问调查所得的吸烟资料是否可靠。
但特殊检验的花费很大,且要注意操作的标准化。
此外,要重视调查员和实验员的培训以及开展不同调查员之间和同一调查员在不同时间的质量控制。
措施:①既简便又具有一定可靠性的检查手段或
工具(instrument)②以及提高检查人员检查技术的一致性,是保证获得正确检查结果的两项重要措施。
环境测量
研究职业环境或生活环境因素与疾病关系,就需
要进行现场环境检测。
例如,进行工作环境微小气候空气污染、有毒物
质的暴露测量,或测量某工作场所全体工人的暴露情
况,并据此计算组中每位工人的平均暴露量。
当不能直接测量个人暴露时,这种反映全组人群
的暴露信息特别有用。
上述信息主要是生态学资料(ecological data),有可
能掩盖组内个体暴露水平差异。
环境检测时应注意采集点代表性。
最好在有观察对
象工作或居住的地区采样,才能较准确反映真实暴露。
当环境中危险物质的浓度或剂量不稳定时,一次检测
的结果不能代表全面暴露情况。
宜采用连续、多次检
测方法。
一般人群特征资料
characteristics)
(data on general
包括人口学特征和社会经济状况,前者指年龄、
性别、民族、婚姻状况;后者指文化程度、经济收入、
职业等。
这些资料可以通过病历、户籍、职工登记表中获
得,个别项目也可通过询问调查获得。
用途:评价组间的可比性,即暴露组与非暴露组
在各种有关人群特征方面是否相似,并可以分析它们
的混杂作用。
结局资料的收集
在选定研究的人群和收集了有关暴露及一般人群特
征资料后,下一步的任务就是随访、追踪观察这些对
象,确定他们在观察期间的结局,以此来收集结局资料(data on outcome)。
结局资料的收集方法可根据具体
研究目的以及客观实际采用前述的收集基线信息的方法。
在收集结局资料,随访、追踪观察研究对象时应注意以下几点:
结局指标的选择
结局可以是发病或死亡或具有某种生化指标、血
清学指标、遗传标记等,要根据所观察疾病的诊断技术、死因判断的可靠程度、病死率的高低、病程的长短,以及常规发病或死亡登记报告制度的有无和完整性来确定。
注意结局的判断标准应尽量采用国际或国内统一的标准。
如研究吸烟与发生冠心病的关系,若研究对象发
生了冠心病即为该研究对象出现了结局。
对于道路交通事故研究,结局可以是车祸的发生与否;若研究职业伤害的危险因素,则应以伤害的发生情况作为结局事件。
一般研究疾病的危险因素是以疾病发生与否或因该病死亡与否作为结局事件。
要有统一随访内容和项目,做好访视记录
观察项目应制成调查表或各项检查记录表,并
按要求填写随访登记表格。
同时研究者对每次随访
工作及随访记录都要进行质量控制,发现不符合要
求者及时查漏补缺,因为一次不合格的随访可能使
一个研究对象失去被统计分析的价值(事实上是失访)。
失访偏倚是队列研究中最大的偏倚。
两个队列中所有观察对象确定结局的方法应
保证相同。
尽量采用盲法进行调查访问,即调查者不知道
被调查对象是属于暴露组还是属于非暴露组,以避
免主观因素的影响。
严格培训调查员
要求运用统一随访的方法,如询问技巧、记录
方法等;两组同等对待。
随访
• 随访期
随访期的确定应根据所研究的目的而
定,以暴露因素作用于人体至产生疾病结局
的一般潜隐期为依据,在不失这个原则的基
础上尽量缩短随访期,以节约人力、物力,
减少失访。
随访时间的长短取决于暴露与疾病的关联强度
以及疾病的潜伏期长短(暴露因素与疾病的联系强度越强,随访期越长;疾病的潜伏期越长,随访期越短)。
若是研究持续时间较长,在整个观察期间一般应随访几次,其随访次数和间隔期限视具体情况而定。
如观察时间较短,在观察终止时一次性搜集资料即可。
• 研究对象的随访
保证随访成功是队列研究的关键之一。
随访的目
的是:确定研究对象是否在观察之中,确定研究人群的结局发生情况,并进一步收集有关暴露与混杂因素的资料,以备分析使用。
尽量减少失访,是保证队列研究成功的重要条件。
一般随访时间越长,失访率越高,失访率若超过10%,偏倚会随之增大,失访率在20%~30%以上,其随访结果是否反映真实情况将会受到怀疑,应答率以不低于90%为宜。
观察终点与观察终止时间
• 观察终点(end-point)
指当观察对象出现预期结果,例如一项队列研
究所限定的疾病或死亡,至此就不再继续观察研究对象了。
• 观察终止时间
指整个研究工作可以得出结论的时间,到了观
察终止时间时,研究对象中有的出现了预期的结局事件,有的没有。
观察终点常为规定的疾病的发生或死亡。
如规定
发生冠心病或肺癌死亡为终点,则患了其它病不应视为已到达观察终点,如得了糖尿病还应继续随访,直至观察终止时间。
但是如果研究对象在未到观察终点之前死于其它疾病,表明对其已不能继续随访,但相对于整个研究来说,该研究对象属于失访。
应充分认识到这一点,资料分析时对其应按失访处理,所以,认清观察终点与观察终止时间的区别将直接影响资料的分析。
队列研究资料的分析
包括以下三部分:
①计算不同研究队列的疾病发生率和率差别的显著性检验;
②计算暴露因素与疾病发生的关联强度,即发生某疾病的危险度分析;
③剂量反应关系的分析。
率的计算。