队列研究方法及统计学考虑
队列研究

合计
13
1168
1181
三、资料分析
1.率的计算 1)累积发病率(cumulative incidence) 2)发病密度(incidence density) 暴露人口由于迁移他处、死于其他疾病、中途 加入等,应将变动着的人群转变为人时数代替人 数来计算,如人年,此种发病率称发病密度。如 1个观察对象观察满一年为1人年。 2.暴露人年的计算 1)小样本 从观察对象中剔除死亡、迁徙及失去 联系者,补充新加入的人数来折算人年。
2)小样本:算各人随访人年数,各年龄组的总人年数
例: 有3人从开始观察日至1981.1.1止,逐个计算人年
对象 出生日期 进入研究日期 退出研究日期
1 1927.3.21 2 1935.4. 9 3 1942.11.12 1966.7.19 1961.11.11 1970.2. 1 1977.9.14(迁居外地) 1973.12.1(死亡) 1981.1. 1(随访结束)
a c AR Ie Iu= ab cd
例2 AR=3.31-0.12=3.19%
RR与AR的区别 RR评价暴露与疾病的联系强度,不说明绝对危险度的大小 用于病因研究 AR表示某因素对疾病的绝对危险,用于公共卫生决策。
例: 吸烟对不同疾病的AR和RR
疾病
肺癌 心血管病
死亡率1/105 吸组
(一)常见偏倚 1.失访偏倚 研究对象由于移居外地、外出、不合作或死于其 他疾病未能追踪观察到,以至在研究中丢失。 影响研究真实性,其程度取决于: 1)失访人群的质,即失访人群与未失访人群在所 研究的主要方面区别 2)失访人群的量,小于观察人群总数的5%,偏 倚不大
2.选择偏倚 任何非研究因素在研究人群中与一般人群分布不 一致,暴露人群或非暴露人群划分错误。 往往高估或低估联系强度 3.测量偏倚 对疾病诊断缺乏正确标准,或测量仪器精确性差, 造成漏诊或误诊 4.混杂偏倚 如性别、年龄等
队列研究

预防医学第十五章队列研究预防医学教研室第十五章队列研究第一节概述一、定义“队列”,指在一定期间对其进行随访的人群组。
队列研究将研究对象按是否暴露于某因素分成暴露组与非暴露组(对照组),随访适当长的时间,比较两组所研究疾病的发病率或死亡率差异,以研究暴露因素与疾病之间的关系。
研究人群吸烟不吸肺癌不患肺癌不患a b cd (人数)调查方向现在将来队列研究示意图队列研究资料归纳表━━━━━━━━━━━━━━━━━━━━━病例非病例合计发病率─────────────────────暴露组a b a+b a/(a+b)非暴露组c d c+d c/(c+d)─────────────────────合计a+c b+d N(a+c)/N ━━━━━━━━━━━━━━━━━━━━━a/(a+b )与c/(c+d),如果有显著差异,说明暴露因素与疾病有联系,且很可能是因果关系。
二、特点①观察性研究方法;②设立对照;③由“因”求“果”,是前瞻性研究;④能验证因果关系的假设。
三、种类1、前瞻性队列研究从“现在”开始的前瞻性研究。
观察开始时,病例未出现,需要追踪观察一定时间,方能得到结果(发病或死亡)。
2、回顾性队列研究(历史前瞻性研究)追溯过去某个时间开始的暴露情况,调查那时以来的发病情况,对暴露人群与非暴露人群进行比较,以研究暴露与疾病的关系。
研究开始时,已发病或死亡。
3、双向性队列研究回顾性队列研究观察到“现在”后,再继续前瞻性随访。
四、用途1、检验病因假设2、描述疾病的自然史3、评价自发的预防效果实例二十世纪上半叶在英国发现:肺癌死亡率与支气管炎、肺结核及其它癌症不同,呈迅速上升趋势,且与烟草的消耗量有平行关系。
肺癌吸烟?Doll与Hill在1948年进行病例对照研究发现:吸烟者患肺癌的危险性明显高于不吸烟者,吸烟可能是肺癌的病因。
(假设)从1951年开始,进行了队列研究研究对象:英国医生。
发函调查了59600名医生的一般情况与吸烟状况,来自40701名医生的调查表可供分析。
队列研究 (2)

二 特点 1. 对比性研究 2. 自然观察法 3. 抽样性研究 4. 由因到果研究 5. 单因多果的研究 6. 能较确切证实因素与疾病的因果联系
三 用途 1. 检验病因假设 2. 评价自发的预防效果 3. 研究疾病自然史 4. 新药上市后监测
四 、 种类
1. 前瞻性队列研究 ( prospective cohort study ) 前瞻性队列研究应考虑的问题: 1)有明确检验假设; 2)队列人群发病率较高; 3)潜伏期较短; 4)准确地测量及诊断方法; 5)有足够的观察人群; 6)失访率低。 2. 历史性队列研究( historical cohort study ) 1)--5) 6)有比较详细的历史记录或档案材料。
5. 样本量大小
(1) 影响因素 ①人群发病率的高低(是否接近0.5) ②暴露人群与对照人群的发病率差异 ③第一类误差 ④第二类误差(把握度) (2) 样本量的计算 ①计数资料的样本量计算
n 2PQ ( ) ( P1 P 0 )
2 2
P1为暴露组发病率; P0为非暴露组发病率; P=(P1+P0)/2 Q=1-P
(2) 发病密度( incidence density, ID ) 当观察人口不稳定时,以观察人数乘以观察时间(通常为年) 计算的发病率称为发病密度。
(3)标化率、标化死亡比和标化死亡比例比的计算
① 标化率( standardized rate )的计算
由于暴露组与非暴露组(一般人群为对照)经常存在年龄构 成的差别,以至于不能直接比较粗率,而必须用校正年龄 的标化率进行比较
队 列 研 究(Cohort Study)
一 基本概念 将特定人群分为暴露某因素与非暴露 某因素或不同暴露水平的亚组,追踪观察一 定时间,比较两组或各组的发病率或死亡率 以检验该因素与发病有无因果联系及联系 强度。 队列可分为两种固定队列(fixed cohort); 动态队列(dynamic cohort)。
队列研究

第四章队列研究探讨疾病的病因、危险因素及预后因素等是流行病学在医学研究中的重要应用之一。
通过描述性研究,可以初步获得研究对象的各种特征,但此时疾病的影响因素与结局是同时观察的,因此需要采用分析性研究方法加以探讨。
队列研究(cohort study)是分析性研究的重要方法之一,它可以直接观察暴露于不同危险因素或不同特征人群的结局,从而探讨危险因素与疾病发生或结局之间的关系。
第一节概述一、概念队列研究是指将某一特定人群按是否暴露于某可疑因索或按不同竑露水平分为亚组,追踪观察一定的时间,比较两组或各组发病率或死亡书的差异,以检验该因素与某疾病有无因果关联及关联强度大小的一种观察性研究方法。
二、研究目的{一)检验病因假设由于队列研究是由因及果的研究,能确证暴錤与疾病的关系,因此检验病因假设是队列研究的主要目的和用途。
一次队列研究可以只检验一种接露与一种疾病之间的因果关联(如吸烟与肺癌),也可检验一种秘錤与多种结局之间的关联(如可同时检验吸烟与肺癌、心脏病、慢性支气忏炎等的关联)。
* '(二)评价预防效果有些域鋸有预防某结局发生的效应,即具有预防效果。
如大蒜的摄入可预防消化道肿瘤如I?癌的发生,戒烟可减少吸烟者肺癌发生的危险等。
这里的预防措施(如大蒜摄人和戒烟)即暴露因素不是人为给予的,而是研究对象的自发行为。
通过这种人群的“自然实验”(natural experiment)也可以评价某因素的预防效果。
(三)研究疾病自然史临床上只能通过观察单个病人从发病到痊愈或死亡的过程来了解疾病的自然史。
在队列研究开始时,研究前研究对象只是具有某种暴谣而不患有相应的疾病,因此可以观察人群中不同个体缺露于某因素后,疾病逐渐发生、发展,直至结局的全过程,包括亚临床阶段的变化与表现,M时还可以观察到各种自然和社会因素对疾病进程的影响。
队列研究不但可了解个体疾病的自然史,而且可了解疾病在人群中的发生发展过程。
三、研究类型(一)前瞻性队列研究(prospective cohort study)研究对象的确定与分组是根据研究开始时研究对象的暴露状况而定的,研究结局的获得®要随访观察一段时间后才能获得,这是队列研究的基本形式。
队列研究

5、有足够的观察人群并将其分成暴露组与非 暴露组 6、观察人群相对稳定 7、有足够的人力、物力和时间支持长时间的 研究工作 (二)选择历史性队列研究的要点 1-5 同上 6、是否可被利用的医学记录或档案资料
实施
五、研究对象的选择 (一)暴露人群的选择
1、特殊暴露人群 (1)职业人群 (2)特殊暴露人群 2、一般人群 (1)一般社区居民 (2)有组织的团体人群
abcd lnRR的95%CI
ln RR 1.96 Varln RR
反自然对数即为RR95%CI
RR=1: 说明暴露因素与疾病无关联。 RR>1: 说明暴露因素与疾病有“正”关 联,是致病因素。 RR<1: 说明暴露因素与疾病有“负”关 联,是保护因素。
表 RR与关联强度
RR
0.9~1.0
1.0~1.1
0.7~0.8 0.4~0.6 0.1~0.3 <0.1
1.2~1.4 1.5~2.9 3.0~9.9
10~
关联强度 无 弱 中 强
很强
(2)归因危险度 / 特异危险度(Attributable Risk, AR)
AR=暴露组发病率-非暴露组发病率
意义
➢ 暴露与非暴露人群比较,所增加的疾病发 生数量
➢ 根据研究开始时研究者掌握的有关研究对象 在过去某时刻的暴露情况的历史材料分组
➢ 不需要随访,研究开始时结局已出现
优点
➢ 短期内完成资料的收集和分析 ➢ 时间顺序仍是由因到果 ➢ 省时、省力、出结果快
缺点
➢资料积累时未受到研究者的控制,内容上 未必符合要求
➢需要足够完整可靠的过去某段时间有关研 究对象的暴露和结局的历史记录或档案材料
队列研究的优点和局限性
一、优点 (一)适用于常见病。 (二)研究方向由“因”及“果”,资料偏 倚少较可靠。 (三)可以直接获得两队列人群的发病率或 死亡率,及各种疾病危险关联指标,故结果 真实可靠。
队列研究计算统计学效能的方法学

队列研究计算统计学效能的方法学随着大数据时代的到来,计算统计学作为处理大规模数据的一种方法,成为了数据科学领域不可或缺的技能之一。
而在实际应用中,计算统计学的效能往往成为了关注的焦点,而队列研究则是一种常用的方法,用于评估计算统计学的效能。
本文将从方法学的角度,针对队列研究计算统计学效能进行深入探讨。
1. 队列研究的概念和原理队列研究是一种通过模拟系统中任务进入队列、等待队列和完成队列的过程,来评估系统效能的方法。
在计算统计学中,队列研究可以用于评估各种算法和模型在处理大规模数据时的效能表现。
其原理是通过构建队列模型,对任务的到达、处理和完成进行模拟,从而得出系统性能指标,如平均等待时间、平均服务时间等。
2. 队列研究在计算统计学中的应用在计算统计学中,队列研究被广泛应用于评估各种算法和模型的效能。
在数据挖掘领域,可以利用队列研究来评估不同的分类算法在处理大规模数据时的效能表现,从而选择合适的算法进行应用。
在机器学习领域,队列研究也可以用于评估不同的模型在训练和预测过程中的效能表现,为模型选择和优化提供依据。
3. 队列研究计算统计学效能的方法在进行队列研究计算统计学效能评估时,需要注意以下几个方法:(1)确定评估指标:评估计算统计学效能时,需要确定系统性能的评价指标,如平均等待时间、平均服务时间、系统利用率等,以便于对系统进行综合评估。
(2)构建队列模型:根据实际情况构建队列模型,包括任务到达的分布、任务处理时间的分布等。
对于不同的计算统计学问题,可能需要采用不同的队列模型,如M/M/1队列、M/M/c队列等。
(3)进行仿真实验:利用仿真工具或编程语言进行队列模型的仿真实验,模拟任务的到达、处理和完成过程,并记录系统性能指标。
(4)分析结果和优化:对仿真实验结果进行分析,发现性能瓶颈,并对系统进行优化,如调整算法参数、更换算法模型等。
4. 队列研究计算统计学效能的意义队列研究对于评估计算统计学效能具有重要的意义。
病例队列研究

案例三:糖尿病的病例队列研究
总结词
这项研究通过长期跟踪糖尿病患者,评估了糖尿病对心血管疾病、肾脏疾病等并发症的 影响。
详细描述
研究者选取了一组糖尿病患者和一组健康对照者,收集了他们的血糖、血压、血脂等生 理指标以及生活习惯等信息。经过多年随访,发现糖尿病患者发生心血管疾病、肾脏疾 病等并发症的风险较高,而有效的血糖控制和健康的生活方式可以降低并发症的发生风
通过病例队列研究,深入探讨病因的 作用机制,为预防和治疗提供科学依 据。
疾病自然史研究
疾病演变过程
通过长期追踪病例队列,研究疾病的演变过程,了解疾病的发展规律。
疾病预后评估
通过对病例队列的随访,评估疾病的预后情况,为临床治疗和患者管理提供指导。
药物疗效评价
药物效果评估
通过病例队列研究,比较药物治疗组和 对照组的疾病结局,从而评估药物的疗 效。
选择的病例应具有代表性,能够 反映目标人群的特征和分布情况, 以确保研究结果的可靠性。
可及性
确保所选病例能够被研究者所接 触和获取,以便进行后续的调查 和追踪。
分组方法
相似性原则
根据研究目的和研究问题, 将具有相似特征或背景的 病例归为一组,以便进行 比较和分析。
差异性原则
在分组时,应考虑不同组 别之间的差异性,以便更 准确地比较和评估不同组 别之间的差异。
生存曲线
绘制生存时间与时间的关系曲线,直观展示生存 变化趋势。
3
影响因素分析
研究影响生存时间的因素,如治疗方式、疾病分 期等。
Part
05
病例队列研究的优缺点
优点
病因研究的有效工具
病例队列研究能够有效地揭示疾 病与暴露因素之间的因果关系, 为病因研究提供有力证据。
第4章.队列研究(谭红专)

第四章队列研究队列研究(cohort study)是分析流行病学(analytical epidemiology)研究中的重要方法之一,它通过直接观察危险因素暴露状况不同的人群的结局来探讨危险因素与所观察结局的关系。
与之类似的名称还有前瞻性研究(prospective study)、发生率研究(incidence study)、随访研究(follow-up study)及纵向研究(longitudinal study)等。
队列研究与病例对照研究相比,其检验病因假设的效能优于病例对照研究。
因此,队列研究在流行病学病因研究中应用广泛。
第一节概述一、概念队列研究是将人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组,追踪其各自的结局,比较不同亚组之间结局频率的差异,从而判定暴露因子与结局之间有无因果关联及关联大小的一种观察性研究(observational study)方法。
这里观察的结局主要是与暴露因子可能有关的结局。
暴露(exposure)是指研究对象接触过某种待研究的物质(如重金属)、具备某种待研究的特征(如年龄、性别及遗传等)或行为(如吸烟)。
暴露在不同的研究中有不同的含意,暴露可以是有害的,也可以是有益的,但都是需要研究的。
队列(cohort)原意是指古罗马军团中的一个分队,流行病学家加以借用,表示一个特定的研究人群组。
根据特定条件的不同,流行病学中的队列一般有两种情况:一是指特定时期内出生的一组人群,叫出生队列(birth cohort);另一种是泛指具有某种共同暴露或特征的一组人群,一般即称之为队列或暴露队列(exposure cohort),如某个时期进入某工厂工作的一组人群。
根据人群进出队列的时间不同,队列又可分为两种:一种叫固定队列(人群)(fixed cohort),是指人群都在某一固定时间或一个短时期之内进入队列,之后对他们进行随访观察,直至观察期终止,成员没有因为结局事件以外的其他原因退出,也不再加入新的成员,即在观察期内保持队列的相对固定。
第十七章队列研究

p1
OR p0 1 p0 (OR 1)
p ( p1 p0 ) / 2
q 1 p1
因此公式19-1可以简化为:
2 pq(u u )2 n ( p1 p0 )2
例题1:一项探讨大学生父母离异与大学生人格障碍关系的病例对照 研究,已知大学生人群中父母离异者占5%,父母离异与人格障碍的 OR值为6,设假阳性率为5%,检验效能为90%,计算样本含量。 已知:p0 = 0.05, = 0.05, power = 0.9, = 0.1, OR = 6 6 0.05 解:由公式19-2计算p1: p 0.24 1 1 0.05 (6 1)
第二节
设计和实施
三、研究对象的选择 ㈠暴露人群的选择 1.特殊暴露人群:由于特殊原因暴露于某 特殊因素的人群。 2.一般人群:一般人群或有组织的人群团 体中的暴露者。
㈡对照人群的选择
1.内对照:选择某暴露因素在整体中分布不均匀的某人群,按照人群 内部的暴露情况分为暴露组和非暴露组,选择非暴露组为内对照。
㈡率的差异显著性检验 ㈢计算暴露与发病的关联强度
1.相对危险度(relative risk, RR):又称危险比、率比。 RR=Ie/I0 Ie为 暴露组的发病率或死亡率,I0为非暴露 组的发病率或死亡率。 RR说明暴露组发病或死亡是非暴露组的倍数。 其数值的意义为:RR>1,暴露与疾病有正关联;RR>1, 暴露与疾病有负关联;RR=1,暴露与疾病无关联。 RR数值的意义应考虑95%可信限
2.外对照:按照规定的暴露,在某人群中选择一组有暴露的人群作为 暴露组,在另一人群中选择一组与暴露组在年龄、性别、民族、居 住地区等方面相似的非暴露人群作为对照组,称为外对照。
流行病学第四章 队列研究

yes
暴露组
目标人群 代表 未患某研究 性样 疾病
No Yes 非暴露组 No
队列研究的结构模式图
本
固定队列
出现结局 未出现结局
研究开始
研究结束
动态队列
出现结局
失访
研究开始
研究结束
队列研究的特点
属于观察性研究
设立对照组 由因及果
能计算发病率,确证暴露与疾病的因果联系
质量控制
培训调查员
制定相应的规章制度 盲法
资料分析
计算各组的发病或死亡率
对组间率的差异进行统计学显著性检验 对差异有统计学显著性的进一步计算关联强
度
累计发病率:观察人群比较稳定
观察期内发病(或死亡 )人数 CI 观察开始时的人口数
发病密度:观察期间人群人数产生了较大的
直接获得暴露组和非暴露组的发病率或死亡率
直接估计危险度
符合时间顺序,验证病因的能力较强 获得一种暴露与多种结局的关系 收集的资料完整可靠,不存在回忆偏倚 可研究疾病的自然史
不适于发病率很低的疾病的病因研究 易发生失访偏倚 耗时,耗人力、物力、财力
设计要求严密,资料的收集和分析难度较大
队列研究的实施—确定研究结局
结局:指研究者预期的结果事件。是队列研
究观察的自然终点。 结局不仅限于发病、死亡还可以是中间变量。
队列研究的实施—确定研究对象
暴露人群的选择: 职业人群 特殊暴露人群 一般人群 有组织的人群团体 对照人群的选择 内对照 外对照 人群对照 多种对照
职业人群
暴露史比较明确,有关暴露与疾病的历史记
流行病学 第四章 队列研究

南京医科大学公共卫生学院流行病与卫生统计学系 电邮:sujing@
流行病学病因研究的一般过程
描述疾病频 度和分布
描述性研究
三间分布 常规资料 临床信息
形成
检验
→ 假设 → 假设
→ 因果 推断
逻辑推理
(Mill’s 准则)
队列研究 病例对照研究
实验研究
结合各方面因
素进行综合分
二、基本原理
选定一组研究人群,根据过去或目前的暴露情 况进行分组 有无暴露因素:暴露组和非暴露组 暴露因素的水平:低、中、高剂量组
随访观察各组的观察结局(发病或死亡) 比较各组发病率或死亡率的差异,从而判定暴
露因素与发病有无因果关联及关联大小
©by Jing Su
暴
露
组
研
究
对
象
对
照
组
发病 未发病 发病 未发病
研究现场: 江苏省海门市(HCC高发区)
研究人群: 35个镇的1008个村的25-64岁居民 海门市防疫站工作人员入户调查
©by Jing Su
四、确定样本量
决定因素: 1、一般人群(非暴露组的)所研究疾病的发病
或死亡率(P0),P0越接近0.5,样本越小 2、暴露组与对照组人群发病率之差d= P1- P0, 暴露组疾病的发病或死亡率(P1),或相对危 险度(RR)估算P1,d越大,样本越小
注意事项: 一般对照组样本数≥暴露组的样本数 估计失访对数据分析的影响,一般按估计样
本量增加10%作为实际样本量
©by Jing Su
例:乙肝病毒感染与原发性肝细胞癌的队列研究
假设HCC发病率P0=0.003/人年(全国水平)
假设HBV感染者的发病率为未感染者的2.5倍,即
队列研究

2.4 队列研究目的
检验病因假设
( hypothesis)
(包括了探索一种暴露与多种疾病的关系)
研究疾病自然史(
natural history of disease)
前 言 概 述 步 骤 分 析
2.5 队列研究分类
前瞻性队列研究Prospective Cohort Study
前 言 概 述 步 骤 分 析
资料积累时未受到研究者的控制, 资料积累时未受到研究者的控制,内容上未必符合 要求 需要足够完整可靠的过去某段时间有关研究对象的 暴露和结局的历史记录或档案材料
2.5.2 历史性队列研究优缺点
短期内完成资料的收集和分析 时间顺序仍是由因到果 省时、省力ቤተ መጻሕፍቲ ባይዱ出结果快 省时、省力、
队列研究
Cohort Study
河北医科大学公共卫生学院 流行病与卫生统计学教研室 刘建波
前言 Flash
队列研究的主要内容
前言 概述 队列研究的基本步骤 资料整理与分析
1.1 前言 病因研究步骤
前 言 概 述 步 骤 分 析
1.1 前言 病因研究步骤
前 言 概 述 步 骤 分析性研究 分 析
1.3 前言
队列
前 言 概 述 流行病学中队列一词常常用于表述在 步 骤 分 析 一定时期有共同经历或者具有共同状态 的人群组
1.3 前言
队列cohort:
队列
前 言 概 述 步 骤 分 析
1.3 前言
队列
1、队列分类(根据特定条件): 暴露人群
队列 出生队列 birth cohort 暴露队列 exposure population
前 言 概 述 步 骤 分 析
队列研究

第五章队列研究★✧第一节概述⏹队列研究(cohort study)也称前瞻性研究prospective study,随访研究follow-up study,纵向研究longitudinal study等。
暴露结局(疾病)一、基本概念⏹队列研究的重要概念⏹队列cohort⏹暴露exposure⏹危险因素risk factor⏹保护因素protective factor1、队列的概念:拥有同一属性的某一组人。
a)2013年南京市常住人口b)2010年到2014年南医大注册的所有学生c)出生队列birth cohort:出生于同一时期的人组成的特殊队列1)队列可以是流动(有人员出入)的,也可以是固定的(相对固定,没有人员流动,成员不可以同时是非成员)2、暴露的概念:研究对象接触过的某种待研究的物质,或具有某种待研究的特征或行为。
(理解)物质:病原体、毒物。
特征:年龄、性别、血压、血糖。
行为:吸烟、饮酒、工作类型。
二、基本原理⏹选定一组研究人群,根据过去或目前的暴露情况进行分组☐有无暴露因素:暴露组和非暴露组☐暴露因素的水平:低、中、高剂量组⏹随访观察各组的观察结局(发病或死亡)⏹比较各组发病率或死亡率的差异,从而判定暴露因素与发病有无因果关联及关联大小队列研究的特点:1susceptible population)需设立纳入及排除标准⏹剔除已生病个体或明确不会生病的个体⏹在进行传染病危险因素的研究时,需考虑个体被感染的几率2、属于观察性研究,根据暴露的自然存在状态分组,无人为控制,也不存在随机分组3、时间顺序:从“因”到“果”,可确定因果关系(疾病发生之前已经确定了研究对象的暴露情况)4、前瞻性研究,可计算发病率、死亡率等率的指标三、队列研究的用途⏹⏹评价预防效果⏹研究疾病的自然史⏹新药的上市后监测四、队列研究的类型1、前瞻性队列prospective cohort也称即时性或同步性(concurrent) 队列开始研究时确定对象、分组,经随访得到结局优点:资料准确缺点:样本大,花费大,时间长建立队列时要特别考虑能否负担得起,能否获得想要的结果!2、回顾性队列retrospective cohort也称历史性(historical) 或非即时性(non-concurrent) 队列研究开始时疾病结局已发生,研究对象是过去进入队列的,分组依据的是过去的暴露资料 优点:省人、物、时缺点:依赖历史资料的完整与可靠,常缺乏混杂因素的资料3、双向性队列ambispective cohort历史队列后继续进行前瞻性队列最适合于对人体健康同时具有短期和远期效应的暴露因素研究✧第二节研究设计与实施一、确定研究因素队列研究最主要的目的:进一步验证现况调查或病例对照研究中已发现的有特异影响、且在统计学上有联系的危险(或保护)因素。
流行病研究方法—队列研究(流行病学课件)

三、混杂偏倚及其控制
混杂是指所研究因素与结果的联系被其它外部因素所混淆,这 个外部因素就叫混杂变量.它是疾病的一个危险因子,又与所研究的 因素有联系,它在暴露组与对照组的分布是不均衡的。
混杂偏倚
产生原因
暴露组和对照组在一些影响研究结果的主要特征(混 杂因素)分布不一致
控制方法
设计阶段:限制研究对象,匹配; 分析阶段:标准化率分析、分层分析、多因素分析。
五、资料收集与随访
基线资料的收集
基线资料一般包括:人口学资料及可能的混杂因素信息、暴露因素 信息、结局指标信息等。
五、资料收集与随访
资料的收集方法
随访
五、资料收集与随访
质量控制
六、质量控制
质量控制
1. 调查员的选择 2. 制定调查手册 3. 调查员培训 4. 监督与检查
第四章 队列研究
三、确定研究现场与研究人群
研究人群
1. 从目标人群中抽出具有代表性的人 2. 未患所研究疾病 3. 分为暴露人群和非暴露人群
暴露人群选择
1. 职业人群 2. 特殊暴露人群 3. 一般人群 4. 有组织的人群团体
非暴露人群选择
1. 内对照:一群研究对象内部既包含了暴露组,又包含对照组 2. 外对照:一群研究对象外部寻找对照组 3. 总人口对照:整个地区现成的发病或死亡资料 4. 多重对照:两种或以上的对照形式
信息偏倚
产生原因
1. 疾病、暴露标准不明确 2. 检验仪器不精确、检验技术不熟练、询问技巧不佳等 3. 对暴露组和对照组成员随访方法不一致
控制方法
1. 提高临床诊断技术、明确各项标准并严格执行 2. 选择精确稳定的测量方法、调准仪器、严格实验操作规程 3. 培训调查员,提高调查技巧并统一标准
二十章队列研究cohortstudy

队列研究资料整理表
病例
对照
合计
a c a+c=m1
b d b+d=m0
a+b=n1 c+d=n0 a+b+c+d=T
发病率 a/n1 c/n0
相对危险度(Relative Risk,RR)又称危险比
暴露组的发病率 Ie=a/n1 非暴露组的发病率 I0=c/n0 相对危险度 RR=Ie/I0=(a/n1)/(c/n0)
1973.12.01(死亡)
12.06 人年
1981.01.01(观察结束时健在) 10.92 人年
以上累计总人年为11.15+12.06+10.92=34.13人年, 发病密度(死亡率)为1/34.13=29.3‰
(二)率的差异显著性检验(参阅统计学书) (三)计算暴露欲发病的关联强度
组别 暴露组 非暴露组 合计
能影响人群发病率变动、疾病结局的研究因素。
队列——其一泛指暴露于某事物或因素、具有共
同特征的一群人,即研究中通常所称的队列。其二 是指特定时间内出生并按此出生时期确定的一组人, 称为出生队列。
三、队列研究的种类
四、队列研究的用途
① 检验病因假设 ② 描述疾病的自然史 ③ 评价自发的预防效果
第二节 设计和实施
1、收集人口学资料 2、查阅记录和档案 3、询问调查研究对象或知情人 4、医学检查或检验以收集客观资料 5、收集环境资料
(二)随访
1、观察终点和终止时间 2、随访追踪的人群团体
收集基线资料
基线资料一般包括待研究的暴露因素的暴露状况,疾 病与健康状况,年龄、性别、职业、文化、婚姻等个 人状况,家庭环境、个人生活习惯及家族疾病史等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
队列研究的人时如何定义?
临床常见 ▪ 入队列时间:病人首次入院时间/手术时间/首次药物治疗时间/确诊时间 ▪ 出队列时间:研究结束时间/末次随访时间/发生关注终点时间
① 研究结束时间——采集队列信息时间 ② 末次随访——每个受试者最末次随访到的时间 ③ 发生关注终点时间——死亡/复发/恶化/新发疾病时间,等等.
c
d
合计
a+c=m1
b+d=m0
合计 a+b=n1 c+d=n0 a+b+c+d=t
暴露组发病率=a/n1 非暴露组发病率=c/n0
报告时必须注明时间长短
队列研究评价
表2 队列研究资料归纳整理表(发病密度)
暴露组
非暴露组
合计
病例数
A1
A0
M
人年数
T1
T0
T
暴露组发病率= A1 / T1 非暴露组发病率= A0 / T 0
历的时间 o 在动物实验研究中,从开始给药到发生死亡所经历的时
间
生存时间不仅是活着的时间 可以是任意两件事件之间的时间间隔!
得结果可能与真实值存在较大偏差
生存分析
生存时间 (survival time): 从某起始事件到某终止事件所经历的时间跨度称为生存时间
o 在临床研究中,急性白血病患者从骨髓移植治疗开始到 复发为止之间的时间间隔
o 冠心病患者在两次发作之间的时间间隔 o 在流行病学研究中,从开始接触某危险因素到发病所经
HR与RR的区别
▪ 两者均用于前瞻性研究,多数认为HR与RR意思一样,但HR还考虑了时间因素, 换言之,包含了时间效应的RR就是HR;
▪ 从终点时间的角度来看,也可以这样理解,RR考虑了终点事件的差异,而HR不 仅考虑了终点事件的有无,还考虑了到达终点所用的时间及截尾数据
样本量计算
队列研究—样本量计算公式(定量指标)
▪ HR主要通过COX回归分析得出,其计算较为复杂,需要用 软件计算
OR,RR,HR的区别
OR与RR的区别
▪ 从公式即可看出,OR或RR值越大,表明暴露的效应越大,暴露与结局关联的强 度也就越大。两者均为比值,因此以1为界限
▪ RR的计算需要使用发病率,因此队列研究、随机对照试验等前瞻性研究均可使用 RR;但回顾性研究(如病例-对照研究),是根据研究对象状态分组,无法直接 计算发病率,只能使用OR
队列研究数据(人时的计算)
当队列内对象的动态变化较大时,以人数为基数计算 发病率就显得不尽合理。此时,应考虑每个观察对象的观 察时间,以人时的方式来表示对象的观察时间
常用的人时单位包括人年,人月和人日等 总人时=所有观察对象的观察时间
如100人观察10年等于1000人年;1000人观察1年、 或500人观察2年也等于1000人年
▪ 未被注意的基线偏差造 成研究结果很难被评价 或掌控
▪ 需要更多的患者和更长 的随访时间
队列研究模式
前瞻性、观察法、设立对照 、由因到果、符合 时间顺序、能确证暴露和结局的因果关系
队列研究类型
队列研究类型
队列研究-方案设计
1、明确PICO问题
P-人群/患者
I-干预/暴露
C-比较/对照
O-结局
队列研究——样本量计算公式(定性指标)
样本量计算
如果研究涉及随访,必须考虑失访率!
Lost to Follow-up Rate!
注册研究强调连续入选病例,故实际 样本量会远远大于计算出来的样本量!
统计分析
队列研究常见统计方法
▪ 连续变量 正态分布且方差齐——t检验(两组比较);方差检验
(两组及以上比较); 非参数检验;多元线性回归等
队列研究方法及统计学考虑
注册研究特殊之处在于:有特定疾病或治疗的患者在医院就
诊均需纳入登记,强调连续入选病例,获得真实世界数据。
队列研究的必要性
随机对照研究 (RCT)
▪ 严格的入组/排除标准 ▪ 缺乏长期随访 ▪ 通常难以反映各年龄段、各
阶层患者情况, ▪ 伦理问题 ▪ 费用巨大
队列研究
▪ 缺乏随机分组导致组间 存在基线情况的偏差
▪ 分类变量(不含时间) 卡方检验(OR/RR值);logistic回归(OR值)等
▪ 分类变量(含时间)——生存分析 Cox比例风险模型(HR值)等
如何处理组间不均衡
▪ 建立模型后把不均衡的组间变量放入模 型作为混杂因素进行模型校正
▪ 倾向性评分(propensity score matching) ▪ 巢式病例对照研究(nested case-control
study)
倾向性评分
▪ 应用条件 1) 需要匹配的变量很多,配对通常不可行; 2) 实验组与对照组人数相差甚远(>4:1) ; 3) 混杂因素多,分层分析不可行; 4) 受样本量限制,可能多因素回归可能过度拟合
▪ 目的 将多个变量(多维)转化为一个中间变量(一维)
▪ 倾向值(propensity score) 是在控制其他混杂因素的条件下,个体接 受干预的概率
相对危险度 (relative risk, RR)
相对危险度说明暴露于某可疑危险因素后,暴露组 发生所研究疾病结局的危险性是非暴露组的倍数
RR越大,暴露的效应越大,暴露与结局关联的强度越大 RR>1,危险因素; RR=1,无关联; RR<1,保护因素
风险比值比(Hazard ratio,HR)
▪ 又叫风险函数比,是生存分析资料中用于估计因为某种因素 的存在而使死亡/缓解/复发等风险改变的倍数。其计算公式 为: HR=暴露组的风险函数h1(t)/非暴露组的风险函数h0(t) t指在相同的时间点上
▪ 分析策略 匹配、分层、多因素调整
倾向性评分
治疗组 对照组
最终分析
.00 .10 .20 .30 .40 .50 .60 .70 .80 .90 1.00
缺陷: ▪ 只能尽量减少混杂因素产生的影响,不能完全消除 ▪ 只能平衡和控制可观测的混杂因素 ▪ 当有重要的混杂因素缺失或不可观测时,采用倾向值分析所
2、 明确入选排除标准——准确、客观、可行、易操作 3、 暴露(水平,时间,方式,持续时间等)和结局(客观)应明确 4、 样本量——满足最低样本量的基础上,尽量大的样本量 5、 随访期应保证能发现足够数量的结局
评价指标
队列研究评价
表1 队列研究资料归纳整理表(累积发病率)
病例
非病例
暴露组
a
b
非暴露组