队列研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
暴露 组率
Ie a n1 RR I0 c n0
意义
非暴露 组率
E发病或死亡的危险是Ē的多少倍 RR值 ,暴露的效应 暴露与结局关联强度
实例
乙肝病毒感染与PHCC关系的队列研究结果
暴露组
累积发病率 发病密度
非暴露组
RR
14.75 15.63
75.25‰ 7.749 ‰
5.10‰ 0.4959‰
结局的关系。
危险因素(risk factor)泛指能引起某特定不良
结局(outcome),或使其发生的概率增加的因 子,包括个人行为、生活方式、环境和遗传等多 方面的因素。危险因素的反面称为保护因素 (protective factor).
结局 暴露
Y
E
目标人群
代表性 样本 N
Ē
时间顺序
Y
N
过去
发病、死亡、健康状况和生命质量
终极结果(发病)或中间结局(血清变化)
正面(生命延长)和负面(发病)
定性或定量
可多个或多方面(实例的结局是PHCC死亡 )
一次研究可有多个结局
慢性 支气 管炎 吸烟
吸烟
肺癌
冠心 病
结局的测量
采用国际或国内通用的标准
确定研究现场与研究人群
研究现场 有足够符合条件的研究对象 领导重视、群众支持 医疗条件较好,交通较便利 发病率较高
优 点
时间顺序增强了病因推断的可信度
直接获得暴露与结局资料,结果可信
能获得发病率
缺 点
所需样本量大,花费大,时间长 影响可行性
前瞻性队列研究应用条件
有明确的检验假设 所研究疾病的发生率较高,一般不低于5‰ 明确规定暴露因素和结局变量 有可靠的测量手段 足够的观察人群和暴露情况 能完成随访的人群
资料的收集与随访
基线资料 随 访 资料收集方法
基线(baseline)资料
暴露的资料
个体的其他信息
实例对研究对象的基线资料的收集包括:血
清HBsAg,同时还收集了肝炎史、PHCC家族史、
职业、吸烟、饮茶、饮酒、水源类型、主食
类型等其他可疑危险因素及年龄、性别等人
口学特征资料。
随访(follow up)
AR RR × I 0 I 0 I 0 RR 1
意义
E与Ē 人群比较,所增加的疾病发生数量 AR值 暴露因素消除后所减少的疾病数量
RR与AR的区别 疾病 肺癌 心血管疾病 吸烟者 非吸烟者 RR
(1/10万人年)
AR
50.12
296.75
4.69 170.32
10.7 1.7
产生原因
选择对象的方法不当
最初选定参加研究的对象中有人拒绝参加
历史性队列研究中部分档案丢失或记录不全 志愿者队列 研究开始时未能发现早期病人等
控 制
预防为主,抽样方法正确,严格按规定标 准选择对象,提高研究对象的应答率和依从性
失访偏倚(lost to follow-up)
研究对象因迁移、外出、死于非终点疾病或拒绝继续 参加观察而退出队列所引起的偏倚。 本质上属于选择性偏倚
a(1079)
c(387) a+c=m1
非暴露组发病率=c/n0=75.25‰ 暴露组发病率=a/n1=5.10‰
表4-2
队列研究资料归纳整理表(人时资料) 暴露组 非暴露组 合计
病例数 人年数
A1 (1079)
A0(387)
M T
T1 (139238.27) T 0(780562.01)
暴露组发病率= A1 / T1=774.93 非暴露组发病率= A0 / T 0=49.58
控 制
设计 选择便于随访的人群 在计算的研究样本的基础上扩大10% 实施 加强对随访员的管理 制定随访计划和监测措施 整理资料
对失访对象进行补查
比较失访者和急需观察者的基本特征差异, 以评估失访可能造成的影响
第五节 优点与局限性 优点
直接获得暴露组和非暴露组的发病率或死亡率
有代表性
实例的研究现场是江苏省海门市
研究人群
从目标人群中抽出的具有代表性的人 未患所研究疾病 分为暴露组和对照组
暴露人群选择
职业人群
特殊暴露人群 一般人群 有组织的人群团体
对照人群的选择
内对照(internal control) : 一群研究对象内部
外对照(external control) : 一群研究对象外部
随访对象、内容和方法 随访间隔 随访者
观察终点(研究对象出现了预期的结果)
观察终止时间(整个研究工作截止的时间)
实例是从1993年起到2003年止每年随访一次,观察终点 是PHCC死亡
资料收集方式
查阅纪录 调查询问 健康或疾病检查 环境监测等
质量控制
调查员的选择
RR
1.00 1.81 3.39
AR
0.0000 0.0285 0.0851
结果 血清胆固醇水平 患冠心病的RR 说明存在剂量效应关系
第四节 常见偏倚及其控制
选择偏倚
失访偏倚
信息偏倚 混杂偏倚
选择偏倚(selection bias)
研究人群在一些重要因素方面与一般人群或待研究的 总体人群存在差异,而导致研究结果的偏倚。
1 1 11 a b c d
ln RR的95%CI ln RR ±1 . 96 Var
ln RR
反自然对数即为RR 95%CI,实例算出的危险度比(RR) 的95%可信区间是:13.12~16.60
归因危险度 (attributable risk, AR )
即暴露组发病率(危险度)与对照组发病率(危险度) 相差的绝对值 a c AR I e I 0 或 n1 n0
2
p1:暴露组预期发病率 p0:对照组预期发病率
p : 两个发病率的平均值
实例
已知 p0=0.003,RR=2.5,α=0.05,β=0.1
计算样本量
根据上述条件
zα=1.96, zβ=1.282 ,q0=0.997 p1=p0×RR=0.0075,q1=0.9925 代入公式得 n=5420 即HBsAg阳性组与阴性组各需5420人
影响样本量的因素
对照人群中所研究疾病的发病率p0 暴露组与对照组人群发病率之差p1-p0 第一类错误α值 把握度(power) 1-β
样本量的计算:
查表 公式计算(条件 暴露组和对照组样本含量相等)
z 2 pq z p q p q 0 0 1 1 n 2 p1 p 0
发病密度 (incidence density) ID =
观察期内发病(或死亡)人数 观察人时 0~∞ 观察时间长
变化范围 适用条件
人口不稳定
存在失访 资料不很整齐
标化死亡比 (standardized mortality ratio, SMR)
研究人群中的观察死亡数 SMR 以标准人口死亡率计算的预期死亡数
意义
乙肝病毒感染者发生PHCC的危险是非乙肝病毒感染者 的14.75倍
RR与关联强度
RR
关联强度
0.9~1.0
0.7~0.8 0.4~0.6 0.1~0.3 <0.1
1.0~1.1
1.2~1.4 1.5~2.9 3.0~9.9 10~
无 弱 中 强 很强
RR 95%CI
Woolf法
Var
ln RR
现在
将来
历史性队列
回顾性收集已有的历史资料 继续前瞻性收集资料
双向性队列
前瞻性队列
前瞻性收集资料
时间顺序
前瞻性队列研究 (prospective cohort study)
研究队列的确定是现在(concurrent) 根据研究对象现在的暴露分组
需要随访(follow up)
结局在将来某时刻出现
因素的测量:
需测量暴露的水平,暴露的时间,及暴露的
方式。暴露的测量应采用敏感、精确、简单和
可靠的方法。
性质:定性(quality),定量(quantity) 方法:访谈,实验室检查,查阅记录
确定研究结局
结局是研究队列中预期结果事件,是队列研的自然 终点(natural end)。研究结局的确定应全面、具体、 客观。可包括:
调查员培训 制定调查员手册
监督
第三节 资料的整理与分析
基本整理模式 人时的计算 率的计算
效应的估计
基本整理模式
表4-1 队列研究资料归纳整理表(累积发病率资料)
病例 暴露组 非暴露组 合计 非病例 b(13259) d(75511) b+d=m0 合计 a+b=n1 c+d=n0 a+b+c+d=t
40~59岁男子按基线血清胆固醇分组的冠心病6年发生情况
病例数 16 29 51 96 危险度 0.0352 0.0637 0.1203 0.0720 平均年发病率 0.0059 0.0106 0.0200 0.0120
血清胆固醇(mg/dl) 人数 <210 210~ >245 合计 454 455 424 1333
人时的计算
精确法:逐人逐天计算
近似法:按年平均人口数计算
寿命表法:当年内进入或退出队列的 个人均作1/2人年计算
累积发病率 (cumulative incidence) CI=
观察期内发病(或死亡)人数 观察开始时的人口数
变化范围 0~1 适用条件 样本大 人口稳定 整齐的资料 报告时必须注明时间长短
足够的人、财、物力
双向性队列研究 ambispective cohort study
研究队列的确定是过去 根据研究对象过去某时刻的暴露情况分组
需要随访
部分结局可能已出现
优点:是将前瞻性队列研究与历史性队列研究结 合起来的一种设计模式,因此兼有上述二类的优 点 。 应用:当基本具备进行历史性队列研究的条件下, 如果从暴露到现在的观察时间还不能满足研究的 要求(人时不够,未满足效应期),还需继续前 瞻性观察一段时间时,则选用双向性队列研究。
病因和危险因素研究是流行病学研究的重要任 务,病因研究的逻辑顺序应该是先有病因存在, 然后有疾病发生,即先因后果。 如何研究,如何证实????
队列研究!
一、基本概念
队列研究(cohort study)是分析流行病学研究 中两大重要方法之一。它通过直接观察暴露于某 因素不同状况人群的结局来探讨该因素与所观察
பைடு நூலகம்
效应的估计
相对危险度 归因危险度 归因危险度百分比 人群归因危险度 人群归因危险度百分比 剂量-反应关系
相对危险度(relative risk, RR )
通常包括了危险度比(risk ratio)或率比(rate ratio, RR)。 即暴露组的危险度(累积发病率)或发病密度与对照组的危险度 或发病密度之比。
直接估计危险度
符合时间顺序,验证病因的能力较强 获得一种暴露与多种结局的关系 收集的资料完整可靠,不存在回忆偏倚 可研究疾病的自然史
局限性
不适于发病率很低的疾病的病因研究 易发生失访偏倚
二、研究设计与实施
确定研究因素
确定研究结局 确定研究现场与研究人群 确定样本量 资料的收集与随访 质量控制
(以一项乙肝病毒(HBV)感染与原发性肝细胞癌 (PHCC)的队列研究为例,以下简称实例)
确定研究因素
主要暴露因素:在描述性研究和病例对照研究的基础上确定。 可能影响结局的因素:混杂因素及人口学特征等。 实例中确定的研究因素是乙肝病毒感染,以HBsAg阳性作为乙肝 病毒感染指标。
45.43 126.43
意义
RR 吸烟对肺癌的病因学意义较大 AR 戒烟对心血管疾病的预防作用较大 即公共卫生意义较大
剂量-反应关系
分析方法
列出不同暴露水平下的发病率 以最低暴露水平组为对照,计算各暴露水平的 RR 和危险度差(RD) 必要时,应对率的变化作率的趋势性检验
表4-3
总人口对照(total population control): 整个地区 现成的发病或死亡统计资料 多重对照(multiple controls) :两种或以上的对照 形式
实例是从一般人群中选择研究对象,采用内对照
确定样本量
计算样本量时需考虑的问题
抽样方法
暴露组与对照组的比例
失访率
变化范围 适用条件 0~∞ 结局事件的发生率低 样本小,不宜直接计算率时
SMR的意义
被研究人群死于(发生)某病的危险性是标准人 群的多少倍
SMR=1
研究人群某病死亡(发病)危险=标准人群 SMR>1 研究人群某病死亡(发病)危险>标准人 群,是标 准人群的SMR倍 SMR<1 研究人群某病死亡(发病)危险<标准人群