17 队列研究的设计与分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十七章队列研究的设计与分析
[教学要求]
了解:队列研究的设计及需注意的问题;队列研究的样本含量估计。熟悉:熟悉相对危险度的假设检验方法;M-H分层分析方法及其趋势检验方法; 熟悉暴露人年的计算。
掌握:掌握相对危险度和归因危险度的意义、计算及置信区间的估计方法;掌握人时发病率、发病概率和累计发病概率的意义、区别与估计方法。
[重点难点]
第一节队列研究的基本概念
一、基本概念
队列研究是对不同暴露水平的对象进行追踪观察,确定其疾病发生情况, 从而分析暴露因素与疾病发生之间的因果联系。
相对危险度是暴露人群发病率与非暴露人群发病率的比值,表示暴露于某危险因素的人群中,发病风险是非暴露人群发病风险的多少倍,它反映了危险因素对疾病发生风险的作用程度。
归因危险度表示暴露于某危险因素的人群中发病风险与非暴露人群发病风险相比较的绝对差值,反映暴露危险因素造成发病增加的绝对量。
二、队列研究有以下几种类型:
1.前瞻性队列研究
2.历史前瞻性队列研究
3.临床病例的随访研究
三、计算 相对危险度:0
1
P P RR =
∧
归因危险度: 01P P AR −=∧
四、应用
相对危险度主要具有流行病学和病因学方面的意义,说明暴露因素与疾病发生的病因关联。
归因危险度具有更多的疾病控制和公共卫生方面的意义,它提示如果疾病控制部门消除了该危险因素,发病率下降的比率会是多少。 五、队列研究设计的注意问题: 1.暴露人群的选择 2.对照人群的选择 3.终结指标的选择 4.样本含量的估计 第二节
疾病发生指标的估计
一、基本概念
暴露人年:随访1个研究对象满1年则为1个暴露人年,是估计发病率基数的计量单位。
人时发病率又称发病密度,是在计算出暴露人年的基础上,采用暴露人年作分母,用发病人数作分子计算出来的发病频率指标。
发病概率反映研究对象在随访期间发病可能性的大小,用随访期内发病的频率来近似估计。
累积发病概率与发病概率的意义相同,只是估计方法是将随访期分成若干的时间区间,先估计各时间区间的发病概率,再估计整个随访期间的发病概率。
二、计算
设发病数为d ,暴露人年数为N ,人时发病率为N
d
P =
。 设随访期间新发病数为d ,随访队列总人数为N ,发病概率为
N
d q =
, 当随访期间有删失,设删失数为c , 则发病概率为
)
2
(0c N d q −=
。
累积发病概率的各区间发病概率的计算与上相同,整个随访期间累积发病概率为
∏=−−
=k
i i
k q Q 0
)1(1三、应用
发病概率适用于随访人口比较稳定,观察时间较短,失访人数极少的情况。
人时发病率与累积发病概率适用于随访时间较长,随访人群有变动,观察对象有进有出,有的中途失访等情况。
第三节 暴露队列与非暴露队列的比较 一、基本概念
混杂因素指与暴露因素和疾病均关联的非研究因素。
分层分析指将研究对象按某混杂因素的水平分层,按各层四格表分别估计预期死亡数,再汇总估计总的相对危险度和进行假设检验,这样排除混杂因素对估计结果的干扰。
剂量-反应关系指随着暴露水平的增加,发病风险也随之增加的相互关系。
二、计算
相对危险度的假设检验可以用前面章节介绍的四格表χ2检验,统计量为
2
012
112
/)5.0|/(|N D N N N D N d −−=
χ
相对危险度的的95%置信区间使用Miettinen 法,
2
/
96.11%95χ±∧
=a RR RR 置信区间的
在M-H 分层分析中,预期死亡数为 i
i
i i N N d E 11= 预期死亡数方差为 2
011i
i
i i i N N N d V =
分层校正后的相对危险度计算公式为
i
i i i i i a N N d N N d RR //1001ΣΣ=
∧
M-H 分层χ2检验的公式为
i
i i V E d 12
112
)(ΣΣ−Σ=
χ
剂量-反应关系分析中的趋势检验计算公式为
]
)()[())(1(22
222i i i i i i i i x n x n N D N D x n N D
x d N N Σ−Σ−Σ−
Σ−=χ
三、应用
队列研究资料的分析步骤:
1. 根据随访资料计算不同特征人群的暴露人年数,如按性别、年龄和随访年代计算暴露人年;
2. 在暴露人年的基础上,估计疾病发生频率,如人时发病率、发病概率或累积发病概率;
3. 根据研究目的分别计算相对危险度和归因危险度;
4. 对相对危险度做假设检验;
5. 估计相对危险度的置信区间;
6. 在有需要的情况下,按混杂因素水平做分层分析,校正混杂因素影响;
7. 对有序多分类变量做趋势检验。
[案例讨论参考答案]
案例17-1 该案例是全国11个省市调查所得的资料,由于各省市调查过程和人群的差异,必然会对分析结果产生影响,因此必须先对各
省市的资料分别进行分析,并对分析结果做比较,如果各省市间结果没有显著性差异,才能考虑作合并分析。
在分析血压与冠心病和脑卒中的关系时,年龄是可能的混杂因素,因为从医学知识可知,年龄越大,血压越高,特别是收缩压; 同时年龄越大,冠心病和脑卒中的发病风险越高。即年龄与危险因素和疾病均有关联,符合混杂因素的定义。因此需要考虑用分层分析方法在控制年龄干扰后估计血压与疾病的关联。估计校正年龄因素后,收缩压与冠心病关系更密切的结论会有改变。
为进一步论证血压与两种疾病的因果联系时,剂量-反应关系的检验是重要的内容,可以通过血压与疾病发生的趋势检验来检验这关系。
[电脑实验程序及结果解释]
实验17-1队列研究资料的分层分析实验。
程序17-1 队列研究资料的分层分析程序及说明
行号程序说明
01 DATA smoking; 建立SAS数据集;
02 INPUT age sm id no @@; 定义变量并读入数据;
03 CARDS; 定义数据块开始;
04 1 0 0 11266 1 1 0 23100 1 1 1 2
05 2 0 0 1907 2 1 0 6331 2 1 1 2
06 3 0 0 1078 3 1 0 5194 3 1 1 7
07 4 0 0 855 4 0 1 1 4 1 0 3939 4 1 1 11
08 ; 数据块结束;
09 PROC FREQ; 调用FREQ过程;
10 TABLE age*sm*id/NOCOL NOPERCENT CMH;定义表格及输出统计量;
11 WEIGHT no; 指定权重变量;
12 RUN; 运行程序;
运行结果:
Output窗口:
The FREQ Procedure
Table 1 of sm by id Table 2 of sm by id