第九讲-分层分析(XDL)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
各层的效应大小是否一致,其变异是随 机误差造成的还是固有的。它是分层分 析所面临的首要任务。同质性检验的假 设是效应大小U在各层是同质的,同质性 检验一般采用Wald卡方检验的方法。
2021/4/9
25
同质性检验(2)
(一)基本形式
1)对于差的测量:其基本形式是:
2 wald
uˆi uˆ 2 / vˆi
2021/4/9
20
概述-分层分析的基本步骤(4)
4、调整控制混杂:如果同质性检验结果证
明,层别效应是一致的,分层分析则以调整控制 混杂为主。其计算主要包括一致效应的合并点估 计,一致效应的区间估计及一致效应的P值。
5、评价和描述效应测量修饰:如果同
质性检验的结果证明层间效应估计值的差异有统 计学显著性时,则认为该变量具有效应测量修饰 作用。此时,分层分析的目标指向效应测量修饰 的评价与描述
2021/4/9
6
概述-混杂与效应测量修饰(3)
表 19-1 职业接触粉尘与慢性呼吸道疾病的关系
层 1 吸烟 接触粉尘 不接触
层 2 不吸烟 接触粉尘 不接触
合计(粗) 接触粉尘 不接触
发病人数
650
850
未发病人数 350 3150
总观察人年数 1000 4000
发病率(R) 0.650
0.213
2021/4/9
4
概述-混杂与效应测量修饰(1)
混杂:在研究某疾病与某因子的关系时,
由于一个或多个既与疾病有制约关系,又 与暴露因子密切相关的第三变量的影响, 掩盖或夸大了所研究的暴露因子与疾病的 联系。这种作用就称为混杂,这些第三变 量就称为混杂因子。
效应测量修饰:是指某种效应测量值的
大小随某个第三变量(暴露和发病以外)
分析方法:直接合并法 最大似然法 M-H法
3)对累积发生率差(cumulative incidence difference, CID)的资料:
4)对累积发生率比(cumulative incidence ratio, CIR)的资料:
5)对病例对照或现患率的资料:
2021/4/9
27
3、点值估计(1)
点值估计一般是应用层别效应估计值进行加权平均,从分层资料 中导出一个效应的总估计值。各层的权重大小与各层别估计值的 方差成反比。据此导出总效应点值估计的一般公式:
暴露
非暴露
合计
病例
A1i
A0i
M1i
人时
T1i
T0i
Ti
2021/4/9
22
资料整理(2)
2、分层纯计数资料(stratified pure count data)的归纳整理: 一般的纯计数资料包括累积发病率资料,病例对照研究 资料等。该类资料一般可整理为表 19-3:
表 19-3 分层纯计数资料的归纳整理表(i 层)
19
概述-分层分析的基本步骤(3)
3、层别效应的一致性假设与检验:
绝大多数的分层分析方法是以各层效应大小一 致(即同质的)为基础的。
层别效应一致性的假设检验即为同质性检验, 它是先要在同质性假设条件下,求出一个一致 效应的总的估计值,然后与各层别估计值比较。
由于比值测量的一致性通常意味着差值测量 的异质性,因此,对比值和差异测量的一致性 需要单独评价。
Wi i层的效应估计值
总效应点值估计 i
Wi
i
这里的 Wi=1/(i 层的效应估计值的方差)。根据上述一般公式,总效 应点值估计有直接合并法,最大似然法和 M—H 法三种。根据资料 类型,样本大小,要求精度及效应测量指标的不同,可选择不同的 方法进行合并,并有不同的公式。
2021/4/9
28
分析方法的选择
i
式中 uˆi 是 i 层的层别效应估计值, uˆ 是总的合并估计值, vˆi 是 i 层的估计
方差。关于 uˆi 和 uˆ 的计算依据样本量和要求精度的不同,可应用直接加
权合并法,M—H 法或最大似然法。
2)对于比的测量:其公式应变为:
2 wald
ln uˆi ln uˆ2 /Var [lnuˆi ]
i
2021/4/9
26
同质性检验(3)
(二)以最大似然法为基础的同质性检验
如果合并的效应估计值需用最大似然法进行计算时,同质性检验可根据
资料类型和效应指标的不同选择下述改良公式。
1)对人时资料发生率差(incidence rate difference, IRD)的资料:
2)对人时资料发生率比(incidence rate ratio, IRR)的资料:
另一方面,当一部分混杂因子被控制后, 另一些混杂因子的作用则可能变小而可 被忽视。因此,我们无需对每个重要的 混杂因子都进行控制 。
2021/4/9
13
概Байду номын сангаас-选择混杂因子(3)
向前选择(forward selection)的策略选 择需要控制的混杂因子。一般先从最简 单的可接受的分层(如按性别)开始进 行暴露效应估计,然后根据混杂因子作 用的大小,将作用较大的混杂因子一个 一个地增加到分层变量中。当控制变量 的增加对总的效应估计值不再有重要意 义时,这种选择过程即停止。
2021/4/9
15
概述-选择混杂因子(5)
当所有的或大多数的混杂因子都通过分层进行 调整时,由于样本变小,此时以近似统计学为 基础的分层分析方法都将导致很大偏倚的最终 结果。这种偏倚的特征是效应估计值开始越来 越远离无效假设。
控制或减少这种偏倚的方法主要有:①采用向 前选择的策略;②确定选择混杂因子的临界点 时,考虑使用可信区间;③应用精确法代替近 似法计算效应估计值及其可信限。
暴露
病例
A1i
非病例
B1i
合计
N1i
非暴露 A0i B0i N0i
合计 M1i M0i Ni
2021/4/9
23
资料整理(3)
3、分层病例队列资料(stratified case-cohort data)的归纳整理: 病例队列资料因其对照组是一个既含有病例亦含有非病例 的完整队列,故其资料整理有独特之处(表 19-4)。
表 19-4 分层病例队列资料的归纳整理表(i 层)
非对照组的病例 对照组的病例 对照组的非病例 合计
暴露
A11i A10i B1i N1i
非暴露
A01i A00i B0i N0i
合计
M11i M10i M0i Ni
2021/4/9
24
2、同质性检验(1)
同质性检验(testing homogeneity)即检验
概念:分层分析是将资料按某个(些) 需要控制的变量的不同分类进行分层, 然后再估计某暴露因子与某疾病之间的 关系的一种资料分析方法。
2021/4/9
3
概述-分层分析的用途
估计和控制混杂因子; 评估和描述效应测量修饰; 描述随访研究中的失访问题和竞争风
险; 研究两因子之间的生物学交互作用; 用于生存分析和诱导期分析。
第九讲 分层分析
Stratified Analysis
2021/4/9
1
主要内容
一、概述
二、步骤与方法:
资料整理
同质性检验
点值估计
假设检验
区间估计
三、效应测量修饰的评价与描述
四、应用
基本生存分析
诱导期分析
2021/4/9
2
一、概述
历史: 美国著名生物统计学家Mantel和 Haenszel于1959年首次提出了著名的分层 分析(stratified analysis)法,以解决肿 瘤回顾性研究中的混杂问题。
2021/4/9
14
概述-选择混杂因子(4)
后退删除(backward deletion)策略:即 首先对所有能够调整的潜在混杂因子都 进行调整,然后将那些导致效应变化最 小的混杂因子逐一删除,如果某变量的 删除导致的总的效应估计值的变化超过 某一临界点时,删除即可停止。
在评价混杂因子的重要性时,会受 到其他混杂因子和选择策略的强烈影响。
测量指标;而混杂却与特异的效应测量指标无
关。 2021/4/9
8
概述-混杂与效应测量修饰(5)
3)混杂是由于混杂因子在暴露与非暴露组(或 病例与对照组)中分布比例不同所造成的;而 效应测量修饰是由于效应测量修饰因子对暴露 与疾病的关系产生了实质性影响,或者说效应 测量修饰因子与暴露因子有交互作用。
17
概述-分层分析的基本步骤(1)
分层分析的前奏是先要判断某(些)因 子是否为混杂因子,然后从众多混杂因 子中选择必需调整控制的混杂因子,并 确定它们的分类。分层分析的基本步骤 是: 1、分层列表:将资料按混杂因子分层后 列表,然后分别计算各层的效应估计值。
2021/4/9
18
概述-分层分析的基本步骤(2)
对混杂因子作用大小的估计最好是在其 他混杂因子被控制的条件下进行。
2021/4/9
11
概述-选择混杂因子(1)
控制的必要性的判断:对效应估计值的变化选
择一个临界点作为判断的标准。临界点的选择通 常有两种方法:
人为确定法,即人为规定调整后的效应测量值
的变化应大于5%,10%或其他标准,才被认为是 重要的。
率差(RD)
0.437
率比(RR)
3.052
750 60 3250 940 4000 1000 0.188 0.060
0.128 3.133
1400 910 3600 4090 5000 5000 0.280 0.182
0.098 1.538
2021/4/9
7
概述-混杂与效应测量修饰(4)
混杂与效应测量修饰的异同:
4)研究者希望预防和消除混杂,而对效应测量 修饰却要尽量的发现和描述。通过改变源人群 或设计策略(如配比等),能阻止一个潜在的 混杂因子产生混杂,但同时也可能削弱了对效 应测量修饰的研究。
2021/4/9
9
概述-混杂的判断
混杂因子具有下列四个基本特征:
1)它必须是对照人群中所研究疾病的一 个危险因子;
2)它必须和源人群中的暴露变量有关;
3)它不是暴露和疾病之间的一个中间变 量;
4)按该可疑混杂因子调整后的效应测量 值不同于调整前的效应测量值。
2021/4/9
10
概述-混杂作用大小的估计
对混杂因子作用大小的最直接估计方法 是比较对该混杂因子进行调整前和调整 后的效应测量值,用两个效应测量值之 间的不一致的程度来估计。
2021/4/9
21
二、步骤与方法 1、资料整理(1)
1、分层人时资料(stratified person-time data)的归纳整理: 人时资料即以人时为分母,以发病率密度为主要测量指 标的资料。一般为队列研究资料。该类资料可整理为表 19-2:
表 19-2 分层人时资料的归纳整理表(i 层)
统计学检验:对未调整和调整估计值两者之间
的差异进行统计学检验,如果检验结果有显著性, 则对该因子的调整是必须的。选择混杂因子时, 一般需要提高拒绝无效假设的α水平至 0. 2 甚至更 高,而不使用传统的0.05水平。
2021/4/9
12
概述-选择混杂因子(2)
选择控制的必要性:
不能试图通过分层分析控制所有的混杂 因子,因为样本的限制。
的值的变化而变化,这个第三变量称为效 应测量修饰因子。
2021/4/9
5
概述-混杂与效应测量修饰(2)
效应测量修饰被认为是效应的异质性,而没有 效应测量修饰被称为效应的同质性。
当效应测量修饰因子与暴露因子两者均对疾病 的发生有作用时,如果暴露组的发病率和非暴 露组的发病率之比在某可疑效应测量修饰因子 的各水平之间恒定,即不存在修饰作用,那么 它们的差则可能是不恒定的,即可能存在修饰 作用;如果比测量和差测量均不存在修饰作用, 那么在其他测量中一定存在修饰作用。反之亦 然。
2、检查层别效应估计值:
在绝大多数分层分析中,效应估计值在各层都 有一些变化,而这些变化的意义却不尽相同。
检查与分析的目的就是要明确这种层别效应估 计值的变化有无统计学意义,是否是科学的, 有无重要的公共卫生意义。
明确这些问题对决定下一步用什么分析方法和 如何报告分层分析结果将起关键作用。
2021/4/9
相同之处在于两者均能使所估计的暴露效应被 歪曲;两者的
主要区别表现在下列四个方面:
1)效应测量修饰是所研究的效应的一种特性, 是独立于研究,不随调查研究设计的变化而变
化的一种客观现象;而混杂的存在与否却取决
于研究设计,混杂是研究中的一种偏倚,是系 统误差。
2)效应测量修饰存在与否取决于所用的效应
2021/4/9
16
概述-确定混杂因子的分类
理想的情况是控制混杂因子的重要混杂 作用所需的最少分类。
原则上,如果样本够大,分类不宜过少; 如果样本不大,则以检查精确可信限为 标准。要求当分类数发生变化时,精确 可信限有一个合适的变化(达到要求的 临界点,但又不出现过于夸大的现象)。
2021/4/9
相关文档
最新文档