11流行病学方法I(交互作用)-2013
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
乘法模型
• 如果同时暴露两个或多个因素的效应等于单独 暴露单个因素作用的乘积,则交互作用不存在。 即: R11 / R00 =(R10 / R00)(R01 / R00 ) 式1 式1表示X、Z均暴露时的效应等于二者分别暴 露时效应的简单相乘。进一步,如果式1两边 取自然对数,则得到等式 ln(R11 / R00 )=ln(R10 / R00)+ln(R01 / R00 ) 式2 • 如果符合式1、2,表明X与Z符合乘法模型。
•
生物学交互作用与统计学交互作用 概念完全不同。生物学交互作用是指 实际存在的两种或多种因素之间真实 的生物学作用。而统计学交互作用是 关于基于统计模型和参数的定量概念。
• 假定暴露或干预的效益可以通过它们所 致的新增病例的增减来衡量,新增病例 (发病数)或发病率的可加性偏离即为 公共卫生交互作用。������ • 如果由各因素所致的超额新增病例不是 可加的,说明存在公共卫生交互作用影 响。
实 例
长期服用维生素E与心肌梗死队列研究 心肌梗死 + 长期服用维 生素E 不服用维生 素E 400 600 RR=0.67 — 600 400 长期服用 维生素E 不服用维 生素E 长期服用维生素E与心肌梗死按是否吸烟的 分层分析 吸烟组 心肌梗死 + 240 580 — 30 300 不吸烟组 心肌梗死 + 160 20 — 570 100
交互作用的统计方法包括参数法和非参数法。 1. 参数法 Logistic回归模型。 2. 非参数法(主要是数据挖掘方法)。 (1)降维法;多因子降维法。 (2)基于树的方法;分类回归树和随机森林法。 (3)模式识别法;包括神经网络、支持向量机。 (4)贝叶斯法:贝叶斯上位效应关联图谱。 参数法和非参数法分析交互作用时各有优缺点 ; 低维数据的 分析可采用参数法和非参数法, 高维数据的分析则主要采用非参 数法,
交互作用基本概念 交互作用模型 交互作用与混杂现象的区别 交互作用的统计分析方法 交互作用分析实例
������
• 个体暴露于单个的危险因素时不会患病, 仅当同时暴露两个或多个危险因素时才患 病。这是关于多危险因素在生物学机理上 的定性概念。联合作用的类型分为 4种: 相加作用、协同作用、拮抗作用、独立作 用。
类型 1 2 3 4 5 6 7
cRR 2.36 2.36 2.36 2.36 2.36 2.36 2.36
aRR1 2.48 3.56 1.08 1.13 2.63 0.56 2.89
aRR2 Байду номын сангаас.33 3.49 1.16 5.06 6.23 0.64 0.58
结果判定 无混杂、无交互作用 负混杂、无交互作用 正混杂、无交互作用 无混杂、负交互作用 无混杂、正交互作用 正混杂、无交互作用 无混杂、正交互作用
实例说明
相加模型 R11 - R00 =(R10- R00)+(R01 - R00) 34.72-1=33.72>6.94-1+3.70-1=8.64 符合相加模型, 有交互作用 相乘模型 R11 / R00= ( R10 / R00) ( R01 / R00) 34.72/1>6.94/1*3.70/1=25.7 符合相乘模型, 有交互作用
• 暴露单个危险因素作用的总和或乘积是否等于同 时暴露两个或多个危险因素的作用,若同时暴露 两个或多个危险因素的作用明显大于暴露单个危 险因素作用的总和或乘积,称为正交互;反之, 同时暴露的作用效应明显小于暴露单个危险因素 作用的总和或乘积,则为负交互。这是关于多危 险因素的统计模型和参数的定量概念。
以两因素为例,假设两个因素X与Z为二分 变量,用R00表示X和Z两因素均不存在时的效 应,R11表示X和Z两因素均存在时的效应;R01 表示X因素不存在而Z因素存在时的效应,R10 表示X因素存在而Z因素不存在时的效应。
Z=1 X=1 X=0
危险度差
危险度比 R11 R01
Z=0
R10 R00
R11-R01
对混杂偏倚的识别可以根据混杂偏倚产生的机 理,结合专业知识,并运用定量分析的方法进行判断。 一般来说识别混杂偏倚的方法有下面几种: 1、根据专业知识提出研究中可能存在的混杂因子。 常见的混杂因子分为两类,一类是人口统计学指标如 年龄、性别、种族、职业、经济收入、文化程度等; 另一类是除研究因素以外的危险因素,如研究氡气与 肺癌关系时,吸烟就是一个可能的混杂因素。 2、利用分层分析进行判断
R11/ R01
R10-R00
R10/ R00
相加模型
• 如果同时暴露两个或多个因素的效应等于单独 暴露单个因素作用的总和,则交互作用不存在。 • X与Z无交互作用的条件为: Z=1时的率差(R11-R01) 等于Z=0时的率差(R10 -R00) R11-R01 = R10-R00 式1 可以把这个等式写成: R11 - R00 =(R10- R00)+(R01 - R00) 式2 • 如果符合式2,表明X与Z符合以率差为测量指标 的加法模型。
• 上面讲了交互作用的两种检验方法: • 方法 I :模型中乘积项回归系数的检验(又称 WALD TEST)。如上例βsa的检验,如显著表示有交互作用; • 方 法 II : 似 然 比 检 验 ( Log likelihood ratio test),具体方法为: • 计算卡方值:X2=2*(LL1-LL2)。如上例,LL1表示从 方程I(或II)得出的似然对数; LL2表示从方程III 得出的似然对数。 • 计算自由度差。如上例,方程 I (或 II )有 3 个自变 量,方程III只有2个自变量,差为1。 • 按卡方检验,得出P值。 • 一般来说,似然比检验效率高于回归系数的检验。
交互作用超额相对危险度( relative excess risk of interaction , RERI):表示两因素联合作用与其单 独作用之和的差值,RERI = A - (B + C - 1) ,同 时也表示交互作用与两因素以外的因素作用之间 的关系(这里公式是假定后者OR = 1),如果未知 因子作用很大,则所研究的交互作用就变得十分 次要而没有意义。这里,RERI 即为基于相加模型 的两因素交互作用值。
交互作用指标
交互作用指数(the synergy index S ,S) :S =(A - 1) / [ (B - 1) + (C - 1) ]当S = 1 时,无交 互作用;S > 1 时,两因子间有正交互作用; S < 1 时,两因子间有负交互作用。
交互作用归因比(att ributable proportion of interaction , AP):表示总效应中有多大 比例归因于两因子交互作用AP = [A - (B + C - 1) ]/ A。 纯交互作用归因比:AP*= [A - (B + C -1) ]/ (A - 1) 表示由基因和环境两因素引起的效 应中归因于两因子交互作用的比例。
• 流行病学研究中,由于一个或多个外来因素的存 在,掩盖或夸大了研究因素与疾病的联系,从而 部分或全部地歪曲了两者间的真实联系,称之为 混杂偏倚或混杂。引起混杂的因素称为混杂因子。 • 混杂因子的特点:它必须与所研究的疾病的发生 有关,是该疾病的危险因素之一;必须与所研究 的因素有关;必须不是研究因素与疾病病因链上 的中间环节或中间步骤。 • 混杂因子导致混杂偏倚的条件:混杂因素在各比 较组间分布不均。
以吸烟与饮酒两个两分类变量为例, 它们有四种可能的组合(如下表):
不饮酒 不吸烟 吸烟 β0 β0+βs 饮酒 β0 + βa β0+βa+βs+βsa
• 我们可以形成一个四分类的变量,再用四 个二分类变量X00、X01、X10、X11指示这四组, 形成回归方程:
• 方程I:f(Y)= β0+β1X10+β2X01+β3X11 β1 是吸烟不饮酒组与不吸烟不饮酒组的差,β2 是不吸 烟但饮酒组与不吸烟不饮酒组的差,β3是吸烟又饮酒组与不 吸烟不饮酒组的差。 • 方程II:f(Y)=β0+βaalcohol+βssmoke+βsasmoke*alcohol 回归系数的βs不能简单地解释为吸烟的作用,而应确切 地说是对不饮酒者吸烟的作用(等于方程I的β1)。βa不能 简单地解释为饮酒的作用,而应确切地说是对不吸烟者饮酒 的作用(等于方程I的β2),因为βs、βa、β0 三者间有相 互依赖的关系。
某队列研究资料的分层分析 分层前 D E E a c cRR b d D 有F E E D a c aRR1 分层1 D b d 无F E E 分层2 D a c aRR2 D b d
当cRR(cOR)≠分层后的aRRi(aORi),各分层RRi(ORi) 相等或相近,则混杂偏倚存在。但外来因素的作用并非仅 为混杂,cRR(cOR)≠分层后的aRRi(aORi)也可以是由于因 素间的交互作用所致。在cRR(cOR)≠分层后的aRRi(aORi) 的情况下,理论上,当样本足够大时,如各分层的 RRi(ORi)相等,则主要是混杂所致;如果分层的RRi(ORi) 不等,则以因素间的交互作用为主。
交互作用指数:S = (A - 1) / [ (B - 1) + (C -1) ] = 3. 90,A - 1 > (B - 1) + (C - 1) 表明两者之间存在基于相加模型的正交互作用,有 Leiden 因子Ⅴ基因突变者再口服避孕药可能增加静脉血栓栓塞 的危险。该指数是否具有统计学意义需要进行假设检验。 交互作用归因比:AP = [A - (B + C - 1) ]/A = 0. 7224 = 72. 24 % ,表明有上述基因突变的口服避孕药者 , 其产生的静脉血栓栓 塞患者中,有72. 24 %是由该两因子的交互作用所致。 纯交互作用归因比:AP*= [A - (B + C -1) ]/ (A - 1) = 0. 7438 = 74. 38 % ,在有上述基因突变的口服避孕药者所产生的全部静脉 血栓栓塞患者中,当除去其他或未知因子产生的病例后,因这两因 子交互作用占有的与两因子有关的病例总数比例为74. 38 %。 交互作用超额相对危险度: RERI = A -(B + C - 1) = 25. 08,表 明归因于有Leiden 因子Ⅴ基因突变者口服避孕药两者交互作用 所致的静脉血栓栓塞危险性是其他或未知因子( 其OR = 1 ) 的25. 08 倍。
• 方程I与方程II是等同的,方程I中的β3 等于方程II 中的βa+βs+βsa 。方程I和II都有3个自变量(自由 度 ) , 都 没 有 假 定 βsa 等 于 零 , 又 称 为 饱 和 ( Saturated )模型。从方程 II 中我们可以观察βsa 是否显著。如果我们假定吸烟与饮酒无交互作用, βsa等于零,则方程II变为: • 方程III:f(Y)= β0+βaalcohol+βssmoke • 只用βa、βs来拟合这四组,如果得到的似然数与方 程 I ( II )没有显著差别,表明βsa 是多余的,或者 说βsa与零无显著性差异,吸烟与饮酒对f(Y)无交互 作用。反之,吸烟与饮酒对f(Y)有交互作用。
RR=1.32
RR=1.27
分层前的cRR=0.67,分层后的aRR1=1.32、aRR2=1.27;分层 前后的RR值不等,且分层后各层的RR值相近,可以认为混杂偏倚 的存在,吸烟在该研究中是一个混杂因子(负混杂、无交互作用)。
• 概念������ • 混杂:与所研究的暴露因素和疾病都有联系 的外部因子,可以歪曲(掩盖或夸大)暴露因 素与疾病之间真正联系。 • 交互:与所研究的暴露因素和疾病都有联系 的外部因子,它的存在使得暴露因素和疾病 之间的效应发生真实的改变。
• 性质 • 混杂:造成偏倚,影响结果的真实性。不是 一个因素固定不变的特性,即在一项研究中 它起混杂作用,而在另一项研究中却不是混 杂因子。 • 交互:是一种真实的效应。所产生的效应是 恒定的,从数学上来说是常数。
• 处理的方法 • 混杂:应尽量避免与消除。它存在与否 取决于研究设计,可以通过设计的更改 进行防止。 • 交互:应尽量去发现,评价。它的存在 与否与研究设计无关。