JAMA:应用混合模型分析重复测量资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

JAMA:应用混合模型分析重复测量资料医学数据挖掘出品,戴云鹤译。

本篇内容翻译自Michelle A. Detry 和Yan Ma于2016年1月26日发表在JAMA的文章《Analyzing Repeated Measurements Using Mixed Models》,查看英文原文请点击“原文链接”。

纵向研究通常会包括有关病人状态或结局的多元重复测量资料,这些资料可用于评估结局的差异,或不同时间点上治愈率或死亡率的差异。

与来自不同病人的测量资料相比,来自于同一病人的重复测量资料相似度更高,分析结果时还需要考虑数据的关联性。

许多常见的统计方法(例如线性回归模型)都假定测量资料之间彼此独立,因此不适用于这种情况。

在比较不同治疗方法结局的差异时,我们可以只对最后一次测量进行分析,以判断研究结束时两组之间的结局是否存在差异。

但是,这种方法会忽略掉重复测量中的许多信息,也不能反映出每个病人的病情变化过程。

当对不同时间点的结局进行重复测量时,很多重要的临床问题就能得到解决。

JAMA最近发表的一篇研究中,Moseley等[1]对踝关节骨折病人的活动限制和生活质量(QOL)进行了测量,以判断监督锻炼计划与康复建议相结合的方式是否比单独建议更有效。

有关病人活动限制和生活质量的数据,该研究组分别在基线水平以及随访1个月、3个月和6个月时进行了测量。

作者使用混合模型2对两干预组病人不同时间点的结局进行了比较。

混合模型的使用
为什么混合模型用于分析重复测量数据?
当所有研究对象都即受某些相同因素的影响(例如,干预效果),又都具有某些不同的特征时(例如,踝关节骨折的程度、功能的基线水平以及生活质量),混合模型就很适合于分析研究对象不同时间点上结局的变化轨迹。

混合模型可以明确地解释同一研究对象的重复测量资料之间的关联。

对许多研究对象都产生相同效应的因素称为固定效应,而在不同研究对象之间存在差异的因素就称为随机效应。

例如,假定某种新疗法对所有病人的疗效相同,并将模型设为固定效应;但是病人的基线功能或恢复速度存在差异,因此应当选择随机效应模型。

而混合模型同时包含固定和随机两种效应。

由于混合模型能同时考虑固定效应和随机效应,因此能灵活地判断多种因素的效应,为一些特殊的重要临床问题提供解决方法。

相比之下,通常用于分析纵向数据的重复测量方差分析(ANOVA)便不具有此灵活性,如果不能满足它的严格假设(例如,所有效应都是固定的)就会产生误导的结果。

除了用于人群水平的比较,混合模型还能显示出个体在不同时间点上的反应类型。

最合适的混合模型的框架由具体的临床问题所决定。

例如,如果某种治疗方法对病人恢复速度的效应一定,该混合模型就包括随机的基线效应和固定的反应效应,而固定的反应效应能够捕捉治疗方法对恢复速度的效应。

观察对象之间会以多种不同的方式相互关联,这种模式叫做相关结构,选择正确的结构在混合模型的使用中十分重要。

例如,如果测量的时间长度不同,但每个测量之间的关联趋于相同,应该选用“符合对称”结构。

相反,如果测量的时间间隔越长,测量之间的关联越
低,则应该选择“自回归”结构。

如果关联模式没有任何约束,可以选择“不确定型”相关,但是与其他方法相比,不确定型相关的模型拟合需要更大的数据集。

理想情况下,假定的相关结构应该基于获取重复测量资料的临床环境。

例如,与在相隔较远的时间点上测量的数据相比,在相邻时间点上测量的纵向数据(例如,关节术后的疼痛评分)具有更强的关联性,因此应当采用自回归结构。

当要用到客观比较来评估竞争相关结构时,可以采取统计测试(例如,似然比检验)。

结果数据不完整(例如,由病人某些随访的缺失或病人失访所导致的数据缺失)在纵向研究中很常见。

[3]因此,对于不同的研究对象,其可用的测量数据的多少也不同,这时就不能选择重复测量的方差分析对数据进行处理。

混合模型可以容纳不平衡的数据模式,利用分析中所有可用的观察结果和病人。

混合模型假设未观察到的测量值的缺失是独立的,但又依赖于所观察到的测量值。

[4,5]该假设称为随机缺失,通常是合理的。

[3,5]
重复测量方差分析的前提是“完全随机缺失”,即假设缺失在观察到的测量值和未观察到的测量值中都是独立的,但这种假设更加不现实。

利用混合模型能够合理有效地估计治疗方法的效应,即使缺失值并不完全随机,而且通常也不需要额外的方法(例如多重替代法)来处理缺失数据。

[3-5]
混合模型的局限性有哪些?
与任何统计模型一样,混合模型的基本假设得不到满足时,其有效性也会受到限制。

例如,如果某种治疗方法的效应在不同的病人之间存在显著的差异(例如,由基因差异导致),将治疗效果看作固定
效应就不太合理。

同样,假定的相关结构如果选择不当,将会影响模型结果和研究结论。

确保混合模型的结构与临床环境相匹配是十分重要的。

由于需要估计的参数量比较大,当可用的数据有限时,混合模型很难估计或“拟合”。

当必须使用不确定型相关结构时,这点尤为重要不同软件包用于混合模型的精确估计方法不尽相同,因此数据结果会因统计软件的不同而有所差异。

当存在缺失数据时,混合模型可以基于数据的随机缺失而提供有效的推论。

但是在实际中我们很难判断假设是否能够得到满足,信息审查(不可忽略缺失)也不能排除。

如果调查人员怀疑随机缺失的假设存在偏倚,可能会采用不可忽略缺失的合适模型来进行敏感性分析。

模型的选择取决于研究设计、数据缺失模式以及其他具体的研究细节。

[2]
该作者为什么要在研究中使用混合模型?
研究人员使用混合模型对数据进行了分析,因为他们想要了解结局随时间的变化,以及治疗效应对结局的影响。

该模型包括治疗组的固定效应、测量的时间点以及基线分数。

治疗和时间的交互效应也被包括在内,以判断两种治疗干预方法是否能导致不同的恢复轨迹。

另外,该模型还包括基线值的随机效应,以处理每个病人基线水平的不同。

该试验报道,研究进行过程中,每个治疗组都有10-20%的病人失访。

因此,缺失值效应的测量十分重要。

他们还进行了一项预先计划的灵敏度分析,采用多重替代法5来分析主要结果对随机缺失假设的敏感度。

主要结果和敏感度分析的结果是相同的。

解读混合模型结果时的注意事项
与大多数统计模型一样,应该要考虑到数据结构是否能够获取,以及临床环境(例如,不同时间点上的重复测量)是否与模型结构相匹配。

通过图形资料汇总(例如,“spaghetti”或“string”图可以显示研究对象的结局随时间而变化的轨迹)来判断观察到的数据的模式是否符合模型假设是十分有用的。

spaghetti图
当结局数据缺失时,分析者应该考虑到缺失的模式是否是随机的,是否符合混合模型的固有假设。

相关结构的选择应该有明确的基本原理,并基于研究设计(例如,随访的模式)。

参考文献
1. Rehabilitation after immobilization for ankle fracture: the EXACT randomized clinical trial. JAMA. 2015;314(13):1376-1385.
2. Applied Longitudinal Analysis. 2nd ed. Hoboken, NJ:Wiley;2011.
3. Missing data: how to best account for what is not known.
JAMA. 2015;314(9): 940-941.
4. Beyond repeated-measures analysis of variance: advanced statistical methods for the analysis of longitudinal data in anesthesia research. Reg Anesth Pain Med. 2012;37(1):99-10
5.
5. Multiple imputation: a flexible tool for handlingmissing data. JAMA. 2015;314(18):1966-1967.。

相关文档
最新文档