广义线性混合效应模型在临床疗效评价中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
广义线性混合效应模型在临床疗效
评价中的应用
【摘要】目的:探讨临床疗效评价中分类重复测量资料的广义线性混合效
应模型(GLMMs)及的GLIMMIX宏实现。
方法:利用GLIMMIX宏ERROR和LINK语句来指示疗效指标的分布及连接函数,通过REPEATED 和RANDOM语句的TYPE选项选择合适方差
协方差结构矩阵来模拟不同时间疗效指标
的相关性,采用基于线性的伪似然函数进行模型参数估计。
结果:广义线性混合效应模型允许临床疗效评价指标是指数家族中
任意分布,可以通过连接函数将疗效指标的均数向量与模型参数建立线性关系,简化运算过程。
结论:广义线性混合效应模型建模灵活,可为临床疗效评价提供更丰富的信息。
【关键词】广义线性混合效应模型临床疗效评价分类重复测量资料 GLIMMIX宏Apllications of Generalized Linear Mixed Models in Clinical Curative
Effects EvaluationLuo Tiane, et al Abstract Objective :To discuss generalized linear mixed models(GLMMs) of categorical repeated measurement datas in clinical curative effect evaluation, implementing with GLIMMIX macro in soft. Methods: Using the ERROR and LINK sentences of GLIMMX macro to sign the distribution and link function of the index ,adopting the TYPE option of REPEATED and RANDOM sentences to select the appropriate
variance covariance matrixs for modeling the relations, making use of pseudo likelihood function based on linear to estimate the model parameters. Results: GLMMs allow the index may be one of the exponential family (Contimuum distributions including Nomal ,beta distribution ,chi squared
distribution etc;Disperse
distributions including
Binomal ,Poisson and inverse Binomal etc), the vecor of expected means of the index is linked to the model parameters by a link function and model the linear equation, simple the calculator procedure. Conclusion: GLMMs can easily fit statistical models,the results are objective and reality, can strongly provide the abundant information for clinical curative effect evaluation. Key words generalized linear mixed models; clinical curative effects evaluation; categorical repeated measurement datas; GLIMMIX macro 临床疗效评价中常常需要对同一患者
在不同时点进行多次观测并记录其疗效指标,当疗效指标为属性特征或类别时,称其为分类重复测量资料,如在治疗前、疗后4周、8周、12周等连续检测乙肝患者核心抗体,其结果有阴性、阳性两个水平;连续监测病人的治疗效果,反应变量为治愈、显效、好转、无效等。
如同定量变量重复测量资料,
数据间不满足独立性要求, 存在自相关性
和异方差性。
经典统计分析方法要求数据满足独立性和常量方差。
为拓宽医学研究需要,本研究主要介绍不满足独立性要求的分类
重复测量资料广义线性混合效应模型与的GLIMMIX宏实现。
1 资料与方法
资料
某医师拟探讨乳腺治疗仪合用乳块康贴治
疗乳腺增生疗效的临床试验,采用随机、双盲设计,收集符合乳腺增生症西医诊断及中医辨证气滞血瘀证标准的女性患者93例,
随机分为A、B、C 3组,分别采用3种治疗方案。
方案A:乳腺治疗仪合用乳块康贴,
每日一次,每次照射半小时,药贴每日一贴,贴于疼痛明显或增生部位;方案B:乳块康贴,每日一贴,外用;方案C:乳腺治疗仪,每日一次,每次照射半小时。
15天为一疗程,在每个疗程末记录病人是否有乳腺结节、乳腺疼痛及经行腹痛等指标,连续收集两个疗程,分析指标若为二分类反应变量,变量赋值为有=1,无=0。
方法
广义线性混合效应模型[1~6]
取分类变量的疗效指标Y为反应变量,对
每个个体进行重复观测,为说明不同用药方案疗效是否有差别及随时间疗效的变化情况,可采用广义线性混合效应模型,记作:Y=μ+ε g(μ)=Xβ+Zγ(1)
式中Y:n×1维观测向量,μ:观测的均数向量,通过连接函数g(.)将其与模型参数建立恒等方程;X和Z分别是固定效应和随
机效应的设计矩阵,β和γ分别是模型的
固定效应和随机效应参数向量,当随机效应γ满足均数为0,方差矩阵为G的正态分布,γ~N(0,G),var(γ)=G;残差ε满足正态分布ε~N(0,R),var(ε)=R,R:残差协方
差矩阵。
模型也可记作:E(Y|γ)=g-1(Xβ+Zγ)(2) g-1(.)表示可微单调连接函数g(.)转置。
广义线性混合效应模型的反应变量可以是
指数家族的任一分布,相应的连接函数及误差分布见表1。
表1 反应变量的分布类型及
对应的误差分布和连接函数
参数估计:采用Wolfinger和
O’connell(1993)提出的伪似然函数进行
参数估计,可用SAS/STAT里GLIMMIX宏实现,伪似然函数采用加权正态混合模型,通过迭代使准似然函数即线性化伪变量达到
最大化。
因为每次迭代最大化的似然函数是伪变量而不是原始数据,故将此方法称为“伪似然”,伪变量是基于一阶泰勒系列扩展获得:
伪变量
z=g(μ)+(y-μ)B-1=Xβ+Zγ(y-μ)B-1(3)
z的方差
Vz=var(Xβ+Zγ)+B-1var(y-μ)B-1=ZGZ
+B-1RB-1
相关残差矩阵R是线性尺度P和AB-1的产物,Vz=ZGZ+A1/2B-1/2PA-1/2B1/2。
软件实现
利用的GLIMMIX宏过程[4,5,7]来实现
分类重复测量资料广义线性混合效应模型
拟合与参数估计,若id表示观测个体编码,group表示分组,time表示不同重测时间点,以经行腹痛y为反应变量说明模型的模拟过程,以下是SAS程序的数据步和必需的宏语句,详细用法请参考SAS软件的帮助内容。
2 结果
拟合优度检验
利用模型提供多种方差协方差结构,根据拟合优度检验AIC和BIC准则越小越好的判定标准来选择最佳模型,无结构矩阵模型1的 AIC和BIC值均明显低于其它模型,所得结果拟合更优,见表2。
表2 拟合优度AIC 和BIC准则进行模型选择表3 Ⅲ型固定效应结果分析比较
不同用药组疗效指标差别有统计学意义;不同疗程差别有统计学意义;组别和疗程的交互作用存在,见表3。
不同用药方案的主效应比较,以单用乳腺治疗仪为基线,乳腺治疗仪合用乳块康贴组优于C组,单用乳块
康贴与C组疗效差别尚不能认为有统计学意义;不同疗程主效应分析,疗程2优于疗程1(time=1);由交互效应分析可见,以C组为基线,A组的疗程2优于疗程1,B组的疗程2优于疗程1,但差别尚不能认为有统计学意义;两法合用比单用疗效好,见表4。
表4 模型固定效应解
3 讨论
循证医学是遵循科学依据的医学,近年来在国际临床医学领域迅速发展。
进行方法学与研究思路的创新与突破是促进医学发展,提高临床研究质量的关键。
在进行医学临床研究时,运用科学的设计方案,敏感性高、特异性强评价试验疗效指标,正确选用统计方法可提高临床研究质量,而且也是保证科研结果准确可靠的一个重要环节。
分类变量重复测量资料其反应变量不满足正态分布,存在非独立性及异方差性,即不能应用常规统计方法来分析。
广义估计方程可用来分析分类重复测量资料,反应变量可以是指数家族的任一分布,有多种协方差结构可供选择。
但是GEE是固
定效应模型,对于等级分类重复测量资料,只能分析具有独立协方差结构的数据[8] ,不能分析具有相关性的等级变量,而且GEE 模型不能包括随机效应项,这些均限制了该模型的应用范围。
广义线性混合效应模型是广义线性模型[7~10]的推广,模型在固定效应的基础
上加入了随机效应部分;在正态随机效应基础上,反应变量可以是指数家族中任一分布,包括常用的二项式分布和Poisson分布等离散分布及正态分布,beta分布和卡方分布等连续分布,本研究以反应变量为二项分布;此模型提供多种R矩阵和G矩阵的方差协方差结构,可以很好拟合多种分布类型的重复测量数据,即便个体间存在相关性的数据,仍可灵活建模,解决具有相关性和异方差的资料。
在临床疗效评价中,随着计算机软件的开发与应用,可较方便地解决模型拟合与疗效评价中的方法学问题。
它不仅可解决常规方法不易解决的复杂问题,而且所得结果解释更为客观,应用范围更广,在SAS软件宏语句编程中易于按分析要求实现,具有很
好的应用前景。
【参考文献】
1 Breslow NE, Clayton DG. Approximate inference in generalized linear mixed of the American Statistical Association,1993, 88: 9~25.
2 Oliver Schabenberger. Introducing the GLIMMIX Procedure for Generalized Linear Mixed Models,SAS Institute Inc, Cary, NC. Paper 196~130.
3 Charles Methods for the Analysis of Repeated ,New York,2002.
4 Helen Brown ,Robin Mixed Models in Medicine. John Wiley & Sons
5 Diggle, P. J., Liagn, K. Y., and Zeger, S. L. Analysis of Longitudinal Data. NewY ork: Oxford University Press. 1994.
6 Zeger, S. L. and Karim, M. R. Generalized linear models with random effects: A Gibbs sampling of the
American Statistical Association, 1991,86:79~86.
7 %GLIMMIX macro to fit the generalized linear mixed model[OL]. http:/// ctx/samples /index. jsp?
sid=536&tab =details.
8 Lumley estimating equations for ordinal data: a note on working correlation structures. Biometrics,1996,52(1):354~361.
9 McCullagh P, Nelder JA. Generalized LinearModels. London: Chapman & Hall, 1989.
10 Dobson, Introduction to Generalized Linear and
Hall ,London,1990.。