纵向观测二分类数据的广义线性模型分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.3 可交换结构(EXC) δijk=α (j<k≤n),此时Ei=(1,…,1)′为n(n-1)/2维元素均为1的向量。Wi 的对角元为: wijk=1+(1-2μij)(1-2μik)* {μij(1-μij)μik(1-μik)}α-α2 (j<k≤n) 若已经获得估计 , ,则可据此得到 的协方差阵的稳健估计。我们已将上述方法编制成计算 机运行程序,下面以表1的资料进行分析讨论。
… … … …

… … … … … … … …

… … … …
55 P M 24 1
ห้องสมุดไป่ตู้
1 1 1 1 110 A F 63 1
1111
56 A M 25 0
1 1 0 1 111 A M 31 1
1111
等横向分析方法,将造成信息损失;更为重要的是,由于忽略了重复数据间可能存在的相关性,会 导致参数估计不准确,甚至得出错误的结论。 纵向研究由于充分考虑了数据间的相互依赖性,具有可提高功效以及对模型的选择有稳健性等 优点,正日益受到统计学界的广泛关注。纵向数据的分析目前多采用拟合线性模型和广义线性模型 的方法,研究的焦点集中在如何解决重复观测间的相关性问题上[1,2]。Zeger等在1986年提出的广 义估计方程,较好地解决了似然函数中多余参数的估计问题[3],它将横向研究中的线性模型以及 广义线性模型的参数估计推广到了纵向数据的分析。本文讨论纵向观测二分类数据的logistic广义线 性模型分析,利用广义估计方程解决模型的回归参数和相关参数的估计问题。
1 模型及参数估计
一般地,设有m个个体,个体i的观测序列为yi=(yi1,…,yini)′,相应的观测时间为ti=(ti1,…,
tini)′,对应于yij(j=1,…,ni)的协变量向量为xij=(xij1,…,xijp)′,以Yij表示对应于yij的随机变量,记
μij=E(Yij),μi=(μi1,…,μini)′。为方便起见,下面的叙述中,去掉ni的下标i。
βs+1=βs+(∑iD′iV-1iDi)-1∑iD′iV-1i(yi-μi)
αs+1=αs+(∑iE′iW-1iEi)-1∑iE′iW-1i(Ri-δi)
至此,只要知道相关阵Ri(α),就可迭代得到参数的估计。以下就Ri(α)的几种常用结构进行讨 论。
2 相关阵结构
2.1 独立结构(IND) R(α)=I(单位阵),此时每个个体的各次重复观测间相互独立,可用一般 的logistic回归模型进行分析[6,7]。 2.2 一阶依赖结构(DE-1) R(α)为三对角阵,次对角线元素为: δij,j+1=α(j=1,…,n-1) 此时 Ei=δ i/α=(e i12,…,ei1n,…,ein-1,n)′=(1,0,…,1)′ 即关于Ei的元素有:
万方数据
file:///E|/qk/dejydxxb/dejy99/dejy9907/990724.htm(第 3/6 页)2010-3-22 16:47:21
第二军医大学学报Academic Journal of Second Military Medical University1999年 7月 第20卷 第7期 Vol
万方数据
file:///E|/qk/dejydxxb/dejy99/dejy9907/990724.htm(第 2/6 页)2010-3-22 16:47:21
第二军医大学学报Academic Journal of Second Military Medical University1999年 7月 第20卷 第7期 Vol
这里β=(β1,…,βp)′为p维回归参数向量。 回归参数β的估计值 为下列广义估计方程的解[4]:
(3)
其中Di= / =(djk)n×p,Vi为近似协方差阵,定义为: Vi=A1/2iRi(α)A1/2i Ai=diag{μi1(1-μi1),…,μin(1-μin)} Ri(α)为近似相关阵,其结构完全由相关参数α确定。 根据(2)式可得: μij=exp(x′ijβ)/{1+exp(x′ijβ)} 则Di的元素djk为:
[Acad J Sec Mil Med Univ, 1999, 20(7): 483~485]
医学研究和临床试验中经常碰到重复观测二分类数据。如:进行临床试验, 比较两种处理对呼吸 道疾病的疗效。在两个研究中心将111名患者(甲中心56名,乙中心55名)随机分为两个处理组:积 极治疗组(54名)和安慰剂治疗组(57名),治疗期间连续4次检查患者的呼吸道情况,结果为二分 类变量,以0表示差,1表示好。可能的影响因素有研究中心、处理、性别、基准呼吸状况以及开始 治疗时患者的年龄。数据如表1示,表中处理栏A为积极治疗,P为安慰治疗。 这种资料是按时间顺 序对个体进行重复观测而得到的,其观测结果分为两类。对于这种纵向观测资料,若采用通常意义 下的t 检验或方差分析
j<k≤n;i=1,…,m
(4)
其中Ri=(Ri12,…,Ri1n,…,Rin-1,n)′为n(n-1)/2维向量,δi=E(Ri)=(δi12,…,δi1n,…,δin-1,n)′
Ei= Wi=diag{wi12,…,wi1n,…,win-1,n} 于是可得到估计α,β的迭代公式为:
至于相关参数α的估计,根据样本相关系数
j=1,…,n;k=1,…,p
记其均值E(Rijk=δijk),Rijk的方差为[5]:
wijk=Var(Rijk)=1+(1-2μij)(1-2μik).
{μij(1-μij)μik(1-μik)}1/2δijk-δ2ijk
将δijk看作Ri(α)的(j,k)元,它是α的函数,α满足如下方程:
Analysis of longitudinal binary data using generalized linear models
Xiong Linping Cao Xiutang Xu Yongyong Lu Jian Department of Health Statistics,Faculty of Medical Service, Second Military Medical University,Shanghai,
Status(0=bad,1=good)
No. Tr. Sex Age
No. Tr. Sex Age
Baseline 1 2 3 4
Baseline 1 2 3 4
1 P M 46 0
0 0 0 0 57 P F 39 0
0000
万方数据
file:///E|/qk/dejydxxb/dejy99/dejy9907/990724.htm(第 1/6 页)2010-3-22 16:47:21
纵向观测二分类数据的广义线性模型分析
熊林平 曹秀堂 徐勇勇 陆 健
摘要 目的:利用广义线性模型对纵向观测二分类数据进行分析,充分考虑纵向观测间的相关性, 给出一般分析方法。方法:采用Zeger和提出的广义估计方程,拟合logistic广义线性模型,讨论3种协 方差矩阵结构。结果:同时获得回归参数、相关参数的估计,完成了较为实用的运行程序,并进行 了实例分析。结论:医学研究和临床试验中经常接触到纵向观测数据,对这类数据需采用特殊的方 法进行分析处理,以解决重复观测间的相关性问题。 关键词 纵向观测;二分类数据;广义线性模型 中国图书资料分类法分类号 R 311
i=1,…,111;j=1,…,4
由估计结果(表2)可见,性别效应(β3)及年龄效应(β4)均无显著性意义。去掉这两个因 素,拟合新的logistic模型。最后得到的模型含有参数β2(处理效应)和β5(基准效应),均有显 著性意义,结果见表3。
表 1 甲中心56名患者及乙中心55名患者呼吸道状况观测结果 Tab 1 The observations of breathing condition of 56 patients in center A and 55 patients in center B
Status(0=bad,1=good)
200433
ABSTRACT Objective: To analyze longitudinal binary data by using generalized linear models. with consideration of the correlation between repeated measures. Methods: Generalized estimating equations (GEE) proposed by Zeger and Liang was used. For several covariance structures, one method was given for estimating regression and correlation parameters. Results: Regression and correlation parameters were estimated simultaneously. A set of program was finished and an example was illustrated. Conclusion: Longitudinal data often occur in medical researches and clinical trials. To solve the problem of correlation between repeated measures, it is necessary to use some special methods to cope with this kind of data. KEY WORDS longitudinal measure; binary data; linear model, generalized
Yij为二分类变量,观测结果为0或1,μij=Pr{Yij=1},Var(Yij)=μij(1-μij),二分类数据的 logistic模型为: logit(μij)=x′ijβ (i=1,…,m;j=1,…,n) (1)
即: log{μij/(1-μij)}=xij1β1+…+xijpβp (2)
表 2 logistic模型Ⅰ拟合结果 Tab 2 Fitted result of logistic model 1
第二军医大学学报Academic Journal of Second Military Medical University1999年 7月 第20卷 第7期 Vol
第二军医大学学报
Academic Journal of Second Military Medical University 1999年 7月 第20卷 第7期 Vol.20 Nol.7 1999
3 实例分析与讨论
对表1资料进行分析。以yij表示第i个患者第j次观测时的呼吸道状况,i=1,…,111,j=1,…,4,μij表示 yij的均值,协变量为:研究中心xi1、处理xi2、性别xi3、年龄xi4,以及基准呼吸状况xi5。令:
利用logit连接函数 h(x)=log{x/(1-x)} 针对两种相关阵结构:一阶依赖结构(DE-1),可交换结构(EXC),拟 合logistic模型。 logi t(μij)=β0+xi1β1+xi2β2+xi3β3+xi4β4+xi5β5
第二军医大学学报Academic Journal of Second Military Medical University1999年 7月 第20卷 第7期 Vol
2 P M 28 0
0 0 0 0 58 A M 25 0
0111
3 A M 23 1
1 1 1 1 59 A M 58 1
1111
相关文档
最新文档