条件LOGISTIC回归

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ij
设1:1配对资料中第i对的结果为 yi1 =1, 则相应的条件概率为 Pr{yi1=1,yi2=0|yi1=1,yi2=0 or yi1=0,yi2=1}
Pr {yi1 =1,yi2 =0|yi1 =1,yi2 =0 or yi1 =0,yi2 =1} = Pr yi1 = 1} Pr yi 2 = 0} + Pr yi1 = 0} Pr { yi 2 = 1} Pr yi1 = 1} Pr { yi 2 = 0}
配伍回顾性研究
以一个病例(Case)或发生感兴趣事件配以一个 或多个对照(Control) 收集病例与对照是否暴露于某些风险因素(解释 变量) 可建立预测模型,由给定的解释变量值预测此感 兴趣的事件
样本要求
样本含量大于200时,可以不必考虑参数估计的偏差 配对组数不应少于50(协变量多时还应增加);也可考 虑增大对照数
1 2
概 述
配对设计 两分类反应变量 如果将配对设计资料的“对”看作为“层”时,配对 设计资料可看作高度分层的资料 一般logistic回归需要估计的参数较多,对样 本容量要求较高,配对资料一般不能满足此 要求
3
概 述
配对研究,不关心层因素的作用 条件logistic回归采用条件似然函数,在构造 条件似然函数时溶入了对层因素的考虑,最 后在模型中消去反映层因素的参数,从而减 少了模型中要估计的参数个数,降低了对样 本容量的要求 应用于配对前瞻性研究资料,配对回顾性研究 资料,交叉设计等资料
需先建立病例(或给定事件)有暴露的条件概率。 然后,应用Bayes理论,求相应的关于事件的 条件概率
13 14
条件似然函数
设研究中有q个配伍对,h=1,2,…,q,θhi 为第h个配伍对中第i个观察单位为病例的概 X 率(i=1,2)。 hi 为第h个配伍对中第i个观察 单位的解释变量的向量 1:1配对中在给定结果(病例还是对照)条件 下观察到特定解释变量的条件概率:即观察值 h1为病例(e)的条件下解释变量为Xh1 且观 察值h2为对照( e )的条件下解释变量为Xh2 的条件概率为: Pr{X h1 e}Pr{X h2 e }
全部配对资料的条件似然函数为:
L=∏
9
exp[β + γ ' ( z i1 − z i 2 )] i =1 1 + exp[β + γ ' ( z i1 − z i 2 )]
q
10
与非条件logistic回归的区别在于
截距β表示处理的效应 反应变量描述一对观察的结果,反应变量取1表 示{ yi1=1且 y i 2 =0},反应变量取值0表示{ yi1 =0且 y i 2 =1}。 解释变量是一对观察的解释变量的差值
程序8.1
Variable INTERCPT AGE SEX SPORT DF 1 1 1 1 Parameter Standard Wald Pr > Standardized Estimate Error Chi-Square Chi-Square Estimate -1.1638 0.4391 7.0257 0.0080 . 0.3344 0.1986 2.8354 0.0922 0.631487 0.4907 0.6060 0.6557 0.4181 0.268576 -2.5322 1.1651 4.7234 0.0298 -0.686192 Odds Ratio . 1.397 1.633 0.079
Βιβλιοθήκη Baidu
率。令 θhi = Pr {e X hi } 则有
1 − θ hi = Pr {e X hi }
θ h1 (1 − θ h 2 ) θ h1 (1 − θ h 2 ) + θ h 2 (1 − θ h1 )
hi
将第h配伍层的Logistic模型θ 条件概率变为
=
exp {α h + β ' X hi } 1 + exp {α h + β ' X hi }代入
4
配对的前瞻性研究
分析方法
用变量差值拟和:logistic 用分层的COX模型拟和:phreg
在分层的cox模型中,各层的基础风险函数h0(t)之间是 独立的 cox模型属于半参数方法,拟和时不需估计基础风险函 数h0(t),只估计各协变量的系数;这与配对logistic回 归中不关心α大小只估计β是一致的
15
观察值h1为对照的条件下解释变量为Xh1且观 察值h2为病例的条件下解释变量为Xh2的条件 Pr 概率为: { X e } Pr { X e} 对h配伍组中病例的解释变量为Xh1 ,且对照 解释变量为Xh2的条件概率为
h1 h2
Pr{X h1 e}Pr{X h2 e } + Pr{X h1 e }Pr{X h1 e}
Pr{X h1 e}Pr{X h2 e }
16
根据Bayes定理 P(A B ) = P(B A)P( A) / P( B) 上式可等于: Pr {e X }Pr {e X } Pr {e X }Pr{e X }+ Pr{e X }Pr{e X } 条件概率变为以解释变量为条件的病例或对照的概
h1 h2 h1 h2 h1 h2
第h配伍层的 ah效应被抵消了,只剩下解释变量向量及其对 应的参数向量 β ′ q exp{β ' ( X h1 − X h 2 )} 条件似然函数为 ∏ 1 + exp{β ' ( X h1 − X h 2 )} h =1 与非条件似然函数相似,注意:1.该配对数据的条件似然函 数即为当反应变量恒为1或任意常数时Logistic回归模型非条 件似然函数。2.模型中没有截距。3.其协变量的值为病例和 对照相应的解释变量的差值。 当 xh1k = xh 2 k (对所有k)时,由于它们对似然比的贡献恒为 0.5,在模型中不提供信息,可被剔除。
1 + exp{β '( X h1 − X h 2 )}
17 18
exp {β '( X h1 − X h 2 )}
3
代表处理因素作用的截距β的比数比 e −1.1638 =0.312,饮药茶 组患感冒风险低于安慰剂组 参加健身运动的情况(SPORT)比数比 e −2.5322 =0.079 ,经常参 加健身运动者不容易患感冒(平衡了年龄和性别的作用后 )
11 12
2
配伍回顾性研究
应用注意
各个yi(i=1,…,n)应互相独立,不可用于传染病研究 各观察对象的观察时间长短相同 适用于1:1配对,需要计算差值
条件LOGISTIC回归
邓 伟 2010.3
研究某种传统中药茶预防冬季感冒的效果。 68对身体健康,但自述以往冬季难免感冒的 夫妻自愿参加了该项研究。从当年10月1日至 12月31日,随机安排每对夫妻中的一位(夫或 妻)每天早晨饮一次药茶,同时,另一位(妻或 夫)则饮安慰剂。收集的变量还包括年龄,性 别和参加健身运动的情况。反应变量为在该 年11月和12月是否患过感冒。
= exp ⎡ β + γ ' ( zi1 − zi 2 ) ⎤ ⎣ ⎦ 1 + exp ⎡ β + γ ' ( zi1 − zi 2 ) ⎤ ⎣ ⎦
Pr{yi1=0}Pr{yi2=1}
exp{α i + γ ′zi 2 } 1 = × 1 + exp{α i + β + γ ′zi1} 1 + exp{α i + γ ′zi 2 }
y i 2 =0,
{
{
{
{
7
8
将logistic模型代入: Pr{yi1=1}Pr{yi2=0}
exp{α i + β + γ ′zi1} 1 = × 1 + exp{α i + β + γ ′zi1} 1 + exp{α i + γ ′zi 2 }
Pr{yi1=1,yi2=0|yi1=1,yi2=0 or yi1=0,yi2=1}
y ij 为第i对第j个观察的结果,i=1,…,q
y ij =1表示观察结果为阳性,y ij =0表示观察结果为阴性。
x x 处理因素, =1表示处理(病例), ij =0表示非 处理(对照) z ij =(z ,...,z )ˊ表示t个解释变量参数 ij1 ijt α i 第i层(第i配对)的效应参数 β 处理效应参数 γˊ=(γ1, γ2,... γt) 解释变量的效应参数向量 有q+1+t个参数 x ij
某随机临床试验,有=1,...,q个中心被随机选 择。且在每个中心随机选择一个病人用试验 药物,随机选另一病人用安慰剂。考察病人 的病情是否有好转 主要目的:考察处理的作用 这是以中心为层的1:1配对资料,按logistic 回归模型:
5
6
1
条件概率
Pr {y ij = 1} = π ij = 1 + exp(α i + βxij + γ ' z ij ) exp(α i + βxij + γ ' z ij )
相关文档
最新文档