COX回归分析副本
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Cox模型中回归系数的检验
• 假设为 H0: ,其它参数β固定; 0 k • H1: ,其它参数β固定。 0 k • H0 成 立 时 , 统 计 量 Z = bk / SE(bk) 服从标准正态分布。SE(bk)是回归系数bk的 标准误。
6、Cox回归模型的作用
(1) 可以分析各因素的作用 (2)可以计算各因素的相对危险度 (relative risk,RR) (3)可以用 β1x1+β2x2+…+βpxp(预后 指数)估计疾病的预后。
•
设第i个因素的回归系数为bi,对应的风险比(risk ratio,记 为RRi): RRi=exp(bi),表示该因素每增加一个单位时,风险 度改变多少倍。
• 在本例中放疗X5,取值0和1,b=-1.589, RR=0.204,表示因 子水平1与0比较,前者的风险度是后者的0.204倍 (20.4%),提示“放疗”是有利因素。“鼻血”X4取值是 0、1、2, b=1.38, RR=3.978,表示因子水平每增加1个等级, 风险度增加3.978倍,提示“鼻血”是不利因素。
• 5. 生存曲线(选入2个变量的模型)源自文库
9.COX回归应该注意事项
1.COX模型的基本假定是比例风险假定(PH)。只有满足该假 定的前提下,基于此模型的分析预测才是可靠和有效的。 即资料除满足基本要求外,还要求因素对生存时间的作用 不随时间变化(比例风险假定)。如观察年限超过10年时, 癌症手术后放疗的治疗作用可能逐渐消失,从而不满足这 一要求。 2.检查某自变量是否满足PH假定,最简单的方法是观察按该 变量分组的Kaplan-Meier生存曲线,若生存曲线明显交叉, 提示不满足PH假定。图形法有一定的主观性,但由于图法 简便、直观。在实际中很常用。 3.COX比例风险回归模型所需样本含量的经验估算方法是至 少需要相当于协变量个数10-15倍的阳性结局事件数。
编 项目登记 观察记录 号 性别 年龄 分期 鼻血 放疗 化疗 开始日 终止日 结局
…
51
…
2
…
2
…
1
…
0
…
…
…
…
2363
88-12-1 95-5-22 1
注:性别‘ 1’ 为男性、放疗‘ 1’ 表示采用,‘ 0’ 表示未采用、结局 ‘1’表示死亡。
3.SPSS 软件实现方法
• File→Open→相应数据(已存在)→ Analyze→ Survival→Cox regression →Time(dat)→Status →Define event →single value(1) →Continue → Covariates(自变量) →method → Fkward→Continue →
Step 2
a. Residual Chi Square = 9.374 with 5 df Sig. = .095 b. Residual Chi Square = 2.790 with 4 df Sig. = .594
Variables in the Equation Step 1 Step 2 X4 X4 X5 B 1.084 1.381 -1.589 SE .421 .530 .695 Wald 6.630 6.799 5.221 df 1 1 1 Sig. .010 .009 .022 Exp(B) 2.957 3.978 .204
• Options→Correlation of estimate→ Display model→at last step→Entry-removal (0.05,0.10)→Maximum iterations(20)→ Continue→OK
Case Processing Summary N Cases available in analysis Cases dropped Event a Censored Total Cases with missing values Cases with non-positive time Censored cases before the earliest ev ent in a stratum Total 15 1 16 0 0 0 0 16 Percent 93.8% 6.3% 100.0% .0% .0% .0% .0% 100.0%
10.临床随访研究的缺点:
• 随访研究容易造成失访。当失访率 高于50%时,研究失败; • 随访时间可能很长; • 各组间不易达到均衡一致,缺乏可 比性; • 常伴有主观因素的影响,盲法观察 不易实施。
小结
Cox回归与多重线性回归、logistic回归 的比较
多重线性回归 数据类型 Y数值变量 logistic回归 Y分类变量 Cox回归 Y二分类变量+时间 X数值变量、分类变量、等级变量
Cox比例风险回归模型
ln(h(t)/ h0(t))=β1x1+β2x2+…+βpxp
参数β 1,β2…,βp称为偏回归系数 , 由于h0(t)是未知的,所以COX模型称为半参 数模型。 COX比例风险函数的另一种形式: h(t)= h0(t)exp(β1x1+β2x2+…+βpxp)
4. 流行病学意义
a. Beginning Block Number 0, initial Log Likelihood function: -2 Log likelihood: -61.344 b. Beginning Block Number 1. Method: Enter
Variables in the Equation X1 X2 X3 X4 X5 X6 B .262 .053 -1.274 1.106 -2.587 -.541 SE .896 .053 1.261 .618 1.114 .848 Wald .085 .995 1.020 3.201 5.397 .407 df 1 1 1 1 1 1 Sig. .770 .318 .312 .074 .020 .524 Exp(B) 1.299 1.054 .280 3.023 .075 .582
Variables in the Equation Step 1 Step 2 X4 X4 X5 B 1.084 1.381 -1.589 SE .421 .530 .695 Wald 6.630 6.799 5.221 df 1 1 1 Sig. .010 .009 .022 Exp(B) 2.957 3.978 .204
(1)向前法(forward
7、筛选变量(逐步COX回归分析)
selection)
(2)后退法(backward selection) (3)逐步回归法 逐步引入-剔除法(stepwise selection) SPSS实现方法与Logistic回归相同
Enter和Remove的确定同前
调试法:P从大到小取值0.5,0.1, 0.05,一般实际用时, Enter , Remove应多次选取调整。
Cox回归分析 (Cox regression)
Cox回归分析(Cox regression)
• 影响生存时间的长短不仅与治疗措施有关 , 还 可能与病人的体质 , 年龄 , 病情的轻重等多种 因素有关。 • 如何找出它们之间的关系呢?对生存资料不能 用多元线性回归分析。 • 1972 年英国统计学家 Cox DR. 提出了一种能处 理多因素生存分析数据的比例危险模型 ( Cox's proportional harzard model)。
模型结构
变量筛选 前进法;后退法;逐步法 参数估计 最小二乘法 参数检验 F-test t-test 参数解释 回归系数b 样本含量 至少变量数的10倍 应用 因素分析 预测预报 Y 最大似然法 似然比检验 Wald检验 score检验 优势比OR 至少变量数的20倍 最大似然法 似然比检验 Wald检验 score检验 RR 非截尾例数至少变 量数的10倍
1、数据结构
设含有p个变量x1, x2,…,xp及时间T和结局C的 n个观察对象. 其数据结构见表1。
表1
实验对象 t
COX模型数据结构
C X1 X2 X3
1 2 3 … n
t1 t2 t3 … tn
1 0 0 … 1
a11 a21 a31 … an1
a12 a22 a32 … an2
a13 … a23 … a33 … … … an3 …
…. XP
a1p a2p a3p … anp
2、COX回归模型 (Cox regression model)
(1)风险率(hazard rate):
患者在t时刻仍存活,在时间t后的瞬间 死亡率,以h(t)表示。
h(t )
死于区间(t , t t )的病人数 在t时刻尚存的病人数 t
3.COX回归模型的构造
•
8.实例分析
例.某医师对1988年收治的16例鼻腔 淋巴瘤患者随访了13年,数据见表7, 试作COX回归。
•
1 2 3 … 16 1 0 0 … 0 45 36 45
表2
2 2 2 2 2 0
鼻腔淋巴瘤患者随访资料
整理
生存天数 578 1549 4717 0 0 1 1 1 0 88-1-17 89-8-17 1 88-1-21 92-4-17 1 88-2-2 90-12-31 0
4. 生存曲线不能随意延长,也不能轻易用 于预测预报,经过大量研究所得的生存 曲线才有可能推广应用。 5.模型拟合优度考察: 据预后指数 PI(prognostic index)分组, 比较各组基于Cox模型的生存曲线与基于 kaplan-Meier 法估计的生存曲线,如两 组曲线吻合较好,表明Cox模型拟合较好。
Total a. Dependent Variable: DAY
Omnibus Tests of Model Coefficientsa,b Overall (score) -2 Log Likelihood Chi-square df 45.145 14.783 6 Change From Previous Step Change From Previous Block Sig. Chi-square df Sig. Chi-square df Sig. .022 16.199 6 .013 16.199 6 .013
变量xj暴露水平时的风险率与非暴 露水平时的风险率之比称为风险比HR (hazard ratio)
HR= eβi
HR风险比 相对危险度RR
偏回归系数及意义
1. 若危险因素为二值变量,其偏回归系数表示当 其他自变量固定时,相对危险度的对数值;
2. 若危险因素为等级变量,偏回归系数表示当其 他自变量不变的情况下,变量每改变一个等级, 两个相邻等级的RR值增加exp(bi)倍;
3. 若危险因素为连续性变量,偏回归系数表示当 其他自变量不变的情况下,变量每改变(增加) 一个单位,其RR值变化(增加) exp(bi)倍。
5.Cox回归模型的检验
•
• • •
• •
对Cox模型的检验采用似然比检验。 假设为H0:所有的βi 为0 , H1:至少有一个 βi 不为0 。 将Ho和H1条件下的最大部分似然函数的对数 值分别记为 LLP (H1 ) 和 LLP ( H1 ) 可以证明在H0成立的条件下,统计量 χ2=-2[ LLP ( H1 ) - LL P ( H 0 ) ] 服 从自由度为p的χ2分布。
•
多元线性回归模型:
ˆi y
b0 b1 x1i b2 x2i
1 X1
bp x pi
pXp
Logistic回归模型:
ln[ p /(1 p)]
0
设不存在因素X1、X2 、Xp的影响下, 病人t 时刻死亡的风险率为h0(t), 存在因素X1、 X2 、Xp t的影响下, t时刻死亡的风险率为h(t). 用死亡率的比 h(t)/h0(t) 代替P/(1-P)即得。
Covariate Means X1 X2 X3 X4 X5 X6 Mean .500 44.625 2.063 1.250 .563 .625
Zhubu:Block1: Method = Forward Stepwise (Wald)
Variables not in the Equationa,b Step 1 X1 X2 X3 X5 X6 X1 X2 X3 X6 Score 1.320 .220 .019 6.144 .488 .016 .712 .867 .692 df 1 1 1 1 1 1 1 1 1 Sig. .251 .639 .891 .013 .485 .900 .399 .352 .406