10生存分析+R语言代码surv
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目 录
1
生存函数和危险函数 生存分析数据的 Cox 回归模型
2
. . .
. .
.
. . . . . . . .
. . . . . . . .
. . . . . . . . .
. .
. .
. .
. .
.
吴喜之
短标题
生存函数和危险函数 生存分析数据的 Cox 回归模型
生存分析数据的 Cox 回归模型
生存函数并不是一成不变的, 它可能是一些自变量的函数. Cox 比例危险回归 模型把生存函数的某种变换形式描述成自变量的线性函数. 如用 X 代表自变 量向量, 则 Cox 比例危险回归模型为 ln h(t) = ln h0 (t) + X⊤ β 或者 h(t) = h0 (t) exp(X⊤ β ),
Survival Functions
1.0
TX=1 TX=2 0.8 S(t) 0.0 0 0.2 0.4 0.6
500 t
1000
1500
. . .
. .
.
. . . . . . . .
. . . . . . . .
. . . . . . . . .
. .
. .
. .
. .
.
吴喜之
短标题
生存函数和危险函数 生存分析数据的 Cox 回归模型
1 Original by Gareth Ambler and modified by Axel Benner (2010). mfp: Multivariable Fractional Polynomials. R package version 1.4.9. . . . . . . . . . . . . . . /package=mfp. . . . . . . . . . . . . . . . 吴喜之 短标题
变量 CASE 和 ENTRY.DT 不能参与建模, 应该删去. 并删除两个有缺失的观测值, 合并 COND 的有些水平, 整理过 的数据就是 193 × 11(pharynx1.csv). a
可以从网站 /statdata/statdata/stat-nonlin.html 下
生存函数和危险函数 生存分析数据的 Cox 回归模型
生存分析
R 软件陪同 吴喜之
December 20, 2014
. . .
. .
.
. . . . . . . .
. . . . . . . .
. . . . . . . . .
. .
. .
. .
. .
.
吴喜之
短标题
生存函数和危险函数 生存分析数据的 Cox 回归模型
吴喜之 短标题
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
生存函数和危险函数 生存分析数据的 Cox 回归模型
下面我们用程序包mfp1 来尝试关于 Cox 比例危险模型的多重分 数多项式模型 (multiple fractional polynomial model). 这种方法类 似于多项式回归, 但更加灵活, 而且自动进行逐步回归及变量选 择. 参见 Ambler and Royston (2001). 代码为:
变量名 CASE INST SEX TX GRADE AGE COND SITE T.STAGE N.STAGE ENTRY.DT STATUS TIME
性质 哑元型定性变量 哑元型定性变量 哑元型定性变量 哑元型定性变量 哑元型定性变量 定量变量 哑元型定性变量 哑元型定性变量 哑元型定性变量 哑元型定性变量 整数 哑元型定性变量 整数
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
载.
吴喜之 短标题
生存函数和危险函数 生存分析数据的 Cox 回归模型
u=read.csv("D:/2010stat/pharynx1.csv") library(survival) fit <- survfit(Surv(TIME, as.numeric(STATUS)) ~ TX, data=u) plot(fit,lty=1:2, ylab="S(t)",xlab="t", main='Survival Functions',col=c(2,4)) legend(1500,1,c("TX=1","TX=2"),lty=1:2,col=c(2,4))
输出结果表明 R2 为 0.248, 对模型的似然比检验的 p 值为 2.383 × 10−5 , Wald 检验的 p 值为 1.197 × 10−5 , Score 检验的 p 值为 1.439 × 10−6 . 除了 R2 稍小 之外, 似乎拟合得还可以. 当然, 从输出结果来看, 许多变量并不显著. 因此可 以减少一些变量, 这就留给读者去做了.
式中, h0 (t) 表示待估计的基本危险函数, 它与自变量 X 无关. 现在用 Cox 比例 危险回归模型来拟合口咽癌数据. 代码如下:
library(survival) fit=coxph(Surv(TIME,as.numeric(STATUS))~.,data=u)#Cox回归模 plot(survfit( fit)) #拟合的生存函数 summary(fit)#回归结果
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. .
. .
. .
.
吴喜之
短标题
生存函数和危险函数 生存分析数据的 Cox 回归模型
Example
口咽癌数据 (pharynx.csv, pharynx1.csv) 这个来自 Kalbfleisch and Prentice (1980) 的数据 a , 基于美国 Radiation Therapy Oncology Group 的几个机构针对口咽若干位置的鳞状细胞癌的临床试验. 该试验分成两组, 其中一组仅仅使 用放疗 (TX=1), 而另一组则同时使用放疗和化疗 (TX=2). 原始数据 pharynx.csv 为 195 × 13 的矩阵. 口咽癌数据变量情况 描述 编号 机构代码 性别 (1,2) 实验代码 (1: 标准,2: 处理) 和正常细胞的区别度 年龄 身体状况 病变位置 癌症 T 分期 癌症 N 分期 进入试验日期 删失 (0: 右删失, 1: 死亡) 如未删失, 则是存活时间, 否则是最后记录时间 (天数)
. .
. .
. .
. .
. ..Biblioteka 生存函数和危险函数 生存分析数据的 Cox 回归模型
. . .
. .
.
. . . . . . . .
. . . . . . . .
. . . . . . . . .
. .
. .
. .
. .
.
吴喜之
短标题
目 录
1
生存函数和危险函数 生存分析数据的 Cox 回归模型
2
. . .
. .
.
. . . . . . . .
. . . . . . . .
. . . . . . . . .
. .
. .
. .
. .
.
吴喜之
短标题
生存函数和危险函数 生存分析数据的 Cox 回归模型
生存函数和危险函数
在生存分析中, 研究的主要对象是寿命超过某一时间的概率. 它 还可以描述其他一些事件发生的概率, 例如产品的失效、出狱犯 人首次犯罪、失业人员首次找到工作、青少年首次吸毒等. 令 T 为表示寿命的随机变量, 累积分布为 F(t) = P(T ⩽ t), 密度 为 f(t), 而活过时间 t 的概率为 S(t) = P(T > t) = 1 − P(T ⩽ t), t > 0. 式中的 S(t) 称为生存函数 (survival function). 除了生存函数之 外, 还有危险函数 (hazard function) 的概念, 用 h(t) 表示, 它实际 上是 − ln S(t) 关于 t 的导数: P(t ⩽ T ⩽ t + ∆t|T ⩾ t) ∆t→0 ∆t f(t) d F(t + ∆t) − F(t) = = [− ln S(t)]. = lim ∆t→0 [1 − F(t)]∆t S(t) dt ∫t 累积危险函数为 H(t) = 0 h(u)du. 生存函数、危险函数、累积危 险函数在数学上等价. h(t) = lim
library(mfp) f=mfp(Surv(TIME,as.numeric(STATUS))~fp(AGE, df=4,select=0.0 +INST+SEX+TX+GRADE+COND+SITE+T.STAGE+N.STAGE, family=cox,data=u) print(f)#输出结果 (rsq=1-sum((f$residuals)^2)/sum((u$TIME-mean(u$TIME))^2))#R 输出的结果列在下面. 此外, 似然比检验的 p 值为 1.327 × 10−5 , R2 为 0.999, 比前面的拟合结果要好.