生存分析-cox 回归与sas应用总结
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Cox 回归分析是生存分析的一种半参数分析方法。
COX回归用于研究各种因素(称为协变量,或伴随变量等)对于生存期长短 的关系,进行多因素分析。
h(t,x)=h0(t)exp(1x1 + 2x2 +••••••+ mxm ) X1,X2,••••,Xm是协变量 1 ,2,••••••,m是回归系数,由样本估计而得。 I >0表示该协变量是危险因素,越大使生存时间越短 I <0表示该协变量是保护因素,越大使生存时间越长 h0(t)为基础风险函数,它是全部协变量X1,X2,••••,Xm都为0或标准状 态下的风险函数,一般是未知的。
最大似然法
最大似然法
参数检验 F-test t-test
参数解释 回归系数b
似然比检验 Wald检验 score检验
优势比OR
似然比检验 Wald检验 score检验
RR
样本含量 至少变量数的10倍 至少变量数的20倍 非截尾例数至少变 量数的10倍
应用
因素分析 预测预报 Y
因素分析
因素分析
预测、判别P(Y=1) 生存预测 S(t)
多元线性回归
logistic回归
Cox回归
数据类型 Y数值变量
Y分类变量
Y二分类变量+时间
X数值变量、分类变量、等级变量
模型结构 Y=1x1 + 2x2 +•••+ mxm 变量筛选 前进法;后退法;逐步法
h(t,x)=h0(t)exp(1x1 + 2x2 +•••+ mxm )
参数估计 最小二乘法
生存资料的分析方法
描述 -生存时间 生存率 风险率 • 非参数法 -KM法 、寿命表 (LIFETEST) • 参数法- 指数模型、Weibull模型、Gompertz模型 ( LIFEREG) • 半参数法- COX回归 (PHREG)
Cox 回归分析是生存分析的一种半参数分析方法。 优点: 多因素分析方法 不考虑生存时间分布 利用截尾数据
----------------------------------------------------------
指标
回归系数
P值
相对危险度
----------------------------------------------------------
肿瘤部位中段
-0.7169
0.0469
0.488
生存分析(Survival analysis)是指根据试验或调查得到 的数据对生物或人的生存时间进行分析和推断,研究生存 时间和结局与众多影响因素间关系及其程度大小的方法, 也称生存率分析或存活率分析。
生存资料特点 : 1 生存时间的分布一般为非正态分布
指数分布,对数正态分布 ,Weibull分布, Gamma分布,……
2.【模型选项】 TIES=估计生存率方法
BRESLOW : 使用Breslow的近似似然估计,为默认的选项 DISCRETE :用离散Logistic模型替代比例风险模型,多用于m:n的Logistic回归 EFRON : 使用 Efron的近似似然
肿瘤部位下段
-1.0077
0.0068
0.365
深度
0.3585
0.0007
1.431
TNM分期
0.1603
0.0003
1.174
未分化癌
0.7019
0.0385
2.018
淋巴结转移数
0.2703
0.0001
1.310
---------------------------------------------------------COX回归方程为:
成比例风险模型检验:((最大似然法迭代 )(似然比
模型参数的检验:似然比、比分检验和Wald检验
PHREG过程的语法格式如下: PROC PRREG [过程选项]; MODEL <生存时间变量*截尾指示变量(数值)>=<自变量名> /[模型选项]; STRATA <分层变量名列>; FREQ <变量名列>; BY <分组变量名列>; RUN;
COX回归的应用:
(1)因素分析 分析哪些因素(协变量)对生存期的长短有显著作用。 对各偏回归系数作显著性检验,如显著,则说明在排除其它因素的影
响后,该 因素与生存期的长短有显著关系。
(2)求各因素在排除其它因素的影响后,对于死亡的相对危险度(或比 数比)
如某因素Xi的偏回归系数为bi, 则该因素Xi对于死亡的比数比为exp(bi) 当Xi为二值变量时,如转移(1=转移,0=不转移) exp(bi)为转移相对于不转移对于死亡的相对危险度(或比数比)
COX回归的应用:
(3)比较各因素对于生存期长短的相对重要性 比较各标准化偏回归系数bi’ 绝对值的大小,绝对值大的对生存期长
短的作用也大。 (4) 考察因素之间的交互作用
如考察XL和XK之间的交互作用是否显著,再增加一各指标:XLK= XL*XK ,如其偏回归系数bLK显著,则XL和XK之间的交互作用显著。
2 含Fra Baidu bibliotek截尾数据(censored data) 截尾数据提供的信息是不完全的 是否出现、何时出现结局不知道
生存资料的分析 估计: Kaplan- Meier法,寿命表法 比较: log-rank检验 影响因素分析:Cox比例风险回归模型(Cox回归模型),是生
存分析中最重要的模型之一。 预测: Cox回归模型预测生存率。
h(t,x)=h0(t)exp(-0.7169X3b - 1.0077X3c+ 0.3585X4+0.1603X5+0.7019X8c +0.2703X9)
侵及深度越深,TNM分期越大,淋巴结转移数越多,则生存期越短; 细胞类型为未分化癌的生存期短
肿瘤部位中段或下段的比上段生存期长。
PHREG(proportional harzard regression,比例风险回归)过程基于 Cox比例危险模型对生存数据进行回归分析,结局变量(因变量)为生存 时间,可以处理生存时间有截尾的数据。模型中的自变量可以是连续性、 分类变量、时间依存的自变量。
1.【过程选项】 NOPRINT 不打印输出 NOSUMMARY 不打印输出事件和截尾数值 SIMPLE 输出MODEL 语句中每一个说明变量的简单的描述统计量。
PHREG过程的语法格式如下: PROC PRREG [过程选项]; MODEL <生存时间变量*截尾指示变量(数值)>=<自变量名> /[模型选项]; STRATA <分层变量名列>; FREQ <变量名列>; BY <分组变量名列>; RUN;