cox回归结果解析 - 360文档中心

合集下载

相关主题

比例风险回归模型

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

筛选变量的方法：第一步，结合临床，临床认为有关的变量均筛选出来。

第二步.应用双变量的相关分析，把显著相关的变量筛选出来，保留临床意义更大的那个。

第三步，应用Kaplan-Meier法对每个危险因素的两个暴露水平做生存曲线，若曲线存在交叉，则不能应用Cox生存分析（Cox生存分析也称比例风险回归，它包含一个假定，即在随访期间暴露于预后因素与非暴露的风险比例维持恒定），这类变量需应用更复杂的非比例风险回归模型，这里将不详述了。

第四步，单因素分析。

可应用COX生存分析的第0步结果作为单因素分析的结果。

可在SPSS的Cox回归里选择任何一种前进法，在Option中选择at each step，取因子筛选第0步的Score检验结果作为单因子Cox回归分析的结果。

也有文章的单因素分析对于离散型变量应用卡方检验和连续型变量应用t检验，等级资料应用双变量相关分析。

最后，将进行Cox回归分析。

应用SPSS中analysis-survival-cox regression.在time一栏中选择生存时间；在state一栏中选择数据状态（在数据编码中已经介绍），在激活的define event一栏中设定single value为1。

这里要强调几个小问题：1，SPSS可以支持研究者做两个或以上的变量的共同效应，需在主对话框中同时选中需研究的变量两个或两个以上，这样协变量框中的>a*b>才会被激活。

2，分类变量，在这里被称为哑变量，需单击categorical，然后将分类变量选入对话框。

最后得到的结果，B为协变量的系数，Exp（B）为相对危险度。

可得到比例风险模型：h（t，x）=h0（t）exp（Σβ ixi）公式1－1
预后指数也称预后得分，PI(prognostic index)= （Σβ ixi）
PI=0代表危险率处于平均水平，PI<0，代表危险率低于平均水平；PI>0，代表危险率高于平均水平。

由公式1－1可以求得全部病人的预后指数。

将所有的预后指数做等级变换，例如分组的界点PI＝-1，0，1，以PI为分类变量做COX回归，并估计生存率，便获得预后指数分类生存率，若样本量很大，或代表性比较好，可用内插法分别估计不同预后指数水平的人群的k年生存率，以及中数生存期，编制成参照表，便可用于临床，根据每个病人的PI值，预测其存活k年的概率，以及期望的生存年数。

最后一段摘自方积乾主编的第二版《医学统计学与电脑试验》。

如果我们能够象国外一样做大规模多中心前瞻的研究，我一定要做到最后一步。

其实这个问题关键还是在你自己，就是你为何要定义分类变量？如果变量是连续变量或者是具有等级关系的，那么一般是不定义为分类变量的，比如年龄，身高，体重等等。

如果变量的数值之间没有等级关系，比如组别，我们用1表示A组，2表示B性，3表现C组，这个在分析的时候是需要定义为分类变量的，因为这个数值的大小是没有意义的。

所以关键怎么选择，还是需要看楼主这几个变量所代表的具体意义。

COX回归时如果需要分析的自变量中为有序多分类，为保证结果的准确性，应将其指定为亚变量进行分析(严格的讲，两分类变量也应进行指定，但不指定时的分析结果是等价的)，所以您定义为categorical后的计算结果是可信的
the final multivariate Cox regression model, xx was identified as an independent prognostic factor with an adjusted hazard ratio of 1.60 (95% confidence interval 1.07–2.41)”,而有的文章则是这样描述“Cox regression indicated that ING4 expression is an independent prognostic factor for overall 5-year survival (Relative risk = 2.50, 95% confidence interval = 1.09–5.74, P = 0.031)”请问这两种描述有什么区别？hazard ratio与relative risk又有什么不同？谢谢大家！
相关疾病：
•
•
1、Enter：所有自变量强制进入回归方程；
2、Forward: Conditional：以假定参数为基础作似然比概率检验，向前逐步选择自变量；
3、Forward: LR：以最大局部似然为基础作似然比概率检验，向前逐步选择自变量；
4、Forward: Wald：作Wald概率统计法，向前逐步选择自变量；
5、Backward: Conditional：以假定参数为基础作似然比概率检验，向后逐步选择自变量；
6、Backward: LR：以最大局部似然为基础作似然比概率检验，向后逐步选择自变量；
7、Backward: Wald：作Wald概率统计法，向后逐步选择自变量。

--------------------------------------------------------------------------------------------------------------
在自变量很多时，其中有的因素可能对应变量的影响不是很大，而且x之间可能不完全相互独立的，可能有种种互作关系。

在这种情况下可用逐步回归分析，进行x因子的筛选，可以很好地剔除一些对模型贡献不大的变量，这样建立的多元回归模型预测效果会比较好。

如下，变量非常多的情况：
y：历年病情指数
x1：前年冬季油菜越冬时的蚜量(头/株)
x2：前年冬季极端气温
x3：5月份最高气温
x4：5月份最低气温
x5：3~5月份降水量
x6：4~6月份降水量
x7：3~5月份均温
x8：4~6月份均温
x9：4月份降水量
x10：4月份均温
x11：5月份均温
x12：5月份降水量
x13：6月份均温
x14：6月份降水量
x15：第一次蚜迁高峰期百株烟草有翅蚜量
x16：5月份油菜百株蚜量
x17：7月份降水量
x18：8月份降水量
x19：7月份均温
x20：8月份均温
x21：元月均温
在变量较少或者是有很多变量没有意义的情况下，用ENTER比较好
forward用得最多，但据说backward效果更好，但两者结果基本一致的，差异的情况很少
我见过有的文章在做回归分析的时候，enter、forward、backward一起用
“多因素logistic回归分析结果：enter、forward、backward 3 种分析均提示慢性炎症状态是最强烈的危险因素，而血红蛋白增多、活动度增多、食欲改善具有保护性作用。

”
———1239例CKD并发营养不良和心血管疾病的多中心调查及中药干预的实验。