SPSS数据分析—生存分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生存分析是对生存时间进行统计分析的一种技术,所谓生存时间,就是指从某一时间点起到所关心的事件发生的这段时间。这里的时间不一定就是钟表日历上的时间,也有可能是其他的度量单位,比如长度单位等。

生存时间有两个特点:

1.存在删失,是指由于某种原因导致生存时间没用被准确或完整的记录下来,这种情况很常见,如果不存在删失,那么生存分析和一般统计方法没用太大区别,但是一旦出现删失,就必须考虑其影响,一般统计方法将不再适用。

2.生存时间非负,且分布常常右偏,导致基于正态分布理论的常规统计方法不适用。用生存分析就可以解决以上问题。

生存分析的几个就基本概念

1.事件

也称为失效事件,是指由研究者所规定的事件的结局,这在生存分析中是一个非常重要的概念,其定义应该非常明确,并且应该在研究开始阶段就要确定。失效事件并不一定是消极的,也可以是正面、积极的,这取决于研究目的。

2.生存时间

指从某一时间点起到所关心的事件也就是实效事件发生前的这段时间,生存时间的起点需要人为规定

3.删失

是指观察对象的终止观察并不是由于实效事件的发生,而是由于其他原因导致终止,这种情况往往不知道终止的时间点,因此会造成其时间数据不完整,并且删失需要在各组之间随机,如果删失的出现并不随机,则不能用生存分析

4.生存函数

用于描述生存时间分布的工具,当t=0时,生存函数取值为1,随着时间推移t 增大,生存函数的取值逐渐减小。

5.风险函数

也是用于描述生存时间分布,表示随机变量T已至时点t的条件下,在接下来的一瞬间失效事件发生的概率

生存分析的基本内有

1.刻画生存时间分布

2.生存时间分布的组间比较

3.评价生存时间分布影响因子的效果

生存分析可以分为参数法、半参数法、非参数法三种,参数法相当于非线性回归,半参数法有Cox回归,非参数法有寿命表法和Kaplan-Meier法,

SPSS中的生存分析都集中在生存函数过程中,下面我们分别介绍这几种方法

一、Kaplan-Meier法

分析—生存函数—Kaplan-Meier

例:现在有一组临床实验数据,抽取44名患者,被随机分到新药组和对照组,每组22名,对此进行生存分析研究,数据如下

可见记录生存时间数据至少需要两个变量,一个是时间变量,另一个是时间状态变量,用于表示该时间点是失效事件发生的时间还是删失的时间,如果有多个组别,还需要加上组别变量,因此本例中一共有三个变量,分别是时间变量,指示变量,组别变量,指示变量中,0表示没有删失,1表示失访,2表示研究结束时仍未发生失效事件

以上数据的组成样本量较小,并且每个观察个体的时间能够被准确记录,因此可以使用Kaplan-Meier法

二、寿命表法

Kaplan-Meier法仅适用于每个观察个体的时间能够被准确记录,但是有时候我们收集的数据组成为分段记录的,这时应该使用寿命表法

分析—生存函数—寿命表

例,对114名患者进行随访,数据如下

这种类型的数据组成形式非常类似于对计数资料分组之后的频数表,在本例中,time为时间变量,died为指示变量,0为删失,1为失效事件,num为人数。既然num为人数,那么首先还是要进行加权处理

三、Cox回归模型

分析—生存函数—Cox回归

K-M法和寿命表法都只适用于只有少数因子并且因子水平较少的情况(如果是连续变量还需要转化为分类变量),而Cox回归模型则比较擅长分析多因子多水平的生存分析,并且数据类型也没有限制。

Cox回归模型的基本思想是在风险函数和研究因子之间建立类似于广义线性模

型的关联,是一种半参数模型,需要满足比例风险性假定。比例风险性是指在协变量固定的情况下,个体风险率与基准风险率之比与时间t无关。

例:想研究某种治疗方法是否会延长患者生存时间,由于影响生存时间的因子有很多,因此为了正确估计,需要考虑其他因子的作用

由数据可知,除了时间变量time和指示变量censor之外,还有其他分组变量,并且组别的水平较多,数据类型较复杂,因此适用Cox回归模型进行分析

相关文档
最新文档