生存分析的概念
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、生存分析的概念:
将事件的结果和出现此结果所经历的时间结合起来分析的统计分析方法。
研究生存现象和响应时间数据及其统计规律的一门学科。
对一个或多个非负随机变量(生存时间)进行统计分析研究。
对生存时间进行分析和推断,研究生存时间和结局与众多影响因素间关系及其程度的统计分析方法。
在综合考虑相关因素(内因和外因)的基础上,对涉及生物学、医学(临床、流行病)、工程(可靠性)、保险精算学、公共卫生学、社会学和人口学(老龄问题、犯罪、婚姻)、经济学(市场学)等领域中,与事件(死亡,疾病发生、发展和缓解,失效,状态持续)发生的时间(也叫寿命、存活时间或失效时间,统称生存时间)有关的问题提供相关的统计规律的分析与推断方法的学科。
二、“生存时间”(Survival Time)的概念
生存时间也叫寿命、存活时间、失效时间等等。
医学:疾病发生时间、治疗后疾病复发时间
可靠性工程系:元件或系统失效时间
犯罪学:重罪犯人的假释时间
社会学:首次婚姻持续时间
人口学:母乳喂养新生儿断奶时间
经济学:经济危机爆发时间、发行债券的违约时间
保险精算学:保险人的索赔时间、保险公司某一索赔中所付保费
汽车工业:汽车车轮转数
市场学中:报纸和杂志的篇幅和订阅费
三、生存分析的应用领域:社会学,保险学,医学,生物学,人口学,医学,经济学,可靠性工程学等
六、生存分析研究的目的
1、描述生存过程:估计不同时间的总体生存率,计算中位生存期,绘制生存函数曲线。统计方法包括Kaplan-Meier(K-M)法、寿命表法。
2、比较:比较不同处理组的生存率,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗
方案较优。统计方法log-rank检验等。
3、影响因素分析:研究某个或某些因素对生存率或生存时间的影响作用。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。统计方法Cox比例风险回归模型等。
4、预测:建立Cox回归预测模型。
主要研究内容
描述生存过程:研究人群生存状态的规律,研究生存率曲线的变动趋势,是人寿保险业的基础。
生存过程影响因素分析及结局预测:识别与反应、生存及疾病等相关风险因素,预测生存结局,在临床中应用的非常广泛。
七、主要分析方法
1、参数法方法:首先要求观察的生存时间t 服从某一特定的分布,采用估计分布中参数的方法获得生存率的估计值。生存时间的分布可能为指数分布、Weibull分布、对数正态分布等,这些分布曲线都有相应的生存率函数形式。只需求得相应参数的估计值,即可获得生存率的估计值和生存曲线。
2、非参数方法:实际工作中,多数生存时间的分布不符合上述所指的分布,就不宜用参数法进行分析,应当用非参数法。这类方法的检验假设与以往所学的非参数法一样,假设两组或多组的总体生存率曲线分布相同,而不论总体的分布形式和参数如何。非参数法是随访资料的常用分析方法。
3、半参数方法:只规定了影响因素和生存状况间的关系,但是没有对时间(和风险函数)的分布情况加以限定。这种方法主要用于分析生存率的影响因素,属多因素分析方法,其典型方法是Cox比例风险模型。
4、几种常用的统计软件:SAS,SPSS,Stata,Excel,R
第二章数据类型
一、完全数据(Complete data)
每个个体确切的生产时间都是知道的。这样的数据称为完全数据(Complete data)。但在实际的生存分析中,数据在很多情况下是很难完全观察到的。
二、删失(Censoring )
生存数据一个重要的特点是:在研究结束时,无法获得某些个体确切的生存时间。例如:失去联系(病人搬走,电话号码改变),无法观察到结局(死于其他原因),研究截止,个体仍然存活……在这些情况下获得的数据就是删失数据(Censored data)。对存在删失的个体,只知道删失时间(Censoring time)。
删失分为右删失(Right censoring)、左删失(Left censoring)和区间删失(Interval censoring)1、右删失(Right censoring)。
在进行观察或调查时,一个个体的确切生存时间不知道,而只知道其生存时间大于时间L,则称该个体的生存时间在L上是右删失的,并称L为右删失数据(Right-censored data)。
右删失有三种类型(按结束时间差别):I型删失(Type I censoring)、II型删失(Type II censoring)和III型删失(Type III censoring)。
(1)I型删失(Type I censoring):对所有个体的观察停止在一个固定的时间,这种删失即为I型删失(或定时删失)。例如:动物研究通常是以有固定数目的动物接受一种或多种处理开始,由于时间和费用的限制,研究者常常不能等到所有动物死亡。一种选择就是在一个固定时间周期内观察,在截止时间之后仍可能有些动物活着,但不继续观察了。这些动物的生存时间是不知道的,只知其不小于研究周期时间。I型删失的删失时间是固定的。
图表 1 I型删失示例
(2)II型删失(Type II censoring):同时对n个个体进行观察,一直到有一固定数目(r < n)的个体死亡(失效)为止,这种删失即为II型删失。II型删失的删失时间是随机的。
图表 2 II型删失示例
(3)III型删失(Type III censoring):所有个体在不同时间进入研究,某些个体在研究结束之前死亡,他们的确切生存时间是知道的,其他个体在研究结束之前退出研究而不被跟踪观察或在研究结束时仍然活着。进入研究的时间可能不同,删失时间也可能不同,这种删失叫做III型删失,又称为随机删失(Random censoring)。
图表 3 III型删失示例
2、左删失(Left censoring)
研究对象在时刻开始接受观察,而在此之前我们感兴趣的时间已经发生,这就是左删失。例如:“您初次吸食大麻是在什么时候?” 有一种回答:“我吸食过,但我不记得吸食的具体时间了。”这些回答的吸食时间数据就是左删失。
通过测试确定儿童学会完成特定任务的年龄,有些儿童在进入研究前就已经可以完成某项特定任务,这些儿童的事件发生时间也是左删失。
出现左删失同时,也可能出现右删失,称为双删失(Double censoring)。例如:对吸食大麻的