应用统计学生存分析【精选】
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
06:17:35
Kaplan-meier过程
例1:3种疗法治疗66例白血病患者缓解时间(天),数据 (kaplanm.sav)如下 A疗法:4,5,9,10,11,12,13,28,28,28,29,31, 32,37,41,41,57,62,74,100,139,20+,258+,269 B疗法:8,10,10,12,14,20,48,70,75,99,103, 162,169,195,220,161+,199+,217+,245+ C疗法:8,10,11,23,25,28,28,31,31,40,48,89, 124,143,12+,159+,190+,196+,197+,205+,219+
变量名 caseno time censor
age trt sex bui ch p stage
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
生存分析方法
Kaplan-meier过程 这是一种非参数法,主要用于小样本,适用于能够准 确记录事件和删失发生时点的数据。 Life Tables过程 也叫寿命表法,适用于样本量大,且不太可能准确记 载每个观察对象的死亡或删失发生时间的数据。 Cox回归模型分析法 用于描述多个变量对生存时间的影响
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Life-Tables过程
例2:某医院对114名男性胃癌患者接受手术后的生存情况 进行了11年的随访,得到数据(lifetb.sav)如下
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Life-Tables过程
2019年9月12日星期四
当变量为二分类变量时,一般以死亡、复发、恶化等为 终结事件,如本例就是以恶化为终结事件,标记值为1,所 以在Single value框中输入1;如果生存状态变量取值为连续 变量时,则在Range of values 框分别输入下限值和上限值。
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
对于分层变量的处理不同:Life Tables 过程仅按该分层变量进行分层,没 有考虑其对生存时间的影响,即没有提供控制该分层变量的情况下对研究 因素对生存时间的影响进行统计分析的能力; Kaplan-Meier过程则是在控 制该分层变量的情况下对研究因素对生存时间的影响进行统计分析。
做出的生存曲线不同
重庆交通大学管理学院
06:17:35
Kaplan-meier过程 (4)生存曲线
分析结果
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Life-Tables过程
Life Tables过程用于: 制作寿命表 绘制各做曲线如生存函数、风险函数曲线等。 对某一研究因素的不同水平的生存时间分布进行比较,控 制另一个因素后对研究因素不同水平的生存时间分布进行 比较,包括从总体上比较和不同水平间进行两两比较。
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
基本概念
生存时间(Survival Time):
从狭义的角度来说:生存时间是患某病的病人从发病到
死亡所经历的时间跨度。
生存时间
开始发病
病人死亡
从广义的角度:从某种起始事件到达某种终点时间所经历 的时间跨度。
生存时间
起始事件
终点事件
将h0(t)移至等式左边并去自然对数得: ln[hi(t)/ h0(t)]=β1xi1+….+βpxip
等式左边的部分为相对风险度的自然对数值,等式右边部分
为伴随变量与相应回归系术的线性组合。
βj(j=1,2,…,p)的实际意义是:在p-1个伴随变量为一 定值时,当伴随变量xj每改变一个测定单位时所引起的相对 风险度自然对数值的改变量。 Cox模型假定各自变量xj的回 归系数βj与危险度间呈指数函数关系。当βj=0时,说明xj对 危险度不起作用;βj为正值时xj为危险因子,增大了危险度; βj为负值时xj=1与xj=0的两个危险度相比,则得到一个与 h0(t)无关的比值,称为相对危险度。
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Life-Tables过程
(1)寿命表Ⅲ
1
2
分析结果
3
4
1. 风险率。活过时点t个体在时点t后单位时间内死亡概率的估计值
2. 生存函数估计的标准误。
3. 概率密度的标准误
4. 风险率的标准误。
2019年9月12日星期四
重庆交通大学管理学院
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Kaplan-meier过程
对组间生存函数的差异进行检验的方法 Log Rank法和Breslow法较为常用
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Kaplan-meier过程
Survival:累积生存率估计,选中,表明要求将各观察 样本的生存率存入原始数据库中 Standard error of survival:累积生存率估计的标准误 Hazard:累积风险函数估计 Cumulative events:终结事件的累积频数
重庆交通大学管理学院
06:17:35
Life-Tables过程
输出生存时间范围及组距:前一个框输入生存
时间上限,后一个框输入生存时间的组距
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Life-Tables过程
寿命表 生存曲线 风险函数曲线
2019年9月12日星期四
重庆交通大学管理学院
Kaplan-meier过程 (3)水平间的整体比较
分析结果
Log Rank、Breslow和Tarone-Ware三种检验方法的检验统计 量分别为3.282、2.861和3.360,它们的p值分别为0.194、0.239 和0.186,说明三组疗法之间生存时间的差异无显著性
2019年9月12日星期四
分析结果
1 23
4
56
…
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Kaplan-meier过程 (2)生存时间估计
分析结果
Mean是生存时间的算术均数, Median为中位生存时间, 同时表格中也给出它们的95%的可信区间。
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Kaplan-meier过程
生存分析表 平均生存时间和中位 生存时间及其标准误 和可信区间
累积生存函数曲线
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Kaplan-meier过程 (1)生存表分析
1.观察时间 2.生存状态 3.累积生存率 4.累积生存率 的标准差 5.累积死亡数 6.组中剩余人数
统计学检验方法不同:Life Tables过程采用Wilcoxon法 ,Kaplan-Meier过程 用Log rank 法、Breslow法、Tarone-are法
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Cox回归模型
上面介绍的两种生存分析方法只能研究一至两 个因素对生存时间的影响,当生存时间的影响因 素有多个时,它们就无能为力了,下面介绍Cox Regression过程,这是一种专门用于生存时间多 变量分析的统计方法。
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Cox回归模型
例3 数据pancer.sav是关于胰脏癌术中接受放疗会否延长病人生存时间
的研究。该研究的终点为死亡,接受手术被定义为计算生存时间的起点。
由于该研究是一项未经随机化的观察研究,要正确估计术中接受放疗提
高患者生存时间的效果,还需考虑对其他因子的效果进行调整。
06:17:35
Life-Tables过程 (1)寿命表(分三部分讲解)
分析结果
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Life-Tables过程
(1)寿命表Ⅰ
1
2
3
4
5
分析结果
1.生存时间的组段下限
2.进入该组段的观察例数
3.该组段的删失例数
4.暴露于危险因素的例数
5.所关心的事件的例数,即死亡例数
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
生存时间的数据类型
1.完全数据(Complete Data)指达到了明确结局的观察对象 的生存时间数据。某个观察对象具有明确的结局时,该观察 对象所提供的关于生存时间的信息是完整的。
2.截尾数据 (Censored Data):由于某种原因未能观察到观察 对象的明确的结局,所以不知道该观察对象的确切的生存时间, 就象该观察对象的生存时间在未到达规定的终点之前就被截尾 了。
06:17:35
Life-Tables过程 (2)累积生存函数曲线
分析结果
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Kaplan-Meler法和寿命表法的比较
基本思想不同:Life Tables 过程是将生存时间分成许多小的时间段,计算 该段内生存率的变化情况,分析的重点是研究总体生存规律;而KaplanMeier过程则是计算每一“结果”事件发生时点的生存率,分析的重点除 了研究总体生存规律外,还热心于寻找相关影响因素。
生存分析
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
生存分析
生存分析:在临床诊疗工作的评价中,慢性疾病的预
后一般不适用于治愈率、病死率等指标来考核,因为其无 法在短时间内明确判断预后情况,为此,只能对患者进行 长期随访,统计一定时期后的生存或死亡情况以判断诊疗 效果。
生存分析还适用于现场追踪研究(发病为阳性)、临床 疗效试验(痊愈或显效为阳性)、动物试验(发病或死亡) 等。
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Life-Tables过程
(1)寿命表Ⅱ
1
2
3
4
分析结果
1. 所关心事件的观察单位数的比,即各组的死亡概率
2.各组的生存概率
3. 至本组段上限的生存函数估计值,由各组的生存概率累积相乘所得。
4. 概率密度,所有个体在时点t后单位时间内死亡概率估计值。
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Kaplan-meier过程
Kaplan-meier法用于: 估计某因素不同水平的中位生存时间 比较研究因素不同水平的生存时间有无差异 控制一分层因素后对研究因素不同水平的生存时间比较
2019年9月12日星期四
重庆交通大学管理学院
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Cox回归模型
模型结构:设有n名病人,第i名病人的生存时间为ti,同时该 病人具有一组伴随变量xi1,xi2…xip。该病人生存到时间ti的 风险函数hi(t)是其基础风险函数ho(t)与相应伴随变量的函数 的乘积,其数学表达式为:
hi(t)= h0(t)f(β1xi1+….+βpxip) Cox建议伴随变量的函数为指数形式,故Cox比例风险回
2019年9月12日星期四
ห้องสมุดไป่ตู้
重庆交通大学管理学院
06:17:35
Kaplan-meier过程
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Kaplan-meier过程
时间变量 结局变量
分组变量
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Kaplan-meier过程
截尾数据提供了部分关于生存时间的信息,使研究者知道 该观察对象至少在已经经历的这个时间长度内没有发生终点事 件,其真实的生存时间只能长于我们现在观察到的时间而不会 短于这个时间。(符号t+)
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
生存时间资料的特点
有2个效应变量:一是生存时间(天数),二是结局 (死亡与否、是否阳性等)。 存在截尾数据:由于某种原因未能明确观察到随访 对象发生事先定义的终终事件。 分布类型复杂:生存时间资料常通过随访获得,因 观察时间长且难以控制混杂因素,故其分布常呈偏态, 影响因素较多,规律难以估测。
归可写为:
hi(t)= h0(t)exp(β1xi1+….+βpxip) 式中的h0(t)是当所有伴随变量xi1,xi2,…xip都处于0或标 准状态下的风险函数,是一个不确定的值,β1,β2…,βp为回 归系数,须用实际资料来估计。
2019年9月12日星期四
重庆交通大学管理学院
06:17:35
Cox回归模型