应用统计学 生存分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Hazard:累积风险函数估计
Cumulative events:终结事件的累积频数
Kaplan-meier过程
生存分析表 平均生存时间和中位
生存时间及其标准误
和可信区间 累积生存函数曲线
Kaplan-meier过程 (1)生存表分析
1.观察时间 2.生存状态 3.累积生存率 4.累积生存率 的标准差 5.累积死亡数 6.组中剩余人数 1 2 3 4
分析结果
5
…
6
Kaplan-meier过程 (2)生存时间估计
分析结果
Mean是生存时间的算术均数, Median为中位生存时间, 同时表格中也给出它们的95%的可信区间。
Kaplan-meier过程 (3)水平间的整体比较
分析结果
Log Rank、Breslow和Tarone-Ware三种检验方法的检验统计 量分别为3.282、2.861和3.360,它们的p值分别为0.194、0.239 和0.186,说明三组疗法之间生存时间的差异无显著性
2.截尾数据 (Censored Data):由于某种原因未能观察到观察 对象的明确的结局,所以不知道该观察对象的确切的生存时间, 就象该观察对象的生存时间在未到达规定的终点之前就被截尾 了。 截尾数据提供了部分关于生存时间的信息,使研究者知道 该观察对象至少在已经经历的这个时间长度内没有发生终点事 件,其真实的生存时间只能长于我们现在观察到的时间而不会 短于这个时间。(符号t+)
124,143,12+,159+,190+,196+,197+,205+,219+
Kaplan-meier过程
Kaplan-meier过程
时间变量 结局变量
分组变量
Kaplan-meier过程
当变量为二分类变量时,一般以死亡、复发、恶化等为 终结事件,如本例就是以恶化为终结事件,标记值为1,所 以在Single value框中输入1;如果生存状态变量取值为连续 变量时,则在Range of values 框分别输入下限值和上限值。
Life-Tables过程
例2:某医院对114名男性胃癌患者接受手术后的生存情况 进行了11年的随访,得到数据(lifetb.sav)如下
Life-Tables过程
Life-Tables过程
输出生存时间范围及组距:前一个框输入生存 时间上限,后一个框输入生存时间的组距
Life-Tables过程
Kaplan-meier过程 (4)生存曲线
分析结果
Life-Tables过程
Life Tables过程用于: 制作寿命表 绘制各做曲线如生存函数、风险函数曲线等。
对某一来自百度文库究因素的不同水平的生存时间分布进行比较,控
制另一个因素后对研究因素不同水平的生存时间分布进行 比较,包括从总体上比较和不同水平间进行两两比较。
寿命表 生存曲线 风险函数曲线
Life-Tables过程 (1)寿命表(分三部分讲解)
分析结果
Life-Tables过程 (1)寿命表Ⅰ
1 2 3 4 5
分析结果
1.生存时间的组段下限 3.该组段的删失例数
2.进入该组段的观察例数 4.暴露于危险因素的例数
5.所关心的事件的例数,即死亡例数
Life-Tables过程 (1)寿命表Ⅱ
生存时间资料的特点
有2个效应变量:一是生存时间(天数),二是结局
(死亡与否、是否阳性等)。
存在截尾数据 :由于某种原因未能明确观察到随访 对象发生事先定义的终终事件。 分布类型复杂 :生存时间资料常通过随访获得,因 观察时间长且难以控制混杂因素,故其分布常呈偏态,
影响因素较多,规律难以估测。
基本概念
生存时间(Survival Time): 从狭义的角度来说:生存时间是患某病的病人从发病到 死亡所经历的时间跨度。 生存时间 开始发病 病人死亡
从广义的角度:从某种起始事件到达某种终点时间所经历 的时间跨度。 生存时间 起始事件 终点事件
生存时间的数据类型
1. 完全数据( Complete Data)指达到了明确结局的观察对象 的生存时间数据。某个观察对象具有明确的结局时,该观察 对象所提供的关于生存时间的信息是完整的。
Kaplan-meier法用于:
估计某因素不同水平的中位生存时间
比较研究因素不同水平的生存时间有无差异 控制一分层因素后对研究因素不同水平的生存时间比较
Kaplan-meier过程
例1:3种疗法治疗66例白血病患者缓解时间(天),数据
(kaplanm.sav)如下 A疗法:4,5,9,10,11,12,13,28,28,28,29,31, 32,37,41,41,57,62,74,100,139,20+,258+,269 B疗法:8,10,10,12,14,20,48,70,75,99,103, 162,169,195,220,161+,199+,217+,245+ C疗法:8,10,11,23,25,28,28,31,31,40,48,89,
生存分析方法
Kaplan-meier过程 这是一种非参数法,主要用于小样本,适用于能够准 确记录事件和删失发生时点的数据。
Life Tables过程
也叫寿命表法,适用于样本量大,且不太可能准确记 载每个观察对象的死亡或删失发生时间的数据。 Cox回归模型分析法 用于描述多个变量对生存时间的影响
Kaplan-meier过程
Kaplan-meier过程
对组间生存函数的差异进行检验的方法 Log Rank法和Breslow法较为常用
Kaplan-meier过程
Survival:累积生存率估计,选中,表明要求将各观察
样本的生存率存入原始数据库中 Standard error of survival:累积生存率估计的标准误
1 2 3 4
分析结果
1. 所关心事件的观察单位数的比,即各组的死亡概率 2.各组的生存概率 3. 至本组段上限的生存函数估计值,由各组的生存概率累积相乘所得。
生存分析
生存分析
生存分析:在临床诊疗工作的评价中,慢性疾病的预后
一般不适用于治愈率、病死率等指标来考核,因为其无法
在短时间内明确判断预后情况,为此,只能对患者进行长 期随访,统计一定时期后的生存或死亡情况以判断诊疗效
果。
生存分析还适用于现场追踪研究(发病为阳性)、临床 疗效试验(痊愈或显效为阳性)、动物试验(发病或死亡) 等。
Cumulative events:终结事件的累积频数
Kaplan-meier过程
生存分析表 平均生存时间和中位
生存时间及其标准误
和可信区间 累积生存函数曲线
Kaplan-meier过程 (1)生存表分析
1.观察时间 2.生存状态 3.累积生存率 4.累积生存率 的标准差 5.累积死亡数 6.组中剩余人数 1 2 3 4
分析结果
5
…
6
Kaplan-meier过程 (2)生存时间估计
分析结果
Mean是生存时间的算术均数, Median为中位生存时间, 同时表格中也给出它们的95%的可信区间。
Kaplan-meier过程 (3)水平间的整体比较
分析结果
Log Rank、Breslow和Tarone-Ware三种检验方法的检验统计 量分别为3.282、2.861和3.360,它们的p值分别为0.194、0.239 和0.186,说明三组疗法之间生存时间的差异无显著性
2.截尾数据 (Censored Data):由于某种原因未能观察到观察 对象的明确的结局,所以不知道该观察对象的确切的生存时间, 就象该观察对象的生存时间在未到达规定的终点之前就被截尾 了。 截尾数据提供了部分关于生存时间的信息,使研究者知道 该观察对象至少在已经经历的这个时间长度内没有发生终点事 件,其真实的生存时间只能长于我们现在观察到的时间而不会 短于这个时间。(符号t+)
124,143,12+,159+,190+,196+,197+,205+,219+
Kaplan-meier过程
Kaplan-meier过程
时间变量 结局变量
分组变量
Kaplan-meier过程
当变量为二分类变量时,一般以死亡、复发、恶化等为 终结事件,如本例就是以恶化为终结事件,标记值为1,所 以在Single value框中输入1;如果生存状态变量取值为连续 变量时,则在Range of values 框分别输入下限值和上限值。
Life-Tables过程
例2:某医院对114名男性胃癌患者接受手术后的生存情况 进行了11年的随访,得到数据(lifetb.sav)如下
Life-Tables过程
Life-Tables过程
输出生存时间范围及组距:前一个框输入生存 时间上限,后一个框输入生存时间的组距
Life-Tables过程
Kaplan-meier过程 (4)生存曲线
分析结果
Life-Tables过程
Life Tables过程用于: 制作寿命表 绘制各做曲线如生存函数、风险函数曲线等。
对某一来自百度文库究因素的不同水平的生存时间分布进行比较,控
制另一个因素后对研究因素不同水平的生存时间分布进行 比较,包括从总体上比较和不同水平间进行两两比较。
寿命表 生存曲线 风险函数曲线
Life-Tables过程 (1)寿命表(分三部分讲解)
分析结果
Life-Tables过程 (1)寿命表Ⅰ
1 2 3 4 5
分析结果
1.生存时间的组段下限 3.该组段的删失例数
2.进入该组段的观察例数 4.暴露于危险因素的例数
5.所关心的事件的例数,即死亡例数
Life-Tables过程 (1)寿命表Ⅱ
生存时间资料的特点
有2个效应变量:一是生存时间(天数),二是结局
(死亡与否、是否阳性等)。
存在截尾数据 :由于某种原因未能明确观察到随访 对象发生事先定义的终终事件。 分布类型复杂 :生存时间资料常通过随访获得,因 观察时间长且难以控制混杂因素,故其分布常呈偏态,
影响因素较多,规律难以估测。
基本概念
生存时间(Survival Time): 从狭义的角度来说:生存时间是患某病的病人从发病到 死亡所经历的时间跨度。 生存时间 开始发病 病人死亡
从广义的角度:从某种起始事件到达某种终点时间所经历 的时间跨度。 生存时间 起始事件 终点事件
生存时间的数据类型
1. 完全数据( Complete Data)指达到了明确结局的观察对象 的生存时间数据。某个观察对象具有明确的结局时,该观察 对象所提供的关于生存时间的信息是完整的。
Kaplan-meier法用于:
估计某因素不同水平的中位生存时间
比较研究因素不同水平的生存时间有无差异 控制一分层因素后对研究因素不同水平的生存时间比较
Kaplan-meier过程
例1:3种疗法治疗66例白血病患者缓解时间(天),数据
(kaplanm.sav)如下 A疗法:4,5,9,10,11,12,13,28,28,28,29,31, 32,37,41,41,57,62,74,100,139,20+,258+,269 B疗法:8,10,10,12,14,20,48,70,75,99,103, 162,169,195,220,161+,199+,217+,245+ C疗法:8,10,11,23,25,28,28,31,31,40,48,89,
生存分析方法
Kaplan-meier过程 这是一种非参数法,主要用于小样本,适用于能够准 确记录事件和删失发生时点的数据。
Life Tables过程
也叫寿命表法,适用于样本量大,且不太可能准确记 载每个观察对象的死亡或删失发生时间的数据。 Cox回归模型分析法 用于描述多个变量对生存时间的影响
Kaplan-meier过程
Kaplan-meier过程
对组间生存函数的差异进行检验的方法 Log Rank法和Breslow法较为常用
Kaplan-meier过程
Survival:累积生存率估计,选中,表明要求将各观察
样本的生存率存入原始数据库中 Standard error of survival:累积生存率估计的标准误
1 2 3 4
分析结果
1. 所关心事件的观察单位数的比,即各组的死亡概率 2.各组的生存概率 3. 至本组段上限的生存函数估计值,由各组的生存概率累积相乘所得。
生存分析
生存分析
生存分析:在临床诊疗工作的评价中,慢性疾病的预后
一般不适用于治愈率、病死率等指标来考核,因为其无法
在短时间内明确判断预后情况,为此,只能对患者进行长 期随访,统计一定时期后的生存或死亡情况以判断诊疗效
果。
生存分析还适用于现场追踪研究(发病为阳性)、临床 疗效试验(痊愈或显效为阳性)、动物试验(发病或死亡) 等。