生存分析与Cox回归
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大样本分段
(按时间分组)资料
2016/9/19
生存分析与Cox回归
32
1. 未分组资料 (乘积极限法/Kaplan-Meier法)
2016/9/19
生存分析与Cox回归
33
1.0
(7 11) : (7 t ) (0.5833 0.4861) : (0.5833 0.5)
53
生存曲线比较SPSS实现——例3
四、 Cox回归
对生存时间资料进行单因素分析 (log-rank检验)时,要
求各对比组在非处理因素方面均衡可比,而实际工作
中却很难做到;很多因素会对生存时间产生影响,需 用多因素分析方法。 Cox 回 归 也 称 比 例 风 险 模 型 (Proportional hazards model)是对生存资料进行多因素分析常用的统计方法
二、生存资料的统计描述
生存率及其标准误 中位生存期 生存曲线
2016/9/19
生存分析与Cox回归
25
基本概念
2016/9/19
生存分析与Cox回归
26
基本概念
2016/9/19
生存分析与Cox回归
27
基本概念
2016/9/19
生存分析与Cox回归
28
基本概念
2016/9/19
生存分析与Cox回归
0.8
t 7
0.6
(7 11)( 0.5833 0.5) 10.4 0.5833 0.4861
0.4
0.2
0.0 0 10 20 30 40
2. 分组资料(寿命表法 life-table method)
2016/9/19
生存分析与Cox回归
36
Lk Lk 1 Ck Dk
两种药物的结局比较 谷丙转氨酶阴转率% 80.00 80.00
药物 中药 西药
治疗例数 40 40
平均阴转时间(天) 21 35
2016/9/19
生存分析与Cox回归
3
一、生存资料概述
随访研究 (follow up) 是医学研究中常用的设计方法 随访研究不仅要考虑观察对象的结局,还要考虑出现 结局所经历的时间 这类(既要考虑结局又要考虑结局出现的时间)资料称为 生存资料 (survival data) 生存分析(survival analysis)是将观察的结局和出现结局 所经历的的时间结合起来进行分析的统计方法。
48
三、生存曲线比较 (单因素分析)
2016/9/19
生存分析与Cox回归
49
生存资料分析的基本要求 样本应由随机抽样得到,要保证一定的样本含量 死亡例数不宜太少 截尾例数不宜太多
生存时间应尽可能精确
2016/9/19
生存分析与Cox回归
52
对数秩检验(log-rank)注意事项
① 属于单因素分析方法,适用于两组及多组间的比较
2016/9/19
生存分析与Cox回归
20
4. 生存分析的基本内容
① 描述生存过程:研究生存时间的分布特点,估计生 存率及其标准误、绘制生存曲线等。
例如,根据乳腺癌患者手术后的生存资料,可以估计 不同时间点的生存率及其标准误,如1年生存率、3年 生存率、5年生存率等,还可以绘制生存曲线,观察乳 腺癌患者手术后的生存过程。 常用方法有乘积极限法和寿命表法。
2016/9/19
生存分析与Cox回归
13
表20-1 10年间346例大肠癌患者手术后的生存时间记录 患者编号 性别 年龄(岁) dtime 手术时间 终止随访时间 结局 生存时间(月) 1 男 32 10 1994-1-23 1994-12-24 死亡 11 2 女 48 12 1998-2-14 1999-1-1 失访 10+ 3 女 26 6 1992-3-4 1995-4-12 死亡 37 4 男 55 3 1999-8-20 2001-9-21 死于其他 25+ 5 女 58 8 2001-3-10 2001-12-31 存活 9+ „ „ „ „ „ „ „ „
生存分析与Cox回归
流行病与卫生统计学教研室 曹 明 芹
生存分析与Cox回归
生存资料概述
生存分析的基本概念 生存资料的统计描述 生存曲线的比较 Cox回归
2016/9/19
生存分析与Cox回归
2
一、生存资料概述
举例 某医师分别用中药、西药各治疗急性肝炎病人 40例,结果如下表,试问:哪种药物的治疗效果好?
29
基本概念
2016/9/19
生存分析与Cox回归
30
基本概念
2016/9/19
生存分析与Cox回归
31
常用方法
乘积极限法 (product-limit method)
也称为K-M法(Kaplan-Meier法) 小样本资料或大样本未分段(未按时间分组)资料
寿命表法 (life table method)
2016/9/19
生存分析与Cox回归
8
1. 基本概念
举例 说明下列研究的起始事件与终点事件
① 急性白血病患者进行骨髓移植后以是否复发来评价骨
髓移植效果
② 职业性铅中毒的危险因素(开始职业性接触至出现铅
中毒症状)
③ 冠心病患者两次发病的时间间隔
④ 大肠癌患者手术后存活情况(手术、死亡)
⑤ 接受健康教育对青少年戒烟到复吸的影响因素分析 ⑥ 接受某种保险方式后的中途退保分析
2016/9/19
生存分析与Cox回归
21
4. 生存分析的基本内容
② 比较生存过程:获得生存率及其标准误的估计值后,
可进行两组或多组生存曲线(生存过程)的比较。 例如,比较两种不同治疗措施治疗恶性肿瘤患者的生 存曲线,可了解哪种治疗措施较优,从而为临床决策 提供依据。常用方法有对数秩检验。
2016/9/19
生存分析与Cox回归
18
2. 生存资料的特点
① 蕴涵有结局和时间两个方面的信息;
② 结局为两分类互斥事件; ③ 一般是通过随访收集得到,随访观察往往是从某统一 时间点(如确诊、入院或实施手术等某种处理措施后)开 始,观察到某规定时间点截止; ④ 常因失访等原因造成某些研究对象的生存时间数据不 完整; ⑤ 分布类型复杂,需用生存分析
Leabharlann Baidu
2016/9/19
生存分析与Cox回归
56
四、 Cox回归
Cox回归模型的一般形式 回归系数的解释 Cox回归应用条件 回归系数的估计及假设检验 Cox回归分析应注意的问题
2016/9/19
生存分析与Cox回归
57
1. Cox回归模型的一般形式
(t ) 0 (t ) exp(1 x1 2 x2 ... p x p )
生存分析与Cox回归
22
4. 生存分析的基本内容
③ 生存过程的影响因素分析
例如,为了改善鼻咽癌患者的预后,应先了解可能影 响患者预后的因素,如年龄、病程、病情、术前健康 状况、有无淋巴结转移、术后有无感染、辅助治疗措 施、营养状况等,通过随访收集患者术后的生存时间 和上述因素的资料,然后采用多因素生存分析方法确 定影响患者预后的主要因素,从而为在手术前后进行 预防或干预提供参考依据。 常用的多因素生存分析方法:Cox比例风险回归模型
2016/9/19
生存分析与Cox回归
4
一、生存资料概述
医学随访研究一般有两种
所有研究对象同时进入研究(观察起始时间相同)
例如,队列研究、动物的随访观察
被研究对象逐个进入研究(观察起始时间不同)
例如,临床随访研究
由于受经费和时间的限制,最终观察时间不能无限延长
2016/9/19
生存分析与Cox回归
② 可用于时间未分组的资料,也可用于时间分组资料
③ 各组间生存时间的比较根据各组生存曲线的高低及中位生存时 间判断 ④ 需满足生存资料的基本要求,且各样本生存曲线不能交叉 ⑤ 生存曲线若出现交叉,则提示可能存在混杂因素,应采用分层
对数秩检验或Cox比例风险回归模型进行分析
2016/9/19
生存分析与Cox回归
2016/9/19
生存分析与Cox回归
19
3. 生存资料的数据形式
10年间346例大肠癌患者手术后的生存时间 患者编号 性别 年龄(岁) dtime 结局 生存时间(月) 1 1 32 10 1 11 2 2 48 12 0 10 3 2 26 6 1 37 4 1 55 3 0 25 5 2 58 8 0 9 „ „ „ „ „ „
qk Dk / Nk
N k Lk Ck / 2
pk 1 qk
1.0
0.8
0.6
中位生存期为2.3
0.4
0.2
0.0 0 1 2 3 4 5 6 7 8 9 10
生存资料的统计描述SPSS实现——例1
生存资料的统计描述SPSS实现——例2
三、生存曲线比较 (单因素分析)
h(t ) h0 (t ) exp(1 x1 2 x2 ... p x p )
2016/9/19
生存分析与Cox回归
58
病人 Name 王一 黄二 张三 李四
处理 性别 生存 结局 组号 (男=1) 天数 (死=1) x1 1 0 0 1 x2 1 0 1 0 t 18 48 70 90 d 1 1 0 1
1. 基本概念
完全数据提供了观察对象确切的生存时间,是生存分
析的主要依据;
截尾数据仅提供了部分信息,研究者并不知道观察对 象确切的生存时间。截尾数据太多会影响生存分析的 效果 那么截尾数据能不能删除?
2016/9/19
生存分析与Cox回归
16
1. 基本概念
对生存资料的两种错误分析
① 抛弃截尾数据,只考虑确切数据 损失样本含量、损失了信息,截尾数据提供部分信息, 说明在某时刻之前仍存活 ② 将截尾数据当作确切数据处理
2016/9/19 生存分析与Cox回归 9
1. 基本概念
生存时间(survival time)或失效时间(failure time)
生存时间指观察到的存活时间 常用符号 t 表示 生存时间是生存分析中的重要信息,必须准确
明确规定起始事件、终点事件 时间的测度单位(年、月、日)
2016/9/19
完全数据:指从观察起点到发生死亡事件所经历的时 间,生存时间是完整确切的。 截尾数据或截尾值(censored value),又称删失值或终 检值。 生存时间观察过程的截止不是由于死亡/终点事件,而 是由于其他原因引起的,称为截尾(censored) 从观察起点到截尾时点所经历的生存时间称为截尾数 据,习惯上在生存时间右上角标注“+”表示
2016/9/19 生存分析与Cox回归 12
1. 基本概念
截尾的主要原因:
① 失访(withdrawal):失去联系,如信访无回音、电话采 访不应答、上门采访找不到人、搬迁没留地址等 ② 退出:死于非研究因素或非处理因素而退出研究,如死 于意外或其他疾病
③ 终止:设计时规定的研究时限已到而终止观察,但研究 对象仍然存活
低估了生存时间的平均水平,截尾数据中存在生存时 间较长的数据,如果损失,会使结果产生偏性
2016/9/19
生存分析与Cox回归
17
1. 基本概念
对截尾数据进行分析是生存分析的重要特点,在生存
分析中,结局变量常以1表示出现结局,0表示截尾。
应变量有2个: 生存时间 t 和结局变量(0-1)
2016/9/19
5
1. 基本概念
起始事件与终点事件
起始事件—反映研究对象生存过程的起始特征事件。 终点事件(outcome event)又称失效事件(failure event) 或死亡事件(death event) 终点事件—研究者所关心的研究对象的特定结局,可 以标志某种处理措施失败或失效的特征事件
起始事件和终点事件是由研究目的决定的,在设计时 就明确规定,并在研究期间严格遵守不能随意改变
2016/9/19
生存分析与Cox回归
23
生存分析的基本方法
统计描述
统计指标:生存率、中位生存时间 列表和绘图:生存曲线
统计推断
参数法:指数分布、威布尔分布等 非参数法:log-rank检验(单因素分析) 半参数法:Cox回归
(多因素分析)
24
2016/9/19
生存分析与Cox回归
生存分析与Cox回归
10
1. 基本概念
整个研究的观察时间 研究开始到研究结束的时间
因为有起始事件发生时间、终点事件发生时间、观察 开始时间、观察结束时间,生存资料数据分为完全数 据(complete data)和截尾数据(censored data)
2016/9/19
生存分析与Cox回归
11
1. 基本概念
2016/9/19
生存分析与Cox回归
45
对上例进行分析时两种错误的做法:
错误1:采用平均生存时间而不是中位生存时间来表示
生存时间的平均水平。 错误2:采用常规t检验或方差分析进行组间比较。
2016/9/19
生存分析与Cox回归
46
三、生存曲线比较 (单因素分析)
2016/9/19
生存分析与Cox回归
(按时间分组)资料
2016/9/19
生存分析与Cox回归
32
1. 未分组资料 (乘积极限法/Kaplan-Meier法)
2016/9/19
生存分析与Cox回归
33
1.0
(7 11) : (7 t ) (0.5833 0.4861) : (0.5833 0.5)
53
生存曲线比较SPSS实现——例3
四、 Cox回归
对生存时间资料进行单因素分析 (log-rank检验)时,要
求各对比组在非处理因素方面均衡可比,而实际工作
中却很难做到;很多因素会对生存时间产生影响,需 用多因素分析方法。 Cox 回 归 也 称 比 例 风 险 模 型 (Proportional hazards model)是对生存资料进行多因素分析常用的统计方法
二、生存资料的统计描述
生存率及其标准误 中位生存期 生存曲线
2016/9/19
生存分析与Cox回归
25
基本概念
2016/9/19
生存分析与Cox回归
26
基本概念
2016/9/19
生存分析与Cox回归
27
基本概念
2016/9/19
生存分析与Cox回归
28
基本概念
2016/9/19
生存分析与Cox回归
0.8
t 7
0.6
(7 11)( 0.5833 0.5) 10.4 0.5833 0.4861
0.4
0.2
0.0 0 10 20 30 40
2. 分组资料(寿命表法 life-table method)
2016/9/19
生存分析与Cox回归
36
Lk Lk 1 Ck Dk
两种药物的结局比较 谷丙转氨酶阴转率% 80.00 80.00
药物 中药 西药
治疗例数 40 40
平均阴转时间(天) 21 35
2016/9/19
生存分析与Cox回归
3
一、生存资料概述
随访研究 (follow up) 是医学研究中常用的设计方法 随访研究不仅要考虑观察对象的结局,还要考虑出现 结局所经历的时间 这类(既要考虑结局又要考虑结局出现的时间)资料称为 生存资料 (survival data) 生存分析(survival analysis)是将观察的结局和出现结局 所经历的的时间结合起来进行分析的统计方法。
48
三、生存曲线比较 (单因素分析)
2016/9/19
生存分析与Cox回归
49
生存资料分析的基本要求 样本应由随机抽样得到,要保证一定的样本含量 死亡例数不宜太少 截尾例数不宜太多
生存时间应尽可能精确
2016/9/19
生存分析与Cox回归
52
对数秩检验(log-rank)注意事项
① 属于单因素分析方法,适用于两组及多组间的比较
2016/9/19
生存分析与Cox回归
20
4. 生存分析的基本内容
① 描述生存过程:研究生存时间的分布特点,估计生 存率及其标准误、绘制生存曲线等。
例如,根据乳腺癌患者手术后的生存资料,可以估计 不同时间点的生存率及其标准误,如1年生存率、3年 生存率、5年生存率等,还可以绘制生存曲线,观察乳 腺癌患者手术后的生存过程。 常用方法有乘积极限法和寿命表法。
2016/9/19
生存分析与Cox回归
13
表20-1 10年间346例大肠癌患者手术后的生存时间记录 患者编号 性别 年龄(岁) dtime 手术时间 终止随访时间 结局 生存时间(月) 1 男 32 10 1994-1-23 1994-12-24 死亡 11 2 女 48 12 1998-2-14 1999-1-1 失访 10+ 3 女 26 6 1992-3-4 1995-4-12 死亡 37 4 男 55 3 1999-8-20 2001-9-21 死于其他 25+ 5 女 58 8 2001-3-10 2001-12-31 存活 9+ „ „ „ „ „ „ „ „
生存分析与Cox回归
流行病与卫生统计学教研室 曹 明 芹
生存分析与Cox回归
生存资料概述
生存分析的基本概念 生存资料的统计描述 生存曲线的比较 Cox回归
2016/9/19
生存分析与Cox回归
2
一、生存资料概述
举例 某医师分别用中药、西药各治疗急性肝炎病人 40例,结果如下表,试问:哪种药物的治疗效果好?
29
基本概念
2016/9/19
生存分析与Cox回归
30
基本概念
2016/9/19
生存分析与Cox回归
31
常用方法
乘积极限法 (product-limit method)
也称为K-M法(Kaplan-Meier法) 小样本资料或大样本未分段(未按时间分组)资料
寿命表法 (life table method)
2016/9/19
生存分析与Cox回归
8
1. 基本概念
举例 说明下列研究的起始事件与终点事件
① 急性白血病患者进行骨髓移植后以是否复发来评价骨
髓移植效果
② 职业性铅中毒的危险因素(开始职业性接触至出现铅
中毒症状)
③ 冠心病患者两次发病的时间间隔
④ 大肠癌患者手术后存活情况(手术、死亡)
⑤ 接受健康教育对青少年戒烟到复吸的影响因素分析 ⑥ 接受某种保险方式后的中途退保分析
2016/9/19
生存分析与Cox回归
21
4. 生存分析的基本内容
② 比较生存过程:获得生存率及其标准误的估计值后,
可进行两组或多组生存曲线(生存过程)的比较。 例如,比较两种不同治疗措施治疗恶性肿瘤患者的生 存曲线,可了解哪种治疗措施较优,从而为临床决策 提供依据。常用方法有对数秩检验。
2016/9/19
生存分析与Cox回归
18
2. 生存资料的特点
① 蕴涵有结局和时间两个方面的信息;
② 结局为两分类互斥事件; ③ 一般是通过随访收集得到,随访观察往往是从某统一 时间点(如确诊、入院或实施手术等某种处理措施后)开 始,观察到某规定时间点截止; ④ 常因失访等原因造成某些研究对象的生存时间数据不 完整; ⑤ 分布类型复杂,需用生存分析
Leabharlann Baidu
2016/9/19
生存分析与Cox回归
56
四、 Cox回归
Cox回归模型的一般形式 回归系数的解释 Cox回归应用条件 回归系数的估计及假设检验 Cox回归分析应注意的问题
2016/9/19
生存分析与Cox回归
57
1. Cox回归模型的一般形式
(t ) 0 (t ) exp(1 x1 2 x2 ... p x p )
生存分析与Cox回归
22
4. 生存分析的基本内容
③ 生存过程的影响因素分析
例如,为了改善鼻咽癌患者的预后,应先了解可能影 响患者预后的因素,如年龄、病程、病情、术前健康 状况、有无淋巴结转移、术后有无感染、辅助治疗措 施、营养状况等,通过随访收集患者术后的生存时间 和上述因素的资料,然后采用多因素生存分析方法确 定影响患者预后的主要因素,从而为在手术前后进行 预防或干预提供参考依据。 常用的多因素生存分析方法:Cox比例风险回归模型
2016/9/19
生存分析与Cox回归
4
一、生存资料概述
医学随访研究一般有两种
所有研究对象同时进入研究(观察起始时间相同)
例如,队列研究、动物的随访观察
被研究对象逐个进入研究(观察起始时间不同)
例如,临床随访研究
由于受经费和时间的限制,最终观察时间不能无限延长
2016/9/19
生存分析与Cox回归
② 可用于时间未分组的资料,也可用于时间分组资料
③ 各组间生存时间的比较根据各组生存曲线的高低及中位生存时 间判断 ④ 需满足生存资料的基本要求,且各样本生存曲线不能交叉 ⑤ 生存曲线若出现交叉,则提示可能存在混杂因素,应采用分层
对数秩检验或Cox比例风险回归模型进行分析
2016/9/19
生存分析与Cox回归
2016/9/19
生存分析与Cox回归
19
3. 生存资料的数据形式
10年间346例大肠癌患者手术后的生存时间 患者编号 性别 年龄(岁) dtime 结局 生存时间(月) 1 1 32 10 1 11 2 2 48 12 0 10 3 2 26 6 1 37 4 1 55 3 0 25 5 2 58 8 0 9 „ „ „ „ „ „
qk Dk / Nk
N k Lk Ck / 2
pk 1 qk
1.0
0.8
0.6
中位生存期为2.3
0.4
0.2
0.0 0 1 2 3 4 5 6 7 8 9 10
生存资料的统计描述SPSS实现——例1
生存资料的统计描述SPSS实现——例2
三、生存曲线比较 (单因素分析)
h(t ) h0 (t ) exp(1 x1 2 x2 ... p x p )
2016/9/19
生存分析与Cox回归
58
病人 Name 王一 黄二 张三 李四
处理 性别 生存 结局 组号 (男=1) 天数 (死=1) x1 1 0 0 1 x2 1 0 1 0 t 18 48 70 90 d 1 1 0 1
1. 基本概念
完全数据提供了观察对象确切的生存时间,是生存分
析的主要依据;
截尾数据仅提供了部分信息,研究者并不知道观察对 象确切的生存时间。截尾数据太多会影响生存分析的 效果 那么截尾数据能不能删除?
2016/9/19
生存分析与Cox回归
16
1. 基本概念
对生存资料的两种错误分析
① 抛弃截尾数据,只考虑确切数据 损失样本含量、损失了信息,截尾数据提供部分信息, 说明在某时刻之前仍存活 ② 将截尾数据当作确切数据处理
2016/9/19 生存分析与Cox回归 9
1. 基本概念
生存时间(survival time)或失效时间(failure time)
生存时间指观察到的存活时间 常用符号 t 表示 生存时间是生存分析中的重要信息,必须准确
明确规定起始事件、终点事件 时间的测度单位(年、月、日)
2016/9/19
完全数据:指从观察起点到发生死亡事件所经历的时 间,生存时间是完整确切的。 截尾数据或截尾值(censored value),又称删失值或终 检值。 生存时间观察过程的截止不是由于死亡/终点事件,而 是由于其他原因引起的,称为截尾(censored) 从观察起点到截尾时点所经历的生存时间称为截尾数 据,习惯上在生存时间右上角标注“+”表示
2016/9/19 生存分析与Cox回归 12
1. 基本概念
截尾的主要原因:
① 失访(withdrawal):失去联系,如信访无回音、电话采 访不应答、上门采访找不到人、搬迁没留地址等 ② 退出:死于非研究因素或非处理因素而退出研究,如死 于意外或其他疾病
③ 终止:设计时规定的研究时限已到而终止观察,但研究 对象仍然存活
低估了生存时间的平均水平,截尾数据中存在生存时 间较长的数据,如果损失,会使结果产生偏性
2016/9/19
生存分析与Cox回归
17
1. 基本概念
对截尾数据进行分析是生存分析的重要特点,在生存
分析中,结局变量常以1表示出现结局,0表示截尾。
应变量有2个: 生存时间 t 和结局变量(0-1)
2016/9/19
5
1. 基本概念
起始事件与终点事件
起始事件—反映研究对象生存过程的起始特征事件。 终点事件(outcome event)又称失效事件(failure event) 或死亡事件(death event) 终点事件—研究者所关心的研究对象的特定结局,可 以标志某种处理措施失败或失效的特征事件
起始事件和终点事件是由研究目的决定的,在设计时 就明确规定,并在研究期间严格遵守不能随意改变
2016/9/19
生存分析与Cox回归
23
生存分析的基本方法
统计描述
统计指标:生存率、中位生存时间 列表和绘图:生存曲线
统计推断
参数法:指数分布、威布尔分布等 非参数法:log-rank检验(单因素分析) 半参数法:Cox回归
(多因素分析)
24
2016/9/19
生存分析与Cox回归
生存分析与Cox回归
10
1. 基本概念
整个研究的观察时间 研究开始到研究结束的时间
因为有起始事件发生时间、终点事件发生时间、观察 开始时间、观察结束时间,生存资料数据分为完全数 据(complete data)和截尾数据(censored data)
2016/9/19
生存分析与Cox回归
11
1. 基本概念
2016/9/19
生存分析与Cox回归
45
对上例进行分析时两种错误的做法:
错误1:采用平均生存时间而不是中位生存时间来表示
生存时间的平均水平。 错误2:采用常规t检验或方差分析进行组间比较。
2016/9/19
生存分析与Cox回归
46
三、生存曲线比较 (单因素分析)
2016/9/19
生存分析与Cox回归