医学统计学课件--生存分析第十七章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013-8-7 医学统计学 16
(三)生存分析主要研究的内容
1.统计描述:计算不同时间点(t)的生存率, 描述生存过程。 2.统计推断:检验不同处理方式的生存过程 有无统计差别. 3.自变量(x)对生存时间(t)的关系:影 响生存时间的危险因素分析.
2013-8-7 医学统计学 17
第二节 生存率的估计与生存曲线
2013-8-7 医学统计学 “t”表示从研究起点到结局出现时间 23
t
生存率S(t)的概率乘法估计
S(t)也称累计生存概率,t 时刻存活是t 时刻之前一直生存的累积。 概率乘法原理计算(359页)
s(ti ) pi p1 p2 ... pi
(公式17-2)
Pi 为某时间区间(ti)的生存概率。假定 个体在各时段生存是独立。
ti时刻存活的人数 n年生存率 s(ti ) 观察的总人数 90 80 s(1) 0.9 s(2) 0.80 2013-8-7 医学统计学 100 100
22
生存时间数据分析时整理示意图
•
• •
失访
死亡 失访 死亡
死亡 死亡 0 2 4 6 8 10 12 14 16 18 20 年
2013-8-7 医学统计学 27
例17-1:某手术方法(甲法)治疗23例肾 上腺肿瘤病人后生存情况(讲义358页)
生存时间(t,月),其中“+”者为截尾数据 1,3,5(3),6(3),7,8,10 (2) ,14+,17,19+,20+,22+,26+, 31+,34,34+,44,59 计算生存率s(t)和生存曲线
20
生存率(survival rate)
称为生存函数 记为S(t) S(t) :指观察对象从起始事件(如手术时间
为0点)开始,到t时刻仍存活的概率。常用n年 生存率表示。 ti时刻存活的人数( X ) n年生存率 s(t ) 观察的总人数
时间ti ,i=1,2,3…n
2013-8-7 医学统计学 假设数据是完全数据,计算见例 21
第一节
生存分析的基本概念
一、随访数据概念
1.分析的变量(y) 1) 结局事件:指结局出现的特征,如疾病的死 亡、复发、发生( y=1或0) 。 2)时间间隔变量 记为(t)
t=结局事件出现日期 - 事件的起始日期
(起始日期可规定:如诊断、用药、手术日期 2013-8-7 8 医学统计学 等), t的单位:可用年、月、周表示
疗效除了应评价“结局”的好坏,结局所 经历时间长短也是评价疗效重要的指标。
2013-8-7
医学统计学
4
例2:
两种方法对疾病的疗效 方法 治疗人数 生存人数 生存率% 甲方法 100 20 20 乙方法 100 50 50 经χ2检验 p<0.05,乙法预后优于甲法。 假定: 1.观察期间疾病的死亡率不随时间变化。 2.研究对象观察时间长度相等。
98/10/20 98/11/25 车祸死亡 0
医学统计学
2013-8-7
(二)随访的方式
1.全部观察对象同时接受不同处理(起点相同) 随访方式:多见于动物实验(见图17-1,a)
2.观察对象在不同时间接受处理因素(起点不同) 随访方式:临床试验研究(见图17-1,b)
2013-8-7
医学统计学
13
死亡概率、生存概率
死亡概率(F):在某时间段(t)开始存活的个体, 死于(t+△t)该时段内的可能性。
某时间段内的死亡数 d F 某时间段初的观察数 n
(17-1)
生存概率(pi=1-F):
指某时间段开始存活的个体到该时间段结束 时仍存活的概率。
2013-8-7
某时间段存活人数 p 医学统计学 某时间段初的观察数
2013-8-7 医学统计学 28
表17-1 甲种手术后病人生存率的计算方法
时间(月) 死亡 ti 人数 期初 人数 死亡 概率 生存 概率 生存率
p( x t )
0.957 0.914 0.783 0.652 0. 609 0.565 0.478 0.478 29
1 3 5 6 7 8 10 + 142013-8-7
2.截尾数据
观察过程中个体因其他原因未观察到明确的 结局, 称为截尾或删失数据( censored data)。 截尾原因有: ①失访,②退出研究,如其他原因死亡。③研究 时间结束,未出现结局事件。 截尾值(censored value): 时间(t)=截尾事件日期 -起始事件日期 记为t+。(例:10+月)
2013-8-7 医学统计学 6
随访Leabharlann Baidu究资料
•
当研究事件(y)的结局是两分类数据(发 生,不发生),并且结局与时间(t)有关, 如同时收集事件发生的时间(t),该类数据 称为随访资料,分析该数据的统计方法用生 存分析。
• 生存分析是将“结局”与“时间”两个因素 结合一起研究的统计分析方法。
2013-8-7 医学统计学 7
1 1 3 3 1 1 2 0
23 22 21 18 15 14 13 11
0.043 0.045 0.143 0.167 0.067 0.071 0.154 0.000 医学统计学
t
0.957 0.955 0.857 0.833 0.933 0.929 0.846 1.000
表17-1资料甲手术描述指标(SPSS 软件)
寿命表(不讲)
医学统计学 2
*要求掌握概念、方法、用途。
概 述
• 临床上疗效、预后的评价常用疾病 的结局指标:如有效率、治愈率、 死亡率比较。对于短期内能明确治 疗效果的疾病是适用的。但对于远 期疗效,上述指标的评价不全面。
2013-8-7
医学统计学
3
例
某病的疗效比较
甲药 乙药 治愈率(%) 80 81 平均治愈时间(月) 20 12
2.大样本资料的生存分析方法—寿命表法 (Life-table method)
例17-3 表17-3 2418例男性心绞痛病人生存率情况 术后 死亡 截尾 期初 校正 生存 生存率 年数 人数 人数 人数 人数 概率 (t+1) 0456 0 2418 2418 0.8114 0.8114 1226 39 1962 1942.5 0.8837 0.717 2- 152 22 1697 1686 0.9098 0.6524
(一)描述生存资料的几个指标
1.不同时间点生存率 2.生存曲线
3.中位生存时间
2013-8-7 医学统计学 18
几个率概念
死亡率、死亡概率、生存概率、生存率
死亡率:表示在单位时间(年)内死亡发生 的频率(年平均死亡水平)。
某年内死亡数 某年死亡率 1000% 某年的平均人数
2013-8-7 医学统计学 19
某人研究手术方法治疗23位肾上腺肿瘤病人的 生存时间(月)如下: 1,3,5(3),6(3),7,8,10(2), 14+,17,,19+,20+,22+,26+,31+,34, 34+,44,59 注:( )括号内的数为相同时间点的人数 数据另一种记录: 对象编号 生存时间(t) 结局状态(0为截尾值) 1 1 1 2 14 0
例:某病病人术后生存率
期初 (ti 1,ti ) 人数 [0,1] 100 [1,2] 90 [2,3] 80 生存 死亡 生存 死亡 生存 生存率 s(ti ) 人数 人数 概率 概率 10 90 0.1 0.9 0.90 10 80 0.11 0.89 0.80 20 60 0.25 0.75 0.60
动物实验随访数据(图17-1,a)
×为死亡
× O O × ×
O 为截尾
0
起始事件时间
2013-8-7 医学统计学
如给药
t 研究结 束时间
14
一批病人不同时间进入研究的随访资料
起点 起点 死亡
死亡
失访
起点
起点
起点
存活 存活
90年
2013-8-7
91年
医学统计学
92年
93年(研究结 15 束)
资料整理和记录
2013-8-7 医学统计学 32
第三节 生存曲线的统计检验
比较不同方法的生存率,常进行生存率曲 线间的比较。 方法:时序检验(Log-Rank test),可对两组 或多组生存率曲线做比较. 检验假设:H0:两总体的生存率曲线相同 H1:两总体的生存率曲线不同 α=0.05,如P≤α,拒绝H0 2013-8-7 医学统计学
某病不同药后随访记录(天)
预后因素
病例 号 1 2 3 4
随访记录
是否 死亡 1 1 0 生存 时间 140 160 99 36
12
性别 处理 开始 终止 组 日期 日期 1 A药 98/07/12 98/11/29 2 B药 98/07/01 98/12/29 1 A药 98/08/22 98/11/29 2 B药
2013-8-7 医学统计学 24
2.生存曲线:(survival curve) 指各时点(t)为横轴,生存率S(t)为纵轴,连 接一起的曲线图。描述生存率在各时点(t)的 变化过程。 3.半数生存期(中位数生存时间) 即生存率为0.5时对应的时间(t),描述一 组数据平均生存时间。
注:生存时间(t)是正偏态分布。
33
Log-rank检验
检验统计量:
2013-8-7 医学统计学 25
Survival Functions
1.2
1.0
甲手术
.8
.6
乙手术
.4
.2
0.0
-.2 0 10 20 30 40 50 60
月
图17-2 两种手术治疗方式术后病人生存曲线的比较 2013-8-7 26 医学统计学
(二)生存率估计的统计方法 (非参数方法)
1.小样本数据生存率计算*。 用 kaplan-Meier的乘积极限法(productlimit method,PL法) 方法: 1)将生存时间t由小到大排列。截尾值排在完 全数据后,例:20,20+ 2)列出t时刻死亡数(d) 3)生存率估计用概率乘法原理 例:17-1和表17-1
2013-8-7 医学统计学 9
3.生存数据的特点
1)完全数据:研究对象在规定研究期间提供确 切的“时间和结局”。
2)截尾数据(t+) :截尾数据虽然提供的信息不 完全,但提供了部分信息,如 t=10+年>9年。 3)生存数据的结果变量(Y )有两个: 时间(t)值 ,t>0 结局状态(y )=“ 如死亡或截尾值”
Survival Time Standard error 95% Confidence Interval
Mean: 24.23 Median: 10.00
•
•
4.99 6.96
( 14.44, 34.01 ) (.00, 23.63 )
表17-2资料乙手术描述指标 • Survival Standard 95% Confidence Time Err Interval Mean 7.80 1.18 (5.50, 10.10 ) Median 6.00 2.98 (0.16, 11.84 ) 2013-8-7 30 医学统计学
2013-8-7 医学统计学 校正人数=1962-39/2=1942.5 31
寿命表法与PL的区别
1.计算在 (ti 1,ti ) 时间段的生存率。 如0-1年、1-2年,时间段组距相等。 2.寿命表方法计算死亡概率,用校正观察人数计 算。假定有截尾事件的人在各时间组内平均生 存为1/2时间。 (校正观察人数=期初观察人数-截尾人数/2) 死亡概率=某时间组内死亡人数/校正观察人数
2013-8-7 医学统计学 10
二 资料的收集
(一)随访研究设计 1.明确研究对象的起始事件时间,如手术日期等。 2.明确结局事件:如死亡或复发。 3.明确研究跨度时间:如2000年至2005年结束。 4.记录个体影响结果(y)的其他自变量。
2013-8-7 医学统计学 11
例:收集生存数据和影响预后的因素 。
2013-8-7 医学统计学 5
随访研究
随访研究(follow-up study)是医学中常用前 瞻性研究. 例:两种方法肾移植病人术后肾的生存时间 和结局(生存率)比较. 例:不同方法对某病人(癌症、反复发作疾病) 生存时间(缓解时间)与结局(生存率)比较. 该类数据通过随访得到,称为随访资料。
第十七章 生存分析 (Survival Analysis)
随访研究及统计分析
第二军医大学卫生统计学教研室 孟 虹
2013-8-7 医学统计学 1
本章内容
第一节 第二节 第三节 生存分析的基本概念 生存率的估计与生存曲线* 生存曲线的Log-rank检验
第四节
第五节
2013-8-7
COX比例风险回归模型*
(三)生存分析主要研究的内容
1.统计描述:计算不同时间点(t)的生存率, 描述生存过程。 2.统计推断:检验不同处理方式的生存过程 有无统计差别. 3.自变量(x)对生存时间(t)的关系:影 响生存时间的危险因素分析.
2013-8-7 医学统计学 17
第二节 生存率的估计与生存曲线
2013-8-7 医学统计学 “t”表示从研究起点到结局出现时间 23
t
生存率S(t)的概率乘法估计
S(t)也称累计生存概率,t 时刻存活是t 时刻之前一直生存的累积。 概率乘法原理计算(359页)
s(ti ) pi p1 p2 ... pi
(公式17-2)
Pi 为某时间区间(ti)的生存概率。假定 个体在各时段生存是独立。
ti时刻存活的人数 n年生存率 s(ti ) 观察的总人数 90 80 s(1) 0.9 s(2) 0.80 2013-8-7 医学统计学 100 100
22
生存时间数据分析时整理示意图
•
• •
失访
死亡 失访 死亡
死亡 死亡 0 2 4 6 8 10 12 14 16 18 20 年
2013-8-7 医学统计学 27
例17-1:某手术方法(甲法)治疗23例肾 上腺肿瘤病人后生存情况(讲义358页)
生存时间(t,月),其中“+”者为截尾数据 1,3,5(3),6(3),7,8,10 (2) ,14+,17,19+,20+,22+,26+, 31+,34,34+,44,59 计算生存率s(t)和生存曲线
20
生存率(survival rate)
称为生存函数 记为S(t) S(t) :指观察对象从起始事件(如手术时间
为0点)开始,到t时刻仍存活的概率。常用n年 生存率表示。 ti时刻存活的人数( X ) n年生存率 s(t ) 观察的总人数
时间ti ,i=1,2,3…n
2013-8-7 医学统计学 假设数据是完全数据,计算见例 21
第一节
生存分析的基本概念
一、随访数据概念
1.分析的变量(y) 1) 结局事件:指结局出现的特征,如疾病的死 亡、复发、发生( y=1或0) 。 2)时间间隔变量 记为(t)
t=结局事件出现日期 - 事件的起始日期
(起始日期可规定:如诊断、用药、手术日期 2013-8-7 8 医学统计学 等), t的单位:可用年、月、周表示
疗效除了应评价“结局”的好坏,结局所 经历时间长短也是评价疗效重要的指标。
2013-8-7
医学统计学
4
例2:
两种方法对疾病的疗效 方法 治疗人数 生存人数 生存率% 甲方法 100 20 20 乙方法 100 50 50 经χ2检验 p<0.05,乙法预后优于甲法。 假定: 1.观察期间疾病的死亡率不随时间变化。 2.研究对象观察时间长度相等。
98/10/20 98/11/25 车祸死亡 0
医学统计学
2013-8-7
(二)随访的方式
1.全部观察对象同时接受不同处理(起点相同) 随访方式:多见于动物实验(见图17-1,a)
2.观察对象在不同时间接受处理因素(起点不同) 随访方式:临床试验研究(见图17-1,b)
2013-8-7
医学统计学
13
死亡概率、生存概率
死亡概率(F):在某时间段(t)开始存活的个体, 死于(t+△t)该时段内的可能性。
某时间段内的死亡数 d F 某时间段初的观察数 n
(17-1)
生存概率(pi=1-F):
指某时间段开始存活的个体到该时间段结束 时仍存活的概率。
2013-8-7
某时间段存活人数 p 医学统计学 某时间段初的观察数
2013-8-7 医学统计学 28
表17-1 甲种手术后病人生存率的计算方法
时间(月) 死亡 ti 人数 期初 人数 死亡 概率 生存 概率 生存率
p( x t )
0.957 0.914 0.783 0.652 0. 609 0.565 0.478 0.478 29
1 3 5 6 7 8 10 + 142013-8-7
2.截尾数据
观察过程中个体因其他原因未观察到明确的 结局, 称为截尾或删失数据( censored data)。 截尾原因有: ①失访,②退出研究,如其他原因死亡。③研究 时间结束,未出现结局事件。 截尾值(censored value): 时间(t)=截尾事件日期 -起始事件日期 记为t+。(例:10+月)
2013-8-7 医学统计学 6
随访Leabharlann Baidu究资料
•
当研究事件(y)的结局是两分类数据(发 生,不发生),并且结局与时间(t)有关, 如同时收集事件发生的时间(t),该类数据 称为随访资料,分析该数据的统计方法用生 存分析。
• 生存分析是将“结局”与“时间”两个因素 结合一起研究的统计分析方法。
2013-8-7 医学统计学 7
1 1 3 3 1 1 2 0
23 22 21 18 15 14 13 11
0.043 0.045 0.143 0.167 0.067 0.071 0.154 0.000 医学统计学
t
0.957 0.955 0.857 0.833 0.933 0.929 0.846 1.000
表17-1资料甲手术描述指标(SPSS 软件)
寿命表(不讲)
医学统计学 2
*要求掌握概念、方法、用途。
概 述
• 临床上疗效、预后的评价常用疾病 的结局指标:如有效率、治愈率、 死亡率比较。对于短期内能明确治 疗效果的疾病是适用的。但对于远 期疗效,上述指标的评价不全面。
2013-8-7
医学统计学
3
例
某病的疗效比较
甲药 乙药 治愈率(%) 80 81 平均治愈时间(月) 20 12
2.大样本资料的生存分析方法—寿命表法 (Life-table method)
例17-3 表17-3 2418例男性心绞痛病人生存率情况 术后 死亡 截尾 期初 校正 生存 生存率 年数 人数 人数 人数 人数 概率 (t+1) 0456 0 2418 2418 0.8114 0.8114 1226 39 1962 1942.5 0.8837 0.717 2- 152 22 1697 1686 0.9098 0.6524
(一)描述生存资料的几个指标
1.不同时间点生存率 2.生存曲线
3.中位生存时间
2013-8-7 医学统计学 18
几个率概念
死亡率、死亡概率、生存概率、生存率
死亡率:表示在单位时间(年)内死亡发生 的频率(年平均死亡水平)。
某年内死亡数 某年死亡率 1000% 某年的平均人数
2013-8-7 医学统计学 19
某人研究手术方法治疗23位肾上腺肿瘤病人的 生存时间(月)如下: 1,3,5(3),6(3),7,8,10(2), 14+,17,,19+,20+,22+,26+,31+,34, 34+,44,59 注:( )括号内的数为相同时间点的人数 数据另一种记录: 对象编号 生存时间(t) 结局状态(0为截尾值) 1 1 1 2 14 0
例:某病病人术后生存率
期初 (ti 1,ti ) 人数 [0,1] 100 [1,2] 90 [2,3] 80 生存 死亡 生存 死亡 生存 生存率 s(ti ) 人数 人数 概率 概率 10 90 0.1 0.9 0.90 10 80 0.11 0.89 0.80 20 60 0.25 0.75 0.60
动物实验随访数据(图17-1,a)
×为死亡
× O O × ×
O 为截尾
0
起始事件时间
2013-8-7 医学统计学
如给药
t 研究结 束时间
14
一批病人不同时间进入研究的随访资料
起点 起点 死亡
死亡
失访
起点
起点
起点
存活 存活
90年
2013-8-7
91年
医学统计学
92年
93年(研究结 15 束)
资料整理和记录
2013-8-7 医学统计学 32
第三节 生存曲线的统计检验
比较不同方法的生存率,常进行生存率曲 线间的比较。 方法:时序检验(Log-Rank test),可对两组 或多组生存率曲线做比较. 检验假设:H0:两总体的生存率曲线相同 H1:两总体的生存率曲线不同 α=0.05,如P≤α,拒绝H0 2013-8-7 医学统计学
某病不同药后随访记录(天)
预后因素
病例 号 1 2 3 4
随访记录
是否 死亡 1 1 0 生存 时间 140 160 99 36
12
性别 处理 开始 终止 组 日期 日期 1 A药 98/07/12 98/11/29 2 B药 98/07/01 98/12/29 1 A药 98/08/22 98/11/29 2 B药
2013-8-7 医学统计学 24
2.生存曲线:(survival curve) 指各时点(t)为横轴,生存率S(t)为纵轴,连 接一起的曲线图。描述生存率在各时点(t)的 变化过程。 3.半数生存期(中位数生存时间) 即生存率为0.5时对应的时间(t),描述一 组数据平均生存时间。
注:生存时间(t)是正偏态分布。
33
Log-rank检验
检验统计量:
2013-8-7 医学统计学 25
Survival Functions
1.2
1.0
甲手术
.8
.6
乙手术
.4
.2
0.0
-.2 0 10 20 30 40 50 60
月
图17-2 两种手术治疗方式术后病人生存曲线的比较 2013-8-7 26 医学统计学
(二)生存率估计的统计方法 (非参数方法)
1.小样本数据生存率计算*。 用 kaplan-Meier的乘积极限法(productlimit method,PL法) 方法: 1)将生存时间t由小到大排列。截尾值排在完 全数据后,例:20,20+ 2)列出t时刻死亡数(d) 3)生存率估计用概率乘法原理 例:17-1和表17-1
2013-8-7 医学统计学 9
3.生存数据的特点
1)完全数据:研究对象在规定研究期间提供确 切的“时间和结局”。
2)截尾数据(t+) :截尾数据虽然提供的信息不 完全,但提供了部分信息,如 t=10+年>9年。 3)生存数据的结果变量(Y )有两个: 时间(t)值 ,t>0 结局状态(y )=“ 如死亡或截尾值”
Survival Time Standard error 95% Confidence Interval
Mean: 24.23 Median: 10.00
•
•
4.99 6.96
( 14.44, 34.01 ) (.00, 23.63 )
表17-2资料乙手术描述指标 • Survival Standard 95% Confidence Time Err Interval Mean 7.80 1.18 (5.50, 10.10 ) Median 6.00 2.98 (0.16, 11.84 ) 2013-8-7 30 医学统计学
2013-8-7 医学统计学 校正人数=1962-39/2=1942.5 31
寿命表法与PL的区别
1.计算在 (ti 1,ti ) 时间段的生存率。 如0-1年、1-2年,时间段组距相等。 2.寿命表方法计算死亡概率,用校正观察人数计 算。假定有截尾事件的人在各时间组内平均生 存为1/2时间。 (校正观察人数=期初观察人数-截尾人数/2) 死亡概率=某时间组内死亡人数/校正观察人数
2013-8-7 医学统计学 10
二 资料的收集
(一)随访研究设计 1.明确研究对象的起始事件时间,如手术日期等。 2.明确结局事件:如死亡或复发。 3.明确研究跨度时间:如2000年至2005年结束。 4.记录个体影响结果(y)的其他自变量。
2013-8-7 医学统计学 11
例:收集生存数据和影响预后的因素 。
2013-8-7 医学统计学 5
随访研究
随访研究(follow-up study)是医学中常用前 瞻性研究. 例:两种方法肾移植病人术后肾的生存时间 和结局(生存率)比较. 例:不同方法对某病人(癌症、反复发作疾病) 生存时间(缓解时间)与结局(生存率)比较. 该类数据通过随访得到,称为随访资料。
第十七章 生存分析 (Survival Analysis)
随访研究及统计分析
第二军医大学卫生统计学教研室 孟 虹
2013-8-7 医学统计学 1
本章内容
第一节 第二节 第三节 生存分析的基本概念 生存率的估计与生存曲线* 生存曲线的Log-rank检验
第四节
第五节
2013-8-7
COX比例风险回归模型*