医学统计学生存分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十七章 生存分析 (Survival Analysis)
随访研究及统计分析
第二军医大学卫生统计学教研室 孟虹
2020/3/29
医学统计学
1
本章内容
第一节 生存分析的基本概念
第二节 生存率的估计与生存曲线*
第三节 生存曲线的Log-rank检验
第四节 COX比例风险回归模型*
第五节 寿命表(不讲)
2020/3/29
医学统计学
10
二 资料的收集
(一)随访研究设计 1.明确研究对象的起始事件时间,如手术日期等。
2.明确结局事件:如死亡或复发。
3.明确研究跨度时间:如2000年至2005年结束。
4.记录个体影响结果(y)的其他自变量。
2020/3/29
医学统计学
11
例:收集生存数据和影响预后的因素 。
2020/3/29
医学统计学
9
3.生存数据的特点
1)完全数据:研究对象在规定研究期间提供确 切的“时间和结局”。
2)截尾数据(t+) :截尾数据虽然提供的信息不 完全,但提供了部分信息,如 t=10+年>9年。
3)生存数据的结果变量(Y )有两个: 时间(t)值 ,t>0 结局状态(y )=“ 如死亡或截尾值”
1.统计描述:计算不同时间点(t)的生存率, 描述生存过程。
2.统计推断:检验不同处理方式的生存过程 有无统计差别.
3.自变量(x)对生存时间(t)的关系:影 响生存时间的危险因素分析.
2020/3/29
医学统计学
17
第二节 生存率的估计与生存曲线
(一)描述生存资料的几个指标
1.不同时间点生存率
2.生存曲线
F
ቤተ መጻሕፍቲ ባይዱ
某时间段内的死亡数 某时间段初的观察数
d n
(17-1)
生存概率(pi=1-F):
指某时间段开始存活的个体到该时间段结束
时仍存活的概率。
2020/3/29
某时间段存活人数 p 某时医学间 统计学段初的观察数 20
生存率(survival rate)
2020/3/29
医学统计学
6
随访研究资料
• 当研究事件(y)的结局是两分类数据(发
生,不发生),并且结局与时间(t)有关, 如同时收集事件发生的时间(t),该类数据 称为随访资料,分析该数据的统计方法用生 存分析。
• 生存分析是将“结局”与“时间”两个因素 结合一起研究的统计分析方法。
2020/3/29
1,3,5(3),6(3),7,8,10(2), 14+,17,,19+,20+,22+,26+,31+,34, 34+,44,59
注:( )括号内的数为相同时间点的人数
数据另一种记录:
对象编号 生存时间(t) 结局状态(0为截尾值)
1
1
1
2
14
0
2020/3/29
医学统计学
16
(三)生存分析主要研究的内容
3.中位生存时间
2020/3/29
医学统计学
18
几个率概念
死亡率、死亡概率、生存概率、生存率
死亡率:表示在单位时间(年)内死亡发生 的频率(年平均死亡水平)。
某年死亡率
某年内死亡数 某年的平均人数
1000%
2020/3/29
医学统计学
19
死亡概率、生存概率
死亡概率(F):在某时间段(t)开始存活的个体, 死于(t+△t)该时段内的可能性。
80
20
81
12
疗效除了应评价“结局”的好坏,结局所 经历时间长短也是评价疗效重要的指标。
2020/3/29
医学统计学
4
例2:
两种方法对疾病的疗效
方法 治疗人数 生存人数 生存率%
甲方法 100
20
20
乙方法 100
50
50
经χ2检验 p<0.05,乙法预后优于甲法。
假定:
1.观察期间疾病的死亡率不随时间变化。
8
2.截尾数据
观察过程中个体因其他原因未观察到明确的 结局, 称为截尾或删失数据( censored data)。 截尾原因有:
①失访,②退出研究,如其他原因死亡。③研究 时间结束,未出现结局事件。
截尾值(censored value): 时间(t)=截尾事件日期 -起始事件日期 记为t+。(例:10+月)
医学统计学
7
第一节 生存分析的基本概念
一、随访数据概念
1.分析的变量(y) 1) 结局事件:指结局出现的特征,如疾病的死 亡、复发、发生( y=1或0) 。
2)时间间隔变量 记为(t)
t=结局事件出现日期 - 事件的起始日期
(起始日期可规定:如诊断、用药、手术日期
等), 2020/3/29 t的单位:可用医年学统计、学 月、周表示
2.研究对象观察时间长度相等。
2020/3/29
医学统计学
5
随访研究
随访研究(follow-up study)是医学中常用前 瞻性研究.
例:两种方法肾移植病人术后肾的生存时间 和结局(生存率)比较.
例:不同方法对某病人(癌症、反复发作疾病) 生存时间(缓解时间)与结局(生存率)比较.
该类数据通过随访得到,称为随访资料。
×为死亡
×
O 为截尾
O O
× ×
0
起始事件时间
2020/3/29
如给药
医学统计学
t
研究结
束时间
14
一批病人不同时间进入研究的随访资料
起点
起点
起点
死亡
死亡
失访
90年
2020/3/29
起点
起点
91年
92年
医学统计学
存活 存活
93年(研究结
束)
15
资料整理和记录
某人研究手术方法治疗23位肾上腺肿瘤病人的 生存时间(月)如下:
0
2020/3/29
医学统计学
12
(二)随访的方式
1.全部观察对象同时接受不同处理(起点相同) 随访方式:多见于动物实验(见图17-1,a)
2.观察对象在不同时间接受处理因素(起点不同) 随访方式:临床试验研究(见图17-1,b)
2020/3/29
医学统计学
13
动物实验随访数据(图17-1,a)
某病不同药后随访记录(天)
预后因素
随访记录
病例 性别 处理 开始 终止 是否
号
组 日期 日期 死亡
1 1 A药 98/07/12 98/11/29
1
2 2 B药 98/07/01 98/12/29
1
3 1 A药 98/08/22 98/11/29
0
生存 时间 140 160 99
4 2 B药 98/10/20 98/11/25 车祸死亡 36
*要求掌握概念、方法、用途。
2020/3/29
医学统计学
2
概述
• 临床上疗效、预后的评价常用疾病 的结局指标:如有效率、治愈率、 死亡率比较。对于短期内能明确治 疗效果的疾病是适用的。但对于远 期疗效,上述指标的评价不全面。
2020/3/29
医学统计学
3
例
甲药 乙药
某病的疗效比较
治愈率(%) 平均治愈时间(月)
随访研究及统计分析
第二军医大学卫生统计学教研室 孟虹
2020/3/29
医学统计学
1
本章内容
第一节 生存分析的基本概念
第二节 生存率的估计与生存曲线*
第三节 生存曲线的Log-rank检验
第四节 COX比例风险回归模型*
第五节 寿命表(不讲)
2020/3/29
医学统计学
10
二 资料的收集
(一)随访研究设计 1.明确研究对象的起始事件时间,如手术日期等。
2.明确结局事件:如死亡或复发。
3.明确研究跨度时间:如2000年至2005年结束。
4.记录个体影响结果(y)的其他自变量。
2020/3/29
医学统计学
11
例:收集生存数据和影响预后的因素 。
2020/3/29
医学统计学
9
3.生存数据的特点
1)完全数据:研究对象在规定研究期间提供确 切的“时间和结局”。
2)截尾数据(t+) :截尾数据虽然提供的信息不 完全,但提供了部分信息,如 t=10+年>9年。
3)生存数据的结果变量(Y )有两个: 时间(t)值 ,t>0 结局状态(y )=“ 如死亡或截尾值”
1.统计描述:计算不同时间点(t)的生存率, 描述生存过程。
2.统计推断:检验不同处理方式的生存过程 有无统计差别.
3.自变量(x)对生存时间(t)的关系:影 响生存时间的危险因素分析.
2020/3/29
医学统计学
17
第二节 生存率的估计与生存曲线
(一)描述生存资料的几个指标
1.不同时间点生存率
2.生存曲线
F
ቤተ መጻሕፍቲ ባይዱ
某时间段内的死亡数 某时间段初的观察数
d n
(17-1)
生存概率(pi=1-F):
指某时间段开始存活的个体到该时间段结束
时仍存活的概率。
2020/3/29
某时间段存活人数 p 某时医学间 统计学段初的观察数 20
生存率(survival rate)
2020/3/29
医学统计学
6
随访研究资料
• 当研究事件(y)的结局是两分类数据(发
生,不发生),并且结局与时间(t)有关, 如同时收集事件发生的时间(t),该类数据 称为随访资料,分析该数据的统计方法用生 存分析。
• 生存分析是将“结局”与“时间”两个因素 结合一起研究的统计分析方法。
2020/3/29
1,3,5(3),6(3),7,8,10(2), 14+,17,,19+,20+,22+,26+,31+,34, 34+,44,59
注:( )括号内的数为相同时间点的人数
数据另一种记录:
对象编号 生存时间(t) 结局状态(0为截尾值)
1
1
1
2
14
0
2020/3/29
医学统计学
16
(三)生存分析主要研究的内容
3.中位生存时间
2020/3/29
医学统计学
18
几个率概念
死亡率、死亡概率、生存概率、生存率
死亡率:表示在单位时间(年)内死亡发生 的频率(年平均死亡水平)。
某年死亡率
某年内死亡数 某年的平均人数
1000%
2020/3/29
医学统计学
19
死亡概率、生存概率
死亡概率(F):在某时间段(t)开始存活的个体, 死于(t+△t)该时段内的可能性。
80
20
81
12
疗效除了应评价“结局”的好坏,结局所 经历时间长短也是评价疗效重要的指标。
2020/3/29
医学统计学
4
例2:
两种方法对疾病的疗效
方法 治疗人数 生存人数 生存率%
甲方法 100
20
20
乙方法 100
50
50
经χ2检验 p<0.05,乙法预后优于甲法。
假定:
1.观察期间疾病的死亡率不随时间变化。
8
2.截尾数据
观察过程中个体因其他原因未观察到明确的 结局, 称为截尾或删失数据( censored data)。 截尾原因有:
①失访,②退出研究,如其他原因死亡。③研究 时间结束,未出现结局事件。
截尾值(censored value): 时间(t)=截尾事件日期 -起始事件日期 记为t+。(例:10+月)
医学统计学
7
第一节 生存分析的基本概念
一、随访数据概念
1.分析的变量(y) 1) 结局事件:指结局出现的特征,如疾病的死 亡、复发、发生( y=1或0) 。
2)时间间隔变量 记为(t)
t=结局事件出现日期 - 事件的起始日期
(起始日期可规定:如诊断、用药、手术日期
等), 2020/3/29 t的单位:可用医年学统计、学 月、周表示
2.研究对象观察时间长度相等。
2020/3/29
医学统计学
5
随访研究
随访研究(follow-up study)是医学中常用前 瞻性研究.
例:两种方法肾移植病人术后肾的生存时间 和结局(生存率)比较.
例:不同方法对某病人(癌症、反复发作疾病) 生存时间(缓解时间)与结局(生存率)比较.
该类数据通过随访得到,称为随访资料。
×为死亡
×
O 为截尾
O O
× ×
0
起始事件时间
2020/3/29
如给药
医学统计学
t
研究结
束时间
14
一批病人不同时间进入研究的随访资料
起点
起点
起点
死亡
死亡
失访
90年
2020/3/29
起点
起点
91年
92年
医学统计学
存活 存活
93年(研究结
束)
15
资料整理和记录
某人研究手术方法治疗23位肾上腺肿瘤病人的 生存时间(月)如下:
0
2020/3/29
医学统计学
12
(二)随访的方式
1.全部观察对象同时接受不同处理(起点相同) 随访方式:多见于动物实验(见图17-1,a)
2.观察对象在不同时间接受处理因素(起点不同) 随访方式:临床试验研究(见图17-1,b)
2020/3/29
医学统计学
13
动物实验随访数据(图17-1,a)
某病不同药后随访记录(天)
预后因素
随访记录
病例 性别 处理 开始 终止 是否
号
组 日期 日期 死亡
1 1 A药 98/07/12 98/11/29
1
2 2 B药 98/07/01 98/12/29
1
3 1 A药 98/08/22 98/11/29
0
生存 时间 140 160 99
4 2 B药 98/10/20 98/11/25 车祸死亡 36
*要求掌握概念、方法、用途。
2020/3/29
医学统计学
2
概述
• 临床上疗效、预后的评价常用疾病 的结局指标:如有效率、治愈率、 死亡率比较。对于短期内能明确治 疗效果的疾病是适用的。但对于远 期疗效,上述指标的评价不全面。
2020/3/29
医学统计学
3
例
甲药 乙药
某病的疗效比较
治愈率(%) 平均治愈时间(月)