第17章 生存分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Cox比例风险回归模型。
20
三、生存资料的统计描述和生存 率的区间估计
(一)未分组资料的生存分析(小样本,原始数据形式) 用乘积极限法(product-limited estimates);又称 Kaplan-Meier法,是一种非参数方法,主要适用于 观察例数不多时。
例:某种治疗方案治疗Ⅲ期肺癌患者11例,随访时间(月)记 录如下:
6
1、“死亡”事件或称失败事件(failure event) :
表示观察到随访对象出现了我们所规定的结局,是 反映处理因素失败或失效的特征。如乳腺癌病人手 术后复发、肾移植病人肾功能衰竭、白血病患者化 疗后的复发等。
失败事件的认定是生存分析的基石,必须绝对 准确。 注意:失效事件应当由研究目的而定,并非一定是 死亡,而死亡也并非一定是失败事件。
期末存活数 10 9 8 7 6 5 4 3 2 1 0
Censored:
( 18.18%) 6,
Events: 9 20 )
Survival Time
Standard Error
95% Confidence Interval
Survival Table
Cumulative Proportion Surviving at the Time Time 1 2 3 5 6 9 11 13 16 26 37 Status 1 1 1 1 1 0 1 1 1 1 0 Es timate .909 .818 .727 .636 .545 . .436 .327 .218 .109 .
4
二、生存分析的基本概念
(一)生存分析的基本术语
(二)随访内容
(三)随访方式
(四)生存分析的主要内容
5
(一)生存分析的基本术语
1、“死亡”事件或称失败事件(failure event)
2、截尾值(censored value) 3、生存时间(survival time) 4、生存率(survival rate)
(4)随访截止:随访研究结束时观察对象仍存活, 终止随访时间为研究结束时间。
13
记录影响生存的有关因素
如病人年龄、病程、健康状况、经济、文化、 职业等因素,以便分析这些因素对生存率的影响。
14
随访资料数据的特点: (1)应变量有两个,即生存时间(天数)和结局(死亡与否)。 (2)生存时间存在观察不完全的数据。
28
Survival Function
1.2 1.0 .8 .6 .4 .2 0.0 0 5 10 15 20 25 30 35 40
Survival Function Censored
随访时间(月)
生存率曲线阶梯曲线(Kaplan-Meier曲线)
29
由图可直观地比较各样本的生存率曲线,
也可对某一病例任意时刻的生存率作出估计,
即随访观察持续的实足时间,按失败事件发生或 失访前最后一次的随访时间记录。按天、周、月、 年等时间单位记录,常用符号t表示。 一般情况下较细的时间单位准确性较高,应尽量 以个体为单位采用较细的时间单位来记录。但在许 多大型的随访中,不可能做到按个体记录,常见的 是按固定时间段(如一月一次等)记录有多少人失 访及多少人发生失败事件,此为分组生存资料。
反之亦可由任意生存率估计生存时间。
本例中位生存时间为11个月。
中位生存时间常用于比较随访资料。
30
3、总体生存率可信区间的估计
用正态近似原理估计某时点总体生存率的可信区
间。
公式为:p( x t ) u s p ( x t )
如本例6个月生存率的95%可信区间为:
下限:p( x 6) 1.96s p ( x 6 ) 0.5455 1.96 0.1501 0.2513 上限:p( x 6) 1.96s p ( x 6 ) 0.5455 1.96 0.1501 0.8397
9
如某病人1990年2月1日进入随访,1992年4月间发生 失败事件,他的生存时间为t=26月;

又如某白血病患者化疗3月后失去联系,他的随访 结果为一截尾值,生存时间记为t=3+月;

安放心脏起搏器患者术后2年因意外事故死亡,他 的随访结果也为一截尾值,生存时间记为t=2+年。


某医院对100例原发性肝癌生存情况随访结果
l,2,3,5,6,9+,11,13,16,26,37+
试估计各时点生存率及其标准误。
21
(1)死亡数(dx):与生存时间对应的发生死 亡时间的人数。 (2)期初病例数(nx):恰好在X时刻以前的病 例数。 (3)条件死亡概率(qx):恰好在X月前的观察 对象在X月时点死亡的概率。 (4)条件生存概率:恰好在X月前的观察对象活 过X月时点的概率。
7
2、截尾值(censored value) :删失值。 有的观察对象终止随访不是由于失败事件发生,
而是由于中途失访、死于其它原因、随访截止。由
于不知道这些观察对象发生失败事件的时间,他们
的资料不能提供完全的信息,这些对象的观察值称
为截尾值,常用符号“+”表示。如140+天。
8
3、生存时间(survival time)
15
(三)随访方式
1、全体观察对象同时接受处理,观察到最后一例 出现结果,或者事先规定的随访截止时间。 2、全体观察对象在不同时间接受处理,根据完成 一定数量随访病例决定随访截止时间,或者按事先 规定的时间停止随访。这种方式较为常见。
16
“×”——表示“死亡”; “o”——表示失访退出研究或死于与本处理无关的 其它原因。
17
(四)生存分析的主要内容和基本方法
1、描述生存过程
研究人群生存状态的规律,如生存时间的分布特
点,计算某个时点的生存率、生存率曲线的变动趋势
等。 例如根据白血病化疗后的缓解年数资料,可以估 计不同年数的缓解率P(X>t),如P(X>3)、P(X>5)等, 也可以获得这些病人的缓解率曲线。
常用方法:乘积极限法和寿命表法。
18
Βιβλιοθήκη Baidu
2、比较生存过程
两组或多组生存曲线比较。
常用方法:对数秩检验、Gehan比分检验、
Breslow检验。
19
3、生存过程的影响因素分析
比较不同亚人群的生存状况,进行两组或多组生
存率比较,以了解哪些因素会影响目标人群的生存过 程,这是生存分析方法最重要的研究内容,在临床医 学中应用非常广泛。 例如分析影响乳腺癌病人手术后预后的因素,可 以是病人的年龄、病程、术前健康状况、有无淋巴结 转移、术后有无感染、辅助治疗措施、营养等。
月数 失访数 死亡数 0~ 2 17 1~ 1 26 2~ 3 27 3~ 2 15 4~ 0 2 5~ 1 2 6~ 0 0 7~ 1 0 8~9 0 1
10
4、生存率(survival rate)
实际应当是生存概率,指某个观察对象活过t时 刻的概率,常用P(X>t)表示。如P(X>10)表示某对
dx qx nx
dx ˆ x 1 qx 1 p nx
23
(5)生存率 P(X>t):即观察对象活过某时点 的概率。 某时点的生存率为≤t时刻的各时点条件生 存率的乘积。
ˆx p( x t ) p ˆ1 p ˆ2 p ˆ 3 0.7273 如:p( x 3) p
25
生存率 .9091 .8182 .7273 .6364 .5455 .4364 .3273 .2182 .1091
生存率标准误 .0867 .1163 .1343 .1450 .1501 .1547 .1497 .1337 .1021 2 4 (
累积死亡数 1 2 3 4 5 5 6 7 8 9 9
象活过10天(或10月、10年)的概率。
根据不同随访资料的失败事件,生存率可以是
缓解率、有效率等。
11
(二)随访内容
1、每个观察对象有明确的开始随访时间
2、随访结局和终止随访时间 3、记录影响生存的有关因素
12
随访结局和终止随访时间
(1)“死亡”:即处理失败,终止随访时间为“死 亡”时间。 (2)中途失访:如失去联系、中途退出等,终止随 访时间为最后一次访问时间为准。 (3)死于其它与研究疾病无关的原因,终止随访时 间为死亡时间。
31
(二)分组资料的生存分析
应用:
1、当随访资料的例数较多 ( 如 n>50) 时,可先将原始资料分组
再进行分析。
2、很多随访研究设计的随访时间是一年或一个月一次,随访
结果只有该年或该月期间的若干观察人数、发生失败事件人数
和截尾人数,没有各个病例的确切观察时间,所获得的资料只 能视为分组资料。
32
1 2 3 4 5 6 7 8 9 10 11
N of Cumulative Std. Error Events .087 1 .116 .134 .145 .150 . .155 .150 .134 .102 . 2 3 4 5 5 6 7 8 9 9
N of Remaining Cases 10 9 8 7 6 5 4 3 2 1 0
方法:
分组资料的生存率估计使用寿命表 (life
table)法,这也是一种非参数统计方法。
33
例某医院对100例原发性肝癌患者确诊后进行随 访,得资料见下表,根据此资料进行分组资料生存率 和标准误的计算。
0~ 月数 失访数 2 死亡数 17 1~ 1 26 2~ 3 27 3~ 2 15 4~ 0 2 5~ 1 2 6~ 0 0 7~ 1 0 8~9 0 1
2
原理及方法在其他领域的应用
利用生存分析的原理和方法,把“出生”、“死亡” 的涵义稍加变通,在医学研究中可以有广泛的应用。
3
应用举例:

观察某“手术或化疗”对恶性肿瘤病人的疗效,可 将“手术或化疗”代替“出生”,用生存分析来分 析接受该处理患者的生存时间以及活过某时点的概 率。

以第一次心肌梗死代替“出生”,以第二次心肌梗 死代替“死亡”,用生存分析可以预计在多少年或 月内发生第二次心肌梗死的概率。 一般而言,能够明确划分起止点的现象,即凡涉 及事物寿命现象的问题,均可以用生存分析的原理和 方法来进行研究。
34
35
36
Survival Function
1.2
1.0
.8
.6
与未分组资料的生存率 曲线的不同之处是: 生存率的各点在各 组段的上限处,用折线 连接各点。
.4
.2 0.0 0 2 4 6 8 10
生存时间
Cases weighted by 人数
生存率曲线
随访资料的生存分析 Survival Analysis
温州医学院公共卫生学院 叶晓蕾
一、生存分析的意义
生存分析不仅仅是字面上的“生存分析”,它 代表了一种基本的分析思想。
原义:
生存分析原先是用来分析特定人群的生命过程 或死亡过程的统计方法。该人群出生后,按照一定 的年龄组死亡率先后死去,直到全部死亡为止,用 统计学方法推算出该人群在不同年龄组的“生存概 率”、“预期寿命”等指标。
26
Means and Medians for Survival Time Mean Std. Error 3.521
a
Median Std. Error 4.642 95% Confidence Interval Lower Bound 1.901 Upper Bound 20.099
95% Confidence Interval Lower Bound 5.882 Upper Bound 19.682 Estimate 11.000
(6)生存率的标准误:
sp ( x t )
1 p( x t ) p( x t ) nx d x
24
Survival Analysis for TIME 随访时间(月) 1 2 3 5 6 9 11 13 16 26 37 Number of Cases: 平均存活时间: (Limited to 中位存活时间: 11 死亡数 1 1 1 1 1 0 1 1 1 1 0 11 13 37 ) 5 ( 2, 20 )
Estimate 12.782
a. Estimation is limited to the largest survival time if it is censored.
27
2、生存率曲线
未分组资料的生存率曲线也称Kaplan—Meier曲线,
它是以时间t为横轴,生存率P(X>t)为纵轴,水平横 线的长短代表一个t时点到下一个t时点的距离,从而 表示时间与生存率关系的曲线。
相关文档
最新文档