生存分析(第17章)
第十七章生存分析SurvivalAnalysis
12
动物实验随访数据(图17-1,a)
×为死亡
×
O 为截尾
O O
× ×
0
起始事件时间
如给药
t
研究结
束时间
13
一批病人不同时间进入研究的随访资料
起点
起点
起点
死亡
死亡
失访
起点
90年
91年
起点 92年
存活 存活
93年(研究结
0 2 4 6 8 10 12 14 16 18 20 年
t
“t”表示从研究起点到结局出现时间 22
生存率S(t)的概率乘法估计
S(t)也称累计生存概率,t 时刻存活是t 时刻之前一直生存的累积。
概率乘法原理计算(359页)
s(ti ) pi p1 p2...pi (公式17-2)
Pi 为某时间区间(ti)的生存概率。假定 个体在各时段生存是独立。
该类数据通过随访得到,称为随访资料。
5
随访研究资料
• 当研究事件(y)的结局是两分类数据(发
生,不发生),并且结局与时间(t)有关, 如同时收集事件发生的时间(t),该类数据 称为随访资料,分析该数据的统计方法用生 存分析。
• 生存分析是将“结局”与“时间”两个因素 结合一起研究的统计分析方法。
6
第一节 生存分析的基本概念
一、随访数据概念
1.分析的变量(y) 1) 结局事件:指结局出现的特征,如疾病的死 亡、复发、发生( y=1或0) 。
2)时间间隔变量 记为(t)
t=结局事件出现日期 - 事件的起始日期
(起始日期可规定:如诊断、用药、手术日期
生存分析 SPSS
─从数据到结论
第十七章 生存分析
什么是生存分析的内容?
• “我的期望年龄是多少岁?” • “到底这个新疗法能使得这类绝症 患者多存活多久?”“还有什么别 的因素和存活长短有关?” • 保险公司也要考虑各种人群的寿命, 以确保其人寿保险或医疗保险既具 有竞争力又有利可图。 • 在工程上,人们也会考虑一个材料, 一个原件,甚至一个设备的寿命是 多少。
G roup
. 00 1. 00 0. 8
1. 0
0. 6
0. 4
根据Cox模型所估计的 治疗组(group=1)和对照 组(group=0)的生存函数 图
Cum Survival
0. 2
0. 0 0. 00 20. 00 40. 00 60. 00 80. 00
Survival Time
可以得到各种点图(2)
本章的内容和公式(基本)
本章的内容和公式(Kaplan-Meier)
本章的内容和公式(Cox模型)
组别
1.00
存活时间
治疗组与对照组的生存函数是否不同:三种检验 • 在存在任意右删失(例18.1数据的删失就是右 删失)的情况下,利用SPSS软件可以得到三种 对治疗组和对照组进行比较的检验;检验的 零假设均为:这两组的生存函数相同。这三 种检验是对数秩(logrank)检验(Mantel-Cox 检验)、Breslow检验(对前面Wilcoxon检验的 改进),以及Tarone-Ware检验。通过软件计 算可以得到这三种检验的结果:
• 在上面得到的生存函数的估计下,可 以对治疗组和对照组进行比较。所用 的检验为Wilcoxon (Gehan)检验。 • 这里的零假设是:这两组的生存函数 相同。 • 可以很容易从计算机输出得到检验的 p-值等于0.0564。因此,如取显著性 水平为0.05,就不能拒绝零假设。
生存函数
例子
• 例 18.1(数据 surv.txt)为了研究对农 药中毒的治疗,需要进行动物试验。研 究人员利用40只老鼠进行某种农药中毒 后的某种治疗方法试验。 • 其中有20只鼠接受治疗处理;而作为对 照的另外20只鼠没有接受治疗。 • 在此之后观察这些老鼠的生存时间(天 数)。对每一个鼠都记录了其存活时间(t)、 是否属于治疗组以及是否在某观测时间 段数据出现删失。
一些概念
• 在生存分析中,人们往往希望知道 存活过时间t的概率,这就是所谓的 生存函数(survival function)S(t)。 • 显然它等于1减去生存时间少于t的 概率,即S(t)=1-F(t)。 • 还有一个在t时刻处(附近),对死亡 发生的可能性进行度量的函数,称 为危险函数(hazard function),用h(t) 表示,它实际上是-lnS(t)的关于t的 导数(见后面公式)。
例子
• 这里的所谓删失(censored)是由于某 种原因,无法继续观测;这意味着老 鼠至少活过了这个最后记录的时间, 但最终活了多久就不得而知了。 • 这种删失在对于人类疾病的跟踪研究 中经常出现;虽然不如未删失 (uncensored)的数据完整,但也包含 了其至少活了多久这样的信息。 • 这里数据中的删失称为右删失。
SPSS软件使用说明(Kaplan-Meier方法 )
• 选择Analyze-Survival-Kaplan-Meier; • 然后把变量time选入Time;把变量censored选入 Status,再点击Define Event来定义未删失值为1; 再把变量treat选入Factor; • 之后点击Options,在其中点击Survival Table(s) (默认值)和其他需要的表格;在Plot选择需要 的图,比如Survival; • 回到主对话框后,点击Compare Factor Levels来 选择需要的检验;也可点击Save来存储一些输出。 然后在点击Continue之后,最后点击OK来运行。
第十七章:生存分析
五、生存概率与死亡概率
活过该年人数 P 某年年初人口数
该年内死亡人数 q 某年年初人口数
该年内死亡人数 m 某年平均人口数
六、风险函数(Hazard Function)
• 用h(t)表示,其定义为: • h(t)=lim(在时间t生存的病人死于区间(t,△t) 的概率/△t) • 由于计算h(t)时,用到了生存到时间t,这一条 件,故上式极限式中分子部分是一个条件概率。可 将h(t)称为生存到时间t的病人在时间t的瞬时死亡 率或条件死亡速率或年龄别死亡速率。当用t作横 坐标,h(t)为纵坐标所绘的曲线,如递增,则表示条 件死亡速率随时间而增加,如平行于横轴,则表示没 有随时间而加速(spss演示)
第四节
•
生存率的比较
• • • •
当有两个或两个以上的生存分布时,我们 常需比较它们是否来自同一生存分布,此时的 假设检验为: H0:样本所来自的总体生存分布相同。 H1:样本所来自的总体生存分布不相同。 α =0.05 可选用的检验方法有:Log-rank法和 Wilcoxon(Breslow)法。当拒绝H0时,认为几 个生存分布不相同。
一、生存时间
• 是一个广义的概念,生存时间不一定专用于死 与活的情况,生存时间(存活时间)可定义为从 某种起始事件到达某终点事件所经历的时间跨 度。
• • • • • • •
例如: 急性白血病病人治疗-复发之间的缓解期; 冠心病病人在两次发作之间隔; 已作输卵管结扎的妇女从施行输卵管吻合手术后 至受孕的时间间隔; 在流行病学研究中,从开始接触危险因素到发病所 经历的时间; 住院到出院之间所花费的医疗费用; 从购买到失效期间某医疗设备被使用的次数; 从购买到第一次维修某车辆所行驶的总里程等。
统计学教案习题17随访资料的生存分析
第十七章 随访资料的生存分析一、教学大纲要求(一)掌握内容 1.生存分析基本概念生存时间、完全数据、截尾数据、死亡率、死亡概率、生存概率、生存率。
2.估计生存率的方法:Kaplan-Meier 法、寿命表法。
(二)熟悉内容1.生存曲线、半数生存期。
2.生存资料的基本要求。
3.两生存曲线的比较的对数秩检验。
(三)了解内容 Cox 回归模型。
二、教学内容精要(一)生存分析中的基本概念1.生存时间(survial time )指观察到的存活时间,如表11-1中t 分别为360,990,1400,1800天。
生存时间有两种类型:(1)完全数据(complete data )指从起点至死亡所经历的时间,即死者的存活时间,如表11-1中360,990,1800天。
(2)截尾数据(censored data )由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。
从起点至截尾所经历的时间,称为截尾数据,如表11-1中1400天,习惯上记为1400+天。
表11-1 4例鼻咽癌随访记录患者序号性别 (男=1)处理组号开始日期 终止日期 结局 (死=1)存活天数 10 1 11/29/80 11/04/85 1 360 2 1 1 06/13/82 06/08/83 1 990 3 1 0 03/02/83 12/31/86 0 1400+ 4 008/04/8304/10/86118002.死亡概率与生存概率(1)死亡概率(mortality probability )指死于某时段内的可能性大小,记为q 。
年死亡概率的计算公式为q =某年年初观察例数某年内死亡数,若年内有截尾,则分母用校正人口数(校正人口数=年初人口数-21截尾例数)。
这里的死亡概率与通常所说的死亡率是有区别的,死亡率的分母常用年平均人口,反映过去一年的死亡频率(年平均水平),而死亡概率则用年初人口,表示往后的一年中死亡机会大小。
第十七章:生存分析(理论)
常见风险函数的类型示意
风险函数的不同情况:
常数,
下降,
如:死于飞机失事。
如:意外伤害。
先升后降, 如:交通事故。
上升, 如:持续接触危险因素。
澡盆样,
如:人的一生。
平均生存时间
• 由于生存时间的分布总是偏态的,故平 均生存时间常用中位生存时间(median survival time)来计算,其意义是50% 的个体存活且有50%的个体死亡的时间, 也即生存率为50%时在生存曲线中所对 应的生存时间。
完全数据(complete data)
在随访过程中,观察到了病人的确切结局,也 就知道其具体的存活时间.
删失数据(censored data,截尾数据)
随访工作中,由于某种原因未能观察到病人 的明确结局,这样,就不知道该病人的确切生存 时间,称之为删失数据。
常在生存时间数据后加上符号+表示删失数据。
entdate enddate 2004-10-7 2005-8-7 2002-6-29 2002-7-29 2004-8-2 2005-1-1 2004-4-5 2007-2-3 2004-10-1 2004-10-31 2003-12-12 2004-1-11 2003-12-8 2008-9-5 2003-2-14 2003-10-15 2002-1-10 2003-1-10 2002-12-17 2004-7-15
表17-1
• • • • • • • • • • • ID 1 2 3 4 5 6 7 8 9 10
100名HIV阳性患者的生存时间(月)及 其影响因素
time sex age drug 10 0 27 1 1 0 47 1 5 1 40 1 34 1 37 0 1 0 33 1 1 0 42 1 57 0 37 0 8 1 32 1 12 0 37 1 19 1 34 0 status 1 0 1 1 1 1 1 1 0 1
生存分析
第1章基本概念第1节生存资料的特点生存资料(Survival Data)或失效时间资料(Failure-time Data)与多元线性回归资料很相似,只不过因变量(或反应变量)通常为观测对象生存的时间,常用t来表示。
当然,生存时间是广义的,可以指在通常意义下生物体的生存时间、也可以指所关心的某现象(如疾病治愈后、合格品使用后)持续的时间。
若生存时间是准确观测到的,则称为完全数据。
生存资料的一个明显特点是:所收集的资料中常常包含不完全数据,也称为截尾数据、删失数据、终检数据(Censored Data)。
包括删失数据的资料,称为删失资料。
对于删失数据,既不能简单地弃之,踊能像对待完全数据那样给予充分的信任,需要采取一些技术处理。
专门处理这种资料的统计方法,称为生存分析(Survival Analysis)。
导致数据删失有多种原因,最常见的有:失访(病人因搬家、随访信件丢失、车祸等原因,导致医生对他们的随访观察中断)和研究截止。
由随机因素引起的,称为随机删失;若事先就定了截止日期,则称为定时删失(也称Ⅰ型删失);若事先就定了观察完多少例就截止研究,则称为Ⅱ型删失(也称为定数删失)。
在表达删失数据时,常在其右上角放一个“+”号;而用SAS软件分析时,常在其前放一个“-”号或产生1个指示变量(如:C=0表示删失数据、C=1表示完全数据,反过来也可以),便于计算时区别对待。
为了使数据的表达与计算在形式上统一起来,本篇一律用负数表示删失数据,因生存时间不可能为负值,故不会产生混淆。
第2节生存时间函数描述生存时间规律的函数很多,统称为生存时间函数。
其中最主要的有生存函数、死亡概率函数、概率密度函数和危险率函数。
1.生存函数(Survival Function)生存函数也称为生存概率或累积生存率,常用S(t)表示,它表示一个体生存时间长于t的概率。
在具体问题中,该函数在t时刻的取值可用式(5.1.1)来估计∶S(t)≈生存时间长于t的病人数/病人总数(5.1.1)2.死亡概率函数(Failure Probability Function)死亡概率函数简称为死亡概率,常用F(t)表示,它表示一个体从开始观察起到时刻t为止的死亡概率。
第十七章:生存分析(理论)
完全数据(complete data)
在随访过程中,观察到了病人的确切结局,也 就知道其具体的存活时间.
删失数据(censored data,截尾数据)
随访工作中,由于某种原因未能观察到病人 的明确结局,这样,就不知道该病人的确切生存 时间,称之为删失数据。
常在生存时间数据后加上符号+表示删失数据。
检验) 3. Cox模型
第十七章 生存分析
第一节 基本概念
• 在医学,生物学研究中,常用到生存 分析 (Survival Analysis)方法。例如 对于肿瘤等疾病的疗效及预后的考核,通 常不用治愈率,有效率等表示,而用将 来复发或死亡的时间长短表示,也即生存 时间来表示。
• 所谓生存时间(survival time)是 指从某个标准时刻(如发病,确诊,开始治 疗或进行手术的时间)算起至死亡或复发 为止的时间。
表17-1 100名HIV阳性患者的生存时间(月)及 其影响因素
• ID entdate enddate time sex age drug • 1 2004-10-7 2005-8-7 10 0 27 1 • 2 2002-6-29 2002-7-29 1 0 47 1 • 3 2004-8-2 2005-1-1 5 1 40 1 • 4 2004-4-5 2007-2-3 34 1 37 0 • 5 2004-10-1 2004-10-31 1 0 33 1 • 6 2003-12-12 2004-1-11 1 0 42 1 • 7 2003-12-8 2008-9-5 57 0 37 0 • 8 2003-2-14 2003-10-15 8 1 32 1 • 9 2002-1-10 2003-1-10 12 0 37 1 • 10 2002-12-17 2004-7-15 19 1 34 0
医学统计学:生存分析(sun)
临床试验及其随访资料的特点是:一部分研究 对象可观察到死亡,从而得到准确的生存时间, 所提供的信息是完全的,称为完全数据;但往 往另有一部分病人,或中途失访,或到观察结 束时仍存活,对这部分病人无法知道准确的生 存时间,只知道其生存时间比观察到的时间要 长,它提供不完全的信息,称为不完全数据 (截尾数据)。
生存分析法不仅能分析完全数据的资料,同时 也可以分析包含不完全数据的资料。
生存分析是将事件发生的结果和随访时间两个 因素结合在一起进行分析的一种统计分析方法, 它能充分利用所得到的研究信息,更加准确地 评价和比较随访资料。
第一节 生存分析中的基本概念
一、基本概念
(一)生存时间(survival time) 任何两个有联系事件之间的时间间隔。狭义的生存时间是指患有某中疾 病的人从发病到死亡所经历的时间跨度。广义上为从某中起始事件到终 点事件所经历的时间跨度,可用小时、天、周、月、年等时间单位记录, 常用符号t表示。
2.相对危险度 假定第i个变量的取值 为0和1,其对应的回归系数为bi,且具有 统计学意义.该因素取值l与取值为0相比 其对应的相对危险度的估计为
RR的1-α可信区间为
3.个体预后指数
从Cox模型可以看出,病人的风险率与该 病人具有的危险因素及各因素对应的回 归系数有关。对各变量进行标准转换后 进行模型配合,可得到各因素对应的标 准回归系数,此时定义个体预后指数 (personal prognosis index)为
Cox模型的注意事项
①注意研究资料的代表性及可靠性,保证研究对象是 总体中的一个随机样本;协变量在研究对象中的分布 要适中,否则会给参数的估计带来困难;应将一切可 能因素都包括在调查分析之中,否则容易造成分析结 果的偏差;②对研究生存时间要有明确的规定,如果 以“发病”作为观察的起点,则要对“发病”有一个 明确的规定,对终止事件也要有一个明确的规定,如 果将“治愈”作为结局的终止事件,则要对“治愈” 有一个明确的规定;③如果研究的变量随时间而发生 变化,可以采用伴时协变量的Cox模型进行分析。④ Cox模型分析时,样本含量不宜过小,一般在40例以上。 随着协变量的增加其样本含量应适当的增加,要求样 本含量为观察协变量的5~20倍。要尽量避免观察对象 的失访,过多的失访容易造成研究结果的偏倚。
生存分析(第17章)
生存时间 t时 刻 的 观 察 单 位 数 S(t,X) 总观察例数
生存概率针对单位时间;生存率针对某个 较长时间段,它是生存概率的累积结果。 如5年生存率是每一年不同生存概率乘积。
S(5, X) p1 p2 p5
7.风险函数 (hazard function,h(t,X)) 生存时间已达到 t 的一群观测对象在 t 时 刻的瞬时死亡率。
j i
(9)生存率的标准误:
S E S ( t i,X )
p N
j i j
qj
j
2.生存率曲线
1 0.8
© ¨%£ Ê £ æ Â ú ´ É
0.6 0.4 0.2 0 0 5 ú ´ É æ Ê ±¼ ä £ ¨Ä ê £ © 10 15
Ð Ð Ä Ô Ð Ä ½ Ê Í ´ ² ¡ È Ë µ Ä É ú ´ æ Ç ú Ï ß
生存过程 的比较
生存过程 Cox 比例风险模型 的影响因素分析 非比例风险模型 logistic 回归模型
指数回归模型 Weibull 回归模型
第二节 生存率的估计与生存曲线
(生存过程的描述)
一、小样本资料
1.生存率的计算
2.生存率标准误的计算
3.生存曲线
4.中位生存时间
1.生存率的计算 乘积极限法 (product-limited method) 由Kaplan-Meier于1958年提出,又称为 Kaplan-Meier法 利用概率乘法原理计算生存率
例 有人研究了甲种手术方法治疗肾上腺肿瘤 病人23例的生存情况,定义从手术后到病人 死亡的时间为生存时间,得到生存时间(月) 如下(+为截尾数据),试计算其生存率与 标准误。 1,3,5,5,5,6,6,6,7,8,10,10, 14+,17,19 + ,20 + ,22 + ,26 + ,31 + , 34,34 + ,44,59。
第十七章 生存分析
姓名 性别(男 性别 男=1) 手术 冯 ×× 李 ×× 黄 ×× 吴 ×× 马 ×× 1 0 1 0 1 0 1 1 0 1 00-07-08 00-11-27 0 0 - 0 01- 1 0 0 0 - 1 2 - 1 5 7 00-07-16 00-12-31 00-08-18 00-11-22 00-10-10 00-11-12
m=d/n q=d/n0 (n0-d)/n0 (n0-d)/N
(6) . 185 . 222 . 286 . 400 . 667 (7) . 167 . 200 . 250 . 333 . 500 (8) . 833 . 800 . 750 . 667 . 500 (9) . 833 . 667 . 500 . 333 . 167
流 行 病 与 卫 生 统 计 学 教 研 室 乔 慧
(3) 生存概率 ( survival probability ) 指某单位时段开始时存活的个体到该时段结束时仍存活的可 能性的大小.
年 存 率 =1死 概 q 生 概 p 亡 率
该 活 一 的 数 年 满 年 人 = 年 人 数 初 口
= (n0-d)/n0 分子为年末尚存人数, 若年内有删失,分母用校正人口数.
死亡 死亡 痊愈 出现反应 复发
流 行 病 与 卫 生 统 计 学 教 研 室 乔 慧
随访(follow-up)资料的记录
生存资料一般通过随访收集, 生存资料一般通过随访收集, 记录的项目: 记录的项目: (起始与终止)随访事件 起始与终止) 生存时间(开始观察日期与终止观察日期)(年,月, 生存时间(开始观察日期与终止观察日期)(年 )( 小时, 秒等) 天,小时,分,秒等) 分组变量(处理方法) 分组变量(处理方法) 和其它协变量(性别,年龄,职业,文化程度等) 和其它协变量(性别,年龄,职业,文化程度等)
17 第17章(全C)生存分析20110910
G ( X t )的95 %可信区间为 G ( X t ) 1.96 S G ( X t ) exp exp[ G ( X t ) 1 96 S G ( X t ) ] 。 (17 8) (17 9) 对公式(17 8)取反对数, 得到总体生存率可信区间
第17章 生存分析 第20页
第17章 生存分析 第2页
章目录
END
研究生用《医学统计学》
孙振球 主编 人民卫生出版社 2005年8月第2版
第17章 生存分析 第3页
章目录
END
第十七章 生存分析
目录
第一节 生存分析中的基本概念 第二节 生存率的估计与生存曲线
第三节 生存分析的log-rank检验
第四节 Cox 比例风险回归模型概念
第17章 生存分析 第17页
章目录
END
2.生存率标准误计算
有两个公式 S P ( X t ) d P( X t ) n( n d ) 1 P( X t ) nd (17 3) (17 4)
S P ( X t ) P ( X t ) 例: S P ( X t )
1 1 1 0.430 0.1041 23 22 22 21 10 9
第17章 生存分析 第18页
章目录ቤተ መጻሕፍቲ ባይዱ
END
计算总体率可信区间:公式及例题
计算总体率1 可信区间 P(X t) u /2 S P ( X t ) (17 5) 生存率为P( X 17 ) 0.430, 可信区间为 0.430 1.96 0.1041 (0.226 , 0.634 )
第五节 寿命表
作业及思考题
第17章 生存分析 第4页
生存分析(第17章)
17
6.风险函数 (hazard function,h(t, X )) 生存时间已达到 t 的一群具有协变量X的 观测对象在 t 时刻的瞬时死亡率。
死亡
死亡时间
生存但中途失访 最后一次访问时间
死于其他疾病 死于该病时间
生存但随访结束 研究结束时间
3.记录影响生存时间的有关因素
19
(二)随访方式
×
○
×
○
0 始点
○ ○
× ×
×
死亡
○
失访 治疗措施改变 死于其他疾病
○
t 时间 终点
20
×
○
×
○
0 始点
○ ○
× ×
○
×
死亡
○
失访 治疗措施改变 死于其他疾病
患者 性 年 确诊到 手术开 终止随
生存
编号 别 龄 手术时 … 始时间 访时间 结局
时间
(岁) 间(月)
(月)
1 男 32 10 … 94.01.23 94.12.24 死亡
11
2 女 48 12 … 98.02.14 99.01.01 失访
10+
3 女 26 6 … 92.03.04 95.04.12 死亡
天数不同。 甲、乙两药物治疗某病治愈率均为90%, 甲药治疗的患者平均12天出院, 乙药治疗的患者平均7天出院。
4
随访观测评价临床疗效存在三个问题 2.一部分研究对象可观测到死亡,得到准确生
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
A T2
T
16 23.8092
23.809
20 12.1912
12.191
7.56
组数 1 2 1 1, 0.005 P 0.01
结论:按=0.05水准拒绝H0 ,接受H1 ,可 以认为两种手术方式后病人的生存率有差别。
第四节 Cox比例风险回归模型
(Cox’s proportional hazard regression model)
1 1 23 1 0 1.605 20 2 0 1.395 43 3 2 2 22 0 0 0.550 18 1 0 0.450 40 1
26 59 1 1 0 1.000 0 0 0 0.000 1 1 合计 - - 16 7 23.809 - 20 0 12.191 - 36
生存时间
t时刻的观察单位数 总观察例数
生存概率针对单位时间;生存率针对某个 较长时间段,它是生存概率的累积结果。 如5年生存率是每一年不同生存概率乘积。
S(5, X) p1 p2 p5
7.风险函数 (hazard function,h(t,X))
生存时间已达到 t 的一群观测对象在 t 时 刻的瞬时死亡率。
二、大样本资料
1.生存率的计算 寿命表法(life table method)
表 17-3 2418 例男性心绞痛病人生存率及标准误的计算
生存时 间区间 (年)
ti-1
死亡 人数
di
截尾 人数
ci
起初 观察 人数
Li
校正观 察人数
Ni
死亡概率
qi
生存概率 生存率
pi
S(ti,X)
(1) (2) (3) (4) (5) (6)=(2)/(4) (7)=1-(6) (8)=∏(7)
甲(n=23):1,3,5,5,5,6,6,6,7,8, 10,10,14+,17,19 + ,20 + ,22 + ,26 + ,31 + ,34,34 + ,44,59。 乙(n=20):1,1,2,3,3,4,4,4,6,6, 8,9,9,10,11 ,12 ,13 ,14 ,15 ,17,18。
两种手术治疗方式术后病人生存曲线比较 3.生存曲线
1.0
%
.8
生 存 .6 率 ( ) .4
.2
0.0 0
10
20
30
40
50
生存时间(月)
组别
乙种手术 乙-censored 甲种手术 甲-censored 60
4.中位生存时间 有50%的个体其存活期大于该时刻。 图解法:简单直观,结果粗略。 线性内插法(利用线性比例关系): t=8, S(8,X)=0.565; t=10, S(10,X)=0.478 (8–10):(8 – t)=(0.565 – 0.478):(0.565 – 0.50) t=9.494(月)
乘积极限法 (product-limited method) 由Kaplan-Meier于1958年提出,又称为 Kaplan-Meier法 利用概率乘法原理计算生存率
例 有人研究了甲种手术方法治疗肾上腺肿瘤 病人23例的生存情况,定义从手术后到病人 死亡的时间为生存时间,得到生存时间(月) 如下(+为截尾数据),试计算其生存率与 标准误。
第十七章 生存分析 survival analysis
随访观测评价临床疗效存在三个问题:
两种治疗方法的治愈率相同,但平均治愈 天数不同。
甲、乙两种药物治疗某病治愈率均为90%, 甲药治疗的患者平均12天出院,乙药治疗的 患者平均7天出院。
一部分研究对象可观测到死亡,得到准确 生存时间(完全数据);一部分研究对象中
(二)随访方式
×
○
×
○
0 始点
○ ○
× ×
×
死亡
○
失访 治疗措施改变 死于其他疾病
○
t 时间 终点
×
○
×
○
0 始点
○ ○
× ×
○
×
死亡
○
失访 治疗措施改变 死于其他疾病
t 终点
时间
×
○
0 始点
×
○
t 终点
○
○
×
死亡
×
○
失访
×
治疗措施改变
死于其他疾病
○
时间
三、生存分析研究的主要内容
1.描述生存过程 生存时间分布特点、估计生存率及平 均生存时间、绘制生存曲线。
终点事件
死亡
重新吸烟 复发 下一次发作 发病 治愈
2.截尾值(censored value,+)
随访中由于某种原因未能观测到病人的明确 结局,提示真实生存时间长于观测到的时间。
原因: 失访; 死于其他疾病; 病人生存期超过研究的终止期;动物试验到 达终止期未出现规定终止事件; 治疗措施改变。
又称删失值或终检值 ,本章讨论右删失情况。
t
死亡人 数 d
起初观 察人数
n
死亡概 率
q=d/n
生存概 率
p=1-q
生存率 S(t,X) =∏p
标准误 SE
(1) (2) (3) (4) (5) (6) (7)
1
1
1
23
0.043 0.957 0.957 0.0425
2
3
1
22
0.045 0.955 0.914 0.0588
3
5
3
21
0.143 0.857 0.783 0.0860
生存时间分布通常不服从正态分布。
生存分析是将事件发生的结果与随访时间两 个因素结合起来、可以对完全或不完全数据 进行分析的方法。
第一节 生存分析中的基本概念
一、名词解释
1.生存时间(survival time, t )
起始事件
发病
戒烟开始 白血病治疗缓解 冠心病前一次发作 接触危险因素 开始服药
14 ~ 15 ~
6 33 59 42.5 0 20 20 10.0
0.1412 0.0000
0.8588 1.0000
0.1405 0.0137
0.1405 0.0137
( 点1ti);时在间区区间间内死ti亡1,;ti 在 :区继间续内生截存尾到。区间终
(2)死亡人数di: (3)截尾人数ci: (4)起初观察人数Li: (5)校正观察人数Ni: Ni=Li-ci/2
3.死亡率(mortality rate,m )
单位时间内死亡频率或强度。
年死亡率
m
同年内死亡人数 某年平均人数
年平均人数=(年初人数+年终人数)/2
4.死亡概率(mortality probability, q )
死于某阶段内的可能性大小。
年死亡概率q
同年内死亡人数 某年年初人数
有删失值时: 年初人数=原年初人数(删失例数)/2
SE S(t,X) d n(n d)
d为 t时刻各种非截尾值所对应的死亡人数
SEt5 0.783
1 1 3 0.0860 23 22 22 21 2118
总体率1-的可信区间
S(t,X) u / 2SE
如样本生存率为S(5, X) 0.783时, 其 总 体 生 存 率 的95%可 信 区 间 为 : 0.783 1.96 0.0860 (0.6144,0.9516)
1,3,5,5,5,6,6,6,7,8,10,10, 14+,17,19 + ,20 + ,22 + ,26 + ,31 + , 34,34 + ,44,59。
相同数据只列一次;完全数据与截尾值相同时,截尾值在后。
表 17-1 甲种手术方式治疗 23 例肾上腺肿瘤病人的生存率计算
序号 i
时间 (月)
14
31+
0
5
0.000 1.000 0.430 0.1041
15
34
1
4
0.250 0.750 0.323 0.1216
16
34+
0
3
0.000 1.000 0.323 0.1216
17
44
1
2
0.500 0.500 0.161 0.1293
18
59
1
1
1.000 0.000 0.000
—
2.生存率标准误的计算
途失访、或死于其它疾病、或观测结束时仍
存活,得不到准确生存时间(不完全数据)。
10 年间 346 例大肠癌患者手术后的生存时间记录
患者 编号
性 年龄 别 (岁)
确诊到手 术间隔时 间(月)
手术开 始时间
终止随 访时间
结局
生存 时间 (月)
1 男 32 10 94.01.23 94.12.24 死亡
生存率 标准误
SE
(9)
0 ~ 456 0 2418 2418.0 0.1886 0.8114 0.8114 0.0080
1 ~ 226 39 1962 1942.5 0.1163 0.8837 0.7170 0.0092
2 ~ 152 22 1697 1686.0 0.0902 0.9098 0.6524 0.0097
(生存过程的影响因素分析)
1972年由英国统计学家 D. R. Cox 提出,解决 以下问题:
在生存时间的分布种类繁多且难以确定、存
在截尾数据的情况下,研究协变量X与生存函
数S(t, X)之间的关系。
Cox 模型不直接考察生存函数 S(t, X)与协 变量的关系,而是用风险函数 h(t, X)作为 应变量。