生存分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
18
一、乘积极限法
一. 乘积极限法(Product-Limit Method)
例1
Biblioteka Baidu
用某中药加化疗(中药组)和化疗(对照组)两种疗法治疗白 血病后, 随访记录各患者的生存时间,不带"+"号者表示已死亡, 即完全数据,带"+" 号者表示尚存活,即截尾数据,试作生存分析。 时间单位为月。 中药组 10,2+,12+,13,18,6+,19+,26,9+,8+,6+,43+,9,4,31,24
的分组寿命表法的计算结果亦会不同,当分组资料中
每一个分组区间中最多只有 1个观察值时,寿命表法
的计算结果与乘积极限法完全相同。
17
第三节
非参数生存分析方法
一. 乘积极限法(Product-Limit Method)
简称为积限法或PL法,它是由统计学家Kaplan和Meier 于1958年首先提出的, 因此又称为Kaplan-Meier法, 是 利用条件概率及概率的乘法原理计算生存率及其标准误 的。 设S(t)表示t年的生存率,s(ti/ti-1)表示活过ti-1 年又活过 ti年的条件概率,例如s(1),s(2)分别表示一 年,二年的生存率,而s(2/1)表示活过一年者,再活一年 的条件概率,据概率的乘法定律有: S(2)=S(1)S(2/1), 一般地有 S(ti)=S(ti-1)S(ti/ti-1)
跨度,广义的生存时间定义为从某种起始事件到终 点事件所经历的时间跨度。
6
生存分析的基本概念 4、中位(半数)生存时间
中位生存时间(Median survival time)是指
寿命中位数,表示有且只有50%的观察对象还可以
活这么长时间。由于截尾数据的存在,中位生存期
的计算不同于普通的中位数,它可以利用生存函数 公式或生存曲线图,令生存率为50%时,推算出生 存时间
生存率的比较
表2 126例胃癌患者寿命表法估计生存率
───────────────────────────────────────────────────── 时间(年) 期初例数 死亡例数 失访例数 截尾例数 有效例数 条件生存率 累积生存率 di ∑di/ni(ni-di)累积生存 ti n'i di ui wi ni ^S(ti/ti-1) ^S(ti) ni(ni-di) 率标准误 ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾=⑻√⑽ ───────────────────────────────────────────────────── 0126 47 4 15 116.5 0.5966 0.5966 5.805×10-3 5.805×10-3 0.0455 160 5 6 11 51.5 0.9029 0.5386 2.088×10-3 7.893×10-3 0.0479 238 2 0 15 30.5 0.9344 0.5033 2.301×10-3 0.0102 0.0508 321 2 2 7 16.5 0.8788 0.4423 8.359×10-3 0.0186 0.0602 410 0 0 6 7.0 1.0000 0.4423 0 0.0186 0.0602 54 0 0 4 2.0 1.0000 0.4423 0 0.0186 0.0602 ─────────────────────────────────────────────────────
23
3.分别用(22.5)(22.6)(22.7)式计算条件生存率 ^S(ti/ti-1),累积生存率s(ti)及其标准误。 计算结果已列于表22.2中,第7,8,11列,表中9,10二 列系用于第11列的计算。 例如时间段0--中 ^S(ti/ti-1)=(116.5-47)/116.5=0.5966 ^S(ti)=1×0.5966=0.5966 SE(S(ti))=0.5966×√5.805×10-3=0.0455 故一年生存率的估计为0.5966±0.0455 同样二年生存率的估计为0.5386±0.0479 由于寿命表法与积限法的累积生存率及其标准误的 计算公式完全相同 , 所以 , 当分组资料中每一个分组区间 24 中最多只有1个观察值时,寿命表法就是积限法。
22
寿命表法估计生存率步骤如下: 1.将观察例数按时间段(年)0-,1-,2-,划分,分别计 数期初例数,死亡,失访, 截尾例数列入表2的1-5列。事 实上,从第二个时间段开始,期初人数ni 系由下式算得: n'i=n'i-1-di-ui-wi 例如第二行,即时间段1-,有 n'2=126-47-4-15=60 2.计算各时间段期初实际观察例数,(亦称有效例数 )ni ni=n'i-ui/2-wi/2

2
第二节
一、基本概念
生存分析基本概念
1、失效事件与起始时间 在生存分析随防研究过程中,一部分研究对象 可观察到死亡,可以得到准确的生存时间,它提供 的信息是完全;这种事件称为失效事件(failure event)也称之为死亡事件、终点事件。

起始事件(initial event)是反映生存时间 起始特征的事件,如疾病确诊、某种疾病治疗开始、 接触毒物等。 。
10
生存分析的基本概念 3)风险函数
风险函数(Hazard Function) 用h(t)表示,其定义为: h(t)=lim(在时间t生存的病人死于区间(t,△t)的概率/△t) 由于计算 h(t) 时 , 用到了生存到时间 t, 这一条件 , 故上 式极限式中分子部分是一个条件概率。可将h(t)称为生存到 时间t的病人在时间t的瞬时死亡率或条件死亡速率或年龄别 死亡速率。当用t 作横坐标 ,h(t) 为纵坐标所绘的曲线 , 如递 增,则表示条件死亡速率随时间而增加 ,如平行于横轴 ,则表 示没有随时间而加速(或减少)死亡的情况。
生存分析的基本概念

生产截尾值的原因:1)病人失访;2)
病人的生存期超过了研究的终止期;3)在动
物实验中,有时事先规定观察期限或动物数
5
生存分析的基本概念 3、生存时间
生存时间(survival time)是指任何两个有联
系事件之间的时间间隔,常用t表示。狭义的生存
时间指患某疾病的病人从发病到死亡所经历的时间
生存分析
第一节 第二节 引言 生存分析的基本概念
第三节
第四节 第五节
非参数生存分析
Cox模型 实例分析与计算机实现
1
第一节 引言 在医学研究中,常常用追踪的方式来研究事物 发展的规律。如,了解某药物的疗效,了解手术的 存活时间,了解某医疗仪器设备使用寿命等等。 对生存资料的分析称为生存分析。所谓生存资 料就是描述寿命或者一个发生时间的数据。更详细 的说一个人的生存时间的长短与许多因素有联系的, 研究因素与生存时间的联系有无及程度大小,称为 生存分析。 生存分析在医学科学研究中具有广泛而重要的 应用价值,它对人群寿命的研究,各种慢性疾病的 现场追踪研究,临床疗效试验和动物试验等研究中 随访资料的处理起着举足轻重的作用。
二. 寿命表法(Life Table Method)

适用于随访的病例数较多, 将资料按生存
期进行分组,在分组的基础上计算生存率 ,本
法也能用于不分组的资料,此时计算结果与积
限法相同。
21
某医院1946年1月1日到1951年12月31日收治的126 例胃癌病例,生存情况如表2,试用寿命表法估计生存率 。
存数据和没有结局的截尾数据,能较充分地利用资料
信息。
如果改变出生/死亡的含义,可使生存分析得到
更广泛的应用。如以开始暴露于某病的危险因素代替 出生,以发生此病代替死亡可用生存分析来研究暴露
于危险因子后在多少月或年内发病概率。再比如,以
某病治疗代替出生,以死于该病作为死亡,生存分析
来研究某病治疗后的生存时间,如此等等。
11
生存分析的基本概念 如急性白血病病人从治疗开始到复发为止之间的
缓解期,冠心病病人两次发作之间的时间间隔,戒
烟开始到重新吸烟之间的时间间隔,接触危险因素
到发病的时间间隔等。生存分析中最基本的问题就
是计算生存时间,要明确规定事件的起点、终点及 时间的测度单位,否则就无法分析比较。
12
生存分析的基本概念 生存分析这个统计技术可以同时分析有结局的生
对照组
2+,13,7+,11+,6,1,11,3,17,7
19
资料中药组积限法计算生存率
───────────────────────────────────── 时间 状态 期初人数 死亡人数 条件生存率 累积生 di ∑di/ni(ni-di)累积生存 ti si ni di (ni-di)/ni 存率^S(ti)ni(ni-di) 率标准误 ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨=⑥√⑧ ───────────────────────────────────── 2 活 4 死 15 1 0.9333 0.9333 0.004762 0.004762 0.0644 6 活 6 活 8 活 9 死 11 1 0.9090 0.8485 0.009091 0.013853 0.0999 9 活 10 死 9 1 0.8889 0.7542 0.013889 0.027742 0.1256 12 活 13 死 7 1 0.8571 0.6465 0.023810 0.051551 0.1468 18 死 6 1 0.8333 0.5387 0.033333 0.084885 0.1570 19 活 24 死 4 1 0.7500 0.4040 0.083333 0.168218 0.1657 26 死 3 1 0.6667 0.2694 0.166667 0.334885 0.1559 31 死 2 1 0.5000 0.1347 0.500000 0.834885 0.1231 43 活 20 ─────────────────────────────────────
3
生存分析的基本概念
2、截尾数据(Censored
data) 但往往有一部分人或中途失防,或到观 察结束时仍存活,对这些人无法知道准确的 生存时间,对于这样的观测值,只知道其生 存时间大于T,而不知道其准确的生存时间。 这种数据称为截尾数据(Censored data)。 它提供不完全信息。
4
8
生存分析的基本概念
9
生存分析的基本概念 2)死亡函数
概率密度函数 (Probability Density Function) 简称为密度函数,记为f(t),其定义为: f(t)=lim (一个病人在区间(t,t+△t)内死亡概率/△t) 它表示死亡速率的大小。如以t为横坐,f(t) 为纵坐标 作出的曲线称为密度曲线,由曲线上可看出不同时间的死亡 速率及死亡高峰时间。纵坐标越大,其死亡速率越高,如曲线 呈现单调下降,则死亡速率越来越小,如呈现峰值,则为死亡 高峰。
7
生存分析的基本概念 5、生存时间函数
1)生存函数
生存概率又称为生存率(Survival Rate)或生存函数, 它表示一个病人的生存时间长于时间t的概率,用S(t) 表示: s(t)=P(Tt) 如5年生存率: s(5)=P(T5) 以时间t为横坐标,S(t)为纵坐标所作的曲线称为生存率曲线, 它是一条下降的曲线,下降的坡度越陡,表示生存率越低或生 存时间越短,其斜率表示死亡速率。
13
资料收集
二、资料收集 一)随访内容 1、明确开始随访的时间 如住院时间、确诊时间、开始治 疗时间等。 2、随访结局和终止随防的时间 3、记录影响生存时间的有关因素 二)随访方式 1、全体观察对象同时接受处理措施,观察到最后一例出现 结果,或事先规定的随访截止时间。 2、全体观察对象在不同时间接受治疗,完成一定数量随访 病例后决定随访截止时间,可按事先规定的时间停止随访。
14
随访资料常见形式示意图
15
生存分析研究目的
三)生存分析研究的主要内容
1、描述生存过程(估计生存函数)
2、比较生存过程(比较生存函数) 3、影响生存时间的因素分析
16
生存率的估计方法
生存率S(t)的估计方法有参数法和非参数法。常 用非参数法,非参数法主要有二个,即,乘积极限法与 寿命表法,前者主要用于观察例数较少而未分组的生 存资料,后者适用于观察例数较多而分组的资料,不同
相关文档
最新文档