生存分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解析:
以“<3.0cm”组为例,n=14,样本含量较小且含删失
乘积极限法——kaplan-meier法 方法原理:
1. 将生存时间由小到大依次排列, 2.在每个时间区间上,计算死亡人数、删失人数、期初 人数、死亡概率、生存概率和生存率。 3.作生存曲线。
数据。
①
②
③
④
+
+
+
Kaplan-Meier法生存曲线为阶梯形曲线。
生存分析—寿命表法
【电脑实现】 —SPSS
1.数据录入:频数形式
【Time 】 生存时间(年) 【 Status 】0:删失数据 1:完全数据(死亡) 【 Freq 】频数
2. 加权
3. SPSS过程
4. 结果及结果输出:
期初 有效 例数 期内 死亡 数 生存 率标 准误 风 险 率 风险 率标 准误
结局
存活 失访
生存时 间/月
59 54 44
08/12/2000 死于膀胱瘤
4
5
60
59
I
II
≤3.0
>3.0
0
0
06/06/1996
07/20/1996
10/27/2000 死于冠心病
06/21/1998 死于膀胱瘤
53
23
6
…
59
I
>3.0
1
08/19/1996
09/10/1999 死于膀胱瘤
37
是反映离散程度大小的指标。
⑸ 风险函数(hazard function) : t 时刻存活的个体在t 时刻的瞬时死亡率。
h(t ) lim
t 0
Pt T t t T t t
h(t)近似地等于t 时刻存活的个体在此后一个单位时
段内的死亡概率。
生存分析的基本步骤: 估计生存率(生存函数) 估计生存曲线 生存时间分布的组间比较
2. 计算死亡概率、生存概率
死亡概率=期内死亡数/期初有效例数 生存概率=1-死亡概率
3. 计算生存率。 4. 作生存曲线。
①
②
③
④
寿命表法
寿命表法曲线为折线。 该法只估计时段右端点的生存率,省略了时段内的生存率估计。
中位生存期
恶性肿瘤患者确诊后5 年内生存率下降较快,5 年后下 降较平缓,说明确诊5年内该恶性肿瘤患者的死亡威胁较大。
⑷ 中位生存期及四分位数间距
①中位生存期(median survival time) :也称半数生存期, 是生存时间中位数(M/P50),表示恰有50%的个体存活 的时间,即生存率为50%时对应的生存时间,是描述集中 趋势的指标。 中位生存期越长,表示疾病的预后越好。 ②生存期的四分位数间距: Q=P75-P25
19.2.1 寿命表法(life table method)
例21-1 收集374名某恶性肿瘤患者的随访资料,取时间区 间均为1年,整理结果见下午表,试估计各年生存率。
解析:
该生存资料为大样本,生存时间粗略且含有删失数据。
方法原理:
寿命表法
1. 计算期初有效例数,注意删失数据
期初有效例数=期初病例数-期内删失数/2
观察性研究:
观察起点
⑴ 疾病确诊
生存时间
终点事件
死亡 痊愈
死亡 复发 痊愈
⑵ 治疗开始 ⑶ 症状缓解
⑷ 接触毒物 ⑸ 接触危险因素
疾病恶化
出现毒性反映 发病
随机对象的临床试验研究:
试验组 合格的 研究对象 对照组 伴随因素 干扰因素
出现结果
尚未出现结果 失访、脱落
随访研究(follow-up study)示意图
Logistic分析的缺陷:
只考虑终点事件的出现与否。
但在研究中,还需要考察对象到达终点时所经历 时间的长短,也就是说研究者对医学事件发生、发展 所经历的时间感兴趣。 如恶性肿瘤、慢性病等各个观察对象随访各时间 点的发生情况,以评价临床疗效和控制的好坏。
对缺损数据无法处理。
生存分析
有结局和生存时间两个因变量;
中位生存期
生存分析—Kaplan-Meier
【电脑实现】 —SPSS
1.数据录入
【 Group 】 1: <3.0cm;2: 3.0cm 【 dtime 】 生存时间(月) 【 Status 】0:删失数据
1:完全数据(结局事件)
2. SPSS过程
3. 结果及结果输出:
group <3.0cm 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Ti me 14.00 0 19.00 0 26.00 0 28.00 0 29.00 0 32.00 0 36.00 0 40.00 0 42.00 0 44.00 0 45.00 0 53.00 0 54.00 0 59.00 0 6.000 7.000 9.000 10.00 0 11.00 0 12.00 0 13.00 0 20.00 0 23.00 0 25.00 0 27.00 0 30.00 0 34.00 0 37.00 0 43.00 0 50.00 0 St atus 完全 完全 完全 完全 完全 完全 完全 完全 完全 删失 完全 删失 完全 删失 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全 完全
随访研究:
生存时间
终点事件:死于膀胱肿瘤
死亡 失访
死于冠心病
删 失
死亡
到截止时间事件尚未发生
死亡 死亡
研究截止时点 2000/12/30
时间
2. 生存数据类型:
完全数据:在规定的观察期内,对某些观察对象观察 到了终点事件发生,从起点到终点事件所经历的时间, 称为生存时间的完全数据(complete data)。用符号 “ t ”表示。
删失数据(截尾数据):规定的观察期内,对某些
观察对象,由于某种原因未能观察到病人的终点事件 发生,并不知道其确切的生存时间,就象病人生存时 间在未达到规定的终点就被截尾一样,称为生存时间 的删失数据,又称截尾数据,用符号“ t+ ”表示。
产生删失数据的常见原因有:
研究结束时终点事件尚未发生;
19 生存分析
常用的回归分析:
回归分析
1个因变量Y Y是数值 变量
两个因变量 (结局分类变量+时间)
④
生存分析
Cox回归
Y是分类 型变量
① 一元回归
1个自变量X
② 多重回归
2个以上自变量X
③ Logistic 回归
Logistic regression
Simple regression
Multiple regression
1.寿命表法
2. Kaplan-Meier法
在不考虑其它混杂因素 的情况下,可用寿命表 法和Kaplan-Meier法作
Log rank 检验
评价生存时间影响 因子的效果
Cox回归模型
21.2 生存曲线的估计
大样本资料:寿命表法
生存率估计
小样本资料:kaplan-meier法
或称乘积极限法 (product limit method)
生存资料特点:
生存时间分布不正态—非负且右偏; 可能含有删失数据(censor)。
同时考虑结局和生存时间两个因变量;
生存分析特点:
可处理生存时间分布不正态的问题; 可处理删失数据。
生 存 分 析
19.1 概 述 。
19.2 生存率的估计
。
19.3 生存曲线的比较 。 19.4 Cox比例风险回归模型
错误1:只考虑确切数据,丢弃截尾数据(损失信息); 错误2:将截尾数据当作确切数据处理(低估了生存时间的 平均水平)。
在处理正偏态分布数据时两种错误的做法:
错误1:采用平均生存时间而不是采用中位生存时
间来表示生存时间的平均水平。
错误2:采用常规 t 检验或方差分析进行组间比较。
(应采用log-rank检验比较几组生存时间 )
失访; 死于其它原因; 由于严重药物反应而终止观察或改变治疗措施。
生存分析的特点:
同时考虑生存结局和生存时间
生存资料
可能含有删失数据(censor); 生存时间分布不正态—非负且右偏。
特点:
生存分析
可处理删失数据; 可处理生存时间分布不正态的问题。
处理删失/截尾数据时两种错误的做法:
若资料中有删失数据,则须分段计算生存概率,再应用
概率乘法定理将分时段的生存概率相乘得到生存率:
ˆ (t ) P(T t ) p p ...... p S ˆ (t ) p S k k 1 2 k k 1 k
区分:生存率——生存概率
生存概率是针对单位时间而言的;
生存率是针对某个较长时段的,是生存概率的累计结果。
线性回归
曲线回归
生存分析(survival analysis) —— 将终点事件和出现终点时间所经历的时间结
合起来分析的一类统计分析。
主要特点:考虑到了每个研究对象出现某一结局
所经历的时间长短。
例:某医院泌尿外科医师对可能影响膀胱肿瘤术生生 存的因素进行了调查,选择1996-2000年间手术治疗的 膀胱肿瘤患者30例,随访截止日期2000年12月30日:
2. 生存分析中常用概念:
死亡概率(probability of death);
生存概率( probability of survival); 针对单位时间的
生存率(survival rate)及其标准误 ;
中位生存期(median survival time)及四分位间距; 风险函数(hazard function): t 时刻存活的个体在t 时 刻的瞬时死亡率。
2. 3年生存率
S(3)=P(T≥3)=(50–30)/50= 0.4 = p1 × p2 × p3
故生存率又称为累积生存概率(cumulative probability of survival ),它是随着时间的变化而变化 着的,是关于时间的函数,称为生存函数(survival function)。
期间死亡人数:k 初人口数:n 末人口数:n-k
⑴ 死亡概率(probability of death):表示某单位时
段开始存活的个体,在该时段内死亡的可能性;
如年死亡概率。
某年内死亡人数 死亡概率(q) 某年年初人口数
注意:如果年内有删失,则分母用校正人口数: 校正人口数 = 年初人口数—删失例数/2
19.1 生存分析的概述
生存分析中的基本概念:
1. 生存时间(survival time) —— 从规定的观察起点到某一特定终点事 件出现的时间长短。
三要素:
观察起点
生存时间
终点事件
随机对照临床试验研究:观察起点通常是随机化
分组的时间。
观察性研究:观察起点可以是发病时间、第一次 确诊时间或接受正规治疗的时间;终点事件可以 是某种疾病发生、某种处理的反应、疾病的复发 或死亡等。
期间死亡人数:k 初人口数:n 末人口数:n-k
⑵ 生存概率(probability of survival) :单位时段开始 时存活的个体,到该时段结束时仍然存活的可能性。
某年活满一年人数 生存概率(p) 1 q 某年年初人口数
注意:若年内有删失,分母用校正人口数。
⑶ 生存率(survival rate) :0 时刻存活的个体经历 tk 时个单位时间段后仍存活的可能性。
若资料中无删失数据时:
tk时刻仍存活例数 ˆ S (t ) P(T tk ) 观察总例数
源自文库
【举例】手术治疗50例肺癌病人,术后1,2,3年的
死亡数分别为10,10,10例,无截尾数据。试求各年 的生存概率和3年生存率。
解:1. 各年生存概率 p1 = ( 50–10 )/50 =0.80 p2 = ( 40–10 )/40 =0.75 p3 = ( 30–10 )/30 =0.67
表19-2 30例膀胱肿瘤患者生存资料的原始记录表
编 号
1 2 3
年龄 肿瘤 肿瘤大 是否 (岁) 分级 小/cm 复发
62 64 52 I I II ≤3.0 ≤3.0 ≤3.0 0 0 1
手术日期
02/10/1996 03/05/1996 04/09/1996
终止观 察日期
12/30/2000 12/03/1999
期初 病例 数
期内 删失 数
死亡 概率
生存 概率
生存 率
概率 密度
概率密 度标准 误
19.2.2 乘积极限法——kaplan-meier法
例19-2 按下表数据,14例膀胱肿瘤<3.0cm患者和16
例膀胱肿瘤≥3.0cm患者的生存时间(月)如下,试估
计两组生存率。
<3.0cm 14 19 26 28 29 32 36 40 42 44+ 45 53+ 54 59+ ≥3.0cm 6 7 9 10 11 12 13 20 23 25 27 30 34 37 43 50