医学统计学课件:13 生存分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、生存时间
♦ Survival time:泛指研究者所关心的某现象的持 续时间,即从某起始事件到某终点事件所经历的 事件跨度。常用符号 t来表示。
如: 白血病患者化疗后的复发时间; 肾移植患者肾移植后的肾功能衰竭时间; 接受健康教育戒烟后的青少年复吸烟时间;
2、死亡事件与起始事件
♦死亡事件:即失效事件、终点事件,泛指 种处理措施失败或失效的特征事件。一般 计阶段根据研究目的确定。
Std. Error of Cumulative Proportion Surviving at End of Interval
.01 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01
假设检验
Log-rank检验,又称时序检验 Gehan比分检验
7.000 死亡
.583
.142
5
7
6
8.000 失访
.
.
5
6
7
11.000 死亡
.486
.148
6
5
8
15.000 死亡
.389
.147
7
4
9
18.000 死亡
.292
.139
8
3
10 33.000 失访
.
.
8
2
11 36.000 死亡
.146
.124
9
1
12 38.000 失访
.
.
9
0
Means and Medians for Survival Time
Proportion Surviving
.81 .88 .91 .89 .90 .89 .90 .89 .90 .89 .86 .84 .86 .89 .86 1.00
Cumulative Proportion Surviving at
End of Interval
.81 .72 .65 .58 .52 .46 .42 .37 .33 .30 .26 .21 .18 .16 .14 .14
不能认为……不同。
P < 0.05 拒绝H0 ,接受H1 ,差异有统计学意
义,可以认为……不同。
( 1) 将 两 组 患 者 按 生 存 时 间 统 一 从 小 到 大 排序 标明组别、死亡数;
( 2)列出各时点的期初病例数(分组和合计);
( 3)分别计算甲、乙两组各时点的理论死亡数; ( 4)计算甲、乙两组理论死亡数的合计值;
4、死亡概率与生存概率
♦ 死 亡 概率( q) : 是 指 在 某 单 位 时 段 开 存活的个体 在该时段内 死亡的可能性大 小。
♦ 生 存 概 率 ( p= 1-q) : 是 指 在 某 单 位 时
开始时 存活的个体到该时段结束时仍存活 的可能性大小。
5、生存率与生存曲线
♦ 生 存 率 : 记 为 S( tk ) , 即 生 存 函 数 , 是 指 对 象 活 过 tk 时 刻 的 概 率 。 实 质 上 是 累 积 生 存 率。
目录
概述
♦ 资料收集 ♦ 几个基本概念 ♦ 生存分析的内容和基本方法
目录
案例
某医师收集了 1992年 1月 1日到 2001年 12月 31 日 10年 间 共 346例 大 肠 癌 患 者 手 术 后 资料,以了解患者术后生存情况及其可能 的影响因素。以下是部分资料。
10年间346例大肠癌患者手术后的生存时间记录表
总体生存率的区间估计:
S (tk ) ± uα / 2 SE[S (tk )]
SE[S (tk )] = S (tk )
k
dj
n (n
j =1 j j
d j)
失效事件的标记值。死亡记为0,这里就输入0。
Survival Table
Cumulative Proportion Surviving at the Time
案例
♦ 某研究者收集了男性心绞痛患者 2418例, 经随访将有关资料整理后列于下表,其中 生存时间是以年计算的,试计算其生存率 及其标准误。( data: lifetb.sav)
Interval Start Time 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Log-rank 检验分析步骤
1、建立检验假设,确定检验水准
H0:实验组和对照组患者的总体生存曲线 位置相同 H1:实验组和对照组患者的总体生存曲线 位置不同 =0.05
2、选择检验方法, 计算检验统计量
3、确定 P值,做统计推断
χ 2 < χα2,ν χ 2 > χα2,ν
P > 0.05 不拒绝H0 ,差异无统计学意义,尚
Lower Bound
.000
Upper Bound 22.945
a. Estimation is limited to the largest survival time if it is censored.
阶梯曲线
寿命表法
♦ 属于非参数法; ♦适用情况:当随访结果只有某年或某
观察人数、发生死亡事件人数和截尾人 数,而没有每个观察对象确切的生存时 间,即只能获得按随访时间分组的资料;
S
(tk )
=
P(T
tk )
=
tk时刻仍存活的例数 观察总例数
生存曲线: 随访时间作为横坐标、生存率 作为纵坐标。随时间的增加,该曲线一般 呈下降趋势,下降速度快在图形上表现为 坡度大,曲线陡峭,意味着生存率较低或 生存期较短。
中位生存时间
♦即半数生存期,是指生存率为 0.5时对 应 的 生 存 时 间 , 表 示 恰 好 有 50% 的 体活过此时间。该值越大,说明疾病 预后越好。
♦ 截 尾 数 据 : 又 称 删 失 值, 是指生存时间观察过程的截止 不是由于死亡事件,而是由于其它原因, 如失访(因搬 迁而失去联系,中途退出实验,其他与本研究无关的原 因死亡),观察对象的生存期超过了研究的终止 在右上角标记 “+”。
生存资料的特点
因变量有两个:结局和时间两方面的信息;
一般通过随访收集得到,从某统一时间点开 始,观察到规定时间点截止,常因失访等造 成数据不完整,分布类型复杂。
医学统计学
生存分析
公共卫生学院预防医学教研室
生存分析(survival analysis):是将事件发生 的结局和发生这种结局所经历的时间综合起来分 析的一种统计分析方法。 能够充分利用所得的研究信息,更加准确的评价 和比较随访资料。包括统计描述和统计推断。
主要内容
♦ 生存分析概述 ♦ 生存率的估计-乘积极限法和寿命表法 ♦ 生存曲线比较的假设检验-Logrank检验 ♦ Cox比例风险回归模型
1995.04.12 死亡
2001.09.21 死于其他
2001.12.31 存活
随访内容
① 明确开始随访的时间 ② 随访的结局和终止随访的时间 ③ 记录影响生存时间的有关因素
随访方式
全体观察对象同时接受处理措施,观察到最后一例 出现结果,或者事先规定的随访截止时间。
全体观察对象在不同时间接受治疗处理,完成一定 数量随访病例后决定随访截止时间,或按事先规定的时 间停止随访。(最常见的形式)
编号 性别 1男 2女 3女 4男 5女
……
年龄 (岁)
32
48 26 55 58
Dtime (月)
手术时间
10 1994.01.23
12 1998.02.14
6 1992.03.04
3 1999.08.20
8 2001.03.10
终止随访时 间
1994.12.24
结局 死亡
1999.01.01 失访
81.500 42.500 10.000
Life Tablea
Number of Terminal Events
456 226 152 171 135 125
83 74 51 42 43 34 18 9 6 0
Proportion Terminating
.19 .12 .09 .11 .10 .11 .10 .11 .10 .11 .14 .16 .14 .11 .14 .00
Mean a
95% Confidence Interval
Median
95% Confidence Interval
Estimate 16.653
Std. Error 4.164
Lower Bound
8.491
Upper Bound 24.814
Estimate 11.000
Std. Error 6.094
N of Cumulative
N of Remaining
Time Status Estimate Std. Error
Events
Cases
1
1.000 死亡
.917
.080
1
11
2
2.000 死亡
.833
.108
2
10
3
4.000 死亡
.750
.125
3
9
4
5.000 死亡
.667
.136
4
8
5
a. The median survival time is 5.33
Number Exposed to Risk
2418.000 1942.500 1686.000 1511.500 1317.000 1116.500
871.500 671.000 512.000 395.000 298.500 206.500 129.500
生存分析主要内容
描述生存过程-乘积极限法和寿命表法 比较生存过程- log rank检验、 Gehan比 分检验 影响生存过程的因素分析- Cox回归模型
生存分析基本方法
♦ 参数法:指数分布法、Weibull分布法 ♦ 非 参 数 法 : 如 乘 积 极 限 法 、 寿 命 表 法 、 lo
rank检验、 Gehan比分检验 ♦ 半参数法:如Cox回归模型
目录
案例
♦ 慢 性 活 动 性 肝 炎 的 临 床 实 验 数 据 ( data : logrank1.sav):
44名慢性活动性肝炎患者的生存时间(月)
组别
生存时间(月)
Prednisolone
2 6 12 54 56+ 68 89 96 96 125+ 128+ 131+ 140+ 141+ 143 145+ 146+ 148+ 162+ 168 173+ 181+
( 5)计算卡方值;
∑ 2χ =
(A-T),2 T
1ν = −组数
本例,卡方值= 4.19
分析步骤
♦ 1、将生存时间t 从小到大排序; ♦ 2、计算死亡人数 dk; ♦ 3、计算期初病例数 nk; ♦ 4、计算各时点死亡概率 qk; ♦ 5、计算各时点生存概率 pk; ♦ 6、计算各时点生存率 S(tk)及其标准误; ♦ 7、计算各时点总体生存率的可信区间; ♦ 8、求中位生存时间(图解法和线性内插法); ♦ 9、绘制生存曲线。
生存率的估计
♦ 乘积极限法,即 Kaplan- Meier法: 适用于样本量
较小,每个观察个体的事件发生时点或删失发生时点能 够被准确记录下来的生存时间数据。主要用于未分组生 存资料。
♦ 寿命表法: 适用于样本量较大、生存时间分段记录的
数据。
目录
乘积极限法(KM法)
案例
♦ 某医师采用手术疗法治疗 12例宫颈癌患者,随访 时间(月)记录如下:1,2,4,5,7, 11, 15, 18, 33+, 36, 38+。试估计各时点生存 率及其标准误、各时点总体生存率的 95%可信区 间 、中 位生 存时 间、 并绘制生存曲线。( data: km.sav)
如: 乳腺癌患者手术后的死亡; 白血病患者化疗后的复发; 接受健康教育戒烟后的青少年复吸烟;
2、死亡事件与起始事件
♦ 起始事件:是反映生存时间起始特征的事 件。
♦ 如疾病确诊,某种治疗开始,接触毒物 等。
♦ 应在设计时明确规定
3、截尾数据
♦ 完全数据:是指一部分研究对象可随访观察到明确的结 局即终点事件,知道病人的确切生存时间。
Number Entering Interval
2418 1962 1697 1523 1329 1170
938 722 546 427 321 233 146 95 59 20
Number Withdrawing
during Interval
0 39 22 23 24 107 133 102 68 64 45 53 33 27 33 20
对照组
2 3 4 7 10 22 28 29 32 37 40 41 54 61 63 71 127+ 140+ 146+ 158+ 167+ 182+
Log-rank检验
♦ 基本思想: ♦ 假 设 H0 成 立 , 则 根 据 两 种 处 理 不 同 生 存 时
期初观察人数和理论死亡概率计算出 理论死亡 数,与实际死亡数应相差不大 ,否则无效假设 H0 不 成 立 , 认 为 两 条 生 存 曲 线 差 异 有 统 计 义。 ♦ 适用于两个或多个样本生存曲线的比较。