生存分析SurvivalAnalysis
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
死亡 生存
合计
治疗组(i=1) d1j
n1j-d1j
n1j
安慰剂组(i=2) d2j
n2j-d2j
n2j
合计
Dj
Sj
Nj
计算理论死亡数e1i
n1j Dj Nj
计算Log-rank检验统计量
2
(d 1i
e1i
)
2 i
n1 jn2 j D jS j
j N j2 ( N j 1)
H0为真时,Log-rank统计量2服从自由度为1的卡 方分布
位
• 从疾病确诊到死亡 • 从治疗开始到治愈 • 从出生到第一颗乳牙萌出
生存分析的基本概念---死亡概率/生存概率
死亡概率q:在某时间区间内的被观察对象在 该时间区间内(无失访)死亡的概率估计
在 该 时 间 区 间 死 亡 人 数 q某 时 间 区 间 初 期 尚 存 活 人 数
生存概率p:在某时间区间内(无失访)的被观察 对象在该时间区间内生存的概率估计
生存分析的基本概念---生存率
❖ 生存率计算
▪ 无删失: S(t)t时 刻 仍 总 存 观 活 察 的 例 观 数 察 例 数
▪ 有删失:需分段计算各时间段的生存概率pi ,然后利用
概率乘法将pi相乘得到t时刻的生存率
S(t) S(tp ) 1 p1 p p 2 2 L ...pt p t
▪ 第i个时段开始的人数为 n i ,在第i个时段内死亡人数
为 d i ,删失人数为 c i ,则
pi
1
d, i
ni
ni1nidici
乘积极限法(K-M法)估计生存率
❖ 适用于原始数据的资料 ❖ 例:研究人员对20名某肿瘤术后病人进行跟踪随
访三年,记录他们的生存时间。试估计生存率绘 制生存曲线,资料如下
3, 5+,5,8,9,9,9+,9+,11,15,15+, 16,20,20+,25,28,28+,28+,28+,32
Stata软件实现
三、用Stata软件进行Log Rank检验
1.确定生存分析的时间变量是week,结局变量是 outcome
Stset week outcome
2.对两条曲线进行Log Rank检验 sts test group,logrank 即:Sts test 分组变量,logrank
生存率曲线的比较
例10.3:现有两组白血病病人的随访研究资料,其缓 解时间(周)记录如下,现欲比较治疗组与安慰剂组 的病人生存曲线是否一样?
• 资料
治疗组(第1组): 6,6,6,7,10,13,16,22,23,6+,9+, 10+,11+,17+,19+,20+,25+,32+,32+,34+,35+
▪ 生存时间一般为非正态,故用中位生存期 ▪ 可采用内插法计算:
t0.5=20.4(月) ▪ 如果生存期最长的死亡对象的生存率高于50%,则无法估计中位生
存期。
生存寿命表法计算生存率
❖适用于大样本资料 ❖数据按时间区间分组 ❖利用删失资料信息,按删失资料对进行校正 ❖区间中的删失个体折算半个人时
寿命表法计算生存率
生存资料
患者 编号
1 2 3 4 5
性别
男 女 女 男 女
年龄
32 48 26 55 58
从确诊到手 手术时间 终止随访时间 结局 术的时间(月)
10
1994.01.23 1994.12.24 死亡
12
2019.02.14 2019.01.01 失访
6
1992.03.04 2019.04.12 死亡
乘积极限法(K-M法)估计生存率
序号
i (1)
1 2 3 4 5 6 7 8 9 10 11
时间 t 时刻期 t 时刻 t 时刻 死亡
生存
(月) 初例数 死亡数 终检数 概率
概率
ti
ni
di
ci q=d/n pi=(ni-di)/ni
(2)
(3)
(4) (5) (6)
(7)
3
20
1
0 0.0500 0.9500
5
19
1
1 0.0526 0.9474
8
17
1
0 0.0588 0.9412
9
16
2
2 0.1250 0.8750
11
12
1
0 0.0833 0.9167
15
11
1
1 0.0909 0.9091
16
9
1
0 0.1111 0.8889
20
8
1
1 0.1250 0.8750
25
6
1
0 0.1667 0.8333
❖ 针对这类生存资料的分析方法:生存分析
生存分析
❖ 生存分析
研究既有事件的发生时间又有事件结局资料的统计学方法
强调所研究问题的结果变量是某一事件发生的时间
❖ 基本目的
▪ 描述生存过程 ▪ 比较不同人群的生存过程 ▪ 分析生存时间的相关因素
生存资料的特点
❖ 生存资料的特点 ▪ 随访资料 ▪ 时间和结局(失效、删失) ▪ 有不完全数据 ▪ 通常不服从正态分布
ex p ( ex p (ln ( ln (S (ti)) u /2S (S tiE )[ ln S ((S ti()t]i))))
SE是标准误
生存曲线及中位生存期
❖ 生存曲线 survival curve:以随访时间为横坐标, 生存率为纵坐标绘制的曲线
❖ 中位生存期median survival time:半数生存时间/ 平均生存时间,恰好由50%个体存活s(t)=0.5的时间
起始事件:标志研究对象生存过程开始的特征事件 称为起始事件,与终点事件相对应,如确诊、手术、 开始采取措施,开始观察
生存分析的基本概念---生存时间
❖生存时间survival time(失效时间failure time):终点事件与被观察对象发生终点事件 之间所经历的时间间隔,用t表示
▪ 要获得准确的生存时间 ▪ 研究目的不同,时间单位不同,使用恰当的时间单
0.7594 0.5889 0.5253 0.4377 0.3939 0.2772 0.2376 0.1697
生存率曲线的比较
❖ Log-rank检验:时序检验,属于非参数方法, 比较整个生存时间的分布
▪ 大样本卡方检验 ▪ 2条或多条生存曲线比较
H0:总体生存率曲线相同 H1:总体生存率曲线不同
❖例:10.2
序 术后 期初观 期内死 期内终 校正
号 生存 察例数 亡人数 检人数 人数
天数
n
d
c
nc=n-c/2
(1) t
(3)
(4)
(5)
(6)
(2)
1
0-
68
16
3
66.5
2 50-
49
11
0
49
3 100-
38
4
2
37
4 200-
32
5
4
30
5 400-
23
2
6
20
6 700-
15
4
3
13.5
生存分析 survival analysis
内容
1
生存资料
2
生存分析的基本概念
3
STATA实现
生存资料
❖ 一些医学事件所经历的时间:从开始观察到事件 发生的时间,不是短期内可以明确判断的
▪ 乳腺癌病人术后生存时间 ▪ 幼儿乳牙萌出的时间 ▪ 白血病病人化疗后缓解持续的时间 ▪ 两种方法治疗某慢性病产生疗效的时间
Log-rank 检验的实例计算
• 本例的检验统计量计算为
2 (10.26)2 16.79
6.2685
• 查卡方界值表,P<0.001,基于两组生存曲线的位 置,可以认为试验组的生存率高于对照组,差异 有统计学意义。
Stata软件实现
一、用Stata软件计算生存率及95%可信区间
1.定义生存分析的时间变量是time,结果变量是 status
3
2019.08.20 2019.09.21 死于其他
8
2019.03.10 2019.12.31 存活
生存 时间
11 10+ 37 25+ 9+
2 3
1
1992.03.04 4
5 2019.12.31
生存分析的基本概念---终点事件/起始事件
终点事件outcome event:失效事件 failure event, 指研究者所关心的特定事件,如死亡、复发、出牙;
活 过 该 时 间 区 间 人 数 p某 时 间 区 间 初 期 尚 存 活 人 数
生存分析的基本概念---终检
❖ 终检censoring:删失值,在终点事件发生前, 由于某种原因被观察对象的观测过程终止了
❖ 右Biblioteka Baidu失:终点事件发生在最后一次观察的右方
▪ 特点:不完全信息(不知道确切生存时间),但可知真 实的生存时间不会短于现在观察到的时间。
7 1000-
8
11
2
7
8 1300-
5
1
3
3.5
9 >1600
1
0
1
---
死亡 概率 q=d/nc (7)
0.2406 0.2245 0.1081 0.1667 0.1000 0.2963 0.1429 0.2857
生存 概率 p=1-q (8)
生存 率 S(t+1) (9)
0.7594 0.7755 0.8919 0.8333 0.9000 0.7037 0.5871 0.7143
▪ 发生的原因
• 失访 • 随访结束时仍存活 • 死于其他原因 • 治疗措施改变
生存分析的基本概念---生存率
❖生存函数 (累计生存概率):个体生存时间大 于t的概率。任一时刻t对应的生存函数就是该 时点的生存率。
▪ S(0)=1; ▪ 2年生存率:个体生存时间超过2年的概率S(2)
❖ 生存曲线:所有时点的生存率构成生存曲线
安慰剂组(第2组):1,1,2,2,3,4,4,5,5,8,8,8,8, 11,11,12,12,15,17,22,23
两组生存曲线的统计描述
1.00
0.75
生 存 0.50 率
0.25
0.00 0
group 1
试验组
对照组
group 2
10
20
30
40
周
Log-rank test 方法
,
计算时,先将两组每一生存时间t( j ) 的资料列 成一个2×2 表的形式
stset time status
2.显示Kaplan-Meier方法的计算生存率结果 sts list
Stata软件实现
二、用Stata软件绘制生存曲线
1.定义生存分析的时间变量是time,结果变量是 status
stset time status
2. 绘制Kaplan-Meier法估计的生存曲线 sts graph
28
5
1
3 0.2000 0.8000
32
1
1
0 1.000 0.0000
生存率
S(ti) (8) 0.9500 0.9000 0.8471 0.7412 0.6795 0.6177 0.5491 0.4804 0.4004 0.3203 0.0000
总体生存率的区间估计
❖ K-M法计算的样本生存率是总体生存率的点估计 ❖ 区间估计: