14生存分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

◦ 计算恰在每一时刻 pi q i ti 之前的生存人数
ˆ ( t ) 和生存概率 ◦ 计算复发概率S
i
◦ 计算生存率
Kaplan-Meier methods
2.计算生存率的标准误
ˆ ( t )] S ˆ (t ) SE[ S i i
t

j
dj n j (n j d j )
ti
j 1, 2 , i
则接受化疗患者的复发风险为
h1 (t ) h0 (t )exp( x) h0 ( t )exp( 0.380 1) 0.68 h0( t)
HRj exp( j )
自变量Xj的两个不同取值c0、c1 自变量Xj的取值为0、1
PHREG
h0 (t )exp( 1 X 1 2 X 2 m X m ) h(t , X ) HR * h(t , X ) h0 (t )exp( 1 X *1 2 X *2 m X *m )
(1)到研究结束时结局仍未发生 (2)失访 (3)结局起因于其他原因

生存数据的特点 ◦同时考虑生存结局和生存时间 ◦生存时间可能含有删失数据 ◦生存时间的分布很复杂,通常不服从正态分布
图14-1 生存时间原始记录示意图
图14-1中,完全数据:1号、5号 删失数据:2号、3号、4号
二、生存分析常用统计指标
di (14)
1 ห้องสมุดไป่ตู้ 1 0 2

0 1 1 0 0 30
log-rank test
(1)建立检验假设,确定检验水准
H0:S1(t)=S2(t) H1:S1(t)≠S2(t) α=0.05 (2)计算统计量 2 值 两条总体生存曲线相同
两条总体生存曲线不同
2 ( 9 15 . 695 ) 2 6.304 按肿瘤≤2cm计算, 7. 110 2 ( 21 14 . 305 ) 2 6.304 按肿瘤>5cm计算, 7. 110
h0 ( t )exp( 1 X 1 2 X 2 m X m ) h( t , X ) HR * h( t , X ) h0 ( t )exp( 1 X *1 2 X * 2 m X * m )
exp[1(X1 X *1 ) 2(X 2 X * 2 ) m(X m X * m )]
于或等于2cm的患者和21例肿瘤直径大于5cm患者手
术后的生存资料,定义从手术后到患者复发的时间 为生存时间月),试估计两组的复发率。
肿瘤直径≤2cm
10 68+
10+ 71 9 26
13 88+ 13 27
18 95+ 13 28
25+
29
30
33
46
50+ 54
肿瘤直径>5cm
5 25
14 32
Vki nki nki ni d i 1 di ni ni ni 1
表14-3 两种肿瘤直径患者术后生存曲线比较的 log-rank检验计算表
序号 i (1) 1 2 3 4 5 … 28 29 30 31 32 合计 时间(月) ti (2) 5 9 10 10 13 … 68 71 86 88 95 — n1i (3) 15 15 15 14 13 … 4 3 2 2 1 — d1i (4) 0 0 1 0 1 … 0 1 0 0 0 9 1 0 0 1 1 6 c1i (5) 0 0 0 1 0 肿瘤≤2 cm T li (6) 0.417 0.429 0.441 0.000 0.813 … 0.000 0.750 0.667 0.000 0.000 15.695 V1i (7) 0.243 0.245 0.247 0.000 0.467 … 0.000 0.188 0.222 0.000 0.000 7.110 n2i (8) 21 20 19 19 19 … 1 1 1 0 0 — d2i (9) 1 1 0 0 1 … 0 0 1 0 0 21 0 0 0 0 0 0 c2i (10) 0 0 0 0 0 肿瘤>5cm T2i (11) 0.583 0.571 0.559 0.000 1.188 … 0.000 0.250 0.333 0.000 0.000 14.305 V2i (12) 0.243 0.245 0.247 0.000 0.467 … 0.000 0.188 0.222 0.000 0.000 7.110 ni (13) 36 35 34 33 32 … 5 4 3 2 1 — 合计
(3)确定概率,作出统计推论
1
P<0.05,按α=0.05水准,拒绝H0,接受H1,可 认为两条生存曲线不同,肿瘤≤2cm患者的生存 率高于肿瘤> 5cm患者。
2. Breslow检验
wi d ki wiTki ) 2 w i Vki
2 2
k 1, 2 , , g
(1)
1 2 3 4 5 6 7 8 9 10 11
(2)
10 10+ 13 18 25+ 29 30 33 46 50+ 54 68+ 71 88+ 95+
(3)
1 0 1 1 0 1 1 1 1 0 1 0 1 0 0
(4)
0 1 0 0 1 0 0 0 0 1 0 1 0 1 1
(5)
15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
1.生存率(survival rate):生存函数

观察对象的生存时间T大于某时刻t的概率,用S(t)表示。
0≤ S(t) ≤1
资料无删失数据
ˆ(t ) P ˆ(T t )= t时刻仍存活的例数 S 观察总例数
资料有删失数据
S( t ) P(T tk ) p1 p2 pk S( t k 1 ) pk
15 47
19 52
20 54
21 60
22 86
24
一、Kaplan-Meier生存率曲线

Kaplan和Meier(K-M法) 步骤
1.计算生存率

◦ 将生存时间ti 按从小到大的顺序排列 c i
◦ 列出[ti,ti+1)上的复发数 di 和删失数 ni ni 1 di 1 ci 1
exp[1 ( X1 X *1 ) 2 ( X2 X *2 ) m ( X m X *m )]

比例风险假定,PH假定比值HR与h0(t)无关,即在时 间t上为常数。

HR计算举例
欲了解乳腺癌患者手术后复发是否与化疗有关,以 X 1
X 0 表示未进行化疗,得到 0.380 表示接受化疗,
12
13 14 15
0.000
0.333 0.000 0.000
1.000
0.667 1.000 1.000
0.379
0.253 0.253 0.253
3.绘制生存曲线
Kaplan-Meier methods
Edward Kaplan
Paul Meier
图14-2
乳腺肿瘤≤2cm和乳腺肿瘤>5cm组生存曲线
根据上述计算的生存率及其标准误可估计总体
生存率的可信区间。
ˆ (t ) z SE[S ˆ (t )] S i /2 i
表14-2 乳腺肿瘤直径≤2cm组生存率计算表
序号
i
时间(月)
ti
复发数
di
删失数
ci
期初例数
ni
复发概率
qi
生存概率
pi
生存率
ˆ (t ) S i
标准误
ˆ (t )] SE[S i
第一节 生存分析的基本概念
一、生存数据及其特点
生存时间:终点事件与起始事件之间的时间间隔,
常用t 表示。
完全数据(complete
删失数据(censored
data):观察到结局(如24)
data):截尾数据,未观察到结
局,右删失(如24+)

产生删失数据的原因
Survival analysis
(8)
0.933 0.933 0.862 0.790 0.790 0.711 0.632 0.553 0.474 0.474 0.379
(9)
0.064 0.064 0.091 0.108 0.108 0.123 0.132 0.137 0.139 0.139 0.140 0.140 0.139 0.139 0.139
组 数 -1
Norman Breslow
Tki 和 Vki 意义同 log-rank检验 d ki、 wi 为权重 g为组数,
Log-rank : wi =1 远期差异 Breslow : wi =ni 近期差异
Breslow test

例14-2资料采用Breslow检验
2 4.462 ,P 0.05 ,结论同log-rank检验。
医学统计学
第十四章 生存分析
Survival Analysis

在医学研究中,常常用追踪(follow up)的方式来 研究事物发展的规律,如:了解某药物的疗效、手 术后的存活时间、某医疗仪器设备的使用寿命。

特点:追踪研究的现象都要经过一段时间 统计学上将这段时间称为生存时间

生存分析:将终点事件和生存时间结合起来分析的 一类统计分析方法。
(1 , 2 , , m ):回归系数,一组待估计的参数。
PHREG
2.模型的参数解释及相对危险度计算
Cox模型可变换为
h (t , X ) ln 1 X1 2 X 2 m X m h0(t )
风险比(hazard ratio,HR)或相对危险度任两个个 体风险函数之比
生存时间已达到t的观察对象在时刻t的瞬时死亡
(t ) 表示。 率,用 h
h(t)≈P(t≤T<t+1|T≥t) 当△t=1时, h( t ) lim
t 0
P ( t T t t | T t ) t
第二节 生存率曲线及比较

例14-2 某研究者收集了15例乳腺恶性肿瘤直径小
(6)=(3)/(5)
0.067 0.000 0.077 0.083 0.000 0.100 0.111 0.125 0.143 0.000 0.200
(7)=1-(6)
0.933 1.000 0.923 0.917 1.000 0.900 0.889 0.875 0.857 1.000 0.800
其中,pi(i=1,2,…,k)为各分时段的生存概率 生存率:累积生存概率(cumulative probability of survival)
Survival analysis
2. 中位生存期(median survival time) :半数
生存期50%的个体尚存活的时间
3. 风险函数(hazard function):危险率函数

注意:两种方法的应用条件相同,即各组生存 曲线呈比例风险关系,生存 曲线不能有交叉。
生存曲线有交叉时,不适合做生存曲线的整体
比较。
第三节 多变量Cox回归分析

生存分析的多变量分析方法特点:
1. Logistic回归不能同时处理结局变量和生存时间。 2.生存时间分布类型的复杂性不满足多元线性回 归条件的要求。 3.多元线性回归与Logistic回归均不能利用不完
二、生存率的比较
1. log-rank检验
基本思想:在H0成立时,根据ti时点的死亡率,可计算出 各组的理论死亡数,则检验统计量为:
d ki Tki ) V ki
2
2
组数-1
Nathan Mantel
d ki:各组在时间ti上的实际死亡数
Tki:各组在时间ti上的理论死亡数
PHREG
βj :在其他因素不变的条件下,变量Xj 每增加一个单位 所引起的相对危险度的自然对数。
exp(βj ):在其他因素不变的条件下,变量Xj 每增加一
个单位所引起的相对危险度。 βj>0, exp(βj )>1, Xj 为危险因素 βj<0, exp(βj )<1, Xj 为保护因素
HRj exp[ j (c1 c0 )]
全数据提供的信息。
一、Cox回归模型
1.模型的基本形式
h (t , X ) h0(t )exp(1 X1 2 X 2 m X m )
h(t,X):观察对象生存到时刻的风险函数 h0(t): 基准风险函数,X1=X2=…=Xm=0时t时刻 的风险函数
X (X1 , X 2 , , X m ):可能与生存时间有关的m个自变量
相关文档
最新文档