生存分析(第17章)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 1 23 1 0 1.605 20 2 0 1.395 43 3 2 2 22 0 0 0.550 18 1 0 0.450 40 1
26 59 1 1 0 1.000 0 0 0 0.000 1 1 合计 - - 16 7 23.809 - 20 0 12.191 - 36
途失访、或死于其它疾病、或观测结束时仍
存活,得不到准确生存时间(不完全数据)。
10 年间 346 例大肠癌患者手术后的生存时间记录
患者 编号
性 年龄 别 (岁)
确诊到手 术间隔时 间(月)
手术开 始时间
终止随 访时间
结局
生存 时间 (月)
1 男 32 10 94.01.23 94.12.24 死亡
3.死亡率(mortality rate,m )
单位时间内死亡频率或强度。
年死亡率
m
同年内死亡人数 某年平均人数
年平均人数=(年初人数+年终人数)/2
4.死亡概率(mortality probability, q )
死于某阶段内的可能性大小。
年死亡概率q
同年内死亡人数 某年年初人数
有删失值时: 年初人数=原年初人数(删失例数)/2
两种手术治疗方式术后病人生存曲线比较 3.生存曲线
1.0
%
.8
生 存 .6 率 ( ) .4
.2
0.0 0
10
20
30
40
50
生存时间(月)
组别
乙种手术 乙-censored 甲种手术 甲-censored 60
4.中位生存时间 有50%的个体其存活期大于该时刻。 图解法:简单直观,结果粗略。 线性内插法(利用线性比例关系): t=8, S(8,X)=0.565; t=10, S(10,X)=0.478 (8–10):(8 – t)=(0.565 – 0.478):(0.565 – 0.50) t=9.494(月)
SE S(t,X) d n(n d)
d为 t时刻各种非截尾值所对应的死亡人数
SEt5 0.783
1 1 3 0.0860 23 22 22 21 2118
总体率1-的可信区间
S(t,X) u / 2SE
如样本生存率为S(5, X) 0.783时, 其 总 体 生 存 率 的95%可 信 区 间 为 : 0.783 1.96 0.0860 (0.6144,0.9516)
(生存过程的影响因素分析)
1972年由英国统计学家 D. R. Cox 提出,解决 以下问题:
在生存时间的分布种类繁多且难以确定、存
在截尾数据的情况下,研究协变量X与生存函
数S(t, X)之间的关系。
Cox 模型不直接考察生存函数 S(t, X)与协 变量的关系,而是用风险函数 h(t, X)作为 应变量。
1962-39/Hale Waihona Puke Baidu = 1942.5
(6)死亡概率qi: qi=di/Ni
(7)生存概率pi: pi =1- qi
(8)生存率:
S
(t i,X)
pj
ji
(9)生存率的标准误:
S
SE (ti,X)
qj ji p jN j
2.生存率曲线
生存率(%)
1 0.8 0.6 0.4 0.2
0 0
5
10
生存率 标准误
SE
(9)
0 ~ 456 0 2418 2418.0 0.1886 0.8114 0.8114 0.0080
1 ~ 226 39 1962 1942.5 0.1163 0.8837 0.7170 0.0092
2 ~ 152 22 1697 1686.0 0.0902 0.9098 0.6524 0.0097
2.比较生存过程 对各样本生存率进行比较。
3.影响生存时间的因素分析 拟合生存分析模型。
四、生存分析的基本方法
研究目的 生存过程 的描述
生存过程 的比较
生存过程 的影响因素分析
非(半)参数方法 乘积极限法(又称 Kaplan-Meier 法) 寿命表法 Turbull 估计
对数秩(log-rank)检验 分层对数秩检验 Gehan 检验 广义 Wilcoxon 检验 Mantal-Haenszel 检验 Cox 比例风险模型 非比例风险模型 logistic 回归模型
14 ~ 15 ~
6 33 59 42.5 0 20 20 10.0
0.1412 0.0000
0.8588 1.0000
0.1405 0.0137
0.1405 0.0137
( 点1ti);时在间区区间间内死ti亡1,;ti 在 :区继间续内生截存尾到。区间终
(2)死亡人数di: (3)截尾人数ci: (4)起初观察人数Li: (5)校正观察人数Ni: Ni=Li-ci/2
h(t,
X)
lim t0
P(t
T
t
t t
T
t,
X)
二、资料收集
(一)随访内容
1.明确开始随访的时间 (如出院时间、确诊时间、开始治疗时间)
2.随访的结局 死亡 生存但中途失访 死于其他疾病 生存但随访结束
终止随访时间 死亡时间 最后一次访问时间 死亡时间 研究结束时间
3.记录影响生存时间的有关因素
5.生存概率(survival probability , p)
单位时段开始时存活的个体到该时段结束 时仍存活的可能性。
年生存概率p
同年内活满一年人数 某年年初人数
有删失值时:
年初人数=原年初人数(删失例数)/2
p=1q
6.生存率 (survival rate,S(t,X))
又称生存函数。
S(t,X)
乘积极限法 (product-limited method) 由Kaplan-Meier于1958年提出,又称为 Kaplan-Meier法 利用概率乘法原理计算生存率
例 有人研究了甲种手术方法治疗肾上腺肿瘤 病人23例的生存情况,定义从手术后到病人 死亡的时间为生存时间,得到生存时间(月) 如下(+为截尾数据),试计算其生存率与 标准误。
1,3,5,5,5,6,6,6,7,8,10,10, 14+,17,19 + ,20 + ,22 + ,26 + ,31 + , 34,34 + ,44,59。
相同数据只列一次;完全数据与截尾值相同时,截尾值在后。
表 17-1 甲种手术方式治疗 23 例肾上腺肿瘤病人的生存率计算
序号 i
时间 (月)
终点事件
死亡
重新吸烟 复发 下一次发作 发病 治愈
2.截尾值(censored value,+)
随访中由于某种原因未能观测到病人的明确 结局,提示真实生存时间长于观测到的时间。
原因: 失访; 死于其他疾病; 病人生存期超过研究的终止期;动物试验到 达终止期未出现规定终止事件; 治疗措施改变。
又称删失值或终检值 ,本章讨论右删失情况。
H0:两种手术方式后病人的生存率相同 H1:两种手术方式后病人的生存率不相同 =0.05
表 17-4 两种手术方式后病人生存率比较 log-rank 检验计算表
序号 时间
甲种手术组
乙种手术组
合计
i
t n1i d1i c1i T1i n2i d2i c2i T2i
ni di
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12)
2
A T2
T
16 23.8092
23.809
20 12.1912
12.191
7.56
组数 1 2 1 1, 0.005 P 0.01
结论:按=0.05水准拒绝H0 ,接受H1 ,可 以认为两种手术方式后病人的生存率有差别。
第四节 Cox比例风险回归模型
(Cox’s proportional hazard regression model)
15
生存时间(年)
男性心绞痛病人的生存曲线
第三节 生存曲线的log-rank检验 (生存过程的比较)
Log-rank检验是以生存时间的对数为基础 推导出来的;
其基本思想是实际死亡数与期望死亡数之 间的比较;
它是对各组生存率作整体的比较。
例 用甲、乙两种手术方法分别治疗病情基本相 同的肾上腺肿瘤病人23例与20例,定义从手术 后到病人死亡的时间为生存时间,得到生存时间 (月)如下(+为截尾数据),问甲、乙两种手 术方式后病人生存率有无差别?
t
死亡人 数 d
起初观 察人数
n
死亡概 率
q=d/n
生存概 率
p=1-q
生存率 S(t,X) =∏p
标准误 SE
(1) (2) (3) (4) (5) (6) (7)
1
1
1
23
0.043 0.957 0.957 0.0425
2
3
1
22
0.045 0.955 0.914 0.0588
3
5
3
21
0.143 0.857 0.783 0.0860
生存时间
t时刻的观察单位数 总观察例数
生存概率针对单位时间;生存率针对某个 较长时间段,它是生存概率的累积结果。 如5年生存率是每一年不同生存概率乘积。
S(5, X) p1 p2 p5
7.风险函数 (hazard function,h(t,X))
生存时间已达到 t 的一群观测对象在 t 时 刻的瞬时死亡率。
14
31+
0
5
0.000 1.000 0.430 0.1041
15
34
1
4
0.250 0.750 0.323 0.1216
16
34+
0
3
0.000 1.000 0.323 0.1216
17
44
1
2
0.500 0.500 0.161 0.1293
18
59
1
1
1.000 0.000 0.000

2.生存率标准误的计算
第十七章 生存分析 survival analysis
随访观测评价临床疗效存在三个问题:
两种治疗方法的治愈率相同,但平均治愈 天数不同。
甲、乙两种药物治疗某病治愈率均为90%, 甲药治疗的患者平均12天出院,乙药治疗的 患者平均7天出院。
一部分研究对象可观测到死亡,得到准确 生存时间(完全数据);一部分研究对象中
(1)将两组资料混合后统一排序: c1i、c2i分别表示两组截尾数据。
(2)计算各组的期望死亡数:
T1i
di n1i ni
3 23 1.605 43
T2i
di n2i ni
3 20 1.395 43
(3)求各组的期望死亡人数之和:
T1i 23.809 T2i 12.191
(4)计算 2值:
生存时间分布通常不服从正态分布。
生存分析是将事件发生的结果与随访时间两 个因素结合起来、可以对完全或不完全数据 进行分析的方法。
第一节 生存分析中的基本概念
一、名词解释
1.生存时间(survival time, t )
起始事件
发病
戒烟开始 白血病治疗缓解 冠心病前一次发作 接触危险因素 开始服药
参数方法 指数分布法 Weibull 分布 Gamma 分布 logistic 分布 对数正态分布 分布参数检验
指数回归模型 Weibull 回归模型
第二节 生存率的估计与生存曲线 (生存过程的描述)
一、小样本资料
1.生存率的计算 2.生存率标准误的计算 3.生存曲线 4.中位生存时间
1.生存率的计算
11
2 女 48 12 98.02.14 99.01.01 失访
10+
3 女 26
6 92.03.04 95.04.12 死亡
37
4 男 55
3 99.08.20 01.09.21 死于其他 25+
346 女 58
8 01.03.10 01.12.31 存活
9+
开始观察时间:1992.01.01 终止随访时间:2001.12.31
(二)随访方式
×

×

0 始点
○ ○
× ×
×
死亡

失访 治疗措施改变 死于其他疾病

t 时间 终点
×

×

0 始点
○ ○
× ×

×
死亡

失访 治疗措施改变 死于其他疾病
t 终点
时间
×

0 始点
×

t 终点


×
死亡
×

失访
×
治疗措施改变
死于其他疾病

时间
三、生存分析研究的主要内容
1.描述生存过程 生存时间分布特点、估计生存率及平 均生存时间、绘制生存曲线。
甲(n=23):1,3,5,5,5,6,6,6,7,8, 10,10,14+,17,19 + ,20 + ,22 + ,26 + ,31 + ,34,34 + ,44,59。 乙(n=20):1,1,2,3,3,4,4,4,6,6, 8,9,9,10,11 ,12 ,13 ,14 ,15 ,17,18。
二、大样本资料
1.生存率的计算 寿命表法(life table method)
表 17-3 2418 例男性心绞痛病人生存率及标准误的计算
生存时 间区间 (年)
ti-1
死亡 人数
di
截尾 人数
ci
起初 观察 人数
Li
校正观 察人数
Ni
死亡概率
qi
生存概率 生存率
pi
S(ti,X)
(1) (2) (3) (4) (5) (6)=(2)/(4) (7)=1-(6) (8)=∏(7)
相关文档
最新文档