生存分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
乘积极限法生存曲线及其半数生存期(Md=180日)
(二)寿命表法(life table method):应用 于样本例数足够多时,是乘积极限法的 一种近似(频数表法)。
例:某恶性肿瘤随访资料如下表,用寿命表法估 计生存率 1.数据列表:按手术年数从0开始,列出时段(t~) 及其序号k;将死亡和删失例数分配到各时段 组。
SPSS的过程:
三、生存曲线的比较 log-rank检验
对两(多)组总体生存曲线是否相同 进行假设检验的方法。
例:两组儿童横纹肌肉瘤治疗后复发时间 (月)如下,对照组为摘除+放疗,处理组为 摘除+放疗+化疗,问处理组是否可提高缓 解率(相当于寿命表资料的生存率)?
对 照 组
2,3,9,10,10,12+,15,15+,16, 18+,24+,30,36+,40+,45+
某年活满一年人数 p 1 q 某年年初观察例数
1 校正人口数 年初观察例数 删失例数 2
5. (累积)生存率(cumulative probability of survival):指病人经过t个单位时间之后仍存
活的概率。 若无删失数据,则
t时刻仍存活的例数 S (t ) P(T t ) 观察总例数
生存概率 p=(n0-d)/n0 0.833 0.800
t+1年生存率 S(t+1)=(n0d)N 0.833 0.667
0.250
0.333 0.500
0.750
0.667 0.500
0.500
0.333 0.167
生存概率(survival probability):表示在某 单位时段开始时存活的个体到该时段结 束时仍存活的机会大小。分子即年底尚 存人数,若年内有删失,则分母用校正 人口数
例:一组病人的存活时间(日数)如下, 试用乘积 极限法估计生存曲线。 90,150,210,540,150,270+
1. 数据列表:
将完全数据t从小到大排列,重复数据只列一次, 删失数据不列入;删失时刻介于tk和tk+1之间者, 登录在tk时刻删失人数一栏。
序号 k 1 2
存活 时间 t 90 150
4. 死亡率、死亡概率、生存概率:
例:手术治疗60例肺癌病人,术后5年每年死 亡数10例,无删失,求基本的生存分析指标。 (人时)死亡率(mortality rate,death rate):某单 位时间内的死亡强度。人年数常用年平均人 口数代替。年初人口数包含恰好在此时死亡 或删失者。
某年内死亡数 m 比例基数 观察人年数
在H0成立的条件下,该统计量服从自由 度为1的卡方分布。 本例结果为5.60,P=0.0179,按α=0.05 水准拒绝H0,接受H1,可认为附加放疗 有助于病人的缓解。
Breslow检验:
2 B
( N j a j N j e j )2
2 2 N jvj
在H0成立的条件下,该统计量服从自由度 为1的卡方分布。 本例结果为5.338,P=0.0209,按α=0.05 水准拒绝H0,接受H1,可认为附加放疗有 助于病人的缓解。
处 理 组
9,12+,16,19,19+,20+,20+, 24+,24+,30+,31+,34+,42+,44+, 53+,59+,62+,
S (t)
1.0 .9 .8 .7 .6 .5 .4 .3 0 10 20 30 40 50 60 70
GROUP
¦ À ´ í × é ¦ À ´ í × é É ¾ Ê § Ô Õ × ¶ é Ô Õ × ¶ é É ¾ Ê §
序号 k 1 2 3 4 5
术后 年数 t
0~ 1~ 2~ 3~ 4~
期内死 亡数 d
68 61 38 16 8
期内 删失数 c
8 7 3 1 0
期初 例数 n0 233 157 89 48 31
校正年 初人数 nc=n0c/2
229.0 153.5 87.5 47.5 31.0
2.求年初人数: n05=31 n04=n05+d4+c4=31+16+1=48 n03=n04+d3+c3=48+38+3=89 3.求校正年初人数nc=n0-c/2 4.计算死亡概率q=d/nc 5.计算生存概率p=1-q 6.计算生存率及其标准误
生存分析
Survival analysis
一、基本概念
1.疾病预后:1.结局好坏 2.该结局所经历的时间 2.资料来源:通过随访收集。 起点是确诊日期,治疗开始的日期等。 阳性结局是死亡,复发,致残,痊愈等。 注意:在临床疗效评价中,仅仅用痊愈率, 有效率,病死率等百分率指标效能较差, 同时考虑时间则可全面和精确地评价疗效。
t时刻死 亡数 d 1 2
t时刻 删失数 c 0 0
t时刻 期初 死亡概率 例数 q=d/n0 n0 6 5 1/6 2/5
3Biblioteka Baidu4
210 540
1 1
1 0
3 1
1/3 1/1
2.求t时刻初期例数n0 n04=1 n03=n04+d3+c3=1+1+1=3 n02=n03+d2+c2=3+2+0=5 n01=n02+d1=5+1=6 3.求t时刻死亡概率q=d/n0 4.求t时刻生存概率p=1-q 5.计算生存率及其标准误:
SE[ S (tk )] S (tk )
pn
j 1 j
k
qj
j
生存概率 p=1-q 5/6 3/5 2/3 0/1
生存率 S(t) 0.833 0.500 0.333 0.000
标准误 SE[S(t)] 0.152 0.204 0.193 0
乘积极限法根据死亡时点分段,逐个估计死亡 时点的生存率,间断点的纵坐标值在下一个台 阶处,最后一个时点的病例全部死亡时,曲线 与横坐标相交。
0.286 0.400 0.667
死亡概率(mortality probability):死于某 时段的可能性大小。若年内有删失,则 分母用校正人口数。死亡率与死亡概率 的分母不同。
某年内死亡数 q 某年年初观察例数
1 校正人口数 年初观察例数 删失例数 2
死亡概率 q=d/n0 0.167 0.200
6.生存曲线(survival curve):将各个时点 的生存率连接在一起的曲线图或表。 7.半数生存期(median survival time):表 示有且只有50%的个体可活这么长时间。 本例S(3)=0.50, 所以半数生存期为3年。
二、生存率及其标准误
(一)乘积极限法(product-limit method): 即Kaplan-Meier法,为非参数法,主要用 于小样本资料。
暴露组与非暴露组的危险率之比正是流行病 学中的相对危险度RR,于是可以看出Cox模型中 回归系数的流行病学含义是0-1变量的相对危险度 的自然对数。
X
ln( RR )
表达的模型可以改写成以下更容易理 解的一种形式:
h( t , x ) exp( 1 x1 2 x 2 p x p ) h0 ( t )
其中t为病人的存活时间。如果含有删失数据, 分母必须分时段校正。 生存概率是单个时段的概率,生存率是从0~t 多个时段的累积结果。
假定病人在各个时段生存的事件独立, 各时段的生存概率为p,则
S (tk ) P(T tk ) p1 p2 pk
该式可处理删失数据,如三年生存率为
S (3) p1 p2 p3 0.833 0.800 0.750 0.500
0.1179
0.0293 0.0254
0.0226
寿命表法生存曲线及其半数生存期 (Md=1.7年)
寿命表法估计的是时间区间右端点上的生 存率。 可用正态近似法估计总体生存率的置信区 间,如手术后2年生存率的95%可信区间 为: 0.4237±1.96×0.0332=(0.3586,0.4888) 动态变化:生存或死亡概率可反映其趋势。 累积情况:该资料标准误较小,说明生存 率具有代表性,半数以上病人手术后存活 不到2年。
一、模型结构
优点:适用条件很宽,便于做多因素分析。 用于疾病预后分析及队列研究的病因探索。
危险率函数h(t,x):描述已经活过时点t的 个体在时点t后单位时间内死亡的危险性 (t时刻仍存活的病人往后一瞬间的死亡 率)。
Cox模型:
h(t,x)=h0(t)exp(b1x1+b2x2+…+bpxp)
h0(t)为基准危险函数,表示所有协变量均为 0时的个体死亡危险率,它是与时间有关的任 意函数。基线危险率函数不要求特定的形式, 具有非参数的特点,而指数部分的协变量效应 具有参数模型的形式,故Cox回归属于半参数 模型。 xi,bi分别是协变量及其回归系数。
h(t , x 1) h0 (t ) exp( ) exp( ) RR h(t , x 0) h0 (t )
(三)k年生存率与半数生存期估计:可用内插法对k 年生存率和半数生存期做近似估计,对于寿命表法, 可用百分位数法求Md。 (四)生存资料的基本要求: 1.样本由随机抽样方法获得。 2.删失比例不能太大,否则结果存在较大偏倚。 3.生存时间尽可能精确到日数。 4.死亡例数不能太少。 5.缺项尽量补齐。
(1)因变量有两个,即生存时间和结局。 (2)生存时间存在观察不完全数据。 不能简单地计算死亡率或平均生存时间进 行分析。
生存时间:指观察到的存活时间。 完全数据(complete data):从起点到死亡所经 历的时间。 删失数据(censored data):由于失访、改变治 疗方案、研究结束等使部分病人不能随访到 底。也提供了部分信息。
死亡概率 q=d/nc 0.2969 0.3974
生存概率 p=1-q 0.7031 0.6026
t+1年 生存率 S(t+1) 0.7031 0.4237
标准误 SE[S(t+1)] 0.0302 0.0332
0.4343 0.3368
0.2581
0.5657 0.6632
0.7419
0.2397 0.1589
t(Ô Â )
乘积极限法估计的缓解曲线,可见分辨度较好
检验假设
H0:两总体缓解曲线相同。 H1:两总体缓解曲线不同。 α=0.05
Log-rank检验(时序检验):该法不指
定生存时间服从特定的某种分布,属于非参数 检验。
2 L
( a j e j )2
2 v j
将两组非删失时间混合从小到大排序,得多个 四格表,aj和ej分别为第j个四格表中某组复发 数的实际频数和理论频数, vj为aj的方差。 对照 处理 1 0 2月 复发 14 17 未复发
左边的比值也就是相对危险度或称为风险比 (risk ratio)。Cox模型中假定它的大小与时间 无关,称为比例危险率假设,简称PH假设, 这就是这种模型称为比例危险率模型的原因。
二、参数估计与假设检验
例:为研究某药是否会改进急性白血病的预后, 延长缓解时间(周),将确诊病人给予不同治 疗,一组为用药组,另一组为对照组(传统疗 法),治疗前检测了病人的白细胞计数,经过 一定时间的随访,得白血病人的缓解时间。试 做分析。 本例共有两个协变量: 治疗方法x1: 用药,1;对照,0 白细胞计数x2 : 具体数值
5例肝癌随访记录
序 号
1 2
协变量 姓 名 性别 处理
… … 1 0 0 1
观察记录
开始 980712 980701
整理
终止 结局 日数 1129 1208 0 1 140 160
3
4
…
…
1
0
1
0
980714
980822
1231
1129
0
1
170
99
5
…
1
1
981020
1125
1
36
3.数据特点:
(三)注意:
1.方法选择 :log-rank相对重视远期效应, 而Breslow相对重视近期效应。 2.应用条件:各组生存曲线不能交叉,交 叉提示可能存在混杂因素,应设法校正 或分段分析。 3.效应大小:有统计学意义时,考察效果 用生存曲线图目测判断、半数生存期 比 较、相对危险度比较。
Cox回归分析
1 年平均人口数 (年初人口 年末人口) 2
术后 年内死亡 年内删 年数 数d 失数c t~ 0~ 1~
2~ 3~ 4~
年初 年平均例 死亡率 例数 数n=n0m=d/n n0 d/2 60 50
40 30 20
10 10
10 10 10
0 0
0 0 0
55 45
35 25 15
0.182 0.222