医学统计学--生存分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
讲义例:17-1
• 某人研究手术方法治疗23位肾上腺肿瘤病人的 生存时间(月)如下: • 1,3,5(3),6(3),7,8,10(2),14+, 17,,19+,20+,22+,26+,31+,34,34+,44, 59 • 注:( )括号内的数为相同时间点的人数 • 数据特点: • 1.生存时间的分布为偏态分布, • 2.有截尾值 • 3.每个值包含两个含义,即“t”和状态“死亡 与否”
三、生存分析中的基本方法
• 1.非参数法*: • 特点:不考虑变量的分布,采用秩次统计量。 是生存资料常采用的方法。主要是单变量的统 计描述和比较。 • 2.半参数法*:如Cox模型,主要是生存时间的 影响因素分析。 • 3.参数法: • 特点:假定资料服从某分布。常采用指数分布 和Weibull分布等。(不常用)
S (2) p1 p2 0.9 0.89 0.8
• 条件死亡概率、条件生存概率(275页) • 条件死亡概率(F):某时间段开始存活的个体 到该时间段结束时,死于某时段内的可能性。
某时间段内的死亡数 d F 某时间段初的观察数 n
• 生存概率(S=1-F): • 指某时间段开始存活的个体到该时间段结 束时仍存活的概率。 •
寿命表法与PL的区别
• 1.计算在 (ti 1,ti ) 时间段的生存率。 • 如0-1年、1-2年,时间段组距相等。 • 2.寿命表方法计算死亡(生存)概率,假定有 截尾事件的人在各时间组内平均生存为1/2时间。
•校正观察人数=期初观察人数-截尾人数/2 • 死亡概率=某时间组内死亡人数/校正观察人数
t
“t”表示从研究起点到结局出现时间
• 2.生存曲线:(survival curve) • 指各时点(t)为横轴,生存率S(t)为 纵轴,连接一起的曲线图。描述该组病人 各时点的生存过程。(277页)
• 3.半数生存期(中位数生存时间) • 生存率为0.5时对应的时间(t),表示 50%的个体可生存的时间,常作为生存 数据的平均指标。(278页)
表17-1资料甲手术描述指标(SPSS 软件)
Survival Time Standard error 95% Confidence Interval
Mean: 24.23 Median: 10.00
•
4.99 6.96 Standard Err 1.18 2.98
( 14.44, 34.01 ) (.00, 23.63 ) 95% Confidenc Interval ( 5.50, 10.10 ) ( .16, 11.84 )
• 2.大样本数据生存率计算
• 用寿命表法(Life Table,LT法)
两法特点:
• 1.均可计算有截尾的生存资料。 • 2.生存率S(t)计算采用概率乘法 原理。 • SPSS、SAS统计软件用PL法和 LT法计算生存率S(t)、生存率的 标准误Sp、中位数生存时间、绘制 生存曲线。
例17-1:某手术方法治疗23例肾上腺 肿瘤病人后生存情况(讲义275)
• 条件死亡概率F(t=1)=0.1,在1Hale Waihona Puke Baidu内死亡的概率.
p( X 2) 80 / 100 0.8
直接法 概率乘积法
• p( X 2) 0.9 0.89 0.8
生存时间数据分析时整理示意图
•
• •
失访
死亡 失访 死亡
死亡 死亡 • 0 2 4 6 8 10 12 14 16 18 20 年
第一节
生存分析的基本概念
一、基本概念
1. 生存时间(t)=结局事件日期 -起始事件日期。 t的单位:可用年、月、周表示。
起始事件(事 件的特征)
如诊断、用 药、手术等
时间(t)
结局事件(结 局出现的特征)
如疾病 的死 亡、复发等
2.截尾数据:
• 观察过程因其他原因未观察到明确 的结局称为截尾( censored )数据。原 因有:①失访,②退出研究,如其他原 因死亡。③研究时间结束,未出现结局 事件。 • 截尾值(censored value):其生存时间 = 截尾事件日期 -起始事件日期, 记为 t+ 。 (例:10+月)
Survival Functions
1.2
1.0
甲手术
.8
.6
乙手术
.4
.2
0.0
-.2 0 10 20 30 40 50 60
图17-2 两种手术治疗方式术后病人生存曲线的比较
(二)生存率估计的统计方法 (非参数方法)
• 1.小样本数据生存率计算。
•
用 kaplan-Meier的乘积极限法 (product-limit method,PL法)
随访记录
终止 是否 生存 日期 死亡 时间 98/11/29 Y 140 98/12/29 Y 160 98/11/29 失访 99 98/11/25车祸死亡 36
随访研究资料
• 随访资料: • 随访观察某事件出现“某结局”和“结局 出现的时间”的资料统称为随访资料,评价 该资料的统计学方法为生存分析。 • 生存分析是将“结局”与“时间”两个因素 结合一起研究的统计分析方法
• 其他统计方法不能处理该资料
二.资料的收集
• (一)随访内容 • 1.明确起始事件的特征和时间,如手 术日期等。 • 2.明确随访结局:结局的特征事件, 如死亡或截尾事件。 • 3.明确研究结束时间。 • 4.记录影响“时间”的其他自变量。
• 例:收集生存数据和影响预后的因素 。 •
•
• • • • • • • 病例 号 1 2 3 4
( Ai Ti ) Ti
2
2
• 该χ2服从的自由度=(比较组数-1)
• Ai为某组各时间点实际死亡数(di)之和. • Ti为某组各时间点的期望死亡数(Ti)合计 • i 表示比较组,i=1,2,…k组
表17-4
Log-rank检验的基本思想
乙法手术组
时间 甲法手术组 1i T t n1i d1i 1 23 1 1.605
• 1.生存率
•
1)直接法
生存时间X t的病人数 p( X t ) 观察的病人总数
• 2.概率乘法原理计算(275页)
S (t ) p j p1 p2
pj
(公式17-2)
Pj 为条件生存概率,有截尾数据,采用该法。
• S(t)也称累计生存概率,t 时刻存活是t 之前一直生存的累积。 • 例:
•
• 甲药 • 乙药
• 疗效除了应评价“结局”的好坏,结 局所经历的时间长短也是评价疗效重 要的指标。
• 例:收集生存数据和影响预后的因素 。
•
•
• • • • • • • 病例 号 1 2 3 4
某病用不同药后随访记录(天)
预后因素
性别 处理 组 1 A药 2 B药 1 A药 2 B药 开始 日期 98/07/12 98/07/01 98/08/22 98/10/20
(二)随访的方式
• 1.全体观察对象同时接受某处理 • 随访方式:多见于动物实验(见图 17-1,a) • 2.观察对象在不同时间接受处理因素 • 随访方式:多见于临床试验研究 (见图17-1,b)
×为死亡
O 为截尾 × O O × × 0 起始事件时间 如给药
t
研究结 束时间
一批病人不同时间进入研究的随访资料
(17-1)
例:某病病人生存率
• 生存 期初 死亡 生存 • (年) 人数 人数 人数 • 0-1 100 10 90 • 2 90 10 80 • 3 80 20 60 死亡 概率 0.1 0.11 0.25 生存 生存率 概率 p( X t ) 0.9 0.90 0.89 0.80 0.75 0.60
某病用不同药后随访记录(天)
预后因素
性别 处理 组 1 A药 2 B药 1 A药 2 B药 开始 日期 98/07/12 98/07/01 98/08/22 98/10/20
随访记录
终止 是否 生存 日期 死亡 时间 98/11/29 Y 140 98/12/29 Y 160 98/11/29 仍活 99 98/11/25车祸死亡 36
第十七章 生存分析
(Survival Analysis)
概 述
• 问题的提出:
• 临床上疗效、预后的评价常用疾病 的结局指标:如有效率、治愈率、 死亡率指标比较,对于在短期内能 明确治疗效果的疾病是适用的。但 对于通过随访后的远期疗效,其指 标的评价不全面。
•例
•
某病的疗效比较
治愈率 80% 81% 平均治愈时间 20天 12天
例17-3 • 表17-3 2418例男性心绞痛病人生存率情况 • 术后 死亡 截尾 期初 校正 生存 生存率 • 年数 人数 人数 人数 人数 概率 (t+1) • 0456 0 2418 2418 0.8114 0.8114 • 1226 39 1962 1942.5 0.8837 0.717 • 2- 152 22 1697 1686 0.9098 0.6524 • 校正人数=1962-39/2=1942.5
表17-2资料乙手术描述指标
• Survival Time Mean 7.80 Median 6.00
Survival Functions
1.2
1.0
.8
甲手术 乙手术
.6
.4
.2
0.0
-.2 0 10 20 30 40 50 60
月
图17-2 两种手术治疗方式术后病人生存曲线的比较
2.大样本资料的生存分析方法—寿命 表法(Life-table method)
3.生存数据的特点
1.完全观察的随访数据:研究对象在规定的研究 期间提供确切的“时间”。其生存时间记为 “t”。 2.截尾数据:截尾数据(t+)虽然提供的信息不完 全,但提供了部分信息,如 t=10+年>9年。 3.生存数据的结果变量(Y )有两个: 1)“时间(t)值” ,(t)>0 2)结局状态=“ 如死亡或截尾值”。
• 生存时间(t,月),其中“+”者为截尾数据 • 1,3,5(3),6(3),7,8,10 (2) • ,14+,17,19+,20+,22+,26+, • 31+,34,34+,44,59 • 计算生存率s(t)和生存曲线
表17-1 甲种手术后病人生存率的计算方法
时间(月) • T • 1 • 3 • 5 • 6 • 7 • 8 • 10 • 14+ 死亡 人数 1 1 3 3 1 1 2 0 期初 人数 23 22 21 18 15 14 13 11 死亡 概率 0.043 0.045 0.143 0.167 0.067 0.071 0.154 0.000 生存 生存率 p( X t ) 概率 0.957 0.957 0.955 0.914 0.857 0.783 0.833 0.652 0.933 0. 609 0.929 0.565 0.846 0.478 1.000 0.478
n2i
20
d 2i
2
T2i
合计
ni d i
1.395 43 3 按两组合计 死亡率计算 各组理论频 数
di 3 T1i n1i 23 1.605 ni 43 di 3 T2i n2i 20 1.395 ni 43
• 如H0成立: χ2统计量的P>0.05
第三节 生存曲线的统计检验
• 目的:将生存率为整体进行曲线与曲线的 比较 • 方法:时序检验(Log-Rank),为非参 数法检验,可对两组或多组做比较. • 检验假设:H0:两总体的生存率相同 • H1:两总体的生存率不同 • 检验水准α=0.05,如P≤α,拒绝H0
Log-rank检验
• 检验统计量
起点 起点 死亡
死亡
失访
起点
起点
起点
90年 91年 92年
93年
存活 存活
(研究结束)
(三)生存分析主要研究的内容
• 1.统计描述:用统计指标描述生存过程, 计算不同时间点(t)的生存率
• 2.统计推断:统计检验不同处理方式的生 存过程有无差别
• 3.自变量(x)与时间(t)的关系:影响 生存时间的危险因素分析
第二节 生存率的估计与生存曲线
• (一)描述生存资料的几个指标 (见讲义275-278页) • 1.生存率 ,记为p(X≥t) • 2.生存曲线 • 3.平均生存时间(中位生存时间) • 反映不同时间(t)的结局(生存) 出现(生存)率
生存率的概念和计算公式
记为S(t)或P(X≥t)。 • P(X≥t) :指某观察对象从起始事件(如 手术时间为0点)开始,经历了t=1,2..n (年或月)个单位时间后仍存活的概率。