统计学教案习题17随访资料的生存分析

合集下载

练习题答案17

练习题答案17

第十七章生存分析练习题一、最佳选择题1.生存分析中的生存时间为( )。

A.出院至失访的时间B.手术至失访的时间C.观察开始至终止的时间D.观察开始至失访的时间E.入院至出院的时间2.关于膀胱癌化疗的随访资料做生存分析,完全数据是指( )。

A.死于膀胱癌B.死于意外死亡C.死于其它肿瘤D.观察结束时仍然存活E.由于搬迁而失访3.采用log-rank检验分析肺癌发病资料,其中吸烟、慢性支气管炎两个因素都有统计学意义,由此可认为( )。

A.吸烟与肺癌有因果联系B.慢性支气管炎与肺癌有因果联系C.两个因素与肺癌有因果联系D.两个因素为肺癌的发病因素E.以上都不对4.生存分析的反应变量是( )。

A.正态的和方差齐性的B.生存时间和结局变量C.生存时间D.结局变量E.完全数据(未截尾)二、问答题1. 在肿瘤预后分析中,死于非肿瘤患者的数据怎样处理?2. 生存分析可用于发病资料的分析吗?请举例说明。

3. 生存时间能计算平均数、标准差吗?4. 生存分析对资料有哪些基本要求?三、计算题1. 下表是296例肝癌患者的生存数据,试作生存分析并绘生存曲线。

296例肝癌患者的生存数据生存时间(月)期初观察人数死亡人数删失人数[0,1) 296 94 10[1,2) 192 74 5[2,3) 103 22 10[3,4) 71 22 6[4,5) 43 5 5[5,6) 33 6 6[6,7) 21 4 1[7,8) 16 2 1[8,9) 13 3 2[9,10) 8 2 0[10,11) 6 2 2[11,12) 2 2 02. 某医院有11例乳腺癌患者接受手术加化疗治疗,其生存时间如下:10 14 15 16+19 19 20 20+24 26 28 试估计生存率,并绘生存曲线。

3. 某医院用甲、乙两疗法治疗急性黄疸性肝炎,随访十年得资料如下:甲疗法组12,25,50+,68,70,79+,83+,91+,114+,114+,乙疗法组1,1,9,17,21,25,37,38,58,72+,73试比较两疗法的生存期(月)有无差别。

随访数据的统计分析方法

随访数据的统计分析方法
浙江大学医学院流行病与卫生统计学教研室 沈毅
2.求 t时刻期初例数n0 本例最后时刻期初人数n5=1,其它 时刻由下往上累计获得,例如,
n03=n04+d3+c3=2+1+0=3,n02=n03+d2+c2=3+2 +0=5(见第5列)
3.求t时刻死亡概率q=d/n0。(见第 6列) 4.求t时刻生存概率p=1-q。(见第7列) 5.计算生存率及其标准(见第8,9列)
S(t)=P(T≥t)=p1p2…pk 式中pj可用校正人数估计,可处理截尾数据。 上例:3年生存率为
S(3)=10/40=0.250 由式(12-5)求得例12-1的3年生存率为
S(3)=p1p2p3=0.750×0.667×0.500=0.250
浙江大学医学院流行病与卫生统计学教研室 沈毅
(2)生存率的标准误:生存率的标准误有不同的估计方法, 其中Greenwood’s法(1926)比较常用,其公式为
生存时间的统计分析方法起源于19世纪对寿命表的研究,在第 二次世界大战期间,由于对武器的可靠性的要求,使这一分析方法 得到了很大的发展,并不断扩展应用的其他研究领域中。近40年来, 在医学研究,特别是在临床随访研究中,也引进了生存分析的方法, 用来分析病人的随访资料。由于临床研究资料的多样性和复杂性, 反过来又进一步推动了生存时间分析技术的发展。到目前为止,生 存分析作为统计学的一个分支,已形成了一套完整的体系,包括参 数法,非参数法以及回归分析方法等。
浙江大学医学院流行病与卫生统计学教研室 沈毅
(二)生存时间数据的类型:
1.完全数据 某个观察对象具有明确的结局时,该观察对象所 提供的关于生存时间的信息是完整的。我们把达到了明确结局 的观察对象的生存时间数据称为完全数据(Complete Data)。

随访资料的生存分析

随访资料的生存分析

随访资料的生存分析对于需要长期观察的病例,如慢性病或恶性肿瘤,原有疗效指标如有效率、治愈率等就不适用,还需要考虑出现结局的时间长短。

生存分析(survival analysis)是将结局和出现时间结合起来分析的统计分析方法。

生存分析最常用的方法有乘积限法和寿命表法、生存率比较的log-rank检验和Wilcoxon检验以及Cox比例风险回归模型。

生存分析的基本概念研究生存时间需要通过随访完成,随访有两种形式:1.从所有观察对象在同一时间接受统一处理后观察到事先规定的时间或一定数量观察对象出现特定结局为止2.观察不同时间接受同一处理,然后观察到规定时间或一定数量出现特定结局(此状况更常见)。

终点事件(endpoint event):又称失效事件(failure event),是指研究对象发生的研究者关心的特定结局。

起始事件:研究对象生存特征的起始特征事件。

生存时间(survival time):两个有联系的起始事件和终点事件之间的时间。

为了得到准确的生存时间,必须明确规定起点事件和终点事件。

需要注意,虽然名词是“生存时间”,但事实上不一定是说生存,只要符合上面定义的任何时间段都可以叫生存时间。

生存时间需要恰当的测度单位(小时、日、月、年等),一般测度时间越小,准确性越高。

删失(censoring):也叫终检,是指没有观察到终点事件,无法得知确切生存时间。

包含删失数据称为不完全数据(incomplete data)。

右删失(right censoring):从时间轴上看,终点事件发生在最后一次随访时间的右方,真实生存时间只能大于这个时间。

产生右删失原因:1 随访对象失访2 随访结束仍未出现终点事件3 治疗措施改变生存率估计与生存曲线常用的两种方法:乘积限法(product-limit method),用于小样本未分组资料。

寿命表法(life table method),用于大样本分组资料。

乘积限法:也叫Kaplan-Meier法或K-M法,主要用于小样本,也可用于大样本。

生存分析

生存分析
随访资料的生存分析
内容
一、生存分析的基本概念 二、生存率的Kaplan-Meier 法 三、生存率的Life Table 法
四、Cox 比例风险模型简介
例1
一、生存分析的基本概念 例1 某医师收集了1998年1月到2003年2月5年间用甲、 乙两种手术方法治疗肾上腺肿瘤病人的资料,以了解患者 术后结局及其可能的影响因素。术后记录的内容如下表:

生存分析(survival analysis)
(1) 就是将事件的结果和出现这一结果所 经历的时间结合起来分析的一种统计分析方法, 它不仅可以从事件结局的好坏,如疾病的痊愈 (成功)和死亡(失败),而且可以从事件的 持续时间进行分析比较,如某病经治疗后存活 的时间长短进行分析比较。 (2)能同时分析有结局的完全数据和没有结 局的不完全数据,充分利用了信息。 因而能够更为全面地反映某种治疗的效果。
---------------------------------------------------------------------------------生存 手术 手术 随访终止 时间 病历号 性别 年龄 方法 时间 时间 结局 组织类型 (月) --------------------------------------------------------------------------------------------------217328 男 54 甲 98.02.14 99.01.01 失访 高分化 10+ 225468 女 61 甲 00.08.27 03.02.28 存活 低分化 30+ 227347 男 75 乙 02.04.11 02.08.20 死亡 高分化 4 232435 男 45 乙 99.11.07 02.02.02 死亡 高分化 26 224562 女 52 乙 03.01.25 03.02.28 存活 低分化 1+ . . . ----------------------------------------------------------------------------------------------------

随访资料的生存分析

随访资料的生存分析

生存率是相对于时间t的函数,称为生存函数,记为S(t)。
• 生存函数在某时点的值就是生存率。例如,S(5)=0.1832,习
惯上说5年生存率为18.32%。
生存函数或生存率的计算
①若前t个时段没有删失:
t时段结束时仍存活的人 数 S ( t ) P( T t ) 研究期初观察总人数
例如:
截尾数据(截尾值、删失数据,censored data):
尚未观察到研究对象出现反应(终点事件)时,即由于某种原 因停止了随访,这时记录到的时间信息是不完整的,这种生 存时间数据称为不完全数据或截尾值。截尾值能提供部分信 息,即该研究对象实际的生存时间只会长于观察到的时间。
生存分析中的基本概念
截尾值出现的原因有以下三种: ① 失访:观察期内由于研究对象搬迁、不 配合等原因造成失访; ② 退出:观察期内研究对象意外死亡、死 于其它疾病或改变治疗方案等而中途退 出研究; ③ 终止:观察期结束时仍未出现结局。
若该时段内有删失,则分母用校正人口数: 校正人口数=期初观察人数-删失数/2
生存分析中的基本概念
(三)生存概率、生存率、生存函数
2. 生存率和生存函数:
• 生存率(survival rate) :指研究对象经历t个时段后仍存活的概
率,即生存时间大于等于t的概率,用P(T≥t)表示。
• 生存函数(survival function):生存率随时间t的变化而变化,即
生存分析中的基本概念
(一) 生存时间(survival time):
3、生存时间资料的整理:
对于随访资料,需要记录的原始数据包括开始观察的时点
(起始事件发生的时间)、终止观察的时点、研究对象的结
局、可能的影响因素。生存时间为一反映时间长短的指标,

统计学考题(按章节) 第6题【05分】__随访资料的生存分析

统计学考题(按章节) 第6题【05分】__随访资料的生存分析

五、其它30分(3~5道题目,每题6~10分)随访资料的生存分析:【06真题】九、某医生从 2002年 1月 1日起对某医院收治的 6名急性心肌梗塞病人进行跟踪观察,2002年 3月 25日结束观察,共 12周。

记录的资料如下:(5分)1、上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?2、判断上述随访时间哪些属截尾值?写出观察对象编号。

【05真题、04真题、03真题】四、16例某癌症病人在不同时期经随机化分配到A、B两治疗组,并继续进行随访至1974年5月 31日结束。

资料如下表:(8分)16例某种癌症病人随访资料病人号治疗组分组日期终止日期是否该病死亡截尾值1 A 68.05.12 68.05.30 Y2 B 70.10.18 71.04.16 Y3 B 69.02.12 70.11.06 Y4 A 72.01.30 74.05.31 仍存活5 A 73.11.11 74.01.02 Y6 B 68.03.12 73.03.30 车祸死亡7 A 69.01.06 69.01.04 Y8 A 69.02.08 70.02.08 迁出9 B 71.05.02 71.11.13 Y10 B 68.03.08 68.05.23 Y11 B 73.12.12 74.02.20 Y12 A 74.05.01 74.05.09 Y13 B 72.07.02 72.07.15 Y14 B 68.12.18 74.04.31 失访15 A 69.01.01 74.05.31 仍存活16 B 73.09.02 73.09.20 Y1.上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?2.判断上述随访时间哪些属截尾值,写出观察对象编号。

3.要比较A、B疗法对该种癌症病人的疗效,宜选用何种统计检验方法?4.A、B治疗组随访资料生存时间的特征量(代表值)一般用何指标表示?【答案】jszb0、本资料中,第7号观察对象数据,终止日期竟然早于分组日期,是典型的错误数据,应该排除。

培训_随访资料的生存分析

培训_随访资料的生存分析
Kaplan-Meier法估计生存率 log-rank检验进行组间生存率比较
2.结果 估计:Kaplan-Meier生存率及生存
曲线。
比较:log-rank检验卡方值及其P值。 因素分析及预测:
变量赋值(数量化方法)表 变量统计描述:
各组病例数和构成比(分类变量) 均数和标准差(数值变量)
列出序号 整理数据
(3) 求年初人数
(4) 求校正年初人数

(5)
计算死亡概率:q =
d/nc (6) 计算生存概率: p =1-q
(7)
计算生存率及其标准
误:利用正态近似法估计总体生
存率的可信区间
3、k年生存率与半数生存期估计
期内 删失 人数
三、对数秩检验(log-rank test) ——非参数检验
检查可能的交互作用项是否显著 (方法:一次引入一个交互作用项, 看其对应的回归系数是否为0)。
模型拟合优度考察:据预后指数PI 分组,比较各组基于Cox模型的生 存 曲 线 与 基 于 kaplan-Meier 法 估 计 的生存曲线,如两组曲线吻合较好, 表明Cox模型拟合较好。
生存率分析:生存曲线不能随意延 长,也不能轻易用于预测预报,经
强调设计的重要性
专业知识角度:选择疾病种类、终 点事件、影响因素及结果的专业解 释等。
统计学角度:样本例数、因素的赋 值、生存时间准确到天数、因素筛 选方法、结果的统计学解释等。
小结(论文报告中应写明)
1.材料与方法 病例来源、起始事件、终点事件、
观察终止时间、截尾情况、随访结 果的获得方法,样本含量、截尾例 数及百分比(%)。 建立数据库方法 统计学处理方法

医学随访资料的生存分析

医学随访资料的生存分析

生存分析的应用
估计生存率、生存曲线和中位生存时间 生存率的比较 影响生存率的因素 对不同因素水平的个体进行预测
第一节 概念
生存时间survival time, failure time 完全数据complete data 截尾数据censored data “+” 条件生存概率conditional probability of survival 生存率survival rate 生存曲线survival curve 中位生存期median survival time
数。 4、按公式计算各个生存时间上的理论死亡数。 5、计算两组或多组合计的实际死亡数和理论
死亡数。 6、计算统计量。
趋势检验
Trend test 多组生存率比较时,若分组变量是等级变量 或连续变量等级化分组,经对数秩检验有统计学意义时, 可作趋势检验,分析生存率是否随分组等级存在升高或降 低的趋势。 基本思想:编秩计算统计量x2值。
结束语
渴望梦想的光芒,不要轻易说失望
Write in the end, send a sentence to you, eager to dream of light, don't easily say disappointed
为更好满足学习和使用需求,课件在下载后 可以自由编辑,请根据实际情况进行调整
2 0.5000
生存率
Sˆtk

0.8571 0.7857 0.6429 0.5714 0.4571 0.2286 0.1143
标准误 ⑻
0.0935 0.1097 0.1281 0.1323 0.1471 0.1359 0.1056
对数秩检验
Log-rand test 用于两组或多组生存率比较的非参数检验

统计学教案习题17随访资料的生存分析

统计学教案习题17随访资料的生存分析

第十七章 随访资料的生存分析一、教学大纲要求(一)掌握内容 1.生存分析基本概念生存时间、完全数据、截尾数据、死亡率、死亡概率、生存概率、生存率。

2.估计生存率的方法:Kaplan-Meier 法、寿命表法。

(二)熟悉内容1.生存曲线、半数生存期。

2.生存资料的基本要求。

3.两生存曲线的比较的对数秩检验。

(三)了解内容 Cox 回归模型。

二、教学内容精要(一)生存分析中的基本概念1.生存时间(survial time )指观察到的存活时间,如表11-1中t 分别为360,990,1400,1800天。

生存时间有两种类型:(1)完全数据(complete data )指从起点至死亡所经历的时间,即死者的存活时间,如表11-1中360,990,1800天。

(2)截尾数据(censored data )由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。

从起点至截尾所经历的时间,称为截尾数据,如表11-1中1400天,习惯上记为1400+天。

表11-1 4例鼻咽癌随访记录患者序号性别 (男=1)处理组号开始日期 终止日期 结局 (死=1)存活天数 10 1 11/29/80 11/04/85 1 360 2 1 1 06/13/82 06/08/83 1 990 3 1 0 03/02/83 12/31/86 0 1400+ 4 008/04/8304/10/86118002.死亡概率与生存概率(1)死亡概率(mortality probability )指死于某时段内的可能性大小,记为q 。

年死亡概率的计算公式为q =某年年初观察例数某年内死亡数,若年内有截尾,则分母用校正人口数(校正人口数=年初人口数-21截尾例数)。

这里的死亡概率与通常所说的死亡率是有区别的,死亡率的分母常用年平均人口,反映过去一年的死亡频率(年平均水平),而死亡概率则用年初人口,表示往后的一年中死亡机会大小。

第十七章:生存分析

第十七章:生存分析

五、生存概率与死亡概率
活过该年人数 P 某年年初人口数
该年内死亡人数 q 某年年初人口数
该年内死亡人数 m 某年平均人口数
六、风险函数(Hazard Function)
• 用h(t)表示,其定义为: • h(t)=lim(在时间t生存的病人死于区间(t,△t) 的概率/△t) • 由于计算h(t)时,用到了生存到时间t,这一条 件,故上式极限式中分子部分是一个条件概率。可 将h(t)称为生存到时间t的病人在时间t的瞬时死亡 率或条件死亡速率或年龄别死亡速率。当用t作横 坐标,h(t)为纵坐标所绘的曲线,如递增,则表示条 件死亡速率随时间而增加,如平行于横轴,则表示没 有随时间而加速(spss演示)
• 这些都可作为生存时间用作生存分析。
随访资料的记录--截尾的概念
包括: (1)开始观察日期,终止观察日期---生存时间 (2)结局(最终观察到的是死亡还是存活) 死于该病---完全数据 存活或死于其他原因---截尾数据 每个生存期数据要用2个变量表示:观察到的生 存时间和是否截尾(如:用0表示截尾,用0表 示死亡;4+ 用4,0表示;4用4,1表示)。 (3)协变量---各种影响生存期长短的因素。
风险函数的不同情况:
常数,
下降,
如:死于飞机失事。
如:急性损伤。
上升,
如:持续接触危险因素。
澡盆样,如:人的一生。
生存分析目的: (1)估计生存函数。 (2)比较各组的生存函数。
(3)研究影响生存期长短的因素。
第பைடு நூலகம்节

生存分析的统计方法
生存率S(t)的估计方法有参数法和非参数 法。常用非参数法,非参数法主要有二个,即, 乘积极限法与寿命表法,前者主要用于观察例 数较少而未分组的生存资料,后者适用于观察 例数较多而分组的资料,不同的分组寿命表法 的计算结果亦会不同,当分组资料中每一个分 组区间中最多只有 1个观察值时,寿命表法的 计算结果与乘积极限法完全相同。

随访资料的生存分析

随访资料的生存分析

第十五章生存分析第一节生存资料的特点前面有关章节介绍了多种定量资料和定性资料的统计分析方法。

下面是一个临床实例,请思考该资料的特点,应选用何种统计方法进行统计分析较为合适。

某医生将22例肺癌患者随机分为两组,分别采用化疗和放化疗联合治疗,从缓解出院日开始随访,随访时间(月)如下(带“+”号的数据表示患者至少存活了多少个月)。

试比较化疗和放化疗联合治疗肺癌的疗效是否有差别。

化疗组1,2,3,5,6,9+,11,13,16,26,37+放化疗联合组10,11+,14,18,22,22,26,32,38,40+,42+该医生的研究目的是评价化疗和放化疗联合治疗两种临床治疗措施的疗效。

临床治疗措施的疗效评价,一方面要看治疗措施所引起的“结局”(该资料中,即为“生存”或“死亡”),另一方面还要看得到这种结局所经历的时间长短(该资料中,即为患者接受化疗或放化疗联合治疗后存活多长时间,或患者接受化疗或放化疗联合治疗后多长时间发生死亡)。

显然,结局为“生存”且存活时间越长,其疗效就越好。

反之,结局为“死亡”且存活时间越短,其疗效就越差。

结局虽然都是“死亡”,但能够使患者生存时间越长的临床治疗措施的疗效就越好。

从前面几个章节所学习的内容来看,可以考虑的方法有t检验、方差分析或秩和检验。

但t检验和方差分析都要求所比较的两个样本来自正态分布总体,而该资料两个组中均有带“+”号的数据,其提供的信息不完整,如“9+”表示该患者至少存活了9个月,但准确死亡时间不清楚,这就导致两个样本的总体分布不明确,不满足t检验和方差分析的应用条件。

退一步说,即使该资料满足t检验和方差分析的应用条件,但由于这两种方法均只是比较患者接受化疗和放化疗联合治疗后的生存时间有无差别,并未分析两种治疗措施的结局有无差别,因而达不到综合评价这两种治疗措施疗效的目的。

因此,不宜采用t检验或方差分析。

秩和检验虽不对样本所来自的总体作严格限定,但它也只能比较患者接受两种治疗措施后的生存时间有无差别,并不能分析两种治疗措施的结局有无差别,因而也达不到综合评价这两种治疗措施疗效的目的。

医学统计学:生存分析(sun)

医学统计学:生存分析(sun)

临床试验及其随访资料的特点是:一部分研究 对象可观察到死亡,从而得到准确的生存时间, 所提供的信息是完全的,称为完全数据;但往 往另有一部分病人,或中途失访,或到观察结 束时仍存活,对这部分病人无法知道准确的生 存时间,只知道其生存时间比观察到的时间要 长,它提供不完全的信息,称为不完全数据 (截尾数据)。
生存分析法不仅能分析完全数据的资料,同时 也可以分析包含不完全数据的资料。
生存分析是将事件发生的结果和随访时间两个 因素结合在一起进行分析的一种统计分析方法, 它能充分利用所得到的研究信息,更加准确地 评价和比较随访资料。
第一节 生存分析中的基本概念
一、基本概念
(一)生存时间(survival time) 任何两个有联系事件之间的时间间隔。狭义的生存时间是指患有某中疾 病的人从发病到死亡所经历的时间跨度。广义上为从某中起始事件到终 点事件所经历的时间跨度,可用小时、天、周、月、年等时间单位记录, 常用符号t表示。
2.相对危险度 假定第i个变量的取值 为0和1,其对应的回归系数为bi,且具有 统计学意义.该因素取值l与取值为0相比 其对应的相对危险度的估计为
RR的1-α可信区间为
3.个体预后指数
从Cox模型可以看出,病人的风险率与该 病人具有的危险因素及各因素对应的回 归系数有关。对各变量进行标准转换后 进行模型配合,可得到各因素对应的标 准回归系数,此时定义个体预后指数 (personal prognosis index)为
Cox模型的注意事项
①注意研究资料的代表性及可靠性,保证研究对象是 总体中的一个随机样本;协变量在研究对象中的分布 要适中,否则会给参数的估计带来困难;应将一切可 能因素都包括在调查分析之中,否则容易造成分析结 果的偏差;②对研究生存时间要有明确的规定,如果 以“发病”作为观察的起点,则要对“发病”有一个 明确的规定,对终止事件也要有一个明确的规定,如 果将“治愈”作为结局的终止事件,则要对“治愈” 有一个明确的规定;③如果研究的变量随时间而发生 变化,可以采用伴时协变量的Cox模型进行分析。④ Cox模型分析时,样本含量不宜过小,一般在40例以上。 随着协变量的增加其样本含量应适当的增加,要求样 本含量为观察协变量的5~20倍。要尽量避免观察对象 的失访,过多的失访容易造成研究结果的偏倚。

医学统计学考题(按章节)第6题【05分】__随访资料的生存分析

医学统计学考题(按章节)第6题【05分】__随访资料的生存分析

医学统计学考题(按章节)第6题【05分】__随访资料的⽣存分析五、其它30分(3~5道题⽬,每题6~10分)随访资料的⽣存分析:【06真题】九、某医⽣从 2002年 1⽉ 1⽇起对某医院收治的 6名急性⼼肌梗塞病⼈进⾏跟踪观察,2002年 3⽉ 25⽇结束观察,共 12周。

记录的资料如下:(5分)1、上述资料随访时间单位以(⽇)、(⽉)、(年)哪个较合适?为什么?2、判断上述随访时间哪些属截尾值?写出观察对象编号。

【05真题、04真题、03真题】四、16例某癌症病⼈在不同时期经随机化分配到A、B两治疗组,并继续进⾏随访⾄1974年5⽉ 31⽇结束。

资料如下表:(8分) 16例某种癌症病⼈随访资料病⼈号治疗组分组⽇期终⽌⽇期是否该病死亡截尾值1 A 68.05.12 68.05.30 Y2 B 70.10.18 71.04.16 Y3 B 69.02.12 70.11.06 Y4 A 72.01.30 74.05.31 仍存活5 A 73.11.11 74.01.02 Y6 B 68.03.12 73.03.30 车祸死亡7 A 69.01.06 69.01.04 Y8 A 69.02.08 70.02.08 迁出9 B 71.05.02 71.11.13 Y10 B 68.03.08 68.05.23 Y11 B 73.12.12 74.02.20 Y12 A 74.05.01 74.05.09 Y13 B 72.07.02 72.07.15 Y14 B 68.12.18 74.04.31 失访15 A 69.01.01 74.05.31 仍存活16 B 73.09.02 73.09.20 Y1.上述资料随访时间单位以(⽇)、(⽉)、(年)哪个较合适?为什么?2.判断上述随访时间哪些属截尾值,写出观察对象编号。

3.要⽐较A、B疗法对该种癌症病⼈的疗效,宜选⽤何种统计检验⽅法?4.A、B治疗组随访资料⽣存时间的特征量(代表值)⼀般⽤何指标表⽰?【答案】jszb0、本资料中,第7号观察对象数据,终⽌⽇期竟然早于分组⽇期,是典型的错误数据,应该排除。

生存分析(第17章)

生存分析(第17章)
又称生存函数。
生存时间 t时 刻 的 观 察 单 位 数 S(t,X) 总观察例数
生存概率针对单位时间;生存率针对某个 较长时间段,它是生存概率的累积结果。 如5年生存率是每一年不同生存概率乘积。
S(5, X) p1 p2 p5
7.风险函数 (hazard function,h(t,X)) 生存时间已达到 t 的一群观测对象在 t 时 刻的瞬时死亡率。
j i
(9)生存率的标准误:
S E S ( t i,X )

p N
j i j
qj
j
2.生存率曲线
1 0.8
© ¨%£ Ê £ æ Â ú ´ É
0.6 0.4 0.2 0 0 5 ú ´ É æ Ê ±¼ ä £ ¨Ä ê £ © 10 15
Ð Ð Ä Ô Ð Ä ½ Ê Í ´ ² ¡ È Ë µ Ä É ú ´ æ Ç ú Ï ß
生存过程 的比较
生存过程 Cox 比例风险模型 的影响因素分析 非比例风险模型 logistic 回归模型
指数回归模型 Weibull 回归模型
第二节 生存率的估计与生存曲线
(生存过程的描述)
一、小样本资料
1.生存率的计算
2.生存率标准误的计算
3.生存曲线
4.中位生存时间
1.生存率的计算 乘积极限法 (product-limited method) 由Kaplan-Meier于1958年提出,又称为 Kaplan-Meier法 利用概率乘法原理计算生存率
例 有人研究了甲种手术方法治疗肾上腺肿瘤 病人23例的生存情况,定义从手术后到病人 死亡的时间为生存时间,得到生存时间(月) 如下(+为截尾数据),试计算其生存率与 标准误。 1,3,5,5,5,6,6,6,7,8,10,10, 14+,17,19 + ,20 + ,22 + ,26 + ,31 + , 34,34 + ,44,59。

统计学教案习题17随访资料的生存分析

统计学教案习题17随访资料的生存分析

统计学教案习题17随访资料的生存分析 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN第十七章随访资料的生存分析一、教学大纲要求(一)掌握内容1.生存分析基本概念生存时间、完全数据、截尾数据、死亡率、死亡概率、生存概率、生存率。

2.估计生存率的方法:Kaplan-Meier法、寿命表法。

(二)熟悉内容1.生存曲线、半数生存期。

2.生存资料的基本要求。

3.两生存曲线的比较的对数秩检验。

(三)了解内容Cox回归模型。

二、教学内容精要(一)生存分析中的基本概念1.生存时间(survial time)指观察到的存活时间,如表11-1中t分别为360,990,1400,1800天。

生存时间有两种类型:(1)完全数据(complete data)指从起点至死亡所经历的时间,即死者的存活时间,如表11-1中360,990,1800天。

(2)截尾数据(censored data)由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。

从起点至截尾所经历的时间,称为截尾数据,如表11-1中1400天,习惯上记为1400+天。

患者序号(男=1)处理组号开始日期终止日期(死=1)存活天数1 0 1 11/29/80 11/04/85 1 3602 1 1 06/13/82 06/08/83 1 9903 1 0 03/02/83 12/31/86 0 1400+4 0 0 08/04/83 04/10/86 1 1800 2.死亡概率与生存概率(1)死亡概率(mortality probability )指死于某时段内的可能性大小,记为q 。

年死亡概率的计算公式为q =某年年初观察例数某年内死亡数,若年内有截尾,则分母用校正人口数(校正人口数=年初人口数-21截尾例数)。

这里的死亡概率与通常所说的死亡率是有区别的,死亡率的分母常用年平均人口,反映过去一年的死亡频率(年平均水平),而死亡概率则用年初人口,表示往后的一年中死亡机会大小。

17 第17章(全C)生存分析20110910

17 第17章(全C)生存分析20110910

G ( X t )的95 %可信区间为 G ( X t ) 1.96 S G ( X t ) exp exp[ G ( X t ) 1 96 S G ( X t ) ] 。 (17 8) (17 9) 对公式(17 8)取反对数, 得到总体生存率可信区间
第17章 生存分析 第20页
第17章 生存分析 第2页
章目录
END
研究生用《医学统计学》
孙振球 主编 人民卫生出版社 2005年8月第2版
第17章 生存分析 第3页
章目录
END
第十七章 生存分析
目录
第一节 生存分析中的基本概念 第二节 生存率的估计与生存曲线
第三节 生存分析的log-rank检验
第四节 Cox 比例风险回归模型概念
第17章 生存分析 第17页
章目录
END
2.生存率标准误计算
有两个公式 S P ( X t ) d P( X t ) n( n d ) 1 P( X t ) nd (17 3) (17 4)
S P ( X t ) P ( X t ) 例: S P ( X t )
1 1 1 0.430 0.1041 23 22 22 21 10 9
第17章 生存分析 第18页
章目录ቤተ መጻሕፍቲ ባይዱ
END
计算总体率可信区间:公式及例题
计算总体率1 可信区间 P(X t) u /2 S P ( X t ) (17 5) 生存率为P( X 17 ) 0.430, 可信区间为 0.430 1.96 0.1041 (0.226 , 0.634 )
第五节 寿命表
作业及思考题
第17章 生存分析 第4页

生存分析(第17章)

生存分析(第17章)
➢3 年生存率 S(3) = (N – d)/N =(50 – 30) / 50 = 0.4000 S(3) = p1× p2 × p3 = 0.8000 × 0.7500 × 0.6667=0.4000
17
6.风险函数 (hazard function,h(t, X )) 生存时间已达到 t 的一群具有协变量X的 观测对象在 t 时刻的瞬时死亡率。
死亡
死亡时间
生存但中途失访 最后一次访问时间
死于其他疾病 死于该病时间
生存但随访结束 研究结束时间
3.记录影响生存时间的有关因素
19
(二)随访方式
×

×

0 始点
○ ○
× ×
×
死亡

失访 治疗措施改变 死于其他疾病

t 时间 终点
20
×

×

0 始点
○ ○
× ×

×
死亡

失访 治疗措施改变 死于其他疾病
患者 性 年 确诊到 手术开 终止随
生存
编号 别 龄 手术时 … 始时间 访时间 结局
时间
(岁) 间(月)
(月)
1 男 32 10 … 94.01.23 94.12.24 死亡
11
2 女 48 12 … 98.02.14 99.01.01 失访
10+
3 女 26 6 … 92.03.04 95.04.12 死亡
天数不同。 甲、乙两药物治疗某病治愈率均为90%, 甲药治疗的患者平均12天出院, 乙药治疗的患者平均7天出院。
4
随访观测评价临床疗效存在三个问题 2.一部分研究对象可观测到死亡,得到准确生

随访资料生存分析 医学统计学课件

随访资料生存分析 医学统计学课件
2.截尾数据(censored data):亦称截尾值 (censored value)或终检值。指从观察起点到发 生非“死亡”事件所经历的时间。
截尾原因大致有三种情况:
1. 失访:未继续就诊、拒绝访问或搬迁而失去联系。 2. 死于与研究疾病无关的原因:由于其他原因死亡。 3. 研究终止:研究结束时终点事件尚未发生。
survivalanalysis无论观察性研究无论观察性研究还是实验还是实验试验试验性研究性研究有时需对研究有时需对研究对象进行追踪观察对象进行追踪观察不仅了解某事件发生的不仅了解某事件发生的结局结局同时同时还了解发生这种结局所经历的还了解发生这种结局所经历的时间时间
随访资料生存分析
Survival Analysis
生存分析的意义与应用
无论观察性研究,还是实验(试验)性研究,有时需对研究 对象进行追踪观察,不仅了解某事件发生的结局,同时 还了解发生这种结局所经历的时间。
例如临床治疗措施效果评价:白血病化疗缓解持续时间 和缓解率、乳腺癌术后生存时间和生存率、肾移植术后 生存时间和生存率等。
上述生存资料若按通常的方法进行分 析,有两方面的问题:
肿瘤 <3.0cm
14 19 26
28
29
32
36
40
42 44+ 45 53 + 54 59 +
肿瘤 ≥3.0cm
6
7
9
10 11 12 13 20 23 25 27
30 34 37 43 50
生存时间 t
14 19 26 28 29 32 36 40 42 44 45 53 54 59
死亡数 dt
估计方法:图解法 线性内插法
生存分析主要内容:

统计学:生存分析

统计学:生存分析

4.死亡概率、生存概率
(1)死亡概率 q (mortality probability): 指死于某时段内的可能性大小。它是一个随时间上升的函数q(t),当时间 趋于无穷大时,死亡概率等于1。年死亡概率公式为
某年内死亡数 ,若有截尾,则分母用 校正人口数, 某年年初人口数 校正人口数 年初人口数 1 2 截尾例数 q
(3)生存曲线(survival curve)
以t 为横坐标轴,S(t)为纵坐标轴,将各时点的生存率连接在一起的曲线。
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1 2 3 ú ´ É æ Ç ú Ï ß
6.半数生存期 (median survival time)
指只有50%的个体存活的时间(寿命的中位数)。
一、 生存分析的基本概念
1.随访资料的记录
某医师收集1992年1月1日到2001年12月31日10年间共346例大肠癌患者术后的资料, 研究因素有:性别、年龄(岁)、从确诊到进行手术的时间dtime(月),资料如下:
表20-1 编号 1 2 3 4 5 … 性别 男 女 女 男 女 … 年龄 32 48 26 55 58 … dtime 10 12 6 3 8 … 346例大肠癌患者手术后的生存时间记录 手术时间 1994.01.23 1998.02.14 1992.03.04 1999.08.20 2001.03.10 … 终止随访时间 1994.12.24 1999.01.01 1995.04.12 2001.09.21 2001.12.31 … 结局 死亡 失访 死亡 死于其他 存活 … 生存时间 11 10+ 37 25+ 9+ …
死亡概率不同于死亡率,区别在于分母不同,死亡率的分母为年中平均人口数, 而死亡概率的分母是年初人口数。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第十七章 随访资料的生存分析一、教学大纲要求(一)掌握内容 1.生存分析基本概念生存时间、完全数据、截尾数据、死亡率、死亡概率、生存概率、生存率。

2.估计生存率的方法:Kaplan-Meier 法、寿命表法。

(二)熟悉内容1.生存曲线、半数生存期。

2.生存资料的基本要求。

3.两生存曲线的比较的对数秩检验。

(三)了解内容 Cox 回归模型。

二、教学内容精要(一)生存分析中的基本概念1.生存时间(survial time )指观察到的存活时间,如表11-1中t 分别为360,990,1400,1800天。

生存时间有两种类型:(1)完全数据(complete data )指从起点至死亡所经历的时间,即死者的存活时间,如表11-1中360,990,1800天。

(2)截尾数据(censored data )由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。

从起点至截尾所经历的时间,称为截尾数据,如表11-1中1400天,习惯上记为1400+天。

表11-1 4例鼻咽癌随访记录患者序号(男=1)处理组号开始日期 终止日期 (死=1)存活天数10 1 11/29/80 11/04/85 1 360 2 1 1 06/13/82 06/08/83 1 990 3 10 03/02/83 12/31/86 01400+4 008/04/8304/10/86118002.死亡概率与生存概率(1)死亡概率(mortality probability )指死于某时段内的可能性大小,记为q 。

年死亡概率的计算公式为q =某年年初观察例数某年内死亡数,若年内有截尾,则分母用校正人口数(校正人口数=年初人口数-21截尾例数)。

这里的死亡概率与通常所说的死亡率是有区别的,死亡率的分母常用年平均人口,反映过去一年的死亡频率(年平均水平),而死亡概率则用年初人口,表示往后的一年中死亡机会大小。

(2)生存概率(survival probability )与死亡概率相对应,记为p ,表示在某单位时段开始时存活的个体到该时段结束时仍存活的机会大小。

年生存概率的计算公式为=-=q p 1某年年初人口数某年活满一年人数,若年内有截尾,也要用校正人口数。

(二)生存率的Kaplan-Meier 法与寿命表法估计 1.生存率(1)生存率(survival rate ) 指病人经历k t 个单位时间后仍存活的概率,记为)(k t S 。

若无截尾数据,则)(k t S ==≥)(k t T P 观察总例数时刻仍存活的例数k t (11-1)其中T 为病人的存活时间。

如果含有截尾数据,分母就必须分时段校正,故此式一般不能直接应用。

(2) 生存率估计的概率乘法原理假定病人在各个时段生存的事件独立,生存概率为k p p p ,,,21 ,则应用概率乘法得生存率估计的应用公式为)(k t S =k k p p p t T P 21)(=≥ (11-2) 若式中k p p p ,,,21 用校正人数估计,便可处理截尾数据。

生存概率与生存率在意义上差别很大,前者是单个时段的概率,后者是从0至k t 多个时段的累积结果。

(3) 生存曲线(survival curve) 指将各个时点的生存率连接在一起的曲线图。

(4) 半数生存期(median survival time ) 表示恰好有50%的个体可活这么长时间。

2.生存率的估计方法(1)乘积极限法(product-limit method ) 直接用概率乘法原理估计生存率(不分组),由Kaplan-Meier 于1958年提出,因而又称Kaplan-Meier 法。

这是一种非参数法,主要用于小样本,也适用于大样本。

其生存曲线是左连续的阶梯形曲线。

(2)寿命表法(life-table method ) 当样本例数足够多时,乘积极限法可按时间分组计算,这就是寿命表法,实际上是乘积极限法的一种近似。

其生存曲线呈折线形。

(三)两样本生存曲线的比较——对数秩检验对数秩检验(log-rank test )用于两样本生存曲线的比较,其零假设为两总体生存曲线相同,基本思想是如果零假设成立,根据不同日期两种处理的期初人数和死亡人数,计算各种处理在各个时期的理论死亡数。

若零假设成立,则实际死亡数与理论死亡数不会相差太大,否则应认为零假设不可能成立,两条生存率曲线差异有统计学意义。

对数秩检验统计量(近似法)为:∑=-=mk k k k T T A 122)(χ ,1-=m υ (11-3)其中k A 和k T 分别是第k 组死亡的实际数和理论期望数。

在0H 成立的条件下,统计量2χ服从自由度为1-m 的2χ分布,m 为组数,据2χ作出是否拒绝0H 的决定。

(四)Cox 回归模型Cox 回归是生存分析中最重要的方法之一,其优点是适用范围很广和便于做多因素分析。

Cox 回归假定病人的风险函数为)ex p()()(22110p p X b X b X b t h t h +++= (11-4) 其中)(t h 为风险函数,又称风险率或瞬间死亡率,)(0t h 为基准风险函数,是与时间有关的任意函数,b X ,分别是观察变量及其回归系数。

英国统计学家Cox D R 提出了参数i b 的估计和检验方法,故称为Cox 回归。

三、典型试题分析(一)单项选择题1.生存分析的效应变量是 ( )。

A .正态的和方差齐性的B .生存时间和结局变量C .生存时间D .结局变量答案:B[评析] 本题考点:生存分析的概念生存分析是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,所以它的应变量有两个,即生存时间和结局。

2.随访资料做生存分析的条件为( )。

A .有一定的例数B .有一定的死亡数C .死亡比例不能过小D .自变量取值不随时间变化 答案:B[评析] 本题考点:生存资料的基本要求生存资料的基本要求为:①样本由随机抽样方法获得,并有足够数量;②死亡例数不能太少(≧30);③截尾比例不能太大;④生存时间尽可能精确到天数;⑤缺项要尽量补齐。

所以最佳答案应选B 。

3.Cox 回归风险率( )。

A .等于一个常数B .服从某种分布规律C .等于基准函数乘上一个比例因子D .适用于任意肿瘤资料 答案:C[评析] 本题考点:Cox 回归模型的特点及应用 首先,用于Cox 回归模型分析的资料必须满足生存资料的基本要求,因此任意肿瘤资料不一定满足此要求,排除D 。

Cox 回归风险函数中因)(0t h 未定义,所以不知道风险在病人与病人之间的差别和风险随时间变化的具体分布,排除A ,B 。

所以正确答案为C ,从风险回归函数的定义式也可看出。

4.采用log-rank 检验分析肺癌发病资料,其中吸烟、慢性支气管炎2个因素都有统计学意义,由此可认为( ):A .吸烟与肺癌有因果联系B .慢性支气管炎与肺癌有因果联系C .2个因素与肺癌有因果联系D .以上都不对 答案:D[评析] 本题考点:模型中的变量如何选择取舍选入模型的变量是统计学上的有关变量,不一定都与肺癌有因果关系,其中某些可能只有伴随关系而已;未选入模型的变量不一定全是无关变量,要考虑是否模型内的某些变量代替了它的作用,或因例数不够,或实验中对该因素进行了控制而引起的。

所以正确答案选D 。

5.根据表11-1中的存活时间,试用Kaplan-Meier 法估计生存曲线。

[评析] 本题是考察对乘积极限法的应用情况,此法应用普遍,应熟练掌握。

具体解法见表11-2。

表11-2 乘积极限法估计生存率计算表2 9903 1 132 (43)(2)=参照表11-2,计算步骤为:1. 列出序号:k =1,2,...(第1列); 2. 死亡时间排队:将存活时间t (完全数据)从小到大顺序排列,重复数据只列一次, 截尾数据(如1400)+不列入(第2列);3. 求出t 时刻期初例数n :即存活时间大于或等于t 的例数(含死者)(第3列); 4. 列出t 时刻的死亡数d :即死亡时间为t 的例数(第4列); 5. 求出t 时刻的死亡概率:(第5列); 6. 求出t 时刻的生存概率:(第6列); 7. 分别计算生存率及其标准误;(第7、8列); 8. 绘制生存曲线。

四、习题(一)名词解释1.生存分析2.生存时间3.完全数据4.截尾数据5.死亡率6.死亡概率7.生存概率8.生存率(二)单项选择题1.Cox回归的自变量( )。

A.必须服从正态分布和方差齐性 B.必须是计量资料C.可以是计量资料或分类资料 D.无任何条件2.生存分析中的生存时间为( )。

A.出院至失访的时间 B.手术至失访的时间C.观察开始至终止的时间 D.观察开始至失访的时间3.关于膀胱癌化疗的随访资料做生存分析,可当作截尾值处理的是( ):A.死于膀胱癌 B.死于意外死亡C.死于其它肿瘤 D.b,c都是(三)简答题1.在肿瘤预后分析中,死于非肿瘤患者的数据怎样处理2.生存分析可用于发病资料的分析吗请举例说明。

3.生存时间能计算平均数、标准差吗4.Cox回归可估计参数,故属于参数方法(四)计算题1.表11-3第2-4列是296例肝癌患者的生存数据,试作生存分析并绘图示之。

2.某院用甲、乙两疗法组治疗急性黄疸性肝炎,随访十年得资料如下:甲疗法组 12,25,50+,68,70,79+,83+,91+,114+,114+,乙疗法组 1,1,9,17,21,25,37,38,58,72+,73比较两疗法的生存期(月)有无差别。

五、习题答题要点(一)名词解释1.生存分析:生存分析(survival analysis)是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,它不仅可以从事件结局的好坏,如疾病的治愈(成功)和死亡(失败),而且可以从事件的持续时间,如某病经治疗后存活的时间长短进行分析比较,因而能够更全面、更精确地反映该治疗的效果。

2.生存时间:生存时间(survival time)指观察到的存活时间。

3.完全数据:完全数据(complete data)指从起点至死亡所经历的时间,即死者的存活时间。

4.截尾数据:由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。

从起点至截尾所经历的时间,称为截尾数据(censored data )。

5. 死亡率:某年内死亡例数与年中观察例数之比称为死亡率(mortality rate )。

6. 死亡概率:死亡概率(mortality probability )是指某年内死亡例数与年初观察例数之比,若年内有截尾,分母用校正人口数。

7. 生存率:生存率(survival rate )指病人经历k t 个单位时间后仍存活的概率,即kt 时刻仍存活的例数与观察总例数之比。

相关文档
最新文档