医学统计学-生存分析课件
《医学生存分析》课件
2023《医学生存分析》课件CATALOGUE目录•生存分析的基本概念•生存分析的统计方法•生存分析在医学领域的应用•生存分析的软件实现•生存分析的案例分析•总结与展望01生存分析的基本概念生存分析的定义生存分析是研究生存现象及其影响因素的方法学生存现象是指个体在经历一段时间的暴露于某种因素后,出现某种结局(如死亡)的现象;生存分析即是对这种现象及其影响因素进行研究和分析的方法学。
生存分析的主要对象是生存时间生存时间是指个体从某种研究因素暴露开始,到出现某种结局所经历的时间。
生存分析主要关注的是个体在暴露后,何时出现某种结局,以及这个时间的长短。
预后生存分析、预测生存分析、病因生存分析等。
生存分析的分类根据研究目的描述性生存分析、半参数生存分析、参数化生存分析等。
根据数据类型单变量生存分析、多变量生存分析等。
根据样本量大小1生存分析的应用领域23在医学研究中,生存分析常被用来研究患者的生存时间、肿瘤患者的无瘤生存时间、器官移植患者的无排异生存时间等。
医学研究在工业卫生领域,生存分析常被用来研究职业暴露对工人健康的影响,如暴露于有害物质对工人寿命的影响等。
工业卫生在流行病学中,生存分析常被用来研究某种因素对人群健康的影响,如吸烟对肺癌患者生存时间的影响等。
流行病学02生存分析的统计方法生存分析研究在给定时间点,事件发生与否的概率,以及影响事件发生概率的因素描述性统计用于总结和描述生存数据的集中趋势和离散程度比例风险模型基于Cox回归模型,考虑了生存数据中的比例风险关系生存分析的常见统计方法介绍零假设对数秩检验似然比检验检验生存时间分布是否满足比例风险假设检验比例风险模型是否拟合数据0302 01事件发生与否的概率与时间无关使用Cox回归模型构建生存分析模型建立模型根据专业知识和临床经验选择影响生存时间的因素变量选择使用ROC曲线、校准曲线等方法评估模型的性能和预测能力模型评估03生存分析在医学领域的应用生存分析在肿瘤临床试验中的应用生存分析可以评估肿瘤患者的生存期和死亡风险,帮助临床医生制定更加精确的治疗方案。
《医学生存分析》PPT课件
24.11.2020
h
29
24.11.2020
h
30
可采用SPSS软件中生存分析方法计算出生 存率大小,并画出生存函数图(或生存率 曲线)直接观察。
研究者关心的研究对象的特定结局,当被观察 对象出现终点事件通常记为1,出现截尾记为0。 起点事件是反映研究对象生存过程的起始特征的 事件。
生存时间的起点和终点要有严格、统一的定义, 以便于计算生存时间。
24.11.2020
h
16
3、暴露因素及混杂因素 除了要研究的危险因素(暴露因素)外,还要控
制混杂因素的影响。
必须分清暴露因素和混杂因素。
如:在比较A、B两种治疗方案治疗某恶性疾病 的生存情况的同时,病人的肾功能状况也影响 治疗后的生存情况。这项研究中,暴露因素为 A、B两种治疗方案,混杂因素是肾功能状况。
24.11.2020
h
17
随访资料的特点
1、生存时间的分布呈偏态。 一般为正偏态,因为生存时间一般为单调递减。 102名黑色素瘤患者的生存时间资料,做直方图。
对于例2,若比较两组的存活率,可采用两样本卡 方检验;但只考虑了生存效果评价的其中一个方 面。
而评价生存效果,不仅要看是否出现了某种结局 (如:有效、治愈、死亡等),还要考虑出现这 些结局所经历的时间长短。(举例说明)
24.11.2020
h
6
措施:采用生存分析方法。
生存分析方法特点: (1)能将研究对象的随访结局和生存时间两个因素同时结
24.11.2020
h
14
“生存”和“死亡” 扩展为具有两类互斥结 果的事件,“生存”是某事件某状态的持 续, “死亡”是某终点事件的发生。
《医学生存分析》课件
生存函数是描述对象在给定时间点之前生存的概率的函数。
定义
通常采用生存概率函数、累积生存函数和条件生存函数三种方式。
计算方法
定义
风险函数是指在给定时间点之前生存的概率相对于时间变化的函数。
计算方法
通常采用函数表达式或估计参数的方法进行计算。
风险函数
Cox比例风险模型是一种半参数模型,用于研究多个因素对生存时间的影响。
数据探索性分析
数据描述
对数据进行描述性统计分析,包括均值、中位数、众数、方差等指标,以了解数据的基本特征。
生存模型
01
选择合适的生存模型,如Cox比例风险模型、Weibull模型等进行拟合。
基于生存模型的数据分析
模型评估
02
通过交叉验证、ROC曲线、Hosmer-Lemeshow检验等方法评估模型的性能。
研究背景及目的
数据来源
本课件所使用的数据来源于某三甲医院的一项关于某疾病患者生存时间的研究。
数据预处理
数据预处理包括数据清理、缺失值处理、异常值处理、数据转换等方面,以确保数据质量和分析结果的可靠性。
数据来源及预处理
生存模型
本课件将介绍常用的生存模型,如Cox比例风险模型、Weibull模型和Log-rank检验等。
生存分析可以帮助医生更好地了解患者的病情和预后,从而制定更加个性化的治疗方案。
医学研究中生存分析的优势
生存分析在医学研究中的挑战
生存分析中的数据往往存在缺失和异质性,需要进行特殊处理和调整,否则可能影响分析结果的准确性。
生存分析中的一些参数和模型的选择需要基于经验和专业知识,对于医学研究者的专业知识和经验要求较高。
指导制定治疗方案
通过对患者的生存分析,医生可以了解不同治疗方案下患者的生存情况,从而指导制定更合适的治疗方案。
医学统计学课件:生存分析
5.88 2
19 .6 82
Es ti m ate 11 .0 00
S td. Er ror
4.64 2
95 % C on fi den ce In terva l
Lower Bou n d Upper Bou nd
1.90 1
20 .0 99
a. Es ti m ati on i s l i m ite d to the la rge st survi val ti me i f i t i s cen sored.
生存分析 Survival Analysis
起始
终止
手术疗法和化学疗法治疗乳腺癌的疗效比较
生存分析
根据试验或调查得到的数据 对生物或人的生存时间进行分析和推断, 研究生存时间和结局与众多影响因素间关系 及其程度大小的方法, 也称生存率分析或存活率分析
死亡事件,失效事件,failure event 截尾值,删失值,censored value 生存时间,survival time 生存率,survival rate
生存率曲线 Kaplan - Meier曲线
时间t为横轴, 生存率P(X>t)为纵轴, 水平横线代表一个时点到下一个时点的距离, 表示时间与生存率关系的曲线
生存率曲线,Kaplan—Meier曲 线
总体生存率的置信区间
正态近似原理
p( x t) u sp( xt)
Life Table
.4364 .3273 .2182 .1091
Censored:
生存率标准误 累积死亡数
.0867
1
.1163
2
.1343
3
.1450
4
.1501
[课件]医学统计学--生存分析PPT
1974
1975 1976 1977
29
26 24 32
28
24 21 27
25
19 19 23
23
18 16 21
19
18 14 18
18
18 14 16
17
16 13
17
16
17
1978
1979 1980 1981 合计
25
36 25 46 243
23
31 23 36 213
20
29 19 154
医学统计学--生存分析
生存分析的意义与应用
无论观察性研究,还是实验(试验)性研究,有时需对研究
对象进行追踪观察,不仅了解某事件发生的结局,同时
还了解发生这种结局所经历的时间。
例如临床治疗措施效果评价:白血病化疗缓解持续时间 和缓解率、乳腺癌术后生存时间和生存率、肾移植术后 生存时间和生存率等。
上述生存资料若按通常的方法进行分 析,有两方面的问题:
1.n年生存率有时出现后一年大于前一年的现象。
活 满 n 年 的 人 数 n 年 生 存 率 = 1 0 0 % 观 察 满 n 年 的 人 数
表1 某地1974—1981年胃癌根治术后随访记录 年份 例数 生存年数 1 2 3 4 5 6 7 8
二.生存时间
生存时间(survival time)也是一个广义概念, 泛指所关心的某现象的持续时间,即随访观察 持续的时间,常用符号t表示。
表2
患者 编号
6例乳腺癌患者术后随访记录
观察记录 生存天数 t
开始日期
终止日期
结局 (死=1,生=0)
原因
1
2
医学统计―生存分析课件
t
关系可表示为: S(t) exp h(t)dt (16.9)
0
风险函数与生存函数的关系
17
h1 t 是一种上升的曲线,危险率随时间变化而增加,如
急性白血病患者治疗无效时其危险率随时间呈增加趋势;
h2 t 的曲线为下降趋势,表示危险率逐渐减小,如意
外事故造成的外伤经有效治疗后死亡的危险性逐渐减小;
of survival),即将时刻 t 尚存活看成是前 t 个时段一直
存活的累计结果。如: n年生存率 1p0 1 p11 p2 ......1 pn1 。 14
(四)生存率曲线(survival curve): 是指以时间为横轴、生存率为纵轴,将各个时点的生 存率连接在一起的曲线图。曲线形状分为两种: 1、阶梯形:小样本资料用直接法估计的生存曲线; 2、折线形:大样本资料用频数表法估计的生存曲线。 (五)中位生存期(median survival time): 也称半数生存期,即生存时间的中位数,表示生存率 等于 50%时的时间。反映生存时间的平均水平。
1
0.5000 0.5000
1
1.0000 0.0000
活过该月 的生存率
p(x>t) (7) 0.9000 0.9000 0.7875 0.6750 0.5625 0.5625 0.4219 0.4219 0.2109 0.0000
生存率 标准误
s
(8) 0.0949 . 0.1340 0.1551 0.1651 . 0.1737 . 0.1726 0
2
传统方法在分析随访资料时的困难
时间和生存结局都成为了要关心的因素
•除了生存结局作为判定标准以外,只要能让病人存活 时间延长,这种药物也应当是被认为有效的。即时间 延长也认为有效 •如果将两者均作为应变量拟和多元模型,因为时间分 布不明(一般不呈正态分布,在不同情况下的分布规 律也不同),拟和多元模型极为困难
医学统计学第16-章生存分析-PPT幻灯片
0.0199
20 25 0.0787 10.0000 2.6517 0.0250 0.0105 0.064516 0.028475
25 30 0.0741 8.1250 2.2535 0.0200 0.00949 0.072727 0.035758
30 35 0.0660 11.2500 3.7500 0.0200 0.00949 0.114286 0.054761
n data li16_1; n input count c time; n cards; n 510 n 715 n 6 1 10 n 4 1 15 n 5 1 20 n 4 1 25 n 4 1 30 n 0 1 35 n 2 1 40 n 1 1 45 n 2 1 50 n; n proc lifetest plots=(s) method=life n width=5; time time*c(0); n freq count; n run;
生存时间资料常通过随访获得,因观 察时间长且难以控制混杂因素,再加上存 在截尾数据,规律难以估计,一般为正偏 态分布。
6、生存率(survival rate)与 死亡概率
①生存率:又叫累积生存率或生存函数。
表示观察对象其生存时间T大于t时刻的概 率,常用S(t,X)=P(T>t,X)表示。在实际工
data ex16_2; input month censor@@; cards; 1 0 3 0 4 0 5 0 6 0 8 0 10 0 11 0 12 0 14 0 17 0 18 0 24 0 30 0 31 0 51 0 62 1 78 1 88 1 115 1 124 1 ; proc lifetest plots=(s); time month*censor(1); run;
医学统计学-生存分析180页PPT
31、别人笑我太疯癫,我笑他人看不 穿。(名 言网) 32、我不想听失意者的哭泣,抱怨者 的牢骚 ,这是 羊群中 的瘟疫 ,我不 能被它 传染。 我要尽 量避免 绝望, 辛勤耕 耘,忍 受苦楚 。我一 试再试 ,争取 每天的 成功, 避免以 失败收 常在别 人停滞,生命 就永远 只能是 死水一 潭。 34、当你眼泪忍不住要流出来的时候 ,睁大 眼睛, 千万别 眨眼!你会看到 世界由 清晰变 模糊的 全过程 ,心会 在你泪 水落下 的那一 刻变得 清澈明 晰。盐 。注定 要融化 的,也 许是用 眼泪的 方式。
35、不要以为自己成功一次就可以了 ,也不 要以为 过去的 光荣可 以被永 远肯定 。
46、我们若已接受最坏的,就再没有什么损失。——卡耐基 47、书到用时方恨少、事非经过不知难。——陆游 48、书籍把我们引入最美好的社会,使我们认识各个时代的伟大智者。——史美尔斯 49、熟读唐诗三百首,不会作诗也会吟。——孙洙 50、谁和我一样用功,谁就会和我一样成功。——莫扎特
医学统计学课件:13 生存分析
生存资料的特点
因变量有两个:结局和时间两方面的信息;
一般通过随访收集得到,从某统一时间点开 始,观察到规定时间点截止,常因失访等造 成数据不完整,分布类型复杂。
1、生存时间
♦ Survival time:泛指研究者所关心的某现象的持 续时间,即从某起始事件到某终点事件所经历的 事件跨度。常用符号 t来表示。
如: 白血病患者化疗后的复发时间; 肾移植患者肾移植后的肾功能衰竭时间; 接受健康教育戒烟后的青少年复吸烟时间;
2、死亡事件与起始事件
♦死亡事件:即失效事件、终点事件,泛指 种处理措施失败或失效的特征事件。一般 计阶段根据研究目的确定。
N of Cumulative
医学统计学
生存分析
公共卫生学院预防医学教研室
生存分析(survival analysis):是将事件发生 的结局和发生这种结局所经历的时间综合起来分 析的一种统计分析方法。 能够充分利用所得的研究信息,更加准确的评价 和比较随访资料。包括统计描述和统计推断。
主要内容
♦ 生存分析概述 ♦ 生存率的估计-乘积极限法和寿命表法 ♦ 生存曲线比较的假设检验-Logrank检验 ♦ Cox比例风险回归模型
总体生存率的区间估计:
S (tk ) ± uα / 2 SE[S (tk )]
SE[S (tk )] = S (tk )
k
dj
n (n
j =1 j j
d j)
医学统计学课件--生存分析第十七章
t
生存率S(t)的概率乘法估计
S(t)也称累计生存概率,t 时刻存活是t 时刻之前一直生存的累积。
概率乘法原理计算(359页)
s(ti ) pi p1 p2 ... pi
(公式17-2)
Pi 为某时间区间(ti)的生存概率。假定 个体在各时段生存是独立。
2019/2/13 医学统计学 校正人数 =1962-39/2=1942.5 31
寿命表法与PL的区别
1.计算在 (ti 1,ti ) 时间段的生存率。 如0-1年、1-2年,时间段组距相等。
2.寿命表方法计算死亡概率,用校正观察人数计 算。假定有截尾事件的人在各时间组内平均生 存为1/2时间。 (校正观察人数=期初观察人数-截尾人数/2) 死亡概率=某时间组内死亡人数/校正观察人数
2019/2/13 医学统计学 24
2.生存曲线:(survival curve) 指各时点(t)为横轴,生存率S(t)为纵轴,连 接一起的曲线图。描述生存率在各时点(t)的 变化过程。 3.半数生存期(中位数生存时间) 即生存率为0.5时对应的时间(t),描述一 组数据平均生存时间。
注:生存时间(t)是正偏态分布。
生存分析的基本概念
一、随访数据概念
1.分析的变量(y) 1) 结局事件:指结局出现的特征,如疾病的死 亡、复发、发生( y=1或0) 。
2)时间间隔变量 记为(t) t=结局事件出现日期 - 事件的起始日期
(起始日期可规定:如诊断、用药、手术日期 2019/2/13 8 医学统计学 等), t的单位:可用年、月、周表示
23 22 21 18 15 14 13 11
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PPT学习交流
26
【例2】某医院对100例胰腺癌切除术后的患者进行随 访,得资料如下。试分析其生存过程。
PPT学习交流
27
• (7)=(6)-(5)/2
• (8)=(4)/(7)
• (9)= 1-(8)
PPT学习交流
28
PPT学习交流
29
SPSS软件操作
• 第一步:建立变量。
PPT学习交流
30
医学统计学 (11)
PPT学习交流
1
•第一部分
•生存分析
•第二部分
•Meta分析
PPT学习交流
2
•第一部分
•生存分析
PPT学习交流
3
在医学研究中,常常用追踪的方式来研究事 物发展的规律。如:了解某药物的疗效,了解手 术的存活时间,了解某医疗仪器设备使用寿命等 等。
PPT学习交流
4
生存资料的特点
如:急性白血病病人从治疗开始到复发为止之间的缓解期, 冠心病病人两次发作之间的时间间隔,戒烟开始到重新吸烟 之间的时间间隔,接触危险因素到发病的时间间隔等。
生存分析中最基本的问题就是计算生存时间,要明确规定事 件的起点、终点及时间的测度单位,否则就无法分析比较。
PPT学习交流
8
中位生存时间是指寿命中位数,表示有且只有 50%的观察对象还可以活这么长时间。由于截尾 数据的存在,中位生存期的计算不同于普通的中 位数,它可以利用生存函数公式或生存曲线图, 令生存率为50%时,推算出生存时间。
21
• 第三步:生存分析(2)
PPT学习交流
22
• 第三步:生存分析(3)
PPT学习交流
23
• 第四步:结果解读(1)
结果解读:生存表基本描述
PPT学习交流
24
• 第四步:结果解读(2)
结果解读:生存表统计描述
中位生存时间及95%CI
PPT学习交流
25
• 第四步:结果解读(3)
结果解读:生存函数图
PPT学习交流
5
生存资料的数据类型
• 按观察对象生存时间的完整性可分为两种类型。 (1)完全数据:指观察起点到发生结局事件的时间
明确、完整的资料,即具有明确完整生存时间的 数据。 (2)截尾数据:指由于其他因素(非研究因素)导致 观察对象的生存时间难以明确判断,这种生存时 间数据称为截尾数据。也称为截尾值、删失值或 终检值。 不论截尾数据的产生原因为何,截尾生存时间的 计算均为观察起点至截尾点所经历的时间,而且 一般情况下其准确的生存时间要长于截尾时间, 常在此类数据的右上角标记“+”。
PPT学习交流
11
生存分析的主要内容: 1.描述生存过程(估计生存函数) 2.比较生存过程(比较生存函数) 3.影响生存时间的因素分析
PPT学习交流
12
SPSS中的 菜单位置
PPT学习交流
13
描述生存过程
生存率的估计方法有参数法和非参数法。常用非 参数法,非参数法主要有二个,即乘积极限法与 寿命表法。
乘积极限法,又称Kaplan-Meier法,主要用于观 察例数较少(n<50)而未分组的生存资料;
寿命表法适用于观察例数较多而分组的资料,不 同的分组寿命表法的计算结果亦会不同,当分组 资料中每一个分组区间中最多只有 1个观察值时, 寿命表法的计算结果与乘积极限法完全相同。
PPT学习交流
14
• 乘积极限法:Kaplan-Meier • 寿命表法:寿命表 • 因素分析:Cox回归
PPT学习交流
9
生存函数
生存概率又称为生存率或生存函数,它表示一个病人的生存时 间长于时间t的概率,用S(t)表示。
以时间t为横坐标,S(t)为纵坐标所作的曲线称为生存率曲线, 它是一条下降的曲线,下降的坡度越陡,表示生存率越低或生 存时间越短,其斜率表示死亡速率。
PPT学习交流
10
死亡函数
表示死亡速率的大小。如以t为横坐,f(t) 为纵坐标作出的曲线称为密 度曲线,由曲线上可看出不同时间的死亡速率及死亡高峰时间。纵坐 标越大,其死亡速率越高,如曲线呈现单调下降,则死亡速率越来越 小,如呈现峰值,则为死亡高峰。
PPT学习交流
6
生存分析基本概念
起始事件是反映生存时间起始特征的事件,如疾 病确诊、某种疾病治疗开始、接触毒物等。
在生存分析随防研究过程中,一部分研究对象可 观察到死亡,可以得到准确的生存时间,它提供 的信息是完全;这种事件称为失效事件,也称之 为死亡事件、终点事件。
PPT学习交流
7
生存时间(survival time)是指任何两个有联系事件之间的 时间间隔,常用t表示。狭义的生存时间指患某疾病的病人 从发病到死亡所经历的时间跨度,广义的生存时间定义为 从某种起始事件到终点事件所经历的时间跨度。
结果解读:生存函数
PPT学习交流
37
生存曲线的比较
• 对数秩检验:其基本思想是,在假定无效假设 (两总体生存曲线相同)成立的前提下,可根 据不同日期两种处理的期初人数和死亡人数, 计算各种处理在各个时期的理论死亡数。若无 效假设成立,则实际死亡数与理论死亡数不会 相差太大。
• Gehan比分检验:其基本思想是,在假定无效假 设(两总体生存曲线相同)成立的前提下,则 两样本来自分布相同的总体,两样本的Gehan比 分合计V值应为0,若V值偏离0太远,则无效假 设成立的可能性就很小。
• 第二步:输入原始数据
PPT学习交流
31
• 第三步:加权个案
PPT学习交流
32
• 第四步:生存分析(1)
PPT学习交流
33
• 第四步:生存分析(2)
PPT学习交流
34
• 第三步:生存分析(3)
PPT学习交流
35
Hale Waihona Puke • 第四步:结果解读(1)
结果解读:寿命表描述
PPT学习交流
36
• 第四步:结果解读(2)
PPT学习交流
15
【例1】某治疗方案治疗晚期肝癌患者7例,随访时 间(月)记录如下。试分析其生存过程。
PPT学习交流
16
╳ =
PPT学习交流
17
PPT学习交流
18
SPSS软件操作
• 第一步:建立变量。
PPT学习交流
19
• 第二步:输入原始数据
PPT学习交流
20
• 第三步:生存分析(1)
PPT学习交流
(1)包含有结局和时间两个方面的信息。 (2)结局资料一般为二分类资料,即结局是两对立
相互排斥的事件,如生存与死亡、有效与无效等。 (3)生存资料一般需经过前瞻性随访观察才能获得
,随访往往从某统一的时点开始,到某规定的时点 结束,所以生存资料有时也称为随访资料。 (4)由于失访等原因使一些研究对象的生存时间难 判断,导致部分生存时间数据不完整。