统计-生存分析课件PPT
合集下载
医学统计学-生存分析课件
PPT学习交流
26
【例2】某医院对100例胰腺癌切除术后的患者进行随 访,得资料如下。试分析其生存过程。
PPT学习交流
27
• (7)=(6)-(5)/2
• (8)=(4)/(7)
• (9)= 1-(8)
PPT学习交流
28
PPT学习交流
29
SPSS软件操作
• 第一步:建立变量。
PPT学习交流
30
医学统计学 (11)
PPT学习交流
1
•第一部分
•生存分析
•第二部分
•Meta分析
PPT学习交流
2
•第一部分
•生存分析
PPT学习交流
3
在医学研究中,常常用追踪的方式来研究事 物发展的规律。如:了解某药物的疗效,了解手 术的存活时间,了解某医疗仪器设备使用寿命等 等。
PPT学习交流
4
生存资料的特点
如:急性白血病病人从治疗开始到复发为止之间的缓解期, 冠心病病人两次发作之间的时间间隔,戒烟开始到重新吸烟 之间的时间间隔,接触危险因素到发病的时间间隔等。
生存分析中最基本的问题就是计算生存时间,要明确规定事 件的起点、终点及时间的测度单位,否则就无法分析比较。
PPT学习交流
8
中位生存时间是指寿命中位数,表示有且只有 50%的观察对象还可以活这么长时间。由于截尾 数据的存在,中位生存期的计算不同于普通的中 位数,它可以利用生存函数公式或生存曲线图, 令生存率为50%时,推算出生存时间。
21
• 第三步:生存分析(2)
PPT学习交流
22
• 第三步:生存分析(3)
PPT学习交流
23
• 第四步:结果解读(1)
应用统计学生存分析课件
计算方法
通过概率函数或累积分布函数进行计 算。
风险函数
定义
描述在某一时间点之前发生事件的概率密度函数。
计算方法
通过概率密度函数进行计算。
应用场景
在风险评估、可靠性工程等领域,需要了解在某 一时间点之前发生故障或失效的概率密度。
失效率函数
1 2 3
定义 描述在某一时间点之后发生事件的概率密度函数。
比较与选择
根据数据特性和研究目的选择合适的生存模 型,并进行模型比较和验证。
PART 03
生存分析的统计方法
生存分析的参数模型
参数模型定义
01
参数模型是一种假定数据遵循某种特定分布的模型,如Weibull
分布、Logistic分布等。
参数模型的估计
02
通过最大似然估计或最小二乘法等统计方法,对模型的参数进
机器故障的生存分析
总结词
介绍机器故障生存分析的基本概念和方法, 包括数据收集、模型选择和结果解释等。
详细描述
机器故障的生存分析是一种用于预测机器故 障时间和进行故障诊断的统计分析方法。通 过对机器运行过程中的监测数据(如温度、 压力、振动等)进行收集,利用生存分析模 型(如加速寿命试验模型、可靠性模型等) 对机器的寿命和故障模式进行分析,从而为 机器维护和故障预测提供依据。
生存分析的应用前景
临床医学
在临床医学领域,生存分析可用于评估治疗方案的效果、预测患者 的生存时间和预后情况。
药物研 发
在药物研发过程中,利用生存分析对药物的疗效和安全性进行评价, 加速药物的研发进程。
公共卫生
在公共卫生领域,生存分析可用于研究疾病的流行趋势、评估预防措 施的效果,为公共卫生决策提供科学依据。
[课件]医学统计学--生存分析PPT
1974
1975 1976 1977
29
26 24 32
28
24 21 27
25
19 19 23
23
18 16 21
19
18 14 18
18
18 14 16
17
16 13
17
16
17
1978
1979 1980 1981 合计
25
36 25 46 243
23
31 23 36 213
20
29 19 154
医学统计学--生存分析
生存分析的意义与应用
无论观察性研究,还是实验(试验)性研究,有时需对研究
对象进行追踪观察,不仅了解某事件发生的结局,同时
还了解发生这种结局所经历的时间。
例如临床治疗措施效果评价:白血病化疗缓解持续时间 和缓解率、乳腺癌术后生存时间和生存率、肾移植术后 生存时间和生存率等。
上述生存资料若按通常的方法进行分 析,有两方面的问题:
1.n年生存率有时出现后一年大于前一年的现象。
活 满 n 年 的 人 数 n 年 生 存 率 = 1 0 0 % 观 察 满 n 年 的 人 数
表1 某地1974—1981年胃癌根治术后随访记录 年份 例数 生存年数 1 2 3 4 5 6 7 8
二.生存时间
生存时间(survival time)也是一个广义概念, 泛指所关心的某现象的持续时间,即随访观察 持续的时间,常用符号t表示。
表2
患者 编号
6例乳腺癌患者术后随访记录
观察记录 生存天数 t
开始日期
终止日期
结局 (死=1,生=0)
原因
1
2
医学统计―生存分析课件
t
关系可表示为: S(t) exp h(t)dt (16.9)
0
风险函数与生存函数的关系
17
h1 t 是一种上升的曲线,危险率随时间变化而增加,如
急性白血病患者治疗无效时其危险率随时间呈增加趋势;
h2 t 的曲线为下降趋势,表示危险率逐渐减小,如意
外事故造成的外伤经有效治疗后死亡的危险性逐渐减小;
of survival),即将时刻 t 尚存活看成是前 t 个时段一直
存活的累计结果。如: n年生存率 1p0 1 p11 p2 ......1 pn1 。 14
(四)生存率曲线(survival curve): 是指以时间为横轴、生存率为纵轴,将各个时点的生 存率连接在一起的曲线图。曲线形状分为两种: 1、阶梯形:小样本资料用直接法估计的生存曲线; 2、折线形:大样本资料用频数表法估计的生存曲线。 (五)中位生存期(median survival time): 也称半数生存期,即生存时间的中位数,表示生存率 等于 50%时的时间。反映生存时间的平均水平。
1
0.5000 0.5000
1
1.0000 0.0000
活过该月 的生存率
p(x>t) (7) 0.9000 0.9000 0.7875 0.6750 0.5625 0.5625 0.4219 0.4219 0.2109 0.0000
生存率 标准误
s
(8) 0.0949 . 0.1340 0.1551 0.1651 . 0.1737 . 0.1726 0
2
传统方法在分析随访资料时的困难
时间和生存结局都成为了要关心的因素
•除了生存结局作为判定标准以外,只要能让病人存活 时间延长,这种药物也应当是被认为有效的。即时间 延长也认为有效 •如果将两者均作为应变量拟和多元模型,因为时间分 布不明(一般不呈正态分布,在不同情况下的分布规 律也不同),拟和多元模型极为困难
医学统计学第16-章生存分析-PPT幻灯片
0.0199
20 25 0.0787 10.0000 2.6517 0.0250 0.0105 0.064516 0.028475
25 30 0.0741 8.1250 2.2535 0.0200 0.00949 0.072727 0.035758
30 35 0.0660 11.2500 3.7500 0.0200 0.00949 0.114286 0.054761
n data li16_1; n input count c time; n cards; n 510 n 715 n 6 1 10 n 4 1 15 n 5 1 20 n 4 1 25 n 4 1 30 n 0 1 35 n 2 1 40 n 1 1 45 n 2 1 50 n; n proc lifetest plots=(s) method=life n width=5; time time*c(0); n freq count; n run;
生存时间资料常通过随访获得,因观 察时间长且难以控制混杂因素,再加上存 在截尾数据,规律难以估计,一般为正偏 态分布。
6、生存率(survival rate)与 死亡概率
①生存率:又叫累积生存率或生存函数。
表示观察对象其生存时间T大于t时刻的概 率,常用S(t,X)=P(T>t,X)表示。在实际工
data ex16_2; input month censor@@; cards; 1 0 3 0 4 0 5 0 6 0 8 0 10 0 11 0 12 0 14 0 17 0 18 0 24 0 30 0 31 0 51 0 62 1 78 1 88 1 115 1 124 1 ; proc lifetest plots=(s); time month*censor(1); run;
生存分析介绍PPT课件
比较的两组之间生存函数是否不同的非参数 检验方法
没有删失的例子
组别j
1
>
2
>
时点i 实际时间
1
23
4
56
45 6 9 10 11
具体计算方法
比较的两组之间生存函数是否不同的非参数 检验方法(续)
有删失的例子
组别j 1
+
2
时点i 实际时间
1
23
4
567
:删失
>
+>
45 6
9 10 11
13
Logrank Test and Wilcoxon Test
5
234.000 0.2368 0.7632 0.1015 14
4
244.000*
.
.
.
14
3
246.000 0.1579 0.8421 0.0934 15
2
265.000 0.0789 0.9211 0.0728 16
1
304.000
0 1.0000
0
17
0
NOTE: The marked survival times are censored observations.
由于权重不同,由两种方法得到差别有统 计学意义的难易度随生存函数的不同而不 同。
1
1
1
生
生
生
存
存
存
率
率
率
0
A
时间
Logrank检验
容易得到有意差
0
B
时间
Wilcoxon检验
容易得到有意差
0
C
时间
生存分析.ppt
即:生存函数图象下的面积是平均寿命.
2020/2/5
18
§(7)中位生存时间m
半数生存期,表示恰好有50%的个体 尚存活的时间
即,生存分布的50%分位点
P(T m) 50%
注意:中位生存时间与平均生存时间(期 望)的区别;
估计出阶梯型的生存函数后,可通过线性
插值法估计中位生存时间;
2020/2/5
生存分析(Survival Analysis) 主讲人: 赵 永 红
2020/2/5
1
§前言
(1)生存分析是将事件的结果(终点事件) 和出现这一结果所经历的时间结合起来 分析的一种统计分析方法。
(2)生存分析不同于其它多因素分析的 主要区别点就是生存分析考虑了每个观 测出现某一结局的时间长短。
生存分析是对非负随机变量进行统计分析
2020/2/5
4
右删失(截尾)数据(right censoring)
(1)定时截尾试验----Type I Censoring. 每个个体有自己潜在的删失时间Ci,此时 我们观察到的是:
ti min(Ti , Ci ), i I (Ti Ci )
ti , i 都是随机变量,joint p.d.f is f (ti )i P(Ti Ci )1i
2020/2/5
5
右删失(截尾)数据(right censoring)
(2)定数截尾试验----Type Ⅱ Censoring.
n 个个体进入研究,直到有r 个个体发生失 败事件时候终止试验.
我们观察到的是:
t(1) ... t(r )
joint p.d.f is
r
Cnr { f (t(i) )}{P(Tj t(r ) )}nr
应用统计学生存分析课件
常用模型
Cox比例风险模型、加速失效时间模 型等。
03
02
模型特点
既包含某些已知参数,也包含未知 函数。
估计方法
通常采用似然估计或矩估计进行模 型参数的估计。
04
03
生存分析模型
比例风险模型
比例风险模型(Cox模型)是一种常用的生存分析模型,它假设风险函数的比例形式,即不同个体的 风险函数只与比例风险有关,而与时间无关。
SAS在生存分析中的应用
SAS中的生存分析过程
在SAS中,可以使用`SURvival`过程进行生存分析,该过程包括数 据准备、模型建立、结果输出等多个步骤。
SAS中的生存分析图表
SAS提供了多种图表类型,如Kaplan-Meier曲线、Cox比例风险模 型图等,用于可视化生存分析结果。
SAS在生存分析中的优势
STATA也提供了多种图表类型, 如Kaplan-Meier曲线、危险函数 图等,用于可视化生存分析结果。
STATA在生存分析中 的优势
STATA是一种功能强大的统计分 析软件,具有友好的用户界面和 灵活的数据处理能力,并且提供 了大量的统计方法和命令。
05
生存分析的挑战与未来发展
数据缺失与删失问题
生存分析的重要性
生存分析在医学、生物统计学、社会科学等领域都有广泛的应用,它可以帮助我们更好地理解生存现象,为临床 实践、政策制定等提供科学依据。
生存分析的基本概念
生存函数
描述在某段时间内研究对象生存的概率。
死亡函数
描述在某段时间内研究对象死亡的概率。
危险函数
描述在某段时间内研究对象死亡的风险。
生存分析的应用场景
详细描述
多状态生存模型考虑到生存状态的多样性, 可以更准确地描述生物过程和行为。然而, 确定状态转换的机制、选择合适的模型参数 以及处理不完全数据等问题,都增加了多状 态生存模型应用的难度。
Cox比例风险模型、加速失效时间模 型等。
03
02
模型特点
既包含某些已知参数,也包含未知 函数。
估计方法
通常采用似然估计或矩估计进行模 型参数的估计。
04
03
生存分析模型
比例风险模型
比例风险模型(Cox模型)是一种常用的生存分析模型,它假设风险函数的比例形式,即不同个体的 风险函数只与比例风险有关,而与时间无关。
SAS在生存分析中的应用
SAS中的生存分析过程
在SAS中,可以使用`SURvival`过程进行生存分析,该过程包括数 据准备、模型建立、结果输出等多个步骤。
SAS中的生存分析图表
SAS提供了多种图表类型,如Kaplan-Meier曲线、Cox比例风险模 型图等,用于可视化生存分析结果。
SAS在生存分析中的优势
STATA也提供了多种图表类型, 如Kaplan-Meier曲线、危险函数 图等,用于可视化生存分析结果。
STATA在生存分析中 的优势
STATA是一种功能强大的统计分 析软件,具有友好的用户界面和 灵活的数据处理能力,并且提供 了大量的统计方法和命令。
05
生存分析的挑战与未来发展
数据缺失与删失问题
生存分析的重要性
生存分析在医学、生物统计学、社会科学等领域都有广泛的应用,它可以帮助我们更好地理解生存现象,为临床 实践、政策制定等提供科学依据。
生存分析的基本概念
生存函数
描述在某段时间内研究对象生存的概率。
死亡函数
描述在某段时间内研究对象死亡的概率。
危险函数
描述在某段时间内研究对象死亡的风险。
生存分析的应用场景
详细描述
多状态生存模型考虑到生存状态的多样性, 可以更准确地描述生物过程和行为。然而, 确定状态转换的机制、选择合适的模型参数 以及处理不完全数据等问题,都增加了多状 态生存模型应用的难度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有/无序变量 --- 多项式(multinomial)Logistic 回归
• 时间事件变量 --- 生存分析
基本概念
生存分析主要研究内容
统计学分析
理想情况-相同随访时间
基本概念
生存分析主要研究内容
统计学分析
实际情况-不同随访时间
基本概念
生存分析主要研究内容
统计学分析
相关概念 • 生存分析:对一个或多个非负随机变量进行统计推断,研究事件发生和
二、得分检验 (score test) 检验一个或多个新 变量能否引入模型
三、Wald 检验 检验模型中的变量 是否被剔除
THANK YOU FOR ATTENTION
IF YOU HAVE ANY QUERY, PLEASE FEEL FREE TO ASK ME
响应时间数据及其统计规律的一种统计方法,既考虑结果又考虑生存时
间,并可充分利用截尾数据所提供的不完全信息,对生存时间的分布特
征进行描述,对影响生存时间的主要因素进行分析。
• 事件:研究中规定的生存研究的终点(endpoint),结局变量(0 / 1)
• 生存时间:某个起始时间开始,到某个终点事件(方案中规定的事件)
时间 (月)
事件发生
6.4
1
4.5
1
2.5
0
2.9
0
3.8
1
基本概念
生存分析主要研究内容
统计学分析
生存概率等指标的估计
• 分子 • 分母
= 发生事件数(d) = 总风险人时(pt)
• 所研究事件 发生率(人时)
发生事件数(d) = 总风险人时(pt)
• Rate = 3/(6.4+4.5+2.5+2.9+3.8) = 0.149 per pm
基本概念
生存分析主要研究内容
统计学分析
Kaplan-Meier 生存曲线
中位生存期(Median survival time),又称半 数生存期,当累积生存率为0.5时所对应的生存时 间,表示有且只有50%的个体可以发生这个时间
基本概念
生存分析主要研究内容
统计学分析
Kaplan-Meier 生存曲线
基本概念
PART ONE
资料类型 相关概念
基本概念
资料类型
生存分析主要研究内容
统计学分析
• 连续型变量
--- 线性(linear)回归
• 二分类变量
--- Logistic 回归
• 计数变量
--- 泊松(Poisson)回归
• 多分类变量
有序变量 --- 有序(order)Logistic 回归
的发生所经历的时间,也称失效时间(failure time or survival time)
或事件发生时间(Time to event,简称TTE)
• E.g. OS (Overall survival), PFS (Progression-free survival)
基本概念
相关概念
生存分析主要研究内容
向(暂时的)
基本概念
生存分析主要研究内容
统计学分析
Cox 比例风险回归模型
Exponent function 指数函数
基本概念
生存分析主要研究内容
统计学分析
Cox 比例风险回归模型
基本概念
生存分析主要研究内容
统计学分析
Cox 比例风险回归模型
基本概念
生存分析主要研究内容
统计学分析
Cox 比例风险回归模型
基本概念
生存分析主要研究内容
统计学分析
Log-rank 检验
基本概念
生存分析主要研究内容
统计学分析
Cox 比例风险回归模型
• 考虑其他相关因素(排除混杂因素) • 假设所有人的 incidence rate 相同,但实际不同,
--e.g. 六十岁以上人群死亡率呈增长趋势 • Hazard rate 在某一时间点发生所研究事件的倾
基本概念
生存分析主要研究内容
统计学分析
Cox 比例风险回归模型
协变量 (影响因素)
基本概念
生存分析主要研究内容
统计学分析
Cox 比例风险回归模型
Cox 模型的假设检验
一、似然比检验 (likelihood ratio
test) 模型中原有不显著变 量的剔除和新变量的 引入,以及包括不同 变量的各个模型比较
04 采用Cox模型进行起 效率或复发率的多因 素分析
基本概念
生存分析主要研究内容
统计学分析
生存概率等指标的估计
基本生存数据
• 时间变量 • 事件/截尾标志
= 1 发生所研究事件
随访时间不同,不能 计算prevalence and incidence,但可计算
人时发病率、人时死 亡率等
= 0 截尾
• Per patient-years,per 100 patient-years,per patient-month
基本概念
生存分析主要研究内容
统计学分析
生存概率等指标的估计
Incidence rate ratio(IRR)
• 比较两组之间的rate • IRR = rate in group 1 / rate in group 2
生存分析 Survival Analysis
主要内容 CONTENTS
基本概念
资料类型 相关概念 (生存分析、事件、 生存时间等)
生存分析主要研究内容
描述生存过程 比较生存过程 分析风险因素 建立数学模型
统计分析方法
生存概率等指标的估计 Kaplan-Meier 生存曲线 Log-rank 检验 Cox 比例风险回归模型
统计学分析
• 完整数据(complete data):观察对象在观察期内出现响 应(终点事件),所记录的时间信息是完整的
• 截尾数据(截尾值、删失数据,censored data):尚未观 察到研究对象出现响应(终点事件)时,即由于某种原因 停止了随访,这是记录的时间信息是不完整的
• e.g.:失访、退出、终止
Meier)等
使用Log-rank检 使用Cox回归模型
验 间和终点事件的
率进行比较,以 保护因素和不利
探讨各组间的生 因素,因素作用
存过程是否存在 大小及方向,相
差异
对危险度的大小
通过Cox回归 模型建立最终 的数学模型
统计分析方法
生存概率等指标的估计 PART THREE Kaplan-Meier 生存曲线
• 解释与odds ratio(OR)类似,可计算95%CI和P值
• Eg: Incidence rate for men = 2.5 per 100 pyrs Incidence rate for women = 5 per 100 pyrs IRR (women vs. men) = 5/2.5 = 2
Log-rank 检验 Cox 比例风险回归模型
基本概念
生存分析主要研究内容
统计学分析
01 计算生存率、中位生存
期、IRR 等
02 Kaplan Meier曲线法
估计各组事件累积发 生率(起效率、复发 率、死亡率)并计算 中位数发生时间及其 95%CI
统计 分析方法
03 采用log rank test法 比较组间差异(非参 数)
基本概念
相关概念
生存分析主要研究内容
统计学分析
生存分析主要研究内容
描述生存过程 PART TWO 比较生存过程
分析风险因素 建立数学模型
基本概念
生存分析主要研究内容
统计学分析
描述生存过程 比较生存过程 分析影响因素 建立数学模型
研究生存时间的 分布特点,估计 生存率及中位生 存期,绘制生存 曲线(Kaplan-