生存分析概述及实例分析 PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全数据:指提供了完整信息的数据。例如,在研究产品的失效 时间时,某个样品从进入研究直到失效都在我们的观察中,可以得到 该样品的具体失效时间,这就是一个完全数据。
删失数据:是指在观测期内,我们并没有看见个体的状态发生改 变,无法确定个体具体的生存时间。又分为左删失数据,右删失数据, 区间删失数据。
生存分析概述及实例分析
S(t) ni di
n ti<t
i
i = 1 , 2 ,… ,k ,且S(t)为递减函数。
生存分析概述及实例分析
16
K-M分析
Kaplan-Meier分析,也称为乘积极限分析,是Kaplan和Meier在 1958年提出的一种估计生存函数的非参数方法。与生命表分析不 同,K-M分析以事件发生的时间点将观测区间分段,用来估计生存 函数。下举例说明其具体的分析过程。
生存分析概述及实例分析
5
研究内容
生存分析研究的内容主要有以下两个方面: 一 对生存过程的描述
二 分析生存过程的影响因素并对生存的结局加以预测
生存分析概述及实例分析
6
应用领域
生存分析虽然源自医学领域,但其在生物学,保险学,可靠性
工程学,经济学,教育学,社会学等领域都有广泛的应用。比如:
医疗科学中病人的去世
(10号) 21160311055
生存分析概述及实例分析
1
1 概述
目录
2 常用术语
3 分析方法
4 案例分析
生存分析概述及实例分析
2
概述
生存分析概述及实例分析
3
定义
生存分析是研究生存现象和响应时间数据及其统计规律的
一门学科。由于最初研究的关键事件是死亡,故称为生存分
析。生存分析是统计科学的重要分支,其研究的两个重要变
18
以SPSS对上例进行K-M分析,结果 如下:
1.输入数据
2.进行K-M分析
生存分析概述及实例分析
19
参数设置
生存分析概述及实例分析
20
输出结果
K-M分析生存函数图
生存分析概述及实例分析
21
生命表分析与K-M分析的比较
生命表分析适用于大样本的情况,特别是没有个体数据的情形,主 要优点是对生存时间的分布没有要求。
保险行业中的赔偿
可靠性工程中产品的失效
金融领域中银行账户从开立到取消的时间的研究
教育行业中学生的中途退学
客户关系管理中的客户流失
生存分析概述及实例分析
7
常用术语
生存分析概述及实例分析
8
生存数据
生存分析中所分析的数据通常称为分析数据,一般度量的是某个 事件发生所经历的时间长度。生存数据可以分为完全数据和删失数据。
[65,150) :个体2在65小时退出实验, 本区间无个体死亡, S(t)=0.8×4/4=0.8.
[150,220) :个体3在150小时死亡,S (t)=0.8×2/3=0.53.
[220,300) :个体4在220小时退出实验, 本区间无个体死亡, S(t)=0.53×2/2=0.53.
t=300时,个体5死亡,S(300)=0
生存分析概述及实例分析
17
下表记录了5个实验对象的存活时间, 其中F代表失效,S代表存活,2和4为 右删失数据。
t
用S(t)表示实验对象的累积存活概率, 分时间段计算如右:
生存分析概述及实例分析
[0,31) :此区间5个实验对象均存活, 故 S(t)=5/5=1.
[31,65) :个体1在31小时死亡,故本区 间 S(t)=1×4/5=0.8
元为“事件”和“寿命”。
事件:生存分析中定义的事件有死亡、损坏、失败、解雇、
病发等等。例如病人的死亡,产品的失效,疾病的发生,职
员被解雇。
寿命:从记录开始到事件发生的时间。
生存分析概述及实例分析
4
特点
生存分析的优点在于其能够处理删失数据。 生存分析的统计资料以生存时间为反应变量,此类资料的 生存时间变量大多不服从正态分布,且由于删失值的存在, 不适合用传统的分析方法处理。此时就应选用生存分析的方 法。
10
生存函数
生存函数(survival function),又称为累积生存率,我们 用符号T表示个体的生存时间(从开始记录到事件发生的时间), 用 t 表示观测时间,将生存函数记作 S(t),是指个体生存时 间大于 t 的概率。
S(t)= P(T> t ),显然 S(t)是非升函数,且S(0) = 1, S(∞)= 0,
生存分析概述及实例分析
11
风险函数
风险函数(hazard function),又称为瞬时死亡率,
记作 h(t)。是指在t时刻存活的个体,在t+∆ t 时刻死亡
的概率。
h(t)=lim P( tTtt)
t 0
t
显然,h(t)非负,且无上限。
生存分析概述及实例分析
12
分析方法
生存分析概述及实例分析
13
按照是否使用参数,可以将生存分析中的分析方法分为三类:
参数方法:若已经证明某事件的发展可以用某个参数模型很好
地拟合,就可以用参数方法做该事件的生存分析。常用的参数模型
有指数分布模型、对数分布模型、正态分布模型,威泊分布模型等。
非参数方法:当被研究事件不能被参数模型很好地拟合时,可
以采用非参数方法研究它的生存特征。常用的非参数方法包括生命
9
A B C D E
起始
死亡 退出
死亡 死亡
ຫໍສະໝຸດ Baidu
未知
观测时间区间 删失数据示意图
终止
完全数据: A,观测期内死亡 右删失数据: B,观测未终止时因故退出 C,观测终止时尚未死亡 左删失数据: D,死亡时间在某一时刻之前,具体时间未知 区间删失数据: E,死亡时间位于某一区间,具体时间未知
生存分析概述及实例分析
表分析和K-M分析。
半参数方法:它比参数模型灵活,与非参数方法相比更容易对
分析结果进行解释。生存分析中使用的半参数模型是Cox比例风险
模型。
生存分析概述及实例分析
14
非参数方法
生命表分析 K-M分析
生存分析概述及实例分析
15
生命表分析
生命表分析将观测时间分成时间段,按时间段逐个统计事件发
生的情况,以此估计生存函数。假设共有k个时间段 [ t 0 , t 1) , [ t 1 , t 2) , … , [ t k-1 , t k ) , 每个区间中事件发生的次数分别为 d 1 ,d 2 ,… , d k , 每个区间中的个体总数分别为 n 1 , n 2 ,… , n k ,所以在 第 i 个区间个体存活的概率为(n i - d i )/ n i ,而个体可以从第 一个区间存活到第 i 个区间的概率(累积生存率)为:
删失数据:是指在观测期内,我们并没有看见个体的状态发生改 变,无法确定个体具体的生存时间。又分为左删失数据,右删失数据, 区间删失数据。
生存分析概述及实例分析
S(t) ni di
n ti<t
i
i = 1 , 2 ,… ,k ,且S(t)为递减函数。
生存分析概述及实例分析
16
K-M分析
Kaplan-Meier分析,也称为乘积极限分析,是Kaplan和Meier在 1958年提出的一种估计生存函数的非参数方法。与生命表分析不 同,K-M分析以事件发生的时间点将观测区间分段,用来估计生存 函数。下举例说明其具体的分析过程。
生存分析概述及实例分析
5
研究内容
生存分析研究的内容主要有以下两个方面: 一 对生存过程的描述
二 分析生存过程的影响因素并对生存的结局加以预测
生存分析概述及实例分析
6
应用领域
生存分析虽然源自医学领域,但其在生物学,保险学,可靠性
工程学,经济学,教育学,社会学等领域都有广泛的应用。比如:
医疗科学中病人的去世
(10号) 21160311055
生存分析概述及实例分析
1
1 概述
目录
2 常用术语
3 分析方法
4 案例分析
生存分析概述及实例分析
2
概述
生存分析概述及实例分析
3
定义
生存分析是研究生存现象和响应时间数据及其统计规律的
一门学科。由于最初研究的关键事件是死亡,故称为生存分
析。生存分析是统计科学的重要分支,其研究的两个重要变
18
以SPSS对上例进行K-M分析,结果 如下:
1.输入数据
2.进行K-M分析
生存分析概述及实例分析
19
参数设置
生存分析概述及实例分析
20
输出结果
K-M分析生存函数图
生存分析概述及实例分析
21
生命表分析与K-M分析的比较
生命表分析适用于大样本的情况,特别是没有个体数据的情形,主 要优点是对生存时间的分布没有要求。
保险行业中的赔偿
可靠性工程中产品的失效
金融领域中银行账户从开立到取消的时间的研究
教育行业中学生的中途退学
客户关系管理中的客户流失
生存分析概述及实例分析
7
常用术语
生存分析概述及实例分析
8
生存数据
生存分析中所分析的数据通常称为分析数据,一般度量的是某个 事件发生所经历的时间长度。生存数据可以分为完全数据和删失数据。
[65,150) :个体2在65小时退出实验, 本区间无个体死亡, S(t)=0.8×4/4=0.8.
[150,220) :个体3在150小时死亡,S (t)=0.8×2/3=0.53.
[220,300) :个体4在220小时退出实验, 本区间无个体死亡, S(t)=0.53×2/2=0.53.
t=300时,个体5死亡,S(300)=0
生存分析概述及实例分析
17
下表记录了5个实验对象的存活时间, 其中F代表失效,S代表存活,2和4为 右删失数据。
t
用S(t)表示实验对象的累积存活概率, 分时间段计算如右:
生存分析概述及实例分析
[0,31) :此区间5个实验对象均存活, 故 S(t)=5/5=1.
[31,65) :个体1在31小时死亡,故本区 间 S(t)=1×4/5=0.8
元为“事件”和“寿命”。
事件:生存分析中定义的事件有死亡、损坏、失败、解雇、
病发等等。例如病人的死亡,产品的失效,疾病的发生,职
员被解雇。
寿命:从记录开始到事件发生的时间。
生存分析概述及实例分析
4
特点
生存分析的优点在于其能够处理删失数据。 生存分析的统计资料以生存时间为反应变量,此类资料的 生存时间变量大多不服从正态分布,且由于删失值的存在, 不适合用传统的分析方法处理。此时就应选用生存分析的方 法。
10
生存函数
生存函数(survival function),又称为累积生存率,我们 用符号T表示个体的生存时间(从开始记录到事件发生的时间), 用 t 表示观测时间,将生存函数记作 S(t),是指个体生存时 间大于 t 的概率。
S(t)= P(T> t ),显然 S(t)是非升函数,且S(0) = 1, S(∞)= 0,
生存分析概述及实例分析
11
风险函数
风险函数(hazard function),又称为瞬时死亡率,
记作 h(t)。是指在t时刻存活的个体,在t+∆ t 时刻死亡
的概率。
h(t)=lim P( tTtt)
t 0
t
显然,h(t)非负,且无上限。
生存分析概述及实例分析
12
分析方法
生存分析概述及实例分析
13
按照是否使用参数,可以将生存分析中的分析方法分为三类:
参数方法:若已经证明某事件的发展可以用某个参数模型很好
地拟合,就可以用参数方法做该事件的生存分析。常用的参数模型
有指数分布模型、对数分布模型、正态分布模型,威泊分布模型等。
非参数方法:当被研究事件不能被参数模型很好地拟合时,可
以采用非参数方法研究它的生存特征。常用的非参数方法包括生命
9
A B C D E
起始
死亡 退出
死亡 死亡
ຫໍສະໝຸດ Baidu
未知
观测时间区间 删失数据示意图
终止
完全数据: A,观测期内死亡 右删失数据: B,观测未终止时因故退出 C,观测终止时尚未死亡 左删失数据: D,死亡时间在某一时刻之前,具体时间未知 区间删失数据: E,死亡时间位于某一区间,具体时间未知
生存分析概述及实例分析
表分析和K-M分析。
半参数方法:它比参数模型灵活,与非参数方法相比更容易对
分析结果进行解释。生存分析中使用的半参数模型是Cox比例风险
模型。
生存分析概述及实例分析
14
非参数方法
生命表分析 K-M分析
生存分析概述及实例分析
15
生命表分析
生命表分析将观测时间分成时间段,按时间段逐个统计事件发
生的情况,以此估计生存函数。假设共有k个时间段 [ t 0 , t 1) , [ t 1 , t 2) , … , [ t k-1 , t k ) , 每个区间中事件发生的次数分别为 d 1 ,d 2 ,… , d k , 每个区间中的个体总数分别为 n 1 , n 2 ,… , n k ,所以在 第 i 个区间个体存活的概率为(n i - d i )/ n i ,而个体可以从第 一个区间存活到第 i 个区间的概率(累积生存率)为: