卫生统计学第八版第十二章 生存分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 基本概念与主要内容
第一节 基本概念与主要内容
(一)基本概念
1. 终点事件
终点事件又称失效事件(failure event)或死亡事件,终点事件是一个广
义概念,泛指标志某种处理措施失败或失效的特征事件。一般是在设计 阶段根据研究目的来确定。
第一节 基本概念与主要内容
(一)基本概念
1. 终点事件
(1)死亡概率与生存概率
② 生存概率(survival probability)用p 表示,某时段开始时存活的个体,到该时 段结束时仍存活的可能性。如年生存概率表示年初尚存人口存活满一年的可
能性。显然 p=1-q。
第一节 基本概念与主要内容
(一)基本概念
3. 生存曲线 与生存曲线相关的概念
(2)生存率 ①生存函数(survival function) 表示观察对象的生存时间 t 大于时间的概率,常用 S(t )表示,即S(t ) =Pr(T>t )。 生存函数又称为累积生存率,简称生存率(survival rate)。
第二节 生存曲线的估计
(一)Kaplan-Meier法
例1 欲进一步了解肾上腺皮质癌患者接受治疗后的生存状况,研究
者收集了肾上腺皮质癌患者的住院资料。其中,有12人进行手术治
疗后再辅以化学药物治疗,他们的生存时间(月)分别为:2, 5, 8, 9, 9+, 10, 13, 13, 15+, 18, 20, 23+。试问,采用该治疗方案的12名患
(1)生存时间相关的要素 ①观察起点(起点事件) ②观察终点(终点事件)
③时间间隔的度量。
这三者都需要根据研究目的,在研究设计阶段明确地定义出来,且在整个研究过程 中保持不变。
第一节 基本概念与主要内容
(一)基本概念
(2)观察对象的观察起点的设置
① 所有观察对象在同一时间点接受治疗; ② 观察对象在不同时间点接受治疗。 在进行研究时可根据实际情况选择其 中一种方式进行。如图所示。
第二节 生存曲线的估计
1166名尘肺患者确诊后生存率及其标准误
第二节 生存曲线的估计
1. 生存率及其标准误的计算
(1) 确定分组区间 ti , t : 根据随访时间及观察例数确定组数和区间宽度。 (2) 计算期内死亡数、期内删失数和期初观察人数:第一个时间区间的期初观察人数是所有的
观察例数;下一个区间的期初观察例数按以下公式计算:
3. 生存率
与生存曲线相关的概念
(3)生存曲线
生存概率是单位时间上生存的可能性,生存率是某个时间段(由一个或
多个单位时间组成的时间段)生存的可能性,即数个单位时间生存概率的累 积结果。
第一节 基本概念与主要内容
(二) 主要内容
1.描述生存时间的分布特点。通过生存时间和生存结局的数据估计平均存活时间及生存率, 绘制生存曲线,根据生存曲线分析其生存特点等。 2.比较生存曲线。通过相应的假设检验方法对不同样本的生存曲线进行比较,以推断各总 体的生存状况是否存在差别,比较不同治疗方法预后效果的差异。 3.分析影响生存状况的因素。通过生存分析模型来探讨影响生存状况的因素,通常以生存 时间和结局作为因变量,而将可能的影响因素作为自变量,通过拟合生存分析模型,筛选 具有统计学意义的生存状况的影响因素。
两种不同研究对象纳入形式示意图
第一节 基本概念与主要内容
(一)基本概念
(3)数据的分类
①完全数据(complete data):在整个研究过程中,随访到了观察对象的终点事件发生
的时间,研究者可以获得从起点到终点完整的生存时间,所提供的是准确的生存时间。 ②删失数据(censored data):在整个研究过程中,无法确切获得生存时间的数据,称
(一)基本概念
3. 生存曲线
与生存曲线相关的概念
(1)死亡概率与生存概率 ①死亡概率(probability of death) 用 q 表示,指某时段开始时存活的个体,在
该时段内死亡的可能性。如年死亡概率表示年初尚存人口在今后1年内死亡的
可能性
第一节 基本概念与主要内容
(一)基本概念
3. 生存曲线 与生存曲线相关的概念
第二节 生存曲线的估计
第二节 生存曲线的估计
随访资料生存曲线的估计方法有参数法和非参数法,对于服从 特定参数分布的生存资料,参数法更为准确,但大多数生存资料分 布不规则、不确定或未知,常用非参数法。常见的非参数方法有 Kaplan-Meier法和寿命表法。前者一般用于观察例数较少的未分组 资料,后者适用于观察例数较多的分组资料。
(1)实例: ①如肾上腺皮质癌患者手术后的死亡; ②白血病患者化疗后的复发; ③肾移植患者的肾功能衰竭;
④接受健康教育戒烟后的青少年复吸烟;
⑤接受某种健康保险方式后的中途退保。
第一节 基本概念与主要内容
(一)基本概念
2. 生存时间 生存时间(survival time)指从观察起点到终点事件的时间间隔,常用符号T表示。
k
ˆ(t )],其近似计算公式为: (6) 计算生存率的标准误 SE[S i
ˆ (t )] S ˆ (t ) SE[ S i i
n
j 1
dj
j
(n j d j )
第二节 生存曲线的估计
2. 中位生存时间和生存曲线
(1) 中位生存时间的概率及计算方法:中位生存时间是指寿命中位数,表示有且只有50% 的观察对象可以活这么长时间。如果样本生存率中有0.5,则中位生存时间;如果样本生 存率中没有0.5,则可采用插值法进行估计。 (2) 生存曲线:以生存时间为横坐标,各时间点的生存率为纵坐标,将各个时间点的生存 率连接在一起绘制成连续型的曲线称之为生存曲线。
再进行分析。一般用于观察对象数目较多的分组资料,不能够充分利用每条
记录的信息,但其计算和结果的解释都很简单。
第二节 生存曲线的估计
(二)寿命表法
例2 尘肺是煤矿工人长期接触生产性粉尘引起的不可逆转的职患者1166人,其生存时间列于下表。试计算生存率及其标准误。
3. 生存率的95%置信区间
求出样本各时点生存率及其标准误后,可用正态近似原理估计某时点总体生存率的置信区 间,计算公式为:
ˆ (t ) z SE[S ˆ (t )] S i /2 i
第二节 生存曲线的估计
12例术后辅助化疗的肾上腺皮质癌患者的生存率及其标准误
序号 时间 (月) 死亡 例数 删失 例数 期初 人数 死亡 概率 生存 概率 生存 率 生存率 标准误
若数据中无删失值,生存函数可用下式估计:
第一节 基本概念与主要内容
(一)基本概念
3. 生存曲线
与生存曲线相关的概念
(2)生存率 ② 生存函数特征: 生存函数是一个随时间下降的函数,t=0时,生存函数值为1,表示每个 患者在接受治疗前处于存活状态;当 t 趋于无穷大时,生存函数值为0,表示
每位患者的生存时间是有限的。
(3) 计算期初校正人数公式如下:
nci ci ni 2
ni 1 ni di ci
第二节 生存曲线的估计
ni 1 ni di ci
第二节 生存曲线的估计
1. 生存率及其标准误的计算
ˆ i ): ˆ i )和生存概率( p (4) 计算各时间点的死亡概率( q
di ˆi q ni
ˆi 1 q ˆi p
ptk
i
ˆ S (5) 计算各时间点生存率 (ti ): S (tk ) Pr(T tk ) S (tk 1 ) pt p1 p2
3. 生存曲线 以 生存时间ti为横坐标,各时
间点的S(ti ) 为纵坐标,将各个时
间点的生存率连接在一起绘制成 的连续曲线称之为生存曲线
(survival curve)。是以更为直观的
图示法描述生存率随生存时间而 变化的曲线。
K-M生存曲线
第一节 基本概念与主要内容
(一)基本概念
3. 生存曲线
与生存曲线相关的概念
第一节 基本概念与主要内容
(一)基本概念
(5)生存时间数据的分布特点 ①根据研究选择相应的度量单位,如年、月、日、小时等。 ②生存时间数据是通过随访收集获得,且有删失。 ③为非正态分布。因研究不同,生存时间常呈指数分布、Weibull分布、对数正 态分布等分布,因此需要与之对应的统计方法来分析。
第一节 基本概念与主要内容
为删失数据(censored data),也被称为截尾数据。
第一节 基本概念与主要内容
(一)基本概念
(4)产生删失数据原因 ① 失访:由于患者变更联系方式、未继续就诊或拒绝访问等原因,无法继续随 访,未能观察到终点事件。 ② 退出:患者死于其他疾病或因其他原因死亡(如死于车祸)而终止观察。 ③ 终止:研究结束时终点事件尚未发生。
第一节 基本概念与主要内容
(一)基本概念
3. 生存曲线
与生存曲线相关的概念
(2)生存率
③ 与生存概率的关系:
生存概率是单位时间上生存的可能性,生存率是某个时间段(由一个或 多个单位时间组成的时间段)生存的可能性,即数个单位时间生存概率的累 积结果。
第一节 基本概念与主要内容
(一)基本概念
3. 生存曲线 与生存曲线相关的概念
(2)生存率 ③ 与生存概率的关系:
对于不同单位时间的生存概率pi (i=1,2,…ti ),可利用概率乘法原理将相乘
得到 ti 时刻生存率,即
第一节 基本概念与主要内容
(一)基本概念
3. 生存曲线 与生存曲线相关的概念
(2)生存率 ③ 与生存概率的关系:
第一节 基本概念与主要内容
(一)基本概念
卫生统计学
第十二章 生存分析
毕育学 西安交通大学
刘红波
中国医科大学
目录
01 第一节:基本概念与主要内容 第二节:生存曲线的估计 第三节:生存曲线的比较
02
03 04
重点难点
※ 生存资料的特点 ※ 生存函数及其相关概念 ※ Kaplan-Meier法估计生存函数 ※ 各时点的生存曲线比较的对数秩检验
(3)中位生存时间 生存函数取值为0.5时对应的生存时间称为中位生存时间(median survival time),又称中位生存期或半数生存期,记为T 50,即 S(T50 ) 。它表示有50%的 个体可以存活到比 更长时间,通常用于描述生存期的平均水平。
第一节 基本概念与主要内容
(一)基本概念
第二节 生存曲线的估计
(一)Kaplan-Meier法
Kaplan-Meier法,又称乘积极限法,基本思想是将所有观 察对象的生存时间(包括删失数据)由小到大依次排列,对 每个时间点进行死亡概率、生存概率和生存率的估计。一般 用于观察对象数目较少的未分组资料,能够充分利用每条记 录的信息,估计不同生存时间点的生存率。
i
ti
(1) 2 5 8 9 9+ 10 13 15+ 18 20 23+
di
(2) 1 1 1 1 0 1 2 0 1 1 0
ci
(3) 0 0 0 0 1 0 0 1 0 0 1
ni
(4) 12 11 10 9 8 7 6 4 3 2 1
ˆi q
(5) 1/12 1/11 1/10 1/9 0/8 1/7 2/6 0/4 1/3 1/2 0/1
ˆ (t )] SE[S i
(8) 0.0798 0.1076 0.1250 0.1361 0.1361 0.1462 0.1470 0.1470 0.1427 0.1147 0.1147
1 2 3 4 5 6 7 8 9 10 11
第二节 生存曲线的估计
(二)寿命表法
当遇到样本含量较大的随访资料时,某些个体的删失发生在两次随访 之间,不能获得确切的生存时间,这时需要将原始资料按照生存时间分组后
者的术后生存率如何?
第二节 生存曲线的估计
1. 生存率及其标准误的计算
(1) 编号和排序:将生存时间t从小到大排序并编号。相同的生存时间只取其中一个参加排序;
完全数据与删失数据相同时,分别列出,完全数据列在删失数据前面,见上表第(1)栏。 (2) 列出各时间点死亡例数和删失例数,见表第(2)、(3)栏。 (3) 计算期初人数:每一时间点之前观察到的生存例数,即为期初例数,其计算公式为:
ˆi p
(6) 1−1/12 1−1/11 1−1/10 1−1/9 1−0/8 1−1/7 1−2/6 1−0/4 1−1/3 1−1/2 1−0/1
ˆ (t ) S i
(7) 0.9167 0.8333 0.7500 0.6667 0.6667 0.5714 0.3810 0.3810 0.2540 0.1270 0.1270