第一章生存分析介绍

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

正文(Presentation)
该章给出了生存分析的总体介绍, 基于流行病学特定类型或其他数据的流 行的数据分析步骤。这一章的重点是生 存分析涉及的问题、目的、主要的术语 及符号、原始数据编排、实例。
问题 目的
重点
术语及符号 数据排版 例题
一 生存分析
一般而言,生存分析是数据分 析的统计学过程的集合。它所关心 的结局变量为研究事件发生时的时 间。
由风险函数的公式可知,极限符号右侧是 两个数值之比,分子是条件概率,分母是一个 小的时间区间,分子与分母相除以后得到的是 每单位时间的概率,不再是概率而是比率,它 的取值范围与概率的取值范围不同,概率的取 值范围为0-1,而极限符号右侧的取值范围为 0-∞,其大小取决于时间的单位是天、周、月 还是年。
2 删失数据
一般造成删失的原因有三个 1 直到研究结束时研究对象仍未发生终点事件 2 研究对象在研究期间发生失访 3 研究对象因死亡而退出研究(如果死亡不是研究者 感兴趣的事件)或其他原因(如药物副反应或其他风 险)
研究结束——终点事件未发生
删失 失访 中途退出
2 删失数据
以图例的形式描述几个研究对象的随访经历,以X表 示发生终点事件的研究对象。 例
因为该章主要是描述性内容,数学、统 计学、流行病学知识并不是绝对必要的。但 是读者对流行病学原理以及对数学符号和公 式的了解将会大有利于对本书的学习。
简略摘要
• • • • • • • • • • 1 什么是生存分析 2 删失数据 3 术语及符号 4 生存分析的目的 5 基于计算机应用的数据格式 6 用于理解分析的数据格式 7 生存时间的描述性统计 8 例题 9 多变量例题 10 生存分析的数学模型
三 术语与符号
3 术语与符号
T——随机变量 ,生存时 间,大于或等于0
t——随机变量T的某一个 确切值,例如,观察某个 研究对象经过癌症治疗以 后生存期能否超过5年, 此时 t=5,T>5?
3 术语与符号
以希腊字母 作为终点事件是否发 生的指示变量,它是一个随机变量
研究结束时未发生终点事件
=0 失访
2 删失数据
左删失——研究对象的确切生存时间小于或等于观察的生 存时间。例如,随访一个研究对象直到他表现为HIV阳性,研 究者一般将研究对象第一次HIV测试阳性作为终点事件。但是 研究者不知道研究对象接触到HIV病毒的确切时间,也就不知 道研究对象确切的HIV呈阳性的时间。这样该研究对象的生存 时间属于左删失,因为他真正的生存时间是从随访开始到感染 HIV的时间,小于观察的生存时间(从随访开始到HIV测试阳性 的时间)
第一个图是健康人群的 风险函数图,由图可知, 不论t取何值,h(t)均等于 一个常数—— ,即对 于一个研究对象而言, 若他/她在研究期间一直 保持健康状态,那么他/ 她在研究期间的任何时 间患病的瞬时可能性均 相同。当风险函数为一 常数时,这时的生存模 型就是指数模型
• 10 应用于模型理论理解的编排格式或组成 部分的识别或辨认,特别是能够按照这种 编排格式进行数据设置 • 11 实例的生存曲线或风险函数的解释及比 较 • 12 给出一个实例,根据解释变量与生存时 间之间的关系来陈述生存分析的目的 • 13 平均生存期或平均风险的计算或解释 • 14 两组生存数据风险比的定义或解释
3 术语与符号
趋于零,对公式右侧的表达式取极 限,可以得到t时刻每单位时间失效事件发 生的概率。另一种说法是风险函数或条件 风险比表示已生存到t时刻的研究对象,在t 时刻每单位时间失效事件发生的瞬时可能。
t
3 术语与符号
下图是三个风险函数随时间变化的图形, 不同于生存函数,风险函数的取值不一定 从1开始,一直下降为0,而是可以从任意 值开始,向任意方向上升或下降,但总是 大于零。
2 删失数据
研究对象A在研究开始时进入研究,五周后发生终点事 件,他的生存时间是5周,不属于删失 研究对象B也是在研究开始时进入研究,但是在12周的 研究期结束以后仍未发生终点事件,生存时间属于删 失,因为我们只知道他至少生存的12周 研究对象C在研究开始后第2.5周进入研究,在第六周 时退出研究,他的生存时间为3.5周,属于删失 研究对象D在研究开始后第4周进入研究,直到研究结 束时仍未发生终点事件,他的删失时间为8周 研究对象E在研究开始后第3周进入研究,在随访到第 九周时发生失访,他的删失时间为6周 研究对象F在研究开始后第8周进入研究,随访到第11.5 周时发生终点事件,与研究对象A一样,没有发生删失, 他的生存时间为3.5周
3 术语与符号
风险函数公式极限符号右侧的分子部分是一 个条件函数,它表示在给定条件A的前提下,B的 概率。即已经生存到t时刻的研究对象在(t,t+t) 时间区间内终点事件发生的概率。
由于风险函数利用了条件概率的形式,因此风险函 数有时被称为条件风险率。
3 术语与符号
风险函数是一个比率而不是概 率
时间
研究事件
1 生存分析
研究事件:死亡、发病、复发、 痊愈
假设结局为一个研究事件
>一个研究事件 周期性事件 或 竞争性危险
时间 事件
生存时间 终点事件
1 生存分析
简要介绍关于生存分析的五个 例题
第一个例子:,对处于缓和期的白血病患 者,随访几个星期后,看其能保持缓和期 多长时间。第二个例子:对一个身体健康 无疾病的队列,随访几年后看有哪些研究 对象患心脏病。第三个例子:对一个年龄 大于60岁的人群,随访13年,观察他们的 生存期。第四个例子:对一些新近释放的 假释犯,随访几个星期,观察他们是否又 被重新拘捕。这种研究称为累犯研究。第 五个例子:追踪随访经过心脏移植手术的 患者的生存期。
1 生存分析
生存时间:单位是年、月、周、日。是从对 研究对象开始随访到研究事件发生的时间。 研究事件:可以是死亡、疾病发生、复发、 痊愈或者是任何事先指定的感兴趣的事件。 虽然在一次研究中会有不止一个结局事件发 生,但是我们假设只有一个事件是研究者感 兴趣的。当考虑的结局事件不止一个时,涉 及到的统计学问题为周期性事件或竞争性危 险问题,这将在第八、第九章中分别介绍。
第一章 生存分析介绍
• • • • • • • • 1 导言 2 简略摘要 3 目标 4 正文 5 总结 6 练习 7 实验 8 练习答案
导言
这一章给出了生存分析数据的描述性分析 步骤。分析步骤包括生存分析涉及的问题类 型、结局变量的考虑、删失数据的考虑、生 存函数和风险函数的表述、生存分析数据的 规划(即数据输入计算机时的编排方法)、 生存分析的目标、生存分析实例。
以生存时间t为横轴,生存函数s(t)为纵轴,绘制生存曲线。 由图可以观察得到生存曲线的以下特点
(1)生存曲线是一条非增曲线,随着t的增加,不断下降。 (2)t=0时,s(t)=s(0)=1。即研究开始时,没有研究对象出现终点事 件。在0时刻的生存概率为1 (3)t→∞时,s(t)=s(∞)=0。即理论上,若研究时间没有限制,最后 将没有研究对象存活。所以生存曲线最终下降为0。 这种情形是生存曲线的理论模型
3 术语与符号
Βιβλιοθήκη Baidu
举例说明风险函数的取值,以P表示条件概率, P=1/3,时间区间t 为1/2天,两数相除可得每单位时 间的概率,P值保持不变,时间区间的单位由天改 为周,则1/2天等于1/14周,两数相除可得每单位时 间的概率,计算结果见下表
t
3 术语与符号
对于相同的条件概率,时间区 间的单位不同时,计算得到的结果 不同,其值有可能大于一。
1 生存分析
在生存分析中,通常把时间变量称为生 存时间,因为它代表了研究对象在随访期间 “生存”的时间。研究事件称为终点,因为 研究事件通常是死亡、疾病发生或其他消极 事件。生存时间也可以是经过外科手术重返 工作岗位的时间按。这里的终点是一个积极 事件。
1 生存分析
结局变量:研究事件发生的 开始随访
学习目标
• • • • • • • • • 1 辨认或描述生存分析所涉及的问题类型 2 删失数据的定义 3 右删失数据的定义 4 造成数据删失的三个主要原因 5 生存函数的定义、辨认、解释 6 风险函数的定义、辨认、解释 7 生存函数与风险函数的关系 8 生存分析的三个主要目的 9 应用于计算机的原始数据编排格式的识别 或辨认,特别是能够按照这种编排格式进 行数据设置
1 生存分析
以上五个例子均属于生存分析的范畴,因为他 们的结局变量都是某个特定事件发生时的时间。在 第一个关于白血病患者的例子中,研究者感兴趣的 终点事件是患者脱离缓和期,结局变量是处于缓和 期的病人从进入研究到脱离缓和期所用的时间 (周)。第二个例子的终点事件是“患心脏病”, 结局变量是健康人群从进入研究到患心脏病所用的 时间(年)。第三个例子的终点事件是死亡,结局 变量是年龄大于60岁的人群从进入研究到死亡所用 的时间(年)。第四个例子是一个社会学研究而不 是一个医学研究,所关心的终点事件是“重新被拘 捕”,结局变量是假释犯从被释放到再一次被拘捕 所经历的时间(周)。第五个例子的终点事件是死 亡,结局变量是患者从接受心脏移植到死亡生存的 时间。
2 删失数据
总结 六个研究对象中,有两个发生终点 事件,为A与F,四个发生删失, 为B、C、D、E。
2 删失数据
六名研究对象的生存时间表
在该表最后一列中,以1表示研究对象发生了终点事件,以0表示发生删失。生存时 间的单位为周
2 删失数据
删失类型
2 删失数据
右删失——当研究结束时研 究对象未发生终点事件、失访、 中途退出造成的删失称为右删失。 虽然研究对象也可能发生左 删失,但大部分删失都是右删失。
3 术语与符号
h(t)表示在时间t仍存活的研究对象,每单 位时间终点事件发生的瞬时可能。与生存函数 相反,生存函数关注的是未发生终点事件,风 险函数关注的则是终点事件的发生。在某种程 度上,风险函数可以认为是给出了生存函数蕴 含的信息的相反的一面。
3 术语与符号
以速度的例子解释瞬时可能的意义。在你开车时看到 速度仪显示的速度为60英里每小时,这意味着在未 来的一小时内你将在这条路上行驶60英里。这就是 瞬时可能的意义。速度仪上的数字决定你在未来一小 时内行驶多长的距离。由于你可能在未来的一小时内 减速或加速,也有可能停车,所以60英里每小时的 读数并不能说明你在未来一小时内真正行驶的距离。 速度仪仅仅说明你在某一瞬间的行驶速度。 与速度的含义相似,风险函数表示生存到t时刻的研 究对象,在t时刻失效事件(死亡或发病)发生的瞬 时可能。这与速度的例子是类似的,假设你已经行驶 了一段时间,这时速度仪上的速度也是一个瞬时可能。
3 术语与符号
对于实际数据,生存函数的图形是阶梯 状的,而不是光滑曲线。由于研究期限不可 能无限长以及竞争风险的存在,因此不是所 ˆ 表示 有的研究对象都会发生终点事件。以s 估计的生存函数,在研究结束时,生存曲线 不一定下降为0 。
3 术语与符号
以h(t)表示风险函数,风险函数 公式为
t 表示一个小的时间区间
二 删失数据
绝大多数的生存分析必须考虑 删失问题,当我们获得了研究对象 生存时间的部分信息,而不知道确 切的生存时间时,删失就发生了。
删失——不知道确切生存时间
2 删失数据
举一个简单的关于删失的例子,以X表示一组处于缓和 期的白血病患者,对他们进行随访直到这些患者脱离 缓和期。对于某个患者,当研究结束时,他仍处于缓 和期,终点事件没有发生,该病人的生存时间就认为 是删失的。对于这个患者,他的生存时间至少是研究 者对他进行随访的时间,但是若他在研究结束以后才 脱离缓和期,研究者就不知道他的确切的生存时间。
中途退出
3 术语与符号
生存函数与风险函数
3 术语与符号
生存函数表示研究对象活过某 个时间的概率,即T>t的概率
3 术语与符号
生存函数是生存分析的基础,因 为知道了不同t值的生存概率,就 获得了关于生存数据的最关键信 息 理论上,t的取值范围为0-∞, 生存函数的图形是一条光滑的 曲线
3 术语与符号
3 术语与符号
对于一个给定的t值,风险函数 具有以下两个特点:
1 风险函数是非负的,h(t) ≥0 2 风险函数没有上界,即风险函数的取值 范围为0-∞
原因:由风险函数的公式可知, 风险函数的分子与分母都是非负 的,分母 t 的取值范围为0- ∞
3 术语与符号
风险函数的图形类型 1 常数风险函数
相关文档
最新文档