随访资料的生存分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生存率是相对于时间t的函数,称为生存函数,记为S(t)。
• 生存函数在某时点的值就是生存率。例如,S(5)=0.1832,习
惯上说5年生存率为18.32%。
生存函数或生存率的计算
①若前t个时段没有删失:
t时段结束时仍存活的人 数 S ( t ) P( T t ) 研究期初观察总人数
例如:
截尾数据(截尾值、删失数据,censored data):
尚未观察到研究对象出现反应(终点事件)时,即由于某种原 因停止了随访,这时记录到的时间信息是不完整的,这种生 存时间数据称为不完全数据或截尾值。截尾值能提供部分信 息,即该研究对象实际的生存时间只会长于观察到的时间。
生存分析中的基本概念
截尾值出现的原因有以下三种: ① 失访:观察期内由于研究对象搬迁、不 配合等原因造成失访; ② 退出:观察期内研究对象意外死亡、死 于其它疾病或改变治疗方案等而中途退 出研究; ③ 终止:观察期结束时仍未出现结局。
若该时段内有删失,则分母用校正人口数: 校正人口数=期初观察人数-删失数/2
生存分析中的基本概念
(三)生存概率、生存率、生存函数
2. 生存率和生存函数:
• 生存率(survival rate) :指研究对象经历t个时段后仍存活的概
率,即生存时间大于等于t的概率,用P(T≥t)表示。
• 生存函数(survival function):生存率随时间t的变化而变化,即
生存分析中的基本概念
(一) 生存时间(survival time):
3、生存时间资料的整理:
对于随访资料,需要记录的原始数据包括开始观察的时点
(起始事件发生的时间)、终止观察的时点、研究对象的结
局、可能的影响因素。生存时间为一反映时间长短的指标,
属数值变量,可按下式计算:生存时间(t)=终止观察的时 点-开始观察的时点,结局变量()反映终点事件是否发生,
n年生存率1 p0 1 p1 1 p2 ...... 1 pn1
生存分析中的基本概念
(四)生存率曲线(survival curve):以时间为
横轴、生存率为纵轴绘制的曲线。
(五)中位生存期(median survival time,半
数生存期):即生存时间的中位数,反映生 存时间的平均水平。表示生存率等于50%时 的时间。
随访资料的生存分析
山东大学公共卫生学院 刘静
第一节
概 述
随访资料是指对一批研究对象进行追踪观察
所获得的有关其结局以及出现这种结局所经 历的时间等方面的资料。 随访资料常因失访等原因造成某些数据不完 全,需要用专门的方法进行统计处理。由于 随访资料的分析最初起源于对寿命资料的统 计分析,故称为生存分析(survival analysis), 或称为生存时间分析。
生存分析的研究内容
生存分析的研究内容主要包括以下三个方面: ① 对生存时间进行统计描述; ② 寻找影响生存时间长短的“危险因素”(包 括正危险因素和负危险因素); ③ 估计生存率和生存时间长短,进行预后评 价。
生存分析中的基本概念
生存时间
死亡概率、死亡率 生存概率、生存率、生存函数、生ቤተ መጻሕፍቲ ባይዱ率曲线
型:
完全数据(complete data) 截尾数据(截尾值、删失数据,censored data)
生存分析中的基本概念
(一)、生存时间(survival time):
生存时间的两种数据类型:
完全数据(complete data):观察对象在观察期内出现
反应(终点事件),这时所记录到的时间信息是完整的,这种 生存时间数据称为完全数据。
为一二分类的变量。通常用(t,)完整地表示一个观察对
象的随访结果。
原始数据的记录和整理:
教材151页表12-1和图12-1、图12-2。
生存分析中的基本概念
(二) 死亡概率和死亡率:
1. 死亡概率(mortality probability):是指某单位时
段开始时尚存的研究对象在该单位时段内死亡的 可能性大小。
某单位时段内死亡数 m 1000 % 该时段平均人口数
平均人口数=(该时段期初人口数+期末人口数)/2
生存分析中的基本概念
(三)生存概率、生存率、生存函数
1.生存概率(survival probability):表示某单位时 段开始时尚存活的个体到该时段结束时仍然 存活的可能性大小。
活满某时段的人数 p 1- q 该时段期初观察人数
生存分析中的基本概念
(一)、生存时间(survival time):
2、特点:
① 分布类型不易确定。一般不服从正态分布,少数情 况下近似服从指数分布、Weibull分布、Gompertz 分布等,多数情况下往往是不服从任何规则的分布 类型。 ② 影响因素多而复杂且不易控制。 ③ 根据研究对象的结局,生存时间数据可分为两种类
活满n年的人数 n年生存率 100% 研究期初观察人数
②若观察期内有删失:假定观察对象在各个单 位时段内是否生存的事件是相互独立的,其 生存概率分别为p1,p2,p3,……,pt, 则根据概率 的乘法原理得S(t)=p1p2p3…pt。
故生存函数又称累积生存概率(cumulative
probability of survival),即将时刻t尚存活看 成是前t个时段一直存活的累计结果。
某单位时段内死亡数 q 该单位时段的期初观察 人数
若该时段内有删失,则分母用校正人口数:
校正人口数=期初观察人数-删失数/2
生存分析中的基本概念
(二) 死亡概率和死亡率:
2.死亡率(mortality rate):指单位时间里研究对象 的死亡频率或强度,即平均每千人(或万人、百 人等)中的死亡人数。
半数生存期
危险率函数
死亡密度函数
生存分析中的基本概念
(一)、生存时间(survival time):
1. 定义: 狭义:指病人从发病到死亡所经历的时间。
广义:从某个起始事件开始到规定的终点事件发 生(出现反应)所经历的时间。也称失效时间 (failure time)。如:某病从治疗到痊愈的时间、 从接触某种危险因素到发病的时间、癌症患者从 接受手术治疗到死亡的时间、婴儿出生到囟门闭 合的时间、婴儿出生到第一颗乳牙萌出的时 间……均可称为生存时间。