生存分析之一
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、生存率计算中 可能存在的问题
当各组的生存曲线发生交叉 现象时,应查明原因,考虑 是否存在混杂因素的影响, 必要时需对重要非处理因素 进行分层分析。
3、生存率的合理计算方法
上述可能导致“5年生存率”大 于“3年生存率”的两种情况正 是生存资料两个突出特点之一, 即生存资料含不完全的信息,需 要采用专门处理生存资料的统计 分析方法(即生存分析)来分析 此类资料。
治疗或手术后活过 1年的患者数 1年生存率 治疗或手术后观察满 1年的患者总人数
公式(3)
1、生存率的概念
同理,可以定义“3年生存率”、 “5年生存率”、“10年生存率”、 、“n年生存率”,如“n年生 存率”定义为:
治疗或手术后活过 n年的患者数 n年生存率 治疗或手术后观察满 n年的患者总人数
1、生存率的概念
一组患相同疾病的患者经 过治疗后,在一段时间内 各时点上均有可能出现死 亡,各时点上的死亡概率 q和生存概率p的定义分别 如下:
1、生存率的概念
各时点上的死亡概率:
该时点上死亡人数 q 该时点上被观察的总人 数
各时点上的生存概率: P=1-q
1、生存率的概念
然而,通常人们所说的“1年生存率”的含 义是什么呢?并非指恰好在“第365天的生 存概率”,而是指“在365天之内一直存活 的概率”,故其计算公式如下:
2、生存率计算中 可能存在的问题
因为当出现上述两种情况或其中 之一并用式(4)计算5年生存率 时,上述两种情况的患者只能排 除在分母之外,即分母变小,故 可能会出现5年生存率大于3年生 存率的反常现象。
2、生存率计算中 可能存在的问题
另外,两组患者在某一段时间内 的生存曲线并非始终平行,若仅 用时点生存率的大小来比较或评 价,很容易产生偏性,需要同时 考察多个时点,更好的做法是直 接比较两条或多条生存曲线之间 的差别有无统计学意义;
2、生存资料的特点
在表达删失数据时,常在其右上角放一个 “+”号;而用SAS软件分析时,常在 其前放一个“-”号或产生1个指示变量 (如:C=1表示删失数据、C=0表示完全 数据,反过来也可以),便于计算时区别 对待。为了使数据的表达与计算在形式上 统一起来,本章一律用负数表示删失数据, 因生存时间不可能为负值,故不会产生混 淆。
公式(4)
2、生存率计算中 可能存在的问题
根据常理可知:“n年生存率” 应小于“(n-1)年生存率”, 然而,由上述计算“n年生存率” 的定义式中不难发现,当出现下 列两种情况或其中的一种情况时, 可能会出现5年生存率大于3年生 存率的不合理现象,即:
来自百度文库
2、生存率计算中 可能存在的问题
第一种情况:患者在治疗或 手术后3到5年间死于其他疾 病; 第二种情况:患者在治疗或 手术后3到5年间因迁移等原 因失访。
3、生存资料的描述
定量描述法:用“中位数”表示平均水 平,用“四分位数间距”表示离散度大 小。 定性描述法:用“1年生存率”、“3年 生存率”、、“n年生存率”等时 点生存率定性地描述一组患者在特定时 点上的生存质量大小;用生存曲线反映 整体的生存水平高低。
二、生存率的概念、合理 计算方法及描述方法 1、生存率的概念 2、生存率计算中可能 存在的问题 3、生存率的合理计算 方法
2、生存资料的特点
如何处理删失数据?对于删失数据, 既不能简单地弃之,又不能像对待 完全数据那样给予充分的信任,需 要采取一些技术处理。专门处理这 种资料的统计分析方法,称为生存 分析(Survival Analysis)。
2、生存资料的特点
为什么生存资料一般不服从正态分布? 这是由于生命现象的本质特征所决定的, 一批患同一种癌症的患者,经过相同方 案治疗后,少数人在很短时间内就死亡 了,绝大部分患者在一段较长的时间内 生存着,还有极少数患者会存活10年、 20年,甚至更长时间。所以,生存资料 一般呈现极严重的正偏态分布。
3、生存率的合理计算方法
在单因素生存资料的分析中,应将 各时间点上的生存概率全部计算出 来,自小到大连乘,一直乘到所期 望的时刻为止,这种计算生存率的 方法被称为“Kaplan-Meier法, 简称KM法”,也叫做“乘积-极限 法,即Product-Limit法,简称PL 法”。
3、生存率的合理计算方法
一、生存资料的概念、 特点及描述
1、生存资料的概念 2、生存资料的特点 3、生存资料的描述
1、生存资料的概念
什么叫生存资料?生存资料 (Survival Data)或失效时间资 料(Failure-time Data)与多元 线性回归资料很相似,只不过因 变量(或反应变量)通常为观测对 象生存的时间,常用t来表示。
1、生存资料的概念
当然,生存时间是广义的,可以 指在通常意义下生物体的生存时 间、也可以指所关心的某现象 (如疾病治愈后、合格品使用后) 持续的时间。若生存时间是准确 观测到的,则称为完全数据,否 则,称为删失数据。
2、生存资料的特点
生存资料有两个明显特点:其一、 所收集的资料中常常包含不完全 数据,也称为截尾数据、删失数 据、终检数据(Censored Data);其二、生存资料一般不 服从正态分布。
2、生存资料的特点
删失数据是如何产生的?导致数据删失有 多种原因,最常见的有:失访(病人因搬 家、随访信件丢失、车祸等原因,导致医 生对他们的随访观察中断)和研究截止。 由随机因素引起的,称为随机删失;若事 先就定了截止日期,则称为定时删失(也 称Ⅰ型删失);若事先就定了观察完多少 例就截止研究,则称为Ⅱ型删失(也称为 定数删失)。
生存资料统计分析 (第一讲)
作者与讲授:胡良平
单位:军事医学科学院生物医学 统计咨询中心
说明
为《中华耳鼻咽喉科》杂志 编辑委员会举办的全国培训 班讲科研设计与统计分析课 程; 本讲为“生存资料统计分析 的第一讲”。
讲授提纲
一、生存资料的概念、特点 及描述 二、生存率的概念、合理计 算方法及描述方法 三、单因素k水平设计(k2) 生存率的比较