第六讲 生存分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
id diagtime time prior therapy status cell
患者编号 诊断到治 疗时间 生存时间
治疗前处 0 理
治疗方案 病人状态 1 0 1
经过处理 1 标准方法 2 死亡 鳞癌 1 2
未经处理 实验方法 删失数据 小细胞肺癌 3 腺癌 4大细胞肺癌
七、以员工离职管理为例
S t exp hs ds
t 0
三、Cox回归模型
比例风险模型(Cox模型)
其中h0 t 是一个同X无关的基准风险函数。 它是等比例风险模型,这是因为
ht , X1 h0 t exp X1' ' exp X1 X 2 ' ht , X 2 h0 t exp X 2
六、Cox Regression 风险比例模型分析
因变量:生存时间,时间变量是数值型,状态变 量可以是分类或连续型变量;
自变量:与生存时间有关的一组变量;
比例风险假设:从一个事件到另一个事件的风险 比例不随时间而变化
一般来说,使用向后消去法可以减少漏掉潜在的 有价值的预测因子
实例
根据一组137位肺癌患者生存时间的数据,辨认预测因素
五、KM分析(Kaplan-Meier分析)
时间变量是数值型
状态变量是二分变量或分类变量 发生的事件可以用一个正数值或用某个范围的连 续数值表示 假设:事件发生的概率仅依赖于时间
案例:根据某医院对 58 例肾上腺样瘤病人在不同 治疗中的数据,分析在切除或不切除肾脏条件下 两种治疗方案的结果是否有显著差异。
模型分析
KM分析
实际操作
生存函数
对比分析
Cox等比例风险模型分析
参数估计结果
Cox模型的优劣
缺点:
不好懂 优点:
对模型设定要求较弱 应用广泛
课后习题
癌症临床试验数据研究
1.研究目的:对比评估某新治疗方案的疗效; 2.数据介绍:
因变量是病人的生存时间和生存状态,
自变量是不同治疗方案、癌细胞类型、临床打分、 病人年龄; 3. 作业要求:做完整的生存数据回归分析,包括参 数估计、假设检验,以及预测评估。
背景介绍
企业如何留住自己的员工
数据说明 数据来源: 国内某大型商业银行人力资源部门,1300个
样本
因变量:
Y:员工在职时间
C:是否已经离职
解释变量
X1:户籍 X2:性别 X3:年龄
描述分析 员工的平均在职时间有多长?
均值?中位数?
1.整体的描述分析
2.来自百度文库比分析
分户籍生存函数 分性别生存函数 分年龄生存函数
第六讲 生存分析
——以员工离职管理为例
一、生存分析与生存数据
生存分析应用于生物医学、工业、社会科学等领 域,比如肿瘤患者治疗后生存时间、电子设备的 寿命、婚姻持续时间、员工工作时间等等; 生存数据特点:在研究期间结束时在某些个体身 上还没有发生,如果所观测的数据含有事件称为 删失数据。比如,员工在企业的工作时间就是生 存数据,把员工加入企业看作“出生”,离职看 作“死亡”,工作时间就是看作“生存时间”;
二、生存时间函数
生存函数(累积生存率) S t PZ t
概率密度函数
f t lim Pt Z t t t 0 t
危险率函数(风险函数)
ht lim
Pt Z t t | Z t f t t 0 t S t
ht h0 t e
1x1 2 x2 k xk
极大似然估计
参数估计
Cox模型允许基准风险 h0 t 的函数形式任意,不需 要为基准风险设定函数形式,可以照常估计回归系 数
估计方法
极大似然估计
统计学推断
四、生命表分析
生命表用来概括在特定的时期里特定人口的死亡 情况,是一种非参数分析方法 实验研究饮食与肿瘤之间的关系,对 90 只老鼠分 成3组,在相同环境下,分别给予低脂饮食、饱和 饮食和不饱和饮食,注射等量的肿瘤细胞,观测 200天,做出不同喂养方式下的生存时间表,比较 不同喂养方式下生存的时间是否有显著性差异。