第六讲 生存分析要点

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二、生存时间函数
生存函数(累积生存率)
St PZ t
概率密度函数
f t lim Pt Z t t
t 0
危险率函数(风险函数)
t
ht
lim
t 0
Pt
Z
t t
t
|
Z
t
f t S t
St
exp
t
0
hsds
三、Cox回归模型
比例风险模型(Cox模型)
h t h t e1x12x2 k xk 0
估计方法 极大似然估计
统计学推断
四、生命表分析
生命表用来概括在特定的时期里特定人口的死亡 情况,是一种非参数分析方法
实验研究饮食与肿瘤之间的关系,对90只老鼠分 成3组,在相同环境下,分别给予低脂饮食、饱和 饮食和不饱和饮食,注射等量的肿瘤细胞,观测 200天,做出不同喂养方式下的生存时间表,比较 不同喂养方式下生存的时间是否有显著性差异。
KM分析
实际操作
生存函数 对比分析
Cox等比例风险模型分析
参数估计结果
Cox模型的优劣
缺点: 不好懂
优点:
对模型设定要求较弱 应用广泛
课后习题
癌症临床试验数据研究
1.研究目的:对比评估某新治疗方案的疗效; 2.数据介绍:
因变量是病人的生存时间和生存状态, 自变量是不同治疗方案、癌细胞类型、临床打分、 病人年龄; 3.作业要求:做完整的生存数据回归分析,包括参 数估计、假设检验,以及预测评估。
六、Cox Regression 风险比例模型分析
因变量:生存时间,时间变量是数值型,状态变 量可以是分类或连续型变量;
自变量:与生存时间有关的一组变量; 比例风险假设:从一个事件到另一个事件的风险
比例不随时间而变化 一般来说,使用向后消去法可以减少漏掉潜在的
有价值的预测因子
实例
根据一组137位肺癌患者生存时间的数据,辨认预测因素
五、KM分析(Kaplan-Meier分析)
时间变量是数值型 状态变量是二分变量或分类变量 发生的事件可以用一个正数值或用某个范围的连
续数值表示 假设:事件发生的概率仅依赖于时间 案例:根据某医院对58例肾上腺样瘤病人在不同
治疗中的数据,分析在切除或不切除肾脏条件下 两种治疗方案的结果是否有显著差异。
id
患者编号
诊断到治 diagtime 疗时间
time
生存时间
prior
治疗前处

0
经过处理 1 未经处理
therapy 治疗方案 1 标准方法 2 实验方法
status cell
病人状态 0 死亡 1 鳞癌
1 删失数据 2 小细胞肺癌 3 腺癌 4大细胞肺癌
七、以员工离职管理为例
背景介绍 企业如何留住自己的员工
数据说明 数据来源:国内某大型商业银行人力资源部门,1300个
样本
因变量:
Y:员工在职时间 C:是否已经离职
解释变量
X1:户籍 X2:性别 X3:年龄
描述分析 1.整体的描述分析
员工的平均在职时间有多长?
均值?中位数?
2.对比分析 分户籍生存函数 分性别生存函数 分年龄生存函数
模型分析
其中h0 t 是一个同X无关的基准风险函数。
它是等比例风险模型,这是因为
wk.baidu.com
ht,
ht,
X1 X2
h0 t exp h0 t exp
X 1'
X
' 2
exp X1 X 2 '
极大似然估计
参数估计
Cox模型允许基准风险h0t 的函数形式任意,不需
要为基准风险设定函数形式,可以照常估计回归系 数
第六讲 生存分析
——以员工离职管理为例
一、生存分析与生存数据
生存分析应用于生物医学、工业、社会科学等领 域,比如肿瘤患者治疗后生存时间、电子设备的 寿命、婚姻持续时间、员工工作时间等等;
生存数据特点:在研究期间结束时在某些个体身 上还没有发生,如果所观测的数据含有事件称为 删失数据。比如,员工在企业的工作时间就是生 存数据,把员工加入企业看作“出生”,离职看 作“死亡”,工作时间就是看作“生存时间”;
相关文档
最新文档