cox模型及其应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若是未知分布或有缺失值数据,存在一定的问题和难度
(3)预后因素对生存时间的影响
即x对s(t)、h(t)的影响,也就是 x与s(t)、h(t)之 间可建立回归模型。
2、模型构造的两大部分:基本部分和修改部分
假定x1,x2,…,xp为协变量或影响因素;h(t)为具有协变 量x1—xp的个体在t时刻的风险函数或死亡率,表示生存时间已达 t的人在t时刻的瞬时死亡率;h0(t)为t的未知函数,即x=0时t时 刻的风险函数,称为基准风险函数。h(t)是h0(t)受所有协变 量修改的结果。
3.生存时间与截尾时间
生存时间(survial、failure、waiting time) 从某个起始事件开始到某个终点事件的发生所
经历的时间。 截尾时间(censored):研究对象某一时间进入随 访到出现失访。 真实的生存时间未知,只知道比观察到的截尾生存 时间要长。
二、生存数据特点
1.数据的分布为独特分布,不规则,未知分布。 通常不服从正态分布。有时近似服从指数分布、 weibull分布、gompertz分布、对数logistic。
③当x为连续性变量时, RRt=e(x-x*)
2、RRt=eb=
h(t,1) h(t,0)
称为比例风险模型 (proportional hazards model)
第三节 cox模型的参数估计与统计推断
一、极大似然法估计 二、cox模型的似然函数(部分似然法)
partial likelihood function 1、无截尾数据的资料 例i=1—4,tj=t1—t4,(无截尾,无重合ties) ①危险集 rist set
2.不可避免地包含有截尾数据。
三、生存时间分布
1.生存函数--任意时刻生存率
s(t)=p(T≥t) 0≤t≤∞ ①中位生存期:又称半数生存期,表示恰好有50%的个 体尚存活的时间。 ②特定的生存函数都有特定的生存分布。
2.危险率函数(harzard fuction)
危险率:患者已活到t时刻,到t+ t这段时间内死
cox模型及其应用
主要用于生存分析
宁波大学医学院 沈其君
第一节 基本概念
一、随访研究与生存时间
1.随访研究 在队列研究中,对一批研究对象进行追踪观察
所获得的有关结局以及出现这种结局所经历的时 间等方面的研究。 目的:
a 估计生存率和生存时间长短,进行疗效 考核和预后评价。
b 对生存状况进行简单客观的统计描述 (生存概率、生存率、中位生存期等)。
手术切除
死亡
染毒
死亡
化疗
缓解
缓解
复发
终点事件和起始事件是相对而言的,它们都由研究目的决 定,须在设计时明确规定,并在研究期间严格遵守,不能 随意改变。
2.可能出现的随访结局(仅以死亡为终点为 例)
1.出现规定的结局(失效failure) 2.死于其他疾病 3.失访(只要未能观察到事先规定的终点事件) 4.随访结束时病人尚存活等 生存时间的类型 1. 完全数据(complete data)
第二节 COX模型结构及流行病学意义
一、问题提出
1、组间比较 2、多因素(协变量):回归
y=b0+b1x1+b2x2+…+bnxn
例如,恶性黑色素瘤的预后影响因素有部位、病程、治疗、 恶性程度、形态大小、是否转移等。
3、生存分析如何构建回归模型?
二、生存分析回归模型的一般构造
1、构造思想
(1)自变量x----影响因素 因变量y----生存时间 (2)x与y之间的表现形式
当b>0,则eb>1,h(t,1)>h(t,0) 当b<0,则eb<1,h(t,1)<h(t,0)
两组病人的危险性比值为
h(t,1) RRt= h(t,0) = eb
在某一时刻新疗法对于常规 疗法的危险性有多大
②当n=2时,x1=
1 0
x2=
1 0
h(t,11)=h0(t)eb1+b2 h(t,10)=h0(t)eb1 h(t,01)=h0(t)eb2 h(t,00)=h0(t)e0
3、生存分析的回归模型
Cox模型的基本形式为
h(t)=h0(t)exp( b1x1+b2x2+…+bnxn )
称此模型为比例风险模型。自变量x可以是各种预后影响因 素,也可以是这些因素的交互作用项;b1—bn为各协变量 所对应的回归系数。
4、参数估计方法
(1)全参数法 (2)半参数法 (3)非参数法
﹛ ﹜ R(t1)= 1,2,3,4 R(t2)=﹛2,3,4﹜ R(t3)=﹛3,4﹜ R(t4)=﹛4﹜
②似然函数的构造思想
t 4
L( )= i R
i 1
j
条件危险概率
各死亡 时点上各死亡之概率的乘积
1 Rt1 =
h0(t)分布要明确,极大似然法 cox模型的贡献在于可对h0(t)不作要求 h0和自变量的估计形式都未知
三、流行病学意义
假设cox模型为
h(t)=h0(t)exp( b1x1+b2x2+…+bnxn )
1、b1—bn为回归系数①当n=1时,x1=1 新疗法 0 常规疗法
exp(bx)=
eb h(t,1)=h0(t)eb e0 h(t,0)=h0(t)e0
从起点至死亡(死于所研究疾病)所经历的时间。 2. 截尾数据(删失数据,censored data)
从起点至截尾点所经历的时间。 【尚未观察到研究对象出现反应(终点事件)时,即由于 某种原因停止了随访,这时记录到的时间信息是不完整的, 这种生存时间数据称为不完全数据或截尾值。】截尾原因: 失访、死于其它疾病、观察结束时病人尚存活等。
c 探讨影响疗效和预后的“危险因素”及 “保护因素”。
随访研究的三个因素(两点一线)
起点事件:反映研究对象生存过程的起始特征的事件。
终点事件:研究者所关心的特定结局。
生存时间:从某个起始事件开始到某个终点事件的发生所 经历的时间。也称失效时间。
生存时间举例(小孩智齿除外?)
起始事件
终点事件
服药
痊愈
亡的(广义的死亡)可能性。(条件概率 ) 生存概率:单位时段开始存活的个体到该时段结束
时仍存活的可能性。
3.生存函数s(t)与危险率函数h(t)的关系
lim h(t)=
P(t T t t) t为任意时刻的危险率
t 0
t
t
e S(t)=
h(u)du
0
h(t)= t h(u)du 0
累积危险概率
(3)预后因素对生存时间的影响
即x对s(t)、h(t)的影响,也就是 x与s(t)、h(t)之 间可建立回归模型。
2、模型构造的两大部分:基本部分和修改部分
假定x1,x2,…,xp为协变量或影响因素;h(t)为具有协变 量x1—xp的个体在t时刻的风险函数或死亡率,表示生存时间已达 t的人在t时刻的瞬时死亡率;h0(t)为t的未知函数,即x=0时t时 刻的风险函数,称为基准风险函数。h(t)是h0(t)受所有协变 量修改的结果。
3.生存时间与截尾时间
生存时间(survial、failure、waiting time) 从某个起始事件开始到某个终点事件的发生所
经历的时间。 截尾时间(censored):研究对象某一时间进入随 访到出现失访。 真实的生存时间未知,只知道比观察到的截尾生存 时间要长。
二、生存数据特点
1.数据的分布为独特分布,不规则,未知分布。 通常不服从正态分布。有时近似服从指数分布、 weibull分布、gompertz分布、对数logistic。
③当x为连续性变量时, RRt=e(x-x*)
2、RRt=eb=
h(t,1) h(t,0)
称为比例风险模型 (proportional hazards model)
第三节 cox模型的参数估计与统计推断
一、极大似然法估计 二、cox模型的似然函数(部分似然法)
partial likelihood function 1、无截尾数据的资料 例i=1—4,tj=t1—t4,(无截尾,无重合ties) ①危险集 rist set
2.不可避免地包含有截尾数据。
三、生存时间分布
1.生存函数--任意时刻生存率
s(t)=p(T≥t) 0≤t≤∞ ①中位生存期:又称半数生存期,表示恰好有50%的个 体尚存活的时间。 ②特定的生存函数都有特定的生存分布。
2.危险率函数(harzard fuction)
危险率:患者已活到t时刻,到t+ t这段时间内死
cox模型及其应用
主要用于生存分析
宁波大学医学院 沈其君
第一节 基本概念
一、随访研究与生存时间
1.随访研究 在队列研究中,对一批研究对象进行追踪观察
所获得的有关结局以及出现这种结局所经历的时 间等方面的研究。 目的:
a 估计生存率和生存时间长短,进行疗效 考核和预后评价。
b 对生存状况进行简单客观的统计描述 (生存概率、生存率、中位生存期等)。
手术切除
死亡
染毒
死亡
化疗
缓解
缓解
复发
终点事件和起始事件是相对而言的,它们都由研究目的决 定,须在设计时明确规定,并在研究期间严格遵守,不能 随意改变。
2.可能出现的随访结局(仅以死亡为终点为 例)
1.出现规定的结局(失效failure) 2.死于其他疾病 3.失访(只要未能观察到事先规定的终点事件) 4.随访结束时病人尚存活等 生存时间的类型 1. 完全数据(complete data)
第二节 COX模型结构及流行病学意义
一、问题提出
1、组间比较 2、多因素(协变量):回归
y=b0+b1x1+b2x2+…+bnxn
例如,恶性黑色素瘤的预后影响因素有部位、病程、治疗、 恶性程度、形态大小、是否转移等。
3、生存分析如何构建回归模型?
二、生存分析回归模型的一般构造
1、构造思想
(1)自变量x----影响因素 因变量y----生存时间 (2)x与y之间的表现形式
当b>0,则eb>1,h(t,1)>h(t,0) 当b<0,则eb<1,h(t,1)<h(t,0)
两组病人的危险性比值为
h(t,1) RRt= h(t,0) = eb
在某一时刻新疗法对于常规 疗法的危险性有多大
②当n=2时,x1=
1 0
x2=
1 0
h(t,11)=h0(t)eb1+b2 h(t,10)=h0(t)eb1 h(t,01)=h0(t)eb2 h(t,00)=h0(t)e0
3、生存分析的回归模型
Cox模型的基本形式为
h(t)=h0(t)exp( b1x1+b2x2+…+bnxn )
称此模型为比例风险模型。自变量x可以是各种预后影响因 素,也可以是这些因素的交互作用项;b1—bn为各协变量 所对应的回归系数。
4、参数估计方法
(1)全参数法 (2)半参数法 (3)非参数法
﹛ ﹜ R(t1)= 1,2,3,4 R(t2)=﹛2,3,4﹜ R(t3)=﹛3,4﹜ R(t4)=﹛4﹜
②似然函数的构造思想
t 4
L( )= i R
i 1
j
条件危险概率
各死亡 时点上各死亡之概率的乘积
1 Rt1 =
h0(t)分布要明确,极大似然法 cox模型的贡献在于可对h0(t)不作要求 h0和自变量的估计形式都未知
三、流行病学意义
假设cox模型为
h(t)=h0(t)exp( b1x1+b2x2+…+bnxn )
1、b1—bn为回归系数①当n=1时,x1=1 新疗法 0 常规疗法
exp(bx)=
eb h(t,1)=h0(t)eb e0 h(t,0)=h0(t)e0
从起点至死亡(死于所研究疾病)所经历的时间。 2. 截尾数据(删失数据,censored data)
从起点至截尾点所经历的时间。 【尚未观察到研究对象出现反应(终点事件)时,即由于 某种原因停止了随访,这时记录到的时间信息是不完整的, 这种生存时间数据称为不完全数据或截尾值。】截尾原因: 失访、死于其它疾病、观察结束时病人尚存活等。
c 探讨影响疗效和预后的“危险因素”及 “保护因素”。
随访研究的三个因素(两点一线)
起点事件:反映研究对象生存过程的起始特征的事件。
终点事件:研究者所关心的特定结局。
生存时间:从某个起始事件开始到某个终点事件的发生所 经历的时间。也称失效时间。
生存时间举例(小孩智齿除外?)
起始事件
终点事件
服药
痊愈
亡的(广义的死亡)可能性。(条件概率 ) 生存概率:单位时段开始存活的个体到该时段结束
时仍存活的可能性。
3.生存函数s(t)与危险率函数h(t)的关系
lim h(t)=
P(t T t t) t为任意时刻的危险率
t 0
t
t
e S(t)=
h(u)du
0
h(t)= t h(u)du 0
累积危险概率