生存分析结课论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《生存分析结课论文》
——关于乳腺癌术后生存情况与患者年龄的研究
班级:
姓名:
学号:
2016年5月7日
目录
摘要
本文讨论45岁以上乳腺癌患者的术后生存状况。对44名45岁以上的乳腺癌患者的资料进行回顾性分析,按年龄分为两组,其中A组(<50岁,25例),B组(≥50岁,19例),探讨乳腺癌患者术后生存情况与患者年龄间的关系。结果有统计学意义(P<0.01)。年龄是乳腺癌的一个独立预后变量,但乳腺癌的其他影响患者生存状况因素如:临床分期、淋巴结转移、病理类型、手术方式对乳腺癌患者的影响也是不容忽视的。
关键词生存分析乳腺癌年龄Kaplan-Meier估计
Nelson-Aalen估计 Cox模型
1.问题的提出
乳腺癌是女性最常见的恶性肿瘤之一。且发病率呈逐年上升的趋势,在欧美国家,乳腺癌占女性恶性肿瘤的25%-30%.乳腺癌常发病于停经妇女,我国则常见于绝经前妇女,45—50岁发病率较高。中老年妇女是乳腺癌发病的主要对象。发病年龄较欧美国家年轻10岁左右。由文献报道年龄是一个对复发率有影响的独立因素,年龄在45-50岁的患者复发率增加,为比较不同年龄乳腺癌术后生存状况的差别。本文从生存状况变化的角度做生存性分析,探讨乳腺癌术后生存情况与患者间年龄关系。
2.数据的来源
选取患乳腺癌的44名妇女,初治均为手术治疗,分为两组。A 组为年龄在45岁到50岁的患者,B组为年龄在 50岁以上的患者。5年后得到下列复发时间。时间(月)
数据来源于《生存数据分析的统计方法》
A组 4 5 9 16 12 13 10 23 28 29 31 32 47 41 41 57 62 74 100 139 20+ 258+ 269+
B组 8 10 10 12 14 20 48 70 75 99 105 162 169 195 220 161+ 199+ 217+ 245+
3.模型方法介绍和总结
3.1 生存时间函数
描述生存时间分布规律的函数主要有生存函数、死亡概率函数、概率密度函
数和危险率函数。为了后文叙述方便,这里主要介绍生存函数和危险率函数。
3.1.1 生存函数
在描述生存规律的数量指标中,以往常用的指标是某个特定时间的生存率(例如:3
年生存率、5年生存率)。这一指标的主要缺陷为不能反映整个生存规律,一个理想的指标
应该是任意时间的生存率,即生存率是任意时刻t 的函数。其意义是研究个体生存时间长于
t 的概率。若令T 为生存期,s(t)为任意时刻t 的生存率,得
∞ (3.1) 则称)(t S 为生存率函数,简称生存函数。 从T 的分布函数)(t F 可知, )(1)(t F t S -= (3.2) 将)(t S 对t 在直角坐标系作图画出生存率曲线,陡峭的生存曲线表示低的生存率或的生存时 间。另外,从图上可粗略估计出中位生存时间,即生存曲线上取生存率为50%时所对应的时 间。 3.1.2 危险率函数(Hazard Function ) 如果我们考虑已活到t 时刻的患者,在时间t 附近的瞬间死亡危险性,根据数学上极限性质, 可表示为: h(t)=0t lim →∆ t )t T t t T t (∆≥∆+<≤ (3.3) 则称h(t)为危险率函数。即相当于条件瞬间死亡率。 3.1.3 S(T)与h(t)的关系 )()(0)(t H du u h e e t S t --=⎰= 其中⎰=t du u h t H 0)()(,称H(t)为累计危险率函数。 生存函数)(t S 和危险率函数)(t h 在不同的生存时间分布中(例如Weibull 、log logistic 等)有着特定的函数形式。 3.2.1 生存函数的估计 非参数法对生存数据的分布型没有相应的要求,因而适用面比较广。医学研究中,大量 的生存数据其分布是不规则、不确定或未知分布,因而常用非参数法估计生存率。根据样本 含量的大小可分别选择寿命表法或乘积限估计法。 Nelson-Aalen 估计 在有删失的情况下,可以根据累积死亡率与生存函数的关系()ln[()] H t S t ∧ =-来估计累积死亡力函数H(t)。这时估计式为:()ln[()]H t S t ∧∧=-。另外有一个累积死亡 力估计式,它与以乘积限估计式为基础的估计式相比,具有更好的小样本性质,这一估计式 由Nelson 建议,然后由Aalen 重新发现并加以改进,这就是Nelson-Aalen 估计式,即 在最大的时间观察范围内的定义如下: 0,(),i i i i t t i t t H t d t t y ≤⎧⎪≤⎪=⎨≥⎪⎪⎩∑ 该估计式的方差可以从下式得到: 2 2()i i H i t t i d t y σ≤=∑ 以累积死亡率的Nelson-Aalen 估计式为基础,生存函数的另一个估计式为: ()exp[()]S t H t ∧∧ =-。 Nelson-Aalen 估计式在分析数据时主要有以下两方面的应用,其一是在选 择事件发生时间的参数模型方面的应用,其二是为死亡率h(t)提供粗估计,这 些估计值是Nelson-Aalen 估计式的斜率。 3.2.1.2 乘积限估计法 当数据个体较少时,为充分利用每个数据的信息,必须采用更为精确的估计方法。这些 估计方法中应用最多、效率较高的是Kaplan-Meier 在1958年提出的乘积限估计(Product-limit estimator)。因而此法又称Kaplan-Meier 法。 乘积极限法适用于离散数据,它用于建立时刻t 上的生存函数。它的原理是根据t 时刻 及其之前各时间点上的条件生存率的乘积,来估计时刻t 的生存函数)(t S 和它的标准误 ))((t S SE 。设k t t t <<<...21代表k 个观察对象的生存时间,设i n 为i t 时刻之前生存的个体 数目,即危险集的大小),...,2,1(k i =,再设i d 表示生存时间的截尾性质,k i ,...,2,1=。又 令i P 表示观察对象在时刻i t 的条件生存率,即对于k i ,...,2,1=,有: i i i i n d n p -=,其中⎩ ⎨⎧=是截尾数据个生存时间如果第是完全数据个生存时间如果第i i i t i t i d ,0,1