生存分析结课论文

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《生存分析结课论文》

——关于乳腺癌术后生存情况与患者年龄的研究

班级:

姓名:

学号:

2016年5月7日

目录

摘要

本文讨论45岁以上乳腺癌患者的术后生存状况。对44名45岁以上的乳腺癌患者的资料进行回顾性分析,按年龄分为两组,其中A组(<50岁,25例),B组(≥50岁,19例),探讨乳腺癌患者术后生存情况与患者年龄间的关系。结果有统计学意义(P<0.01)。年龄是乳腺癌的一个独立预后变量,但乳腺癌的其他影响患者生存状况因素如:临床分期、淋巴结转移、病理类型、手术方式对乳腺癌患者的影响也是不容忽视的。

关键词生存分析乳腺癌年龄Kaplan-Meier估计

Nelson-Aalen估计 Cox模型

1.问题的提出

乳腺癌是女性最常见的恶性肿瘤之一。且发病率呈逐年上升的趋势,在欧美国家,乳腺癌占女性恶性肿瘤的25%-30%.乳腺癌常发病于停经妇女,我国则常见于绝经前妇女,45—50岁发病率较高。中老年妇女是乳腺癌发病的主要对象。发病年龄较欧美国家年轻10岁左右。由文献报道年龄是一个对复发率有影响的独立因素,年龄在45-50岁的患者复发率增加,为比较不同年龄乳腺癌术后生存状况的差别。本文从生存状况变化的角度做生存性分析,探讨乳腺癌术后生存情况与患者间年龄关系。

2.数据的来源

选取患乳腺癌的44名妇女,初治均为手术治疗,分为两组。A 组为年龄在45岁到50岁的患者,B组为年龄在 50岁以上的患者。5年后得到下列复发时间。时间(月)

数据来源于《生存数据分析的统计方法》

A组 4 5 9 16 12 13 10 23 28 29 31 32 47 41 41 57 62 74 100 139 20+ 258+ 269+

B组 8 10 10 12 14 20 48 70 75 99 105 162 169 195 220 161+ 199+ 217+ 245+

3.模型方法介绍和总结

3.1 生存时间函数

描述生存时间分布规律的函数主要有生存函数、死亡概率函数、概率密度函

数和危险率函数。为了后文叙述方便,这里主要介绍生存函数和危险率函数。

3.1.1 生存函数

在描述生存规律的数量指标中,以往常用的指标是某个特定时间的生存率(例如:3

年生存率、5年生存率)。这一指标的主要缺陷为不能反映整个生存规律,一个理想的指标

应该是任意时间的生存率,即生存率是任意时刻t 的函数。其意义是研究个体生存时间长于

t 的概率。若令T 为生存期,s(t)为任意时刻t 的生存率,得

(3.1)

则称)(t S 为生存率函数,简称生存函数。

从T 的分布函数)(t F 可知, )(1)(t F t S -= (3.2)

将)(t S 对t 在直角坐标系作图画出生存率曲线,陡峭的生存曲线表示低的生存率或的生存时

间。另外,从图上可粗略估计出中位生存时间,即生存曲线上取生存率为50%时所对应的时

间。

3.1.2 危险率函数(Hazard Function )

如果我们考虑已活到t 时刻的患者,在时间t 附近的瞬间死亡危险性,根据数学上极限性质,

可表示为:

h(t)=0t lim →∆ t )t T t t T t (∆≥∆+<≤ (3.3)

则称h(t)为危险率函数。即相当于条件瞬间死亡率。

3.1.3 S(T)与h(t)的关系

)()(0)(t H du u h e e t S t --=⎰= 其中⎰=t

du u h t H 0)()(,称H(t)为累计危险率函数。 生存函数)(t S 和危险率函数)(t h 在不同的生存时间分布中(例如Weibull 、log logistic

等)有着特定的函数形式。

3.2.1 生存函数的估计

非参数法对生存数据的分布型没有相应的要求,因而适用面比较广。医学研究中,大量

的生存数据其分布是不规则、不确定或未知分布,因而常用非参数法估计生存率。根据样本

含量的大小可分别选择寿命表法或乘积限估计法。

Nelson-Aalen 估计

在有删失的情况下,可以根据累积死亡率与生存函数的关系()ln[()]

H t S t ∧

=-来估计累积死亡力函数H(t)。这时估计式为:()ln[()]H t S t ∧∧=-。另外有一个累积死亡 力估计式,它与以乘积限估计式为基础的估计式相比,具有更好的小样本性质,这一估计式

由Nelson 建议,然后由Aalen 重新发现并加以改进,这就是Nelson-Aalen 估计式,即

在最大的时间观察范围内的定义如下:

0,(),i i i i

t t i

t t H t d t t y ≤⎧⎪≤⎪=⎨≥⎪⎪⎩∑ 该估计式的方差可以从下式得到:

2

2()i i H i t t i

d t y σ≤=∑ 以累积死亡率的Nelson-Aalen 估计式为基础,生存函数的另一个估计式为:

()exp[()]S t H t ∧∧

=-。 Nelson-Aalen 估计式在分析数据时主要有以下两方面的应用,其一是在选

择事件发生时间的参数模型方面的应用,其二是为死亡率h(t)提供粗估计,这

些估计值是Nelson-Aalen 估计式的斜率。

3.2.1.2 乘积限估计法

当数据个体较少时,为充分利用每个数据的信息,必须采用更为精确的估计方法。这些

估计方法中应用最多、效率较高的是Kaplan-Meier 在1958年提出的乘积限估计(Product-limit

estimator)。因而此法又称Kaplan-Meier 法。

乘积极限法适用于离散数据,它用于建立时刻t 上的生存函数。它的原理是根据t 时刻

及其之前各时间点上的条件生存率的乘积,来估计时刻t 的生存函数)(t S 和它的标准误

))((t S SE 。设k t t t <<<...21代表k 个观察对象的生存时间,设i n 为i t 时刻之前生存的个体

数目,即危险集的大小),...,2,1(k i =,再设i d 表示生存时间的截尾性质,k i ,...,2,1=。又

令i P 表示观察对象在时刻i t 的条件生存率,即对于k i ,...,2,1=,有:

i i i i n d n p -=,其中⎩

⎨⎧=是截尾数据个生存时间如果第是完全数据个生存时间如果第i i i t i t i d ,0,1

相关文档
最新文档