生存分析论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《生存分析论文》
题目:基于非参数分析法
研究改进手术对患者生存时间的影响专业:
班级:
姓名:
2015年6月25日
摘要
生存分析(survival analysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。
临床随访,又称为前瞻性研究(prospective study),本文采用此方法进行两组肾移植的病人手术后的生存时间和结局的研究。
研究过程中主要面临的问题有:
(1)结局及生存时间据需要考虑—经典的统计分析方法不能同时分析结局和生存时间;
(2)随访研究中研究对象可能会失访或死于其他疾病;或因研究经费和时间的限制不可能等到所有的对象都出现结局---截尾(censoring)或终检。
生存分析能解决以上问题。
本文通过比较A组和B组两组实验数据来探究改进手术对患者生存时间的影响,通过最后结果可以看出,改进手术组会大大提高患者生存率,因此,今后医生应致力于手术改良,以多加提高患者的生存率。
关键词 Kaplan-Meier估计 Nelson-Aalen估计 Cox模型 SAS软件
一、估计原理
1.乘积极限法(Kaplan-Meier )
Kaplan-Meier 分析方法,又称乘法极限估计、PL 法或最大似然估计法,是由Kaplan 和Meier 在1958年提出的一种求生存函数的非参数方法。寿命表分析适用于大样本情况,在处理小样本时,为充分利用每个数据所包含的信息,Kaplan-Meier 分析便成为首选的分析工具。
乘积极限法(Kaplan-Meier )适用于离散数据,它用于建立时刻t 上的生存函数。Kaplan-Meier 法是根据t 时刻及其之前各时间点上的条件生存率的乘积,来估计时刻t 的生存函数S(t)和它的标准误SE(S(t))。设12t t tk ≤≤≤代表k 个观察对象的生存时间,设i n 为i t 时刻开始之前生存的个体数目,即危险集的大小(i=1,2,…,k ),再设i d 表示生存时间的截尾性质,i=1,2,…,k 。又令i p 表示观察对象在时刻i t 的条件生存率,即对于i=1,2,…,k ,有:
i i
i i n d p n -=,其中1,0i i i i d ⎧=⎨⎩如果第个生存时间t 是完全数据;,如果第i 个生存时间t 是截尾数据;
那么,观察对象在时刻t i 时的条件死亡率如下:
1i i q p =-
对于i=1,2,…,k ,Kaplan-Meier 法定义时刻t i 上的生存函数和它的标准误的估计公式如下:
0(),1,2,
.(())(i
i k k i i S t p i k SE S t S t ∧
=∧
∧
=
==除了生存函数,均数和中位数也是反映一组生存时间平均水平常用的统计指标。但由于生存资料多呈偏正态分布,因而更适宜选用中位数,包括百分位数等指标。
2.log-rank 检验
Log-rank 检验的渐进平均值E 和方差V :
()()()
11111/2
21112111211121211E=111k
k k
k
d K
k ki ki k i k ki
ki d K ki k i ki d K
k ki k i k ki d
K ki
k i ki ki ki ki ki ki ki
V n n h h φθφφθφφφφθφθφφφθ========⎛⎫
- ⎪
++⎝⎭⎡⎤⎢⎥+⎢⎥⎣⎦
+=+==
∑∑∑∑∑∑∑∑
12ki ki n n 、分别为实验组和对照组在第K 时间间隔第i 个病人死亡前生存的人
数,12ki ki h h 、分别为实验组和对照组在第K 时间间隔第i 个病人死亡前的死亡危险率,k d 为第k 个时间间隔的死亡人数。
设/,k k k d d d d ρ==∑
,则(E e D =
其中,1
1/2
1()K
i i
k K i i k e D ργ
ρη===
⎛⎫
⎪⎝⎭
∑∑,11i i
i i i i
i φθφγφθφ=
-++,()2
1i i i φηφ=+ 将log-rank 统计量的分布视作N (E ,1),有:
/2E αβμμ=+
根据区间上两组概率分配向量中的治愈率,很容易求出所需总样本含量:
2/()E C n d P P =+
式中,E C P P 、为试验组和对照组的事件发生率。
在随访研究中,样本含量除受统计学要求及治疗效果影响外,还有许多不确
定性影响因素,例如患者入组、失访、治愈时间的分布,患者在试验阶段的依从性,以及是否满足比例风险等等。Log-rank 检验除考虑最后结局,还考虑了出现结局的时间,并充分利用失访资料所提供的不完全信息。对于具体的试验,本法都能拟合一个独特的生存过程,较好反应实际情况,应用灵活,因此是一种有效、可行的样本含量估计方法,能更好适应临床试验的复杂性和多样性,巧妙解决多种复杂因素并存对样本含量的影响问题。
3.Nelson-Aalen 估计
在有删失的情况下,可以根据累积死亡率与生存函数的关系()ln[()]
H t S t ∧
=-来估计累积死亡力函数H(t)。这时估计式为:()ln[()]H t S t ∧
∧
=-。另外有一个累积死亡 力估计式,它与以乘积限估计式为基础的估计式相比,具有更好的小样本性质,这一估计式由Nelson 建议,然后由Aalen 重新发现并加以改进,这就是Nelson-Aalen 估计式,即
在最大的时间观察范围内的定义如下:
0,(),i i
i i t t i
t t H t d t t y ≤⎧⎪≤⎪=⎨
≥⎪⎪⎩∑ 该估计式的方差可以从下式得到:
22()i i
H i t t
i
d t y σ≤=∑
以累积死亡率的Nelson-Aalen 估计式为基础,生存函数的另一个估计式为:
()exp[()]S t H t ∧∧
=-。
Nelson-Aalen 估计式在分析数据时主要有以下两方面的应用,其一是在选择事件发生时间的参数模型方面的应用,其二是为死亡率h(t)提供粗估计,这些估计值是Nelson-Aalen 估计式的斜率。
4.Cox 模型
像通常的回归分析一样,人们也希望能建立起生存时间(因变量或反映变量)随危险因素(自变量或协变量)变化的回归过程,以便对危险因素的作用大小有一个全面的了解和掌握,并根据危险因素的不同取值对生存概率进行预测。由于很难获得准确的生存时间,前述目的较难直接实现。1972年Cox 提出了比例危险模型,简称Cox 模型。由于此模型在表达形式上与参数模型相似,但在对模型中的各参数进行估计时却不依赖于特定的假设,所以又称为半参数模型。
设12(,,
,)k x x x x =是影响生存时间t 的k 个危险因素。设()i h t 为i 名受试者
在时刻t 的风险率,即t 时刻外后一瞬间的死亡速率。又设0()h t 表示不受危险
因素x 的影响下,在时刻t 的风险率,又称为基准风险率或基准函数。其模型的具体形式如下:
01122()()exp()i i i m im h t h t x x x βββ=++
+