BP神经网络在生存中应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

BP神经网络在生存中应用

生存分析(survivalanalysis)起源于19世纪对寿命表的分析,当

前已广泛应用到临床研究中,能够处理含有删失值的数据,能够同时

考虑事件发生的结局及发生结局的时间。当前处理生存资料的方法有

参数模型、非参数模型及半参数模型。参数模型对生存时间的分布要

求非常严格,医学资料中很少能满足;生存分析中传统的回归模型,

例如:Cox比例风险模型、加速失效时间模型也要求模型满足一定的假设前提,而实际数据往往难以满足这些假设。神经网络近年来受到普

遍的注重,在医学领域中的应用主要预测与分类,与传统回归模型不同,它能够克服这些缺点,在模型中能够容纳非线性效应,交互效应、协变量的效应能够随时间变化。当前国内研究神经网络在生存分析中

的应用尚较少,本文拟探讨几种不同的神经网络生存模型在贲门癌预

后中的应用。

BP神经网络是当前应用最多的神经网络,一般由一个输入层(inputlayer)、一个输出层(outputlayer)、一个或几个中间层

(隐层)组成,每一层可包含一个或多个神经元,其中每一层的每个

神经元和前一层相连接,同一层之间没有连接。输入层神经元传递输

入信息到第一隐层或直接传到输出层,隐层的神经元对输入层的信息

加权求和,加一个常数后,经传递函数运算后传到下一个隐层(或输

出层),常用的传递函数是logistic函数,即φh=1/(1+exp(-z)),输出层神经元对前一层的输入信息加权求和经传递函数φ0(线性或logistic函数或门限函数)运算后输出,例如:如果输入为xi,对于

含一个隐层的神经网络能够得到:

g(xi,θ)=φ0(αk+∑i≠kwikxi+∑jwjkφh(αj+∑iwijxi))(1)

θ表示未知的参数矢量(即各层的网络权值),BP神经网络一般采

用BP算法训练网络,训练开始时选择初始值0,BP算法通过梯度下降

法得到估计值,使得g(x,)能很好地估计实测值,关于BP算法及改进

可参考相关文献[1]。

利用BP神经网络模型建立生存分析模型,常用的方法有:连续时间

模型(continuoustimemodels)与离散时间模型(discretetimemodels)。

1.1连续时间模型(continuoustimemodels)

最常用的是Faraggi和Simon[2]提出的方法,在Cox比例风险模型中,风险函数与时间、协变量有如下关系:

h(t,xi)=h0(t)exp(βxi)(2)

通过最大化偏似然函数,使用Newton-Raphson法得到参数的估计值,现在使用神经网络的输出值g(xi,θ)来代替(2)中的线性项βxi,

比例风险模型变成h(t,xi)=h0(t)exp[g(xi,θ)],有偏似然函数:

Lc(θ)=∏i∈uexp∑jwjk/(1+exp(-

wijxi))/∑j∈Riexp∑jwjk/(1+exp(-wijxj))(3)

g(xi,θ)能够依赖时间和协变量变化,也就是说协变量的效应能够随

时间而变化,这给我们提供了一个能够处理删失变量但又不需要满足

比例风险模型的PH假定的可供选择的方法。

1.2离散时间模型(discretetimemodels)

常用的模型有[3]:(1)直接预测患者是否能够存活到某年(例如5年),是最简单的神经网络模型,模型的输出层只有一个神经元结点,

如欲预测多个时间点,则需建立多个神经网络模型(每个模型对应一

个时间区间);(2)多个输出结点的单个神经网络模型。

1.2.1输出层有单个结点的神经网络模型是一个标准的分类神经网络

模型,生存时间被分成2个区间,例如生存时间是否大于5年。其似

然函数为:

∏patientsptii(1-pi)(1-ti)

其对数似然函数为:

∑patientstilogpi+(1-ti)log(1-pi)

pi:第i个病人死亡的概率,ti:第i个观测在某时间点(例如5年)的结果,如观测死亡,取值为1,否则取值为0。对于删失的观测不能

简单地排除,这样会造成偏性,我们使用Cox线性比例风险模型产生

的个体预测值对删失值做填补。

1.2.2输出层有多个结点的神经网络模型将生存时间分成几个离散的

区间,估计某个区间事件发生的概率。

不考虑时间区间的顺序,有模型:logpk-logp1=ηk(X)(k=2,…,P)

从神经网络能够得到输出值yk:yk=∑iwikxi+∑jwjkφ1(∑iwijxi)(K=1,…,P)(这里我们设ηk(x)=yk-y1),

于是能够得到时间区间k的概率:pk=exp(yk)∑l(yl)

建立似然函数∏patients∑lik=mi+1pki

mi:观测i存活的前一个生存区间,li:最后的时间区间,pki:第i 个病人在时间区间k死亡的概率。

本次研究采用灵敏度、特异度、一致性指数C(concordanceindex)[4,5]作为预测准确性的评价指标。一致性指数C是对含有删失数据

的ROC曲线下面积的推广(generalization),是指预测结果和实际结

果一致的观察单位的对子数占总的有用对子数的比例,即C=一致的对子数/有用的对子数,C接近0.5表明模型的预测性能差,接近1表明预

测性能好。一致性指数的计算步骤为[5]:①产生所有的病例配对。

若有n个观察个体,则所有的对子数为C2n。②排除两种对子:对子中

具有较小观察时间的个体没有达到观察终点及对子中2个个体都没达

到观察终点。③计算有用对子中,预测结果和实际相一致的对子数,④

计算一致性指数。

2实例分析

相关文档
最新文档