【CN110111848A】一种基于RNNCNN神经网络融合算法的人体周期表达基因识别方法【专利】

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 (43)申请公布日 (21)申请号 201910378150.9

(22)申请日 2019.05.08

(71)申请人 南京鼓楼医院

地址 210008 江苏省南京市鼓楼区中山路

321号

(72)发明人 许佩佩 

(74)专利代理机构 南京钟山专利代理有限公司

32252

代理人 戴朝荣

(51)Int.Cl.

G16B 40/00(2019.01)

G06N 3/04(2006.01)

(54)发明名称一种基于RNN-CNN神经网络融合算法的人体周期表达基因识别方法(57)摘要本发明公开了一种基于RNN -CNN神经网络融合算法的人体周期表达基因识别方法,首先对原始数据进行缺失修补和时序周期延拓,然后通过数据标签建立优质学习数据集,将周期表达数据进行热图聚类,以视觉角度初始了解生物钟基因的特定表达,然后利用深度学习算法,将循环神经网络算法和卷积神经网络算法结合成RNN -CNN 融合算法,最后将RNN -CNN融合算法分类器与常用的深度学习算法CNN、RNN进行周期与非周期基因亚型分类,将分类结果进行了交叉验证,并用准确度评分、召回率以及综合评价指标进行评

价。权利要求书2页 说明书12页 附图8页CN 110111848 A 2019.08.09

C N 110111848

A

1.一种基于RNN -CNN神经网络融合算法的人体周期表达基因识别方法,其特征在于,包括如下步骤:

步骤S1:数据预处理,从GEO数据库获取人类时序基因表达谱数据GSE39445,包括人体全血转录组,对原始数据进行缺失修补和时序周期延拓;

步骤S2:对预处理后的数据进行标签,更改数据格式,建立数据训练集;

步骤S3:从数据训练集中选取出若干组周期表达数据,将周期表达数据基于R语言进行热图聚类;

步骤S4:将循环神经网络算法和卷积神经网络算法相结合,搭建RNN -CNN融合神经网络,并对步骤S2建立的数据训练集进行分类训练,得到对时序基因表达谱数据进行周期与非周期基因亚型分类的分类结果。

2.根据权利要求1所述的一种基于RNN -CNN神经网络融合算法的人体周期表达基因识别方法,其特征在于,所述步骤S1包括:

步骤S11:将缺失的时间点对应的数据列用其他周期里面对应相同时间点的数据列来补偿;

步骤S12:将不同周期中随机抽取某一个时间点测试数据列组成一个完整的周期数据,其中,不同周期中的时间点要求对应相同。

3.根据权利要求1所述的一种基于RNN -CNN神经网络融合算法的人体周期表达基因识别方法,其特征在于,所述步骤S2包括:

步骤S21:建立拥有1200组数据的学习数据集,其中,每一个基因的一个周期含有10个数据点,并包含至少十个周期,通过计算机C语言为数据进行标签;

步骤S22:对标签好的数据,将每列数据分别与对应前一个时间点的数据相减,保留结果在当前位置,设减去后的结果为A,同时设置波动值为0.05;当A<-0.05时,设置当前值为-1;当-0.050.05时,设置当前值为1,最终表达谱数据结果由-1、0、1进行显示,分别表示某一测试点相当于上一测试点的减少、保持以及增加状态。

4.根据权利要求1所述的一种基于RNN -CNN神经网络融合算法的人体周期表达基因识别方法,其特征在于,所述步骤S4中,RNN -CNN融合神经网络搭建的步骤包括:

步骤一:搭建循环神经网络外循环体RNN,循环神经网络RNN采用长短时记忆网络结构,并在RNN结构中额外加入遗忘门结构;

步骤二:搭建卷积神经网络内循环CNN,卷积神经网络CNN采用LeNet -5模型,由两个卷积层、两个池化层以及三个全连接层组成,所述两个卷积层和池化层依次交错连接,所述三个全连接层依次连接于池化层后,在每层节点加入常数偏置项和ReLU激活函数实现深层网络的去线性化,获得矩阵数据X in ,如下式表示:

X in =X+b;

其中,X in 表示节点最终输入数据,X表示初始输入数据,b表示常数偏置项;

则X in 为最后一层的输入,然后用Softmax回归将神经网络的输出转换成概率分布,如下

式表示:

其中,y i 为神经网络的原始输出;

权 利 要 求 书1/2页2CN 110111848 A

相关文档
最新文档