遗传算法优化BP神经网络的专家自动诊断模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
创新视点
科技创新导报 Science and Technology Innovation Herald
5
目前,随着计算机信息化和人工智能的迅速发展,人们生活水平在不断提高,人们对健康也越来越重视。
专家自动诊断疾病的系统成为各界关注的焦点,人们都希望从疾病知识库中根据专业知识和病案数据,提取相应的规则来不断学习更新,能尽早地发现疾病,提高疾病分类诊断的效率。
该文采用遗传算法和神经网络来建立一个卵巢癌自动分级诊断的人工智能模型。
卵巢癌是严重威胁妇女健康的恶性肿瘤之一,由于卵巢位于盆腔深部,早期无任何症状,而且目前没有有效的筛选方法和特
异的诊断方法,患有卵巢癌的妇女的存活率较低,在各种卵巢癌中浆液性囊腺癌比例最大,5年存活率只有20%~30%。
目前,临床上对癌症的诊断主要有B超、C T、对血清肿瘤标志物的联合检测、血清蛋白质组识别、病理分析等方法。
病理学检查是一种非常重要的疾病诊断方法,目前主要靠手工来完成,不但工作量大,且易受检查者水平的限制。
数字图像中细胞的自动分割和细胞分类识别模型的建立,分类识别模型是提高分类性能的重要因素。
首先对卵巢肿瘤是良性、恶性还是交界性进行准确判断,然后
再判断卵巢癌患者临床分期。
卵巢癌的临床分期越早,治疗效果越好;期别越晚,效果越差。
检查腹水中有无癌细胞是对卵巢临床分期分级的重要步骤。
B P人工神经网络因其具有分布式信息存储方式、并行式信息处理方式、自组织学习、自适应能力、强大的容错性和非线性处理能力,能够有效地对疾病进行筛查和诊断。
只需选择好输入和输出变量,其他的工作全部由人工神经网络来完成,使用非常方便。
既能避免人脑判断问题时的主观性和思维定势,也可完全消除人脑在决策过程中的易疲劳性。
BP神经网络在疾病的筛查和诊断中发挥重要作用,但是仍然存在一些难以解决的问题,如:局部极小问题、结构设计问题、实时性差问题等。
有研究采用B P 神经网络来对卵巢癌诊断建模,但是由于改进的B P
算法有局限性,不易得到最优解,从实验数据可以看到存在很大的误差。
为了改善B P 神经网络学习算法易陷入局部极小的缺陷,可以将遗传算法和神经网络结合应用,所以
本文采用遗传算法来优化B P 神经网络,改进B P 算法得到G A -B P 算法,得到B P反向传播神经网络的初始权值和阈值,使其网络
模型的预测值误差更小。
1 BP神经网络
人工神经网络A N N (A r t i f i c i a l
遗传算法优化BP神经网络的专家自动诊断模型
李洪进
(遵义医学院医学信息工程系 贵州遵义 563000)
摘 要:随着计算机信息化和人工智能的发展迅速,专家自动诊断疾病系统成为各界关注的焦点。
卵巢癌是严重威胁妇女健康的恶性肿瘤之一,而且目前无有效的筛选方法和特异的诊断方法。
BP 人工神经网络因其具有分布式信息存储方式、自适应能力、强大的容错性和非线性处理能力,能有效地对疾病进行筛查和诊断。
该文采用遗传算法来优化改进BP算法得到GA-BP算法,通过遗传和变异操作对BP神经网络的初始权值和阈值进行优化,不断更新选择,使得网络的系统总误差趋于最小,构建出卵巢癌诊断模型。
采用Matlab2013、VC++编程和统计软件SPSS.18等工具来实现专家自动诊断的人工智能模型,并通过计算机仿真和预测进行检验。
关键词:遗传算法 BP神经网络 自动诊断 人工智能模型
中图分类号:TP3 文献标识码:A 文章编号:1674-098X(2015)01(a)-0005-03
Automatic Diagnosis Expert Model Based on GA-BP Neural Network
LI Hongjin
(Medical Information Engineering Department Zunyi medical college,Zunyi Guizhou,563000,China)
Abstract:With the development of computer information and artificial intelligence rapidly,automatic disease diagnosis expert system has become the focus of public attention. Ovarian cancer is the malignant tumor of the serious threat to women’s health,diagnosis methods and currently no screening and specific and effective.BP artificial neural network because of its distributed information storage mode and adaptive ability,strong fault tolerance and nonlinear processing ability,is able to effectively carry out screening and diagnosis of diseases.This paper uses the improved BP algorithm are optimized by genetic algorithm GA-BP algorithm,through the heredity and mutation of BP neural network to optimize the initial weights and threshold and constantly updated to choose,make network system tends to the minimum total error,constructed the model of ovarian cancer diagnosis.With Matlab2013,vc + + programming and statistical software SPSS.18 automatic diagnostic tools for experts such as artificial intelligence model,and through the computer simulation and prediction.
Key Words:Genetic Algorithm;Back Propagation Neural Network;Automatic diagnosis;Artificial intelligence model
是
否
编码和群体初始生成
BP 神经网络训练选择适应度高的个体
满足优化准则?
遗传GA 算法
交叉运算变异运算
创造新的群体
输出神经网络的
权值和阈值
BP 算法流程
构建新的神经网络图1 基于GA遗传算法优化的BP神经网络流程
Copyright©博看网 . All Rights Reserved.
创新视
点
科技创新导报 Science and Technology Innovation Herald
6
N e u r a l N e t w o r k )是对生物神经网络B N N 的结构和实现机制原理进行模拟,由大量人工神经元以某种方式相互连接而成,对连续的输入做出状态响应的动态信息处理系统,能模拟人脑生物神经网络系统处理信息,在医学中应用包括临床对癌细胞诊断方面,如宫颈癌、胰腺癌等,80%~90%的人工神经网络模型是把误差反传算法 (BP网络)应用于函数逼近、模式识别与分类。
B P 神经网络(B a c k P r o p a g a t i o n Neu ral Network)是一种单向传播的多层前向神经网络,至少有三层或三层以上的神经网络,即:输入层、中间层、输出层,上下层之间实现全连接,而每层神经元之间无连接,BP神经网络模型如图1。
学习样本提供给网络后,神经元的激活值从输入层经各中间层向输出层传播,误差反传是将输出误差以某种形式通过隐含层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号。
在输出层经过各中间层逐层根据误差信号调整连接权值,最后回到输入层,这种算法称为误差逆传播算法,它包括模式顺传播-误差逆传播-记忆训练-学习收敛四个过程。
随着这种误差反向传播权值的不断修正,网络对输入模式响应的正确率也不断上升。
如果网络的输入节点数为M、输出节点数为L,则此神经网络可看成是从M 维欧氏空间到L 维欧氏空间的映射,这种高度非线性的映射,适合该文的研究对象,所以选择误差反向传播以B P 神经网络模型作为系统预测模型。
BP神经网络模型特点如下:
(1)非线性能力很强,由许多神经元按拓扑结构构成大规模的复杂系统。
(2)具有自组织、自适应、自学习的能力。
(3)高度容错性和稳健性,当预测单元中的部分信息不足或由于观测失误而产生错误信息时,仍可给出较正确的预测结果。
B P 算法属于δ算法,是监督式的学习算法,基本步骤:
(1)初始化:置所有的加权系数为最小的随机数。
(2)提供训练集:给出顺序赋值的输入向量x(t),x(2),…,和期望的输出向量(训练集)t(1),t(2),…,tN。
(3)计算实际输出。
(4)计算期望值与实际输出的误差。
(5)调整输出层的加权系数ωki。
(6)调整隐含层的加权系数ωij。
(7)返回步骤(3),使网络输出层的误差平方和达到最小。
BP 标准梯度下降算法存在着学习收敛速度慢、容易陷入局部极小而不能得到全局最优解等缺点,所以B P 神经网络建立的是黑箱模型,不能用数学方法求最优解,而遗传算法寻优无需目标函数,具备明确的
数学表达式,可以用来进行优化计算。
本文采用遗传算法来优化神经网络建模,使训练后的网络模型预测值与实验值误差尽可能的小。
2 遗传算法
遗传算法GA (Genetic Algorith m)是基于进化论和遗传变异理论,是新发展起来基于优胜劣汰、自然选择和适者生存的优化算法,特点是直接对结构对象进行操作,不存在求导和函数连续性的限定,具有内在的隐并行性和更好的全局寻优能力,采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。
基本遗传算法其本操作包括选择、交叉和变异操作。
遗传算法通过对多个体的迭代搜索来逐步找出问题的最优解,在迭代过程中,实质是处理了一些具有相似编码结构的个体,把个体作为某些相似模板的具体表示,则对个体的搜索过程就是对这些相似模板的搜索过程,即对模式的处理。
遗传算法的核心内容是参数编码、初始群体的设定、适应度函数的设计、遗传操作设计、控制参数设定五个要素。
作为一种新的全局优化搜索算法,遗传算法有简单通用、鲁棒性强、适于并行处理以及高效、实用等特点。
最大的优点是容易和其他的算法结合,具有可扩展性。
遗传算法在人工神经网络的应用中有三种结合方式,即网络权值的进化、网络结构的进化、学习规则的进化,该文选择的是对网络权值和阈值的进化。
基于遗传算法的BP算法选择最佳的染色体作为网络权值,搜索能力强,训练速度快,可以有效避免局部最小的问题。
采用G A -B P 算法,先用遗传G A 算法在全局空间上搜索权值和阈值的最优点,然后用B P 算法在最优点附近寻优达到最优值,能够克服B P 算法的缺陷。
G A -B P 算法具有全局搜索能力,增强在搜索过程中自动获得和积累知识,使得搜索结果误差很小。
3 GA-BP算法
由于BP算法存在着学习收敛速度慢、容易陷入局部极小而不能得到全局最优解等缺点,本课题采用遗传算法来优化B P 神经网络建模,G A -B P 算法先用遗传G A 算法在全局空间上搜索权值和阈值的最优点,然后用B P 算法在最优点附近寻优达到最优值,克服B P 算法的缺陷。
G A-B P 算法的基本步骤如下。
(1)编码,随机产生一个初始种群。
(2)对染色体解码解码,将编码后的个体转换成问题空间的决策变量,确定隐含层节点数和权值,形成BP神经网络。
(3)按照个体适应值的大小,计算适应度函数,评价染色体优劣。
(4)由交叉和变异这两个遗传算子对交
配池中的个体进行操作,形成下一代种群。
(5)返回步骤(2)直到满足收敛判据,得到解。
将得到的隐含层节点数和权值赋值给BP神经网络,进行后续训练。
本算法把神经网络中神经元的连接权值编码成二进制码串,随机生成这些码串的初始群体,用遗传G A 算法优化计算,进行一代计算后将码串解码成权值和阈值构成新的神经网络,对所有训练样本计算得到神经网络输出的均方误差来确定每个个体的适应度,反复计算使得神经网络的系统总误差SSE (su m square error)趋于全局最小值,从而构建了卵巢癌诊断模型。
具体算法实现需要用到Matlab的神经网络工具箱N N E T 和遗传算法工具箱G A D S ,提供了图像用户界面G UI,采用命令行方式,功能强大。
4 专家自动诊断卵巢癌的人工智能模型
首先要确定BP神经网络的特征向量,对从卵巢肿瘤患者的腹水涂片中获得的卵巢细胞图像进行识别与特征值提取。
特征向量是神经网络的输入,提取特征向量的目标,就是要把待分类信息转化到更加能体现其类别的新特征空间中。
因此,特征向量提取是否合适,将极大地影响分类结果。
初始权值一般取(—1,1)之间的随机数,学习速率决定每一次循环训练中所产生的权值变化量,选取范围在0.01~0.8之间。
需要做以下工作:
对从卵巢肿瘤患者的腹水涂片中获得的卵巢细胞图像,用Matlab7.0中的Im age P ro cessin g To olb ox 工具箱进行处理分析。
训练与测试样本来源于遵义医学院病理科的存档资料。
处理得到需要的细胞样本图像后,提取细胞图像形态学的特征参数。
用M a t l a b 中的N e u r a l N e t w o r k To olb ox 工具箱对卵巢癌细胞图像识别与特征值提取进行深入研究的基础上,用B P 神经网络对细胞图像进行诊断分类。
用M a t l a b 的神经网络工具箱n n T o o l K it 来创建和训练神经网络,B P 网络创建函数为n e w f f,网络训练函数为 train,具体的训练过程:首先按照特征向量提取方法获得包含80个特征向量的训练样本集,样本数据的定义与预处理,利用load 函数可以在工作空间中自动载入网络训练所需的输入数据p;然后按照样本集计算目标输出集t;最后调用train函数即可完成网络训练。
网络仿真使用函数sim,调用sim函数后返回一个形式与目标输出集相同的输出。
最后通过比较仿真输出集与仿真样本目标输出集评价神经网络的自动诊断效果。
因为细胞识别的关键是细胞特征参数
(下转9页)
Copyright©博看网 . All Rights Reserved.
创新视点
科技创新导报 Science and Technology Innovation Herald
9
展打开了空间。
(2)学生在实际操作大型仪器设备中,段炼了动手能力和实际工作能力,培养了对仪器开发的兴趣,开扩了视野,增强了对科学研究的认识,激发了创新思维
[11]。
许多学
生积极参加学校每年度举办的《学生实验室建设贡献奖》活动,并多次获奖。
自1989年第一届至2014年第二十四届,化学系研究生共获得一等奖6项、二等奖31项、三等奖68项。
(3)公共测试分析平台中的大型仪器设备在学校每年度的《大型仪器设备使用效益评价》中均在95分以上,其中有两个机组在《清华大学大型仪器设备使用效益评价奖》中获得示范机组一等奖。
在开放基金的支持下,经过26年的软硬件建设,分析中心已发展成为清华大学公共测试分析平台,承担着国家重大仪器专项,973、863等国家重大科研任务。
4 几点建议
分析中心自成立以来,在教学、科研和人才培养中取得了显著成果,为了推进分析中心可持续发展,提出以下几点建议。
4、1 拓宽仪器设备资源
将校内教师经费购买的闲置设备和不常使用的设备托管给分析中心,做到物尽其用。
继续实行开放仪器设备,资源共享的运行模式,积极鼓励院系内各科研、教学实验室开放自己购置的仪器设备,提高仪器的使用率,为将来的仪器维修储备维修基金,延长仪器设备的使用寿命。
仪器可以放置在校级测试平台上,如:分析中心、材料中心等平台,有集中的测试地点,有专职技术人员从事样品测试、结果分析、日常维护等服务,统一管理,共享共用。
也可以放置在各自的实验室内,由聘用的技术服务人员专门负责项目测试、结果分析以及仪器的维护保养和简单的维修工作。
在满足实验室内正常科研项目分析测试需要的同时,充分发挥设备本身的能力,专享共用,提高设备使用效率。
4.2 提升公共服务水平
随着学校内各级平台的建立与发展,为教学与科研工作提供优质服务的同时,也加强了竞争,特别是与学校外一些测试机构的竞争愈加激烈,价格低、服务好的平台会受到学生及老师的青睐,而分析中心虽然作为校内平台,具有天时、地利、人和的得天独厚的条件,但仍然面临着不可避免的竞争。
因此,分析中心应根据学科发展需要思考如何利用自己占有教学、科研资源的优势。
5 结语
自1986年清华大学设立实验室开放基金以来,分析中心作为校级公共分析测试服务平台,为全校师生的教学及科研工作提供了高质量、高水平的分析测试服务,同时,自身也得到了壮大和发展,具备了一定的科研及教学能力,为化学系的学科发展、科研实力的加强,做出了积极贡献。
为开放仪器设备共享的服务理念,起到了推动作用和引导作用。
面对未来的市场竞争,分析中心应在探索分析测试方法、发明分析测试技术方面下功夫,充分利用教育资源优势,树立加强人才培养的教育理念,借助公共分析测试服务平台,为教学、科研工作提供更好的服务。
参考文献
[1] 张原,李鑫.加强大型仪器设备开放
共享工作实现高校科学集约式发展[J].西北工业大学学报:社会科学版,2009,29(3):93-95.
[2] 杨树国,武晓峰,闻星火,等.设立
实验室开放基金促进学校仪器设备开放共享[J ].实验室研究与探索,2011,30(11):382-386.
[3] 梁国华,杨树国,武晓峰,等.清华大学
实验室开放基金的设立与发展[J].实验技术与管理,2012,29(8):188-193.[4] 杨桂芳,
陈正红.国内外大型仪器设备开放共享机制研究对比[C]//北京高教学会实验室工作研究会2008学术研讨会论文集.2008:266-269.
[5] 杜奔新,杨敏.工科院校实验室大型仪器
设备如何管理与资源共享的实践与探索[C]//北京高教学会实验室工作研究会2007学术研讨会论文集.2007.
[6]
邢媛媛,王新利.关于盈亏平衡分析方法的讨论[J].中国市场,2007(26):13-14.[7] 钱俊臻,柴毅,严薇,等.大型仪器设备
开放基金建设研究[J].实验技术与管理,2011,28(11):263-267.
[8] 黄坤,胡煜,李彦启,等.理工类高校实
验室开放基金的实践与趋势研究[J].实验技术与管理,2012,29(2):184-187.[9] 张原,李鑫.加强大型仪器设备开放共
享工作实现高校科学集约式发展[J].西北工业大学学报:社会科学版,2000,29(3):93-95.[10]
黄天文,
白德成,张文定.大型仪器设备开放的共享机制与措施[J].实验室研究与探索,2008,27(10):155-158.[11]
张雪梅,汪徐春,郭亮,等.建设分析测试平台,培养应用型高级人才[J].实验技术与管理,2012,29(10):201-203.
的选择和计算,对细胞及细胞核共设立了灰度值、面积、周长、等效圆直径、形状因子、核与浆之比6个特征参数值,将提取的特征向量作为输入神经元对神经网络进行权值训练,产生BP神经网络,输出变量包括正常卵巢上皮细胞、良性和恶性两种不同的浆液性卵巢癌肿瘤细胞。
然后采用遗传算法来优化改进BP算法得到G A -B P 算法,并实现算法。
通过遗传和变异操作对BP神经网络的初始权值和阈值进行优化,不断更新选择,使得网络的系统总误差趋于最小,构建出卵巢癌诊断模型。
最后应用M a t l a b 、V C ++和统计软件SPSS.18工具来实现人工智能模型,得出实验数据和计算机仿真图像,并验证网络模型预测值与实验值之间的误差。
5 结语
采用改进B P 算法的方法有以下几种:
加入动量项;使用顺序方式训练网络;归一化输入信号;自适应学习速率法。
采用L-M (Levenberg-Ma rqua r t)算法让误差平方和最小,加快学习收敛速度,通过对比实验数据和临床数据,其误差还是很大,改进后的效果不好,而遗传算法寻优无需目标函数,具备明确的数学表达式,可以用来进行优化计算。
该文采用遗传算法来优化B P 神经网络建模(G A -B P 算法),使得训练后神经网络模型预测值与实验值的系统总误差SSE(su m sq u a re er r or)趋于全局最小值,建立了一个卵巢癌自动分级诊断的人工智能模型。
这个专家自动诊断系统能有效地诊断卵巢癌患者临床分期,有利于开展疾病防治工作。
参考文献
[1] 韩立群.人工神经网络理论、设计用应
用一人工神经细胞、人工神经网络和人工神经系统[M].北京:化学工业出版社,
2002:51-52.
[2]
H u s s e i n i G A ,A b d e l-Ja b b a r N M,Mjalli F S,et al.Modeling and sensitivity analysis of acoustic r ele a s e o f d o x o r u biei n f r o m u nsta bilize d pInie P105 usin g a n a r tificia l n e u r a l n et w o r k m o d e l[J].Te c h n o l C a n c e r R e s Treat,2007,6(l):49-56.
[3]
管颂东.神经网络技术在卵巢肿瘤诊断中的应用[D].无锡:江南大学,2008.[4] 师黎.基于遗传算法优化BP神经网络在
心电图身份识别中的应用[J].中国组织工程研究与临床康复,2010(43):8069-8072.
[5] 任小洪,徐卫东,刘立新,等.基于遗传算
法优化B P 神经网络的数控机床热误差补偿[J].制造业和自动化,2011(9):41-43.
(上接6页)
Copyright©博看网 . All Rights Reserved.。