本科毕业论文---基于bp神经网络的字符识别算法的实现正文
一个基于BP网络的字符识别器
一个基于BP网络的字符识别器杨戈;谢思路【摘要】This paper introduced the background knowledge of Artificial Neural Network and a way to use BP network to recognize printed characters was proposed, which was implemented with C language. After a lot of experiments, the experimental results show that the character recognizer has good validity and correctness. Besides, the printed characters can be recognized successful within the reasonable range of error.%本文简单介绍了人工神经元网络的背景知识,提出了一种利用传统BP(Back-Propagation 误差逆传播)网络识别印刷字符的方法,用C语言对其进行了实现。
在进行了大量实验之后,实验结果表明该字符识别器具有较好的有效性和正确性,能够在合理的误差范围内以较好的效率成功识别字符。
【期刊名称】《计算机系统应用》【年(卷),期】2013(000)010【总页数】6页(P163-168)【关键词】人工神经元网络;BP网;图像识别;C语言【作者】杨戈;谢思路【作者单位】北京师范大学珠海分校信息技术学院,珠海 519087; 北京大学深圳研究生院深圳物联网智能感知技术工程实验室,深圳 518055;北京师范大学珠海分校信息技术学院,珠海 519087【正文语种】中文人工神经元网络(ANN Artificial Neural Networks)理论、实现方式及算法是人工智能(AI Artificial Intelligence)研究的重要课题之一,也是智能控制的重要分支领域.自从人们认识到人脑计算与传统的数字计算机相比是完全不同的方式开始,关于人工元神经网络(一般称之为“神经网络”(neural network))的研究工作就开始了[1].人脑是一个高度复杂的、非线性的和并行的计算机,能够组织它的组成成分,即神经元.人工神经网络的研究在一定程度上受到了生物学的启发,因为生物的学习系统是由相互连接的神经元组成的异常复杂的网络,而人工神经元网络与此大体相似[2].神经元网络是由简单处理单元构成的大规模并行分布式处理器,天然地具有存储经验知识和使之可用的特性,以人工的方法模拟人脑的功能,有助于加深对思维及智能的认识.自40年代以来,人们在研究人脑机理的基础上,广泛开展模仿脑模型的人工神经网络理论的研究,由于人工神经元网络具有与人脑相似的高度并行性、良好的容错性和联想记忆功能、自适应和自学习能力等特点,尤其是以BP网络(Back-Propagation误差逆传播)为代表的神经网络具有良好的自学习能力、强大的分类能力、容错能力,可以实现输入到输出的非线性映射.由于人工神经元网络所具有的以上特点,所以它在以下的一些主要领域中得到了应用:① 模式识别与图像处理印刷体和手写体字符识别、语音识别、指纹、人脸识别、RNA与DNA序列分析、癌细胞识别、目标检测与识别、心电图、脑电图分类、油气藏检测、加速器故障检测、电机故障检测、图像压缩复原.其中人脸检测作为智能人机交互中的一个重要环节,受到了研究领域的普遍重视,并取得了很大的进展[3].② 控制及优化化工过程控制、机械手运动控制、运载体轨迹控制以及电弧炉控制.③ 金融预测与管理股票市场预测、有价证券管理、借贷风险分析以及信用卡欺骗检测.④ 通信自适应均衡、回声抵消、路由选择、导航以及多媒体处理系统.⑤ 其他如知识发现和数据挖掘、气象与地球科学等.本论文主要介绍了BP网络,并设计和实现了基于传统BP网络和基于改进BP网络的字符识别器,用C语言对其进行了实现并验证.本文中所设计的字符识别器是可以实现对字符进行识别的方法.例如现在要利用一BP网络来识别三种图形,如图1的 (a),(b),(c)所示.识别过程为系统经过基于BP算法的反复学习之后正确识别出图形.将图形以数组的方式输入,通过隐藏层节点映射到一组输出模式,使输出模式等同于输入模式.BP网络(Back Propagation NN)即进行误差校正的多层前馈网络,BP网络是利用实际输出与期望输出之差对网络的各层连接权由后向前逐层进行校正的一种计算方法,它适用于任意多层的网络.图2所示是一个三层BP网络.BP网可以看作是一个从输入到输出的高度非线性映射,具有的主要特点体现在信息处理的并行性,分布式的信息存储,自组织和自适应性,具有很强的学习和联想功能以及容错性并且由此而来的泛化能力. BP神经元网络已经成为神经元网络的重要模型之一,在很多领域都得到了应用.BP网络的学习过程主要由四部分组成:① 输入模式顺传播,即输入模式由输入层经中间层向输出层传播计算;② 输出误差逆传播,即输出的误差由输出层经中间层传向输入层;③ 循环记忆训练,即模式顺传播与误差逆传播的计算过程反复交替循环进行;④ 学习结果判别,即判定全局误差是否趋向极小值.设图2中的网络的输入层有n个神经元,输出层有q个神经元,中间层有p个神经元. 通常人工神经元网络的学习方式是“对权值的学习”[4].BP网络的学习过程是有教师学习方式的权值学习,训练集包含M个样本,取第k个训练样本,对于输入层和中间层而言,设输入层的输入为ak,i则:在(1)式中,i=1,2,…,n,j=1,2,…,q(下同).netk,j表示中间层的神经元j接收到的总输入,jθ表示神经元j的阈值,Wi,j表示输入层i与中间层j之间的连接权值.BP算法中大多选用S型函数作为输出函数,S型函数的优点在于它是可微分的[5].其中S型函数如公式(2)所示:则神经元j的实际输出bk,j如公式(3)所示:定义网络误差函数如公式(4)所示:其中在公式(5)中dk,j是对单个训练样本,单元j的期望输出[6].训练网络的目的是找到一组权重,使误差函数极小化.由于最小误差要求权变换是负梯度方向,所以应使Wi,j 的调整量ΔWi,j与的负值成正比例变化,故两层之间的调整量应为:令,则得到:在公式(7)中,ak,i即输入层的输入,α>0表示学习系数.而中间层与输出层之间的计算过程也类似于输入层与中间层之间的计算过程,故这里不再赘述.BP网络的优点如下:① 对问题的先验知识要求少;② 可实现对特征空间较为复杂的划分;③ 适合用高速并行处理系统来实现.该字符识别器的BP网络结构的设定如下:① 神经元个数的选取对于BP神经网络,其结构的确定包括了输入层、输出层节点个数的确定和隐藏层层数、隐藏节点个数的确定.其中输入层和输出层节点个数是根据实际问题确定的.在本例中,根据图12的待识别图形可以看出输入层的节点个数应设为16个(因为16个节点可以表示出一个字母),而输出层节点个数设为3个,表示期望的三个不同的输出.关于隐藏层数和隐藏节点个数的确定一直是人工神经元网络设计的难点,这是因为隐藏层神经元数与所需解决的问题的特定要求、输入层和输出层神经元的数量以及训练样本的数量等因素有直接关系,故隐藏层神经元网络的数量问题没有精确解只有次优解.隐藏层神经元的数量不能太少,太少会使得网络解决问题的精度不够.而最关键的是隐藏层的神经元数量不能过多,在过多的情况下对于样本学习的精度很容易达到,但是网络很可能出现过拟合,造成泛化能力下降,容错性差.通常是通过经验来确定隐藏层的神经元个数,在本例中将其设定为8个.② 初始权值的选取由于系统是非线性的,初始权值对于学习是否达到局部最小、是否能够收敛以及训练时间的长短关系很大.如果初始权值太大,使得加权后的输入落在激活函数的饱和区,从而使得调节过程几乎停顿下来.所以,一般总是希望经过初始加权后的每个神经元的输出值都接近于零,这样可以保证每个神经元的权值都能够在她们的激活函数变化最大之处进行调节[7].所以,一般取初始权值在(-1,1)之间的随机数.③ 学习系数的选取学习系数决定每一次循环训练中所产生的权值变化量.太高的学习系数可能导致系统的不稳定,但太小的学习系数将导致训练时间较长,收敛速度很慢,不过能保证网络的误差值不超出误差表面的低谷而最终趋于最小误差值[8].所以在一般情况下,倾向于选取较小的学习系数以保证系统的稳定性.在本例中将学习系数选取为0.01.④ 允许最大学习次数的选取允许最大学习次数选取的关键是要保证在其范围内能够完成正确识别的功能,即在允许的学习次数内,误差值能够达到期望的精度,小于允许最大误差值.当在允许最大学习次数的范围内,不能够达到期望精度,则学习失败.在本例中,先将其值设定为3000.本例中的具体设定如下:首先将这三个图形用三个输入模式向量A1,A2, A3来表示,其中有颜色的部分为1,没有颜色的部分为0.即:这三个输入模式所对应的希望输出为:D1=[1,0,0]TD2=[0,1,0]TD3=[0,0,1]T该例对应的BP网络的输入层有16个神经元,输出层有3个神经元,隐含层有8个神经元.其网络结构如图4所示.这里设定最大允许误差为:误差的计算方法按照平方和误差计算:学习系数取α=β=0.1.综上所述,实验参数的设定如表1所示.本节根据第1节中的设计进行了识别器的实现.字符识别器的算法伪代码如下:头文件;main(){声明变量;初始化输入样本x1,x2,x3;初始化期望输出y1,y2,y3;初始化输入层和中间层的连接权w;初始化中间层和输出层的连接权v;初始化中间层和输出层的阈值t1,t2;3.1 实验环境实验运行的具体的实现环境见表2.3.2 实验结果分析为了验证识别器识别字符的成功率,本文进行了4000次的大量实验,但由于篇幅所限,在此只列出部分的实验结果(见表3).由表3所记录的实验结果可以看出,该算法的运行结果较为稳定,基本上在允许的范围内都能够实现识别字符的功能,成功完成学习的次数以及误差均存在于合理的范围之内.其中在3.2节中设定误差值应小于0.01,允许最大学习次数为3000次.基于传统BP网络的识别器的运行结果如图5所示.从图5可以看出,此次实验中学习次数为787次,在规定的学习次数内(3000)完成了学习.并且误差值小于允许最大误差值(0.01).所以此次实验完成了识别字符的任务,实际输出在可接受的误差内等于了实际输出.3.3 改变学习次数实验结果分析在允许最大学习次数为3000次的情况下,让程序自动进行1000次反复试验,试验结果如图6所示.此时学习成功率为100%.当将允许最大学习次数缩小为1000次时,让程序自动进行1000次反复试验,试验结果如图7所示.此时学习成功率为91.8%.总结两次实验,可以看出,当学习次数可以多达3000次时基本能够保证正确识别字符;当将允许最大学习次数缩小为1000次时,并不能保证完成识别字符的功能,但是能够缩短程序的运行时间,当程序需要识别的输入模式对的数量庞大时,这种时间的节省有着十分重要的意义.本文用BP算法设计与实现了一个字符识别器,但这种传统的BP算法具有一定的缺陷,因此本文还提出了几种改进方法,并实现了其中一种改进方法,即累积误差校正算法,它能够有效的缩短学习所需时间.本文识别器完成了识别3个字符的功能,同理可以扩展识别26个英文字母、0-9数字或其他字符,如果附加其他功能模块,如翻译功能,即可通过计算机翻译印刷书本中英文单词、短语等,对于盲人等特定人群有着特别意义[9].【相关文献】1 Simon Haykin.神经网络与机器学习.北京:机械工业出版社,2011:2−10.2 Tom M.Mitchell.机器学习.北京:机械工业出版社, 2003:46−89.3叶航军,白雪生,徐光祐.基于支持向量机的人脸姿态判定.清华大学学报(自然科学版),2003,43(1):67−70.4 Stuart Russell,Peter Norvig.人工智能-一种现代方法(第二版),北京:人民邮电出版社,2004:23−40.5危辉.基于结构学习和迭代自映射的自联想记忆模型.软件学报,2002,13(3):438−440.6张泉灵,王树青.基于神经网络的非线性预测函数控制.浙江大学学报(工学版),2001,35(5):497−501. 7王旭,王宏,王文辉.人工神经元网络原理与应用.沈阳:东北大学出版社,2000:19−38.8张宇,潘国腾,谢伦国.一种基于人工神经元网络的条件分支预测算法.华中科技大学学报(自然科学版),2005.33(增刊):101−103.9陆琼瑜,童学峰.BP算法改进的研究.计算机工程与设计, 2007,28(3):648−650.。
基于BP网络的字符模式识别
第24卷 第02期计 算 机 仿 真2007年02月 文章编号:1006-9348(2007)02-0145-04基于BP网络的字符模式识别邓文华(温州大学管理学院,浙江温州325035)摘要:神经网络理论已经成为解决某些问题的重要手段的方法。
但利用神经网络进行解决问题和设计的时候,必定会涉及到大量的有关数值计算等问题,所以利用计算机对神经网络模型进行仿真和辅助设计时,仍是件很麻烦的事情。
所以MAT LAB的便利受到了青睐,BP网络在人工神经网络中应用最为广泛,而且在理论上十分完善,网络结构也比较直观。
在BP网络中,模式识别是应用比较广泛的一个方面。
该系统使用MAT LAB中神经网络工具箱对英文表中的26个字母进行识别。
通过建立网络,训练网络,测试网络,最后进行仿真,完成了正确识别26个英文字母的功能。
该系统的操作界面简洁、友好、使用简单方便。
关键词:神经网络;模式识别;网络中图分类号:TP319.9 文献标识码:APa ttern Recogn ition Ba sed on Bp NetworkD EN G W en-hua(School ofM anagement,W enzhou University,W enzhou Zhejiang325035,China)ABSTRACT:Neural net work has already become an i m portant method for resolving some p roblem s,but whenmaking use of the neural net work to solve p roblem s,large quantity of calculation must be involved,so it is still ap iece of troublesome affair.Therefore MAT LAB gets a very good reputation in this area.BP net work is one of thew idest app lication areas in the artificial neural net w ork,its theory is very perfect,and its structure is verysi mp le.Pattern recognition is very popular in BP net work app lication.26letters of alphabets are identified byusing MAT LAB and its neural net work tool box in this system.The step s of the p rogram are creating the net work,training the net work,testing the net work and the last is to carry out the emulation.In the end the system canidentify the26letter of alphabets successfully.A brief and si mp le interface,easy to use are the features of thesystem.KEYWO RD S:Neural net w ork;Pattern recognition;Net w ork1 引言目前,神经网络理论已经成为解决某些问题的手段的方法,而且这类问题在利用传统方法是很难或者无法解决,或者在处理上尚存困难。
基于BP神经网络的多样本手写体字符识别
基于BP神经网络的多样本手写体字符识别李丹【摘要】手写体字符识别是人机交互领域的一个重要内容,本文基于 BP 神经网络实现了任意数量字符模版的多字符手写体字符识别。
分为以下几步,第一,首先对目标图像进行识别前预处理。
包括灰度图像二值化、图像孤立像素滤波、图像膨胀、腐蚀、按字母最小行分割、按字母最小列分割、图像紧缩、归一化等;第二,用处理好的多个样本进行BP神经网络训练。
包括BP网络参数的选择、目标结果构建、输入到结果的映射即用样本库进行神经网络学习机的训练;第三,待测字母的识别。
包括对图像预处理、字符提取、归一化和送入已训练好的BP网络进行识别。
该系统最终实现了95%以上的手写字符识别正确率,有一定的借鉴意义。
%Handwritten Character Recognition is an important element in the field of human-computer interaction. This paper achieved a multi-sample handwritten character recognition based on BP neural network. Divided into the following steps: First, the pre-processing of the target image. Including binarization of gray image, the pixel filtering of isolated image, image dilation and corrosion, character segmentation in minimize row and column, image compression, normalization, etc; Second, Training the BP neural network with the processed character image. Including the selection of BP network parameters, building the results, the input mapping to the output (raining the neural network learning machine using sample database); Third, the recognition test of the unknown handwritten character. Including image preprocessing, character extraction, normalization and typing the unknown character to the BP network thathas been trained to recognize. Ultimately, the system achieved more than 95% accuracy of the handwritten character recognition, there is certain significance.【期刊名称】《软件》【年(卷),期】2016(037)007【总页数】6页(P103-108)【关键词】模式识别;BP神经网络;手写体字符识别;图像分析【作者】李丹【作者单位】沈阳市园林科学研究院,辽宁沈阳 110000【正文语种】中文【中图分类】TP391.41本文著录格式:李丹. 基于BP神经网络的多样本手写体字符识别[J]. 软件,2016,37(7):103-108在当前MATLAB神经网络字符识别研究中,一般都是基于单个字符库样本进行学习机训练而且很少进行手写字符的识别,例如应用最多的车牌字符识别[1-3],其送入的训练样本一般很有限,因此学习样本有限,很难适用于具有广泛特性的手写字符识别[4],因此,对于多种不同手写样本的训练和识别有一定的研究意义[5-7]。
基于BP神经网络的单数字字符识别算法实现
基于BP神经网络的单数字字符识别算法实现作者:潘志杰任赛君陈友荣来源:《电脑知识与技术·学术交流》2008年第29期摘要:提出一个BP神经网络的单数字字符识别算法的总体实现方案,实现单数字字符图像的采集、储存、识别和显示。
根据BP神经网络的原理,把识别算法分成工作期算法和学习期算法,并采用VC++6.0软件,运用VC语言分别设计并实现其算法,用MFC设计了系统的显示界面,最终可以在液晶屏幕上看到字符的识别结果。
结果显示运用该算法,单数子图像识别率在90%以上,而且学习次数越多,识别率越高。
基于BP神经网络的单数字字符识别算法可以广泛应用到数字仪表、车牌识别、卫星定位等很多领域,具有一定的应用价值。
关键词:单数字字符;识别算法;BP网络中图分类号:TP183文献标识码:A文章编号:1009-3044(2008)29-0461-03Recognition Algorithm of Single Numeric Character Based on BP Neural NetworkPAN Zhi-jie, REN Sai-jun, CHEN You-rong(Information Science & Technology College,Zhejiang Shuren University,Hangzhou310015,China)Abstract: Propose an overall realized project that recognition algorithm of single numeric character based on BP neural network, realizes single numeric character image collection, storage, recognition and display. According to the BP neural network's principle,the recognition algorithm is divided into the work algorithm and the study algorithm. Use the software of VC++6.0, respectively design and realize the algorithms with the VC language, design system's display interface with MFC. Finally the character recognition results display on the liquid crystal screen. The result showed that utilizes this algorithm, the recognition rate of single numeric character image is above 90%, moreover the more times of study are, the higher recognition rate is. Recognition algorithm of single numeric character based on BP neural network is widely applied in the digital instrument, the car license recognition, the satellite positioning and so on many field, and it has certain application prospect.Key words: single alphanumeric character; recognition algorithm; BP network1 引言数字图像处理技术发展到今天,数字图像识别技术已经获得长足的进步。
基于bp神经网络的字符识别算法的实现毕业(设计)论文正文
一、原始依据(包括设计或论文的工作基础、研究条件、应用环境、工作目的等。
)工作基础:了解C++的基本概念和语法,熟练使用Visual C++6.0软件。
研究条件:BP神经网络的基本原理以及图像处理的基本常识。
应用环境:基于BP神经网络的图片图像文件中的字符识别。
工作目的:掌握基于Visual C++6.0应用程序的开发。
了解人工智能的基本概念并掌握神经网络算法的基本原理。
掌握Visual C++6.0中的图片处理的基本过程。
二、参考文献[1]人工智能原理及其应用,王万森,电子工业出版社,2007.[2]VC++深入详解,孙鑫,电子工业出版社,2006.[3]人工神经网络原理, 马锐,机械工业出版社,2010.[4]Visual C++数字图像处理典型案例详解,沈晶,机械工业出版社,2012.[5]Application of Image Processing to the Characterization of NanostructuresManuel F. M. Costa,Reviews on Advanced Materials Science,2004.三、设计(研究)内容和要求(包括设计或研究内容、主要指标与技术参数,并根据课题性质对学生提出具体要求。
)1、掌握C++的基本概念和语法。
2、掌握二维神经网络的基本原理。
了解BP神经网络的基本概念。
3、完成Visual C++中对于图像的灰度、二值化等预处理。
4、完成基于样本的神经网络的训练以及图像中数字的识别,并对其性能进行统计和总结,分析其中的不足。
指导教师(签字)年月日审题小组组长(签字)年月日北京理工大学本科生毕业设计(论文)开题报告摘要人工神经网络是通过对人脑生物神经机理进行简化,抽象和模拟之后建立起来的一种计算模型,属于机器学习的重要研究领域。
本设计主要提出一种用神经网络来识别含有数字字符的方法。
神经网络采用带有动量项和自适应学习率的反向传播算法(BP)进行训练。
基于BP神经网络的字符识别算法的实现设计
摘要人工神经网络是通过对人脑生物神经机理进行简化,抽象和模拟之后建立起来的一种计算模型,属于机器学习的重要研究领域。
本设计主要提出一种用神经网络来识别含有数字字符的方法。
神经网络采用带有动量项和自适应学习率的反向传播算法(BP)进行训练。
在识别之前要对图像进行一系列的预处理,主要包含灰度化、二值化、锐化、噪声去除、字符分割、字符归一化、字符骨架提取等。
经过预处理的图片适合后续的训练及识别。
预处理后对图片上的字符进行特征提取,特征提取的方法很多,这里选择效果较好的十三特征提取法来进行特征提取。
最后采用BP神经网络来对待检测的图片上的数字进行识别。
关键词:反向传播算法;BP网络;人工神经网络;图像处理;特征提取ABSTRACTArtificial neural network is a computational model which is established after the simplification of the biological neural mechanism of human brain and abstract and simulation. It belongs to the important research field of machine learning.In this design, a neural network is proposed to identify the method of containing digital character. The neural network is trained by the back propagation (BP) algorithm with momentum and adaptive learning rate. Before identification, there are a series of image pretreatment which are graying, binarization, sharpening, noise removal, character segmentation, character normalization and character skeleton extraction. Images which are pretreated will be more suitable for the later training and recognition. After pretreatment, feature extraction is performed. There are a lot of ways of feature extraction, the extraction method of thirteen features which has better evaluation was chosen here. Finally, it uses BP neural network to identify the numbers on the pictures which are to be tested.Keywords: BP algorithm; BP Neural Network; ANN; image processing;Feature Extraction.目录第一章绪论 (1)1.1字符识别的简介 (1)1.2文字识别方法及研究现状 (1)1.3课题研究内容 (2)第二章人工神经网络 (3)2.1人工神经网络算法 (3)2.2BP网络 (6)第三章图像的预处理 (12)3.1256色位图灰度化 (12)3.2灰度图像二值化 (12)3.3图像的梯度锐化 (13)3.4去除离散的杂点噪声 (14)3.5整体倾斜度调整 (15)3.6字符分割 (16)3.7标准归一化 (18)3.8紧缩的紧缩重排 (19)3.9特征提取 (20)第四章基于人工神经网络的数字识别 (21)4.1系统框架 (21)4.2基于神经网络的数字识别的基本过程 (22)4.3程序的运行 (25)第五章总结与展望 (28)5.1总结 (28)5.2后续工作及展望 (28)参考文献外文资料中文译文致谢第一章绪论1.1 字符识别的简介字符识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
基于BP神经网络字符识别系统的研究
基于BP神经网络字符识别系统的研究【摘要】:文章重点对数字、字符进行识别,主要可以分为前期的预处理和后期的神经网络识别两部分。
文章结构如下:首先,对输出图像进行预处理,包括图像的灰度化、二值化、图像锐化、图像分割、图像归一化等技术;其次,提取图像的特征;最后把提取处理的特征在BP神经网络中训练和识别。
文章综合利用数字图像处理和神经网络技术,采用Visual C++6.0实现。
【关键词】:人工神经网络; BP网络; 数字识别; 图像分割; 特征提取一、系统简介系统在实现的过程当中,先分解成两个大块,就是图像预处理模块和识别模块。
其中图像像预处理块在对图像进行了一系列变换后把最后提取到的数字字符提交给数字识别模块,然后进行识别并给处结果。
在这里用到了较进的图像预处理技术及神经网络技术。
本系统总的流程为图象预处理,特征提取,经过神经网络样本训练最后是神经网络的识别并显示结果。
在图象预处理中,针对本系统的神经网络识别,前三个和后三个图像预处理的技术是必须的,但中间三个图像预处理技术是针对特定的图像进行的处理,它们也可以换成其它的图像预处理技术。
图像预处理完成后,对每一幅图像都必须有特征提取,把提取的特征在神经网络中进行训练和识别,流程图如下:整个系统的程序实现分为图像预处理和神经网络识别两大模块。
在图像预处理的过程当中,我们采用了许多图像处理的技术,最后把每个数字的特征提取出来。
特征提取采用最简单的逐象素特征提取方法,对图像进行逐行逐列的扫描当遇到黑色象素时取其特征值为1,遇到白色象素时取其特征值为0,这样当扫描结束以后就形成了一个维数与图像中象素点的个数相同的特征向量矩阵。
简单来讲,其功能就是把归一化样本的每个象素都作为特征提取出来,这里就得到了每幅图像就有归一化后的16*8的128个特征值。
二、BP神经网络模型通常我们说的BP神经网络的模型,即误差反向传播神经网络,其思想是不断的训练权值,并设有一个标准的输出,每次训练以后得到的实际输出与标准的输出比较,设置一个最小误差,达到一个误差是就表示网络训练好了,否则继续训练,达到一定的训练次数,还没有达到这个标准表示网络的设置有问题。
毕业设计BP神经网络方法对车牌照字符的识别(含外文翻译) (1)
摘要为了对车牌字符的识别,本文将BP神经网络应用于汽车车牌的自动识别,在车牌图像进行预处理后的基础上,重点讨论了用BP神经网络方法对车牌照字符的识别。
首先将训练样本做图像预处理,对车牌上的字符进行分割,得到单个字符。
对大小不一的字符做归一化后,对字符进行特征提取,把长为15,宽为25的归一化后的图像中的字符信息提取出来,图像中白点置为0,图像中的黑点置为1,这样就得到了15×25的特征向量,这个特征向量记录的就是字符的特征。
把这个特征向量送到BP网络中进行训练,得到了训练好的权值,把他保存到“win.dat”和“whi.dat”中。
然后打开要识别的图片(即车牌),对图像进行预处理后就可以识别了。
识别率也在90%以上,表明该方法的有效性。
关键字:车牌识别;LPR;字符识别;特征提取; BP神经网络;AbstractFor the discernment to the number plate character, this text applies BP neural network to the automatic discernment of the automobile number plate, on the basis that the number plate picture goes on in advance treated , is it use BP neural network method to car discernment , license plate of character to discuss especially. Will train samples to do the pretreatment of the picture at first, character in number plate cut apart, get the individual character. After making normalization to the character not of uniform size, drew the characteristic to the character 15, wide to draw out for character information of 25 picture behind the normalization, picture white point it puts to be 0, black point of picture is it as 1 , receive 15* 25 characteristic vector quantity like this to put, what the vector quantity of this characteristic is written down is the characteristic of the character . Send the characteristic vector quantity BP network train, get good right value of training, keep him in win.dat and whi.dat. Open picture (namely number plate) discerned to want, go on to picture in advance treated to can discern. The discerning rate is above 90% too; show the validity of this method.Key word:The number plate discerning;The character discerning;LPR;The characteristic is drawn;BP neural network;目录摘要 (Ⅰ)ABSTRACT (Ⅱ)第一章概述 (1)1.1 基本概念 (1)1.2 字符识别简介 (2)1.2.1字符识别发展概况 (2)1.2.2字符识别系统用到的方法 (3)1.2.3字符识别原理 (4)1.3 国内外研究现状和发展趋势 (5)1.4 基于神经网络的字符识别系统 (6)1.4.1 系统简介 (6)1.4.2 系统的基本技术要求 (7)1.4.3系统的软硬件平台 (7)第二章字符识别系统中的关键技术 (8)2.1 特征提取 (8)2.1.1 基本概念 (8)2.1.2 区域内部的数字特征 (10)2.1.3 基于边界的形状特征 (13)2.2 神经网络 (18)2.2.1 人工神经元 (18)2.2.2 人工神经网络构成 (22)2.2.3 人工神经网络的学习规则 (23)2.2.4 BP神经网络 (24)第三章系统的实现 (31)3.1 系统流程图 (31)3.2 程序实现 (31)3.3 程序的总体框架 (36)第四章系统使用说明、测试及注意事项 (37)4.1 系统使用说明 (37)4.2 系统测试 (39)4.2.1 数字识别 (39)4.2.2 字母识别 (40)4.2.3 汉字识别 (40)4.2.4 车牌识别 (41)4.3 注意事项 (41)第五章结论和展望 (42)致谢 (43)参考文献 (44)外文原文与译文 (46)●外文原文 (46)●译文 (57)第一章概述1.1 基本概念随着21世纪经济全球化和信息时代的到来,计算机技术、通信技术和计算机网络技术迅猛发展,自动化的信息处理能力和水平不断提高,并在人们社会活动和生活的各个领域得到广泛应用。
一种基于BP神经网络的车牌字符识别算法
一种基于BP神经网络的车牌字符识别算法作者:王娜来源:《电脑知识与技术》2017年第32期摘要:从目前智能交通的发展实际出发,结合图形图像处理技术对智能交通的重要组成部分车牌识别中的字符识别进行了研究。
采用了一种新的方法对车牌字符进行识别,即神经网络方法与模板匹配法相结合。
通过实践可以得出,这种方法识别效果很好,而且提高了识别的效率及准确性。
关键词:BP神经网络;车牌字符识别;模板匹配;智能交通系统中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2017)32-0201-02A License Plate Character Recognition Algorithm Based on BP Neural NetworkWANG Na(Department of Information Engineering, Liaoning Construction Vocational College,Liaoyang 111000, China)Abstract: From the reality of the development of intelligent transportation, combined with graphics and image processing technology, the character recognition of license plate recognition is studied, which is an important component of intelligent transportation.A new method is used to recognize license plate characters, that is, neural network method is combined with template matching method.Through practice, we can conclude that this method has good recognition effect,and improves the efficiency and accuracy of recognition.Key words: BP neural network; License plate character recognition; template matching;Intelligent transportation system目前,全球经济迅速发展,汽车数量的不断增加,进而智能交通系统(简称ITS)也就成了研究的焦点。
基于改进型BP神经网络的字符识别算法研究
摘要 : 神 经 网络被 广泛地应用 于字符识 别, 通过对其难点 问题 的分析 , 为 了提 高字符识别率 , 本文应 用改进型 B P神 经 网络进行 字符识别 , 该算法识别率 高, 速度快 , 可适用 于多种 高噪声环境 中, 实用性很 强。
Ab s t r a c t :Ne u r a l n e t w o r k i s w i d e l y印p l i e d f o r c h a r a c t e r r e c o g n i t i o n .T h r o u g h t h e a n a l y s i s o f t h e p r o b l e ms ,t h i s p a p e r r e c o g n i z e s c h a r a c t e r b y t h e a p p l i c a t i o n o f i mp r o v e d B P n e u r a l n e t w o r k ,S O a s t o i mp mv e r e c o g n i t i o n r a t e . h i T s me t h o d h a s h i g h r e c o g n i t i o n r a t e , f a s t
・
2 0 6・
价 值 工 程
基 于改进型 B P神经 网络 的字符识别算 法研 究
Re s e a r c h on Cha r a c t e r Re c o g ni t i o n Al g or i t hm Ba s e d o n I m pr o v e d BP Ne ur a l Ne t wo r k
1 . 1结 构 识 别 结 构 识 别 是 早 期 字符 识 别 的 研 究 的 主 要方法 , 我 们 也 可 以 称 之 为 句 法 结 构 识 别 。 其 思 想 是 提 取
基于BP神经网络识别字符
3、对BP神经网络进行仿真。用不同的方法生成测试样本图像,存于另外的bmp文件中,测试结果如下:
测试样本
识别情况
与训练样本完全相同
测试20个样本(2组0~9,皆是训练样本的复本),100%正确
三、基于BP神经网络识别字符
Matlab在图像处理与目标识别方面的应用实验
三、基于BP神经网络识别字符的简单实验
汽车牌照定位与字符识别是目标自动识别的一个典型问题。车牌由有限的字母和数字组成,采用固定的印刷字体和排列顺序。在车牌自动识别系统中,因自然因素或采样因素使得原本规则的印刷体字符产生畸变,给字符识别来了很大困难。BP神经网络算法是把一组样本输入输出问题转化为一个非线性优化问题,并通过梯度算法利用迭代运算求解权值的一种学习方法。采用BP网络进行分类,并附加线性感知器来实现单字符的有效识别,算法简便,识别率高,可适用于多种高噪声环境中的印刷体字符识别。
二、神经网络仿真程序设计:
1、构造训练样本集,并构成训练所需的输入矢量和目标矢量:准备10组,每组10个(0~9)数字bmp图片作为训练样本。其中1组为清晰的,这里使用Microsoft Visual C#编程生成。另9组是在清晰样本的基础上,用Matlab添加'salt & pepper'、'gaussian'等噪音制作成的(下图示以“5”为例)。这些图片经过一定的预处理,取出其最大有效区域,归一为16×16的二值图像,作为输入矢量。
与训练样本用相同的噪音算法生成
测试20个样本(2组0~9,分别加'salt & pepper'、'gaussian'噪音),60%正确
基于BP神经网络的字母识别系统设计与实现
济南大学泉城学院毕业论文题目基于BP神经网络的字母识别系统设计与实现专业电气工程及其自动化班级07Q2学生学号指导教师二〇一一年六月七日摘要基于前向反馈神经网络的字母识别技术在科学技术日新月异的今天迅速得到发展,在诸多的方面得到应用包括出版、金融、军事、现金登记、页面浏览以及任何带有重复性、变化性数据的文件。
英文字母识别系统的设计经过以下几个过程:预处理、特征提取、BP神经网络的训练、识别。
本文的重点在于BP神经网络。
本文运用的是三层神经网络,输入层、隐含层、输出层。
隐含层节点的确定本文给出了多种方法,本文运用了根值的方法。
基于人工神经网络字母识别的特点和优越性,主要表现在三个方面:第一,具有自学习功能。
字母识别时,只在先把许多不同的图像样板和对应的应识别的结果输入人工神经网络,然后在识别之前对神经网络进行训练形成稳定的权值这样网络通过自学习功能,慢慢学会识别类似的图像。
第二,具有联想存储功能。
用人工神经网络的反馈网络在字母识别时可以实现这种联想。
第三,具有高速寻找优化解的能力。
字母识别时寻找一个复杂问题的优化解,往往需要很大的计算量,利用一个针对某问题而设计的反馈型人工神经网络的字母识别系统,发挥计算机的高速运算能力,可能很快找到优化解。
本文是在matlab环境下模拟整个英文字母的识别过程,随着科学技术的发展识别技术更加成熟,各种难题都将会得到解决。
关键词:字母识别;图像处理;特征提取;BP神经网络ABSTRACTToday the science and technology develop rapidly. Letter recognition technology based on the feedback neural network is applied in many aspects including publication, finance military, cash register, page views, and any with repeatability,and variability of data files .Letter Identification System include the following processes: preprocessing, feature extraction, BP neural network training,and recognition..In this paper, we use a three-layer neural network, including input layer, hidden layer and output layer. This paper supply of a variety of methods to determine Hidden layer nodes . The root sign method and other method.that proposed by the Nelson and Illingwnrth are applied .The features and advantages of Artificial neural network is reflected in three aspects :First, a self-learning function. When we recognize letters, only putting many different images and the corresponding results into the artificial neural network and forming a stable weight before the letter recognition,the network will be through self-learning function to slowly identify similar images.Second, with the association storage. Artificial neural network feedback network can achieve this association in the letter recognition.Third, finding the optimal solution with high capacity. Finding the optimal solution of a complex often require a large amount of ing a design that a feedback type artificial neural network for problem and playing the high-speed computing power of computer, you may quickly find the optimal solution. In the matlab environment this article simulate the entire process of letter recognition, with the development of science and technology recognition technology is more mature and have various problems will be solved.Keywords:Letter identification;image processing;feature extraction;the feedback neural network目录摘要........................................................................................................... - 1 -ABSTRACT . (II)1 前言 (1)1.1 研究背景及意义 (1)1.2 研究现状 (2)1.3 手写字母识别方法 (3)1.3.1 结构模式识别方法 (3)1.3.2 统计模式识别方法 (3)1.3.3 统计与结构相结合的识别方法 (4)1.3.4 人工神经网络方法 (4)1.4 识别系统性能的评价 (5)1.5 论文组织结构 (5)2 预处理 (6)2.1 系统框架 (6)2.2 预处理概述 (6)2.3 本文预处理设计 (6)2.3.1去噪 (7)2.3.2二值化 (8)2.3.3 归一化 (10)2.3.4细化 (11)3 字母特征提取 (13)3.1 特征提取概述 (13)3.2 本文特征提取设计 (13)3.2.1像素百分比特征 (14)3.2.2提取矩阵的粗网格特征 (15)3.2.3 重心特征 (16)3.2.4 提取图像的矩阵像素特征 (16)3.2.5笔划特征 (17)3.2.6 外轮廓特征提取 (18)4 BP神经网络 (19)4.1 人工神经网络 (19)4.2神经网络的模型图 (20)4.3 BP神经网络的工作原理 (21)4.4神经网络的各层节点数 (22)4.4.1输入层和输出层 (22)4.4.2 隐含层节点数的优化确定 (23)4.5 BP神经网络的参数设计和训练过程[17] (25)5 实验结果及分析 (28)5.1 实验设计 (28)5.1.1 实验参数 (28)5.1.2 训练和识别样本库设计 (28)5.2隐含层节点对实验结果的影响 (28)5.2 识别样本的正确率 (30)5.3 实验结果分析 (31)结论 (32)参考文献 (33)致谢 (35)附录 (36)1 前言1.1 研究背景及意义手写字母识别技术是光学字符识别(Optical Character Recognition ,简称OCR)的一个分支,字母识别的研究背景要追溯到早期的光学识别技术,距今已有40多年的发展历史。
基于BP神经网络的手写英文字母识别.
(2)结合语义理解的后处理技术 与识别前的预处理相对,可以对识别的结果进行后期处理,提高识别的正确率。分 析人类在识别文字的过程,文字一般都是结合上下文进行理解的,因此,计算机在识别 文字时也可以在识别单字的基础上,结合单字的上下文信息对识别结果进行校正,以单 词甚至句子作为一次识别的结果。依据对语言文字的统计信息,可以确定某个文字后可 能跟随的候选字符集,达到缩小搜索范围、简化计算的目的。这种结合上下文信息识别 的技术存在的问题主要集中在如何高效组织候选字符子集、实现候选字符的快速定位
out
gained
letters characteristic which used to
vector
be
input of
the characteristic
from samples,we select 520
samples(20 groups)to train the
BP Neural
ቤተ መጻሕፍቲ ባይዱ
Network,and then
后遵守此规定)。
导师签名:—≮轰瑶乒F 日期:—血知‘旦一
签名:主丝.
日期:y矽上多∑乙
中北大学学位论文
弟一旱瑁比 第一章绪论
1.1目的和意义 随着计算机技术的推广应用,尤其是互联网的日益普及,人类越来越多地依赖计算 机获得各种信息,大量的信息处理工作也都转移到计算机上进行。在日常生活和工作中, 存在着大量的文字信息处理问题,因而将文字信息快速输入计算机的要求就变得非常迫 切,输入速度低已经成为信息进入计算机系统的主要瓶颈,影响着整个系统的效率。因 此,要求有一种能将文字信息高速、自动地输入计算机的方法。 目前,文字输入方法主要有键盘输入、手写识别、语音输入和机器自动识别输入等。 人工键盘输入方法需要经过一定时间的学习训练才能掌握,手写识别和语音输入虽然简 单便捷,但其输入速度不高,对于大量已有的文档资料,采用这些方法要花费大量的人 力和时问。因此,能够实现文字信息高速、自动输入的只能是计算机自动识别技术,即 光学字符识别技术。光学字符识别技术(OCR)Ul】(Optical Character Recognition)是计算机 自动、高速地辨别纸上的文字,并将其转化为可编辑的文本的一项实用技术。它是新一 代计算机智能接口的一个重要组成部分,也是模式识别领域的一个重要分支。 手写字母识别一直是热门的研究课题,字母识别要解决数据的采集、处理及选择、 输入样本表达的选择、模式识别分类器的选择以及用样本集对识别器的有指导的训练等 典型问题。字符识别和处理的信息可分为两大类:一类是文字信息,处理的主要是用各 国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息;另一类是数据信息, 主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报 表、财务报表、银行票据等等【Il。目前文字识别技术己经广泛应用到了各个领域中,它 作为计算机智能接口的重要组成部分,在信息处理领域中可以大大提高计算机的使用效 率,是办公自动化、新闻出版、计算机翻译等领域中最理想的输入方式,将庞大的文本 图像压缩成机器内码可以节省火量的存储空问。 1.2光学字符识别技术的现状及展望 OCR由于更容易被人们接受、掌握,近几年来,它同语音识别、行为识别等一起 日益成为人们研究的焦点。mM、Motorola、HP和Microsoft等公司都陆续展开了这方
BP算法实现字母识别.
P[0][30]={-1,-1,1,1,1,1,-1,1,-1,1,-1,-1,1,-1,-1,1,-1,-1,-1,1,-1,1,-1,-1,-1,-1,1,1,1,1};其他字母对应的向量也做类似的处理。最终的标准输入矩阵P[26][30],包含26个字母向量。
步骤6:
一轮迭代结束后,验证平均误差:e是否满足误差要求E,若满足要求,则训练学习完成;若不满足误差要求,就返回步骤2进行下一轮迭代,如此反复直到满足误差要求或者达到最大迭代次数,最终训练学习完成。
三、实验内容
1.网络的设计与实验前的预处理工作
网络的设计:
网络的选择如图2所示:
图2网络的结构
如图2所示,本次实验所用的网络有一个输入层,一个隐含层,一个输出层,网络结构为30-30-1。p为待输入的学习(识别)向量,维数为30*1,w1为第一层权值,维数30*30,w2为第二层权值,维数30*1,b1为第一层偏值,维数30*1,b2为第二层偏值,维数1*1,a1为第一层输出,维数30*1,a2为网络最后的输出。激励函数分为两种,第一种是S型函数,另一种是y=x直线函数。
基于BP网络多层感知机的字母识别
摘要:本次实验主要使用了BP神经网络方法对给定的英文字母A-Z进行识别,并对应输出0-25表示识别成功。考虑的干扰因素的存在,在实验中分别测试了隐藏16%和33%样本数据的效果,使得网络具有一定的容错能力。本次实验程序的编写主要使用了C语言。
基于BP神经网络的字符识别系统(完整版)doc资料
基于BP神经网络的字符识别系统(完整版)doc资料计算机与现代化2021年第1期J I S UANJ I Y U X I A NDA I HUA总第161期收稿日期:2020205211项目:河南省自然科学资助项目(0511011500作者简介:张可(19842,女,河南三门峡人,南京航空航天大学信息科学与技术学院硕士研究生,研究方向:图像处理;张高燕(19872,女,河南三门峡人,北京师范大学信息科学与技术学院硕士研究生,研究方向:图像与语音信号处理;吴苏(19872,男,河南南阳人,哈尔滨工程大学计算机科学与技术学院硕士研究生,研究方向:I nternet 应用软件;范海菊(19792,女,河南新乡人,河南师范大学计算机与信息技术学院讲师,研究方向:语音和图像信号处理。
基于BP 神经网络的字符识别系统张可1,张高燕2,吴苏3,范海菊4(1.南京航空航天大学信息科学与技术学院,江苏南京210016;2.北京师范大学信息科学与技术学院,北京100875;3.哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001;4.河南师范大学计算机与信息技术学院,河南新乡453007摘要:基于BP 神经网络设计了一个字符识别系统。
首先,对字符图像进行二值化处理,构造输入向量矩阵。
其次,通过选取初始权值、隐层节点数和权值学习算法,创建BP 神经网络,对样本数据进行训练,之后对加有噪声的样本再次进行训练,以提高网络的鲁棒性。
最后进行仿真测试并制作图形用户界面G U I 来模拟与演示该系统。
仿真结果显示,该BP 网络对噪声系数小于0.8的字符识别率可达95%,且网络训练时间可接受。
关键词:BP 神经网络;G U I ;字符识别;鲁棒性中图分类号:TP311.52文献标识码:ASystem of Character Recogn iti on Ba sed on Back 2propaga ti on Neura l NetworkZHANG Ke 1,Z HANG Gao 2yan 2,WU Su 3,F AN Hai 2ju4(1.College of I nf or mati on Science and Technol ogy,Nanjing University of Aer onautics and Astr onautics,Nanjing 210016,China;2.College of I nf or mati on Science and Technol ogy,Beijing Nor mal University,Beijing 100875,China;3.College of Computer Science and Technol ogy,Harbin Engineering University,Harbin 150001,China;4.College of Computer and I nfor mati on Technol ogy,Henan Nor mal University,Xinxiang 453007,ChinaAbstract:This article designs a character recogniti on syste m based on the Back 2Pr opagati on neural net w ork .First,the character i m age is p r ocessed in binary t o construct the input vect or matrix .Second,by choosing the initial weight,the nu mber of hide nodes and the learning algorith m of weight,a perfect BP neural net w ork is created .And then the net w ork carries on the training t o the samp le data and after wards t o the sa mp le with noise once more,t o enhance the net w ork r obustness .Finally,it carries on the si m ulati on test and manufactures graphical user interface t o si m ulate and demonstrate this system.The si m ulati on result shows that the character recogniti on rate of thisBP net w ork is possible t o reach 95%with the noise fact or less than 0.8,and the training ti m e is accep table .Key words:BP neural net w ork;G U I ;character recogniti on;r obustness0引言为了解决计算机对字符的自动识别问题,使计算机达到真正智能化,人们对计算机的自动识别进行了多年研究,并取得了很大的进步。
基于BP神经网络的手写数字识别
基于BP神经网络的手写数字识别手写数字识别是一个常见的图像处理任务,旨在将手写数字的图像转换为相应的数字。
传统的方法通常使用特征提取和分类器来完成这个任务。
但是,基于神经网络的方法已经证明比传统方法更有效和准确。
BP神经网络是使用最广泛的神经网络之一,用于解决各种分类和预测问题。
在本文中,我们将探讨如何使用基于BP神经网络的方法来实现手写数字识别。
首先,我们需要定义神经网络的结构。
对于手写数字识别,我们可以使用一个三层的BP神经网络,其中输入层有784个神经元(对应于28 x 28个像素),一个隐藏层,和一个输出层,输出层有10个神经元,分别对应于数字0到9。
接下来,我们需要准备训练数据。
我们可以使用MNIST数据集,该数据集包含了70,000张手写数字的图像,每张图像都有一个正确的标签。
我们可以将这些图像和标签分成训练集和测试集,其中训练集用于训练神经网络,测试集用于评估模型的准确性。
在使用训练数据时,我们需要将图像转换为数字向量,并将标签编码为独热向量。
然后,我们可以开始训练神经网络。
在每个训练迭代中,我们根据输入数据计算前向传递,并计算误差。
然后,我们使用反向传播更新网络的权重。
这个过程被重复进行多次,直到误差收敛为止。
最后,我们可以使用测试集评估模型的准确性。
我们将每个测试样本的图像输入到神经网络中,并将神经网络的输出与实际标签进行比较。
我们可以使用准确率来评估模型的实际性能,例如正确分类的测试样本的比例。
总结来说,基于BP神经网络的手写数字识别是一种可行和准确的方法。
然而,需要注意的是网络的结构和超参数的选择,以及训练和测试数据的质量都会影响模型的性能。
基于神经网络的手写数字识别系统的设计与实现毕业论文
中南大学本科生毕业论文(设计)题目基于神经网络的手写数字识别系统的设计与实现目录摘要 (Ⅰ)ABSTRACT (Ⅱ)第一章绪论 (1)1.1手写体数字识别研究的发展及研究现状 (1)1.2神经网络在手写体数字识别中的应用 (2)1.3 论文结构简介 (3)第二章手写体数字识别 (4)2.1手写体数字识别的一般方法及难点 (4)2.2 图像预处理概述 (5)2.3 图像预处理的处理步骤 (5)图像的平滑去噪 (5)二值话处理 (6)归一化 (7)细化 (8)2.4 小结 (9)第三章特征提取 (10)3.1 特征提取的概述 (10)3.2 统计特征 (10)3.3 结构特征 (11)结构特征提取 (11)笔划特征的提取 (11)数字的特征向量说明 (12)3.3 知识库的建立 (12)第四章神经网络在数字识别中的应用 (14)4.1 神经网络简介及其工作原理 (14)神经网络概述[14] (14)神经网络的工作原理 (14)4.2神经网络的学习与训练[15] (15)4.3 BP神经网络 (16)算法 (16)网络的一般学习算法 (16)网络的设计 (18)4.4 BP学习算法的局限性与对策 (20)4.5 对BP算法的改进 (21)第五章系统的实现与结果分析 (23)5.1 软件开发平台 (23)简介 (23)的特点 (23)使用MATLAB的优势 (23)5.2 系统设计思路 (24)5.3 系统流程图 (24)5.4 MATLAB程序设计 (24)5.5 实验数据及结果分析 (26)结论 (27)参考文献 (28)致谢 (30)附录 (31)摘要手写体数字识别是模式识别中一个非常重要和活跃的研究领域,数字识别也不是一项孤立的技术,它所涉及的问题是模式识别的其他领域都无法回避的;应用上,作为一种信息处理手段,字符识别有广阔的应用背景和巨大的市场需求。
因此,对数字识别的研究具有理论和应用的双重意义。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、原始依据(包括设计或论文的工作基础、研究条件、应用环境、工作目的等。
)工作基础:了解C++的基本概念和语法,熟练使用Visual C++6.0软件。
研究条件:BP神经网络的基本原理以及图像处理的基本常识。
应用环境:基于BP神经网络的图片图像文件中的字符识别。
工作目的:掌握基于Visual C++6.0应用程序的开发。
了解人工智能的基本概念并掌握神经网络算法的基本原理。
掌握Visual C++6.0中的图片处理的基本过程。
二、参考文献[1]人工智能原理及其应用,王万森,电子工业出版社,2007.[2]VC++深入详解,孙鑫,电子工业出版社,2006.[3]人工神经网络原理, 马锐,机械工业出版社,2010.[4]Visual C++数字图像处理典型案例详解,沈晶,机械工业出版社,2012.[5]Application of Image Processing to the Characterization of NanostructuresManuel F. M. Costa,Reviews on Advanced Materials Science,2004.三、设计(研究)内容和要求(包括设计或研究内容、主要指标与技术参数,并根据课题性质对学生提出具体要求。
)1、掌握C++的基本概念和语法。
2、掌握二维神经网络的基本原理。
了解BP神经网络的基本概念。
3、完成Visual C++中对于图像的灰度、二值化等预处理。
4、完成基于样本的神经网络的训练以及图像中数字的识别,并对其性能进行统计和总结,分析其中的不足。
指导教师(签字)年月日审题小组组长(签字)年月日北京理工大学本科生毕业设计(论文)开题报告摘要人工神经网络是通过对人脑生物神经机理进行简化,抽象和模拟之后建立起来的一种计算模型,属于机器学习的重要研究领域。
本设计主要提出一种用神经网络来识别含有数字字符的方法。
神经网络采用带有动量项和自适应学习率的反向传播算法(BP)进行训练。
在识别之前要对图像进行一系列的预处理,主要包含灰度化、二值化、锐化、噪声去除、字符分割、字符归一化、字符骨架提取等。
经过预处理的图片适合后续的训练及识别。
预处理后对图片上的字符进行特征提取,特征提取的方法很多,这里选择效果较好的十三特征提取法来进行特征提取。
最后采用BP神经网络来对待检测的图片上的数字进行识别。
关键词:反向传播算法;BP网络;人工神经网络;图像处理;特征提取ABSTRACTArtificial neural network is a computational model which is established after the simplification of the biological neural mechanism of human brain and abstract and simulation. It belongs to the important research field of machine learning.In this design, a neural network is proposed to identify the method of containing digital character. The neural network is trained by the back propagation (BP) algorithm with momentum and adaptive learning rate. Before identification, there are a series of image pretreatment which are graying, binarization, sharpening, noise removal, character segmentation, character normalization and character skeleton extraction. Images which are pretreated will be more suitable for the later training and recognition. After pretreatment, feature extraction is performed. There are a lot of ways of feature extraction, the extraction method of thirteen features which has better evaluation was chosen here. Finally, it uses BP neural network to identify the numbers on the pictures which are to be tested.Keywords: BP algorithm; BP Neural Network; ANN; image processing;Feature Extraction.目录第一章绪论 (1)1.1字符识别的简介 (1)1.2文字识别方法及研究现状 (1)1.3课题研究内容 (2)第二章人工神经网络 (3)2.1人工神经网络算法 (3)2.2BP网络 (6)第三章图像的预处理 (12)3.1256色位图灰度化 (12)3.2灰度图像二值化 (12)3.3图像的梯度锐化 (13)3.4去除离散的杂点噪声 (14)3.5整体倾斜度调整 (15)3.6字符分割 (16)3.7标准归一化 (18)3.8紧缩的紧缩重排 (19)3.9特征提取 (20)第四章基于人工神经网络的数字识别 (21)4.1系统框架 (21)4.2基于神经网络的数字识别的基本过程 (22)4.3程序的运行 (25)第五章总结与展望 (28)5.1总结 (28)5.2后续工作及展望 (28)参考文献外文资料中文译文致谢北京理工大学2014届本科生毕业设计(论文)第一章绪论1.1 字符识别的简介字符识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
如何除错或利用辅助信息提高识别正确率,是字符识别中最重要的课题。
早在60、70年代,世界各国就开始有对于字符识别的研究,而研究的初期,多以文字的识别方法研究为主,且识别的文字仅为0至9的数字。
以同样拥有方块文字的日本为例,1960年左右开始研究OCR的基本识别理论,初期以数字为对象,直至1965至1970年之间开始有一些简单的产品,如印刷文字的邮政编码识别系统,识别邮件上的邮政编码,帮助邮局作区域分信的作业;也因此至今邮政编码一直是各国所倡导的地址书写方式。
1.2 字符识别方法及研究现状1.2.1 字符识别方法字符识别方法:字符识别方法基本上分为统计、逻辑判断和句法三大类。
常用的方法有模板匹配法和几何特征抽取法。
① 模板匹配法将输入的字符与给定的各类别标准文字进行相关匹配,计算输入字符与各模板之间的相似性程度,取相似度最大的类别作为识别的结果。
这种方法的缺点是当被识别类别数目增加时,标准字符模板数量也随之增加。
这一方面会增加机器的存储容量,另一方面也会降低识别的正确率,所以这种方式适用于识别固定字型的印刷体字符。
这种方法的优点是用整个字符进行相似度计算,所以对于字符缺损、边缘噪声等具有较强的适应能力。
② 几何特征抽取法抽取字符的一些几何特征,如字符的端点、分叉点、凹凸部分或水平、垂直、倾斜等各方向的线段、闭合环路等,根据这些特征的位置及相互关系进行逻辑组合判断,获得识别结果。
这种识别方式由于利用了结构的信息,因此也适用于手写体文字那样变型较大的字符。
1.2.2 字符识别发展现状字符识别可应用于许多领域,如阅读、文献资料的检索、信件的分拣、稿件的校对、银行支票的处理、商品发票的统计汇总、商品编码的识别等。
它可以方便用户快速录入信息,提高各行各业的工作效率。
进入20世纪90年代以后,随着我国信息化建设的全面开展,以及我国信息自动化和办公自动化的普及,大大推动了字符识别技术的进一步发展,使字符识别技术的识别正确率、识别速度满足了广大用户的要求。
文字识别技术诞生20余年来,经历从实验室技术到产品的转变,目前已经步入行业应用开发的成熟阶段。
相比发达国家的广泛应用情况,在国内,文字识别技术在各领域的应用还有着广阔的空间。
随着国家信息化建设的发展,文字识别技术拥有了一个全新的行业应用局面。
各个研究文字识别的软件将会更加深入到信息化建设的各个领域。
1.3 课题研究内容本课题研究内容如下:1.BP神经网络是人工神经网络的其中一种,它利用实际输出与期望输出之差对网络的各层连接权由后向前前逐层进行校正。
通过学习BP网络的算法,对BP网络进行反复训练,确定稳定的权值与阈值,进而应用到字符识别系统中去。
2.对待识别图片进行一系列预处理。
预处理的过程主要包括对于图像的灰度化、二值化、图像的梯度锐化、离散噪点的去处、图像倾斜度的调整、字符的分割、图像的归一化处理、图像的紧缩重排等。
3.识别过程分为三个阶段:图像预处理阶段,BP网络的训练阶段,字符识别阶段。
设计程序分别完成三个阶段,利用BP神经网络识别正确出图片中的数字信息。
第二章人工神经网络2.1 人工神经网络人工神经网络(Artificial Neural Network,简称ANN),以数学模型模拟神经元活动,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。
人工神经网络具有自学习、自组织、自适应以及很强的非线性函数逼近能力,拥有强大的容错性。
它可以实现仿真、预测以及模糊控制等功能。
是处理非线性系统的有力工具。
2.1.1 人工神经网络算法一、设计信息处理单元连接的方式按照信息处理单元的连接方式,神经网络可以分为多种类型。
这里介绍按照结点有无反馈划分的两种典型的网络结构:(1)前馈网络网络可以分为几个层。
各层按信号传输先后顺序依次排列,第i层的神经元只接受第i-1层神经元给出的信号。
各神经元之间没有反馈。
输入层结点与输出层结点称为“可见层”,其他中间层则称为“隐层”。
(2)反馈网络网络分层,某些结点除了接受外加输入以外,还要接受其他结点的反馈,或者是自身的反馈。
当然,除了这种划分方式,还有按照层数划分为单层网络与多层网络,按照输入数据的特点划分为离散网络和连续网络等。
不同的网络在性能和效率上会有很大的差异,一般来说,跨层连接的结点越多,网络越是可靠;层数越多,网络的效率越低;反馈越多,网络的学习能力越强;结点个数越多,网络的记忆能力就越好。