基于BP神经网络的数字识别

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于BP神经网络的数字识别
饶志双;黄宗珊
【摘要】手写数字识别是人工智能技术中一个十分重要的分支,在人们日常生活中也应用得越来越频繁,例如在快递分拣、金融等有关数字识别的领域中都有较多的应用,这也使得越来越多人投入到手写数字识别技术研究中,人工神经网不仅具有非常好的容错能力、分类能力,还具有自适应和自学习等特性,备受人们的重视,基于此,本文在对神经网络介绍的基础上就神经网络在手写数字识别方面做了一些研究探讨.【期刊名称】《科技视界》
【年(卷),期】2018(000)007
【总页数】2页(P130-131)
【关键词】神经网络;手写数字识别;BP网络
【作者】饶志双;黄宗珊
【作者单位】西南科技大学计算机科学与技术学院,四川绵阳 621010;西南科技大学计算机科学与技术学院,四川绵阳 621010
【正文语种】中文
【中图分类】TP391.41
1 绪论
1.1 概述
现如今,随着科学技术的发展,人们的生活也越来越自动化,智能化,手写数字识
别在人们日常生活中也应用得越来越频繁,例如在快递分拣、金融等有关数字识别的领域中都有较多的应用,这也使得越来越多人投入到手写数字识别技术研究中,早期的研究,虽然取得了巨大的进步,但同时也遇到了一些问题,那就是不同的人书写的字体大不相同,这使得即使是同一个数字,在识别时也会遇到巨大的困难。

因此,人们选择了利用神经网络来解决这一问题,因为它的容错性好,分类能力强,而且还具有自我学习的特性。

1.2 研究现状
近年来,国内外的学者对数字识别技术的各个环节做了广泛而深入的研究,将当前的数字识别工作分为联机识别和脱机识别两种,联机识别是指将写的字通过传感器传入电脑等设备进行识别,如今研究已经比较成熟[1],而脱机识别是指通过手写
数字的照片形势进行识别,经过数十年的研究,人们提出了许多的识别方法,按照使用的特征不同,大致可以分为基于结构特征和基于统计特征两类[2]。

2 BP神经网络
2.1 人工神经网络
人工神经网络通过一种称为连接的单向信号通路将一些处理单元互连而成,每个处理单元都有一个单输出到所期望的连接。

每一个处理单元传送同样的信号即处理单元输出信号[3-5]。

2.2 BP神经网络
2.2.1 基本原理
图1 BP神经网络结构图
BP神经网络是一种非常典型的前馈神经网络,网络的基本结构如下面图1所示,它包含了输入层、输出层及隐层,隐层可以是一层或多层,每一层上的神经元被称为单元或节点。

BP算法分为两部分:信息的正向传递和误差的反向传播。

在正向
传递过程中,输入信息从输入层通过隐含层一层一层计算传向输出层,每一层神经
元的状态仅能够影响下一层神经元的状态。

如果在输出层没有得到期望的输出,需要计算输出层的误差变化值,然后转向反向传播,经网络将误差信号沿着之前的链接通路反向传回来修改各层神经元的权值直到达到期望目标[6]。

2.2.2 BP网络的算法描述
(1)对每一层的权值Wij初始化.权值取[0,1]之间任意值。

(2)对输入数据进行预处理,提供训练样本和目标输出.输入训练样本:X=(x1,x2,···xn,1), 期望输出:Y=(y1,y2,···yn)。

(3)计算每一层的输出,对于第 k层的第i个神经元的输出
(4)求各层的学习误差.对于输出层有 k=m,有:对于其他各层,有
(5)修正权系数 Wij和阀值
(6)当求出了每一层各个权系数之后,按照给定品质指标判断能否满足要求.如果要求满足,则算法结束;如果要求不满足,则返回(3)执行[7]。

2.2.3 前向传播
前向传播可以理解为每一层神经元接收上一层神经元的传来的信息,经过一定的算法变换然后得到输出[8]。

2.2.4 反向传播
前向传播的讯号到达了输出层,在输出层同时拥有实际结果和计算结果,我们的目的是使计算结果和实际结果尽量接近,也就是要使得计算结果与实际结果的总误差要最小,而总误差实际上只是一个多元函数,多层嵌套的结果。

3 数据处理
3.1 数据集说明
数据文件train.xlsx和test.xlsx包含从零到九的手绘数字的灰度图像。

每幅图像的高度为28像素,宽度为28像素,总共为784像素。

每个像素都有一个与之相关的像素值,表示该像素的亮度或暗度,数字越高意味着越暗。

这个像素值是一个0
到255之间的整数。

3.2 数据预处理
由于数据集中的数据是一个42000*784的矩阵,每行都是一个样本,是一个
28*28的像素图片,每张图具有784个特征,每个特征的值的取值范围是0-255,为了处理方便,可以将784个特征值进行二值化处理。

4 实验结果分析
4.1 实验结果
实验中,不断调整隐藏层神经元数目B和学习率的值,对训练集训练得到模型,
再对测试集数字进行识别,得到如下结果:
B,λ 15,0.3 55,0.3 28,0.2 40,0.2 100,0.2 10,0.5正确率 75.00% 70.52% 78.53% 80.32% 73.69% 70.76%
4.2 实验分析
由表格可以看出,不同的隐藏层神经元数目B和学习率的值对我们分类预测的准
确性有很大的影响当神经元书目为40,学习率为0.2时准确率为 80.32%,这是
一个不错的结果,要想进一步提高准确率还需要在这两个参数上做进一步的尝试。

5 总结
5.1 总结
神经网络在很早以前就被人提出,然而受限于当时电脑设备的限制,一直不得人心,近几十年来科学技术的飞速发展给我们这位历史悠久的伙伴带来了第二春,得以在各行各业大展身手,本文在对人工神经网络的详细介绍分析的基础上将神经网络应用于手写数字识别,神经网络的容错性,纠错性能很好的帮助我们训练高效高准确率的模型。

【参考文献】
【相关文献】
[1]胡玲琳,张若男,李培年,等.手写数字体自动识别技术的研究现状[J].浙江万里学院学
报,2015(2):72-78.DOI:10.3969/j.issn.1671-2250.2015.02.015.
[2]曹丹,杨长兴,张伟,等.手写数字识别的研究进展[J].电脑知识与技
术,2009,5(3):688,695.DOI:10.3969/j.issn.1009-3044.2009.03.073.
[3]朱军勇,贺红燕,张春生.粗糙集-神经网络在构建企业供应链合作伙伴选择中的应用[J].河南理工大学学报:社会科学版,2007,8(1):33.
[4]肖德云,陈荣达,王宗军.基于模糊集和 BP神经网络的企业投资决策绩效集成评价[J].华中科技大学学报:城市科学版,2005,9(3):25.
[5]吴轲.复杂系统思想对计算机辅助企业投资决策的探讨[J].河南科技,2005,6(3):451.
[6]马耀名,黄敏.基于 BP神经网络的数字识别研究[J].信息技术,2007,31(4):87-
88,91.DOI:10.3969/j.issn.1009-2552.2007.04.026.
[7]盛仲飙.BP神经网络原理及MATLAB仿真[J].渭南师范学院学报,2008,23(5):65-
67.DOI:10.3969/j.issn.1009-5128.2008.05.022.
[8]贾书瑞.基于 BP神经网络的手写数字识别[J].科学中国人,2017,(15):23-24.。

相关文档
最新文档