手写数字识别技术研究【开题报告】

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

毕业设计开题报告

计算机科学与技术

手写数字识别技术研究

一、选题的背景、意义

字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家,各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码,统计报表,财务报表,银行票据等等,处理这类信息的核心技术是手写数字识别。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。

在当前在手写体数字识别的研究中,对于已二值化的图像抽取特征的方法有许多种。常用的统计特征有Gabor变换特征、Legendre矩特征、Pseudo-Zernike矩特征与Zernike矩特征。统计特征通常反映图像点阵总体分布情况,这些特征的图像预处理简单,对噪声不敏感,但对字的一些精细结构部分反应不灵敏。由数字图像的骨架和轮廓可抽取出手写体数字的结构特征,它往往对字结构精细部分反映灵敏,但图像预处理复杂,对噪声较敏感,一个完善的基于结构特征的分类器往往十分庞杂。基于这种情况,研究一种特征提取基于根据图像象素的走向判断出某段数字的结构的手写体识别系统具有一定的现实意义。

二、研究的基本内容与拟解决的主要问题

手写字符识别技术作为光学字符识别的一个重要分支,其综合了数学图像处理、计算机图形学和人工智能等多方面的知识,已越来越成为计算机自动化和智能化的重要技术。

由于手写数字的不规范性和多样性,再加上为了识别精确而对数字图像进行高点阵扫描,从而使数字识别时所要处理的信息不仅量大,而且复杂。为了能更好地识别,就要求识别系统能从大量数据中抽取关键信息,加以准确识别。脱机识别将书写字符转化为点阵或二值图像再抽取特征进行识别, 该方法与书写顺序无关, 较易识别具有“补笔划”或有“自由始终点”的字符, 但不易抽取象笔划特征这样分类能力强的特征。

本毕业设计主要解决以图像形式存在的手写体数字的识别问题。主要分为三个部分,

即预处理,手写体数字的结构化特征提取,分类器设计及识别。

图像预处理阶段的细化工作,主要是为了使结构化特征提取时,所提取的特征能更好地反映手写数字或字母的特征。手写体数字或字母的结构化特征的提取,是本论文的关键部分,直接关系到识别的准确率。结构化特征主要根据图像象素的走向,准确判断出某段数字或字母的结构,如直线、折线、曲线、分叉线等。

为了提高识别率,我们将采用BP神经网络算法,对手写体数字或字母的特征进行智能化处理,输出正确的结果。

三、研究的方法与技术路线、研究难点,预期达到的目标

手写数字识别研究的难点在于:第一,不同数字之间字形相差不大,使得准确区分某些数字相当困难;第二,数字虽然只有十种,而且笔划简单,但同一数字写法千差万别。使得手写数字识别的识别率和识别精度很低。

本设计主要分为三大步骤:第一阶段,预处理;第二阶段,特征提取;第三阶段,分类器设计及识别。详细步骤如下图所示:

第一阶段预处理阶段主要包括定位、二值化、去噪、切分、大小规格化、细化等步骤,这里将采用一些成熟的算法。

第二阶段手写数字特征的提取结构化特征时主要根据图像象素的走向,准确判断出某段数字或字母的结构,如直线、折线、曲线、分叉线等。同时配合中线特征等建立起较为准确的特征库。

第三阶段分类器设计及识别时将采用BP神经网络算法设计分类器,通过这些算法本身的高容错率和算法本身的模糊判断等特性,再结合之前建立起的准确的特征库,从而提高手写数字识别时的正确率,达到理想的识别效果。

四、论文详细工作进度和安排

1:2010-2011学年第一学期第9-11周,与指导老师见面,完成选题,初步查找收集相关资料。

2:2010-2011学年第一学期第11-18周,完成开题报告,文献综述,外文翻译,并交给指导老师审阅。

3:2010-2011学年第二学期第1-3周,完成毕业论文初稿;交给老师审阅,根据老师提出的意见进行修改。

4:2010-2011学年第二学期第4-13周,完成论文的最终定稿,交指导教师和评阅教师评阅,并准备论文(设计)答辩。

5:2010-2011学年第二学期第14-15周,进行论文答辩。

五、主要参考文献:

[1] 曹丹等.手写数字识别的研究进展[J].电脑知识与技术.2009.03.

[2] 娄震等.自由手写体数字识别研究[J].计算机学报.1999.10.

[3] 张捷.手写数字识别的研究与应用[D].西安:西安建筑科技大学;2004.

[4] 王鹏.基于神经网络的手写体字符识别[D].北京:北京工业大学学报.2007.09.

[5] 王军.基于模板匹配的联机手写数字识别[J].现代计算机(专业版).2008.

[6] 朱小燕等.基于反馈的手写体字符识别方法的研究[J].清华大学计算机科学与技术系.2002.05.

[7] 杨淑莹等.图像模式识别-VC++技术实现[M].北京:清华大学出版社.2005.

[8] 施少敏.基于BP神经网络的数字识别方法[J].兵工自动化.2006.10.

[9] 付庆铃等.基于人工神经网络的手写数字识别[J].北京工商大学学报.2004.122.

[10] 王永亮.小波神经网络在手写数字识别中研究与应用[D].山东理工职业学院.电脑编程技巧与维护.2010.14.

[11] Gonzalez,Wood.Digital Image Processing[M].Prentice Hall.2008.

[12] Richard O.Duda.Pattern Classification[M]. wiley-Interscience. 2000.

相关文档
最新文档