基于模板匹配算法的字符识别系统研究与实现_毕业论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
合肥学院
毕业设计(论文)
设计(论文)题目基于模板匹配算法的字符识别系
统研究与实现
院系名称计算机科学与技术系
专业(班级)计算机科学与技术
姓名(学号)
指导教师
系负责人
摘要
自从计算机问世以来,让机器具有模式识别能力一直是计算机科学家们的努力方向。研究表明,对视觉和听觉信息的处理过程,不仅仅是一个感知过程,也是一个认知过程。因此,研究模式识别,是理解人类智能的本质的重要途径。字符识别是一个传统和典型的模式识别问题,脱机手写数字识别是一个典型的大类别的模式识别问题。手写体数字具有不同字符字型相差不大、相同字符有多种不同写法、数字没有上下文关系等等特点,使得脱机手写体数字识别成为识别领域最大的难题和最终的目标。在这种大类别识别的研究中,传统上大多采用模板匹配的方法来解决问题。而在模板匹配算法中,得计算其特征值。图像需要经过二值化,细化等预处理。
关键字模板匹配;特征值;细化;二值化
ABSTRACT
Since computer appeared, it has been an effort direction for scientist to let the computer has the ability of pattern recognition. Researching indicates that the procedure to deal with seeing and hearing not only a procedure of perception but also cognition. Therefore, studying pattern recognition is an important way in understanding the mankind’s intelligence and ability. Character recognition is a traditional and typical pattern recognition problem, and Handwritten Numeral Recognition is a typical large vocabulary pattern recognition problem. Different characters do not vary much, the same character can be written in many ways, there is no context between characters, and so on. Because of so many characteristics, Handwritten Numeral Recognition is a very difficult problem and commonly regarded as one of the ultimate goals of character recognition research. And the template matching algorithm, in its calculation of eigenvalues. Image require two value, thinning and other pretreatment.
引言
手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition,简称OCR)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸上的阿拉伯数字。
在整个OCR领域中,最为困难的就是脱机手写字符的识别。到目前为止,尽管人们在脱机手写英文、汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。
手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:(1).阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究基本上与文化背景无关,这样就为各国,各地区的研究工作者提供了一个施展才智的大舞台。在这一领域大家可以探讨,比较各种研究方法。(2).由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。这方面最明显的例子就是人工神经网络------相当一部分的ANN模型和算法都以手写数字识别作为具体的实验平台,验证理论的有效性,评价各种方法的优缺点。(3).尽管人们对手写数字的识别已从事了很长时间的研究,并已取得了很多成果,但到目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题。(4).手写数字的识别方法很容易推广到其它一些相关问题棗一个直接的应用是对英文这样的拼音文字的识别。事实上,很多学者就是把数字和英文字母的识别放在一块儿研究的。
人类认知事物的过程中,视觉起到了举足轻重的作用。视觉是人类最高级的感知器官,它不仅指对光信号的感受,还包括了对视觉信息的获取、传输、处理、存储与理解的全过程。随着工业自动化的发展,机器视觉作为一种应用系统逐渐得到完善和发展。机器视觉就是用机器代替人眼来做测量和判断。其特点是能够提高生产的柔性和自动化程度,在一些不适合人工作业的危险工作环境或人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉;同时在大批量工业生产过程中,用人工视觉检查产品质量效率低且精度不高,用机器视觉检测方法可以大大提高生产效率和生产的自动化程度。而且机器视觉易于实现信息集成,是实现计算机制造的基础技术。在机器视觉中,常常需要从图像背景中把感兴趣的物体检测出来,模板匹配是最常用也是最基本的方法。随着信号处理技术和计算机技术的不断发展,模板匹配在工业检测、卫星遥感、半导体封装、文字识别、导航制导、医学X射线图片处理、气象云图分析、光学和雷达的图像模板跟踪、工业流水线的自动监控、工业仪表的自动监控、资源分析、交通管理、图像数据库检索以及景物分析中的变化检测等领域应用越来越广泛。可见,匹配技术己经成为机器视觉和众多领域中不可或缺的组成部分,对图像匹配技术进行探索研究势在必行。
在下面各章我将以一个字符识别系统为例,就字符识别概述、模板匹配算法及改进、图像预处理、系统的具体实现等方面进行描述。
第一章绪论。
第二章模板匹配算法及改进。
第三章图像的预处理。
第四章系统的设计与实现。
第五章系统运行及测试。
结束语部分对本次毕业设计做出总结。