基于模板匹配算法的数字识别讲解
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中南民族大学
毕业论文(设计)
学院: 计算机科学学院
专业: 软件工程年级:2009 题目: 基于模板匹配算法的数字识别学生姓名: 李成学号:09065093指导教师姓名: 李波职称: 讲师
2013年5月
中南民族大学本科毕业论文(设计)原创性声明
本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。
作者签名:2013年月日
摘要 (1)
Abstract (1)
1 绪论 (2)
1.1 研究目的和意义 (2)
1.2 国内外研究现状 (2)
2 本文基本理论介绍 (3)
2.1 位图格式介绍 (3)
2.2 二值化 (3)
2.3 去噪 (3)
2.4 细化 (4)
2.5 提取骨架 (4)
3 图像的预处理 (5)
3.1 位图读取 (5)
3.2 二值化及去噪声 (5)
3.3 提取骨架 (6)
4 基于模板匹配的字符识别 (8)
4.1 样本训练 (8)
4.2 特征提取 (8)
4.3 模板匹配 (9)
4.4 加权特征模板匹配 (10)
4.5 实验流程与结果 (10)
5 结论 (16)
5.1 小结 (16)
5.2 不足 (16)
6 参考文献 (17)
基于模板匹配算法的数字识别
摘要
数字识别已经广泛的应用到日常生活中,典型的数字自动识别系统由图像采集、预处理、二值化、字符定位、字符分割和字符识别等几部分组成, 这些过程存在着紧密的联系。传统的模板匹配算法因为图像在预处理之后可能仍然存在较大的干扰,数字笔画粗细不均匀,有较大的噪声,识别效率不高。本文采的主要思想就是对字符进行分类,之后对字符进行细化,提取细化后字符的特征矢量,与模板的特征矢量进行加权匹配,误差最小的作为识别结果。本文在模板匹配法的基础上, 采用了特征值加权模板匹配法, 并且改进了匹配系数的求法。应用该法取得了满意的效果, 提高了识别率。
关键词:模板匹配;数字识别;特征值加权;字符识别;
Template matching algorithm-based digital identification
Abstract
Digital identification has been widely applied to daily life, the typical digital automatic identification system by the image acquisition, pre-processing, binarization, character positioning, character segmentation and character recognition several parts, there is a close link these processes. Traditional template matching algorithm because the image may still exist after pre-greater interference, digital strokes uneven thickness, the noise, the identification efficiency is not high. Adopted herein main idea is to classify the character after character refinement, the characters feature vector extraction refinement, and the template feature vector is weighted matching, the minimum error as a recognition result. Template matching method based on feature weighted template matching method, and improve the matching coefficient method. The application of the method to obtain satisfactory results, to improve the recognition rate.
Key words:Template matching; digital identification; characteristic value weighted; character recognition;
1 绪论
1.1研究目的和意义
字符是我们进行信息交流的重要工具,实现计算机的手写字符识别是加快社会信息化进程的关键所在. 由于阿拉伯数字是唯一的被世界各国通用的符号,手写字符识别的研究一直以阿拉伯数字为主导. 在识别算法方面,目前常用的字符识别方法有模板匹配法、几何分类法、人工神经网络识别法和支持向量机( SVM)识别法. 从原理上分析,模板匹配法实现较为简单,但常用的模板匹配法在模板数量很大时计算量很大.本文将研究对象局限于特定图像数字,采用模板匹配法进行识别,根据数字特征先找出最佳特征值,再进行识别取得了较好的效果. 下面是实验中涉及的有关算法.
1.2国内外研究现状
图像匹配在近几十年来一直是人们研究的热点和难点,最早的研究是在70年代美国从事飞行器辅助导航系统等军事应用研究中提出来的。经历了10多年的发展从年代以后其应用逐步从原来单纯的军事应用扩大到其它领域。
国内外现阶段对图像匹配研究主要是以提高匹配的精度和速度为主,同时对匹配方法的通用性及鲁棒性也有一定要求。已研究比较多的匹配方法主要分为基于图像灰度的匹配方法和基于图像特征的匹配方法。
基于灰度相关的图像匹配方法,主要处理不存在旋转的匹配对象,且已经提出了各种各样针对灰度匹配的方法,如:Leese与1971年提出的MAD算法,Bamea D I和Silverman 和于1972年提出了序贯相似性检测法——SSDA,紧接着又提出了归一化积相关算法——NCC,这些方法在时问复杂度或匹配精度上均存在一定问题,不适应于实际的匹配应用。对各种匹配快速算法的研究,主要是从尽可能减少匹配运算量或搜索的位置数这两个角度入手。文献[1]分别对MAS、NCC和SSDA等经典模板匹配算法进行改进以提高匹配速度;文献[2]提出新的匹配方法,即基于图像灰度值编码的匹配方法,较传统匹配算法在速度上提高了一个数量级,但其仅适应于矩形匹配对象,且对局部光照变化非常敏感,从而影响匹配准确度。但在实际应用当中,一般以不规则匹配对象居多,且环境的光照变化也是非常不稳定因素,因此算法设计过程中必须考虑这几个因素。典型的还有在搜索策略上进行改进的一系列方法,分层搜索技术、遗传算法、最小二乘、模拟退火、能量最小、削减搜索分支、多子区域相关匹配等。匹配速度主要从两个方面来分析,一方面分析在同样硬件环境下,同样匹配精度和要求下,比较所研究方法和其它方法的实际运算时间;另一方面分析算法,进行算法时间复杂度的比较。
由于基于灰度相关的图像匹配方法,不能解决匹配对象存在旋转情况下的匹配问题,所以继续研究基于特征的图像匹配方法,主要是针对匹配对象存在旋转情况下的匹配方法。常使用的特征包括边缘、区域、曲率、面积、线交叉点、质心等,其中以边缘和区域边界最常用,它们可由边缘检测方法和图像分割方法得到。
从上述分析可知,一方面匹配问题是研究热点,另一方面也说明匹配问题仍然有许多技术难题没有解决且急需解决。在上千种算法中,匹配问题在准确性、鲁棒性两方面几乎找不到通用的、一劳永逸的算法。