一种基于多模板匹配的字符识别方法
基于模板匹配法的字符识别算法研究
![基于模板匹配法的字符识别算法研究](https://img.taocdn.com/s3/m/0bd0c50676c66137ee061929.png)
( Na u c t n 1 c n c l l g , o d 4 7 0 Ch n ) Hu n Lo Di Vo a i a o Te h ia l e L u i 1 0 0, ia Co e
Ab ta t T hi pe is i c s d t o e fc ar c e e o ii sr c : s pa r fr td s us e he c nc pto h a t r r c gn ton, pr e s a e plt athi i c p e: e — oc s nd t m a e m c ng prn i l s c
o d,fo t e ag rt m r c s n h e o ef c s d o h h e e lt - b s d c a a t rr c g ii n a g rt m ;a d n r m h l o i h p o e sa d t e k y c d o u e n t et r et mp a e a e h r c e e o n t l o ih o n a an c mp r t e a a y ie e e if r n t t a e a d t e c a a t ro a s o s i u n s ; s to f r d a p i n l a g i o a a i n l s s d s v n d fe e ts a e r t n h h r c e f l e c n co s e s l ti fe e n o t a — v f a o b
第 3 卷 第 2期 1
20 ቤተ መጻሕፍቲ ባይዱ 2年 6月
计 算
技
术
与 自 动
化
基于模板匹配的车牌汉字识别方法及判别函数
![基于模板匹配的车牌汉字识别方法及判别函数](https://img.taocdn.com/s3/m/930ad57527284b73f2425029.png)
摘
要
ቤተ መጻሕፍቲ ባይዱ
利用预先设计好的标准车牌汉字模板与待识别字符进行逻辑 ‘ 运算,通过判别函数得 出识别结果。文中提 与’
出两个判别函数 ,求取模板、待识别字符与匹配结果三者标准差最小值,求取 匹配结果矩阵元素和最大值 ,并对它们的识别
结果进行对比和分析 ,最后将 两个函数联合使用。结果表 明,在一些字符的识别上文 中方法较以往的识别方法有所提 高。
a d te c a a trt e r c g ie n h h rce o b e o n z d. I u sfr r wo d s rmia tf n t n tp t wa d t ici n n u ci s, c luae h nmu o tn ad o o ac lt st e mii m fsa d r d v ain o etmp ae, t ec aa trt er c g ie n h thn e ut c luae h xmu s m ft e e it ft e lt o h h h r ce ob e o nz d a d t emac igr s l, ac lt st ema i m u o h marx ee n so h th n e ut a d ma e n a ay i o errs l . T e tu e h m o eh r T e r — ti lme t fte mac i gr s l , n k sa n lss ft i e ut h s h n i s st e t g t e . h e s l h w h ti h sb te e utta h r vo smeh d i e o n t n o o h r ces ut s o ta t a etrrs l h n t ep e iu t o n rc g i o fs me c a a tr . s i K e wo d lc n ep ae rc g i o y r s ie s lt e o t n; c aa tr; tmp ae; lgc o eain ; b n r ti Malb n i h ce r e lt o i p rto s ia y marx; t a
基于模板匹配算法的字符识别系统研究与实现_毕业论文
![基于模板匹配算法的字符识别系统研究与实现_毕业论文](https://img.taocdn.com/s3/m/5d4a13c16f1aff00bed51e77.png)
合肥学院毕业设计(论文)设计(论文)题目基于模板匹配算法的字符识别系统研究与实现院系名称计算机科学与技术系专业(班级)计算机科学与技术姓名(学号)指导教师系负责人摘要自从计算机问世以来,让机器具有模式识别能力一直是计算机科学家们的努力方向。
研究表明,对视觉和听觉信息的处理过程,不仅仅是一个感知过程,也是一个认知过程。
因此,研究模式识别,是理解人类智能的本质的重要途径。
字符识别是一个传统和典型的模式识别问题,脱机手写数字识别是一个典型的大类别的模式识别问题。
手写体数字具有不同字符字型相差不大、相同字符有多种不同写法、数字没有上下文关系等等特点,使得脱机手写体数字识别成为识别领域最大的难题和最终的目标。
在这种大类别识别的研究中,传统上大多采用模板匹配的方法来解决问题。
而在模板匹配算法中,得计算其特征值。
图像需要经过二值化,细化等预处理。
关键字模板匹配;特征值;细化;二值化ABSTRACTSince computer appeared, it has been an effort direction for scientist to let the computer has the ability of pattern recognition. Researching indicates that the procedure to deal with seeing and hearing not only a procedure of perception but also cognition. Therefore, studying pattern recognition is an important way in understanding the mankind’s intelligence and ability. Character recognition is a traditional and typical pattern recognition problem, and Handwritten Numeral Recognition is a typical large vocabulary pattern recognition problem. Different characters do not vary much, the same character can be written in many ways, there is no context between characters, and so on. Because of so many characteristics, Handwritten Numeral Recognition is a very difficult problem and commonly regarded as one of the ultimate goals of character recognition research. And the template matching algorithm, in its calculation of eigenvalues. Image require two value, thinning and other pretreatment.引言手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition,简称OCR)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸上的阿拉伯数字。
一种基于模板匹配的OCR识别方法及其系统[发明专利]
![一种基于模板匹配的OCR识别方法及其系统[发明专利]](https://img.taocdn.com/s3/m/37767b7468eae009581b6bd97f1922791688beff.png)
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202010715323.4(22)申请日 2020.07.23(71)申请人 厦门商集网络科技有限责任公司地址 361101 福建省厦门市厦门火炬高新区创业园轩业楼3008室(72)发明人 庄国金 陈文传 陈昊 温亦汝 杨龙 吕晓君 郑宇 (74)专利代理机构 福州科扬专利事务所 35001代理人 何小星(51)Int.Cl.G06K 9/34(2006.01)G06K 9/32(2006.01)G06K 9/46(2006.01)G06T 5/00(2006.01)G06T 7/11(2017.01)G06F 40/216(2020.01)(54)发明名称一种基于模板匹配的OCR识别方法及其系统(57)摘要本发明涉及一种基于模板匹配的OCR识别方法及其系统,通过对图像进行预处理,投影切割字符,将字符划分为多个网格,并计算网格特征值,将特征值与模板特征值比对计算相似度,以相似度最高的模板作为识别结果。
本发明有益效果:适用于大部分场景,算法开发难度低,效率高,识别精度高。
权利要求书4页 说明书10页 附图4页CN 111914847 A 2020.11.10C N 111914847A1.一种基于模板匹配的OCR识别方法,其特征在于,包括如下步骤:S1:获取目标图像;S2:对所述目标图像进行预处理;S3:对经过预处理的目标图像进行字符切割,以获得单独的字符图像,利用投影算法对所述字符进行切割处理;S4:将所述单独的字符图像进行垂直投影分割获得N个一级网格,对所述一级网格进行水平投影分割获得N2个二级网格,对所述二级网格进行垂直投影分割获得2N2个三级网格,对所述三级网格进行水平投影分割获得4N2个四级网格,其中,N的取值大于2;S5:计算所有的所述四级网格的特征值,所述特征值包括:笔画方向的对比特征值,横竖笔画判断的位特征值,撇捺笔画判断的位特征值,大小判断的位特征值,形状判断的位特征值;S6:将所述特征值与字符模板的对应特征值按照从左到右的顺序,依次比对对应位置的数值,如果数值一致,则相似度加1,计算所有特征值的相似度总和,取相似度总和最大的字符模板所代表的字符作为字符识别结果。
基于模板匹配算法的字符识别研究
![基于模板匹配算法的字符识别研究](https://img.taocdn.com/s3/m/62ce0816905f804d2b160b4e767f5acfa1c7831a.png)
基于模板匹配算法的字符识别研究随着信息技术的发展,字符识别技术在各个领域的应用越来越广泛。
本文主要探讨基于模板匹配算法的字符识别技术,旨在提高字符识别的准确性和效率。
本文将介绍模板匹配算法的原理及其在字符识别中的应用;阐述常用的字符识别技术,如图像处理、深度学习等;通过实验分析模板匹配算法在字符识别中的有效性和可行性。
模板匹配算法是一种常见的图像处理技术,其基本原理是将输入图像与预先定义的模板进行比较,找到最相似的部分。
在字符识别领域,模板匹配算法通常用于识别特定的字符或符号。
需要将待识别的字符或符号定义为模板,并将模板存储在数据库中。
在识别过程中,将输入的图像与数据库中的模板逐一进行比较,找出最相似的字符或符号。
字符识别技术是利用计算机技术自动识别图像中的字符或符号。
除了模板匹配算法外,常用的字符识别技术还包括图像处理和深度学习等。
图像处理技术主要是通过对图像进行预处理、特征提取等操作,为后续的字符识别提供更好的图像数据。
深度学习则是利用神经网络模型进行字符识别,其具有强大的自适应能力和鲁棒性,可以处理各种复杂的字符和字体。
基于模板匹配算法的字符识别研究是本文的重点。
目前,该领域的研究主要集中在如何提高模板匹配算法的准确性和效率方面。
一些研究者通过优化算法参数、选择更合适的特征提取方法等手段来提高准确性;另一些研究者则从数据库优化、多模板匹配等方面入手来提高识别效率。
随着深度学习技术的发展,也有越来越多的研究者将深度学习应用于字符识别,取得了不错的成果。
为了证明模板匹配算法在字符识别中的有效性和可行性,我们设计了一系列实验进行测试。
我们选取了多种不同的字符模板,包括数字、英文字母、中文字符等,并使用不同的图像处理技术对这些模板进行预处理。
然后,我们将这些模板与待识别的字符图像进行比较,并采用主观和客观两种方式评价算法的准确性和效率。
实验结果表明,基于模板匹配算法的字符识别技术在某些场景下具有较高的准确性和效率,但面对复杂多变的字符和字体时仍存在一定的局限性。
基于模板匹配的手写字符识别技术实现
![基于模板匹配的手写字符识别技术实现](https://img.taocdn.com/s3/m/3c9f87186c175f0e7cd1371e.png)
情 况 下 , 们往 往 采 用 模 板 匹 配 的算 法 对 手 写 字 我 符 进 行 识 别 , 识别 过 程 中 , 在 图像 需要 进 行 去 噪 ,
二值 化等 预处 理 , 过 提 取 特 征值 的方 法 建 立 模 通 板 数 据库 , 匹配 的过 程 中 , 在 通过 对特 征值 的 比对
1 4 1 全 局设 置 在菜 单栏 中 的 “ 具 ( os . . 工 To l)
一
选项 ( t n ) ( Opi s 一 目录) rco i ” 设 置 l o Di tr s 先 e e i b
C: P o r m i s Op n \ r g a F l \ e CV\ i e l b
中 图分 类 号 : P 9 . 3 T 3 14 文献标识码 : A
0 引 言
对视觉 和 听觉 信息 的处 理过 程不 是一 个简 单 的感 知过程 , 确切 的说 是一 个认 知 过程 , 更 模式 识
别 的 延伸便 是 人类 智能 , 以 , 计算 机具 有模 式 所 让 识 别 能力 一直 是计算 机 研究 者努 力 的方 向.
摘 要 : 传 统 的 图 像 处 理 程 序 中 , 于 没 有 标 准 的 AP , 往 会 造 成 编 码 量 大 , 率 又 不 高 的 结 果 . 在 由 I往 效 而 Op n V提 供 了 统 一 的 AP , 后 续 的 图像 处 理 提供 了 极 大 的 便 利 , 这 里 首 先 介 绍 了在 V + + 6 0下 安 装 、 eC I为 在 C . 配 置 Op n V( 里 主要 指 的 是 O e C . eC 这 p n V1 0版 本 ) 环境 , 以及 建 立 O e C 下 的 V pn V C+ + 6 0应 用 程 序 框 架 . . 在
ocr识别流程
![ocr识别流程](https://img.taocdn.com/s3/m/8741c959b94ae45c3b3567ec102de2bd9605dedd.png)
ocr识别流程一、概述OCR(Optical Character Recognition,光学字符识别)是一种将图像中的文字转换为可编辑文本的技术。
OCR技术在现代社会中得到了广泛应用,例如文档数字化、自动化数据录入等领域。
本文将详细介绍OCR识别流程。
二、前期准备1.确定需识别的图像类型:OCR技术可以识别多种类型的图像,如扫描件、照片等。
在进行OCR识别前需要确定需处理的图像类型。
2.选择合适的OCR软件:市面上有很多OCR软件,如ABBYY FineReader、Adobe Acrobat等。
根据需求选择合适的软件。
3.准备好待处理的图像:将需处理的图像保存在计算机中,并确保其清晰度和分辨率符合要求。
三、OCR识别流程1.导入待处理图像:打开所选OCR软件,在界面中导入待处理的图像。
2.预处理:对导入的图像进行预处理,以提高后续识别效果。
常见预处理方法包括:(1)去除噪点:使用滤波算法去除噪点,提高文字清晰度。
(2)增强对比度:调整亮度和对比度,使文字更加清晰鲜明。
(3)分割图像:将图像按照文字行进行分割,以便后续逐行识别。
3.文字识别:对预处理后的图像进行文字识别。
OCR软件通常采用以下两种方法进行文字识别:(1)基于模板匹配的方法:OCR软件将待处理图像中的每个字符与预先存储的字符模板进行比对,从而确定每个字符的识别结果。
(2)基于机器学习的方法:OCR软件利用深度学习算法训练神经网络,从而实现对待处理图像中字符的自动识别。
4.后处理:对OCR识别结果进行后处理,以提高其准确性和可读性。
常见后处理方法包括:(1)纠错:通过比对OCR识别结果和原始文本,纠正其中可能存在的错误。
(2)格式化:根据需求对OCR识别结果进行格式化,如调整字体、字号等。
(3)去重复:在多次扫描同一文档时可能会出现重复内容,在后处理阶段需要去除这些重复内容。
5.导出文本文件:将OCR识别结果导出为文本文件,以便进一步编辑、存储或分享。
基于模板匹配算法的识别系统
![基于模板匹配算法的识别系统](https://img.taocdn.com/s3/m/dbf4d8e619e8b8f67c1cb985.png)
中图分类  ̄ - : T P 3 9 1 . 4 1
文献标识码 : A
文章编号 : l 0 O 7 — 9 4 1 6 ( 2 0 1 3 ) 0 6 — 0 1 3 4 0 2
1模板 匹配算 法 的描 述
在机器识别事物的过程 中, 常需把不 同传感器或同一传感器在 不 同时间、 不同成像条件下对同一景物获取的两幅或多幅图像在空 间上对准 , 或根据 己知模 式到另一幅 图中寻找相 应的模式 , 这就叫 做 匹配 。 因为只有 当同一场景的两幅图像在 同一坐标系下时, 才能 进行相似性 比较 , 所 以模板 匹配的过程实际上也就是把一幅图像变 换到另一 幅图像的坐标系过程 。 图像的模板匹配就是先给定一 幅图 像, 然后 到另 一幅图像 中去查找这幅 图像 , 如果找到 了, 则 匹配成 功。 这看起来好像很 简单 , 因为我们一 眼就能看 出一幅图中是否包 含另一 幅图像 , 遗憾的是 电脑 并不具有人眼的强大的视觉 的功能 , 因而需要 电脑去判定一幅图片中是否包含另一幅图片是件不容易 的事情 。 对于机器视觉 系统而言 , 实现匹配首先要对 图像进行预处 理。 先计算模板图片 的特征值 , 并存储到计算机 中。 然后计算待测试 样 板图片 的特征值 , 与计算机 中模 板进行 比较 , 运用 匹配算法 实现 匹配 。 整 个 过 程如 图 1 所示 。 在基 于 图像处 理 的 应用 领 域 中, 对于 图像 匹配 的研 究 可 以说 一 直都是数字 图像处理技术和计算机视觉理解的重要研究内容 。 图像 匹配在机器视觉 、 工业 自动模式识别 、 医学 图像的定位等方面都有
3 )
∑∑S ( , n ) x T ( m , )
一种基于PCA的多模板字符识别
![一种基于PCA的多模板字符识别](https://img.taocdn.com/s3/m/5ef42a292f60ddccda38a0b5.png)
0 引 言
字符( 包括数字和英文) 识别是 图像处理和模式识别
领 域 中的研究 课题 之一 , 涉及 模 式识 别 、 它 图像 处 理 、 人工
字 符进 行 细 化 , 后 提取 细 化 后 的 字 符特 征 , 时 特 征维 然 此 数 较 高 , 于在 高 维 的特 征 空 间 , 法 的 时 间复 杂 度 和 空 由 算
( CA) P .Toi p o erb s lsiiainr sa c ndgtla d E gih c aa trr c g iin,ti a e s CA O r v o u tca sf t e e rho ii n l h rce eo nto m c o a n s hsp p ru e P d t
d me so e u to fc a a t r fa u e is l 。t e S d K- a s t l s e c h r c e O ma e e c h r c e i n in r d c in o h r c e e t r s fr ty h n U e me n O cu t r e h c a a t r t k h c a a t r a a
智能、 中文信息处理等学科 , 是一 门综合性技术, 中文信 在 息处理 、 办公室 自动化 、 人工智能、 车牌识别 、 交通管理等 高技术领域都有着重要 的实用价值和理论意义。稳定特 征的抽取与良好性能 的分类器 的设计是整个识别系统的 核心 , 它们直接决定 了识别系统的性能 。 识别系统的识别方式可 以分为传统 的单模板分类器
Sc u n Unv riy,Ch n du 6 00 4) ih a ie st e g 1 6 ・
Ab ta t Th s p p rp e e t d a n w u t t m p a ec a a t rr c g iin m eh d b s n p i cp l mp n n n l ss sr c : i a e r s n e e m li e l t h r c e e o n t t o a e o r i a - o d n o c o e t a y i a
一种基于模板匹配的字符识别方法
![一种基于模板匹配的字符识别方法](https://img.taocdn.com/s3/m/ba369039df80d4d8d15abe23482fb4daa58d1df0.png)
一种基于模板匹配的字符识别方法专利名称:一种基于模板匹配的字符识别方法技术领域:本发明属于模式识别与图像处理技术领域,具体涉及模板匹配识别,本方法用于对图像中的字符进行识别,从而将图像信息转化为文字信息。
背景技术:字符识别是许多智能系统的关键组成部分。
例如在车牌识别系统中,字符识别是最后一步。
字符识别属于模式识别范畴,现有的模式识别在理论、方法与实践方法的成果,为字符识别提供了丰富的解决方法。
从统计模式识别的观点来看,字符的识别实际上一个模式分类的问题。
国内外学者提出了许多不同的识别方案,大致可分为基于分类器的识别方法和基于模式/模板匹配的方法。
从公开的论文来看,利用分类器进行识别的方法可以获得较好的识别结果。
例如有 D. Llorens 等人提出的 “Car License Plates Extraction and Recognition Based onConnected Components Analysis and HMM Decoding”。
但是分类器的方法需要大量的学习样本进行训练。
同时,像ANN这样的分类算法存在收敛性和过学习的问题。
模板匹配算法适用于没有旋转角的固定大小的单字符识别。
通常采用的是对二值图像进行匹配。
P. Comelli 等人在文献“Optical recognition of motor vehicle licenseplates. ”中提出了模板匹配在字符识别中的应用。
从实时性、算法复杂性等角度考虑,模板匹配算法能够满足字符识别的任务。
但是模板匹配也有其缺陷,即对同一类字符在不同图像中的尺度多变性以及光照多变性敏感,容易产生匹配偏差,因此,需要加入特殊处理手段。
这也是在本发明中,着重解决的问题。
发明内容针对现有技术存在的上述问题,本发明提出一种基于模板匹配的字符识别方法,该方法在传统的模板匹配算法基础上,加入多尺度和位移变换,以解决实际场景中存在的字符多样性问题。
基于模板的连机字符识别方法
![基于模板的连机字符识别方法](https://img.taocdn.com/s3/m/ff26c502c4da50e2524de518964bcf84b9d52ddc.png)
基于模板的连机字符识别方法
Scott;D.Connell;胡辉良
【期刊名称】《图象识别与自动化》
【年(卷),期】2001(000)002
【摘要】手写体字符在日常生活中普遍应用,同时也是一种有用的机器输入方式。
模板匹配分类法能分类单个字符或词。
本文,我们介绍一种基于模板的连机字符识别方法,大量具有代表性的模板会作自动判决。
这些模板代表一个特定字符的不同书写风格,它们也可作为判决树的一种高效分类。
在296MHz的Sun Ultra Sparc机上,对一组17,928个字母数字(共36种:10种数字,26种字母)的测试,其识别率超过8字符/秒,并取得了86.9%的正确率。
【总页数】13页(P1-13)
【作者】Scott;D.Connell;胡辉良
【作者单位】不详;不详
【正文语种】中文
【中图分类】TP391.43
【相关文献】
1.一种基于多模板匹配的字符识别方法 [J], 李婧;龚晓峰;王瑞辉
2.一种基于改进模板匹配的车牌字符识别方法 [J], 马俊莉;莫玉龙;王明祥
3.一种基于模板匹配的数字仪表字符识别方法 [J], 卢卫娜;刘长荣;郑玉才;王海芳
4.一种基于比例特征提取模板匹配算法的充值卡卡密字符识别方法 [J], 张春昱
5.基于模板匹配和神经网络的车牌字符识别方法 [J], 王敏; 黄心汉
因版权原因,仅展示原文概要,查看原文内容请购买。
基于模板匹配的光学字符识别技术研究
![基于模板匹配的光学字符识别技术研究](https://img.taocdn.com/s3/m/6c48e97eb207e87101f69e3143323968011cf4f5.png)
基于模板匹配的光学字符识别技术研究近年来,随着人工智能技术的不断发展,光学字符识别技术也得到了显著的进展。
基于模板匹配的光学字符识别技术是其中一种比较成熟的技术。
本文将对基于模板匹配的光学字符识别技术进行研究和探讨。
一、模板匹配原理基于模板匹配的光学字符识别技术是通过将待识别字符与已知字符进行比对,从而进行识别的。
其核心原理是利用已知字符的特征作为模板,并将其与待识别字符进行匹配,从而得出它们的相似度,最终确定待识别字符的类型。
二、模板匹配方法在模板匹配技术中,模板的选择是一个非常重要的环节。
提高模板匹配的准确性,需要选取尽可能多的不同或相似的模板。
1. 模板图像获取获取模板图像时,既可以用人工制作的样本,也可以用现成的字体资料库,甚至可以利用字符生成软件进行生成。
模板图像的获取具有很强的主观性,所以要选择一些良好的模板,这是制造高精度OCR系统的前提。
2. 特征提取特征选择具有重要意义,对于提高识别率有很大影响。
对于同一个字符,由于字体、大小、倾角、灰度等因素的变化,它的特征也是不同的。
针对这一问题,一些常用的特征提取方式,如投影法、轮廓变换、极坐标变换等方式被广泛采用,以提高识别的精度和准确性。
3. 模板匹配模板匹配就是比较待识别字符与模板库中的已知字符,利用字符的特征进行匹配比较。
匹配可以分类为两类,一是相似性度量法,二是分类决策方法。
基于概率分布的相似性度量法是目前常见的方法。
它将待识别字符与已知字符进行匹配,计算它们之间的相似度,选取相似度最高的作为待识别字符的类别,从而实现字符识别。
三、模板匹配的优缺点模板匹配技术具有优缺点并存。
1. 优点(1) 精度高: 模板匹配技术对于类似字符的识别效果较好。
(2) 实用性强: 模板匹配技术的原理和方法均较易理解,易于实现,因此受到广泛的应用。
它不受文字排版次序的限制,且识别难度与字体无关,因此具有较强的实用性。
2. 缺点(1) 可扩展性差: 字符库过大时,匹配时间会变得非常长,对于大规模的识别任务,其缺点也比较明显。
多模版匹配的特殊符号识别定位算法研究
![多模版匹配的特殊符号识别定位算法研究](https://img.taocdn.com/s3/m/49cb67713a3567ec102de2bd960590c69ec3d8fe.png)
第38卷第3期 计算机应用与软件Vol 38No.32021年3月 ComputerApplicationsandSoftwareMar.2021多模版匹配的特殊符号识别定位算法研究曹长玉 郑佳春 黄一琦(集美大学厦门市海洋智能终端研发及应用重点实验室 福建厦门361021)收稿日期:2019-08-27。
福建省科技计划重点项目(2017H0028);福建省自然科学基金项目(2013J01203,2015J01265)。
曹长玉,硕士生,主研领域:图像识别,深度学习。
郑佳春,教授。
黄一琦,硕士生。
摘 要 针对试卷智能批阅场景模式,由于Tesseract OCR缺少特殊符号包,直接定位符号存在较多漏检等问题,提出具有覆盖保留机制的多模板匹配方法。
通过OCR定位空白试卷中的符号分别建立多类型元素的方块、圆圈、括号模板集;而对于试卷中的直线,通过筛选查找轮廓的方法建立多类型元素的直线模板集,综合多模板匹配技术提高试卷中符号的识别性能及定位准确率。
经实际试卷测试结果表明:该算法符号定位准确率、精确度和召回率均高于94%;查找轮廓法定位直线准确率达96%,模板匹配直线定位准确率、精确度和召回率高于87%;将空白试卷符号坐标应用于学生作答试卷,能较完美地定位手写答案。
关键词 智能批阅 模板匹配 符号 查找轮廓中图分类号 TP391.1 文献标志码 A DOI:10.3969/j.issn.1000 386x.2021.03.027ASPECIALSYMBOLRECOGNITIONANDLOCATIONALGORITHMBASEDONMULTI TEMPLATEMATCHINGCaoChangyu ZhengJiachun HuangYiqi(XiamenKeyLaboratoryofMarineIntelligentIOTTerminalDevelopmentandApplication,JimeiUniversity,Xiamen361021,Fujian,China)Abstract Intheintelligentreviewscenemodeoftestpapers,becauseTesseract OCRlacksthespecialsymbolpackage,therearemanymisseddetectionproblemssuchasmissingsymbols.Amulti templatematchingmethodwithoverlayretentionmechanismisproposed.Thesquare,circleandbrackettemplatesetsofmulti typeelementswereestablishedbyOCRlocatingthecoincidenceofblanktestpapers.Forthestraightlineinthetestpaper,thelinetemplatesetofmulti typeelementswasestablishedbymethodoffilteringthecontoursearch,andthentheintegratedmulti templatematchingtechnologyimprovedtherecognitionperformanceandpositioningaccuracyofthesymbolsinthetestpaper.Theactualtestpapertestresultsshowthatthesymbolicpositioningaccuracy,precisionandrecallratearehigherthan94%;theaccuracyrateoflinepositioningbysearchingcontourmethodis96%,andthetemplatematchinglinepositioningaccuracy,precisionandrecallratearehigherthan87%;theblanktestpapersymbolcoordinatesareappliedtostudents answerpaper,whichcanperfectlylocatethehandwrittenanswer.Keywords Intelligentreview Templatematching Specialsymbols Searchingcontour0 引 言传统基于人工的试卷批改方式需花费教师大量的时间与精力,大大增加了教学负担。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一种基于多模板匹配的字符识别方法李 婧,龚晓峰,王瑞辉(四川大学 电气信息学院 成都 610065)摘要:本文在对字符进行各种预处理,包括倾斜校正,归一化,分割的基础上,依据字符的高度,宽度范围,提出了一种基于多模板匹配的字符识别方法,并将该算法运用于仿宋_GB2312字体,识别率达到98%以上,有效的提高了识别正确率,简单易实现。
关键词:倾斜校正;字符分割;多模板匹配中图分类号:TP391.41 文献标识码:AA recognition method of characters based onMulti-Template MatchingLI Jing, GONG Xiao-feng, Wang Rui-hui(College of Electrical Information, Sichuan University, Chengdu 610065, China) Abstract: This paper first do pretreatment such as skew correction, normalization, segmentation of characters, etc. Then it presented a new muti-template matching method according to the range of the character’s width and height. At last, the experiment used in the FangSong_GB2312 font show that this method can improve recognition accuracy and is easy to put into practice.Keywords: skew correction; character segmentation; multi-template matching0 引言字符识别是图像处理和模式识别领域中的研究课题之一,它涉及模式识别、图像处理、人工智能、中文信息处理等学科,是一门综合性技术,在中文信息处理、办公室自动化、人工智能、车牌识别、交通管理等高技术领域都有着重要的实用价值和理论意义[1]。
目前字符识别主要有以下几种方法:1)利用字符的统计特征进行特征提取,2)基于字符结构分析的识别方法,3)利用字符的结构特征和变换进行特征提取,4)基于模板匹配的方法进行字符识别,5)近年来又出现了基于神经网络的算法和基于矩和小波变换的识别算法。
但由于同一字体的字符有各种字号的差异,单一的运用上述某一种方法的效果都不理想[2]。
为了提高识别率,本文从识别率较高的模板匹配法入手,对单模板匹配和特征模板进行改进,提出了一种根据字符高度,宽度值为每个字聚类多个模板,最后采用海明距离实现多模板的匹配。
通过将该算法运用于仿宋_GB2312字体,发现这一方法能有效解决相似度高的字符的正确识别问题,有一定的实用价值。
1 识别系统总体方案字符识别系统一般包括字符预处理,字符分割,字符识别三个环节,系统框图如图1所示。
图1 字符识别系统框图2 预处理字符图像可能是彩色的,可能含有噪声点或位置倾斜,为了便于分割和特征比对,我们要先将其全部统一成标准的16×8的二值化模板。
所以需要进行去噪[3],二值化,倾斜校正,图2 遍历法示意图2.1倾斜校正:一般倾斜校正有基于纵向投影和Hough 变换[4]两种方法,本文采取的是遍历法。
如图2所示,选择图像的左边界作为出发点,选择某倾斜角度θ作为直线的倾斜角。
已知直线方程y=k*x 十b,知道直线上的一点(x,y)和直线的倾斜角度θ,则可以求得k 和b。
然后判断被确定的直线是否都在背景中,若是,倾斜角度为θ的直线数加1。
如图2中直线①,③,④,都不满足要求,只有②是完全在背景的直线。
保持θ不变,遍历左边界的所有点可以得到一系列的直线,分别判断这些直线是否满足要求,记录满足要求的直线数。
给倾斜角度θ一个范围,按一定的步进变化θ,可以得到不同的θ对应的贯穿左右边界的直线数,以其中直线数最大的那个θ作为真实倾斜角度的估计。
当倾斜角度限制在较小的范围时,该方法检测倾斜角度的时间会明显优于Hough 变换检测倾斜角度。
图3可以看出在10度角的时候能够贯穿图像左右的直线条数达到280多条,远远高于其它角度检测出来的满足要求的直线。
因此,该文本的倾斜角度是10度,这与实际将图像旋转的角度一样。
图3 倾斜角度检验结果2.2归一化:为了避免归一化后丢失图像信息,我们采用插值法,对于新图里的每个点(i 1,j 1)按比例放大找到原图中的点(i,j),并将(i,j)点的像素值赋给(i 1,j 1),这样处理后不会产生离散点。
3 字符分割完成字符预处理后就可以对字符进行切分了,切分有很多方法, 由于本文是印刷体字符且不存在粘连并具有连通性,可以采用比较简单的投影的方法。
3.1行分割:将字符作水平方向的投影,累加各行上黑色像素的个数,由于每行字符间存在明显间距,可通过一条水平的线条从上到下扫描投影图,通过判断扫描过程中遇见的黑色像素决定每行的起始位置。
3.2 字符粗分割:方法与行分割类似,区别仅在于在已分割出的每行字符中作垂直方向的投影,根据字间距,判断扫描过程中遇见的黑色象素决定字符的起始和结束地址。
3.3 字符细分割:由于字符大小不一,仅用一次上述方法会使小字符和一行多排的字符分割不准确,为了精确取得每个字符的边框,我们必需在已分割出的方框中再次进行行投影,列投影,完成二次分割,效果如图4。
图4 二次分割效果图4 特征提取4.1 投影特征二值的字符图像向下投影,即从字符上边缘向下扫描,遇到字符像素即作累积投影,最后对投影特征进行波峰、波谷判断[5],依据比例构成形成特征模板。
以后得到的投影特征与模板比较分类。
本文采用水平方向和竖直方向的投影合起来作为二维特征向量。
4.2 模板特征4.2.1简单模板匹配 简单模板匹配过程中选择的模板与字符归一化后的图像统一尺寸为高16像素宽8像素。
模板只有一套,本文中用仿宋_GB2312字体中36号字做模板,直接进行模板与字符图像的逐点匹配,采用海明距离[6]即:i d =16800(,)(,)iy x T x y I x y ==⊗∑∑ 其中T i (x,y)为第i 号模板,I(x,y)为字符图像,且T i (x,y),I(x,y)都取值0或者1。
0表示白色背景象素,1表示黑色字符象素。
取d i 最小时T i (x,y)对应的字符为匹配结果。
但由于每种字体的字符从10号到72号不等,而模板仅一种必然会引起识别误差,为处理这个问题首先想到了下面的改进方法。
4.2.2基于概率的多模板匹配在10号至72号字种,平均的选取八种字号建模,得到八个模板,使这八个模板基本涵盖了各种大小的字符。
并计算每个模板的平均字符高度。
识别时,首先统计该文本中所有字符的高度,计算哪种高度的字符数目最多,根据出现概率最多的高度来决定选用哪个模板进行匹配。
当文本中大多数为一种字号的字符,模板选择正确时,识别率基本可达100%,并且由于是基于概率统计的方法,所以文本字符数越多,越容易正确选择模板,识别正确率越高。
而当文本中含有各种不同字号的字符时,每种高度出现的概率相近,就很难选择模板,造成识别错误。
所以综上所述,这种基于概率的多模板匹配实际是一种假相的多模板,因为最终用于匹配的仍然为单一模板。
适用于文本字数多,字号相近的字符识别。
4.2.3改进的多模板匹配在仿宋_GB2312字体中对10到72号字符按照字号的不同共做14个模板,统计各个模板的高,宽范围,对待识别的每个字符按其高,宽值寻找匹配模板,若有多个模板符合要求,则都进行匹配,在结果中选择最相似的一个作为最终识别结果。
图5为字符c 的识别过程。
图5 单字符识别过程4.3 功能扩展4.3.1不同字号混排的识别对这种情况如果依然采用自上而下,自左及右依次进行字符的对应匹配并对应显示的方式,会使一行内重叠摆放的几个小字符同时产生错误,为解决这一问题,我们首先采用第三部分提到的二次分割法精确分割然后用竖直排列显示方法来处理这一问题。
4.3.2特殊字符i,j的识别对于字符i,j,由于字符中有断隔,为了避免错分在分割时设置一定阈值,对像素值小于一定数的不予标记,取消分割。
5 分析与结果选取仿宋_GB2312字体10-72号字符的868个样本对这三种模板:标准单模板,基于概率的多模板,改进的多模板进行试验,考虑各种情况,选取的样本包括有污点,彩色,倾斜,不同字号混排等情况。
得到的实验结果如表1。
表1 实验结果算法 正确匹配个数 识别率单模板 741 85.4%基于概率的多模板 795 91.6%改进的多模板 858 98.8%由实验结果可以看出改进后的多模板匹配虽然在计算量和复杂度上都高于前两种模板,但是这种匹配法对每个字符寻找模板,多次匹配,找出最相似的字符,是真正意义上的多模板匹配。
所以除了特小号字符外,对仿宋_GB2312字体识别率在98%以上,且不受字符数目多少,字号是否一致的限制,解决了基于概率识别的局限性。
通过验证,本算法在印刷体字符识别方面具有很高的实用价值,简单易行,可靠性高。
本文作者创新点:1.预处理阶段用改进的遍历法进行倾斜校正。
2.分割阶段对各种情况下包括不同字号,混排,特殊字符(i,j)的精细划分。
3.识别阶段对单一模板匹配法进行改进,采用海明距离实现多模板的匹配,大大提高了识别的正确率。
参考文献[1]Parker J.R.. Gray Level Thresholding in Badly Illustrated Images. Ieee Tran on Patterm Analysis and Machine Intelligence, 1991, 13(8): 813—819.[2]P V S Rao. A Knowledge-Based Approach for Script Recognition without Training[J]. IEEE Tran on PAMI, 1996, 18(4): 460-464.[3]Guo Xiao-song, Kong Xiang-yu, Yang Bi-wu. Algorithm research of templet matching method based on connected area applied to character recognition[J]. Computer Engineering and Applications, 2002, 12(1): 46-47.[4]Mikhail J Atallah. Fast Image Template Matching in the Sum of the Absolute Value of Differences Measure[J]. IEEE Tran on IMAGE PROCESSING, 2001: 10(4).[5]曾庆鹏,吴水秀,王明文.模式识别中的特征提取研究[J].微计算机信息,2008,1-1:220-221。