基于结构形状的印刷体数字识别方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[5] 叶飞 ,黎峰.基 于整 体 特 征 的 快 速 手 写 体 数 字 字 符 识 别 [J].计 算 机 工 程 与 设 计 ,2006(22). (责任编辑:杜能钢)
The Method of Printed Figures Based on Structure
Abstract:A method of printing digital has been proposed that based on the structure shape, through analyzing the structure shape of the printing digital. This method does not need to complex thin to the character picture, reducing the erroneous question which is brought by thinning, so the recognition speed is quickly. The result shows this method is effective. Key Words:Printing Digital;Features Extraction;Upside-Horizontal Line Length;Downside-Horizontal Line Length;Closed Circle
方法不用对字符图像进行复杂的细化处理,减少了因细化带来的误差问题,因而识别速度非常快,实验证明了该方
法的有效性。
关键词:印刷体数字;特征提取;上横线长度;下横线长度;闭合圈数中 图 分 类 号 NhomakorabeaTP312
文 献 标 识 码 :A
文 章 编 号 :1672-7800 (2010)05-0067-02
第9卷%第5期 2010年 5 月
软件导刊 Software Guide
Vol.9 No.5 May. 2010
基于结构形状的印刷体数字识别方法
倪桂博1,梁晓尊2
(1.天津理工大学 中环信息学院,天津 300380;2.河北邢台供电公司,河北 邢台 054001)
摘 要:从数字的结构形状着手,通过分析印刷体数字的形状,提出了一种基于结构形状的印刷体数字识别方法。 该
1 特征提取
由于印刷体数字结构形状的特殊性,我们可以提取 4 种结
构特征:高宽比特征,上横线长度,下横线长度,闭合圈数。 高宽比特征: 仔细观察不难发现数字 1 的特别性 ,1 是数
字里面最窄的数字, 也就是 1 的高度和宽度的比值是最大的, 所以对数字进行大小归一化后,我们先求数字的高度和宽度的 比值,若高度和宽度的比值大于某一个值,我们就直接识别为 1,若不是再提取其他特征。
图 4 射线到达位置
例如: 0、6、9 和 8 都有闭合圈数 。 数字中 0 整体就一个 圈,6 下部有一个圈,9 上部有一个圈,8 有两个圈 ,数字 3 没有 圈。
有了以上特征我们就可以对数字进行分类识别了。
2 识别
首先我们先对待识别的数字图像进行去噪和二值化处理, 处理完后提取数字的高度和宽度比,若比值大于某一数值就可 以直接识别为 1,我们以初号字为例(以下都是以除号字为例) 这个比值可以取 2,若高度和宽度的比值大于 2 就可以识别为 1, 若不是则进行大小归一化处理, 我们统一规划到 64×64 大 小。 然后提取待识别字符的上横线长度特征,若上横线长度大 于整个字符的一半,这里可以取数值为 32,那么这个字符就是 5 或者 7,然后再比较下横线长度特征,下横线长度大的是 5,
上横线长度特征:在数字中也可能存在着横线,我们用像 素点连续在上部出现的个数来描述上横线的长度。 如图 1 所 示。
图 1 上横线示例
数字中 5 和 7 的上横线长度几乎占据了整个数字的宽度, 在数字中是最大的。我们可以通过计算上横线长度把 5 和 7 从 其他数字中区分出来。
下横线长度特征:有了上横线长度特征,我们就可以定义 下横线长度特征了,我们用像素点连续在下部出现的个数来描 述下横线的长度。 如图 2 所示:2 和 4 的下横线长度占据了数 字宽度的大部分。
图 2 下横线示例
2 和 4 的下横线长度占据了数字宽度的大部分,通过计算 下横线长度可以把 2 和 4 从数字中区分出来。
闭合圈数特征: 闭合圈数就是指数字中是否有闭合的圈, 一般求闭合圈数的方法是从所有的背景点向上、下、左、右、左 上、右上、左下、右下 8 个方向发出 8 条射线,判断射线是否与
作者简介:倪桂博(1981-),男,天津人,硕士,天津理工大学中环信息学院助教 ,研究方向为人工智能;梁晓尊 (1980-),男 ,河北 邢台 人 ,河北 邢台 供电公司助理工程师,研究方向为自动化。
· 68 ·
软件导刊
2010 年
字符相交,有多少条射线与字符相交,则该背景点的值就置为 多少,若值为 8 说明就有圈存在。在这里为了提高识别的速度, 我们不必对每个背景点都求一次,由于印刷体字符结构形状的 特殊性,我们可以选取几个位置就可以了,例如:如图 3 所示, 我们可以从 6 中下面的圈中位置选取几个点,然后计算这几个 点发出的 8 条射线和字符相交的次数是否为 8,若为 8 说明下 面有圈。
0 引言
光 学 字 符 识 别 (OCR)技 术 经 过 几 十 年 的 发 展 ,已 经 从 实 验 研究走向应用,印刷体数字识别是字符识别的一个分支,有极 大的实用价值。 在过去的数十年,研究者们提出了许许多多的 识别方法,这些方法大致可分为两类:基于结构特征的方法和 基于统计特征的方法。 一般来说,使用统计特征的分类易于训 练,且在给定的训练集上能得到较高的识别率;而使用结构特 征的方法能描述字符的结构,在识别过程中能有效地结合几何 和结构的知识,因此能得到可靠性较高的识别结果。实际上,印 刷体数字字符识别相对于汉字或其它语言的文字识别来讲是 非常简单的。首先,它字符少,一共就只有 10 个字符需要分类; 其次,笔划少,结构简单。 由于印刷体数字有以上特征,所以我 们可以放弃以前那种“二值化—去噪—规整—细化—特征点提 取-分类”这种老的思路,而从数字它本身独特的结构上入手, 来进行识别。 文章中提到把横线特征和穿越次数特征结合起 来进行识别,横线特征可以很好的区分某些数字,穿越次数也 代表了数字的某些特征,但是这两种方法的结合对有些数字来 说还是会出现误识,如 3 和 8 这两个数有可能会出现误识。 文 章中提到一种基于凹凸特征的识别方法,该方法可以很好的进 行数字识别,但是有些数字具有自己独特的特征,和其它数字 可以很好的识别出来, 所以我们不必对每个数字都取凹凸特 征,而对那些难以区分的数字再提取凹凸特征,这样我们就可 以提高识别速度。 本文就是把两种方法进行了结合,提出了一 种新的识别模型。
小的是 7。 如果上横线长度不大于 32,就提取下横线长度特征, 若下横线长度大于 32,那么就是 2 或 者 4,然后 再 比 较 上 横 线 特征,上横线长度大的是 2,小的是 4,如果上横线长度和下横 线长度都没有 32,那么就是 0、3、6、8 和 9 中的一个,这时,我 们提取闭合圈数特征,如果有两个圈那么是 8,上部有圈的是 9,下部有圈的是 6,没圈的是 3,剩下的是 0。 识别流程如图 5 所示。
图 3 特殊点的选取 对于一个圈和两个圈的判断, 我们以下部是否有圈为例,
我们可以用如下方法,选取特殊点后,开始向 8 个方向发射射 线,但向上发射射线时并不到达最上端,我们可以到达如图 4 所示横线的位置,同理判断上部是否有圈时,向下发射射线时 也不要到达最低端, 这样我们就可以判断是否有两个圈了,而 对 0 有一个圈的判断可以选取特殊点后,发射射线时可以到达 最上端和最下端。 这样我们就可以判断字符是否有圈还是没 圈,有一个圈还是有两个圈了。
[2] 严国莉,黄山,李岱璋,等.印刷体数字快 速 识别 算 法在 身 份证 编 号 数 字 识 别 中 的 应 用 [J].计 算 机 工 程 ,2003(1).
[3] 邢如义,夏冰,袁红云.印刷体数字快速识别方法 [J].河北建筑科 技 学 院 学 报 ,2004(3).
[4] 罗佳 ,王玲.基 于凹 凸 特 性 笔 顺 编 码 的 手 写 体 数 字 识 别 方 法 [J]. 计 算 机 工 程 与 科 学 ,2007(5).
图 5 识别流程
3 结束语
在 Windows XP 平台下,用 Matlab6.5 对 200 个印刷体数字 进行了识别,识别率可以达到 100%。该方法简单、识别速度快 、 精度高、抗干扰强。
参考文献:
[1] 柳回 春,马 树 元,吴 平 东 ,等.手 写 体 数 字 识 别 技 术 的 研 究 [J].计 算 机 工 程 ,2003(4).
相关文档
最新文档