纸币序列号的快速识别方法研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图1
纸币序列号识别方法
3
3.1
快速纸币序列号识别方法
纸币图像的二值化 鉴于人民币中序列号的 10 个字符中,可能人民币上
判定。 3.4 字符分割 通过前面图像处理,对提取到的序列号进行分割,以 人民币为例,需要将序列号分割成 10 个字符,每一个字 符都送入字符识别的方法中来进行识别,方法循环 10 次 即可。这里使用扫描线的方法,在某一行或某一列跟踪一 , 条线, 其所产生的颜色变化数就是穿线数, 比如字符 “ H” 按行来进行穿线的话,可能会有 2、 4 这 2 种穿线数。具 体方法如下: (1)对纸币序列号图像中的每一行进行“穿线数”并记 录,这里本文使用了 35 个像素高的矩阵框来提取字符, 故有 35 行。 并且挑出最大值以及所对 (2)将这些穿线数进行统计, 应的行, 如果多行属于最大值的穿线数, 可任意取某一行, 记为第 K 行。 (3)对第 K 行进行跟踪,找出最接近字符的左右 2 边 所属的列。 在该列上没有字符 (4)第 3 个条件产生的左列需满足: 信息 (即全是白像素 )而且前一列也没有字符信息,但是后 一列含有字符信息;右列反之亦然。 通过上述步骤对字符进行分割,就可以对字符进行识 别。纸币序列号字符分割结果如图 2 所示。
图2
纸币序列号字符分割结果
3.5
纸币序列号的粗分类 传统方法计算量大,很难做到实时高效的对字符进行
识别, 为了提高识别速度和效率, 降低不必要的复杂计算, 可以先根据字符的几何特点将其归于若干大类,在这些大 类里对字符进行进一步的识别,可以获得良好的效果。 3.5.1 闭合曲线特征的求取 纸币序列号上的字符与车牌一样,都是英文字母大写 或者阿拉伯数字。这就说明纸币上的序列号字符是一个单
和闭合曲线特征对字符进行细分类,对细分类的字符利用字符区分器进行识别。实验结果表明,该方法操作简单,能避免复杂的计算,识 别速度较快,且能提高字符的识别率。 关键词:纸币序列号识别;连通域特征;扫描线;Hausdorff 距离;闭合曲线特征
Research on Rapid Recognition Method of Paper Sequence Number
FANG Ai-dong1, HU Xue-gang2, SHENG Zhuang3
(1. School of Information Engineering, Suzhou University, Suzhou 234000, China; 2. School of Computer and Information, Hefei University of Technology, Hefei 230009, China; 3. Beijing Institute of Control Engineering, Beijing 100190, China) 【Abstract】This paper proposes a fast method for paper sequence number recognition. Characters are divided into several categories through the characteristics of connected domain and scanline, small fine categories are subdivided with the Hausdorff distance and the close curve characteristics. It uses character differentiator to identificate small fine categories. Experimental results show that this method has simple operation, can avoid complicated calculation, recognition speed is fast, and can improve the recognition rate of character. 【Key words】paper sequence number recognition; connected domain characteristic; scanline; Hausdorff distance; close curve characteristics DOI: 10.3969/j.issn.1000-3428.2012.24.037
————————————
[5] [6]
2
快速纸币序列号识别方法架构
图像识别手段越来越多地被应用在纸币防伪中,其
中,纸币序列号作为防伪的重要依据之一越来越得到重 视,通过移植到 DSP 芯片配置在验钞机中,以达到实时 准确识别纸币真伪的效果。由于图像质量参差不齐,识别 运算量大,因此如何有效地提高识别速度,提高识别性能 成为当前的主要问题。 纸币序列号识别方法如图 1 所示。图像预处理包括了 对纸币图像进行二值化、图像倾斜校正、序列号定位、字 符分割。识别方法采用了由粗到细的分类方法,先通过求
第 38 卷
第 24 期
房爱东,胡学钢,盛
庄:纸币序列号的快速识别方法研究
157
取字符连通域特征把序列号分成 3 类,通过 Hausdorff 距 离匹配方法对字符进行细分类和识别。由于纸币序列号的 识别方法最终会移植到 DSP 开发板上用以配置在点钞机 上,因此纸币序列号的识别必须要求对硬件资源消耗足够 小。采取由粗到细分类方法能够避免大量复杂的计算从而 降低硬件资源的要求。
具,但是传统的验钞机防伪手段有限,已经不能满足客户 的要求。市场上每年都会出现大量高仿真的假币,它们有 着相同序列号和图像特征,因此,通过将图像识别方法移 植到数字信号处理 (Digital Signal Processing, DSP)芯片上 嵌入到验钞机中可以有效地提高其防伪性能。 近年来,使用神经网络和机器学习方法对纸币进行清 分和识别方法很多,如反向传播 (Back Propagation, BP) 网 络识别器 [1]、颜色和纹理特征识别 [2-3]、 Kohonen 网络 [4]识 别 方 法 , 基 于 高 斯 混 合 模 型 (Gaussian Mixture Model, GMM)的识别方法 ,以及字符结构识别方法 等。 BP 网 络由于受初始参数影响大而往往不能收敛或陷入局部最 小,Kohonen 网络识别过程中容易受到噪音影响而导致识 别率不高, GMM 模型保证准确性时又具有相对大的计算
房爱东 1,胡学钢 2,盛 庄3
(1. 宿州学院信息工程学院,安徽 宿州 234000;2. 合肥工业大学计算机与信息学院,合肥 230009; 3. 北京控制工程研究所,北京 100190) 摘 要:针对纸币序列号识别问题,提出一种快速识别方法。求解字符连通域特征和扫描线法对序列号实现粗分类,使用 Hausdorff 距离
(1)寻找序列号上的第 1 个字符的左上角像素点 P( x 1, y 1)。 (2) 点 P( x 1, y1) 的右下角的黑色像素点满足字符特征 (笔画的宽度,单连通性 )。 (3)矩阵框内的某一行从左往右跟踪至少会穿过 10 个 字符上的像素点。 (4)矩阵框内所有行至少有 7 行满足条件 (3) 。 通过上述方法提取纸币上的序列号,经过上述的图像 处理后,还需要对提取到的纸币序列号进行字符分割,提 取到的纸币序列号可能还有一定的噪音,可以根据字符的 单连通性以及字符的像素数 ( 除字符“ 1”和“ I”外,其余 字符的像素数位于 60~150 之间 ) 来对分割到的字符进行
158





2012 年 12 月 20 日
连通域的图。因此,可以计算字符本身上满足“内部是白 色像素点,外围是黑色像素”的“环状”闭合曲线的数目, 具有闭合曲线的字符图像和闭合特征被破坏的字符如图 3 所示,字符“ 8 ”具有 2 条闭合曲线,字符“ A” , “ P”具 有一条闭合曲线,并且把该数目作为字符的一个很重要的 特征来帮助识别字符。
第 38 卷 第 24 期 Vol.38 No.24 ·人工智能及识别技术·
计 算 机 工 程 Computer Engineering
文章编号:1000—3428(2012)24—0156—05 文献标识码:A
2012 年 12 月 DeceHale Waihona Puke Baiduber 2012
中图分类号:TP391
纸币序列号的快速识别方法研究
基金项目:安徽省自然科学基金资助项目(10040606Q64);安徽省高等学校省级自然科学基金资助项目(KJ2011B180);安徽省高等学校优秀青 年人才基金资助项目(2012SQRL199ZD);安徽省高等学校质量工程基金资助项目(20101077) 作者简介:房爱东(1966-),男,副教授,主研方向:模式识别,数据挖掘;胡学钢,教授、博士生导师;盛 收稿日期:2012-06-18 修回日期:2012-09-18 E-mail:fad5006@163.com 庄,工程师、硕士
图3 具有闭合曲线的字符图像和闭合特征被破坏的字符
骤 (4)。 由于字符本身最多含有 2 条闭合曲线 (如“ 8”),因此 在一般情况下,仅需要染 2 次色,就能计算出字符的闭合 曲线数目。由图 3,某些字符的闭合曲线比真实情况“增 加”了,含有“伪闭合曲线” ,因此,本文针对每一条闭 合曲线添加了 2 个判定条件: (1)闭合曲线内的白色像素点至少要为 3 个。 (2)闭合曲线内的白色像素点集合的高度至少要为 2 。 需要说明的是,若通过染色求出的某一条闭合曲线没 有通过给出的条件判定,则还需要通过重复染色的办法重 新计算字符的闭合曲线数目,直至染色方法求出的闭合曲 线都满足给定的判定条件。通过求出字符的闭合曲线特 征,可能大大简化对字符识别的难度,下面给出按照闭合 曲线特征对字符的分类: (1)2 条闭合曲线的字符有 {8,B }。 (2)1 条闭合曲线的字符有 {4,6,9, A, O , D, Q ,0,R, P }。 (3)0 条闭合曲线的字符有 {1,2,3,5,7, W, E, T, Y , U,I, S, F, G , H , J, K, L, Z, X, C, V, N, M}。 可以看到,通过对字符的闭合曲线特征的计算,能够 把所有待识别的字符分成 3 类。相对于从 36 个字符当中 来识别某个字符,用字符的闭合曲线特征首先分一次类明 显能够简化识别字符的难度。 3.5.2 求取字符特征的方法 通过求取字符的闭合曲线,把字符分成了 3 类,但是
的序列号的字符颜色含有红、黑 2 色,并且序列号的字符 边界部分是序列号本身与纸币背景间的过渡色,用常规的 二值化方法会有一定的困难。 这里采用文献 [8]基于字符笔 画特征的二值化改进的办法。对图像中某一点 p( x, y),用 p 表示其像素值;avg sum 8( x ,y)表示点 p( x, y )的 8 领域的平 均像素值。该方法的二值化条件总结如下: (1)图像中的每一个点 p( x, y) ,若 p<80。设定 p=0,若 p>120,设定 p=255。 (2)对图像中心点 p( x, y ),若 pi(0<i <9)满足 pi≥ p 的有 5 个或 5 个以上,设定 p=0 。 (3)若 avg sum 8(x, y )< T,设定 p=0。 T 是事先设定的一 个阈值,对不同设备上的图像传感器可能设定的值不同, 这里设定的 T 为 60。 (4)若 |p− avg sum 8( x, y)|> X ,设 p=255。X 是设定的一个 阈值,对不同设备上的图像传感器可能设定的值不同,这 里设定 X 为 3 。 通过上述的二值化方法处理,得到的图像能够很好地 保留序列号的信息。需要注意的是,得到的二值化图像有 可能带有噪声,为了更好地进行处理,可以根据需要对图 像进行噪声 (毛刺 )消除处理 [9]。 3.2 图像倾斜校正 为了提高识别性能,对于倾斜的图像要进行校正。首 先通过寻找纸币边界点,对纸币的边界点进行直线拟合, 可以得到纸币的边界,纸币边界的交点即是纸币的顶点。 边界和扫描图像的夹角,也就是纸币图像的倾斜角,对纸 币图像进行旋转即可完成校正。为了使得结果更准确,倾 斜角度不宜过大,这里规定为 12°。 3.3 序列号定位 通过纸币的顶点信息,可以得到纸币序列号可能出现 的区域。在该区域内对序列号进行定位和提取。这里用了 一个 350×35 大小的矩阵框来提取纸币序列号 (矩阵框的单 位为像素 )。序列号提取的方法如下:
1
概述
验钞机 (纸币清分机 ) 是银行常用的检验纸币真伪的工
复杂性,字符结构识别方法速度快,但对噪音敏感。 为此, 本文提出一种纸币序列号的快速识别方法。先通过扫描线 方法把待分辨字符粗分为若干大类,再计算其 Hausdorff 距离 [7],从而对字符进行判定和细分类,最后将细分类的 字符通过字符区分器进行识别。
相关文档
最新文档