纸币序列号的快速识别方法研究
基于支撑矢量机的纸币序列号识别
域或 网格 , 在各个小区域内分别抽取统计特征 , 主要 包括 : 局部笔画方 向特征、 细胞特征 、 方向线素特征 、 经过本文算法 的处理 , 字符图像 中的字符 已经 处于字符图像的中心 , 故不需进行位置归一化 , 而本 文也不提取字符的笔画特征 , 也不需进行笔画粗细 归一化。考虑到分割字符的尺寸不一 , 本文将字符 的尺寸规 一化到 4 2 , 中高度 为 4 , 8 4其 8 宽度 为
作者简介 : 艾朝霞 (99 , , 17 一)女 陕西米脂人 , 师 , 讲 研究方 向: 信号与信息处理。E— a :i ax 13 6 .o m i ahoi 2@13ci l z a n
・
3 ・ 8
榆 林
学 院、学 报
2 1 年 第4期 ( 01 总第 9 6期 )
使之成为同一尺 寸大小 的字符 , 即为 大小 归一化。 它是通过归一化图像中的像素对应在原图像中的点
1字 符 图像预 处理
征的基础上去除多余 的点, 以利于字符特征的提取 。
1 3大 小归一 化 1 对 于 不 同大小 的 字符 做 变 换 ,
字符 图像预处理是为了去 除噪声 , 加强有用的
收稿 1期 :0 1 0 0 3 2 1 — 4— 8 基金项 目: 榆林学院青年科技基金项 目( 1 K 1 1Y 2 )
征 、 变矩 特 征 、 e k 、 穿 透 数 目特 征 、 不 Zmie矩 笔 全
局笔划方向特征 、 背景特征等。变换 特征即对字符 图像进行各种变换 , 利用变换系数作为特征 , 常用 的
变换 有 Fuir变 换 、 C or e D T变 换 、 l Wa h变 换 、 —L s K
2 4。
G br ao 特征 、 四角 特征 等 。
纸币序列号识别装置研究
目录1.选题依据 (2)1.1. 课题来源 (2)1.2. 课题研究目的 (2)1.3. 课题研究意义 (2)1.3.1. 研究领域的原理与意义 (2)1.3.2. 本课题的特点和意义 (5)1.4. 国内外研究动态 (5)1.4.1. 国内外研究现状 (5)1.4.2. 本课题相关内容研究 (6)2研究内容、技术指标、技术路线、研究方法及拟解决的关键题 (7)2.1研究内容 (7)2.1.1系统总体结构 (7)2.1.2系统各模块构成 (8)2.2技术指标 (9)2.3技术路线 (10)2.4拟采用的研究方法和手段 (10)2.5拟解决的关键技术问题 (10)3本课题的特色与创新点 (12)4实验条件,可能遇到的困难和问题,以及解决的方法和措施 (13)4.1实验条件 (13)4.2可能遇到的困难和问题,以及解决方法和措施 (13)5论文工作和经费的估计 (14)6论文工作计划(起止时间,分年度的具体实施内容) (15)参考文献 (16)1.选题依据1.1. 课题来源本课题是自选课题,课题名称是基于ATM的纸币序列号识别系统。
1.2.课题研究目的本课题研究在ATM中实现对运动纸币序列号图像采集、识别和传输的功能,根据ATM内部结构及出钞的特点,主要利用接触式图像传感器、FPGA及内嵌的NIOS处理器和通用异步串口收发器完成对ATM中运动纸币序列号图像的采集、识别、传输。
1.3. 课题研究意义1.3.1.研究领域的原理与意义自动取款机(ATM)的使用方便了银行与客户的交易,一方面降低了银行工作人员的工作量,提高了银行业务办理效率与竞争能力,同时也给人们取款等交易带来了极大的便利,不再受金融机构营业时间的限制,为客户节约了大量以前在银行柜台前等待的时间。
然而,目前在社会上屡次出现客户反映在ATM中取到假币的事件,引起了社会的广泛关注,而银行又拿不出证据表明客户手中的货币不是从ATM中提取的。
当客户从ATM取到假币时,银行和客户都会陷入不必要的麻烦之中。
基于模板匹配的人民币纸币序列号识别系统研究
关键词
人 民币纸币 ; 字符识别 ; 模板 匹配 ;图像处理
TP 9 31
中 图分 类号
Re e r h o s a c n RM B r e c mb rI e tfc to y t m Cu r n y Nu e d n iia i n S s e
rn ynu e d nt ia in meh dbae ntm paema c igm eh di rs n e nt i y tm n hei n i c t n s se i d v lp d e c mb rie i c t t o s do e lt thn t o p e e td i hss se a d t f o s de tf ai y tm s e eo e . i o On t eb sso h ma epe ra me ,Fisl h n o e r ii dit ifrntfc aueca ssb h i sz s n he hen m b r h a i ft ei g rte t nt r tyt eba kn tsa edvde n odfee a ev l ls e yt er ie ,a d t nt u e c a a tr r o ae a i n tr ft eb n n t ’ n m b rlc to ndsz .Th u h r cesa elc td e sl i e mso h a k o es u y e o a in a ie en mbe h rc esi hei g r u p b hep o rc a a tr n t ma ea ec tu yt r —
Ba e n Te pl t a c n s d o m a e M t hi g
基于ATM的纸币序列号识别系统
目录1选题依据 (1)1.1课题来源 (1)1.2课题研究目的 (1)1.3课题研究意义 (1)1.4国内外研究动态及目前存在的问题 (2)2研究内容、技术指标、技术路线、研究方法及拟解决的关键问题 (3)2.1研究内容 (3)2.2技术指标 (5)2.3技术路线 (5)2.4拟采用的研究方法和手段 (6)2.5拟解决的关键技术问题 (6)3本课题的特色与创新点 (7)4实验条件,可能遇到的困难和问题,以及解决的方法和措施 (8)4.1实验条件 (8)4.2可能遇到的困难和问题,以及解决方法和措施 (8)5论文工作和经费的估计 (9)6论文工作计划(起止时间,分年度的具体实施内容) (10)参考文献 (11)1选题依据1.1课题来源本课题为自选课题,题目为:基于ATM的纸币号码识别系统。
1.2课题研究目的本课题研究一种基于ATM的纸币号码识别系统――以DSP为处理器核心的系统,该系统嵌入到ATM自动取款机里,在出钞过程中可以自动采集和识别纸币号码并记录存储下来。
该系统结合机器视觉技术和数字图像处理技术,并运用特定的号码识别算法来识别纸币号码并与硬件相结合将识别出的号码存储起来。
此系统并与打印设备相联接,以方便将号码数据等信息以交易凭据的形式打印出来。
1.3课题研究意义自动取款机(ATM)的使用方便了银行与客户的交易,一方面降低了银行工作人员的工作量,同时也给人们取款、存款等交易带来了极大的方便,为客户节约了等待的时间。
然而,目前的ATM取款机出钞时没有带钱币的真伪检验功能,因此同直接从柜员手中取钱还是有差别的:在银行柜台前取款时,虽然有点麻烦,但是,经柜员给客户的钱至少是经过验钞机检验过的,因此,取到假币的几率非常小。
由于ATM中的钱是银行工作人员放进去的,且钱币经ATM机交给客户前没有再经过验钞机的检验,因此,在ATM上取钱存在一定的风险性,社会上也时刻报道在取款机里取到假钱的事件。
ATM上取到假钱的主要来源或原因主要有以下三方面:(1)在钱币到银行前,成捆的钱币中已有假钱,未经验钞处理就存入ATM中;(2)银行工作人员由于在放钞过程中存在疏漏而误将未验过的钞票放入ATM中,而这些钞票中有可能就存在假钞;(3)在工作人员将纸币放入ATM之前,虽然经过了验钞机的检验,但没有检验出假币。
人民币号码自动识别方法研究_段敬红
CN 43-1258/T P ISSN 1007-130X计算机工程与科学COM P U T ER EN GIN EERIN G &SCIEN CE2008年第30卷第1期 Vo l 30,N o 1,2008文章编号:1007-130X (2008)01-0066-03人民币号码自动识别方法研究*Research on an A utomatic N umber RecognitionM ethod for RM B Banknotes段敬红,栾 丹DUAN Jing -hong,LUAN Dan(西安理工大学,陕西西安710048)(X i an University of Technology,Xi an 710048,China)摘 要:针对人民币印刷中号码的识别问题,本文研究了其中的识别算法,包括号码图像的二值化、号码区域的定位、号码字符的分割及归一化和号码字符的识别,提出了一种号码区域定位及分割方法。
在此基础上,建立了相应的识别系统并进行了实验研究。
结果表明,系统具有较高的识别精度,能较好地满足实际需求。
Abstract:T he number r eco gnit ion method for RM B notes in the press process has been studied.T he recog nitio n alg o -r ithm includes imag e binarizatio n,number r eg io n localizat ion,number char acter s ext ractio n and nor malization,number fea -tur e ex tr act ion and the recog nitio n.A met ho d fo r number region lo calizatio n and seg mentat ion is pro posed.Based on the a-l g or ithm,a recog nition system is built and the r elevant experiments is inv est igated.T he exper imental results show t he system has a hig h recog nition r ate.关键词:号码识别;图像分割;特征提取Key words:number recog nitio n;imag e seg mentat ion;feature ex tr action 中图分类号:T P391.4文献标识码:A1 引言人民币号码印刷过程中会出现错号、重号、缺号等情况,目前的方法大都是由人工检查完成,费时费力。
纸币序列号定位与分割方法研究
龙源期刊网
纸币序列号定位与分割方法研究
作者:李朝匡逊君赵文倩
来源:《计算技术与自动化》2012年第02期
摘要:人民币序列号的唯一性,是区别纸币的一种标示,采用一种基于投影法的号码区域定位方法,并提出一种沿双向最短路径搜索字符串上下轮廓的凹凸位置进行粘接字符分割方法。
在号码区域定位时,对二值化后的序列号实行行和列投影,进行粗定位和精定位两个步骤实现目标区域的定位;为了提高分割粘接字符的正确率,利用字符串之间存在的凹凸轮廓特征,沿双向最短路径搜索字符串上下轮廓的凹凸位置,分割出单个字符。
实验结果表明,投影法能够快速、准确的实现纸币序列号的定位;当有字符粘接时,采用沿双向路径方法比沿单向路径方法能够找到更好的切割点,并去除掉多余的粘接噪声,能够实现纸币序列号正确、有效地字符分割。
关键词:投影法;定位;双向最短路径;凹凸轮廓;分割。
纸币号码识别技术研究
高校 理科 研 究
纸币号码i ) 技布研 穷 RI N
苏州工 业 园区工业技 术 学 院 沈红 雷
[ 摘 要] 本文主要研 究了号码 图像的预处理方法 , 包括有号码 图像粗定位 、 图像 的二值化 、 声去除等 , 以实验 分析 为基础 , 噪 并 经过 对模板 匹配算法与特征 分析算 法的研究比较 , 出 提 一套具有低 时间开销和高识别率的号码字符的综合识别算法。 [ 关键词 ] 图像粗定位 图像二值化 模板 匹配算法 识别率
号码 。
是一个办法 , 对于大部分纸币图像也 已经足够 , 但这种方法对不同光照 的情况下适应能力较差。为了更好地适应于不同光照的情况 , 应该采用 计算 图像灰度均值并加权 的办法来决定闭值 , 以此将灰度图像二值化。 阈值计算公式如下
Y( i ) = ∑P,× 1 A l N
二 、 币 号码 像 预 处 理 纸
纸币号码 图像 的预处 理 , 包括有号码 图像粗 定位 , 图像 的二 值化 , 噪声去除 , 倾斜字符校正 以及单字符的分割 。其 中,纸币图像规格为 6 6 3 3分辨率为 lOp。 0 ×0 , Od i 1 . 图像粗定位 号码 从图像处理的角度来看 ,纸币号码图像是一个典型的复杂背景 中
一 一
其 中 Y是均值 ,i P是像素点 i 的灰度值 , N为像 素点 的个数 , A为加 权系数 。 ’ 实验表明 , 当加权 系数为 0 时 , 化效果 比较好 , . 8 二值 故可设 加权 系 数 A O8 为方便后续算法 的实现 , = ., 二值化 后将 目标像素点值置 1背景 , 像素点置 0 。 3噪声去除 . 在使用摄像头进行 图像 采集 以及数据 传输 过程中 , 到电子器件 受 的影响 ,使得图像 中的一些像素点 的灰度值 与周 围临近像素 的灰度值 有 比较明显的差异 , 称之为噪声 。 噪声的消除是 图像预处理过程中非常 重要的一个环节, 它的研究是字符分割与识别等工作 的基础。 本文通过 算法判断出属于噪声 的像素点 , 然后消 除它 , 从而在保护原有 图像边缘 的同时完全消除噪声 。 因为图像 中的噪声相对 于我们要识别 的 目 而言 ,一般都是较小 标 的 , 目标区域则是一个连通 的相对 比较大 的整体 , 以噪声在某个半 而 所 径范围内是 孤立的。对于前景和噪声是黑色 ( 灰度为 1 , )而背景是 白色 ( 灰度为 0 的二值 图像 , ) 我们可 以对灰度 为 1 P 点 的邻域 内判断该 的 i x 点是否是噪声 。 采用如图 2所示的八个方 向进行判断 , 这里设噪声半径 的变量参数 Ln L n e ( e 可以根据预估计的噪声的大小事先设定 )然后再 , 按照这八个方向依次延伸长度为 Ln的像 素 , e 将这些点 L n e 领域内的 像素的灰度 值相加 , 这样就得到八个和 , 如果点 f y ) 是噪声的话 , 那么 这八个 和将没有一个为 L n 即该点在这八个方向上的 L n e, e 长度的延伸 都“ 穿过了” 噪声 , 而只有灰度为 0 的背景点。进而可由此判断点 f, ) (y x 为噪声点 , 将其灰度置成背景灰 度 0 即消除了该噪声 点。 , 而对于 目标物 体由于其相对较大 ,在八个方 向总有一个方 向上 的 L n e 长度的延伸不 能“ 穿过 ” 标物体。所以 , 于这些像素点保持原来 的灰度不变 。 目 对 L n为 2的八向去噪 的示意图如图 2 e 所示 :
基于数字图像处理的人民币号码检测算法研究_孙鹏辉
摘要纸币是现代金融事业的血液,是当今世界不可缺少的东西。
近年来钱币、特别是纸币被抢劫事件不断发生严重影响了社会治安也使银行受到了严重的经济损失。
为了减少银行损失根据纸币号码的唯一性在纸币入库前记录纸币的号码在货币流通市场提供一种纸币号码自动识别装置若发现目前流通的纸币与丢失纸币号码相一致则限制其流通同时也有利于抢劫案件的侦破。
随着经济的繁荣和发展纸币的流通量越来越大但是假币的存在一直是困扰着金融行业的不可忽视的一个问题。
因此纸币真伪辨识的准确率和效率尤为重要。
本文纸币上的号码都不会重复,因此它是判别纸币身份的依据。
纸币序列号是综合了印刷体英文字符和数字的字符串。
针对人民币,利用数字图像处理技术和模式识别技术,设计与实现了纸币号码识别。
本文在参考当前国内外先进的与纸币号码识别相关的图像处理技术在研究了图像数据的预处理、图像分割、图像识别等主要算法的基础上,提出了一种字符识别的算法,本文通过对纸币号码图像这些处理后,最终实现了纸币号码识别,并仿真出了结果。
本文研究运用图像处理、模式识别的相关知识,以计算机视觉、特征检测为重要手段,研究纸币号码图像的自动识别技术。
通过对图片的预处理、号码体的定位、图像分割、号码体的识别等算法对纸币号码进行识别。
首先,对纸币图像进行预处理,图像预处理是纸币识别系统的必要工作。
纸币图像的预处理过程包括纸币图像去噪、灰度化、图像分割、图像的校正图像的二值化等主要步骤。
包括真彩。
本文采用的是基于阈值分割的方法对图像进行二值化的。
然后,研究了纸币号码识别的关键算法,包括序列号的粗略定位、序列号的提取、单字符分割和字符归一化。
本文根据纸币号码在整个人民币中的大致位置粗略切割出序列号;再通过水平灰度投影和垂直灰度投影的方法确定纸币号码区域的精确位置,然后将号码从图像中分割出来;然后通过单个字符根据先验知识进行大致的切分,之后再通过水平和垂直投影的方法对单个字符进行精确的分割;最后对分割出来的字符进行大小归一化处理,并将其作为字符识别的基本单位。
一种基于特征结构的纸币号码识别方法
值分别在竖直方向和水平方向上进行差值运算 。
l _ 3 图像 二值 化 ‘
对纸币图像进行二值化的 目的是寻找适 当的方法将灰度图像转化为黑 白二值 图像。在研究中, 号码 线条用黑色像素表示 , 背景用白色像素表示。 在进行分割处理时 , 一般通过确定阈值化进行图像 的二值化 。采用阈值法分割 , 认为前景区域或背 ∑ 景区域内邻近位置像素点值是近似 的, 不同前景区域或背景区域的像素值差距很大 , 表现为不 同的 目标 × 一 和背景对应灰度直方图上不同的峰。为了将各个峰分开 , 选择位于峰谷处的灰度值作为分割 阈值 。对 只包含 目标区域和背景区域的图像 , 其直方 图并不一定呈现出双峰的形式。当图像中的背景面积远远大
Fi g . 2 Bi n a r y i ma g e
1 . 4 字 符定位
将灰度图像转化为二值图像后 , 需要对得到的二值图像进行字符定位。字符定位是将单个字符信息 从整个字符图像 中分离 出来 , 并且保留原字符的全部信息作为后续识别工作的数据源n 。水平定位确定
了整个字符 区域在竖直方向的位置后 , 还需要在 已经确定 的区域 内对图像进行列扫描 , 确定每个字符块
的左 右边 界 。 ( 1 ) 水 平初 步定位 。 自上而 下 , 计算 号码 图像 每一 行 黑色 像 素点 的个 数 , 并将 其记 录在 l p r o j e c t i o n 数
组中。其中, l p r o j e c t i o n 叼数元表示第 i 行的黑色像素累加值 ( 0 ≤ ≤9 6 ) 。统计数组中所有l p r o j e c t i o n [
辽 宁 科 技 大 学 学 报
第3 6 卷
Y j i = ㈨
纸币号码快速识别系统
纸币号码快速识别系统
苑玮琦;张昱
【期刊名称】《计算机工程》
【年(卷),期】2005(31)24
【摘要】开发了一种快速的纸币号自动识别系统,能在捆钞的同时自动识别并记录下通过捆钞机上的纸币号码.该系统首先通过CCD摄像头采集24位彩色图像,经过逻辑脊谷判断法分割、投影法定位、结构法识别几个过程输出号码串.实验结果表明,该系统组织设计的逻辑脊谷判断算法有效提取了号码图像,穿越号码体距离法定位号码准确,提出的号码识别系统取得了较高的识别率.
【总页数】3页(P153-155)
【作者】苑玮琦;张昱
【作者单位】沈阳工业大学信息工程学院视觉检测研究所,沈阳,110023;石家庄邮电职业技术学院,石家庄,050021
【正文语种】中文
【中图分类】TP391.41
【相关文献】
1.纸币号码读入识别系统的单片机实现 [J], 秦浩
2.基于ARM的纸币号码识别系统 [J], 王惠;鲁五一
3.纸币号码读入识别系统的单片机实现 [J], 吕国策;
4.纸币号码读入识别系统的单片机实现 [J], 夏彬
5.基于CIS的纸币号码图像采集识别系统 [J], 宾心华;周少武
因版权原因,仅展示原文概要,查看原文内容请购买。
人民币纸币号码的快速识别
可 以 缩 放 到 同一 个 大 小 .而 号 码 固定 在 左 下 角 区 域 ,这 样 可 以
这 样 的点 不 是 骨 架 ; f 6 )不 能删 , 因 为 它是 直 线 的端 点 ,如 果 这 样 的点 删 了 ,那 么 最 后整 个 直线 也 被 删 了 ,剩 不 下 什 么 ;另 外 ,孤 立 点 不 能 删 ,因 为孤 立 点 的骨 架 就 是 它 自身 。
性 , 因此 可 以 用 来标 识纸 币 的身 份 。纸 币号 码 自动 识 别 在 纸 币
印 刷过 程 有 着 十 分 重 要 的 应用 价值 .在 出钞 时 自动识 别并 记 录
下 纸 币 的号 码 .使 出 入银 行 和 国 家 的纸 币号 码 都 有 记 录 ,一 旦
该样 本 图像 为 真 彩 色 图 像 ,需 要 对 其 进 行 预 处 理 。 首 先 将 真 彩 色 数 字 图像 转 化 为 二 值 图像 :
一种人民币纸币号码自动识别快速方法
一种人民币纸币号码自动识别快速方法
娄元芳;郝颖明
【期刊名称】《微计算机信息》
【年(卷),期】2008(24)36
【摘要】针对实际工程应用对大角度倾斜的人民币号码自动识别在处理速度和识别率方面的高标准要求,利用智能相机建立了纸币号码自动识别实验系统,并提出了一种综合利用多种特征的人民币号码快速识别方法.该方法在号码分割定位时利用改进的投影法,避开图像倾斜校正环节,节省分割时间;在号码识别时利用数字的开口特征以及数字的宽高比、穿线特征等特征直接识别定位好的数字.在良好光照条件下,通过对170张倾角在±137范围内100元新人民币的测试,识别一张纸币号码(仅数字部分)的时间在4ms以内,识别率100%.实验结果表明,该算法识别速度快,且允许图像有较大的倾斜,可以满足实际工程的需要.
【总页数】3页(P210-212)
【作者】娄元芳;郝颖明
【作者单位】110016,辽宁,沈阳,中国科学院沈阳自动化研究所;100049,北京,中国科学院研究生院;110016,辽宁,沈阳,中国科学院沈阳自动化研究所
【正文语种】中文
【中图分类】TP391.41
【相关文献】
1.基于DSP的纸币号码自动识别记录系统 [J], 汤永华;张志佳;苑玮琦
2.人民币纸币号码的快速识别 [J], 陶胜
3.人民币号码自动识别方法研究 [J], 段敬红;栾丹
4.一种基于特征结构的纸币号码识别方法 [J], 冯鑫;吴庆洪
5.人民币纸币冠字号码字符识别方法研究 [J], 陈正伟;朱建华;周律;刘浏
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计 算 机 工 程 Computer Engineering
文章编号:1000—3428(2012)24—0156—05 文献标识码:A
2012 年 12 月 December 2012
中图分类号:TP391
纸币序列号的快速识别方法研究
158
计
算
机
工
程
2012 年 12 月 20 日
连通域的图。因此,可以计算字符本身上满足“内部是白 色像素点,外围是黑色像素”的“环状”闭合曲线的数目, 具有闭合曲线的字符图像和闭合特征被破坏的字符如图 3 所示,字符“ 8 ”具有 2 条闭合曲线,字符“ A” , “ P”具 有一条闭合曲线,并且把该数目作为字符的一个很重要的 特征来帮助识别字符。
基金项目:安徽省自然科学基金资助项目(10040606Q64);安徽省高等学校省级自然科学基金资助项目(KJ2011B180);安徽省高等学校优秀青 年人才基金资助项目(2012SQRL199ZD);安徽省高等学校质量工程基金资助项目(20101077) 作者简介:房爱东(1966-),男,副教授,主研方向:模式识别,数据挖掘;胡学钢,教授、博士生导师;盛 收稿日期:2012-06-18 修回日期:2012-09-18 E-mail:fad5006@ 庄,工程师、硕士
图1
纸币序列号识别方法
3
3.1
快速纸币序列号识别方法
纸币图像的二值化 鉴于人民币中序列号的 10 个字符中,可能人民币上
判定。 3.4 字符分割 通过前面图像处理,对提取到的序列号进行分割,以 人民币为例,需要将序列号分割成 10 个字符,每一个字 符都送入字符识别的方法中来进行识别,方法循环 10 次 即可。这里使用扫描线的方法,在某一行或某一列跟踪一 , 条线, 其所产生的颜色变化数就是穿线数, 比如字符 “ H” 按行来进行穿线的话,可能会有 2、 4 这 2 种穿线数。具 体方法如下: (1)对纸币序列号图像中的每一行进行“穿线数”并记 录,这里本文使用了 35 个像素高的矩阵框来提取字符, 故有 35 行。 并且挑出最大值以及所对 (2)将这些穿线数进行统计, 应的行, 如果多行属于最大值的穿线数, 可任意取某一行, 记为第 K 行。 (3)对第 K 行进行跟踪,找出最接近字符的左右 2 边 所属的列。 在该列上没有字符 (4)第 3 个条件产生的左列需满足: 信息 (即全是白像素 )而且前一列也没有字符信息,但是后 一列含有字符信息;右列反之亦然。 通过上述步骤对字符进行分割,就可以对字符进行识 别。纸币序列号字符分割结果如图 2 所示。
图3 具有闭合曲线的字符图像和闭合特征被破坏的字符
骤 (4)。 由于字符本身最多含有 2 条闭合曲线 (如“ 8”),因此 在一般情况下,仅需要染 2 次色,就能计算出字符的闭合 曲线数目。由图 3,某些字符的闭合曲线比真实情况“增 加”了,含有“伪闭合曲线” ,因此,本文针对每一条闭 合曲线添加了 2 个判定条件: (1)闭合曲线内的白色像素点至少要为 3 个。 (2)闭合曲线内的白色像素点集合的高度至少要为 2 。 需要说明的是,若通过染色求出的某一条闭合曲线没 有通过给出的条件判定,则还需要通过重复染色的办法重 新计算字符的闭合曲线数目,直至染色方法求出的闭合曲 线都满足给定的判定条件。通过求出字符的闭合曲线特 征,可能大大简化对字符识别的难度,下面给出按照闭合 曲线特征对字符的分类: (1)2 条闭合曲线的字符有 {8,B }。 (2)1 条闭合曲线的字符有 {4,6,9, A, O , D, Q ,0,R, P }。 (3)0 条闭合曲线的字符有 {1,2,3,5,7, W, E, T, Y , U,I, S, F, G , H , J, K, L, Z, X, C, V, N, M}。 可以看到,通过对字符的闭合曲线特征的计算,能够 把所有待识别的字符分成 3 类。相对于从 36 个字符当中 来识别某个字符,用字符的闭合曲线特征首先分一次类明 显能够简化识别字符的难度。 3.5.2 求取字符特征的方法 通过求取字符的闭合曲线,把字符分成了 3 类,但是
具,但是传统的验钞机防伪手段有限,已经不能满足客户 的要求。市场上每年都会出现大量高仿真的假币,它们有 着相同序列号和图像特征,因此,通过将图像识别方法移 植到数字信号处理 (Digital Signal Processing, DSP)芯片上 嵌入到验钞机中可以有效地提高其防伪性能。 近年来,使用神经网络和机器学习方法对纸币进行清 分和识别方法很多,如反向传播 (Back Propagation, BP) 网 络识别器 [1]、颜色和纹理特征识别 [2-3]、 Kohonen 网络 [4]识 别 方 法 , 基 于 高 斯 混 合 模 型 (Gaussian Mixture Model, GMM)的识别方法 ,以及字符结构识别方法 等。 BP 网 络由于受初始参数影响大而往往不能收敛或陷入局部最 小,Kohonen 网络识别过程中容易受到噪音影响而导致识 别率不高, GMM 模型保证准确性时又具有相对大的计算
的序列号的字符颜色含有红、黑 2 色,并且序列号的字符 边界部分是序列号本身与纸币背景间的过渡色,用常规的 二值化方法会有一定的困难。 这里采用文献 [8]基于字符笔 画特征的二值化改进的办法。对图像中某一点 p( x, y),用 p 表示其像素值;avg sum 8( x ,y)表示点 p( x, y )的 8 领域的平 均像素值。该方法的二值化条件总结如下: (1)图像中的每一个点 p( x, y) ,若 p<80。设定 p=0,若 p>120,设定 p=255。 (2)对图像中心点 p( x, y ),若 pi(0<i <9)满足 pi≥ p 的有 5 个或 5 个以上,设定 p=0 。 (3)若 avg sum 8(x, y )< T,设定 p=0。 T 是事先设定的一 个阈值,对不同设备上的图像传感器可能设定的值不同, 这里设定的 T 为 60。 (4)若 |p− avg sum 8( x, y)|> X ,设 p=255。X 是设定的一个 阈值,对不同设备上的图像传感器可能设定的值不同,这 里设定 X 为 3 。 通过上述的二值化方法处理,得到的图像能够很好地 保留序列号的信息。需要注意的是,得到的二值化图像有 可能带有噪声,为了更好地进行处理,可以根据需要对图 像进行噪声 (毛刺 )消除处理 [9]。 3.2 图像倾斜校正 为了提高识别性能,对于倾斜的图像要进行校正。首 先通过寻找纸币边界点,对纸币的边界点进行直线拟合, 可以得到纸币的边界,纸币边界的交点即是纸币的顶点。 边界和扫描图像的夹角,也就是纸币图像的倾斜角,对纸 币图像进行旋转即可完成校正。为了使得结果更准确,倾 斜角度不宜过大,这里规定为 12°。 3.3 序列号定位 通过纸币的顶点信息,可以得到纸币序列号可能出现 的区域。在该区域内对序列号进行定位和提取。这里用了 一个 350×35 大小的矩阵框来提取纸币序列号 (矩阵框的单 位为像素 )。序列号提取的方法如下:
第 38钢,盛
庄:纸币序列号的快速识别方法研究
157
取字符连通域特征把序列号分成 3 类,通过 Hausdorff 距 离匹配方法对字符进行细分类和识别。由于纸币序列号的 识别方法最终会移植到 DSP 开发板上用以配置在点钞机 上,因此纸币序列号的识别必须要求对硬件资源消耗足够 小。采取由粗到细分类方法能够避免大量复杂的计算从而 降低硬件资源的要求。
1
概述
验钞机 (纸币清分机 ) 是银行常用的检验纸币真伪的工
复杂性,字符结构识别方法速度快,但对噪音敏感。 为此, 本文提出一种纸币序列号的快速识别方法。先通过扫描线 方法把待分辨字符粗分为若干大类,再计算其 Hausdorff 距离 [7],从而对字符进行判定和细分类,最后将细分类的 字符通过字符区分器进行识别。
房爱东 1,胡学钢 2,盛 庄3
(1. 宿州学院信息工程学院,安徽 宿州 234000;2. 合肥工业大学计算机与信息学院,合肥 230009; 3. 北京控制工程研究所,北京 100190) 摘 要:针对纸币序列号识别问题,提出一种快速识别方法。求解字符连通域特征和扫描线法对序列号实现粗分类,使用 Hausdorff 距离
和闭合曲线特征对字符进行细分类,对细分类的字符利用字符区分器进行识别。实验结果表明,该方法操作简单,能避免复杂的计算,识 别速度较快,且能提高字符的识别率。 关键词:纸币序列号识别;连通域特征;扫描线;Hausdorff 距离;闭合曲线特征
Research on Rapid Recognition Method of Paper Sequence Number
FANG Ai-dong1, HU Xue-gang2, SHENG Zhuang3
(1. School of Information Engineering, Suzhou University, Suzhou 234000, China; 2. School of Computer and Information, Hefei University of Technology, Hefei 230009, China; 3. Beijing Institute of Control Engineering, Beijing 100190, China) 【Abstract】This paper proposes a fast method for paper sequence number recognition. Characters are divided into several categories through the characteristics of connected domain and scanline, small fine categories are subdivided with the Hausdorff distance and the close curve characteristics. It uses character differentiator to identificate small fine categories. Experimental results show that this method has simple operation, can avoid complicated calculation, recognition speed is fast, and can improve the recognition rate of character. 【Key words】paper sequence number recognition; connected domain characteristic; scanline; Hausdorff distance; close curve characteristics DOI: 10.3969/j.issn.1000-3428.2012.24.037