TVM纸币识别模块中纸币面值识别技术研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
TVM纸币识别模块中纸币面值识别技术研究
摘要:在TVM纸币识别模块纸币识别方法中,利用粘连字符分割和结构识别的方法,对人民币纸币图像进行识别。经试验证明,该方法能正确识别纸币面值,同时对票面的污迹等噪声有很好的抑制效果。
关键词:TVM纸币处理模块;纸币面值识别;粘连字符分割;结构识别前言
随着科技的发展,很多行业都出现了基于人民币纸币识别技术的智能化无人收费系统,节省了大量的人力资源。人民币纸币的识别技术不仅可以应用在自动售货售票上,也可以应用到银行的自动存取款机,手机营业厅的自动交费机等,在地铁AFC系统中TVM机上也使用了人民币纸币识别技术。AFC系统的全称是Automatic Fare Collection System,是一种由计算机集中控制的自动售票(包括半自动售票)、自动检票以及自动收费和统计的封闭式自动化网络系统。
目前已有的识别方法主要是利用统计方法进行识别,如尺寸比较法、模板匹配、人工神经网络等。人民币纸币在流通中不可避免的会沾染污迹或磨损。这些方法虽然能快速识别出纸币的面值,但纸币上的微小污迹或其他图像噪声对识别结果影响很大,甚至出现无法识别或错误识别的现象。为此提出以提高识别准确率为目的的识别方法,使用粘连字符分割和句法识别的方法来识别纸币的面值。
1 西安地铁二号线TVM纸币处理模块
纸币处理模块是识别乘客投入到自动售票机的纸币的机械模块,安装在TVM上,可无方向性的识别当前流通的所有币种的人民币纸币。二号线的自动售票机中采用G&D BIM2020(德国捷德)系列纸币识别器。纸币识别器对纸币的放入无方向性要求,无论乘客如何投入纸币,都不影响纸币识别器对纸币的识别功能,经过识别后合法的纸币将被保存到纸币钱箱,不符合参数指标的纸币通过退纸币口返还给乘客,并有明确标识指示,由TVM机系统完成声音提示。纸币识别器识别功能完整,拓展性强,适应今后人民币防伪技术的发展趋势。
2纸币面值识别技术
2.1 面向识别
要进行人民币纸币面值识别,首先要确定人民币纸币的面向。只有确定出面向,才能准确定位纸币要识别的特征区域。面向可分为:正面正向、正面倒向、反面正向和反面倒向。在进行识别前应先进行预处理,如倾斜校正、滤波等处理。在面向识别中,采用目前常用的方法,即根据灰度来确定。这种方法识别速度快,准确率高。对纸币图像分割成9块区域,根据每一块的灰度进行比较,可以得出纸币的面向。
2.2面值识别
人民币纸币识别对准确率要求很高,识别算法应在保证高识别率的基础上尽可能的提高识别速度。提出的识别方法将粘连字符分割应用到纸币识别中并采用句法方法进行识别,这种方法受纸币的污迹影响很小,即使有一些微小磨损或污迹也能准确识别。
2.2.1字符提取及分割
以50元面值的人民币为例,对数字50定位后需要将两个字符分割开,而5和0连接的很紧密,粘连在一起,直接分割将损害字符的完整。因此需要使用特殊的处理算法。先将数字字符滤波并进行边缘提取,得到50的空心字符,充填后进行细化,得到图1:
图1细化后图像图2分割后数字5和0的图像图3 图4
此时字符依然是粘连的。在二值图像中,白色像素点的值为1,黑色像素点值为0。对图像每一列找出最上端为1的点和最下端为1的点,行数相减,得到差值K。最上端为1的点为,最下端为1的点为,。然后从开始向下,把到之间的点的值都改为1,此时字符图像已经分离,可以轻易的将字符分割开。分割后也可以做一下简单的去毛刺处理。如图2所示,是被分割出来的字符5和0。对字符的识别,这里采用结构识别的方法。
2.2.2字符的识别
将字符图像分割成四个象限,如图3所示,按几何的方法对象限排序,即右上角为第一象限,左上角为第二象限,左下角为第三象限,右下角为第四象限。之后判断每个象限的笔画。根据笔画的不同,列出代表笔画特征的表格,如图4,可以得出如下结果:
结构描述格式为:是否空心;第一象限笔画;第二象限笔画;第三象限笔画;第四象限笔画。
数字0可以描述为:19876;数字1可以描述为:03333;
数字2可以描述为:05842;数字5可以描述为:02425;
对要识别的数字,将其描述出来的字符串进行匹配识别。对字符串进行匹配,就是对两个分别具有m和n个符号的字符串X和Y,衡量他们之间的相似度,具体定义为:将字符串X变换成Y需要的字母编辑次数。将描述要识别的数字的字符串设为X,需要匹配的模板字符串为Y。采用LevenShtein距离法即编辑距离算法,以矩阵的形式给出将X变成Y的所有可能编辑的操作,然后根据这
个矩阵算出最终结果。将表述要被识别的字符的字符串X与其他模板字符串依次匹配,算出LevenShtein距离,距离最小的,就是符合匹配的字符。
3试验结果
下载的不同面值纸币图像共50张,包括第五版及新第五版人民币纸币的正面和反面图像,其中绝大多数是流通时间较长的纸币。在MATLAB 7.0中仿真,对纸币图像进行识别。其中正确识别49张,错误识别1张。错误的原因是该纸币破损和污迹比较大,已经影响到正常的流通。试验中对可以正常流通的纸币,即使有一些小的污迹和破损,也能正确的识别。
4结论
论文中的识别方法能很好的克服字符上的污迹影响识别率的问题,同时也很好的解决了字符粘连而无法分割的问题。如字符上沾有污迹,在细化处理的时候可以很好的弱化污迹带来的影响,在用结构方法进行识别的时候可以尽可能的排除污迹的影响,达到准确识别的目的。文中的方法把统计识别和句法识别方法相结合,实验结果表明,在该方法下对不同面值的纸币进行识别,识别率可以达到99%以上,因此该方法有很好的实用性。
参考文献
[1]杜选,高明峰.人工神经网络在数字识别中的应用[J].计算机系统与应用,2007,(2):21-27.
[2]冈萨雷斯.数字图像处理.北京:电子工业出版社,2008.