一种简易的纸币识别算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

自己收集整理的
错误在所难免
仅供参考交流
如有错误
请指正!谢谢
一种简易的纸币识别算法

宋晓骥 杨彦赟 谈斌 李建伟 张剑白 杨瑞芝
(国防科学技术大学电子科学与工程学院
长沙742100)

摘要:本文结合模式识别和随机信号分析与处理的相关理论
提出了一种纸币识别的模型
主要采用聚类分析和匹配滤波的方法
开发了一种简易而可靠的纸币识别算法
得出了一些有意义的结论

关键词:模式识别 随机信号分析 聚类分析 匹配滤波

0 引言
纸币识别自动化技术
提高了商业、银行等行业的效率
方便了人们的日常生活
开发更好的纸币识别算法
一直受到研发人员的关注
纸币识别技术要有较高的正确性和实时性
同时
考虑到硬件平台
算法应当简易
便于移植和控制成本
针对这些要求
本文研究了一种基于聚类分析和匹配滤波的纸币识别算法

1 聚类分析的原理
1.1 聚类分析简介
聚类分析考量了模式之间的相似性
把相似性大的样本聚集为一个类型
本文主要应用了简单聚类法

这种方法将模式到各聚类中心间的距离与阈值相比较
都大于阈值时该模式就作为另一类的类心
小于阈值时按最小距离原则将其划分到某一类中

其突出特点是计算简单
在待分类模式集给定的条件下
聚类结果很大程度上依赖于模式特征、距离门限T以及模式聚类中心的选取
当有特征矢量分布的先验知识来指导门限T及初始中心的选取时
可以获得较合理的结果

下面讨论相似性测度和模式特征的选取


1.2 相似性测度
在实际中较多使用欧氏距离(Euclidean)作为来衡量相似性
定义为:

那么欧氏距离

欧氏距离具有平移和旋转不变性
但是对于一般线性变换不是不变的
可以把数据标准化来克服这个缺点
在使用欧式距离时作为距离测度时
特征的量纲应统一;应选取能有效反映模式类别属性的特征
否则会造成严重的分类错误


1.3 特征选择中的直接挑选法
直接挑选法是直接从已获得的n个原始特征中选d个特征
使可分性判据J满足

式中
是n个原始特征中的任意d个特征
在要求不高的场合下
为减少计算量
可以采用单独优特征提取法来挑选特征

单独最优法基本思路是计算各特征单独使用时的判据值并递减排序
选取前d个特征

2 匹配滤波的原理
2.1 匹配滤波理论简介
如图所示线性系统
设系统的传递函数为,

输入波形为

其中是确知信号; 是零均值平稳随机过程
功率谱密度为



输出信噪比达到最大
如果

噪声是白噪声
这时的滤波器称为匹配滤波器

2.2 匹配滤波器的特性
匹配滤波器的幅频特性为

它对输入信号的频谱进行加权
对于某个频率点
信号越强
加权系数越大;噪声越强
加权越小
可见
匹配滤波器的幅频特性有抑噪的作用

匹配滤波器的相频特性为

由上式可以看出
滤波器的相频特性抵消了输入信号相角
使信号各频率分量的幅度同相相加;而对噪声各频率分量起到的是功率相加的作用
综合而言
信噪比得到提高

3 工程实现
3.1 纸币识别问题的建模
纸币每一个面的数据是以8×60的矩阵的形式呈现的
为此建立了两个数据模型:特征空间矢量模型和随机过程模型

特征空间矢量模型认为每个面有8个特征
每个特征是60维空间中矢量
这是模式识别中常用的一种模型
便于采用聚类的方法进行识别

随机过程模型假定存在"理想"的纸币
"理想"纸币各面的特征是唯一的确知的信号
而实际的纸币由于污损、环境等原因
往这个信号中引入了噪声
因此
传感器采集到的是一个随机信号
将采集数据的过程视作一个随机过程
这个随机过程由8个样本函数组成
每个样本函数包含60个数据点
基于这个模型
可以利用随机信号分析的理论分析数据
进行更精确的识别


3.2 算法的总体流程图
算法流程图如图3.2所示


















图3.2 总体流程图
3.3 数据预处理算法
数据预处理的任务
是由原始数据得出对"理想"纸币特征的估计
以及将待识别的样本(以下简称样本)做去均值和归一化处理

"理想"纸币的特征将被用作聚类分析的类心
以及匹配滤波器设计中的确知信号
其估计是否准确
关系到识别的成败
为此
采用取中值的方法而不是取均值的方法获得这些特征:把所有样本中同一面值、同一面、同一传感器、同一维的数据排序
取中值作为"理想"纸币相应的特征值
这样有效地避免了噪声的影响
可以得到较准确的估计

为有效利用欧氏距离来度量相似性
对标准数据和样本都进行了去均值和归一化的操作


3.4 初步分类算法
初步分类算法应用特征空间矢量模型
任务是将样本指判为某一面值的纸币
不需要判断真假

分类前运用直接挑选法
选择最具代表性的特征用于分类
以减少运算量
通过计算样本各特征到"理想"纸币各面的欧氏距离
发现样本的第1个特征
即1号传感器的数据最具区分性
把它作样本的特征
对其减抽


在60个数据中每隔4个取出1个
得到15维用于分类的特征

算法流程图如图3.4所示
























图3.5 初步分类算法
3.5 精细分类算法
精细分类算法应用随机过程模型
任务是判断经过初步分类的样本的真伪
将真币指判为一种纸币的某一面

样本的每个特征被视作一个随机序列X[n]
设引入的噪声N[n]为白噪声,那么
(3.5.1)
式中
s[n]是"理想"纸币的特征
s[n]已经在数据预处理过程中由样本估计得出

s[n]是实序列
所以相应的匹配滤波器的冲击响应为
(3.5.2)
将输入序列X[n]与h[n]做卷积
(3.5.3)
把c[n]的最大值与门限比较
就可以检测出X[n]中是否存在信号s[n]
若存在s[n]
说明X[n]对应的样本就属于s[n]对应的纸币
而s[n]的类别已知
这样就完成了识别的任务
识别过程如下图所示


卷积运算较为复杂
为减少运算量
需重新考量匹配滤波的过程

根据匹配滤波理论
c[n]在n=60处取最大值
因此只需要计算c[60]即可
因为
(3.5.4)
所以c[60]就是X[n]与h[n]的逆序序列的对应项乘积之和

注意到在(3.5.2)式中
取C=1
k=60
那么h[n]就是s[n]的逆序序列
那么
(3.5.5)
即c[60]就是X[n]与s[n]的对应项乘积之和

这样
就把复杂的卷积运算化为简单的乘加运算
极大地提高了效率

精细分类算法流程图3.5所示


 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
图3.5 精细分类算法
4 结论
本文结合模式识别和随机信号分析的理论
提出了一种简易而又有效的纸币识别算法
这种算法具有坚实的理论基础和简单的数学运算
实用性较高

但是
本算法也存在一些缺点
比如存储"理想"纸币特征需要较大的空间
粗略的初步分类结果可能对精细分类造成影响等

改进方案可以考虑采用更稳健的初步分类算法;对"理想"纸币更精确的估计
获得准确的聚类中心和匹配滤波器;对噪声精确建模
更好消除噪声影响等


参考文献
[1] 孙即祥
姚伟
滕书华.模式识别[M].北京:国防工业出版社
2009.
[2] 李金宗.模式识别导论[M].北京:高等教育出版社
1994.
[3] 罗鹏飞
张文明.随机信号分析与处理[M].北京:清华大学出版社
2006.
[4] 张笑天
杨奋强
Matlab7.x教程[M].西安:西安电子科技大学出版社
[5] Stanley B Lippman,Josee Lajoie,C++ Primer[M].Adison-Welsley

相关文档
最新文档