车牌定位方法综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文章编号:XXXXX
汽车牌照汉字识别方法综述
摘 要:字符识别是汽车牌照自动识别系统中的关键环节, 汉字字符识别是其中的难点。本文在对车牌汉字识别方法分类的基础上,介绍了各种传统的和最新的汉字识别方法, 分析各种方法的特点,算法及其实现,并对它们的性能进行评述。
关键词:识别; 汉字; 车牌
中图分类号:文献标识码:A
Methods of license plate character recognition
Abstract:License plate character recognition is the key of automatic identification system, and Chinese character recognition is one of the difficulties.Based on the classification of license plate character recognition method ,this paper descripts various traditional and the latest character recognition methods , analyzes the characteristics of every method, algorithms and their implementation, and reviewes their performance .
1 引言
随着国民经济的高速发展, 高速公路、城市道路、停车场建设越来越多,对交通控制、安全管理的要求也日益提高,智能交通系统ITS( Intelligent Traffic System) 已成为世界交通领域研究的前沿课题[1]。在此基础上发展的车牌照识别LPR (License Plate Recognition)系统是智能交通系统的重要组成部分,它在交通管理中占有重要的地位,有着多种应用。
LPR系统主要由三部分组成:车牌定位、字符分割、字符识别[2],其中关键技术是字符识别技术,西文和数字识别技术已经取得了相当大的成果。由于我国车牌的特殊性,汉字字符识别技术依然是重要研究的课题。
光学字符识(Optical Character Recognition)[3]别属于模式识别和人工智能的范畴,同时涉及到图像处理、形式语言、自动机、统计决策理论、模糊数学、组合数学、信息论等学科,它由德国科学家TausheCk于1929年首先提出,但这种梦想直到计算机诞生后才变为现实,现在这一技术己经由计算机来实现。OCR目前依然是国际上比较流行的研究课题,随着研究的深入己成为比较实用的技术。字符识别的基本原理:文字经光电扫描,模数转换为带灰度值的数字信号送至预处理环节。预处理的内容和要求取决于识别方法,一般包括行字切分、二值化、规范化等。经过预处理,字符模式成为规范化的二值数字点阵信息。对该二值汉字点阵,抽取一定的表达形式后,与存储在字典中己知的标准字符表达形式匹配判别,就可识别出输入的未知字符[4]。
目前常用的字符识别方法有结构模式识别、统计模式识别和神经网络三类。典型的汉字识别方法主要有:基于小波的车牌汉字特征提取方法;基于PCA( Principal Component Analysis) 学习子空间的字符识别算法;基于模糊模板匹配的车牌汉字识别方法;基于SVM的车牌汉字识别方法;利用投影特征的车牌识别汉字方法等。然而,虽然这些算法在某些特定条件下识别效果较好,但综合一些诸如天气、背景、车牌磨损和图像倾斜等干扰因素的影响,暂时还不能完全满足实际应用的要求,有必要进行进一步的研究。
2 车牌汉字识别方法
2.1 结构模式识别
字符图像包含丰富的结构信息,设法提取含有这样信息的结构特征及其组成规律,作为识别的依据,这就是结构模式识别。它是最基础的,也是最早的文本字符识别方法。研究的出发点是字符的组成结构。字符是由笔划构成的,也可以认为是由更小的结构基元构成的。由这些结构基元及其相互关系完全可以精确地对字符加以描述。常见的结构识别有:
(l)基于骨架的识别方法
骨架是人对于字符的抽象认识,是经细化得到的。细化有迭代剥离和直接获取两种方法:迭代剥离法是通过搜索图像边缘,通过反复考察边缘点的连通度并结合相应的规则来决定点的去留;直接获取法根据每条扫描线的黑游程中点得到中轴,这样的方法会产生不必要的分支,而且扫描方向必须与笔画方向基本垂直,否则会产生大量断点。
骨架的描述可以由点的集合抽象为顶点与弧构成的图的形式。J.Rocha等描述了使用图的匹配算法来与模板比较,由于顶点和弧上带有具体参数,从而可以得到为完全拟合所需的形变代价,并认为该代价也就是与模板匹配的距离。这一点在汉字识别中非常有效。使用骨架作结构信息源是结构方法的主流。但它的缺点在于它十分依赖图像的细化质量。当图像中有粘连的框线时细化常常会产生拓扑结构上的变化,这时就要求后续识别有较大的规则灵活性[5]。
(2)基于轮廓的识别方法
轮廓也可以反映字符图像的结构,由于存在内外轮廓和笔画宽度等因素的影响,轮廓提取方法简单,结果确定,因而它仍不失为一种好的结构信息源。轮廓大致有两种描述方式,一种与骨架一样用结构点和弧构成图的方式来描述,识别也与骨架相同;另一种则用标准化后的轮廓距边框的距离描述[6]通过在一定范围内寻找轮廓的最远、最近点和最大、最小突变点得到一系列结构特征,构成识别规律。
该方法与上述方法比较,轮廓方法位置更精确,而且运算量较小;但缺点是容易受到笔画宽度和断线的影响。适用于图像质量较好、书写较固定的环境。
综上所述,结构模式识别方法主要优点在于对字体变化的适应性强,区分相似字的能力强。在实际应用中,车牌图像中的字符常常发生变形、断裂、粘连等情况,这些因素直接影响到结构基元的提取,难以进一步推理、识别,抗干扰能力差;另外结构模式识别的描述比较复杂,匹配过程的复杂度较高。所以单纯的结构模式识别方法很少被应用。
2.2 基于小波的车牌汉字特征提取方法
小波变换提供了一种字符图像的多分辨率分析, 它不同于传统的短时傅立叶变换, 它可以分析图像在时域和频域的局部特性, 因此小波变换特别适合于提取图像局部的细节特征[7]。浙江大学的潘翔叶和修梓等人将小波理论应用于车牌汉字特征提取,提出了一种直接从灰度图像提取车牌汉字特征的方法[8]。
该方法首先提取图像的小波矩和基于小波分解的区域密度特征, 然后以识别率好坏为最优依据,进行特征分量排序和选择, 最后把特征矢量送入BP神经网络进行字符识别, 该方法避免了一些传统汉字特征提取方法需要对图像进行二值化操作而造成的汉字字符结构信息丢失。提取的特征有效地反映了车牌汉字的局部和全局特征。但此方法由于没有二值化过程,在汉字字符分割定位不准确的时候, 识别效果不很理想。
2.3 基于PCA学习子空间的字符识别算法
子空间学习算法[9]是一种多特征的分类寻优过程,即可根据样本的训练结果适当地对子空间进行调整, 因此它也是一种监督学习方法。通过这种学习反馈机制能提高子空间的识别效果。采用PCA学习子空间方法来进行灰度图像上字符的识别,不仅克服了传统的基于二值化字符特征提取和识别所带来的主要困难,还尽量多地保存了字符特征。由蒋伟峰和刘济林提出的算法[10]在PCA 子空间的基础上, 通过反馈监督学习的方法使子空间作旋转调整, 从而获得了更好的分类效果。特别当字符类别数不是很大时,子空间的训练时间也将在可接受的范围