车牌识别英文文献1翻译
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
提出的模型
本文的主要目的是要开发一个系统可以从没有虚假质量的复杂的现场图像中提取车牌号码,相机和车牌之间的距离,其中的相对车牌已被抓获在相机等。
对车牌识别系统概述见图1,在车辆图片由相机拍摄后,它会被传递到预先处理单位由系统作进一步处理。其主要功能是消除图像采集子系统所造成的噪声,提升图像的其他两个子系统使用的功效。图像将被板提取模块扫描以找到车辆的车牌。下一阶段是对于车牌中字符的分割。最后每个字符将传递给光学字符识别(OCR)模块来进行识别确定,最终结果将是ASCII字符和车牌号码。
3.1.预处理
输入图像的最初处理是为了提高其质量,并为系统的下一阶段执行作准备。首先,该系统使用的NTSC标准的方法将RGB图像转换为灰度图像。
G=0.299*R+0.587*G+0.114*B
第二步,用中值滤波(5x5)对灰度图像进行处理,以消除噪音,同时也能保持图像的清晰度。中值滤波是一种非线性滤波器,它用各像素5x5邻里的计算得出中位值来取代该像素的值。
3.2.板块提取
板块提取处理包含五个不同的阶段进行,如图2所示;在这里每个阶段执行灰度图像分割过程以消除不属于车牌区域的多余的像素。例如,水平定位阶段是负责寻找水平部分可能包含一个车牌。在下面的讨论中,每一个阶段都会被细细展开讨论。
马来西亚车牌由一排白色字符在黑色的背景底色,所以我们可以说,车牌区域的特点是从一排黑色过渡到一排白色,反之亦然,这样转换被称为“边缘”。从车牌字符到其背景在色彩强度上总的变化叫做边缘的强度。最强边缘值,能够在从一个黑色像素过渡到一个白色像素或从白色像素变为黑色像素情况下被找到。在理想的情况下,马来西亚的车牌是白色的字符绘制在黑色的背景上,因此这种搭配产生了高强度边缘值,用于查找出可能的板区域。在本文中我们将使用Sobel算子来查找边缘。Sobel运算在图片上执行一个2-D空间梯度测量。通常它是用来寻找近似绝对的梯度幅度对在每一个点在输入的灰度图像上。该Sobel
边缘检测器使用一对3x3卷积板块,一个在x方向(列)上按梯度检测,另一个在y方向(行)按梯度检测。实际索贝尔Sobel面具如下:
图4说明了一个边缘检测过程中使用Sobel算子。较淡的区域表示更强板块边缘的情况下牌照。在创建的边缘图像后,系统会搜索有高边缘值的区域,这些区域中最有可能包含车
牌。要做到这一点,系统将为边缘图像建立一个水平投影。一个图像的投影轮廓是一个紧凑的空间表示像素内容分布。水平投影轮廓被定义为每行上像素值之和的矢量。图5显示了图表示水平投影图像的边缘,图像波峰表示为强边缘区域,可用于提取最有可能的水平位置车牌。该系统将标记所有的对应的水平段相当于标记边缘图像的投影轮廓的波峰。
提取过程的下一步是在板中寻找车牌的垂直位置。对于这部分,通常使用的方法为研究统计板的图片的直方图。但这些方法并不适用于马来西亚的车牌,为两个原因:
1.字符数在各板上不同。
2.有些板的特点为字符写在两行。
我们提出了一个简单的方法用的边缘图像来定位图像板的垂直坐标。该算法开始每个像素内的具体位置窗口。通过每一个窗口水平段来滑动窗口和总结窗口内的边缘值,然后通过
窗口的面积划分结果得到的平均倾斜值。对于每一个水平段,该算法为以后处理在进入下一个新的矢量时将存储每个窗口的结果值,我们称这个矢量为HDV,公式为:
这里i=0,1...(ImW- M+1),G(x,y)是边缘图像,W是滑动窗口,A w是滑动窗口的区域。ImW是图像的宽度,M是滑动窗口的宽度。
图6说明了横向密度矢量的计算过程,由于窗口滑过模板的矢量值的平面密度(HDV)图逐渐增大,直到达到图像的波峰,然后再下降,在HDV图的波峰峰点时滑动窗口与车牌进行匹配。
图6. HDV的计算
此后,该算法能找到所有的波峰在HDV图形中的每个水平段。一个波峰如果大于设定的阀值就假定属于一个车牌。图7显示了一个例子为在这一过程中提取的垂直位置车牌随着每个HDV的图的水平段。
图7. 车牌垂直位置的例子
在垂直位置处理过程以后的下一步骤是是清理阶段。这执行过程分为三个主要阶段,它们是:
1.两排板的的分隔处被错误地检测为一个段。
2.从多余的背景中将车牌孤立出来。
3.斜角的检测和纠正。
图8.两个板块出现在同一的水平段中
分离出来的包含有两行字符的车牌将通过二值图像一个水平投影来进行确切的提取和检测一个波谷作为一个特殊的阀值。如被检测到,这一部分将被视为两排板,将被切割成两个独立部分,如下图9所示:
图9.车牌的水平投影
从多余的背景中分离出来的车牌使用一投影轮廓,反映了白色像素在每一列和每一行中的数目。在大多数情况下,预测的纵向的和水平白色像素数量揭示了该板块的实际位置。预测的一个例子如图10所示。
图10. 车牌的水平和垂直投影
要查找车牌的倾斜角度,我们所使用的算法描述在[1]中。计算的倾斜角是通过Hough 变换找到车牌图像中的最明显的线和其角度,最后的车牌图像将被旋转的如图11所示。
图11. 偏斜角的纠正
定位过程的最后一步,是核查阶段。该阶段的输入内容是前面几步中所有的可能包含有车牌的区域。因此,这个阶段的主要目标是过滤掉不属于车牌的区域。我们将遵循以基础规则为的分类做法是,如果下列条件之一满足则该区域将被删除:
1.该区域的高宽比(宽度/高度)小于/大于某阀值。
2.该区域的面积的是小于某一阀值。
3.每一像素的平均倾斜度小于/大于某一阀值。
4.有效的字符数为小于3或大于9。
5.区域密度小于/大于某一阀值(密度=对象区域面积÷所有区域面积)。所有的阈值
决定于实验测试数据。
3.3.字符分割
为了简化字符识别的过程, 最好板块划分为不同的图像,每个包含一个分离的字符。有一些广泛使用的字符分离方法,这些方法可用于几乎所有的可靠的车牌识别系统系统中。这些方法有:静态式[4],垂直投影[8]和连接的组件。前两种方法不能用来分割马来西亚车牌,因为每个车牌没有一个固定的字符数目。本文中以下步骤是用来提取车牌的字符:
1.在可用的灰度值的范围内(0~255)内,扩大图像的对比度。
2.用Otsu方法[10]对车牌图像按所规定的阀值进行分界。
3.搜索图像中的连通区域,每个连通域用一个特殊的标志进行标记来区分图像中两个不同的连通域。如图12所示。
4.从以前的步骤中调整每个字符到标准的高度和宽度(20*10)用于进行下面的识别处理。
图12. 提取车牌字符
3.4.字符识别
人工神经网络用于字符识别。我们使用的多层感知神经网络器(MLP神经网络)测试时用反向传播算法。在学习阶段,数据库的字符构成表示在MLP神经网络的输入层相应的输出与理想的输出作比较。在网络输出时,为了获取响应尽可能接近到理想输出的权重而反复修改。输入层由135个输入神经元组成,一个隐藏层为有40个神经元有登录传递功能。输出级有36神经元,每个输出给定的概率输入相应的字符。