基于聚类的车牌定位的快速方法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
很多车牌上有较厚的边框,这些边框会干扰车牌的精确定位,影响后续的字符分割的效果。因此,要对粗定位得到的矩形区域进行边框检测。
在边框检测之前,对预处理之后的图像进行边缘增强。这里的边缘并不是常规的水平边缘或垂直边缘,而是车牌图像的4个边角。边缘增强时使用的是修正的sobel变换,如公式(2)所示:
(2)
Keywords:license plate location;clustering;rapiddetection;feature scans
1引言
车牌识别技术LPR(License Plate Recognition)是实现交通管理自动化的重要手段和车辆检测系统的一个重要环节。其中,车牌定位与分割处理的质量直接影响着整个车牌识别系统工作的速度和准确度,因而车牌图像的定位与分割环节是反应系统性能优劣的关键因素之一。
经过验证,确定为车牌区域后,利用最小二乘法对车牌进行倾斜校正。
4实验结果
多次实验表明,在对图像进行全图粗扫描时,扫描线的上下边界的偏移量与图像本身分辨率有很大关系,取图像宽度的1/10比较合理。扫描线之间的间隔设置为几个像素即可,本文中设置为5像素。
本文对不同光照不同环境下的204幅车牌照片进行测试,输入图像尺寸为640*480,其中包括10幅黄色车牌照片,7幅白色车牌照片和7幅黑色车牌。实验所用照片均为复杂背景下的车牌图像,如图5所示。
Abstract:The license plate location is a key issue to automatic license plate recognition technology, after years of development, there has developed a variety of license plate location algorithms. However, most of the current positioning methods have the problems of locating a long time and a lower positioning rate under complex background. This paper proposes a fast license plate location method based on clustering, in which the first step is clustering transition points and the color information, and then get the license plate candidate areas for precise positioning to find the license plate area. Experimental results show that this method has a effect in image positioning plate under complex background, and greatly shorten the positioning time.
车牌上的字符有汉字、英文字母、数字3种,英文字母和数字是连续的,笔画之间总有衔接,投影在水平线上,就是一个连续的峰值区域;而汉字却有左右结构,如“皖”和“川”,这些结构的汉字有不衔接的部分,投影在水平线上时,会出现多个峰值。因此,当峰值数在5和10之间时,认定该车牌候选区域为真正的车牌区域,否则认定该候选区域为非车牌区域。
车牌区域具有特定的颜色信息和丰富的跳变点信息,通过对这两种信息进行聚类分析,可以快速得到粗定位之后的结果。对该结果进行校正从而得到精确的车牌区域。算法框图如图1所示:
图1车牌定位算法流程图
2基于多特征聚类的粗定位
粗定位的目的是根据车牌图像的纹理特征,初步得到车牌的几个候选矩形区域,主要包括3个步骤,跳变点聚类,颜色聚类和矩形框选取。
由于边缘增强的目的是增强四个边角,因此对车牌图像的左上、右上、左下、右下四个区域分别使用不同的滤波器进行处理。这样的结果是,图像的四个边角和中间部分被明显增强了。四个边角的增强有利于边框的检测。
通过检测直线的方法检测边框,分别找出左上、左下、右上、右下四个角点。边框检测如果成功,可以直接使用双线性插值的方法进行倾斜校正。双线性插值的矩阵描述形式如2-2所示:
确定边界是在粗定位的基础上,精确的进行行扫描。通过从中间向上下进行扫描,确定上下边界;通过从中间向左右进行扫描确定左右边界。确定边界时,会将边界处的点置为高亮度,作为边界的标志。最后通过水平投影和垂直投影,分别得到精确的左右边界和上下边界。
4车牌验证
通过对车牌图像利用多特征聚类进行粗定位和利用特征扫描进行精确定位,可以快速的定位车牌,并且获得较高的车牌定位率。但是,一些具有和车牌类似结构的非车牌区域会被误检为车牌。因此,需要对定位得到的车牌进行合法化验证。
图2 行扫描示意图
行扫描的目的是根据车牌图像源自文库纹理特征寻找出亮度出现跳变的区域。每一条扫描线在扫描时,记录亮度跳变频繁的线段。行扫描完毕后再将记录的相邻的线段融合成矩形,得到若干个出现亮度跳变的矩形区域。将这些矩形区域作为车牌的候选区域。
1.2颜色聚类
通过跳变点信息快速确定候选区域后,对候选区域的颜色信息进行聚类。
关键词:车牌定位;聚类;快速检测;特征扫描
中图分类号:TP391.41文献标志码:A文章编号:
Afastlicenseplatelocationmethodbased onclustering
Hou Shu-ting, Xu pin
(The Communication University of ChinaSchool ofInformation EngineeringBeijing100024)
3基于特征扫描的精确定位
通过粗定位过程,大部分背景区域被过滤。但是得到的结果还不是精确的车牌区域,还有一些极小的偏差。接下来利用车牌的结构信息来进行精确定位。流程图如图3所示:
图3精确定位流程图
首先对图像进行预处理。预处理主要执行的是灰度化、图形缩放、标准化的工作。这一步是为减少后续计算的运算量。
2.1边框检测
图5原图
图6实验过程图
试验中,当定位到的车牌区域占整个车牌区域的比例大于60%时,可以对该车牌图像进行二次定位,从而得到完整的车牌区域。经过实验发现,本文算法的平均定位时间小于63ms,定位准确率在93%以上,可以有效的去除铆钉边框对车牌定位结果的影响。为了验证文中算法的定位准确率实时性,同时采用文献10的算法和文献11的方法在相似的实验环境下进行对比实验,实验结果如表1所示。由表1可见,本文方法的定位准确率高于文献11的方法,低于文献10的方法,位于两种方法之间,能够满足准确率的要求,平均定位时间是63ms,远远低于文献10的1058ms和文献11的250ms。
1.1跳变点聚类
利用行扫描线对整幅灰度图像进行扫描并记录亮度跳变点。通常而言,车牌区域不太可能会刚好贴近整幅图像的边缘。一般的车牌识别系统在采集图像时,也会尽量确保车牌区域在图像的中间位置。所以扫描图像时,为了减少耗时,行扫描线的上下边界分别距离图像的上下边界有一定的偏移。行扫描线在图像上纵向移动时,也有一定的间隔。该间隔不能太大,否则扫描线太稀疏,无法找出有效的候选区域。行扫描示意图如图2所示。
与车牌粗定位时的全图粗扫描类似,特征扫描也是用若干条扫描线检测车牌字符区域亮度的跳变,但这次可以只用少数几条靠近粗定位结果的矩形区域中部的扫描线。根据亮度跳变的次数,判断这一区域是否是字符区域。一般来说,只要每条扫描线中心点左右两边的亮度跳变次数都在5次以上,即可认为扫描线扫过了若干个字符。
2.3车牌边界确定
3)根据车牌颜色的先验知识,排除颜色信息不符合的候选区域。
1.3矩形框选取
经过颜色聚类之后,可能还会存在不止一个候选区域。此时可根据车牌的先验知识进行选取,排除干扰。例如,车牌矩形区域宽高比在一定范围内是固定的,车牌的大小变化也有一定的范围。然后按照一些既定的策略来进行选取。比如,优先选择图像中位于中下部的矩形区域,优先选择蓝底白字、黄底黑字的车牌(这两种颜色的车牌最为普遍)。根据这样的策略,选择一个最合适的区域作为车牌区域。
基于聚类的车牌定位的快速方法
侯书婷,徐品
(中国传媒大学 信息工程学院 北京 100024)
摘要:车牌定位是车牌自动识别技术中的一个关键问题,经过多年的发展,已经开发出了多种车牌定位的算法。然而目前的定位方法,大都存在定位时间过长,对于复杂背景下的车牌图像定位率较低的问题。本文提出了一种基于聚类的快速车牌定位方法,首先对跳变点和颜色信息进行聚类,得到车牌的候选区域后再进行细定位找到车牌区域。实验证明,该方法对于复杂背景下的车牌图像定位效果良好,并且大大缩短了定位时间。
(1)
1)我国车牌的颜色信息只有四种:蓝底白字,黑底白字,白底黑字和黄底黑字。通过对不同颜色的车牌进行数学上的统计,可以得到其亮度、色度以及饱和的初始中心值。根据初始中心值对每个车牌候选区域进行聚类。在HSV空间中,颜色分量相应的欧几里得距离与人眼感知的颜色差吻合的较好。将HSV颜色空间中的两种颜色Color1={h1,s1,v1},Color2={h2,s2,v2}之间的距离定义为:
目前车牌定位的方法多种多样,归纳起来主要有基于数学形态学的方法、基于小波分析的方法、基于边缘信息的方法以及基于彩色图像的方法等。基于数学形态学的方法经常与其他方法结合使用。例如,将形态学和投影的方法相结合【1】,将形态学和轮廓提取的方法相结合【2】【3】等等。该算法计算量小,定位速度比较快,但是只对于简单背景下的车牌图像处理效果比较好。基于小波分析的方法,是先利用小波变换对车牌图像进行边缘提取和去噪,再结合跳变点、纹理特征等信息定位出车牌区域【4】【5】。该算法能够有效的去除光照、阴雨等复杂背景对于车牌图像的影响,但是小波变换计算复杂,耗费时间,不适用于对实时性要求较高的系统。基于彩色图像的方法能够充分利用车牌的底色信息,然而在车身与车牌颜色接近的情况下,可能会出现伪车牌【4】。Abolghasemi等人提出了一种利用边缘和颜色信息定位车牌的方法【6-7】,但该方法对光照比较敏感,也不适合实时应用。本文结合上面几种车牌定位的方法,提出了一种基于聚类的快速车牌定位方法。
d(Color1,Color2)=|(v1-v2)2+(s1·cosh1-s2·cosh2)2+(s1·sinh1-s2·sinh2)2|1/2.
则两色彩之间的相似度为:Similarity(Color1,Color2)=1-
2)统计每一个候选区域内各种颜色出现的次数。出现次数最多的两种颜色,分别判定为车牌底色和字符颜色。
相对于RGB颜色空间来说,HSV颜色空间用色调(Hue)、饱和度(Saturation)和亮度(Value)三元素来描述色彩,更符合人眼的视觉状态,而且这三个元素在HSV三维空间坐标系中各坐标之间具有相对独立性,可以独立地感知各颜色分量的变化。因此本文先在RGB颜色空间上进行处理,再由RGB颜色空间转换到HSV颜色空间【9】,设RGB颜色模型中红、绿、蓝3分量分别为R、G、B;HSV颜色模型中色度、饱和度、亮度分别为H、S、V,则RGB颜色空间到HSV颜色空间的转换如公式(1)所示。
(3)
而边框检测失败时,则尝试在水平方向上检测直线,用最小二乘法计算直线斜率,进行初步的水平倾斜校正。
2.2基于长度聚类的特征扫描
在车牌定位的时候,一些具有和车牌类似结构的非车牌区域会被误检为车牌。为了进一步排除干扰,减少误检率,首先利用sobel变换对车牌的字符特征进行增强。然后对车牌图像进行特征扫描。
对特征扫描之后的结果进行聚类,投影到水平线上,如图4所示:
图4车牌字符投影
由投影图可见,经过投影之后,字符区域表现为明显的峰值。每一个峰值代表一个字符。垂直边框、铆钉等会对投影结果产生一定的影响,但是经过精确定位的边框检测之后,这一影响被降低到最小。同时,边框的宽度远远小于字符的宽度,所以根据投影宽度也可以排除干扰。
在边框检测之前,对预处理之后的图像进行边缘增强。这里的边缘并不是常规的水平边缘或垂直边缘,而是车牌图像的4个边角。边缘增强时使用的是修正的sobel变换,如公式(2)所示:
(2)
Keywords:license plate location;clustering;rapiddetection;feature scans
1引言
车牌识别技术LPR(License Plate Recognition)是实现交通管理自动化的重要手段和车辆检测系统的一个重要环节。其中,车牌定位与分割处理的质量直接影响着整个车牌识别系统工作的速度和准确度,因而车牌图像的定位与分割环节是反应系统性能优劣的关键因素之一。
经过验证,确定为车牌区域后,利用最小二乘法对车牌进行倾斜校正。
4实验结果
多次实验表明,在对图像进行全图粗扫描时,扫描线的上下边界的偏移量与图像本身分辨率有很大关系,取图像宽度的1/10比较合理。扫描线之间的间隔设置为几个像素即可,本文中设置为5像素。
本文对不同光照不同环境下的204幅车牌照片进行测试,输入图像尺寸为640*480,其中包括10幅黄色车牌照片,7幅白色车牌照片和7幅黑色车牌。实验所用照片均为复杂背景下的车牌图像,如图5所示。
Abstract:The license plate location is a key issue to automatic license plate recognition technology, after years of development, there has developed a variety of license plate location algorithms. However, most of the current positioning methods have the problems of locating a long time and a lower positioning rate under complex background. This paper proposes a fast license plate location method based on clustering, in which the first step is clustering transition points and the color information, and then get the license plate candidate areas for precise positioning to find the license plate area. Experimental results show that this method has a effect in image positioning plate under complex background, and greatly shorten the positioning time.
车牌上的字符有汉字、英文字母、数字3种,英文字母和数字是连续的,笔画之间总有衔接,投影在水平线上,就是一个连续的峰值区域;而汉字却有左右结构,如“皖”和“川”,这些结构的汉字有不衔接的部分,投影在水平线上时,会出现多个峰值。因此,当峰值数在5和10之间时,认定该车牌候选区域为真正的车牌区域,否则认定该候选区域为非车牌区域。
车牌区域具有特定的颜色信息和丰富的跳变点信息,通过对这两种信息进行聚类分析,可以快速得到粗定位之后的结果。对该结果进行校正从而得到精确的车牌区域。算法框图如图1所示:
图1车牌定位算法流程图
2基于多特征聚类的粗定位
粗定位的目的是根据车牌图像的纹理特征,初步得到车牌的几个候选矩形区域,主要包括3个步骤,跳变点聚类,颜色聚类和矩形框选取。
由于边缘增强的目的是增强四个边角,因此对车牌图像的左上、右上、左下、右下四个区域分别使用不同的滤波器进行处理。这样的结果是,图像的四个边角和中间部分被明显增强了。四个边角的增强有利于边框的检测。
通过检测直线的方法检测边框,分别找出左上、左下、右上、右下四个角点。边框检测如果成功,可以直接使用双线性插值的方法进行倾斜校正。双线性插值的矩阵描述形式如2-2所示:
确定边界是在粗定位的基础上,精确的进行行扫描。通过从中间向上下进行扫描,确定上下边界;通过从中间向左右进行扫描确定左右边界。确定边界时,会将边界处的点置为高亮度,作为边界的标志。最后通过水平投影和垂直投影,分别得到精确的左右边界和上下边界。
4车牌验证
通过对车牌图像利用多特征聚类进行粗定位和利用特征扫描进行精确定位,可以快速的定位车牌,并且获得较高的车牌定位率。但是,一些具有和车牌类似结构的非车牌区域会被误检为车牌。因此,需要对定位得到的车牌进行合法化验证。
图2 行扫描示意图
行扫描的目的是根据车牌图像源自文库纹理特征寻找出亮度出现跳变的区域。每一条扫描线在扫描时,记录亮度跳变频繁的线段。行扫描完毕后再将记录的相邻的线段融合成矩形,得到若干个出现亮度跳变的矩形区域。将这些矩形区域作为车牌的候选区域。
1.2颜色聚类
通过跳变点信息快速确定候选区域后,对候选区域的颜色信息进行聚类。
关键词:车牌定位;聚类;快速检测;特征扫描
中图分类号:TP391.41文献标志码:A文章编号:
Afastlicenseplatelocationmethodbased onclustering
Hou Shu-ting, Xu pin
(The Communication University of ChinaSchool ofInformation EngineeringBeijing100024)
3基于特征扫描的精确定位
通过粗定位过程,大部分背景区域被过滤。但是得到的结果还不是精确的车牌区域,还有一些极小的偏差。接下来利用车牌的结构信息来进行精确定位。流程图如图3所示:
图3精确定位流程图
首先对图像进行预处理。预处理主要执行的是灰度化、图形缩放、标准化的工作。这一步是为减少后续计算的运算量。
2.1边框检测
图5原图
图6实验过程图
试验中,当定位到的车牌区域占整个车牌区域的比例大于60%时,可以对该车牌图像进行二次定位,从而得到完整的车牌区域。经过实验发现,本文算法的平均定位时间小于63ms,定位准确率在93%以上,可以有效的去除铆钉边框对车牌定位结果的影响。为了验证文中算法的定位准确率实时性,同时采用文献10的算法和文献11的方法在相似的实验环境下进行对比实验,实验结果如表1所示。由表1可见,本文方法的定位准确率高于文献11的方法,低于文献10的方法,位于两种方法之间,能够满足准确率的要求,平均定位时间是63ms,远远低于文献10的1058ms和文献11的250ms。
1.1跳变点聚类
利用行扫描线对整幅灰度图像进行扫描并记录亮度跳变点。通常而言,车牌区域不太可能会刚好贴近整幅图像的边缘。一般的车牌识别系统在采集图像时,也会尽量确保车牌区域在图像的中间位置。所以扫描图像时,为了减少耗时,行扫描线的上下边界分别距离图像的上下边界有一定的偏移。行扫描线在图像上纵向移动时,也有一定的间隔。该间隔不能太大,否则扫描线太稀疏,无法找出有效的候选区域。行扫描示意图如图2所示。
与车牌粗定位时的全图粗扫描类似,特征扫描也是用若干条扫描线检测车牌字符区域亮度的跳变,但这次可以只用少数几条靠近粗定位结果的矩形区域中部的扫描线。根据亮度跳变的次数,判断这一区域是否是字符区域。一般来说,只要每条扫描线中心点左右两边的亮度跳变次数都在5次以上,即可认为扫描线扫过了若干个字符。
2.3车牌边界确定
3)根据车牌颜色的先验知识,排除颜色信息不符合的候选区域。
1.3矩形框选取
经过颜色聚类之后,可能还会存在不止一个候选区域。此时可根据车牌的先验知识进行选取,排除干扰。例如,车牌矩形区域宽高比在一定范围内是固定的,车牌的大小变化也有一定的范围。然后按照一些既定的策略来进行选取。比如,优先选择图像中位于中下部的矩形区域,优先选择蓝底白字、黄底黑字的车牌(这两种颜色的车牌最为普遍)。根据这样的策略,选择一个最合适的区域作为车牌区域。
基于聚类的车牌定位的快速方法
侯书婷,徐品
(中国传媒大学 信息工程学院 北京 100024)
摘要:车牌定位是车牌自动识别技术中的一个关键问题,经过多年的发展,已经开发出了多种车牌定位的算法。然而目前的定位方法,大都存在定位时间过长,对于复杂背景下的车牌图像定位率较低的问题。本文提出了一种基于聚类的快速车牌定位方法,首先对跳变点和颜色信息进行聚类,得到车牌的候选区域后再进行细定位找到车牌区域。实验证明,该方法对于复杂背景下的车牌图像定位效果良好,并且大大缩短了定位时间。
(1)
1)我国车牌的颜色信息只有四种:蓝底白字,黑底白字,白底黑字和黄底黑字。通过对不同颜色的车牌进行数学上的统计,可以得到其亮度、色度以及饱和的初始中心值。根据初始中心值对每个车牌候选区域进行聚类。在HSV空间中,颜色分量相应的欧几里得距离与人眼感知的颜色差吻合的较好。将HSV颜色空间中的两种颜色Color1={h1,s1,v1},Color2={h2,s2,v2}之间的距离定义为:
目前车牌定位的方法多种多样,归纳起来主要有基于数学形态学的方法、基于小波分析的方法、基于边缘信息的方法以及基于彩色图像的方法等。基于数学形态学的方法经常与其他方法结合使用。例如,将形态学和投影的方法相结合【1】,将形态学和轮廓提取的方法相结合【2】【3】等等。该算法计算量小,定位速度比较快,但是只对于简单背景下的车牌图像处理效果比较好。基于小波分析的方法,是先利用小波变换对车牌图像进行边缘提取和去噪,再结合跳变点、纹理特征等信息定位出车牌区域【4】【5】。该算法能够有效的去除光照、阴雨等复杂背景对于车牌图像的影响,但是小波变换计算复杂,耗费时间,不适用于对实时性要求较高的系统。基于彩色图像的方法能够充分利用车牌的底色信息,然而在车身与车牌颜色接近的情况下,可能会出现伪车牌【4】。Abolghasemi等人提出了一种利用边缘和颜色信息定位车牌的方法【6-7】,但该方法对光照比较敏感,也不适合实时应用。本文结合上面几种车牌定位的方法,提出了一种基于聚类的快速车牌定位方法。
d(Color1,Color2)=|(v1-v2)2+(s1·cosh1-s2·cosh2)2+(s1·sinh1-s2·sinh2)2|1/2.
则两色彩之间的相似度为:Similarity(Color1,Color2)=1-
2)统计每一个候选区域内各种颜色出现的次数。出现次数最多的两种颜色,分别判定为车牌底色和字符颜色。
相对于RGB颜色空间来说,HSV颜色空间用色调(Hue)、饱和度(Saturation)和亮度(Value)三元素来描述色彩,更符合人眼的视觉状态,而且这三个元素在HSV三维空间坐标系中各坐标之间具有相对独立性,可以独立地感知各颜色分量的变化。因此本文先在RGB颜色空间上进行处理,再由RGB颜色空间转换到HSV颜色空间【9】,设RGB颜色模型中红、绿、蓝3分量分别为R、G、B;HSV颜色模型中色度、饱和度、亮度分别为H、S、V,则RGB颜色空间到HSV颜色空间的转换如公式(1)所示。
(3)
而边框检测失败时,则尝试在水平方向上检测直线,用最小二乘法计算直线斜率,进行初步的水平倾斜校正。
2.2基于长度聚类的特征扫描
在车牌定位的时候,一些具有和车牌类似结构的非车牌区域会被误检为车牌。为了进一步排除干扰,减少误检率,首先利用sobel变换对车牌的字符特征进行增强。然后对车牌图像进行特征扫描。
对特征扫描之后的结果进行聚类,投影到水平线上,如图4所示:
图4车牌字符投影
由投影图可见,经过投影之后,字符区域表现为明显的峰值。每一个峰值代表一个字符。垂直边框、铆钉等会对投影结果产生一定的影响,但是经过精确定位的边框检测之后,这一影响被降低到最小。同时,边框的宽度远远小于字符的宽度,所以根据投影宽度也可以排除干扰。