基于聚类分析的车牌字符分割方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图!
字符分割示例
目前常采用的方法是水平投影法 .5/: 即沿水平方向, 计算每 一列属于车牌字符的象素数目。这样, 字符块在水平方向的投 影会在字符的间隙处取得局部最小值, 因此字符的正确分割位 置应该在上述局部最小值附近。 由于第 ! , 5 个字符间的间隔最 大, 一般是找出第 ! 个字符的终止位 置 , 再 依 次 找 出 !, %, 5, 6, 7, $, 0 的起始位置。 但是在实际处理中, 由于摄像机的性能、 车牌的整洁程度、
! 9= ,"9=:$ , ?= , ( $ $ , "
…, @= 9$", = 9$";(, = 9$";$A。
9 "(
$ , "
=:$
! !) , ( …, , <9 = 6( , !, 8 ’$ ) =
第 三 步 : 找 到 ?= 的 最 小 值 ?=9$", 则 对 应 的 & 个 字 符 类 为 ( 8 )如果某类的长宽度大于其余 $ 个类超过设定的阈值 则一般是铆钉连接或噪音的缘故, 此时应按其余类的高宽 @, 黑色矩形区为最后字符切 平均值修正。结果见图 % 的第四列, 分的结果。 对聚类后的矩形区用双线性变换成 ($C%! 大小的二值 ( B) 图像作为神经网络的输入。
字符分割
字符分割是指将车牌区域分割成单个的字符 区 域 , 如图 !
中包含字符的矩形黑框所示, 图 ! 中的碎细线段为残余的车牌 边框。需要强调的是, 为了准确识别车牌上的汉字、 英文和数
图% 汽车牌照字符识别系统框图
字, 每个字符区域必须是包括单个字符的最小矩形区。切分越 尽管不 准确, 则 后 面 识 别 效 果 越 好 。 如 果 偏 移 了 %9! 行 象 素 , 大, 但是由于车牌图象中字符很小, 一 般 宽 和 高 约 %" 到 !" 多 个象素, 这样对字符识别, 尤其是汉字识别造成很大的困难。
> >
!#%
切割方法
从图 ! 中可看到, 在理想情况下, 对 于 车 牌 的 第 !’& 个 字
符, 每个字符的象素( 此时为黑色) 构成了一个独立的连通域。 于是只要得到每个连通域的行列的起始和终止位置, 并由此构 成一个矩形区, 就得到了包含字符的最小矩形区, 定义这样的 矩形区为一个类。而对第一个字符,由于汉字的不连通性, 如 “ 沪” , 聚类分析时往往为多个连通区域。假设得到了“ 户” 和三 个点共四个连通域, 但通过简单比较类“ 户” 的宽度与后 $ 个已 知类( 字符) 的宽度, 就知道需要对第一个字符重新聚类。这样 根据后 $ 个已知的字符的长度和宽度等先验知识, 完全可以简 单方便地得到第一个字符的起始和终止位置。 同样对于字符粘 连, 铆钉干扰也可通过聚类分析加以解决。 设车牌二值化后, 背景象素为白色, 用 " 表示, 而字符象素 图象宽度为 )*+,-. , 高度为 )/0+1.-; 类为包 为黑色, 用 ( 表示; 含单独连通域的最小矩形区。 具体聚类分析方法如下: ( 对车牌图象采用差分直方图法 2(3二值化( 二维熵阈值分 () 割快速法 243253效果好, 但速度慢) , 如图 % 的第二列。 ( 以 ! (6"# $%&’ 7 8 为 阈 值 对 车 牌 图 象 按 行 进 行 扫 描 , 如 !) 果有线段的长度大于 ! ( 就可认为是牌照的上下边框;以 ! !6 ( "()$*’&9% ) 7 4 为阈值对车牌图象按列进行扫描,如果有线段 的长度大于 ! ! 则认为是牌照的左右边框。因此可除掉牌照边 框部分, 如图 % 的第三列。 ( 对处理后的图象从上到下按行逐象素扫描快速聚类 2$3, %) 如 两 象 素 间 距 离 %+,%-./"0& , 就可认为两象素属于一类, 即属 于同一个字符。其中 % 取两象素 1 ( , 间的街区 2( , 3( ) 4( 2! , 3! ) 距离。
! 车牌字符分割 !#% 车牌的特点
我国现行的牌照主要有四种类型: 蓝底白字, 黄底黑字, 白 底黑字或红字, 黑底白字。 车牌共有 0 个字符和 % 个点符号。 一 般第一个 字 符 是 汉 字 , 且是各省市的简称, 如“ 湘” 、 “ 鄂” 、 “ 沪”
基金项目: 武汉市重点科技攻关计划项目资助( 编号: !"""%"%""86 )
目前的车牌定位有许多方法,如基于彩色信息的定位方 法, 但该方法计算量大、 速度慢。 所以文中采用逐行水平线扫描 的方法: 首先对原始图象 进 行 中 值 滤 波 预 处 理 并 用 )*+,- 算 子 提取 边 缘 .%/.!/, 为避免汽车上的广告和标语等的干扰, 采用从图 像底部开始的自左往右逐象素扫描搜寻算法。 由于车牌字符与 背景的灰度值不同, 当水平线横穿牌照时, 其灰度值变化大于 设定阈值且有规律。根据变化的频率及几何特征, 就可确定车 牌的位置。
作者简介: 陈黎, 男, 现为华中科技大学控制科学与工程系硕士研究生。研究方向: 图象处理模式识别。黄心汉, 男, 现任华中科技大学控制科学与 工程系教授、 博士生导师、 智能与控制工程研究所所长, 兼任中国自动化学会机器人专业委员会委员和中国人工智能 学 会 智 能 机 器 人 学会副理事长。研究方向: 智能机器人, 机器人视觉。
和左右边框的残余( 在图象中表现为很细的线段, 由于“ 存在 (” 的可能性, 此时不能简单地依据类的宽度信息而区分开) 。 如果找到的类的数目少于 & 个或某类的宽度大于其余 ( 5) 类的宽度超过一定的阈值, 则应为字符粘连问题。于是分析由 第 4 步得到的类的宽度信息,找出宽度最大的类进行分裂处 理。分裂方法可采用前面的水平投影法, 在类的中间 !’% 个象 直到满足条件。 素范围内寻找局部极小点。重复步骤 5 , ( 按各类的列起始位置从左到右排序。 $) 如果类数目等于 & 个, 转到步骤 8 。否 则 , 分析一下排 ( &) 序后最坏的情况: …, 从左到右依次为: 左 设 得 到 的 聚 类 为 @7(, 7!, 78 ’(, 78A, 边框残余线段 或 噪 声 7(’79, 右边框残余 & 个 字 符 类 79:(’79;&, 每 线段或噪声 79;8’7;。设每个类的水平方向的中心位置为 . $; 个类中心与后一个类中心之间的距离为 9$,. $:(’. $。 对于 & 个字符类, 字符之间的距离是有规律 的 。 只 有 第 ! 个与第 % 字符之间的距离为 &B 毫米, 其余为 5& 毫米。这样设 对 于 9!, 应 取 @9(, 9!, 9%, 94, 95, 9$A 为 相 邻 字 符 间 的 距 离 ( , 在理想情况下, 对应的方差也 5&99! 7 &B ) 9(69!69%69469569$, 应为最小。 现在就把问题转化为已知 ; ’( 个数 9$,求出 $ 个 连 续 的 数, 使其方差最小。 第一步: 计算每个类中心与后一个类中心之间的距离: 9$, ( …, . $:(<. $, $6( , !, ; ’( ) …, 第二步: 从集合 @9(, 9!, 9%, 98’!, 98’(A中依次取出 $ 个数 @9= , 9=:(, 9=;!, 9=;%, 9=;4, 9=:5A,注意对第二个数要令 9=;(69=;(95& 7 计算 &B ,
( 已经越来越受到人们的重视。汽车牌照的自动识别技术 &’() 在公共安全及交通管理方面有着重要的应用价值, 对实现国民 交通事业现代化有着重大意义。 在公路交通中的车牌自动识别 系统中,从汽车图像的获取到车牌字符处理是一个复杂的过 程, 文中设计的车牌字符识别系统分成四大部分, 如图 % 所示。
!#!
%( 1, 4) ,52(’2!:;:3(’3!:
考虑到车牌的第一个字符一般为汉字,故对 %-./"0& 采用 浮动变化的方法。即对车牌图象前 "# $%&’ 6 & 部分用 %-./"0&,! 或 % 聚类,这样能基本解决汉字的不连通问题;对图象后 ( 取 ,<=>)?-6( 。 此时可能出现两个字符连接 "# $%&’9$ ) 7 & 部分, 或字符与铆钉连接等问题, 将在后面的聚类分析中解决。 ( 比 较 聚 类 后 的 各 类 的 高 度 。 对 高 度 小 于 "()$*’& 7 ! 的 4) 类, 可认为是噪声, 因此可去掉。 一般情况剩下的类为 & 个字符
基于聚类分析的车牌字符分割方法
陈 黎 黄心汉 王 敏 李 炜 ( 华中科技大学控制科学与工程系, 武汉 65""06 )
:9;<=-: >?@-A!$5#B,C
摘 要 文章提出了一种基于聚类分析分割车牌字符的方法。 即按照属于同一个字符的象素构成一个连通域的原则, 再
结合牌照的先验知识, 较好解决了汽车牌照在复杂背景条件下的字符切分问题。 关键词 聚类分析 字符分割 图像处理 文献标识码 1 中图分类号 E’58%#6
;<$%’*0%: E?=P G<G,H GH,P,BCP < 3-OPC,H92<P,J ;,C?*J C* P,K;,BC C?, @?<H<@C,HP *I -=@,BP, G-<C,#QC I*--*>P < GH=B@=G-, C?<C C?, G=R,-P >?=@? +,-*BK C* < @?<H<@C,H I*H; < @*BB,@C=S, H,K=*B, C?,B @*;+=B,P >=C? ,;G=H=@<- TB*>-,JK, *I -=@,BP, G-<C,, PO@@,PPIO--U P*-S,P C?, GH*+-,; *I C?, @?<H<@C,HPV P,K;,BC<C=*B OBJ,H @*;G-,R +<@TKH*OBJ @*BJ=C=*BP# =&>?.’+$: @-OPC,H=BK <B<-UP=P, @?<H<@C,H P,K;,BC<C=*B , =;<K, GH*@,PP=BK
计算机工程与应用 !""!#$
!!%
光照条件等因素的影响使牌照中的字符可能出现较严重的模 糊、 缺损或污迹干扰, 如图 % 第一行。同时, 经过车牌定位而分 割出的牌照区域并非完全是精确到牌照上的字符区域, 一般是 含有牌照四条边框的残缺图象和牌照上两个铆钉干扰的区域, 如图 % 第二, 三行。 有时更由于定位时的不准确, 定位的车牌的 长度过长, 多了一段不属于车牌的区域, 如图 % 第四行。对于 “ 沪” , “ 湘” 等汉字, 由于汉字部首与字并不相连, 水平投影时也 这 存在局部最小值, 往往把部首当作背景切掉, 如图 % 第五行。 些因素都可能导致水平投影法字符切割的不准确,甚至失败。 最后由于有些车牌字符的不规范, 如有的白牌黑底车牌字符多 使水平投影法无法使用。 于 & 个, 因此,文中提出了一种基于聚类分析切分车牌字符的方 法, 按照属于同一个字符的象素构成一个连通域的原则, 再结 合牌照字符的固定高度、间距的固定比例关系等先验知识, 较 好地解决了汽车牌照在复杂背景条件下的字符切分问题, 降低 了对车牌定位准确度的要求。同时如稍加改动, 也适用于字符 不为 & 个的不规范车牌。
文章编号 %""!9D55%9( !""! ) "$9"!!%9"!
!"#$%&’()*$&+ ,&%-.+ ./ !-*’*0%&’$’1&23&4%*%5.4 ./ 650&4$& 7"*%&
!-&4 65 8#*42 954-*4 :*42 ,54 65 :&5 ( F,G<HC;,BC *I 3*BCH*- )@=,B@, <BJ :BK=B,,H=BK , LM)E, NO?<B 65""06)
%Hale Waihona Puke Baidu
引言
近年来,随着交通现代化发展的要求,汽车牌照识别
等; 第二个字符是大写英文字母, 如“ 、 “ 、 “ 等; 接着是一 1” 2” 3” 个点“ ・” ; 第三个字符可能是英文字母, 也可能是阿拉伯数字; 第四至第七个字符均为阿拉伯数字, 如“ 鄂1 ・ 4 % ! 5 6” 。 车 宽度为 %7 厘米。其中单个字符统一宽度 牌的长度为 67 厘米, 为 67 毫米, 高 8" 毫米, 第二、 三个字符间隔为 56 毫米, 其余字 符间隔为 %! 毫米。