字符分割
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在车牌自动识别系统中最重要的指标是字符的识别率,对字符识别的准确率直接影响了系统的性能。字符识别部分由车牌图像的二值化、滤波、字符分割、字符大小规一化、汉字、字母和数字识别等模块组成。这一周我主要学习了字符分割模块的有关内容。
车牌字符分割的任务就是把多行或多字符图像中的每个字符从整个图像中分割出来,使其成为单个字符图像,为下一步将标准的单个字符输入到字符识别模块做准备。字符分割是字符识别的基础,字符分割的质量直接影响到字符识别的效果。字符分割之前,首先要进行图像的二值化,然后再进行字符分割,从而分割出一个个具体的二值图表示的字符图像点阵,作为单字识别的输入数据。由于文本图像不但包括了组成文本的一个个字符,而且包含了字符行间距与字符间的空白,甚至还会带有各种标点符号,这就需要采用一定的处理技术将文本中的一个个字符切分出来,形成单个字符的点阵,以便进行字符识别。车牌字符分割的原理主要是利用车牌字符自身的一些特点如规则整齐的排列、字符之间有一定的间隔、字符的宽高比例固定等等,对车牌区域进行垂直方向的投影,利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隙将单个汉字的图像切割开来。
4.2投影分割
投影分割方法的原理是首先将车牌图像转换为二值图像(设白色为1,黑色为0),然后将车牌像素灰度值按垂直方向累加,即所谓的垂直投影。由于车牌中字符之间的灰度值通常为O,因此,投影图将会在字符之间形成谷底,或者说在字符处形成波峰(一种特殊的波峰)。通过寻找两个波峰之间的谷点,将其作为字符分割的位置,完成字符的分割。投影分割法的具体步骤如下:
(1)先自下而上对图像进逐行扫描直至遇到第一个白色象素点。记录下来,然后再由上而下对图像进行逐行扫描直到找到第一个白色象素点,这样,就找到图像大致的高度范围。(2)在这个高度范围之内再自左向右逐行扫描,遇到第一个白色象素时认为是字符分割的起始位置,然后继续扫描,直至遇到没有白色象素的列,则认为是这个字符分割结束。然后继续按照上述的方法扫描,直至图像的最右端,就得到每个字符比较精确的宽度范围。(3)在已知的每个字符比较精确的宽度范围内,按照(1)的方法,分别进行自上而下和自下而上的逐行扫描来获得每个字符精确的高度范围。投影分割的方法比较常用,主要是针对在车牌定位、图像预处理后比较规则的车牌图像。它的优点是程序逻辑设计简单,循环执行功能单一,便于设计和操作,程序执行时间短。缺点是由于车牌图像通常会有噪声,产生字符的断裂和交叠等情况,在投影时字符之间的谷底会受到很大影响,造成谷底不明显,严重时谷底会消失,造成字符分割误差甚至错误,最终影响字符的识别。因此该方法对车牌字符的断裂和交叠问题,解决得不很理想。
4.3基于聚类分析的字符分割
基于聚类分析的字符分割原理是按照属于同一个字符的像素构成一个连通域的原则,再结合牌照字符的高度、间距的固定比例关系等先验知识,来分割车牌图像中的字符。其具体算法步骤为:
(1) 以等于车牌图像宽度七分之一的阈值‘对车牌图像按行进行逐行扫描,如果有线段的长度大于‘就可以认为是牌照的上下边框,再以等于车牌图像高度五分之三的阈值Z:对车牌图像按列进行逐列扫描,如果有线段的长度大于厶,则认为是车牌的左右边框。因此可除去车牌边框部分。
(2)根据车牌字符的先验知识,在预处理好的车牌图像上预设7个类中心。设置类中心可以采用程序提示给定坐标值的方法,也可以采用给予固定坐标值的方法。
(3)自下向上对图像进行逐行扫描,每扫描到一个白色象素时,都要与上述每个类已获得的每个(白色)象素比较距离d,找到与该象素距离最近的已获得象素点,并认为这两个象素属于同一类,即属于同一字符。距离d取两个象素点:彳(x,Y)扫描得到的当前象素,曰O,),)
已聚类好的象素,D(A,B)一(石一而)2+(Y—Yi)2。
(4)经过反复扫描、比较后,得到聚类后的7个类,然后比较类中x,Y的最大值和最小值,并把它们设为该类边框的顶点坐标,假设出现同一类的x的最大值和最小值大于两倍字符中值宽度(这种情况极少出现),就逐一将次大值和次小值作为其左右边界,再比较直至每个类的宽度适中。基于聚类分析的字符分割方法优点是是利用模式识别中聚类分析算法来实现车牌字符分割的,其优点:较好地解决了汉字不连通的问题,较好地解决了车牌字符分割中存在的噪声干扰、车牌磨损造成字符粘连等问题,以及通过改变预设类中心的坐标,可以较好地处理一些新式车牌。但该方法程序逻辑设计复杂,循环嵌套较多,执行时间较长。同时为提高预设类中心的精度,对车牌的宽度有一定限制
4.4基于模板匹配的字符分割
基于模板匹配的字符分割方法是另外一种形式的水平投影法,只是比水平投影法设计的程序更加周密,边界划分得更加精确。在二值图上计算竖直积分投影的平滑曲线p(x),搜索平滑曲线pO)的局部最小(波谷)值得到一个波谷位置序YO{o,1,⋯,然后,将相邻两个波谷f和f+1分别作为左右边界提取出一组矩形区‘,并根据下列规则对矩形序列‘进行删除、分裂、合并和调整大小,其具体步骤如下:
(1)若相邻波谷i和f+1间的波峰较小时将‘删除。主要是相对于字符间的噪声设置的。
(2)若相邻波谷i和i+1间的波峰较大时,即使f和f+1间的距离不够单字符宽度(根据车牌字符的先验知识),因为车牌中有“1"存在,也不能将其合并,需要设置标记。
(3)若相邻矩形,;一,和‘的宽度较小且合并后宽度接近矩形序列的中值,将‘一。和‘合并,便于解决某些汉字的不连通问题。
(4)若矩形c的宽度接近两倍中值宽度且前后相邻矩形的宽度接近中值宽度,将,;等分成两份,以解决车牌字符中的粘连问题。
(5)相邻矩形,;一。和,;的宽度相差较大且合并后宽度接近两倍中值宽度时,调整,;一。的右边界和_,;的左边界,使其尽量接近字符的真实边界。车牌图像中字符与字符之间有一定的近似空白的距离,以精确定位矩形框的左右边界。
基于模板匹配的字符分割程序执行时间与水平投影方法相近,较好地解决了汉字不连通问题、车牌字符分割中存在的如复杂背景的干扰、车牌尺寸的变化、车牌磨损造成字符粘连等难题。其缺点是程序逻辑设计复杂,循环扫描执行功能较多,对车牌中的左右边框的分割有待改进,对一些特殊车牌如上下两行字符的车牌,本算法并不适用。