一种分块自适应文字图像边缘检测新方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种分块自适应文字图像边缘检测新方法
作者:宋建民张玉平陈敏江
来源:《科技创新与应用》2014年第17期
摘要:传统Canny算法通过比较图像梯度值与人为给定阈值,进行图像边缘提取,无法自适应确定阈值。

一些基于改进的最大类间差算法(Otsu算法),通过计算梯度直方图和类间方差极大值的,自动寻找出Canny算法需要的分割阈值实现对传统Canny算法的改进,对于文字图像边缘提取效果并不好。

本文利用梯度直方图峰值搜索的方法设定Canny算法的上阈值,通过对图像分块计算,自适应处理亮度不均的文字图像。

关键词:边缘提取;自适应阈值分割;Canny算子;峰值搜索
引言
当前,数码相机,智能手机等设备普及式的应用方便了随时随地的采集图像,基于图像的即时处理技术得到了广泛的应用,如车牌识别,指纹识别,光学字符识别(OCR),图书扫描等。

边缘检测是图像分割、机器视觉的基础,从图像中提取目标物体,准确高效的边缘提取算法对非常重要。

传统的边缘检测算子,Sobel,Prewitt,Robbert等[1-2]在实用中检测图像边缘时效果并不理想,Canny算子具有较好的检测性能,在图像处理领域有广泛的应用。

然而,传统的Canny 算法阈值是人为固定的,这就限制了它的性能。

在实际使用中,图像的采集受光线,传感器性能等因素影响,含有较多的噪声,一张图片出现亮度不均的情形,这时难以确定一个的固定阈值。

针对Canny算法阈值固定的问题,雒涛、唐路路等[3]提出用Otsu算法自适应计算Canny 算法的阈值[4-5]。

在OCR应用中,文字分割提取是重要的一环。

对于很规则的文本图像,有成熟文字分割提取方法,对于亮度不均的文字图像,Derek B等创造了很好的自适应阈值的方法,用于提取扫描图书中的文字。

对于文字大小不规则,亮度不均的图案,需要用更有效的方法提取字符。

本文针对复杂的文字图像,利用边缘检测,并结合自适应阈值处理的方法提取文字边缘。

1 Canny算法简介
Canny边缘检测算法的步骤为:
1.1用高斯函数对图像进行低通滤波,平滑,I(x,y)=G(x,y)*f(x,y),其中f (x,y)是原始图像,G(x,y)是二维高斯函数:
1.2 计算平滑图像个点的梯度:
利用偏导数计算梯度幅值及角度:
1.3 对梯度幅度进行非极大值抑制,保留极大值点作为候选边缘点。

具体方法是比较当前点与沿梯度方向两侧两个相邻点的梯度幅度,若不是最大,则作为非极大值抑制掉。

1.4 边缘判别与边缘连接。

设置高低两个全局阈值,对于梯度值大于高阈值的作为边缘点保留,梯度值小于低阈值的作为非边缘点删除。

对于梯度值介于高低阈值之间的点,判断其八邻域中有没有超过高阈值的边缘点,有则判定为边缘点,否则判定为非边缘点。

2 类Otsu改进算法简介
Otsu方法是利用类间方差最大化的方法确定图像分割的阈值[6]。

它的思想是统计背景图像和目标物体的灰度值,通过判定背景与目标这两个类间方差最大值得到分类阈值。

图像总像素数,灰度级为[0,L-1],灰度级i出现的概率为,pi=ni/N,设分割阈值为T,划分背景与目标两个类,分别对应灰度区间[0,T]及[T+1,L-1],在灰度直方图中显示为两个峰,其均值为?滋0,?滋1,出
现概率为,,图像总的灰度均值为
?滋T,类间方差为,
计算方差?滓■■的最大值,求得分类阈值。

文献[4],[5]提出的改进方法,将灰度值替换成图像的灰度梯度值,得到梯度值的统计分布,类似Otsu方法,通过计算灰度梯度值的类间方差最大值得到。

3 梯度图分块提取阈值
对于文字图像的边缘提取来说,整个图像的边缘像素点的比例很小,往往小于5%。

这时利用梯度值集中在0附近,利用Otsu类间方差计算分割阈值都接近于0,分割效果不好。

图1是本文所用图例,图2是其梯度直方图。

图1 待处理的文字图像
本文对梯度图像的直方图进行峰值搜索。

经过平滑的梯度直方图,第一峰值点(梯度值P1)对应于背景梯度值,在0附近。

其它值点对应于文字边缘梯度。

如图3所示,局部峰值对应于文字边缘。

本文通过峰值搜索,找到第二峰值点(梯度值P2)。

利用P1,P2计算Canny边缘提取的上阈值(TH),我们取TH=0.7*P2+0.3*P1。

对于图像亮度分布不均匀的情形,一个全局阈值并不能反应图像局部的统计特征,基于开运算闭运算进行对比增强效果并不理想。

对图像的同态滤波计算量过大,不利于实时处理。

因此,我们利用对图像分块处理的方法,利用上述方法分块计算图像的分割阈值。

对本例图像,等比例分成3×3共9块,分别对每块进行梯度直方图峰值搜索,自适应计算Canny边缘的上阈值,处理结果见图4。

4 结束语
我们对比了上述几个方法的对图例1的处理结果。

图5是直接利用Canny边缘提取方法得到的图像,图6是利用梯度峰值搜索,对梯度图像进行全局计算得到Canny方法的上阈值,提取得到的边缘图像。

比较上述各方法,尽管梯度图分块提取阈值得到的图像边缘不如直接进行Canny边缘提取得到的文字图像清晰,但利用Canny算法直接进行边缘提取包含光照不均产生的噪音,若对整个梯度图像计算Canny阈值容易丢失文字图像信息。

利用梯度直方图峰值搜索的方法设定Canny算法的上阈值,通过对图像分块计算,可自适应应处理亮度不均的文字图像。

后续研究将改进梯度图分块提取阈值算法以提高其清晰度,使之成为最为实用的方法之一。

参考文献
[1]冈萨雷斯.数字图像处理:二版[M].北京:电子工业出版社,2007:463-492.
[2]John Canny. A Computional Approach to Edge Detection [J]. IEEE Trans. Pattern Analysis and Machine Intelligence(S0162-8828),1986,8(6):679-698.
[3]OTUSU N. A threshold selection method from gray-level histogram[J].IEEE Transactions on Systems,Man and Cybernetics,1979,9(1):62-66.
[4]雒涛,郑喜凤,丁铁夫.改进的自适应阈值Canny边缘检测[J].光电工程,2009,36(11):106-111,117.
[5]唐路路,张启灿,胡松.一种自适应阈值的Canny边缘检测算法 [J].光电工程,2011,38(5):127-132.
[6]冈萨雷斯.数字图像处理:matlab版[M].北京:电子工业出版社,2005:305-307.
[7]Derek B,Gerhard R. Adaptive Thresholding using the Integral Image[J].Journal of Graphics,GPU,and Game Tools,2007,12(2):13-21.
作者简介:宋建民(1976-),男,河北曲周人,讲师,硕士,主要研究方向为算法设计与分析、图像处理。

相关文档
最新文档