基于二维小波变换的图像二值化方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于二维小波变换的图像二值化方法
林玉容; 陈美龙
【期刊名称】《《武夷学院学报》》
【年(卷),期】2019(038)009
【总页数】4页(P58-61)
【关键词】文字图像; 二维小波变换; 二值化
【作者】林玉容; 陈美龙
【作者单位】闽南科技学院计算机信息学院福建泉州 362332
【正文语种】中文
【中图分类】TP391
数码相机与智能手机的不断推广产生大量的数字图像,蕴含着丰富的信息。
数字图像中的文字识别、特征提取、人工智能模式识别等都需要对图像进行分析。
二值化是进行图像分析前必要的预处理操作[1-2],其性能的优劣直接影响图像分析的结果。
二值化的方法很多,基于直方图的二值化算法是其中一类重要的方法。
根据阈值选取办法,基于直方图的二值化算法分为灰度平均值、百分比阈值、基于谷底最小值阈值、迭代最佳阈值等几十种方法。
这类方法具有容易实现、执行速度快等特点,因此应用广泛,但效果不稳定,特别是对复杂背景的数字图像二值化效果不佳。
小波变换具有多分辨率分析的特点,能够有效去除图像中的噪声,提取图像的局部特征,因此在直方图二值化算法的基础上,提出一种基于二维小波变换的图像二值
化方法,研究该方法在包含文字信息的数字图像中的二值化处理情况。
1 基于二维小波变换的二值化处理
利用小波变换良好的去噪性,对原图像经过多级小波变换,代表原图像信息的小波系数的绝对值较大,而代表图像噪声信号的小波系数的绝对值相对较小。
然后进行小波滤波,将绝对值小于阈值的小波系数过滤,从而达到去噪的效果[3-4]。
研究的基于二维小波变换的二值化处理方法具体步骤如下所述。
1.1 转化为灰度图像
对一幅宽W,高H的彩色图像,按照灰度化转换公式(1)进行灰度化处理,得到灰度图像GRAY。
其中,x∈[1,W],y∈[1,H]。
R(·)、G(·)和B(·)分别表示像素点的红色分量、绿色分量和蓝色分量。
1.2 去噪
对包含文字图像的去噪处理包括小波分解、小波滤波、重构和图像插值等,将图像中的前景文字作为噪声去除,从而得到不包含文字信息图像的近似背景分布。
1.2.1 小波分解
在图像分析中,小波变换即将图像进行多分辨率分解。
先对灰度图像做1层小波分解,在1层小波分解的基础上再作2层小波分解,以此类推执行L次,得到第L 层近似系数AL和三个方向的细节系数,分别是水平细节系数垂直细节系数和对角细节系数,其过程如图1所示。
图1 多级二维小波分解与重构示意图Fig.1 Diagram of multistage two-dimensional wavelet decomposition and reconstruction
对图像进行L层小波分解,得到3L+1个子带,其中包括1个低频基带AL(最高层分解的近似系数)和3L个高频子带(每一层分解的细节系数)(1≤j≤L)。
1.2.2 小波滤波
小波分解后进行低通滤波,平滑数字图像中的文字部分,即将小波分解结果中大于阈值Tn的细节系数置为0,保留小于Tn的部分。
在阈值选取时,依照的是由DoNoho提出的visuthrink方法[5],如公式(2)所示。
其中,σn=c/0.671 5,c为小波细节系数绝对值的中值。
N=3×HL×WL,HL和WL分别是L级小波分解后得到的系数矩阵的行数和列数。
1.2.3 小波重构和图像插值
对高层小波进行1次重构(如图1所示),得到文字被过滤掉的图像缩略图。
由小波重构得到的背景分布缩略图比原图像小很多,所以要使用图像插值的方法将图像放大到原图大小。
比较了多种插值算法,包括最近邻插值、双线性插值和双三次插值法,提出的方法采用了在细节保持方面表现较好的双三次插值[6]。
1.2.4 前景分布
将灰度图像和背景分布作差得到图像的前景分布(包含文字信息)近似图。
有些像素点在过滤噪声时值变大,这是因为小波滤波的过程是对图像做平滑处理,在作差运算后可能出现负值,对于这种情况将该像素点的值置为0。
1.3 计算阈值和二值化处理
通过传统的基于直方图的灰度平均值、迭代最佳阈值和Otsu算法计算全局阈值,并将全局阈值与背景分布相叠加,形成局部阈值。
根据得到的全局阈值和局部阈值进行二值化处理,确定图像中每一个像素点的像素值,最终得到二值化图像。
2 实验对比和分析
实验采用Matlab 2014a对图像进行处理,分别通过灰度平均值、迭代最佳阈值和Otsu算法来计算全局阈值,比较提出方法和传统算法的二值化效果,同时对全局阈值和局部阈值的图像二值化结果进行对比。
然后,将提出方法和常用的局部阈
值二值化算法(Niblack算法和Benrsen算法)进行比较和分析。
实验处理的图像包括手机照片、数码相机拍摄的照片和网络上下载的图片。
2.1 灰度平均值
灰度平均值算法简单,但是性能较差。
对手机(1 200万像素)拍摄的一幅字帖进行1级小波变换,处理结果如图2所示。
灰度平均值算法得到的全局阈值并不能很好地分离前景和背景分布,采用二维小波变换后,效果明显提升,且局部阈值的二值化效果优于全局阈值,这是由于局部阈值更能反映局部特征。
图2 基于二维小波变换和灰度平均值算法的二值化图像Fig.2 Two-valued image based on two-dimensional wavelet transform and grayscale mean algorithm
2.2 迭代最佳阈值
采用迭代最佳阈值算法对网络下载的一幅图像计算全局阈值并进行基于2级变换的二值化操作,结果如图3所示。
未采用小波变换的迭代最佳阈值算法处理后仍存在严重的背景噪声,基于二维小波变换的二值化方法对文字的提取性能明显优于未采用小波变换的情况,局部阈值的效果更优。
图3 基于二维小波变换和迭代最佳阈值算法的二值化图像Fig.3 Two-valued image based on two-dimensional wavelet transform and iterative optimal threshold algorithm
2.3 Otsu算法
采用Otsu算法对数码相机(像素2 000万)拍摄的一幅海报进行3级小波变换,二值化结果如图4所示,基于二维小波变换的二值化效果明显优于只采用Otsu算法的效果。
图4 基于二维小波变换和Otsu算法的二值化图像Fig.4 Bivalued images based on two-dimensional wavelet transform and Otsu algorithm
通过图2-4可知,相比于常见的全局阈值算法,提出的基于二维小波变换的方法
二值化效果明显提升。
为进一步验证其性能,将提出的方法与常见的局部阈值算法(Niblack和Bernsen算法)进行仿真对比。
2.4 Niblack算法
Niblack算法复杂度低,实现灵活,但对域模板大小的选择直接影响该算法的性能,选择不当将引入伪噪声或丢失信息。
采用基于二维小波变换的二值化方法能够有效去除背景噪声,弥补Niblack算法存在的不足,效果如图5所示。
图5 基于二维小波变换和Niblack算法的二值化图像Fig.5 Two-valued image based on two-dimensional wavelet transform and niblack algorithm
2.5 Bernsen算法
Bernsen作为另一经典的局部二值化算法,其二值化效果较好,如图6所示,采
用提出的方法后,对背景噪声(非文字部分)的滤除效果进一步改善,为后续的文字提取和识别降低干扰。
图6 基于二维小波变换和Bernsen算法的二值化图像Fig.6 Binarization image based on two-dimensional wavelet transform and bernsen algorithm
综合上述实验,针对包含文字的数字图像,分别在灰度平均值、最佳迭代阈值、Otsu算法得到全局阈值和Niblack、Bernsen算法得到局部阈值的前提下,采用
提出的基于二维小波变换的方法进行图像处理计算复杂度提高,但是能够有效抑制非文字部分的干扰,二值化效果都有明显提升,验证了该方法的有效性。
采用多级二维小波变换处理,其复杂度是O(M2N log N)(M表示二维小波变换的级数,N表示图像的像素点数)。
处理图像包含手机、数码相机拍摄的照片以及网络上
下载的图片,说明该方法性能稳定,适用范围较广。
3 总结
对于包含文字的数字图像,传统的二值化算法并不能很好地区分文字部分和非文字
部分。
提出的方法通过小波分解、滤波、小波重构和插值等操作将包含文字的部分分离,将不包含文字的部分作为噪声滤除,从而得到更优的二值化效果。
【相关文献】
[1]完颜勇.基于对比度增强和背景估计的文档图像二值化[J].电子科技,2018(4):20-24.
[2]张万绪,孟虹岐,吴长忠,等.弱光背景下文本图像二值化提取算法[J].西北大学学报(自然科学版).2017(2):191-196.
[3]张健.复杂图像文本提取关键技术与应用研究[D].天津:南开大学,2014:22-33.
[4]段银雪.基于K-means的图像文字识别与提取研究[J].电子技术与软件工程.2015(9):88.
[5]DoNoho D.L.Denoised by soft thresholding[J].IEEE Transactions on Information Theory.1995(41):613-627.
[6]Keys,R.Cubic convolution interpolation for digital image processing[J].Acoustics,Speech and Signal Processing,1981(6):1153-1160.。