基于图像区域的交互式文本图像阈值分割算法_龙建武
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机研究与发展ISSN 1000-1239?CN 11-1777?TPJournal of Computer Research and Development 49(7):1420-1431,2012
基于图像区域的交互式文本图像阈值分割算法
龙建武 申铉京 陈海鹏
(吉林大学计算机科学与技术学院 长春 130012)
(符号计算与知识工程教育部重点实验室(吉林大学) 长春 130012)
(longjw08@mails.jlu.edu.cn)
Interactive Document Images Thresholding Segmentation Algorithm Based onImage Regions
Long Jianwu,Shen Xuanjing,and Chen Haipeng
(College of Computer Science and Technology,Jilin University,Changchun130012)
(Key Laboratory of Symbolic Computation and Knowledge Engineering(Jilin University),Ministry of Education,Changchun130012)
Abstract In order to overcome the two problems,parameters selection in the local thresholdingsegmentation methods which have many parameters usually and discontinuous problem amongneighbor regions in the segmentation results,an interactive document images thresholdingsegmentation algorithm based on image regions is proposed in this paper with the priori knowledge orexperience from the users.Firstly,the presented method divides the image into several regionsroughly.Secondly,it sorts all the image blocks according to their standard deviation values,whichare taken as a measure to tell how much information of the background and object every blockcontains.Thirdly,the users input interactive information to separate all regions into three parts:blocks containing background or target only,blocks containing a small amount of background ortarget,and blocks containing distributing equilibrium background and target.Finally,the binarizationof every block is conducted according to different criterion.Extensive experimental results show thatthe proposed scheme yields more promising binarization outcomes and also has better performance fordocument images under normal and inadequate illumination conditions,compared with globalmethods,simply thresholding approaches based on regions,and Chou s method.Moreover,theintroduced approach is also effective for part of the non-text images.
Key words image segmentation;interactive document image segmentation;threshold selection;localthreshold;Otsu method
摘 要 针对现有局部阈值分割算法因参数过多带来的参数选择问题以及在分割结果中块与块之间不连续性问题,利用用户提供的先验知识或经验,提出了一种基于灰度图像区域的交互式文本图像阈值分割算法.该方法首先粗略地将图像进行分块;利用标准差作为衡量图像块含有信息量(背景信息与目标信息)多少这一度量,接着按标准差大小对所有图像块进行排序;然后由用户输入交互式信息将所有图像块分为3个集合:仅含背景或仅含目标的图像块、含有少量背景或者是含有少量目标的图像块以及背景和目标分布比较均衡的图像块;最后对各个集合中的图像块分别按相应准则进行分割.实验结果表明,对于均匀和非均匀光照条件下的文本图像,与全局分割算法、直接分块分割算法和Chou方法相比,该
收稿日期:2010-09-14;修回日期:2011-11-02
基金项目:国家自然科学基金项目(60773098);吉林省科技发展计划基金项目(20080317);吉林大学研究生创新基金项目(20121104)
通信作者:陈海鹏(chenhp@jlu.edu.cn)
方法在分割效果上有显著提升,而且执行效率也较高.另外,对于部分非文本图像也同样有效.关键词 图像分割;交互式文本图像分割;阈值选取;局部阈值;Otsu算法
中图法分类号 TP391.41
图像分割的主要目的是将感兴趣的目标从复杂背景中分离出来,以便进行目标识别和场景分析[1].图像分割技术在模式识别、计算机视觉、医学图像处理等领域中有着十分广泛的应用,阈值法[2]是其中的一种非常重要的分割技术,它以其简单、有效、便于理解的特性而受到人们的普遍欢迎.当前已有很多种阈值分割算法[2],其中,Otsu算法[3]因计算简单、实时性高、鲁棒性强等优点而被广泛采用[4-6].通常,Otsu算法均被作为全局方法使用,尤其当待分割图像呈双峰分布时,分割效果最佳.但因受光照不均等因素的影响,一般待分割图像并不呈明显的双峰分布状态,若仍采用全局分割方法[2-3]必将导致其分割失败.相对于全局分割算法而言,采用分块思想的局部分割方法[2,4-9]有着更为理想的分割效果.为此,在文本图像分割[4-9]中,Chou等人[4]提出了一种基于图像区域的分割算法,该算法过程比较复杂,其基本思想是采用SVM分类器通过学习的方式来建立分割决策规则,但其中需要人为地给定分块数、1个标准差阈值sth和1个均值阈值uth.当图像块的标准差小于sth时再通过uth将该块判断为背景或目标,否则将采用Otsu算法对该图像块进行分割.由Pai等人[5]提出的自适应文本分割算法中不需指定分块数,而是采用水平投影的方式智能化地完成图像分块,然后同样需要按照给定标准差阈值sth和均值阈值uth来决定各个图像块是否需要采用Otsu算法进行分割.虽然上述2种方法总体分割性能较好,但实验过程中均需要用户不断地调整sth和uth,且很难给出比较合适的阈值,因此鲁棒性较弱.以上这2种方法主要用于文本图像分割.这些局部分割算法的主要缺点是控制参数太多,并且在分割结果中还有可能出现块与块之间的不连续性.
然而采用实时交互的分割方式来取代这些控制参数是一个更为值得采纳的解决方案.经典算法如Snake算法[10],该方法主要用于分割医学图像处理领域中的脑部、心脏等图像,它是由用户首先给出初始轮廓线,然后在该指导性信息下完成目标的提取.另外,现今已有很多种用于处理自然图像的交互式图像分割算法[11-13],如Ning等人[11]提出了一种基于最大相似度的交互式区域合并算法,该方法采用
MeanShift算法[14]进行初始分割,将图像分成很多小区域,然后由用户大致标记出一些背景区域和目标区域,最后采用一种最大相似度度量方法[15]进行区域合并以完成目标与背景的分割.该方法是基于边缘检测的交互式图像分割算法,但常因找出的边缘轮廓出现较弱或不连续等问题,导致区域不完整.另外,由于MeanShift算法运行时间较长,所以该方法实时性较差.所有这些交互式方法[10-13]都是通过在目标和背景上画一些直线或曲线,以描述它们的位置和颜色等主要特征,最后在这些信息的指导下完成目标与背景的分离.交互式分割算法主要缺点是受人为因素影响很大,但它可以解决过多控制参数的设置问题,从而提高分割准确度.
本文针对现有局部分割方法参数过多以及分割结果中出现的块与块之间不连续性的缺点,同时结合交互式分割思想,提出了一种基于灰度图像区域的交互式文本图像阈值分割算法.为了方便用户进行交互式操作,本文作者设计并开发了一套交互式图像分割系统.实验结果表明,本文算法通过实时交互有效解决了过多控制参数设置问题,而且相对于现有局部算法而言,本文算法对均匀和非均匀光照条件下的文本图像以及部分非文本图像都有着较好的分割效果.
1 Otsu阈值分割算法
在灰度级为L的灰度图像中,灰度值为i的像素个数用ni表示,总的像素个数表示为n=n0+n1+…+nL-1;用pi表示灰度图像中灰度值为i像素点出现的概率,则:
pi=ni?n,∑
L-1
i=0
pi=1.(1) 将图像中的像素按灰度值用阈值t分成两类C0和C1,即C0={0,1,…,t},C1={t+1,t+2,…,L-1}.则C0和C1出现的概率ω0和ω1分别为
ω0=∑
t
i=0
pi; (2)
ω1=∑
L-1
i=t+1
pi.(3) C0和C1的均值μ0和μ1以及总均值μT分别为
1
2
4
1
龙建武等:基于图像区域的交互式文本图像阈值分割算法
μ0=∑t
i=0
ipi
ω0; (4)μ
1=∑L-
1i=t+
1ipi
ω1;
(5)μT=
∑
L-
1i=0
ipi
=ω0μ0+ω1μ
1.(6
) C0和C1的方差σ20和σ2
1分别为
σ2
0
=∑t
i=0(i-μ0)2
pi
ω0;
(7
)σ2
1
=∑L-
1i=t+1
(i-μ1)2
pi
ω1.(8) C0和C1的类间方差σ2B和类内方差σ2
W分别为
σ2B=ω0(μ0-μT)2+ω1(μ
1-μT)2
;(9)σ2W=ω0σ20+ω1σ2
1.
(10) O
tsu算法是使得类间方差最大且类内方差最小时所对应的t作为最佳阈值,
记为t*
,则:t*
=arg max0≤t≤L-1σ2
B
σ2W
.(11
)2 本文算法
本文算法分5步完成,具体过程如下:Step
1.采用本文提出的三维去噪模型进行预处理;
Step
2.对去噪后图像进行图像分块;Step3.计算各个图像块的标准差,并按标准差从小到大进行排序;
Step
4.根据图像块灰度信息及其直方图信息,由用户进行图像块分类;
Step5.对各个图像进行二值化,以得到最终二值图像.
本文算法的流程图如图1所示
:
Fig
.1 Flow chart of our method.图1 本文算法流程图
2.1 三维去噪模型
对于一幅大小为M×N的数字图像,假定图像由暗背景与亮目标组成.设像素点(x,y)处的灰度值表示为f(x,y),则对于该像素点在其邻域大小为k×k的范围内(通常k取3),其均值g(x,y
)定义为g(x,y)=1k2∑k?
2m=-k?2∑k?
2 n=-k?
2f(x+m,y+n)
.(12) 其中值h(x,y
)定义为h(x,y)=med{f(x+m,y+n),m=-k?2,…,k?2;n=-k?2,…,k?
2}.(13
) 由灰度值f(x,y)、均值g(x,y)和中值h(x,y)组成的一个三维直方图是定义在一个L×L×L的立方体区域内,其3个坐标轴分别表示图像像素的
灰度值f(x,y)、均值g(x,y)和中值h(x,y).因同一像素点处的灰度值、均值和中值十分接近,所以在三维直方图中三元组(f(x,y),g(x,y),h(x,y))沿着体对角线OM方向一狭长的空间区域内分布,如图2所示
:
Fig.2 3-D histog
ram.图2 三维直方图
2
241计算机研究与发展 2012,49(7
)
定义1.设某一像素点(x,y)处的像素值为p1,p2和p3(
分别为灰度值、均值和中值三者之一),若p3分别与p1,p2的距离均比p1与p2的距离大,即p1和p2最接近,用公式表示为:|p3-p1|>|p2-p1
|且|p3-p2|>|p2-p1|,则用Close(p1,p2)>p3表示p1,p2和p3三者的最近相似度.
噪声点、噪声点附近的像素点及边缘像素点往往都分布在远离对角线的那些区域内,下面对这些点的分布情况作详细分析,然后采用最近相似度准则重建三维直方图,图3为三维直方图的8角区域分布图.
下面是对各区域的详细分析
.Fig.3 Distribution of
octagonal regions.图3 八角区域分布图
1
)区域0:灰度值、均值和中值均较小,且三者都十分接近,为背景区域.2
)区域1:灰度值、均值和中值均较大,且三者都十分接近,
为目标区域.3
)区域2:灰度值较小,均值和中值较大且接近,即Close(g,h)>f.该点是亮区中的暗点,为目标区域中的噪声点,灰度值需矫正.
4
)区域3:灰度值较大,均值和中值较小且接近,即Close(g,h)>f.该点是暗区中的亮点,为背景区域中的噪声点,灰度值需矫正.
5
)区域4:均值较小,灰度值和中值较大且接近,即Close(f,h)>g.该点是目标区域中的像素点,其本身不为噪声点,而是其附近有较暗的噪声点,均值需矫正.
6
)区域5:均值较大,灰度值和中值较小且接近,即Close(f,h)>g.该点是背景区域中的像素点,其本身不为噪声点,而是其附近有较亮的噪声点,均值需矫正.
7
)区域6:中值较小,灰度值和均值较大且接近,即Close(f,g)>h.该点是靠近背景区域的边缘像素点,其附近有很亮的噪声点,且像素值较大的像素点数要少于像素值较小的像素点数,所以该点更偏向背景区域,灰度值和均值需矫正.
8
)区域7:中值较大,灰度值和均值较小且接近,即Close(f,g
)>h.该点是靠近目标区域的边缘像素点,其附近有很暗的噪声点,且像素值较小的像素点数要少于像素值较大的像素点数,所以该点更偏向目标区域,
灰度值和均值需矫正.图4为三维空间中信息点的分布示意图,其中图4(a)为矫正前分布状态示意图,从图4(a)可知,噪声点、噪声点附近的像素点及边缘像素点分布比较分散,因此需要对其矫正,矫正后的分布状态示意图如图4(b)
所示
.Fig.4 Schematic diagram of p
oints distribution.图4 信息点分布状态示意图
记初始三元组(灰度值,均值,中值)为(f,g
,h),矫正后的三元组为(f*,g
*
,h*),它们相互之间的距离为:disfg=|f-g|,disfh=|f-h|,disgh=|g-h|.通过上述分析,矫正方法如下:
1
)区域0和1为正常分布,不需对其矫正.2
)对于区域2和3,三者最近相似度为Close(g,h)>f,用距离关系式表示为:disfg>disg
h且disfh>disg
h,灰度值可用均值和中值的均值来矫正,即f*
=(g+h)
?2.(14) 3)对于区域4和5,三者最近相似度为Close(f,h)>g,用距离关系式表示为:disfg>disfh且disg
h>disfh,
均值可用灰度值和中值的均值来矫正.g*
=(f+h)
?2.(15) 4
)对于区域6和7,三者最近相似度为Close(f,g)>h,用距离关系式表示为:disfh>disfg且disg
h>disfg,
灰度值和均值可用中值来矫正,即f*=g*
=h.
(16
)3
241龙建武等:基于图像区域的交互式文本图像阈值分割算法
对于正常分布的非噪声像素点可能也会满足上述其中某种情况,但因其灰度值、均值和中值十分接近,故使用上述矫正方程矫正后其分布基本不受影响.
对于没有矫正的项使用原值即可,最后基于上述矫正后的三维直方图便可得到去噪后的灰度图像
f(x,y)=(f*+g*+h*
)
?3.(17)2.2 图像分块
对于受光照不均等因素影响的待分割图片,如
图5(a)所示(大小为256×64),其直方图往往不呈双峰分布状态,如图5(b)所示,若采用全局分割算法处理,分割结果并不理想,如图5(c)所示.由于Otsu分割算法具有计算简单、速度快等优点,相对全局Otsu法而言,基于分块思想的局部区域Otsu分割方法可取得更为理想的分割结果
.
Fig.5 Imag
e partitioning.图5 图像分块
本方法只需用户粗略的指定出图像块数c(其中c=n×n),便能取得理想的分割效果.通过大量实验表明,其中n一般只需在[1,10]范围内取值.当n取1时表示待分割图片没有进行分块,即一般用于对均匀光照下的图像进行分割.n的取值主要是根据待分割图像受光照不均影响的程度来决定的,即当图像中光照强度变化很小时,n可以取较小值;当光照强度变化很大时,n值可以取得较大一些,以便将图像分的更细,达到最佳的分割效果.如图5(d)所示为分块结果,这里分成了4×4共16个像素块.2.3 图像块排序
在完成图像分块后,如果对各个图像块直接采用Otsu法进行分割,其分割效果一般不会理想,如图6(a)所示.其原因仍然是部分图像块的灰度直方图不呈双峰分布,所以需分别对其进行特殊处理.
标准差是用来刻画数据散布程度的一个度量.当数据散布越分散,即其中所包含的信息量越多时,标准差越大;当数据分布越集中,
即其中所包含的信
Fig.6 Image blocks sorting
.图6 图像块排序
息量越少时,标准差越小.所以当图像块仅含背景信息或目标信息时,它所含信息量少,其标准差就小;而当图像块同时含有背景和目标信息时,它所含信息量大,其标准差就大.因此,本文采用标准差作为图像块含有信息量(背景信息与目标信息)多少的度量.
假设第i个图像块包含有Ni个像素点,
其中i∈[1,c];该图像块中第j个像素点的灰度值记为xj,其中j∈[0,Ni-1];记μi和σi分别为此图像块的均值和标准差,则:
μi=1
Ni∑Ni
-1j=
0xj; (18
)σi=1Ni∑Ni-1j=0
xj-μ()i槡
2
.(19) 在完成对待分割图片分块后,
分别计算出各个图像块的标准差σi.然后按照标准差大小从小到大进行排序,并将这些图片块分别标记为r1,r2,…,rc.
那么,标准差较小的图像块对应为背景块(一般均值较小)
和目标块(一般均值较大),标准差较大的图像块对应为同时含有背景和目标的图像块.需要注意的是:这里只需要按标准差大小进行排序即可,不需要按均值再进行排序.其主要原因是:当待分割图片受光照不均影响很大时,
有些背景块的均值反而可能比个别目标块的均值要大,所以不能采用均值将背景块和目标块完全的分开.图5(d)中的图像块编号即为按标准差排序后的序号,如图6(b)所示为图像块排序结果.2.4 图像块分类
在对所有图像块排好序后,接下来由用户根据各个图像块灰度信息及其灰度直方图来指定出3个区域R1,R2和R3,其中R1={r1,r2,…,rl-1},R2=
{rl,…,rh-1},R3={rh,…,rc},即只需用户指定R2的下限l和R3的下限h.其中R1,R2和R3分别满足条件:R1中图像块为只含背景信息或只含目标信
4
241计算机研究与发展 2012,49(7
)
息的图像块即呈单峰分布;R2中图像块为只含少量背景信息或只含少量目标信息的图像块即呈不明显双峰分布;而R3中的各图像块当中的背景信息和目标信息的分布比较均衡即呈双峰分布.
由图6(b)可知:图像块1~5均只含背景,图像块6~8均只含少量目标信息,所以可设置l=6,h=9,由此可得到分类结果:R1={r1,…,r5},R2={r6,r7,r8},R3={r9,…,r16}.
这样分类的好处是:因R1中的图像块只含背景信息或只含目标信息,所以只需简单地将其中各个图像块指定为黑(背景)或者白(目标)即可.R2中的图像块因含有少量背景信息或少量目标信息,因此其直方图并不一定呈明显的双峰分布,显然不能采用全局阈值分割算法直接进行分割.考虑到信息分布的连续性,因此可以取其邻域图像块中最小阈值作为当前块的分割阈值.R3中的图像块因背景信息和目标信息分布比较均衡,其直方图均呈明显的双峰分布,因此采用Otsu分割算法进行分割即可.需强调的是:本文所提的邻域图像块均指排序前的邻域块,并非排序后,因为排序后的相邻图像块之间在物理位置上是没有任何关系的.从图5(d)可知,如图像块12的左邻域为14,上邻域为6,右邻域为13,下邻域为16.
2.5 图像块二值化
设第i个图像块表示为fi(x,y),若该图像块的阈值为thi,则采用式(20)进行二值化处理.
fi(x,y)=
0,f≤thi;
255,f>thi{.(20)
在完成所有图像块分类后,接下来就是对各个图像块进行二值化.首先记各个块的分割阈值为thi,并将所有阈值初始化为空(-1),其中i∈[1,c],具体二值化过程如下.
1)因R3中各个图像块均呈明显的双峰分布,所以首先采用Otsu分割算法直接对其中的各块ri分别进行分割,以得到相应的分割阈值thi,并进行二值化,其中i∈[h,c].
2)对于R2中的图像块,将那些其邻域块均属于R1中的图像块重新划分到R1中,同时将其从R2中删除,然后对R2中的图像块按标准差由大到小逐个进行处理.
初始化:将R2中的图像块按标准差将其标号由大到小存入数组vec中;用来记录数组vec是否发生变化的标记flag=false.
Step1.对vec中的各个图像块,分别选其邻域
图像块中最小的非空阈值作为当前块的阈值,并将其二值化,然后将该图像块标号从vec中删除,并记flag=true.若其邻域图像块中的阈值均为空(-1),则对当前块不做任何处理,继续进行下一图像块的处理,若一轮处理完毕后则转Step2.
Step2.若数组vec为空,则转3).否则,若flag=true,重置标记flag=false,转Step1,否则转Step3.
Step3.对vec中的各个图像块采用Otsu分割算法分别进行分割,得到相应的分割阈值,并进行二值化,然后转3).
3)对R1的处理.
初始化:把R2和R3中的所有图像块的标号存入空数组vec中,用于保存临时变量的1个空数组vecTmp.
Step1.对vec中的每一图像块ri逐一遍历其四邻域left(左邻域)、top(上邻域)、right(右邻域)、bottom(下邻域):
①若left的阈值为空(-1),则将left加入数组vecTmp中,然后统计图像块ri中第1列的黑点数nB和白点数nW.若nB>nW,则设置left的阈值为255,否则设置为0,并对其进行二值化.若left的阈值非空(>0),则转②;
②若top的阈值为空(-1),则将top加入数组vecTmp中,然后统计图像块ri中第1行的黑点数nB和白点数nW.若nB>nW,则设置top的阈值为255,否则设置为0,并对其进行二值化.若top的阈值非空(>0),则转③;
③若right的阈值为空(-1),则将right加入数组vecTmp中,然后统计图像块ri中最右1列的黑点数nB和白点数nW.若nB>nW,则设置right的阈值为255,否则设置为0,并对其进行二值化.若right的阈值非空(>0),则转④;
④若bottom的阈值为空(-1),则将bottom加入数组vecTmp中,然后统计图像块ri中最下一行的黑点数nB和白点数nW.若nB>nW,则设置bottom的阈值为255,否则设置为0,并对其进行二值化.若bottom中的阈值非空(>0),则遍历vec中下一个图像块,若vec遍历完毕则转Step2.Step2.若数组vecTmp为空,则分割结束,否则清空vec,然后将vecTmp拷贝给vec,并清空vecTmp,转Step1.
采用上述算法可得图5(d)的分割结果,如图7(a)所示.图7(b)为相应各图像块的分割阈值,在每个图像块中,左侧为块标号,右侧为相应块的阈值,
5
2
4
1
龙建武等:基于图像区域的交互式文本图像阈值分割算法
其中,R1={r1,…,r5},R2={r6,r7,r8},R3={r9,…,r16}
.Fig.
7 Blocks binarization.图7 图像块二值化
3 实验结果
3.1 系统介绍
为方便用户进行交互式图像分割操作,本文作者设计并开发了一套交互式图像分割系统,其主界面如图8所示.
本系统需要用户输入的交互式信息主要包括:1
)图像分块设置用户只需在系统左边组合框“Regions Label”当中通过单击鼠标来选择不同的数字(
取值范围为
Fig.8 Main interface of the interactive image segmentation sy
stem.图8 交互式图像分割系统主界面
[1,100
]),然后根据待分割图像的光强分布情况,用户可通过点击按钮“Set Block Size”来设置分块数n,从而将图像分成了n×n块,
其中n的取值范围为[1,10].本系统默认设置为n=5,通过大量实验表明,一般采用此默认设置即可获得理想的分割效果.
2
)图像块分类设置同样,用户只需在组合框“Regions Label”当中选择不同的数字(取值范围为[1,100]),同时在系统右边将显示出该标号所对应图像块的灰度直方图,根据该直方图的分布情况,用户可通过点击按钮“Set Low Region”和“Set High Reg
ion”来分别设置合适的R2的下限l和R3的下限h.
3.2 分割实验
本实验分为两组:均匀和非均匀光照下图像分
割测试.为验证本算法的鲁棒性,除了对文本图像的分割测试,
在非均匀光照条件下还增加了一组非文本图像测试.试验中,参照文献[4],对于Chou方法中的均值阈值和标准差阈值分别设为uth=1
28和sth=
15.3.2.1 实验1.均匀光照情况
图9为在均匀光照条件下的文本图片的实验结果(图像大小为960×340).通常,均匀光照条件下图片不需要进行分块处理,直接采用全局分割方法便可获得理想分割效果(即分为1×1块),如图9(h)所示.为验证本文算法的分割性能,实验中采用了默认分块数将其分为5×5共25个图像块,Chou方法也采用了相同的分块数.
在图9的实验过程中,在对其完成分块并按标
6
241计算机研究与发展 2012,49(7
)
准差从小到大进行重排后如图9(d)所示,从图9(d)
可知图像块1~2只含背景,图像块3~5中只含少量目标信息,因此可将块1~2划分到R1中,块3~5划分到R2中,而R3={r6,…,r25}
,分割结果如图9(e)(f)所示.若对所有图像块均直接采用Otsu算法进行分割,其分割结果如图9(g)
所示,不难发现,
图像块1~2都分割失败,主要原因在于这2个图像块仅含背景信息即均呈单峰分布.对于Chou方法,从第3个图像快开始均较大,前两块因均值较大可直接设为背景,其后的所有块直接采用Otsu法便可得到理想分割.表1为图9中所有图像块的标准差和分割阈值
.
Fig.9 Experimental results of the document image under homog
eneous illumination condition.图9 均匀光照文本图片实验结果
Table 1 Standard Deviation and Threshold of Blocks in Fig
.9表1 图9中所有图像块的标准差和分割阈值
Blocks Set
Index ri(
standard deviationσ,threshold th) [l=3,h=6]R1={r1,r2}
r1(
7.95,0)r2(
9.11,0)R2={r3,r4,r5}r3(16.91,123)r4(26.74,121)r5(
27.19,123)R3={r6,…,r25}r6(36.15,124)r7(43.87,127)r8(45.97,121)r9(48.00,118)r10(48.23,126)r11(48.41,129)r12(
49.40,116)r13(49.91,127)r14(50.42,116)r15(50.56,117)r16(51.03,115)r17(51.15,112)r18(51.21,125)r19(51.39,124)r20(51.83,115)r21(53.45,123)r22(53.75,121)r23(54.08,122)r24(54.45,122)r25(
58.46,127)3.2.2 实验2.
非均匀光照情况图10~12为不均匀光照条件下的图片实验结果.其中,图10大小为906×690,图11大小为894×680,
实验中均采用了默认分块数(5×5);图12大小为500×400,因图像中光照强度变化较大,因此实验中采用了较大的分块数(6×6).为便于对比,Chou方法中采用了相同的分块数.
对于这些光照不均的图片,只能采用局部分割算法处理才能获得理想分割效果,
若采用全局分割方法,分割结果分别如图10(h)、图11(h)和图12(g)所示.若对所有图像块都采用Otsu算法进行分割,必将导致R1中的所有图像块分割失败,R2中部分图像块分割失败,
直接分块分割结果分别如图10(g)、图11(g)和图12(f)所示.主要原因是R1中图像块均呈单峰分布,
无论是背景块或是目标块;R2中的图像块部分接近单峰分布而另一部分接近双峰分布,主要与用户指定的区域范围有关,所以会导致R2中接近单峰分布的那些图像块分割失败.
在图10实验中,对其完成分块并按标准差从小到大重排后如图10(d)所示,从图10(d)知图像块1只含背景,图像块2~6均只含少量目标信息,由此可得图像块划分结果:R1={r1},R2={r2,…,r6},R3={r7,…,r25},分割结果见图10(e)(f)所示.表2为图10中所有图像块的标准差和分割阈值.
7
241龙建武等:基于图像区域的交互式文本图像阈值分割算法
图10 非均匀光照文本图片实验结果
Table 2 Standard Deviation and Threshold of Blocks in Fig.10
表2 图10中所有图像块的标准差和分割阈值
Blocks Set Index ri(standard deviationσ,threshold th) [l=2,h=7]
R1={r1}r1(9.57,0)
R2={r2,…,r6}r2(10.37,151)r3(10.63,123)r4(13.00,131)r5(13.89,151)r6(19.60,131)
R3={r7,…,r25}r7(21.97,131)r8(33.36,151)r9(33.81,153)r10(35.39,114)r11(36.16,123)r12(37.02,140)r13(38.11,119)r14(38.91,141)r15(40.05,158)r16(41.20,149)r17(41.73,133)r18(42.27,154)r19(43.58,124)r20(44.29,162)
r21(45.21,139)r22(45.37,154)r23(46.31,141)r24(46.37,146)r25(47.07,136)
在图11的实验过程中需注意的是:虽然图11
(c)(d)中的图像块2为背景块,但图像块1左下角
却含有极少量目标信息,因此需将图像块1、2同时
划入R2中,由于图像块3所含目标信息较少,所以
仍可将其划入R2中,其余图像块均划入R3中,而
R1为空.由此可得图像块划分结果:R1={},R2=
{r
1,r
2
,r
3
},R
3=
{r
4
,…,r
25
},分割结果如图11(e)
(f)所示.表3为图11中所有图像块的标准差和分割阈值.
在图10和图11实验中,因Chou方法中标准差阈值的限制,使得那些含有少量目标信息的图像块因标准差较小导致目标信息直接丢失.如图10中图像块2~5,图11中图像块1,均因其标准差较小和均值较大而直接设置为背景.
图12为典型的光照强度渐变剧烈的单目标图像.需要注意的是:图12(c)中的图像块21~36的灰度直方图均呈明显的双峰分布,因此直接将其全部划分到R3中即可;图像块1~16全为背景块,而
8
2
4
1计算机研究与发展 2012,49(7)
Fig.11 Experimental results of the document image under nonhomogeneous illumination condition.
图11 非均匀光照文本图片实验结果
Table 3 Standard Deviation and Threshold of Blocks in Fig.11
表3 图11中所有图像块的标准差和分割阈值
Blocks Set Index ri(standard deviationσ,threshold th) [l=1,h=4]
R2={r1,r2,r3}r1(9.00,131)r2(10.99,140)r3(20.16,140)
R3={r4,…,r25}r4(31.86,131)r5(32.48,192)r6(35.02,202)r7(35.91,208)r8(36.47,154)r9(36.97,204)r10(37.74,206)r11(38.91,158)r12(39.01,172)r13(39.82,150)r14(40.28,201)r15(40.71,200)r16(42.06,140)r17(42.39,194)
r18(42.48,178)r19(43.15,177)r20(43.78,163)r21(44.40,194)r22(44.83,182)r23(46.89,181)r24(50.24,158)
r25(52.38,171)
Table 4 Standard Deviation and Threshold of Blocks in Fig.12
表4 图12中所有图像块的标准差和分割阈值
Blocks Set Index ri(standard deviationσ,threshold th) [l=21,h=21]
R1={r1,…,r20}r1(3.74,255)r2(3.75,255)r3(3.76,255)r4(3.79,255)r5(3.82,255)r6(3.84,255)r7(3.87,255)r8(3.88,255)r9(3.88,255)r10(3.88,255)r11(3.89,255)r12(3.91,255)r13(3.92,255)r14(3.94,255)
r15(3.96,255)r16(3.99,255)r17(7.80,0)r18(7.82,0)r19(9.08,0)r20(9.09,0)
R3={r21,…,r36}r21(11.48,67)r22(14.42,70)r23(14.72,32)r24(15.33,53)r25(15.84,60)r26(15.99,36)r27(16.15,36)
r28(16.78,54)r29(18.14,33)r30(19.10,59)r31(19.10,89)r 32(19.32,
77)
r33(22.80,76)r34(27.01,90)
r35(32.36,94)r36(33.10,92)
9241
龙建武等:基于图像区域的交互式文本图像阈值分割算法
Fig.12 Experimental results of
the non-document image under nonhomogeneous illumination.图12 非均匀光照下非文本图像实验结果
图像块17~20全为目标块,因此直接将块1~20划分到R1即可.由此可得到图像块划分结果:R1={r1,…,r20},R2={},R3={r21,…,r36},分割结果如图12(d)(e)所示.Chou方法中因前23个图像块标准差均较小,
同时均值也较小,导致均被设置为背景,如图12(h)所示.表4为图12中所有图像块的标准差和分割阈值.
4 总 结
为了能够更好地对非均匀光照条件下文本图像进行分割,本文提出了一种基于灰度图像区域的交互式文本图像阈值分割算法.本算法采用标准差作为判断图像含有信息量多少的度量,根据局部区域的标准差大小来决定该图像块选取某种分割方式.在分割过程中需要用户根据图像块灰度信息及其直方图给出交互式信息,来将所有图像块分为3个区域范围,
然后按类别将所有图像块进行分类处理.凭借Otsu法的计算简单、实时性高、鲁棒性强等优点,本文算法依然具有较高的分割性能,尤其对非均匀光照条件下的文本图像以及部分非文本图像,具有优越的分割效果.当然,本文算法也存在着某些不足,如需要用户给出交互式信息,受人为因素影响较大.因此,寻找一种全自动图像分割算法有待进一步探讨与研究.
参考文献
[1]Yilmaz A,Javed O,Shah M.Object tracking:A survey[
J].ACM Computing
Surveys,2006,38(4):1-45[2]Sezgin M,Sankur B.Survey o
ver image thresholdingtechniques and quantitative performance evaluation[J].Journal of Electronic Imaging,2004,13(1):146-168[3]Otsu N.A threshold selection method from gray
-levelhistograms[J].IEEE Trans on Systems,Man andCy
bernetics,1979,9(1):62-66[4]Chou C H,Lin W H,Chang
F.A binarization method withlearning-build rules for document images produced bycameras[J].Pattern Recognition,2010,43(4):1518-1530[5]Pai Y T,Chang
Y F,Ruan S J.Adaptive thresholdingalg
orithm:Efficient computation technique based onintelligent block detection for degraded document images[J].Pattern Recog
nition,2010,43(9):3177-3187[6]Mog
haddam R F,Cheriet M.A multi-scale framework foradaptive binarization of degraded document images[J].Pattern Recog
nition,2010,43(6):2186-2198[7]Sauvola J,Pietikainen M.Adaptive document imag
ebinarization[J].Pattern Recognition,2000,33(2):225-236[8]Kim I J.Multi-window binarization of camera imag
e fordocument recognition[C]??Proc of the 9th Int Workshop onFrontiers in Handwriting Recognition.Piscataway NJ:IEEE,2004:323-
3270
341计算机研究与发展 2012,49(7
)。