基本图像特征用于文本图像文种识别

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基本图像特征用于文本图像文种识别
郭龙;平西建;周林;童莉
【摘要】为了解决现有方法在运算速度和识别效果上的矛盾,该义将基本图像特征用于文本图像文种识别.按照纹理分析结构方法的观点,将纹理皋元划分为7种类型,提取描述文本图像纹理基元构成以及其空间位置关系的特征,采用支持向量机对所
提特征进行训练和分类,实现文字种类识别.实验选用有质量退化的中、英、俄、日、韩、阿拉伯等10种不同语言文字的文本图像,结果表明该算法运算速度快,有较高
的识别准确率,并对图像质量退化有较好的鲁棒性.
【期刊名称】《应用科学学报》
【年(卷),期】2011(029)001
【总页数】5页(P56-60)
【关键词】文本图像;文种识别;基本图像特征;支持向量机
【作者】郭龙;平西建;周林;童莉
【作者单位】解放军信息工程大学,信息工程学院,郑州,450002;解放军信息工程大学,信息工程学院,郑州,450002;解放军信息工程大学,信息工程学院,郑州,450002;解放军信息工程大学,信息工程学院,郑州,450002
【正文语种】中文
【中图分类】基础科学
第 29 卷第 1 期应用科学学报2 011{1 ‘ 1}iJO URNAL OFAPPLIEDSCIENCES -Electronicsand InformationEnglneerlng
Vol.29No.Jan.2011基本图像特征用于文本图像文种识别郭龙,平西建,周林,童莉解放军信息工程大学信息工程学院,郑州 450002摘要:为了解决现有方法在运算速度和识别效果上的矛盾,该文将皋本图像特征用于文本图像文种识别,按照纹理分析结构方法的观点,将纹理基元划分为 7 种类型,提取描述文本图像纹理基元构成以及其空问位置关系的特缸,采用芰持向量机对所提特征进行训练和分类,实现文字种类识别.实验选用有质量退化的中、英、俄、同、韩、阿拉们等 10 种/ 1i同语言文字的文本图像,结果表l 必该算法运算速度快,有较高的识别准确率,并对图像质量退化有较好的鲁棒性.关键词:文本图像:义种识别;基本图像特征;支持向量机中图分类号:
TP391.1文章编号: 0255-8297(2011)01-0056-05 IdentificationofScriptsinDocumentImagesUsingBasic Image Features GUOLong,PINGXi-jian,ZHOU
Lin,TONGLiInstituteofInformatio'nEnginee'ri'ng,PLAInfo'rmationEnginee'rin gUniversity,Zhengzhou4soo02,Chitna Abstract:In this
paper,anovelscriptidentificationmethodbasedonbasicimagefeatures(BIF)is proposed to resolvetheconflict betweenthespeedof featureextractionandaccuracyof identification. According totheconcept of structuralapproachtotextureanalysis,texturebasicunitsaredividedintosevent ypes.Support vectormachine(SVM) is usedto trainandclassify thefeatures,whichdescribethestructureanddistributionof texture basicunits,toidentifyscriptsin differentlanguages. Experimentshavebeenperformedupondegraded document imagesincludingtenlanguagesincludingChinese,Russian,English,Japanese,K orean,Arabic,etc. Experimental
resultsconfirmthattheproposedmethodcanidentifyscriptsaccuratelyandeffici ently.It is robust againstimagedegradation. Keywords:
image,scriptidentification,basicimagefeature(BIF),supportvectormachine随着信息技术的发展,文件、档案等文字资料通过图文扫描仪、数码相机等图
像数据采集设备生成的文本图像是网络传输中图像数据的重要组成部分.冈此,文本图像分析技术己成为图像处理、模式识别及人工智能领域的研究热点,文本图像分析技术涉及机器视觉、图像处理、人工智能、模式识别、自然语言理解等多学科,其目的足将行政公文、商业信函、科技文献、私人文件等文本图像通过信息处理的予段转换为电子文档,用丁.保存、检索或从巾
提取信息,以提高信息处理的效率,该技术的处理包括文本图像检索、
版血分析、文种识别、光学字符识别(OCR) 等,结构流程如图 1 所示.其巾,文种识别作为文本图像分析的重要环节以及OCR的前端处理技术,已成为广泛关注的研究课题之一.目前,针对语言文’≯ 种类识别进行的研究
可以划分为基于符号匹配、基于统计特征和基于纹理特征的文种识别三大类【 1] .前两类方法大多需要以准确的文本行划分和字符分割为前提,对
文本图像噪声字体等鲁棒性较差.基于纹理特征的文种识别是将同收稿
日期: 2010-09-14;修订日期: 2010-10-21基金项目:国家白然科学基金(No.60970172)资助通信作者:平两建,教授,博导,研究方向:幽像处理、模式识别、计算机视觉、信息隐藏, E-mail:pingxj@12
6 .com第29卷1期应用科学报2 011{1‘1}i JOURNAL OF APPLIED SCIENCES - Electronics and InformationEnglneerlng Vol.29 No. Jan. 2011郭龙,平西建,周林,童莉解放军信息工程大学信息工程学院,郑州 450002摘要:为了解决现有方法在运算速度和识别效果上的矛盾,该文将皋本图像特征用
于文本图像文种识别,按照
IdentificationofScriptsinDocumentImagesUsingBasic GUO Long, PING Xi-jian, ZHOU Lin, TONG Li
InstituteofInformatio'nEnginee'ri'ng,PLAInfo'rmationEnginee'ringUniversity ,Zhengzhou4soo02,Chitna Abstract:In this
paper,anovelscriptidentificationmethodbasedonbasicimagefeatures(BIF)is proposed resolvetheconflict betweenthespeedof featureextractionandaccuracyof identification. the concept of structuralapproachtotextureanalysis,texturebasicunitsaredividedintosevent ypes.Support vector machine (SVM) is usedto trainandclassify thefeatures,whichdescribethestructureanddistributionof
basicunits,toidentifyscriptsin differentlanguages. Experimentshavebeenperformedupondegraded imagesincludingtenlanguagesincludingChinese,Russian,English,Japanese,K orean,Arabic,etc. resultsconfirmthattheproposedmethodcanidentifyscriptsaccuratelyandeffici ently.It is againstimagedegradation.
image,scriptidentification,basicimagefeature(BIF),supportvectormachine随着信息技术的发展,文件、档案等文字资料通过图文扫描仪、数码相机等图
像数据采集设备生成的文本图像是网络传输中图像数据的重要组成部分.冈此,文本图像分析技术涉及机器视觉、图像处理、人工智能、模式识别、自然语言理解等多学科,其目的足将行政公文、商业信函、科技文献、私人文件等文本图像通过信息处理的予段转换为电子文档,用丁.保存、识别、光学字符识别(OCR) 等,结构流程如图 1 所之一.目前,针对语言文分为基于
符号匹配、基于统计特征和基于纹理特征的文种识别三大类【 1] .前两类
方法大多需要以准确的文本行划分和字符分割为前提,对文本图像噪声字体等鲁棒性较差.基于纹理特征的文种识别是将同平两建,教授,博导,
研究方向:幽像处理、模式识别、计算机视觉、信息隐藏, E-
mail:pingxj@126 .com第 1 期郭龙等:基本图像特征用十文本图像文种识别57一种文字的文本图像看作同一类纹理,从而可用纹理分类的方法来解决文’ 扣种类识别问题[2] .近年来纹理分析技术的迅速发展,使基于纹理特征的文种识别算法日趋成熟.基于纹理特征的文种识别算法主要有基丁Gabor滤波器法[3] 、基于小波变换法( 4]、基于灰度级共生矩阵法【 2】、基于小波共生商方图的方法[5] 、基于:元树复数小波的方法[6 】、基于小波包的方法[7] . Gabor 滤波模拟人的视觉系统,具有旋转不变性,虽然文种识别的种类和准确率都较高,但是计算最较大;小波变换具有独特的快速算法,
大大减小了计算最,但每一级多分辨率分解只能提取图像在 3 个方向的特征,识别率不高;基于小波共生直方图的方法提高了识别率,但它是在小波分解的基础上进行共生南方图的计算,速度慢,特征维数高,齑酽坚l 嚣产婴犀翮
竺图图 1 文本图像分析系统 FigurelSystemof documentimageprocessing现有方法在运算速度利识别效果上的矛盾无法满足实际应用的需求,为解决这 JVJ 题,本文提出了基于基本图像特征的方法. 1纹理描述的结构方法纹理描述结构法的基本理沦认为复杂的纹理可由一些简译的纹理基元(基本纹理元素)
以一定的有规律的形式排列组合而成[8] .该方法涉及两个关键问题,一
是如何确定纹理基元,,:是如何建立排列规则.总之,为了刻画纹理,
就需要描述灰度纹理基元的性质以及它们之间的空问位置关系,目前并没有标准
的纹理基元集合,一般认为—个纹理基元足由一组属性所刻画的相联通的像
素集合.最简单的基元就是像素,其属性就是灰度,相对复杂的基元是 1 组
均匀灰度相连的像素集合,这样的纹理基元可根据尺寸、方向、形状或甲均
灰度等来描述.2基本图像特征 (BIFs)基本图像特征是Griffin等人[9-11] 提出的一种多尺度纹理分析方法.该方法将图像的纹理基元划分为 7 种不
同类型,这 7 种纹理基元的集合称为基本图像特征(basicimagefeatures,BIFs).基本图像特征(BIFs) 是根据:阶高斯衍生滤波器纽
(2ndsecondorderfilter bankofGaussian derivatives)【10!的响应来划分 7 种
不同纹理基元,高斯衍生滤波器组对图像的局部特性十分敏感,能很好地反应出不同几何结构的纹理区域,高斯衍生滤波器组由6个高斯衍生滤波器组成,如图 2 所示:高斯衍生滤波器的一维表达式为 GU(一套G4(x)=(27LU2)一 2e 一。

z(1) G7z(x)=£≥ G 。

(z)= (孑亨专)“H 。

(孑≥ i) G 。

(z)(2)
式巾,上标仃为滤波器的尺度参数,下标佗表示G 嚣 (x)的 n 阶导数,H 。

为埃尔米特多项式(Hermite polynomial).将其推广到?维 G7_nn(z ,们
=G%(z)G 三( Ⅳ)(3)图像与高斯滤波器组的响应[11] 称为”localjet” . Sml(X ,可 )= ,( z ,可)术 G 三。

(z,y),0≤ ?礼+n≤ 2式巾, I(x,∥ )表示图像 (z,∥ )点像素的灰度值,用高斯滤波器组的响应” localjet ” 计算以下两个
参数: A =u2(S20+S02)-y=a2 、/露 i 『二■ 2+4S11■Goao(x,y)(a) 零阶高
斯衍生滤波器(a) One zeroth-order gaussian derivativefilter■ Giao(x, 力OOaLfL 。

’1 (b)-阶高斯衍生滤波器(b)Twofirst-ordergaussian derivarivenlters蘸鬻搿3‘;鬻鬻溅 + 。

Ⅸi 4 { 藜鞫■麟i 墨黪黎黧 i 曛瓣—_~薹曩?_ G20(X,y) G^0,y) G02{X,y) (c) 二阶高斯衍生滤波器(c) Threesecond-ordergaussian derivative filters图 2BIFs滤波器组 Figure2Filter bankusedtocalculateBIFs然后根据忙s 。

,2 盯~ / s 孔十瑶l ,A ,-A ,2i (, y 一”, 2 一 { ( 7+ 入), 7}7个参数的最大值确定像素点所对心’扣种类识别问题[2] .近年来纹理于:元树复数小波的方法[6 】、基于小波
包的方法[7] . Gabor 滤波模拟人的视觉系统,具有旋转不变性,虽然文种
识别的种类和准确率都较高,但是计算最较大;小波变换具有独特的快速算法,大大减小了计算最但每一级多分辨率分解只能提取图像在 3 个方向的特征,识别率不高;基于小波共生直方图的方法提高了识别率,但它是在小波
分解的基础上进行共生南方图的计算,速度慢,特征维数高,图文本图像分析
系统 Figure l System of documentimageprocessing现有方法在运算速度利识
别效果上的矛盾无法满足实际应用的需求,为解决这 JVJ 题,本文提出了基
于基本图像特征的方法.纹理描述结构法的基本理沦认为复杂的纹理可由一些简译的纹理基元(基本纹理元素)以一定的有规律的形式排列组合而成[8] .该
方法涉及两个关键问题,一是如何确定纹理基元,,:是如何建立排列规则.总之,目前并没有标准的纹理基元集合,一般认为—个纹理基元足由一
组属性所刻画的相联通的像素集合.最简单的基元就是像素,其属性就是灰度,相对复杂的基元是 1 组均匀灰度相连的像素集合,这样的纹理基元可根据尺寸、方向、形状或甲均灰度等来描述.为7种不同类型,这 7 种纹理基元的集合称为基本图像特征(basicimagefeatures, BIFs).基本像特征(BIFs) 是根据:
阶高斯衍生滤波器纽 (2ndsecondorderfilter bankofGaussian斯衍生滤波器组对图像的局部特性十分敏感,能很好地反应出不同几何结构的纹理区域,高斯衍生滤波器组个高斯衍生滤波器组成,如图 2 所示:高斯衍生滤波器的一维
表达式为一套G4(x)=(27LU2)2e。

z (1)≥G。

(z)=(孑亨专)“Hi)(z)(2)式巾,上标仃为滤波器的尺度参数,下标佗表示G嚣(x)的 n 阶导数, H 。

为埃尔米特多项式(Hermite G7_nn(z,们 =G%(z)G三(Ⅳ)
(3)”localjet”≤2local jet计算以下两个参数: A = u2 (S20 + S02) -y=a2 、
/露 i 『二■ +4S11 Goao(x,y) (a) 零阶高斯衍生滤波器 (a) zeroth-order gaussian derivativefilter Giao(x,力 OOaLfL 。

’1 (b) -阶高斯衍生滤波器 Two first-ordergaussian derivarivenlters蘸鬻搿3‘;溅Ⅸ {藜鞫■麟i 墨黪黎黧曛瓣
—_~ (c)二阶高斯衍生滤波器 Threesecond-ordergaussian derivative filters BIFs滤波器组 Filter bankusedtocalculateBIFs然后根据忙s 。

,2 盯~ / s
孔十瑶l ,A ,-A ,2i (, y 一”,{7+入7}7个参数的最大值确定像素点所对心58应用科学学报第29 卷的纹理基元.其中, E 为固定参数,可根据不同需要在(0, 1)范围内取值, ESOO 对应图像中的平坦(flat) 区域,
2a~ / s}o+s31 对应坡型(slope) 区域,土入对应明暗点(dark/lightBlob) ,22(y 士¨对应明暗线(dark/light Line) , 7 对应鞍型(saddle) 区域,共 7 种BIFs ,分别用不同颜色表示,如图 3 所示. ESOO ,2d 诟五干品,bz%
土 ),x曩吧 n豳图 37种BIFsFigure 3Sevenkindsof basicimagefeatures 3 基于BIFs 的文种识别 3.1 特征提取按第 2 节所述方法计算文本图像,( z ,可)的高斯衍生滤波器组响应” localjet ” ,由此求出相应参数,从而确定像
素点所对应的BIFs.本文根据BIFs 的对』遁关系,进行图像编码得到 C ( z ,可),如图 3 所示.码字1r\)7分别对应 7 种BIFs: 平坦、坡犁、暗点、明点、暗线、明线、鞍犁.烈,却是正赢不觏,饱彦真诚地匀以为认识了链胂
种目的,饱在他墨所雪.弗对,有时候盛脯垂懑H 睦悒固执地寻觅备案· 叁的.擞 } 有熙人在一种鹰:的计翻悬潦不可湃豹!”人,覆应卷认识他镟事彰
黼瓣麓戮F 躐蝴≤戮渊鹾憋㈣璃.麓图 4BIFs 编码示例 Figure4Exampleof basicimagefeaturescode为了描述纹理基元的组成,需要对不同码字的个数
进行统计.文字区域不包括平坦部分,所以只需统计2 ~7 码字的数目即可
y=N 一1x-M 一1Pm=∑ ∑ pmcx ,可)m=2,3,… ,7(4) 可_0x-0 pm(x ,可 ) :o , C(x ,可) ≠ml , C(x ,可 )=mm=2, 3 ,… , 7式中, M和Ⅳ 分别为
图像的高度和宽度,为了便于计算,将 Pm 进行归一化处理 i-2同时,本文采
用共生矩阵对 C(x ,可)提取反映纹理基元空间排列规则的特征,同样,码字 1 不参加计算,共生矩阵的数学表达式为 i ,J=1 , 2 ,… , 6(6)
q~x,Ay(x'y) = C(x +Ax,y+Ay) =j +1 0,else MA。

,Ay ,。

,j 是大小为 6x6 的矩阵,表示点( z ,可)和点(z+ △z ,y+ △们码字对数目的统计,式(6) 将
对空问排列规则的描述转化为对空间位置上码字对的描述.计算
00 , 450 , 900 , 1350 这 4 个方向上且iJ (△x ,△y )取(0 , 1), (1 ,
1) , (1, 0),( -1 ,1 )时的共生矩阵,提取共生矩阵的能量、对比度、均匀性和相关性作为描述空间排列规则的特征,能量(energy) E,Xx,△y=
∑MAx.△y(i,j)2 i,j对比度(contrast) CA 。

,△, = 芝二 li=iI2MA 。

,△可(i ,J) 0,,均匀性(homogeneity) 相关性(correlation) ax)(j-ay)MAx,△y(i,j) SxPy式中, a 。

, ay ,Px ,py 分别为 MA 。

,Ay(i ,J)行和列的均值和方差.按
上述方法对文本图像提取纹理基元组成以及空~誓一 n一巳栅蛳■眦囊 II,-.'r-,'NH-<黹∑ Ⅵ11 △&Gc-l ∑ Ⅵ= △ ∽ △L的纹理基元.其中, E 为固定参数,可根据不同需要在(0, 1)范围内取值, ESOO 对应图像中的平坦(flat)区域,2a~ /s}o+s31 对应坡型(slope) 区域,土入对明点(dark/lightBlob) , 22(y 士¨对应明共种BIFs分别用不同颜色表示,如图 3 所示.3 7种BIFs 3 Seven kindsof basicimagefeatures基于BIFs的文种识别 3.1特征提取按第 2
节所述方法计算文本图像,( z ,可)的高斯衍由此求出相应参数,暗线、明线、鞍犁.烈,却是正赢不觏,饱彦胂种目的,饱在他墨所雪.弗对,有时
候盛脯垂懑H睦的.擞}有熙人在一种鹰的计翻悬潦不可湃豹!”黼瓣麓戮F躐蝴≤戮渊鹾憋㈣璃4 BIFs 编码示例 Example of basicimagefeaturescode为了描述纹理基元的组成,需要对不同码字的个数进行统计.文字区域不包括平坦部分,所以只需统计~7码字的数目即可 y=N一1 x-M Pm=∑pmcx ,可)
m=2,3,…,7(4)可_0x-0 oC(x ,可) ≠mC(x ,可 )=m m=2和Ⅳ分别为图像的高度和宽度,为了便于计算,将Pm进行归一化处理 i,J=16 (6) C(x +Ax,y+Ay) =j +1 0, else点(z+△z,y+△们码字对数目的统计,式(6) 将对空问排列规则
的描述转化为对空间位置上码算004509001350这 4个方向上且
iJ△x△y )取(0 , 1), (1 , 1) , (1, 0),( -1 ,1 )时的共生 E,Xx,△y=
∑MAx.△y(i,j)2 0,均匀性(homogeneity)相关性(correlation) ax)(j-ay)MAx,
△y(i,j) SxPy式中,aay,Px ,py 分别为 MA 。

,Ay(i ,J)行和列的均~誓n
巳栅蛳眦囊 II ,-. ' r-, 'N H -<黹Ⅵ 11△ & G c-l∽ L龙等:基本图像特征用于文本图像文种识别 59 I 、日 J 排列规则的两类特征,得到 22 维特征向最 FU={Rt) ,弼,磺,磁,磁,群, Efo,cfo,G70,L70,Egi,C01,G; 1,Lgi,E' i,C' i,G'L11,L'i}为了降低字体大小、格式、噪声和笔画断裂等冈素对算法造成的影响,从 2 个尺度(盯 =1 ,盯 =2 )上提取特征,得到 44 维特征向量 F=[Fl ,F2l.3.2训练和分类支持向量机(support vectormachine , SVM) 是 EbAT&T Bell实验窒的Vapnik 等人根据统计学习理论提出的一种机器学习方法,通过非线性变换将输入空问变换到一个高维空间并在该高维空间中求取最优线性分类面,根据结构风险最小化准则,在使训练样本分类误差极小化的前提下,尽量提高分类器
的泛化推广能力.本文选用支持向量机(SVM) 作为分类器,采用径向基函数(RBF) 作为支持向最机的核函数,将所有训练样本所提取的特征用SVM 进行
训练,进而对测试样本进行自动分类. 3.3 算法步骤将本文算法步骤总结如下:步骤 1计算图像在两个尺度(盯 =1 ,盯 =2 )上的高斯衍生滤波器组响心” localjet ” ,步骤 2根据” localjet ” 计算参数入和
1 .步骤 3按 ESOO ,
2 盯、/瑶i ■露 1 ,士A ,2 一{ ( 7 土入),7) 中的最大值 (E=0.1) ,将像素点划分到对应的BIFs 中.步骤 4 按照BIFs
的对应关系,将图像编码得到C(x ,可 ),统计码字 2 ~7 的个数 Pm ,计算 C(x ,可 )在 00 , 450 , 900 , 1350 这 4 个方向上的共生矩阵MAx,Ay(i ,J)步骤 5将 Pm 归一化后得到 R 。

,并计算矩阵M△。


Ay(i ,J) 的能量、对比度、均匀性和相关性得到 44 维特征 F=[Fl, F2l.
步骤 6将训练样本集提取的特征用SVM 训练,训练完成后,再对测试样本进行分类,得到识别结果. 4 实验结果实验图像是从报纸、杂志和书籍上扫描得到的文本图像,其字体格式及大小均不同,且有不同程度的倾斜、噪声、
笔画断裂等质量退化现象.包含英、中、俄、日、韩、阿拉伯、印度、缅甸、柬埔寨、减文 10 种文种,每种文种图像 300 幅,共 3000幅实验图像,如图 5 所示(由于版面限制,只列出6 种文种图像) ?garden, awaytrom
\ne ‘砹何破捉住,她丈夫g man, saying,\Vhereare ’的心,疑恨她,她
并跨 because Iwas without d面伊法十分之一作供象 ou theknowledgethatyc
是思念的素祭.使人是 mich rsaidyou,were not f要把圣水盛在瓦器里, me,sheg 吖emethefiuit头散发,站在耶和华西 a haveyou.done' And 也手里拿着致咒谓的苦外 ;t An:ltheLord(jodsaid (b) 中文 (a) 英文(: )chinese(a) EnglishU 砖 cmV(aa*P:umeB:aic 功瑁嚼pe 瑚: BrrFmWP 印班助藿 B03JIO)K{Vl)HM BXOWITB fBOCBSITWIHI. CbHrMJih 碑珈eB 城、郎yKeq:orIyB 幻TOflOBb!yorBewrH (c) 俄文fc)Russian 昔譬财旦1_工导,删咎叫 1爿 01旦7]
暑6}早告q 立舛04, 萼斗,吲司珥,畸及珥,巷鄙。

嘈珥,巷斟舛耍q1- 翎斟巷,O}叶Dpla+, 呈醉哥珥,甘早{3叫 1 71l 砷叶黠c{ al)71L+OJ 辱鲁珥方 1割普鲁珥,07 十普q q 01 半量7}畸9- 只● 李剿i:- 删N.V)u; 最七幺々奄. = 订皋眩良一≮ ~ . tjc 傍点、弓L垒爱序 ^ .b ¨ fg口事 iel| 舢
r%gki:~ . Ic 南占。

-tL 它磷谚l:与是茜 b 、乇∞ ,j, i~ 、,: D 俩
方两蜓fd)日文(d)Japanese ·{f_LJJJ:_04-'1s 山—丫、 S 、如.0u716jI≯山一土Ii』 bJ 乜嘻k ),掣山声o ●直丑aJ'L牮 L'Jo了 Ack 掣JK草奠q — J,UbUl “i≮p :J “ Jcu
7 .。

;(e)韩文 (f) 阿拉伯文(e) Korea (f)Arabic 图5 实验图像Figure
5Examplesof experimentalimages算法的评价指标为识别效率与识别效果两
个方面.识别效率主要利用算法对单幅图像的特征提取时间 T 、特征维数 D 来衡量,识别效果采用查全率珏和查准率 TP 来衡量,且 TR : t77,r , TP- —mrmt rrzr 十? 7Iu 式中, m 。

为该文种正确识别的样本数,,, t。

为误粕为该文种的样本数, mt 为该文种的测试样本数.实验时用SVM 从特征库巾每种文种随机抽取100幅用于训练,余下的 200 幅用于测试,为了避免样本差异对算法的影响,共进行 5 次实验,以 5 次实验的平均值作为识别结果.同时,为了验证算法的有效性,将实验结果与基于小波共生直方图的方法【5]进行比较,本文在Intel2.40GHz处理器、512MB 内存的Windows XP Professional 微机环境下,以MallabR2007b 为实验平台进行实验.表 1 为算法的识别效率比较结果.表 2 是 10 种不同语言文本图像的实验结果. I、日J排列规则的两类特征,得到 22 维特征向最 FU= {Rt)弼,磺,磁,磁,群, Efo,cfo,G70,L70, Egi,C01,G; 1,Lgi, E' i,G'L11,L'i}为了降低字体大小、格式、噪声和笔画断裂等冈素对算法造成的影响,从 2 个尺度(盯 =1 ,盯 =2 )上提取特征,得到 44 维特征向量 F=[Fl ,F2l. 3.2训练和分类支持向量机(support vectormachine , SVM) 是提出的一种机器学习方法,通过非线性变换将输入空问变换到一个高维空间并在该高维空间中求取最优线性分类面,根据结构风险最小化准则,在使训练样本分类误差极小化的前提下,尽量提高分类器的泛化推广能力.用径向基函数(RBF) 作为支持向最机的核函数,将所有训练样本所提取的特征用SVM 进行训练,进而对测试样本进行自动分类. 3.3算法步骤将本文算法步骤总结如下:步骤 2根据计算参数入和1 .按ESOO盯/瑶i■露 1 ,士A ,2土入) 7) 中的最大值 (E=0.1) ,将像素点划分到对应的BIFs中.步骤 4在个方向的生矩阵 MAx,Ay(i ,J)归一化后得到 R 。

,并计算矩阵44维特征 F= [FlF2l.步骤 6实验结果实验图像是从报纸、杂志和书籍上扫描得到的文本图像,其字体格式及大小均不同,
且有不同程度的倾斜、俄、日、阿拉伯、印度、缅甸、柬埔寨、减文 10 种文种,每种文种图像 300 幅,共 3000幅实验图像,如图 5所示由于版面限制,只列出6 种文种图像) ?garden, awaytrom \ne ‘ man, saying,
\Vh ereare ’ theknowledgethatyc mich rsaidyou,were not me, sheg 吖emethefiuit haveyou.done' And 也 ;t An:ltheLord(jodsaid英文 ()chinese English U砖cmV(aa *P:umeB:aic 功瑁嚼pe 瑚BrrFmWP印班藿
B03JIO)K{ Vl)HM BXOWITB fBOCBSITWIHICbHrM Jih碑珈eB 城、郎y K eq:orIyB 幻 TOflOBb! yorBewrH (c) 俄文 fc) Russian昔譬财旦1_工导,删咎叫
1爿旦7]暑6}早告q 立舛04,萼斗,吲司珥,畸及珥,巷鄙。

嘈珥,巷斟舛耍q1- 翎斟巷,O}叶Dpla+, 呈醉哥珥,甘早{叫1 71l砷叶黠c{ al)71L+OJ辱鲁珥方 1
割普鲁珥,07 十普 q q 01 半量7}畸9- 只● 李剿i:-删N.V)u;最七幺々
奄. = 订皋眩良一≮~t jc 傍点、弓口事 i e l| 舢 r%gki: ~Ic南占-tL它磷谚i~D 俩方两蜓 fd)日文 (d) Japanese·—丫、S如0u71 6j≯山一土Ii』 bJ 乜嘻k ),
掣山声o ●直丑 aJ'L了Ack掣JK草奠q—,UbUl“i≮p:JJcu7.。

; (e) (f)阿
拉伯文 Arabic5实验图像 5 Examples of experimentalimages间 T特征维数 D 来衡量,识别效果采用查全率珏和 TRt77,rTP—mr mt rrzr十?7I u式中, m 。

为该文种正确识别的样本数,,, t。

为误粕为该文种的样本数, mt 为该文
种的测试样本数.实验时用SVM 从特征库巾每种文种随机抽取幅用于
训练,余下的 200 幅用于测试,为了避免样本差异对算法的影响,共进行
5 次实验,以 5 次实验的平均值作为识别结果.同时,为了验证算法的
有效性,将实验结果与基于小波共生直方图的方法【5]进行比较,文在Intel 2.40GHz处理器、 512MB 内存表为算法的识别效率比较结果.表 2 是 10 种
不同语言文本图60表 l 识别效率比较 TablelCompa risonof theefficiency┏ ━ ━
━ ━ ━ ━ ┳ ━ ━ ━ ━ ┳ ━ ━ ━ ━ ━ ┓ ┃ ┃ D┃ T/s┃ ┣ ━ ━ ━ ━ ━ ━ ╋ ━ ━ ━ ━ ╋ ━ ━ ━ ━ ━
┫ ┃本丈方法 44 0.168文献【 5 】384 0.442┃ ┗ ━ ━ ━ ━ ━ ━ ┻ ━ ━ ━ ━ ┻ ━ ━ ━ ━ ━ ┛表 2 文种识别结果Table2Comparisonof theexperimentalresults Vo┏ ━
━ ━ ┳ ━ ━ ━ ━ ━ ┳━ ━ ━ ━ ━ ┳ ━ ━ ━ ━ ━ ┳ ━ ━ ━ ━ ━ ┓ ┃ ┃┃ ┃ TP┃ ┃ ┣ ━ ━ ━ ╋ ━ ━ ━ ━ ━ ╋ ━ ━ ━ ━ ━ ╋ ━ ━ ━ ━ ━ ╋ ━ ━ ━ ━ ━ ┫ ┃ ┃本义 J 法文献【 5】本文方法┃ ┣ ━ ━ ━ ╋ ━ ━ ━ ━ ━ ╋ ━ ━ ━ ━ ━ ╋ ━ ━ ━ ━ ━ ╋ ━ ━ ━ ━ ━ ┫ ┃英 99.9 96.0 98.6 98.0中 99.5 97.6 98.9俄 100 95.6 99.7【 J 98.5 97.4 98.1韩 98.8 99.6 96.5
阿 95.0印 99.8 99.0柬 99.3 97.0缅藏 97.5平均┃ ┗ ━ ━ ━ ┻ ━ ━ ━ ━ ━ ┻ ━ ━ ━ ━ ━ ┻ ━ ━ ━ ━ ━ ┻ ━ ━ ━ ━ ━ ┛从表 1 和 2 可看出,基于基本图像特征法的运算速度比小波共生赢方图法【 5]提高近 1.5 倍,同时,提取的特征维数大大降低,识别结果平均提高了近2% .H文和韩文的查全率略低于其他文种,这是由于
日文和韩文笔画单一结构简单,纹理特征与其他文种相近. [rl 文、日文的查准牢略低是由于日文中含骨部分的汉字,在日文中汉’ f 较多或中文中结构简 F' .的文宁较多的情况下,存易使两类文种纹理相近,造成误谚 {.英文
单词由拉丁字母构成,在其他文种(例如俄文)含有大量拉丁字母,而本文种特有的字母较少时,也会误判为英文,导致英文查准牢略低. 5 结语组对
图像的噪声有较好的鲁棒性,能从两个尺度提取图像特征,实验结果表叫本文
算法对宁体大小、格式,噪声,笔画断裂等现象具有较好的鲁棒性,参考文献:[1]AIRAMIS, MANJULAD.Asurveyof scriptidentifica- tiontechniquesfor
multi-scriptdocumentimages[J].InternationalJournalof RecentTrendsin Engineer-ing,2009,1(2):246-249. [2]BUSCHA,BOLEsWW, SRIDHARANS.Texturefor script identification[J]. IEEEIYansactionson Pat- tern AnalysisandMachineIntelligence,2005,27(11): 1720-1732.【 3 】TANTN.Rotationinvariant texturefeaturesand theiruseinautomaticscriptidentification[J].IEEE Transactions
onPatternAnalysisandMachineIntel- ligence,1998,20(7):751-756.【4 】曾理,唐远炎,陈廷槐,基于多八度小波纹理分析的。

≯ 种类自动识别|J 】.计
算机学报, 2000,23(7):699- 704.ZENGLi,TANGYuanyan,CHEN Tinghuai. Multi- scalewavelettexture-based
scriptidentificationmethod[Jl.ChineseJournalofComputers,2000, 23(7):699-704.(inChinese) [5 】 HIREMATHP S,SHIVASHANKAR S.Wavelet basedco- occurrence histogramfeaturesfor textureclassifica- tionwithanapplicationtoscriptidentificationin
adocumentimages[J].PatternRecognitionLetters, 2008,29(9):1182-1189.【】朱华光,平西建,程娟,基于二元树复数小波变换的文种白动识别
IJ 】.数据采集与处理, 2008 , 23(6): 766-712. ZHUHuaguang,PING Xijian, CHENG Juan.Auto-maticscriptidentificationbasedondual-treecom- plexwavelettransform[Jl.Journalof DataAcquisi-
tionandProcessing,2008,23(6):766-712.(inChi-
nese)PADMAMC,VIJAYAPA.Entropybased featuresusefulfor automaticscriptidentification[Jl.InternationalJournalonComputerSciencean dEn-gineering, 2010,2(2):115-120. TUCERYAB M,
JAINAK.Texturesegmentationusing voronoi
polygons[J].IEEETransactionsonPatternAnalysisMachineIntellegence,1990,1
2(2):211-216.[9] GRIFFIN LD.The2ndorderlocal-image-structure
solid[Jl.IEEE'IyansactionsonPaternAnalysisMan-
chineIntellegence,2007,29(8):1355-1366. 110]本文提出的基于基本图像特
征的文种识别算法是将纹理基元划分为 7 种类型,分别对图像纹理基元组成比例以及其空间位置关系进行描述,有效地提【11]取出反映不同文种文
本图像纹理差异的特征,并采用SVM对提取的特征进行训练和分类,从而实现了多文种的识别,该算法在计算速度提高的同时大大减少了特征维数,识别效果也有所改善,高斯衍生滤波器 L D, LILLHOLM
M.Symmetrysensitivitiesof derivative-of-Gaussianfilters[Jl.IEEETransactions onPatternAnalysisand MachineIntelligence,2010, 32(6):1072-
1083.CROSIERM, GRIFFINLD.Textureclassificationwith dictionaryof basicimagefeatures[C]//IEEECon-ferenceonComputerVisionandPatternRecogni-tion,2008,1-12:2502-2508.编辑:管玉娟)l识别效率比较Table Comparison of theefficiency┏━┳┓┣╋┫文献【】┗┻┛文种识别结果 of theexperimentalresults5】从表 1 和 2 可看出,基于基本图像特征法的运算速度比小波共生赢方图法【 5]提高近 1.5 倍,同时,提取的特征维数大大降低,识别结果平均提高了近2% . H文和韩文的查全率略低于其他文种,这是由于日文和韩文笔画单一f较多或中文中结构简 F' .的英文单词由拉丁字母构成,在其他文种(例如俄文)含有大量拉丁字母,而本文种特有的字母较少时,结语组对图像的噪声有较好的鲁棒性,能从两个尺度提取图像特征,实验结果表叫本文算法对宁体大小、格式,噪声,笔画断裂等现象具有较好的鲁棒性,参考文献: [1] AIRAMI S, MANJULAD.Asurveyof scriptidentifica- tiontechniquesfor multi-scriptdocumentimages[J]. InternationalJournalof RecentTrendsin Engineer- ing,2009,1(2):246-249. [2] BUSCH A, BOLEs W W, SRIDHARAN S. Texture for IEEE IYansactions on AnalysisandMachineIntelligence,2005,27(11): 1720-1732.】 TAN T N. Rotation invariant features theiruseinautomaticscriptidentification[J].IEEE Pattern AnalysisandMachineIntel- ligence,1998,20(7):751-756.】曾理,唐远炎,陈廷槐,基于多八度小波纹理分析的。

≯ 种类自动识别|J 】.计算机
学报, 2000,23(7):699- 704. ZENG Li, TANG Yuanyan, CHEN scale wavelet texture-based identification method[Jl.ChineseJournalofComputers,2000, 23(7):699-704.(inChinese) [5】 HIREMATH P S.Wavelet basedco- histogramfeaturesfor textureclassifica- tion with an applicationtoscriptidentificationin images[J].PatternRecognitionLetters, 2008, 29 (9): 1182-1189.】朱华光,平西建,程娟,基于二元树复数小波变换的文种白动识别IJ 】.数据采集与处理, 2008 , 23(6): 766- 712. ZHU Huaguang, Juan. Auto- maticscriptidentificationbasedondual-treecom- plex transform[Jl.Journalof DataAcquisi- tionandProcessing,2008,23(6):766-712.(inChi- nese) PADMA M C, VIJAYA A. Entropy based featuresusefulfor automaticscriptidentification[Jl. InternationalJournalonComputerScienceandEn- gineering, 2010,2(2):115-120. M, JAINAK.Texturesegmentationusing
polygons[J].IEEETransactionsonPattern AnalysisMachineIntellegence,1990,12(2):211-216. [9] D. The 2nd order local-image-structure solid[Jl. 'IyansactionsonPaternAnalysisMan- chineIntellegence,2007,29(8):1355-1366.本文提出的基于基本图像特征的文种识别算法是将纹理基元划分为 7 种类型,分别对图像纹理基元组成比例以及其空间位置关系进行描述,有效地提对提取的特征进行训练和分类,从而实现了多文种的识别,该算法在计算速度提高的同时大大减少了特征维数,识别效果也有所改善,高斯衍生滤波器 M.Symmetrysensitivitiesof derivative-of-Gaussianfilters[Jl.IEEETransactions Analysis MachineIntelligence,2010, 32(6):1072-1083. CROSIER M, GRIFFINLD.Textureclassificationwith。

相关文档
最新文档