基于模糊模型相似测量的小类别数汉字及数字识别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2000.11计算机工程与应用
1引言
汉字是一种结构性的字符,因此汉字识别一般均采用“特
征提取+分类器”
的方法[1-4],即先提取字符的轮廓特征和局部结构特征分别作为其粗分特征和细分特征,再通过设计的相应粗分类器和细分类器进行分类识别。
但是由于特征提取的过程实质上是对汉字信息的变换和压缩过程,其处理过程中必然会损失一定量的原始信息,其中包括本可用来分类识别的有用信息,这显然不利于汉字的识别效果。
如果建立以象素描述的汉字模板库并用统计模板匹配的识别方法,就能避免汉字特征提取过程中有用信息的损失,识别效果一定很好。
但汉字的数量大(国际二级汉字有6763个)
,且有的字形十分类似,在这种汉字模式类别多、模式类间距离近的情况下,其计算代价将十分高昂。
因此如果采用统计模板匹配的汉字识别方法,必须考虑在减少处理过程中有用信息损失的同时降低计算代价。
文章提出了一种基于模糊相似测量的汉字分类识别方法,该方法直接对汉字的二值化图像采用模糊逻辑方法转换成基于非线性加权相似函数的模糊样板,然后通过分类模糊模型的统计,相似性测量样板的分级组合和基于规则的分类,能有助
于减小噪声的影响、限制样板库容量的迅速增加和加快汉字分类识别速度。
在对小类别数多字体汉字识别的实验中,取得了良好的分类识别效果。
2相似测量及模糊模型的相似测量
2.1相似测量
相似性是模糊理论的一个抽象概念,它提供了两变量关系的定量测量。
假设A 、B 为大小m=列数X 行数的图像,
也就是:A={a ij \1!i !列数,1!j !行数}和B={b ij \1!i !列数,1!j !行数},且A 、B 分别表示集合A 、集合B 的基数。
则A 、B 的相
关系数!(A ,B )
可表示为:!(A ,B )=!
(a ij
-a'ij
)b ij !
a 2
ij -!b 2
ij
"(1)
式中:a'ij 为a ij 的余数。
若A 、B 为二值图像,1和0分别表示图像和图像的背景,考虑对称性,即:
*
该课题得到国家自然科学基金和江苏省教委留学回国人员科研基金资助。
作者简介:卢达,副教授,主要研究方向为模式识别和图象处理。
谢铭培,复旦大学计算机科学系教授,中国人工智能学会副理事长,研究领域包
括:人工智能,图象识别,计算机自动控制等。
基于模糊模型相似测量的小类别数汉字及
数字识别*
卢
达
浦
炜
钱忆平
常熟高等专科学校(江苏常熟215500)
谢铭培复旦大学计算机科学系(上海200433)
E-maiI :*************.cn
摘
要
文章提出了一种基于模糊相似测量的小类别数多字体汉字及数字识别方法。
该方法通过模糊逻辑处理,直接
将字符的二值化图像转换成基于非线性加权相似函数的模糊样板,然后通过分类模糊模型的统计,相似性测量样板的分级组合和基于规则的分类进行识别。
实验表明,该方法用于小类别数多字体汉字及数字识别的效果良好。
关键词
模糊模型
相似测量
字符识别
小类别数汉字识别
Small Set Chinese Character and Digit Recognition Based on
Similarity Measure of Fuzzy Model
Lu Da Pu Wei (ian Yiping (Changshu CoIIege ,Changshu 215500)
Xie Mingpei
(Department of Computer Science ,Fudan University ,Shanghai 200433)
A bstract:
this paper presents a method to recognize digit and smaII set and MuIti-font Chinese character based on
simiIarity measure of Fuzzy ModeI.this method can transform binary images of character directIy into fuzzy prototypes
based on a nonIinear weighted simiIarity function by fuzzy Iogic approach ,then uses the statisticaI fuzzy modeI for cIas-sification ,the hierarchic grouping of fuzzy prototypes of simiIarity measurement and a ruIe-based cIassifier.the experi-ments show this method is effective when used for smaII set Chinese character and digit recognition.Keywords:fuzzy modeI ,
simiIarity measure ,character recognition ,smaII set Chinese character recognition 78
计算机工程与应用2000.11
(A ,B )= (B ,A ),则公式(1)可改写为: (A ,B )=
(a ij D ij -12a*ij D ij -12a ij D*ij ) a 2
ij
D 2
ij
(2)
式中:权1/2用于-1到+1范围相似性的标准化。
设D A 和D B 分别表示集合A 和集合B 的基数。
即D A =A ,
D B =B ,
同时设X=A D B 表示A 和B 中的公共象素,而m 为A 和B 中元素的总和,
即m=A +A*=B +B*=列数X 行数,则公式(2)可改写为:
(A ,B )=
(a ij D ij
-12a*ij D ij
-12
a ij
D*ij
) a 2
ij
D 2
ij
=
2X-12D A -12D B
D A D B
(3)显然公式(3)为线性函数。
由于匹配是基于两图像交点的百分数,公式(3)就存在一个问题,即不匹配元素的位置没有被考虑,而相似测量必须考虑象素位置的不同,为此作者提出了一非线性加权相似函数,将公式(3)改写为:
(A ,B )=
(a ij D ij -12 ij D ij -12 ij a ij ) a 2ij
D
2ij
(4)
式中:权 ij 、 ij 分别表示象素(i ,j )到图像A 、B 的测量距离,而
={ ij I ij =maX (c 4(a ij )-1,0)}(5) ={ ij I ij =maX (c 4(D ij )
-1,0)}(6)
式中:c 4(a ij )、c 4(D ij )表示象素a ij 、D ij 分别到图像A 、B 的城市街区距离,而式中c 4(a ij )及c 4(D ij )减去1是因为将沿着图像A 、B 轮廓线的一个象素考虑为噪声容差。
2.2模糊模型的相似测量
由两二值图像间的相似测量扩展到模糊模型,两模糊样板
间的相似测量描述如下:
定义:设E 2为二维欧几里德空间,则位于E 2中的模糊模型 是有序对的一矩阵,即 ={(p ij ,X ij )},其中p ij 代表一象素,X ij 代表相应象素的图像的隶属值,范围为[0,1]。
命题1:假设一模糊样板 由连体二值图象{A 1,A 2,…,A D }的集合组成,集合中元素用a ij 表示, 中各元素的隶属值计算如下:
X ij =
Z A a E A a ij
m
(7)
命题2:设 1={p ij ,X (1)
ij }和 2={p ij ,X (2)
ij }为E 2中两个模糊样板。
={ (1)ij }和 ={ (2)
ij }为对应于 1和 2的权函数,
1和 2的相似测量定义如下:
( 1, 2)=
(X (1)
ij /X (2)ij
-12 (1)ij X (2)ij -12 ij (2)X (1)ij
) X (1)
ij X
(2)
ij
(8)
式中:/为交运算符号,即: 1D 2={p ij ,X (1)
ij /X (2)
ij }而X (D)
ij (D=1,2)
表示自交运算X (D)
ij /X (D)
ij 。
命题3:假设模糊样板 由(5)式所得权函数为{ A , A ,
…, A }的连体二值图像{A 1,A 2,…,A m }的集合组成, 的权函数
( )定义为:
ij =Z E
ij
m
(9)
式中: ij 为 A , A ,…, A 中的元素。
3实现技术
3.1分类识别过程
文章所提出的汉字识别过程为预处理、基于模糊相似测量的匹配算法和基于规则的分类。
预处理包括平滤、去噪、二值化、文本行切分和文本行中字符切分等,作者采用BlurriDg 技术代替平滑[5],考虑到汉字形体结构复杂,因此在去除孤立噪声时,应注意滤波窗口大小的选择需适中[6],以下将主要介绍匹配算法和规则分类。
3.2匹配算法
两给定模糊图形A 和B 若相似,它们应该有相似的几何
性质;若两图形不一样,则无法判定最佳匹配。
相似测量可通过图形质心匹配计算,此计算过程中,由于噪声的存在必须考虑容差,算法描述如下:
(1)计算A 、B 的质心C A 和C B :
C A = jX (A )ij X (A )ij , iX (A )ij X (A )ij ,和C B = jX (B )
ij X (B )ij , iX (B )ij X (B )
ij
,(10)(2)根据最小距离C A C B ,计算A 、B 的相关系数 (A ,B ),也就是: (A ,B )由图形A 作 、 移动推导而得:
(A ,B )=
(X (A)ij
/X (B)i+ ,j+
-12 (A )ij X (B )i+ ,j+ -12 i+ ,j+ (B )X (A )ij
) X (A )
ij
X (B )
ij
(11)
式中: =rouDc(X C -X C ), =rouDc(y C -y C )
若相关系数 高于一阈值,比如高于0.95,A 和B 可认为相同。
(3)若 在临界范围内,比如0.8540.95,则 (A ,B )的值由 、 在如下范围内求得:
-(X C -X C )S 1和 -(y C -y C )S 1(12)
若X C -X C 和y C -y C 的值不是整数,则 、 需作三个以上位置的匹配运算,其中若有一次 大于0.95,则A 和B 相同,否则A 和B 为不同。
第三步描述的模糊推论是因为在临界范围内相似性是不确定的,但如果是因噪声引起图形质心的失真可通过移动一图形来获得较好的匹配。
3.3规则分类
考虑到文本中所有字符样板放在同一任意序列中,其匹配
是低效率的。
为此作者采用分级分类法,见图1。
在图1中,分
级树的叶节点C i 表示初始文字图象,L i 表示相应一文本行的
模糊样板集合,也就是把文本行看作分类过程的一个单元,而与各文本行相关的模糊样板集合分级组合,这便于文字大小的比较,若两文本行文字大小不一样,模糊样板集合相应分离成
两子集且匹配不能完成[7]。
分级树的根节点代表整个文本文字的模糊样板的集合。
利用该方法有两个优点,一是相比顺序分类,缩短了匹配过程中的搜索时间;二是具有平行处理能力,即分级树的各节点可同时处理,但也存在这样的问题:在分级树远离根节点处,模糊样板子集仅包含少数元素,因此两子集中相似图形的搜索较简单,但在接近根节点处,因库容量迅速增
79
2000.ll 计算机工程与应用
字体大小3号字4号字5号字6号字各体综合
识别率99.59%99.53%99.48%
98.73%99.36%字体宋体
仿宋体
黑体楷体幼圆体
识别率99.5l%99.59%99.53%99.47%99.54%字体隶书
隶变体
魏碑体
行楷体
识别率
98.78%99.29%
99.l9%
99.l6%
加而有可能使匹配无法进行,为解决这一问题,采用了基于规则的预分类,对两模糊样板 l 、 2,由公式(8)对它们作相似测量,并将相关系数 分成相等测量E 和不等测量I :
E=
!X
(l)ij
A X (2)
ij
!X
(l)ij
X (2)
ij
"
=
O
";I= (l)ij X (2)ij + (2)ij X
(l)
ij
2
"(l3)
式中 、 、 O 为模糊样板 l 、 2、 l O 2的基数。
设: t 为相似测量的阈值, l 为输入模糊样板, 2为文本库中的模糊样板,由 > ,
若当 l D 2,即X (l)ij Z X (2)
ij 时为最佳相等测量。
若下式成立,则 2为可能匹配样板:
E ( l , 2)=
O
"=
"=
"
Z t (l4)
同理,当 < ,若以下不等式成立, 2为可能匹配样板:
"
Z t (l5)
由式(l4),式(l5),可推得规则l :规则l :若 2
t S S
2
t
成立, 2是 l 的可能匹配样
板。
规则2:若两模糊样板宽度差值大于宽度阈值 t 时,两模糊样板不可能匹配。
规则3:
若两模糊样板质心左区域或右区域的列数差值大于阈值C l ,则两模糊样板不可能匹配。
规则4:若两模糊样板质心的上区域或质心的下区域的行数之差大于阈值C 2时,则两模糊样板不可能匹配。
规则5:设
i 为模糊样板 第i 列的隶属值之和,两模糊样板 l 、 2可能匹配的条件是:
t "S !
( i A i+ )(l6)
而 -(X C -X C )S l 规则2、3、4是基于样板的特征。
在分类识别系统中,各样板库根据样板基本特性分类,用规则l 、2、3、4滤去不可能匹配的样板后得到可匹配的样板集合,最后应用基于外形推测的相似测量获得在两维图形中的可匹配样板。
4实验结果及讨论
上述分类识别系统采用C 语言在SUN 4/490工作站U-
NIX 系统下实现。
实验一,从汉字字库中选出6~3号宋体、仿宋体、黑体、楷体、幼圆体、隶书体、隶变体、魏碑体、行楷体中的细、标、粗、特四种的“零壹贰叁肆伍陆柒捌玖拾百仟万亿圆角分整正”简繁体各20个字混合后分别在300dpi 和600dpi 扫描条件下输入,组成共计ll520个汉字的待识字符集进行测试,取得了较好的识别效果。
表l 、
表2为测试结果。
表l
表2实验二,采用美国NIST 数字样本进行测试识别,样本数为3000个,
测试识别率为95.l3%,该测试结果与有关文献采用其它方法的数字识别测试结果比较,效果还是不错的。
根据实验结果:(l )在九种汉字字体中,隶书体识别率相对
较低,这是因为隶书体笔划较粗,笔划之间的水平间距较小,字符二值化处理过程中易受噪声影响而引起笔划粘连,若字体较大则粘连处象素隶属值低很容易用文献[8]所提出的分离算法分开。
(2)字体较小的6号字仍有l.2%的字符不能正确识别,其原因是:较大字符的边界清楚,而字符较小时边界则可能重叠,这是因为较小字符图形样板的基数相对较小,然而印刷、扫描过程中产生的噪声的容差并不受字符大小的影响,因此同类最小相等测量值可能就低,而不同类的不等测量值则可能更小。
为此,相似测量的域值的选取必须由字符大小确定。
一种强调不等测量的方法为:
E-I Z t +CI 式中:C 为一系数。
为使实验主体文本(5号字体)不同类字符确保分类识别,作者在实验中采用C=4、 t =0.88对汉字待识字符集进行分类识别取得较满意的结果。
但在相似测量阈值的选取、如何对边界分级等方面还有待进一步研究和改进,争取会有更大程度上的突破。
(收稿日期:2000年7月)
参考文献
l.Mori S ,Suen C Y ,Yamamoto K.~istoricaI review of OCR research
and deveIopment.proc.IEEE ,l992;80(7):l029-l058
2.Mantas J.An overview of character recognition methodoIogies.pat-tern Recognition ,l986;l9(6):425-430
3.~iIderbrandt T ~,Liu W T.OpticaI recognition of handwritten Chi-nese characters:advances since l980.pattern Recognition ,l993;26(2):205-225
indan V K ,
Shivaprasad A p.Character recognition -a review.pattern Recognition ,l990;23(7):67l-683
5.Ken-ichi Maeda ,
Yoshiaki Kurosawa ,~aruo.~and-printed KANJI Recognition by pattern Matching Method.C~l80l-0/82/0000/0789,l982,IEEE
6.Ray S.A ~euristic Noise Reduction AIgorithm AppIied to ~and-Written Numeric Characters.0678655/88l988,EIsevier Science pub-Iishers B.V.(North-~oIIand )
7.R.G.Casey ,S.K.Chai ,K.Y.Wong.Unsupervised construction of de-cision networks for
pattern cIassification.Research Report RJ 4264,IBM Research Lab.,Sun Jose ,CA ,U.S.A.l982:74-78
8.卢达,
谢铭培等.一种基于骨架法形态分析的粘连字符图像分切方法.中文信息学报,l999;l3(2):40-45
图l 分级分类示意图
80
基于模糊模型相似测量的小类别数汉字及数字识别
作者:卢达, 浦炜, 钱忆平, 谢铭培, Lu Da, Pu Wei, Qian Yiping, Xie Mingpei
作者单位:卢达,浦炜,钱忆平,Lu Da,Pu Wei,Qian Yiping(常熟高等专科学校,江苏常熟,215500), 谢铭培,Xie Mingpei(复旦大学计算机科学系,上海,200433)
刊名:
计算机工程与应用
英文刊名:COMPUTER ENGINEERING AND APPLICATIONS
年,卷(期):2000,36(11)
被引用次数:3次
1.Mori S;Suen C Y;Yamamoto K Historical review of OCR research and development[外文期刊] 1992(07)
2.Mantas J An overview of character recognition methodologies[外文期刊] 1986(06)
3.Hilderbrandt T H;Liu W T Optical recognition of handwritten Chi-nese characters advances since 1980[外文期刊] 1993(02)
indan V K;Shivaprasad A P Character recognition - a review[外文期刊] 1990(07)
5.Ken-ichi Maeda;Yoshiaki Kurosawa,Haruo Hand-printed KANJI Recognition by Pattern Matching Method.CH1801-0/82/0000/0789 1982
6.Ray S A Heuristic Noise Reduction Algorithm Applied to Hand-Written Numeric Characters.0678655/881988
7.R G Casey;S K Chai;K Y Wong Unsupervised construction of de-cision networks for pattern classification 1982
8.卢达;谢铭培一种基于骨架法形态分析的粘连字符图像分切方法 1999(02)
1.米红娟.Mi Hongjuan应用模糊数学方法评价软科学成果[期刊论文]-甘肃科学学报1999,11(2)
2.焦军彩.唐健.JIAO Jun-cai.TANG Jian基于模糊模式识别的高速公路交通事件的自动检测[期刊论文]-常州工学院学报2006,19(2)
3.梁礼明.林元璋模糊模式识别在试卷分析中的应用[期刊论文]-南方冶金学院学报2004,25(4)
4.尉永青.刘培德模糊集技术在网络信息过滤系统中的应用研究[期刊论文]-西藏大学学报2004,19(4)
5.LI Xi-can.李希灿.朱俊芳.杨学昌.周爱民.杨会清模糊模式识别在乔店水库水质评价中的应用[期刊论文]-山东农业大学学报(自然科学版)2006,37(3)
6.陈东升.张银鹤.李宝珍模式识别的Fuzzy统计方法及应用[期刊论文]-数学的实践与认识2004,34(10)
7.高仕龙.GAO Shi-long基于特征融合的车牌汉字识别技术[期刊论文]-乐山师范学院学报2008,23(12)
8.陈颉.朱福喜.CHEN Jie.ZHU Fuxi根据骨架结构相似性的书法内容分层检索[期刊论文]-小型微型计算机系统
2010,31(1)
9.王丰效.李军试卷诊断的模糊模式识别[期刊论文]-汉中师范学院学报2002,20(6)
10.陈守煜.于雪峰相对隶属度与两级模糊识别模型及其在水工评价中应用[期刊论文]-大连理工大学学报2004,44(2)
1.卢达.浦炜.陈琦玮.谢铭培基于神经网络和模糊匹配算法的手写汉字预分类研究[期刊论文]-计算机应用 2005(10)
2.刘洁.张剑清.邓非.徐佳序列影像的高置信度数字识别[期刊论文]-测绘通报 2006(1)
3.薛宏全基于小波分析的车牌识别系统研究[学位论文]硕士 2004
引用本文格式:卢达.浦炜.钱忆平.谢铭培.Lu Da.Pu Wei.Qian Yiping.Xie Mingpei基于模糊模型相似测量的小类别数汉字及数字识别[期刊论文]-计算机工程与应用 2000(11)。