基于Gabor小波变换的汉字识别方法
基于多尺度小波分析的汉字字体识别
( 2)
( 3)
( 1)
f和 D
( 3) 2-2
f网格化为 2 × 2个大小为 8 × 8的网格块 。 然后 ,
( 2)
在这些网格块中 , 提取小波特征 。 如图 3, 是对 D 2 - 1 f 子图像进 行网格化 。
对于单个汉字字符图像 , 字体信息体现在笔画 D 2 - 2 f 和 D 2 - 2 f。 本身的属性上 , 这种信息是一种局部信息 , 而且这个局部信息 是很微小的 。 图像的基本信息都在低频图像 (A 2 - 2 f) 之中 ,
f和 D
( 2)
( 3) 2-2
f。 D
( 3)
( 1) 2-1
f、 D
( 2) 2-1
f和 D
(3) 2-1
f的大小为
16。 在特征提 D 2 - 2 f和 D 2 - 2 f的大小为 16 × D 2 - 2 f、 32 × 32, A 2 - 2 f、
取过程中不考虑包含大量字符信息的 A 2 - 2 f低频尺度空间 , 只 考虑 D
2 3 1 析 ,生成 7 幅 子图 像 分别 为 : D 2 1 D 2 - 1 f、 D 2 - 1 f、 A 2 - 2 f、 D 2 - 2 f、 - 1 f、
( ) ( ) ( ) ( )
格化 , 网格的大小为 8 ×8。 D 2 - 1 f、 D 2 - 1 f和 D 2 - 1 f的大小为 32 ×
细节图像的小波能量的一般表达式 :
N /2 i
式中 , EnergyD P 定义为 D 2 - i 子图像的小波能量比例分布特 征 , EnergyD
( j) 2- i
为子图像 D
的小波能量 。
EnergyD 2 - i =
基于Gabor变换与最近邻分类器的字符识别方法
摘
要 : 学 字 符 识 别 中 , 征 提 取 与分 类 是 最 关 键 的步 骤 , 中 采 用 G br 换 来 提 取 图 像 特 征 , 光 特 文 ao变
结合最近邻分类 器进 行分类识别 , 实现 了对 中文字符 的准确 识别 . 实验 表 明 , 方法具 有较好 的抗 干扰 该
性.
原 图像 中的像素 点 的 映射公 式 为 :
收 稿 日期 :0 00 —0 2 1 -52
作者简 介 : 杨彩霞 (9 2 ) 女 , 16 一 , 河南洛 阳人 , 宝鸡职业技术学 院经济管理系副教授 . 研究方 向 : 汉字字符识别
西安 文理 学院学报 : 自然科 学版
第1 3卷
理 , 次 进行 G br 其 a o 变换 进 行特 征 提取 , 最后 使 用 最 近邻 分 类 器 进行 特征 分 类 . 验 结 果 表 明本 方 法 能 实
够较 有效 地 提取 出字 符特 征 , 并能 有 效地 对字 符进 行分 类 .
1 预 处 理
对 于需要 识别 的各类 字符 , 由于 字符 的大 小 和位置 对 于 字符 特 征 提 取 、 别 具 有不 同 的影 响 , 识 因此 需要 对字 符 图像进 行 归一 化处 理 . 该过 程包 括 位置 归一 化 和大小 归 一化 .
12 字符 大小 归 一化 .
对 不 同大 小 的字符 字 号 的变化 所 引起 的字 符尺 寸相 差 可 能接 近 十倍 , 因此 需 要将 字符 大过 归一 化 图像 中的像 素对应 在 原 图像 中 的点 的位 置 来 决 定 归一 化 图像 中像 素
关 键 词 : ao; C K N G brO R; N 中 图分 类 号 :P 9 T 31 文献标识码 : A
基于Gabor-SVM的文字识别方法
可调 和具 有 最 佳 的 时频 域 分 辨 能 力 。Ga o b r滤 波 器采 用 的 Ga o 变 换是 一类 重要 的 时频 分 析方 法 , br
凭 直觉 在许 多 特征 中选 取 出一 些 可 能 的 分类 能力 强 的特 征用 于汉 字 识 别 ; 因此 , 要 优 化特 征 以提 需
( nigUnv ri f c nea dTeh o g inC l g ”, nig 2 0 4 )Z ,N n j g 20 1 ) Naj ies yo i c n cn l yZj ol e Naj 10 6 (TE n t Se o i e n a gi 1 0 2 n
和 Y方 向上 的标 准差 , 决定 了函数 的空 间 扩展 。以 g x, 为母 小波 , 过对 g x ) ( ) 通 ( , 进行 适 当的 尺 度
重要 特征 的前 提 下 , 缩 冗 余 信 息 , 除 局 部 的 噪 压 清
声, 以利 于后续 特 征提取 的进 行 。
3 2 特 征提 取 .
决定 。在 权衡 计算 的有效 性 和处 理 时 间 的情况 下 , 选择 0 ,5 ,0 ,3 。 4个 方 向对 于字 体 识 别 是 。4 。9 。1 5 这
足够 的 。实践 表 明对大 多数 纹理 特征 的提取 , 以上
w ( , ) I ( 1Y ) S( —X , —Y ) L Y = z ,1 g . l z J 7 C 1
将 G br ao 特征用于汉字识别 , 是将汉字图像看 成一种特殊的纹理 图像 , 使用 G b r ao 滤波器来提取
其特 征 。 由于 同一 个 文 字 的不 同文 本 图像 在 内容
基于Gabor变换的汉字字体识别研究
其 平 均 笔 划 数 是 英 文 字 母 的 十 倍 以 上 I 1 。
汉 字 有 多 种 字 体 , 刷 汉 字 字 体 主 要 有 宋 体 、 宋 体 、 体 印 仿 楷 和黑 体 , 为 四 大 体 , 图 1所 示 。 其 特 征 如 下 : 称 如 ( ) 体 : 形 正 方 , 细 竖 粗 , 划 和 横 、 划 接 折 处 吸 收 1宋 字 横 横 竖 了楷 体 用 笔 的 特 点 , 有 顿 角 , 、 、 、 、 与 竖 划 的 粗 细 都 点 撇 捺 挑 钩 基 本相等 , 尖锋 短而 有力 。 其 ( ) 宋 体 : 摹 仿 宋 版 书 的 字 体 , 形 略 长 , 划 粗 细 基 2仿 是 字 笔 本相 等 , 划 略 向右上方 倾斜 , 笔划 的尖锋 加长 。 横 副 ( ) 体 : 形 类 似 于 手 写 体 , 顿 角 , 划 变 化 较 多 , 划 3楷 字 有 笔 笔
维普资讯
基 于 Ga o b r变 换 的 汉 字 字 体 识 别 研 究
田学 东 郭 宝 兰
( 河北 大 学数 学 与计 算机 学 院 , 定 0 10 ) 保 7 0 2
E— i : d in ma l x t @ma l b .d .n a i h ue uc .
改 善 计 算 机 输 入 信 息 的 能 力 , 成 为 研 究 热 点 。 汉 字 识 别 技 术 已 是 模 式 识 别 技 术 的 一 个 研 究 领 域 , 以 自动 识 别 印 刷 ( 写 ) 可 书 在 纸 张 ( 质 ) 的 文 字 图 像 , 其 转 换 为 相 应 文 字 的 编 码 存 入 计 介 上 将 算 机 , 度 远 远 高 于 手 工 录 入 , 到 了 很 快 的 发 展 。 目前 , 刷 速 得 印
基于Gabor变换的高鲁棒汉字识别新方法
图3
方向的选择性示意图 8 ./0*1 滤波器! 对线条宽度、 ( /)./0*1 滤波器的冲激响应函数在 ;& 轴上的侧视图 8 (0) 对只包含单个线条 (方向为!! "( 45*) 的图像, 当 线条宽度 < 变化时, ( )) 宽度 ./0*1 滤波器的输出变化; 为#= ’ 的线条其方向!变化时, ./0*1 滤波器的输出响应!! &
’
电
子
学
报
’55’ 年
’ ’ ’ & $& $’ $$ "#$ % ( ’ ・ ・ & , ’ ’ #" ## ! ・ $& ! " )*+ " ( # +,", 其中 , (&) ・ $’ ! % " +,)*+ " ( #・ " 这里, 重点考察其空 ./0*1 滤波器具有很优秀的时频聚集性,
[.] 经得 到 了 广 泛 的 应 用 * 在 .’ 年 代 中 期, , W"L"L$I$ <" [&’] <9;@ 等对脱机手写字符识别中基于 !"#$% 滤波器的特征抽
取方法进行了研究 * 上述研究在抗噪声方面取得了一定的效 果, 但是仍然存在几个很重大的缺陷: ( &) 设计 !"#$% 滤波器 组时, 根据识别率进行参数的筛选, 过程烦琐, 计算量很大, 而 且不能保证获得最好的参数; (2) 这些方法都是基于二值图像 的, 对将 !"#$% 滤波器应用于低质量灰度字符图像识别的问
间局域性、 空间抽样间隔以及频率选择性 (线条宽度和方向的
[&] 选择性) &
一种基于局部Gabor滤波器组的手写体汉字识别方法
种 基 于局 部 G br 波器 组 的手 写体 汉 字 识别 方法 ao 滤
陈 蓉 邓 洪波 金 连 文 , ,
(. 1 北京邮电大学 电子工程 学院, 北京 107 ; 086 2 香港 中文大学 计算机科 学与工程 系,中国 香: ; . 巷 3 华南理工大学 电子与信息学院, 东 广州 504 ) . 广 160 ( e j @su. d .n el i c te u a ) wn 摘 要 : 对单 一尺 度 的 G br 波 器组只 对 某一特 定粗 细 的手 写体 汉字敏 感 的缺 点 , 出 了一 针 ao 滤 提 种新 颖 的 多尺度 局部 G br 波 器组 。 为 了评 估该 方 法 的识 别 性 能 , ao 滤 实现 了一 个基 于 G b r 征 的 ao 特 手写体汉字识别系统, 实验表 明多尺度全局 G br ao 滤波器组在识别性 能上明显提 高 , 局部 G br ao 滤波 器组在基本保持识别性能的情况下, 特征维数 明显降低 , 算量和 内存 需求减少。该 方法选取局 部 计 G br ao 滤波器。 8 3H L00手写体汉字数据库的识别, 对 6 C 20 最高平均识别率达到 了9 .2 , 明了该 23% 表 方法在手写体汉字识别 中的有效性。 关键 词 : a o 滤 波 器 ; 征提 取 ;线性判 别 分析 ; 写体 汉 字识 别 G br 特 手 中图分类 号 : P 9 .2 T 3 1 1 文 献标识 码 : A
维普资讯
第2 7卷 第 5期 20 0 7年 5月
文章编号 :0 1 9 8 (0 7 0 10 — 0 1 20 ) 5—12 2 2—0 3
一
计 算机 应 用
Co utrAp lc to mp e p i ains
基于Gabor滤波器组的车牌汉字特征提取
Ab t a t sr c
I h sp p r a meh d f r i e e c a a tr e tr xr ci n i e i l—ie s — lt y u i gGa o a ee a s r i r s n t i a e . to o n s h r ce au e e t t v h ce l n e pa e b s b rw v lt r n f m sp e — Ch f a o n c n t o
Zh n Zh n Yo g h o u Fe g a n z a ( colfC m ue c nea dTl o u i tnE gnen ,ins n esyZ e a g22 1 ,ins ,hn ) Sho o p t Sic n e cmm nc i n i r g J guU i rt,hn n 10 3 J gu C i o r e e ao ei a v i i f a a
朱 峰 詹永照
( 江苏大学计算机科学与通 信工 程学 院 江苏 镇江 22 1 ) 10 3
摘 要 提 出基于 G br a。 滤波器组的特征提取新方法。利用 汉字 图像 的统计信息及 归一化信息 提 出针对车牌汉字的有效 的 G — a br o 滤波器组参数优化 方法, 并设计 一组 G br ao 滤波器用于提取车牌汉 字图像 中不 同 中心频率和 方位 的笔画纹理特 征 实 现 直 接对 灰度 图像 的特征 提取 。实验结果表明 , 比传 统二值 化特征 提取 方法 采用基于 G br 相 a。 滤波器组 的小波变换提取特 征能够获得 更 良 好 的识别性 能。
.
e td B s d o h e r f b rf tr n esa it a no main o h n s h a tri g s a s t fG b rf tr a e i n d t x n e - a e n t e t oy o o l sa d t tt i l f r t C i e e c a ce h Ga ie h sc i o f r ma e e a o l s W S d sg e e — o i e o t c e t r e t r s o i e e t e t r q e c n re tt n i h h a tri g . x e me t s o h t o h td rc l xr cs r t x u e fa u e fdf r n n r fe u n y a d o n ai n te c a ce ma e E p r n s h w t e meh d ta ie t e t t a t f c l a i o r i y a f au e r m r y s ae i g ef r s e c l n l o g e n lw q ai e s ae e tr s f o g a c ma e p r m x el t f ri l o e y ma s i o u t g y c . l yr l
基于Gabor滤波器特征抽取的字符识别方法
基于Gabor滤波器特征抽取的字符识别方法XuewenWang;XiaoqingDing;ChangsongLiu;李立章
【期刊名称】《图象识别与自动化》
【年(卷),期】2005(000)001
【摘要】本文论述了在灰度图像上采用Gabor滤波器对字符识别的新方法。
特征通过Gabor滤波器直接从字符图像的灰度级上抽取,并按照其结构进行专门的计算。
自适应函数采用Gabor滤波器的输出在低质量的图像上显示较好的特性。
为了增强特征抽取的分辨力,从Gabor滤波器输出的正反有效图像上分别构建特征直方图。
实验显示,本文的方法对于低质量的打印字符和草写体字符识别具有极好的特性。
【总页数】11页(P12-22)
【作者】XuewenWang;XiaoqingDing;ChangsongLiu;李立章
【作者单位】无
【正文语种】中文
【中图分类】TP391.41
【相关文献】
1.基于多方向Gabor滤波器和Adaboost的虹膜识别方法 [J], 张祥德;黎明奇;王琪;孙艳蕊
2.一种自适应加权的基于Gabor滤波器的人脸识别方法 [J], 刘嵩;罗敏;来国红;张国平
3.基于Gabor滤波器的特征抽取技术 [J], 赵英男;杨静宇
4.基于Gabor变换与最近邻分类器的字符识别方法 [J], 杨彩霞
5.基于Gabor滤波器和SVM结合的中华蜂图像识别方法 [J], 刘超;林寿英;王彩霞;李新亮;张晓青;谢奕涛
因版权原因,仅展示原文概要,查看原文内容请购买。
基于Gabor小波变换的汉字识别方法
基于 Gabor 小波变换的汉字识别方法①
吴 锐 ② 刘家锋 唐降龙 孙广玲
(哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001)
摘 要 基于 Gabor 滤波器时频局域性和方向选择性对应在汉字图像上即是对笔划宽度 和方向的选择这一认识 ,考虑到笔划宽度多峰值 、笔划是方向的特点 ,利用二维 Gabor 小 波的多分辨率特性 ,对汉字图像进行了多尺度多方向分析 ,提取多个子平面的滤波器输出 系数作为统计特征 ,实现了字符图像的高性能识别 ,为开展低质量 、低分辨率的汉字字符 图像识别研究提供了新方法 。实验结果表明 ,用这种方法识别低分辨率的字符图像 ,效果 优于其他方法 。 关键词 Gabor 小波 , 字符识别 ,字符图像
小波变换在图像处理方面有着广泛的应用 , Huang L[5]利用 Harr 小波对汉字图像进行多层分解 , 将分解后的小波系数直接作为特征 ,并将不同层的 小波系数分别作为粗2细分类器的分类特征 ,用来识 别手写体汉字 。该方法对汉字识别有一定的效果 , 但总的来说 ,只是将汉字图像看成一个随机的二维 点阵 ,没有充分考虑汉字的结构特点 。Gabor 函数在 图像纹理分析上具有优异的性能[9211] 。文献 [ 8 ,10 ] 均利用 Gabor 小波变换 ,提取图像的纹理及边缘特 征 ,实现了图像的高性能检索和形状识别 。Gabor 变 换也被用于字符识别[1 ] [11 ] 、字体识别[12 ] 及数字识 别[13215 ] ,这些文献均对基于 Gabor 滤波器的特征抽 取方法进行了大量研究 ,其中文献 [ 1 ]是利用 Gabor 变换实现汉字识别的最新成果 ,它考虑了汉字笔划 的局域性和方向性 ,并在滤波器采样间隔和方向间 隔等约束条件下推导出一组最优的滤波器组参数 ,
基于Gabor_SVM的文字识别方法_黄萍
总第262期2011年第8期计算机与数字工程Co mputer&Dig ital Eng ineeringV ol.39N o.8143基于Gabor-SVM的文字识别方法*黄 萍1) 卢谢吉2)(南京理工紫金学院1) 南京 210046)(中兴通讯2) 南京 210012)摘 要 文字识别的难点和关键在于特征提取,文章把文字版面看作是含有特殊纹理信息的图像,利用Gabo r变换,通过纹理分析提取出文字的全局特征。
文字特征提取后,对其使用SV M进行训练学习。
实验结果表明本方法能够较有效地提取出字符特征,并能有效地对字符进行分类。
关键词 G abo r;SVM;文字识别中图分类号 T P391.41Chinese Character Re cognition Based on Gabor-SVMHuang P ing1) L u X ieji2)(N anjing U niver sity o f Science and T echno lo gy Zijin Co llege1),N anjing 210046)(ZT E2),N angjing 210012)Abstract T he difficulty and key of Chinese char acter recog nitio n ar e featur e ex traction.In t his paper,Chinese charac-ter can be treated as an image containing special texture info rmatio n.U sing Gabor filter s to ex tract features,and using SVM method to study these features.T he ex periment shows that t his met ho d perfo rms ex cellently for Chinese characters featur e ex tractio n and recog nitio n.Key Words Gabor,SV M,character recog nitionClass Numb er T P391.411 引言文字识别是图像识别的分支之一,学科上属于模式识别和人工智能的范畴[1]。
一种改进的基于Gabor变换的字符特征提取方法
到固定的位置上, 这个过程被称为位置归一化。有两种简单的位置归
一化方法。一种是基于质心的位置归一化; 另外一种是基于字符外边
框的位置归一化。基于质心的方法需要首先计算字符的质心, 然后再
把 质 心 移 动 到 指 定 的 位 置 上 。基 于 字 符 外 边 框 的 位 置 归 一 化 需 要 首 先
行 Gabor 变换进行特征提取。实验结果表明本方法能够较有效地提取
出字符特征, 对字符分类具有较好的支持作用。
1.字符归一化处理
为了消除字符的大小、位置对字符特征提取、识别的影响, 需要对
字符图像进行规范化处理。归一化一般分为位置归一化和大小归一
化。
1.1 字符位置归一化
为了消除字符点阵位置上的偏差, 需要将整个字符点阵图形移动
结构( 句法) 特征提取方法 和 [1][2] 基于神经网络 的 方 法[3]。 统 计 特 征 方 法
对噪声不敏感, 有较好的稳定性, 但是不能很好地区分字与字之间的
一些细节上的差异, 通常用于字符的粗分类。结构特征方法能够较好
的分辨出字形上的细微差别, 但是结构方法对噪声比较敏感, 容易受
到干扰, 算法复杂, 速度慢。人工神经网络具有良好的容错性、并行处
波器函数定义如下:
’ % &( 2
G( x, y; l, θk ) =G1 ( x, y)
cos( R) - exp
-σ 2
+iG1 ( x, y) sin( R)
( 3)
’ ) 其中 G1
2
(
x,
y)
=
λ
2
exp
2
-
λ( x2 +y2 )
2
, σ=π, R=λxcosθk +λysinθk ,
基于Gabor小波变换的汉字识别方法
基于Gabor小波变换的汉字识别方法
吴锐;刘家锋;唐降龙;孙广玲
【期刊名称】《高技术通讯》
【年(卷),期】2005(015)003
【摘要】基于Gabor滤波器时频局域性和方向选择性对应在汉字图像上即是对笔划宽度和方向的选择这一认识,考虑到笔划宽度多峰值、笔划是方向的特点,利用二维Gabor小波的多分辨率特性,对汉字图像进行了多尺度多方向分析,提取多个子平面的滤波器输出系数作为统计特征,实现了字符图像的高性能识别,为开展低质量、低分辨率的汉字字符图像识别研究提供了新方法.实验结果表明,用这种方法识别低分辨率的字符图像,效果优于其他方法.
【总页数】4页(P7-10)
【作者】吴锐;刘家锋;唐降龙;孙广玲
【作者单位】哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001;哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001;哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001;哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于Gabor小波变换和PCA的人脸识别方法 [J], 张向东;李波
2.基于矩和Gabor变换的手写体汉字识别方法 [J], 李玉静;杨扬;颉斌
3.一种基于局部Gabor滤波器组的手写体汉字识别方法 [J], 陈蓉;邓洪波;金连文
4.基于人脸T型区域Gabor小波变换的表情识别方法 [J], 段晓珊; 王坤侠
5.基于人脸T型区域Gabor小波变换的表情识别方法 [J], 段晓珊; 王坤侠
因版权原因,仅展示原文概要,查看原文内容请购买。
一种基于局部Gabor滤波器组的手写体汉字识别方法
一种基于局部Gabor滤波器组的手写体汉字识别方法
陈蓉;邓洪波;金连文
【期刊名称】《计算机应用》
【年(卷),期】2007(27)5
【摘要】针对单一尺度的Gabor滤波器组只对某一特定粗细的手写体汉字敏感的缺点,提出了一种新颖的多尺度局部Gabor滤波器组.为了评估该方法的识别性能,实现了一个基于Gabor特征的手写体汉字识别系统,实验表明多尺度全局Gabor 滤波器组在识别性能上明显提高,局部Gabor滤波器组在基本保持识别性能的情况下,特征维数明显降低,计算量和内存需求减少.该方法选取局部Gabor滤波器,对863 HCL2000手写体汉字数据库的识别,最高平均识别率达到了92.32%,表明了该方法在手写体汉字识别中的有效性.
【总页数】3页(P1222-1224)
【作者】陈蓉;邓洪波;金连文
【作者单位】北京邮电大学,电子工程学院,北京,100876;香港中文大学,计算机科学与工程系,中国,香港;华南理工大学,电子与信息学院,广东,广州,510640
【正文语种】中文
【中图分类】TP391.12
【相关文献】
1.一种基于局部Gabor滤波器组及PCA+LDA的人脸表情识别方法 [J], 邓洪波;金连文
2.基于矩和Gabor变换的手写体汉字识别方法 [J], 李玉静;杨扬;颉斌
3.基于局部中频Gabor滤波器组的人脸识别 [J], 周立俭;马妍妍;孙洁
4.一种实用的Gabor滤波器组参数设置方法 [J], 赵英男;杨静宇;孟宪权
5.一种基于Gabor滤波器组和LBP的多特征联合SAR纹理图像分类方法 [J], 张斌;高鑫
因版权原因,仅展示原文概要,查看原文内容请购买。
基于矩和Gabor变换的手写体汉字识别方法
基于矩和Gabor变换的手写体汉字识别方法
李玉静;杨扬;颉斌
【期刊名称】《信息技术》
【年(卷),期】2003(27)12
【摘要】特征提取是手写体汉字识别的一个研究难点.本文提出了一种基于特征融合的新提取方法,即将Gabor变换和正交矩变换结合起来,用正交Zernike矩提取全局特征,用Gabor变换提取局部特征,然后使用主成分分析的方法进行特征压缩.由此得到的特征向量能从整体上和局部上反映汉字的特征.实验证明该方法是行之有效的.
【总页数】3页(P44-46)
【作者】李玉静;杨扬;颉斌
【作者单位】北京科技大学信息工程学院,北京,100083;北京科技大学信息工程学院,北京,100083;北京科技大学信息工程学院,北京,100083
【正文语种】中文
【中图分类】TP391.43
【相关文献】
1.基于Zernike矩和Gabor变换的脱机签名鉴定 [J], 牟小建;赵东亮
2.基于Gabor变换和不变矩的掌纹识别研究 [J], 刘丹丹;苏日娜;张永平;郏璐璐;蔡金凤
3.基于弹性网格和Legendre矩的手写体汉字识别方法 [J], 徐赵辉;杨扬;颉斌
4.基于Gabor变换和Zernike矩的人脸特征提取方法 [J], 罗海波
5.基于Gabor变换和Zernike矩的人脸特征提取方法 [J], 罗海波
因版权原因,仅展示原文概要,查看原文内容请购买。
基于Gabor变换与最近邻分类器的字符识别方法
基于Gabor变换与最近邻分类器的字符识别方法
杨彩霞
【期刊名称】《西安文理学院学报(自然科学版)》
【年(卷),期】2010(013)004
【摘要】光学字符识别中,特征提取与分类是最关键的步骤,文中采用Gabor变换来提取图像特征,结合最近邻分类器进行分类识别,实现了对中文字符的准确识别.实验表明,该方法具有较好的抗干扰性.
【总页数】3页(P83-85)
【作者】杨彩霞
【作者单位】宝鸡职业技术学院,经济管理系,陕西,宝鸡,721013
【正文语种】中文
【中图分类】TP391
【相关文献】
1.对应用于手写体字符识别的最近邻分类器原型学习算法的评估(下) [J], Cheng-LinLiu;张罡;等
2.对应用于手写体字符识别的最近邻分类器原型学习算法的评估(上) [J], Cheng-Lin;Liu;张罡
3.基于多稀疏分布特征和最近邻分类的物体识别方法 [J], 孙利娟;张继栋;杨新锋
4.一种基于融合的词袋模型和大裕度最近邻分类算法的图像识别方法 [J], 杨亦波;王斌;王剑锋
5.一种基于相似度判据的K近邻分类器的车牌字符识别方法 [J], 杨晓敏;何小海;吴炜;陈默;薛磊
因版权原因,仅展示原文概要,查看原文内容请购买。
基于Gabor滤波器的数字文档图像文字提取算法
基于Gabor滤波器的数字文档图像文字提取算法
付平;李孟;尹洪涛
【期刊名称】《电子学报》
【年(卷),期】2006(034)00z
【摘要】本文提出一种在数字文档图像中自动检测和提取文字的算法.首先对图像在不同方向和阶数上进行Gabor滤波,得到反映文档图像布局的滤波图像,然后在得到的滤波图像中直接提取候选文字区域,再利用几何特性和高频分量特性筛选准则从中剔除非文字区域.最后选取了不同类型、不同语言和不同字体的文档图像进行实验,实验结果表明本算法对各种文档图像均能给出满意的结果.
【总页数】4页(P2387-2390)
【作者】付平;李孟;尹洪涛
【作者单位】哈尔滨工业大学,黑龙江,哈尔滨,150001;哈尔滨工业大学,黑龙江,哈尔滨,150001;哈尔滨工业大学,黑龙江,哈尔滨,150001
【正文语种】中文
【中图分类】TP309
【相关文献】
1.基于Gabor滤波器的数字文档图像文字提取算法 [J], 付平;李孟;尹洪涛
2.改进的二维变换Gabor小波滤波器特征提取算法 [J], 闫俊强;乔志伟;王强
3.基于非高斯二维Gabor滤波器的生物特征提取算法 [J], 陈熙;张戈
4.基于一维Gabor滤波器的虹膜特征提取算法 [J], 朱敬锋;顾可伟;刘映杰
5.基于MATLAB GUI的Gabor滤波器数字图像处理实验平台设计 [J], 杨艳;夏福全;陈章宝
因版权原因,仅展示原文概要,查看原文内容请购买。
用于字体识别的Gabor滤波角度GA优化方法
用于字体识别的Gabor滤波角度GA优化方法
杨芳;田学东;郭宝兰
【期刊名称】《计算机工程与应用》
【年(卷),期】2003(039)025
【摘要】Gabor滤波角度对字体识别结果有重要影响,由于字体纹理与自然纹理的不同,现有的Gabor滤波器角度参数不适于提取字体纹理的有效特征.基于字体纹理的多变性,该文提出使用遗传算法通过对字体纹理的学习优化滤波角度参数,使之能够适应字体纹理的特点,以提高识别率.通过对常用的4种字体899块字体纹理样本的测试表明:遗传算法能够找到适合字体识别的角度参数,使用新的角度参数减少了识别时间,提高了字体识别率.
【总页数】3页(P83-85)
【作者】杨芳;田学东;郭宝兰
【作者单位】河北大学数学与计算机学院,保定,河北,071002;河北大学数学与计算机学院,保定,河北,071002;河北大学数学与计算机学院,保定,河北,071002
【正文语种】中文
【中图分类】TP391.43
【相关文献】
1.适用于虹膜识别的Gabor滤波器参数选择 [J], 苑玮琦;刘汪澜;柯丽
2.一种用于掌纹识别的Gabor滤波器方向选取方法 [J], 张莉;万琛;刘海华
3.基于Gabor滤波的功能卡片涂鸦检测与识别 [J], 杨志红;余剑武;肖贤军;宗春博
4.基于Gabor滤波的功能卡片涂鸦检测与识别 [J], 杨志红;余剑武;肖贤军;宗春博
5.基于Gabor滤波器和SVM结合的中华蜂图像识别方法 [J], 刘超;林寿英;王彩霞;李新亮;张晓青;谢奕涛
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0 引 言
目前 ,对低质量的 、退化的 、基于灰度图像的字 符识别正成为一个新的研究热点[124] 。脱机手写体 汉字识别仍吸引着多数研究者的兴趣[527 ,8 ] ,并取得 很大进展 ,但离实用化还有相当距离[5] 。OCR 软件 的推广应用标志着汉字识别技术的成熟 ,但由于对 低质量 、低分辨率的字符图像识别能力有限 ,影响了 其更广泛的应用 。因而 ,寻求一种适应性强的汉字 识别方法具有重要的实用价值 。
实部输出) ,其中正实部输出与负实部输出分别计 算 。将 S 3 K 个 N 3 N 的输出平面等分为 M 3 M 个 区域 ,分别统计每个区域的实部输出的正值和负值 之和 ,即某一点的 Gabor 滤波器输出为 F r ( i , j) , 则
sum + ( m , n)
( m +1)
3
N M
(
n +1)
y′= a - m ( - xcosθ + ysinθ)
(3)
其中θ= nπ/ k 为方向参数 , k 为旋转方向的数
目 , a - m为尺度因子 。设 Uh 、Ul 分别为图像 I ( x , y)
频率的上限值和下限值 ,即对应字符笔划宽度最小
最大峰值 , k 为 Gabor 小波多通道分析中的方向数 , S 为尺度个数 ,各参数计算如下 :
波器对汉字图像中的线条 (笔划) 宽度和方向的选择
性表现在 :当滤波器的周期 (λ) ,即中心频率的倒数
与线条宽度 ( w) 成 2 倍关系 ,滤波器的方向与线条
方向相差 90°时 ,滤波器输出最大 (这里的输出只考
虑滤波器实部输出) 。为此 ,获得汉字图像的笔划宽
度和方向信息对小波簇的参数设计尤为重要 。
(收稿日期 :2004210222)
—7 —
高技术通讯 2005 年 3 月 第 15 卷 第 3 期
λ,0) 为中心频率的带通滤波器 ,带宽与 Gauss 窗口 的尺度成反比 ,σx 、σy 为高斯窗口沿坐标轴的宽度 , 1/λ= u0 为 Gabor 函数中心频率 ,λ为周期 , (1/λ,0) 的相位体现了滤波器的方向选择性 。
—8 —
0. 2 ,0. 4 (相应的 w = 5 , 2. 5 , 1. 25) ; 汉字笔划方向在 横 、竖 、撇 、捺四个方向的分布相对集中 , 取 k = 4 , θ 依次取 - 90°, - 45°,0°,45°。
图 1 对手写体汉字( 64pixel ×64pixel) 的笔划宽度( a) 以及方向( b) 分布的统计结果[ 1]
化方法将图像归一化至 64 ×64 大小 ;对低分辨率印 刷体二值图像 ,归一化为 32 ×32 大小 ;对手写体二 值图像归一化至 64 ×64 大小 。
图 3 调整后的识别结果
3. 2 分块特征的提取 归一化后的字符图像经 Gabor 小波变换后 ,提
取变换系数 (即滤波器组的输出) 作为特征 (只考虑
调整后的滤波器在与 2. 1 节相同实验条件下的
识别结果见图 3 。实验结果表明多尺度的小波变换
性能显著优于单一尺度滤波器变换 ,但当 S > = 4
时 ,识别性能未有明显提高 。
图 2 不同尺度( S) 不同方向数 ( K) 对应的识别率
3 特征提取
3. 1 归一化 对灰度图像 ,我们采用文献 [ 16 ]中的线性归一
(2)
其中
,σu
=
1 2πσx
,
σv
=
1 2πσy
, 这里
, Gabor
函数是以
(1/
① 863 计划 (2001AA114041) 资助项目 。 ② 男 ,1976 年生 ,博士研究生 ,助教 ;研究方向 :文字识别 、图像处理 ;联系人 ,E2mail :simple @hit . edu. cn
1 Gabor 小波的构造及参数设计
1. 1 Gabor 滤波器
二维 Gabor 函数可以如下表示[10] :
f ( x , y) =
1 2πσσx y
exp
-
1 2
x2
σ2x
+
y2
σ2y
exp
i
2πx λ
· (1)
其傅里叶变换为
12
F( u , v)
= exp
-
1 2
u- λ σ2u
+
v2
σ2v
Gabor 滤波器对线条宽度的敏感 。
吴 锐等 :基于 Gabor 小波变换的汉字识别方法
2. 2 Gabor 小波的参数调整 基于 2. 1 节的分析 ,对 Gabor 小波的参数进行
调整 。
(1) 尺度的选择 :仍选取 3 个尺度 ,以笔划的实
际宽度值来确定 Gabor 函数中心频率 ,分别取为 U0
a
=
( Un/
Ul)
1 s- 1
,
σu
=
( a - 1) Uh ,
( a + 1) 2 1n 2
σv =
Uh
-
21n
σ2u
Un
2 1n 2 -
(2 1n 2) 2σ2u
U2h
-
1 2
π
tan 2 k
(4) 这里 , u0 = Uh , n = 0 ,1 ,2 , …, k21 ; m = 0 ,1 ,2 , …, S2 1. 于是 ,相应的小波变换为
1. 2 本文采用的多通道 Gabor 小波
设 f ( x , y) 为 Gabor 小波母函数 ,通过对 f ( x , y) 的旋转与伸缩变换构成 Gabor 小波簇 :
f mn ( x , y) = a - m F ( x′, y′) , a > 1 , m , n = int eger
x′= a - m ( xcosθ + ysinθ) ,
2 Gabor 小波的实验验证及参数调整
2. 1 Gabor 小波的实验验证 对 100 套包含 3755 类一级汉字的 150dpi 的印
刷体汉字样本 ,随机选取 75 套作为训练样本 ,另 25 套作为测试样本 。对不同的 S 、K ,识别结果如图 2 所示 (实验条件见第 4 节) :
实验显示 ,方向数的增加可以明显提高识别率 , 8 个方向上的滤波变换性能比 4 个方向进行滤波变 换的效果要好得多 ,但方向数过多 (多于 8 个) ,性能 显著下降 。与预期相反的是 ,尺度数的增加却使性 能反而下降 ,尺度数越多 ,效果越差 。
小波变换在图像处理方面有着广泛的应用 , Huang L[5]利用 Harr 小波对汉字图像进行多层分解 , 将分解后的小波系数直接作为特征 ,并将不同层的 小波系数分别作为粗2细分类器的分类特征 ,用来识 别手写体汉字 。该方法对汉字识别有一定的效果 , 但总的来说 ,只是将汉字图像看成一个随机的二维 点阵 ,没有充分考虑汉字的结构特点 。Gabor 函数在 图像纹理分析上具有优异的性能[9211] 。文献 [ 8 ,10 ] 均利用 Gabor 小波变换 ,提取图像的纹理及边缘特 征 ,实现了图像的高性能检索和形状识别 。Gabor 变 换也被用于字符识别[1 ] [11 ] 、字体识别[12 ] 及数字识 别[13215 ] ,这些文献均对基于 Gabor 滤波器的特征抽 取方法进行了大量研究 ,其中文献 [ 1 ]是利用 Gabor 变换实现汉字识别的最新成果 ,它考虑了汉字笔划 的局域性和方向性 ,并在滤波器采样间隔和方向间 隔等约束条件下推导出一组最优的滤波器组参数 ,
从而构成 2 3 S 3 K 3 M2 维的特征向量 ,将此 特征向量直接送入统计分类器进行分类 。
4 实验结果
我们分别对一定数量的脱机手写体汉字样本 、 150dpi 的印刷体汉字样本进行识别实验 ,为了与其 他特征作比较 ,实验中选用以下几种特征 : (1) 本文 的 Gabor 小波特征 ,取 S = 3 , K = 8 ,简记为 GW ,其一 级汉字的识别字典约为 11M ; (2) 文献 [ 1 ]中的 Gabor 特征 ,记为 GAB3 ,相应识别字典约 3. 7M ; (3) 方向 像素 特 征[6] , 简 记 为 DEF , 其 相 应 识 别 字 典 约 为 114M。实 验 中 全 部 使 用 街 区 距 离 ( City Block Dis2 tance) 分类器进行训练和识别 , 运行环境为 P Ⅳ1. 6 G ,内存 128M。 4. 1 脱机手写体汉字的实验
利用最优 Gabor 滤波器组对字符图像进行滤波变 换 ,提取变换系数特征 ,实现汉字图像的高性能识 别 ,尤其对低质量的字符图像有一定的适应性 。但 该方法的不足在于 ,没能充分考虑字符图像的空间 分布信息 。根据字符图像的统计信息 ,汉字笔划宽 度和方向的分布有多个峰值 。从文献 [ 1 ]中我们也 知道 , Gabor 滤波器对笔划宽度及方向敏感 ,对具有 不同笔划宽度和方向的字符图像 ,滤波结果差异很 大 。基于以上考虑 ,本文充分考虑笔划宽度多峰值 , 笔划多方向的特点 ,利用二维 Gabor 小波的多分辨 率特性 ,对汉字图像进行多尺度多方向分析 ,提取多 个子平面的滤波器输出系数作为统计特征 ,实现字 符图像的高性能识别 。
(3) 由于字符图像中的笔划分布在各个方向上
相近 ,可令 σv =σu 。调整后的参数如下 :
1
Uh = 0. 125 , Ul = 0. 08 , a = ( Uh/ Ul) S - 1 ,
u0
=
as
uh
- m-
1
,σu
=
3
u0
, σv = σu
2 1n 2
(7)
其中 , s = 3 , m = 0 ,1 ,2 。
吴 锐等 :基于 Gabor 小波变换的汉字识别方法