脱机手写体汉字识别综述

合集下载

脱机手写体数字识别研究综述

脱机手写体数字识别研究综述
p o s e d.
Ke y wo r ds:h a n d wr it t e n d i g i t s r e c o g n i t i o n; p r e—p r o c e s s i n g; f e a t u r e e x t r a c t i n g; c l a s s i ic f a t i o n a n d r e c o g n i t i o n
云南 民族大学学报 : 自然科学版 , 2 0 1 3 , 2 1 ( S 1 ) : 6 7— 7 1
d o i : 1 0 . 3 9 6 9 / j . i s s n . 1 6 7 2— 8 5 1 3 . 2 0 1 3 . S 1 . 0 1 7
C N 5 3—1 1 9 2 / N 1 S S N 1 6 7 2—8 51 3
Ab s t r a c t :Th i s p a p e r s u r v e y e d t h e ma i n t e c h n i q u e s i n t h r e e p ha s e s:p r e—p r o c e s s i n g,f e a t u r e e x t r a c t i n g, c l a s s i i— f
现在 的数 字识别 技 术可 分为 印刷体 识别 和手 写体 数 字识 别 2个 类 别 , 而 手写 体 数 字识 别 可 分 为联 机 识 别和脱机手写体数字识别两类 , 本文主要 的是讨论脱机手写体数字识别的问题. 脱机手写体数字识别是模式 识 别 的一个 重要 分支 , 它 涉及 到模 式识别 中的典 型 问题 如 图像处 理 、 统计 理论 等学科 , 具 有综 合性 的特 点. 在 邮政 编码 自动识 别 、 处理 的财务 、 税 务报 表 、 支票 、 验证 新 的理论 领域 等都 有着 重要 的理论 意 义和 实用价 值 . 手写体数字只有 1 0 个简单的笔画写成 , 所 以识别的类别看似只有 l 0 种简单 的笔划构造 , 但实际上通过 些测试结果表明 , 印刷体汉字 的正确识别率高还远远高于数字识别的正确率 , 有的连联机手写体汉字的正 确 识别 率也 高于数 字识 别率 , 且 仅仅 只有脱 机手 写 体汉 字 的识 别低 于它 . 这 些 主要 归 因 于数 字 笔划 差 别 小 , 字形 相差 不 大 , 很难 准 确 区分 某些 数字 , 且很 难做 出兼 顾 世 界各 种 区域 性 写法 识 别 率极 高 的通 用识 别 系 统 , 即很难 找到 不 同写法 的手写 数字 字符 的共 同特 征 . 目前 , 已有 很多论 文 提 出了脱 机手 写体 汉字识 别 的方法 在 不 同 的字符数 据库 中试 验 , 并 取得 了很 高 的识别 率 , 但 是对 真 正 的手 写 体数字 的识 别效 果却 没 能很精 确 的达

脱机手写体汉字识别技术综述

脱机手写体汉字识别技术综述
方案 。
而汉字 识别 属 于大 类 别 ( 称 为 超 多 类 ) 式 或 模
识 别 问题 , 在模 式 识 别理 论 和 方 法 的研 究上 具
有 重要意 义 。
( ) 字字形 结构 复杂 。 2汉 ( ) 字 中相 似 字 符 较 多 , 些 汉 字 的 差 3汉 有
目前 , 字输入 主要 分 为人 工 键 盘输 入 和 汉 机器 自动 识 别 输 入 两 种 。人 工 键 盘 输 入 是 指 用 手工击 键 方 式 按 照 一 定 的规 律 将 汉 字 输 入 到计 算 机 , 目前 已有 数 百 种 键 入 方 法 。但 是 ,
弯 , 笔 的 拐 角 变 成 圆 折
弧等。

笔 画模糊 不规 范 该 连 的不 连 , 该 连 的 不 却相 连 。
自动识 别 输 入 分 为 语 音 识 别 和 字 符识 别 两种 。汉字识 别 是模 式识 别 的一 个重 要 分 支 ,
也 是文字识 别领 域 中最 困难 的 问题 , 涉 及模 它
与 拼音文 字的打 字输 入 不 同 , 人们 往 往需 要 经
别仅 在 于 一 个 点 或 一 个 笔 画 。 F 于手 写 体 字 } 1 符存在 变形 , 使得 手 写 体相 似 字 符 的 区分 比印
刷 体要 困难得 多 。
() 4 书写 风格 因人 而 异 , 成 手 写 体 汉 字 造 变形 , 具体 表现在 以下 几方 面 :
计 算机 进行识 别 处理 的方 法 , 是 机器 字符 识 也 别 中最 困难 的一 个 课 题 。这 些 困难 和 问题 表
现在 :
成 和发展有 着不 可磨 灭 的贡 献 , 并将 继 续 发挥 重要 的 、 与其 它 文字 形 式 难 以取 代 的作 用 。然

基于GABP神经网络的脱机手写藏文识别方法

基于GABP神经网络的脱机手写藏文识别方法

基于GABP神经网络的脱机手写藏文识别方法摘要:通过对当前流行的各种识别技术进行分析比较,在对藏文手写体特征展开深入研究的基础上,考虑到将来的研究趋势及可扩展性,提出了一套基于手写藏文识别的技术方法,即基于GABP神经网络的藏文识别方案,并着重对手写藏文识别中的特征提取和分类器设计进行了分析,提出了藏文识别领域今后的发展方向。

关键词:脱机手写藏文识别;GABP神经网络;特征提取0引言模式识别在各个领域中的应用非常多,从这些应用中可以看到它们的共性,即一个模式识别系统通常包括原始数据的获取和预处理、特征提取与选择、分类或聚类、后处理4个主要部分。

其中藏文识别需要解决的关键问题是模式分类,其理论基础是模式识别技术,其中最常用的方法是统计模式识别方法和结构模式识别方法。

近年来也有很多人将隐马尔科夫模型用于手写识别领域,取得了良好的效果。

本文主要介绍统计模式识别、结构模式识别以及使用较多的隐马尔科夫模型和人工神经网络模型。

1模式识别1.1统计模式识别统计模式识别是依据统计的原理来建立分类器,其分类器设计方法主要有贝叶斯决策理论和判别函数。

贝叶斯决策理论基本思想为:在类条件概率密度和先验概率已知或者可以估计的条件下,利用贝叶斯公式比较样本属于两类的后验概率,然后将类别决策为后验概率大的一类,从而使总体错误率最小。

常见的一种贝叶斯决策为最小错误率贝叶斯决策<sup>[1]</sup>,其决策规律如下:如果P(w\-1|x)>P(w\-2|x),则x∈w\-1;反之,则x∈w \-2。

通过贝叶斯公式,后验概率的比较可以转化为类条件概率密度的比较,离散情况下也是类条件概率的比较,而这种条件概率或条件密度则反映了在各类模型下观察到当前样本的可能性或似然度,因此可以定义两类之间的似然比或对数似然比进行决策。

该方法的主要优点是抗干扰能力强,且易于实现,但是应用中的主要缺点是细分能力较弱,区分相似字的能力较差。

模式识别综述及汉字识别的原理

模式识别综述及汉字识别的原理

133模式识别综述及汉字识别的原理Pattern Recognition Summary and Chinese Character Recognition Principle宋佳Song Jia(洛阳师范学院, 河南洛阳471022)(Luoyang Normal University, Henan Luoyang471022)摘要: 通过对模式识别系统的简要评述,对近年来几种基本的模式识别方法进行了总结,并对模式识别在汉字识别方面的应用原理作了介绍。

关键字: 模式识别系统; 模式识别方法; 汉字识别中图分类号:TP391.4 文献标识码:A文章编号:1671-4792-(2007)9-0102-03Abstract: In this paper components of pattern recognition system were introduced. Several basic patternrecognition methods which were frequently utilized are summed up. Finally Chinese character recognition whichis a application of pattern recognition were introduced.Keywords: Pattern Recognition System; Pattern Recognition Methods; Chinese Character Recognition0引言模式识别技术的研究目的是根据人的大脑的识别机理,通过计算机模拟,构造出能代替人完成分类和辨识的任务,进而进行自动信息处理的机器系统。

模式识别技术在社会生活和科学研究的许多方面有着巨大的现实意义,己经在许多领域得到了广泛应用。

随着计算机技术和人工智能、思维科学研究的迅速发展,模式识别技术正在向更高、更深的层次发展。

隐马尔可夫模型在脱机手写体汉字识别中的应用

隐马尔可夫模型在脱机手写体汉字识别中的应用

汉字 建 立 8个 H MM, 过 等 比 重 综 合 方 法将 8个分 类 器 的计 算 结 果 进 行 综 合 , 而 得 到识 别 结 果 , 通 从 实
践 证 明该 方 法是 可 行 的 。
关 键 词 : 马 尔可 夫 模 型 ; 机 ; 写体 ; 字识 别 隐 脱 手 汉 中 图分 类 号 :T 3 14 P 9 .3 文献标识 码 : A
I )模 型状 态 集合 S = { l S , , }; S ,2… 2 )观 测状 态 集合 = { l , , }, 于连 续性 的观 , … 对 测量 , 这个 集合 可 以无 限 ;
3 初始概率 Ⅱ = ll , 中 =P q =S)I i Ⅳ; ) 丌}其 (l i,≤ ≤ 4 转 移概 率 A = { } 其 中 a ) , = P q+ = 暑 I : (I l q
YY… y , 出 此 样 本 出 自哪 一 个 模 型 , 里 有 三 个 基 本 问题 : x2 T 找 这 识 别 问题 的概 率 ? 给 定 观 测 序 列 Y =YY… Y 和 模 型 = ( x2 T A,
上的 汉字输 入 到计 算 机 , 然后 由计 算 机 识别 。 由于 识别 对 象
A src:A lwo -n eomt .me o r ad rtnC i s hrc r,Hd e b t t e f ler g i a l i c o t df nw i hn ecaat s idnM ̄kvMoe(I M)i peet . t h oh t e e e o dlI - M s r nd I s e
脱机 手写 体汉 字识 别 是 通过 光学 扫 描设 备将 书 : ( B, 采 A, / 7)来 表示 模 型 的 全部 参数 。 HM M应 用 于模 式 识 别 就 是 要 为 每 一 个 模 式 建 立 一 个 H MM参数 模 型 , 识别 过程 就是 给 定 一 个 观测 过程 的样 本 Y=

大字符集脱机手写体汉字识别粗分类问题

大字符集脱机手写体汉字识别粗分类问题
法, 实践证明 , 该算法速度较快 , 效果较好( 如图 3所示 ) 。
0 引 言
随着计算机应用 的 日益普及 , 息 的 自动化输 入 已成 为 信 必然趋势 , 因此 , 实现手写体汉字 的 自动识别 无疑具有重要 的 实用价值 。目前汉字的印刷体识别 和联 机手 写体识别 问题都 得到 了很好 的解决 , 已有产品问世 , 并受到用户的欢迎 。对脱 机手写体汉字识别来说 , 由于字形变化大 、 稳定的特征难 以提 取、 结构信息难以利用等特 点 , 使得对 它 的识别 难度非 常大 , 目前仅在 小字符集方 面取得 了令人 满 意的成果 , 但对 大字符 集 来说 , 仍在进行研究 。针对大字符集汉 字数量多的问题 , 一 般 采用 多级分类 的方法 , 即先粗 分类 , 然后再 细分类 。本文 以 H L 00手写汉字库为基础 , 建了一个实验 系统 , C 20 构 对大字符 集脱机手 写体汉字识 别粗分类 中的一些 问题进行
图 3 索引表细化算法示例
13 特 征提 取 .
我们采用 了常见 的投影特 征 、 网格点阵特征 、 向线素特 方
征 和这几种特征构 成的组合 特征 。经 过预处理后 , 同的汉 不
1 系统 的设计 与实现
1 1 系统框架 .
个完整的脱机手写 体汉字识 别 系统 7个 部分组 成 , 其
总体框架如 图 1所示。
特殊的子类 , 该子类有 一个特 征类 容器 , 以存放各个 子类 的 可 指针 , 这样 , 容器 中不 同的子类指针组合就形成的不同的组合
图 1 大字符集脱机手写体汉字识别系统
特 征类 。
实验系统采用 V + 60设计 , C +. 硬件 平 台为 赛 扬 24 , . G

基于混合核函数的脱机手写汉字识别

基于混合核函数的脱机手写汉字识别

起来得到混合核函数来 识别手 写汉 字 , 收其 变 吸 形 。根 据 M re 条 件 不 难 证 明 对 于 不 同 的 核 函 ec r 数, 其非负线性组合仍然满足 M r r e e 条件 ¨ , c ]可以 作为一种新的核函数来实现支持向量机的汉字分 类, 函数
转 化 为其对 偶 问题 , : 即
1 f I /
支持 向量 机 (V 是 由 V pi S M) ank等人 在统 计 学
习理 论基 础上 提 出的 , 过结 构风 险最 小化 原理 来 通
m i n

ya ( z )一 i, ‘
() 4
提高 泛化推 广 能力 。文 献 [ ] 用 S M 分 类 器取 4利 V
维普资讯
第3 5卷( 0 7 第 l 20 ) 2期
计算机 与数字工程
2 5
基 于 混合 核 函数 的脱 机 手 写 汉 字 识别
张 凯 王建 平
合肥 20 0 ) 3 0 9 ( 合肥 工业 大学电气与 自动化工程学 院 摘 要
脱机手写汉字识别是模式识 别领 域 一项难题 。支持 向量机 ( V 也是近年来 发展起来并 成功的用 于模 式分 S M)
关键词 混 合 核 函数 T 3l P 9 支持 向量 机 手 写汉 字 识 别 中 图分 类 号
1 引 言
脱 机手 写 体 汉 字识 别 是 由计算 机 对 输 入 的手 写体 汉 字图像 进行识 别 , 主要 包括 汉 字 图像 的预处 理 , 征 提取 以及分 类决 策 三个 阶段 。在分 类决 策 特
( ・ ( )+b= W ) 0 () 1
其 中 ∈R ( 为 特 征 空 间 向 量 。这 里 最 优 的 , ) 含义足 指 所构造 的超 平 面 是 在 结 构 风 险最 小 化 的 基础 , 使两类 汉 字样本 分类 间 隔最 大 。可以证 明

基于双神经网络分类器的脱机手写体汉字识别

基于双神经网络分类器的脱机手写体汉字识别

的笔顺、 笔划起停、 笔划方向等重要信息因而 比联机
识别 的难 度 要 大 得 多 】 由 于 特 征 空 间 分 布 十 分 。
复杂 , 目前还没有找到完全可分的特征映射及相应 的曲面, 现有的方案多是基于小字符集的研究 , 且分 类器种类繁 多, 石繁 槐 等采用 基于 支持 向量机 (uprV c r ah e S M) Spo et ci , V 的分类决策方法 , t oM n 在
现并行处理 , 提高了分类器的效率。 本文所采用的 B P网络为 4层神经 网络 , 网络 训练 过程 见 图 2 字 符 通 过 不 同 的特 征 提取 手 段 得 ,
到 2组特征 向量 , 这 2组 向量分 别 对 2个 神经 网 用 络进行训 练 , 练 的过 程 遵 循 梯 度 下 降原 则 。训 练 训 完成 的网络就 可 以按 着 图 1 b 所 描述 的那样 , 行 () 进 文字识别 。
作为生活中交流、 记述的主要方式 , 大量的汉字
文档需要进行整理 、 查询、 统计和分析, 实现电子化 中文文档的自动识别可以大大提高工作效率 , 因而
汉字文档 自 动识别研究具有重要意义 。目前印刷体 汉字识 别系统 已经 走 出实 验 室 , 入 到 办公 自动 化 加 产品的行列¨ ; 机手写体汉字识别 已趋 于成熟 , 联 有许多 项产 品产 业 化 , 汉 王 笔 、 ooo 如 M t l 笔等 ; r a慧 而脱机手写体汉字识别 因其 自身的复杂性 , 使得系 统实现具有很大的困难 , 目前还没有十分成熟的产 品, 是一门待发展的技术, 因此成为了国内外研究的 热点。
歌 (94 )西北工业 大学硕 士研究生 , 18 一 , 主要从事信息处理模式识别研究 。

手写数字识别技术研究文献综述

手写数字识别技术研究文献综述

文献综述手写数字识别技术研究一、前言部分手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition,简称OCR)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。

OCR是模式识别的一个分支,按字体分类主要分为印刷体识别和手写体识别两大类.而手写体识别又可分为受限手写体和不受限识别体,按识别方式有课分为在线识别和脱机识别。

在整个OCR领域中,最为困难的就是脱机手写字符的识别。

到目前为止,尽管人们在脱机手写英文,汉字识别的研究中已取得很多可喜成就,但距实用还有一定距离。

而在手写数字识别这个方向上,经过多年研究,研究工作者已经开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方案。

字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家,各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码,统计报表,财务报表,银行票据等等,处理这类信息的核心技术是手写数字识别。

因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。

[1][2][15]二、主题部分(一).手写数字识别研究的理论意义手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:1.阿拉伯数字是唯一的被世界各国通用的符号,对手写数字识别的研究基本上与文化背景无关,这样就为各国,各地区的研究工作者提供了一个施展才智的大舞台。

在这一领域大家可以探讨,比较各种研究方法。

2.由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。

3.尽管人们对手写数字的识别已从事了很长时间的研究,并已取得了很多成果,但到目前为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题(Open problem)。

手写汉字识别原理

手写汉字识别原理

手写汉字识别原理主要介绍了非特定人脱机手写体汉字识别的基本步骤和技术难点,以及当前的研究热点和成果。

一、汉字识别概述字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋,并将继续发挥重要的、其它文字形式难以取代的作用。

然而,汉字是非字母化、非拼音化的文字,在当今高度信息化的社会里,如何快速高效地将汉字输入计算机,已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我国得到普及应用。

围绕这一问题,人们提出了各种解决方案。

目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。

人工键盘输入是指用手工击键方式按照一定的规律把汉字输入到计算机,目前已有数百种键入方案。

但是,与拼音文字的打字机不同,人们需要经过一定时间的学习训练才能掌握某种键入方法,更为严重的是:对于大量已有的文档资料,采用人工键入方法将要花费大量的人力和时间。

为此,机器自动识别输入就成为了必须研究的课题。

自动识别输入分为语音识别和字符识别两种。

汉字识别是模式识别的一个重要分支,也是文字识别领域最为困难的问题,它涉及模式识别、图象处理、数字信号处理、自然语言理解、人工智能、模糊数学、信息论、计算机、中文信息处理等学科,是一门综合性技术,在中文信息处理、办公室自动化、机器翻译、人工智能等高技术领域,都有着重要的实用价值和理论意义。

汉字识别技术可分为印刷体汉字识别和手写体汉字识别两大类,后者又可分为联机(on-line)手写汉字识别和脱机(off-line)手写汉字识别,如图1所示:从识别的角度来看,多体印刷体汉字识别难于单体印刷体汉字识别,手写体识别难于印刷体识别,而脱机手写识别又难于联机手写体识别。

可喜的是,经过科研人员的努力,我国已有印刷体汉字识别和联机手写汉字识别的商品出售,目前已形成百家争鸣、百花齐放的局面,但是脱机手写汉字识别还处于实验室研究阶段。

在脱机手写汉字识别领域,非特定人脱机手写汉字识别又难于特定人手写汉字识别。

中文手写识别技术研究报告

中文手写识别技术研究报告

一、概念定义:模式识别:指识别出给定物体所归属的类别。

文字识别:由计算机自动识别各种字符,如字母、数字、汉字或其他语言中的字符二、识别分类:根据文字的字体:可分为手写体文字识别和印刷体文字识别。

根据采用的输入设备:可以分为联机识别和脱机识别。

根据识别对象的不同:文字识别又相应地分为西文识别、数字识别和汉字识别等。

汉字识别系统的分类:通常分为手写汉字识别系统和印刷汉字识别系统两大类。

按输入方式不同,手写汉字识别系统又分为联机和脱机两种。

联机手写识别:指将字符书写在与计算机相连的书写板上,由计算机根据字符的书写轨迹进行实时识别,因此联机识别是针对手写体而言的;它又叫做实时,在线手写体识别。

使用光笔在图形输入板上写字,人在书写的同时,机器根据书写的笔画、笔顺提取特征信息进行识别,是一种方便的文字输入手段,也是文字识别最简单的一种。

目前市面上使用的主要就是基于联机的手写识别。

优点:联机识别可以采集到更多的信息,如时间、点的座标、笔画运动轨迹、笔顺等动态信息,为文字识别提供更多依据,降低识别难度缺点:一个是联机手写时,用户对写字板或书写设备的不适应性,会产生比较多的干扰;二是用户书写的习惯,主要是不同用户书写时笔画的顺序各有不同,增加识别难度;三是书写时笔画连笔的问题,会造成笔画的误识别。

脱机手写识别:指将字符书写或打印在纸张上,用扫描仪或其他光电转换装置将其转换成电信号输入到计算机中,再由机器进行识别。

脱机手写体识别:又叫做离线手写体识别。

由书写者预先将字写在纸上,通过扫描仪转换成图像,再由计算机识别成汉字。

由于手写风格因人而异,同一个人书写时变化较多,且无法获得实时信息,它是文字识别领域最难的分支,目前实现仍是困难的。

缺点:涉及的识别模式繁杂,技术难度大。

目前已成熟并实际应用的主要是汉字印刷体的脱机识别,脱机手写识别目前可能还处于实验阶段,实现难度大。

三、识别过程:一个模式识别系统可分为四个主要部分:1:数据获取2:预处理3:特征提取和选择4分类器(分类器设计和决策)其中最关键部分为:特征提取和分类器。

基于变精度粗糙集的脱机手写体汉字识别

基于变精度粗糙集的脱机手写体汉字识别
b s d o a i b e p e ii n r u h s t a e n v r a l r c so o g e
W ANG in pn ZHANG - n Ja - ig, Dami
( h o fElc rcEn ie rn n tm ain,H ee Sc o lo e ti gn eig a d Auo to fiUni riy o c oo y,H ee 3 0 9,Chia vest fTehn lg fi2 0 0 n)
rc g iin t m p o et eie tf b l ya d c r e tca sfc t n r t fh n wrte i e ec a a — e o nt o i r v h d n ii i t n o r c lsiia i a eo a d i n Chn s h r c o a i o t tr Th x e i e tr s l h w h tt em eh d i e sbea d efc ie e. e e p rm n e u t s o t a h t o sfa il n fe tv . s
t t d h f-i eh n wrte i e ec a a trrc g iin o su y t eo fl a d i n Chn s h r c e e o nto .A e rsi lo ih o h trb t n t h u it ag rt m ft ea ti u e c r d cin i a ibep e iin r u h s ti e i n d Th ei iin o trb t mp ra c ,wh c s e u to n v ra l rcso o g e sd sg e . ed f t fa ti u ei o t n e n o ih i

离线手写签名识别技术研究

离线手写签名识别技术研究

离线手写签名识别技术研究在当今社会,签名识别技术已经成为日常生活和工作中不可或缺的一部分。

而在诸多应用场景中,离线手写签名识别技术的价值尤为凸显。

本文将详细介绍离线手写签名识别技术的原理、实现方法、优化策略以及实际应用效果,旨在强调该技术的研究意义和价值。

离线手写签名识别技术是通过对输入的签名图像进行特征提取和匹配,从而识别出签名者的身份。

其实现方法主要分为以下几个步骤:预处理:首先对输入的签名图像进行预处理,包括去噪、二值化、分割等操作,以提高图像质量。

特征提取:通过对预处理后的图像进行特征提取,获取签名的关键信息,如笔画方向、长度、宽度等。

模板匹配:将提取的特征与事先存储的模板进行匹配,找出最相似的模板,进而确定签名者的身份。

离线手写签名识别技术所面临的挑战和难点主要包括以下几个方面:签名的复杂性和多样性:由于每个人的书写习惯和方式不同,使得签名具有很大的变化性和复杂性,这给识别技术带来了很大的难度。

签名的变形和失真:在实际应用场景中,签名可能会因为各种原因而产生变形或失真,如情绪紧张、疲劳等,这会导致识别率下降。

伪造和篡改:不法分子可能会伪造或篡改他人的签名,这给签名识别技术提出了更高的安全要求。

为了解决上述问题,研究者们不断尝试改进算法和模型,以提高识别准确率和速度。

其中,深度学习技术的兴起为离线手写签名识别带来了新的突破。

通过对大量的签名数据进行训练,深度学习模型能够自动学习签名的特征表示,从而实现更高的识别准确率。

为了进一步提高离线手写签名识别的准确率和速度,研究者们提出了一系列优化和改进策略,主要包括以下几个方面:特征提取方法的优化:通过对特征提取过程进行优化,提高特征的质量和表示能力,从而更好地描述签名的特点。

深度学习模型的选择:针对离线手写签名识别的特点,选择合适的深度学习模型进行训练,以便更好地适应签名的多样性和变形情况。

数据增强技术:利用数据增强技术对训练数据进行扩增,提高模型的鲁棒性和泛化能力,从而减少对特定签名数据的依赖。

脱机手写体汉字识别中SVM参数优选问题

脱机手写体汉字识别中SVM参数优选问题

Jn 0 6 u e2 0
脱 机 手 写体 汉 字识 别 中 S M 参 数优 选 问题 V
左泽 华 , 杨 扬, 颉 斌 ( 京科技 大学 信 息 工程 学院 , 北 北京 108 ) 0 03 ( a e l9 @sh . o w k _ 9 8 ou cm)

要 : 究了基于支持 向量机 的脱机手写体汉字识别 中核参数 和误 差惩罚 因子的选择 问题 。 研
( 4 )
其 中K( x, )= ( )・ ( ) 称为核 函数 , 只需满足 Me e rr c 条 件即可。 ’是分类阈值 , 以用任一个支持 向量求得 , b 可 或通 过两类中任意一对支持向量取 中值求得 。
其他 样本无关 。 我们可 以将最优超 平面规范化为 :
Y[ W・ )+b ( ]一1+ ≥0,
面, 允许错分样本 的存在 。
i=1 … , ( ) , n 1
其中 基 ≥0为引入的正的松弛 因子 , 用来构 造“ 软边缘 ” 分类
T er,L ) 是 一种 专门的小样本统计理论 , hoyS T 着重研究 在有 限样本情况下 的统 计规 律及 学 习方 法。2 0世纪 9 0年 代 , 在
中图分类 号 : P 9 .1 T 3 14 文 献标 识码 : A
保证训练样本 的分类误 差尽可能小 。
在两类模 式识别 问题 中, 设模 式样本 ( ,。 , Y)i=1 … , ,
0 引 言
手写体汉字识别一直是模式识别 研究领域 中的难点 。手 写体汉字样本类别 间的差距不平 均 , 有些类别 间的差别很大 , 而有些类别 间的差别极 其细微 ; 同的书写 者书写 的汉字样 不 本风格 千差万别 。由于这些 因素 的存 在 , 导致 一些汉 字在特

基于多重HMM的脱机手写汉字识别

基于多重HMM的脱机手写汉字识别
垂直 区域 、 和负 4 。 向区域 的投 影 变 换 正 5方 后构 造 的 H MM, 这 四个 H 对 MM 模 型进 行 集 成 , 可 以设 计 出一个 MH 就 MM 的识别 器 。 本 文选用 的模 型是左 一右 型 , 且 具有 并


图 1 系统 的整 体 框 图

定 的转移步 长 限制 , 即状 态转 移概率 n 满 足 :
。 =0 ,当 -< i 『 或 i 。 +3
13 模 型 的 初 始 化 .
识别 系统 的 隐 马 尔 可 夫 模 型 的 初 始 化
设 置如下 :
( ) 态 之 间的转移概 率是 均匀分 布 的 1状
( 图2 , 见 ) 由于当J<i 『 i 3时 ,d=0 或- + n ,
所以。
。 =0 3 3 ii J i . 3 , f +2
V0. . 12l No 2 Fb 20 e ., 0 7
基 于 多 重 HMM 的 脱 机 手 写 汉 字 识 别
陈 景 波 杨 浩 东 孙 斌 , ,
(. 1常熟理工学院 信息与控制工程系 , 江苏 常熟 250 ; 150 2 西北 工 业大学 电子 信息学 院 , . 陕西 西安 7Biblioteka 7 ) 102 维普资讯
常熟理工 学 院学报 (自然 科学版 )
20 0 7年

边界链 编码 特征 ( 以数 字斜 率 为基 础 ) 观 测 , 符号分 别是 { 12 3 4 5 6 7}所 以 观 测 0, , , , , , , , 符号 的数 目 M =8 。对 于 不 同的汉 字 模 式 , 状态 的数 目保 持 一 致 , 在具 体 的 实 验 时 , 可 以确定 一个值 , 如 N= 例 6或 8 。

基于贝叶斯网络的脱机手写体汉字智能识别

基于贝叶斯网络的脱机手写体汉字智能识别

基于 贝叶斯 网络 的脱机手 写体汉 字智能识别
温尚清, 郝志峰 , 廖 芹 , 陈炎雄
( 南理工 大学 数 学科 学学院, 东 广 州 5 04 ) 华 广 16 1

要 : 对汉 字识 别 的超 多类 问题 , 贝叶 斯 网络 分 类 器 引入 小样 本 字符 集 脱机 手 写 体 汉 字识 针 将
tm s c n tuce n ti o a e t e i o sr td a d i s c mp r d wih Euci e n d sa e c a sfe .The e p rme t n i ae t a t ld a itnc l s i r i x e i n si d c t h ti
识别难度又远远高于联机手写体汉字识别 , 是模式
识别 中最 困难 的 问题 , 其 是 非 特定 人 手 写 体 汉 字 尤
识别. 原因在于汉字字符集合大 、 字形复杂 、 相似汉 字较多且差别极其细微 、 不规则书写变形很多. 相似
字在 特征空 问 中的 距 离 变 小 , 使得 普 通 距 离 分类 器 的推 广能力 变弱 . 因此 , 如何提 高分 类器 的泛 化和 推 广能 力 , 为汉 字识 别研 究 的关键 问题之 一 . 成
到 目前为止 , 除了脱机手写体数字的识别 已有
实 际 应用外 , 汉字 等 文 字 的脱机 手 写 体 识 别 还处 在
c n i c e s h e o n to ae t 2. a n r a e t e r c g iin r t o 9 4% .a d t e eo e i h smo e p a tc blt n c lb lt . n h rf r t a r r c ia i y a d s a a iiy i Ke r y wo ds:Ba e in n t r y sa ewo k;ca sfe ;o f neha d itn Ch n s h r c e ;i t l g n e o n to ls i r f i n wrte i e e c a a tr n el e tr c g iin; i l i

基于多尺度的蒙古文脱机手写识别方法

基于多尺度的蒙古文脱机手写识别方法

基于多尺度的蒙古文脱机手写识别方法武慧娟;范道尔吉;白凤山;滕达;潘月彩【期刊名称】《中文信息学报》【年(卷),期】2022(36)10【摘要】蒙古文的一大特点是字符无缝连接,因此一个蒙古文单词有多种字符划分方式。

根据蒙古文这一特点,该文提出了多尺度蒙古文脱机手写识别方法,即让一个手写蒙古文单词图像对应多种目标序列,用多个目标序列同时约束训练模型,使得模型更加精准地学习手写图像的细节信息和蒙古文构词规则。

该文提出了“十二字头”码、变形显现码和字素码3种字符划分方法,且拥有相互包含关系,即“十二字头”码可以分解为变形显现码、变形显现码可以进一步分解为字素码。

多尺度模型首先用多层双向长短时记忆网络对序列化手写图像进行处理,之后加入第一层连接时序分类器做“十二字头”码序列的映射,然后是第二层连接时序分类器做变形显现码序列的映射,最后是第三层连接时序分类器做字素码序列的映射。

用三个连接时序分类器损失函数的和作为模型的总损失函数。

实验结果表明,该模型在公开的蒙古文脱机手写数据集MHW上表现出了最佳性能,在简单的最佳路径解码方式下,测试集Ⅰ上的单词识别准确率为66.22%、测试集Ⅱ上为63.97%。

【总页数】7页(P81-87)【作者】武慧娟;范道尔吉;白凤山;滕达;潘月彩【作者单位】内蒙古大学电子信息工程学院【正文语种】中文【中图分类】TP391【相关文献】1.基于双射变换的脱机手写数字识别方法2.基于GA-BP神经网络的脱机手写藏文识别方法3.一种基于复合特征的脱机手写体字符识别方法4.基于反馈知识迁移的脱机手写体汉字识别方法5.基于GA-BP神经网络的脱机手写藏文识别方法因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

脱机手写体汉字识别综述赵继印1,郑蕊蕊2,吴宝春1,李 敏1(1.大连民族学院机电信息工程学院,辽宁大连116600;2.吉林大学通信工程学院,吉林长春130025) 摘 要: 脱机手写体汉字识别是模式识别领域最具挑战性的课题之一.本文分析了近年来脱机手写体汉字识别的最新进展,讨论了脱机手写体汉字分割、特征提取和分类器设计等关键技术的各种主流方法,介绍了3种典型的汉字识别数据库,并提出了脱机手写体汉字识别的难点问题和今后发展的趋势,为该领域的研究者指明研究方向,共同促进脱机手写体汉字识别技术的发展.关键词: 脱机手写体汉字识别;字符分割;特征提取;分类器设计;汉字识别数据库中图分类号: TP39114 文献标识码: A 文章编号: 037222112(2010)022*******A Review of Off 2Line Handwritten Chine se Character RecognitionZH AO Ji 2yin 1,ZHE NG Rui 2rui 2,W U Bao 2chun 1,LI Min 1(1.College o f Electormechanical and Information Engineering ,Dalian Nationalities Univer sity ,Dalian ,Liaoning 116600,China ;2.College o f Communication Engineering ,Jilin Univer sity ,Changchun ,Jilin 130025,China )Abstract : Off 2line handwritten Chinese character recognition is one of the most challenging problems in pattern recognition field.This paper analyzed the latest developments of off 2line handwritten Chinese character recognition in recent years.Main meth 2ods of the key technologies such as Chinese characters segmentation ,feature extraction and classifier design were discussed.This pa 2per also introduced 3typical off 2line handwritten Chinese character recognition databases.Finally ,remain difficult issues and future trends of off 2line handwritten Chinese character recognition were proposed.This paper will guide researchers in this field and pro 2mote development of off 2line handwritten Chinese character recognition technology.K ey words : off 2line handwritten Chinese character Recognition ;characters segmentation ;feature extraction ;classifier design ;Chinese recognition database1 引言 汉字识别是模式识别的一个重要分支,也是文字识别领域最为困难的问题之一,它涉及模式识别、图像处理、统计理论等学科,呈现出综合性的特点,在办公和教学自动化、银行票据自动识别、邮政自动分拣、少数民族语言文字信息处理等技术领域,都有着重要的理论意义和实用价值[1].汉字识别技术可分为印刷体和手写体汉字识别两大类.手写体汉字识别又可分为联机(on 2line )和脱机(off 2line )手写体汉字识别.脱机手写体汉字识别可分为受限和非受限两种情况,如图1所示.清华大学、中科院自动化所等著名高校和科研院所都致力于汉字识别的研究,以汉王科技股份有限公司为首的科技企业也推出了一系列成熟的商业产品[2].目前,很多论文提出的脱机手写体汉字识别的方法在不同的字符数据库试验中,取得了95%~99%的识别率,但是对真正的手写文档的识别效果却难以达到实际应用的要求.目前脱机手写体汉字识别仍处于实验室研究阶段,成功的商业产品仍未发布[2~4].本文着重讨论脱机手写体汉字识别的现状和存在的问题,明确今后的发展趋势,为脱机手写体汉字识别领域的广大研究人员提供参考和借鉴.2 手写汉字字体特点 从识别的角度分析,汉字具有如下4个特点.2.1 汉字类别多汉字的个数很多,国家标准G B1803022000《信息交换用汉字编码字符集基本集的扩充》收录27484个汉字[5].汉字个数在模式识别问题中体现为汉字的类别,因此汉字识别问题属于超大规模数据集的模式识别问题.收稿日期:2009202216;修回日期:2009206213基金项目:大连民族学院科研基金(N o.20086201);吉林省科技厅科技引导计划(N o.20090511)第2期2010年2月电 子 学 报ACT A E LECTRONICA SINICA V ol.38 N o.2Feb. 20102.2 字体结构复杂汉字基本笔画(stroke)分为:横、竖、撇、点、折[6].笔画的组合方式分为相离、相接和相交三种.特征结构笔画和相应笔画的组合方式在以笔画为特征的汉字识别中起到关键作用.汉字的组合方式包括独体字和合体字.合体字又包括上下结构、左右结构、品字结构等多种结构.以部件(radical)为基础的手写体汉字识别中,需根据汉字的组合方式对已提取的部件进行重新组合.2.3 字形变化多手写体汉字字形总的来说可以分为:手写印刷体(hand2print fashion scripts)、行书(fluent scripts)和草书(cursive scripts).对于相同的字形又因不同人书写风格的差异造成手写汉字的变形.脱机手写汉字在日常生活中以行书为主.对于行书和草书等笔迹相连的情况,字符分割是识别的关键环节,如果出现分割错误,将影响后续识别结果的精度.2.4 相似字多汉字集合中相似字较多,由于手写体汉字变形的存在,使得手写体中相似字的区分比印刷体要困难得多[1].比如,在手写体中的一点,可能会因为不当的预处理而消失,从而造成字符的误识.因此要求预处理方法能够针对手写汉字的特点,做到尽量不丢失笔画信息.在识别过程中,对于相似的字体,可以采用更精确的细分类过程进行鉴别.在识别后处理阶段,通常采用相似字符集作为候选字符集的主体.3 识别过程 对于脱机手写体汉字识别而言,其识别过程通常如图2所示.原始的手写文稿通过扫描仪等OCR(Optical Charac2 ter Recognition)设备,转换成灰度图像或者二值图像,并进行预处理.字符特征分为统计和结构特征两种模式.识别阶段,根据提取的特征,选择相应的分类器及其组合形式进行模式分类.识别后处理根据前后文字的上下文关系选择最合乎逻辑的字词,能进一步提高识别准确率,最后输出分类结果.4 图像预处理 很多图像处理技术可以应用于脱机手写体汉字图像,包括:(对灰度图像)二值化、(对二值图像)伪灰度化、去噪、骨架化、边缘提取、倾斜矫正等.本节主要介绍字符图像分割的关键技术和方法.基于切分的汉字识别方法是目前汉字识别的主流方法.汉字的分割通常首先对整篇文档做行切分,再在行分割的基础上进行单个字符的分割.图3显示了手写体汉字分割处理的一般流程[2].只有当每一单个字符的图像都能正确地从整个文本页面图像中分割出来,才有可能进行正确的文字识别[5].然而,手写体汉字的书写随意性很大,相邻汉字之间的位置关系也复杂多样.手写体汉字的书写可能产生如下4种基本位置排列情况[7,8],如图4所示.(1)正常:汉字各自分开独立为整体;单个汉字中各个部件间的距离远小于字间距离.(2)粘连:汉字的某一笔在一点或几点与相邻汉字接触;(3)重叠:汉字间无接触,但无法用垂直分割线分割;(4)过分:汉字左右部分间距过大或汉字内部出现笔画断裂.604 电 子 学 报2010年真实手写文档上述情况往往同时出现,这是造成无法正确分割汉字的主要因素,对这种手写体汉字的切分是今后研究的重点和难点问题[8].目前手写体汉字分割广泛采用的方法如下:4.1 投影法投影法(Project Profile H istogram,PPH)通过统计图像中每一列(行)黑像素的个数得到投影直方图.在直方图中字符区域对应于波峰,字符间隔对应于波谷.投影法简单,速度快,对印刷体汉字和手写印刷体汉字的分割有相当好的效果,但是会将粘连或重叠的字符识别为一个字符,出现弱分割现象;或将过分字符识别为若干字符,产生过分割现象.412 连通域分析法连通域分析法[8](C onnected C om ponent Analysis, CC A)是在整个字符图像中寻找相连的像素作为连通元,分析这些连通元本身的图像属性,判断它们是否属于同一个字符图像,然后利用先验知识对它们进行拆分和合并.连通域分析法对于重叠字符和倾斜字符能够取得理想的分割效果.但使用该方法时连通元容易过碎,使严重断裂的字符图像无法重新合并,真正粘连的字符也不能通过连通元切分开,需在后续的识别模块中加入粘连字符模板或者通过其它方法进行再切分. 4.3 Viterbi算法m层单向图,建立一个隐马尔可夫模型(H idden M arkov M odel, H M M)来表示该有向图[8,9].图中的每个节点对应隐含状态,有向边表示状态的转移方向,用节点轨迹组成观测序列,其概率分布为分割路径穿过结点的几率大小, m是观测序列的长度.采用Viterbi算法[10~12]寻求分割路径,相当于在图中沿着有向边方向找出所有路径中的最大概率者,组成顺向首尾相接的一串有向边的集合,即得到非线性的分割路径.Viterbi算法对于交错、单处笔划粘连等字符能够得到较好的分割效果,但并未从根本上解决多种粘连方式的分割问题.4.4 基于识别的方法将字符分割与识别截然分开,分割将是手写体汉字识别误差的主要来源,基于识别的统计分割方法是汉字分割的新出路[5].基于识别的方法首先将字符分成若干组成部分,并采用合并策略在多条候选的合并路径中通过识别结果选择一条最佳路径[13,14].基于识别的字符分割方法通过识别模块来指导切分,识别结果对分割起着决定性的作用,分割是识别的副产品[9],分割结果依赖于识别分类器的性能[13].图像预处理会给字符图像带来干扰或形变,引入新的误差.改进的二值化、细线化、字符归一化、字符分割等图像预处理算法[15~17],能够减少预处理带来的字体变形等不利影响,但不能从根本上解决预处理带来的干扰.由于目前尚不能完全实现字符的正确分割,所以,对于基于分割的脱机手写体汉字识别,字符分割的精度直接决定后续汉字识别的精度,是手写体识别系统精度的瓶颈.文献[18]提出了一种无分割的手写体汉字识别方法,并通过实验证明了该方法的可行性.这种方法实质上是对文本进行行分割,再在行分割的基础上提取字符特征,而非精确到单个字符的分割.行分割相对字符分割简单,计算量小,引入误差更小.无分割脱机手写体汉字识别更符合人类识别字符的习惯,将是未来汉字手写体识别的新趋势.5 特征提取 手写体汉字识别特征提取方法可分为基于结构特征、统计特征和将结构特征和统计特征相融合的方法. 5.1 结构特征结构特征是汉字识别研究初期的主流方法,需要先抽取结构基本单元,再由这些基本单元构成来描述汉字特征.结构特征比较直观,符合人们书写汉字的过程,能较好地反映汉字的结构特性;缺点是对结构基本单元提取困难,各结构元素之间的拓扑关系复杂,抗干扰性较差.同时,由于汉字的结构特征通常都要利用细化算法提取,不仅计算量大而且会出现形变问题,给汉字识别带来新的噪声影响.5.1.1 基于特征点特征点是反映汉字形体特征整体分布状况的关键点.通常对大多数结构稳定的汉字,一旦获得了正确的特征点集,就可能顺利地按一定的策略和步骤(连接笔划、结构匹配等)将汉字形体划归为正确的字类.根据不同的研究思路,研究人员对特征点的定义也不尽相同[19~21].5.1.2 基于笔画一个汉字区分于其它汉字的主要特征就是笔画及其所在的位置,“横”、“竖”、“撇”、“捺”四种笔画的数量及其相对位置唯一地确定了一个汉字[22].基于笔画的特征提取方法将字符分解成笔画,并根据笔画的数量、顺序和位置进行识别[23~26].“横”、“竖”、“撇”、“捺”是构成汉字的四种基本笔画,所占比重大,并且提取容易,因而在识别系统中常采用它们作为识别特征.5.1.3 基于部件部件是一个居于笔画和单字之间的中间层次,相当于西文的字母.把若干个部件按照一定规则加以组合就可构成方块汉字.我国语言文字工作委员会对G B130001字符集中的20902个汉字逐个进行拆分、归纳与统计后,制定《汉字基础部件表》,共有560个可供独704第 2 期赵继印:脱机手写体汉字识别综述立使用的部件.这560种部件并不都适用于汉字识别,通常从中选用若干部件作为识别特征[27].文献[28]提出的基于部件的汉字分解示意图,如图5所示.图中的4个汉字具有相同的3个部件,可根据最后一级分解部件来进行识别.5.2 统计特征统计特征一般针对单个汉字,即整字(H olistic ),提取方便,抗干扰能力强.文献[5]指出,汉字结构的复杂,在统计识别方法中,不仅不是缺点,而且使得汉字具有比其他西方文字具有更强的鉴别能力,不仅可以识别成千上万个超多类汉字,而且具有高抗干扰和高鲁棒识别性能,这是结构分析方法无法达到的.统计特征的缺点是没有充分利用汉字的结构信息.本节针对脱机手写体汉字主流的统计特征方法进行介绍.5.2.1 弹性网格特征弹性网格特征(E lastic M esh ,E M )用一种弹性网格将汉字图像分块,对每一块内的像素进行变换或者分析后产生特征向量[29~32].对字符进行弹性网络的划分能有效地反映汉字的结构细节和字符的共同特征,避免手写体汉字中因个人书写风格差异引起的字体变形和因数据采集、非线性变换等因素导致的样本变形等问题.但该方法各个块之间互不关联,不能体现汉字的整体结构信息.5.2.2 方向线素特征方向线素特征(Directional E lement Feature ,DEF )首先抽取汉字的轮廓,并考察轮廓点像素的8邻域内的黑像素点在水平、垂直、+45°、-45°四个方向上的分布情况.如有符合四个方向上的任一种情况,则该像素对应方向上的方向线素值加一个常数[33~35].方向线素特征同时反映了字符的结构和统计特征,比较全面地代表图像信息,是汉字识别领域一种成熟的特征提取方法.但方向线素特征的特征维数多,在进行特征匹配之前要对特征向量进行降维处理,增加了识别算法的复杂度.5.2.3 G abor 特征G abor 滤波器是窄带带通滤波器,有明显的方向选择和频率选择特性,能在空域和时域同时达到最优联合分辨率[31],因此G abor 滤波器在脱机手写体汉字识别中提取特征方面得到了广泛应用[36~38].G abor 变换提取汉字特征充分反映了笔画结构在空间上的局域性,笔画的方向性以及在频域上笔画与干扰的可分性等重要特性,提高了识别算法的鲁棒性和对细节的分辨率.G abor 滤波器缺点在于特征提取时间较长且提取的特征数据存在冗余性,需通过主成分分析等方法进行压缩.5.2.4 矩特征脱机手写体汉字识别中采用Hu 不变矩、Legendre 矩、Z ernike 矩、K raw tchouk 矩、小波矩[3946].Hu 矩为非正交矩,含有大量冗余信息.正交矩对模式具有位移、旋转和变换不变性,在应用中最具代表性的是Legendre 矩和Z ernike 矩.CH O 2H UAK THE 和RO LAND T.CHIN [47]对Legendre 矩和Z ernike 矩在噪声敏感性、信息冗余和图像表示能力三方面进行了实验对比和理论分析,结论表明Z ernike 矩的效果在各方面都优于Legendre 矩.Z ernike 矩可以任意构造高价矩,因而包含更全面的图像信息,所以Z ernike 矩识别效果更好.与Z ernike 矩和Legendre 矩等连续正交矩特征相比,K raw tchouk 矩是数字域的离散正交矩,不存在数字化过程中所带来的近似误差问题,在计算过程中不需要进行坐标转换,而且构造简单,更加适合用来描述数字图像[46].小波矩能同时得到图像的全局特征和局部特征,因而在识别相似形状的物体时有更高的识别率[48,49].对于手写体汉字识别,单独运用结构特征和统计特征中的任何一种单一的特征,必然存在识别的盲区.将汉字结构特征和统计特征等多种特征相结合,可以实现各种特征的优势互补,能够更全面地反映汉字的特征.特征融合后的脱机手写体汉字通常具有多维的特征,增加了识别算法的计算复杂度,因此普遍采用PC A ,LDA 和FDA 等方法[50~52]对特征向量进行降维处理后再送入分类器分类.多特征融合的方法成为手写体汉字识别特征提取的主流方法[53~56],是未来发展的必然趋势.如果能够借鉴相关领域的研究成果,引入更适于手写体汉字的特征描述方法,特别是能够直接从原始字符图像提取的特征,将简化图像预处理步骤,减少因预处理带来的误差,进一步提高脱机手写体汉字的识别精度.6 分类器设计 手写体汉字识别的对象是几千个(种)汉字,脱机手写体汉字识别常用的分类器可分为单分类器和多分类器集成两种.多分类器集成的方法是目前的主流技术,同时也是未来的发展趋势.6.1 单分类器6.1.1 改进的二次判别函数改进的二次判别函数(M odified Quadratic Discrim ina 2804 电 子 学 报2010年tion Function,M QDF)分类器以一个G auss分布去描述每个类的样本分布,直接采用常数代替偏小特征值,有效地缓解了小特征值估计误差所带来的系统性能下降[5].基于统计模型的M QDF分类器便于设计与实现,且具有很好的鲁棒性和较高的识别准确率,因此在脱机手写体汉字识别中得到广泛的应用[57,58].6.1.2 支持向量机支持向量机(Support Vector M achine,S VM)根据Vap2 nik提出的结构风险最小化原理,通过最大化分类间隔,使学习机的泛化性能尽量提高,其优越性在理论和实验方面都得到了深入地研究和验证.S VM是一个两类问题的判别方法,在对多类问题实现分类时,采用一对一、一对多、S VM决策树和有向无环图支持向量等分解策略,因此S VM的计算复杂度和时间复杂度较大,一般不用于直接分类[52].针对这个问题,目前研究者[15,59~63]提出了如下解决方法:(1)采用S VM作细分类;(2)将大规模字符集划分成小的子集;(3)采用多种S VM算法的改进形式.引入各种改进的快速S VM多分类算法[64~66]到脱机手写体汉字识别领域中,也能够提高识别的速度.6.1.3 人工神经网络人工神经网络(Artificial Neural Netw ork,ANN)具有并行处理、自组织、自适应和学习能力,被广泛的应用,包括:BP网络[67]、多层感知器网络、模块径向基神经网络[50]、自适应振荡神经网络[68,69]、H opfield网络、自组织特征映射网络等[1].ANN 用于大字符集分类时,训练时间和分类时间太长,一般不用于直接分类[52].文献[70]针对这个问题,提出了在预分类结果的基础上,采用简化的样本集对ANN进行训练的策略,在不降低识别效果的基础上,大大缩短了ANN在大样本集上的收敛时间.6.1.4 隐马尔科夫模型常用的统计语言模型是建立在将文本语言看作为字或词的不同阶的马尔可夫链的基础上,语言相关模型的参数可以通过大型语料库的学习而获得.语言模型和单字识别结果的可信度结合,利用Viterbi算法,获得在考虑上下文信息的语言模型条件下的最优文本识别结果.由于实际资源的限制,实际系统中往往采用字或词的一阶或二阶马尔科夫模型[71,72].隐马尔科夫模型适合于大规模分类,缺点是尚缺乏公认权威的语言模型.目前广泛应用的是对某种特定领域进行小规模的建模,如邮政地址系统,银行手写支票金额的模型. 6.2 多分类器集成多分类器集成算法通过特定的组合方式,能够对单分类器取长补短,发挥各个组成分类器的最大优势.多分类器集成算法中每一个组成的分类器称为元分类器,可以采用611节介绍的任何一种单分类器的形式.集成算法根据其结构可分为串行和并行结构两类.6.2.1 串行结构串行结构的集成算法[73]是根据汉字识别特点对整个识别过程进行分级,或分阶段处理.前一级的输出结果是后一级的输入,后一级识别是对前一级识别的细化和延续,实现多特征多方法的互补以及多识别级间信息的利用,以进一步提高汉字识别率.6.2.2 并行结构并行结构的集成算法首先构造多个分类器,这些分类器基于不同特征、不同分类器形式或是不同训练样本集合,每个分类器独立训练,相互之间没有影响.针对各分类器的输出结果,采取一定的规则进行融合或表决,得到最终的输出结果.常用的表决策略有投票法、D2S(Dem pster2Shafer)法、行为知识空间法、综合集成法、基于置信度的神经网络集成法等[1].从模式识别的观点来说,汉字识别是一种超多类的模式集合,已有的适用于模式类别较少的识别方法和理论已不完全适用[27].应选择针对大规模数据集的分类方法或者对汉字类别进行合理的划分,以适应目前的分类方法.采用结合了串、并行结构的混合结构多分类器集成对脱机手写体汉字进行分类是未来的发展趋势.串行分类器具有分类递进,后级分类器能够弥补前一级识别的不足,实现细节上的互补的优点;并行分类器能够在全局的分类器输出结果间取得整体上的平衡.因此,采用混合结构的多分类器集成策略,能够实现细节与整体上的双保险,从而提高脱机手写体汉字识别的精度.7 数据库 建立手写汉字数据库是研究和开发手写汉字识别技术的基础.目前国内外一些研究团体已建立并公开了大规模的字符识别数据库.脱机手写体汉字识别的结果在这些数据库上实验,更有利于公正客观地对比实验结果,促进汉字识别技术研究的深入与发展.目前,具有典型代表性的数据库有以下几种.7.1 ET L字符数据库ET L字符数据库由日本电子工业发展协会(Japan E lectronic Industry Development Association,现在的Japan electronics and in formation technology industries association)、大学和研究机构联合协助的电工技术实验室(E lec2 trotechnical Laboratory,现在的Tsukuba central2,national institute of advanced industrial science and technology,AIST)收集[74].ET L数据库包含了120万手写和机器印刷字符图片,涵盖了用于识别研究的日文,中文,拉丁文和数字字符.数据库图片分别有60×60,64×63,72×76,和904第 2 期赵继印:脱机手写体汉字识别综述128×127不同像素规格.字符图片文件包含不止一个记录,每个记录有一个字符图片和对应的ID 信息的编码.该数据库不包含书写者信息.图6是ET L8中的字符样本[24]和ET L9B 数据库中的部分字符[56].7.2 HC L2000数据库HC L2000数据库[75]是由北京邮电大学信息工程系在国家863计划的资助下研发的一个大规模脱机手写汉字数据库系统.该数据库面向一级汉字,包含了3755×1300个手写汉字样本和1300个书写者的个人信息,可实现汉字样本信息和书写者信息间的互查,为研究各类人员的文字书写特征及影响识别率的相关因素提供了方便.每个汉字样本采用64×64个二值像素描述,占用512字节.书写者信息除书写者标识信息外,还包括性别、年龄、职业、文化程度、书写工具等.图7是两幅来自于HC L2000数据库[76]的字符图片,编号分别为Hh451和Hh453.HC L2000数据库是目前我国汉字识别领域被广泛采用的数据库.7.3 HIT 2MW 数据库HIT 2MW 数据库[3,18]由哈尔滨工业大学计算机科学与技术学院开发.该库由780多个书写者在无监督的情况(无监督情况是指书写参与者与数据库收集者并不发生正面接触,而是通过邮寄等方式将数据库页面交与书写者,书写者按照自己习惯的书写规则在一块未经分格的区域书写题签上标注的内容,允许出现涂改、文本行倾斜和交叠等复杂手写现象)下书写完成,优化出合格的手写样本853份.HIT 2MW 数据库字量为186444字(包括标点、字母和汉字),涵盖了大部分G B2312280一级汉字,一定量的G B2312280二级汉字,甚至G B2312280字符集以外的少量汉字.图8和图9是两幅来自HIT 2MW 数据库的样本,编号分别为b04090303和b04090902.HIT 2MW 数据库中的手写体样本不是按照孤立的汉字书写,而是按照一定的规则从《人民日报》上随机抽取的一段200字左右具有一定含义的文字,因此可以看作是真实的手写体样本.迄今为止,HIT 2MW 数据库已被美国U C Berkeley ,日本T oky o 大学,清华大学,吉林大学和华南理工大学等多家科研院所采用,应用领域主要集中在中文文档的行切分、汉字的切分识别、中文文本的无切分识别、笔迹鉴别和签名验证等方面.8 识别后处理及评价准则 手写体汉字识别后处理一般是根据上下文关系对单字的识别进行处理.利用后处理技术,能够实现对单字识别结果的确认或者纠错,进一步提高整个汉字识别系统的正确率.目前主流的后处理技术包含以下3个步骤:(1)根据上下文关系建立基于词或字的N 元语法(N 2gram )统计语言模型,即N -1阶M arkov 模型.实践中最常见的是bi 2gram 或tri 2gram 模型[77~81];(2)确定并调整候选字的相似字集,作为候选字符集;(3)在候选字符集上,根据统计语言模型,以句子为处理单元,采用Viterbi 算法选择具有最大概率的句子路径,从而确定相014 电 子 学 报2010年。

相关文档
最新文档