手写识别技术

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

手写识别
编辑词条分享
请用一段简单的话描述该词条,马上添加摘要。
目录
? 1 手写识别(HandWriting Recognition)技术
? 2 HWR与jHWR
?
手写识别 - 手写识别(HandWriting Recognition)技术
 手写识别(Handwriting Recognize),是指将在手写设备上书写时产生的有序轨迹信息转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程,是人机交互最自然、最方便的手段之一。随着智能手机、掌上电脑等移动信息工具的普及,手写识别技术也进入了规模应用时代。 随着智能手机、掌上电脑等移动信息工具的普及,手写识别技术也进入了规模应用时代。
手写识别能够使用户按照最自然、最方便的输入方式进行文字输入,易学易用,可取代键盘或者鼠标。用于手写输入的设备有许多种,比如电磁感应手写板、压感式手写板、触摸屏、触控板、超声波笔等。
手写识别属于文字识别和模式识别范畴,文字识别从识别过程来说分成脱机识别(off-line)和联机识别(on-line)两大类,从识别对象来说又分成手写体识别和印刷体识别两大类,我们常说的手写识别是指联机手写体识别。
手写识别 - HWR与jHWR

jHWR手写识别系统以先进的大容量字典技术为基础,是一种能够在任何时间、任何地点,向任何人实时、准确的提供手写识别服务的高效便捷手段,非常符合信息时代动态更新和个性化查询的需求。
JHWR体系结构
联机手写识别是指将在手写设备上书写时产生的有序轨迹信息转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字内码的一个映射过程。 下图为eJHWR的体系结构展示:
jHWR体系结构







jHWR引擎特点


1.中文识别范围
2. 多个识别字典可供选择
3. 多语种识别
4. 更高的识别效果
5. 出色的识别引擎性能
6. 完善的识别功能库
7. 多样化的输出结果
jHWR的识别产品图
jHWR识别产品图




jHWR的识别流程
jHWR的识别流程















什么是eJHWR
(一)eJHWR技术,运用句法结构自学习算法和基于特征统计算法的多核心融和技术。具有如下特点:
1.识别率高。
2.识别速度快。
3.无笔顺限制。
4.数据字典大小可缩扩。
(二)eJHWR支持环境
OS: WinCE , Nucleus, Embedded Linux , Symbian, Palm Os, HOPEN, pSOS, UCOS等
CPU: DragonBall(Motorola 68000) EZ(16M) 和VZ(33M),MIPS, SH3, SH4, ARM7, StrongARM, ARM9, Xscale等
(三)eJHWR可以带来如下主要功能:
1.文本输入— 取代键盘输入的频繁按键,文字符号夹杂时免去频繁的输入方

式切换,遇到不确定读音的文字也可照常书写。
2.快速定位— 用手写笔担当鼠标,快速定位,比键盘操作自如得多。
3.快速查询— 当菜单层级太深或者不知道该查询信息的准确分类时,调用手写输入,免除频繁而茫然的键盘操作实现快速查询。




手写输入方法,是完全以平常的习惯,把要输入的汉字写在一块叫书写板的设备上(实际上是一种数字化仪,现在有的与屏幕结合起来,可以显示笔迹)。这种设备将笔尖走过的轨迹按时间采样后发送到计算机中,由计算机软件自动完成识别,并用机器内部的方式保存、显示。
汉字识别的方法基本上分为统计识别、结构识别以及神经网络方法等几大类。大量的联机手写识别系统采用的都是结构识别方法。所谓结构识别方法,其出发点是汉字的组成结构,从汉字的构成上讲,汉字是由笔划(点、横、竖、撇、捺等)、偏旁、部首构成,通过把复杂的汉字模式分解为简单的子模式直至基本模式元素,对子模式的判定,以及基于符号运算的匹配算法,达到对复杂模式的识别。结构识别法的优点是区分相似字的能力强,缺点是抗干扰能力差。统计识别方法是将汉字看为一个整体,其所有的特征是从这个整体上经过大量的统计而得到的,然后按照一定准则所确定的决策函数进行分类判决。统计识别的特点是抗干扰性强,缺点是细分能力较弱。
识别率是手写汉字识别研究中最重要的环节,影响识别率的因素也是手写识别技术研究中的难点,目前影响识别率的因素主要有以下几个方面:
 笔顺问题。由于不同人具有不同的书写习惯,笔划的书写顺序经常发生变化,因此,单纯通过串匹配进行识别难以达到理想效果。对汉字进行描述时,仅仅采用一维串也就显得不够,必须利用一些二维方法来描述,从而又极大地增加了匹配的难度。
 连笔问题。一般人写字时都不会一笔一划地书写,为了节省时间,连笔字是自然而然的事情,一些行书连笔甚至完全脱离了楷书的框架。从实用角度讲,连笔问题比笔顺问题具有更重要的意义。对于结构识别而言,连笔一方面使笔划种类大大增加,甚至达到难以归纳的程度;另一方面,连笔又使得笔段抽取难度大增,因为连笔会增加一些冗余笔段,连笔造成的畸变又会使笔段方向严重离散。总之,连笔不论对于基于哪种基元的结构识别都是严峻的挑战。
 相似字区分。汉字种类繁多,很多汉字彼此之间非常相似,例如“己、已、巳”三个字相差只在细微之间。手写汉字的变形十分严重,怎样能使识别系统抓住微小的差别,目前还是一个非常

值得研究的问题。
 对抗干扰能力的要求。抗干扰能力,也称为鲁棒性,对于联机手写识别系统的性能是非常重要的。书写时候,笔划的畸变、丢失,多余笔段(如笔锋)的插入,字的倾斜,部件间相对位置、大小的变化,这些都是经常发生的现象。对于结构识别来说,会造成基元提取和识别的错误。传统的结构识别方法恰好在鲁棒性上是薄弱环节。因此,要想取得好的性能,必须对传统识别方法进行改进,增强其鲁棒性,从而增加实用性。


相关文档
最新文档