基于多尺度的蒙古文脱机手写识别方法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于多尺度的蒙古文脱机手写识别方法
武慧娟;范道尔吉;白凤山;滕达;潘月彩
【期刊名称】《中文信息学报》
【年(卷),期】2022(36)10
【摘要】蒙古文的一大特点是字符无缝连接,因此一个蒙古文单词有多种字符划分方式。
根据蒙古文这一特点,该文提出了多尺度蒙古文脱机手写识别方法,即让一个
手写蒙古文单词图像对应多种目标序列,用多个目标序列同时约束训练模型,使得模
型更加精准地学习手写图像的细节信息和蒙古文构词规则。
该文提出了“十二字头”码、变形显现码和字素码3种字符划分方法,且拥有相互包含关系,即“十二字头”码可以分解为变形显现码、变形显现码可以进一步分解为字素码。
多尺度模型首先用多层双向长短时记忆网络对序列化手写图像进行处理,之后加入第一层连接时序
分类器做“十二字头”码序列的映射,然后是第二层连接时序分类器做变形显现码
序列的映射,最后是第三层连接时序分类器做字素码序列的映射。
用三个连接时序
分类器损失函数的和作为模型的总损失函数。
实验结果表明,该模型在公开的蒙古
文脱机手写数据集MHW上表现出了最佳性能,在简单的最佳路径解码方式下,测试集Ⅰ上的单词识别准确率为66.22%、测试集Ⅱ上为63.97%。
【总页数】7页(P81-87)
【作者】武慧娟;范道尔吉;白凤山;滕达;潘月彩
【作者单位】内蒙古大学电子信息工程学院
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于双射变换的脱机手写数字识别方法
2.基于GA-BP神经网络的脱机手写藏文识别方法
3.一种基于复合特征的脱机手写体字符识别方法
4.基于反馈知识迁移的脱机手写体汉字识别方法
5.基于GA-BP神经网络的脱机手写藏文识别方法
因版权原因,仅展示原文概要,查看原文内容请购买。