【CN109993162A】基于卷积神经网络的老挝语印刷体文本光学字符识别方法【专利】

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910156076.6
(22)申请日 2019.03.01
(71)申请人 昆明理工大学
地址 650093 云南省昆明市五华区学府路
253号
(72)发明人 周兰江 郝永彬 周枫 张建安 
(51)Int.Cl.
G06K 9/32(2006.01)
G06K 9/34(2006.01)
(54)发明名称基于卷积神经网络的老挝语印刷体文本光学字符识别方法(57)摘要本发明公开了一种基于卷积神经网络的老挝语印刷体文本光学字符识别方法,属于自然语言处理和机器学习技术领域。

本发明在输入印刷体文本扫描图片后,首先对图像进行二值化处理,并进行旋转矫正。

然后因为老挝文为从左至右书写的横排元音附标文字,因此将预处理过的图像通过投影直方图法,按照先行后列的顺序,对整页字符进行切割,切分成老挝文字符组合。

然后将切分出的老挝文字符输入针对老挝语特征建立的四路并行卷积神经网络模型中,输出对应的字符文本。

最后按照老挝语语言规则对字符文本序列进行后处理,产生最终文本输出。

本发明在老挝语字符识别及纸质资料数字化处理上
有一定的应用价值。

权利要求书1页 说明书4页 附图2页CN 109993162 A 2019.07.09
C N 109993162
A
权 利 要 求 书1/1页CN 109993162 A
1.一种基于卷积神经网络的老挝语印刷体文本光学字符识别方法,其特征在于:包括如下步骤:
Step1,将计算机可处理的数字图像进行输入,输入图像为由扫描仪扫描获得的印刷品扫描图片;
Step2,对图像进行预处理,即通过数字图像处理技术,按照局部自适应二值化方法将输入图像转换为二值黑白图像,消除噪点,然后根据最小外接矩形对图像扭曲进行矫正;
Step3,对二值化的无扭曲图像进行先横向后纵向的投影直方图法分析,根据直方图峰/谷特征,在直方图谷处进行划分,将整幅图像切割为单字符图像;
Step4,将单字符图像输入四路并行的卷积神经网络模型中,在每路中分别判别出老挝语字符中声调/上部元音/辅音/下部元音等书写于不同位置的字符,输出字符;
Step5,对Step4输出的字符进行判断,是否将上部元音或下部元音错误切分为一行,如存在错误返回Step3进行修正,然后根据老挝语固定搭配习惯,对输出文本进行修正;
Step6,输出输入图片对应的文本。

2.根据权利要求1所述基于卷积神经网络的老挝语印刷体文本光学字符识别方法,其特征在于:所述步骤step2中先采用局部自适应二值化方法将RGB彩色图像转制为二值图像,再采用形态学开操作减少噪点,然后采用用最小外接矩形法修正图像倾斜,获得无扭曲二值化图像。

3.根据权利要求1所述基于卷积神经网络的老挝语印刷体文本光学字符识别方法,其特征在于:所述步骤step4中的每一路卷积神经网络,按照“输入-批标准化-卷积-卷积-池化-丢弃参数-卷积-池化-丢弃参数-卷积-池化-批标准化-展平-全连接-批标准化-全连接-输出”的层次结构,构建神经网络模型,对老挝语字符进行识别。

2。

相关文档
最新文档