OCR识别的处理技术流程

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
OCR的处理流程如下:
首先将标的物的影像输人,然后经过影像前处理、文字特征抽取、
比对识别等过程,最后经人工校正将认错的文字更正,将结果输出。详细
如下:
专注下一代成长,为了孩子
书山有路勤为径;学海无涯苦作舟
影像输入
要想进行OCR处理,必须先通过光学仪器,如影像扫描仪、传真机或
任何摄影器械,将影像转人计算机。随着科技的进步,扫描仪等输人装置
已制作得愈来愈精致,轻薄短小,品质也高,对OCR有相当大的帮助。扫
描仪分辨率的提高使影像更清晰,扫描速度的加快提高了OCR处理的效率
影像前处理
影像前处理是OCR系统中需解决问题最多的一个模块。从得到一个
不是黑就是白的二值化影像或灰阶、彩色的影像,到分离出一个个的文字
影像的过程,都属于影像前处理。它包含了影像正规化、去除噪声、影像
首先,如果我们阅读一篇用并非自己知道的语言所写的文章,我们
能大概地分辨不同的字母,但却不能理解其意义。然而,对于这样的文章,
我们通常能够理解其中的数字符号。因为它们是我们所广泛使用的。同样
的道理可以解释为什幺许多OCR系统只能辨认数字,而只能相对较少地辨
认数字与字母的组合字。
其次,在字母与数字中有许多相似的地方,比如,在识读到字母与
矫正等的影像处理,以及图文分析、文字行与字分离的文件前处理。影像
处理的原理及技术都已成熟,在网站上有不少可用的链接库;在文件前处
理方面,则凭各家本领了;影像需先将图片、表格及文字区域分离出来,
甚至可将文章的编排方向、文章的提纲及内容主体区分开,而文字的大小
及文字的字体也可如原始文件一样地判断出来。值得一提的是如何将独立
书山有路勤为径;学海无涯苦作舟
OCR识别的处理技术流程
一个OCR识别系统,其目的很简单,只是要把影像作一个转换,使
影像内的图形继续保存,若有表格,则将表格内资料及影像内的文字一律
变成计算机文字,使能达到影像资料的储存量减少,识别出的文字可再使
用及分析,当然也可节省因键盘输人的人力与时间。
要想实现这一目的,可以对比人识别文字的过程:
数字的组合字的时候,你几乎很难分辨出字母“O”与数字“0”的差别。
作为人类,我们是可以通过阅读句子和段落来了解其精确的意思。但对于
机器设备来说,这个过程实在是太困难了。
最后,我们要依靠对照来帮助分辨字符。对于那些出现在很黑的底
板或其他字词和图画上的字符,我们很难阅读。同样的道理,设计一套能
够理解所需要的数据而舍弃无用信息的字符识别系统也是一项艰难的任务。
文字从文字行抽取出来。中文字特别的地方在于它有部首的观念。因此,
不只是上下的合成,左右合成的字也特别多,且有可能是两部分(如“利”
、“明”等),也有三部分的(如“捌”、“晰”等)合成。当这些字与英文
或数字同时存在且紧靠在一起时,判断如何连接或切出,是相当困难的。
对排版整齐的印刷文件都无法百分之百解决,更何况是每个人写字习性都
不同的手写文件。也因此,手写的OCR产品走向是特殊且有限制的。
文字特征抽取
单以识别率而言,特征抽取可说是OCR的核心,用什幺特征,怎幺
抽取,直接影响识别的好坏,所以在OCR研究初期,特征抽取的研究报告
特别多。而“特征”可说是识别的筹码,可简易的区分两类。一类为统计
的特征。例如文字区域内的黑/白点数比,当文字区分成好几个区域时,
专注下Leabharlann Baidu代成长,为了孩子
相关文档
最新文档