OCR文字识别技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
OCR文字识别技术
OCR文字识别技术是随着扫描仪的普及而兴起的,令人非常高兴的是,这项技术已经相当成熟,在未来的几年中也将长盛不衰。OCR是Optical Character Recognition的简称,指光学字符识别技术,是自动识别技术研究和应用中的一个重要领域。对于大批量的印刷文字向电子文档的输入,OCR文字识别技术无疑是最好的,效率与识别率都能让用户十分满意。当然,这点大家还得感谢我们的祖先,因为中文笔划复杂而非常容易识别,
至于英文可就没有那幺幸运了。
1、扫描
完成各个扫描参数的设置后开始扫描,选择扫描方式,是使用“TWAIN
扫描界面”还是使用“直接终扫”。
选择“TWAIN扫描界面”则要进行两次扫描,第一次“预扫”目的是为
了测定被扫描文件的亮度,用户在“预扫”结果中对扫描亮度、分辨率以
及扫描范围进行调整后再进行“终扫”。
如果选择“直接扫描”,系统只进行一次扫描,假如用户在直接终扫的
亮度选择中已选“固定”或者“自动”,扫描后将直接显示扫描获得的图像;假如选择的是“手动调整”,则扫描结束后,屏幕显示“选择亮度”
对话框,可边调整亮度边观察图像的明暗变化和扫描质量,直到对图像满意。
2、识别
倾斜矫正
由于印刷和用户多方面操作的原因,扫描得到的图像可能有一定的倾斜
角度,尤其是小的倾斜角度,在扫描中难以避免,对于特别小的倾斜角度(约1—2度)OCR系统可以自动适应,无须任何处理就可识别。对于倾斜角度小于10—15度时,可以先进行倾斜矫正,然后在进行识别处理,如果倾斜角度大雨15度,图像失真,建议从新扫描。OCR系统自动倾斜矫正和自动倾斜矫正两种方式。建议使用自动倾斜矫正。
版面分析
版面分析是将扫描得到的图像,划分出每一个区域块。对于各个不同的
区域块,也就是划分出我们所要识别的图像中文字所在的区域范围。版面分析分为自动版面分析和手动版面分析。简单的图像版式建议使用自动分析,报刊等复杂版式建议采用手动分析,以免遗漏所要识别的文字。
进行识别
图像文件根据各自情况经过倾斜矫正、版面分析等处理后,即可进入识
别程序(图像中只含有单栏的横排文字,没有其他的复杂的内容,可以不进行版面分析,就能识别)。识别是OCR系统的核心,为了保证正确的识别,应按以下的步骤进行。
(1)选择正确的识别字体
根据识别图像的具体情况选择字体
简体多体(印刷体)——常见的宋体、仿宋体、黑体、楷体、圆体
繁体多体(印刷体)——常见的宋体、仿宋体、黑体、楷体、圆体
纯英文(印刷体)——常见的英文多种字体
手写体——要求笔记规范、不潦草
(2)识别
点击OCR系统工具条中的“识别”命令进行操作,如果对于识别过的图像进行再次识别,系统会出现对话框,提示是否覆盖已有的识别结果。