光学字符识别技术_图文.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
光学字符识别技术中图像处理
一.文字识别系统的构成。
印刷体识别的原始图像是通过扫描仪、 CCD器件或传真机等获得的二维灰度或二 值图像,其识别过程如下图:
进入OCR系统
获取图像识别
图像预处理
版式分析
文本的切割 识 别 特征提取
单字识别
后处理Leabharlann Baidu
文稿校对 结束
二.文字识别技术
OCR识别技术可分为印刷体识别技术和手 写体识别技术,而后者由分为联机手写识 别和脱机手写识别技术。从识别难度上讲, 多印刷体识别技术难于单印刷体识别,手 写字体识别难于印刷体识别,而脱机识别 难于联机识别。
用于文字识别的方法有统计模式识别,结构模式识别和 人工神经网络等方法。
在OCR系统中,是一个典型的图像处理系 统,从图像的获取,预处理,到文本的切 割,看将其视为一个输入图像输出图像的 一般意义上的图像处理,二特征的提取到 输出文本可认为是一个图像分析的过程, 是一种更广义上的图像处理。
在进行印刷体汉字识别时,首先将印在纸 上的汉字,经过电扫描产生模拟信号,再 经过模电转换将其转变为灰度图像输入计 算机。纸张的薄厚、洁白度、光洁度、油 墨深浅、印刷质量,产生的污点、飞白、 断笔,交连等干扰。输入设备光学畸变、 量化等过程也要引入的噪声。所以在当个 汉字识别之前要对这副图像进行预处理。
展台设计 http://www.hehuexpo.com
编辑:cvdfbgnyhtt993456
纵上所述,OCR系统中使用的基本图像处理原理 和方法如下: 图像获取的基本原理,图像的表示存储;图像的 旋转; 图像去噪声、平滑,即图像的增强和复原; 图像分割; 图像的模式识别分析等。