光学字符识别技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
联机手写识别
脱机手写识别
识别快
出错多
空间多
识别慢
出错少
更新快
识别器是系统的核心:
实时 识别
输入被识 别样本
特征提取 特征选择
分类识别
百度文库识别输出
学习
输入 学习 样本
特征提取 特征选择
分类识别
分类器设计
改进分类器
检验
特征 字典
用于文字识别的方法有统计模式识别,结构模式识别和 人工神经网络等方法。
OCR应用领域
证照类
证 件 识 别
OCR识别证件表面信息
扫描仪: 扫描证件 正反面
身份证识读仪: 读取芯片信息
识别到的证件信息:
姓名 XXX
性别 X 民族:XX 出生 XXXX年XX月XX日
照片
住址 XXXXXXXXXXXXXX
公民身份号码 XXXXXXXXXXXXXXXXXXXXX
签发机关 XXXXXXX
有效期限 XXXX。XX。XX-XXXX。XX。XX
票据类 证照类 银行卡、车牌 名片、文档 人民币冠字号
票据类
OCR识别 自动分类 票 据 自 动 分 类
中国银行 招商银行 工商银行
转账支票 现金支票
支票
支票
票据类
OCR 识别引擎将票面要素(大写金额、小写金额、出票日期、 支票号、出票人账号、收款人、磁码、支付密码等)精准识别出来,实 现自动录入,自动校验,加快审核的及时性,降低人工肉眼辨别的疲劳 度。
名片文档管理
识别内容:
名 片
OCR识别
1、地址:XXXXXXX 2、手机:XXXXXX
识
3、电话:XXXXXXXXX
别
4、传真:XXXXXXXXX
5、公司名称:XX
✓ 快速录入人脉信息,
✓ 支持移动端、PC端及云 端识别
人民币冠字号
人民币纸币上的编码又称冠字号码,“冠字”是印在纸币上用来标记印刷批次的 两个或三个英文字母,由印钞厂按一定规律编排和印刷;“号码”则是印在冠字 后面的阿拉伯数字流水号,用来标明每张钞票在同冠字批次中的排列顺序。
一个OCR识别系统,其目的很简单,只是要把 影像作一个转换,使影像内的图形继续保存、有表 格则表格内资料及影像内的文字,一律变成计算机 文字,使能达到影像资料的储存量减少、识别出的 文字可再使用及分析。可以极大减轻数据录入工作
的强度,提高数据录入的速度。
一.文字识别系统的构成。
➢ 印刷体识别的原始图像是通过扫描仪、 CCD器件或传真机等获得的二维灰度 或二值图像,其识别过程如下图:
票据类
OCR识别 自动分类
凭 证
OOOCCCRRR识识识别别别 自自自动动动分分分类类类
识
别
分
类
类型:开卡 类型:建立卡与用户关系
类型:换卡 类型:销卡
证照类
资 质 文 件 分 类
资质文件影像资料
自自动动自识命动别名自自命、、动动名命分、名类、 自动自分动类分类
企业法税人务营登业记执证照 组织机构代码证
识别过程
进入OCR系统 获取图像识别 图像预处理
版式分析 文本的切割
特征提取 单字识别 后处理 文稿校对
结束
识别
图像预处理
版式分析
文本的切割
去噪声 倾斜矫正 二值化等
段落
图表
表格
文本切割
字符切割
特征提取
统计特征
结构特征
单子识别
特征库
字库
后处理
语义
词频 结果纠正
二.文字识别技术
OCR识别技术可分为印刷体识别技术和手 写体识别技术,而后者由分为联机手写识 别和脱机手写识别技术。
企业法人营业执照 税务登记证 组织机构代码证
……
证照类
资 质 文 件 要 素 识 别
企业法人营业执照
识别内容:
1、注册号:XXXXXXX 2、执照编号:XXXXXX 3、名称:XXXXXXXXX 4、住所:XXXXXXXXX 5、法定代表人姓名:XX 6、公司类型:XXXXXX 7、注册资本:XXX万元 8、实收资本:XXX万元 9、经营范围:XXXXXXXXXXXXXXXX 10、营业期限:X年X月X日至X年X月X日
光学字符识别技术
OCR介绍
OCR(optical character recognition)文字识别[1] 是指 电子设备(例如扫描仪或数码相机)检查纸上打印 的字符,然后用字符识别方法将形状翻译成计算机 文字的过程;即,对文本资料进行扫描,然后对图 像文件进行分析处理,获取文字及版面信息的过程。
一致
比对信息
不一致
证件真伪
X
证件真伪
银行卡
识别到的证件信息:
OCR平台
银 行:Credit Bank 卡 号:3902 0181 9864 1384 有效期: 01/12 姓 名:UISER NAME
车牌OCR
✓ 智能停车场 ✓ 视频卡口自动识别车辆
名片文档
多平台管理:用户可通过手机、PC及WEB服务器端对文 档进行识别、管理多平台数据实时同步
冠字号
产品优势
高识别率 自动审核
自动检测 并修正
技术领先
影像加密 存储
自动起名 并分类
防篡改技 术
谢谢
谢谢!