票据识别技术研究进展

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

s se a emany i ec aa trs g n ai n meh db sd o h r c eit ie o eb l ez d r c g i o l o i sa d y tm r il t h r ce e me tt to , a e n c a a trs cl ft i ss ie e o n t n ag r h n nh o i n h l i t m
摘 要 :本文 对银 行 的票 据 自动识 别技 术 及 其进展 进 行 了论 述 。主要 是 票据 自动识 别 系统 的构 建 , 包括 扫描 输 入模 块 和识 别模 块 。介 绍 OC 在 票据 自动识 别 系统 中的 应 用 ,介 绍 一 些最新 票 据识 别 算法 ,主要 是 通 用票 据识 别 系统 中的 字符 R 切 分 方 法、基 于特征 线检 取 的 票据 识别 算 法和 滴水 算 法 。
Li n Zhao ong’ z 。
(. a g o g Ee tcP w r n u t c o l a g h u 5 0 2 , hn ;2E u a i & r i n e tr 1 Gu n d n lcr o e d sr S h o, n z o 1 5 0C i i I y Gu a . d c t n T an g C ne o i o a g o gP w r i C roa inGu n z o 5 5 0Ch a f Gu n d n o e d op rt , a g h u 1 2 , i ) Gr o 0 n
A bsr c :n t spa rb n noe uom ai de i c to e h l g a t o r s r ic s d. o ai d ni c to t a tI hi pe ,a k tsa t tc i nt a in tc no o y nd ispr g e sa e ds use Autm tci e tf ain i f i s se i m an y t e o tuci n il, cudng he c n n t o ul a h I nt y y tm s il h c nsr to b l i l i t s a ipu m d e nd t e de i M od l . sn t u eOCR p p r de ci s h a e srbe te a pl ai n o u o ai d n i c to yse t nto c o eo elt s il e og iin l o ih . nea t e og iin p i to fa t m tc ie tf ai n s t m o i r du es m ft ae tblsr c nto a g rt m Ge r lNoesr c nto c i h
计 算机 光盘 软件 与应 用
工 程 技 术 C m u e D S fw r n p lc to s o p t r C o ta ea dA p a i n i 2 1 第 9期 0 0年
票据识 别技术研究进 展
林 兆 宗
( . 东省 电 力 o _ 学校 ,广 州 5 0 2 ;2广 东电 网公 司教 育培 训 中心 ,广 州 5 02 ) 1广 r, -l k 15 0 . 15 0
d i eh . rpm tod
K e w o dsl nt c to n t s0 CR; y r :de i ain o e ; i f Chaa trs g e t to r ce e m n ai n


概 述 Βιβλιοθήκη 现 代 社会 的各 种 商业 活 动 ,特别 是银 行 方面 ,广泛 使 用各 种 票 据 ,特 别是 支票 的 使用 更加 广 泛 。随着 现 代社 会 的发 展 ,人 们 越 来越 多 的使 用支 票来 代 替现 金进 行 消 费和 结算 。 支票 的 广泛 使 , 必 然导 致支 票 的存 储 、管 理 以及 支票 信 息 的查 找变 得愈 加 难 。计 算 机逐 渐普 及 ,使 得 使用 电脑 管 理支 票成 为 可 能 ,但足 人 工输 入 支 票信 息 需耗 费大 量 的时 间和 人 力 ,因此 没 计一 个 智 能系 统 自动 识 别支 票 ,从 中提 取有 用信 息, 并按 照一 定 的分 类 规则 保存 到 数 据 库提 供用 广 大用 户检 索 查询 ,最大 程度 上 减少 用 户 的工 作量 就 显得 很 有必 要 。在 这些 工 作 的整 体规 划 中 ,基础 是 票据 识 别系 统 的构建 。前 提 是 O R技 术 的保证 。关键 是 票据 识别 算 法和 规 则数 C 据库 的优化 。 票 据 识别系 统主 要 由两 个模 块 组成 。如 图 ( 1 1 图 — )所 示 。
关键 词 :票据 识别 ;OC ;字符切 分 R
中图分 类号 :T 3 1 2 P1. 5
文 献标 识 码 :A
文章 编号 :10— 59 ( 0 0 0— 00 0 0 7 99 2 1 ) 9 02 — 4
R e e r h o Aut m a i a s a c n o tc l Che ueI ntfc to Te hno o y q de i a i n c i lg
对 识 别 出来 的数 据进 行 分类 ,并对 信 息不 全和 个别 错别 字进 行 自 动纠 错 。修 改编 辑模 块 对照 输 入 图像和 识 别结 果 ,进行 手 工修 改 纠错 。 版面 分 析模 块 是指 对于 读 入 的票据 图像 进 行版 面分 析 ,包 括 倾 斜 校 正 、去除 噪音 、抽取 信 息 区域 、切分 文 字行 等 。对于 简单 的文 档版 面 分析 ,很 多 文献 都提 出了 比较 有效 的方 法 ,但是 对 于 复杂 的版 面 ,特 别是 像 票据 这样 的手 写 体和 印刷 体 混排 , 噪音干 扰 较 强 , 同时又 存在 着 大量 的背 景 图案 和底 纹 的特殊 版 面 ,上面 这几 种方 法 都很 难取 得 好 的效果 ,表 现 为不 能有 效 切分 手写 字和 印刷 字 ,不 能从 背景 图案 和底 纹 中抽 取有 用信 息 。
相关文档
最新文档