浅谈数字图像处理及文字轮廓提取_顾国庆

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Roberts 算 子 特 点 是 边 缘 定 位 准 , 对 噪 声 敏 感 。 2 、Prewitt 算 子 和 Sobel 算 子 Prewitt 算 子 边 缘 检 测 算 子 使 用 两 个 有 向 算 子 ( 一 个 水 平 的 , 一 个 是垂直的, 一半称为模板) , 每一个逼进一个偏导数:
1 、R oberts 算 子 Roberts 算 子 是 一 种 微 分 算 子 。 设 输 入 图 像 为 f(i ,j ), 算 子 输 出 图 像 为 g(i ,j ), 则 Roberts 算 子 的 差 分 形 式 表 达 如 下 : gx=f(i ,j )- f(i +1 ,j ); gy=f(i +1 ,j )- f(i ,j +1 ); g(i ,j )=abs(gx)+abs(gy); 其卷积模板分别是:
三 、边 缘 检 测 及 轮 廓 提 取 算 法
人 类 通 过 眼 、耳 、鼻 、身 接 受 信 息 , 感 知 世 界 , 并 进 而 认 识 世 界
边 缘 是 图 像 的 最 重 要 特 征 。所 谓 的 边 缘 , 是 指 周 围 象 素 灰 度 又 阶
和 改 造 世 界 。据 统 计 , 人 类 所 获 得 的 信 息 中 , 约 有 百 分 之 七 十 五 是 以 跃 变 化 或 屋 顶 变 化 的 那 些 象 素 的 集 合 。 Poggio 等 曾 在 撰 文 中 说 : “边
常 见 的 边 缘 点 有 三 种 ( 图 一 ) 。 第 一 种 是 阶 梯 形 边 缘 ( Step -
2. 1 、数 字 图 像 处 理 的 特 点
edge ) , 即 从 一 个 灰 度 导 比 它 高 很 多 的 Biblioteka Baidu 一 个 灰 度 。 第 二 种 是 屋 顶 型
数 字 图 像 处 理 于 模 拟 图 像 处 理 相 比 有 如 下 特 点 : 1 ) 、 再 现 性 边 缘 ( Roof- edge ) , 它 的 灰 度 是 慢 慢 增 加 到 一 定 程 度 然 后 慢 慢 减 小 。
用 自 己 的 好 , 如 果 什 么 都 用 现 成 的 , 我 们 就 难 以 真 正 做 好 。我 对 计 算 [3 ] 杜 友 福 通 用 计 算 机 基 础 教 程 12 ̄13 页 科 学 出 版 社
机的学习太少了, 做的不好的地方望大家多多指教。
[4 ] [ 美] J.Glenn Brookshear 计算机科学概论 44 ̄45 页 人民邮电出版社
的 特 定 的 操 作 来 “改 造 ”图 像 。 所 谓 特 对 的 目 标 , 可 以 是 使 图 像 更 清 要 处 理 的 信 息 但 是 又 保 留 了 图 像 中 物 体 的 形 状 信 息 ”。
晰 、更 美 丽 动 人 , 也 可 以 使 从 图 像 中 提 取 某 些 特 定 的 信 息 。
Sobel 算 子 和 Prewitt 算 子 的 不 同 就 在 于 使 用 的 模 板 不 一 样 :
Prewitt 算 子 的 特 点 是 : 平 均 、微 分 对 噪 声 有 抑 制 作 用 ; 而 Sobel 算子在实际中最常用。它们存在一些共同的问题如: 它们的结果对 噪声很敏感, 图像的离散差分对噪声比对原图像更敏感; 可以通过 先对图像做平滑以改善结果, 但是又会产生一个问题: 会把一些靠 在一起的边缘平滑掉, 而且会影响对边缘的定位。
图像处理在单人鉴别上的应用, 也是目前广泛研究的一大类图 像处理课题, 其中指纹识别已实用化。在这一范畴内的其它识别课 题, 如笔迹、印鉴、面部照片等等的识别问题, 都已受到了普遍的关注。
图像处理的应用领域远不是上列各项所能概括的。它将随着
图一 边缘检测是一种基于灰度不连续性进行分割的方法。其常用算 子如下:
首先阐述了一些数字图像处理的基本理论, 最后总结了一些已经提出的各种通用算法, 提出了检测的流程。
【关 键 词 】 文 字 轮 廓 提 取 数 字 图 像
一 、引 言
限制和随即干扰, 往往要用数字图像处理技术对取得的图像作预处
文 字 轮 廓 提 取 主 要 应 用 有 印 刷 体 汉 字 识 别 和 手 写 数 字 识 别 理 , 对 原 始 图 像 进 行 灰 度 校 正 、噪 声 过 滤 和 畸 变 校 正 等 处 理 。
来 表 示 的 灰 度 图 像 。都 可 以 用 计 算 机 来 进 行 处 理 。4 ) 、灵 活 性 大 , 图
像处理可大致分为像质改善, 图像分析与图像重建三大部分。由于
数字图像不仅能完成线性运算, 也能完成非线性运算, 也就是说, 凡
可以用数学公式或逻辑表达式来表达的一切运算, 都可以用数字图
信息科技
中国高新技术企业
浅谈数字图像处理及文字轮廓提取
文 / 顾国庆
【摘 要 】 文 字 作 为 一 种 高 级 语 义 特 征 , 对 文 章 内 容 的 理 解 、索 引 、检 索 具 有 重 要 作 用 , 因 此 , 研 究 文 字 轮 廓
的 提 取 有 着 重 要 的 实 际 意 义 。基 于 数 字 图 像 的 文 字 轮 廓 提 取 技 术 是 数 字 图 像 处 理 中 的 一 个 重 要 的 内 容,本 文
(作者单位系长江大学)
(!上!接 !112!页!) !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
如 果 我 们 用 Prewitt 算 子 检 测 图 像 M 的 边 缘 的 话 , 我 们 可 以 先 分别用水平算子和垂直对图像进行卷积, 得到的是两个矩阵, 在不 考 虑 边 界 的 情 形 下 也 是 和 原 图 像 同 样 大 小 的 M1 ,M2 对 应 位 置 的 两 个 数 平 方 后 相 加 得 到 一 个 新 的 矩 阵 G,G 表 示 M 中 各 个 象 素 的 灰 度 的梯度值。然后就可以通过阈值处理得到边缘图像。总的过程是:
像处理实现。
2. 2 、数 字 图 像 处 理 的 应 用 领 域
图像信息既然是人类的主要信息源, 图像处理的应用领域就必 然涉及到我们生活的一切方面。并且随着人类活动范围的不断扩 大 , 其 应 用 领 域 亦 随 之 不 断 扩 大 。 如 : 文 字 及 图 纸 的 读 取 、医 用 图 像 处 理 、遥 感 图 像 处 理 、工 业 领 域 中 的 应 用 、军 事 公 安 方 面 等 。
电子计算机自动辨认在纸张上的文字和阿拉伯数字。字符识别处理 文字轮廓提取技术主要用了图像分割和特征提取等方法。图像特征
的 信 息 可 分 为 两 大 类 : 一 类 是 文 字 信 息 , 处 理 的 主 要 是 用 各 国 家 、各 是 用 于 区 分 一 个 图 像 内 部 的 最 基 本 属 性 或 特 征 的 , 它 们 可 以 是 源 景
的技术, 已几乎可将一幅模拟图像数字化为任意大的二维数组, 也
就 是 说 , 图 像 数 字 化 精 度 可 以 足 够 高 。 3 ) 、适 用 面 广 , 图 像 的 来 源 多
种 多 样 , 可 以 是 光 , 也 可 以 是 不 可 见 波 谱 图 像 。只 要 对 这 些 不 同 信 息
源的图像数字化以后, 对计算机来说, 都是一幅或多幅用二维数组
民族的文字( 如: 汉字, 英文等) 书写或印刷的文本信息; 另一类是数 物中人类视觉可以鉴别的自然特征, 也可以是通过对图像进行测量
据信息, 主要是由阿拉伯数字及少量特殊符号组成的各种编号和统 和处理从而人为定义的某些特征或参数, 它们称为人工特征。图像
计 数 据 , 如 : 邮 政 编 码 、统 计 报 表 、财 务 报 表 、银 行 票 据 等 等 , 处 理 这 特 征 提 取 在 图 像 分 析 中 占 有 重 要 地 位 。 事 实 上 , 图 像 分 割 技 术 就 是
(下 转 120 页 )
- 112-
信息科技
中国高新技术企业
4 结束语
参考文献
计算机的工作原理越来越无人问津了, 人们都在忙着搞高级开 [1]陈天洲 卜佳俊 计算机系统概论 5 ̄6 页 清华大学出版社
发 , 好 像 底 层 的 东 西 与 自 己 无 关 。 不 管 什 么 东 西 用 别 人 的 总 是 没 有 [2 ] 何 广 军 计 算 机 基 础 教 程 (WindowsXP 版 ) 6 页 清 华 大 学 出 版 社
(Handwritten Numeral Recognition), 是 光 学 字 符 识 别 技 术 (Optical Char-
图像处理有很多的方法, 它的最终目的在于增强视觉效果, 使得
acter Recognition , 简 称 OCR) 的 一 个 分 支 , 它 研 究 的 对 象 是 : 如 何 利 用 原 来 看 不 清 楚 的 图 像 看 得 清 楚 , 原 理 难 以 看 清 楚 得 图 像 看 得 清 楚 。
(作者单位系宁波大学信息学院电子信息科学与技术)
(!上!接 !113!页!) !!!!!!!!!!!!!!!!!!!!!!6、!响!应!模 块!!!!!!!!!!!!!!!!!!!
其 他 算 子 包 括 : Laplacian 算 、Robinson 算 子 、LOG 算 子 、Kirsch 算 子 、Smoothed 算 子 等 。 其 检 测 流 程 图 如 下 图 二 。
图二检测流程 四 、结 束 语 随 着 我 国 开 始 大 力 推 广 的 “三 金 ”工 程 在 很 大 程 度 上 要 依 赖 数 据 信息的输入, 如果能通过手写数字识别技术实现信息的自动录入,
类信息的核心技术是手写数字识别。手写文字的识别研究有着重大的现实 依 据 图 像 的 边 缘 特 征 或 组 织 特 征 进 行 的 。 同 样 , 图 像 描 述 和 分 类 技
意义, 一旦研究成功并投入应用, 将产生巨大的社会和经济效益。
术也离不开图像特征的提取。
二 、数 字 图 像 处 理 概 述
图 像 的 形 式 , 通 过 以 眼 睛 为 入 口 的 视 觉 系 统 而 获 得 的 。也 就 是 说 , 图 缘 或 许 对 应 着 图 像 中 物 体 ( 的 边 界 ) 或 许 并 没 有 对 应 着 图 像 中 物 体
像是人类最主要的信息源。图像处理就是按特定的目标, 用一系列 ( 的边界) , 但是边缘具有十分令人满意的性质, 它能大大地减少所
图像处理设备成本的不断降低, 图像处理技术水平的不断提高, 以 及图像处理技术的不断普及而不断扩大。可以这样说, 凡是用眼睛 可以直接或间接( 通过各种仪器) 看到的对象, 都是图像处理研究与 应用的对象。
2. 3 、数 字 图 像 处 理 方 法 以各种手段获得的图像( 称为原始图像) 由于受到种种条件的
好 , 数 字 图 像 于 模 拟 图 像 不 同 , 不 会 因 存 储 、传 输 或 复 制 而 产 生 图 像 第 三 种 是 线 性 边 缘 ( Line - edge ) , 它 的 灰 度 从 一 级 别 跳 到 另 一 个 灰 度
质 量 的 退 化 , 从 而 能 准 确 地 保 持 原 图 像 的 再 现 性 ; 2 ) 、精 度 高 , 目 前 级 别 之 后 然 后 回 来 。
无 疑 会 促 进 这 一 事 业 的 进 展 。高 速 数 字 信 号 处 理 DSP 技 术 的 发 展 也 将促进算法的快速实现, 使其能应用于人们生活中的各种图像增 强, 图像分析和识别等, 大大推动信息化建设。
参考文献 [1] 孙 家 广 , 杨 长 贵 , 计 算 机 图 形 学 [M ] 北 京 清 华 大 学 出 版 社 , 1996. [2] 章 毓 晋 , 图 像 处 理 和 分 析 [M ] 北 京 清 华 大 学 出 版 社 , 1999. [3] 边 肇 琪 , 模 式 识 别 [M ] 北 京 清 华 大 学 出 版 社 , 2000. [4] 何 斌 等 Visual C + + 数 字 图 像 处 理 [M ], 人 民 邮 电 出 版 社 , 2002 年
相关文档
最新文档