计算机视觉研究综述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
比特 数 , 以节 省传 输 和存 储 消耗 。 图像变 换 旨在 减少 计 算量 ,如 将
空间 域 的 图像 阵 列变 换成 频 域 空 间去 处 理 。 图像描 述 ( r e p r e s e n t a . t i o n )是 图像 理解 的前 提 ,其 作 用 是挖 掘 一般 或 主 要信 息 去描 述 图 像 。 图像增 强 和复 原 主要 用于 提 高 图像质 量 ,如 去除 噪声 ,强化 高
频 信息 等 。 以上 图像 处 理技技 术 主要 依赖 一些 数学 变换 。
模 式 识 别 、 机 器 学 习 、深 度 学 习等 算 法 赋 予 计 算 机 看 懂 的 能
类 解 决大 规模 复杂 的问题 。计 算机 视 觉任 务应 用相 当广 泛 ,如 人类
识 别 、车 辆 或 行 人 检 测 、 目标 跟 踪 、图 像 生 成 等 ,其 在 科 学 、工
视 觉任 务 面临 的挑 战。
【 关键词 】计算机视觉;人工智能;机 器学习;应用
能力 赋 予 了计算 机看 即获取 的能 力 ,是 人工 智 能 的重要 输入 。这里
1 引言
视 觉是 人类 理解 认 识外 部世 界 的重 要途 径 。在 人类 认知 的过程 中 ,有 超过 8 0 %的信 息 量来 自视 觉系 统 [ 】 】 ,如物 体 的形 状 、 大小 、
力 ,是 人工 智 能 的核 心 ,更 形 象 的说就 是 让计 算机 像人 的大脑 去 理 解 图像 。模 式识 别 、机 器学 习、深 度学 习是让机 器 感 知或 学 习的 工
具或 方 法 ,本文 不对 它 们进 行 区别 ,主 要帮 助读 者 理解 这 些方 法是
Байду номын сангаас
业 、农 业 、医 疗 、交通 、军 事等 等领 域都 有着 广泛 的应 用 前景 。
颜色 、 空间 位置 等 。但 是 , 由于 主观 和 客观 条件 限制 ,很多 信 息不 能 由人类 视 觉系 统直 接或 者 准确 的获 取 ,人 类 自然 的希 望借 助外 部
设备 帮助 人类 处 理或 者理 解信 息 ,这 就为 人类 科 学技 术发 展 带来 一 个 崭 新 的研 究课 题一 一计 算机 视 觉 。计 算机 视觉 是研 究 如何 让机 器 “ 看 ” 的科学 ,其 可 以模 拟 、扩展 或 者延 伸人 类 智能 ,从 而 帮助 人
E L E C T R O NI C S WOR L D・ 探索与观察
计 算机 视 觉研 究综述
浙 江省 绍兴鲁迅 中学 倪晨 旭
【 摘要 】随着信息时代 的发展 ,未来的信息社会将会有至少9 0 %的流量源 自图像和视频数据 ,让机器 “ 看懂”这些视 觉数据,掌握解决具体
的计 算机视 觉任 务 的方 法是 国 内外 学术界 和工 业界 最 关注 的 问题 。 为 了帮助 读者 对 计算机 视 觉有 直观 的认 识 ,本文 对 计算机 视 觉 系统进 行 综 述 。首 先 ,概述 计 算机视 觉 的发展 进程 ;然后 ,研 究解 决 具体计 算机 视 觉任 务 的技 术并 分类分 析典 型 的计 算机视 觉应 用 ;最后 ,分析 计 算机
如 荼 。本文 从 计算 机视 觉 发展 、研 究技 术 、面 临 的挑战 等 方法 对计 算机 视 觉进 行研 究 ,为计 算机 视觉 研 究奠定 基础 。
2 计算机视 觉概述 4 计算机视觉任 务的应用
计 算机 视觉 是 从 图像或 者视 频 中提 出符 号 或者 数值 信 息 ,分析 计算 该信 息 以进 行 目标 的识 别 、检测 和跟 踪 等 。更形 象 的说 ,计 算 随着信 息 技术 的发展 ,计 算机 视 觉应 用在 人 们 的 日常生 活 中 、 学 术界 和工 业 界 己屡 见不 鲜 ,计算 机视 觉 应用 呈爆 炸 式增 长 ,本 文
随 着 并 行 计 算 、 云 计 算 、机 器学 习等 软 硬 件 技 术 的 发展 ,计 算 机 的 图像处 理 能力 不断 提高 ,计 算机 视 觉近 几年 获得 了快速 的发
如 何帮 助计 算机 理解 图像或 者视 频 的 。让计 算机 看 懂 的过程 ,就是 根据 图像 或 者视 频数 据 建模 的过 程 ,建 模就 是用 数 学符 号或 者 公式
主要 介绍 数 字 图像处 理技 术 , 即将 图像 信号 转化 成数 字 信号 再用 计 算机 进 行处 理 的技 术 【 2 】 。图像 处 理 的 目的 ,是将 输 入 的低 质 量 的 图 像 转 化成 高质 量 的 图像输 出,常 用 的方 法有 图像 压缩 编 码 、 图像 变 换 、 图像 描述 、 图像 增 强和 复原 。 图像压 缩 编码 是减 少 描述 图像 的
推 理 数据 之 中 的一般 模 式或 者规 律 ,从 而可 以对 新 输入 的数 据进 行 分类 或者 回 归 ,分类 就是 输 出数 据 的类别 ,回归 类 似与 数学 中的映 射 函数 ,输 出数据 的可 能值 。
展 ,各 项应 用 在各 个领 域 落地 生根 ,学 术 界和 工业 界 的研 究也 如火
像 ,如光 学字符 识别 、显微 图片 的分析解 释等 。 ̄ ] t 6 0 年代 ,通 过计算 机 程序 可 以将二 维图像 转换成三 维结构 进行分 析,从此 开启三 维场景
下计算机 视觉研 究 。到 7 0 年代 ,麻省理 工学 的人工智 能实验室 院首次 开 开设计 算机视觉课 程 ,由著名 的H o r n 教授主讲 , 同实验 室的Ma r t 教 授 首次提 出表示 形式 ( r e p r e s e n t a t i o n )是视 觉研究 最重要 的 问题 。到 8 0 ,9 O 年 代 ,计 算机视 觉迅速发 展 ,形 成感知特 征 的新 理论框 架并逐 渐 应用 到工业 环境 中 。 ̄ t J 2 1 世 纪 ,计 算机 视 觉 领域 呈 现 许 多新 的趋 势 , 计算机 视 觉与 计 算机 图形 学深 度 结合 ,基 于计 算机 视 觉 的应用
机 视 觉就 是 让计算 机 像人类 一样 能看 到 图像 ,并 看懂 理解 图像 。
计算 机视 觉 开始 于2 0 世 纪5 O 年 代 ,主 要用 于分 析和 识 别二 维 图
重 点介 绍 计算 机视 觉任 务 的三 大应 用 ,分 别 是 图像识 别 、 目标检 测
和 图像 分割 。