基于马尔可夫随机场的单目图像深度估计

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

本文的基本 思想是 : 将深度估计 问题归结为模式识别 问 题, 深度即连续的待识别 的模式类,图像及其对应深度 图像
基 金项 目: 1 国家 自然科 学基 金(0 002;2上海 市启 明星基 金(6 A103资助 652 4) 0Q 4 0) 作 者简 介:张 蓓蕾 (9 3) 18.,女 ,河 南濮 阳人 ,东华 大学信 息科 学与技 术 学院 ,硕士 ,图像 处理 与模式 识别 ,上海 刘 洪玮 (9 2) 18 .,男,江 苏徐州 人 ,东华大 学信 息科 学与技 术 学院 ,硕 士 ,电力 电子 与 电气 传动 ,上海
基 于 马 尔可 夫 随机 场 的单 目图像 深 度 估 计
张蓓 蕾 ,刘 洪 玮
摘 要 : 图像 深度 获 取 是 机 器视 觉领 域 活 跃 的研 究课 题 。 将 图像 深 度估 计 问题 归结 为 模 式 识 别 问题 , 以单 目图像 深 度 为待 分 连续 模 式类 ,在 多 尺度 下对 图像 块 提 取 绝对 和 相 对 深 度 特 征 , 选择 表征 上 下 文 关 系的 MR ( ro n o Fed MA F Mak vRad m i )一 P l
Mi oo ue A p ct n o 2 , o1, 00 c cmp tr p l a o s 1 6N . 2 1 r i i V . 1
文 章 编 号 : 10 -5X(0 01-0 90 0 77 7 2 1)10 4 -2
技 术 交流
微型 电脑 应 用
21 0 0年第 2 6卷第 1 1期
也称之 为似然 函数 ,它是描述测量数据条件分布的,py 是 C)

个 未知常数 ,通常 ,该后验分布是关于 的邻域系统的
样本 对象集
描 - 类 设 甫 _ 一分 器 计
分 决 类 策
MR 源自文库布 。 F
f) 4基于恰当准则 的最优 估计确定 了上述后验概论后 ,
待 对象 L 薛 分 集 I 描 _ ・
估计模型。实践证 明该方法成本低 ,无需 昂贵测距 设备 ,无 需摄像机内部及外部参数 ,应 用范围广 。
l 深 度估 计与模 式识 别
模 式识别是指对表 征事物或现象 的各 种形式 的 ( 数值 的、文 字的或逻辑关系的 )信息,进行处理和分析 ,进而对 事物或现象进行描述、辨认 、分类和解释的过程 ,是信息科 学和人工智 能的重要组成部分 。 模式识别 系统 的基本框架如
2 MR . F MAP 型框 架 模
构造MR . P FMA 先验模型包含3 个步骤【】 5: () 1确定邻域和对应 的基 团对 规则位置集( 点集) 点(y 、 x)
的邻 域 为
仪。另一种方法是基于一个场景 的多幅 图像或图像序列 , 利
用多视 图摄像几何,通过求取视差 ,获取深度值 ,例如基于 双 目『1 1、三 目『】 1 2、多 目【】 3、环 目『】 4的三维立体化方法。其
通过最优化方法求取最大后验概率, 估计出某图像块对应的 深度 值。
姿态感知) ,三维立体重建 ( 体、场景的三维现 实模拟 ) 物 、
机器 人 视 觉 ( 器 人 行 为 指 导 )等 方 面 。 机 目前主要有两种方法获得 图像深度信息: 一种是深度感 应器 ,原理 是 利 用 射 线 的 反射 时 间计 算 距 离 , 种 方 法 的优 这 点在于精度高 , 但缺点是设备成本较高 , 例如三维激光 扫描
( xmu a otr r Ma i m p s i i e o )方法 ,建立拉普拉斯模型 ,表述 某图像 块的深度和 其邻域深度之间的关系。实验得到 了某一类单 目
图像 对 应 的 深 度 图像 ,证 明 了该 算 法 的 有 效性 。 关 键 词 : 单 目图像 ;深 度 图像 ;马 儿 可 夫 随机 场 ;最 大后 验 概 率 中图分类号 :T 3 1 P 9 文献标志码 :A
图 1 示: 所

f) 2选择好基团后,再确定其 函数 。
() 3确定后验分布,基 于随机场 的先验分布和测量噪 声分布的特 征, 根据 Bae 定理,求得给定测量数据 Y y时, ys =
X x的后验概论Px Y p lpx py, = (y= (x ( /( 其中p ) l y) ) ) 是一个 先 is 验Gb 分布,px) b ‘(y是给定Xx l = 时,Y 的条 = y 件概论,
优点是条件充足,算法易行,缺点是需要摄像机参数,专业
知识 要 求 较 高 。
本文利用单 目图像进行深度估计,基本原理是:以模式 识 别 原 理 为 框 架 , 采 用 MR ( ro ad m id) F Mak v R n o Fe l

MAP Ma i m p s r r)【】 (( x mu a ot i i 5方法,建立 拉普拉斯深度 eo
, { :< - 一 ) c ,由 c决定邻域结沟 的 = , 0 0 + , ) } 大 小和相应的基团;对 不规则位置集 ,根据 D l ny三 角 ea a u 形( V rn i 或 oo o 多边形) 确定任一位 置的邻域 ,它们有不同的 形状和尺寸,按包含的位置数划分邻域类型;在图像理解和 目标 识别等 问题 中,常借助 图论(rp hoy 的方法构造 gah ter) Mak v图,由它表示处理这些 问题 时所需的上下文关系( ro 约 束) ,确定邻域结构及基 团。

给 定 问题 的解 与 预 先确 定 的准 则 有 关 ,例 如 MA P估 计 ,它
是最大后验概论准 则下 的解 。
图 1模式 识别 基本过 程
() 5算法 实现 ,直接求 B ys估计具有指数复杂性 ,因 ae 为需要计算所 有可 能状态的后验概率,实际上是不可行的,
通常避开这个 问题 ,选择可行的途径 和算法 。
0 引言
图像深度信息的获取, 旨在得到图像 中不 同对象间 的空 间位置信息,广泛应用于图片理解( 目标识别、场景层次、
组成的图像对集 为样本对象集 , 对样本对象和待分对象分别 提取深 度特征 ,以贝叶斯原理为基础 ,建立分类器进行分类
决策 ( 拉普拉斯模 型) 由样 本对象集训练得到模型参数 , ,并
相关文档
最新文档