摄像机沿光轴运动下的场景三维重建
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
射影重建升级到欧氏的方法;Hartley等[6]提出了通 过三幅图像来计算三焦点张量,然后分解得到投影 矩阵 来 进 行 三 维 重 建;Sturm 等[7]提 出 了 通 过 factorization来进行三维重建的方法.
目前通过运动视觉进行三维重建一般都是采用
摄像机围绕目标运动,以获取一系列图像,然后进行
小,此时仍然可以将图像分辨率的变化近似看作图
像缩放.
证毕.
性质2. 轴向运动前后拍摄的两幅图像中的对
应点之间的视差与其到对应点连线交点(或近似交
点)的距离成正比. 根据性质2,距离对应点连线的交点(或近似交
点)越近的点,其视差越小.当摄像机的运动为纯平
536
计算机辅助设计与图形学学报
2005年
移运动时,所 有 对 应 点 连 线 将 交 于 一 点[9],并 且 当
E K[R|t]X
(1)
则 V EVK[R|t]X⇒V EK◜[R|t]X. 所以,
将原徒像通过变换矩阵 V 变换后可得到由主点在
(0,0)的摄像机 K◜拍摄到的图像.
设轴向运动中包含的旋转和其他两个方向的平
移为0,则运动前后的投影矩阵分别为 P1EK[I, t1],P2EK[I,t2],其中,t1E[0,0,0],t2E[0,0,tz]. 空间一点 XE[x,y,z,1]经过两个投影矩阵投影 到图像平面,其图像坐标分别为 1Efx/z,fy/z;
3 轴向运动的性质
我们首先给出有关轴向运动的两个假设. 假设1. 轴向运动是以轴向平移为主,附以 X 轴和Y 轴上较小的旋转和平移运动. 在进行轴向运动时,通常无法保持摄像机严格 地沿光轴方向运动,但由于轴向运动一般用来拍摄 较远处的目标,在这种情况下,沿着光轴以外的两个 轴的较小旋转就会引起目标偏移出图像平面,使得 无法拍摄到整个目标;而且在拍摄目标时,一般都 会尽量保持所要拍摄的目标在图像中间,使得摄像 机运动前后沿X 轴和Y 轴的旋转比较小,同时这两 个方向的平移相对轴向运动来说也比较小. 假设2. 轴向运动时,X,Y 轴上的平移和旋转 之间存在互相制约的关系. 当摄像 机 做 轴 向 运 动 时,不 可 避 免 地 会 有 沿 X,Y 轴的旋转存在.当摄像机沿 Y 轴向右(左)旋 转的时候,目 标 会 向 左( 右)方 偏 离 图 像 中 心. 此 时 为了保持所要拍摄的目标在图像中间,拍摄者将会 下意识地做一个向左(右)的平移,使得目标保持在 图像的中间.同理,当摄像机有沿 X 轴向上(下)的 旋转时,一般 就 会 伴 随 着 一 个 向 下( 上 )的 平 移. 通
过大量的实验证明,此假设在绝大多数情况下都是
成立的. 根据以上假设,我们给出轴向运动的性质. 性质1. 通过轴向运动获取的图像分辨率将会
有较大差异,并且当场景深度大致相同时,图像分辨
率的变化可看作近似的图像缩放. 轴向运动一个明显的特点就是运动前后拍摄的
两幅图像分辨率将会有较大差异.距离目标较近时 拍摄的目标的分辨率将会比距离目标远时拍摄的分
摄像机沿光轴运动下的场景三维重建
裴明涛 贾云得
(北京理工大学计算机科学与工程系视觉与智能系统实验室 北京 100081) (viteopei@)
摘 要 讨论了采用针孔摄像机进行摄像机沿光轴运动下的场景三维重建的方法.基于摄像机轴向运动的特点和 性质,利用该方法找到图像间的缩放因子,进而解决了轴向运动下的特征匹配;采用Sturm 的摄像机自标定方法得到 摄像机的内外参数;从而实现了摄像机沿光轴运动下的场景三维重建.
辨率高.根据假设1,当场景深度大致相同时,图像 分辨率的变化可看作近似的图像缩放.
证明. 假设摄像机主点为(0,0),当 主 点 不 在
└10 -u0┐ (0,0)时,定义变换矩阵 VE 01 -v0 ,则 K◜E
L00 1┘ └f 0 0┐ V*KE 0 f 0.空间一点 X 通过摄像机投影 L0 0 1┘ 到图像平面,其图像坐标为
内参数的精度,当摄像机内参数存在较大误差时,一
般无法得到令人满意的结果.本文讨论了轴向运动 的两个性质及其在特征点匹配及三维重建中的应用. 实验结果表明,利用轴向运动的性质来进行三维重
建能够得到 较 好 的 重 建 结 果. 需 要 指 出 的 是,本 文
收稿日期:2003-09-29;修回日期:2004-02-09 基金项目:国家自然科学基金(K60075005);国家“八六三”高技术研究发展计划(2002AA735051)
关键词 三维重建;轴向运动;运动视觉 中图法分类号 TP391.41
3DReconstructionunderCaLeraMotionalongOpticAxis
PeiMingtao JiaYunde
(VisionandIntelligentSystemsLaboratory,DepartmentofComputerScienceandEngineering,BeijingInstituteofTechnology,Beijing 100081)
ヘ( 1(1)-u0)2+( 1(2)-v0)2 (n+1).
可以看出,轴向运动前后两幅图像上对应点的
视差为第一幅图像上的图像点到主点距离的n1+1. 所以,距离主 点 越 近 的 图 像 点 其 视 差 将 会 越 小. 当 轴向运动中包含着较小的旋转和其他两个方向的平
移时,此问题依然存在,只是主点变成了对应点连线
第17卷 第3期
计算机辅助设计与图形学学报
Vol.17,No.3
2005年3月
JOURNALOFCOMPUTER-AIDEDDESIGN & COMPUTERGRAPHICS
Mar.,2005
===============================================================
X,Y 轴上的平移为0时,该交点即为主点.当摄像 机的运动包含较小的旋转时,对应点连线将有一个
近似的交点.性 质 2 可 由 下 面 的 推 导 看 出. 为 方 便 推导,我们假设由轴向运动中的旋转和其他两个方
向的平移为0,由成像公式(1), ╰ 1 E(fx+u0z)/z, (fy+v0z)/z < 2 E(fx+u0z+u0tz/(z+tz), (2) ╰ (fy+v0z+v0tz)/(z+tz)
2Efx/(z+tz),fy/(z+tz);则 1(1)/ 2(1)E(fx/z)/ (fx/(z+tz))E(z+tz)/z, 1(2)/ 2(2)E(fy/z)/ (fy/(z+tz))E(z+tz)/z.
可以看 出,当 场 景 的 深 度 值 变 化 不 大 时,(z+ tz)/z 近似等于一个常数,此时图像分辨率的变化 可近似看作图像缩放.当轴向运动中包含的旋转和 其他两个方向的平移不为0时,由假设1可知,轴向 运动中包 含 的 旋 转 和 其 他 两 个 方 向 的 平 移 都 比 较
配方 法 适 用 于 轴 向 运 动 的 情 况. 通 过 Dufournaud 等[10]的方法,可以实现分辨率差别很大的图像间的 特征点匹配,但是得到的匹配点数目太少,不能满足 三维重建的需要.我们将用文献[10]方法找到的匹 配点作为初试匹配点,并根据这些初试匹配点找到 两幅图像间的缩放因子,对其中一幅图像进行缩放; 然后采用文献[1]的方法进行特征点匹配,找到匹配 点之后,再根据缩放因子将匹配点的坐标还原回缩 放前的坐标值.这样就可以解决轴向运动下的特征 点匹配问题.此外,做轴向运动时,第一幅图像上的 特征点对应的第二幅图像上的特征点会落在主点和 第一幅图像上特征点的连线上,由于 X,Y 轴上的 平移和旋转的存在,第二幅图像上的特征点不会正 好在该直线 上. 但 是,寻 找 特 征 点 的 区 域 可 以 限 制 在图像上该直线附近的一小块区域内,从而可以加 快匹配速度并减少错误匹配的数目.
定义tzEz/n,代入式(2)可得 1(1)- 2(1)E (fxtz)/(z(z+tz))Efx/(n+1)zE(fx+u0zu0z)/(n+1)zE( 1(1)-u0)/(n+1). 同理可得
1(2)- 2(2)E( 1(2)-v0)/(n+1).所以,轴 向运动前后两幅图像上对应点的视差为
ヘ( 1(1)- 2(1))2+( 1(2)- 2(2))2 E
到摄像机的运动参数,重建出场景的三维信息;而当
摄像机内参数未知时,进行三维重建相对比较复杂. 首先要通过图像间的对应点信息求出基本矩阵,然
后由 基 本 矩 阵 得 到 摄 像 机 投 影 矩 阵 进 行 三 维 重 建[2],这 样 一 般 只 能 得 到 射 影 意 义 下 的 重 建 结 果. Maybank等[3]提出了通过 Kruppa方程来进行摄像 机自标定的方法;Pollefeys等[4]在对摄像机的内参 数做了一些假设后通过自标定可以得到欧氏意义下 的重建结果;Faugeras等[5]提出了根据场景信息将
场景的三维 重 建. 而 在 空 间 探 测 器 自 主 降 落、空 投 自主降落等应用领域中,只能通过摄像机沿其光轴
方向运动来获取图像,因此在轴向运动,即摄像机沿
其光轴方向运动下的三维重建有着重要的应用价值. 目前对 于 轴 向 运 动 下 的 三 维 重 建 的 研 究 还 很 少. Xiong等[8]介绍 了 一 种 在 下 降 运 动( 轴 向 运 动 的 一 种情况)中计算深度图的方法,但其过分依赖摄像机
Abstract Thispaperdiscussesthe3Dreconstructionfromimagestakenbyacameramovingalongits opticaxis.Inoursolution,thefeature-pointmatchingand3Dreconstructionarerealizedeffectivelybasedon thepropertiesofforward motion. Experimentresultsshowthatsatisfactory3Dreconstructioncanbe obtainedwhenthepropertiesofforwardmotionareemployed.
的交点(或 近 似 交 点). 当 视 差 过 小 时,重 建 结 果 将 会很不稳定.为解决这个问题,采取减小n 的值,即 摄像机朝目 标 移 动 较 大 的 距 离. 但 即 使 如 此,距 离 主点对应点连线的交点(或近似交点)太近的图像点
的视差依然 很 小,仍 无 法 得 到 准 确 的 重 建. 此 时 可 以通过插值等方法来得到其三维坐标.
3期
裴明涛等:摄像机沿光轴运动下的场景三维重建
535
方法适用于摄像机距场景较远的情况,当摄像机距 离场景较近时,三维重建中的遮挡问题还需进一步 研究.
2 摄像机模型
本文中摄像机模型为经典的针孔模型.摄像机 └γf su0┐
内参数矩阵为 K E 0fv0 ,其中(u0,v0)为主 L 0 0 1┘
点坐标;f 为摄像机焦距,由于摄像机的倾斜因子s 一般都很小,故设sE0;由于通常摄像机的纵横比 γ 非常接近于1,故设γE1. 摄像机拍摄两幅图像 时的投影矩阵分别为 P1EK[R1,t1],P2EK[R2, t2],其中,R1 和 R2 为摄像机在第一个和第二个拍 摄位置相对于世界坐标系的旋转矩阵,t1 和t2 分别 为摄像机在第一个和第二个拍摄相对于世界坐标系 的平移向量.我们定义运动前的摄像机坐标系为世 界坐标系,坐标原点为摄像机光心,X 轴和Y 轴与 图像平面的u 轴和v 轴平行,Z 轴为摄像机的光轴, 与图像平面垂直;则摄像机拍摄两幅图像的投影矩 阵分别为 P1EK[I,0],P2EK[R,t].
Keywords 3Dreconstruction;forwardmotion;structurefrom motion
1引 言
三维重建是计算机视觉主要的研究方向之一. 近年来,对于三维重建和摄像机自标定的研究取得
了 很 多 重 要 的 成 果,形 成 了 比 较 完 善 的 理 论 体 系[1-8].Zhang[1]提出了当摄像机内参数已知时通过 运动重建场景三维信息的方法.该方法首先根据图 像间的对应点求出本质矩阵,然后分解本质矩阵得