北理工贾云德《计算机视觉》第十五章 三维运动估计

合集下载

计算机视觉中的目标跟踪与运动估计算法

计算机视觉中的目标跟踪与运动估计算法

计算机视觉中的目标跟踪与运动估计算法摘要:随着计算机视觉技术的迅猛发展,目标跟踪与运动估计成为了计算机视觉领域一个重要的研究方向。

目标跟踪是指在给定的视频序列中,通过对目标的连续观察和判断,实时地追踪目标的位置,运动估计则是通过对目标在图像或视频序列中的运动进行建模和预测。

本文将介绍目标跟踪与运动估计的基础概念、常用算法和应用领域,并讨论其挑战和发展趋势。

1.引言计算机视觉是一门研究如何使计算机能够“看”的学科,它将图像处理、模式识别和人工智能等知识相结合,旨在模拟人类的视觉系统,实现对图像和视频的理解和分析。

目标跟踪与运动估计是计算机视觉领域的一个重要方向,具有广泛的应用前景。

2.目标跟踪算法目标跟踪算法是指在给定的视频序列中,通过对目标的连续观察和判断,实时地追踪目标的位置。

常见的目标跟踪算法包括基于模板匹配的方法、基于特征匹配的方法、基于相关滤波的方法等。

这些算法利用了图像中目标的特征信息(如颜色、纹理、形状等)来判断目标的位置,并通过更新模型或特征来实现目标的连续跟踪。

3.运动估计算法运动估计是指通过对目标在图像或视频序列中的运动进行建模和预测。

常见的运动估计算法包括基于光流的方法、基于特征点匹配的方法、基于深度学习的方法等。

这些算法利用了图像序列中的像素或特征点之间的变化关系,预测目标的未来位置,进而实现对目标的运动估计。

4.应用领域目标跟踪与运动估计在很多领域有着广泛的应用,例如视频监控、交通管理、移动机器人、虚拟现实等。

在视频监控领域,目标跟踪与运动估计可以实时地追踪事件发生的位置和运动轨迹,提供重要的监控信息。

在交通管理领域,目标跟踪与运动估计可以预测交通流量和车辆轨迹,提供交通优化的参考。

在移动机器人领域,目标跟踪与运动估计可以实现对机器人的自主导航和动作控制。

在虚拟现实领域,目标跟踪与运动估计可以实现用户动作捕捉和虚拟对象的交互。

5.挑战和发展趋势目标跟踪与运动估计在实际应用中仍面临一些挑战,如目标形变、光照变化、遮挡等。

三维位姿估计原理

三维位姿估计原理

三维位姿估计原理
三维位姿估计是指在三维空间中估计某个物体的位置和姿态。

该技术在计算机视觉、机器人操作等领域都有广泛应用。

三维位姿估计的原理基于许多数学和计算机视觉算法,包括:
1. 特征提取:从图像或点云数据中提取出有用的特征,比如角点、边缘、曲线等。

2. 特征匹配:将一个图像或点云数据中的特征与另一个图像或点云数据中的特征进行匹配,以获得两者之间的相对位置和姿态。

3. 相机标定:确定相机内部和外部参数,以便进行图像与真实世界之间的转换和计算。

4. 三维重建:将多个二维图像或点云数据进行配准和三维重建,以获得物体的三维模型。

5. 姿态估计:根据物体的三维模型和相机的位置,计算出物体的位姿,包括位置和旋转角度。

以上技术在三维位姿估计过程中不断相互作用,不断迭代,使得位姿估计结果更加准确。

北理工贾云德《计算机视觉》chapter06边缘检测

北理工贾云德《计算机视觉》chapter06边缘检测

第六章边缘检测边缘(edge)是指图像局部强度变化最显著的部分.边缘主要存在于目标与目标、目标与背景、区域与区域(包括不同色彩)之间,是图像分割、纹理特征和形状特征等图像分析的重要基础.图像分析和理解的第一步常常是边缘检测(edge detection).由于边缘检测十分重要,因此成为机器视觉研究领域最活跃的课题之一.本章主要讨论边缘检测和定位的基本概念,并使用几种常用的边缘检测器来说明边缘检测的基本问题.图像中的边缘通常与图像强度或图像强度的一阶导数的不连续性有关.图像强度的不连续可分为:(1) 阶跃不连续,即图像强度在不连续处的两边的像素灰度值有着显著的差异;(2) 线条不连续,即图像强度突然从一个值变化到另一个值,保持一个较小的行程后又返回到原来的值.在实际中,阶跃和线条边缘图像是很少见的,由于大多数传感元件具有低频特性,使得阶跃边缘变成斜坡型边缘,线条边缘变成屋顶形边缘,其中的强度变化不是瞬间的,而是跨越一定的距离,这些边缘如图6.1所示.(a)(b)图6.1 两种常见的边缘,(a) 阶跃函数,(b) 线条函数.其中第一排为理想信号,第二排对应实际信号对一个边缘来说,有可能同时具有阶跃和线条边缘特性.例如在一个表面上,由一个平面变化到法线方向不同的另一个平面就会产生阶跃边缘;如果这一表面具有镜面反射特性且两平面形成的棱角比较圆滑,则当棱角圆滑表面的法线经过镜面反射角时,由于镜面反射分量,在棱角圆滑表面上会产生明亮光条,这样的边缘看起来象在阶跃边缘上叠加了一个线条边缘.由于边缘可能与场景中物体的重要特征对应,所以它是很重要的图像特征。

比如,一个物体的轮廓通常产生阶跃边缘,因为物体的图像强度不同于背景的图像强度.在讨论边缘算子之前,首先给出一些术语的定义:边缘点:图像中具有坐标],[j i 且处在强度显著变化的位置上的点.边缘段:对应于边缘点坐标],[j i 及其方位θ,边缘的方位可能是梯度角.边缘检测器:从图像中抽取边缘(边缘点和边缘段)集合的算法.轮廓:边缘列表,或是一条表示边缘列表的拟合曲线.边缘连接:从无序边缘表形成有序边缘表的过程.习惯上边缘的表示采用顺时针方向来排序.边缘跟踪:一个用来确定轮廊的图像(指滤波后的图像)搜索过程.边缘点的坐标可以是边缘位置像素点的行、列整数标号,也可以在子像素分辨率水平上表示.边缘坐标可以在原始图像坐标系上表示,但大多数情况下是在边缘检测滤波器的输出图像的坐标系上表示,因为滤波过程可能导致图像坐标平移或缩放.边缘段可以用像素点尺寸大小的小线段定义,或用具有方位属性的一个点定义.请注意,在实际中,边缘点和边缘段都被称为边缘.由边缘检测器生成的边缘集可以分成两个子集:真边缘集和假边缘集.真边缘集对应场景中的边缘,假边缘集不是场景中的边缘.还有一个边缘子集,即场景中漏检的边缘集.假边缘集称之为假阳性(false Positive ),而漏掉的边缘集则称之为假阴性(false Negative ). 边缘连接和边缘跟踪之间的区别在于:边缘连接是把边缘检测器产生的无序边缘集作为输入,输出一个有序边缘集;边缘跟踪则是将一幅图像作为输入,输出一个有序边缘集.另外,边缘检测使用局部信息来决定边缘,而边缘跟踪使用整个图像信息来决定一个像素点是不是边缘.6.1 梯度边缘检测是检测图像局部显著变化的最基本运算.在一维情况下,阶跃边缘同图像的一阶导数局部峰值有关.梯度是函数变化的一种度量,而一幅图像可以看作是图像强度连续函数的取样点阵列.因此,同一维情况类似,图像灰度值的显著变化可用梯度的离散逼近函数来检测.梯度是一阶导数的二维等效式,定义为向量⎥⎥⎦⎤⎢⎢⎣⎡=⎥⎦⎤⎢⎣⎡=f x f y x G G y x G ∂∂∂),((6.1)有两个重要的性质与梯度有关:(1) 向量),(y x G 的方向就是函数),(y x f 增大时的最大变化率方向;(2) 梯度的幅值由下式给出:22|),(|y x G G y x G += (6.2)在实际应用中,通常用绝对值来近似梯度幅值:y x G G y x G +=|),(| (6.3)或),max(|),(|y x G G y x G ≈ (6.4)由向量分析可知,梯度的方向定义为)/arctan(),(x y G G y x a = (6.5)其中α角是相对x 轴的角度.注意梯度的幅值实际上与边缘的方向无关,这样的算子称为各向同性算子(isotropic operators).对于数字图像,方程6.1的导数可用差分来近似.最简单的梯度近似表达式为],1[],[],[]1,[j i f j i f G j i f j i f G y x +-=-+= (6.6)请注意j 对应于x 轴方向,而i 对应于负y 轴方向.这些计算可用下面的简单卷积模板来完成 11-=x G 11-=y G (6.7) 在计算梯度时,计算空间同一位置x 和y 处的真实偏导数是至关重要的.然而采用上面公式计算的梯度近似值x G 和y G 并不位于同一位置,x G 实际上是内插点 [,/]i j +12处的梯度近似值,y G 是内插点],2/1[j i +处的梯度近似值.由于这个缘故,人们常常使用22⨯一阶差分模板(而不用21⨯或 12⨯模板)来求x 和y 的偏导数:1111--=x G 1111--=y G (6.8) 用上式计算x 和y 方向梯度的位置是相同的,这一点位于内插点]2/1,2/1[++j i 处,即在22⨯邻域的所有四个像素点之间.不过这种计算可能会导致一些混淆,所以,通常用33⨯邻域计算梯度值.这一方法将在下一节讨论.6.2 边缘检测算法边缘检测算法有如下四个步骤:滤波:边缘检测算法主要是基于图像强度的一阶和二阶导数,但导数的计算对噪声很敏感,因此必须使用滤波器来改善与噪声有关的边缘检测器的性能.需要指出,大多数滤波器在降低噪声的同时也导致了边缘强度的损失,因此,增强边缘和降低噪声之间需要折衷.增强:增强边缘的基础是确定图像各点邻域强度的变化值.增强算法可以将邻域(或局部)强度值有显著变化的点突显出来.边缘增强一般是通过计算梯度幅值来完成的.检测:在图像中有许多点的梯度幅值比较大,而这些点在特定的应用领域中并不都是边缘,所以应该用某种方法来确定哪些点是边缘点.最简单的边缘检测判据是梯度幅值阈值判据.定位:如果某一应用场合要求确定边缘位置,则边缘的位置可在子像素分辨率上来估计,边缘的方位也可以被估计出来.在边缘检测算法中,前三个步骤用得十分普遍。

北理工贾云德《计算机视觉》第十三章 三维场景表示

北理工贾云德《计算机视觉》第十三章 三维场景表示
??????????????1233210uuuuaaaap??????????????????????????11233210321023vvvuuuvubbbbaaaap其中每一个系数都是一个三元矢量其中ai是三元行矢量bj是三元列矢量aibj的积是各坐标系数的双积该系数曲面为
第十三章 三维场景表示
x = rx cos s1 ϕ cos s2 θ y = ry cos s1 ϕ sin s2 θ z = rz sin s1 ϕ
−π / 2 ≤ ϕ ≤ π / 2 −π ≤θ ≤ π
渐变s1和s2值可生成形状渐变的超圆球 这些及其它超二次曲面形状的可以生成很 复杂的形状,如家具、闪电和其它金属构 成。
13.2.4 超二次曲面
由二次方程添加参数可生成超二次曲面 通过调整参数可以改变物体的形状。 增加的参数数目等同于物体的维数 (1)超椭圆 在超椭圆方程中,当x和y项的指数视 为变量时,笛卡儿超椭圆方程表示:
x y ( ) +( ) =1 rx ry
2 s 2 s
超椭圆参数方程:
x = rx cos s θ y = ry sin θ
]
⎡v3 ⎤ ⎢ 2⎥ ⎢v ⎥ ⎢v⎥ ⎢ ⎥ ⎢1⎥ ⎣ ⎦
其中, ai是三元行矢量 bj是三元列矢量 Ai,bj的积 是各 坐标系数的双积
该系数曲面为:
P(u,v)=UTMV
其中,
M是4×4矩阵,其元素是参数曲面的每一个坐标系数的矢 量. 张量积曲面是两曲线的积:一条曲线以u为坐标,另一条 以v为坐标.任何平行于坐标轴的平面和张量积三次多项式曲 面的交线都是三次多项式曲线.
场景分割 是将表示场景的网面分割成若干
部分,每一部分表示一个物体或一个特定 的区域,这样有利于物体识别、曲面精确 估计等后处理算法的实现.

飞行器三维航迹规划算法

飞行器三维航迹规划算法

n
∑ Z (t) =
z i N i, k ( t)
i= 0
B 样条基函数 N i, k ( t) 由以下所给的 ( 3)、
(4) 式递归算式得到:
1
Knot (i) ≤ t < Kno t (i + 1)
N i, 1 (t) = 1 Kno t (i) ≤ t < Kno t (i + 1)AND t = n - k + 2
目 前, 已 有 许 多 飞 行 器 航 迹 规 划 算 法[1][2][3], 但研究工作主要是分别进行水平面与 竖直面内的二维优化, 这些方法在进行规划时并 没有充分利用地形的迹蔽作用。 文献[ 4 ]提出了 直升机的地形跟踪三维路线直接生成的方法。以
速度方向与地形的切平面坐标轴间的夹角作为 控制量, 飞机的位置坐标作为状态变量, 将航迹 规划问题化为一起点固定、终端自由、时间自由 的最优控制问题。 通过不断地改变初始航向的方 法, 使路线的终点接近目标点, 但该方法需要计算 地形的二阶偏导数, 因此对地形的要求较严, 计算 量较大, 并且直接产生的三维航迹很容易发散。
整, 从而使算法缺乏微调 (fine2tu rn ing) 的功能。 若在算法一开始就选取较高的精度, 那么串长就 很大, 这样也将降低算法的效率。 为了克服二进 制编码的缺点, 文中以空间 B 样条曲线的控制 顶点坐标值 (X i, Y i, Z i) ( i= 1, …, M , M 为控制 顶点的个数) 作为基因位, 直接采用浮点数进行 编码。 同时为了减小搜索范围, 限制每个基因位 的编码取值范围, X i, Y i 的取值范围限定在规划 的平 面 区 域 内, Z i 限 定 在 ( hm in + ~ h clear hm ax + h ) clear 范围内, 其中 hm ax、hm in分别为规划范围内的 最大和最小地形高程数据, hclear为飞行器最小飞 行高度。采用浮点编码也便于以后引入与该问题

北理工贾云德《计算机视觉》第十五章 三维运动估计

北理工贾云德《计算机视觉》第十五章 三维运动估计

′ y k +1
′ ⎛ xk ⎞ ⎜ ⎟ ′ 1)E⎜ y k ⎟ = 0 ⎜1⎟ ⎝ ⎠
外极线 方程
⎛ e00 ⎞ ⎜ ⎟ ⎜ e01 ⎟ ⎜e ⎟ ⎜ 02 ⎟ ⎜ e10 ⎟ ⎜ ⎟ e11 ⎟ = 0 ⎜ ⎜ e12 ⎟ ⎜ ⎟ e 20 ⎟ ⎜ ⎜e ⎟ ⎜ 21 ⎟ ⎜ 1 ⎟ ⎝ ⎠
′ ′ (x k +1 x k
rxz和ryz缩小α,zk放大α,方程仍然成立,因此产 生多义性。三帧或三帧以上图象上的四点就可以克服 这个问题。
15.1.2 基于正交投影的运动估计
将(15.2)小角度旋转矩阵代入(15.1),得到如下的正交投 影模型:
′ ′ ′ xk +1 = xk − φy k + ψz k + t x ′ ′ ′ y k +1 = φxk + y k − θz k + t y
15.1.3 透视投影模型
设空间点(x,y,z)在图象平面上的投影(x’,y’)。如果成象 模型为透视投影,则 x y
x′ = F z
y′ = F
z
根据(15.1)式有
⎛ x k +1 ⎞ ⎡ rxx ⎜ ⎟ ⎢ ⎜ y k +1 ⎟ = ⎢ ryx ⎜ z ⎟ ⎢r ⎝ k +1 ⎠ ⎣ zx rxy ryy rzy rxz ⎤ ⎛ x k ⎞ ⎛ t x ⎞ ⎛ xk ⎞ ⎜ ⎟ ⎥⎜ ⎟ ⎜ ⎟ ryz ⎥ ⎜ y k ⎟ + ⎜ t y ⎟ = R k ⎜ y k ⎟ + Tk ⎜z ⎟ rzz ⎥ ⎜ z k ⎟ ⎜ t z ⎟ ⎝ k⎠ ⎦⎝ ⎠ ⎝ ⎠
2n个方程,通 过最小二乘法 来求解
2.根据1得到的运动参数估计值,再对深度值{zi,k}进行估计。 将式(15.7)重新写为(15.8)

计算机视觉贾云德chapter01

计算机视觉贾云德chapter01

图 1.1 用于生产线上具有简单视觉系统的工业机器人系统示意图 (2)产品检验 机器视觉在工业领域中另一个成功的应用是产品检验.目前已经用于产品外形检验、表面 缺陷检验, 比如, 滑块及滑槽的外形检验以及装配后的位置检验, 以决定它们能否装配在一起, 并且准确无误地完成装配任务;发动机内壁麻点、刻痕等缺陷检查,以决定产品的质量.通过 X 射线照相或超声探测获取物体内部的图像,可以实现内部缺陷检验,如钢梁内部裂纹和气孔 等缺陷检验. (3) 移动机器人导航 我们来看一下图 1.2 所示的两组图像,每一组图像称为一个立体对(stereo pair) ,是由移 动机器人上的两个摄象机同步获取的,表示某一时刻关于场景的不同视点的两幅图像.机器人 利用立体对可以恢复周围环境的三维信息.移动机器人可以利用场景的三维信息识别目标、识 别道路、判断障碍物等,实现道路规划、自主导航,与周围环境自主交互作用等.将立体图像 对和运动信息组合起来,可以构成满足特定任务分辨率要求的场景深度图.这种技术对无人汽 车、 无人飞机、 无人战车等自主系统的自动导航十分有用. 比如, 著名的美国 Sojourner 和 Rocky7 等系列火星探测移动机器人都使用了立体视觉导航系统.
2
系在一起.突触机制、动作电位、抑制性相互作用都在第三个层次上.心理物理学与第二层次 (即表示与算法)有着更直接的联系.更一般地说,不同的现象必须在不同的层次上进行解释, 这会有助于人们把握正确的研究方向.例如,人们常说,人脑完全不同于计算机,因为前者是 并行加工的,后者是串行的.对于这个问题,应该这样回答:并行加工和串行加工是在算法这 个层次上的区别,而不是根本性的区别 , 因为任何一个并行的计算程序都可以写成串行的程 序. 因此, 这种并行与串行的区别并不支持这种观点, 即人脑的运行与计算机的运算是不同的, 因而人脑所完成的任务是不可能通过编制程序用计算机来完成.

北理工贾云德《计算机视觉》chapter01引论

北理工贾云德《计算机视觉》chapter01引论

第一章引论人类在征服自然、改造自然和推动社会进步的过程中,面临着自身能力、能量的局限性,因而发明和创造了许多机器来辅助或代替人类完成任务.智能机器,包括智能机器人,是这种机器最理想的形式,也是人类科学研究中所面临的最大挑战之一.智能机器是指这样一种系统,它能模拟人类的功能,能感知外部世界并有效地解决人所能解决问题.人类感知外部世界主要是通过视觉、触觉、听觉和嗅觉等感觉器官,其中约80%的信息是由视觉获取的.因此,对于智能机器来说,赋予机器以人类视觉功能对发展智能机器是及其重要的,也由此形成了一门新的学科—机器视觉(也称计算机视觉或图像分析与理解等).机器视觉的发展不仅将大大推动智能系统的发展,也将拓宽计算机与各种智能机器的研究范围和应用领域.机器视觉是研究用计算机来模拟生物外显或宏观视觉功能的科学和技术.机器视觉系统的首要目标是用图像创建或恢复现实世界模型,然后认知现实世界.机器视觉系统获取的场景图像一般是灰度图像,即三维场景在二维平面上的投影.因此,场景三维信息只能通过灰度图像或灰度图像序列来恢复处理,这种恢复需要进行多点对一点的映射逆变换.在信息恢复过程中,还需要有关场景知识和投影几何知识.机器视觉是一个相当新且发展十分迅速的研究领域,并成为计算机科学的重要研究领域之一.机器视觉是在20世纪50年代从统计模式识别开始的[1],当时的工作主要集中在二维图像分析和识别上,如光学字符识别,工件表面、显微图片和航空图片的分析和解释等.60年代,Roberts(1965)通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述[Roberts 1965].Roberts 的研究工作开创了以理解三维场景为目的的三维机器视觉的研究.Roberts对积木世界的创造性研究给人们以极大的启发,许多人相信,一旦由白色积木玩具组成的三维世界可以被理解,则可以推广到理解更复杂的三维场景.于是,人们对积木世界进行了深入的研究,研究的范围从边缘、角点等特征提取,到线条、平面、曲面等几何要素分析,一直到图像明暗、纹理、运动以及成像几何等,并建立了各种数据结构和推理规则.到了70年代,已经出现了一些视觉应用系统[Guzman 1969, Mackworth 1973,].70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视觉”( Machine Vision)课程,由国际著名学者B.K.P.Horn教授讲授.同时,MIT AI 实验室吸引了国际上许多知名学者参与机器视觉的理论、算法、系统设计的研究,David Marr教授就是其中的一位.他于1973年应邀在MIT AI 实验室领导一个以博士生为主体的研究小组,1977年提出了不同于"积木世界"分析方法的计算视觉理论(computational vision),该理论在80年代成为机器视觉研究领域中的一个十分重要的理论框架.可以说,对机器视觉的全球性研究热潮是从20世纪80年代开始的,到了80年代中期,机器视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现,比如,基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等.到目前为止,机器视觉仍然是一个非常活跃的研究领域.许多会议论文集都反应了该领域的最新进展,比如,International Conference on Computer Vision and Pattern Recognition(CVPR); International Conference on Computer Vision(ICCV); International Conference on Pattern Recognition(ICPR); International Conference on Robotics and Automation(ICRA); Workshop on Computer Vision, and numerous conferences of SPIE.还有许多学术期刊也包含了这一领域的最新研究成果, 如,IEEE Transaction on Pattern Analysis and Machine Intelligence(PAMI); Computer Vision, Graphics, and Image Processing(CVGIP); IEEE Transaction on Image Processing; IEEETransaction on Systems, Man, and Cybernetics(SMC); Machine Vision and Applications; International Journal on Computer Vision(IJCV); Image and Vision Computing; and Pattern Recognition.每年还出版许多研究专集、学术著作、技术报告,举行专题讨论会等.所有这些都是研究机器视觉及其应用的很好信息来源.1.2 Marr的视觉计算理论Marr的视觉计算理论[Marr1982]立足于计算机科学,系统地概括了心理生理学、神经生理学等方面业已取得的所有重要成果,是视觉研究中迄今为止最为完善的视觉理论.Marr建立的视觉计算理论,使计算机视觉研究有了一个比较明确的体系,并大大推动了计算机视觉研究的发展.人们普遍认为,计算机视觉这门学科的形成与Marr的视觉理论有着密切的关系.事实上,尽管20世纪70年代初期就有人使用计算机视觉这个名词[Binford,1971],但正是Marr 70年代末建立的视觉理论促使计算机视觉这一名词的流行.下面简要地介绍Marr的视觉理论的基本思想及其理论框架.1.2.1 三个层次Marr认为, 视觉是一个信息处理系统,对此系统研究应分为三个层次:计算理论层次,表示(representation)与算法层次,硬件实现层次,如表1-1所示.表1-1按照Marr的理论,计算视觉理论要回答视觉系统的计算目的和策略是什么,或视觉系统的输入和输出是什么,如何由系统的输入求出系统的输出.在这个层次上,信息系统的特征是将一种信息(输入)映射为另一种信息(输出).比如,系统输入是二维灰度图像,输出则是三维物体的形状、位置和姿态,视觉系统的任务就是如何建立输入输出之间的关系和约束,如何由二维灰度图像恢复物体的三维信息.表示与算法层次是要进一步回答如何表示输入和输出信息,如何实现计算理论所对应的功能的算法,以及如何由一种表示变换成另一种表示,比如创建数据结构和符号.一般来说,不同的输入、输出和计算理论,对应不同的表示,而同一种输入、输出或计算理论可能对应若干种表示.在解决了理论问题和表示问题后,最后一个层次是解决用硬件实现上述表示和算法的问题,比如计算机体系结构及具体的计算装置及其细节.从信息处理的观点来看,至关重要的乃是最高层次,即计算理论层次.这是因为构成知觉的计算本质,取决于解决计算问题本身,而不取决于用来解决计算问题的特殊硬件.换句话说,通过正确理解待解决问题的本质,将有助于理解并创造算法.如果考虑解决问题的机制和物理实现,则对理解算法往往无济于事.上述三个层次之间存在着逻辑的因果关系,但它们之间的联系不是十分紧密,因此,某些现象只能在其中一个或两个层次上进行解释.比如神经解剖学原则上与第三层次即物理实现联系在一起.突触机制、动作电位、抑制性相互作用都在第三个层次上.心理物理学与第二层次(即表示与算法)有着更直接的联系.更一般地说,不同的现象必须在不同的层次上进行解释,这会有助于人们把握正确的研究方向.例如,人们常说,人脑完全不同于计算机,因为前者是并行加工的,后者是串行的.对于这个问题,应该这样回答:并行加工和串行加工是在算法这个层次上的区别,而不是根本性的区别, 因为任何一个并行的计算程序都可以写成串行的程序.因此,这种并行与串行的区别并不支持这种观点,即人脑的运行与计算机的运算是不同的,因而人脑所完成的任务是不可能通过编制程序用计算机来完成.1.2.2 视觉表示框架视觉过程划分为三个阶段, 如表1-2所示.第一阶段(也称为早期阶段)是将输入的原始图像进行处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图(primitive sketch);第二阶段(中期阶段)是指在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息的包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图(2.5 dimensional sketch);在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体的过程称为视觉的第三阶段(后期阶段).Marr理论是计算机视觉研究领域的划时代成就,但该理论不是十分完善的,许多方面还有争议.比如,该理论所建立的视觉处理框架基本上是自下而上,没有反馈.还有,该理论没有足够地重视知识的应用.尽管如此,Marr理论给了我们研究计算机视觉许多珍贵的哲学思想和研究方法,同时也给计算机视觉研究领域创造了许多研究起点.1.3 机器视觉的应用机器视觉技术正广泛地应用于各个方面,从医学图象到遥感图像,从工业检测到文件处理,从毫微米技术到多媒体数据库,不一而足.可以说,需要人类视觉的场合几乎都需要机器视觉.应该指出的是,许多人类视觉无法感知的场合,如精确定量感知、危险场景感知、不可见物体感知等,机器视觉更突显其优越性.下面是一些机器视觉的典型应用.(1)零件识别与定位由于工业环境的结构、照明等因素可以得到严格的控制,因此,机器视觉在工业生产和装配中得到了成功的应用.图1.1 是一个具有简单视觉的工业机器人系统示意图,其视觉系统由一个摄象机和相关的视觉信息处理系统组成.摄象机位于零件传输带上方,对于不同的零件,可以选择不同颜色的传输带,比如,明亮的物体,选择黑色传输带,暗色的零件,选择白色的背景,这样有利于视觉系统将零件从传输带上分离出来,并进行识别和定位,识别的目的是为机器人提供是否操作或进行何种操作的信息,定位的目的是导引机器人手爪实时准确地夹取零件.图1.1 用于生产线上具有简单视觉系统的工业机器人系统示意图(2)产品检验机器视觉在工业领域中另一个成功的应用是产品检验.目前已经用于产品外形检验、表面缺陷检验,比如,滑块及滑槽的外形检验以及装配后的位置检验,以决定它们能否装配在一起,并且准确无误地完成装配任务;发动机内壁麻点、刻痕等缺陷检查,以决定产品的质量.通过X射线照相或超声探测获取物体内部的图像,可以实现内部缺陷检验,如钢梁内部裂纹和气孔等缺陷检验.(3) 移动机器人导航我们来看一下图1.2所示的两组图像,每一组图像称为一个立体对(stereo pair),是由移动机器人上的两个摄象机同步获取的,表示某一时刻关于场景的不同视点的两幅图像.机器人利用立体对可以恢复周围环境的三维信息.移动机器人可以利用场景的三维信息识别目标、识别道路、判断障碍物等,实现道路规划、自主导航,与周围环境自主交互作用等.将立体图像对和运动信息组合起来,可以构成满足特定任务分辨率要求的场景深度图.这种技术对无人汽车、无人飞机、无人战车等自主系统的自动导航十分有用.比如,著名的美国Sojourner和Rocky7等系列火星探测移动机器人都使用了立体视觉导航系统.图1.2 由移动机器人立体视觉系统获取的立体图像对,可用来重建场景三维信息(4)遥感图像分析目前的遥感图像包括三种:航空摄影图像、气象卫星图像、资源卫星图像.这些图像的共同特点是在高空对地表或地层进行远距离成像,但三种图像的成像机理完全不同.航空图像可以用普通的视频摄象机来获取,分析方法也同普通的图像分析一样.卫星图像的获取和应用随着成像机理不同而变化很大,气象卫星使用红外成像传感系统可以获取不同云层的图像,即云图,由此分析某一地区的气象状况;海洋卫星使用合成孔径雷达获取海洋、浅滩图像,由此重构海洋波浪三维表面图;资源卫星装备有多光谱探测器(multiple spectral sensor, MSS),可以获取地表相应点的多个光谱段的反射特性,如红外、可见光、紫外等,多光谱图像被广泛地用于找矿、森林、农作物调查、自然灾害测报、资源和生态环境检测等.(5)医学图像分析目前医学图像已经广泛用于医学诊断,成像方法包括传统的X射线成像、计算机层析(computed tomography, CT)成像、核磁共振成像(magnetic resonance imaging, MRI)、超声成像等.机器视觉在医学图像诊断方面有两方面的应用,一是对图像进行增强、标记、染色等处理来帮助医生诊断疾病,并协助医生对感兴趣的区域进行定量测量和比较;二是利用专家知识系统对图像(或是一段时期内的一系列图像)进行自动分析和解释,给出诊断结果.(6)安全鉴别、监视与跟踪用机器视觉系统可以实现停车场监视、车辆识别、车牌号识别、探测并跟踪“可疑”目标;根据面孔、眼底、指纹等特征识别特定人。

无人驾驶车辆_北京理工大学中国大学mooc课后章节答案期末考试题库2023年

无人驾驶车辆_北京理工大学中国大学mooc课后章节答案期末考试题库2023年

无人驾驶车辆_北京理工大学中国大学mooc课后章节答案期末考试题库2023年1.2007年 DARPA举办的城市挑战赛,冠军是斯坦福大学的无人车。

参考答案:错误2.相机与激光雷达数据融合主要是指空间数据融合。

()参考答案:错误3.关于激光雷达slam,以下描述正确的有()参考答案:Gmapping 采用粒子滤波的方法,在二维激光雷达slam中使用广泛。

_Karto SLAM采用图优化的方法计算更新激光雷达的位姿。

_Cartographer以子地图为单位构建全局地图,以消除构图过程中产生的累积误差。

_Hector SLAM采用基于扫描匹配的方法,在传感器精度高的情况下,定位建图效果好。

4.视觉里程计的目的是根据拍摄的图像估计相机的运动,其关键步骤包括()参考答案:特征提取_局部优化_运动估计_特征匹配5.以下哪些曲线可以用于状态空间采样()参考答案:Dubins曲线_Reeds-shepp曲线_B样条曲线_高次多项式曲线6.单层感知机无法解决异或问题,这是因为异或问题是一个非线性问题,而单层感知机属于一种线性分类器。

参考答案:正确7.LPA*算法是一种实时、增量式的规划算法。

参考答案:错误8.通过卫星播发导航电文的方式可以将电离层时间误差、对流层时间误差、多路径延迟误差和卫星位置j等信息提供给用户。

参考答案:正确9.拓扑地图模型选用节点来表示道路上的特定位置,用节点与节点间的关系来表示道路间联系。

这种地图表示方法结构简单、存储方便、全局连贯性好,适合于大规模环境下的路径规划。

参考答案:正确10.相机成像时,像素点是离散的,像素值是连续的。

参考答案:错误11.假如激光雷达坐标系到车体坐标系的旋转矩阵为[0.83, -0.26, 0.49; 0.36, 0.93,-0.11; -0.42, 0.27, 0.87;],平移向量为[-0.1, -0.6, 0.6],激光雷达坐标系中坐标为[1.6, -1.5, 1.5]的点,在车体坐标系中的坐标是()参考答案:[2.35, -1.58, 0.83]12.Dijkstra算法只能求出起点到终点的最短路径,不能得到起点到其它各节点的最短路径。

动态特征空间和三维运动目标的智能递推识别方法

动态特征空间和三维运动目标的智能递推识别方法

动态特征空间和三维运动目标的智能递推识别方法
动态特征空间和三维运动目标的智能递推识别方法是一种基于计算机
视觉技术的智能识别方法,它可以对三维运动目标进行高效准确的识
别和跟踪。

该方法主要基于动态特征空间的理论,通过对目标的运动
轨迹和特征进行分析,实现对目标的智能递推识别。

动态特征空间是指在时间序列上,将目标的特征向量作为空间的维度,将目标的运动轨迹作为空间的坐标,从而构建出一个动态特征空间。

在这个空间中,目标的运动轨迹和特征可以被表示为一个点或者一条
曲线,通过对这些点或曲线的分析,可以得到目标的运动状态和特征
信息。

三维运动目标的智能递推识别方法主要包括以下几个步骤:首先,通
过摄像机获取目标的运动轨迹和特征信息;然后,将这些信息映射到
动态特征空间中,得到目标在空间中的位置和状态;接着,通过对目
标在空间中的运动轨迹和特征进行分析,得到目标的运动状态和特征
信息;最后,根据这些信息,对目标进行智能递推识别和跟踪。

该方法的优点在于可以对目标进行高效准确的识别和跟踪,同时可以
应用于多种不同的场景和环境中。

例如,在智能交通系统中,可以利
用该方法对车辆和行人进行识别和跟踪,从而实现交通流量的监测和
管理;在安防领域中,可以利用该方法对可疑人员和物品进行识别和跟踪,从而提高安全防范能力。

总之,动态特征空间和三维运动目标的智能递推识别方法是一种基于计算机视觉技术的智能识别方法,它可以对三维运动目标进行高效准确的识别和跟踪,具有广泛的应用前景和研究价值。

目标物点云的三维坐标计算

目标物点云的三维坐标计算

目标物点云的三维坐标计算全文共四篇示例,供读者参考第一篇示例:目标物点云的三维坐标计算是一种常见的计算机视觉技术,通过对目标物体的点云数据进行处理和分析,可以获取目标物体在三维空间中的准确位置和姿态信息。

点云数据是由目标物体表面上的一系列点构成的数据集,通过对这些点进行处理,可以实现目标物体的三维坐标计算。

在进行目标物点云的三维坐标计算之前,首先需要通过三维扫描设备或者摄像头获取目标物体的点云数据。

这些点云数据通常是以离散点的形式存在,每个点都具有坐标信息和颜色信息。

接下来,需要对这些点云数据进行处理,以提取出目标物体的特征点和边缘信息。

在提取特征点和边缘信息之后,可以通过三维重建算法对目标物体进行三维模型的重建。

通过分析点云数据之间的关联性和空间位置关系,可以得到目标物体在三维空间中的几何形状和空间位置信息。

这些信息可以被用来计算目标物体在三维空间中的坐标和姿态。

在进行目标物点云的三维坐标计算时,通常会采用不同的算法和方法进行处理。

其中最常用的方法包括最小二乘法、迭代最近点算法、表面拟合算法等。

这些算法可以帮助我们对点云数据进行精确的处理和分析,从而得到目标物体的准确的三维坐标和姿态信息。

在实际的应用场景中,目标物点云的三维坐标计算可以被广泛应用于工业、医疗、军事等领域。

比如在工业生产中,可以通过对产品进行三维扫描和点云数据处理,实现产品质量检测和缺陷分析;在医疗领域,可以通过对患者进行三维扫描和点云数据处理,实现精准的手术规划和操作。

目标物点云的三维坐标计算是一种重要的计算机视觉技术,通过对点云数据的处理和分析,可以实现目标物体在三维空间中的准确定位和姿态计算。

这种技术在日常生活和产业生产中都有着广泛的应用前景,将为我们的生活和工作带来更多的便利和效率提升。

第二篇示例:目标物点云的三维坐标计算是现代科技领域中的一个重要课题,它涉及到计算机视觉、图像处理、机器学习等多个领域的知识。

点云是由大量的点组成的三维点集,可以用来描述目标物体的形状、位置、大小等信息。

复杂光照环境下的车辆检测方法-北京理工大学

复杂光照环境下的车辆检测方法-北京理工大学

第36卷第4期2016年4月北京理工大学学报T r a n s a c t i o n s o fB e i j i n g I n s t i t u t e o fT e c h n o l o g yV o l.36 N o.4A p r.2016复杂光照环境下的车辆检测方法裴明涛,沈家峻,杨敏,贾云得(北京理工大学计算机学院,智能信息技术北京市重点实验室,北京100081)摘要:提出一种用于复杂光照环境下的车辆检测方法,该方法在传统的假设验证框架下充分利用了先验知识和复杂光照背景下的车辆特征.在假设生成阶段,利用车辆边缘信息与车辆前部形状特征进行拟合来生成假设;在假设验证阶段,使用HO G特征作为描述子,结合S VM分类器完成假设车辆目标的验证识别.实验结果表明在复杂的光照环境中,本文方法能够有效检测出传统方法无法检测的目标,是对正常光照环境下车辆检测方法的有效补充.关键词:车辆检测;假设验证框架;复杂光照中图分类号:T P39文献标志码:A 文章编号:1001-0645(2016)04-0393-06D O I:10.15918/j.t b i t1001-0645.2016.04.011V e h i c l eD e t e c t i o n M e t h o d i nC o m p l e x I l l u m i n a t i o nE n v i r o n m e n tP E IM i n g-t a o,S H E NJ i a-j u n, Y A N G M i n,J I A Y u n-d e(B e i j i n g L a b o r a t o r y o f I n t e l l i g e n t I n f o r m a t i o nT e c h n o l o g y,S c h o o l o fC o m p u t e r S c i e n c e,B e i j i n g I n s t i t u t e o fT e c h n o l o g y,B e i j i n g100081,C h i n a)A b s t r a c t:A no n-r o a dv e h i c l ed e t e c t i o n m e t h o du n d e rc o m p l e xi l l u m i n a t i o ne n v i r o n m e n t s w a s i n t r o d u c e d.T h e a p p r o a c hu s e s t h e f e a t u r e s o f av e h i c l eu n d e r c o m p l e x i l l u m i n a t i o ne n v i r o n m e n t a n d p r i o r k n o w l e d g e o f t h e v e h i c l e s f r o n t s h a p e b a s e do n t h e h y p o t h e s i s-v e r i f i c a t i o n f r a m e w o r k.D u r i n g t h e s t a g e o f h y p o t h e s i s g e n e r a t i o n,e d g e sw e r e e x t r a c t e d f r o mt h e f r o n t i m a g e o f a v e h i c l e a n d t h e nf i ta p p r o x i m a t e l y w i t ht h ef r o n ts h a p eo ft h ev e h i c l e.I nt h eh y p o t h e s i sv e r i f i c a t i o n p h a s e,HO G f e a t u r e s w e r eu s e da sad e s c r i p t o r,i nc o m b i n a t i o n w i t ht h eS VM c l a s s i f i e rt o c o m p l e t e t h e v e r i f i c a t i o n o f h y p o t h e s i s.T h e e x p e r i m e n t a l r e s u l t s s h o wt h a t t h e p r o p o s e dm e t h o d w o r k sw e l l i n c o m p l e x i l l u m i n a t i o n e n v i r o n m e n t,a n d i t h a s g o o d p e r f o r m a n c e i n d e t e c t i n g v e h i c l e t a r g e t s u n d e r c o m p l e x i l l u m i n a t i o ne n v i r o n m e n t.K e y w o r d s:v e h i c l e d e t e c t i o n;h y p o t h e s i s-v e r i f i c a t i o n f r a m e w o r k;c o m p l e x i l l u m i n a t i o n车辆检测是计算机视觉领域的重要研究内容.目前有很多成熟的算法被提出,许多算法利用阴影[1]㊁颜色[2]㊁对称性[3]等特征进行车辆检测,但在复杂的光照环境下有较高的漏检率.在利用车辆边缘信息的方法中,S u n等[4]提出一种多尺度3级分辨率的假设产生方法,对3级不同分辨率的图像分别提取垂直和水平边缘,再生成垂直与水平边缘直方图,根据边缘直方图的波峰分布确定车辆假设的区域.然而这种方法在车辆一侧光照较强的环境中由于光照的干扰导致另一侧的边缘信息丢失严重,无法形成完整的垂直与水平边缘组合,从而使车辆目标在假设生成阶段被排除掉.另外一种效果较好的车辆检测方法主要是利用车辆的纹理特征[5],但是这种方法对于车辆表面的信息的完整性具有较高的依赖,在实际路面图像采集过程中由于光照环境的变化很难保证图像中车辆的表面信息始终完整.收稿日期:20141209基金项目:国家自然科学基金资助项目(61472038);北京市教育委员会共建专项资助项目作者简介:裴明涛(1977 ),男,博士,副教授,E-m a i l:p e i m t@b i t.e d u.c n.在一些复杂的光照环境中,由于光线在车辆表面的反射会使得车辆表面模糊一片,很难提取纹理特征,因此产生大量的漏检.复杂光照环境一般包括车辆两侧的光照不均,车辆的顺光与逆光以及光照强度短时间内剧烈变化等情况.目前关于复杂光照环境中的车辆目标检测研究较少.本文主要研究复杂光照环境中车辆检测问题,分析复杂光照环境中车辆特征信息,包括车辆与路面之间的边界信息和车辆前部形状特征信息等,并基于假设验证框架[6],建立了一种基于边缘提取的车辆检测方法.基于假设验证的车辆检测流程如图1所示.该框架分为两个步骤:①假设生成,在图像中生成一些可能是车辆的假设区域;②假设验证,通过测试验证确认假设生成的区域中是否真的存在车辆图1 基于假设验证框架的车辆检测流程F i g .1 F l o w c h a r t o f h y p o t h e s i s -v e r i f i c a t i o ns t r u c t u r e 1 车辆假设的生成在车辆假设的生成过程中,先进行图像预处理,提高图像质量;然后利用L o G (L a pl a c e o f G a u s s i a n )边缘检测算法对图像进行边缘检测并二值化边缘图;再根据车辆的前部形状特征进行拟合,并根据拟合度确定候选区域.1.1 图像的预处理车辆检测的数据多从道路监控拍摄的视频中获取,但从源视频中取得的视频图像数据并不能直接用于目标检测,在进行车辆目标假设区域的生成操作之前需要进行预处理.摄像机系统在成像过程中必然会受到光照㊁天气㊁传感器以及系统非线性㊁目标快速移动等复杂因素的影响而产生噪声干扰,降低图像的质量并影响车辆的检测,因此在车辆检测之前需要对图像进行平滑去噪.本文对原始彩色图像进行的预处理分为灰度化处理和平滑处理两步.彩色图像先采用加权平均法对R G B 3个分量进行计算得到较为合理的灰度图像,然后对灰度图像进行高斯滤波去除噪声的干扰,得到较为平滑的图像.经过图像的预处理,原始视频数据转化为灰度图像数据,并减少或过滤了图像的噪声干扰,增强图像的有用信息,为目标的检测创造了良好条件.1.2 L o G 边缘检测在光照环境较为复杂的情况下,车辆表面的信息丢失较为严重,但是车辆与路面的边界区分依然明显,因此本文在假设区域生成的过程中充分利用这一特点,为得到完整的边缘图像,用L o G 边缘检测算子对图像进行边缘检测.L o G 算子即高斯拉普拉斯算子,基本思想是首先对原始图像进行最佳平滑处理,最大程度地抑制噪声,再对平滑后的图像求取边缘.高斯拉普拉斯算子使用的低通滤波器是二维高斯滤波器,其基本函数为G (x ,y )=12πσ2e x p -x 2+y 22σæèçöø÷2.(1) 图像通过低通滤波即平滑处理可以实现对噪声最大程度的抑制.平滑后的图像通过拉普拉斯算子Ñ2计算二阶导数进行增强.对图像的高斯平滑滤波和拉普拉斯微分运算两步可以合并成一个卷积算子Ñ2G (x ,y )=12πσ4x 2+y 2σ2-æèçöø÷2e x p -x 2+y 22σæèçöø÷2,(2)式中Ñ2G (x ,y )即为L o G 算子的一般形式.以Ñ2G (x ,y )对原始的灰度图像进行卷积运算,然后提取零交叉点可以获得图像的边缘点.实验中原始的灰度图像经过L o G 算子边缘检测之后成功地保留了车辆的轮廓,效果如图2(b )所示.图2(a)为原始图像.图2 L o G 边缘检测与图像二值化结果F i g .2 L o Ge d ge d e t e c t i o na n db i n a r i z a t i o n493北京理工大学学报第36卷1.3拟合策略道路监控画面主要拍摄的是车辆前部,本文车辆检测的标记位置为车辆前部,车辆前部具有明显的形状特征,整体成矩形,存在上下左右4个边缘,并满足一定的高宽比.对于L o G边缘检测所得到的图像进行拟合,对目标与矩形以及长宽比的拟合程度进行比较确定候选区域.首先将边缘图像二值化,如图2(c)所示.分析二值图像可知,相对于路面以及路边的干扰物,汽车目标作为人造刚体,其边缘呈现出较为明显的形状特征.因此可根据目标对于车辆前部形状的拟合程度进行判定.拟合之前先确定一个合适的扫描窗口,统计区域的大小㊁长宽比以及厚度的选择对结果有影响,本文在实验之前通过统计分析选择长宽比和大小符合大部分车辆前部的结果生成扫描窗口,以此窗口为单位对整个二值图像进行扫描.对于扫描窗口向外和向内各扩展一段距离形成一个中空的区域,作为有效统计区域,如图3所示,黑色区域为有效统计区域.对于在扫描窗口的统计区域内的像素进行统计.图3有效统计区域的生成F i g.3 E f f e c t i v e a r e a g e n e r a t i o n设有效统计区域为D,对于扫描窗口n定义拟合度为G(n)=ðiɪD i(x,y),(3)式中i(x,y)为(x,y)处的像素值,在二值图像中为1或0.对于每一个扫描窗口计算拟合度,将限定扫描区域内拟合度高于一定阈值G t h的目标作为假设候选.1.4聚类融合由于车辆的类型不同,车辆距离监控镜头的位置也不同,导致目标区域的大小变化多样.为了不产生漏检,实际实验中会采用多尺度扫描的策略,因此会产生满足条件的假设框集中分布的情况,需要对于集中分布的假设框进行聚类从而得到较为准确的假设区域.本文采用具有噪声的基于密度的聚类方法D B-S C A N[7](d e n s i t y-b a s e d s p a t i a l c l u s t e r i n g o f a p p l i c a t i o n sw i t hn o i s e)进行聚类运算,D B S C A N 是一种空间聚类算法.该算法基于密度处理,将具有足够密度的区域划分为簇,能够在具有噪声的空间数据库中发现任意形状的簇,将簇定义为密度相连的点的最大集合.D B S C A N算法的优点是聚类速度快且能够有效处理噪声点和发现任意形状的空间聚类.另外该算法不需要输入划分的聚类个数,适用于本文所需的不确定假设数量的情况.2假设验证算法获得车辆假设后,需要对假设的真伪进行验证.本文采用了基于表观的方法,选择方向梯度直方图HO G(h i s t o g r a m so fo r i e n t e d g r a d i e n t s)特征作为特征描述子,支持向量机S VM(s u p p o r tv e c t o r m a c h i n e)作为分类器.将上一步得到的车辆假设框归一化到一定的尺寸,再提取假设区域的HO G特征表示为一组特征值.最后将特征值送到训练好的S VM分类器进行分类,分为车辆和非车辆类别以确定假设框的真伪.2.1车辆特征描述本文的研究重点在于复杂的光照环境下的车辆检测,因此要求选择的特征描述子能够有效地克服目标亮度和尺度的变化.HO G特征最早由由D a l a l 等[8]提出用于行人检测,并取得了较好的效果,后来被推广用于各种目标检测的描述中.HO G特征更加关注目标局部区域内梯度方向直方图分布,而通常目标的变化只会出现在较大的尺度范围内.因此保证了HO G特征对尺寸和光照变化的不敏感性[9].HO G特征提取的提取可分为梯度计算和梯度统计两步进行.梯度值计算时用一维的离散微分模板[-1,0,1]和[-1,0,1]-1同时在水平和垂直方向上对图像进行处理.对于每一个像素,用式(4)(5)分别计算每一个点水平和垂直的梯度分量,再用式(6)(7)计算每一个像素点的梯度值和梯度方向,G x(x,y)=H(x+1,y)-H(x-1,y),(4)G y(x,y)=H(x,y+1)-H(x,y-1),(5)G(x,y)=G x(x,y)2+G y(x,y)2,(6)θ(x,y)=a r c t a n[G y(x,y)/G x(x,y)].(7)在梯度统计的过程中,对于每个像素点上的梯度值和方向进行加权统计.本文在方向直方图的构建时采用了0ʎ~180ʎ的方向范围并分为9个等级,每20ʎ是一个等级.不同形状的物体梯度分布不同,593第4期裴明涛等:复杂光照环境下的车辆检测方法可以用梯度方向直方图区分物体的形状.每一幅图像可分成等大小的细胞单元(c e l l),在细胞单元内计算图像边缘梯度直方图.为了避免光照和对比度的变化对梯度分布的影响,必须局部归一化梯度,将几个细胞单元组成一个块(b l o c k ).将块内细胞单元的梯度直方图连接起来作为块的特征,在图像上滑动块得到的特征值连接起来就构成了图像的梯度直方图特征.2.2 S V M 分类器采用S VM 作为车辆分类器[10],S VM 是一种有效的用于线性和非线性二分类问题的分类器.对于给定的一组点,S VM 分类器找到一个超平面来使得两边每个类别正确的数量最多,并且每一类到该超平面的距离最大.分类间的超平面可以表示为f (x )=ðli =1y i a i k (x ,x i )+b ,(8)式中:参数x ɪR N为被分类对象的特征描述向量;y ɪ(-1,+1)为样本标记;k (x ,x i )为内核函数.通过采用不同的内核,S VM 可训练为不同种类的分类器,本文采用式(9)的径向基核函数来构造分类器对HO G 特征向量进行分类k (x ,x i )=e x p -x -x i22σæèçöø÷2.(9) 在使用分类器之前需收集一定数量的正样本和负样本训练分类器,通过调节参数σ来获得更高准确率的S VM.本文的待分类目标是每一个假设框的HO G 特征向量,对于假设生成过程产生的每一个结果提取HO G 特征向量,通过S VM 分类为车辆目标和非车辆目标.至此完成整个图像的车辆检测,在整个过程中从假设生成的边缘检测到假设验证的特征描述子再到分类器的选择均需要考虑复杂光照环境这一研究重点.3 实验结果与分析3.1 分类器的训练在训练车辆分类器时,本文在实际路口拍摄的图像中收集训练数据,通过随机滑动窗口的方法收集负样本,手工标定的方法收集正样本.在训练分类器时,本文使用了正样本300个,负样本600个.在测试分类器时,挑选独立于训练样本的正负样本各100个,调节核函数的参数获得查准率较高且错分率较低的分类器作为实验使用的分类器.3.2 实验数据本文的实验首先建立了一个复杂光照环境的数据集,所有数据均来自实际路口拍摄的图像,其中包含了300幅比较具有代表性的复杂光照环境下的道路监控图像,这些图像均独立于分类器训练时所采用的数据.图像中受光照的影响,车辆的各方面特征均有较为严重的丢失,正常光照下的车辆检测方法在这样的图像中漏检率和误检率较高.图4为部分实验数据,这些图像均受到了复杂光照的影响,或为强顺逆光导致车身表面过度曝光,细节信息全无,或为单侧光照过强导致左右两边特征不对称.这些都是复杂光照对于车辆表观特征产生的严重影响,传统车辆检测方法在这样的数据中表现较差,因此本文实验在这样的数据集上进行以验证方法的有效性.图4 部分实验数据F i g .4 E x p e r i m e n t a l d a t a s a m p l i n g3.3 定性分析为测试本文方法的检测效果,进行了与其他方法的比较实验.实验选择了同样利用边缘特征进行候选目标提取的文献[4]中的方法进行比较,该方法通过边缘图像的灰度影射图来确定候选目标.本文的方法重点在于假设生成的过程,因此又选择了直接采用滑动窗口扫描提取特征分类的方法进行对比.实验对于车辆检测的标注为车前部,检测到完整的车前部即为有效目标.图5为部分实验结果,在复杂的光线环境中,尽管车辆表面的信息丢失严重,车辆与路面的边界依旧明显,因此本文方法能够很好地检测出目标.其693北京理工大学学报第36卷中复杂光照对白色车辆的影响尤为明显,车辆的表面纹理以及车牌均由于过度曝光而模糊一片.但路面大多为深色,车辆与路面的边界边缘清晰可见,本文的方法恰恰利用了这一优势,对于白色车辆有更好的检测效果.图5部分实验结果F i g.5 E x p e r i m e n t a l r e s u l t s s a m p l i n g对比实验中S u n的方法在光照比较极端的情况下只能检测出车辆的一侧边缘,在车辆阴影较大时会将阴影误认为候选目标.当画面中同时出现多辆车时检测到的边缘之间会互相影响从而降低检测效果.而直接通过滑动窗口密集采样的方法能够检测出大多数正确目标,但同时误检率也很高且速度较慢.3.4定量分析为进一步定量分析本文提出的方法的有效性和鲁棒性,定义实验数据集中车辆检测的准确率(查准率)为R p r e c i s i o n=N t pN t p+N f p,(10)式中:N t p为正确检测为车辆的个数;N f p为将非车辆区域检测为车辆的个数,即误检个数.同时定义实验数据集中车辆检测的召回率(查全率)为R r e c a l l=N t pN t p+N f n,(11)式中:N f n为将车辆区域检测为非车辆区域的个数,即漏检个数;N t p+N f n为图像序列中车辆的总个数.对比实验将3种方法分别在复杂光照环境的数据集中测试,对比结果如表1所示.表1各算法评价指标T a b.1E v a l u a t i o no f e a c ha l g o r i t h m算法查准率/%查全率/%本文算法82.383.0S u n的算法68.565.3滑动窗口密集采样方法82.088.0在复杂光照的数据集上本文的方法取得了较高的准确率和召回率,相比文献[4]的边缘灰度统计方法效果有较大的提升.直接通过滑动窗口对整个图像进行扫描提取特征并分类的方法比本文有更高的召回率,但耗时较长(每张图像需1200m s),无法满足实际视频中实时监测车辆的要求.本文的方法每张图像的耗时小于40m s,可完全满足车辆检测系统的实时性要求.图6为阈值由低升高时召回率和准确率的变化曲线,由图6可知,当拟合度设定的阈值G t h变化时,查准率和查全率会随之变化.阈值较低时绝大部分车辆目标会被检测出,同时误检数量也较高.因此查准率较低,查全率较高.当阈值设定较高时则相反,误检的数量会降低,但是漏检的数量也会增多.在实际使用过程中可根据需求设定合适大小的拟合度阈值.图6查准率和查全率与阈值的关系F i g.6 R e l a t i o n s h i p o f p r e c i s i o na n d r e c a l l r a t ew i t h t h r e s h o l d由定量的结果可知,在正常光照下的车辆检测方法几乎无法检测出目标的情况下,本文的方法依旧保持了较高的检测率,对于复杂光照环境这一特殊情况切实有效.4结论提出了一种复杂光照环境下的车辆检测方法,实验结果表明,对于正常光照环境下车辆检测方法无法检测的车辆,本文方法能够有效地检测出目标.由于本文方法所使用的边缘特征充分考虑到了复杂光照环境中车辆所能保留的信息,同时结合车辆头部的形状特征进行拟合来进行假设区域的生成,因793第4期裴明涛等:复杂光照环境下的车辆检测方法此可以面对复杂的光照环境而保持较好的检测效果,可以作为正常光照环境下车辆检测方法的有效补充.参考文献:[1]M o r i H ,C h a r k a iN M.S h a d o w a n dr h y t h m a ss i gn p a t t e r n s o f o b s t a c l e d e t e c t i o n [C ]ʊP r o c e e d i n gso f I E E E I n t e r n a t i o n a l S y m p o s i u m o n I n d u s t r i a l E l e c t r o n i c s .[S .l .]:I E E E ,1993:271277.[2]B u l u s w a r SD ,D r a p e r BA.C o l o rm a c h i n e v i s i o n f o r a u -t o n o m o u s v e h i c l e s [J ].E n g i n e e r i n g A p pl i c a t i o n s o f A r t i f i c i a l I n t e l l i g e n c e ,1998,11(2):245256.[3]Z i e l k eT ,B r a u c k m a n n T M ,V o n S e e l e n W.I n t e n s i t ya n de d g e -b a s e ds y mm e t r y d e t ec t i o n w i t ha na p p l i c a t i o n t oc a r -f o l l o w i n g [J ].C V G I P :I m a g e U nde r s t a n d i n g ,1993,58(2):177190.[4]S u nZ ,M i l l e rR ,B e b i sG ,e t a l .Ar e a l -t i m e p r e c r a s h v e h i c l e d e t e c t i o n s y s t e m [C ]ʊP r o c e e d i n g s o f S i x t h I E E E W o r k s h o p o n A p p l i c a t i o n so fC o m p u t e r V i s i o n .[S .l .]:I E E E ,2002:171176.[5]H a r a l i c kR M ,S h a n m u ga m K ,D i n s t e i nIH.T e x t u r e f e a t u r e s f o r i m a g ec l a s s i f i c a t i o n [J ].I E E E T r a n s a c t i o n s o nS y s t e m ,M a n ,a n dC yb e r n e t ic s ,1973(6):610621.[6]S u nZ ,B e b i sG ,M i l l e rR.M o n o c u l a r p r e c r a s hv e h i c l ed e t e c t i o n :f e a t u r e s a n d c l a s s i f i e r s [J ].I E E E T r a n s a c t i o n s o n I m a g e P r o c e s s i n g,2006,15(7):20192034.[7]E s t e rM ,K r i e g e lH P ,S a n d e r J ,e t a l .Ad e n s i t y -b a s e d a l g o r i t h m f o r d i sc o v e r i n g c l u s t e r s i n l a r g e s p a t i a ld a t a b a se sw i t hn o i s e [C ]ʊP r o c e e d i n g s of t h eS e c o n d I n -t e r n a t i o n a l C o n f e r e n c e o n K n o w l e d g e D i s c o v e r y a n d D a t a M i n i n g (K D D -96).P o r t l a n d ,O r e go n ,U S A :[s .n .],1996.[8]D a l a lN ,T r i g g sB .H i s t o gr a m s o f o r i e n t e d g r a d i e n t s f o r h u m a nd e t e c t i o n [C ]ʊP r o c e e d i n g so fI E E E C o m p u t e r S o c i e t y C o n f e r e n c e o n C o m p u t e r V i s i o n a n d P a t t e r n R e c o gn i t i o n .[S .l .]:I E E E ,2005.[9]K h a mm a r i A ,N a s h a s h i b i F ,A b r a m s o n Y ,e t a l .V e h i c l e d e t e c t i o n c o m b i n i n g g r a d i e n t a n a l ys i s a n d A d a B o o s t c l a s s i f i c a t i o n [C ]ʊP r o c e e d i n g so f t h e8t hI n -t e m a f i o n a lI E E EC o n f e r e n c eo nI n t e l l i ge n t T r a n s p o r t a t i o n S ys t e m s .V i e n n a ,A u s t r i a :[s .n .],2005:10841089.[10]S u nZ ,B e b i sG ,M i l l e rR.O n -r o a dv e h i c l ed e t e c t i o n u s i n gg a b o r f i l t e r sa n ds u p p o r tv e c t o rm a c h i n e s [C ]ʊP r o c e e d i n gso f200214t hI n t e r n a t i o n a lC o n f e r e n c eo n D i g i t a l S i g n a l P r o c e s s i n g.[S .l .]:I E E E ,2002:10191022.(责任编辑:李兵췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍췍)(上接第381页)[9]李豫川,伍星,迟毅林,等.基于形态滤波和稀疏分量分析的滚动轴承故障盲分离[J ].振动与冲击,2011,30(12):170174.L i Y u c h u a n ,W u X i n g ,C h i Y i l i n ,e t a l .B l i n d s e p a r a t i o n f o r r o l l i n g b e a r i n g fa u l t sb a s e d o n m o r p h o l o g ic a l f i l t e r i n g a n ds p a r s ec o m p o n e n ta n a l ys i s [J ].J o u r n a lo f V i b r a t i o na n d S h o c k ,2011,30(12):170174.(i nC h i n e s e)[10]E n g a n K ,A a s e S O ,H a k o n H u s o y J.M e t h o d o f o p t i m a l d i r e c t i o n sf o rf r a m ed e s i g n [C ]ʊP r o c e e d i n gs I C A S S P 99-I E E E I n t e r n a t i o n a l C o n f e r e n c e o n A c o u s t i c s ,S p e e c h ,a n d S i g n a lP r o c e s s i n g.[S .l .]:I E E E ,1999:24432446.[11]A h a r o n M ,E l a dM ,B r u c k s t e i nA M.T h eK -S V D :a na l g o r i t h m f o rd e s i g n i n g o fo v e r -c o m p l e t ed i c t i o n a r ie sf o rs p a r s er e p r e s e n t a t i o n [J ].I E E E T r a n s a c t i o n o n S ig n a l P r o c e s s i n g,2006,54(11):43114322.[12]王国栋,阳建宏,黎敏,等.基于自适应稀疏表示的宽带噪声去除算法[J ].仪器仪表学报,2011,32(8):18181823.W a n g G u o d o n g ,Y a n g J i a n h o n g ,L i M i n ,e t a l .W i d e b a n dn o i s er e m o v i n g a l g o r i t h m b a s e do na d a pt i v e s p a r s e r e pr e s e n t a t i o n [J ].C h i n e s eJ o u r n a l o fS c i e n t i f i c I n s t r u m e n t ,2011,32(8):18181823.(i nC h i n e s e)[13]丁康,黄志东,林慧斌.一种谱峭度和M o r l e t 小波的滚动轴承微弱故障诊断方法[J ].振动工程学报,2014,27(1):128134.D i n g K a n g ,H u a n g Z h i d o n g ,L i nH u i b i n .A w e a k f a u l t d i a g n o s i sm e t h o d f o r r o l l i n g e l e m e n t b e a r i n g sb a s e do n M o r l e tw a v e l e ta n ds pe c t r a lk u r t o s i s [J ].J o u r n a lof V i b r a t i o n E ng i n e e r i n g,2014,27(1):128134.(i nC h i n e s e)[14]R u b i n s t e i nR ,Z i b u l e v s k y M ,E l a dM.E f f i c i e n t i m p l e -m e n t a t i o n o f t h e K -S V D A l g o r i t h m u s i n g ba t c h o r t h o g o n a lm a t c h i n gp u r s u i t [J ].C S T e c h n i o n ,2008,40(8):115.(责任编辑:李兵)893北京理工大学学报第36卷。

计算机视觉中的数学方法

计算机视觉中的数学方法
吴福朝 编著
计算机视觉中的数学方法
内容简介
本书由射影几何、矩阵与张量、模型估计三个部分组成,它们是三维计算机视觉所涉及到 的基本数学理论与方法。I. 射影几何学是三维计算机视觉的数学理论基础,是从事计算机视觉 研究所必备的数学知识。本书着重介绍射影几何学和它在视觉中的应用,主要内容包括:平面 与空间射影几何,摄像机几何,两视点几何,自标定技术和三维重构理论。II. 矩阵与张量是描 述和解决计算机视觉问题的必要数学工具,视觉领域研究人员都应该掌握这门数学。本书着重 介绍与视觉有关的矩阵、张量理论与它的应用,主要内容包括:矩阵分解,矩阵分析,张量代 数,运动与结构,多视点张量。III. 模型估计是三维计算机视觉的基本问题,通常涉及到变换或 某种数学量的估计。本书着重介绍与视觉估计有关的数学理论与方法,主要内容包括:迭代优 化理论,参数估计理论,视觉估计的代数方法、几何方法、鲁棒方法和贝叶斯方法。上述三部 分涉及的数学内容是相对独立的,但三维计算机视觉将它们组成一个有机的整体。通过阅读本 书,读者能掌握三维计算机视觉中的基本数学内容与方法,增强数学素养、提高分析和解决视 觉问题的数学能力。
2பைடு நூலகம்
第6章
5.1.1 影消点与影消线--------------------------------------- 101 5.1.2 摄像机内参数----------------------------------------- 102 5.2 圆环点与摄像机内参数------------------------------------- 105 5.2.1 内参数约束方程--------------------------------------- 105 5.2.2 确定圆环点的图像------------------------------------- 105 5.2.3 圆环点与正交方向------------------------------------- 107 5.3 平行性与摄像机内参数------------------------------------- 108 5.3.1 平行四边形的射影------------------------------------- 108 5.3.2 平行六面体的射影------------------------------------- 111 5.3.2 摄像机内参数----------------------------------------- 113 5.4 Kruppa 方程与摄像机内参数--------------------------------- 117 5.4.1 Kruppa 方程------------------------------------------- 117 5.4.2 由 Kruppa 方程求焦距---------------------------------- 119 5.5 绝对二次曲线与摄像机内参数------------------------------- 121 5.5.1 基本约束方程----------------------------------------- 121 5.5.2 变化内参数------------------------------------------- 121 5.5.3 恒定内参数------------------------------------------- 122 5.5.4 尺度因子计算公式------------------------------------- 123 5.6 绝对二次曲面与摄像机内参数------------------------------- 125 5.6.1 基本约束方程----------------------------------------- 125 5.6.1 约束的等价性----------------------------------------- 126 三维重构理论 6.1 三角原理------------------------------------------------- 130 6.2 基本矩阵与射影重构--------------------------------------- 132 6.3 无穷远平面与仿射重构------------------------------------- 133 6.4 绝对二次曲线与度量重构----------------------------------- 135 6.5 绝对二次曲面与度量重构----------------------------------- 138 6.6 实现分层重构的实例--------------------------------------- 140 6.6.1 仿射点对应------------------------------------------- 141 6.6.2 准仿射重构------------------------------------------- 142 6.6.3 仿射重构--------------------------------------------- 143 6.6.4 度量重构--------------------------------------------- 146 6.7 多摄像机系统标定----------------------------------------- 147 6.7.1 一维标定物------------------------------------------- 147 6.7.2 确定仿射摄像机矩阵----------------------------------- 148 6.7.3 确定欧氏摄像机矩阵----------------------------------- 149

一种基于特征跟踪的图像稳定方法

一种基于特征跟踪的图像稳定方法

一种基于特征跟踪的图像稳定方法
朱玉文;王俊;贾云得
【期刊名称】《北京理工大学学报》
【年(卷),期】2003(23)5
【摘要】根据摄像机透视投影模型,通过提取特征点进行摄像机的运动估计,提出一种基于FMA(frame-to-mosaicalgorithm)的补偿方法.该方法针对图像连续帧间晃动幅度较大的情况,通过均值滤波合成当前帧及其前几帧的运动进行补偿.实验结果表明该方法有较好的稳定效果,而且能够做到实时处理.
【总页数】5页(P596-600)
【关键词】图像稳定;摄像机稳定;特征跟踪;运动估计;运动补偿
【作者】朱玉文;王俊;贾云得
【作者单位】北京理工大学信息科学技术学院计算机科学工程系
【正文语种】中文
【中图分类】TP391
【相关文献】
1.一种基于特征匹配的目标识别跟踪方法 [J], 赵高鹏;薄煜明;陈益
2.一种基于特征点匹配的目标跟踪方法 [J], 管学伟
3.一种基于特征跟踪的彩色序列图像拼接方法 [J], 沈项军;李峰;陈金华
4.一种基于特征光流检测的运动目标跟踪方法 [J], 李金宗;原磊;李冬冬
5.一种基于特征点稳定跟踪的三维注册方法 [J], 查晨东; 张雷; 袁博
因版权原因,仅展示原文概要,查看原文内容请购买。

摄像机沿光轴运动下的场景三维重建

摄像机沿光轴运动下的场景三维重建

摄像机沿光轴运动下的场景三维重建
裴明涛;贾云得
【期刊名称】《计算机辅助设计与图形学学报》
【年(卷),期】2005(017)003
【摘要】讨论了采用针孔摄像机进行摄像机沿光轴运动下的场景三维重建的方法.基于摄像机轴向运动的特点和性质,利用该方法找到图像间的缩放因子,进而解决了轴向运动下的特征匹配; 采用Sturm的摄像机自标定方法得到摄像机的内外参数;从而实现了摄像机沿光轴运动下的场景三维重建.
【总页数】6页(P534-539)
【作者】裴明涛;贾云得
【作者单位】北京理工大学计算机科学与工程系视觉与智能系统实验室,北
京,100081;北京理工大学计算机科学与工程系视觉与智能系统实验室,北京,100081【正文语种】中文
【中图分类】TP391.41
【相关文献】
1.基于简化摄像机自定标模型下的三维重建方法 [J], 胡明星;申军青;袁保宗
2.摄像机平行于场景运动且晃动下的视频修复 [J], 梁敏;王兆仲
3.非重叠场景下多摄像机车辆跟踪研究 [J], 邵建荃
4.基于多RGBD摄像机的动态场景实时三维重建系统 [J], 段勇;裴明涛
5.基于摄像机运动的简单虚拟场景生成 [J], 史迎春;周献中;丁泉;刘哲;王韬
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

′ 取F=1,即规范化透视 xk +1 = ′ ′ ′ rzx xk + rzy y k + rzz + t z / z k 投影,则有 ′ ′ ryx xk + ryy y k + ryz + t y / z k (15.13): ′ y k +1 = ′ ′ rzx xk + rzy y k + rzz + t z / z k
ryy = sinθ sinψ sinφ + cosθ cosφ ryz = cosθ sinψ sinφ − sinθ cosφ rzx = − sinψ rzy = sinθ cosψ rzz = cosθ cosψ
(式12.3)
15.1.1 正交投影模型
当物体深度变化范围不大时,透视投影是正交投 影,成象模型为正交投影,则x’=x y’=y 式(15.1) 可 表示为:
′ xk +1 = F ′ y k +1
rxx xk + rxy y k + rxz z k + t x xk +1 =F z k +1 rzx xk + rzy y k + rzz z k + t z
ryx xk + ryy y k + ryz z k + t y y k +1 =F =F z k +1 rzx xk + rzy y k + rzz z k + t z
min E − [T]× R
Rk 2
约束条件: R T R = I
det(R ) = 1
15.1.6 从外极线方程估计运动参数
一种直接方法:Longuet-Higgins准则
LH (R , T) =

i =0
n −1
~ ~ (m T.k +1 ⋅ (T × R m i , k )) 2 i
齐次坐标
•齐次线性方程(无解或有无穷解) 令基本矩阵E的一个系数为1,待估参数有8个。 •矩阵E是一个斜对称矩阵和一个旋转矩阵的乘积,矩阵E 的前三个性质构成三个约束方程,待估参数5个。
M T +1 ⋅ (Tk × R k M k ) = 0 k
平移量TK乘以任何不为零的系数都不影响方程成立,就 是说,当用同一个比例系数改变物体形状或运动平移量时, 所得到的图像完全一样。因此,从运动恢复形状和从图像序 列恢复运动参数,只能在关于一个比例系数的意义下进行。
3.重复上述两步,直到两次迭代值之差小于给定的某一个阈值。
当深度估计不准确或初始值不当,可能导致迭代错误收敛或收敛在一个局部最小值
算法15.2 基于两帧图像运动估计扰动迭代算法 扰动
1.初始化深度值{zi,k},置迭代计数器m=0。 xk +1 = xk − φy k + ψz k + t x ′ ′ ′ ′ ′ ′ 2.在给定深度值下根据式(15.6)估计运动参数 y k +1 = φxk + y k − θz k + t y 3.根据当前的运动估计和深度参数,由(15.6)计算对应点的坐标
~ λm k
在第k+1帧图像平面上的投影是
~ λRm k + T 称为外极线
极点(epipole):对应第k帧图像光学中心在第k+1帧图像 极点 平面上的投影。e k +1 = T
~ e k +1 × m k +1,∞ = T × Rm k 外极线方程:
外极线方程分析
•未知参数9个,
~ T Em = 0 ~ m k +1 k
′ ′ m k +1 = ( xk +1 , y k +1 )T
~ ′ ′ m k = ( xk , y k ,1)T
物体点在第k帧和第k+1帧上的投影点坐标,齐次坐标
~ T Em = 0 m k +1 ~ k
~ ′ ′ m k +1 = ( xk +1 , y k +1 ,1)T
几何意义
射线上任 何一点可 以表示为
物体上一个参考点,其深度值为Zref,则物体上 任意一点的关于一个尺度系数深度值可以表示为
z = z ref + αz rel
′ ′ ′ xk +1 = xk +1 = rxx xk + rxy y k + (rxz z k + t x ) ′ ′ ′ y k +1 = y k +1 = ryx xk + ryy y k + (ryz z k + t y )
15.1.5 从基本矩阵估计运动参数
(1)估计基本矩阵 基本矩阵只有5个未知独立参数,5-点算
法来求解,解很不稳定;应选取8个以上的对应点通过最小二乘 法来求解。将基本矩阵E表示为:
⎛ e00 ⎜ E = ⎜ e10 ⎜e ⎝ 20
e01 e11 e21
e02 ⎞ ⎟ e12 ⎟ ( xk +1 ′ e22 ⎟ ⎠
算法15.1 基于两帧图像的运动估计两步迭代算法
1. 给定n个对应点坐标对和深度估计值
{( xi′, k , yi′, k )} {( xi′, k +1 , yi′, k +1 )}
{z i ,k }
i=1,2,…n,且n≥3,这样方程(15.6)可重新写为(15.7)
′ ′ ⎛ x k +1 − x k ⎞ ⎛ 0 ⎜ ⎟ ⎜ ⎜ y′ − y′ ⎟ = ⎜ − z k ⎠ k ⎝ k +1 ⎝ zk 0 ′ − yk ′ xk 1 0 ⎛θ ⎞ ⎜ ⎟ ⎜ψ ⎟ 0 ⎞⎜ ⎟ ⎟ φ 1 ⎟⎜ ⎟ ⎠⎜ t ⎟ x ⎜ ⎟ ⎜ty ⎟ ⎝ ⎠
6.给深度参数赋一个扰动值
(m) zi,k

( m −1) zi,k
∂ei (m) + α∆ i −β ∂z
其中α和β是常系数,∆i(m)=Ni(0,σ2(m))是零均值高斯分布 函数,其方差σ2(m)=e2。
7.回到第2步
实验证明,这种改进的迭代算法在初始深 度值有50%的误差的情况下,也能很好地收 敛到正确的运动参数值。
(15.6)
• 6个未知参数,其中5个是全局运动参数,一个是深度 参数。 • 理论上给定三点就可以根据(15.6)列出6个方程,从而 解出六个未知参数。但实际上,由于数值计算误差, 常常需要多个点, • 基于上述正交投影模型有基于两帧图象的两步迭代 法:首先,根据上一次迭代得到的深度估计值,确定 运动参数,然后再使用新的运动参数更新深度估计 值。
rxz和ryz缩小α,zk放大α,方程仍然成立,因此产 生多义性。三帧或三帧以上图象上的四点就可以克服 这个问题。
15.1.2 基于正交投影的运动估计
将(15.2)小角度旋转矩阵代入(15.1),得到如下的正交投 影模型:
′ ′ ′ xk +1 = xk − φy k + ψz k + t x ′ ′ ′ y k +1 = φxk + y k − θz k + t y
′ y k +1
′ ⎛ xk ⎞ ⎜ ⎟ ′ 1)E⎜ y k ⎟ = 0 ⎜1⎟ ⎝ ⎠
外极线 方程
⎛ e00 ⎞ ⎜ ⎟ ⎜ e01 ⎟ ⎜e ⎟ ⎜ 02 ⎟ ⎜ e10 ⎟ ⎜ ⎟ e11 ⎟ = 0 ⎜ ⎜ e12 ⎟ ⎜ ⎟ e 20 ⎟ ⎜ ⎜e ⎟ ⎜ 21 ⎟ ⎜ 1 ⎟ ⎝ ⎠
′ ′ (x k +1 x k
′ ′ rxx xk + rxy y k + rxz + t x / z k
15.1.4 外极线方程和基本矩阵
将三维刚体运动模 型方程15.1缩写为
两步迭代往往不收敛
M k +1 = R k M k + Tk
M T +1 ⋅ (Tk × R k M k ) = 0 k M 令:E = T × R 则: k +1EM k = 0
(15.1)
用欧拉角的形式表示,并假定旋转角 较小,则旋转矩阵可以表示为
rxx = cosψ cosφ rxy = sinθ sinψ cosφ − cosθ sinφ rxz = cosθ sinψ cosφ + sinθ sinφ ryx = cosψ sinφ
• 其中θ,ϕ,φ分别表示绕 x,y,z 轴逆时针旋转小 角位移
′ ′ ′ xk +1 = xk +1 = rxx xk + rxy y k + (rxz z k + t x )
′ ′ ′ y k +1 = y k +1 = ryx xk + ryy y k + (ryz z k + t y )
上述方程有6个参数,表示第k帧图象像素到第k+1 帧的仿射映射关系。 正交投影模型是无法确定物体点到成象平面的距 离,因为垂直于图像平面的一条直线,其上的所有 点都将投影到该图象平面上一点.
T
⎛ 0 ⎜ 引 [T]× = ⎜ t z ⎜ 入: ⎜−ty ⎝
− tz 0 tx
ty ⎞ ⎟ − tx ⎟ ⎟ 0 ⎟ ⎠
E = [T]× R
E是一个3×3矩阵,称为基本矩阵,矩 阵元素称为基本参数。
x k +1 用zk zk+1除以等式的两边得 ( z k +1
M T +1EM k = 0 k
⎛ xk +1 ⎞ ⎡ rxx ⎜ ⎟ ⎢ ⎜ y k +1 ⎟ = ⎢ryx ⎜ z ⎟ ⎢r ⎝ k +1 ⎠ ⎣ zx rxy ryy rzy rxz ⎤⎛ xk ⎞ ⎛ t x ⎞ ⎛ xk ⎞ ⎜ ⎟ ⎥⎜ ⎟ ⎜ ⎟ ryz ⎥⎜ y k ⎟ + ⎜ t y ⎟ = R k ⎜ y k ⎟ + Tk ⎜z ⎟ rzz ⎥⎜ z k ⎟ ⎜ t z ⎟ ⎝k +1 y k
相关文档
最新文档