加速鲁棒特征(surf)

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

本科毕业设计

英文翻译

专业名称信息工程

学生姓名周航远

指导教师赵春晖

完成时间 2010.5

本科毕业设计英文翻译

指导教师评阅意见

学生姓名：班级：得分：

加速鲁棒特征（SURF）

Herbert Bay , Andreas Ess , Tinne Tuytelaars ,和 Luc Van Gool 摘要

本文提出了一种新颖的刻度旋转不变的检测器和描述器。创造了SURF（加速鲁棒性特征）。SURF甚至比以前被推荐的方案更具可重复性、特异性和鲁棒性，在计算和比较速度上也快很多。

这是通过以下方法完成的：依赖于积分图像的图像卷积、建立在目前先进的探测器和描述器（特别是采用了Hessian矩阵方法的探测器和基于分布的描述器）的基础上、简化了这些手段使之更有效。这产生了新颖的探测、描述和匹配步骤的结合。

这篇文章包含了对探测器、描述器探测最重要参数的影响的详细描述。我们推测这篇关于SURF的应用面临两个挑战，虽然它们是相反的：图像配准中的相机矫正以及目标识别。我们的实验强调了SURF在一系列计算机视觉研究中的有效性。

关键词：兴趣点，局部特征，特征描述相机矫正目标识别

1、引言

找出同一场景或物体的两张图像的对应点的工作是很多计算机视觉应用的一部分。图像配准，相机矫正，目标识别以及图像检测只是很少的一部分。

寻找离散图像点的对应点可分为三大步骤。第一，在图像中的特殊位置选择“兴趣点”，比如角落、斑点、T形结合处。一个兴趣点探测器最有价值的特性是它的重复性。重复性是一个探测器在不同可视条件下寻找同一个物理兴趣点的可靠性的表示。第二，每个兴趣点的关系用一个特征向量表示。这种描述器非常与众不同。在相同时间对噪声、探测器位移及几何和光学上的形变具有很好的鲁棒性。最后，对不同图像的描述器进行向量匹配。进行这种匹配时给予矢量间的距离，例如马氏距离或欧氏距离。描述器的维度对时间有影响，所以用较少的维度才有更快的兴趣点匹配。然而，低维度特征向量在总体上与高维度相比区分度还是较差的。

把探测器和描述器合二为一已成为我们的目标。相比最先进的方式，它需要更快比较而又不牺牲性能。寻找一个既能简化探测方案又能保持准确性的平衡点

以及在保证充分的特异性的基础上减小描述器的尺度是我们成功的关键。

很多文献中大量的探测器和描述器已经被提出。同时，详细的比较和评估数据集已经开始执行。我们的快速探测器和描述器SURF（加速鲁棒特征）在其他文献中介绍过。它是建立在前期工作所增加的洞察力的基础上的。在我们对这些标准数据集的实验中，SURF的探测器和描述器不仅更快，而且它的可重复性更高，区分度更明显。

我们关注在尺度上和面内的旋转不变的探测器和描述器。这些似乎在特种通常发生的形变的复杂性和鲁棒性之间做了很好的平衡。另外，各向异性的缩放和每个特殊效果被认为是二阶效应，即覆盖在一定程度上的整体稳健描述器。需要注意的是描述器可以通过仿射正常化椭圆形这一手段扩展到仿射不变区域，虽然这会影响计算时间。在另一方面，扩大探测器并不是那么简单。关于光度变形，我们假设一个简单的线性模型的偏差（补偿）和对比度变化（比例系数）。不管是探测器还是描述器都运用了颜色信息。

在第三节中，我们描述了快速鲁棒的兴趣点检测上的应用策略。输入图像分析了不同尺度，以保证尺度不变性。在第四节中检测到的兴趣点提供了一个旋转和尺度不变的描述。此外，我们还对与周边的兴趣点对比的基础上提出了一个简单而有效的第一线索引技术。

2.相关工作

2.1兴趣点检测

最广泛使用的探测器可能是Harris角检测器，可以追溯到1988年。它是基于二阶矩矩阵的特征值。不过，Harris角落不是尺度不变的。Lindeberg引入了自动规模选择的概念。这可以判断图像中的兴趣点每个都有自己的特征尺度。他同时与试验的Hessian矩阵以及Laplace（对应到跟踪的Hessian矩阵）来检测斑点状结构的决定因素。Mikolajczyk和Schmid运用这种方法，创造了高重复性的鲁棒和规模不变的特征探测器。他们被称为Harris-Laplace和Hessian-Laplace。他们用（规模改变）Harris措施或Hessian矩阵行列式的选择位置，以及拉普拉斯算子选择规模。在高速对焦中，Lowe运用高斯滤波差异（DoG）提出了高斯算法的拉普拉斯算子（LoG）。

另外几种尺度不变的兴趣点检测器也有人提出过。比如由Kadir和Brady

提出的通过放大区域熵突出区域特征。以及Jurie和Schmid提出的基于边缘区域的检测器。但它们似乎不太适合进行加速。也有几个仿射不变特征探测器已经提出，可以应付更广泛的视角的变化。不过，这已经超出了本文的范围之内。

从现有的探测器研究和已发布的比较，我们可以得出结论，基于Hessian 的探测器比基于Harris的更加稳定、重复性更高。此外，利用Hessian矩阵的行列式，而不是它的痕迹（拉普拉斯算子）更好，因为它更少考虑冗长的局部的结构。我们还观察到近似像高斯滤波差异能在尽量不牺牲准确性的前提下提高速度。

2.2兴趣点描述

更大量的特征点描述已被提出，如高斯衍生物，不变量，复杂特征，可操纵过滤器，相位的本地特征，和描述符代表内的兴趣点附近分布的小尺度特征。后者由Lowe介绍，已被证明优于其他。这可以解释为他们获取了关于空间强度模式大量信息，但同时被鲁棒的小变形或ocalisation误差时间。文献描述，简称筛选，面向计算的本地兴趣点周围的梯度直方图存储在128维向量集（8个方向4 × 4的位置方向集）。

在实际应用中SIFT描述似乎仍然是最引人瞩目的。因此也是目前应用最为广泛的。它很独特，也相对较快。这是网络应用最为关键的。最近实施现场可编程门阵列（FPGA）的筛选和[37]提高了一个数量级的速度。与此同时， Grabner 等也用积分图像来近似SIFT。它们的探测步骤是建立在平均值差异的基础上（不进行插值）对整体直方图进行描述的。他们获得的速度和我们大致相同，但和SIFT相比，他们牺牲了质量。对于网络应用所涉及的普通电脑，这三个步骤（探测、描述、匹配）必须更快。

整个身体的工作正在逐步加快匹配可用。他们为近似匹配付出了代价。方法包括最好的首先由Lowe , balltrees, 词汇树，地点敏感散列，或多余的位向量提出。为了配合这一点，我们建议的Hessian矩阵的使用跟踪，大大提高匹配速度。再加上描述的低维，任何匹配的算法，势必加快了速度。

2.3.兴趣点检测

我们的兴趣点检测方法使用了一个非常基本Hessian矩阵逼近。这使它更适用于积分图像，大大减少了计算时间，因此更受欢迎。Simard等人提出的积分