单目视觉定位中SURF算法参数的优化
机器视觉中基于SURF算法的目标识别研究
机器视觉中基于SURF算法的目标识别研究第一章:引言随着计算机技术的不断发展,机器视觉技术逐渐应用于各种领域。
其中,目标识别是机器视觉技术的重要应用之一,可以在自动控制、工业制造、军事等领域中发挥重要作用。
在目标识别中,特征点检测和匹配是关键技术。
SURF算法是一种快速有效的特征点检测和匹配算法,已经得到广泛应用。
本文将介绍机器视觉中基于SURF算法的目标识别研究,具体包括SURF算法原理、SURF算法在目标识别中的应用及其优劣势分析、SURF算法在实际系统中的应用及其发展趋势等。
第二章:SURF算法原理SURF算法是加速稳健特征(Speeded Up Robust Feature)的缩写。
它是基于尺度空间理论的特征点检测和匹配算法。
SURF算法主要包括三个步骤:尺度空间构建、特征点检测和特征描述。
尺度空间构建是指先将原始图像进行高斯滤波,得到不同尺度下的图像金字塔,然后通过差分的方式得到尺度不变的DoG (Difference of Gaussian)图像组。
特征点检测是指在DoG图像组中检测出极值点,SURF算法中采用的是Hessian矩阵。
特征描述是指在检测到的特征点周围的邻域内,计算一组具有较强区分度的局部特征描述子,SURF算法中采用的是基于积分图像的Haar小波特征描述子。
第三章:SURF算法在目标识别中的应用及其优劣势分析SURF算法在目标识别中的应用主要包括两个方面:特征点检测和匹配。
特征点检测是指在图像中寻找具有独特性、稳定性和可重复性的特征点,SURF算法对尺度空间建立和特征点检测都有良好的性能,能够有效地检测到目标物体中的关键点。
匹配是指在两个图像中寻找相似的特征点,SURF算法具有较高的匹配准确率和速度,能够实现快速准确地目标匹配。
但是,SURF算法也存在一些不足之处,比如对图像旋转、缩放、变形等变化不够鲁棒,需要额外的操作来进行补偿。
第四章:SURF算法在实际系统中的应用及其发展趋势SURF算法在实际系统中的应用非常广泛,例如在工业机器人、自动驾驶、安防监控等领域中都得到了应用。
改进SURF算法的特征提取与匹配方法研究
改进SURF算法的特征提取与匹配方法研究
赵腾飞;辛大欣;华瑾
【期刊名称】《机械与电子》
【年(卷),期】2017(035)009
【摘要】针对门把手图像特征点提取与匹配对快速性和准确性的要求,提出一种改进SURF算法.该算法主要对图像较平滑区域难以提取出大量信息点的问题进行改进.增加了边缘检测算法,得到图像边缘信息后进行形态学处理,并通过膨胀运算和开运算后获得门把手图像边缘区域信息并提取出关键点,进而获得较多特征明显的信息.改进SURF算法和原始SURF算法相比,在平滑区域能够较好提取出特征点,匹配准确率也有明显的提升,并且增强了算法的实时性.
【总页数】4页(P77-80)
【作者】赵腾飞;辛大欣;华瑾
【作者单位】西安工业大学电子信息工程学院,陕西西安710021;西安工业大学电子信息工程学院,陕西西安710021;西安工业大学电子信息工程学院,陕西西安710021
【正文语种】中文
【中图分类】TP39
【相关文献】
1.基于改进SURF算法的工件图像特征匹配 [J], 张强;韩松奇;于微波
2.基于SURF算法的无坐标矿山空间位置匹配方法研究 [J], 杨雪
3.基于SURF算法的绿色作物特征提取与图像匹配方法 [J], 张志斌;赵帅领;罗锡文;魏凤岐
4.改进的SURF算法在图像匹配中的应用 [J], 黄春凤; 刘守山; 别治峰; 许广会
5.基于ROI提取和改进SURF算法的图像匹配方法研究 [J], 田杰;徐忠民
因版权原因,仅展示原文概要,查看原文内容请购买。
SURF算法在小尺寸图像拼接中参数配置的优化
SURF算法在小尺寸图像拼接中参数配置的优化周宇浩崴;应忍冬;蒋乐天【摘要】在图像拼接领域,SURF算法因其出众的时效性和鲁棒性,有着十分广泛的应用。
针对SURF算法中特征点提取和描述过程中参数固定,对侧重点不同的图像拼接应用存在变通性较差的问题,提出了从窗口滤波器权值,特征点周围子区域的选择以及子区域内Haar小波变换的采样点范围三方面进行参数配置优化。
针对目前主流的流媒体尺寸图像,利用控制变量法在不同的SURF参数配置下,对算法的时效性、准确性和鲁棒性等性能进行了分析;通过特征点匹配率和特征点匹配效率的比较,给出了SURF算法参数的选择策略。
仿真结果表明该策略可以有效提高SURF算法在图像拼接中的运算速度和准确性,丰富算法在实时领域的应用。
%In the field of image stitching, SURF algorithm is widely used for its excellent real-time procedure and robust. Due to the fixed parameter settings in interest point detection and description, the adjustability of SURF algorithm to different applying situation is relatively weak. In order to improve the range of SURF application, this paper looks into three aspects in the algorithm:the weight of box filter, the sub-region selection and the Haar wavelet sampling point range within the sub-region. In comparing the real-time quality, the stitching accuracy and the robust quality of the algorithm, the experiments using variable control method propose a parameter setting strategy based on small scale image which is widely used in nowadays stream media. In analyzing the interest points match rate and efficiency, the strategies proposed in characterizing the algorithm can extend the use of SURF in real-time field.【期刊名称】《计算机工程与应用》【年(卷),期】2013(000)019【总页数】5页(P191-195)【关键词】加速鲁棒特征(SURF)算法;图像拼接;小尺寸图像;参数配置;特征点匹配;窗口滤波器;特征点子区域【作者】周宇浩崴;应忍冬;蒋乐天【作者单位】上海交通大学电子工程系,上海200240;上海交通大学电子工程系,上海 200240;上海交通大学电子工程系,上海 200240【正文语种】中文【中图分类】TP391图像拼接分为直接拼接和融合技术,在目前融合技术中主要分为基于灰度信息和基于特征信息两种模式。
改进SURF算法在图像汉字识别中的应用
改进SURF算法在图像汉字识别中的应用孟伟;钟娜【摘要】针对复杂背景下汉字匹配准确率较低的问题,提出一种改进的SURF算法。
该算法利用灰度分级的字符分割方法,先进行灰度分割增强图像的对比度,采用灰度分级树将图像中的所有像素处理为树的模式进行计算,根据灰度分级确定主节点,根据主节点的级别所对应的灰度值对图像进行分割。
同时,根据汉字结构的特殊性,取消了SURF算法的旋转不变性。
实验结果表明,与未使用改进的SURF 算法相比,对图像质量较差的文本图像,改进的SURF算法能有效地提高其匹配的准确率。
%Aiming at the low matching accuracy of Chinese characters, an improved algorithm of SURF is presented. The algorithm is based on gradation character segmentation. Contrast of image is enhanced by using gray level segmentation, and then with the gray level classification tree, all pixels in the image are processed to the tree model. According to the gray level classification, the main node is determined. Grey level corresponding to the main node level is used in image segmentation. According to the particularity of Chinese characters, the rotation invariance of SURF algorithm is cancelled. Experimental results show that the improved algorithm can improve the matching accuracy effectively, especially for text image of poor quality.【期刊名称】《计算机工程与应用》【年(卷),期】2015(000)012【总页数】5页(P156-160)【关键词】复杂背景;汉字匹配;快速鲁棒特征(SURF)算法;灰度分级;字符分割【作者】孟伟;钟娜【作者单位】北京林业大学信息学院,北京 100083;北京首钢自动化信息技术有限公司,北京 100043【正文语种】中文【中图分类】TP3911 引言近年来,汉字识别一直是模式识别等相关领域内长期的研究热点[1]。
surf算法代码 -回复
surf算法代码-回复什么是Surf算法Surf算法(Speeded Up Robust Features)是一种用于图像特征检测和描述的计算机视觉算法。
它是在2006年由Herbert Bay等人提出的,旨在提高图像处理中的特征点检测与匹配的速度和准确性。
Surf算法在计算机视觉和图像处理领域中得到广泛应用,它的主要目标是在图像中找到稳定且唯一的局部特征点。
Surf算法的步骤1. 尺度空间构建:Surf算法在图像中使用多尺度空间来有效地检测特征点。
它通过不断模糊图像,并计算模糊后的图像与原始图像的差异来构建多尺度空间。
算法使用一个高斯滤波器来进行图像模糊,并通过逐渐增加滤波器的方差来构建不同尺度下的图像。
这样做的目的是使得算法能够在不同尺度下检测到特征点,而不受图像缩放的影响。
2. 关键点检测:在构建好尺度空间后,Surf算法会在每个尺度中检测关键点。
关键点是那些在图像中具有稳定尺度和位置,并且对缩放、旋转和光照变化具有不变性的点。
Surf算法使用Hessian矩阵来检测关键点。
Hessian矩阵是一个用于测量图像局部变化的矩阵,在Surf算法中,它被用来检测图像中的高强度点。
3. 关键点定位:在检测到关键点后,Surf算法会对关键点进行精确定位。
它使用一个Haar 小波响应来定位关键点的位置和方向。
Haar小波是一种多尺度基函数,它能够识别出图像中的边缘和纹理特征。
Surf算法利用Haar小波响应来定位出关键点的具体位置和方向,以便后续的特征描述步骤。
4. 特征描述:在完成关键点定位后,Surf算法会对每个关键点进行描述,以便后续的特征匹配。
Surf算法使用了一种叫做加速权重积分(Fast Hessian)的方法来生成特征描述子。
特征描述子是一个向量,它能够描述关键点周围区域的结构和纹理信息。
Surf算法会通过计算关键点周围区域的灰度变化来生成特征描述子。
5. 特征点匹配:在完成特征描述后,Surf算法会使用一种叫做KD树的数据结构来进行特征点的匹配。
SURF算法在图像处理中的应用
SURF算法在图像处理中的应用SURF算法是一种被广泛应用于计算机视觉领域的算法,其全称是Speeded Up Robust Features。
它是一种特征提取算法,可以在图像中检测出具有特殊性质的关键点,并生成具有鲁棒性的特征描述子。
这些特征可以用于识别相似的图像,比较相似度,并在图像配准、图像跟踪、三维重建等领域中发挥重要作用。
本文将探讨SURF算法在图像处理中的应用。
一、 SURF算法的原理SURF算法是基于SIFT算法的一种改进,它的主要优势在于速度更快、鲁棒性更强。
下面简单介绍SURF算法的原理。
1. 尺度空间构建SURF算法首先对原始图像进行尺度变换,通过高斯金字塔来构建尺度空间。
尺度空间的不同层次可以检测到不同大小的特征。
通过不同层次检测的关键点可以估计出原始图像中的关键点,这个过程被称为尺度空间极值点检测。
2. 关键点定位在尺度空间中,SURF算法通过Hessian矩阵的行列式求解得到图像局部极值点位置,这些点是具有高强度、对光照变化鲁棒等性质的关键点。
3. 方向确定为了使SURF算法对旋转和光照变化更加鲁棒,需要为每个关键点确定一个主方向,这个方向是在关键点周围采用Hessian矩阵主方向确定的。
4. 特征描述为了描述关键点的局部特征,SURF算法使用了一种统计学上的方法,即将关键点周围的区域分解成小的子区域,每个子区域在水平和竖直方向上计算Haar小波变换,形成特征向量。
这些特征向量组成的特征描述子具有鲁棒性,可以用来评估关键点的稳定性。
5. 特征匹配在进行图像匹配时,SURF算法使用了一种快速的近似最近邻搜索方法,称为快速最近邻搜索(FLANN)。
它可以在大规模的特征库中快速找到与查询特征最相似的特征。
二、 SURF算法可以被广泛应用于图像处理中,下面介绍一些应用领域。
1. 图像配准SURF算法可以被用来匹配两幅图像之间的关键点,通过计算两幅图像中关键点的相似度来实现图像配准。
基于SURF算法的单目转双目视觉定位
i ma g e f e a t u r e p o i n t e x t r a c t i o n a n d ma t c h i n g i n t h e p r o c e s s o f o b j e c t t a r g e t r e c o g n i t i o n a n d l o c a t i n g . T h e e x p e r i me n t a l
r e s ul t i n d i c a t e s ,t he me t ho d o f mo n o c u l a r t o r e a l i s e b i n o c ul a r v i s u a l po s i t i o n i n g b a s e d o n S UR F a l g o r i t h m,bo t h i n
其 系 统结 构 简 单,造 价 较低 ,具有 一 定 的现 实 意义 .
通过摄 像机 获取 的图像 相对于真实物 体往往有缩放 、
旋转 以及遮挡 的变化 , 这 就需要对 图像进行特 征 匹配
目立 体视觉 作为机器 视觉 的一 种,是近年来 研究 的热 点方 向之 ~.该视 觉系统 模拟 人眼,利 用成像 设备 获
关键词 :提取;匹配
Mo no c u l a r t o Re a l i z e Bi no c u l a r Vi s u a l Po s i t i o n i n g Ba s e d o n SURF Al g o r i t h m
SURF算法
SURF算法⼀、原理:Sift算法的优点是特征稳定,对旋转、尺度变换、亮度保持不变性,对视⾓变换、噪声也有⼀定程度的稳定性;缺点是实时性不⾼,并且对于边缘光滑⽬标的特征点提取能⼒较弱。
Surf(Speeded Up Robust Features)改进了特征的提取和描述⽅式,⽤⼀种更为⾼效的⽅式完成特征的提取和描述。
⼆、Surf实现流程如下:1. 构建Hessian(⿊塞矩阵),⽣成所有的兴趣点,⽤于特征的提取⿊塞矩阵(Hessian Matrix)是⼀个多元函数的⼆阶偏导数构成的⽅阵,描述了函数的局部曲率。
由德国数学家Ludwin Otto Hessian于19世纪提出。
surf构造的⾦字塔图像与sift有很⼤不同,Sift采⽤的是DOG图像,⽽surf采⽤的是Hessian矩阵⾏列式近似值图像。
Hessian矩阵是Surf算法的核⼼,构建Hessian矩阵的⽬的是为了⽣成图像稳定的边缘点(突变点),为下⽂的特征提取做好基础。
每⼀个像素点都可以求出⼀个Hessian矩阵。
Hessian矩阵的判别式为:当Hessian矩阵的判别式取得局部极⼤值时,判定当前点是⽐周围邻域内其他点更亮或更暗的点,由此来定位关键点的位置。
在SURF算法中,图像像素l(x,y)即为函数值f(x,y)。
但是由于我们的特征点需要具备尺度⽆关性,所以在进⾏Hessian矩阵构造前,需要对其进⾏⾼斯滤波,选⽤⼆阶标准⾼斯函数作为滤波器。
H矩阵的三个矩阵元素L_xx, L_xy, L_yy从⽽计算出H矩阵:Surf使⽤了盒式滤波器来近似替代⾼斯滤波器,提⾼运算速度。
盒式滤波器(Boxfilter)对图像的滤波转化成计算图像上不同区域间像素和的加减运算问题,只需要简单⼏次查找积分图就可以完成。
每个像素的Hessian矩阵⾏列式的近似值:2. 构建尺度空间同Sift⼀样,Surf的尺度空间也是由O组L层组成,不同的是,Sift中下⼀组图像的尺⼨是上⼀组的⼀半,同⼀组间图像尺⼨⼀样,但是所使⽤的⾼斯模糊系数逐渐增⼤;⽽在Surf中,不同组间图像的尺⼨都是⼀致的,但不同组间使⽤的盒式滤波器的模板尺⼨逐渐增⼤,同⼀组间不同层间使⽤相同尺⼨的滤波器,但是滤波器的模糊系数逐渐增⼤。
视觉定位的关键参数
视觉定位的关键参数一、视觉特征提取视觉定位的第一个关键参数是视觉特征。
视觉特征是从图像中提取出来的一些能够代表图像内容的信息,例如边缘、角点、纹理等。
常用的视觉特征提取算法包括SIFT、SURF和ORB等。
这些算法可以通过对图像进行滤波、边缘检测和兴趣点提取等操作,得到一组稳定的特征点。
二、特征匹配与跟踪特征匹配与跟踪是视觉定位的第二个关键参数。
在视觉定位中,需要将当前图像中提取的特征点与参考图像中的特征点进行匹配,从而确定当前图像在参考图像中的位置。
常用的特征匹配算法有FLANN、RANSAC等。
这些算法可以通过计算特征点之间的距离和相似度,找到最佳的匹配点,并通过随机采样一致性算法来排除错误匹配。
三、相机内外参数校准相机内外参数校准是视觉定位的第三个关键参数。
相机内参数是指相机自身的参数,例如焦距、畸变系数等;相机外参数是指相机在世界坐标系中的位置和朝向。
在视觉定位中,需要对相机的内外参数进行准确的校准,以保证定位的精确性。
常用的相机校准算法有张正友标定法和Tsai标定法等。
四、地图构建与更新地图构建与更新是视觉定位的第四个关键参数。
在视觉定位中,需要建立一个参考地图,用于对当前图像进行位置估计。
地图可以通过激光雷达、摄像头和惯性导航等多种传感器进行构建。
同时,随着环境的变化,地图也需要进行更新,以适应位置变化和新的特征点。
五、定位算法与优化定位算法与优化是视觉定位的第五个关键参数。
在视觉定位中,需要根据特征匹配结果和地图信息,计算当前图像在世界坐标系中的位置和方向。
常用的定位算法有基于特征匹配的PnP算法、基于滤波器的扩展卡尔曼滤波算法等。
同时,为了提高定位的精度和鲁棒性,还可以采用优化算法,例如非线性最小二乘法和粒子滤波器等。
六、实时性与鲁棒性实时性与鲁棒性是视觉定位的最后两个关键参数。
在实际应用中,视觉定位需要具备较高的实时性,即能够在短时间内完成图像处理和定位计算。
同时,视觉定位还需要具备较好的鲁棒性,即能够在复杂环境中稳定地进行定位。
视觉定位系统的精度优化方法分析
视觉定位系统的精度优化方法分析视觉定位系统是一种通过摄像机感知环境来确定位置和姿态的技术。
它在许多领域得到广泛应用,例如无人驾驶、机器人导航和增强现实等。
视觉定位系统的主要目标是提高定位的精度和稳定性,以便实现准确的位置感知和导航。
在视觉定位系统中,精度优化是关键的挑战之一。
下面将介绍几种常用的视觉定位系统精度优化方法。
1. 特征提取与匹配:特征提取是视觉定位系统的基础。
通过提取场景中的关键特征点(如角点、边缘等),可以更好地描述环境,并在后续的定位过程中进行匹配。
在特征匹配过程中,通常使用描述子(如SIFT、SURF、ORB等)来计算特征点的特征向量,并利用特征向量进行匹配。
为了提高匹配的准确性和鲁棒性,可以使用一些优化方法,如基于关系图的匹配算法、RANSAC算法等。
2. 路标选择与辨识:路标是视觉定位系统中的重要参考,它们可以提供可靠的地标信息用于定位。
在路标选择过程中,可以考虑一些关键因素,如特征的可靠性、视野范围内的路标密度等。
为了辨识路标,可以使用基于几何形状或视觉特征的方法进行识别。
例如,可以使用模板匹配、图像分割和机器学习等方法来识别和辨别路标。
3. 姿态估计与滤波:姿态估计是视觉定位系统中关键的一步,它用于确定相机的旋转和平移矩阵,从而获得准确的位置信息。
姿态估计可以通过解决外点问题来实现,即使用多个匹配点来计算旋转矩阵,并使用RANSAC算法剔除外点。
为了提高估计的稳定性和精度,可以采用滤波算法,如卡尔曼滤波、扩展卡尔曼滤波等。
4. 外部信息融合:除了摄像机的视觉信息外,还可以引入其他传感器的数据来提高定位的精度。
例如,可以利用惯性测量单元(IMU)来提供陀螺仪和加速度计的数据,以补偿姿态估计中的漂移误差。
此外,还可以利用全球定位系统(GPS)来提供位置验证和校正。
通过将多个传感器的数据进行融合,可以有效地提高视觉定位系统的精度和鲁棒性。
5. 校准与精度评估:校准是保证视觉定位系统精度的关键。
surf算法学习心得(一)——算法原理
surf算法学习心得(一)——算法原理surf算法详解SURF学习笔记Speed-Up Robust Features(SURF)SURF 是一种尺度,旋转不变的detector和descriptor.最大的特点是快!在快的基础上保证性能(repeatability,distinctiveness 和robustness)。
SURF采用有效策略的主要有:1)积分图(用于对图像卷积)2)detector是基于Hessian矩阵,descriptor是基于分布的下面是SURF算法的具体实现:1.兴趣点检测SURF 对于兴趣点的检测是基于最基本的Hessian近似矩阵。
1.1积分图像(由于不会在这里编辑公式,直接截图了)PS:这里加一点自己的一点个人理解:关于矩形区域内像素点的求和应该是一种简单重复性运算,采用这种思路总体上提高了效率。
为什么这么说呢?假设一幅图片共有n个像素点,则计算n 个位置的积分图总共的加法运算有n-1次(注意:可不是次哦,要充分利用递推思想),将这些结果保存在一个跟原图对应的矩阵M中。
当需要计算图像中某个矩形区域内的所有像素之和是直接像查表一样,调出A,B,C,D四点的积分图值,简单的加减法(注意只需要三次哦)即可得到结果。
反之,如果采用naive的方式直接在原图像中的某个矩形区域内求和,你想想,总共可能的矩形组合有多少?!!且对于一幅图像n那是相当大啊,所以2那可是天文数字,而且这里面绝大部分的矩形有重叠,重叠意味着什么?在算求和的时候有重复性的工作,其实我们是可以有效的利用已经计算过的信息的。
这就是积分图法的内在思想:它实际上是先计算n个互不重叠(专业点说是不相交)的矩形区域内的像素点求和,充分利用这些值(已有值)计算未知值,有点类似递推的味道...这就完全避免了重复求和运算。
1.2 用于检测兴趣点的Hessian矩阵作者Herbert Bay利用Hessian矩阵来检测兴趣点,具体是用Hessian矩阵行列式的最大值标记斑状结构(blob-like structure)的位置。
surf算法原理
surf算法原理宝子们!今天咱们来唠唠这个超有趣的SURF算法原理呀。
SURF呢,它全名叫加速稳健特征(Speeded - Up Robust Features)。
这名字听起来就感觉很厉害的样子,就像一个超级英雄,有着加速的超能力,还特别稳健呢。
咱先说说这个算法为啥要被搞出来。
你想啊,在图像的世界里,有那么多图像,就像有好多好多不同的小世界一样。
我们有时候想在这些图像里找到一些特别的东西,比如说两张照片里相同的物体啦,或者是在一张很复杂的图像里找到我们感兴趣的部分。
要是靠人工去一点点找,那可不得累死人,而且效率超低。
所以呢,就有了像SURF这样的算法。
那SURF算法到底是咋工作的呢?这就像是一场奇妙的探险之旅。
它先得把图像变得有规律起来。
就好比把一个乱糟糟的房间先简单整理一下,这样才能更好地找东西。
它会构建图像的积分图像。
这个积分图像可不得了,就像是给图像做了一个快速索引一样。
比如说你想知道图像里某个小方块的像素总和,要是没有这个积分图像,你得一个一个像素加起来,那得多慢呀。
但是有了积分图像,就可以一下子算出来,就像开了挂一样。
然后呢,SURF算法要找图像里的那些关键点。
这些关键点就像是图像里的小明星,是很特别的存在。
它怎么找呢?它会用一种类似小探测器的东西,在图像里到处探测。
这个探测器可不是随便探测的哦,它是根据图像的一些特性来的。
比如说图像里有些地方的亮度变化很特别,就像在一片平地上突然有个小土坡一样,这种地方就很可能是关键点。
找到这些关键点之后呢,SURF算法还得给它们做个标记,就像给小明星们戴上专属的小名牌一样,这样以后才能准确地找到它们。
接下来呀,SURF算法要描述这些关键点。
这就好比是给每个小明星写个小传一样。
它会根据关键点周围的像素信息来描述。
比如说关键点周围的像素是怎么分布的呀,是像星星一样散开,还是像小团子一样聚在一起呢。
它会用一些数学的方法把这些信息变成一串数字,这串数字就是这个关键点的独特描述啦。
SURF算法
SURF算法SURF是一种尺度、旋转不变的detector和descriptor。
最大的特点是快!在快的基础上保证性能(repeatability,distinctiveness 和robustness)。
SURF采用有效策略的主要有:1)积分图像(用于对图像卷积)2)detector 是基于Hessian矩阵,descriptor是基于分布的。
下面是SURF算法的具体实现:1.兴趣点检测SURF对于兴趣点的检测是基于最基本的Hessian近似矩阵。
1.1积分图像1.2 用于检测兴趣点的Hessian矩阵中得到启发,采用了盒子型滤波器(box filter)对上面的滤波器进行近似。
盒子型滤波器见图1.3.再根据filter的大小做一个归一化。
这对于尺度不变性是有必要的。
有了前面的着一些准备工作,就可以对一幅图像I计算每个点的近似Hessian矩阵的行列式值,将这些值存储,备用!1.3尺度空间表示算法的尺度不变性主要靠不同尺度下寻找感兴趣点。
谈到不同尺度就不得不说‘金字塔’。
Lowe在其SIFT大作中是这样构造尺度空间的:对原图像不断地进行Gauss平滑+降采样。
得到金字塔图像后,又进一步得到了DOG图,边和斑状结构就是通过DOG图得到其在原图的位置。
SURF中的做法与SIFT是有所不同的。
SIFT算法在构造金字塔图层时Gauss滤波器大小不变,改变的是图像的大小;而SURF则恰恰相反:图像大小保持不变,改变的是滤波器的大小。
之所以这么做的目的考虑的主要目的还是效率问题(这样可以利用积分图有关的快速计算,用不同size的Mask进行卷积运算,复杂度是一样的,仅仅是三个加减法而已)。
而且,由于没有对图像进行降采样,所以不存在混叠现象。
与SIFT类似,SURF的尺度空间也是按组(Octaves)划分的。
每一个Octave 里是对输入图像用size不断增加的filter进行滤波后得到的一系列响应。
总的来说,一组包含了一个缩放因子。
一种基于SURF的图像配准改进算法_高素青
1. 1 特征点的快速检测 在S UR F 特征 点 描 述 符 的 形 成 过 程 中 需 要 花 费大量时间计算小波 , 为了提高算法效率 , 减少计算 算法在计算小波响应时做了相应改进 , 即在构 时间 , 先确定每一个特征点的主方 造特征点描述符之 前 , 然后计算其小波响应并形成特征点描述符 。 向, ( )框式滤波器尺寸确定 。 构造检测子首先要 1 通过设置的阶数和层数构建出块状响应序列 。 每个 块状响应都是以大小为阶数 × 层数的二维图像数组 结构实现的 。 每一个阶 — 层对可以确定一个滤波器 的尺寸 , 因此框式滤波器的尺寸 N 为 :
I m r o v e d a l o r i t h m o f i m a e r e i s t r a t i o n b a s e d o n S U R F p g g g
1 2 3 G A O S u i n X u n u n, C h e n x i a TAN HUANG q g , j g
第4期
等: 一种基于 S UR F 的图像配准改进算法 高素青 ,
3 7 3
) 描 述 算 子, 它对 S UR F( s e e d e d u r o b u s t f e a t u r e s - p p 图像平移、 旋 转、 缩 放 等 变 化 具 有 良 好 的 不 变 性. 并于2 进一步提高了 0 0 8年对该方法进行了完善, S I F T 算法的性能。 本文针对细节 丰 富 图 像 中 S UR F算法性能有 影响算法效率的问题, 提出了一种改进的 所下降, 匹配算法。改进的 S S UR F特征点提取、 UR F算法 以特征点 的 数 量 和 相 互 间 距 离 作 为 判 定 条 件, 可 为后 以得到数 量 适 当 且 分 布 相 对 均 匀 的 特 征 点, 续特征点 描 述 和 特 征 匹 配 阶 段 节 省 了 时 间, 提高 了匹 配 的 准 确 率。 同 时 在 特 征 点 匹 配 阶 段 利 用 H e s s i a n矩 阵 迹 的 正 负 性 提 高 了 特 征 点 匹 配 的 速 采 度。针对误 匹 配 影 响 图 像 拼 接 准 确 性 的 问 题, 用随机 采 样 算 法 ( 提 高 匹 配 的 精 确 度。 R AN S A C) 最后通过实验分析验证了本文算法的 合 理 性 和 有 效性。
改进的SURF特征提取与匹配算法
DOI:10.3969/j.issn.2095-509X.2018.11.014改进的SURF特征提取与匹配算法张晓宇ꎬ何文思ꎬ段红燕ꎬ魏松涛(兰州理工大学机电工程学院ꎬ甘肃兰州㊀730050)摘要:针对SURF图像匹配算法在求取特征点主方向阶段太过依赖局部区域像素梯度方向ꎬ造成找到的主方向不准确㊁误匹配率高的问题ꎬ提出一种改进的SURF匹配算法ꎮ首先ꎬ利用SURF提取出特征点的64维特征向量并构建描述子ꎻ然后ꎬ采用距离匹配测度和余弦相似度匹配测度相结合的方法进行特征点匹配ꎻ最后ꎬ使用改进的随机抽样一致算法ꎬ进一步提高匹配正确率ꎮ实验结果表明:图像在一定程度的旋转㊁缩放㊁模糊㊁光照和视角变化情况下ꎬ改进算法匹配正确率在94%以上ꎮ关键词:图像处理ꎻSURF算法ꎻ图像匹配ꎻ余弦相似度ꎻ随机抽样一致算法中图分类号:TP391.4㊀㊀㊀文献标识码:A㊀㊀㊀文章编号:2095-509X(2018)11-0058-05㊀㊀在机器视觉研究领域ꎬ图像匹配一直是其中重要的组成部分ꎮ匹配算法根据其思想可以分为两大类:基于区域匹配方法和基于特征匹配方法ꎬ其中基于特征的匹配方法有计算速度快㊁鲁棒性好和对图像变形不敏感等优点ꎬ是常用的匹配方法ꎮSIFT(scale-invariantfeaturetransform)[1]是最常用的特征点检测算法ꎬ对图片的平移㊁缩放㊁旋转等具有不变特性ꎬ然而SIFT算法在计算特征点描述子的时候对每个特征点都需要构建128维特征向量ꎬ这样就降低了运算速度ꎮWang和Bay等[2-3]提出的SURF(speededuprobustfeatures)算法ꎬ继承了SIFT的不变性ꎬ并在提取图像的特征点运算速度上比SIFT快3倍左右[4]ꎮ然而SURF算法在求取特征点主方向时受到局部区域像素梯度方向的影响ꎬ在匹配过程中仅使用欧氏距离作为评判标准ꎬ使得匹配产生较大误差ꎮ本文提出一种改进SURF算法ꎬ先利用余弦相似度进行二次匹配来去除伪特征点ꎬ再使用随机抽样一致算法(randomsampleconsensusꎬRANSAC)进一步降低误匹配率ꎮ1㊀SURF算法原理SURF是一种具有高效性和高鲁棒性的局部特征描述算法ꎬ其不仅对图像旋转㊁缩放具有极强的适应性ꎬ而且图像环境在光照变化㊁视角变化㊁仿射变换和噪声的情况下也能保持一定程度的稳定性[5]ꎮSURF特征匹配算法可以分为3个步骤:特征点检测㊁构建特征描述子和特征点匹配[6]ꎮ1.1㊀特征点检测特征点检测可分为3步:尺度空间极值点检测㊁精确定位极值点㊁选取特征点主方向ꎮ1.1.1㊀尺度空间极值点检测SURF算法利用Hessian矩阵H(xꎬσ)检测特征点[7]ꎬ每一个像素点都可以求出一个Hessian矩阵ꎬ其中x表示特征点的坐标ꎬσ表示尺度ꎮLxx(xꎬσ)是输入图像与高斯二阶微分∂2∂x2g(σ)的卷积ꎬg(σ)为高斯函数ꎬLxy(xꎬσ)㊁Lyy(xꎬσ)与Lxx(xꎬσ)的含义类似ꎮ然后滤波器选用二阶标准高斯函数ꎬ通过特定核间的卷积计算出二阶偏导数ꎬ从而计算出H矩阵ꎬ表达式如式(1)所示ꎮH(xꎬσ)=Lxx(xꎬσ)Lxy(xꎬσ)Lxy(xꎬσ)Lyy(xꎬσ)éëêêùûúú(1)由于图像中的特征点需要具备尺度无关性ꎬ所以先对特征点进行高斯滤波消除特征点的相关性ꎬ再进行Hessian的计算ꎮL(xꎬt)代表不同解析度下的图像ꎬ计算公式如式(2)㊁(3)所示ꎮL(xꎬt)=G(t) I(xꎬt)(2)G(t)=∂2g(t)∂x2(3)收稿日期:2017-06-11基金项目:国家自然科学基金资助项目(51665028)ꎻ甘肃省兰州市科技局基金项目(2015-RC-44)作者简介:张晓宇(1992 )ꎬ男ꎬ山西晋中人ꎬ兰州理工大学硕士研究生ꎬ主要研究方向为数字图像处理ꎮ85 2018年11月㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀机械设计与制造工程㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀Nov.2018第47卷第11期㊀㊀㊀㊀㊀㊀㊀㊀㊀MachineDesignandManufacturingEngineering㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀Vol.47No.11式中:I(xꎬt)为图像函数ꎮHerbertBay提出用近似值代替L(xꎬt)以达到简化计算的目的ꎬ同时引入权值带消除误差ꎬ权值大小会随尺度变化而发生改变ꎬ则Hessian矩阵行列式为:det(Happrox)=LxxLyy-(0.9Lxy)2(4)式中:det(Happrox)为像素点的Hessian矩阵行列式ꎻLxxꎬLyyꎬLxy为高斯滤波后图像在各个方向的二阶导数ꎮ匹配图像具有不同的空间尺度ꎬ图像金字塔可以将模板图像求解出多种尺度空间以适应匹配要求ꎮ传统的金字塔结构各层待检测图片尺寸大小发生了变化ꎬ各子层在运算过程中都需要用高斯函数进行平滑处理ꎬ降低了运算效率ꎬ如图1所示ꎮ但在SURF算法中ꎬ各个octave层之间的待检测图片尺寸大小是相同的ꎬ只改变了滤波器大小ꎮ采用这种方法缩短了采样过程所消耗的时间ꎬ处理速度得到较大提高ꎮ图1㊀金字塔结构1.1.2㊀精确定位极值点将Hessian矩阵处理过的每个像素点与其三维领域的26个点进行对比ꎬ如果是极值点则保留ꎬ反之剔除ꎬ再通过三维线性差值法获得亚像素级的特征点ꎬ并删除检测特征点中小于一定阈值的点ꎮ1.1.3㊀选取特征点主方向在特征点区域内统计其haar小波特征ꎬ以60ʎ扇形为单位ꎬ统计扇形区域内所有特征点的水平和垂直haar小波特征总和ꎬ然后60ʎ扇形以一定间隔进行旋转ꎬ旋转一周后以小波特征最大的扇形方向作为该特征点的主方向ꎬ过程示意图如图2所示ꎮ图2㊀特征点主方向求取过程1.2㊀生成特征描述子在特征点周围选取一个正方形框ꎬ边长为20s(s为该特征点的尺度)ꎬ方向为特征点的主方向ꎬ然后把该框分成16个子区域ꎬ每个子区域统计25个像素的水平和垂直方向的haar小波特征ꎬ从而形成四维向量V=[ðdx㊀ð|dx|㊀ðdyð|dy|]ꎬ归一化后形成16ˑ4共64维SURF描述算子[8]ꎮ其中dx为水平方向haar小波特征ꎻdy为垂直方向haar小波特征ꎻ|dx|为水平方向haar小波特征的绝对值ꎻ|dy|为垂直方向haar小波特征的绝对值ꎮ1.3㊀特征点匹配特征点匹配就是把两幅图像中特征点一一对应ꎬ然后计算第一幅图像的每一个特征描述子向量与第二幅图像的特征描述子向量的欧氏距离ꎬ计算所得的最小值即认为是那个特征的最佳匹配ꎮ2㊀匹配算法的改进SURF算法匹配过程中ꎬ如果匹配图像局部点领域信息相近和图像视角不同ꎬ会引起两个不同特征点描述符的匹配程度超过同一点的特征描述符匹配程度ꎮ因此在匹配的两幅图像中如果出现形状相似区域ꎬ就会产生大量误匹配ꎮ由于欧氏距离没有考虑各特征描述子向量之间的相关性ꎬ本文进行二次匹配ꎬ对误匹配对进行消除ꎮ2.1㊀向量空间余弦相似度匹配判断两个向量相似程度的准则一般有两种:距离测度法和相似性函数法ꎮ距离测度法是根据向量空间上存在的距离来判断向量间的差异程度ꎮ相似性函数是用函数值的大小来表明两向量间的差异程度ꎮ本文在欧式距离测度的基础上再用余弦相似度作为约束ꎬ通过设定相似性函数的阈值来去除多余的匹配点对ꎮ余弦相似度测度ꎬ即计算特征点间的相似程度ꎬ将向量根据坐标值绘制到向量空间中ꎬ求得它们的夹角ꎬ并计算出夹角所对应的余弦值ꎬ此余弦值就可以用来表征两个特征点向量的相似性ꎮ余弦值越大ꎬ说明两特征点向量之间的夹角越小ꎬ匹配相似度越大ꎮ具体方法:先使用欧氏距离选取初步特征点对ꎬ然后再使用余弦相似度函数进一步筛选ꎬ如果两个向量的余弦值大于阈值K则保留ꎬ反之删除ꎮK可以根据实验得到ꎬ对于2个向量a和bꎬ余弦相似度S(aꎬb)表达式为:㊀S(aꎬb)=(aꎬb)a b =ðni=1aibi(ðni=1a2iðni=1b2i)1/2(5)952018年第11期㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀张晓宇:改进的SURF特征提取与匹配算法使用余弦相似度对产生缩放和旋转㊁亮度对比度改变㊁模糊㊁视角变化的4类图像进行测试ꎬ选择平均阈值K=0.975ꎬ测试结果见表1ꎮ表1㊀测试结果测试图片旋转和缩放亮度模糊视角最佳阈值K0.970.960.980.992.2㊀改进的RANSAC算法RANSAC算法设立一个阈值把测量数据分为内点和外点ꎬ其中内点数据比较准确ꎬ因此利用内点数据进行参数估计ꎬ以便删除不准确的数据ꎮ此算法需要事先确定3个量[9]:随机采样次数㊁误差容忍度(内外点距离阈值)和一致集的大小(内点总数)ꎮ在经典的RANSAC算法中ꎬ计算最佳模型参数是遍历所有可能的组合ꎬ并以误差最小的一组作为最佳参数ꎬ往往导致计算量大㊁运行时间长ꎮ本文采用PROSAC(theprogressivesampleconsensus)将余弦相似度匹配的结果作为排序的依据ꎬ在采样时根据匹配结果由高到低进行排序ꎬ如此最有可能导致最佳参数的采样会较早出现ꎬ从而减少随机采样次数㊁提高运算效率ꎮ3㊀实验结果与分析用于实验的硬件为联想ThinkPadE420ꎬ其CPU主频为2.2GHzꎬ内存4GBꎻ程序在VisualStu ̄dio2010开发环境下编写ꎮ测试用图为经典测试图像ꎬ以正确匹配率作为评价标准[11]ꎮ1-precision=falsematchescorrectmatches+falsematches(6)式中:precision为正确率ꎻfalsematches为错误匹配ꎻcorrectmatches为正确匹配ꎮ使用原SURF算法和改进SURF算法分别处理测试图像ꎬ如图3~6所示ꎬ其中(a)为使用SURF算法匹配效果图ꎬ(b)为改进SURF匹配效果图ꎮ图3为旋转45ʎ㊁尺度增加2倍ꎬ图4为经过模糊变化ꎬ图5为亮度有较大改变ꎬ图6为相机视角发生变化的ꎮ表2是实验数据ꎮ图3㊀匹配旋转和缩小图像图4㊀匹配模糊变化图像图5㊀匹配亮度变化图片图6㊀匹配视角变化的图片06 2018年第47卷㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀机械设计与制造工程㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀表2㊀测试图像匹配结果图像处理方式算法左图特征点数量右图特征点数量匹配点数量正确匹配点数量正确率/%时间/s旋转和缩放SURF61441061437360.751.13改进SURF448224313096.771.31模糊SURF1681011689657.141.02改进SURF131621919100.001.24亮度SURF127881277861.411.14改进SURF105664242100.001.36视角SURF32732232720863.611.21改进SURF225230171694.111.32㊀㊀从表2可知ꎬ改进SURF算法与原SURF算法相比ꎬ改进算法在不同条件下的图像匹配正确率都有显著提高ꎬ误匹配率平均降低37%ꎬ匹配时间比SURF算法增加0.1~0.2sꎮ使用余弦相似度进行二次匹配ꎬ需要选取的特征点平均减少20%~30%ꎬ说明本文算法稳定可靠ꎬ对图像产生旋转㊁缩放㊁模糊㊁亮度和视角变化等情况都有较强的适应性ꎮ使用SURF和本文算法对随机拍摄的一幅照片进行匹配ꎬ余弦相似度阈值K=0.975ꎬ人工对匹配结果进行校验ꎬ发现误匹配对为0对ꎬ匹配正确率为100.00%ꎬ所用时间比SURF多0.12sꎬ在可接受的范围之内ꎬ如图7所示ꎮ图7㊀匹配实验图片4 结束语本文在用SURF算法提取特征点的基础上结合余弦相似度进行进一步提取ꎬ很好地解决了SURF算法匹配中没有考虑特征点空间位置关系从而导致误匹配率高的问题ꎮ本文提出的方法可以在保证正确率的基础上对图像的旋转㊁缩放㊁模糊㊁亮度变化和视角变化具有较强的鲁棒性ꎬ匹配正确率较高ꎮ但是由于旋转和视角变化易使相近特征点方向一致ꎬ导致余弦相似度进行二次匹配对误匹配点去除不完全ꎬ还需要做进一步的研究ꎮ参考文献:[1]㊀LOWEDG.Distinctiveimagefeaturesfromscale-invariantkey ̄points[J].InternationalJournalofComputerVisionꎬ2004ꎬ60(2):91-110.[2]㊀WANGMꎬYANGKYꎬHUAXSꎬetal.Towardsarelevantanddiversesearchofsocialimages[J].IEEETransactionsonMulti ̄mediaꎬ2010ꎬ12(8):829-842.[3]㊀BAYHꎬESSAꎬTUYTELAARSTꎬetal.Speeded-uprobustfea ̄tures(SURF)[J].ComputerVisionandImageUnderstandingꎬ2008ꎬ110(3):346-359.[4]㊀BAUERJꎬSÜNDERHAUFNꎬPROTZELP.Comparingseveralimplementationsoftworecentlypublishedfeaturedetectors[J].IFACProceedingsVolumesꎬ2007ꎬ40(15):143-148. [5]㊀HUMeiyuꎬCHENJianhuiꎬSHIChengyu.Three-dimensionalmappingbasedonSIFTandRANSACformobilerobot[C]//2015IEEEInternationalConferenceonCyberTechnologyinAu ̄tomationꎬControlꎬandIntelligentSystems(CYBER).Shenyang:ShenyangInstituteofAutomationꎬ2015:139-144. [6]㊀BOUCHECHHꎬFOUFOUSꎬABIDIM.StrengtheningSURFde ̄scriptorwithdiscriminantimagefilterlearning:applicationtoface162018年第11期㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀张晓宇:改进的SURF特征提取与匹配算法recognition[C]//201426thInternationalConferenceonMicro ̄electronic(ICM).NewYork:InstituteofElectricalandElectron ̄icsEngineersIncꎬ2014:136-139.[7]㊀HUANGLꎬCHENCꎬSHENHꎬetal.Adaptiveregistrationalgo ̄rithmofcolorimagesbasedonSURF[J].Measurementꎬ2015ꎬ66:118-124.[8]㊀石雅笋ꎬ刘晓云ꎬ陈奋.基于SURF的彩色图像配准[J].红外技术ꎬ2010ꎬ32(7):415-419.[9]㊀赵向阳ꎬ杜利民.一种全自动稳健的图像拼接融合算法[J].中国图象图形学报ꎬ2004ꎬ9(4):417-422.[10]GUOYꎬBENNAMOUNMꎬSOHELFꎬetal.Acomprehensiveper ̄formanceevaluationof3Dlocalfeaturedescriptors[J].Interna ̄tionalJournalofComputerVisionꎬ2016ꎬ116(1):66-89.TheimprovedalgorithmforSURFfeatureextractionandmatchingZhangXiaoyuꎬHeWensiꎬDuanHongyanꎬWeiSongtao(CollegeofMechanicalandElectricalEngineeringꎬLanzhouUniversityofTechnologyꎬGansuLanzhouꎬ730050ꎬChina)Abstract:ImagematchingalgorithmbasedonSURFreliesongradientdirectionoflocalareapixelstoomuchinthestageofgettingamajororientationtoeachfeaturepointꎬwhichcausestheinaccuracyofmajororientationsandhighfalsematchingrates.AimingataboveproblemsꎬthepaperintroducesanimprovedalgorithmforSURFmatching.Using64-dimensionalfeaturevectorsoffeaturepointsextractedfromSURFꎬitbuildsthedescrip ̄torsꎬandappliesthemethodofcombiningmetricofdistancematchingwithmetricofcosinesimilaritymatchingtomatchfeaturepointsꎬmakestheimprovedRANSACadopttofurtherlowertherateoffalsematching.Theexperi ̄mentalresultsshowthatundertheconditionsofimagesrotatingꎬzoomingꎬblurringlightingandviewchangeꎬtheaccuracyoftheimprovedalgorithmcanreachover94%.Keywords:imageprocessingꎻSURFalgorithmꎻimagematchingꎻcosinesimilarityꎻRANSAC 262018年第47卷㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀机械设计与制造工程㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀。
单目视觉里程计算法研究与优化
单目视觉里程计算法研究与优化近年来,单目视觉里程计算法在机器人导航、自动驾驶、增强现实等领域得到广泛应用。
单目视觉里程计算法的原理是根据图像序列计算相邻帧之间的运动量,进而估计相机在空间中的运动轨迹。
然而,由于单目视觉里程计算法存在的问题,如误差积累、运动模型不准确等,导致其实际应用中存在诸多限制。
因此,针对这些问题,研究与优化单目视觉里程计算法具有重要的现实意义。
一、单目视觉里程计算法的基本原理单目视觉里程计算法是通过在不同时间拍摄的图像序列中提取特征点,进而计算相邻帧之间的位移,并根据位移信息估计相机运动轨迹的一种方法。
具体步骤包括以下几个方面:1.图像预处理:将输入的图像序列进行预处理,主要包括去噪、灰度化等。
2.特征提取:对于每一帧图像,在图像上提取一些关键特征点。
常用的特征点提取算法包括SIFT、SURF以及ORB等。
3.特征匹配:特征点匹配是计算两幅图像之间的位移信息的关键步骤。
常用的特征匹配算法有基于描述子的匹配算法、FLANN算法等。
4.相机运动估计:相机运动估计是基于特征点的位移信息计算相机空间运动轨迹的过程。
常用的运动估计算法有基于特征点匹配的本质矩阵估计算法、基于特征点的运动估计算法等。
5.运动轨迹的优化:优化是为了提高单目视觉里程计算法的精度和准确性。
常用的优化算法有基于滤波器的优化算法、基于非线性优化的算法等。
二、单目视觉里程计算法存在的问题尽管单目视觉里程计算法在实际应用中具有广泛的应用前景,但其在实际应用中也存在一些问题,如误差积累、运动模型不准确等。
1.误差积累:由于单目视觉里程计算法基于特征点匹配来计算相邻帧之间的运动量,因此在匹配过程中的误差会积累到最终估计的运动量中,从而导致估计的相机运动轨迹偏差较大,甚至不可用。
2.运动模型不准确:在单目视觉里程计算法中,相机的运动模型是根据前一个时刻的状态和当前时刻的输入来估计的。
然而,由于相机运动过程中的加速度和姿态变化等因素,相机的运动模型难以完全准确的表示,因此会影响单目视觉里程计算法的精度和准确性。
surf算法基本原理
surf算法基本原理嘿,朋友们,今天咱们聊聊一个有趣的话题,SURF算法。
听起来像是什么神秘的黑科技,其实它是一种非常实用的图像处理算法。
说到图像处理,大家肯定会想起那些花里胡哨的滤镜,或者是手机上那些能把你自拍变得美美哒的应用。
可是,SURF可不是单纯的美颜,它在图像识别和计算机视觉方面可是大显身手的哦。
想象一下,你在拍照的时候,手机能迅速识别出照片里的物体,那背后就有可能有SURF在默默奉献。
SURF,全名叫加速稳健特征(SpeededUp Robust Features),听起来就很酷炫,对吧?这个算法的核心思想其实很简单。
它主要是通过检测和描述图像中的特征点,让计算机能够识别出图像的关键部分。
就好比你见到一个老朋友,虽然他换了发型,但一眼就能认出他来,这就是特征点在起作用。
SURF就是利用这些特征点,帮助计算机进行图像匹配和识别。
SURF是怎么实现的呢?它会找到图像中的特征点。
这就像在一大堆照片中找到最吸引眼球的那一张,难度可想而知。
但SURF可不是一般的算法,它使用了一种叫做“Hessian矩阵”的数学工具,能快速找出图像中的高对比度区域。
这些区域就是我们所说的特征点。
哎,这就像是在人群中找出最亮眼的星星,大家都想看嘛。
找到特征点之后,SURF可没闲着。
它会对这些点进行描述,生成一组特征向量。
简单说,就是给每个特征点贴上一个“标签”,告诉计算机这个点有什么特点。
这种描述方法又快又稳,确保在各种光照、旋转和缩放的情况下都能可靠地识别出这些特征点。
想象一下,风吹草动,照片的背景换了个样子,但你依然能认出那是你最爱的小狗。
这种可靠性真是令人赞叹!再说说SURF在实际应用中的表现。
比如在自动驾驶技术中,车载摄像头需要不断识别周围环境。
SURF帮助车辆识别路标、行人甚至其他车辆,确保安全驾驶。
就好像你在繁忙的街道中,灵活躲避那些横冲直撞的行人,这可不是简单的事儿。
但有了SURF,这一切都变得简单多了。
单目视觉定位中SURF算法参数的优化
第 22 卷 第 6 期 2012 年 6 月
计算机技术与发展
COMPUTER TECHNOLOGY AND DEVELOPMENT
Vol. 22 No. 6 June 2012
单目视觉定位中 SURF 算法参数的优化
赵立双, 冯 莹, 曹 毓
( 国防科学技术大学 光电科学与工程学院 , 湖南 长沙 410073 )
图 1 中分别给出了实验中从柏油路面和水泥路面 拍摄的图像 。图像利用 PointGray Flea2 - 14S3 相机拍 摄, 分辨率为 640 × 480 , 拍摄时相机正俯视路面 , 距离 地面高度 1. 82m, 镜头焦距 16mm。 路面图像具有以下特点 : 1 ) 路面纹理的尺度较小 , 分布相对均匀 , 且相似 性较高 ; 2 ) 路边景物 、 路面人物和运动平台自身的阴影会 导致序列路面图像的亮度出现明显变化 ; 3 ) 镜头焦距较长 , 因此镜头畸变较小 , 为了提高 处理速度 , 可以省去镜头畸变校正的步骤 ; 4 ) 相机架设高度和角度固定 , 在忽略因相机抖动 而引起的误差情况下 , 可以认为所拍摄的序列路面图
[9 , 10 ] [7 , 8 ]
由表 1 可知 , 随着组数 、 层数的减小 , 程序耗时明 “第 1 组 显减少 ; 四组实验中所得到的特征点存在着 第 2 组第 3 组第 4 组” 的包含关系 , 且随着组数和 特征点所覆盖的尺度空间增大 ; 特征点的 层数的增加 , hessian 行列式不 尺度越大 , 最大 hessian 行列式越小 , 从表 1 可以 小于 1000 的特征点主要分布在第 3 组中 , 看出其数量占第一组的 95. 4% 。 根据以上结果分析可知 , 特征较强的特征点主要 分布在小尺度空间中 , 因此在更大的尺度空间中计算 hessian 行列式响应图像不但不能有效增加特征较强 反而增大了计算量 。 综合考虑算法的 特征点的数目 , 有效性和效率 , 实验中将组数设定为 1 , 层数设定为 2 。 2. 2 hessian 行列式阈值动态设定 SURF 算法中 , 参数 hessian 行列式阈值是对特征 hessian 行列式越大 , 特征点 点进行筛选的首要依据 , 特征越强 。为了得到稳定的特征点 , 需要尽可能提高 hessian 行列式阈值 。 但是随着 hessian 行列式阈值的 提高 , 图像中所能检测到的特征点数目也会减少 。 当 特征点数目减小到一定程度后 , 后续程序的精度和稳 定性就会受到影响 。 因此需要合理确定 hessian 行列 式阈值 , 保证特征点既有足够的强度 , 又有足够的数 量。 针对单目视觉定位应用 , 两帧图像之间只要有 2 对正确匹配的特征点对就可以估计出它们之间的变换 特征点误匹配概 矩阵 。考虑到两帧图像之间重叠率 、 率等不利因素的影响 , 当每帧图像上提取的特征点数 目在 200 个以上时就能够保证变换矩阵的准确估计 。 因此在实验中取每帧图像提取 250 个特征点作为 hessian 行列式阈值动态设定的参考 。 选取 888 帧路面图像 , 设置组数为 1 , 层数为 2 , 当 每帧图像仅提取 250 个特征点时 , 各帧图像的 hessian 行列式阈值的分布情况如图 2 所示 。可以看出在不同 hessian 图像上 , 为了保证提取 出 的 特 征 点 数 目 一 致 ,
SURF算法分析
SURF 提取特征点
• 如下图所示第一行图像就是经过离散化,被剪切成9X9方格,=1.2的沿x 方向、y方向和xy方向的高斯二阶微分算子,即Lxx,Lxy,Lyy模板,这些 微分算子可以用9x9的盒装滤波器—Dxx模板、Dxy模板、Dyy模板替代 ,即图中第二行图像。盒装滤波器中白色部分权值为1,灰色部分权值为 0,Dxx和Dyy模板黑色部分的权值为-2,Dxy模板黑色部分权值为-1,白 色部分和黑色部分统称突起。
•
(3.6)
• 式中的Di是(3.3)和(3.4)式的分母,然后计算两个矩阵 A和b,其中A中的元素为:
•
(3.7)
△
•
• 总结:采用这种变换矩阵的方法可以处 理图像之间存在平移、旋转、缩放等变 化条件下的拼接。
四.图像融合
• 四:图像融合
• 通过图像匹配将两幅图像变换到了同一坐标系后,得 到了两幅图像的拼接结果。但是,由于图像采集所带 来的光照、视野等的差异,拼接好的两幅图片在相结 合的部分会出现明显的拼接缝隙,图像融合技术就是 为了去除这种拼接缝隙的有力工具。图像融合应当满 足几个方面的要求:首先,为了消除图像的拼接缝隙 ,就必须采用一种渐变的方法来将拼接的缝隙部分像 素转变为从第一副图片渐变为第二幅图片;其次,图 像的融合应当只针对于拼接的结合部分有效,对于图 像的其他部分不能够产生影响;最后, • 融合算法在算法的复杂度上不能太高,不能影响了图 像拼接的整体速度。
• 加权平均法对于重叠部分的像素值不是简单的叠加求 平均值,而是先进行加权后,再进行叠加平均。假设 现在有两幅图像中的重叠部分分别定义一个权值,取 为d1和d2,并且d1和d2都满足条件属于(0,1),且 d1+d2=1。那么选择合适的权值,就能够使得重叠区 域实现平滑的过度。在重叠部分中,d1由1渐渐过渡到 0,到由0渐渐过渡到1。通过这样的监渐进变化进行融 合,其公式为:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机技术与发展
COMPUTER TECHNOLOGY AND DEVELOPMENT
Vol. 22 No. 6 June 2012
单目视觉定位中 SURF 算法参数的优化
赵立双, 冯 莹, 曹 毓
( 国防科学技术大学 光电科学与工程学院 , 湖南 长沙 410073 )
Optimization of SURF Parameters in Monocular Visual Odometry
ZHAO Li -shuang , FENG Ying , CAO Yu
( College of Optoelectronics Science and Eng. , National Univ. of Defense Techn. , Changsha 410073 , China)
汽车
[5 , 6 ]
等领域有广泛应用 。目前 , 定位频率低是视觉
1
1. 1
路面图像特点与视觉定位算法流程
路面图像特性分析
定位方法发展中面临的重要问题之一 。为了提升视觉 定位方法的定位频率 , 设计了一种单目视觉定位系统 , 该系统针对柏油或水泥路面环境 , 采用基于 SURF 算 法的单目视觉定位方法实现相机运动轨迹的解算 。 为 了提升算法的效率 , 满足高频率的实时定位需求 , 并保 证现有算法的精度和稳定性 , 对 SURF 算法参数与路 面图像中特征点分布 、 程序耗时等关系进行了深入分 析, 据此优化了 SURF 算法中的组数和 层 数 , 并提出
0
引
言
[1 ]
hessian 行列 式 阈 值 动 态 设 定 方 法 。 实 验 结 果 表 明 , 是一种通过分析相机拍摄到的序列图 SURF 参数优化后 , 单目视觉定位在大幅提高效率的 同时 , 也保证了原有的精度和稳定性 。
视觉定位
像而确定运动平台位置和航向的方法 , 在同时定位与
[2 , 3 ] [4 ] 、 地图生成 ( SLAM ) 机器人定位导航 、 自主驾驶
图 1 中分别给出了实验中从柏油路面和水泥路面 拍摄的图像 。图像利用 PointGray Flea2 - 14S3 相机拍 摄, 分辨率为 640 × 480 , 拍摄时相机正俯视路面 , 距离 地面高度 1. 82m, 镜头焦距 16mm。 路面图像具有以下特点 : 1 ) 路面纹理的尺度较小 , 分布相对均匀 , 且相似 性较高 ; 2 ) 路边景物 、 路面人物和运动平台自身的阴影会 导致序列路面图像的亮度出现明显变化 ; 3 ) 镜头焦距较长 , 因此镜头畸变较小 , 为了提高 处理速度 , 可以省去镜头畸变校正的步骤 ; 4 ) 相机架设高度和角度固定 , 在忽略因相机抖动 而引起的误差情况下 , 可以认为所拍摄的序列路面图
收稿日期:2011-10-28 ;修回日期:2012-02-01 基金项目:中国人民解放军总后勤部资助项目 ( BY2008J018 ) 作者简介:赵立双( 1985- ) , 男, 硕士研究生, 研究方向为光电测控技 术; 冯 莹, 教授, 博士生导师, 研究方向为宽带光纤光源技术 、 光纤 激光器技术、 光纤波导生物传感器技术以及光电测控技术 。
摘 要:为了提升单目视觉定位方法的定位效率 , 在基于 SURF 算法的单目视觉定位系统上对 SURF 算法参数的选取进行
了优化。首先分析了路面图像的特点及路面图像中 SURF 特征点的特性, 据此选取了 SURF 算法中组数和层数这两个重 要参数; 其次分析了路面序列图像中特征点数目与 hessian 矩阵行列式阈值之间的关系, 提出了 hessian 矩阵行列式阈值动 态设定方法。通过对 SURF 算法参数的优化, 有效降低了程序的运算量。实验结果表明, 该方法能较好满足路面环境下定 位的要求, 在保证算法精度和稳定性的同时 , 大幅提高了程序的效率。 关键词:机器视觉; 单目视觉定位; SURF 参数; hessian 矩阵行列式阈值 中图分类号:TP212. 14 文献标识码:A 文章编号:1673-629X( 2012 ) 06-0006-04
Abstract:In order to increase the localization frequency of monocular visual odometry , optimization of SURF parameters w as done on features of pavement image and the SURF keypoint in it w ere analyzed, and monocular visual odometry system based on SURF. Firstly , octave number and octave layer number of SURF w ere properly chosen. Secondly , the relation betw een SURF keypoint number and hesand a method of hessian threshold dynamic setting w as put forw ard. By optimizing SURF sian threshold in image sequence w as analyzed, parameter , the amount of computation w as reduced efficiently. The experimental results demonstrate that the method can fit the demand of localization on the pavement, meanw hile, the efficiency of monocular visual odometry is greatly improved as the accuracy and stability are w ell kept. Key words:machine vision;monocular visual odometry ;SURF parameters;hessian threshold