视觉slam介绍知识讲解
如何使用计算机视觉技术进行视觉SLAM定位与建图
如何使用计算机视觉技术进行视觉SLAM定位与建图视觉SLAM(Simultaneous Localization and Mapping)是一种利用计算机视觉技术进行定位与建图的方法。
通过使用摄像头或其他视觉传感器,结合计算机视觉算法,在不依赖于外部定位系统的情况下,实时地估计相机的运动轨迹,并生成环境地图。
视觉SLAM技术在许多领域中得到了广泛应用,如无人机导航、自动驾驶、增强现实等。
本文将介绍如何使用计算机视觉技术进行视觉SLAM定位与建图的基本原理和常用方法。
一、视觉SLAM的基本原理视觉SLAM主要通过两个步骤实现定位与建图:特征提取和运动估计。
具体流程如下:1. 特征提取:从图像序列中提取关键特征点,以获取稳定可靠的图像特征。
常用的特征提取算法有SIFT(尺度不变特征变换)、SURF(速度快的特征变换)和ORB(Oriented FAST and Rotated BRIEF)。
这些算法能够提取出在不同视角下具有唯一性的图像特征点。
提取到的特征点将被用于后续的运动估计。
2. 运动估计:通过特征点的运动轨迹,计算相机在连续帧之间的相对运动。
一种常用的方法是基于稀疏特征点的追踪,例如,通过匹配先前帧中的特征点与当前帧中的特征点,用最小二乘或RANSAC等方法计算相机姿态的变化。
运动估计的结果将被用于定位和建图的更新。
3. 定位更新:通过将估计的相机姿态与先前的定位结果进行融合,得到更准确的相机位置和姿态。
通常,通过运用滤波器,如扩展卡尔曼滤波器(EKF)或无迹卡尔曼滤波器(UKF),结合运动估计和传感器数据来实现定位的更新。
4. 地图更新:使用定位结果和特征点信息,建立和维护环境地图。
地图通常以稀疏或稠密的形式表示。
在建图过程中,常用的算法有图优化(Graph-SLAM)和基于光束法的建图方法。
二、常用的视觉SLAM算法视觉SLAM的研究领域非常广泛,有很多不同的算法和技术可供选择。
以下是几种常用的视觉SLAM算法:1. ORB-SLAM:ORB-SLAM是一种基于特征点的SLAM系统,它使用ORB特征描述子进行特征提取和匹配,利用优化算法来估计相机的运动轨迹和地图。
vslam技术原理
vslam技术原理VSLAM技术原理VSLAM技术是指视觉SLAM技术,是一种利用摄像头或激光雷达等传感器获取环境信息,实现机器人自主定位和建图的技术。
本文将从以下几个方面详细介绍VSLAM技术的原理。
一、SLAM基础概念1.1 SLAM定义Simultaneous Localization and Mapping(同时定位与建图),简称SLAM,是指在未知环境中,通过机器人自身传感器获取环境信息,实现机器人自主定位和地图构建的过程。
1.2 SLAM组成要素SLAM系统由三个部分组成:传感器、运动模型和地图构建模型。
其中传感器用于获取环境信息,运动模型用于预测机器人的运动轨迹,地图构建模型用于生成地图并估计机器人在地图上的位置。
二、VSLAM基本原理2.1 VSLAM定义Visual Simultaneous Localization and Mapping(视觉同时定位与建图),简称VSLAM,是指利用摄像头等视觉传感器获取环境信息,实现机器人自主定位和地图构建的过程。
2.2 VSLAM组成要素VSLAM系统由两个部分组成:视觉传感器和视觉SLAM算法。
其中视觉传感器用于获取环境信息,视觉SLAM算法用于实现机器人自主定位和地图构建。
三、VSLAM技术原理3.1 视觉传感器视觉传感器包括摄像头、双目摄像头、RGB-D相机等。
这些传感器能够获取环境中的图像信息,并将其转化为数字信号,供计算机进行处理。
3.2 视觉SLAM算法视觉SLAM算法主要分为前端和后端两部分。
前端主要负责提取关键点、匹配特征点等工作;后端则负责优化机器人的位置和地图。
3.2.1 前端前端主要包括特征提取、特征描述和特征匹配三个步骤。
(1)特征提取:通过角点检测或边缘检测等方法,提取出图像中的关键点。
(2)特征描述:对于每个关键点,提取其周围区域的局部特征,并将其转化为高维向量表示。
(3)特征匹配:通过计算两张图像中的关键点的相似度,找到它们之间的对应关系。
《视觉SLAM十四讲》笔记(ch7)
《视觉SLAM⼗四讲》笔记(ch7)ch7 视觉⾥程计1本章⽬标:1.理解图像特征点的意义,并掌握在单副图像中提取出特征点及多副图像中匹配特征点的⽅法2.理解对极⼏何的原理,利⽤对极⼏何的约束,恢复出图像之间的摄像机的三维运动3.理解PNP问题,以及利⽤已知三维结构与图像的对应关系求解摄像机的三维运动4.理解ICP问题,以及利⽤点云的匹配关系求解摄像机的三维运动5.理解如何通过三⾓化获得⼆维图像上对应点的三维结构本章⽬的:基于特征点法的vo,将介绍什么是特征点,如何提取和匹配特征点,以及如何根据配对的特征点估计相机运动和场景结构,从⽽实现⼀个基本的两帧间视觉⾥程计。
特征点:⾓点、SIFT(尺度不变特征变换,Scale-Invariant Feature Transform)、SURF、、ORB(后三个是⼈⼯设计的特征点,具有更多的优点)特征点的组成:1.关键点:指特征点在图像⾥的位置2.描述⼦:通常是⼀个向量,按照某种⼈为设计的⽅式,描述了该关键点周围像素的信息。
相似的特征应该有相似的描述⼦(即当两个特征点的描述⼦在向量空间上的距离相近,认为这两个特征点是⼀样的)以ORB特征为代表介绍提取特征的整个过程:ORB特征:OrientedFAST关键点+BRIEF关键⼦提取ORB特征的步骤:1.提取FAST⾓点:找出图像中的“⾓点”,计算特征点的主⽅向,为后续BRIEF描述⼦增加了旋转不变特性FAST⾓点:主要检测局部像素灰度变化明显的地⽅特点:速度快缺点:1).FAST特征点数量很⼤且不确定,但是我们希望对图像提取固定数量的特征2).FAST⾓点不具有⽅向信息,并且存在尺度问题解决⽅式:1).指定要提取的⾓点数量N,对原始FAST⾓点分别计算Harris响应值,然后选取前N个具有最⼤响应值的⾓点作为最终的⾓点集合2).添加尺度和旋转的描述 尺度不变性的实现:构建图像⾦字塔,并在⾦字塔的每⼀层上检测⾓点(⾦字塔:指对图像进⾏不同层次的降采样,以获得不同分辨率的图像)特征旋转的实现:灰度质⼼法(质⼼:指以图像块灰度值作为权重的中⼼)2.计算BRIEF描述⼦:对前⼀步提取出的特征点周围图像区域进⾏扫描特点:使⽤随机选点的⽐较,速度⾮常快,由于使⽤了⼆进制表达,存储起来也⼗分⽅便,适⽤于实时的图像匹配在不同图像之间进⾏特征匹配的⽅法:1.暴⼒匹配:浮点类型的描述⼦,使⽤欧式距离度量⼆进制类型的描述⼦(⽐如本例中的BRIEF描述⼦),使⽤汉明距离度量缺点:当特征点数量很⼤时,暴⼒匹配法的运算量会变得很⼤2.快速近似最近邻(FLANN):适合匹配特征点数量极多的情况实践部分:1.OpenCV的图像特征提取、计算和匹配的过程:演⽰如何提取ORB特征并进⾏匹配代码: 1 #include <iostream>2 #include <opencv2/core/core.hpp>3 #include <opencv2/features2d/features2d.hpp>4 #include <opencv2/highgui/highgui.hpp>56using namespace std;7using namespace cv;89int main(int argc,char** argv)10 {11if(argc!=3)12 {13 cout<<"usage:feature_extraction img1 img2"<<endl;14return1;15 }1617//读取图像18 Mat img_1=imread(argv[1],CV_LOAD_IMAGE_COLOR);19 Mat img_2=imread(argv[2],CV_LOAD_IMAGE_COLOR);2021//初始化22 vector<KeyPoint> keypoints_1,keypoints_2;//关键点,指特征点在图像⾥的位置23 Mat descriptors_1,descriptors_2;//描述⼦,通常是向量24 Ptr<ORB> orb=ORB::create(500,1.2f,8,31,0,2,ORB::HARRIS_SCORE,31,20);2526//第⼀步:检测OrientFAST⾓点位置27 orb->detect(img_1,keypoints_1);28 orb->detect(img_2,keypoints_2);2930//第2步:根据⾓点位置计算BRIEF描述⼦31 orb->compute(img_1,keypoints_1,descriptors_1);32 orb->compute(img_2,keypoints_2,descriptors_2);3334 Mat outimg1;35 drawKeypoints(img_1,keypoints_1,outimg1,Scalar::all(-1),DrawMatchesFlags::DEFAULT);36 imshow("1.png的ORB特征点",outimg1);37 Mat outimg2;38 drawKeypoints(img_2,keypoints_2,outimg2,Scalar::all(-1),DrawMatchesFlags::DEFAULT);39 imshow("2.png的ORB特征点",outimg2);4041//第3步:对两幅图像中的BRIEF描述⼦进⾏匹配,使⽤Hamming距离42 vector<DMatch> matches;43//特征匹配的⽅法:暴⼒匹配44 BFMatcher matcher(NORM_HAMMING);45 matcher.match(descriptors_1,descriptors_2,matches);46// for(auto it=matches.begin();it!=matches.end();++it)47// {48// cout<<*it<<" ";49// }50// cout<<endl;5152//第4步:匹配点对筛选53 distance是min_dist5455double min_dist=10000,max_dist=0;5657//找出所有匹配之间的最⼩距离和最⼤距离,即最相似的和最不相似的和最不相似的两组点之间的距离58for(int i=0;i<descriptors_1.rows;++i)59 {60double dist=matches[i].distance;61// cout<<dist<<endl;62if(dist<min_dist) min_dist=dist;63if(dist>max_dist) max_dist=dist;64 }6566 printf("--Max dist:%f\n",max_dist);67 printf("--Min dist:%f\n",min_dist);6869//当描述⼦之间的距离⼤于两倍的最⼩距离时,即认为匹配有误70//但有时候最⼩距离会⾮常⼩,设置⼀个经验值作为下限71 vector<DMatch> good_matches;72for(int i=0;i<descriptors_1.rows;++i)73 {74if(matches[i].distance<=max(2*min_dist,30.0))75 {76 good_matches.push_back(matches[i]);77 }78 }7980//第5步:绘制匹配结果81 Mat img_match;82 Mat img_goodmatch;83 drawMatches(img_1,keypoints_1,img_2,keypoints_2,matches,img_match);84 drawMatches(img_1,keypoints_1,img_2,keypoints_2,good_matches,img_goodmatch);85 imshow("所有匹配点对",img_match);86 imshow("优化后匹配点对",img_goodmatch);87 waitKey(0);8889return0;90 }实验结果:1.png中提取到的特征点2.png中提取到的特征点匹配结果: 所有点对匹配结果 优化后的匹配点对结果(筛选依据是Hamming距离⼩于最⼩距离的两倍)结果分析:尽管在这个例⼦中利⽤⼯程经验优化筛选出正确的匹配,但并不能保证在所有其他图像中得到的匹配都是正确的,所以,在后⾯的运动估计中,还要使⽤去除误匹配的算法。
视觉SLAM技术的使用方法与定位误差分析
视觉SLAM技术的使用方法与定位误差分析随着机器人和无人驾驶技术的快速发展,视觉SLAM(Simultaneous Localization and Mapping)技术成为了一个备受关注的研究领域。
视觉SLAM技术的出现使得机器人和自动驾驶系统能够在未知环境中同时定位自身位置并构建地图,从而实现更准确的导航与路径规划。
本文将介绍视觉SLAM技术的一般使用方法,同时还将对定位误差进行分析。
首先,实现视觉SLAM的主要步骤是通过相机传感器捕获环境图像,并使用各种算法进行图像处理和测量。
常用的算法包括特征提取与匹配、运动估计、地图构建等。
整个过程可以分为离线和在线两个阶段:离线阶段主要通过处理离线录制的图像序列,预先生成地图;而在线阶段则是在实时采集图像的同时,实时更新地图和定位信息。
在实际操作中,使用视觉SLAM技术需要满足一些硬件和软件要求。
首先,需要使用高质量的相机传感器,以获取高分辨率的图像。
其次,需要使用处理能力强大的计算设备,因为实时图像处理和地图构建需要大量的计算资源。
此外,还需要合适的SLAM算法库,如ORB-SLAM、LSD-SLAM、DSO等。
接下来,我们将对视觉SLAM定位误差进行分析。
视觉SLAM的定位精度受到多个因素的影响,包括图像质量、环境光照条件、传感器的校准精度等。
其中,图像质量是影响视觉SLAM定位精度的一个重要因素。
当图像质量较差时,如光照不均匀、噪声较多或者存在模糊等问题,会导致特征提取和匹配的准确性下降,从而降低了定位精度。
此外,环境光照条件也会对视觉SLAM技术的性能产生影响。
光照条件变化剧烈时,会导致图像特征的提取和匹配困难,从而影响定位的准确性。
因此,为了提高视觉SLAM的稳定性,在光照变化较大的环境中,我们可以采用动态曝光控制方法,即根据环境光照变化动态调整相机的曝光参数,以保证图像质量的稳定性。
对于视觉SLAM技术来说,传感器的校准精度也是影响定位精度的一个关键因素。
SLAM_介绍以及浅析
SLAM_介绍以及浅析SLAM(Simultaneous Localization and Mapping),即同时定位与建图,是一种将移动机器人在未知环境中的位置定位与环境地图生成统一起来的技术。
SLAM技术是实现自主导航和智能导航的关键性技术之一,广泛应用于无人车、无人潜艇、无人机、机器人等领域。
SLAM技术分为前端和后端两部分。
前端主要负责机器人的位置定位,根据传感器获取的数据,通过运动估计(例如里程计模型)和感知估计(例如视觉、雷达感知)等方法,计算机器人在运动过程中的位置和姿态。
后端主要负责地图生成,根据机器人在不同时间点的位置估计和传感器获取的环境地图数据,利用优化算法估计机器人的位置和地图。
在前端中,常用的传感器有激光雷达、相机、惯性测量单元(IMU)等。
激光雷达可以提供高精度的距离和角度信息,常用于建立环境地图。
相机能够捕捉到图像信息,通过图像算法可以提取出环境中的特征点,用于定位和建图。
IMU能够提供线性加速度和角速度信息,用以估计机器人的运动。
在后端中,常用的算法有滤波器、优化方法和图优化等。
滤波器方法包括扩展卡尔曼滤波器(EKF)和无迹卡尔曼滤波器(UKF),通过状态估计和协方差矩阵来估计机器人的位置和姿态。
优化方法包括最小二乘法、非线性优化等,通过最小化误差函数来优化机器人的位置估计和地图。
图优化方法使用图模型来描述机器人的位置和环境地图,通过最大化后验概率来估计位置和地图。
SLAM技术的关键挑战之一是数据关联问题。
由于噪声和误差的存在,机器人在不同时刻获取的传感器数据可能不完全匹配。
因此,需要通过数据关联来确定当前获取的数据与之前数据的对应关系。
常用的数据关联方法有最近邻法、滤波法和图优化法等。
最近邻法通过计算不同数据之间的距离来确定对应关系。
滤波法通过滤波器来更新机器人的位置估计,并根据新的数据重新关联。
图优化法通过图模型来描述数据的关联关系,并通过最大后验概率来估计位置和地图。
SLAM简介
SLAM简介SLAM简介1. 关于SLAMSLAM是同步定位与地图构建(Simultaneous Localization And Mapping)的缩写,最早由Hugh Durrant-Whyte 和 John J.Leonard 提出。
SLAM主要用于解决移动机器人在未知环境中运行时定位导航与地图构建的问题。
SLAM通常包括如下几个部分,特征提取,数据关联,状态估计,状态更新以及特征更新等。
对于其中每个部分,均存在多种方法。
针对每个部分,我们将详细解释其中一种方法。
在实际使用过程中,读者可以使用其他的方法代替本文中说明的方法。
这里,我们以室内环境中运行的移动机器人为例进行说明,读者可以将本文提出的方法应用于其他的环境以及机器人中。
SLAM既可以用于2D运动领域,也可以应用于3D运动领域。
这里,我们将仅讨论2D领域内的运动。
2. 机器人平台在学习SLAM的过程中,机器人平台是很重要的,其中,机器人平台需要可以移动并且至少包含一个测距单元。
我们这里主要讨论的是室内轮式机器人,同时主要讨论SLAM的算法实现过程,而并不考虑一些复杂的运动模型如人形机器人。
在选择机器人平台时需要考虑的主要因素包括易用性,定位性能以及价格。
定位性能主要衡量机器人仅根据自身的运动对自身位置进行估计的能力。
机器人的定位精度应该不超过2%,转向精度不应该超过5%。
一般而言,机器人可以在直角坐标系中根据自身的运动估计其自身的位置与转向。
从0开始搭建机器人平台将会是一个耗时的过程,也是没有必要的。
我们可以选择一些市场上成熟的机器人开发平台进行我们的开发。
这里,我们以一个非常简单的自己开发的机器人开发平台讨论,读者可以选择自己的机器人开发平台。
目前比较常见的测距单元包括激光测距、超声波测距、图像测距。
其中,激光测距是最为常用的方式。
通常激光测距单元比较精确、高效并且其输出不需要太多的处理。
其缺点在于价格一般比较昂贵(目前已经有一些价格比较便宜的激光测距单元)。
视觉slam十四讲 引用
视觉slam十四讲引用视觉SLAM是一种基于视觉传感器的同时定位和地图构建技术,它可以在没有GPS信号的情况下实现精确的定位和地图构建。
视觉SLAM 十四讲是一本介绍视觉SLAM技术的经典教材,由国内外知名学者合作编写而成,内容涵盖了视觉SLAM的基础理论、算法原理、实现方法以及应用案例等方面。
视觉SLAM的基本原理是通过视觉传感器获取场景的图像信息,然后通过计算机视觉算法对图像进行处理,提取出场景中的特征点,并利用这些特征点进行定位和地图构建。
视觉SLAM技术的优点在于可以实现高精度的定位和地图构建,同时还可以适应各种环境和场景,具有广泛的应用前景。
视觉SLAM十四讲的内容十分丰富,其中包括了视觉SLAM的基础理论、算法原理、实现方法以及应用案例等方面。
在基础理论方面,该书介绍了视觉SLAM的基本原理和相关概念,包括相机模型、特征点提取、特征匹配、位姿估计等内容。
在算法原理方面,该书详细介绍了视觉SLAM中常用的算法,包括基于滤波器的方法、基于优化的方法、基于深度学习的方法等。
在实现方法方面,该书介绍了视觉SLAM的实现流程和常用工具,包括ORB-SLAM、LSD-SLAM、SVO 等。
在应用案例方面,该书介绍了视觉SLAM在机器人导航、自动驾驶、增强现实等领域的应用案例。
视觉SLAM十四讲的编写者是国内外知名的视觉SLAM专家,他们在该领域拥有丰富的研究经验和实践经验。
该书的编写风格简洁明了,内容系统全面,既适合初学者入门学习,也适合专业人士深入研究。
此外,该书还提供了大量的代码实现和数据集,方便读者进行实践和验证。
总之,视觉SLAM十四讲是一本非常优秀的视觉SLAM教材,它详细介绍了视觉SLAM的基础理论、算法原理、实现方法以及应用案例等方面,对于学习和研究视觉SLAM技术的人士来说是一本不可多得的好书。
视觉slam的分类
视觉slam的分类视觉SLAM是指基于视觉传感器的同时定位与地图构建技术。
它是一种利用相机或摄像头来实现机器人或无人机在未知环境中自主定位和建图的技术。
视觉SLAM技术的应用非常广泛,包括自动驾驶、智能家居、机器人导航等领域。
视觉SLAM可以分为以下几类:1. 基于特征的SLAM基于特征的SLAM是指通过提取图像中的特征点来进行定位和建图的技术。
这种方法通常使用SIFT、SURF、ORB等算法来提取特征点,并使用RANSAC等算法来进行特征匹配和估计相机位姿。
基于特征的SLAM具有较高的精度和鲁棒性,但对于纹理较少的场景或者运动模糊较严重的情况下,可能会出现定位失败的情况。
2. 基于直接法的SLAM基于直接法的SLAM是指直接利用图像像素值来进行定位和建图的技术。
这种方法通常使用光流法或者稠密光流法来进行像素级别的匹配,并使用优化算法来估计相机位姿。
基于直接法的SLAM具有较高的鲁棒性和对纹理较少的场景具有较好的适应性,但需要较高的计算资源和较长的计算时间。
3. 基于半直接法的SLAM基于半直接法的SLAM是指结合了基于特征法和基于直接法的优点,通过利用像素值和特征点来进行定位和建图的技术。
这种方法通常使用SVO、DSO等算法来进行实现。
基于半直接法的SLAM具有较高的鲁棒性和较快的计算速度,但对于纹理较少的场景可能会出现定位失败的情况。
4. 基于深度学习的SLAM基于深度学习的SLAM是指利用深度学习技术来进行定位和建图的技术。
这种方法通常使用深度神经网络来进行图像特征提取和相机位姿估计。
基于深度学习的SLAM具有较高的鲁棒性和对于纹理较少的场景具有较好的适应性,但需要较大的训练数据集和较长的训练时间。
总之,视觉SLAM技术的分类主要是基于不同的特征提取和匹配方法,每种方法都有其优缺点和适用场景。
未来,随着计算机视觉和深度学习技术的不断发展,视觉SLAM技术将会得到更广泛的应用和进一步的优化。
视觉SLAM十四讲 第七讲 视觉里程计(1)
从理论到实践
高翔 清华大学 2016年冬
2
第七讲 视觉里程计(1)
Chapter 7: Visual Odometry (1)
3 第七讲 视觉里程计(1)
• 本讲目标
• 理解图像特征点的意义, 并掌握在单幅图像中提取出特征点,及多幅图像中匹配特征点 的方法。 • 理解对极几何的原理,利用对极几何的约束,恢复出图像之间的摄像机的三维运动。 • 理解PNP问题,及利用已知三维结构与图像的对应关系,求解摄像机的三维运动。 • 理解ICP问题,及利用点云的匹配关系,求解摄像机的三维运动。 • 理解如何通过三角化,获得二维图像上对应点的三维结构。
• 两步计算位姿:
• 由匹配点计算E
• 由E恢复R,t
• 对极约束的性质: • 乘任意非零常数依然满足 • E共五个自由度 • 当成普通矩阵的话,有八个自由度 • 可用八点法求解
17 7.3 2D-2D:对极几何
• 八点法求E
• 将E看成通常3x3的矩阵,去掉因子后剩八个自由度
• 一对匹配点带来的约束:
八对点构成方程组
• 向量形式:
18 7.3 2D-2D:对极几何
• 从E计算R, t:奇异值分解
四个可能的解,但只有一个深度为正
19 7.3 2D-2D:对极几何
• SVD过程中:
• 取 因为E的内在性质要求它的奇异值为
• 最少可使用五个点计算R,t,称为五点法
• 但需要利用E的非线性性质,原理较复杂
• 如果匹配的是RGB-D图,得到3D-3D间的关系
——PnP
——ICP
14 7.3 2D-2D:对极几何
• 几何关系:
• P在两个图像的投影为
SLAM经典入门教程
SLAM经典入门教程SLAM(Simultaneous Localization and Mapping)是指机器人或移动设备在未知环境中同时实现自身定位和环境地图构建的技术。
SLAM技术广泛应用于自动驾驶、无人机、智能家居等领域。
下面是一个经典的SLAM入门教程,帮助初学者了解SLAM的基本概念和实现方法。
一、SLAM的基本概念1. 定位(Localization):机器人或移动设备在地图中确定自身位置的过程。
2. 地图构建(Mapping):机器人或移动设备在移动过程中构建环境地图的过程。
3. 同步(Simultaneous):指机器人或移动设备在进行定位和地图构建时同时进行,相互依赖、相互影响。
4. 自身定位误差(Self-localization error):机器人或移动设备定位的准确性,影响其整体性能。
5. 地图构建误差(Mapping error):机器人或移动设备构建环境地图的准确性,影响其对环境的理解能力。
二、SLAM的实现方法1.基于视觉的SLAM:利用摄像头或激光传感器获取环境信息,通过图像处理、特征提取、匹配等算法实现定位和地图构建。
2.基于激光雷达的SLAM:利用激光传感器扫描环境,通过计算得出物体的距离和位置,从而实现定位和地图构建。
3.基于惯性测量单元(IMU)的SLAM:利用加速度计、陀螺仪等传感器获取机器人的加速度和角速度信息,通过积分计算位姿,实现定位和地图构建。
4.基于里程计的SLAM:利用机器人的里程计测量轮子转动的距离,通过计算位姿变化来实现定位和地图构建。
三、经典SLAM算法1. EKF-SLAM(Extended Kalman Filter SLAM):基于扩展卡尔曼滤波器的SLAM算法,利用状态估计和协方差矩阵来实现定位和地图构建。
2. FastSLAM:基于粒子滤波器的SLAM算法,将地图分解为多个粒子,每个粒子都有自己的状态和权重,通过多次重采样来更新地图。
视觉SLAM技术的研究与应用
视觉SLAM技术的研究与应用引言:随着计算机视觉和机器人技术的发展,SLAM(Simultaneous Localization and Mapping,即同时定位与地图构建)技术成为了近年来研究的热点之一。
在SLAM技术中,视觉SLAM技术作为一种重要的手段,已经在无人车、无人机、增强现实等领域得到了广泛的应用。
本文将就视觉SLAM技术的研究进展、技术原理及其在实际应用中的表现进行详细的探讨。
一、视觉SLAM技术的研究进展1.1视觉SLAM技术的起源视觉SLAM技术是基于摄像头和图像信息进行定位和地图构建的一种技术。
这种技术最早可以追溯到上个世纪末,当时的研究主要集中在三维重建和摄像头定位上。
随着计算机技术和图像处理技术的发展,SLAM技术也在不断地进行演进和发展。
1.2视觉SLAM技术的发展历程随着计算机视觉和深度学习的发展,视觉SLAM技术也取得了长足的进步。
传统的视觉SLAM算法主要是基于特征点匹配和结构光技术。
而现代的视觉SLAM算法则采用了深度学习和神经网络技术,能够更加准确和高效地完成定位和地图构建的任务。
1.3视觉SLAM技术的研究热点当前视觉SLAM技术的研究热点主要集中在以下几个方面:稀疏与稠密地图构建技术、实时性与鲁棒性的提升、多传感器融合、大规模场景下的定位与地图构建、SLAM在自动驾驶和增强现实中的应用等。
二、视觉SLAM技术的原理与方法2.1视觉SLAM的基本原理视觉SLAM技术的基本原理是通过摄像头采集图像信息,并通过图像处理和计算机视觉算法实现实时的定位与地图构建。
具体来说,就是通过分析相邻图像的特征点,并计算出相机的运动轨迹和周围环境的三维结构。
2.2视觉SLAM的核心技术在视觉SLAM技术中,最核心的技术包括特征提取与匹配、相机位姿估计、地图构建及优化等。
其中,特征提取与匹配是最基础的技术,它能够提取出图像中的关键特征点,并将它们进行匹配,以便计算相机的位姿。
视觉导航中的SLAM技术应用指南
视觉导航中的SLAM技术应用指南导语:视觉导航是近年来快速发展的技术,它结合了计算机视觉和导航领域的知识,旨在让机器能够通过识别和理解视觉输入来导航。
在视觉导航中,Simultaneous Localization and Mapping(SLAM)技术起着至关重要的作用。
本文将深入探讨SLAM技术在视觉导航中的应用指南。
1. SLAM技术简介SLAM技术是一种同时进行定位和地图构建的技术,通过将传感器的观测数据和机器人的位置信息融合,实现机器人在未知环境下的自主导航。
SLAM技术的核心是通过建立一个包含环境信息的地图,并根据机器人的移动轨迹实时更新地图。
视觉SLAM是指使用摄像头或其他视觉传感器进行建图和定位的SLAM技术。
2. 视觉导航中的SLAM技术应用2.1 增强现实(AR)导航SLAM技术可以在现实世界中的实时摄像头图像上叠加虚拟信息,提供更直观的导航体验。
通过SLAM技术,AR导航可以更准确地识别地标和建筑物,并将其与导航路线结合,实现更精准的导航和定位。
这种技术在旅游、导航和游戏等领域有着广泛的应用。
2.2 自动驾驶视觉导航在自动驾驶领域有着重要的应用。
SLAM技术可以利用车载摄像头和其他传感器的数据,实时构建道路地图并进行车辆定位。
通过实时地图更新和车辆定位的信息,自动驾驶车辆可以实时感知周围环境,规划最优路径,并进行自主导航。
2.3 室内导航室内环境通常缺乏GPS信号,因此室内导航面临着定位和地图构建的挑战。
SLAM技术可以通过结合视觉传感器和惯性传感器的数据,实时构建室内地图,并进行定位。
基于SLAM技术的室内导航系统可以在大型建筑物、购物中心和机场等场所提供精确的导航服务。
2.4 无人机导航随着无人机技术的快速发展,SLAM技术在无人机导航中的应用也越来越广泛。
无人机通过搭载摄像头或激光雷达等传感器,利用SLAM技术实现自主导航和定位。
无人机可以在未知环境中进行地图构建,并根据地图进行路径规划和障碍物避让,实现高效的自主导航。
视觉SLAM技术使用注意事项介绍
视觉SLAM技术使用注意事项介绍视觉SLAM(Simultaneous Localization And Mapping)是一种利用相机图像数据进行实时定位和地图构建的技术。
它在许多领域中都有广泛的应用,如机器人导航、增强现实和无人驾驶等。
然而,要正确地使用视觉SLAM技术并取得良好的效果,有一些注意事项需要考虑。
第一,选择适当的硬件设备。
视觉SLAM技术通常需要一个具有高分辨率和低延迟的相机,以获取准确的图像数据。
此外,还需要一个强大的处理器和足够的存储空间来处理和存储图像数据。
因此,在选择硬件设备时,应考虑这些要求并选择能够满足技术需求的设备。
第二,准备合适的环境。
想要获得良好的视觉SLAM效果,环境的光线条件和结构都很重要。
较暗的环境可能导致图像噪声增加,从而影响SLAM的精度;而缺乏纹理和深度信息的场景可能使得特征提取和跟踪更加困难。
为了提高SLAM的性能,可以通过合理调整环境的光照和增加纹理来改善SLAM的效果。
第三,保持相机的稳定性。
在使用视觉SLAM技术时,相机的稳定性对于定位和地图构建的准确性至关重要。
因此,在实际运行过程中,应尽量避免相机的晃动和抖动。
可以通过使用三脚架或稳定的支架来固定相机,或者选择具有图像防抖功能的相机来减少影响。
第四,进行准确的定位和初始化。
在开始SLAM之前,需要进行准确的定位和初始化过程。
定位是指估计相机在三维空间中的位置和方向,而初始化则是在开始时创建地图和特征点。
准确的定位和初始化可以提高SLAM系统的稳定性和精度。
可以通过预先收集场景的地图数据,或者使用其他传感器(如惯性测量单元)来辅助定位和初始化。
第五,进行实时的特征提取和跟踪。
特征提取和跟踪是视觉SLAM中的关键步骤。
在图像中提取稳定且具有辨识度的特征点,并通过跟踪这些特征点来进行定位和地图构建。
为了实现实时性能,特征提取和跟踪的速度必须足够快,并且在图像中具有一定的分布和均匀性。
第六,使用增量式SLAM算法。
视觉SLAM技术在无人机导航中的研究与应用
视觉SLAM技术在无人机导航中的研究与应用随着无人机技术的发展,无人机在农业、测绘、消防、安全等领域的应用日益广泛。
然而,无人机在室内、复杂地形环境下的导航问题一直是一个挑战。
传统的导航方法,如GPS定位,在这些环境中不稳定且容易受到遮挡。
视觉SLAM (Simultaneous Localization and Mapping)技术作为一种新兴的导航方法,通过无人机自身视觉传感器获取环境信息,并实现自主定位与建图。
本文将介绍视觉SLAM技术的原理,研究进展以及在无人机导航中的应用前景。
1. 视觉SLAM技术原理视觉SLAM技术是一种同时实现定位和建图的方法,它利用无人机的视觉传感器(通常是摄像头)获取环境信息,并通过对图像序列的处理和分析,实现自主定位和三维环境地图的构建。
它的基本原理是根据连续图像帧之间的特征匹配和相机运动估计来实现定位和建图。
在视觉SLAM中,无人机的视觉传感器将连续拍摄的图像帧作为输入。
通过对这些图像帧进行特征提取和匹配,可以估计出相机在空间中的运动轨迹。
同时,通过对特征点的三角测量,可以得到无人机与环境中物体的距离信息,从而实现三维环境地图的构建。
最后,通过不断更新定位和建图结果,无人机可以实现自主导航和避障。
2. 视觉SLAM技术研究进展随着计算机视觉和机器学习的发展,视觉SLAM技术在过去几年取得了重要的进展。
目前,主要有以下几种视觉SLAM方法:(1)基于特征的视觉SLAM方法:这种方法通过在图像中提取和匹配特征点来实现相机的定位和建图。
特征点可以是角点、边缘或其他高纹理区域。
这种方法的优点是计算效率高,但对纹理缺乏的区域容易匹配失败。
(2)直接法的视觉SLAM方法:直接法将图像中的像素值作为特征,通过像素值的匹配来实现相机的定位和建图。
这种方法的优点是对纹理缺乏的区域具有较好的鲁棒性,但计算量较大。
(3)半直接法的视觉SLAM方法:半直接法综合了基于特征和直接法的优点,通过提取图像中的稀疏特征,再通过像素值的匹配进行优化。
视觉slam介绍 PPT
3.2 对极几何
• 几何关系:
• P在两个图像的投影为 p 1 , p 2 T 12
• 两个相O 机1 P之间的变换为 e 2 p 2
•
l在2第二个图像上投影为
e1,e2
• 记 ,称为极线,反之亦然
•
p 1 , p 2称为极点
• 实践当T 1中2:
侧重对外在的了解
• 准确的定位需要精确的地图 • 精确的地图来自准确的定位
第一讲 视觉SLAM概述 • How to do SLAM?——Se维码 Marker GPS 导轨、磁条 携带于机器人本体上的 IMU 激光 相机
第一讲 视觉SLAM概述
• 相机 • 以一定速率采集图像,形成视频 • 分类 • 单目 Monocular • 双目 Stereo • 深度 RGBD • 其他 鱼眼 全景 Event Camera, etc.
第一讲 视觉SLAM概述
• 回环检测 • 检测机器人是否回到早先位置 • 识别到达过的场景 • 计算图像间的相似性 • 方法:词袋模型
第一讲 视觉SLAM概述
• 建图 • 用于导航、规划、通讯、
可视化、交互等 • 度量地图 vs 拓扑地图 • 稀疏地图 vs 稠密地图
第二讲 相机与图像 Chapter 2: Cameras and Images
3.1 特征点法
• 特征点:图像当中具有代表性的部分
• 可重复性
• 可区别性
• 高效 • 本地 • 特征点的信息
特征描述应该在光照、视角发生少量变化时 仍能保持一致
• 位置、大小、方向、评分等——关键点
• 特征点周围的图像信息——描述子(Descriptor)
• 主流方法:SIFT/SURF/ORB (OpenCV features2d模块)
激光视觉融合slam原理介绍
激光视觉融合slam原理介绍
激光视觉融合SLAM(Simultaneous Localization and Mapping)是一种利用激光和视觉传感器进行环境感知和自主导航的技术。
它可以同时实现机器人的定位和地图构建,适用于室内和室外环境。
激光传感器通过发射激光束并测量其返回时间和强度来获
取环境的深度信息,从而构建三维点云地图。
视觉传感器则通过摄像头捕捉环境的图像,并通过特征提取和匹配技术来获得相机的位姿信息。
激光视觉融合SLAM的原理是将激光和视觉传感器的数据进行融合,以实现更准确和鲁棒的定位和地图构建。
具体步骤如下:
1. 数据采集:机器人同时使用激光传感器和视觉传感器获取环境的深度和图像数据。
2. 特征提取与匹配:图像数据通过特征提取算法提取出关键点,然后通过特征描述子对关键点进行描述。
接着,将激光的扫描数据与图像中的特征进行匹配,以估计机器人在当前帧的位姿。
3. 建图:利用激光数据,根据当前帧的位姿信息,将扫描点云映射到已知的地图中,逐渐构建出三维地图。
4. 位姿估计:通过视觉数据的匹配结果和激光数据的地图匹配结果,结合传感器的运动模型,对机器人在当前帧的位姿进行估计。
5. 优化与更新:使用优化算法对位姿进行优化,以提高定位的准确性。
同时,不断更新地图以适应环境的变化。
通过不断的数据采集、特征提取与匹配、建图、位姿估计和优化与更新等步骤,激光视觉融合SLAM可以实现精确的环境感知和自主导航,为机器人在未知环境中的定位和路径规划提供支持。
视觉slam的分类
视觉SLAM的分类引言随着计算机视觉和机器人技术的发展,视觉SLAM(Simultaneous Localization and Mapping,即时定位与建图)作为一种重要的感知和导航技术,被广泛应用于自主导航、增强现实、机器人导航等领域。
视觉SLAM通过从视觉传感器获取图像信息,并将其与运动估计算法相结合,实现同时定位机器人的位置和构建环境地图。
在这篇文章中,我们将对视觉SLAM的分类进行全面、详细、完整且深入地探讨。
单目视觉SLAM概述单目视觉SLAM是指仅通过单个摄像头获取的图像信息来实现同时定位和建图的技术。
相对于使用多个传感器的多传感器SLAM来说,单目视觉SLAM更加具有挑战性,因为单个视角往往无法提供足够的几何信息来进行定位和建图。
方法•特征点法:基于特征点的方法是最常用的单目视觉SLAM方法之一。
通常通过提取图像中的关键点,并使用特征描述子来进行特征匹配和跟踪。
同时,该方法也会估计摄像头的运动和三维场景点的位置,以实现定位和建图。
•直接法:直接法是另一种常用的单目视觉SLAM方法。
该方法通过将图像像素值直接用于估计摄像头的运动和场景的深度信息。
与特征点法相比,直接法能够获得更多的几何信息,但该方法对光照变化和纹理稀疏场景比较敏感。
应用•自主导航:单目视觉SLAM可以用于机器人的自主导航。
通过结合图像信息和运动估计,机器人可以实时地感知自身位置和周围环境,从而进行路径规划和避障。
•增强现实:单目视觉SLAM也可以应用于增强现实。
通过追踪相机的运动以及对场景中物体的建模,可以将虚拟对象与真实世界进行融合,使用户能够在现实世界中与虚拟对象进行交互。
双目视觉SLAM概述双目视觉SLAM是指基于双目(左右)摄像头获取的图像信息来实现同时定位和建图的技术。
相对于单目视觉SLAM来说,双目视觉SLAM可以通过摄像头之间的视差来获得更多的三维信息,从而提高定位和建图的精度。
方法•立体匹配法:双目视觉SLAM中最常用的方法是立体匹配法。
基于深度学习技术的视觉SLAM研究与实现
基于深度学习技术的视觉SLAM研究与实现视觉SLAM是指利用计算机视觉技术和环境感知技术,实现机器人或无人机在未知环境中的自主导航和定位。
其中,深度学习技术作为目前最为流行的技术之一,已经被广泛应用于视觉SLAM中,以提高其准确性和可靠性。
一、SLAM的基本概念SLAM,即Simultaneous Localization and Mapping,是对移动机器人或无人机在未知环境中的自主导航和定位问题的研究。
其基本原理是通过机器人在运动过程中捕获环境信息,不断更新机器人当前位置以及环境地图的信息,从而实现机器人在未知环境中的自主导航和定位。
二、深度学习在视觉SLAM中的应用深度学习是指通过对数据的深度分析和学习,提取出高层次抽象的特征表示,以更好地完成模式识别、目标检测、语音识别、自然语言处理等任务。
在视觉SLAM中,深度学习技术作为一种有效的工具,已经广泛应用于以下几个方面:1、深度学习在图像处理中的应用视觉SLAM中最为基础的一步是图像处理,包括图像去噪、特征提取、匹配等。
传统的图像处理方法主要依赖于手工设计的特征,但是这种方法不仅需要花费大量时间和精力进行设计和优化,而且容易受到光照、噪声等因素的干扰。
而深度学习由于其强大的自适应性,可以根据数据自动学习特征表示,从而提升图像处理的准确性。
2、深度学习在目标检测中的应用在SLAM中,机器人需要在未知环境中检测出目标物体,如门、椅子等,以更好地完成自主导航和定位。
而深度学习技术可以通过卷积神经网络等方法,实现对目标物体的高效检测和识别。
3、深度学习在三维重建中的应用三维重建是视觉SLAM中的重要任务之一,其主要目的是基于多张不同角度的图像,构建出一个真实的三维环境模型。
而深度学习技术可以通过深度估计、场景重建等方法,实现对环境三维信息的高效提取和重建。
三、视觉SLAM中的挑战与未来发展方向尽管深度学习技术在视觉SLAM中的应用已经取得了不少成果,但是仍然存在着许多挑战和问题。
视觉slam的介绍
•
称为极点
• 实践当中:
•
通过特征匹配得到,P未知,
•
待求(本质矩阵、单应矩阵)
未知
3.3 三角化
• 已知运动时,求解特征点的3D位置 • 几何关系: • 求 时,两侧乘
• 反之亦然
• 或者同时解
•求
的最小二乘解
3.4 PNP
• 已经3D点的空间位置和相机上的投影点, 求相机的旋转和平移(外参)
3.5 光流
• 设 t 时刻位于 x,y 处像素点的灰度值为 • 在 t+dt 时刻,该像素运动到了
• 希望计算运动 dx, dy
• 灰度不变假设: • 注意:灰度不变是一种理想的假设,实际当中由于高光/阴影/材质/曝光等不同,很
可能不成立。
3.5 光流
• 对 t+dt 时刻的灰度进行Taylor展开并保留一阶项:
• 由于灰度不变,所以
• 希望求解dx/dt, dy/dt
因此 =>
x方向梯度
随时间变化
y方向梯度
3.5 光流
• 但本式是一个二元一次线性方程,欠定
• 需要引用额外的约束
• 假定一个窗口(w ´ w)内光度不变:
• 通过超定最小二乘解求得运动 u,v
3.5 光流
最后,我们可以通过光流跟踪的特征的,用PnP、ICP或对极几何来估计 相机运动。总而言之,光流法可以加速基于特征点的视觉里程计算法,避免计 算和匹配描述子的过程,但要求相机运动较慢(或采集频率较高)。
• 相机
• 以一定速率采集图像,形成视频
• 分类
• 单目 Monocular • 双目 Stereo • 深度 RGBD • 其他 鱼眼 全景 Event Camera, etc.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
提要
1. 视觉SLAM概述 2. 相机与图像 3. 视觉里程计 4. 后端优化 5. 回环检测 6. 地图构建
第一讲 视觉SLAM概述
• Question 机器人自主运动两大基本问题
• 我在什么地方?——定位 • 周围长什么样子?——建图 • 机器人的“内外兼修”:定位侧重对自身的了解,建图侧重对外在的了解
• 单目:没有深度,必须通过移动相机产生深度 Moving View Stereo • 双目:通过视差计算深度 Stereo • RGBD:通过物理方法测量深度
第一讲 视觉SLAM概述
仅有一个图像时:
• 可能是很近但很小的物体 • 可能是很远但很大的物体
它们成像相同
必须在移动相机后才能得知相机的运动和 场景的结构
• 物理手段测量深度 • 结构光 ToF • 主动测量,功耗大 • 深度值较准确 • 量程较小,易受干扰
第一讲 视觉SLAM概述
• 视觉SLAM框架 • 前端:VO • 后端:Optimization • 回环检测 Loop Closing • 建图 Mapping
第一讲 视觉SLAM概述
• 视觉里程计 Visual Odometry
• BRIEF • BRIEF-128:在特征点附近的128次像素比较
3.1.1 ORB特征
• 特征匹配
• 通过描述子的差异判断哪些特征为同一个点 • 暴力匹配:比较图1中每个特征和图2特征的距离 • 加速:快速最近邻(FLANN)
实践:特征提取和匹配
3.2 对极几何
• 特征匹配之后,得到了特征点之间的对应关系
• 需要对感光度量化成数值,例如0~255之间的整数(彩色图像还有通道)
实践 点云拼接
第三讲 视觉里程计
Chapter 3: Visual Odometry
3.1 特征点法
• 经典SLAM模型中以位姿——路标(Landmark)来描述SLAM过程 • 路标是三维空间中固定不变的点,能够在特定位姿下观测到
• 准确的定位需要精确的地图 • 精确的地图来自准确的定位
第一讲 视觉SLAM概述
• How to do SLAM?——Sensors
两类传感器 • 安装于环境中的:
• 二维码 Marker • GPS • 导轨、磁条 • 携带于机器人本体上的 • IMU • 激光 • 相机
第一讲 视觉SLAM概述
• 如果只有两个单目图像,得到2D-2D间的关系 ——对极几何 • 如果匹配的是帧和地图,得到3D-2D间的关系 ——PnP • 如果匹配的是RGB-D图,得到3D-3D间的关系 ——ICP
3.2 对极几何
• 几何关系:
• P在两个图像的投影为
• 两个相机之间的变换为
•
在第二个图像上投影为
• 记 ,称为极线,反之亦然
• 数量充足,以实现良好的定位 • 较好的区分性,以实现数据关联
• 在视觉SLAM中,可利用图像特征点作为SLAM中的路标
3.1 特征点法
• 特征点:图像当中具有代表性的部分
• 可重复性 • 可区别性 • 高效 • 本地
• 特征点的信息
• 位置、大小、方向、评分等——关键点
特征描述应该在光照、视角发生少量变化时 仍能保持一致
• 相机
• 以一定速率采集图像,形成视频
• 分类
• 单目 Monocular • 双目 Stereo • 深度 RGBD • 其他 鱼眼 全景 Event Camera, etc.
第一讲 视觉SLAM概述
• 相机的本质
• 以二维投影形式记录了三维世界的信息 • 此过程丢掉了一个维度:距离
• 各类相机主要区别:有没有深度信息
第一讲 视觉SLAM概述
• 当相机运动起来时
• 场景和成像有几何关系 • 近处物体的像运动快 • 远处物体的像运动慢 • 可以推断距离
第一讲 视觉SLAM概述
• 双目相机:左右眼的微小差异判断远近 • 同样,远处物体变化小,近处物体变化大——推算距离 计算量非常大
第一讲 视觉SLAM概述
• 深度相机
第二讲 相机模型
• 小孔成像模型
原始形式 翻转到前面 整理之:
第二讲 相机模型
• 成像平面到像素坐标
代入 得
第二讲 相机模型
展开形式 矩阵形式
传统习惯
左侧是齐次坐标 中间矩阵称为内参数 右侧是非齐次坐标 内参通常在相机生产之后就已固定
第二讲 相机模型
• 除内参外,相机坐标系与世界坐标系还相差一个变换:
• 回环检测
• 检测机器人是否回到早先位置 • 识别到达过的场景 • 计算图像间的相似性
• 方法:词袋模型
第一讲 视觉SLAM概述
• 建图
• 用于导航、规划、通讯、 可视化、交互等
• 度量地图 vs 拓扑地图 • 稀疏地图 vs 稠密地图
第二讲 相机与图像
Chapter 2: Cameras and Images
• 相邻图像估计相机运动 • 基本形式:通过两张图像计算
运动和结构 • 不可避免地有漂移
• 方法
• 特征点法 • 直接法
第一讲 视觉SLAM概述
• 后端优化
• 从带有噪声的数据中优化轨迹和地图 状态估计问题 • 最大后验概率估计 MAP • 前期以EKF为代表,现在以图优化为代表
第一讲 视觉SLAM概述
• 特征点周围的图像信息——描述子(Descriptor)
• 主流方法:SIFT/SURF/ORB (OpenCV features2d模块)
3.1.1 ORB特征
• 例子:ORB特征
• 关键点:Oriented FAST • 描述:BRIEF
• FAST
• 连续N个点的灰度有明显差异
• Oriented FAST • 在FAST基础上计算旋转•Biblioteka 称为极点• 实践当中:
•
通过特征匹配得到,P未知,
•
待求(本质矩阵、单应矩阵)
未知
3.3 三角化
• 已知运动时,求解特征点的3D位置 • 几何关系: • 求 时,两侧乘
• 反之亦然
• 或者同时解
•求
的最小二乘解
• 这里 R, t 或 T 称为外参 • 外参是SLAM估计的目标
先把P从世界坐标变到 相机坐标系下
第二讲 相机模型
• RGB-D相机:物理手段测量深度
• ToF或结构光两种主要原理 • 通常能得到与RGB图对应的深度图
第二讲 图像
• 相机成像后,生成了图像 • 图像在计算机中以矩阵形式存储(二维数组)