Robust 2D Tracking for Real-Time Augmented Reality

合集下载

虚拟动点运动捕捉技术赋能阿兹海默症研究,OptiTrack还有这样的作用!

虚拟动点运动捕捉技术赋能阿兹海默症研究,OptiTrack还有这样的作用!

虚拟动点运动捕捉技术赋能阿兹海默症研究,OptiTrack还有这样的作用!2018年9月,罗切斯特大学医疗中心的神经科学家们开始使用一种世界前沿研究平台——MoBI系统(全称Mobile Brain/Body Imaging system)——来帮助研究治疗自闭症、阿兹海默症及外伤性脑损伤。

MoBI系统结合了虚拟现实、大脑监测技术以及受好莱坞启发的运动捕捉技术。

它能有效帮助神经科学家研究人类脑神经失调带来的身体运动协调困难,以及为什么我们的大脑在同时进行多任务时会产生挣扎。

原理解析目前MoBI平台被安置在德尔蒙特学院认知神经生理学实验室,集合了几种高科技系统,其中之一便是电影工作室制作CGI特效(Computer Graphics Interface)时常用的运动捕捉技术。

实验参与者需身穿附着反射式标记点的黑色运动捕捉服,并在一间安装有16台亚毫米精度的OptiTrack高速运动捕捉摄像机的房间中完成“在跑步机上走路”和“物体操作”的动作。

运动捕捉服装上的反射式标记点随参与者的运动而不断变换空间位置,并可实时将实验室内16台OptiTrack摄像机发出的红外光反射回至所有摄像机,摄像机接收到每个标记点的空间坐标数据后,将数据实时传输到软件中进行解算,形成刚体,并可将6DoF信息实时传输,驱动研究人员电脑端的3D虚拟模型。

实验参与者在走动过程中,他们面前的屏幕上会投射出沉浸式可互动虚拟场景(如城市街景),需要参与者带路前行。

他们也可以被要求执行任务,做出决策并回应屏幕上的内容。

实验进行时,通过使用高密度EEG(Electroencephalogram:脑动电流图)——参与者头戴金属电极帽,电极帽上的小金属片紧贴头皮——科研人员可实时监测参与者脑电活动。

当运动捕捉数据与EEG监测实时同步,科研人员就可以在实验参与者走路和执行任务时观察其大脑哪些区域被激活,并研究其在移动、执行任务以及同时进行以上两种动作时,大脑如何给予反馈。

Computer-Vision计算机视觉英文ppt

Computer-Vision计算机视觉英文ppt
At the same time, AI MIT laboratory has attracted many famous scholars from the world to participate in the research of machine vision,which included the theory of machine vision , algorithm and design of system .
Its mainstream research is divided into three stages:
Stage 1: Research on the visual basic method ,which take the model world as the main object;
Stage 2: Research on visual model ,which is based on the computational theory;
the other is to rebuild the three dimensional object according to the two-dimensional projection images .
History of computer vision
1950s: in this period , statistical pattern recognition is most applied in computer vision , it mainly focuse on the analysis and identification of two-dimensional image,such as: optical character recognition, the surface of the workpiece, the analysis and interpretation of the aerial image.

基于肤色和Gabor纹理的粒子滤波人脸跟踪

基于肤色和Gabor纹理的粒子滤波人脸跟踪

基于肤色和Gabor纹理的粒子滤波人脸跟踪田天;陈刚【摘要】Tracking method based on single color information may suffer interference from similar color. There exist limitations when applied to complex scenes. Aiming at this problem, this paper proposes an algorithm combining skin color and Gabor texture in the basic frame of particle filtering. It extracts skin color histogram and Gabor texture eigenvector for face region from video frequency, then calculates particle weights and estimates system state. Democratic integration strategy is applied to adaptively adjust fusion weights of these observational features, thus to enhance higher target description reliability. Better tracking accuracy canbe achieved by taking advantage of color video skin detection, multi-resolution, multi-orientation texture extraction of Gabor filter group, and particle filter’s adaptability to non-Gaussian, nonlinear systems. Experimental results show this method is robust to overcome interference of irrelevant skin color region, complex texture background, target occlusion or fast moving.%基于单一颜色信息的跟踪方法容易受到相似颜色的干扰,应用于复杂场景时存在局限性。

面向复杂场景的目标跟踪算法研究

面向复杂场景的目标跟踪算法研究

面对复杂场景的目标跟踪算法探究关键词:目标跟踪;复杂场景;图像增强;多目标跟踪;神经网络一、引言目标跟踪是计算机视觉领域中重要的探究课题之一。

它在许多领域中都有广泛的应用,例如视频监控、自动驾驶和无人机等。

目标跟踪的目标是在视频序列中找到特定目标的位置,并在图像序列中跟踪它的运动轨迹。

但是,在实际应用中,目标跟踪往往会面临浩繁挑战,例如复杂背景、光照变化和目标遮挡等。

因此,如何在复杂场景中实现高效的目标跟踪一直是该领域的探究重点。

二、目标跟踪算法分类目标跟踪算法可以分为两类:基于区域的跟踪算法和基于点的跟踪算法。

基于区域的算法通过检测人工定义的目标区域来实现跟踪。

其中,常用的基于区域的跟踪算法包括均值漂移、卡尔曼滤波、粒子滤波和相关滤波等。

而基于点的跟踪算法则是通过识别特征点,并持续计算它们的相对位置来跟踪目标。

在基于点的跟踪算法中,SIFT和SURF算法是最常用的。

虽然两种算法的原理不同,但它们都具有很强的鲁棒性,在光照变化和目标旋转等状况下均能实现可靠的跟踪效果。

三、面对复杂场景的目标跟踪算法在复杂场景下,目标跟踪会受到许多干扰。

为了解决这些问题,探究人员们提出了许多新的算法。

1. 图像增强技术光照变化是导致目标跟踪误差的主要原因之一。

为了解决这个问题,许多探究者使用图像增强技术来改善图像质量。

常用的图像增强技术包括直方图均衡化、自适应直方图均衡化和对比度受限自适应直方图均衡化等。

这些技术可以将输入图像的亮度范围调整到更适合跟踪的范围。

2. 多目标跟踪算法在某些状况下,需要同时跟踪多个目标。

但是,传统的单目标跟踪算法并不能满足这种需求。

因此,探究人员提出了一些针对多目标跟踪的算法,例如基于马尔科夫随机场的多目标跟踪算法、基于分布式卡尔曼滤波的多目标跟踪算法和基于整体局部最小代价的多目标跟踪算法等。

3. 神经网络结构近年来,神经网络在计算机视觉中越来越受到重视。

许多探究人员将神经网络应用于目标跟踪,并取得了不错的效果。

《2024年多尺度特征融合的轻量深度学习目标检测算法研究》范文

《2024年多尺度特征融合的轻量深度学习目标检测算法研究》范文

《多尺度特征融合的轻量深度学习目标检测算法研究》篇一一、引言随着深度学习技术的快速发展,目标检测在计算机视觉领域的应用日益广泛。

其中,多尺度特征融合的深度学习算法,凭借其在处理不同尺寸目标时的出色性能,成为研究热点。

然而,如何实现在保证准确性的同时降低模型的复杂度与计算成本,以实现轻量化的目标检测算法,成为了研究的重要挑战。

本文就这一课题,进行深入研究,旨在探索出一种有效的多尺度特征融合的轻量深度学习目标检测算法。

二、相关技术概述首先,我们来了解下相关的技术背景。

深度学习算法通过学习大量数据中的模式和规律,进行目标的检测和识别。

在目标检测中,多尺度特征融合技术被广泛应用于处理不同尺寸的目标。

同时,轻量级模型的研究旨在减少模型的复杂度与计算成本,以提高其实时性和适用性。

而轻量深度学习算法的目标则是兼顾模型的性能与复杂度。

三、算法介绍本部分主要介绍多尺度特征融合的轻量深度学习目标检测算法的核心原理与实现过程。

首先,通过设计一个能够同时捕捉多尺度信息的网络结构,将不同层次的特征信息进行融合。

接着,通过轻量级的设计思路,减少网络的复杂度与计算成本。

此外,为了进一步提升模型的性能,我们还引入了其他先进的深度学习技术进行优化。

具体来说,我们的算法包括以下几个步骤:1. 构建一个具有多尺度感知能力的网络结构。

我们通过改进现有的深度学习模型,设计出一个能够同时捕捉不同尺度信息的网络结构。

这样,无论目标的大小如何变化,我们的模型都能有效地进行检测。

2. 特征融合。

我们将不同层次的特征信息进行融合,以充分利用不同层次的特征信息。

这有助于提高模型的性能,尤其是在处理多尺度目标时。

3. 轻量化设计。

我们通过减少网络的复杂度与计算成本,以实现轻量化的目标检测算法。

具体来说,我们采用了一些高效的运算操作和参数优化技术,如卷积分解、模型剪枝等。

4. 引入其他先进的深度学习技术进行优化。

如使用注意力机制提高模型的关注力、使用损失函数调整来提高模型的鲁棒性等。

种群密度调查方法的综述

种群密度调查方法的综述

种群密度调查方法的综述目录一、内容概括 (2)1.1 背景与意义 (3)1.2 国内外研究进展概述 (4)二、种群密度调查方法分类 (5)2.1 样地法 (6)2.1.1 传统样地法 (7)2.1.2 遥感样地法 (8)2.2 标记重捕法 (9)2.2.1 标记技术 (10)2.2.2 重捕技术 (12)2.2.3 参数估计方法 (13)2.3 其他种群密度调查方法 (14)2.3.1 样线法 (16)2.3.2 标志重捕法 (17)2.3.3 随机数表法 (18)2.3.4 二氧化碳浓度法 (19)2.3.5 卫星遥感技术 (20)三、种群密度调查的应用案例 (21)3.1 森林生态系统 (22)3.2 农田生态系统 (23)3.3 城市生态系统 (25)3.4 自然保护区生态系统 (26)四、种群密度调查方法的评价与改进 (27)4.1 各类方法的优缺点分析 (29)4.2 方法的选择与优化策略 (30)4.3 新技术在种群密度调查中的应用前景 (31)五、结论与展望 (32)5.1 研究成果总结 (33)5.2 存在问题与不足 (34)5.3 对未来研究的建议 (36)一、内容概括本文综述了关于种群密度调查方法的相关研究,详细介绍了种群密度调查的基本概念、目的以及常用的调查方法。

文章概括了种群密度调查在生态学、生物学以及自然环境保护领域的重要性,并指出了当前研究的主要焦点和争议点。

种群密度调查的基本概念:介绍了种群密度的定义、种群密度调查的意义以及其在生态学、生物学领域的应用价值。

种群密度调查的目的:阐述了种群密度调查的目的,包括评估种群数量、预测种群动态、监测环境变化对种群的影响等。

种群密度调查方法的分类与介绍:详细介绍了目前常用的种群密度调查方法,包括标记重捕法、样方法、目视估计法等,并对各种方法的优缺点进行了对比分析。

种群密度调查的实践应用:结合具体案例,介绍了种群密度调查在自然保护区管理、野生动物保护、农业生态等领域的应用情况。

基于深度学习的无人机目标检测与跟踪技术研究

基于深度学习的无人机目标检测与跟踪技术研究

基于深度学习的无人机目标检测与跟踪技术研究无人机目标检测与跟踪是无人机领域的一个重要研究方向,它对无人机在各种应用场景中的自主飞行和任务执行能力具有关键性的作用。

随着深度学习技术的逐渐成熟,基于深度学习的无人机目标检测与跟踪技术正在快速发展,并取得了令人瞩目的成果。

无人机目标检测与跟踪技术的研究主要涉及到目标检测和目标跟踪两个方面。

目标检测是指在无人机拍摄的图像或视频中,通过算法自动识别和定位感兴趣的目标物体。

而目标跟踪则是指在目标检测的基础上,通过连续追踪目标物体的位置、大小和形状等特征,实现对目标的持续追踪。

在基于深度学习的无人机目标检测与跟踪技术中,卷积神经网络(Convolutional Neural Network, CNN)是一种常用的深度学习架构。

它具有强大的图像特征提取和分类能力,可以自动学习并提取图像中的高级特征。

对于无人机目标检测任务,研究者们通常采用两阶段检测方法。

首先,利用卷积神经网络提取图像的特征,然后使用目标检测算法进行目标定位和分类。

其中,YOLO(You Only Look Once)和Faster R-CNN(Region-Based Convolutional Neural Networks)等方法被广泛应用于无人机目标检测任务中。

这些方法通过对图像进行密集的特征提取和分类,可以实现快速准确的目标检测。

除了目标检测,无人机目标跟踪也是一个非常重要的研究方向。

针对无人机目标跟踪任务,研究者们提出了许多基于深度学习的跟踪算法。

这些算法通常采用离线训练和在线跟踪两个阶段。

在离线训练阶段,通过大量的有标注数据对模型进行训练,在线跟踪阶段则通过实时获取的图像数据,使用训练好的模型对目标进行跟踪。

其中,Siamese网络和深度学习相关滤波器(DCF)等方法被广泛应用于无人机目标跟踪任务,它们通过对目标和背景之间的关系进行学习,实现对目标的准确跟踪。

基于深度学习的无人机目标检测与跟踪技术在无人机领域具有广阔的应用前景。

二阶段目标检测算法

二阶段目标检测算法

二阶段目标检测算法一、原理及流程具体流程如下:1.输入图像:将待检测的图像输入到算法中。

2.候选框生成:算法通过图像特征和先验知识生成多个候选框,候选框可能包含目标物体。

3.ROI特征提取:对于每个候选框,提取ROI(感兴趣区域)特征,通常使用卷积神经网络(CNN)提取特征。

4.候选框分类:通过分类器对ROI特征进行分类,判断候选框是否包含目标物体。

5.NMS(非极大值抑制):对于多个重叠的候选框,通过NMS方法选择得分最高的候选框作为最终检测结果。

6.输出结果:输出检测结果,即定位、分类和置信度。

二、主要算法及方法1. R-CNN(Region-based Convolutional Neural Network)系列:R-CNN是二阶段目标检测方法的开创者,它通过选择性方法生成候选框,并使用CNN提取ROI特征,最后使用支持向量机(SVM)对候选框进行分类。

后续改进的方法有Fast R-CNN、Faster R-CNN等。

2. SPP-Net(Spatial Pyramid Pooling Network):SPP-Net通过将不同尺度特征图输入到全连接层,实现了对任意尺度输入图像进行检测的能力。

3. SSD(Single Shot MultiBox Detector):SSD是一种基于锚框的目标检测算法,它在特征图上密集地使用多尺度锚框,通过卷积和非线性变换来预测候选框的位置和类别。

4. YOLO(You Only Look Once)系列:YOLO直接将目标检测问题转化为回归问题,通过将图像分为网格并预测每个网格的边界框和类别来实现目标检测。

YOLOv4是目前最新版本,它通过改变网络结构和训练策略进一步提高了检测性能。

三、应用及优势1.目标检测:二阶段目标检测算法在许多计算机视觉任务中都有广泛的应用,如人脸检测、行人检测、车辆检测等。

2.视频监控:二阶段目标检测算法可以用于实时视频监控系统,实现对目标物体的快速检测和跟踪。

基于深度学习的航天器目标检测与跟踪技术研究

基于深度学习的航天器目标检测与跟踪技术研究

基于深度学习的航天器目标检测与跟踪技术研究深度学习技术的快速发展使得目标检测与跟踪在航天器领域得到广泛应用。

本文将探讨基于深度学习的航天器目标检测与跟踪技术的研究进展,并讨论其在实际应用中的挑战和前景。

一、介绍航天器目标检测与跟踪技术的背景航天器目标检测与跟踪旨在准确、实时地检测和跟踪天空中的航天器,对于航天器的识别、监测和导航具有重要意义。

传统的机器学习方法在这一领域存在多种限制,而基于深度学习的目标检测与跟踪技术在准确性和鲁棒性方面取得了显著进展。

二、基于深度学习的航天器目标检测技术1. 卷积神经网络(CNN)在航天器目标检测中的应用卷积神经网络(CNN)是深度学习中最常用的技术,其在航天器目标检测中发挥了重要作用。

基于CNN的目标检测算法通过多层卷积和池化层提取特征,并通过全连接层进行分类和定位。

这种方法具有高度的准确性和鲁棒性,并且可以处理复杂的航天器目标。

2. 目标检测中的区域提议技术区域提议技术是目标检测中的一个重要环节,其目的是在图像中生成可能包含目标的候选区域。

基于深度学习的区域提议技术使用了快速而精确的方法,例如基于深度特征的选择性搜索(Selective Search)和候选区域生成网络(RPN)。

这些方法能够有效地生成航天器目标的候选区域,从而加快了目标检测的速度。

三、基于深度学习的航天器目标跟踪技术1. 单目标跟踪技术在单目标跟踪中,一个目标在视频序列中被连续追踪,通过预测目标的位置和形状。

基于深度学习的单目标跟踪技术采用了循环神经网络(RNN)和卷积神经网络(CNN)等方法,能够更准确地跟踪航天器目标。

2. 多目标跟踪技术与单目标跟踪不同,多目标跟踪需要同时追踪多个目标。

基于深度学习的多目标跟踪技术使用了卷积神经网络(CNN)和递归神经网络(RNN)等方法,结合目标检测算法进行多目标追踪。

这种方法能够同时追踪多个航天器目标,并保持较高的准确性。

四、基于深度学习的航天器目标检测与跟踪技术的挑战和前景1. 挑战虽然基于深度学习的航天器目标检测与跟踪技术已经取得了显著的进展,但仍存在一些挑战。

双目视觉测距国内外研究综述

双目视觉测距国内外研究综述

双目视觉测距国内外研究综述一、引言双目视觉测距是计算机视觉领域的重要研究方向之一,它通过模拟人类双眼来获取场景的深度信息。

双目视觉测距技术在机器人导航、三维重构、智能交通等领域具有广泛的应用前景。

本文将对国内外双目视觉测距的研究进行综述,以期全面、详细、完整地探讨该主题。

二、双目视觉测距原理双目视觉测距原理基于视差的概念,即两个摄像机观察同一场景时,由于视点的差异,同一物体在两个图像中的位置会有所偏移。

通过计算这个偏移量,可以推导出物体到摄像机的距离。

2.1 视差计算方法视差计算方法可以分为基于特征点的方法和基于区域的方法。

2.1.1 基于特征点的方法基于特征点的方法通过提取图像中的特征点,如角点、边缘等,计算特征点在两个图像中的视差,从而得到深度信息。

常用的算法有SIFT、SURF、ORB等。

2.1.2 基于区域的方法基于区域的方法将图像划分为若干个区域,然后计算这些区域的视差。

常见的算法有块匹配、全局优化等。

2.2 双目标定双目标定是双目视觉测距的前提,它的目标是确定两个摄像机之间的几何关系。

常用的双目标定方法有张正友标定法、Tsai标定法等。

三、国内双目视觉测距研究国内在双目视觉测距方面的研究取得了很多进展,以下是其中的几个重要研究成果。

3.1 XXX方法XXX方法是一种基于特征点的双目视觉测距方法,它通过提取图像中的关键点,并利用这些关键点的视差信息计算深度。

该方法在实验中取得了较好的测距精度。

3.2 XXX方法XXX方法是一种基于区域的双目视觉测距方法,它将图像划分为多个区域,并利用区域间的视差信息计算深度。

该方法在复杂场景中表现出较好的鲁棒性。

3.3 XXX方法XXX方法是一种结合了特征点和区域的双目视觉测距方法,它通过提取图像中的关键点和区域,综合利用它们的视差信息计算深度。

该方法在复杂光照条件下具有较好的稳定性。

四、国外双目视觉测距研究国外在双目视觉测距方面也有很多杰出的研究成果,以下是其中的几个代表性研究。

双目视觉测距国内外研究综述

双目视觉测距国内外研究综述

双目视觉测距国内外研究综述双目视觉测距技术是一种利用两个摄像机来获取深度信息的技术。

随着计算机视觉和机器视觉技术的不断发展,双目视觉测距技术已经在各个领域得到了广泛应用。

本文旨在综述近年来在双目视觉测距领域国内外的研究现状和最新进展。

国内双目视觉测距研究我国的双目视觉测距研究起步较早,早在上世纪80年代就开始有学者开始探究双目视觉测距的基本理论。

近年来,随着深度学习等新兴技术的兴起,一批新的双目视觉测距算法相继出现。

其中,基于卷积神经网络(CNN)的双目视觉测距算法得到了广泛应用。

通过训练一个全卷积神经网络,可以在不同数据集上得到较好的结果(如KITTI数据集上的误差小于1%),证明了基于CNN的双目视觉测距算法的高效性和准确性。

国外双目视觉测距研究国外的双目视觉测距研究也取得了很大的进展。

近年来,许多高效和准确的双目视觉测距算法相继出现。

其中,基于卷积神经网络的双目视觉测距算法也在国外得到了广泛的研究。

例如,Deep3DBox、DispNet和Pseudo-lidar等算法,在KITTI数据集上取得了很好的效果。

同时,也有一些基于几何学的传统算法,如MatchNet等,可以取得较好的效果。

双目视觉测距技术的应用双目视觉测距技术在计算机视觉和机器人领域得到了广泛的应用。

例如,在自动驾驶领域,通过双目相机获取道路上车辆和物体的深度信息,可以实现车辆的自动驾驶;在机器人领域,双目相机可以帮助机器人对周围环境进行3D建模和识别,实现机器人导航和路径规划等功能。

结论双目视觉测距技术作为一种获取深度信息的有效手段,已经得到了广泛应用。

基于卷积神经网络的双目视觉测距算法在近年来得到了较广泛的关注和研究,取得了较好的效果。

双目视觉测距技术在计算机视觉和机器人领域有着广泛的应用前景,预计未来还将继续得到研究和应用。

基于改进ORB_的无人机影像拼接算法

基于改进ORB_的无人机影像拼接算法

第 22卷第 4期2023年 4月Vol.22 No.4Apr.2023软件导刊Software Guide基于改进ORB的无人机影像拼接算法张平,孙林,何显辉(山东科技大学测绘与空间信息学院,山东青岛 266590)摘要:针对传统图像拼接算法在无人机遥感影像拼接过程中速度慢、效率低、无法满足实时准确拼接要求的问题,提出一种改进ORB的图像拼接算法。

首先构建尺度金字塔并利用ORB算法提取特征点,利用BEBLID描述符对特征点进行特征描述,采用最近邻比值(NNDR)算法进行粗匹配;然后基于特征点投票构建最优化几何约束对特征点进一步优化,利用随机采样一致性(RANSAC)算法计算变换矩阵,获取高精度变换矩阵;最后利用改进的渐入渐出加权融合算法实现图像拼接。

实验结果表明,所提算法配准精度最高达到100%,配准耗时低于0.91s,拼接图像信息熵达到6.807 9。

相较于传统算法,所提算法具有更高的拼接效率,在降低图像拼接时间的同时能够获取更高质量的拼接图像,性能显著提升。

关键词:图像拼接;多尺度FAST检测;BEBLID特征;最优化几何约束DOI:10.11907/rjdk.222267开放科学(资源服务)标识码(OSID):中图分类号:TP391.41 文献标识码:A文章编号:1672-7800(2023)004-0156-06UAV Image Mosaic Algorithm Based on Improved ORBZHANG Ping, SUN Lin, HE Xian-hui(College of Geodesy and Geomatics, Shandong University of Science and Technology, Qingdao 266590, China)Abstract:Aiming at the problems of slow speed and low efficiency of traditional image stitching algorithm in UAV remote sensing image stitching process, which cannot meet the requirements of real-time and accurate stitching, an improved ORB image stitching algorithm is pro‐posed. Firstly, the scale pyramid is constructed and the feature points are extracted by ORB algorithm, and then the feature points are de‐scribed by BEBLID descriptor; The nearest neighbor ratio (NNDR) algorithm is used for rough matching, and then the optimal geometric con‐straints are constructed based on the feature point voting to further optimize the feature points. The random sampling consistency (RANSAC)algorithm is used to calculate the transformation matrix and obtain the high-precision transformation matrix; Finally, the improved gradual in and gradual out weighted fusion algorithm is used to realize image mosaic. The experimental results show that the registration accuracy of the proposed algorithm reaches 100% at the highest, the registration time is less than 0.91s, and the information entropy of mosaic image reaches 6.807 9. Compared with the traditional algorithm,the algorithm in this paper has higher splicing efficiency,and can obtain higher quality splicing images while reducing the image splicing time. The algorithm performance is significantly improved.Key Words:image mosaic; multi scale FAST detection; BEBLID feature; optimal geometric constraint0 引言近年来,无人机航拍摄影技术越来越成熟,在遥感监测[1]、电力巡检[2]、灾害勘察[3]、军事侦察[4]等领域均有广泛应用。

S T A P L E 目 标 跟 踪 算 法

S T A P L E 目 标 跟 踪 算 法

目标跟踪相关资源(含模型,CVPR2017论文,代码,牛人等)Visual TrackersECO: Martin Danelljan, Goutam Bhat, Fahad Shahbaz Khan, Michael Felsberg. "ECO: Efficient Convolution Operators for Tracking." CVPR (2017). [paper] [project] [github]CFNet: Jack Valmadre, Luca Bertinetto, Jo?o F. Henriques, Andrea Vedaldi, Philip H. S. Torr. "End-to-end representation learning for Correlation Filter based tracking." CVPR (2017). [paper] [project] [github]CACF: Matthias Mueller, Neil Smith, Bernard Ghanem. "Context-Aware Correlation Filter Tracking." CVPR (2017 oral). [paper] [project] [code]RaF: Le Zhang, Jagannadan Varadarajan, Ponnuthurai Nagaratnam Suganthan, Narendra Ahuja and Pierre Moulin "Robust Visual Tracking Using Oblique Random Forests." CVPR (2017). [paper] [project] [code]MCPF: Tianzhu Zhang, Changsheng Xu, Ming-Hsuan Yang. "Multi-task Correlation Particle Filter for Robust Visual Tracking ." CVPR (2017). [paper] [project] [code]ACFN: Jongwon Choi, Hyung Jin Chang, Sangdoo Yun, Tobias Fischer, Yiannis Demiris, and Jin Young Choi. "Attentional Correlation Filter Network for Adaptive Visual Tracking." CVPR (2017) [paper] [project] [test code)][training code]LMCF: Mengmeng Wang, Yong Liu, Zeyi Huang. "Large Margin Object Tracking with Circulant Feature Maps." CVPR (2017). [paper] [zhihu]ADNet: Sangdoo Yun, Jongwon Choi, Youngjoon Yoo, Kimin Yun, Jin Young Choi. "Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning ." CVPR (2017). [paper] [project]CSR-DCF: Alan Luke?i?, Tomá? Vojí?, Luka ?ehovin, Ji?í Matas, Matej Kristan. "Discriminative Correlation Filter with Channel and Spatial Reliability." CVPR (2017). [paper][code]BACF: Hamed Kiani Galoogahi, Ashton Fagg, Simon Lucey. "Learning Background-Aware Correlation Filters for Visual Tracking." CVPR (2017). [paper]Bohyung Han, Jack Sim, Hartwig Adam "BranchOut: Regularization for Online Ensemble Tracking with Convolutional Neural Networks." CVPR (2017).SANet: Heng Fan, Haibin Ling. "SANet: Structure-Aware Network for Visual Tracking." CVPRW (2017). [paper] [project] [code]DNT: Zhizhen Chi, Hongyang Li, Huchuan Lu, Ming-Hsuan Yang. "Dual Deep Network for Visual Tracking." TIP (2017). [paper]DRT: Junyu Gao, Tianzhu Zhang, Xiaoshan Yang, Changsheng Xu. "Deep Relative Tracking." TIP (2017). [paper]BIT: Bolun Cai, Xiangmin Xu, Xiaofen Xing, Kui Jia, Jie Miao, Dacheng Tao. "BIT: Biologically Inspired Tracker." TIP (2016). [paper] [project][github]SiameseFC: Luca Bertinetto, Jack Valmadre, Jo?o F. Henriques, Andrea Vedaldi, Philip H.S. Torr. "Fully-Convolutional Siamese Networks for Object Tracking." ECCV workshop (2016). [paper] [project] [github]GOTURN: David Held, Sebastian Thrun, Silvio Savarese. "Learning to Track at 100 FPS with Deep Regression Networks." ECCV (2016). [paper] [project] [github]C-COT: Martin Danelljan, Andreas Robinson, Fahad Khan, Michael Felsberg. "Beyond Correlation Filters: Learning Continuous Convolution Operators for Visual Tracking." ECCV (2016). [paper] [project] [github]CF+AT: Adel Bibi, Matthias Mueller, and Bernard Ghanem. "Target Response Adaptation for Correlation Filter Tracking." ECCV (2016). [paper] [project]MDNet: Nam, Hyeonseob, and Bohyung Han. "Learning Multi-Domain Convolutional Neural Networks for Visual Tracking." CVPR (2016). [paper] [VOT_presentation] [project] [github]SINT: Ran Tao, Efstratios Gavves, Arnold W.M. Smeulders. "Siamese Instance Search for Tracking." CVPR (2016). [paper] [project]SCT: Jongwon Choi, Hyung Jin Chang, Jiyeoup Jeong, Yiannis Demiris, and Jin Young Choi. "Visual Tracking Using Attention-Modulated Disintegration and Integration." CVPR (2016). [paper] [project]STCT: Lijun Wang, Wanli Ouyang, Xiaogang Wang, and Huchuan Lu. "STCT: Sequentially TrainingConvolutional Networks for Visual Tracking." CVPR (2016). [paper] [github]SRDCFdecon: Martin Danelljan, Gustav H?ger, Fahad Khan, Michael Felsberg. "Adaptive Decontamination of the Training Set: A Unified Formulation for Discriminative Visual Tracking." CVPR (2016). [paper] [project]HDT: Yuankai Qi, Shengping Zhang, Lei Qin, Hongxun Yao, Qingming Huang, Jongwoo Lim, Ming-Hsuan Yang. "Hedged Deep Tracking." CVPR (2016). [paper] [project]Staple: Luca Bertinetto, Jack Valmadre, Stuart Golodetz, Ondrej Miksik, Philip H.S. Torr. "Staple: Complementary Learners for Real-Time Tracking." CVPR (2016). [paper] [project] [github]DLSSVM: Jifeng Ning, Jimei Yang, Shaojie Jiang, Lei Zhang and Ming-Hsuan Yang. "Object Tracking via Dual Linear Structured SVM and Explicit Feature Map." CVPR (2016). [paper] [code] [project]CNT: Kaihua Zhang, Qingshan Liu, Yi Wu, Minghsuan Yang. "Robust Visual Tracking via Convolutional Networks Without Training." TIP (2016). [paper] [code]DeepSRDCF: Martin Danelljan, Gustav H?ger, Fahad Khan, Michael Felsberg. "Convolutional Features for Correlation Filter Based Visual Tracking." ICCV workshop (2015). [paper] [project]SRDCF: Martin Danelljan, Gustav H?ger, Fahad Khan, Michael Felsberg. "Learning Spatially Regularized Correlation Filters for Visual Tracking." ICCV (2015). [paper][project]CNN-SVM: Seunghoon Hong, Tackgeun You, Suha Kwak and Bohyung Han. "Online Tracking by Learning Discriminative Saliency Map with Convolutional Neural Network ." ICML (2015) [paper] [project]CF2: Chao Ma, Jia-Bin Huang, Xiaokang Yang and Ming-Hsuan Yang. "Hierarchical Convolutional Features for Visual Tracking." ICCV (2015) [paper] [project] [github]FCNT: Lijun Wang, Wanli Ouyang, Xiaogang Wang, and Huchuan Lu. "Visual Tracking with Fully Convolutional Networks." ICCV (2015). [paper] [project] [github]LCT: Chao Ma, Xiaokang Yang, Chongyang Zhang, Ming-Hsuan Yang. "Long-term Correlation Tracking." CVPR (2015). [paper] [project] [github]RPT: Yang Li, Jianke Zhu and Steven C.H. Hoi. "Reliable Patch Trackers: Robust Visual Tracking by Exploiting Reliable Patches." CVPR (2015). [paper] [github]CLRST: Tianzhu Zhang, Si Liu, Narendra Ahuja, Ming-Hsuan Yang, Bernard Ghanem."Robust Visual Tracking Via Consistent Low-Rank Sparse Learning." IJCV (2015). [paper] [project] [code]DSST: Martin Danelljan, Gustav H?ger, Fahad Shahbaz Khan and Michael Felsberg. "Accurate Scale Estimation for Robust Visual Tracking." BMVC (2014). [paper] [PAMI] [project]MEEM: Jianming Zhang, Shugao Ma, and Stan Sclaroff. "MEEM: Robust Tracking via Multiple Experts using Entropy Minimization." ECCV (2014). [paper] [project]TGPR: Jin Gao,Haibin Ling, Weiming Hu, Junliang Xing. "Transfer Learning Based Visual Tracking with Gaussian Process Regression." ECCV (2014). [paper] [project]STC: Kaihua Zhang, Lei Zhang, Ming-Hsuan Yang, David Zhang. "Fast Tracking via Spatio-Temporal Context Learning." ECCV (2014). [paper] [project]SAMF: Yang Li, Jianke Zhu. "A Scale Adaptive Kernel Correlation Filter Tracker with Feature Integration." ECCV workshop (2014). [paper] [github]KCF: Jo?o F. Henriques, Rui Caseiro, Pedro Martins, Jorge Batista. "High-Speed Tracking with Kernelized Correlation Filters." TPAMI (2015). [paper] [project]OthersRe3: Daniel Gordon, Ali Farhadi, Dieter Fox. "Re3 : Real-Time Recurrent Regression Networks for Object Tracking." arXiv (2017). [paper] [code]DCFNet: Qiang Wang, Jin Gao, Junliang Xing, Mengdan Zhang, Weiming Hu. "Modeling and Propagating CNNs in a Tree Structure for Visual Tracking." arXiv (2017). [paper] [code]TCNN: Hyeonseob Nam, Mooyeol Baek, Bohyung Han. "Modeling and Propagating CNNs in a Tree Structure for Visual Tracking." arXiv (2016). [paper] [code]RDT: Janghoon Choi, Junseok Kwon, Kyoung Mu Lee. "Visual Tracking by Reinforced Decision Making." arXiv (2017). [paper]MSDAT: Xinyu Wang, Hanxi Li, Yi Li, Fumin Shen, Fatih Porikli . "Robust and Real-time Deep Tracking Via Multi-Scale DomainAdaptation." arXiv (2017). [paper]RLT: Da Zhang, Hamid Maei, Xin Wang, Yuan-Fang Wang. "Deep Reinforcement Learning for Visual Object Tracking in Videos." arXiv (2017). [paper]SCF: Wangmeng Zuo, Xiaohe Wu, Liang Lin, Lei Zhang, Ming-Hsuan Yang. "Learning Support Correlation Filters for Visual Tracking." arXiv (2016). [paper] [project]DMSRDCF: Susanna Gladh, Martin Danelljan, Fahad Shahbaz Khan, Michael Felsberg. "Deep Motion Features for Visual Tracking." ICPR Best Paper (2016). [paper]CRT: Kai Chen, Wenbing Tao. "Convolutional Regression for Visual Tracking." arXiv (2016). [paper]BMR: Kaihua Zhang, Qingshan Liu, and Ming-Hsuan Yang. "Visual Tracking via Boolean Map Representations." arXiv (2016). [paper]YCNN: Kai Chen, Wenbing Tao. "Once for All: a Two-flow Convolutional Neural Network for Visual Tracking." arXiv (2016). [paper]Learnet: Luca Bertinetto, Jo?o F. Henriques, Jack Valmadre, Philip H. S. Torr, Andrea Vedaldi. "Learning feed-forward one-shot learners." NIPS (2016). [paper]ROLO: Guanghan Ning, Zhi Zhang, Chen Huang, Zhihai He, Xiaobo Ren, Haohong Wang. "Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking." arXiv (2016). [paper] [project] [github]Yao Sui, Ziming Zhang, Guanghui Wang, Yafei Tang, Li Zhang. "Real-Time Visual Tracking: Promoting the Robustness ofCorrelation Filter Learning." ECCV (2016). [paper] [project]Yao Sui, Guanghui Wang, Yafei Tang, Li Zhang. "Tracking Completion." ECCV (2016). [paper] [project]EBT: Gao Zhu, Fatih Porikli, and Hongdong Li. "Beyond Local Search: Tracking Objects Everywhere with Instance-Specific Proposals." CVPR (2016). [paper] [exe]RATM: Samira Ebrahimi Kahou, Vincent Michalski, Roland Memisevic. "RATM: Recurrent Attentive Tracking Model." arXiv (2015). [paper] [github]DAT: Horst Possegger, Thomas Mauthner, and Horst Bischof. "In Defense of Color-based Model-free Tracking." CVPR (2015). [paper] [project] [code]RAJSSC: Mengdan Zhang, Junliang Xing, Jin Gao, Xinchu Shi, Qiang Wang, Weiming Hu. "Joint Scale-Spatial Correlation Tracking with Adaptive Rotation Estimation." ICCV workshop (2015). [paper] [poster]SO-DLT: Naiyan Wang, Siyi Li, Abhinav Gupta, Dit-Yan Yeung. "Transferring Rich Feature Hierarchies for Robust Visual Tracking." arXiv (2015). [paper] [code]DLT: Naiyan Wang and Dit-Yan Yeung. "Learning A Deep Compact Image Representation for Visual Tracking." NIPS (2013). [paper] [project] [code]Naiyan Wang, Jianping Shi, Dit-Yan Yeung and Jiaya Jia. "Understanding and Diagnosing Visual Tracking Systems." ICCV (2015). [paper] [project] [code]Dataset-MoBe2016:Luka ?ehovin, Alan Luke?i?, Ale? Leonardis, Matej Kristan. "Beyond standard benchmarks: Parameterizing performance evaluation in visual object tracking." arXiv (2016). [paper]Dataset-UAV123: Matthias Mueller, Neil Smith and Bernard Ghanem. "A Benchmark and Simulator for UAV Tracking." ECCV (2016) [paper] [project] [dataset]Dataset-TColor-128: Pengpeng Liang, Erik Blasch, Haibin Ling. "Encoding color information for visual tracking: Algorithms and benchmark." TIP (2015) [paper] [project] [dataset]Dataset-NUS-PRO: Annan Li, Min Lin, Yi Wu, Ming-Hsuan Yang, and Shuicheng Yan. "NUS-PRO: A New Visual Tracking Challenge." PAMI (2015) [paper] [project] [Data_360(code:bf28)]?[Data_baidu]][View_360(code:515a)]?[View_baidu]]Dataset-PTB: Shuran Song and Jianxiong Xiao. "Tracking Revisited using RGBD Camera: Unified Benchmark and Baselines." ICCV (2013) [paper] [project] [5 validation] [95 evaluation]Dataset-ALOV300+: Arnold W. M. Smeulders, Dung M. Chu, Rita Cucchiara, Simone Calderara, Afshin Dehghan, Mubarak Shah. "Visual Tracking: An Experimental Survey." PAMI (2014) [paper] [project]?Mirror Link:ALOV300++ Dataset?Mirror Link:ALOV300++ GroundtruthDataset-DTB70: Siyi Li, Dit-Yan Yeung. "Visual Object Tracking for Unmanned Aerial Vehicles: A Benchmark andNew Motion Models." AAAI (2017) [paper] [project] [dataset]Dataset-VOT: [project][VOT13_paper_ICCV]The Visual Object Tracking VOT2013 challenge results[VOT14_paper_ECCV]The Visual Object Tracking VOT2014 challenge results[VOT15_paper_ICCV]The Visual Object Tracking VOT2015 challenge results[VOT16_paper_ECCV]The Visual Object Tracking VOT2016 challenge results深度学习方法(Deep Learning Method)由于其独有的优越性成为当前研究的热点,各种框架和算法层出不穷,这在前文的目标检测部分都有较为详细的介绍。

人工智能CT定量分析肺磨玻璃密度结节的研究

人工智能CT定量分析肺磨玻璃密度结节的研究

人工智能CT定量分析肺磨玻璃密度结节的研究随着人工智能技术的发展,医学影像在肺癌筛查、诊断、治疗等方面也有了更多的应用。

磨玻璃密度结节是指CT影像中密度稍高于周围肺组织,呈透明状或部分透明状的结节,其往往是早期肺癌的前兆。

研究表明,磨玻璃密度结节的分析是肺癌早期筛查和诊断的关键之一。

本文将通过引入人工智能技术,实现对磨玻璃密度结节的定量分析,旨在提高肺癌早期诊断的准确率和效率。

磨玻璃密度结节的定量分析旨在准确评估结节的大小、形态、密度等特征来确定其邪恶性。

传统的方法是通过医生手动测量结节并根据经验和肉眼观察来判定邪恶性。

然而,这种方法主观性较强,准确率有限。

人工智能技术通过对大量影像进行训练和学习,可以识别出结节的特征,并根据这些特征进行定量分析。

在人工智能技术中,卷积神经网络(CNN)是当前最常用的人工神经网络之一。

CNN可以对图像进行特征提取和分类,其在医学影像学领域中应用广泛,具有高效、准确、自动化等优点。

人工智能技术通过CNN对影像进行深入分析,可以提取出许多不易被发现的影像特征,进而提高磨玻璃密度结节的识别率和判定准确率。

人工智能技术通过对大量影像进行学习,可以识别出磨玻璃密度结节的大小和形态特征。

其中,对于磨玻璃密度结节的大小分析,人工智能技术可以通过像素计算来测量出结节的直径或面积,通过与其他磨玻璃密度结节进行比较,可以得出更准确的结论。

对于磨玻璃密度结节的形态分析,人工智能技术可以通过大数据分析和卷积神经网络,自动提取结节的特征、形态等信息。

通过形态分析,可以准确评估结节形态的规则性或非规则性,有助于判断结节是否为惡性。

磨玻璃密度结节的密度是影响其邪恶性的关键之一。

通过对磨玻璃密度结节密度的分析,可以准确判断其邪恶性,并制定恰当的治疗方案。

传统方法主要通过CT值来反映结节的密度情况,然而,仅凭人眼观察和经验来判断,准确率较低。

人工智能技术可以通过像素级别的分析,自动提取出结节的密度值,从而对结节的邪恶性进行判断。

基于深度强化学习的自主无人机导航算法研究

基于深度强化学习的自主无人机导航算法研究

基于深度强化学习的自主无人机导航算法研究自主无人机导航是无人机技术中的关键研究方向之一。

近年来,深度强化学习作为一种先进的机器学习方法,已经在无人机导航中得到了广泛应用。

本文将探讨基于深度强化学习的自主无人机导航算法的研究进展和应用前景。

无人机导航是指无人机在复杂环境中实现自主飞行,并完成各种任务,如目标搜索、目标跟踪、障碍物回避等。

传统的无人机导航算法主要依赖于事先设定的任务规则和环境模型,无法适应复杂和变化的环境。

而深度强化学习则能够通过学习和探索,从环境中获取知识和经验,并根据奖励信号相应地调整无人机的行为,从而实现自主导航。

深度强化学习算法的核心是将无人机导航问题建模为马尔可夫决策过程(Markov Decision Process,MDP)。

在这个框架下,无人机的导航可以被视为一个决策过程,无人机通过观察环境状态、选择动作执行以及接收奖励信号来学习最优的策略。

而深度强化学习则通过神经网络模型,学习无人机从状态到动作的映射关系,以实现在不同状态下选择最优的动作。

在深度强化学习的算法中,深度神经网络起到了至关重要的作用。

通过将无人机的环境状态作为输入,动作的价值函数作为输出,神经网络能够学习到无人机在不同状态下选择动作的最优策略。

研究人员通过采集大量的无人机飞行数据,并使用强化学习算法进行训练,不断优化神经网络模型,从而使无人机在不断的学习和探索中逐步提升导航性能。

具体而言,研究表明,基于深度强化学习的自主无人机导航算法在以下方面具有突出优势:首先,深度强化学习能够使无人机在没有先验知识的情况下进行导航。

传统的导航算法通常需要提前设定任务规则和环境模型,但基于深度强化学习的算法可以通过学习和探索从环境中获取知识和经验,不依赖于外部知识。

其次,深度强化学习能够适应不同的环境和任务。

无人机在不同的环境中面临着各种各样的条件和障碍物,传统算法很难应对这些变化。

而基于深度强化学习的算法可以通过学习和调整策略,适应不同的环境和任务需求。

arot概念

arot概念

AROT概念简介AROT,全称为Adaptive Real-time Object Tracking(自适应实时物体追踪),是一种在计算机视觉领域应用广泛的技术。

它能够实时地追踪物体并估计其状态,为目标跟踪、行为分析、增强现实等应用提供强有力的支持。

本文将简要介绍AROT的原理、应用和发展趋势。

原理AROT的核心原理是通过从连续视频帧中提取目标物体的特征,并使用适当的算法来建立目标模型。

这个模型可以捕捉目标的外观和运动状态。

然后,AROT使用目标模型来实时跟踪目标,不断更新模型以适应目标的变化,如形状变化、遮挡、光照变化等。

AROT常用的特征提取算法包括颜色直方图、局部二值模式(LBP)、方向梯度直方图(HOG)等。

目标模型通常由机器学习算法训练得到,如支持向量机(SVM)、结构化输出支持向量机(SVM-HMM)等。

这些算法能够在不同的场景下鲁棒地跟踪目标。

应用AROT在许多领域都有广泛的应用,特别是在智能监控、自动驾驶、人机交互等方面发挥了重要作用。

下面列举一些典型的应用场景:1.智能监控:在安防系统中,AROT可以用于实时追踪安全区域内的可疑行为,从而及时发现并报警异常情况。

2.自动驾驶:在自动驾驶系统中,AROT可以实时跟踪周围的车辆、行人和障碍物,帮助汽车做出智能的驾驶决策。

3.增强现实:AROT可以通过实时追踪现实世界中的物体,将虚拟信息与真实场景相结合,实现增强现实的交互效果。

4.人机交互:AROT可以用于跟踪用户的手势和动作,实现自然的人机交互界面。

发展趋势随着计算机视觉和机器学习的不断发展,AROT技术也在不断进步。

未来,AROT有望在以下几个方面取得更大的突破:1.端到端学习:目前AROT中的各个组成部分通常需要分别设计和调整,导致整个系统复杂度高。

未来,通过端到端学习,可以实现将特征提取、目标模型训练和跟踪等步骤集成在一起,从而简化系统设计和调整。

2.多目标追踪:现有的AROT技术主要针对单个目标进行追踪。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1
Introduction
Unlike virtual reality, which encompasses a user in a completely computer-generated environment, augmented reality is a technology that attempts to enhance a user’s view of the real environment by adding virtual objects, such as text, 2D images, or 3D models, to the display in a realistic manner. Clearly, the realism that a user will experience in an augmented reality environment is directly related to the stability of the registration between the virtual and realworld objects; if the virtual objects shift or jitter, the effectiveness of the augmentation is lost. Vision-based augmented reality systems rely on extremely accurate optical trackers in order to obtain the required registration stability. Additionally, these accurate trackers must operate in real-time. One of the most promising vision-based augmented reality techniques involves tracking a planar pattern in real-time and then augmenting virtual objects on top of the pattern
x x' y' = H y 1 1
where the 3x3 matrix H is a planar homography. This gives us x’ (h31x + h32y + h33) = h11x + h12y +h13 y’ (h31x + h32y + h33) = h21x + h22y +h23 where hij is the i,j-th element of H. Given at least four such correspondences, we obtain a system of eight linear equations that can be used to solve for the elements of H:
Robust 2D Tracking for Real-Time Augmented Reality
Shahzad Malik 1, Gerhard Roth 2, Chris McDonald 1
1 2
School of Computer Science, Carleton University, Ottawa, Canada, K1S 5B6 http://www.cv.iit.nrc.ca/research/ar
Computational Video Group, IIT, National Research Council, Ottawa, Canada, K1A 0R6
Abstract
Vision-based registration techniques for augmented reality systems have been the subject of intensive research recently due to their potential to accurately align virtual objects with the real world. The downfall of these vision-based approaches, however, is their high computational cost and lack of robustness. This paper describes the implementation of a fast, but accurate, vision-based corner tracker that forms the basis of a pattern-based augmented reality system. The tracker predicts corner positions by computing a homography between known corner positions on a planar pattern and potential planar regions in a video sequence. Local search windows are then placed around these predicted locations in order to find the actual subpixel corner positions. Experimental results show the robustness of the corner tracking system with respect to occlusion, scale, orientation, and lighting.
Keywords: Corner tracking, pattern tracking, blob finding, robust, computer vision, augmented reality.
based on its pose. In [5, 7, 9, 10, 14], black and white planar patterns are tracked resulting in relatively stable registrations, but the tracking algorithms fail to provide any robustness to partial pattern occlusions. Specially arranged coloured blobs are tracked in [8] that can handle partial occlusions for a brief period of time via Kalman filtering, but the blob centroids are less reliable at different scales or plane orientations. Other techniques address robustness and occlusion, but only in hybrid configurations involving expensive magnetic or inertial trackers and stereo configurations [1, 2, 12]. In this paper we describe the implementation of an optical corner tracker for an augmented reality system that is precise, fast, and robust, and which can be implemented using a standard, consumer-level camera and PC. In Section 2 planar homographies are first reviewed since they form the mathematical core of the 2D tracker. Section 3 then provides a description of a fast and reliable region detector that allows the system to self-identify predetermined planar patterns consisting of black and white corners. Section 3.2 then proposes an accurate corner tracker which uses a robustly computed homography to predict corner positions that are then refined using localized search windows. Experimental results are then presented in Section 4, which show the tracker’s stability and robustness to occlusion, scale, orientation, and lighting changes. Additionally, a comparison between corner tracking and commonly used blob tracking techniques is made.
tracked in real-time. patterns.
Figure 2 shows some example
Figure 2 – Example of 2D planar patterns used for augmentations. Patterns consist of a thick black border, inside which white rectangles are evenly distributed. The corners of the white rectangles are stored in a data file that is associated with the pattern upon system startup. Although no strict arrangement of rectangles is enforced, it is important to generate patterns that are uniquely identifiable with respect to other existing patterns, as well as under 90 degree rotations. Black and white patterns are preferred over colour due to their high contrast, which is important for region detection and extraction purposes. The following sections cover the 2D tracker in more detail. There are two modes of operation for the tracker: Search Mode, and Tracking Mode.
相关文档
最新文档