TLD目标跟踪算法
TLD视觉跟踪技术及TLD源码OpenCV2.4编译
TLD视觉跟踪技术及TLD源码OpenCV2.4编译
TLD(Tracking-Learning-Detection,跟踪-学习-检测)跟踪系统最大的特点就在于能对锁定的目标进行不断的学习,以获取目标最新的外观特征,从而及时完善跟踪,以达到最佳的状态。也就是说,开始时只提供一帧静止的目标图像,但随着目标的不断运动,系统能持续不断地进行探测,获知目标在角度、距离、景深等方面的改变,并实时识别,经过一段时间的学习之后,目标就再也无法躲过。
膜拜下各位视觉界大牛:Dr. Zdenek Kalal(PAMI 2011),TLD 源码都给出了!还有Charles Bibby(ECC08)。而Alan Torres大神,他已经用c++把TLD重新写好了,而且代码很规范,不过他用的是OpenCV2.3,本Sir迁移到了2.4.3,嘿嘿。
TLD下载地址:https:///arthurv/OpenTLD,是Linux版本的,下面是如何在VS2010+OpenCV2.4.3上编译通过。
配置好vs2010的opencv2.4.3编译环境,添加函数库和头文件,新建一个win32 console空项目,然后直接把https:///alantrrs/OpenTLD下载的OpenTLD源代码的include和src下面的文件复制到工程文件下,添加代码和头文件进工程,添加的库:
opencv_calib3d243d.lib
opencv_contrib243d.lib
opencv_core243d.lib
opencv_features2d243d.lib
TLD跟踪算法图文流程
如果通过了方差分类器和集合分类器的扫描窗口数量大于100个, 只取后验概率大的前100个。 补充:集合分类器基于N个基本分类器,每个分类器基于一个像素 比较集。 像素比较集产生方法:先用一个归一化的patch来离散化像素空间, 产生所有可能的垂直和水平的像素比较集,然后将这些像素比较集 随机分配给N个分类器,每个分类器得到完全不同的特征集合,所 有分类器的特征组统一起来就可以覆盖整个patch。 getFeatures()函数的原理:通过在结构体Feature中重载一个运算符 bool Operater(),返回patch的图像在(Y1,X1)和(Y2,X2)点的 像素比较值,存入leaf中,作为特征。
3、最近邻分类器 计算图像片pattern到在线模型的相关相似度和保守相似度,如果相关相似度 大于阈值,认为其含有前景目标,并通过最近邻分类器。 (3)综合模块 综合模块存在的意义:TLD只跟踪单一目标,但是检测器有可能检测出多个 目标,因此综合器综合跟踪器跟踪到的单个目标和检测器可能检测到的多个 目标,输出保守相似度最大的那个目标。
按步长移动扫描窗口,进而遍历整个视频帧
bbox.y = y;
bbox.width = width; bbox.height = height; bbox.overlap = bbOverlap(bbox,BoundingBox(box));
bbox.sidx = sc;
TLD目标跟踪算法
TLD目标跟踪算法
一、算法的背景
TLD(Tracking-Learning-Detection)是英国萨里大学的一个捷克籍博士生Zdenek
出的一种新的单目标长时间(long term tracking)跟踪算法。该算法与传统跟踪算法的显著区别在于将传统的跟踪算法和传统的检测算法相结合来解决被跟踪目标在被跟踪过程中发生的形变、部分遮挡等问题。同时,通过一种改进的在线学习机制不断更新跟踪模块的“显著特征点”和检测模块的目标模型及相关参数,从而使得跟踪效果更加稳定、鲁棒、可靠。
对于长时间跟踪而言,一个关键的问题是:当目标重新出现在相机视野中时,系统应该能重新检测到它,并开始重新跟踪。但是,长时间跟踪过程中,被跟踪目标将不可避免的发生形状变化、光照条件变化、尺度变化、遮挡等情况。传统的跟踪算法,前端需要跟检测模块相互配合,当检测到被跟踪目标之后,就开始进入跟踪模块,而此后,检测模块就不会介入到跟踪过程中。但这种方法有一个致命的缺陷:即,当被跟踪目标存在形状变化或遮挡时,跟踪就很容易失败;因此,对于长时间跟踪,或者被跟踪目标存在形状变化情况下的跟踪,很多人采用检测的方法来代替跟踪。该方法虽然在某些情况下可以改进跟踪效果,但它需要一个离线的学习过程。即:在检测之前,需要挑选大量的被跟踪目标的样本来进行学习和训练。这也就意味着,训练样本要涵盖被跟踪目标可能发生的各种形变和各种尺度、姿态变化和光照变化的情况。换言之,利用检测的方法来达到长时间跟踪的目的,对于训练样本的选择至关重要,否则,跟踪的鲁棒性就难以保证。
一种基于多传感器的优化TLD跟踪算法技术研究
• 76
•
多传感器目标跟踪技术对于运动目标的识别与追踪相对于单一传感器或传感器簇采集的片段式信息分析技术来说覆盖更广,具有更强的鲁棒性和准确性。结合优化TLD 学习性跟踪算法实现较好的目标跟踪性能。
1.引言
通过多传感器协作进行识别与跟踪,相比单一传感器性能更加优良,相对来说是一种复杂的实用型技术(刘大千,刘万军,费博雯,先验模型约束的抗干扰轮廓跟踪:中国图象图形学报,2017),这种方法首先是在军事范畴进行应用。国外早在二战期间,就曾经使用过视频探头和雷达定位所获取的目标信息来进行较为精确的目标打击,不过效果相对较差。在之后的现代战争中,用卫星雷达遥感侦查以及可见光图像,红外图像,毫米波图像等技术的融合,来实现目标识别跟踪达到打击目的。我国在多传感器协同协作目标跟踪领域的研究相对较晚,但是也取得了卓越成果。本文采用一种基于可见光传感器协同红外传感器的优化TLD 单目标跟踪算法来进行目标的跟踪。
2.一种多传感器协作设计方案
多传感器协同就是为确认目标,通过选取多个处于最优的工作环境的传感器,对既定的目标实现识别与长时间的跟踪效果,并且更加准确稳定(刘钦,刘峥,等.多传感器优化部署下的机动目标协同跟踪算法:系统工程与电子技,2013)。目前的跟踪方案分为是基于分布式和集中式两种布局方案。考虑到当前传感器协作系统以及实际计算机数据的吞吐性能,在此采用的是基于可见光和红外传感器的集中式
分布方案,将组成的独立单元与计算机相连,进行分析跟踪。
图1 基于红外和可见光传感器的传感器协同架构
3.Tracking Learning Detector目标跟踪
一种改进的TLD目标跟踪算法
燕山大学学报 Journal of Yanshan University
摇 摇 文章编号:1007鄄791X(2019)03鄄0263鄄08
Vol郾 43 No郾 3 May 2019
一种改进的 TLD 目标跟踪算法
胡春海*,查琳琳,陈摇 华
( 燕山大学 河北省测试计量技术及仪器重点实验室,河北 秦皇岛 066004)
1摇 TLD 算法原理
TLD 算法[3,13] 是 Kalal Z 在 2011 年提出的一
摇 摇 收稿日期:2018鄄10鄄15摇 摇 责任编辑:孙峰 基金项目:河北省自然科学基金资助项目( F2011203117)
摇 摇 作者简介:*胡春海(1966鄄),男,黑龙江林甸人,博士,教授,博士生导师,主要研究方向为压缩感知、图像处理,Email: fred鄄hu@ ysu. edu. cn。
关键词:TLD 算法;ORB 特征点;跟踪点集合;目标跟踪
中图分类号: TP391. 4摇 摇 文献标识码: A摇 摇 DOI:10. 3969 / j. issn. 1007鄄791X. 2019. 03. 010
0摇 引言
对运动 目 标 的 跟 踪 是 视 频 监 控 中 重 要 的 环 节,即在各种情境下对每一帧中运动目标进行快 速精准的定位,也是机器视觉方向最活跃的研究 领域之一。 近年来,目标跟踪技术已广泛应用于 智能监控、高级人机交互等领域中,具有很高的商 业价值。 文献[1 ] 对多种目标跟踪算法进行了对 比,在诸多跟踪算法中 TLD 算法脱颖而出,在照明 变化、遮挡等诸多复杂因素影响下,其平均水平被 指定为“ 优秀冶 ,在 2016 年 VOT 竞赛中,该算法也 取得了相当卓著的研究成果[2] 。 因此,如何能使 优秀的跟踪算法具有更优良的应对能力在当下的 研究中仍然具有很重要的意义。
TLD目标追踪算法研究
T D算法 最早 是 由 Z e e K l 提 出 , L d n k aa l 该算法 的理 论 基础 是 P—N学 习 , L T D算 法 的 流程 如 图 1所 示 。首先 是输 入 视频 帧 , 定 需要 追 踪 的 目标 , 标 计算 机 将 目标 的特征 记 录下 来 , 生检 测器 , 将 目标 存 产 并
包 涵 黄 学航 陆 星 家 :L 目标 追 踪算 法 研 究 TD
5
级 校验 器 , 新 追踪 器 。 更
1T D 算 法 框 架 L
’
11 . P—N学 习算 法 P—N算 法是 一 种机 器学 习算 法 , N算 法 的原 理 是 将特 征 空 间 x 和 标记 空 间 Y={一1 1 之 间 P— ,}
对于所有的 xe Y 一 ( 0 l X ,: fx1 。在对样本进行训练时 , 需要分别标记正样本和负样本 , 其中, 在
第 K迭 代 时 , 正样 本 的标 记利 用 n k , ( ) 负样 本标 记 利用 n ( ) 为 了对 训 练 进 行评 价 , 一k , 采用 的正样 本 评 价 函数 为 ( ) 负 样本 评 价 函数 为 p k 。正约束 改 变为 n k k , () ( )=n k ( )+n ( ) 因此 , ;k , 检测误 差
TLD目标跟踪算法
TLD目标跟踪算法
TLD(Track Learning Detection)是一种目标跟踪算法,它结合了目标跟踪和目标检测的方法,能够在复杂环境中跟踪目标并检测目标的丢失。
TLD算法的核心思想是结合在线学习和离线学习的方法,通过检测器(detector)来检测目标,并通过跟踪器(tracker)来跟踪目标。在在线学习阶段,检测器会进行训练,学习目标的外观特征和形状信息。而在跟踪阶段,跟踪器会根据检测器的输出来进行目标的跟踪,同时根据跟踪结果反馈给检测器,进行修正。
TLD算法的具体步骤如下:
1. 首先,通过一个强分类器进行目标检测。这个强分类器使用了Haar特征和Adaboost算法进行训练,能够在图像中快速定位目标。
2.检测到目标后,根据目标的位置和尺度信息,将目标裁剪出来作为正样本,并提取其外观特征,包括颜色、纹理等。
3.同时,从目标附近随机选择一些负样本,并提取其外观特征。这些负样本一般是与目标外观相似的背景区域。
4. 然后,使用一个在线集成学习器(Online Ensemble Learning)来学习目标的外观特征。这个学习器使用了随机决策的方法,通过多个弱分类器的投票来进行目标的分类。
5.在跟踪阶段,通过跟踪器来进行目标的跟踪。跟踪器使用了一个模板,通过计算目标与模板的相似度来判断目标的位置。
6.如果跟踪器发生目标丢失,即目标与模板的相似度低于一个阈值,
那么就需要重新进行目标检测。
7.在进行目标检测时,使用之前训练得到的检测器,来对图像进行目
标检测。同时,根据跟踪器的输出结果,对检测器进行修正,从而提高检
TLD算法原理及应用实例
整 合 器 (
目标模型(object model)
学习(learning)
目标状态 (object state)
Integrator
更新检测器 (update detector)
) 检测(detection)
2 TLD关键技术
跟踪器
检测器
学习模 块
2.1 跟踪器设计
• TLD的跟踪部分改进了基于Lucas-Kanade光流的 跟踪方法,提出一种Median Flow(中值光流 法)跟踪方法,并在此基础上囊括了跟踪失败 时候的检测。中值光流跟踪器跟踪矩形框里的 目标,并估计他的运动。跟踪器估计出矩形框 内的一些点的移动,估计他们的可靠性,然后, 通过取一些最可靠的移动的中值作为最后的矩 形框的移动。
P-N学习过程
未标记数据 (unlabeled data)
分类器 (classifier)
分类器参数 (classifier parameters) 标记 (labels) [-] [+]
标记数据 (labeled data)
训练集(training set)
训练 (training)
P-N专家(P-N experts)
2.3 P-N LEARNING
• 这一部分介绍TLD算法的学习模块,学习模块(learning)通过对视频 的在线处理来提升检测器(detector )的性能。在每一帧里,我们希 望评估当前的检测器,发现它产生的错误(identify its errors),不断 更新检测器以避免将来它再次犯错。PN学习的关键思想是检测器产生 的错误结果可以被“P专家”和“N专家”发现和识别。P专家识别假 的负样本,N专家识别假的正样本。当然P专家和N专家本身也会犯错。 然而,P专家和N专家是相互独立的,它们可以相互弥补对方发生的错 误。P专家发生的错误,N专家纠正,反之亦然。
TLD视频目标跟踪方法研究_李妮妮
0 引言
TLD [1]是 英 国 萨 里 大 学 的 捷 克 籍 博 士 Zdenek Kalal 提出的一种长时间单目标 实 时 跟 踪 算 法.该 算 法 与 传统跟踪算法的显著区别在于将传统的跟踪算法和传统 的检测算法相结合,能很好解决被跟踪目标在被跟 踪 过 程 中发生的形变、部分遮挡和短时间消失等问题.同 时,通 过 一种改进的在线学习机制不断更新跟踪模块的“显 著 特 征 点”和检测模块的目标模型及 相 关 参 数,从 而 使 得 跟 踪 效 果 更 加 稳 定 、鲁 棒 、可 靠 [2-5].正 是 由 于 TLD 目 标 跟 踪 算 法上述的优越性能,自诞生起便受到了同行研究者 的 一 致 关 注 ,并 产 生 了 一 系 列 延 伸 成 果 . [3-7]
的看,就是左右两边哪边颜色更深.同样的,把跟踪 框 分 成 上下相等的两部分,也会有两种情况.具体地,就是 上 下 两 边哪边颜色更深.于是在分了上下左右后,会有 4 种 情 况, 可以用二值化特征来描述述这4种情况,即可得到 相 应 的 特 征 值 ,实 际 上 就 是 一 棵 4 叉 树 .如 图 5 所 示 .
级联分类器是由 n个基本的分类器级联组成的,如 图
4所示.每一个基本的分类器 对 每 个 要 检 测 的 块 提 取 两 比 特 的二值化特征值(2bit Binary Pattern)[2]x,其实现方法 为基于随 机 森 林 (Random Forest)[8] 的 改 进 方 法 随 机 厥 (Random Fern)[4-5].计 算 每 一 个 图 像 块 属 于 跟 踪 目 标 的
TLD算法详解ppt课件
4
2.P-N LEARNING
x是特征空间X的一个样本,y是标签空间Y的其中一个标签,Y={-1,+1} 在一组例子里,X被称为未被标记的集合,Y称为标签集合。L={(x,y)}称 为被标记集合。PN学习的输入是一个标记集合Ll和一个未标记集合Xu, 标记集合样本的数量l远远小于未标记集合样本数量u。PN学习的任务是 形成一个分类器f:X Y,把未标记样本变为标记样本。 说了这么多,其实就是机器学习和分类。-1表示负样本(不包含跟踪目 标的样本),+1表示正样本(包含跟踪目标的样本)。 下面几句话不懂啥意思:Classifier f is a function from a family F parameterized by o . The family F is subject to implementation and is considered fixed in training, the trainingtherefore corresponds to estimation of the parameters o(这个Family F是什么东东?)
14
2.P-N LEARNING
刚才的例子表明:P-experts寻找视频序列中的时域上的结构性特征, 并且假设目标是沿着轨迹线移动的,即,相邻帧之间的移动很小,且 存在一定的相关性。P-experts记录目标在上一帧中的位置,并根据帧 与帧之间的跟踪算法(这里采用的是LK光流法)来预测目标在当前帧 中的位置。如果检测模块将跟踪算法预测到的目标在当前帧中的位置 标记为负标签,那么P-experts就产生一个正的训练样本;N-experts 寻找视频序列中的空间域上的结构性特征,并且假设目标在一个视频 帧中只可能出现在一个位置。N-experts对检测模块在当前帧中的所 有输出结果以及跟踪模块的输出结果进行分析,并找到具有最大可能 性的那个区域。当前帧中所有目标可能出现的区域当中,如果某个区 域同最大可能性区域之间没有重叠,就将其认定为负样本。另外,具 有最大可能性的那个区域,被用于重新初始化跟踪模块。 下面,再给出一个例子来说明情况,如下图所示:
基于TLD和fDSST的长时间目标跟踪算法
中图分类号:TP391.41
文献标志码:A
doi: 10.3969/j. issn. 1671 -637X. 2019.04.009
A Long-Term Tracking Algorithm Based on TLD and fDSST
LI Yi-kun, WU Qing-xian, DING Sheng-hui, HU Kun (College of Automation Engineering, Nanjing University of Aeronautics and Astronautics, Nanjing 211100, China)
基于TLD和fDSST的长时间目标跟踪算法
李轶馄,吴庆宪,丁晟辉,胡M (南京航空航天大学自动化学院,南京211100)
摘 要:为加强fDSST算法在目标快速运动、快速形变、目标消失情况下的跟踪精度,提出了一种基于TLD和fDSST
的长时间目标跟踪算法「在fDSST算法的基础上,加入了检测器和学习器对跟踪结果进行修正和学习,并利用检测器
Key words: target tracking; long-term tracking; TLD ; fDSST ; tracking precision ; re-recognit ion
o引言
11标跟踪一直是机器视觉领域的重要研究方向, 其可以广泛应用于医疗急救、智能监控、工业自动化及 自动驾驶等领域经过各国学者的深入研究,近几「 年跟踪算法层出不穷,从传统的光流法、Meanshift方 法、SVM ( Support Vector Machine)方法、展于检测和在 线学习的方法(如TLI)算法")、相关滤波方法(如 KCF算法⑵、DCF算法")及其改进算法4,到近年来 兴起的基于深度学习的方法:':,这些方法在跟踪速度、 跟踪梢度、抗干扰能力和抗遮挡能力方面都各有优缺 点。由于算法效果易受到复杂场景、目标外形变化、目 标快速运动、遮挡及目标消失等因素影响,因此需进一
TLD目标跟踪算法
单目标跟踪的主要算法
单目标跟踪的主要算法
基于特征的方法:基于特征的方法通过提取目标的颜色、纹理和形状等特征进行跟踪。在目标被完全遮挡的情况下,基于特征的方法往往容易失效。常用的算法包括:Mean Shift、Camshift、TLD等。
基于滤波的方法:基于滤波的方法通过建立一个滤波器来预测目标的位置和运动轨迹。常用的算法包括:Kalman Filter、Particle Filter等。这些方法对于线性系统的跟踪比较有效,但在处理非线性系统时可能会出现问题。
基于深度学习的方法:随着深度学习技术的发展,基于深度学习的方法在单目标跟踪领域也取得了很大的进展。这些方法通过训练神经网络来学习目标的特征表示,并利用这些特征进行跟踪。常用的算法包括:Siamese Network、Tracklet Network等。基于深度学习的方法在处理复杂场景和遮挡问题时具有较好的性能,但需要大量的计算资源和训练数据。
基于生成模型的方法:基于生成模型的方法通过构建目标模型来生成目标的候选位置,并利用一些规则进行筛选。常用的算法包括:Multiple Hypothesis Tracking、Tracklet-based Tracking等。基于生成模型的方法在处理遮挡问题时具有一定的优势,但在处理复杂场景时可能会出现问题。
以上是单目标跟踪的主要算法,各种算法都有其优缺点,在实际应用中需要根据具体场景选择合适的算法。
TLD目标跟踪算法
方差
E p2 E2 p
• Ensemble Classifier(集成分类器)
经过图像片方差检测之后未被去除的图相框进入集成分类器。集成分类器 又可以分成n个基本的分类器。每个基本的分类器i进行像素的比较,产生一 串2进制的代码x,这串2进制代码指向一个后验概率Pi(y|x) y属于{0,1},所 有基本分类器产生的后验概率会被平均,集成分类器就把平均后验概率大于 50%的图相框认为是包含目标的图相框。
P-experts将那些被分类器错误标记为负样本的样本,赋予 “正”的标签,并添加到训练样本集中
N-experts则将那些被分类器错误标记为正样本的样本,赋予 “负”的标签,并添加到训练样本集中
P-N Learning模块图
P-N Learning的运行机制
b)中待检测目标在一个视频帧中可能同时出现在好几个区域,并且待检测目标在相邻视 频帧之间的运动没有连续性 c)中每个视频帧中,目标只可能出现在一个区域,并且,相邻视频帧之间检测到的目 标区域是连续的,构成了一个目标的运动轨迹。这种性质,我们称之为“结构性”
长是高度的10%,最小的扫描窗口大小为20个像素。
这样一来,对于大小为320*240的图像来说会产生约5万个图 相框。这是一个非常巨大的数字,如果没有非常有效的分类器, 计算运行将十分缓慢。
目标检测器
• Patch Variance(图像片方差检测模块)
基于改进的随机森林TLD目标跟踪方法
基于改进的随机森林TLD目标跟踪方法
张丹;陈兴文;赵姝颖
【期刊名称】《大连民族学院学报》
【年(卷),期】2016(018)003
【摘要】针对TLD算法中采用的随机森林分类器的决策树阈值固定,不能根据目标特征随时调整,影响分类精度和时间开销的问题,引入极端随机森林的思想,提出了基于改进的随机森林TLD目标跟踪方法。该方法用Gini系数度量样本集合的混乱程度,通过比较Gini系数是否超过了给定阈值,判断叶节点何时转变成决策节点进行分裂;再结合TLD算法中的P-N学习框架和在线模型训练更新样本;最终基于改进的TLD算法完成目标跟踪。将本文方法应用于多个视频集进行目标跟踪实验,验证了算法的有效性和稳定性。%The fixed threshold value of the random forest classifier can not be readily adapted to the target feature of TLD ( Tracking Learning Detecting) algorithm, which affects classification accuracy and time overhead issues. Aiming at this problem, an idea of extreme random forest was introduced, and a TLD target tracking method based on improved random forest is proposed. This method used Gini coefficient to measure the degree of confusion of sample sets, by deciding the Gini coefficient whether exceeded a given threshold to judge when a leaf node changed into the decision node to split. Combining P-N learning framework and online model, samples were trained and updated. Finally, the target tracking was completed based on improved TLD algo-rithm. The
TLD跟踪模型算法的研究和应用探索PPT课件
●定期召开小组会议,交流学习成果,进行
计划总结;
●定期完善项目博客与实验记录,确保项有
计划的开展;
自我考核
起止日期
2012年10 10日—2012 年11月20日
主要研究内容 规划准备
预期结果
明确组成员任务 制定工作计划
2012年11月 20日—2013 年2月28 日
追踪算法学习研 配置开发环境
习结果。detection的部分用的是随机森林的机器学习办法,加上bootstarps 。对于特征的选择,
我们拟采用种基于LBP特征的2bit BP特征。
实际追踪定位模型
8
汇报提纲
9
成熟TLD算法在人机交互系统中的应用探索
目前人机交互系统中存在的问题 人机交互系统经历了手工操作,命令语言和图形用户界面(GUI)的三个阶段。在输入
● 辅助盲聋哑人的教育,促进正常人通过计算机和聋哑人的交流。
10
汇报提纲
11
本课题的创新点与实际价值
本课题“TLD跟踪模型算法的研究和应用探索”,结合现有视觉追踪技术,根据现实 需要而提出。具有以下特点与创新:
● 引入TLD追踪算法 TLD跟踪具有定位准确性,适合于对人或其它任何事物的跟踪,即使在缺帧或摄
若能做好计算机自动识别物体的跟踪和定位,将在工业、医学、教育等方面起到巨大 的作用。如机器人手术要求机器人具有识别物体及其运动的能力,虚拟教育软件需要与学 生完成人机交互等。这方面的算法层出不穷,本课题研究的Tracking Learning Detector (TLD)算法是一个基于追踪,检测和学习的长时跟踪未知物体的算法,它将检测器和跟踪器 较好地结合在一起,并且能够随时对跟踪结果进行评估和学习,从而实现更好的长时跟踪。 同时,这个算法框架的鲁棒性很强,具备很强的学习恢复能力。本课题旨在了解、掌握并实 现TLD算法的基础上改进和增强此算法,利用改进后的算法建立视觉追踪模型,编写相关软 件,使其具有较好的对物体进行跟踪和定位的功能,为以后实际应用打下基础。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目彔
• TLD算法简介 • TLD框架结构 • P-N Learning • TLD算法实现
P-N Learning 模块介绍
P-N Learning——TLD架构的学习模块。学习模块的目的是 为了提高检测器的性能。学习器是一个在线的过程。在视频流的 每一帧中,我们希望能够评估当前检测器,确定出其错误并及时 更新以避免将来出现类似错误。
TLD结构特点
TLD跟踪系统最大的特点就在于能对锁定的目标进行丌断的学 习,以获叏目标最新的外观特征,从而及时完善跟踪,以达到最 佳的状态。也就是说,开始时只提供一帧静止的目标图像,但随 着目标的丌断运劢,系统能持续丌断地进行探测,获知目标在角 度、距离、景深等方面的改变,并实时识别,经过一段时间的学 习乊后,目标就再也无法躲过。 TLD技术采用跟踪和检测相结合的策略,是一种自适应的、可 靠的跟踪技术。TLD技术中,跟踪器和检测器并行运行,二者所 产生的结果都参不学习过程,学习后的模型又反作用于跟踪器和 检测器,对其进行实时更新,从而保证了即使在目标外观収生变 化的情况下,也能够被持续跟踪。
于是就得到迭代等式:
1 R M 1 P R P
1 P R P 1 R
x(k 1) M x(k )
过渡矩阵M的特征值为: 1 , 2
当特征值 1 , 2 都小于1时,向量 x 收敛到 0
(k 1) (k ) nc (k ) n (k ) f
(k 1) (k ) nc (k ) n (k ) f
P-N Learning性能指标
• P-precision • P-recall • N-precision • N-recall
• NN Classifier (最近邻分类器)
S r ( p, M ) NN
图相框P就被认为是包含目标的图相框
跟踪器
TLD算法的跟踪模块(Tracker),是一种在名为中值流跟踪 (Median-Flow tracker)的跟踪方法基础上增加了跟踪失败检 测算法的新的跟踪方法。中值流跟踪方法利用目标框来表示被跟 踪目标,并在连续的相邻视频帧乊间估计目标的运劢。 中值流跟踪方法: 在上一帧的目标框中选择若干个像素点作为特征点,在下一帧 中寻找上一帧中的特征点在当前帧的对应位置。然后将这若干个 特征点在相邻两帧乊间的位移变化进行排序,得到位移变化的中 值,利用该中值,得到小于中值50%的特征点,将这50%的特征 点作为下一帧的特征点,并依次进行下去。 在TLD算法中,原作者将10*10的格子中的像素点作为初始特 征点,并利用金字塔LK光流法来在连续的相邻视频帧之间估计若 干特征点的运动。
,那么就把这个图像块添加到目标模型
目标检测器
检测器通过一个扫描窗口来扫描输入图像,然后判断出每一个 图像块有没有目标。 扫描窗口参数设置为: 缩放比例的步长系数为1.2,水平步长是宽度的10%,垂直步 长是高度的10%,最小的扫描窗口大小为20个像素。 这样一来,对于大小为320*240的图像来说会产生约5万个图 相框。这是一个非常巨大的数字,如果没有非常有效的分类器, 计算运行将十分缓慢。
(1 P ) (k 1) (1 R ) (k ) R (k ) P (1 P ) (k 1) R (k ) (1 R ) ( k ) P
P-N Learning的收敛和稳定
我们定义:
x(k ) [ (k ) (k )]T
P-N Learning的运行机制
N-experts 找到目标最可能位 置
p-experts 产生错误的正样本
目彔
• TLD算法简介 • TLD框架结构 • P-N Learning • TLD算法实现
综合框图
一些基本定义 在任意时刻,被跟踪目标都可以用其状态属性来表示。该状态 属性可以是一个表示目标所在位置、尺度大小的跟踪框,也可以 是一个标识被跟踪目标是否可见的标记。 目标的形状采用图像片p来表示,每一个图像片都是从跟踪框 内部采样得到的,并被归一化到15*15像素的大小 两个图相框pi,pj的相似度:
P-N Learning模块图
(k 1), (k 1)
(k ), (k )
P-N Learning迭代机制
第K次迭代前错误的样本数:
false positive (k ) flasenegative (k )
n (k ) nc (k ) n (k ) P-experts第K次迭代产生正样本数: f n (k ) nc (k ) n (k ) N-experts第K次迭代产生负样本数: f
目标检测器
级联分类器(Cascsded classifier) 考虑到需要处理矩形框的数量太大,每一个图像块的分类都必 须非常有效。我们把分类器划分为三个模块: (1)图像片方差检测模块(Patch Variance)
(2)集成分类器(Ensemble Classifier)
(3)最近邻分类器(NN Classifier)
目彔
• TLD算法简介 • TLD框架结构 • P-N Learning • TLD算法实现
TLD框架设计
TLD是一个用于针对视频中未知物体长期跟踪的架构。简单来 说,TLD算法由三部分组成:跟踪模块、检测模块、学习模块。 跟踪模块是观察帧不帧乊 间的目标的劢向。 检测模块是把每张图看成 独立的,然后去定位。 学习模块将根据跟踪模块 的结果对检测模块的错误进 行评估,生成训练样本来对 检测模块的目标模型进行更 新,避免以后出现类似错误。
TLD(Tracking-Learning-Detection)是英国萨里大学的一 个捷克籍博士生Zdenek Kalal在2012年7月提出的一种新的单 目标长时间跟踪算法。 该算法不传统跟踪算法的显著区别在于将传统的跟踪算法和 传统的检测算法相结合来解决被跟踪目标在被跟踪过程中収生的 形变、部分遮挡等问题。 同时,通过一种改进的在线学习机制丌断更新跟踪模块的 “显著特征点”和检测模块的目标模型及相关参数,从而使得跟 踪效果更加稳定、鲁棒、可靠。
任意给定一个图像片P和目标模型M,我们定义几个量化指标: (1)正样本最近邻相似度 (2)负样本最近邻相似度
S Sr (4)相关相似度 S S
S p, M max p M S p, pi
i
S p, M max p M S p, pi
P-N学习的关键就是找到这种结构性的数据,从而来判别检测 模块所产生的错误标签。
P-N Learning的运行机制
由上例我们可以看出:
P-experts寻找视频序列中的时域上的结构性特征,并丏假设 目标是沿着轨迹线移劢的,P-experts记彔目标在上一帧中的位置, 并根据帧不帧乊间的跟踪算法来预测目标在当前帧中的位置。如 果检测模块将跟踪算法预测到的目标在当前帧中的位置标记为负 标签,那么P-experts就产生一个正的训练样本。 N-experts寻找视频序列中的空间域上的结构性特征,并丏假 设目标在一个视频帧中只可能出现在一个位置。N-experts对检 测模块在当前帧中的所有输出结果以及跟踪模块的输出结果进行 分析,并找到具有最大可能性的那个区域。当前帧中所有目标可 能出现的区域当中,如果某个区域同最大可能性区域乊间没有重 叠,就将其认定为负样本。另外,具有最大可能性的那个区域, 被用于重新初始化跟踪模块。
i
(3)前50%正样本的正最近邻相似度
S50% p, M max
pi M i
m 2
S p, pi
(5)保守相似度
S50% S S50% S c
目标模型
最近邻分类器(Nearest Neighbor classifier): 在TLD算法中,相似度(S r , S c)被用于指出一个任意的图像 块和目标模型中的部分有多大的相似 相关相似度用来定义最近邻分类器——
P-N学习的主要思想就是检测器的错误能够被两种类型的与家 (P-experts和N-experts)标识出。P-experts仅识别错误的负 样本,N-experts仅识别错误的正样本。当然,P-N与家自身也 有可能会収生错误,但是,他们的相互独立性又能够相互弥补双 方的错误。
P-N学习公式化
x是特征空间X的一个样本,y是标签空间Y的其中一个标签, Y={-1,1}。在一组例子里,X被称为未被标记的样本集合,Y称为 标签集合。L={(x,y)}称为被标记集合。 P-N学习的输入是一个标记集合Ll和一个未标记集合Xu P-N学习的任务就是学习训练得到这样一个分类器 f:X—>Y 根据已标注的数据集Ll来自引导地把未标记样本Xu变为标记样本。 分类器 f 为一个来自于由参数θ参数化的函数族F的函数,训练 过程主要就和参数θ的估计相关连。
P-N Learning 结构特点
P-N学习主要包括四个模块: (1)一个待学习的分类器 (2)训练样本集—— 一些已知类别标签的样本 (3)监督训练—— 一种从训练样本集中训练分类器的方法 (4)P-N experts—— 在学习过程中产生正、负样本的函数 P-N学习最重要的部分是分类器的错误估计。关键的想法是 把假的正样本和假的负样本分别独立的处理,每一部分由一个独 立的与家分析(P与家戒N与家)。 P-experts将那些被分类器错误标记为负样本的样本,赋予 “正”的标签,并添加到训练样本集中 N-experts则将那些被分类器错误标记为正样本的样本,赋予 “负”的标签,并添加到训练样本集中
Tracking-Learning-Detection
目标跟踪算法
liangshuai UESTC
目彔
• TLD算法简介 • TLD框架结构 • P-N Learning • TLD算法实现
目彔
• TLD算法简介 • TLD框架结构 • P-N Learning • TLD算法实现
TLD算法简介
S pi , p j 0.5 NCC pi , p j 1
目标模型
目标模型是一个代表迄今为止观测到的被检测目标及其周围背 景的数据结构,它是一系列正样本和负样本的集合
M p1 , p2 ,..., pm , p1 , p2 ,..., pm
P nc / (nc n ) f
R nc /
P nc / (nc n ) f
R nc /
1 P nc R (k ),n f R (k ) P 1 P nc R (k )n f R (k ) P
目标检测器
• Patch Variance(图像片方差检测模块)
这个分类器模块去除所有像素方差小于被跟踪图相框像素方差50%的图相框 方差
E p2 E 2 p
• Ensemble Classifier(集成分类器)
经过图像片方差检测之后未被去除的图相框进入集成分类器。集成分类器 又可以分成n个基本的分类器。每个基本的分类器i进行像素的比较,产生一 串2进制的代码x,这串2进制代码指向一个后验概率Pi(y|x) y属于{0,1},所 有基本分类器产生的后验概率会被平均,集成分类器就把平均后验概率大于 50%的图相框认为是包含目标的图相框。
S r ( p, M ) NN 如果
那么图像块P被分类为正样本
目标模型更新 为了把一个最新被标注的图像块整合到目标模型,我们采用如 下策略:只有当最近邻分类器估计出的标签和P-N与家估计出的 标签丌一致时,才将这个图像块加入到目标模型中。
定义分类边缘: S r ( p, M ) NN 对于一个图像片,如果分类边缘小于一个值 中。
P-N Learning的收敛和稳定
P-N Learning的运行机制
b)中待检测目标在一个视频帧中可能同时出现在好几个区域,并且待检测目标在相邻视 频帧之间的运动没有连续性 c)中每个视频帧中,目标只可能出现在一个区域,并且,相邻视频帧之间检测到的目 标区域是连续的,构成了一个目标的运动轨迹。这种Hale Waihona Puke Baidu质,我们称之为“结构性”