目标识别与跟踪综述概述

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

综述

摘要：人体的运动分析主要指的是对场景中的运动个体或者群体进行运动检测、运动跟踪与理解以到达描述人体行为的目的。通过阅读文献，本文将从人体检测，人体跟踪和人群运动分析三个方面介绍人群特征分析的方法。

1．绪论

随着社会的发展，公共需求的提高，群体运动的分析越来越受关注。并且随着人口的增长，人群活动日益增加，相应的人群安全问题也越来越突出。对人群的分析研究分别在社会学、心理学、建筑学、计算机等各个学科受到极大的关注。人群分析主要分为以下五个方面。

(1)人群管理:对大型集会的人群管理，是公共安全管理领域中最亟待解决的问题。人群分析可以更好的发展人群管理策略，避免因人群拥挤而发生的灾难事件，确保人身安全。

(2)虚拟环境:通过构造人群的数学模型结构,在虚拟环境下来模拟人群场景,来丰富人的生活体验。如一些虚拟的聊天室、电影或者动画制作过程中的特效应用等。

(3)智能环境:在一些涉及到大型人群的智能环境下,人群分析可以预协调人群。如在博物馆,人群的模式决定了如何疏散人群。

(4)公共场所设计:人群分析可以为公共场所的设计提供指导,如对商场的人流估计，使得商场的布局更方便于顾客或者最可能有效的利用空间优化办公室场所。

(5)视觉监控:人群分析可以用来自动检测场景中的异常情况。而且,在人群中的个体跟踪有助于协助安防人员捕捉嫌疑犯。

虽然人群运动分析技术研究已取得了一定的成果，但是人群运动的复杂性以及实际运动场景的多变性仍然给人群运动分析带来很多的研究难点。目前在人群运动的自动检测与跟踪方面，也没有相对完善的理论基础，各向技术也处在完善阶段。主要表现在:

(1)运动检测与分割：在人群运动分析系统中，如何对人群运动实现快速而准确的分割是极为重要的难题。由于视频序列中运动场景极易受到各种客观因素的影响，如光照变化、背景与前景的混杂干扰、运动目标与环境之间或者运动目标之间的遮挡现象等，使得对人群运动实现有效分割变的十分的困难。目前常用的运动分割算法如帧间差分法或背景相减法都难以适应复杂或者拥挤场景的运动分

割。

(2)遮挡问题处理：由于人群运动的密集特性，使得人与人之间的遮挡问题变得极为严重。此外，在真实场景中，还存在人群与人群之间甚至是人群与环境之间的互遮挡现象，这些现象都将导致运动目标对象信息的丢失。这些如何有效处理遮挡问题也是衡量一个人群运动分析系统优劣的准则。

(3)运动特征的提取：人群运动的特征既具有个体运动的特征也具有群体运动的特性，合理的选取人群运动的特征对后续的人群运动分析尤为重要。运动视频序列的直方图信息、光流场、边缘信息、彩色纹理特征等都可以用来作为运动检测。根据不同的运动场景、运动目标特性因合理的采用不同的运动特征。

本文通过对人群特征分析的几种主要算法的整理和介绍，学习了每种算法的优点和缺点以及其适用的环境。

2 人体检测

视频图像中的运动人体检测是一个重要且十分困难的研究领域，在实现运动补偿、视频压缩编码、视频理解时都需要用到运动目标的检测。在视频理解中运动人体检测是后续跟踪、识别和活动分析的基础。对运动人体目标的正确检测能大大提高后续跟踪、识别和活动分析的正确率。

运动目标检测的方法主要分为三种：一种是帧差法，基于时问序列图像上的差分图像实现运动目标的检测；第二种是光流法，是对图像的运动场进行估计，将相似的运动矢量合并形成运动目标的检测；最后一种是背景差法，基于图像序列和参考背景模型相减实现运动目标的检测。帧差法能较好的适应环境变化较大的情况，对于目标运动引起的图像序列中发生明显变化的象素点比较容易检测，但对于变化不明显的象素点不能很好的检测出来。光流法在摄像机存在运动的情况下能较好的检测运动目标，但大多数光流计算方法十分复杂，计算量较大，不能满足实时视频流处理的要求。背景差方法能检测出和运动目标相关的所有象素点，但这种方法对于外界环境的变化，如光照、外来事件等非常敏感。

2.1帧差法

帧差法是基于目标的运动能体现在图像序列的变化上，以直接比较图像序列相邻帧对应象素点发生的相对变化为基础进行运动目标检测的方法。这是一种直接简单的运动检测方法。也相当于检测的是每一帧静态图像中的目标，通过阅读

文献，了解了基于AdaBoost算法的人脸检测方法。

图2.1 AdaBoost快速人脸检测系统框架图

使用AdaBoost学习算法的人脸检测方法由Viola等于2001年提出，该方法的主要特点是简单，实时性好，采用了一种称为“积分图像”的图像表示方法，能够快速计算出检测器用到的特征，然后用AdaBoost学习算法，从一个较大的特征集中选择少量的关键的视觉特征，产生一个高效的强分类器；再用级联的方式将单个的强分类器合成为一个更加复杂的分类器，使图像的背景区域快速地丢弃，而在有可能存在人脸目标的区域花费更多的计算。该方法的突出地位和贡献

在于，它给出了一个稳定的、实时的目标检测框架，是一个实时的人脸检测方法。图2.1为AdaBoost快速人脸检测系统框架图。

2.2光流法

光流法是基于对光流场的估算进行检测分割的方法。光流是图像亮度模式的表观运动光流中既包括被观察物体的运动信息，也包括了有关的结构信息。光流场的不连续性可以用来将图像分割成对应于不同运动物体的区域。光流法检测运动物体的基本原理是：给图像中的每一个像素点赋予一个速度矢量，这就形成了一个图像运动场，在运动的一个特定时刻，图像上的点与三维物体上的点一一对应，这种对应关系可由投影关系得到，根据各个像素点的速度矢量特征，可以对图像进行动态分析。如果图像中没有运动物体，则光流矢量在整个图像区域是连续变化的。当图像中有运动物体时，目标和图像背景存在相对运动，运动物体所形成的速度矢量必然和邻域背景速度矢量不同，从而检测出运动物体及位置。采用光流法进行运动物体检测的问题主要在于大多数光流法计算耗时，实时性和实用性都较差。但是光流法的优点在于光流不仅携带了运动物体的运动信息，而且还携带了有关景物三维结构的丰富信息，它能够在不知道场景的任何信息的情况下，检测出运动对象。

光流计算方法大致可分为三类：基于匹配的方法、频域的方法和梯度的方法。

(1) 基于匹配的光流计算方法包括基于特征和基于区域两种。基于特征的方法不断地对目标主要特征进行定位和跟踪，对大目标的运动和亮度变化具有鲁棒性。存在的问题是光流通常很稀疏，而且特征提取和精确匹配也十分困难。基于区域的方法先对类似的区域进行定位，然后通过相似区域的位移计算光流。这种方法在视频编码中得到了广泛的应用。然而，它计算的光流仍不稠密。

(2) 基于频域的方法，也称为基于能量的方法，利用速度可调的滤波组输出频率或相位信息。虽然能获得高精度的初始光流估计，但往往涉及复杂的计算。另外，进行可靠性评价也十分困难。

(3) 基于梯度的方法利用图像序列亮度的时空微分计算2D速度场（光流）。由于计算简单和较好的效果，基于梯度的方法得到了广泛的研究。虽然很多基于梯度的光流估计方法取得了较好的光流估计，但由于在计算光流时涉及到可调参数的人工选取、可靠性评价因子的选择困难，以及预处理对光流计算结果的影响，