基于视频的三维人体运动跟踪
基于单目视频运动跟踪的三维人体动画研究的开题报告
基于单目视频运动跟踪的三维人体动画研究的开题报告一、研究背景随着计算机视觉技术的发展,视频监控系统越来越普及,人体动画也越来越受到关注。
但是,传统的基于手工建模的人体动画制作工作量大、效率低、成本高,难以满足现实需求。
与此同时,单目视频的普及应用和算法优化为三维动画实时生成提供了便利和可能。
在这个背景下,基于单目视频运动跟踪的三维人体动画生成技术正在逐渐成熟和应用,成为了探索和研究的热点。
二、研究目的本研究旨在利用单目视频运动跟踪技术,实时地捕捉人体运动并生成三维人体动画,以提高动画制作的效率和质量。
具体目标如下:1. 研究人体运动捕捉的基本原理和算法模型;2. 构建单目视频运动跟踪系统进行数据采集和处理;3. 设计三维人体动画生成模型,实现对人体运动的准确描述和模拟;4. 实现对不同人体动作的自动识别和分类功能;5. 实现实时的三维人体动画生成,提高动画制作效率。
三、研究方法本研究采用文献调研、实验研究等方法,主要包括以下步骤:1. 文献调研:对人体运动捕捉、视频运动跟踪技术、人体动画生成等相关领域的现有研究进行梳理和分析,确定本研究的理论基础和技术路线。
2. 数据采集和处理:采集单目视频数据,对视频数据进行预处理,包括运动分割、运动估计、深度图生成等。
3. 三维人体动画生成:根据运动跟踪数据和深度图数据,构建三维人体动画生成模型,实现对人体运动的准确描述和模拟。
4. 动作识别和分类:基于深度学习技术,对人体动作进行分类和识别,实现对不同人体动作的自动识别和分类。
5. 实时三维人体动画生成:将前面步骤中的模块进行整合,实现实时的三维人体动画生成,提高动画制作效率。
四、论文结构本研究主要分为以下几个章节:第一章研究背景和研究目的介绍第二章相关理论与技术综述第三章数据采集和处理第四章三维人体动画生成技术研究第五章动作识别和分类研究第六章实时三维人体动画生成研究第七章实验结果分析第八章总结与展望五、预期成果本研究预期实现以下成果:1. 基于单目视频运动跟踪的三维人体动画生成技术研究,实现对人体运动的准确描述和模拟;2. 实现对不同人体动作的自动识别和分类功能;3. 实现基于现有技术的实时三维人体动画生成系统,提高动画制作效率。
基于视频的三维人体运动跟踪
基于视频的三维人体运动跟踪
刘国翌;陈睿;邓宇;李华
【期刊名称】《计算机辅助设计与图形学学报》
【年(卷),期】2006(018)001
【摘要】提出一种结合多种图像特征,在多摄像机环境下跟踪人体运动的方法.通过定义人体模型、摄像机投影模型以及相似性度量模型来得到优化框架下的目标函数,并使用牛顿-高斯优化算法对其进行求解.模拟数据和实际数据的实验表明,文中方法比仅仅使用灰度特征,跟踪结果得到了改善,对比实验结果也优于基于概率算法的退火粒子滤波.
【总页数】7页(P82-88)
【作者】刘国翌;陈睿;邓宇;李华
【作者单位】中国科学院计算技术研究所智能信息处理重点实验室,北京,100080;中国科学院研究生院,北京,100039;中国科学院计算技术研究所智能信息处理重点实验室,北京,100080;中国科学院研究生院,北京,100039;中国科学院计算技术研究所智能信息处理重点实验室,北京,100080;中国科学院研究生院,北京,100039;中国科学院计算技术研究所智能信息处理重点实验室,北京,100080
【正文语种】中文
【中图分类】TP391.4
【相关文献】
1.基于局部先验模型的单目视频人体运动跟踪 [J], 王文中;王兆其;邓小明;夏时洪;邱显杰
2.适用于单目视频的无标记三维人体运动跟踪 [J], 邹北骥;陈姝;彭小宁;史操
3.基于视频的三维人体运动跟踪系统的设计与实现 [J], 邓宇;李振波;李华
4.基于视频的虚拟人体运动跟踪 [J], 雷晓;李自力
5.基于单目视频运动跟踪的三维人体动画 [J], 吴玥;田兴彦
因版权原因,仅展示原文概要,查看原文内容请购买。
基于视频的三维人体运动跟踪系统的设计与实现
北 1 0 8 ) 0 0 0
北 京 1 0 4 ) 0 0 9
摘
要
在 优 化 粒 子 滤 波 跟 踪 框 架 下 , 计 并 实 现 了一 个 结 合 多 种 图像 特 征 、 多 摄 像 机 环 境 下 跟 踪 人 体 运 动 的 三 设 在
J n ,2 0 ue 07
基 于 视频 的 三维 人体 运 动 跟踪 系统 的设 计 与 实现
邓 宇 李振波 华 李
( 国科 学 院计 算 技 术 研 究 所 智 能 信 息 处 理 重 点 实 验 室 中 ( 家智 能 计 算 机 研 究 中心 国
( 国科 学 院研 究 生 院 中
3 b d d l a r d l n ma el eio d mo e ,wec n d f et eta kn be tf n t n a d D o y mo e ,c meamo e d i g i l o d l a k h a ei h rc ig o jc u ci n n o
r s l e i sn p i ie p ril i e e o v t i g o tm z d a tce fl r.Th e e i n s s w ha ta ki a e o s r tn r s ls u t e xp rme t ho t t r c ng nd r c n tuc ig e u t ma e b urs s e a e a c r t n fe tv d y o y t m r c u a e a d e f c ie.Th ss s e c n b p l d t e e a r a u h a p tn i y t m a e a p i O s v r la e s s c ss ori g e mo i n a l ssa d h to nay i n uma n’ to na i ma i n
基于视频的人体目标跟踪与识别技术
工作展望
技术发展
随着计算机视觉和人工智能技术的不 断发展,基于视频的人体目标跟踪与 识别技术将会有更多的应用场景和需 求。未来,该技术将进一步向着智能 化、自动化、高效化的方向发展,为 各个领域提供更加精准和高效的服务 。
技术挑战
虽然该技术已经取得了很大的进展, 但是仍然存在一些挑战和问题需要解 决。例如,如何提高算法的鲁棒性和 适应性,如何处理大规模和复杂场景 下的目标跟踪与识别问题等。未来, 研究者们需要进一步探索和创新,以 解决这些问题并推动技术的发展。
计算资源和存储空间来处理大规模数据集。
实时性挑战
计算效率
人体目标跟踪与识别技术需要大量的计算资源,包括高性能的处理器和GPU等。为了实现 实时性,需要优化算法和代码,提高计算效率,以满足实时处理的需求。
并行处理
为了加速目标跟踪与识别过程,可以采用并行处理技术,将计算任务分配给多个处理器或 GPU同时进行,以提高处理速度。
基于深度学习的方法
总结词
基于深度学习的方法利用神经网络学习图像中的特征表示进行目标跟踪。
详细描述
基于深度学习的方法通过训练深度神经网络来学习图像中的特征表示,并利用这些特征在后续帧中寻找匹配的目 标。这种方法能够自动提取有效的特征表示,对光照变化和目标形变具有较强的鲁棒性,但需要大量的标注数据 进行训练。
技术应用
基于视频的人体目标跟踪与识别技术 的应用前景非常广阔。未来,该技术 将在智能安防、智能交通、智能家居 等领域得到更加广泛的应用。同时, 该技术还可以与其他技术相结合,如 语音识别、手势识别等,实现更加智 能化和自然化的人机交互方式。
THANKS
谢谢您的观看
该技术面临的主要挑战包括目标遮挡 、光照变化、动态背景等。为了解决 这些问题,研究者们采用了多种算法 和技术,如特征提取、目标检测、运 动跟踪等,以实现准确的目标跟踪与 识别。
基于视频的人体运动跟踪与重构方法研究的开题报告
基于视频的人体运动跟踪与重构方法研究的开题报告标题:基于视频的人体运动跟踪与重构方法研究一、选题背景随着人类社会的不断发展和人类对于智能科技的不断追求,人体运动跟踪和重构技术成为了热门研究领域之一。
对于基于视频的人体运动跟踪和重构方法的研究,可以广泛应用于新型智能设备、虚拟现实、人类姿态分析等领域,提高了人类的生活质量,通过该研究的成果,还可以为人类科学技术的进一步发展提供基础支持。
二、研究目的本研究主要目的是分析人体运动的特点,建立数学模型,设计基于视频的人体运动跟踪与重构方法,并实现模型的验证和应用。
三、研究内容1.人体运动特点的分析和建模;2.基于视频的人体运动跟踪方法的设计;3.人体姿态维度的提取和模式分析;4.基于重建误差和跟踪精度对算法进行优化;5.对模型的验证和应用。
四、研究意义通过本研究,可以为人体运动跟踪和重构技术的进一步发展提供基础支持,并从理论上和实践上提升该技术的应用效能,进一步拓展该技术的应用领域,同时为人类生产生活和科学技术的发展提供有益的支持。
五、研究方法本研究采用基于视频的方法对人体运动进行跟踪和重构,其中包括人体轮廓的提取、图像序列的追踪、运动姿态的重构等步骤。
通过对算法的优化和对模型的验证,最终实现对人体运动的实时跟踪和重构。
六、进度安排1.文献调研和理论准备(2021年10月-2021年11月);2.人体运动特点的分析和建模(2021年11月-2022年2月);3.基于视频的人体运动跟踪方法的设计(2022年2月-2022年6月);4.人体姿态维度的提取和模式分析(2022年6月-2023年1月);5.基于重建误差和跟踪精度对算法进行优化(2023年1月-2023年6月);6.对模型的验证和应用(2023年6月-2024年1月);7.论文的撰写和答辩(2024年1月-2024年6月)。
七、预期成果本研究预期获得以下成果:1.基于视频的人体运动跟踪和重构方法;2.提供一种量化评估人体运动跟踪和重构的指标;3.完成一定的实验和数据采集,形成数据集;4.相关技术的论文和成果发表。
基于视频和三维动作捕捉数据的人体动作识别方法的研究共3篇
基于视频和三维动作捕捉数据的人体动作识别方法的研究共3篇基于视频和三维动作捕捉数据的人体动作识别方法的研究1人体动作识别一直是计算机视觉领域的一个研究热点,它可以应用于很多领域,如虚拟现实游戏、人机交互、安防监控等。
而基于视频和三维动作捕捉数据的人体动作识别方法是当前比较主流的一种方法,本文将介绍这种方法的研究进展和应用情况。
首先,基于视频和三维动作捕捉数据的人体动作识别方法是通过对视频和三维动作捕捉数据进行处理和分析,从而识别出人体的动作。
这种方法的一般流程是:首先采集视频和三维动作捕捉数据,然后通过对数据进行预处理和特征提取,进而进行分类和识别。
其中,预处理包括数据采集、标定、对齐等;特征提取是利用一些特征描述算法,如HOG、SIFT、SURF等,从数据中提取出特征向量;分类和识别则是通过机器学习算法,如SVM、KNN、决策树等,进行分类和识别。
目前,基于视频和三维动作捕捉数据的人体动作识别方法已经在很多领域得到了应用。
在虚拟现实游戏中,这种方法可以实现对玩家的动作进行识别和反馈,进一步增强游戏的沉浸感和互动性;在人机交互领域,这种方法可以实现对人手势的识别,从而实现手势控制功能;在安防监控领域,这种方法可以实现对异常动作的监测和报警。
此外,基于视频和三维动作捕捉数据的人体动作识别方法还可以应用于体育训练、医疗康复等领域。
然而,基于视频和三维动作捕捉数据的人体动作识别方法也面临着一些挑战。
一方面,数据采集和数据处理的成本较高,需要采集大量的视频和三维动作捕捉数据,并进行标定和对齐,这都需要耗费大量的时间和资源;另一方面,算法的精度和鲁棒性也需要不断提高,特别是在面对复杂场景、光照变化和遮挡等情况时,算法的分类和识别能力需要更加强大、灵活。
总的来说,基于视频和三维动作捕捉数据的人体动作识别方法是计算机视觉领域的一个重要研究方向,具有广泛的应用前景。
尽管它面临着一些挑战,但是在硬件技术、算法优化等方面的不断进步,相信这种方法将会得到更好的发展和应用基于视频和三维动作捕捉数据的人体动作识别方法在游戏、人机交互、安防监控、体育训练、医疗康复等领域具有广泛的应用前景。
基于视频的人体运动目标跟踪研究_张恒
Human Motion Target Tracking Based on Video
ZHANG Heng,JIN Xuanhong
( School of OpticalElectrical and Computer Engineering,University of Shanghai for Science and Technology,Shanghai 200000 ,China) Abstract The background in the real life is relatively complex, and the effect of the Camshift target tracking based on the color feature are undesirable in complex situations. The modified Camshift based on spatial edge orientation histograms and optimized Kalman filters are adopted to predict the next possible position of the target in the video,and related OpenCV functions are used to reduce the failure of tracking. The position of search window is obtained by calculating the edge histogram and Kalman filter is used for forecast and feedback the information to determine next frame window position,which can overcome the occlusion and noise interference. Experiments show that the algorithm has good performance in the detection and tracking of the target. Keywords video; edge orientation histogram; Camshift ; Kalman ; OpenCV; object tracking
基于视频的运动人体检测与跟踪的技术研究的开题报告
基于视频的运动人体检测与跟踪的技术研究的开题报告一、研究背景随着计算机视觉技术发展,人体运动检测与跟踪已成为研究热点。
人体运动检测与跟踪技术广泛应用于视频监控、运动学分析、医学研究等领域。
在运动学分析上,它可以帮助研究人体运动模式,识别运动中的异常现象,提高运动表现技能的质量。
在医学研究上,这种技术可以帮助研究人体姿势和动作的变化,对于临床医生的诊断和治疗也有很大的意义。
在视频监控领域,运动人体检测与跟踪技术可以帮助安全监控部门及时发现可疑行为。
二、研究内容本项课题主要研究基于视频的运动人体检测与跟踪技术,旨在开发出一种高效、准确、智能的方法,在各个领域得到广泛应用。
具体研究内容包括:1、运动人体检测方法研究,从单帧图像中识别出人体运动姿态,并获得三维空间中的深度信息;2、运动人体跟踪方法研究,将已检测到的运动人体在视频中进行跟踪,保证运动过程中的连续性和稳定性;3、运动人体分析方法研究,对运动人体进行姿势和动作分析,实现目标的精准识别和分类;4、系统优化方案研究,针对所研究的运动人体检测与跟踪系统,提出优化方案,包括算法的加速等。
三、研究意义1、提高视频监控的准确性和效率,为安全保卫领域提供有力支持,防范恐怖袭击等安全事件发生;2、为运动训练和康复治疗提供数据支持,促进体育产业的发展;3、增强医学图像的研究,为医学诊断和治疗提供技术支持。
四、研究难点本项课题存在一定难度,主要集中在以下几个方面:1、对于不同的人体运动和姿态,需要进行建模和分类;2、针对复杂运动场景,需要解决目标的遮挡和交叉问题;3、高效处理视频流,并保证实时性。
五、研究方法本项课题研究方法主要包括:基于深度学习的运动人体检测方法、匹配追踪算法、基于姿势估计的目标跟踪等。
六、预期成果1、研究出基于视频的运动人体检测和跟踪算法,具有较高的准确率和实时性;2、提供运动人体分析相关的数据和分析算法,支持其他领域的研究;3、对该技术领域进行深入研究,取得新的理论成果和实际应用成果。
基于视频的人体运动跟踪技术研究
基于视频的人体运动跟踪技术研究一、概览随着计算机视觉和模式识别技术的快速发展,基于视频的人体运动跟踪技术在过去的几年里已经取得了显著的进展。
这一技术广泛应用于视频监控、人机交互、虚拟现实、体育分析等领域,为人们带来了诸多便利。
为了更全面地了解基于视频的人体运动跟踪技术,我们首先需要掌握其基本原理和方法。
人体运动跟踪技术主要通过从视频中提取人体的关键点信息,并利用这些信息来追踪人体的运动轨迹。
在这一过程中,我们需要对人体模型进行建模,以便准确地描述和预测人体各部位的位置和运动状态。
跟踪算法的选择和优化也是提高人体运动跟踪精度的重要因素。
基于视频的人体运动跟踪技术正逐渐成为计算机视觉领域的研究热点。
通过对这一技术的研究和发展,我们可以更好地理解和应对现实生活中众多应用场景中的挑战,为人机交互、虚拟现实等领域的应用提供有力支持。
1. 研究背景与意义随着信息技术的快速发展,视频技术在各个领域得到了广泛应用。
人们在娱乐、教育、医疗等各个方面都利用视频来获取信息、交流和完成任务。
人体运动跟踪技术在视频处理和分析方面取得了显著的进展,为各种应用提供了强大的支持。
在这样的背景下,深入研究基于视频的人体运动跟踪技术具有重要的理论和实际意义。
这项技术可以帮助我们更好地了解人体运动的规律,推动模式识别、计算机视觉和机器人学等相关领域的发展;通过与他人分享和讨论运动视频,我们可以进一步提高理解人类行为和生理机制的能力。
实际应用方面,基于视频的人体运动跟踪技术在众多领域具有巨大的潜力,如影视制作和VRAR等领域,为人们带来更加丰富和沉浸式的体验。
对基于视频的人体运动跟踪技术进行研究,不仅可以推动理论创新和技术进步,还可以为人们的生活和工作带来极大的便利和乐趣。
本研究具有重要的理论意义和实践意义。
2. 国内外研究现状及发展趋势基于视频的人体运动跟踪技术受到越来越多的关注。
众多科研机构和高校在该领域取得了显著的研究成果。
清华大学、中国科学院等机构在人体运动跟踪方面有着深入的研究,提出了一些具有代表性的算法和技术。
视频序列中人体运动目标的检测与跟踪
现有技术的优缺点及需要解决 的问题。
研究现状与发展
01
国内外研究现状及代表性方法。
02
现有技术的评估指标与性能比较。
发展趋势与未来研究方向。
03
02
人体运动目标检测
基于光流法的人体运动目标检测
光流法原理
光流是空间运动物体在观测成像平面上的像素运动的瞬时速度, 通过光流计算可以得到运动物体的运动信息。
虽然已经具备较好的实时 性,但随着视频分辨率的 提高和帧率的增加,现有 的目标检测与跟踪方法还 需要进一步优化算法,提 高计算效率。
多目标跟踪
目前对于多目标跟踪的研 究还比较有限,尤其是在 复杂场景下,如何准确地 进行多目标跟踪仍然是一 个挑战。
深度学习模型 的可解释性
虽然深度学习在许多任务 中表现出色,但其黑箱性 质使得模型的可解释性成 为一个挑战。对于安全关 键的应用,如自动驾驶, 需要更多的研究来提高模 型的可解释性。
04
人体运动目标检测与跟踪 的优化算法
基于多特征融合的检测与跟踪算法
特征融合
利用多种特征信息(如颜色、 纹理、运动等)进行融合,以 增强目标检测与跟踪的准确性
。
特征选择
针对不同的应用场景和任务需 求,选择相关的特征进行融合 ,以实现更高效的目标检测与
跟踪。
优势
多特征融合的检测与跟踪算法 能够充分利用多种特征信息, 提高目标检测与跟踪的准确性
优势
强化学习算法能够通过与环境的交互学习最优策略,具有较好的适应性和鲁棒性。
05
实验结果与分析
实验数据集与评估指标
数据集
实验采用了多个公开数据集,包括PETS、CAVIAR、Walkers等,用于评估人体运动目标检测与跟踪 算法的性能。
基于视频图像的运动人体目标跟踪检测系统研究与设计的开题报告
基于视频图像的运动人体目标跟踪检测系统研究与设计的开题报告一、选题背景及意义现代智能视频监控系统已经在安防领域得到了广泛的应用,而基于视频图像的运动人体目标跟踪检测技术是其中关键的一环。
传统的人体目标跟踪算法主要基于像素级的物体分割与轮廓描述,这种方法存在一些问题,例如对快速运动的物体跟踪效果较差,对目标旋转、遮挡等情况处理能力较弱。
因此,近年来研究人员开始尝试基于深度学习等方法改进人体目标跟踪技术,取得了显著的成果。
本论文旨在研究设计一种基于视频图像的运动人体目标跟踪检测系统,实现对运动目标的精确跟踪与检测,提高视频监控系统的安防性能,具有重要意义。
二、研究内容及方法本文将研究以下内容:1. 基于深度学习技术的人体目标检测算法研究,包括Faster RCNN、YOLO 等目标检测算法的原理、优缺点等。
2. 基于视觉目标跟踪算法研究,包括粒子滤波、卡尔曼滤波、Meanshift 等视觉目标跟踪算法的原理、优缺点等。
3. 综合运用深度学习技术和视觉目标跟踪技术,设计一种基于视频图像的运动人体目标跟踪检测系统。
研究方法包括文献调研、数据采集、算法实现与比较。
三、预期成果及创新点预期成果包括:1. 设计一种基于视频图像的运动人体目标跟踪检测系统,并进行有效性验证。
2. 分析比较不同算法在目标跟踪与检测表现上的优缺点。
3. 探索深度学习技术与视觉跟踪技术的结合方式,提高系统运行效率与准确度。
创新点包括:1. 设计一种基于视频图像的运动人体目标跟踪检测系统,与传统目标跟踪算法相比,具有更好的跟踪效果和适应性。
2. 综合运用深度学习技术和视觉跟踪技术,能够有效地解决目标快速运动和旋转、遮挡等问题。
3. 对目标跟踪与检测算法做出深入的分析和比较,为后续相关研究提供参考。
四、论文进度安排第一阶段(2021年4月— 2021年6月):文献调研与数据采集第二阶段(2021年7月— 2021年9月):基于深度学习技术的人体目标检测算法研究第三阶段(2021年10月— 2022年1月):基于视觉目标跟踪算法研究第四阶段(2022年2月— 2022年5月):综合运用深度学习技术和视觉目标跟踪技术,设计一种基于视频图像的运动人体目标跟踪检测系统。
基于视频的人手运动跟踪系统
基于视频的人手运动跟踪系统崔凌(衡水学院物理与电子信息系,河北衡水053000)1引言视频人体运动分析是近年来倍受关注的研究方向,它在当前一些重要的研究和应用领域如计算机动画和游戏、虚拟现实和增强现实、高级人机接口等都有着广泛的需求。
与一般的人体运动捕捉问题不同,以人机交互为目的运动捕捉必须满足实时性,其捕捉结果不需要一定是三维结果,精度也不必太高,但要求跟踪算法具有鲁棒性和一定的自适应性,并可以自动从错误中陕复。
考虑到在一般室内环境中,下半身往往会被遮挡,或位于图像外,主要由上半身的运动(手臂)来传递姿态信息,因此本文考虑实现一个实时的人手运动跟踪系统满足于一般人机交互需要。
2系统设计方案按照对数据处理的抽象程度和视觉系统自身的特点,一个视频运动分析系统可分为由低到高三个层次。
如图1所示,整个视频人手运动跟踪系统分为:数据采集、人手检测和跟踪、人手运动理解和描述三个模块。
[三三卜[:亟至H三堕至固。
图1视顿^昂垂动分析系统眶架结构1)数据采集。
彩色摄像头获取的视频信息经过插在计算机主板上的视频采集卡的数字化和编码后,传入到计算机中供以后的视频图像处理。
它的基本原理是将摄像头和视频采集卡采集检测区域的视频图像,并负责将采集到的图像实时情确地传送到图像处理单元中进行处理,同时也可将图像数据存入附带的外设存储器中,便于后期观察和分析。
2)人手检测和跟踪。
跟踪就是对图像序列中的运动物体,通过提取它的某些特征,并且把这些特征从一幅图像到另一幅图像匹配起来,运动跟踪的目的是获得运动物体的运动孰迹。
3)运动理解和描述模块。
对跟踪的人手的行为进行理解和描述。
3系统软硬件设计”系统的硬件配置一个系统的硬件选择由多方因素共同决定。
系统所要达到的性能指标是决定系统硬件配置最关键因素。
由于文本所需要实现的系统是一个实验性质的小型系统,对性能要求不是很高,所以选用一般的硬件配置就可以。
同时成本预算也是决定硬件配置的一个重要因素。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
坐标系中的位置 , 共有 3 个旋转 3 个平移 , 6 个自 由 度1 图 1 所示为骨架模型的自由度分配示意图 , 整 个骨架自由度为 24 个1 我们把这 24 个自由度放在 一起 , 形成一个状态向量 φ ,φ 可以唯一确定人体在 某一时刻 t 的骨架姿态1 在定义骨架模型的基础上 , 我们同时定义附着 在骨架模型上的身体形状模型1 本文中采用了类似 文献 [ 5 ]中的形状模型 , 用圆台来表示身体的躯干和 四肢 , 并增加椭球形状来表示头 、 手和脚1
[ 728 ]
方式则存在搜索到局部极小值点 , 累计错误以及不 健壮等问题1 b1 基于概率的跟踪框架1 在这个框架 中用概率来描述跟踪过程中的不确定性以及噪声 、 杂乱背景等影响1 比较有影响的是基于离散采样表 示 ( 非参数) 的 Condensation 算法 ,即粒子滤波算法 , 文献 [ 5 ,829 ] 均基于这个跟踪框架1 这类算法同样需 要一个姿态的初始分布 , 然后利用概率的时间传播 来模拟状态分布随时间的演化1 利用基于概率的算法可以处理混乱背景以及非 线性运动模型所引起的多峰分布问题 , 在跟踪低自 由度的运动获得了很大的成功1 然而该算法所需要 的粒子数目随人体自由度的指数增长 , 处理高自由 度的人体运动会有很大问题1 本文采用了基于优化的算法框架 , 通过改进文 献 [ 4 ] 中人体投影模型 ,使之适用于一般意义的透视 摄像机跟踪1 另外 ,将文献 [ 4 ] 中使用的单一灰度特 征拓展到结合使用多种特征 ( 灰度 , 轮廓 , 边界 ) , 从 而改善了原有算法中存在错误累积的情况1
第 18 卷 第 1 期 2006 年 1 月
计算机辅助设计与图形学学报
J OU RNAL OF COMPU TER2A IDED DESIGN & COMPU TER GRAPHICS
Vol118 , No11 Jan1 , 2006
基于视频的三维人体运动跟踪
刘国翌
1) 2)
1 ,2)
陈 睿
1 人体模型及投影过程
人体运动跟踪问题的输入为一个或多个视角 的、 已同步的图像序列 ; 输出为每个时刻人体的姿态 参数 ( 关节位置或角度 ) , 其目标是寻找一组随时间 变化的姿态参数 , 使它们描述的人体运动与图像序 列中的人体运动最为一致1 为了定量地描述这个优 化问题 ,我们首先定义一个人体模型以及这个人体 模型在多个摄像机下的投影过程 , 并在此基础上定 义人体模型与图像特征的匹配过程1
Video2Based 3D Human Body Motion Capture
Liu Guoyi1 ,2) Chen Rui1 ,2) Deng Yu1 ,2) Li Hua1)
1) 2)
( Key L aboratory of I ntelli gent I nf orm ation Processi ng , I nstit ute of Com puti ng Technology , Chi nese A cademy of Sciences , Beiji ng 100080) ( Depart ment of Com puter Science , Graduate School , Chi nese A cademy of Sciences , Beiji ng 100039)
根据应用的不同 , 基于视频的人体运动跟踪分
0 引 言
人体运动跟踪是利用仪器记录人体运动的过 程 ,它在娱乐 、 运动测量分析以及人机交互等许多领 域有着重要的应用1 市场上比较成熟的人体运动捕 捉系统有基于电动机械的 、 电磁的和特殊光学标 记 [ 1 ] 等类型1 相对于这些商业系统 , 基于视频的人 体运动跟踪技术是一种不需要标记或者传感器的被 动跟踪 ,由于其适用范围广 、 对跟踪环境要求较低 、 价格便宜 ,近年来成为机器视觉领域的研究热点1
1 ,2)
邓 宇
1 ,2)
李 华
1)
( 中国科学院计算技术研究所智能信息处理重点实验室 北京 100080) ( 中国科学院研究生院 北京 100039) (gyliu @ict 1ac1cn ,lgone2000 @hot mail1com)
摘 要 提出一种结合多种图像特征 ,在多摄像机环境下跟踪人体运动的方法1 通过定义人体模型 、 摄像机投影模 型以及相似性度量模型来得到优化框架下的目标函数 , 并使用牛顿2高斯优化算法对其进行求解1 模拟数据和实际 数据的实验表明 ,文中方法比仅仅使用灰度特征 , 跟踪结果得到了改善 , 对比实验结果也优于基于概率算法的退火 粒子滤波1 关键词 运动捕捉 ; 多摄像机人体运动跟踪 ; 非线性优化 中图法分类号 TP39114
收稿日期 :2004 - 11 - 19 ; 修回日期 :2005 - 02 - 22
为视频监控 [ 2 ] 、 人机交互 [ 3 ] 、 运动分析和动画制作 等几类1 本文的研究背景即为这类应用 , 利用基于 视频的运动捕捉技术对运动员的运动参数进行自动 采集和准确计量 ,从而提高训练效果1 很多研究者从不同角度讨论了三维人体运动跟 踪问题1 Bregler 等 [ 4 ] 采用类似 L ucas & Kanade 光 流估计的方法来跟踪身体各个部分 ,用 “Exponential maps and twist motions” 旋转描述来简化图像运动 与模型运动的关系1 Deut scher 等 [ 5 ] 采用退火粒子滤 波算法在多摄像机下实现对人体三维全身运动的跟
1期
刘国翌等 : 基于视频的三维人体运动跟踪
83
踪1 Gavrila 等 [ 6 ] 使用基于距离图的图像和模型的匹 配技术 , 采用搜索空间分解的方法找到最优姿态1 文献 [ 8 ] 提出使用 Covariance Scaled Sampling 结合 局部优化的方法从单视频中跟踪人体运动1 总结近年的文献可以看出 , 当前流行的方法大 多采用基于人体骨架模型的匹配技术1 这种方法的 目标是在状态空间中找到一组姿态参数 , 使得对应 这个参数的人体姿态与从图像中提取的底层特征最 为符合1 基于人体骨架模型的匹配技术通常使用产生并 测试的方法 ,其基本思想是根据历史跟踪结果预测 当前时刻的姿态参数 , 然后根据预测的参数值生成 人体姿态的某种表示 ,并用之去匹配图像特征 ,根据 匹配结果对当前时刻姿态参数进行估计1 这种预测 — 匹配 — 更新的跟踪框架也适用与一般意义的物体 跟踪1 使用该跟踪框架跟踪人体 ,需要解决 2 个问题 : 1) 提取有效的图像特征 ; 2 ) 高维人体姿态空间的 搜索1 对于第一个问题目前常用的方法是利用对环境 和人的外观假设来实现 : 文献 [ 5 ] 采用减背景 , 文献 [ 6 ] 采用彩色紧身衣 ,文献 [ 7 ] 采用立体匹配的特征1 根据底层特征的不同 , 匹配的方式也不尽相同1 在 匹配生成数据与底层特征时 , 把描述二者相似程度 的函数称为相似性度量函数 , 它被用来评价生成姿 态的正确程度1 如文献 [ 6 ] 采用了基于边界图像的 距离图匹配 ,文献 [ 7 ] 利用深度数据与元球模型表面 进行匹配 ,文献 [ 4 ,9 ] 采用了基于灰度差的度量函数 等1 本文中结合使用了 3 种常见特征 : 灰度 , 轮廓和 边界特征 ,试图通过组合多种图像特征来提高跟踪 的健壮性 ,从而逐渐减少对实验环境的依赖1 对于高维姿态空间搜索问题 , 一般采用 2 种方 式来解决 : 1) 对搜索空间进行剪枝 , 或者限制搜索在整个 空间的一个子空间内进行1 如限制某些关节角度在 合理的运动范围内 ,并保证肢体不能相交 1 也可 [9 ] 以采用学习已知人体运动的人体运动模型 , 或者 使用运动的平滑性来限制搜索范围1 2) 采用适当的搜索策略1 搜索测量可以分为 2 类 :a1 使用局部优化的算法从某个初始值附近进行 搜索 ,最后优化到一个局部极小值点1 文献 [ 4 ,627 ] 采用的就是这种策略1 优化初值在第 1 帧采用手工 给定或者由自动初始化过程给出 , 在其他时刻则根 据历史跟踪的结果进行预测得到1 基于局部搜索的
M ex = R O t
1
是摄像机外参矩阵 , R 为3 × 3旋转矩
阵表示摄像机的旋转 , t 为 3 × 1 矩阵表示摄像机的 平移向量1 我们利用 OpenCV [ 10 ] 提供的定标算法来计算 每个摄像机的内参数1 对于摄像机外参数 , 采用手 工选取地面上已知世界坐标的蚕照点 ( 最少 4 个不
Abstract We present a video2based 3D body t racking met hod f rom multiple cues in multiple cameras en2 vironment 1 By defining t he body model , image projection model and similarity measurement model , t he t racking object f unction is proposed , t hen resolved using t he Newton2 Gaussian met hod1 The experimental result s on simulated data and t he real data show t he t racking is improved by combining several image cues , and t he t racking performance is better t han t he annealed particle filter algorit hm1 Key words motion capt ure ; multiple camera body t racking ; nonlinear optimization
基金项目 : 国家科技攻关计划课题奥运科技专项 (2001BA904B08) ; 国家重点基础研究发展规划项目 (2004CB318000)