基于条件随机场的连续运动识别技术_柴桦

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

53
HM M 识别。本文沿用手势识别领域中这种思想 , 对文献 [ 3] 进一步研究扩展 , 提出一种适合于体育运动中连续运动识别的 CRF ( Conditional Randon Field , 简称 CRF) / Condensation( Conditio nal Density P ropaga tion , 简称 Condensa tion) 新算法 , 利用 Co ndensatio n 对边界进行动态估计完成分割 , 结合 CRF 对复杂动作的优越识别能力 , 实现了包含翻腾、旋转复杂运动特征的连续运动识别。本文的主要贡献在于 : ( 1) 首次将 C RF 置于 Condensation 框架下进行连续运动的识别 ; ( 2) 提出一种先假设再验证的分段策略 , 利用 Co ndensatio n 可靠解决连续运动的动作片段分割问题 ; ( 3) 利用 CRF/ Condensatio n 算法对分割片段的优选策略去除了动作边界邻近过渡帧的影响 , 提高了连续运动识别的稳定性。
图 1 线性链形式的 C RF 模型
对给定输入结点 , CRF 可以计算指定输出结点的条件概率。定义团 C ( Y , X) 表示图中最大全连接子图的集合 , C RF 将给定输出序列条件概率定义为图中各个团的位势函数的乘积 : 1 c θ ( y c , xc) ( 1) Zθc ∈ C( Y , X) 其中 , c Z θ 为归一化因子 , 保证状态 θ 表示团 c 的位势函数 ; Pθ ( y x)=
立性要求 ; 此外 , 它还具有表示观测元素之间复杂的相互关联属性和长距离依赖的优点。文献[ 3] 中运用 CRF 对人体多种体育运动进行识别 , 结果表明 , C RF 不仅能区分不同动作类型 , 还能分辨出动作的细微差别 , 如漫步和正常行走 , 表现出优越的识别能力。然而 , 以上方法都忽略了过渡姿势对识别的影响。在连续运动识别时 , 由于动作转换过程中过渡姿势随前后动作的不同而变化 , 难以判决归属类别 , 往往出现误将过渡阶段识别为一个或几个动作的现象。在已有的体育运动识别文献中 , 并没有提及这个问题的解决方法。手语识别领域中 , 研究者利用“ 分段识别” 的方法较好地解决了此问题。例如 , 文献[ 4] 中对非特定人连续手语句子进行识别时 , 提取具有较强段特性的手语特征数据输入到精简循环网络中检测段边界 , 再将分好的手语词特征数据输送到 HM M 框架识别 ; 文献 [ 5] 中通过计算手语手势与非手语手势的差异概率来进行边界检测 , 同样采用
基于条件随机场的连续运动识别技术 Continuous M otion Recog nition Based on C RF
柴桦 , 邹北骥 CHAI Hua , ZOU Bei -ji ( 中南大学信息科学与工程学院 , 湖南长沙 410083) ( School of Information Science and Engineering , Central South University , Changsha 410083 , China) 摘要 : 在体育运动识别中 , 过渡姿势的复杂多变性容易导致识别错误。针对此问题 , 本文提出一种基于条件随机场 C RF 和条件概率密度传播 Co ndensation 的连续运动识别算法。该算法采用“ 分段识别” 的思想 , 首先利用 Co ndensatio n 估计动作边界 , 然后分割出片段输入到 CRF 对其进行识别。实验结果表明 , 本文算法能减少过渡姿势对识别正确性的不良影响 , 比传统单纯使用 C RF 算法具有更好的稳定性和识别正确率。 Abstract: T he difficulty in recog nizing v ariable transitio n postures is o ne reason of the occurre nce o f fault co ntinuous motio n reco gnition . W e present a new method to tackle the problem by combining CRF ( Co nditional Rando m Field) with Co ndensation( Conditio nal Density P ropag ation) .In the pr oposed method , Co ndensa tion is used to g ener ate a hypo thesis about the border o f a movement in the continuous motion sequence , then CRF implements the r eco gnition task of the hypothetical movement fr ag ment .The likeliho od o f a hy po thesis can be evalua ted by the pro babilistic output of CRF .Ex pe riments sho w tha t o ur method has a co nsiderable im pr ovement in stability and the rate of cor rect identifica tion co mpa red with C RF . 关键词 : 连续运动识别 ; CRF ; co ndensa tion ; 边界检测 ; 运动识别 Key words : co ntinuous mo tion recog nitio n ; CRF ; co ndensa tion ; bor der detectio n ; motion recog nitio n 中图分类号 : T P391 文献标识码 : A 强的优势 , 同时克服了 HM M 的不足 , 对观测序列没有独
CN 43 -1258/ T P ISS N 1007 -130X
计算机工程与科学
CO M P U T ER EN GIN EERIN G & SCI EN CE
ຫໍສະໝຸດ Baidu
2009 年第 31 卷第 5 期 V ol .31 , No .5 , 2009
文章编号 : 1007-130X( 2009) 05 -0053 -03
其中 , F θ 是特征函数 , 可以采用团中各边或结点任意的非独立状态和转移特征。在给定完备的标记动作训练集 { xm , ym } m= 1 … M 条件下 , 通过最优化训练集的条件对数似然 ( log-likelihoo d)解出 CRF 的模型参数 θ 。条件对数似然函数为以下形式 :
2 CRF 相关原理
Laffe rty J 和 M cCallum A 在 2001 年首次提出的 CRF 是一种无向图模型 , 通过建立概率模型来进行序列数据的标注 , 具有很强的推理能力 , 并且能够使用复杂、有重叠性和非独立的特征进行训练和推理 , 在语音识别、计算机视觉等领域都有优越的表现。线性链是一种典型的 CRF 模型 , 输入结点集合 X = {x1 , x2 , … , xt } 表示可被观察的输入数据 , 输出结点集合 Y = { y 1 , y2 , … , y t } 对应于可被模型预测的输出状态 , 各输出结点之间构成线性结构 , 如图 1 所示。图 1 中 , 空心结点表示勿需对观测序列建模 , 由此特性可知 , C RF 无须考虑建模所设的独立性限制 , 能任意捕捉观测序列的所有属性 , 从而使之能容纳各种非独立迭加特征。
＊收稿日期 : 2008 - 02 -02 ; 修订日期 : 2008 - 05 -04 基金项目 : 国家自然科学基金资助项目( 60673093) ; 湖南省自然科学基金资助项目( 06JJ2065) 作者简介 : 柴桦( 1978 -) , 女 , 湖南张家界人 , 硕士生 , 研究方向为计算机图形学与图像处理 ; 邹北骥 , 教授 , 博士生导师 , 研究方向为计算机图形学与图像处理、计算机辅助设计、多媒体技术和软件工程技术等。通讯地址 : 410083 湖南省长沙市中南大学校本部计算机楼 407 室 ; Tel : 13548727022 ; E - mail : 276967485 @qq . com Address : School of Inf ormati on S cience and Engineering , Cent ral S ou th U niversi ty , C hang sha , Hu nan 410083 , P . R. Chi na
＊
1 引言
在体育运动分析领域中 , 运动识别是近年来备受关注的研究方向 , 它可以用于运动视频的自动标注、基于体育内容的检索等方面 , 对于科学、高效地指导运动员的体育训练 , 从而提高运动员的竞技水平有着积极的推动作用。以往对体育运动识别的研究侧重于简单动作的识别 , 比如走、跑、坐等 , 近年来随着行为识别技术的发展和应用的深入 , 连续运动的识别越来越引起人们的关注。目前 , 国内外就体育运动识别展开的研究工作中 , 概率统计法是应用最广泛的方法 , 如 H M M (Hidden M a rko v M odel , 简称 H M M)、DBN( Dy namic Bay esian N etwo rk , 简称 DBN) 等[ 1 ] 。近年来一种新的概率图模型条件随机场 [ 2] 开始在运动识别领域崭露头角。条件随机场是一种无向图模型 , 它继承了经典概率模型 H M M 对时间序列处理能力
图 2 连续运动识别整体框架
边界检测的目的是找到连续运动长序列中各个动作在时间上的起始和结束点。体育运动过程中 , 动作在时间上的分布不仅与动作类型有关 , 还受到个体身体条件、运动习惯、环境等诸多因素的影响 , 很难找到分布规律。因此 , 本文采用一种有力的动态估计工具 -Condensation 对连续运动序列实施边界检测。 Co ndensatio n[ 6] 是通过非参数化的
M T θ m t m , ym )- lo g Z θ (xm) ) t1 , x , t
L θ=
m =1
F( y ∑ ∑(
t= 1
⑷
3 基于 CRF/ Condensation 的连续运动识别
在体育运动识别任务中 , CRF 可以对给定的观测人体运动序列找出使输出条件概率最大的状态序列 , 从而实现从观测运动序列到运动状态序列的映射。本文采用文献 [ 3] 的方法分别进行体育运动的动作和连续运动的识别实验。实验结果表明 , CRF 在连续运动识别任务中不能很好地处理过渡姿势。为此 , 本文将连续运动的识别分解成边界检测和动作识别两个子任务交叉同时进行 , CRF 只执行动作识别的任务。连续运动识别整体框架如图 2 所示。