一种运动人体行为识别的改进方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种运动人体行为识别的改进方法

摘要:隐马尔可夫模型主要用于根据系统外部观测量来预测该事件的未知序列,本文将它引入运动人体行为识别中。在获得了运动目标的整体轮廓以后,论述了怎

样对规则行为建模,并结合隐马尔可夫原理识别出运动人体行为。针对人体轮

廓单通道图像对比的局限,提出了一种轮廓对比和质心跟踪相结合的方法改进

了算法,通过实验证明该改进的算法具有较好的性能。

关键词:行为模型 隐马尔可夫模型 质心 轮廓

中图法分类号:TP3文献分类标识码:C4

An Improved Method for Human Motion Recognition

Abstract:The Hidden Markov Models is widely used in forecasting the unknown sequence based on observation on outside system. In this paper, it is applied in human

motion recognition. With the human’s silhouettes, the paper deals with how to get the models

of regular actions and combine with HMM to recognize the motions of mobile human. As for

the localization on gray images of silhouettes, silhouettes contrasting and center of mass

tracking algorithm is put forward to solve this problem. The results show that the new

algorithm has better performance.

Key words:Motion models, HMM, Centroid, Silhouette

1引言

目前,“人的观察”(looking at people)向“理解人”(understanding people)转变是计算机视觉领域中最活跃的研究主题之一,其核心是利用计算机视觉技术从图像序列中检测、跟踪、识别人并对其行为进行理解与描述,其重要目标是摆脱传统的人机交互方式(如:键盘、鼠标等设备信息输入),让计算机系统具备自动分析,获取外部信息的能力,并通过分析做出相应的响应,让计算机系统更加智能化和人性化 。

动态现场视觉监控是计算机视觉领域一个新兴的应用方向。视觉监控区别于传统意义上的监控系统在于其智能性[1]。简单而言,不仅用摄像机代替人眼,而且用计算机代替人、协助人,来完成监视或控制任务,从而减轻人的负担.视觉监控具有广泛的应用前景和潜在的经济价值。运动目标行为识别作为整个视觉监控的重点和难点,国内外提出了许多方法,比如区域分割[2],关节点法等,但实现起来相当复杂。针对一些常见的非规则行为(比如跳,爬行,打斗,偷窥等)本文采用了一种隐马尔可夫模型和质心理论相结合的方法,简单的运用自然语言理解,能够比较高效的识别出这些非规则行为,并且具有比较大的可扩展空间。

2相关知识

2.1

运动目标监测的一般步骤

图2.1 运动目标行为识别的一般步骤

本文所做工作属于行为判断,模板匹配法将图像序列转换为一组静态形状模式,然后在识别过程中和预先存储的行为标本相比较[3],结合一定的统计算法,判断人体的行为。

2.2 运动人体行为的图像序列表示

人体在运动过程中动作都可以分解成以时间为线索的图像序列[4],例如走路,跑,跳都可以作分解,我们将一些常见行为的一个周期用一组连续的图像帧来表示,并且对每一帧作图像的预处理,提取出灰度轮廓,将这一组图片建库,也就是本文所提到的标准行为库。下面是行为的图像序列表(以正常行走为例)

图 2.2 正常行走的动作分解

2.3隐马尔可夫模型HMM

隐马尔可夫模型(Hidden Markov Models)主要用于根据系统外部观测量来预测该事件的未知(隐含)序列[5]。使用统计的方式来表示每一个可能的状态间跳转的转移概率,借此来描述一个复杂的系统。它在学习和匹配行为模式方面非常有效。假设对于一个随机事件,有一个观察值序列:,,...,,该事件隐含着一个状态序列:,, (6)

1O 2O t O 1X 2X t X 假设1:马尔可夫假设

(状态构成一阶马尔可夫链)P(|,,…)=P(|);

i X 1−i X 2−i X 1X i X 1−i X 假设2:不动性假设(状态与具体时间无关)P(|)=P(|),对任意i, j 成立; 1+i X i X 1+j X j X 假设3:输出独立性假设(输出仅与当前状态有关)P(,,…|

,,…)=

P(|); 1O 2O t O 1X 2X t X t O t X 隐马尔可夫模型的三个基本问题包括评估问题,解码问题,学习问题。其中解码问题是指:对于给定的模型和观察值序列,求可能性最大的状态序列。对应的算法有韦特比(Viterbi)算法。

2.4 运动人体行为的自然语言理解

自然语言处理就是研究如何能让计算机理解并生成人们日常所使用的语言,使得计算机懂

得自然语言的含义,并做出相应的反应。自然语言理解技术大致可分为机器翻译、语义理解及人机会话技术几个方面。其中语义理解通过将语言学的研究成果和计算机技术结合在一起,实现了对词语在语义层次上的理解[7]。在本文所述系统中,通过相似度对比,计算机能简单的理解运动目标的状态,并以自然语言来描述,比如“在行走的人”,“拿着箱子走的人”等等。

3.系统实现流程及改进算法

在本智能安放系统中,我们规定规则行为有正常行走,慢跑,且允许携带物品(初步理想化为大皮箱),其它的行为,例如爬,跳,偷窥,打斗等均为非规则行为。于是采用排除法,对规则行为建立标准库,由于慢跑和行走在轮廓形状上大致相同,将其建立一个库(设

为A 库)表示“正常行走或慢跑的人”

,将携带箱子的行为建立另外一个库(设为B 库)表示“提箱子走的人”。实现流程如下:

3.1 算法实现步骤

(1)在结合背景减除法和差分法获得了人体轮廓后,我们用区域融合的办法加上形态学腐蚀和膨胀原理[8]进行处理,以保证轮廓的完整性。

(2)建立坐标,采用循环查找的方法,计算每帧轮廓图像中点的垂直和水平方向的最大值和最小值记为,从而找到纵坐标和横坐标最大和最小的点,,以这两个点的连线为对角线,利用OPENCV 中函数确定每帧图像中单个人的矩形框。

)2,1,2,1(X X Y Y )1,1(X Y )2,2(X Y (3)进出屏幕问题的解决,当运动人体进出屏幕的时候,捕获到的人体轮廓并不完整,因此形成误判,这时需要将进出屏幕的过程中经历的图像帧予以屏蔽不加判断。

(4)运用隐马尔可夫模型结合标准库进行行为判断:

用模型五元组),,,,(B A M N Π=λ用来描述HMM,

其中代表行为库的个数,N M 代表库中包含的图片数,Π表示初始时选择某行为库的概率,A 表示选择某个库的情况下选择另一个库的概率,B 代表每个库中图片分布。问题就转化成对于给定的观察序列O =,以及模型T o o o ,...,21λ,如何选择一个对应的状态序列S = 使得S 能够最为合理的解释观察序列O 。在这里对于解码问题我们采用Viterbi 算法,具体实现如下:

,,...,21T q q q 定义: 和分别为状态个数和序列长

度,我们要找的就是]|,...,,,,...,[)(21121,...,max 121λδt t t q q q t O O O i q q q q P i t ==

−−N T T 时刻最大的)(i T δ 所代表的那个状态序列。首先初始化:

N i O b i i i ≤≤=1),()(11πδ

N i i ≤≤=1,0)(1ϕ

递归按照如下公式:

N j T t O b a i j i j ij t N j t ≤≤≤≤=−≤≤1,2),(])([)(11max δ

δmax arg 1)(N j t j ≤≤=

ϕN j T t a i ij t ≤≤≤≤−1,2],)([1δ 最后终结得: )]([max 1*i P T N j δ

≤≤=)]([max arg 1*i q T

N j T δ≤≤=求S序列:

1,...2,1),(*11*−−==++T T t q q t t t ϕ 该序列即为人体行为库中描述行为的图像序列,包括正常行走,慢跑等,我们通过行为库的不断扩展可以识别出更多正常的行为,反之,当我们对于一个观察序列进行计算,确定找不到对应的状态,则这个观察序列所代表的人体行为自然被系统判断成异常。安防报警系统将自动报警。

相关文档
最新文档