人体行为识别的数据库对比研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图4 MSR Ac t i o n 3 D部分 样例动作
MS R D a i l y 3 D [ 3 1 动作 数据 库是用 K i n e c t 传感 器采 集
图像 构 建 的行 为识 别 数据 库 。共包 含 1 6种 运 动 :d r i n k ,
e at ,r ead b ook,cal l cel l p hone, wr i t e on a pap er , L i s e l ap t op, u s e v ac u um c l ea ne r ,c h eer up, s i t s t i l l , t os s p ap er , pl ay game ,l a y d own,w al k, pl ay gui t ar ,
生产 生活有很大影 响 。现在的计算机 的计算能力越来越强大 , 而价格却 越来越便 宜 。计算机 的 出现 和使用 ,最大限度 地减 轻 了人的 压力 ,避免 了人力和 物力 的浪费 。用 于行为识 别的 数 据库是 实现行为识 别研究 的第一步 ,本文将 针对现有 的数
据 库 做 出 总结 和 分 析 。
wa v i n g , t wo - h a n d s - wa v i n g , j u mp i n g i n p l a c e , j u mp i n g
J a c k , s k i p p i n g。每种 动 作 由 9个人 完成 ,数据 库的 采集 是 在 同一静 止的背景 下进行 的 。数据库 中所包 含的每个视 频 ,
C H I N A S C I E N CE A N D T E C H N O L O G Y I N F OR M A T I O N S e p 2 0 1 7 中国科技 信息 2 0 1 7年第 1 7 期
6 1万 ~ 2 0 0万 §
圜
D OI ・1 0 . 3 9 6 9 / j . i s s n . 1 0 0 1 — 8 9 7 2 . 2 0 1 7 . 1 7 . 0 3 3
据库的采 集是 在静止的 背景下进行 的 。但 是 ,每个动 作是在 不一样 的尺度下和 不同 的背景下完 成的 。数 据库 中所 包含的 每个视频 ,完成动作的 时间是 2秒 ,视频帧的速率是 2 5 f / s ,
一
图 1 We i z ma n n数据库
97 一
I 科学I
的科学意 义 ,而且具 有十分 关键的现 实应用价 值 ,对我 们的
基 于 RGB—D 的人体 行 为识别 库
与彩色 图像对 比 ,深度数据仅与物 体的空间位置 相关 ,
具 有空间颜色 无关性 ,能直 接反映 出物体 表面的三维特 性 ; 受光照强弱 以及外界环 境改变等因素的 影响较小且便于处 理
一
中遇到 的问题和瓶 颈 ,深度 图像 的研究和利 用 ,使得人体姿
态估计取 得了较 大进步 。常见的基于 RGB - [ ) 的 人体 行为识 别库有 MSR Da i l y 3 D动作数 据库 、MSR A c t i o n 3 D 动作 数据库和 DH A深度数据 库 。 般 都是针 对彩色视 频和 图像 ,用的 比较 多的 基于 RGB的
◎6 1万 一 2 0 0万 中 国 科 技 信 息2 o 1 7 年 女
|
来自百度文库
J c . g g u ] 8
R ,  ̄ m m 8
e 。 硎g
诎 d 吨
H 曲d c i i
。
幽
盗逝
叠 瞳 t
图2 KT H数 据库
_
图3 MSR Da i l y 3 D数据库 中的部分样 例动作
遮挡 问题 。所 以 ,人体行为识别 结合深度数 据 ,可以更准确
地完成 人体行 为识 别 ,提高识别 率 。将深度信息 作为彩色 图 像序列 的补充 ,可 以有效地突破 可见光图像识 别与行为分析
基于 RGB 的人 体行 为 识别 库
近些年来 ,科研人员 对人体动 作行 为分 类和识 别的探索
人体行为识别库是 We i z ma n n数据库和 K TH数据库 。
We i z ma n n数 据 库 [ 1 ] 共 包含 了 1 0种 运 动 ,分 别
是 wa l k , r u n , j u mp , g a l l o p s i d e wa y s , b e n d , o n e - h a n d —
的,这 四个 场 景 分别 是 o u t d o o r s 、o u t d o o r s wi t h s c a l e
v a r i a t i o n、o u t d o o r s wi t h d i i f e r e n t c l o t h e s 、i n d o o r s 。 数
s t a n d u p,s i t d o wn 。每种动 作由 1 0个人完成 ,每人做 2
一 l 『 ” I I . 菌稽蕊
行 业 曲 线
影 响力 真实度
行业关联度
分析 视频 中人体的行 为是行 为识别研 究的重要 内容 ,作
分辨率为 1 6 0 X 1 2 0 。KT H数据库共有 6 0 0个视频片段 。
为计算机 视觉范 畴的重要 研究课题 ,行为识别 不仅具有 重要
完成 动作 的时间是 2秒 ,视频 帧的速率 是 2 5 f / s ,分辨率 为
1 8 0X 1 44。
K TH数 据库共 包合 了 6种运 动 ,分 别是 wa l k 、i o g g、
r u n 、b o x、h a n d w v a v i n g、h a n d .1 a p p i n g。 每 种 动 作 由 2 5个人 完 成 。数据 库 的采 集 是 在 4种 不 同 的 场 景 下 进行