基于对象的视频摘要技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键帧 的视频摘要和基于对象的视频 摘要。二者的相
式 ,也就 是通 过一 系列 的关键 帧 组成 相应 的语 义单 元 ,概括 表 示镜 头 中 的 内容 l,并提 供 快速 检 索 。 引 在早 期关 键帧提 取 的基础 上 ,现 今基 于关 键帧 的视 频摘 要主 要 向着 根 据高 层语 义特 征对 视频 提取 视频
可 以将这 些 被忽 略 的对 象包 含 到视频 摘 要 中,形 成 最 终 的视频 摘要 。也 可 以使最 终 的视频 摘要 中只 包
含操 作员注 意 到的对象 。 25多视频摘 要 .
Байду номын сангаас
出来 的运 动 目标 都是定 向运动的 ,这样各个被检测 出 来 的 目标在该 2 空间中就是基 本平行 的。每两个运 D 动 目标 中间都会 有一些空 白,我们可 以选取适 当的算 法 ,将 中间的空 白最大程度的去掉 ,这样就相 当于减
又有 明显 的 区别 :前者 只重 点考 虑视 频 的关键 帧 ; 而后 者在 对视 频 中对象 的检 测 、分割 的基 础上 ,选 取合适 的算法 ,最大 限度 的减少 时 间. 间冗 余 ,从 空 而方 便 了对视 频 的分析 、检 索 以及索 引等 ,同时也 节省 了大 量 的存储 空 间 。表 现 出了对 象 随时 间的动 态变 化过 程 ,因此 其表现 的内容 比基 于关 键帧 的视 频摘要 要丰 富的多 。
频检索和 分析时 ,如大海捞针 一般 费时费力 ,且大量 视 频的存 储也是一个重要 问题 。如果能够把 视频 内容 进行浓缩 ,提取 出其 中最主要的部分 ,用一 个简短 的 片 断的视 频摘要来表示 出主要 内容,可有 效提高检 索 和分析 的效率 。所 以视频摘要的研 究近年来 已经引起
21 0 2年 第 2 卷 第 l期 1
ht: wcS .r. t/ p/ ww . — ogc —a n
计 算 机 系 统 应 用
经过 多年 的发展 ,关键帧 的提取方法也在不断的 改进 中, 文献【.0中介绍 了近年来 出现 的较为成熟的 3 1】
如 图中所示 ,输入 图像 中首先 出现 一个 行人行走 的片段 ,经过一段没有运动对象 的空 闲时问后,出现
Ke o d :ie n oi ; ie o s ; e a ;bet yw r svd o mo i r g vdos pi kyf meojc t n n y s r
当今社会 , 随着人们对安全 性能要求 的不断提高 , 视 频监控 越来越广泛 的应用于军事、商业、教育等领
域 。 由此 便产生 了大量 的监控视频,在对 它们进行视
Obet ae d oS n piT c n lg jc- sdVie y o s eh oo y B s
LI Ca- n CAO i n Ro g LIHo g Ya U i Yu , Ja - n , n - n
( co l fnomminadEetcl n ier g S ad n a zuU i ri ,ia 5 1 1C i ) Sh o lfr o n lc i gnei , hn ogJ nh nv s yJ n 0 0 , hn o raE n i e t n 2 a (h n d n rvni aoa r fnel et ulig eh oo yJ a 5 1 1C i ) S ag o gPo icaL b r oyo It i n i n s cn lg,i n20 0, hn l t lg B d T n a
摘
要 :视频摘 要技术是当前多媒体 领域研 究的热点之一 。视频摘要生成方法归 结为两 类:基于关键帧 的视频
摘要和基于对象 的视频摘要:对基于关键帧 的视频摘要方法做 了简要 的介绍 ,并重 点总结了历年来 出现 的基 丁 对象的视 频摘要的生成 方法 。最后对视频摘要技术的发展做 出了总结和展望 。 关键词:视频监控;视 频摘要 ;关键帧;对象
可 以看 作一段“ 管带” ,将对 象分割提取并建好 背景模
型后 ,将 我们提 取的“ 管带” 以最优的排列整合到 由背
景 图像组成 的 3 空间. D 时间描述 中,将“ 管带” 的重要 度计算 出来,按其重要度 由高到低选取 ,改变选 取的
“ 管带” 量就 可 以按照用户 的要求来形成不 同长度 的 数 视频摘要 。 2 基于用户关注空 间与注意力分析 的视频摘要 . 4 基于 用户 关注 空间与注 意力 分析 的视 频摘 要【】 的 主要 思想 是利用 视觉 定位 的方法 来 选取 操作 员感
图 1 动态视频摘要形成过程
较远 的对 象就 可 以看做是被 操 作 员忽 略 的对 象 ,既
Seilsu pc se专论 ・ aI 综述 2 5 0
计 算 机 系 统 应 用
ht:w t / ww. s . g n p/ c —o . —a r c
21 0 2年 第 2 卷 第 1期 1
计 算 机 系 统 应 用
ht:w . S . g n t / wwC - o . p/ —a r c
2 1 年 第 2 卷 第 l期 02 l
基于对象的视频摘要技术①
刘彩云 ,曹建荣 ,李洪艳
( 山东建筑大学 信息与电气工程学院 ,济南 2 0 O ) 5 l 1 ( 山东省智能建筑技术实验室,济 南 2 0 0 1 5 1l
meh d o e vd o s no i sp icpal e c ie . a t t ed v l p n e d a d t ea p iai n p rp ci eo t o ft ie y pssi rn i l d s rb d Atls, h e eo me t n n p lc to e s e tv f h y r t h vie u d os mma ia in a d s n p i ep e e t d r z t n y o ssa r s n e . o r
国内外 的广泛关注 。 例如美 国 MI T实验室 、明尼苏达
l 基于关键帧 的视频摘要
基 于 关 键 帧 的 视 频 摘 要 多 为静 态 视 频 摘 要 模
大 学、德国 Ma n e 大学,国内的亚洲微软研究院 、 nhi m
清华大学 、国防科技大学等都进行 了此领域 的研究川。 视频摘 要技术发展到今天 主要有 两种模 式:基于
Ab ta t sr c :Th ie u e vd o s mm a iai n tc n l g s o e o h o p t n t efe d o rz to e h o o y i n ft eh ts o si h l fmul me i e e r h Thi a e i t i d ar s a c . sp p r
摘要 的方 向发展 。
同之 处就 是都可 以大大缩短监控视频 的长度 ,大大方 便用户对监控视频 的观看 、分析以及检索等 。而二者
① 收稿时间: 1-50; 2 10—4收到修改稿时1 0 1 61 0 " 1— -8 @2 0
2 4 专 论 ・ 述 S ei se 0 综 p c ls aI u
序关系可能会 发生变化 。 22基于相似活动聚类的视频摘要 . 基于相似活动聚类 的视频摘 要【J l是一种 新的产 生 6 简短连惯视频摘要 的方法 ,在视频摘要 中,如果 同一 画面 中播放 的活动是类似的,这样将能更有条理 的表 现 出视频 内容 ,所 以该方法的中心思想是先将类似 的
b sdo ie e a dv e n pib sdo ie betVd osm r ao r f t d cdadte ae nvdokyf mea i os o s ae nvdoojc. i mai t nibi yi r u e r n d y s e u z i s e no l n h
p e e t h e e a in meh d o i e u r s n st e g n rto t o fv d o s mma i ain a d i c n b i i e n o t ls e :v d o s mma ia i n rz o n t a e d v d d it wo ca s s i e u t rz to
态视频摘要 的生成法 。 目前 国内外视 频摘要算法的研 究主要是基于关键帧进行 的。
法可 以形成一段 比较紧凑 的视频摘要 。
该方法得到的视频摘要有两个特点:1 ( )该方法 得
到 的摘要本身仍为一段视频 , 表现镜头中的动态变化 。
()最大限度 的减少 了时间. 间冗余 ,但活动 间的时 2 空
一
关键帧提取方法 。 文献[1提出了一种基 于关键帧聚类 1]
表示 的视频摘要 方法 , 文献【2提 出了一种草图形式的 1]
只 飞行 的鸟,行人和 飞鸟在视频 中出现 在不同的时 间,但通过将行人和鸟在 同一段视频 中同时播放 的方
视频摘要 。 文献[ 1 1  ̄提 出了基于关键帧 的一种新的动 3
该方法用将类 似活动聚类 且只同时播放类似活动 的方法来达到提高浏览效率的 目的 。该方法有三大特 点:1 ()类似 的活动 比较有效地集 结在一起 以形成简短
的视频摘 要; 2 ()所得 的视频摘要条理非常清晰, 大大
提 高浏览效率,还使得多重 的类似活 动便于查看到 ; ()非正常 的活动更容易被检测到 。 3
虽然关键帧提取算法很 多并得到了很大的改进 , 但仍存在 明显的缺 陷:帧选取 依赖 于阈值 的选择 ;计 算量太大 ,不可能做到实 时处 理;仅有颜色特 征不 能 很好地表达视频的语义信息【 。近来,基于对象 的视 l 钔 频摘要技术的兴起和迅速发展使得视 频摘要 技术有 了.
新的突破和发展 。
23基于 3 . D空 间. 间描述中的“ 时 管带” 排列视频摘要 3 空间. 间描述 中的“ D 时 管带” 排列视频摘 "主 】 要用 于视 频中感 兴趣对象是运动对象 的情况 。该方法 的主题思想是将视频转化到一个 3 的空间. 间描述 D 时 中,那些 运动的对象是 我们感兴趣 的,每 一个对 象都
活动聚类 ,然后 以 21中的方法为基础来形成视频摘 .
要。
2 基于对象 的视频摘要
基于对 象的视频摘要是近年来提 出的一种新 的视
频摘要技术,基 于对 象的视频摘要为动态视频摘要模
式 ,即保持了视频 内容随时 间动态变化 的特征 。一般 是 由能够 表达原视频 内容 的小片段加 以编辑而成 。这 样 形成 的视频摘要更大程度 的减少 了时间. 空间冗余。 随着视频 摘要技 术的发展 ,各种基于该思想 的新 的方 法算 法也被广泛 的应 用到该研究 中,其 中比较经典 的 有 如下 的几种方法: 21动态视频摘要 . 动态视频摘 】 的主要思想是将在原始视频 中不 同时发生的活动在视频 摘要 中无遮挡 的情况下 同步播 放 。产生一个在 时间和 空间上相对紧凑并且包含原始 视频 中必要活动的视 频摘要 。 如果在相对较长 的一段视 频 中只有单个或较少对 象 出现 ,可以生成一个“ 频闪 电影” 形式的摘要 ,既在 同一小 的帧序列 中显示 出同一对象在各个小 的时间段
里 的位置及运动情况 。其 具体的实现如图 1 所示 :
兴趣 的区域 ,从而 不需 要形成 语 义规 则 ,只需注 意 操 作员 是如 何观看 视频和 跟踪 运 动 目标 的。人类 如 果把 注 意力放 在 多个运动对 象 的 中心 部位 ,可 以 同
时追踪 5到 8个运动对 象 ,那 些 离注 意 力 中心 部位
式 ,也就 是通 过一 系列 的关键 帧 组成 相应 的语 义单 元 ,概括 表 示镜 头 中 的 内容 l,并提 供 快速 检 索 。 引 在早 期关 键帧提 取 的基础 上 ,现 今基 于关 键帧 的视 频摘 要主 要 向着 根 据高 层语 义特 征对 视频 提取 视频
可 以将这 些 被忽 略 的对 象包 含 到视频 摘 要 中,形 成 最 终 的视频 摘要 。也 可 以使最 终 的视频 摘要 中只 包
含操 作员注 意 到的对象 。 25多视频摘 要 .
Байду номын сангаас
出来 的运 动 目标 都是定 向运动的 ,这样各个被检测 出 来 的 目标在该 2 空间中就是基 本平行 的。每两个运 D 动 目标 中间都会 有一些空 白,我们可 以选取适 当的算 法 ,将 中间的空 白最大程度的去掉 ,这样就相 当于减
又有 明显 的 区别 :前者 只重 点考 虑视 频 的关键 帧 ; 而后 者在 对视 频 中对象 的检 测 、分割 的基 础上 ,选 取合适 的算法 ,最大 限度 的减少 时 间. 间冗 余 ,从 空 而方 便 了对视 频 的分析 、检 索 以及索 引等 ,同时也 节省 了大 量 的存储 空 间 。表 现 出了对 象 随时 间的动 态变 化过 程 ,因此 其表现 的内容 比基 于关 键帧 的视 频摘要 要丰 富的多 。
频检索和 分析时 ,如大海捞针 一般 费时费力 ,且大量 视 频的存 储也是一个重要 问题 。如果能够把 视频 内容 进行浓缩 ,提取 出其 中最主要的部分 ,用一 个简短 的 片 断的视 频摘要来表示 出主要 内容,可有 效提高检 索 和分析 的效率 。所 以视频摘要的研 究近年来 已经引起
21 0 2年 第 2 卷 第 l期 1
ht: wcS .r. t/ p/ ww . — ogc —a n
计 算 机 系 统 应 用
经过 多年 的发展 ,关键帧 的提取方法也在不断的 改进 中, 文献【.0中介绍 了近年来 出现 的较为成熟的 3 1】
如 图中所示 ,输入 图像 中首先 出现 一个 行人行走 的片段 ,经过一段没有运动对象 的空 闲时问后,出现
Ke o d :ie n oi ; ie o s ; e a ;bet yw r svd o mo i r g vdos pi kyf meojc t n n y s r
当今社会 , 随着人们对安全 性能要求 的不断提高 , 视 频监控 越来越广泛 的应用于军事、商业、教育等领
域 。 由此 便产生 了大量 的监控视频,在对 它们进行视
Obet ae d oS n piT c n lg jc- sdVie y o s eh oo y B s
LI Ca- n CAO i n Ro g LIHo g Ya U i Yu , Ja - n , n - n
( co l fnomminadEetcl n ier g S ad n a zuU i ri ,ia 5 1 1C i ) Sh o lfr o n lc i gnei , hn ogJ nh nv s yJ n 0 0 , hn o raE n i e t n 2 a (h n d n rvni aoa r fnel et ulig eh oo yJ a 5 1 1C i ) S ag o gPo icaL b r oyo It i n i n s cn lg,i n20 0, hn l t lg B d T n a
摘
要 :视频摘 要技术是当前多媒体 领域研 究的热点之一 。视频摘要生成方法归 结为两 类:基于关键帧 的视频
摘要和基于对象 的视频摘要:对基于关键帧 的视频摘要方法做 了简要 的介绍 ,并重 点总结了历年来 出现 的基 丁 对象的视 频摘要的生成 方法 。最后对视频摘要技术的发展做 出了总结和展望 。 关键词:视频监控;视 频摘要 ;关键帧;对象
可 以看 作一段“ 管带” ,将对 象分割提取并建好 背景模
型后 ,将 我们提 取的“ 管带” 以最优的排列整合到 由背
景 图像组成 的 3 空间. D 时间描述 中,将“ 管带” 的重要 度计算 出来,按其重要度 由高到低选取 ,改变选 取的
“ 管带” 量就 可 以按照用户 的要求来形成不 同长度 的 数 视频摘要 。 2 基于用户关注空 间与注意力分析 的视频摘要 . 4 基于 用户 关注 空间与注 意力 分析 的视 频摘 要【】 的 主要 思想 是利用 视觉 定位 的方法 来 选取 操作 员感
图 1 动态视频摘要形成过程
较远 的对 象就 可 以看做是被 操 作 员忽 略 的对 象 ,既
Seilsu pc se专论 ・ aI 综述 2 5 0
计 算 机 系 统 应 用
ht:w t / ww. s . g n p/ c —o . —a r c
21 0 2年 第 2 卷 第 1期 1
计 算 机 系 统 应 用
ht:w . S . g n t / wwC - o . p/ —a r c
2 1 年 第 2 卷 第 l期 02 l
基于对象的视频摘要技术①
刘彩云 ,曹建荣 ,李洪艳
( 山东建筑大学 信息与电气工程学院 ,济南 2 0 O ) 5 l 1 ( 山东省智能建筑技术实验室,济 南 2 0 0 1 5 1l
meh d o e vd o s no i sp icpal e c ie . a t t ed v l p n e d a d t ea p iai n p rp ci eo t o ft ie y pssi rn i l d s rb d Atls, h e eo me t n n p lc to e s e tv f h y r t h vie u d os mma ia in a d s n p i ep e e t d r z t n y o ssa r s n e . o r
国内外 的广泛关注 。 例如美 国 MI T实验室 、明尼苏达
l 基于关键帧 的视频摘要
基 于 关 键 帧 的 视 频 摘 要 多 为静 态 视 频 摘 要 模
大 学、德国 Ma n e 大学,国内的亚洲微软研究院 、 nhi m
清华大学 、国防科技大学等都进行 了此领域 的研究川。 视频摘 要技术发展到今天 主要有 两种模 式:基于
Ab ta t sr c :Th ie u e vd o s mm a iai n tc n l g s o e o h o p t n t efe d o rz to e h o o y i n ft eh ts o si h l fmul me i e e r h Thi a e i t i d ar s a c . sp p r
摘要 的方 向发展 。
同之 处就 是都可 以大大缩短监控视频 的长度 ,大大方 便用户对监控视频 的观看 、分析以及检索等 。而二者
① 收稿时间: 1-50; 2 10—4收到修改稿时1 0 1 61 0 " 1— -8 @2 0
2 4 专 论 ・ 述 S ei se 0 综 p c ls aI u
序关系可能会 发生变化 。 22基于相似活动聚类的视频摘要 . 基于相似活动聚类 的视频摘 要【J l是一种 新的产 生 6 简短连惯视频摘要 的方法 ,在视频摘要 中,如果 同一 画面 中播放 的活动是类似的,这样将能更有条理 的表 现 出视频 内容 ,所 以该方法的中心思想是先将类似 的
b sdo ie e a dv e n pib sdo ie betVd osm r ao r f t d cdadte ae nvdokyf mea i os o s ae nvdoojc. i mai t nibi yi r u e r n d y s e u z i s e no l n h
p e e t h e e a in meh d o i e u r s n st e g n rto t o fv d o s mma i ain a d i c n b i i e n o t ls e :v d o s mma ia i n rz o n t a e d v d d it wo ca s s i e u t rz to
态视频摘要 的生成法 。 目前 国内外视 频摘要算法的研 究主要是基于关键帧进行 的。
法可 以形成一段 比较紧凑 的视频摘要 。
该方法得到的视频摘要有两个特点:1 ( )该方法 得
到 的摘要本身仍为一段视频 , 表现镜头中的动态变化 。
()最大限度 的减少 了时间. 间冗余 ,但活动 间的时 2 空
一
关键帧提取方法 。 文献[1提出了一种基 于关键帧聚类 1]
表示 的视频摘要 方法 , 文献【2提 出了一种草图形式的 1]
只 飞行 的鸟,行人和 飞鸟在视频 中出现 在不同的时 间,但通过将行人和鸟在 同一段视频 中同时播放 的方
视频摘要 。 文献[ 1 1  ̄提 出了基于关键帧 的一种新的动 3
该方法用将类 似活动聚类 且只同时播放类似活动 的方法来达到提高浏览效率的 目的 。该方法有三大特 点:1 ()类似 的活动 比较有效地集 结在一起 以形成简短
的视频摘 要; 2 ()所得 的视频摘要条理非常清晰, 大大
提 高浏览效率,还使得多重 的类似活 动便于查看到 ; ()非正常 的活动更容易被检测到 。 3
虽然关键帧提取算法很 多并得到了很大的改进 , 但仍存在 明显的缺 陷:帧选取 依赖 于阈值 的选择 ;计 算量太大 ,不可能做到实 时处 理;仅有颜色特 征不 能 很好地表达视频的语义信息【 。近来,基于对象 的视 l 钔 频摘要技术的兴起和迅速发展使得视 频摘要 技术有 了.
新的突破和发展 。
23基于 3 . D空 间. 间描述中的“ 时 管带” 排列视频摘要 3 空间. 间描述 中的“ D 时 管带” 排列视频摘 "主 】 要用 于视 频中感 兴趣对象是运动对象 的情况 。该方法 的主题思想是将视频转化到一个 3 的空间. 间描述 D 时 中,那些 运动的对象是 我们感兴趣 的,每 一个对 象都
活动聚类 ,然后 以 21中的方法为基础来形成视频摘 .
要。
2 基于对象 的视频摘要
基于对 象的视频摘要是近年来提 出的一种新 的视
频摘要技术,基 于对 象的视频摘要为动态视频摘要模
式 ,即保持了视频 内容随时 间动态变化 的特征 。一般 是 由能够 表达原视频 内容 的小片段加 以编辑而成 。这 样 形成 的视频摘要更大程度 的减少 了时间. 空间冗余。 随着视频 摘要技 术的发展 ,各种基于该思想 的新 的方 法算 法也被广泛 的应 用到该研究 中,其 中比较经典 的 有 如下 的几种方法: 21动态视频摘要 . 动态视频摘 】 的主要思想是将在原始视频 中不 同时发生的活动在视频 摘要 中无遮挡 的情况下 同步播 放 。产生一个在 时间和 空间上相对紧凑并且包含原始 视频 中必要活动的视 频摘要 。 如果在相对较长 的一段视 频 中只有单个或较少对 象 出现 ,可以生成一个“ 频闪 电影” 形式的摘要 ,既在 同一小 的帧序列 中显示 出同一对象在各个小 的时间段
里 的位置及运动情况 。其 具体的实现如图 1 所示 :
兴趣 的区域 ,从而 不需 要形成 语 义规 则 ,只需注 意 操 作员 是如 何观看 视频和 跟踪 运 动 目标 的。人类 如 果把 注 意力放 在 多个运动对 象 的 中心 部位 ,可 以 同
时追踪 5到 8个运动对 象 ,那 些 离注 意 力 中心 部位