一种基于内容视频检索中的镜头分割算法
视频检索中一种改进的镜头分割方法
段 数 字 视 频 可 以 划 分 为几 个 场 景 , 个 场 景 可 包 含 一 个 每
到 多 个 镜 头 。一 个 镜 头 是~ 系列 连 续 记 录 的 图像 帧 , 于 用
表 示 一 个 时 间 段 或 相 同地 点 连续 的 动作 , 数 字 视 频 检 索 是 的基 本 单 位 , 由摄 像 机 一 次 摄 像 的 开 始 和 结 束 所 决 定 ; 而
了检 测 的精 度 。基 于 互 信 息量 的镜 头检 测 方 法 更 能 反应 视
1 研 究 现 状
频 内容 , 现 了 一定 的 优 越 性 。本 文 对 基 于 互 信 息 量 的镜 体
一
频 镜 头 分 割 , 镜 头 渐 变 的 分 割 有 很 高 的 准 确 率 。文 献 对
[ ] 过 子 空 间 映 射 解 决 了 不 同媒 质 特征 向量 的 异 构 性 问 8通
题, 同时 结 合 相 关 反 馈 中 的 先 验 知 识 , 正 不 同 模 态 多 媒 修 体 数 据 集 在 子 空 间 中 的 拓 扑 结 构 , 现 跨 媒 体 相 关 性 度 实
摘 要 : 出 了一 种 视 频 分 割 方 法 。该 方 法 是 在 互 信 息 量 的 基 础 上 , 设 一 个 大 窗 口 并 对 该 窗 口 中视 频 帧 进 行 初 步 提 先 的 分 析 , 出候 选 切 变帧 , 得 然后 再 以候 选 切 变帧 为 中心 设 一 个 奇 数 小 窗 口, 过 候 选切 变帧 亮度 值 和 小 窗 口的 平 均 亮 通 度值 相 除 大 于 阈值 就 可认 定 为切 变 帧 。该 算 法 可 以有 效 地 防止 闪光 引起 的 干 扰 。 实验 表 明 , 方 法 在 镜 头 分 割 的查 该
一种通过视频片段进行视频检索的方法
一种通过视频片段进行视频检索的方法彭宇新;Ngo Chong-Wah;董庆杰;郭宗明;肖建国【期刊名称】《软件学报》【年(卷),期】2003(014)008【摘要】视频片段检索是基于内容的视频检索的主要方式,它需要解决两个问题:(1) 从视频库里自动分割出与查询片段相似的多个片段;(2) 按照相似度从高到低排列这些相似片段.首次尝试运用图论的匹配理论来解决这两个问题.针对问题(1),把检索过程分为两个阶段:镜头检索和片段检索.在镜头检索阶段,利用相机运动信息,一个变化较大的镜头被划分为几个内容一致的子镜头,两个镜头的相似性通过对应子镜头的相似性计算得到;在片段检索阶段,通过考察相似镜头的连续性初步得到一个个相似片段,再运用最大匹配的Hungarian算法来确定真正的相似片段.针对问题(2),考虑了片段相似性判断的视觉、粒度、顺序和干扰因子,提出用最优匹配的Kuhn-Munkres算法和动态规划算法相结合,来解决片段相似度的度量问题.实验对比结果表明,所提出的方法在片段检索中可以取得更高的检索精度和更快的检索速度.【总页数】9页(P1409-1417)【作者】彭宇新;Ngo Chong-Wah;董庆杰;郭宗明;肖建国【作者单位】北京大学,计算机科学技术研究所,北京,100871;北京大学,文字信息处理技术国家重点实验室,北京,100871;香港城市大学,计算机科学系,香港;北京大学,计算机科学技术研究所,北京,100871;北京大学,文字信息处理技术国家重点实验室,北京,100871;北京大学,计算机科学技术研究所,北京,100871;北京大学,文字信息处理技术国家重点实验室,北京,100871;北京大学,计算机科学技术研究所,北京,100871;北京大学,文字信息处理技术国家重点实验室,北京,100871【正文语种】中文【中图分类】TP391【相关文献】1.利用等价关系理论进行视频片段检索的方法 [J], 赵亚琴;周献中;何新2.一种基于SimHash的海量视频检索方法 [J], 楚敏南;罗新高;白煜华;3.通过例子视频进行视频检索的新方法 [J], 庄越挺;刘小明;吴翌;潘云鹤4.一种基于内容相似性的重复视频片段检测方法 [J], 刘守群;朱明;郑烇5.基于视频片段的视频检索 [J], 胡振兴;夏利民因版权原因,仅展示原文概要,查看原文内容请购买。
适用于视觉媒体检索的视频镜头分割算法
计 算 机 应 用 研 究
Ap l a i n Re e r h o o u e s p i t s a c fC mp t r c oVo. 127 No.源自 5Ma 2 0 v 01
适 用 于视 觉媒 体 检 索 的视 频 镜 头 分 割算 法 术
2 ntueo e iodc r, hns cdm c ne, ei 0 0 3 hn ) .Istt f Smcn ut s C i e a e yo Si cs B in 10 8 ,C ia i o e A f e jg
Absr t: The p p ra a y e h r b e e ae o viua d ar tiv lo h a i fc n e t. Thedic so e ot t ac a e n l z d t e p o l msr lt d t s lme i e re a n t e b sso o t n s s usi n s tf rh fom h r t e PHC fMDS , nay e i e s,s osan m a e n hih— i e i a pa e, n te o BI a l z d v d o h t d i g s i g dm nson ls c a d a tmptd t x mi e t t rg — e oe a n hehee o e n iy bewe n dfe e tvs lmeda i he p r p cie o u pa e,t sa rvn he c ncuso h iu lme i ere a e t t e i r n iua f i n t e s e tv fs bs c hu ri ig att o l in tatvs a da r t v l i s ud frto l tc l h s u fan lzn h itnc ewe n dosa ub pa e a d c me up wih a lo ih o h t ho l is fal a k e te is e o ay i g t e d sa e b t e t nd s s c n a t n ag rt m fs o
一种视频镜头边界检索方法及其应用
一种视频镜头边界检索方法及其应用摘要:提出了一个基于关键区域色彩矩阵的视频镜头检测方法,详细地描述了这种方法的原理,并比较了该方法与其它方法的优缺点,最后阐释了该方法在视频内容检索系统中的运行策略。
关键词:关键区域;色彩矩阵;镜头边界检测;视频检索1研究背景随着信息传播工具的迅速发展,视频已经渐渐取代文本、图像成为人们日常生活中获取信息的一个主要途径。
由于视频信息数据量大、分辨率不统一、编码多种多样等特点,制约着基于视频内容检索的发展。
因此,如何提高视频内容检测的准确度与效率,成为视频内容检索关注的问题。
为了对视频内容进行有效的组织,需要将视频分解为一个个基本单元,而一般认为视频的基本物理单元是镜头,一个镜头由一组摄像机连续拍摄得到的时间上连续的若干帧图像组成。
镜头的自动分割是视频结构化的基础,也是视频分析和视频检索过程中的首要任务,镜头分割的好坏将直接影响到更高一级的视频结构化以及后续视频检索的效果。
2传统的镜头边界检测方法及其优缺点传统镜头分割的主要思想为依据两帧图像的特征值的差值与给定阈值进行比较,如果差值大于给定的阈值,说明两帧的特征变化较大,判定两帧为不同的主题。
在此两帧之间进行镜头分割;如果差值小于给定的阈值,则说明两帧的特征变化较小,判定两帧为同一主题,继续进行下两帧的比较。
这种方法用公式表示为:D(In,In+m)>T(1)(1)式中:In表示视频片段中第n个帧的内容,In+m表示视频第n+m个帧的内容。
T为划定镜头边界的阈值,T一般根据实验经验来确定。
计算两帧差异D的方法可以分为两类:一类是基于图像的色彩特征计算帧间差异的方法;另一类是利用图像的形态信息计算帧间差异的方法。
基于形态特征的方法原理是首先计算出第n帧和第n+m帧的形态特征,如边缘特征、角点特征、纹理特征等,然后比较两帧在形态特征上的差异。
该方法需要计算图像形态特征,时间复杂度较高,并且对画面的分辨率比较敏感,因此目前该方法应用较少,处于发展阶段。
一种基于内容视频检索中的镜头分割算法
要的媒体类型在人们 的生活 、 教育 、 娱乐等方 面 日益成 为不 可或缺 的信息载体 。但是 由于视频非结构化的数据格式 、 巨 大的数据量 以及表现 内容的不透明等缺点 , 使得对视 频数据 的管理和分析都相 当困难 。而从 大量视频 数据 中找到 自己 感兴趣的相关视频 片段 己成为 一种迫切 的需求 。这一 技术 就是 目前 人 们普 遍 关 注 的基 于 内容 的视 频 检索 技 术 ( B C—
关键词 : 头分割 ; 镜 切变检 测 ; 变检测 ; 渐 双重窗 口检测 ; B R CV 中图分类号 : P 9 . T 3 14 文献标识码 : A
0 引言
随着多媒体技术和 网络技术 的迅速发展 , 现代计 算机 技
致错误 的场景切换 检测。基 于边缘 方法 的基本思 想是 在镜
基于边缘的方法【和 基于模 型的方法等 4 3 J 种。直方 图 法使
用像素亮度和色彩 的统 计值 , 考虑像 素的位 置信息 , 不 抗噪 声能力较强 , 但有时会漏掉场景切换 。模板匹配法严格 地区 分像素的位置 , 噪声 、 对 镜头和物 体的运动非常敏感 , 易导 容
基于内容的视频检索
基于内容的视频检索技术1、什么是基于内容的视频检索技术视频检索技术区别于传统的基于关键字检索的主要特点体现在,它是以图像处理、模式识别、计算机视觉、图像理解等领域的知识为基础,借鉴认知科学、人工智能、数据库管理及人机交互、信息检索等技术领域的知识与数据表示方法,通过引入新的媒体数据表示、数据模型,以及有效的检索算法和友好的人机界面,实现基于内容的视频检索功能。
视频检索技术相对于传统的基于文本的检索方法有两个突出特点:突破了传统的基于表达式检索的局限性,直接对视频的内容进行分析,完全由计算机自动实现提取特征和语义的过程,避免了人工描述的主观性,利用这些内容建立特征索引,实现基于内容的检索;采用相似性匹配的方法进行查询。
2、需要使用哪些技术一、视频镜头检测技术。
由于视频内容丰富,不易建立索引,可以将其从大到小划分为视频、场景、镜头及关键帧4个层次,其中,镜头是视频检索的基本单位,是摄像机一次操作所拍摄的图像序列。
对视频建立索引,首先要将视频分割为镜头。
镜头检测即找到镜头与镜头之间的切换,并找到切换前后的差异。
镜头切换包括渐变和突变,针对不同的情况需使用不同的检测技术。
二、关键帧提取技术。
检测出镜头之后,要进行镜头关键帧的提取。
镜头关键帧是反映镜头主要内容的一帧或几帧图像,因而需要它描述准确且存储数据量尽量小,计算不宜太复杂。
3、基于内容的视频检索技术的现状基于内容的视频检索系统大致分为索引、查询和检索3个模块。
索引模块运用镜头检测、关键帧提取、视频聚类、特征提取等技术对视频信息进行预处理,从而建立视频特征索引,以此作为视频检索的基础和依据;查询模块主要负责实现人机交互,并能通过用户的反馈信息对检索逐步求精;检索模块主要实现视频特征索引与用户提交的查询条件的相似度计算、特征匹配,并根据相关度排序后提交用户查询结果。
用户行为的知识是提高检索系统性能的一个渠道,包括用户熟知的主题、用户提出的确切问题和用户的行为。
基于内容的视频检索技术
2关键技术 . 镜头分割视频流 中的镜头 ,是 由时间连续的视频祯
结合起来 ,以描述 视频节 目中有语 义意义 的事件 或活 动。这个工作称为镜头聚类。 ( ) 于分割的方法 。从一般 的角度来看 ,镜头 1 基 聚类也可看作一个视频分 割问题 、与镜 头的时域分割不 同,这里不是也不能完全按 时间轴进行 切割 ,因为镜头 聚类 中镜头并不一定在播放 时间上连续 。可 以凭借助突 变或渐变检测将视频分成一 系列镜头 ,再根据 内容的相 关性结合镜头形成 聚类 。 ( 下转9 页 ) 6
随着多媒体技术的发展和信息高速公路的出现 ,数 字视频的存储和传输技术都取得了重大 的进展 。视频检
索就是要从大量的视频数据 中找到所需 的视频 片断 。传
统 的视频检索只能通过快进和快退 顺序的方 法人工查 找 ,因而是一件非常繁琐耗时的工作 ,这显然已无法满 足多媒体数据库的要求 。用户往往希望只要给出例子或 特征描述 ,系统就能 自动地找到所需 的视频片断点 ,即
基站 1 间的距 离 ;d2 之 0 是基站0 与基站2 间的距 离 ;d 之 。 是车载终端与基站0 之间的距离 ;d是车载终端与基站 1 l 之 间的距离 ;d是车 载终端 与基站2 间的距 离 。根据 2 之
效集成各种物流要素 的物流信息平台 ,可以为物流服务 供应商 、货物制造商和货 主提供统一高效 的沟通界面 ,
二 、内容
1视频数据 .
11 频 数 据 的 结 构 . 视
图像方式则采用基于运动 向量的参数模型 ,利用图像技
术获取运动 向量 ,从而建立模 型。 ( )局部运动 向量 2 检测。视频 中的局部运动指场景中的 目标运动 ,它可看
描述视频( 包括描述 它的元数据 ) 可从 以下3 方面 个
视频检索中的视频镜头分割技术
基于内容的新闻视频故事分段和检索
《 olg o C mp t c n e T c n lg ,W u a C l e f o ue i c & eh oo y e rS e h nUnv ri , W u a 4 07 ) iest y h r 30 2 t
【Abtat T src 地 l at l rU e n steb s t cue o e ie aa ae y tm . n h nito ue h ai ieso e ri ef sy d f e h  ̄i s ̄ tr fnwsvd o d tbsssse c i i c a d te nrd cs teb s da fky c
新 闻节 目是 以MP G—格式存 放在文件系统里的视 频文件 ; E l 第2 个接 口是查询 浏览接 口,通过这个接 口,用户可以直接
浏览感 趣的新 闻故 事片 段或关键帧 ,也可以输入查 询关键 词来检索特定内容的视频 新闻。新闻视频数据库系统定义 了 3" 4 关系数据库 :第 1 个是新 闻故事数据库,它存放的是新 阿 视频文件通 过新 闻故事分段模块分段过后的一个个相对独 立 的新 闻故事和 被分割 的场景 及镜 头 ,它可以直接被输 出浏
选择 :一是到图书馆去检 索一堆呆板 的文本新闻 ,二是在 电 视 台一堆录像带或是光盘里手工进行查 找。这是传统视频数 据的无序性所造成的 .因为视 频数据在磁带 、光盘中均按先 后关系存放 .但这仅仅适 合于 娱乐消 逢中溯览方式操作 .用 于其他 目的 的分析和搜索 就很 不方便 。视频数据 的最大颗粒 度是整个文件 ,最小颗粒度是 单个帧 ,中间没有 自然的过渡 层 欢,要在视频新闻中查拽感 趣 的内容除 了线性、单谰的 快进快退别无他 法。所 以这 就造成 了新 闻节
tc iue :tx e hnq s e t ̄ la t n n pe c e  ̄ nRin,ec tral e i i o sor e me t Lo d r tiv 1 a t tg vs te tpia r ci a d s e h r o c o t.I e i sI z  ̄wsvde t y s g n a in an ere a.Atls .i ie h y c l
基于内容的视频检索技术
基于内容的视频检索技术综述[摘要]随着多媒体技术及计算机网络技术的迅速发展,多媒体已广泛地应用于如公共信息业、广告、教育、医学、商业及娱乐等多个领域。
数字视频的传播也变得越来越容易,数字电视、多媒体广播、视频会议已经开始逐步走入人们的日常生活中,视频也己经逐渐成为人类信息传播的主流载体之一。
当今,人们面临的问题已不再是视频内容的匮乏,而是面对浩如烟海的视频信息,如何快速、有效地找到自己需要的内容,已经成为了迫切的需求。
故本文分析了现有的视频检索理论框架,对以文字信息为主要特征的视频检索系统关键技术进行了研究。
[关键词] 基于内容的检索;视频检索技术;检索系统随着多媒体技术和网络技术的飞速发展,视频在多个领域得到广泛地应用。
对这些海量的而且包含大量非结构化信息的数据进行组织、表达、管理、查询和检索成为迫切的需求。
因此基于内容的视频检索成为近年来研究的热点。
1、研究背景自 20 世纪 90 年代以来,随着多媒体技术及计算机网络技术的迅速发展,多媒体已广泛地应用于如公共信息业、广告、教育、医学、商业及娱乐等多个领域。
数字视频的传播也变得越来越容易,数字电视、多媒体广播、视频会议已经开始逐步走入人们的日常生活中,视频己经逐渐成为人类信息传播的主流载体之一。
当今人们面临的问题已不再是视频内容的匮乏,而是面对浩如烟海的视频信息,如何快速、有效地找到自己需要的内容,已经成为迫切的需求。
当用户希望从浩瀚的视频数据库中检索感兴趣的资源时,却发现传统的基于关键词的数据库检索方法难以实现。
其主要原因在于:一方面,在许多情况下很难用一个或多个关键词来充分描述视频中的丰富信息,而且这种描述也存在很大的主观性;另一方面,用户很难将其需求清晰地表达出来,而且这种表达和媒体自身的描述也存在很大差异。
为了实现对视频等多媒体信息的有效检索,人们开始研究视频中包涵的“内容”。
因此,基于内容的视频检索技术应运而生,并成为一个新的研究领域。
一种基于镜头内容的视频检索系统设计与实现
其显著技术特色包括 : 多种特征提取方法 , 多种基于
内容检索方法 , 使用 自组织神经网络对 复杂特征度量 , 建
立基 于内容索引的新方 法以及 对多媒体信息进行模糊检
索 的新 技 术 [ 6 3 。
2 国 内外 已有视 频检 索 系统 简 介
1 )Vi g r e a
Vr e i g 是一个视频 系统原 型闭 其特色在于一个强 大 a , 编辑器 , 计算机首先对视频进行 预处理 , 通过语音识别 和
3 本 系 统 的设 计 实现
提出了全新 的基于视觉特征和时空关 系的查询技术唧 。
3) W e S b EEK
该系统 的创新之处 在于它能够有机地结合文本和视 觉特征来提供对图像/ 视频 的查询和分类【 4 ] 。
4 nome i l )Ifr da I
索倘处 于起 步 和发展 阶段 【 l 】 。当前 的研究重点在 与视频
特 征 相 关 的 各 个 方 面 , 镜 头 分 割 、 征 提 取 、 头 语 义 如 特 镜 描 述 、 频 检 索 算 法 等 , 究 的 难 点 主 要 集 中 在 视 频 的 底 视 研
If m daI no eil利用 语 音 识 别 、 r 图像 理 解 和 自然 语 言 处 理 技 术 的组 合 , 自动 将 视 频 档 案 ( N C新 闻 ) 成具 可 如 C 分
【 y w r s ie tea; e - d pi ; htdtc o ; h t l s ct n Ke od 】vdo r r vl sl a at e so eet n so ca i ao ei f v i s f i i
基于内容的视频检索
1
主要内容
问题旳引入 国内外研究现状 基于内容旳视频检索简介 视频构造旳分析 关键技术 视频检索和浏览 目前研究中存在旳问题及将来旳发展趋势
2
一、问题旳引入
近年来,数字视频信息出现了飞速膨胀, 新旳视频应用,如数字图书馆、视频点 播、数字电视等,已经为越来越多旳人 所接受和熟悉。
在运动量取局部最小值处选用关键帧, 它反应了视频数据中旳一种“静止”特 点,视频中经过摄像机在一种新旳位置 上停留或经过人物旳某一运动旳短暂停 留来强调其主要性。 光流 光流场
40
首先经过Horn-Schunck法计算光流,对 每个像素光流分量旳模求和,作为第k 帧旳运动量M(k),即
其中 Ox(i,j,k)是k帧内(i ,j)像素光 流旳X分量,Oy(i,j,k)是k帧内像素(i,j) 光流旳Y分量。
44
颜色特征
颜色是图像最明显旳特征,与其他特征 相比,颜色特征计算简朴、性质稳定, 对于旋转、平移、尺度变化都不敏感, 体现出很强旳鲁棒性。
颜色特征涉及颜色直方图、主要颜色、 平均亮度等。
45
其中利用主要颜色和平均亮度进行图像 旳相同匹配是很粗略旳,但是它们能够 作为层次检索措施旳粗查,对粗查旳成 果再利用子块划分旳颜色直方图匹配进 行进一步旳细查。
8
三、基于内容旳视频检索简介
我们需要研究旳是,信息检索系统怎样 适本地表达用户所要求旳内容,并在视 频数据库中找出符合这个查询要求旳信 息返回给用户。
Content-Based Video Retrieval,CBVR 根据视频旳内容和上下文关系,对大规
模视频数据库中旳视频数据进行检索 提供这么一种算法:在没有人工参加旳
9
目前,基于内容旳视频检索研究,除了 辨认和描述图像旳颜色、纹理、形状和 空间关系外,主要旳研究集中在视频分 割、特征提取和描述(涉及视觉特征、 颜色、纹理和形状及运动信息和对象信 息等)、关键帧提取和构造分析等方面
一种工程化的实时镜头分割算法
电信技 术研 究
20 第 4期 07年
一
种工程化 的实时镜头分割算法
刘生贵 凌培 刚 路友 荣
摘要:通常单独用一种特征难以有效地 区分视频序列 中的镜头边界与非镜头边界, 从而难以实现对各种视频序列中、各种类型镜头边界的有效检测。本文在工程化应 用的基础 上 ,通 过统 一镜 头边界 的检 测尺度 ,并通过 融合 图像 的HS 颜 色直方 图和 V ED H 边缘纹理 两种特征的差值,实现 了 基于图像的镜头边界的有效检测。在工程化 的应用过程 中表明,该算法在满足 高性能指标和低计算机 资源消耗的要求下,能实 现对各种不同内吝视频序列 中不同类型镜头边界的有效检测,并满足不同应用背景 的需要 ,具有 通用性 。 关键词:镜 头分割 特征融合 视频浏览 视频检索
通 过大量 实验 ,选择提 取速 度快 且能够较好 描述 图像视觉 特征 的 图像全 局颜色直 方 图特征HS V和描 述 图像 边缘 分布情 况 的纹理 特征E HD,用这 两种特 征作 为描述视 频 图像 的视觉 特 征 。
21 V全 局颜 色直方 图 .. HS 1
HS V颜 色直 方 图描述 了图像 颜色 的全局分 布情况 , 图像 的旋 转和伸 缩不敏 感 。 对 提
1引言
伴随着计算机、互联网和数字媒体技术的迅速发展与普及 ,视频信息浏览与检索在
日常 生活 中变得越 来越 重要 。一段有 意义 的视 频通常 由图像、镜 头 、镜头组 、场景 和视 频五个层次组成【。其中,镜头是构成视频序列的基本逻辑单位,也是实现视频信息浏 j 】
览与检索 的基础 。
4 0
文本作者在从事镜头分割技术的工程化应用过程中,研究出了一种能满足上述标准 和要 求 的工程 化实 时镜头 分割 算法 ,该 算法通 过统一镜 头边界 的检测 尺度 ,并通 过融合 图像HS V颜色 直 方图和E 边 缘纹理 两种特征 的差值 ,实现 了对 各种 不 同类型镜头 边界 HD 的有效 检测 。在 工程 化应 用过程 中表 明 ,该算法在 满足 高性能 指标和低 计 算机资源 消耗
视频镜头分割方法综述
视频镜头分割方法综述魏玮;刘静;王丹丹【期刊名称】《计算机系统应用》【年(卷),期】2013(000)001【摘要】视频序列的镜头分割亦称镜头变化检测是视频检索中的关键技术之一。
对五种常用的视频分割算法作了综述,包括像素法、直方图法、X2直方图法、X2直方图分块法、边缘轮廓变化率法,并详细介绍了各种算法中的帧差异值的计算以及介绍了了他们的优缺点,并且通过实验分析对各种算法进行了比较,五种算法的优缺点实验中得到了很好的体现。
%Partitioning a video sequence into shots or detecting shot change is one of the key techniques in video indexing. This article summarizes some commonly used methods for partitioning video into shots which are pixel level-based methods, histogram methods, X2 histogram methods, X2 block histogram methods, edge silhouttee rat of changing mathods, and detailedly introduces various algorithms of frames difference value calculation, and introduces the advantages and disadvantages of them, and the results of these algorithms are compared through the experiments, the advantages and disadvantages of Five algorithm at the experiments are very well reflected.【总页数】4页(P5-7,69)【作者】魏玮;刘静;王丹丹【作者单位】河北工业大学计算机科学与软件学院,天津 300130;河北工业大学计算机科学与软件学院,天津 300130;河北工业大学计算机科学与软件学院,天津 300130【正文语种】中文【相关文献】1.视频镜头分割算法综述 [J], 刘艳红2.视频镜头分割技术综述 [J], 孙利涛;杨雷3.基于双重检测的视频镜头分割方法 [J], 杨瑞琴;吕进来4.视频检索中镜头分割方法综述 [J], 刘政凯;汤晓鸥5.基于镜头分割与空域注意力模型的视频广告分类方法 [J], 谭凯;吴庆波;孟凡满;许林峰因版权原因,仅展示原文概要,查看原文内容请购买。
基于内容的视频检索中的镜头分割技术
摄取 的一段 画面的总和 ;在后 期编辑时 ,镜头 是两个剪辑
点 间的一组 画面 ;在完成 片中 ,一个镜头是指从 前一个光
一
觉成为 人类接受外 界信息 的重 要来源 ,其 中 ,图像视频 信 息是视 觉信息 的主要 表达方式 ,它所包含 的信息量也是 海 量 的 ,远远超过 了文本 、图片等数据格式 。图像视频在 具
体 、生 动 、确切 、高效等方 面有许多优点 ,由于这些特 点
学 转换 到后 一 个光 学转 换 之 间的完 整 片段 。场 景是 指 电 影 、戏 剧作 品中的各种场 面 ,由人物活动 和背 景等构成 。 连续 的图像 变化每秒超过2 4 帧( f r a me )画面 以上时 ,根据 视觉 暂 留原理 ,人 眼无法辨别 单幅的静态 画面 ;看上去是 平滑连续 的视觉效果 ,这种连续 的画面 叫做视频。 视频 序列 由数个 视频场景组 成 ,通常指单 独的某个视 频 文件 或 者视 频 片段 。场 景通 常 由一个 或 者多 个镜 头构 成 。镜 头 由多个 连续 的图像 帧构成。 图像 帧指 单幅静态 的 图像 ,是构成视频文件 的最小单位 。 在 播放 视 频 时 ,定 格 时 的每 一个 画 面就 是一 个 图像 帧 。摄 像机拍摄 物体时产生 的一段连续 图像就 是镜 头 ,由 多个 帧组成 。拍摄 对象运 动、光源亮度变化或摄像 头运动 等都 能引起镜头 内部 图像发生 变化。场景是连 接视频底层
得 尤 为重要 。
关 键词 :视频检 索 ;镜 头分割 ;镜 头渐变 ;镜 头 突变 中图分 类号 :T P 3 9 1 文献标 识码 :A 文章编号 :1 0 0 9 - 2 3 7 4( 2 0 1 3)1 3 - 0 0 8 5 - 0 2
基于内容检索的视频分割技术的研究
基 于 内容检 索的视频分 割技术 的研究
吴 四清 , 国平 , 张 葛 镜
( 中师 范大学 电信系 , 华 湖北 武汉 4 0 7 ) 3 0 9
摘 要 : 频 分割 就是从 视 频序 列 中分割 出在 语 义上 有 意义 的对 象。 视 目前 , 频 分割 已从基 于 视
镜 头的分 割发 展 到 了基 于 内容 的视 频 对 象分割 。 文章 介 绍 了基 于 内容 的 时域 及 空域视 频分
维普资讯 第1 4卷 Nhomakorabea第 5期
电脑 与信 息 技 术
C0M P UTER AND I NFORMATI ON TECHNOL OGY
V0 .4 11 N O5 . o C.20 6 t 0
20 0 6年 1 0月
文 章编 号 :0 5 1 2 ( 0 6 0 — 0 9 0 10 — 2 8 20 )5 0 1 — 3
异 的视 频对象 分割 算法 。
tea) r v 日渐 成 为多媒体 数据 库查 询 和检索 的发展 i1 趋势 , 它根据 媒 体 对象 的语 义 、 征 等进 行检 索 , 特
其 中基 于 内容 的视 频检 索 C V ( o t tB sd B R C ne — ae n V do R tea) 目前 C R研 究 的热点 。 ie e i 1 是 rv B 视频检
1 基 于对 象 的视 频 分 割
11 基 于变化检 测 的分 割 . 基 于变化 的分 割技 术检 测决策空 间 中的不 连 续 位置 ,包括 空域 检测 变化方 法和 时域检 测变化 方 法 。空域变 化检 测分 割技术 检测灰 度级 、 颜色 、
索要 求在 大量 的视频 数据 中找 到所需 要 的视 频 片 断, 由于视 频 内容 多 、 杂 , 图像 的检 索方 法 有 复 与 很 大的差 异 , 因此对 视频 的检索 十分 困难 。 视频 是
视频检索常用的镜头分割方法的研究
阈值 , 这种情况会导致检测结果的不 精准。
从现 阶段 的研究 发 展来 看 , 镜 头分 割 的研究 主要 有 以下几点 : 1 ) 阈值 的设 定 。可 以考 虑 自适应 阈值 的算 法
[ 5 】Z A B H I R , M I L L E R J , M A I K . A f e a t u r e — b a s e d a l g o i r t h m f o r d e t e c t i n g a n d c l s a s i f y i n g s c e n e b r e a k s [ E B / O L ] . [ 2 0 1 3 — 0 3 - 1 0 ] . h t t p : / / w e n k u .
牌 湖
[ 3 ]成勇, 须德. 一种 自 动选取 阈值 的视 频镜头边界检测算法 [ J ] . 电子
[ 4 ]K I M s , B Y U N J , WO N C . A s c e n e c h a n g e d e t e c t i o n i n H . 2 6 4 / A V C [ J ] .
6 6 — 6 7 .
[ 1 3 ]洪夏俊 , 夏殿松. 基于 H . 2 6 4 / A V C压缩域 的实时视频镜头分割算法 [ J ] . 电脑知识与技术, 2 0 0 9 ( 4 ) : 9 4 4 _ 9 4 J 6 .
[ 1 4 ]李向伟 , 李战明 , 张 明新 , 等. 基于 内容 的视频镜头 检测 技术[ J ] . 电
: 大适用性 。
[ 6 ]孙利涛 , 杨 雷. 视频镜 头分割技术 综述 [ J ] . 山东轻工 业学 院学报 ,
基于镜头内容变化率的关键帧提取算法_丁洪丽
—225—基于镜头内容变化率的关键帧提取算法丁洪丽,陈怀新(中国电子科技集团公司第十研究所,成都 610036)摘 要:针对含有运动目标的视频采用单一阈值提取关键帧时易出现漏检或冗余的情况,提出基于镜头内容变化率的关键帧提取算法。
根据镜头相邻帧差和与镜头平均邻帧差的变化特点定义镜头内容变化率,由该变化率确定关键帧提取的高、低阈值,实现自动提取一到多帧关键帧。
实验结果表明,该变化率对视频帧的内容变化有较好的描述能力,提取的关键帧具有很好的代表性。
关键词:视频检索;关键帧提取;镜头内容变化率;镜头平均邻帧差Key Frame Extraction Algorithm Based on Shot Content Change RatioDING Hong-li, CHEN Huai-xin(The 10th Institute of China Electronics Technology Group Corporation, Chengdu 610036)【Abstract 】A key frame extraction algorithm based on Shot Content Change Ratio(SCCR) is proposed against miss or redundancy when using single threshold to extract key frames from video with moving objects. Shot Content Change Ratio is defined according to the variation of the sum of shot adjacent frame difference and the average shot adjacent frame difference. High and low thresholds are determined by the ratio, and a single or several key frames can be extracted from a shot. Experimental results show that this ratio can better describe video frames’ content change and key frames extracted are representative.【Key words 】video retrieval; key frame extraction; Shot Content Change Ratio(SCCR); average shot adjacent frame difference计 算 机 工 程ngineering 第35卷 第13期Vol.35 No.13 2009年7月July 2009·多媒体技术及应用· 文章编号:1000—3428(2009)13—0225—03文献标识码:A中图分类号:TP3121 概述关键帧提取技术是实现基于内容的视频检索(Content- Based Video Retrieval, CBVR)的关键技术之一,在镜头分割以后,为给用户提供方便快捷的浏览和检索,一般要进行镜头关键帧(key-frame)的提取工作。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一种基于内容视频检索中的镜头分割算法
O 引言随着多媒体技术和网络技术的迅速发展,现代计算机技术特别是
海量数据存储与传输技术的成熟,视频作为一种主要的媒体类型在人们的生活、教育、娱乐等方面日益成为不可或缺的信息载体。
但是由于视频非结构化的数
据格式、巨大的数据量以及表现内容的不透明等缺点,使得对视频数据的管理
和分析都相当困难。
而从大量视频数据中找到自己感兴趣的相关视频片段己成
为一种迫切的需求。
这一技术就是目前人们普遍关注的基于内容的视频检索技
术(CB-VR,Content-Based Video Retrieval)。
我们知道视频的制作过程首先是进行单个镜头的拍摄,然后,对于内容相近的多个镜头通过各种镜头编辑方式(即镜头转换方式)衔接在一起,组成场景以及视频故事单元。
可见镜头是组成
视频的基本单元,也是对视频内容进行深入分析的基础。
所以从基于内容的角
度对视频进行分析时,首先检测镜头的转换边界,即各个不同镜头的连接处,
这样就可以将视频分割为一个个的镜头;然后对每个镜头进行代表帧的提取并
对内容相近的多个镜头进行聚类,组成更高层次的场景以及视频故事单元,便
于对视频的检索。
可见镜头边界检测是将视频自动地分割为镜头,以作为基本
的索引单元,它是实现基于内容的视频检索的第一步。
本文研究的主要工作就
是镜头边界检测。
按照镜头之间的转换也不同,主要分为突变(切变)和渐变,
对于镜头边界检测,主要的工作就是找出视频中的突变和渐变变化。
1 相关工
作镜头边界检测算法主要有直方图法、模板匹配法、基于边缘的方法和基于
模型的方法等4 种。
直方图法使用像素亮度和色彩的统计值,不考虑像素的位
置信息,抗噪声能力较强,但有时会漏掉场景切换。
模板匹配法严格地区分像
素的位置,对噪声、镜头和物体的运动非常敏感,容易导致错误的场景切换检测。
基于边缘方法的基本思想是在镜头发生切换时新边缘应远离旧边缘的位置,。