一种通过视频片段进行视频检索的方法

合集下载

基于视频指纹的视频片段检索方法

基于视频指纹的视频片段检索方法

基于视频指纹的视频片段检索方法李泽洲;欧阳建权;张敏;刘炜【摘要】提出一种基于视频指纹的视频片段检索方法,通过视频指纹的相似性匹配对视频片段进行检索.通过改进的Harris检测计算DC图像的角点信息,去掉视频图像边缘提取视频运动特征,根据图像特征相似度和运动特征相似度的调和因子得到视频片段总的相似度.实验结果表明,与现有方法相比,该方法能准确检测视频片段,具有较强的鲁棒性,满足视频检索的实时要求.【期刊名称】《计算机工程》【年(卷),期】2010(036)007【总页数】3页(P239-241)【关键词】视频指纹;Harris检测;视频检索【作者】李泽洲;欧阳建权;张敏;刘炜【作者单位】湘潭大学智能计算与信息处理教育部重点实验室,湘潭,411105;湘潭大学信息工程学院,湘潭,411105;湘潭大学智能计算与信息处理教育部重点实验室,湘潭,411105;湘潭大学信息工程学院,湘潭,411105;湘潭大学智能计算与信息处理教育部重点实验室,湘潭,411105;湘潭大学信息工程学院,湘潭,411105;湘潭大学智能计算与信息处理教育部重点实验室,湘潭,411105;湘潭大学信息工程学院,湘潭,411105【正文语种】中文【中图分类】TP371 概述视频以其信息量大、直观的特点,给人们获取信息和娱乐带来了很大的便利,于此同时,对指定视频片段进行检索已得到越来越多的关注。

比如,企业部门希望能够知道自己的广告在电视台的播出次数和时间,文化监管部门需要对互联网上违法视频进行监控等。

但由于视频数据量大,传统的检索模式难以做到快速、准确,因此怎样从巨大的视频仓库中快速准确地检索出指定视频片段,成为急需解决的难题。

目前针对视频片段检索一般采用2种方法:基于视频结构数据的视频检索[1]和基于视频标志的视频检索。

主要有2种途径:基于水印进行视频检索和基于数字指纹进行检索。

数字水印技术由于要在视频产品中植入一段特殊的识别信息,使这种技术容易受到有目的的攻击。

多媒体内容分析中的视频检索方法综述

多媒体内容分析中的视频检索方法综述

多媒体内容分析中的视频检索方法综述摘要:随着互联网的迅猛发展,视频作为一种重要的多媒体形式,越来越多地被广泛应用于各个领域。

然而,如何实现高效的视频检索成为一个亟待解决的问题。

本文对多媒体内容分析中的视频检索方法进行了综述,包括视频特征提取、关键帧提取、视频编码和索引构建等方面的方法与算法,以及当前存在的挑战和未来的发展方向。

1. 引言视频检索是指在海量视频数据中,根据用户需求寻找相关视频的过程。

由于视频数据的复杂性和规模庞大的特点,传统的关键字搜索方法往往无法满足用户的需求。

因此,研究者们致力于开发各种视频检索方法,以提高检索效果和速度。

2. 视频特征提取视频特征提取是视频检索中的基础工作。

通过对视频进行特征提取,可以将视频数据转化为机器能够理解和处理的形式。

常用的视频特征提取方法包括颜色特征、纹理特征、形状特征和运动特征等。

其中,运动特征在视频检索中起着重要作用,可以通过光流估计、对象跟踪和运动轨迹等方法获取。

3. 关键帧提取关键帧提取是视频检索中的关键步骤之一,通过提取视频中的关键帧,可以大幅度减少视频处理的时间和计算资源。

常用的关键帧提取方法包括基于颜色、纹理、形状和运动等特征的方法,以及基于机器学习和人工智能的方法。

此外,利用视频中的场景转换、镜头切换和运动变化等信息也是一种有效的关键帧提取方法。

4. 视频编码视频编码是将视频数据进行压缩和编码的过程,以减小存储空间和传输带宽。

常用的视频编码方法包括基于帧间预测和帧内预测的编码方法,以及基于变换和量化的编码方法。

此外,最近兴起的深度学习方法也在视频编码中取得了令人瞩目的成果。

5. 索引构建索引构建是视频检索中的关键环节,通过构建有效的视频索引结构,可以提高检索效率和准确率。

常用的索引构建方法包括基于关键帧的索引和基于视频特征的索引。

其中,基于关键帧的索引方法主要通过构建关键帧数据库和关键帧索引表,以实现高效的检索。

而基于视频特征的索引方法则主要通过构建视频特征数据库和特征索引表,以提高检索的准确率。

Adobe Premiere Pro的媒体标记和检索方法

Adobe Premiere Pro的媒体标记和检索方法

Adobe Premiere Pro的媒体标记和检索方法Adobe Premiere Pro是一款功能强大的视频编辑软件,提供了许多媒体标记和检索的功能,让用户能够更高效地管理和组织素材。

在本篇文章中,我们将介绍一些常用的媒体标记和检索方法,希望对您的视频编辑工作有所帮助。

1. 使用标记功能在Adobe Premiere Pro中,您可以使用标记功能将特定的片段进行标记,以便于检索和编辑。

使用标记功能的步骤如下:第一步,选择要进行标记的视频素材,然后在时间轴上播放到需要标记的位置。

第二步,按下"M"键或单击时间轴上的"标记"按钮,将当前位置标记为一个标记点。

第三步,如果需要添加标记的描述或注释,可以在标记面板中进行编辑。

第四步,您可以通过双击标记点或在标记面板中选择标记点来在时间轴中快速跳转到标记点所在位置。

通过使用标记功能,您可以快速准确地定位和检索视频素材中的特定片段,提高工作效率。

2. 使用标签进行分类除了标记功能,Adobe Premiere Pro还提供了标签功能,可以帮助您对视频素材进行分类和组织。

使用标签功能的步骤如下:第一步,选择要进行标签分类的视频素材,然后右键单击素材,选择"添加标签"。

第二步,输入标签名称并按下回车键,您可以为素材添加多个不同的标签。

第三步,您可以通过在项目面板中使用标签筛选器来筛选和查看带有特定标签的素材。

通过使用标签功能,您可以根据需要对视频素材进行灵活的分类和组织,便于后续的检索和使用。

3. 使用搜索功能Adobe Premiere Pro还提供了强大的搜索功能,可以帮助您快速找到需要的视频素材。

使用搜索功能的步骤如下:第一步,在项目面板中点击搜索框,输入关键词或标签。

第二步,Adobe Premiere Pro会自动匹配相关素材,您可以在搜索结果中找到所需的视频素材。

第三步,您还可以使用搜索面板中的筛选器进行高级搜索,比如按照日期、文件类型等进行搜索。

一种基于搜索引擎的视频片段检索方法及装置[发明专利]

一种基于搜索引擎的视频片段检索方法及装置[发明专利]

专利名称:一种基于搜索引擎的视频片段检索方法及装置专利类型:发明专利
发明人:王佐成,任子晖,王汉林,马韵洁,吴艳平,王卫,范联伟,刘春晖,张凯
申请号:CN201510465480.3
申请日:20150729
公开号:CN105049771A
公开日:
20151111
专利内容由知识产权出版社提供
摘要:本发明涉及一种基于搜索引擎的视频片段存储方法、存储装置和一种基于搜索引擎的视频片段检索方法、检索装置以及一种基于搜索引擎的视频快进或快退的播放方法。

所述存储方法包括以下步骤:获取视频流;将获取的视频流进行编码得到若干个视频流压缩数据包;将所述视频流压缩数据包存储到不同的硬盘块中;建立时间索引表,表示时间和每个视频流压缩数据包之间的关系;建立硬盘索引表,表示每个视频流压缩数据包和硬盘块之间的关系。

本发明利用搜索引擎进行索引建立和检索的方式,实时性好,能够满足千万级别视频数据检索的需要。

申请人:安徽四创电子股份有限公司
地址:230088 安徽省合肥市高新技术产业开发区香樟大道199号
国籍:CN
代理机构:合肥和瑞知识产权代理事务所(普通合伙)
更多信息请下载全文后查看。

一种视频镜头边界检索方法及其应用

一种视频镜头边界检索方法及其应用

一种视频镜头边界检索方法及其应用摘要:提出了一个基于关键区域色彩矩阵的视频镜头检测方法,详细地描述了这种方法的原理,并比较了该方法与其它方法的优缺点,最后阐释了该方法在视频内容检索系统中的运行策略。

关键词:关键区域;色彩矩阵;镜头边界检测;视频检索1研究背景随着信息传播工具的迅速发展,视频已经渐渐取代文本、图像成为人们日常生活中获取信息的一个主要途径。

由于视频信息数据量大、分辨率不统一、编码多种多样等特点,制约着基于视频内容检索的发展。

因此,如何提高视频内容检测的准确度与效率,成为视频内容检索关注的问题。

为了对视频内容进行有效的组织,需要将视频分解为一个个基本单元,而一般认为视频的基本物理单元是镜头,一个镜头由一组摄像机连续拍摄得到的时间上连续的若干帧图像组成。

镜头的自动分割是视频结构化的基础,也是视频分析和视频检索过程中的首要任务,镜头分割的好坏将直接影响到更高一级的视频结构化以及后续视频检索的效果。

2传统的镜头边界检测方法及其优缺点传统镜头分割的主要思想为依据两帧图像的特征值的差值与给定阈值进行比较,如果差值大于给定的阈值,说明两帧的特征变化较大,判定两帧为不同的主题。

在此两帧之间进行镜头分割;如果差值小于给定的阈值,则说明两帧的特征变化较小,判定两帧为同一主题,继续进行下两帧的比较。

这种方法用公式表示为:D(In,In+m)>T(1)(1)式中:In表示视频片段中第n个帧的内容,In+m表示视频第n+m个帧的内容。

T为划定镜头边界的阈值,T一般根据实验经验来确定。

计算两帧差异D的方法可以分为两类:一类是基于图像的色彩特征计算帧间差异的方法;另一类是利用图像的形态信息计算帧间差异的方法。

基于形态特征的方法原理是首先计算出第n帧和第n+m帧的形态特征,如边缘特征、角点特征、纹理特征等,然后比较两帧在形态特征上的差异。

该方法需要计算图像形态特征,时间复杂度较高,并且对画面的分辨率比较敏感,因此目前该方法应用较少,处于发展阶段。

基于视频片段的视频检索

基于视频片段的视频检索

基于视频片段的视频检索
胡振兴;夏利民
【期刊名称】《中南大学学报(自然科学版)》
【年(卷),期】2010(041)003
【摘要】为提高视频检索的查询效率,提出一种基于视频片段的视频检索方法.该方法利用相邻帧之间的HIS(Hue, Saturation, Intensity)颜色信息特征将视频流分割成子片段,并采用高维索引结构Vector-Approximation Trie (VA-Trie)来组织视频子片段,然后,利用空间和纹理特征定义视频片段的相似度模型,在此基础上采用基于限定性滑动窗口的高效视频检索算法进行视频片段检索.研究结果表明:与其他检索方法相比,该方法能有效地提高视频检索的查全率和查询率,适合用于运动视频检索.【总页数】6页(P1009-1014)
【作者】胡振兴;夏利民
【作者单位】中南大学,信息科学与工程学院,湖南,长沙,410075;中南大学,信息科学与工程学院,湖南,长沙,410075
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于内容的视频检索技术在多媒体视频检索中的研究 [J], 邢国军;陈亚峰
2.基于弹幕情感分析的视频片段推荐模型 [J], 邓扬;张晨曦;李江峰
3.一种通过视频片段进行视频检索的方法 [J], 彭宇新;Ngo Chong-Wah;董庆杰;
郭宗明;肖建国
4.基于用户兴趣的视频片段提取方法 [J], 邹玲;俞璜悦;王晗
5.基于用户兴趣的视频片段提取方法 [J], 邹玲;俞璜悦;王晗;;;
因版权原因,仅展示原文概要,查看原文内容请购买。

视频片段检索研究综述

视频片段检索研究综述

视频片段检索研究综述视频片段检索研究综述近年来,随着互联网技术的不断发展和普及,人们对视频资源的需求日益增长。

视频片段检索成为了人们获取、利用视频资源的重要途径,也成为了多媒体领域的研究热点之一。

本文将对视频片段检索的相关研究进行综述,以期为后续的研究工作和应用提供参考。

1. 研究背景随着互联网的普及和移动设备用户的不断增加,以及视频分享平台的兴起,视频数据呈现出爆炸式增长的趋势。

在如此庞大而多样化的视频数据面前,如何高效地检索所需的视频片段成为了亟待解决的问题。

视频片段检索旨在根据用户的需求,从海量的视频资源中找到指定的内容,并以视频片段的形式展现给用户。

2. 主要挑战视频片段检索面临着一系列挑战。

首先,视频资源的规模庞大且多样化,传统的基于文本的检索方法已经不能满足用户的需求。

其次,视频是一种多模态数据,既包含视觉信息,也包含语音和音频信息,如何有效地融合这些信息进行检索仍然是一个难题。

此外,视频资源中存在着大量的噪声、重复和冗余,如何对这些问题进行处理也是一个亟待解决的问题。

3. 视频片段检索方法目前,视频片段检索的研究方法主要可以分为两类:基于内容的检索和基于语义的检索。

3.1 基于内容的检索基于内容的检索方法主要通过对视频片段的视觉信息进行提取和匹配来实现。

常用的视觉特征包括颜色直方图、纹理特征、形状特征等。

在提取到视频片段的视觉特征后,可以使用传统的相似度匹配方法,如欧氏距离、余弦相似度等,来实现视频片段的检索。

3.2 基于语义的检索基于语义的检索方法主要通过对视频片段的语义信息进行提取和匹配来实现。

常用的语义特征包括目标识别、动作识别、场景识别等。

在提取到视频片段的语义特征后,可以使用机器学习和深度学习等方法,来实现视频片段的检索。

4. 研究进展和应用在视频片段检索的研究领域,学术界和工业界都取得了很多的成果和进展。

学术界的研究主要集中在算法和技术上的创新和突破,如基于卷积神经网络的视频片段检索方法、基于深度学习的视频片段检索方法等。

一种基于样本视频片段进行海量视频检索的方法[发明专利]

一种基于样本视频片段进行海量视频检索的方法[发明专利]

专利名称:一种基于样本视频片段进行海量视频检索的方法专利类型:发明专利
发明人:姚领众
申请号:CN201310634378.2
申请日:20131127
公开号:CN103605786A
公开日:
20140226
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于样本视频片段进行海量视频检索的方法,以实现“以视频搜视频”。

其包括以下步骤:步骤1)导入原始海量视频;步骤2)海量视频转码;步骤3)结构化分析视频;步骤4)分析结果入库;步骤5)导入样本视频片段;步骤6)结构化分析视频片段;步骤7)样本信息入库;步骤8)数据对比;步骤9)输出结果。

本发明的视频检索方法能改进原来的以语义描述或者样本图片作为输入进行视频检索的方式,实现海量视频中的“以视频搜视频”。

申请人:姚领众
地址:215000 江苏省苏州市虎丘区竹园路209号
国籍:CN
代理机构:上海申新律师事务所
代理人:刘懿
更多信息请下载全文后查看。

利用等价关系理论进行视频片段检索的方法

利用等价关系理论进行视频片段检索的方法

利用等价关系理论进行视频片段检索的方法
赵亚琴;周献中;何新
【期刊名称】《中国图象图形学报》
【年(卷),期】2007(012)001
【摘要】视频片段检索是基于内容的视频检索的主要方式,可是现有的片段检索方法大多只是对预先分割好的片段进行检索.为了从连续的视频节目中自动分割出多个相似的片段,提出了一种新的有效的视频片段检索方法,并首次尝试将等价关系理论应用于视频片段的检索.该方法首先用等价关系理论定义了片段匹配函数,同时采用滑动镜头窗自动分割出多个真正相似的片段;然后把等价类映射为矩阵表达形式,再通过矩阵的特性来度量影响片段相似度的不同因子,实现了相似片段的排序.实验结果表明,该方法能够一次性快速准确地从连续视频库中自动分割出与查询片段相似的多个片段.
【总页数】8页(P127-134)
【作者】赵亚琴;周献中;何新
【作者单位】南京理工大学自动化学院,南京,210094;南京大学工程管理学院,南京,210093;南京理工大学自动化学院,南京,210094
【正文语种】中文
【中图分类】TP391.3;TN941.1
【相关文献】
1.基于视频指纹的视频片段检索方法 [J], 李泽洲;欧阳建权;张敏;刘炜
2.压缩基础上利用纹理进行图像检索的方法研究 [J], 宁晶晶;周海英
3.一种通过视频片段进行视频检索的方法 [J], 彭宇新;Ngo Chong-Wah;董庆杰;郭宗明;肖建国
4.利用Windows Movie Maker对视频片段进行后期制作 [J], 刘雪锋
5.怎样利用终端设备进行国际联机情报检索——DIALOG系统的检索方法 [J], 顾本贵;赵小海;宋芬
因版权原因,仅展示原文概要,查看原文内容请购买。

视频检索综述

视频检索综述

视频检索综述视频检索综述随着互联网和多媒体技术的迅速发展,视频成为人们日常生活中不可或缺的一部分。

然而,随着视频数据的不断增长和视频内容的多样化,如何有效进行视频检索成为了一个值得研究的重要问题。

本文将对视频检索相关的技术和方法进行综述,旨在提供一个全面的了解和把握视频检索领域的现状和进展。

一、视频检索的概述视频检索是指从大规模视频数据集中,根据用户需求找到与之相关的视频片段的过程。

它具有很高的挑战性,主要源于视频数据包含的信息量大、内容复杂多样。

视频检索主要可以分为两个方面的研究,一是基于内容的视频检索,二是基于用户标记的视频检索。

基于内容的视频检索依靠计算机对视频内容的分析和理解,通过比对视频中的视觉特征、语义信息等,来进行检索。

而基于用户标记的视频检索则是依赖用户对视频的标记或注释信息,通过匹配标记与用户查询来实现检索。

二、基于内容的视频检索1. 视频特征提取为了使计算机能够对视频的内容进行分析,首先需要提取视频的特征。

视频特征可以从多个角度进行提取,包括低层次的视觉特征(如颜色、纹理等)、高层次的语义特征(如对象、行为等)以及混合特征。

低层次的视觉特征一般通过提取视频的帧间帧内差异、颜色直方图等来实现。

而高层次的语义特征则需要借助图像识别、行为分析等技术来提取。

2. 视频索引和检索视频索引是指将视频数据集转化为可用于检索的索引结构。

这一步通常包括对视频特征的描述和编码,以及构建索引结构。

视频检索则是在索引结构的基础上,根据用户查询进行匹配和检索。

常用的视频检索方法包括基于相似度的检索和基于学习的检索。

基于相似度的检索一般采用欧氏距离、余弦相似度等来度量视频之间的相似性,进而进行检索。

而基于学习的检索则通过训练分类器来学习视频的特征和标签之间的关系,以实现检索。

三、基于用户标记的视频检索除了基于内容的视频检索,基于用户标记的视频检索也是一种重要的检索方法。

用户标记是指用户对视频的注释或关键词信息。

一种通过视频片段进行视频检索的方法

一种通过视频片段进行视频检索的方法

+ Corresponding author: Phn: 86-10-62752426, Fax: 86-10-62981438, E-mail: peng_yuxin@
Received 2002-11-25; Accepted 2003-03-20 Peng YX, Ngo CW, Dong QJ, Guo ZM, Xiao JG. An approach for video retrieval by video clip. Journal of Software, 2003,14(8):1409~1417. /1000-9825/14/1409.htm Abstract: Video clip retrieval plays a critical role in the content-based video retrieval. Two major concerns in this
Vol.14, No.8
一种通过视频片段进行视频检索的方法
彭宇新 1,2+, Ngo Chong-Wah3, 董庆杰 1,2, 郭宗明 1,2, 肖建国 1,2
1 2 3

(北京大学 计算机科学技术研究所,北京 (香港城市大学 计算机科学系,香港)
100871) 100871)
(北京大学 文字信息处理技术国家重点实验室,北京
视频片段检索是基于内容的视频检索的主要方式,它需要解决两个问题:(1) 从视频库里自动分割出与查
询片段相似的多个片段;(2) 按照相似度从高到低排列这些相似片段.首次尝试运用图论的匹配理论来解决这两个
∗ 第一作者简介 : 彭宇新 (1974- ),男 ,贵州都匀人 ,博士生 ,主要研究领域为基于内容的视频检索 .

视频内容检索与推荐方法综述与对比

视频内容检索与推荐方法综述与对比

视频内容检索与推荐方法综述与对比随着互联网的发展和视频平台的兴起,大量的视频内容涌现出来,用户面临着内容过载的问题。

为了帮助用户快速找到想要的视频内容,视频内容检索与推荐方法应运而生。

本文旨在综述当前常用的视频内容检索与推荐方法,并进行对比分析。

一、视频内容检索方法1. 基于文本信息的检索方法基于文本信息的视频内容检索方法是最早也是最简单的方法之一。

该方法通过对视频相关的文本信息(如标题、标签、描述等)进行建模和检索,根据用户输入的关键词进行匹配。

然而,这种方法往往会受限于文本信息的质量和准确性,容易产生干扰性结果。

2. 基于视觉特征的检索方法基于视觉特征的视频内容检索方法主要是通过分析视频的视觉内容,计算图像或帧的特征,如颜色、纹理、形状等,利用这些特征进行相似度匹配。

这种方法可以克服文本信息的局限性,但在视频内容丰富或变化剧烈的情况下,效果有限。

3. 基于语义理解的检索方法基于语义理解的视频内容检索方法通过对视频内容进行语义分析和理解,构建视频的语义模型,从而实现更准确的检索。

这种方法一般采用深度学习技术,如卷积神经网络(CNN)和循环神经网络(RNN),能够捕捉到视频中的更高层次的语义信息。

二、视频内容推荐方法1. 基于协同过滤的推荐方法基于协同过滤的视频内容推荐方法是最常用和经典的推荐方法之一。

该方法通过分析用户行为数据,找到与目标用户最相似的其他用户或视频内容,根据这些相似性进行推荐。

协同过滤方法有基于用户的协同过滤和基于物品的协同过滤两种形式。

2. 基于内容过滤的推荐方法基于内容过滤的视频内容推荐方法是在视频内容的基础上进行推荐的方法。

该方法通过分析视频的特征和属性,构建视频的内容模型,根据用户的偏好和历史行为进行匹配和推荐。

这种方法一般使用机器学习算法,如聚类算法和分类算法。

3. 基于深度学习的推荐方法基于深度学习的视频内容推荐方法使用深度神经网络模型,能够更好地挖掘用户和视频内容之间的潜在关系。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

XIAO Jian-Guo1,2
(Institute of Computer Science and Technology, Peking University, Beijing 100871, China) (National Key Laboratory of Text Processing Technology, Peking University, Beijing 100871, China) (Department of Computer Science, City University of Hong Kong, Hong Kong, China)
1410
Journal of Software
软件学报 2003,14(8)
Байду номын сангаас
问题.针对问题(1),把检索过程分为两个阶段:镜头检索和片段检索.在镜头检索阶段,利用相机运动信息,一个变化较 大的镜头被划分为几个内容一致的子镜头,两个镜头的相似性通过对应子镜头的相似性计算得到;在片段检索阶段, 通过考察相似镜头的连续性初步得到一个个相似片段,再运用最大匹配的 Hungarian 算法来确定真正的相似片段. 针对问题(2),考虑了片段相似性判断的视觉、 粒度、 顺序和干扰因子,提出用最优匹配的 Kuhn-Munkres 算法和动态 规划算法相结合,来解决片段相似度的度量问题.实验对比结果表明,所提出的方法在片段检索中可以取得更高的检 索精度和更快的检索速度. 关键词: 基于内容的视频检索;片段;相似度;最大匹配;最优匹配 文献标识码: A 中图法分类号: TP391
视频片段检索是基于内容的视频检索的主要方式,它需要解决两个问题:(1) 从视频库里自动分割出与查
询片段相似的多个片段;(2) 按照相似度从高到低排列这些相似片段.首次尝试运用图论的匹配理论来解决这两个
∗ 第一作者简介 : 彭宇新 (1974- ),男 ,贵州都匀人 ,博士生 ,主要研究领域为基于内容的视频检索 .
彭宇新 等:一种通过视频片段进行视频检索的方法 献[11]相比,无论是检索的准确性,还是检索速度,本文提出的方法都取得了更好的效果.
1411
本文第 1 节首先介绍了本文的理论基础——图论的最大匹配和最优匹配.第 2 节介绍怎样自动分割相似片 段.第 3 节介绍视频片段的相似度模型.第 4 节给出了实验结果.第 5 节是总结.
1000-9825/2003/14(08)1409
©2003 Journal of Software 软 件 学 报
Vol.14, No.8
一种通过视频片段进行视频检索的方法
彭宇新 1,2+, Ngo Chong-Wah3, 董庆杰 1,2, 郭宗明 1,2, 肖建国 1,2
1 2 3

(北京大学 计算机科学技术研究所,北京 (香港城市大学 计算机科学系,香港)
+ Corresponding author: Phn: 86-10-62752426, Fax: 86-10-62981438, E-mail: peng_yuxin@
Received 2002-11-25; Accepted 2003-03-20 Peng YX, Ngo CW, Dong QJ, Guo ZM, Xiao JG. An approach for video retrieval by video clip. Journal of Software, 2003,14(8):1409~1417. /1000-9825/14/1409.htm Abstract: Video clip retrieval plays a critical role in the content-based video retrieval. Two major concerns in this
随着电视台视频节目的积累 , 网上数字视频的增加 ,以及数字图书馆、视频点播、远程教学等大量多媒体 的应用 ,如何在海量视频中快速检索出所需要的资料显得至关重要 . 传统的基于关键词描述的视频检索因为描 述能力有限、主观性强、手工标注等原因,已经不能满足海量视频检索的需求.因此,从 20 世纪 90 年代开始,基 于内容的视频分析和检索技术成为研究的热点问题 . 由于基于内容的图像检索的困难性和复杂性 ,大量的研究 主要集中在视频内容的结构分析上 , 如镜头的分割、关键帧的提取、场景的构造等 ,视频检索方面的研究则相 对较少 ,而这部分常常是应用的关键 .视频检索一般分为镜头检索和片段检索 .镜头一般是由摄像机一次摄像的 开始和结束的所有帧构成 ,表示一个物理概念 .而片段是由一连串语义相关的连续镜头构成 ,表示的是一个语义 概念 . 目前视频检索的多数研究集中在镜头检索上 [1~4], 而片段检索方面的研究则刚刚开始 [5~11]. 实际上 , 从用户 的角度分析 ,他们对视频数据库的查询通常会是一个视频片段而很少会是单个的物理镜头 .从信息量的角度分 析 , 由几个镜头组成的视频片段比单个镜头有更多的语义 , 它可以表示用户感兴趣的事件 , 因此 , 查询的结果也 比较有意义 . 例如 , 从新闻中检索出感兴趣的事件 , 从体育节目中检索出喜爱的体育运动 , 电视台检索某条广告 是否播出等 .基于这种考虑 ,本文提出了一种通过视频片段进行视频检索的方法 ,以满足用户通过视频片段来提 交的查询需求. 视频片段检索需要解决两个问题 :(1) 从视频库里自动分割出与查询片段相似的多个片段 ;(2) 按照相似度 从高到低排列这些相似片段 .目前已有的片段检索方法可以分为两类 :(1) 把视频片段分为片段 -帧两层考虑 , 片 段的相似性利用组成它的帧的相似性来直接度量 [5~7];(2) 把视频片段分为片段 - 镜头 - 帧三层考虑 , 片段的相似 性通过组成它的镜头的相似性来度量 , 而镜头的相似性通过它的一个关键帧 [8~10] 或所有帧 [11] 的相似性来度量 . 方法 (1)的缺点在于 ,限制相似的片段必须遵守同样的时间顺序 ,而实际的视频节目并不遵守这种约束 ,因为后期 编辑的结果使得相似的片段完全可能具有不同的镜头顺序 ,如同一个广告的不同编辑 . 同时 ,这种基于每帧的比 较,也使得检索速度比较慢 .方法 (2)的思想比较合理 ,但这种方法从已有的文献上看并没有很好解决片段检索的 问题.文献[8~10]提出了影响视频相似度度量的顺序因子、速度因子、粒度因子、干扰因子,但它的片段是预先 分割好的 , 并没有解决怎样在连续的视频节目里自动分割出多个相似片段的问题 . 与文献 [8~10] 相反 , 文献 [11] 完全忽略了镜头顺序、粒度、干扰因子的影响 , 两个片段的相似度仅仅取决于它们相似镜头的数量 ,因此 , 即使 片段 Y 的所有镜头仅仅和片段 X 的一个镜头相似,Y 也会被认为与 X 相似;另外,镜头的相似性是根据两个镜头 相似的最长帧序列来判断,这种基于每帧的比较和文献[5~7]类似,片段的检索速度也较慢. 针对上述问题 ,本文提出解决片段检索两个问题的一个新方法 .为了分割出相似片段 ,本文采用了上述方法 (2) 的思想 , 把检索过程分为镜头检索和片段检索两个阶段 : 在镜头检索阶段 , 考虑了视频中的时间信息 , 把一个 镜头内部随时间变化的内容,分解为几个内容一致的子镜头(sub-shots),这种基于子镜头的比较全面地反映了两 个镜头是否相似 ; 在片段检索阶段 , 通过考察相似镜头的连续性初步得到一个个相似片段 , 再运用最大匹配的 Hungarian 算法来确定真正的相似片段.为了排列相似片段,类似于文献[8~10],本文考虑了片段相似度度量的不 同因子,不同于文献[8~10],提出用最优匹配的 Kuhn-Munkres 算法和动态规划算法相结合来度量这些因子的影 响 . 本文首次尝试运用图论的匹配理论来解决视频检索问题 ,这是因为匹配的思想要求相似镜头必须一一对应 ( 粒度 ), 在这个条件下 , 求出的最大匹配和最优匹配可以客观而全面地反映两个片段相似的镜头数量和两个片 段视觉相似的程度 ,从而避免了文献 [11]中镜头计算的粒度问题 .第 4 节的实验结果表明 ,与具有同样功能的文
100871) 100871)
(北京大学 文字信息处理技术国家重点实验室,北京
An Approach for Video Retrieval by Video Clip
PENG Yu-Xin1,2+,
1 2 3
NGO Chong-Wah3,
DONG Qing-Jie1,2,
GUO Zong-Ming1,2,
issue are: (1) automatic segmentation and retrieval of similar video clips from video database; (2) similarity ranking of similar video clips. In this paper, motivated by the maximal matching and optimal matching in graph theory, a novel approach is proposed for video clip retrieval based on matching theory. To tackle the clip segmentation and retrieval, the retrieval process is divided into two phases: shot-based retrieval and clip-based retrieval. In shot-based retrieval, a shot is temporally partitioned into several sub-shots based on motion content. The similarity among shots is measured according to the color content of sub-shots. In clip-based retrieval, candidates of similar video clips are selected by modeling the continuity of similar shots. Maximal matching based on Hungarian algorithm is then adopted to obtain the final similar video clips. To rank the similarity of the selected video clips, four different factors: visual similarity, granularity, interference and temporal order of shots are taken into consideration. These factors are modeled by optimal matching based on Kuhn-Munkres algorithm and dynamic programming. Experimental results indicate that the proposed approach is effective and efficient in retrieving and ranking similar video clips. Key words: 摘 要: content-based video retrieval; clip; similarity; maximal matching; optimal matching
相关文档
最新文档