一种通过视频片段进行视频检索的方法

合集下载

Adobe Premiere Pro的媒体标记和检索方法

Adobe Premiere Pro的媒体标记和检索方法Adobe Premiere Pro是一款功能强大的视频编辑软件，提供了许多媒体标记和检索的功能，让用户能够更高效地管理和组织素材。

在本篇文章中，我们将介绍一些常用的媒体标记和检索方法，希望对您的视频编辑工作有所帮助。

1. 使用标记功能在Adobe Premiere Pro中，您可以使用标记功能将特定的片段进行标记，以便于检索和编辑。

使用标记功能的步骤如下：第一步，选择要进行标记的视频素材，然后在时间轴上播放到需要标记的位置。

第二步，按下"M"键或单击时间轴上的"标记"按钮，将当前位置标记为一个标记点。

第三步，如果需要添加标记的描述或注释，可以在标记面板中进行编辑。

第四步，您可以通过双击标记点或在标记面板中选择标记点来在时间轴中快速跳转到标记点所在位置。

通过使用标记功能，您可以快速准确地定位和检索视频素材中的特定片段，提高工作效率。

2. 使用标签进行分类除了标记功能，Adobe Premiere Pro还提供了标签功能，可以帮助您对视频素材进行分类和组织。

使用标签功能的步骤如下：第一步，选择要进行标签分类的视频素材，然后右键单击素材，选择"添加标签"。

第二步，输入标签名称并按下回车键，您可以为素材添加多个不同的标签。

第三步，您可以通过在项目面板中使用标签筛选器来筛选和查看带有特定标签的素材。

通过使用标签功能，您可以根据需要对视频素材进行灵活的分类和组织，便于后续的检索和使用。

3. 使用搜索功能Adobe Premiere Pro还提供了强大的搜索功能，可以帮助您快速找到需要的视频素材。

使用搜索功能的步骤如下：第一步，在项目面板中点击搜索框，输入关键词或标签。

第二步，Adobe Premiere Pro会自动匹配相关素材，您可以在搜索结果中找到所需的视频素材。

第三步，您还可以使用搜索面板中的筛选器进行高级搜索，比如按照日期、文件类型等进行搜索。

一种基于搜索引擎的视频片段检索方法及装置[发明专利]

专利名称：一种基于搜索引擎的视频片段检索方法及装置专利类型：发明专利
发明人：王佐成,任子晖,王汉林,马韵洁,吴艳平,王卫,范联伟,刘春晖,张凯
申请号：CN201510465480.3
申请日：20150729
公开号：CN105049771A
公开日：
20151111
专利内容由知识产权出版社提供
摘要：本发明涉及一种基于搜索引擎的视频片段存储方法、存储装置和一种基于搜索引擎的视频片段检索方法、检索装置以及一种基于搜索引擎的视频快进或快退的播放方法。

所述存储方法包括以下步骤：获取视频流；将获取的视频流进行编码得到若干个视频流压缩数据包；将所述视频流压缩数据包存储到不同的硬盘块中；建立时间索引表，表示时间和每个视频流压缩数据包之间的关系；建立硬盘索引表，表示每个视频流压缩数据包和硬盘块之间的关系。

本发明利用搜索引擎进行索引建立和检索的方式，实时性好，能够满足千万级别视频数据检索的需要。

申请人：安徽四创电子股份有限公司
地址：230088 安徽省合肥市高新技术产业开发区香樟大道199号
国籍：CN
代理机构：合肥和瑞知识产权代理事务所(普通合伙)
更多信息请下载全文后查看。

基于视频片段的视频检索

基于视频片段的视频检索
胡振兴;夏利民
【期刊名称】《中南大学学报（自然科学版）》
【年(卷),期】2010(041)003
【摘要】为提高视频检索的查询效率,提出一种基于视频片段的视频检索方法.该方法利用相邻帧之间的HIS(Hue, Saturation, Intensity)颜色信息特征将视频流分割成子片段,并采用高维索引结构Vector-Approximation Trie (VA-Trie)来组织视频子片段,然后,利用空间和纹理特征定义视频片段的相似度模型,在此基础上采用基于限定性滑动窗口的高效视频检索算法进行视频片段检索.研究结果表明:与其他检索方法相比,该方法能有效地提高视频检索的查全率和查询率,适合用于运动视频检索.【总页数】6页(P1009-1014)
【作者】胡振兴;夏利民
【作者单位】中南大学,信息科学与工程学院,湖南,长沙,410075;中南大学,信息科学与工程学院,湖南,长沙,410075
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于内容的视频检索技术在多媒体视频检索中的研究 [J], 邢国军;陈亚峰
2.基于弹幕情感分析的视频片段推荐模型 [J], 邓扬;张晨曦;李江峰
3.一种通过视频片段进行视频检索的方法 [J], 彭宇新;Ngo Chong-Wah;董庆杰;
郭宗明;肖建国
4.基于用户兴趣的视频片段提取方法 [J], 邹玲;俞璜悦;王晗
5.基于用户兴趣的视频片段提取方法 [J], 邹玲;俞璜悦;王晗;;;
因版权原因，仅展示原文概要，查看原文内容请购买。

视频片段检索研究综述

视频片段检索研究综述视频片段检索研究综述近年来，随着互联网技术的不断发展和普及，人们对视频资源的需求日益增长。

视频片段检索成为了人们获取、利用视频资源的重要途径，也成为了多媒体领域的研究热点之一。

本文将对视频片段检索的相关研究进行综述，以期为后续的研究工作和应用提供参考。

1. 研究背景随着互联网的普及和移动设备用户的不断增加，以及视频分享平台的兴起，视频数据呈现出爆炸式增长的趋势。

在如此庞大而多样化的视频数据面前，如何高效地检索所需的视频片段成为了亟待解决的问题。

视频片段检索旨在根据用户的需求，从海量的视频资源中找到指定的内容，并以视频片段的形式展现给用户。

2. 主要挑战视频片段检索面临着一系列挑战。

首先，视频资源的规模庞大且多样化，传统的基于文本的检索方法已经不能满足用户的需求。

其次，视频是一种多模态数据，既包含视觉信息，也包含语音和音频信息，如何有效地融合这些信息进行检索仍然是一个难题。

此外，视频资源中存在着大量的噪声、重复和冗余，如何对这些问题进行处理也是一个亟待解决的问题。

3. 视频片段检索方法目前，视频片段检索的研究方法主要可以分为两类：基于内容的检索和基于语义的检索。

3.1 基于内容的检索基于内容的检索方法主要通过对视频片段的视觉信息进行提取和匹配来实现。

常用的视觉特征包括颜色直方图、纹理特征、形状特征等。

在提取到视频片段的视觉特征后，可以使用传统的相似度匹配方法，如欧氏距离、余弦相似度等，来实现视频片段的检索。

3.2 基于语义的检索基于语义的检索方法主要通过对视频片段的语义信息进行提取和匹配来实现。

常用的语义特征包括目标识别、动作识别、场景识别等。

在提取到视频片段的语义特征后，可以使用机器学习和深度学习等方法，来实现视频片段的检索。

4. 研究进展和应用在视频片段检索的研究领域，学术界和工业界都取得了很多的成果和进展。

学术界的研究主要集中在算法和技术上的创新和突破，如基于卷积神经网络的视频片段检索方法、基于深度学习的视频片段检索方法等。

基于视频指纹的视频片段检索方法

中图分类号：Ｔ３Ｐ７
基于视频指纹的视频片段检索方法
李泽洲，欧阳建权，张敏，刘炜，
（．湘潭大学智能计算与信息处理教育部重点实验室，湘潭４１０；２１１１５．湘潭大学信息工程学院，湘潭４１Ｏ）ｌ１５
摘
要：提出一种基于视频指纹的视频片段检索方法，通过视频指纹的相似性匹配对视频片段进行检索。通过改进的Ｈｒｓａｉ检测计算ＤｒＣ
第３６卷第７期
ＶＬ３６ｏ
・
Hale Waihona Puke 计算机工
程
２１００年４月
Ａｐｒｌ０１ｉ２０
Ｎｏ７．
ＣｏｐｕｔｒＥｎｇｎｅｒｎｇｍｅｉｅｉ
多媒体技术及应用・
文章编号：１０４８００７＿２９１．０＿２（ｌ０—０３—Ｉ文献标识码：ｏ－２）＿３Ａ
ｃｍｅｅｃｉｔｒｏｅＤＣｉｇｓｇｎｅａｅａｅｎｔｅｉｒｖｅｒｉｔｏ．ＭｏｅｖｒｔｅｍｏｉｎｆａｕｉｘｒｃｅｙｔｉｏｒｄｓｒｐｏｆｔｍａｅｉｅｒｔｄｂｓｄｏｍｐｏｄＨａｒｓｍｅｈｄｈｈｒｏｅ，ｈｔｏｔｍｓｅｔａｔｄｂｒｍｍｉｇｔｅｅｎｈ
（．ｙＬｂｒｔｒｆｎｅｌｅｔｏｕｉｇ＆ＩｆｒｔｎＰｏｅｓｇＭｉｉｒｆｄｃｔｎＸｉｎｔｎＵｎｖｒｉ，ａｇａ１１５１ＫｅａｏａｏｙｏＩｔｌｇｎＣｍｐｔｉｎｎｏｍａｉｒｃｓｉ，ｎｓｙｏＥｕａｉ，ａｇａｏｎｔｏｉｅｓｙＸｉｎｔｎ４１０；ｔ

视频检索综述

视频检索综述视频检索综述随着互联网和多媒体技术的迅速发展，视频成为人们日常生活中不可或缺的一部分。

然而，随着视频数据的不断增长和视频内容的多样化，如何有效进行视频检索成为了一个值得研究的重要问题。

本文将对视频检索相关的技术和方法进行综述，旨在提供一个全面的了解和把握视频检索领域的现状和进展。

一、视频检索的概述视频检索是指从大规模视频数据集中，根据用户需求找到与之相关的视频片段的过程。

它具有很高的挑战性，主要源于视频数据包含的信息量大、内容复杂多样。

视频检索主要可以分为两个方面的研究，一是基于内容的视频检索，二是基于用户标记的视频检索。

基于内容的视频检索依靠计算机对视频内容的分析和理解，通过比对视频中的视觉特征、语义信息等，来进行检索。

而基于用户标记的视频检索则是依赖用户对视频的标记或注释信息，通过匹配标记与用户查询来实现检索。

二、基于内容的视频检索1. 视频特征提取为了使计算机能够对视频的内容进行分析，首先需要提取视频的特征。

视频特征可以从多个角度进行提取，包括低层次的视觉特征（如颜色、纹理等）、高层次的语义特征（如对象、行为等）以及混合特征。

低层次的视觉特征一般通过提取视频的帧间帧内差异、颜色直方图等来实现。

而高层次的语义特征则需要借助图像识别、行为分析等技术来提取。

2. 视频索引和检索视频索引是指将视频数据集转化为可用于检索的索引结构。

这一步通常包括对视频特征的描述和编码，以及构建索引结构。

视频检索则是在索引结构的基础上，根据用户查询进行匹配和检索。

常用的视频检索方法包括基于相似度的检索和基于学习的检索。

基于相似度的检索一般采用欧氏距离、余弦相似度等来度量视频之间的相似性，进而进行检索。

而基于学习的检索则通过训练分类器来学习视频的特征和标签之间的关系，以实现检索。

三、基于用户标记的视频检索除了基于内容的视频检索，基于用户标记的视频检索也是一种重要的检索方法。

用户标记是指用户对视频的注释或关键词信息。

一种通过视频片段进行视频检索的方法

+ Corresponding author: Phn: 86-10-62752426, Fax: 86-10-62981438, E-mail: peng_yuxin@
Received 2002-11-25; Accepted 2003-03-20 Peng YX, Ngo CW, Dong QJ, Guo ZM, Xiao JG. An approach for video retrieval by video clip. Journal of Software, 2003,14(8):1409~1417. /1000-9825/14/1409.htm Abstract: Video clip retrieval plays a critical role in the content-based video retrieval. Two major concerns in this
Vol.14, No.8
一种通过视频片段进行视频检索的方法
彭宇新 1,2+, Ngo Chong-Wah3, 董庆杰 1,2, 郭宗明 1,2, 肖建国 1,2
1 2 3
∗
(北京大学计算机科学技术研究所,北京 (香港城市大学计算机科学系,香港)
100871) 100871)
(北京大学文字信息处理技术国家重点实验室,北京
视频片段检索是基于内容的视频检索的主要方式,它需要解决两个问题:(1) 从视频库里自动分割出与查
询片段相似的多个片段;(2) 按照相似度从高到低排列这些相似片段.首次尝试运用图论的匹配理论来解决这两个
∗ 第一作者简介 : 彭宇新 (1974－ ),男 ,贵州都匀人 ,博士生 ,主要研究领域为基于内容的视频检索 .

视频检索技术

7
Direct Show是为播放各种类型的视频数据、音频数据或其他多媒体数据而设计的。Direct Show支持MPEG(包括MP3、AVI、MOV、WAV、DVD等格式）。借助于Direct Show，可以很容易地实现多种格式的多媒体数据的回放、传输和捕获。Direct Show使用Filter Graph的模型来管理整个数据流的处理过程。利用Direct Show强大的功能，我们可以这样实现帧的提取。首先建立过滤器图表，与特定的多媒体流相关联，然后加视频抓帧过滤器进图表，并设置回调函数。当图表运行时，抓帧过滤器抓取流过的视频帧(可进行设置，可以是每一帧，也可以是间隔固定帧)，把抓取的帧存储在视频库中。利用Direct Show 能够使开发者专注于各自的分析和处理，而无需考虑带有共性的实现细节，极大地降低了多媒体应用开发的复杂度，并提高了其开发效率。
4
下面对视频检索的原理进行简要的介绍。 2.基于内容的视频检索
基于内容的视频分析和检索研究的目的是通过对视频内容进行计算机处理、分析和理解，建立结构和索引，以实现方便有效的视频信息获取。它是根据视频的内容以及上下文关联，在大规模视频数据中进行检索。基于内容的视频检索包括很多技术，如：视频结构的分析 ( 镜头检测技术 ) 、视频数据的自动索引和视频聚类等。目前，在基于内容的视频检索技术的研究方面，除了识别和描述图像的颜色，纹理，形状和空间关系外，其他主要集中在视频镜头分割，特征的提取和描述(包括：视觉特征，颜色，纹理和形状及运动信息和对象信息等)，关键帧提取和结构分析等方面。基于内容的视频检索的系统框图见下图。
目前，国内外已研发出了多个基于内容的视频检索系统，主要有五种，如下：
1：QBIC系统：QBIC(Query By Image Content) 是由IBM Almade n研究中心开发的，是“基于内容”检索系统的典型代表。此系统主要利用颜色、纹理、形状、摄像机和对象运动等描述视频内容, 并以此实现其检索。QBIC提供了对静止图像及视频信息基于内容的检索手段, 允许用户使用例子图像、构建草图、以及颜色和纹理模式、镜头和目标运动等信息对大型图像和视频数据库进行查询。在视频数据分析方面包括了镜头检测、运动估计、层描述、代表帧生成等多种视频处理手段。 2 ： Visual Seek 系统： Visual Seek 是美国哥伦比亚大学电子工程系与电信研究中心图像和高级电视实验室共同研究的、一种在互联网上使用的“基于内容”的检索系统。它实现了互联网上的“基于内容”的图像/视频检索系统，提供了一套供人们在Web上搜索和检索图像及视频的工具。

一种基于样本视频片段进行海量视频检索的方法[发明专利]

专利名称：一种基于样本视频片段进行海量视频检索的方法专利类型：发明专利
发明人：姚领众
申请号：CN201310634378.2
申请日：20131127
公开号：CN103605786A
公开日：
20140226
专利内容由知识产权出版社提供
摘要：本发明公开了一种基于样本视频片段进行海量视频检索的方法，以实现“以视频搜视频”。

其包括以下步骤：步骤1）导入原始海量视频；步骤2）海量视频转码；步骤3）结构化分析视频；步骤4）分析结果入库；步骤5）导入样本视频片段；步骤6）结构化分析视频片段；步骤7）样本信息入库；步骤8）数据对比；步骤9）输出结果。

本发明的视频检索方法能改进原来的以语义描述或者样本图片作为输入进行视频检索的方式，实现海量视频中的“以视频搜视频”。

申请人：姚领众
地址：215000 江苏省苏州市虎丘区竹园路209号
国籍：CN
代理机构：上海申新律师事务所
代理人：刘懿
更多信息请下载全文后查看。

视频检索方法及视频检索映射关系生成方法、装置[发明专利]

专利名称：视频检索方法及视频检索映射关系生成方法、装置专利类型：发明专利
发明人：不公告发明人
申请号：CN201810516305.6
申请日：20180525
公开号：CN110598048A
公开日：
20191220
专利内容由知识产权出版社提供
摘要：本申请涉及一种视屏检索方法及视频检索映射关系生成方法、设备和存储介质。

本申请提供的视频检索方法包括：获取检索指令，检索指令中携带用于检索目标帧图片的检索信息；根据检索信息和预设的映射关系，得到目标帧图片。

本申请提供的视频检索映射关系生成方法包括：采用特征提取模型对视频流中的各个帧图片进行特征提取操作，得到每个帧图片对应的关键特征序列；将每个帧图片对应的关键特征序列输入至文字序列提取模型中进行处理，得到每个帧图片对应的文字描述序列；根据每个帧图片对应的文字描述序列，构建映射关系。

采用本申请提供的视频检索方法及视频检索映射关系生成方法、设备和存储介质，能够提高视频检索的效率，并且人机交互更智能。

申请人：北京中科寒武纪科技有限公司
地址：100190 北京市海淀区科学院南路6号科研综合楼644室
国籍：CN
代理机构：北京华进京联知识产权代理有限公司
代理人：成丹
更多信息请下载全文后查看。

利用等价关系理论进行视频片段检索的方法

利用等价关系理论进行视频片段检索的方法
赵亚琴;周献中;何新
【期刊名称】《中国图象图形学报》
【年(卷),期】2007(012)001
【摘要】视频片段检索是基于内容的视频检索的主要方式,可是现有的片段检索方法大多只是对预先分割好的片段进行检索.为了从连续的视频节目中自动分割出多个相似的片段,提出了一种新的有效的视频片段检索方法,并首次尝试将等价关系理论应用于视频片段的检索.该方法首先用等价关系理论定义了片段匹配函数,同时采用滑动镜头窗自动分割出多个真正相似的片段;然后把等价类映射为矩阵表达形式,再通过矩阵的特性来度量影响片段相似度的不同因子,实现了相似片段的排序.实验结果表明,该方法能够一次性快速准确地从连续视频库中自动分割出与查询片段相似的多个片段.
【总页数】8页(P127-134)
【作者】赵亚琴;周献中;何新
【作者单位】南京理工大学自动化学院,南京,210094;南京大学工程管理学院,南京,210093;南京理工大学自动化学院,南京,210094
【正文语种】中文
【中图分类】TP391.3;TN941.1
【相关文献】
1.基于视频指纹的视频片段检索方法 [J], 李泽洲;欧阳建权;张敏;刘炜
2.压缩基础上利用纹理进行图像检索的方法研究 [J], 宁晶晶;周海英
3.一种通过视频片段进行视频检索的方法 [J], 彭宇新;Ngo Chong-Wah;董庆杰;郭宗明;肖建国
4.利用Windows Movie Maker对视频片段进行后期制作 [J], 刘雪锋
5.怎样利用终端设备进行国际联机情报检索——DIALOG系统的检索方法 [J], 顾本贵;赵小海;宋芬
因版权原因，仅展示原文概要，查看原文内容请购买。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1000-9825/2003/14(08)1409
©2003 Journal of Software 软件学报
Vol.14, No.8
一种通过视频片段进行视频检索的方法
彭宇新 1,2+, Ngo Chong-Wah3, 董庆杰 1,2, 郭宗明 1,2, 肖建国 1,2
1 2 3
∗
(北京大学计算机科学技术研究所,北京 (香港城市大学计算机科学系,香港)
1410
Journal of Software
软件学报 2003,14(8)
问题.针对问题(1),把检索过程分为两个阶段:镜头检索和片段检索.在镜头检索阶段,利用相机运动信息,一个变化较大的镜头被划分为几个内容一致的子镜头,两个镜头的相似性通过对应子镜头的相似性计算得到;在片段检索阶段, 通过考察相似镜头的连续性初步得到一个个相似片段,再运用最大匹配的 Hungarian 算法来确定真正的相似片段. 针对问题(2),考虑了片段相似性判断的视觉、粒度、顺序和干扰因子,提出用最优匹配的 Kuhn-Munkres 算法和动态规划算法相结合,来解决片段相似度的度量问题.实验对比结果表明,所提出的方法在片段检索中可以取得更高的检索精度和更快的检索速度. 关键词: 基于内容的视频检索;片段;相似度;最大匹配;最优匹配文献标识码: A 中图法分类号: TP391
issue are: (1) automatic segmentation and retrieval of similar video clips from video database; (2) similarity ranking of similar video clips. In this paper, motivated by the maximal matching and optimal matching in graph theory, a novel approach is proposed for video clip retrieval based on matching theory. To tackle the clip segmentation and retrieval, the retrieval process is divided into two phases: shot-based retrieval and clip-based retrieval. In shot-based retrieval, a shot is temporally partitioned into several sub-shots based on motion content. The similarity among shots is measured according to the color content of sub-shots. In clip-based retrieval, candidates of similar video clips are selected by modeling the continuity of similar shots. Maximal matching based on Hungarian algorithm is then adopted to obtain the final similar video clips. To rank the similarity of the selected video clips, four different factors: visual similarity, granularity, interference and temporal order of shots are taken into consideration. These factors are modeled by optimal matching based on Kuhn-Munkres algorithm and dynamic programming. Experimental results indicate that the proposed approach is effective and efficient in retrieving and ranking similar video clips. Key words: 摘要: content-based video retrieval; clip; similarity; maximal matching; optimal matching
随着电视台视频节目的积累 , 网上数字视频的增加 ,以及数字图书馆、视频点播、远程教学等大量多媒体的应用 ,如何在海量视频中快速检索出所需要的资料显得至关重要 . 传统的基于关键词描述的视频检索因为描述能力有限、主观性强、手工标注等原因,已经不能满足海量视频检索的需求.因此,从 20 世纪 90 年代开始,基于内容的视频分析和检索技术成为研究的热点问题 . 由于基于内容的图像检索的困难性和复杂性 ,大量的研究主要集中在视频内容的结构分析上 , 如镜头的分割、关键帧的提取、场景的构造等 ,视频检索方面的研究则相对较少 ,而这部分常常是应用的关键 .视频检索一般分为镜头检索和片段检索 .镜头一般是由摄像机一次摄像的开始和结束的所有帧构成 ,表示一个物理概念 .而片段是由一连串语义相关的连续镜头构成 ,表示的是一个语义概念 . 目前视频检索的多数研究集中在镜头检索上 [1~4], 而片段检索方面的研究则刚刚开始 [5~11]. 实际上 , 从用户的角度分析 ,他们对视频数据库的查询通常会是一个视频片段而很少会是单个的物理镜头 .从信息量的角度分析 , 由几个镜头组成的视频片段比单个镜头有更多的语义 , 它可以表示用户感兴趣的事件 , 因此 , 查询的结果也比较有意义 . 例如 , 从新闻中检索出感兴趣的事件 , 从体育节目中检索出喜爱的体育运动 , 电视台检索某条广告是否播出等 .基于这种考虑 ,本文提出了一种通过视频片段进行视频检索的方法 ,以满足用户通过视频片段来提交的查询需求. 视频片段检索需要解决两个问题 :(1) 从视频库里自动分割出与查询片段相似的多个片段 ;(2) 按照相似度从高到低排列这些相似片段 .目前已有的片段检索方法可以分为两类 :(1) 把视频片段分为片段 -帧两层考虑 , 片段的相似性利用组成它的帧的相似性来直接度量 [5~7];(2) 把视频片段分为片段 - 镜头 - 帧三层考虑 , 片段的相似性通过组成它的镜头的相似性来度量 , 而镜头的相似性通过它的一个关键帧 [8~10] 或所有帧 [11] 的相似性来度量 . 方法 (1)的缺点在于 ,限制相似的片段必须遵守同样的时间顺序 ,而实际的视频节目并不遵守这种约束 ,因为后期编辑的结果使得相似的片段完全可能具有不同的镜头顺序 ,如同一个广告的不同编辑 . 同时 ,这种基于每帧的比较,也使得检索速度比较慢 .方法 (2)的思想比较合理 ,但这种方法从已有的文献上看并没有很好解决片段检索的问题.文献[8~10]提出了影响视频相似度度量的顺序因子、速度因子、粒度因子、干扰因子,但它的片段是预先分割好的 , 并没有解决怎样在连续的视频节目里自动分割出多个相似片段的问题 . 与文献 [8~10] 相反 , 文献 [11] 完全忽略了镜头顺序、粒度、干扰因子的影响 , 两个片段的相似度仅仅取决于它们相似镜头的数量 ,因此 , 即使片段 Y 的所有镜头仅仅和片段 X 的一个镜头相似,Y 也会被认为与 X 相似;另外,镜头的相似性是根据两个镜头相似的最长帧序列来判断,这种基于每帧的比较和文献[5~7]类似,片段的检索速度也较慢. 针对上述问题 ,本文提出解决片段检索两个问题的一个新方法 .为了分割出相似片段 ,本文采用了上述方法 (2) 的思想 , 把检索过程分为镜头检索和片段检索两个阶段 : 在镜头检索阶段 , 考虑了视频中的时间信息 , 把一个镜头内部随时间变化的内容,分解为几个内容一致的子镜头(sub-shots),这种基于子镜头的比较全面地反映了两个镜头是否相似 ; 在片段检索阶段 , 通过考察相似镜头的连续性初步得到一个个相似片段 , 再运用最大匹配的 Hungarian 算法来确定真正的相似片段.为了排列相似片段,类似于文献[8~10],本文考虑了片段相似度度量的不同因子,不同于文献[8~10],提出用最优匹配的 Kuhn-Munkres 算法和动态规划算法相结合来度量这些因子的影响 . 本文首次尝试运用图论的匹配理论来解决视频检索问题 ,这是因为匹配的思想要求相似镜头必须一一对应 ( 粒度 ), 在这个条件下 , 求出的最大匹配和最优匹配可以客观而全面地反映两个片段相似的镜头数量和两个片段视觉相似的程度 ,从而避免了文献 [11]中镜头计算的粒度问题 .第 4 节的实验结果表明 ,与具有同样功能的文
彭宇新等:一种通过视频片段进行视频检索的方法献[11]相比,无论是检索的准确性,还是检索速度,本文提出的方法都取得了更好的效果.
1411
本文第 1 节首先介绍了本文的理论基础——图论的最大匹配和最优匹配.第 2 节介绍怎样自动分割相似片段.第 3 节介绍视频片段的相似度模型.第 4 节给出了实验结果.第 5 节是总结.
100871) 100871)
(北京大学文字信息处理技术国家重点实验室,北京
An Approach for Video Retrieval by Video Clip
PENG Yu-Xin1,2+,
1 2 3
NGO Chong-Wah3,
DONG Qing-Jie1,2,
GUO Zong-Ming1,2,
视频片段检索是基于内容的视频检索的主要方式,它需要解决两个问题:(1) 从视频库里自动分割出与查
询片段相似的多个片段;(2) 按照相似度从高到低排列这些相似片段.首次尝试运用图论的匹配理论来解决这两个
∗ 第一作者简介 : 彭宇新 (1974－ ),男 ,贵州都匀人 ,博士生 ,主要研究领域为基于内容的视频检索 .