流形特征镜头边界检测后处理算法

合集下载

一种新的视频镜头边界检测及关键帧提取方法

一种新的视频镜头边界检测及关键帧提取方法

一种新的视频镜头边界检测及关键帧提取方法
方勇;戚飞虎
【期刊名称】《华南理工大学学报(自然科学版)》
【年(卷),期】2004(032)0z1
【摘要】根据视频邻域片段变化的特点提出了镜头边界系数模型,镜头边界系数具有良好的抗噪能力,且对视频帧的时域变化有较好的描述能力,可用于镜头边界检测与关键帧提取.它可以单独检测镜头边界,也可以与传统的基于帧差的镜头边界检测方法相结合检测镜头边界.在提取关键帧时,根据镜头边界系数的分布,自适应地确定镜头内的关键帧数,用非极大值抑制方法与基于镜头边界系数的优先级方法确定关键帧的位置.实验结果表明,该方法在镜头边界检测性能上要优于已有的基于帧差的镜头边界检测方法,提取的关键帧对镜头的视觉内容具有较好的表达能力,且可在视频回放时实时执行.
【总页数】6页(P18-23)
【作者】方勇;戚飞虎
【作者单位】上海交通大学,计算机科学与工程系,上海,200030;上海交通大学,计算机科学与工程系,上海,200030
【正文语种】中文
【中图分类】TP391
【相关文献】
1.一种新的自适应的视频关键帧提取方法 [J], 王宇;汪荣贵;杨娟
2.一种新的视频镜头扫换边界检测方法 [J], 谢明华;刘辉;王新辉
3.一种压缩视频流的视频分段和关键帧提取方法 [J], 王凤领;
4.一种压缩视频流的视频分段和关键帧提取方法 [J], 王凤领
5.一种新的镜头边界检测和静态视频摘要提取方法 [J], 卜庆凯;胡爱群
因版权原因,仅展示原文概要,查看原文内容请购买。

视觉边缘模糊处理算法实现

视觉边缘模糊处理算法实现

视觉边缘模糊处理算法实现
视觉边缘模糊处理算法是一种图像处理技术,用于减少图像中的噪点和细节,使得图像边缘更加平滑和柔和。

下面是一个常见的视觉边缘模糊处理算法的实现详情:
1. 导入所需库和图像:首先,需要导入相关的图像处理库,例如OpenCV。

然后,加载待处理的图像。

2. 灰度转换:将彩色图像转换为灰度图像。

这可以通过将RGB颜色通道进行加权平均来实现,或者使用更高级的色彩空间转换方法。

3. 边缘检测:使用边缘检测算法来识别图像中的边缘。

常用的边缘检测算法包括Sobel、Canny等。

这些算法会计算图像中每个像素点的梯度,并根据梯度强度确定边缘位置。

4. 模糊处理:对边缘进行模糊处理,以减少噪点和细节。

常用的模糊处理算法包括高斯模糊、均值模糊等。

这些算法通过对图像中的像素进行加权平均来实现模糊效果。

5. 边缘增强:通过将原始图像和模糊处理后的边缘图像进行加权叠加,可以增强图像的边缘。

这可以通过简单的逐像素相加或者使用更复杂的卷积运算来实现。

6. 结果显示:将处理后的图像显示出来,以便观察效果。

需要注意的是,以上只是一个基本的视觉边缘模糊处理算法的实现概述。

在实际应用中,可能还会涉及参数调整、边缘优化等更加复杂的步骤,以达到更好的效果。

1。

鲁棒的镜头边界检测与基于运动信息的视频摘要生成

鲁棒的镜头边界检测与基于运动信息的视频摘要生成

鲁棒的镜头边界检测与基于运动信息的视频摘要生成近年来,随着人工智能和计算机视觉领域的不断发展,视频处理技术也得到了极大的提高。

其中,镜头边界检测和视频摘要生成是视频处理领域中的两个重要问题。

一、镜头边界检测镜头边界指的是视频中相邻两个镜头之间的转换点。

镜头的转换包含广义的转换和狭义的转换,广义的转换指的是电影行当中所说的特写、近景、全景等变换,狭义的转换指的是不同的场景、角度、时间等方面的变化。

镜头边界检测在视频编辑中起着极为重要的作用,可以帮助编辑在视频前期进行有效的剪辑和处理。

目前,镜头边界检测已经成为一个重要的研究方向。

常见的镜头边界检测算法主要有以下几种:1.基于边缘检测的镜头边界检测边缘检测是计算机视觉领域中最基础的任务之一,目前已经有很多成熟的算法,包括sobel算子、canny算子等等。

将这些算法应用于镜头边界检测任务中,通常需要对视频中的每一帧分别进行边缘检测,然后通过边缘信息来判断镜头边界。

但是,单独使用基于边缘检测的算法,容易受到光照等环境因素的影响,误判率较高。

2.基于局部变化率的镜头边界检测在视频中,镜头边界往往伴随着场景的变换和运动的变化。

基于此,常常采用整体的方式来判断镜头边界。

目前,基于局部变化率的镜头边界检测算法被广泛应用。

通过提取帧间的图像的局部变化率,并进行异常点检测,从而判断出镜头边界。

优点在于镜头之间的物理变化大,表现在整幅图像上。

3.基于运动信息的镜头边界检测在视频中,镜头边界往往伴随着画面运动的变化。

因此,基于运动信息的镜头边界检测算法成为了一类重要的算法。

运动信息通常可以通过视频中的光流计算来获得。

光流计算是指对相邻两帧图像进行匹配,从而计算出每个像素的位移。

通过对位移分布的分析,可以得到画面运动的信息,从而进行镜头边界检测。

二、基于运动信息的视频摘要生成随着视频数据的快速增长,如何从胡乱攀登的长视频中挖掘出有效的摘要信息成为了一个重要的问题。

视频摘要生成是指从一个较长的视频中选择一些最具代表性的关键帧来进行展示。

镜头分割算法研究

镜头分割算法研究

一个叠化镜头切换的全过程
B帧误差能量的分布规律
结论
同一个镜头内部,各个B帧之间的误差能量 差异较小,分布集中,明显地聚为一类 在不同镜头之间,误差能量相差很大 沿着时间轴,各个镜头呈团状分布
B帧误差能量的分布规律
跳变切换过程中B帧的DCT误差能量曲线图
B帧误差能量的分布规律
淡入淡出切换过程中B帧的DCT误差能量曲线图
镜头切换的定义
设 s (t ) 和 s2 (t ) 分别是镜头切换前后的视频信 t 号,1 和 t2 分别是切换的开始时间和结束时 ℜ s 间,令 T = t2 − t1 , = [t , t ] ,(t ) 是发生镜头切 换时的视频信号,则:
1
1 2
s (t ) = s1 (t )
t2 − t t − t1 + s2 (t ) T T
镜头分割算法研究
肖友能 5月8日
Agenda
前言 镜头切换的定义 镜头边界检测的几种基本算法 压缩域中叠化镜头的快速检测算法 总结
前言
基于内容的视频信息检索认为,一个有 语义的视频序列是由一系列的镜头构成 的 镜头是表示视频内容的基本单元。检测 镜头边界意味着重构这些基本单元 对于理解视频的语义,实现基于内容的 视频检索具有重要的意义
S L ( f m , f n ) = ∑ Ci × S P ( f m , f n , i)
i =1 r
⎧1 如果M > Tth S P ( f m , f n , i) = ⎨ ⎩0 如果M < Tth
( 其中 M =
u m ,i + u n , i 2
+
δ 2 m ,i − δ 2 n ,i
2
M

基于局部线性嵌入的视频镜头变换检测

基于局部线性嵌入的视频镜头变换检测
内容 分 析 、分 类 、检 索 和 其 他 应 用 的基 础 , 因 此 , 镜 头 类 型 变 换 检 测 准 确 性 的 高低 将 直 接 影 响 到 后 对
维空 间 . 像 之间在 时 间轴 上是 局部 相关 的 , 图 图像 之 间 呈 现 出 特 有 的 分 布 . 这 种 分 布 . 成 是 一 个 低 维 的 流 把 看
续处理效 果 。
视 频 镜 头类 型 检 测 算 法 .从 对 视 频 研 究 时 起 就 得 到 广 泛 的 重 视 . 要 表 现 在 阈 值 选 取 和 特 征 度 量 『等 两 主 5 _
形 嵌 入 到 高 维 空 间 中进 行 处 理 。
Ab t c : hs p p r r s n sa n v lmeh d o h tt n i o ee t n b s d o o al i e re e dn . i t , x rc st e ma i s r t T i a e p e e t o e t o f o r s in d tc i a e n lc l l a mb d i g F r l i e ta t n— a s a t o y n sy t h
随 着 日益 丰 富 的视 频 数 据 的 出现 . 们 迫 切 期 望 能 人 在 大 量 视 频 数 据 中 方 便 、 速 地 检 索 到 自己 感 兴 趣 的 视 快 频 段 。 而 要 实 现 视 频 检 索 , 常 是 先 将 视 频 分 割 成 独 立 通
用 于 计 算 合 适 的 阈值 因 此 对 镜 头 变 换 检 测 算 法 的 研 究 . 别 是 渐 变 镜 头 变 换 检 测 依 然 是 视 频 分 析 与 处 理 特
L i ig I Ja B n ( eate to fr a o nier g Lun V ctn lad Tc n a C l g ,Lun 2 7 5 ,C i ) D pr n fI om t n E g e n , ia oao a n eh i l oee ia 3 18 m n i n i i c l hn a

基于预处理的视频镜头边界检测算法

基于预处理的视频镜头边界检测算法

基于预处理的视频镜头边界检测算法章亦葵;赵晖【摘要】针对视频镜头边界检测的高时耗问题,提出了一种基于视频预处理的视频镜头边界检测(SBD)改进算法.通过使用自适应的阈值选择可能包含镜头边界的候选段,候选段内首帧与其余各帧进行相似度对比检测出镜头起始帧,并立即检测切变.若候选段中不包含切变,则进行渐变检测.调整候选段以保证镜头边界位于同一段内,段内其余各帧与起始帧进行相似度对比确定镜头结束帧.实验结果表明,所提算法镜头边界识别准确率能够达到90%以上,且与倒三角模式匹配方法相比能够节约时间15.6%~30.2%;与对渐变和切变分别检测的算法相比,该算法能够在满足识别率的基础上提升检测速度.【期刊名称】《计算机应用》【年(卷),期】2014(034)011【总页数】5页(P3327-3331)【关键词】视频镜头边界检测;视频分割;视频检索;镜头切变;镜头渐变【作者】章亦葵;赵晖【作者单位】天津大学软件学院,天津300072;天津大学计算机科学与技术学院,天津300072【正文语种】中文【中图分类】TP391.40 引言随着数字媒体的增长,视频检索的需求也大幅提升。

视频镜头边界检测是视频检索的关键,视频镜头是指被连续捕获的一系列帧序列[1],视频镜头边界有两种主要形式:切变和渐变。

渐变被分为淡入淡出、溶解、消除等多种形式[2]。

根据视频镜头边界的不同,镜头边界检测方法主要分为两类:切变检测和渐变检测。

早期的研究主要关注于切变,通过提取相邻帧的特征进行比对,然后进行决策,从而判断切变。

相邻帧的对应像素差和颜色直方图是最为常见的两种图像特征。

如Hanjalic等[3-4]提出利用两帧对应像素差和来解决该问题,然而镜头内物体的移动或摄像头的晃动以及光照变化均可能在两帧对比时造成干扰,从而影响实验结果;而颜色直方图比对应像素差和具有很好的鲁棒性[5-6],能够减少外界对实验的影响,利于检测切变。

也有一些采用其他的图像特征来检测视频镜头,如图像边缘[7]。

一种高速切变镜头边界探测算法

一种高速切变镜头边界探测算法

一种高速切变镜头边界探测算法王伟强;高文;马继涌【期刊名称】《计算机科学》【年(卷),期】2001(028)007【摘要】Shot boundary detection is a key technique in constructing video information management system. The paper proposes a fast and effective cut detection algorithm in compressed domain. Compared with other algorithms in compressed domain, the algorithm applies multi-resolution detection mode,distinct from the common comparison mode between consecutive frames. The mechanism makes the volume of data processed decrease greatly in the whole detection process. The algorithm also uses the different raw information,which can be extracted directly from frames with different coding types,as features to reduce computation complexity. To verify the validity of the algorithm, we did experiments on a data set containing 145,000 frames. The experiment results demonstrate the algorithm has not only a very fast detection speed,as 2.5 to 5.2 times fast as others' in compressed domain,but also average 98% accuracy and recall.【总页数】5页(P56-59,45)【作者】王伟强;高文;马继涌【作者单位】中科院计算所数字化技术实验室,;中科院计算所数字化技术实验室,;中科院计算所数字化技术实验室,【正文语种】中文【中图分类】TP3【相关文献】1.一种新的基于背景色度的镜头边界探测算法 [J], 雷震;吴玲达;老松杨2.一种基于直方图的切变镜头自动检测算法 [J], 刘典;刘文萍3.一种嵌入H.264/AVC的镜头切变检测算法 [J], 艾育华;叶梧;冯穗力;胡兵;周卫4.一种改进的视频镜头切变检测算法 [J], 潘磊;束鑫5.基于背景颜色不变量的改进双直方图镜头边界探测算法 [J], 雷震;吴玲达;老松杨因版权原因,仅展示原文概要,查看原文内容请购买。

一种基于PSO分类器的镜头边界检测算法

一种基于PSO分类器的镜头边界检测算法

一种基于PSO分类器的镜头边界检测算法
孟宇;李文辉
【期刊名称】《计算机研究与发展》
【年(卷),期】2007(044)0z2
【摘要】提出一种基于PSO分类器的镜头边界检测算法,该算法以YUV模型中的U分量直方图差异曲线来反映视频帧间差异度,有效避免了检测算法对镜头运动及镜头内物体运动的敏感,同时对渐变具有更好的识别效果.接着采用滑窗均值滤波的方法对差异曲线滤波,在镜头转换部分形成具有显著特征的曲线图形.然后使用一种应用PSO算法的KNN分类器对这些曲线图形进行分类,最终实现对镜头转换的位置检测与类型识别.算法能够在同一步骤内完成对切变和渐变的检测,实验结果表明,该算法具有很好的精确度与召回率.
【总页数】5页(P246-250)
【作者】孟宇;李文辉
【作者单位】符号计算与知识工程教育部重点实验室,长春,130012;吉林大学计算机科学与技术学院,长春,130012
【正文语种】中文
【中图分类】TP391.41
【相关文献】
1.一种二级级联分类的镜头边界检测算法 [J], 薛玲;熊璋;欧阳元新;钟林
2.一种基于TextTiling的镜头边界检测算法 [J], 谢彬彬;贾西平;方刚;欧卫
3.一种基于支持向量机的镜头边界检测算法 [J], 常虹;张明
4.一种改进的基于互信息量的镜头边界检测算法 [J], 王瑞佳;牛之贤;宋春花;牛保宁
5.一种基于支持向量机的镜头边界检测算法 [J], 常虹;张明
因版权原因,仅展示原文概要,查看原文内容请购买。

几种常用镜头边界检测技术介绍

几种常用镜头边界检测技术介绍

几种常用镜头边界检测技术介绍随着数字媒体技术和网络技术的发展与普及,使数字视频广泛进入到人们日常生活的各种领域。

如何从海量的多媒体视频中浏览检索出自己感兴趣的内容,已经成急待解决的问题。

这使得基于内容的视频检索技术成为多媒体科学领域的研究热点。

镜头作为组成视频的基本语义单元,其边界的划分检测是进行视频分段、组织、检索的基础,镜头边界划分的好坏将直接影响到基于内容的视频检索的效率。

本文将研究介绍几种典型的镜头边界检测技术。

渐变:渐变又叫光学切割,指一个镜头渐渐变化到另一个镜头,中间常会穿插十几或几十帧的过渡视频帧的一种镜头变化方式。

镜头边界检测就是要对不同的视频采用合理有效的镜头检测方式,将镜头从视频文件中划分提取出来,为视频检测的后续工作做好基础的准备。

目前,典型的镜头边界检测方法主要有以下几种:(1)像素比较法在镜头边界检测算法中像素比较法是最简单的一种检测帧间距离的算法。

算法的核心思想是:计算两相邻图像帧之间对应位置上的灰度值之差是否大于一个提前设定好的门限值,如果大于这一门限值,就认为该位置上的像素发生了变化,统计两相邻图像帧之间所有发生变化的像素点,根据发生变化的像素点占总像素点的比例来确定镜头是否发生变换。

像素比较法可以用以下的公式表示:其中x, y表示该像素点在图像帧中的位置, d (x, y)表示该像素点是否发生变化,表示相邻两图像帧之间像素值之差的绝对值,表示提前设定好的门限值,若,则对应位置像素点发生变化,用 1 表示,若,则对应位置像素点未发生变化,用0 表示。

其中,X, Y代表以像素点为单位的图像帧的高度与宽度,D (X,Y)代表两图像帧之间所有发生变化的像素点数量占总像素点数量的比值。

像素比较法的优点是算法实现起来比较简便易行, 它的不足之处是没有考虑到噪声的影响, 对摄像机的运动与镜头内物体的运动都比较的敏感。

因此, 一种改进的方法是在对像素点比较之前,先用均值滤波器对待检测图像帧进行平滑滤波处理, 去掉部分噪声,从而降低物体运动对检测结果的影响。

视觉测量中特征点区域的无损压缩算法

视觉测量中特征点区域的无损压缩算法

视觉测量中特征点区域的无损压缩算法许致华;刘治国;于之靖【摘要】In the paper we encode for the lossless compression of feature points zone , and detect and recognise the feature points zone through coding mark targets .We process the feature points zone and the background zone separately , in feature point zone we use lossless compression of integer wavelet transform , and in background zone we use lossy compression of discrete cosine transform .In order to display the structure of the algorithm in the paper more intuitively , we compare the images compressed in the way of this paper with TIFF compression and JPEG compression .Experimental result shows that the compressed image derived from the algorithm in this paper saves the storage space while entirely preserves the information of the feature points zone .This algorithm is suitable for the research on lossless compression of feature points zone in visual measurement .%针对特征点区域无损压缩进行编码,通过编码标志点检测识别特征点区域,将特征点区域和背景区域分别进行处理,特征点区域采用整数小波变换无损压缩,背景区域采用离散余弦变换有损压缩。

基于颜色特征分析的视频镜头边界检测算法研究

基于颜色特征分析的视频镜头边界检测算法研究

摘要在这个多媒体时代,视频处理技术已发展成为计算机学科的一个重要研究领域。

视频镜头检测是提取视频结构化分析的一种重要手段,也是数字视频处理的首要操作,其准确性对后续视频处理的效果具有很大的影响。

常见的视频镜头边界有突变和渐变(淡入、淡出、溶解、扫换)两种类型。

和突变转换相比,渐变转换具有持续时间长,变化缓慢的特点,检测难度相对较大。

此外,视频内容常会受到各种外部因素的影响,比如说噪音、文字插入、logo 插入等等,所有这些因素的存在,都为镜头边界检测增加了难度。

本文的主要目标是研究并设计有效的镜头边界检测算法,以提高视频中的突变转换以及渐变转换的检测性能,为视频图像的分析处理提供技术基础。

论文主要的研究内容及贡献包括以下两个部分:(1)提出了一种基于模糊颜色分布图(FCDC)的视频镜头边界检测算法。

算法通过模糊颜色分布图提取视频帧的颜色特征,然后借助滑动窗口,通过比较不同视频帧之间的颜色变化模式,提取突变转换和渐变转换特征。

通过实验可以看出,和现有的一些研究成果相比,该方法对镜头边界检测具有比较好的实验结果。

(2)提出了一种基于视频跟踪的视频镜头边界检测算法。

通过对上述所提出的算法及其实验结果进行分析,发现算法仍旧存在有待完善之处,于是基于视频跟踪思路,对上述视频镜头边界检测算法进行了进一步改进。

算法将图像颜色特征与视频跟踪相结合,减少视频对象以及摄像机快速移动对渐变检测的影响,同时在突变转换的检测过程中引入二分折半查找方式,以提高检测效率。

另外,算法考虑了彩色视频序列和黑白视频序列同时存在于视频中的情况,提出了差异化阈值法,有效扩展了算法的适用性。

通过实验结果可以看出,算法虽然增加了视频跟踪这个计算量,但提升了突变检测以及渐变检测的覆盖率。

关键词:镜头边界检测,颜色特征,视频跟踪,突变转换,渐变转换ABSTRACTIn the multimedia age, video processing technology has developed to be an important research field of computer science. Video shot boundary detection is an important means to extract video structured information, and the accuracy of the shot boundary detection has a great effect on the follow-up video processing.Usually, shot boundary can be departed into two kinds: abrupt transition and gradual transition. The gradual transition generally refers to the phenomena of fading in, fading out, dissolving and sweeping. Compared with the abrupt transition, the gradual transition has a long duration and a slow change, so that the detection is more difficult. In addition, the video content is always influenced by a variety of external factors, such as noise, text inserts, mark inserts, etc., which increasing the difficulty for the shot boundary detection. The main goal of this thesis is to research and design the effective shot boundary detection algorithm to improve the detection performance of the abrupt transition and gradual transition, and to provide the technology for the analysis and processing of video images. The main research contents and contributions of this thesis include following two parts:(1) A video shot boundary detection algorithm is proposed based on fuzzy color distribution chart (FCDC). At first, the color feature of the video frame is extracted by fuzzy color distribution chart. Then, by analyzing the relationship between the different frames, we extract the abrupt transition and gradual transition. It can be seen from the experimental results that this method has a better performance compared with some existed methods.(2) A video tracking based shot boundary detection algorithm is proposed. Through the analysis of the above proposed algorithm and its experimental results, it is found that the algorithm can be further improved. Therefore, with the above proposed method, we propose an algorithm based on video tracking. The algorithm combines the image color feature with the video tracking to carry out the video shot boundary detection. The proposed algorithm can effectively reduce the influence of the video object and the rapid movement of the camera for the gradual detection. At the same time, the binary detection method is introduced to improve the efficiency of the shot boundary detection. In addition, we have considered the situation that there simultaneously exist the color video sequence and the gray video sequence in the video, and propose the differentiatedthreshold method, which effectively extends the applicability of the algorithm. According to the experimental results, we can see that although the algorithm increases the amount of video tracking, it improves the coverage rate of the detection.Key words: Shot boundary detection, Color feature, Video tracking, Abrupt transition, Gradual transition.目录中文摘要 (I)英文摘要 (II)1 绪论 (1)1.1 视频镜头边界检测的研究背景和意义 (1)1.2 视频镜头边界检测的国内外研究现状 (4)1.3 论文的主要贡献及内容结构 (5)2 图像视觉特征与模糊系统相关理论 (7)2.1 图像视觉特征简介 (7)2.1.1 颜色特征 (7)2.1.2 纹理特征 (11)2.1.3 空间关系特征 (13)2.2 模糊系统 (13)2.2.1 模糊集合与隶属函数 (13)2.2.2 模糊规则 (14)2.2.3模糊系统的分类 (15)2.3 本章小结 (17)3 基于模糊颜色分布图的镜头边界检测算法 (18)3.1 整体框架 (18)3.2 模糊颜色分布图 (19)3.3 突变检测 (22)3.3.1 基于FCDC的突变预检测 (22)3.3.2 基于SIFT的突变再检测 (23)3.4 渐变检测 (25)3.4.1 渐变帧检测 (25)3.4.2 渐变序列检测 (26)3.5 实验仿真与分析 (27)3.5.1 实验结果 (27)3.5.2 实验分析 (29)3.5.3 实验对比 (32)3.6 本章小结 (33)4 基于视频跟踪的镜头边界检测算法 (35)4.1 镜头边界检测算法 (35)4.1.1 整体框架 (35)4.1.2基于二分查找的突变检测 (36)4.1.3 基于视频跟踪的渐变检测 (37)4.1.4 图像颜色特征提取及相似度计算 (40)4.2 实验仿真与分析 (41)4.3 本章小结 (43)5 总结与展望 (44)5.1 总结 (44)5.2 展望 (44)致谢 (46)参考文献 (47)附录 (51)A 作者在攻读学位期间发表的论文目录 (51)1 绪论伴随着计算机技术的高速发展,各种多媒体资源的数量呈大幅度的增长,视频处理技术已经发展成为了计算机方向的一个重要研究领域。

基于特征提取的视频预处理方法

基于特征提取的视频预处理方法

基于特征提取的视频预处理方法基于特征提取的视频预处理方法,是指利用计算机视觉和图像处理技术对视频进行预处理,通过提取视频的特征信息,来实现对视频数据的分析和处理。

这一方法可以帮助我们从视频中获取有用的信息,如目标检测、行为识别、人脸识别等,为后续的视频分析和应用提供基础。

1. 帧差法:帧差法是一种基于像素变化的特征提取方法。

通过比较相邻帧之间的差异,可以提取出视频中的运动信息。

当两帧之间的差异超过设定的阈值时,就认为发生了运动。

该方法适用于目标跟踪、行为识别等应用。

2. 光流法:光流法是一种基于像素移动的特征提取方法。

通过计算相邻帧之间像素点的运动矢量,可以得到视频中的光流场。

光流法可以用于视频中目标的运动分析、人脸识别等任务。

3. 前景提取法:前景提取法是一种基于像素颜色或纹理的特征提取方法。

通过将视频的每一帧与背景模型进行比较,可以将前景物体从背景中提取出来。

前景提取法可以用于目标检测、行人跟踪等应用。

二、视频预处理的流程1. 视频采集与解码:首先需要将视频从摄像机、手机等设备中采集出来,并进行解码,将视频转化为数字化的视频帧序列。

2. 视频滤波处理:对视频帧序列进行滤波处理,消除视频中的噪声和伪影。

4. 视频分割与关键帧提取:将视频分割成不同的场景或镜头,然后提取每个场景或镜头中的关键帧作为代表。

5. 视频特征提取:对每个关键帧进行特征提取,包括颜色特征、纹理特征、形状特征、运动特征等。

6. 特征选择与降维:对提取的特征进行选择和降维处理,提高计算效率和模型的泛化能力。

7. 特征标准化:对选择的特征进行标准化处理,使其具有相同的尺度和分布。

8. 特征表示与存储:将标准化的特征表示成向量形式,并将其存储到数据库中,以便后续的视频检索和分析。

1. 视频监控:通过对视频进行预处理,可以实现对摄像头中的目标物体进行跟踪、识别和行为分析。

2. 视频检索:通过对视频进行特征提取和索引建立,可以实现对视频库中的目标视频进行快速检索。

一种基于特征跟踪的视频镜头检测算法

一种基于特征跟踪的视频镜头检测算法
渐变镜头检测由于镜头切换的多样性,并且相邻帧间的视觉内容变化较小,一直是镜头边缘检 测领域的难点。但是,由于渐变镜头通常都是用来强调视频序列语义内容的变化,因此对其进行精 确检测是极其重要的,使用最多的渐变变化是淡入淡出和溶解[15]。 图 2 分别描述了一个渐变过程中 AVESSDi 和 AVESSDc 值随帧序号的变换情况,当检测到
Abstract:
Partitioning a video sequence into shots is the first step toward video-content analysis and content-based video
browsing and retrieval. A novel video shot boundary detection algorithm was presented based on the feature tracking. First, the proposed algorithm extracts a set of corner-points as features from the first frame of a shot. Then, based on the Kalman filtering, the extracted features are tracked with window-matching method from the succeed frames. According to the characteristic pattern of pixels value changing within the tracked windows, the measure of shot boundary detection can be obtained to confirm the types of transition and the time interval of each gradual transition. The experimental results illustrate that the proposed algorithm is effective and robust with low computational complexity. key words: Shot boundary detection; Corner detection; Feature tracking

【计算机研究与发展】_智能计算机_期刊发文热词逐年推荐_20140727

【计算机研究与发展】_智能计算机_期刊发文热词逐年推荐_20140727

车流量 路径优化 路径一致算法 资源分配 谱聚类 谱图理论 说话人识别 语言模型 语言场 语义相似度计算 语义 web 语义 话题识别与跟踪 词性标注 论证 认识熵 认知物理 认知模型 认知协作 计算机病毒 计算机支持的协作学习(cscl) 计算复杂性 计算复杂度 触发对 角色分配 视频事件 视觉监控 规范化mas 补偿机制 融合算法 融合 蛋白质结构预测 虹膜识别 自适应 自动谈判 自动调优 自动机 脊波 能力描述 聚类算法 聚类有效性 联合对角化(jade) 群核 群体智能 网络预警 网络信息服务 网格 统计信息收集 统一模型 经验风险最小化 组合拍卖 线性eiv模型 纳米技术 约束优化
科研热词 多agent系统 agent 数据挖掘 描述逻辑 微粒群算法 遗传算法 语义web 计算机视觉 聚类 约束满足问题 移动agent 神经网络 电子商务 模糊熵 极大模糊熵原理 本体 智能体 多主体系统 多agent 协作 动态描述逻辑 人工智能 主体 web服务 鲁棒聚类算法 鲁棒估计 高级加密标准(aes) 频繁子树 领域本体表示与推理 音视频联合建模 韩国 非线性时变系统 隐马尔可夫模型 随机游走 随机前馈神经网络 问题回答 长期联盟 镜头边界检测后处理 镜头边界检测 镜头边界分类 速度向量 通信机制 适应度 退火 连续状态表示 进化计算 运动识别 辩论 软竞争 软件过程建模 软件过程协同 轨迹
53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106

采用多特征融合的镜头边界检测方法

采用多特征融合的镜头边界检测方法
t r s ol h e h d.
Ke r s fa u e f s n s o o n a e e t n s l o g n z d n t o k; V h so a y wo d : e tr u i ; h t b u d r d t ci ; ef r a i e r HS itg m o y o - e w r
E m i w j n@h t icm — al -i g o l o : a ma .
L U Qu ,I I n JANG W e 。 U Y . p o c fs o - o n a y d tc o a e n mut fa u e f s n C mp t n i e r g iW uAp r a h o h t b u d r e t n b s d o l -e t r u i . o ue E g ei ei i o r n n
C m u n em g ad A pi t n 计 算 机 工 程 与应 用 o p  ̄rE  ̄ne n n p l ai s c o
2 1 ,6 1 ) 0 04 (3
11 7
采用 多特 征融合 的镜 头边界检 测 方法
刘 群, 江 伟, 吴 渝
LU Q n J G We, u I u ,I AN iwu Y

要 : 出 了一种特征融合的镜 头边界检测方法 HV 有效的方法 , 该文融合 了视 频
帧的 HS V直方图特征 、 边缘特征和纹理特征 , 计算 出不连 续帧。最后 , 采用 K hn n网络 自组织 网络对 不连 续帧值进 行聚类得 到 oo e 镜头边界。 实验结果表明该方法不仅是 可行 和有效的 , 也解 决了需要 阈值 的问题。
关 键 词 : 征 融合 ; 头 边 界检 测 ; 特 镜 自组 织 网络 ; 色彩 直 方 图 D :03 7 /i n10 — 3 1 0 01 . 1 文 章 编 号 :0 2 8 3 (0 0 1— 1 1 0 文献 标识 码 : 中 图分 类 号 :P 7 OI 1.7 8 .s.0 2 8 3 . 1 . 0 js 2 35 10 — 3 1 2 1 )3 0 7 — 4 A T 3

基于Map Reduce的快速视频镜头边界检测算法

基于Map Reduce的快速视频镜头边界检测算法

基于Map Reduce的快速视频镜头边界检测算法郑慧君;陈俞强【摘要】镜头边界检测是视频索引、检索和分析的基础.视频数据量大,镜头边界检测中的高计算成本是实际应用的一个瓶颈.利用Map Reduce模型分布式的计算思想,首先将大量的视频数据处理作业拆分成若干个可独立运行的Map任务,进行视频的解码和特征提取,然后由若干个Reduce任务对特征值进行检测获得最后镜头边界集合.在镜头特征提取时把视频分成31帧的小片段,利用带权值的分块的直方图计算视频片段的首尾帧间差,通过自适应阈值筛选出非镜头切换片段和候选镜头切换片段,对候选镜头切换片段再做进一步检测,提出非相邻帧二次帧差法对渐变镜头进行检测.实验结果表明,利用Map Reduce模型和改进的镜头算法在加速镜头边界检测的同时,还可以取得较好的检测精度.%Shot boundary detection is the foundation of video indexing, retrieval and analysis. However, the huge amount of data and the high computational cost in shot detection becomes a bottleneck in the practical application. Using the distributed computing of Map Reduce model, a large number of video data processing operations is splinted into several independent Map tasks for video decoding and feature extraction. Then the feature value is detected by several Reduce tasks to get the final shot boundary set. When extracting the features, the video is divided into 31 frames segment, using the histogram of block with weight to calculate the difference between first frame and last frame of the video segment. Through the adaptive threshold filtering out the non-boundary segments and the candidate segments, the further detection has been done for the candidate segments.The twice frame difference method of non-neighboring frame is proposed for the gradual shot detecting. Experimental results show that the Map Reduce model and the improved shot detection algorithm is effective in accelerating the shot detection process, and it can also achieve better detection accuracy.【期刊名称】《图学学报》【年(卷),期】2017(038)001【总页数】6页(P76-81)【关键词】镜头边界检测;MapReduce;直方图【作者】郑慧君;陈俞强【作者单位】东莞职业技术学院,广东东莞 523808;东莞职业技术学院,广东东莞523808;广东工业大学计算机学院,广东广州 510006【正文语种】中文【中图分类】TP391.4多媒体技术、移动互联网的飞速发展,导致视频资源呈爆发式增长。

预处理特征型边界条件及其回流处理技术

预处理特征型边界条件及其回流处理技术

预处理特征型边界条件及其回流处理技术预处理特征型边界条件及其回流处理技术:通过特征型预处理Euler方程推导出预处理特征型的边界条件处理方法,并发展了预处理的回流处理技术,增强计算的鲁棒性和精度。

通过特征型预处理Euler方程的特征关系得到边界条件处理方法;在亚声速逑入口和出口边界,根据其特征方程确定回流边界处理方法。

通过数值模拟发现;带回流的特征型边界处理方法比Turkel方法收敛快1.5倍以上,而计算精度与SIMPLE方法相当;在出口带有回流的计算中,其压力误差比Fluent降低68.3%。

由此可知带有回流处理的特征型边界处理方法具有较高的鲁棒性和精度,在实际的工程计算中有一定的应用价值。

一种自动选取阈值的视频镜头边界检测算法

一种自动选取阈值的视频镜头边界检测算法

一种自动选取阈值的视频镜头边界检测算法
成勇;须德
【期刊名称】《电子学报》
【年(卷),期】2004(32)3
【摘要】镜头边界检测是实现基于内容的视频检索的一个重要步骤.文中介绍了现有的镜头边界检测的基本方法,并针对其不足提出了一种自动选取阈值的、综合考虑颜色和空间特征的镜头边界检测算法.该方法能较好地检测出镜头突变和物体运动以及光线变化等情况,对渐变镜头也能达到检测的目的.实验结果表明算法能够有效地检测出视频镜头边界.
【总页数】4页(P508-511)
【作者】成勇;须德
【作者单位】北京交通大学计算机与信息技术学院,北京,100044;北京交通大学计算机与信息技术学院,北京,100044
【正文语种】中文
【中图分类】TP391
【相关文献】
1.一种基于非监督聚类的视频镜头边界检测算法 [J], 陈静;刘洋
2.基于包含度理论的双阈值视频镜头边界检测算法 [J], 陈旭;柳伟
3.一种MPEG压缩视频的镜头边界检测算法 [J], 万伟;张国平;陈明宏;夏洪星
4.一种基于神经网络的视频镜头边界检测算法 [J], 许剑峰;黎绍发
5.一种基于双阈值法改进的镜头边界检测算法 [J], 李松斌;李军;王玲芳;王劲林
因版权原因,仅展示原文概要,查看原文内容请购买。

边界处理 算法

边界处理 算法

边界处理算法
边界处理算法是指在图形处理、计算机视觉等领域中对图像或物体边界进行处理和识别的算法。

其核心是对像素或点集进行处理和分类,确定边界的位置和形态。

在图形处理中,边界处理算法常用于图形分割、边缘检测、形状匹配等任务中。

常见的边界处理算法包括基于梯度的边缘检测算法、Canny算法、轮廓跟踪算法等。

在计算机视觉中,边界处理算法可以用于目标检测、形态分析等任务中。

例如,基于形态学的边界处理算法可以用于识别物体的几何形状,基于直线检测的边界处理算法可以用于检测图像中的直线或边缘。

总之,边界处理算法在图形处理、计算机视觉等领域中具有广泛的应用,不同的算法可以根据具体的任务和需求进行选择和优化。

- 1 -。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

镜头是视频分析和检索的基础, 为了有效检测镜头边界, 并对镜头边界进行分类, 提出一种新的镜头边界描述子: 镜头边界流形视频流可以看做一个高维空间, 镜头边界流形是隐含在该空间中的局部结构, 它能够有效区分镜头边界和非镜头边界, 以及区分不同类型的镜头边界采用这种特征, 提出一种后处理算法, 一方面去除预检测镜头边界的虚警, 另一方面将真正的镜头边界分类实验结果证实了镜头边界流行的有效性以及后处理算法的优异性能关键词镜头边界检测; 镜头边界检测后处理; 镜头边界分类; 拉普拉斯特征映射中图法分类号TP181; T P37随着多媒体技术的发展, 对海量的视频数据进行索引和检索已成为一个重要的研究课题视频通常是无结构的流, 为了方便对视频内容进行分析处理, Rui 等人[ 1] 提出将视频流按内容进行层次划分,从高层到低层分别为视频( video ) 、场景( scene) 、镜头组( group) 、镜头( shot ) 和关键帧( key frame) 镜头是指摄像机从打开到关闭的过程中记录下来的一组连续的帧图像, 它是组成视频的基本物理单位, 视频索引和检索就建立在镜头边界检测的基础上由于视频后期剪辑制作不同, 镜头边界大致分为两类: 切变( cut ) 和渐变( gradual) 渐变镜头边界又分很多种, 主要包括淡入淡出( fade in out ) 、溶解( dissolve) 和擦变( w ipe) 镜头边界的类型能提供更多高层语义, 比如, 一段排球比赛中, 直播镜头与回放镜头之间的切换常常使用擦变检索回放镜头时可以在擦变镜头中寻找, 大大缩小了检索范围因此, 镜头边界分类对于视频分析与检索有重要价值文献[ 23] 对多种镜头边界检测算法进行了比较以往检测算法的要点包括两个方面: 一是特征( feature)及度量( met ric) ; 二是针对度量的决策算法特征用来刻画视频流中每一帧的视觉内容特性, 可以是颜色[ 4] 、边缘[ 5] 或者压缩域上的参数[ 6]; 度量用来刻画视频流中帧与帧之间的特征变化, 文献[ 7]对多种度量进行介绍并比较了它们的性能决策算法的任务则是根据度量采取一定策略和算法检测出镜头边界在现有的镜头边界检测算法中, 采用的特征有像素值( 灰度值或颜色值) 、直方图以及MPEG 压缩域上的参数衡量帧间差异最简单的度量方法是计算两帧基于像素点的距离, 但该方法对运动敏感, 容易造成误检直方图描述的是图像的全局信息, 一定程度上可以减小运动对检测的影响由于目前多数视频采用MPEG 压缩标准, 直接在压缩域上提取特征可以提高检测速度, 常用的压缩域特征包括DC图[ 8] 、运动向量、预测宏块数、宏块的类型信息[ 6] 等现有的针对度量的决策算法包括全局阈值法、自适应阈值法、双阈值比较法[ 9] 、基于统计的决策算法全局阈值法对整段视频序列采用一个全局阈值, 这种方法最简单直接, 但鲁棒性差, 对于不同类型的视频片段或同类型视频的不同时间片段需要设置不同的阈值自适应阈值法利用一个滑动窗口, 统计该窗口内视频的局部特性, 根据统计特性设定动态阈值以上两种方法适用于检测突变镜头, 不能对渐变镜头进行准确定位文献[ 9] 提出的双阈值比较法能够检测出渐变镜头的起始和终止位置, 但不能区分缓变镜头边界的具体类型本文把视频看做图像在时间轴上展开的一个高维空间, 空间中的各点在时间轴上是局部相关的镜头发生切换时, 高维空间的点呈现特有分布, 这种相关性分布可以看做一个低维的流形嵌入在高维空间中我们采用流形学习的方法[ 10] 把它提取出来刻画不同类型的镜头边界, 以这种特征为基础, 提出一种基于学习的镜头边界检测后处理方法1 镜头边界类型分析镜头边界的编辑效果有很多种, 主要包括切变和渐变, 渐变镜头边界又可以分为溶解、淡入淡出和擦变以下给出它们的数学模型公式中, S( x , y ,t ) 表示镜头发生切换时镜头边界的各帧, 表示镜头边界的类型, S 1( x , y , t ) 和S 2 ( x , y , t ) 分别表示切换前的镜头和切换后的镜头1) 切变: 两_L___謃个镜头直接拼接在一起, 对于边界处两帧, 所有像素值发生突然变化S cut( x , y , t ) =S 1( x , y , t ) , t ! t 1,S 2( x , y , t ) , t > t 12) 溶解: 镜头S 1 逐渐变弱, 镜头S 2 逐渐变强, 两个镜头交叠在一起直至变换结束S dissolve( x , y , t ) = S 1( x , y ) (t - t 1T) +S 2( x , y ) (t 2 - tT) ,式中, t 1 和t 2 分别表示溶解变换开始和结束的时间, T 表示镜头变换持续的时间3) 淡入淡出: 淡入是镜头从无到有的过程, 淡出反之S fadein( x , y , t ) = S ( x , y ) (t - t 1T) ,S fadeout( x , y , t ) = S ( x , y ) (t 2 - tT) ,式中, t 1 表示淡入开始的时间, t 2 表示淡出结束的时间, T 表示淡入淡出持续的时间4) 擦变: 镜头S 2 按某个方向将镜头S 1 逐渐擦除处于变换过程中的某帧图像从空间上来看, 一部分属于镜头S 1, 一部分属于镜头S 2S wipe( x , y , t ) = S 1( x , y ) f ( x , y , t ) + S 2( x , y ) [ 1 - f ( x , y , t ) ]擦变有多种类型, 包括横向、竖向、对角线、圆形擦变等, 因而引入函数f ( x , y , t ) 来表示擦变规则, 函数的取值为0 或者1由以上分析, 各种镜头边界的视觉特征明显不同, 第2 节提出的方法能将这种特征有效提取出来2 镜头边界流形学习本节给出镜头边界流形提取的详细算法视频流可以看做一个高维欧氏空间Rf N + 1, N 为每帧的像素个数, 另外一维是时间视频中的每帧可以看做Rf N + 1空间中的一点, 这些点有着局部相关性在空间Rf N + 1中, 不同类型镜头边界中的各帧对应的高维空间点有着不同的局部相关性我们采用流形学习的方法把这种嵌入在空间RfN + 1 中的局部结构提取出来, 以描述不同的镜头边界首先给出流形学习的定义[ 11] :定义1流形学习令Y 是包含在Rf d 欧氏空间的d 维域, 令f : Y ∀Rf d 为一光滑嵌入, 其中N > d数据点{ yi } Y 由某个随机过程生成, 经f 映射形成观测空间的数据{ x i = f ( y i ) } Rfd一般称Y 为隐空间, { y i } 为隐数据流形学习的目标是要从观测数据{ x i } 中重构f 和{ yi }我们采用拉普拉斯特征映射的流形学习方法来发现和重构隐藏在空间Rf N + 1 中的边界流形拉普1994 计算机研究与发展2006, 43( 11)拉斯特征映射是基于局部保序思想来获得高维观测空间与低维结构的在局部意义下的对应[ 11] 文献[ 10] 的实验表明, 拉普拉斯特征映射所得到的流形有很好的聚类和分类效果, 这一点正符合本文镜头后处理算法的需要以下给出具体的镜头边界流形的学习算法:1) 抽取局部点集视频流有时间相关性, 因此首先抽取时间轴上临近的N 帧设k 是候选镜头边界上某一帧的帧号, 以k 为中心取一个大小为N 的窗口, 即在k 帧前取( N - 1) 2 帧, k 帧后取( N - 1) 2 帧将窗口中的每一帧作为一个节点, 构造加权的帧间关系图2) 构造帧间关系图对于Step1 中抽取的点集{ X 1, #, X N } , 如果X i 和X j 相关性高, 就将节点i 和j 之间加一条边加边的方式有两种: ∃邻接法[ 参数% R ] , 如果&X i- Xj &2< , 则将节点i 和j 之间用边连接起来; ∋n 近邻法[ 参数n % N ] , 如果i 是j 的n 个最近邻点之一, 或者j 是i 的n 个最近邻点之一, 则把节点i 和j 连接起来我们采取的方法是将窗口中的点两两连线, 因为它们在时间轴上相邻, 具有较高的相关性3) 选取权值帧间关系图中, 边的权值选取方法有两种: ∃热核法[ 参数t % R ] , 如果节点i 和j 是相连的, 则将它们的边的权值设置为Wij = e& Xi- Xj &2t ; ∋简单方法[ 没有参数] , 只要节点i 和j 相连, 就置权值Wij = 1, 我们采用的是热核权重4) 特征映射对于构造好的帧间关系图G , 根据边的权重得到它的邻接矩阵W, 由W 计算对角矩阵D,Dii= ( jWj i , 然后得到拉普拉斯矩阵: L = D -W, 拉普拉斯矩阵L 是一个对称、半正定矩阵, 它可以被看做一个定义在图G 节点上的操作函数计算下式的广义特征值和特征向量:Lf = Df ( 1)设y0, #, y k- 1 是式( 1) 的特征向量, 按对应特征值从小到大排列, 可以证明, y0 对应的特征值为0, 向量y 0 的每个元素都为1我们取一维向量y 1作为镜头边界的流形结构经过拉普拉斯特征映射之后得到的特征具有很好的区分特性图1 给出了4 种类型镜头边界以及非镜头边界的帧间关系图和镜头边界流形图1( a)表示帧间关系图, 示例图中所取窗口大小为N =11, 颜色越浅表明相似度越高; 图1( b) 表示将图1( a) 的帧间关系图做拉普拉斯特征映射之后的流形结构可以看出, 不同类型的镜头边界以及非镜头边界, 它们的帧间关系图具有不同的特征, 拉普拉斯特征映射之后的镜头边界流形是一维向量, 维数更低, 却能更好地区分不同的镜头边界第4 节的实验结果证明了镜头边界流形的有效性Fig1Featur es for four shot boundar y ty pes and non boundary( a) Inter fr ame graph and ( b) Shot boundary manifold图1四种类型镜头边界以及非镜头边界的特征图( a) 帧间关系图; ( b) 镜头边界流形3 基于流形特征的后处理算法第2 节提出的镜头边界流形有很好的区分特性, 我们在此基础上提出一种镜头边界检测后处理算法首先, 进行镜头边界预检测, 得到候选的镜头边界位置; 然后提取候选镜头边界的流形; 最后, 把镜头边界流形送入分类器进行分类, 分为非镜头王贝等: 基于流形特征的镜头边界检测后处理算法1995边界和镜头边界, 同时得到镜头边界的类型系统流程图如下:Fig 2 The flow chart of shot boundary post refinement algor ithm图2 镜头边界后处理算法流程图在图2 中, 上面的虚线框表示训练模块, 下面的虚线框表示测试模块, 以下详细介绍:3 1 训练模块为了充分训练分类器, 训练模块采用大量训练样本镜头内部存在着由多种原因造成的视觉内容变化, 包括闪光灯、物体运动和相机运动, 这些很容易造成检测算法的误检, 普通的阈值算法很难完全解决运动所带来的问题而在我们的后处理算法中, 只要保证非镜头边界样本中包括容易造成误检的种种情况, 就能够大幅度提高镜头边界检测的准确率训练模块采用第2 节提出的方法对样本提取边界流形3 2 边界预检测及后处理模块1) 镜头边界预检测预检测可以采用任何已有的镜头检测算法预检测步骤的关键在于必须保证检测结果的高查全率, 因此需要将算法中的阈值设置较低这一步中检测的镜头边界虚警率很高, 但可以通过后继步骤消除虚警本文采用的是文献[ 9] 中提出的双阈值比较法算法中有两个阈值T c 和T g , T g 小于T c, T c 用于检测切变镜头和渐变镜头的结束, T g 用于检测渐变镜头的开始检测算法采用的特征是HSV颜色直方图, H, S, V 三个方向各有12, 4, 4 个槽, 直方图总维数为12 ) 4 ) 4= 192这一步中的检测是在DC 图上进行的, 使用DC 图的好处有以下两点:∃DC 图可以直接由压缩域的参数计算得到, 不需要完全解码, 提取速度快; ∋DC 图由压缩域得到,其大小是原始图像的164, 部分消除了物体运动和相机运动的干扰2) 合并过短镜头步骤1) 中, 由于阈值设置较低, 会出现大量短镜头, 我们计算超短镜头( < 10 帧) 与它前一镜头或后一镜头的相似度, 选择相似度较高的一个, 将短镜头与它合并计算镜头相似度时, 采用的特征是HSV 直方图这一步骤使得候选镜头边界的数量减少, 消除了部分明显不可能的候选边界, 减小了步骤3) 的计算量, 有利于提高后处理的准确率3) 提取候选镜头边界的流形采用第2 节介绍的方法提取候选镜头边界流形构造帧间关系图时所取的窗口长度为11, 帧间关系图中边的权重采用热核权重3 3 分类器将训练模块和检测模块提取的结果分别送入分类器进行训练和检测, 分类器将候选镜头边界分为两大类: 镜头边界和非镜头边界非镜头边界被作为虚警丢弃掉, 从而提高了镜头检测的准确率同时镜头边界又可以进一步分为切变、溶解、擦变和淡入淡出4 种类型现有的分类器都可以采用, 我们采用k 近邻( kNN) 分类器, 实验证明它性能好并且计算简单[ 12]4 实验与分析为验证镜头边界流形和后处理算法的有效性,我们在大量视频数据上进行实验实验数据总共25段170571 帧、963 个镜头这些数据具有很大挑战性, 视频内容多样, 涵盖了新闻、体育、科普、广告、教学等多类电视节目; 另外, 这些视频数据中的镜头边界类型也非常多样实验中非镜头边界样本共有300 个, 它们取自预检测之后的虚警边界我们将训练样本之外的视频作为测试数据我们采用了两种常用的性能评价标准∃查全率( recall) : Recal l=N cN c+ N m,∋准确率( precision) : Precision =N cN c+ N f,其中, N c 表示正确检测到的镜头边界数; N m 表示漏检的镜头边界数; N f 表示误检的边界数表1 给出了测试数据信息:Table 1Summary of Training and Testing Video Sets表1训练与测试数据统计Video Number of FramesNumber of Shot BoundariesCuts Dissolves Wipes FadesT raining 128049 323 276 43 62Test ing 42522 175 52 5 324 1 镜头边界检测后处理结果为了验证后处理算法能否有效地去除虚警, 我们统计了测试视频在预检测之后以及后处理之后所1996 计算机研究与发展2006, 43( 11)∃有类型镜头边界总的查全率和准确率,给出:Table 2Refinement Perf ormance of Shot Boundary Detection 预检测之后的查全率很高, 准确率很低通过后处理算法, 多数虚警镜头边界被去除,但查全率有所降低总体来看, 查全率平均下降2%, 准确率平均上升28%牺牲较小的查全率换取准确率的大幅提高, 这表明边界流形能够区分镜头边界与非镜头边界, 预检测边界的后处理是有效的对实验数据的观察表明, 被去除的虚警主要包括以下4 种类型: ∃闪光灯和光照影响; ∋字幕的出现或者消失; ∗物体运动, 比如在运动视频足球中, 场上球员的跑动容易导致预检测算法的误检; +遮挡,视频拍摄过程中忽然有人从镜头前晃过, 使得镜头内连续几帧视觉内容与其他帧完全不同4 2 镜头边界分类结果表3 给出了镜头边界分类的结果Table 3 Performance of Shot Boundary Classification 表3镜头边界分类结果Shot Boundary T ypes Recall PrecisionCut 098 095Dissolve 081 072Wipe 060 075Fade 095 071由表3 可知, 切变镜头的查全率和准确率很高,渐变镜头的检测效果稍差, 但3 种不同类型的渐变边界能得到较好地区分对实验数据的跟踪观察表明, 镜头边界流形能够很好地区分切变镜头边界和闪光灯, 较好地抵抗光照的影响4 3 性能比较由于目前的镜头检测算法多数对不同类型的镜头采用不同的检测算法, 没有算法能够在一次处理中同时进行镜头边界检测和镜头边界分类, 无法与本文算法进行比较, 所以我们采用了Lienhart 的MoCA Project 中专门针对切变和淡入淡出检测的两个程序∃, 在同样的视频数据上进行检测, 采用的参数和阈值是程序的默认值结果在表4 中给出Table 4 Performance Comparison with MoCA Project 表4 与MoCA 系统的性能比较Shot Boundary T ypeMoCA Our MethodRecal l Pr eci si on Recall PrecisionCut 083 064 098 095Fade 081 082 095 071由表4 可知, MoCA 对切变镜头的检测效果比本文算法稍差, MoCA 对淡入淡出镜头边界检测的查全率和准确率的均衡性好过本文算法, 但MoCA只能专门针对切变或者淡入淡出镜头边界进行检测, 不能同时检测到多种镜头边界。

相关文档
最新文档