视频镜头边界检测研究

合集下载

一种基于PSO分类器的镜头边界检测算法

一种基于PSO分类器的镜头边界检测算法
动50100150200250300350400450500550600650jiii20015010050a一段视频的灰度直方图差异曲线图切变切变切变50100150200250300350400450500550600650一段视频的灰度直方图差异曲线与u分量直方图差异曲线的对比248计算机研究与发展200744增刊图1a与b中的两条曲线图在400450帧存在很大差异该段视频中图像的大部分内容是一架飞行中的飞机灰度直方图差异曲线对这个运动非常敏感而分量直方图差异曲线在此区间的变化并不明显
l r a go ithm in this PaPer . ExPeriment al results show that the Perfo ma ce of this algo ithm is c para le r n r m o b
with the existing sh t boundary detection algorithms ’ o .
图会发生较大变化. 直方图法的缺点是有时会漏掉 镜头变换 , 因为两副图像可能有完全不同的结构, 但 其直方图却很接近. 基于块 的方法是针对直方图法 容易漏检这一缺陷提出的, 但是它对镜头内的局部
收稿日期:2007一 05 03一
头分割是整个视频 内容分析 的基础 , 只有首先把视
频序列分解成为镜头才能有效地进行关键帧提取、 视频缩略、 视频序列辨识等工作. 因此, 迄今为止, 镜头边界检测在整个视频分析领域中是研究历史最
墓金项目: 国家自然科学基金项目(60573 82 ; 教育部博士点基金项目(20 6 18 o42 1 ) 0 0 3 )
(吉林大学计算机科学与技术学院 长春 130012 ) ( 符号计算与知识工程教育部重点实验室 长春 13 012 0 ) ( myu jlu@126 .com) -

一种新的镜头边界检测和静态视频摘要提取方法

一种新的镜头边界检测和静态视频摘要提取方法

a s r c x r c i n f r v d o fo b t a te t a t o i e w o l
B nk i uQig a HuA q n iu
( c ol f nomao c neadE g er g S uhat iesy aj g20 9 ,C ia S ho fr t nSi c n n i e n , o tesUnvr t,N ni 10 6 hn ) oI i e n i i n
关键 词 :视 频摘 要 ; 意力模 型 ; 头边 界检测 ; 注 镜 代表 帧 ; 参考 帧
中图分类 号 : N 4 . T 9 11 文献标 识码 : A 文章编 号 :10 0 0 (0 7 0 -5 90 0 1— 5 5 2 0 )40 5 -6
No e p r a h o h t b u d r e e to n t t i e v la p o c fs o o n a y d t c i n a d sa i v d o c
V0 . N O 4 137 . J l 2 0 uy 0 7

种 新 的镜 头 边界 检 测 和 静态 视 频 摘 要提 取 方 法
I庆 凯 、 胡 爱群
( 东南大学信息科学与工程学院 , 南京 20 9 ) 10 6
摘 要 :提 出一种新 的 融合 图像分 割和 注 意力模 型 的静 态视 频 摘 要 自动 生 成方 法. 方法 将视 频 该
a t maia l d s tbo n a is r e d tce u o tc ly a ho u d re a ee td. Fi al h e n n y,t ma c i g difr n e f e e y h t i l th n fe e c o v r s o s

视频镜头边界检测整体方案的设计与实现

视频镜头边界检测整体方案的设计与实现
2Istt o o p t gT c nl y C ieeA a e yo c ne ,e ig 10 8 ,hn . tue fC m ui eh o g 。hns cd m fS i csB in 0 0 0 C ia ni n o e j E m i: un 80 m icr - al h ag 1@g a . n j lo H NG Jn , ANG X a j n, HE G o s n a d i l nain f g nr ls o o n ay d tc o ce . UA ig HU io-i C N a . i n mpe a De g me tt o e ea h t b u d r eet n shme o i
d t ci g s h me o u r n i o n g a u l r n i o b s d o r c si g o ma e s q e c s ah r t a t e e o e e e tn c e fr c t ta st n a d r d a a st n a e n p o e sn f DC i g e u n e rt e h n h d c d d i t i
Co u r En ie rn n piain ,0 7, 3 2 :0 — 0 . mp t gn e ig a d Ap l to s 2 0 4 ( 3) 2 5 2 7 e c
Ab t a t DC i g s q e c s a e x r ce f m sr c : ma e e u n e c n b e ta td r o MP c d d t a EG o e s e m w t o t f l e o i g a d a e o u t a a n t n ie r i u u l d c d n n r r b s g i s o s h y a d s l mo in i f e c s w e o u i g f au e d f r n e ew e a sS n t i p p r we d sg n e e o e e a n mal t nl n e h n c mp t e t r i e e c s b t e n f me .o i h s a e , e i n a d d v lp a g n rl o u n f l

几种常用镜头边界检测技术介绍

几种常用镜头边界检测技术介绍

几种常用镜头边界检测技术介绍随着数字媒体技术和网络技术的发展与普及,使数字视频广泛进入到人们日常生活的各种领域。

如何从海量的多媒体视频中浏览检索出自己感兴趣的内容,已经成急待解决的问题。

这使得基于内容的视频检索技术成为多媒体科学领域的研究热点。

镜头作为组成视频的基本语义单元,其边界的划分检测是进行视频分段、组织、检索的基础,镜头边界划分的好坏将直接影响到基于内容的视频检索的效率。

本文将研究介绍几种典型的镜头边界检测技术。

渐变:渐变又叫光学切割,指一个镜头渐渐变化到另一个镜头,中间常会穿插十几或几十帧的过渡视频帧的一种镜头变化方式。

镜头边界检测就是要对不同的视频采用合理有效的镜头检测方式,将镜头从视频文件中划分提取出来,为视频检测的后续工作做好基础的准备。

目前,典型的镜头边界检测方法主要有以下几种:(1)像素比较法在镜头边界检测算法中像素比较法是最简单的一种检测帧间距离的算法。

算法的核心思想是:计算两相邻图像帧之间对应位置上的灰度值之差是否大于一个提前设定好的门限值,如果大于这一门限值,就认为该位置上的像素发生了变化,统计两相邻图像帧之间所有发生变化的像素点,根据发生变化的像素点占总像素点的比例来确定镜头是否发生变换。

像素比较法可以用以下的公式表示:其中x, y表示该像素点在图像帧中的位置, d (x, y)表示该像素点是否发生变化,表示相邻两图像帧之间像素值之差的绝对值,表示提前设定好的门限值,若,则对应位置像素点发生变化,用 1 表示,若,则对应位置像素点未发生变化,用0 表示。

其中,X, Y代表以像素点为单位的图像帧的高度与宽度,D (X,Y)代表两图像帧之间所有发生变化的像素点数量占总像素点数量的比值。

像素比较法的优点是算法实现起来比较简便易行, 它的不足之处是没有考虑到噪声的影响, 对摄像机的运动与镜头内物体的运动都比较的敏感。

因此, 一种改进的方法是在对像素点比较之前,先用均值滤波器对待检测图像帧进行平滑滤波处理, 去掉部分噪声,从而降低物体运动对检测结果的影响。

一种视频镜头边界检索方法及其应用

一种视频镜头边界检索方法及其应用

一种视频镜头边界检索方法及其应用摘要:提出了一个基于关键区域色彩矩阵的视频镜头检测方法,详细地描述了这种方法的原理,并比较了该方法与其它方法的优缺点,最后阐释了该方法在视频内容检索系统中的运行策略。

关键词:关键区域;色彩矩阵;镜头边界检测;视频检索1研究背景随着信息传播工具的迅速发展,视频已经渐渐取代文本、图像成为人们日常生活中获取信息的一个主要途径。

由于视频信息数据量大、分辨率不统一、编码多种多样等特点,制约着基于视频内容检索的发展。

因此,如何提高视频内容检测的准确度与效率,成为视频内容检索关注的问题。

为了对视频内容进行有效的组织,需要将视频分解为一个个基本单元,而一般认为视频的基本物理单元是镜头,一个镜头由一组摄像机连续拍摄得到的时间上连续的若干帧图像组成。

镜头的自动分割是视频结构化的基础,也是视频分析和视频检索过程中的首要任务,镜头分割的好坏将直接影响到更高一级的视频结构化以及后续视频检索的效果。

2传统的镜头边界检测方法及其优缺点传统镜头分割的主要思想为依据两帧图像的特征值的差值与给定阈值进行比较,如果差值大于给定的阈值,说明两帧的特征变化较大,判定两帧为不同的主题。

在此两帧之间进行镜头分割;如果差值小于给定的阈值,则说明两帧的特征变化较小,判定两帧为同一主题,继续进行下两帧的比较。

这种方法用公式表示为:D(In,In+m)>T(1)(1)式中:In表示视频片段中第n个帧的内容,In+m表示视频第n+m个帧的内容。

T为划定镜头边界的阈值,T一般根据实验经验来确定。

计算两帧差异D的方法可以分为两类:一类是基于图像的色彩特征计算帧间差异的方法;另一类是利用图像的形态信息计算帧间差异的方法。

基于形态特征的方法原理是首先计算出第n帧和第n+m帧的形态特征,如边缘特征、角点特征、纹理特征等,然后比较两帧在形态特征上的差异。

该方法需要计算图像形态特征,时间复杂度较高,并且对画面的分辨率比较敏感,因此目前该方法应用较少,处于发展阶段。

基于运动矢量的MPEG视频镜头边界检测

基于运动矢量的MPEG视频镜头边界检测
方 图 绝 对 差 , 后 用 模 糊 逻 辑 对 上 述 三 个特 征 进 行 综 合 , 理 得 出 突变 、 变镜 头 和 非 镜 头 , 最 推 渐 实现 镜 头 的检 测 。 由 于不
需要 对视 频完全解压 , 直接从 M E P G压缩码流 中提 取信息 , 以计算复 杂度 低 , 取速度较 快。最后 通过 实验验证 了 所 提
F n l h h rce siso r e s o t fau e , x r i tn i au ,e e cs n e s y df r n e a d t e dr cin o t n ia y t ec a a tr t ft e p r e tr s e ecs i e s y v le x r i i tn i i ee c h i t fmoi l i c h s en t e t f n e o o v co itga .a sl t i ee c ee c lu ae .F zy ifrn e w s it d c d t y te ie t ee tr e c aa trs c n e trh s r o m b oue df rn e w r ac ltd f u z ne e c a n r u e o s nh sz h s h e h ce t s a d o r i i ca s e h t t r p— h g . rd a—h g n o c a g n s 1 1 EG vd o s o o n a yd tcin meh d d o e d l i d s os o a u t a e g a u c a e a d n h e o e . 1 MP ie h t u d r ee t to o n t e s f i b cn l n n e b o n t e o r s h ie u l. n xrcs ifr t n dr cl f m E c mp e s d bt s e , O i i o O o u ain o d c mp e s te vd o f y a d e t t n omai i t r l a o e y o MP G o r se i t a S t S f lW c mp tt rm o c mp e i d hg xrt n s e d w ih i v r e y te e p r n a rs t. o lxt a ih e tai p e , hc e f d b h x i yn o s i i e me tl eu s l

结合变步长的两阶段视频镜头边界检测方法

结合变步长的两阶段视频镜头边界检测方法
维普资讯
第2 8卷第 6期
20 0 8年 6月
文 章编 号 : (0 8 0 0 5 1 0
计 算机 应 用
Co mpu e p ia in trAp lc to s
Vo . 1 28 No. 6
方便 、 快捷并准确地 检索到所需 信息成 了一个 问题 。基 于 内 容 的视频检索技术和视频语 义分析的研究为解决此问题应运 而生。镜 头分割作 为视频检 索和视频语 义分 析的第一 步 , 是 随后 的高层内容分析 、 类 、 分 索引和查 询等 的基础 , 其准确性
直 接 影 响 到 视 频 检 索 和 视 频语 义 分 析 的 效 果 。 镜头的切换主要有两大类 : 变 ( 变) 渐变。切变是 切 突 和
(colfC m ue Si c,C ogig U i rt,C og i 00 4 hn ) Sho o o p t c ne hn q nv sy h nqn 40 4 ,C i r e n ei g a
Absr c : Hitg a a p o c fe la s t a as tcins a d m isng dee t ns i s o u d r ee to , ta t so rm p r a h ot n e d o m ny fle dee t o n s i t ci n h tbo n a y d tc in o wh l d e f au e ba e p o h s fe s h g o ie e g e t r — s d a prac u fr ih c mpua in c s. An i p o e ee to pp o c h tt o dv ntg ft tto o t m r v d d tci n a r a h ta o k a a a e o he t pp o c swa o o e wo a r a he s pr p s d, n mey, frtt e s tb n a s ee td sn it ga , a d he b s d o p e i u a l is h ho ou d r wa d tc e u i g h so r ms y n t n a e n r vo s

一种快速的自适应镜头边界检测方法

一种快速的自适应镜头边界检测方法

颜 色是 视频帧图像 内容最 基本的元素 , 也是帧 图像最直观
的特征 。从非压缩域视频 中直接提取 的视频 帧为 R B颜 色 图 G
像, 因此本文利用从视 频帧 的 R B颜 色图像 中提取 亮度作 为 G 特 征来 检测 视频 边界。亮 度由下式 描述 :
L=0. R +0 5 3 . 9G +0 1 B .1
离来检测镜头 。
1 1 跳 帧 法 .
的提高, 从网络上下载 、 点播视频 内容将受到更多人的青睐。因此 阻止不健康内容视频在网络上 的传播将成为净化互联 网的一项重 要任务 。目前 , 应用 的监督 方法 主要 是敏 感关 键字 的检索 。该 方法 的有效性完全依 赖于视频所 附加 的文字是 否准确而全 面 ,
U i r t, uh n ea 6 0 0 hn ) n esy X ca gH n n4 10 ,C ia v i
Ab ta t T e u e a u t f i e aa p o e sn n mp o ed t ci n e ce c t i p p rp o o e a i t o r s r c : o rd c mo n d o d t r c s i ga d i r v ee t f in y, s a e r p s d ar p d me h d f ov o i h o a a t e s o o n a y d t cin T e meh d e t c e e i e r me e u n e r m rgn lvd o f me s q e c s b d p i h tb u d r ee t . h t o x r t d a n w vd o fa ss q e c sfo o i i a i e a e u n e y v o a l l me s i pn t o . o h h t u d r d t ci u e i n e v l e ewe n b i t e s df r n e n i v r g fa —k p i g meh d F rt e s o o n a ee t n, s d d sa c au sb t e r h n s — i e e c s a d t era e a e b y o t g f h a ee t d fa u e e mo ig wid w. h x e i n a e u t s o a e p o o e t o a r v ee t n ef s d tc e e t r si t vn n o T e e p r n h me tl s l h w t t h r p s d meh d c n i o e d tci f — r s h t mp o i

基于动态学习的视频镜头边界检测阈值设定算法

基于动态学习的视频镜头边界检测阈值设定算法

C e S n T n g Ja gXig a F n hxn h n Xi u a  ̄n in n h o a g Z ii
( colfI om t nScryE gne n Sa g a atn n esyS a g a 0 2 0 C ia Sho o fr ai eui n i r g,h nh i o g U i rt ,h n h i 0 4 , hn ) n o t ei i f o v i 2
第2 7卷 第 1 期
21 0 0年 1月
计 算机应 用与软件
Co p t rAp lc to n o t r m u e p ia insa d S f wa e
V 12 . o . 7 No 1
Jn 2 1 a .0 0
基 于 动 态 学 习的视 频 镜 头边 界 检 测 阈值 设 定 算 法
A b tac sr t A h e h d s ti l oih f rvd o s o un r tc in ba e n d a csud s p o o e n t i a e o o i g wih t r s ol etng ag rt m o ie h tbo day dee to s d o yn mi t y i r p s d i h sp p rfrc p n t
h ltr s l st newih t e td v l e o h tt e fle d t ci n n a h e hod i heo t het se au ft a h a s e e to umb ra d t isd tc in nu b rae boh lwe nd t r cso e n hem s ee to m e r t o ra he p e ii n

基于颜色直方图变化率的视频镜头检测

基于颜色直方图变化率的视频镜头检测
内外 的研 究 热 点 。
1 1 色彩 空 间转换 和量 化 .
常见的色彩空间有 R B H L、 S Y V等 , G 、 S H V、 U 本文采用符合 人 眼视觉的 H V色 彩空 间 , 采用 色调 、 和度 、 S 它 饱 明度 来表 示
色彩 。
镜B R) C V 的前 提 , 头 分 镜
本 文 首 先 提 出 了颜 色 直 方 图变 化率 ( R) 概 念 , 以此 为 依 HC 的 并
据进行镜头边界检测 。由于直方图本身对摄像机运动及 图像 内
部物体运动等具有一定的鲁棒性 , 因此 H R也有直方 图的这 些 C
优点 。
快速检索成为 当前亟待解决的问题。然而视频是一种数据量非 常庞大 的非结构化数据 , 并且具有很大 的时空冗余性 , 传统的基 于文本方式的视频检索需要耗 费大量 的人力 财力 , 显然 已不能 再满足人们的要求 了, 因此 基于 内容的视频 检索成 为近年 来 国
第2 8卷 第 4期
21 0 1年 4 月
计算机 应 用与软 件
Co u e p ia in n o t r mp t rAp lc t s a d S f o wa e
Vo . 8 NO 4 12 .
Ap . 011 r2
基 于 颜 色 直 方 图 变 化 率 的 视 频 镜 头 检 测
die ty. Tr dto ls o un r e me a in ag rt m sae c mplx i t mp e n ain prc s ,a d a e n ts t be frg a u lc ng r cl a iina h tbo day s g ntto lo ih r o e n isi l me tto o e s n r o uia l o r d a ha e

镜头变换边界复合检测算法研究

镜头变换边界复合检测算法研究

结果表明该复合检测算法不仅具有 实现复杂度较低 ,而且对各类型图像序 列检测性能好的特点。
关键 词 :镜 头 ;镜 头切变 ;镜 头渐变 ;镜 头变换 边界 检测
Re e r h o o po ie d t c i n a g rt m s f r s o o n a is s a c fc m st e e to l o ih o h t b u d r e
0 引 言
在信息技术飞速发展的今天 , 随着成像采集设
备、 大容量存 储设备 及光纤 传输 网络 的技术进 步 , 数
字视 频 图书馆 、 远程 智能 视频监 控 、 网络视频 电视 等 由于 大大改善 了人们 的工作 和生 活而得 到广泛 普及
和应用 。
能 进行文 本式 的查询 , 这种 方式工作 量极其 庞大 , 无 法适应 于 大规模视 频数 据应用 的需 求 。因此 迫切需 要研究 如 何 利 用计 算 机 自动地 对 原 始 视 频 进 行 分
meh d o f ce ta c s ,r t e a n r w i g o r e vd o d tb s s h t o n ay d tcin i t o sf ref in c e s e r v la d b o sn f a g i e a a a e .S o u d r e e t s i i l b o


要 :将视 频 图像进 行 有效 时 间分段 及 标 定是 视频 图像 内容分 析 、 随机接 入 、视 频 数 据库 浏
览与检 索的 重要研 究 内容 。在 对视 频 图像 进行 时 间分段 和 标 定 过 程 中,镜 头 变换 边 界 的 自动 检
测十分 重要 。镜 头 变换 边界 的 自动检 测 算 法在 国 际上 得 到 了广 泛 的研 究 ,在 分析 了当前 国 际上 的镜 头 变换 边界检 测 算法的基 础 上 ,提 出 了一 种 镜 头 变换 边 界 复合 检 测 算 法。理 论 分 析及 实验

基于累积直方图的视频镜头边界检测方法

基于累积直方图的视频镜头边界检测方法
( o tw s C iaIstt o l t ncT c nlg , h n d 10 6 C ia S uh et hn tue f e r i eh o y C e g u6 0 3 , hn ) ni E c o o
Ab t a t A vd o s o o n a e e t n me h d b s d o u lt e h so r m s p o o e sr c : i e h tb u d r d tc i t o a e n c mua i itg a i r p s d,i h c y o v n w ih
测 对物 体/ 摄像 机 的运动 和光 线 变化 的不敏 感 性 。 实验 结果表 明 , 方 法在镜 头 突变边 界检 测 中达 本
到 9 .7 的查全 率和 9 .5 的查 准率 。 59 % 67 % 关键 词 : 字信 号 处理 ; 频检 索 ; 头边界 检测 ; 数 视 镜 突变边界 ; 累积直 方 图 中图分 类号 :N 1 .3 T 9 1 7 文献 标识 码 : A
r c H r t f9 9 e c n n e p e iin r t f9 7 e c n ie d t ci g a r p ho o n a . e a a i o 5. 7 p r e ta d t r cso a o o 6. 5 p r e twh l ee tn b u ts tb u d r o h i y Ke r y wo ds: i i lsg a r c s i g; i e ere a ; h tb u a ee to d gt i n lp o e sn v d o r tiv l s o o nd r d t ci n;b un a y u l-
e t c me a o h h n e o l mia in E p r n a e u t s o h t h e t o a e c e h c a r rt ec a g f l / i u n t . x e me t l s l h w t a e n w meh d h sr a h d t e o i r s t

基于帧前景的特征距离判据的镜头边界检测

基于帧前景的特征距离判据的镜头边界检测
软件 2 1 年第 3 卷 第 9期 01 2
Sf r ot e wa
国际 I T传媒品牌

基于帧前景的特征距离判据的镜头边界检测木
杨 倩。谢 刚 雷少帅 段 豪
( .太原 理工 大学 测控 技术 研究 所 ,太原 0 02 ;2 1 3 04 .太原 理工 大学 信息 工程 学院 ,太原 0 0 2 ) 3 04
摘 要 : 出了一种 简单 有效的基于 HS 提 V空 问镜 头边 界检 测方法 , 本文综合考虑 了视 频帧全 图像像素 点与局部颜 色直方 图特 征。首先 , 通过 对视 频帧全图的像 素点进行运算提取每一帧的有效前景运动 区域 , 然后提取该 区域 的颜色直方 图。利用滑动窗口计
算 当前 帧的前后两组视频 帧的颜 色直方 图类 间与类 内距 离, 构造有效颜 色特征 的距离判据进行镜 头边界检 测。实验 结果 表明对镜
S o u d r t c i n Ba e n Fe t r s a c ie i n o h r me h t Bo n a y De e to s d o a u e Dit n e Crt r o f t e F a
fr g o n e o e r u d Ar a.
头切变 与渐变有 良好的检测能力。 关键 词 : 头边界检测 ; V 空间; 镜 HS 帧前景运动 区域 ; 离可分性判据 ; 距 自适应阈值 。 中图分类号 : T 3 1 P 9 文献标识码 : A DO :03 6  ̄i n10 .9 02 1 . . 2 I 1.9 9 .s. 36 7 . 1 90 s 0 0 0 0
Y NG Qi XI a g, E hoh a , UA o A a , EG n L I a su i D N Ha n S

一种基于SVD的镜头边界检测方法

一种基于SVD的镜头边界检测方法
维普资讯
第2 7卷 第 1 期
20 0 7年 1月
文 章 编 号 :0 1— 0 1 2 0 ) 1 15— 2 10 9 8 (0 7 0 —05 0

计 算机 应 用
Co utrAp hc fo mp e p a ns i
Vol2 _ 7 NO. 1
m t dbs nSn ̄ eh ae O i o d s V leD cmpsi ( V )W Sp 0e .F s os ut ev e auem txad gth a eo oio S D a mpsd it nt c t i of tr a i n e e u tn r ,c r h d e r t
t r s o d s o u  ̄ " ee t n h e h l h tb n o - d tc i . r o
Ke od :so on a eet n V (igl a eD cm oio) i of ueet c o , dof t em tx yw r s ht u dr dt i ,S D Snua V l eo p si ,v e a r r t n v e a r ar b y c o r u tn d e t x ai i eu i
1 奇异值分解 ( V ) S D
奇异值分解 是一种普遍 采用的矩 阵降秩方法 , 它有 比较
好的数学性质 , 即对给定 的正整 数 k 在 最小 二乘 意义 下 , , 矩 阵的秩近似是对矩 阵的最小改变 。
( h eodAtl yE gne n ol e i nS a x 10 5 hn) TeScn rl r n ieK g Clg ,X ' h ni 0 2 ,C i ie e a 7 a
A s at h fn a n l to so o bu dr eet nw r r n n ou e th o ̄ nn ,adte e bt c:T e udmet me d f s t on aydt i r a h rh c o eebi yit d cda teb n ig n h nanw e r

视频镜头边界检测的实验设计

视频镜头边界检测的实验设计
C HE u n N J a
( c ol f o ue cec n nier g nvrt f lc oi cec n eh ooyo hn ,C e gu 6 0 5 S ho o C mp t Si eadE g ei ,U i s yo et ncSineadT cnlg f ia hnd 10 4,C ia r n n n ei E r C hn )
c i a i e t c u e.w ih i c n u ie t xr c h a i gu i e o tn s n t e r s a c ra,i i i ey r c g ie I t h c l d o sr t r v u h c S o d cv o e ta tt e me nn flvd o c n e t.I h e e r h a e t sw d l e o n z d t a l
s o o n a y d t ci n i h rtse o ie n l ss h t u d r e e t st e f s t p f rv d o a a y i .p o e sn n p l ai n . b o i rc si g a d a pi t s c o
溶 化 :是指 前一 个 视 频镜头 的结 尾部 分 帧 ,和 后 一个视 频 镜头 的开 始 部分 帧 ,在视 觉 内容上 重 叠 播放 ,总 的趋 势 是 前 一 个 视 频 镜 头 的 内容 逐 渐 褪
去 ,后 一个 视频 镜 头 的 内容逐渐 清 晰 出现 。
作 过程 看 ,一 个完 整 、流 畅的视 频序 列 ,是 由多 个 独 立 的视 频镜 头 ,通过 视 频镜 头边 界 (ht ona so bud— r) y 的顺 序 连 接 而形 成 的。视 频 镜 头 的 边 界 变 换 分

采用多特征融合的镜头边界检测方法

采用多特征融合的镜头边界检测方法
t r s ol h e h d.
Ke r s fa u e f s n s o o n a e e t n s l o g n z d n t o k; V h so a y wo d : e tr u i ; h t b u d r d t ci ; ef r a i e r HS itg m o y o - e w r
E m i w j n@h t icm — al -i g o l o : a ma .
L U Qu ,I I n JANG W e 。 U Y . p o c fs o - o n a y d tc o a e n mut fa u e f s n C mp t n i e r g iW uAp r a h o h t b u d r e t n b s d o l -e t r u i . o ue E g ei ei i o r n n
C m u n em g ad A pi t n 计 算 机 工 程 与应 用 o p  ̄rE  ̄ne n n p l ai s c o
2 1 ,6 1 ) 0 04 (3
11 7
采用 多特 征融合 的镜 头边界检 测 方法
刘 群, 江 伟, 吴 渝
LU Q n J G We, u I u ,I AN iwu Y

要 : 出 了一种特征融合的镜 头边界检测方法 HV 有效的方法 , 该文融合 了视 频
帧的 HS V直方图特征 、 边缘特征和纹理特征 , 计算 出不连 续帧。最后 , 采用 K hn n网络 自组织 网络对 不连 续帧值进 行聚类得 到 oo e 镜头边界。 实验结果表明该方法不仅是 可行 和有效的 , 也解 决了需要 阈值 的问题。
关 键 词 : 征 融合 ; 头 边 界检 测 ; 特 镜 自组 织 网络 ; 色彩 直 方 图 D :03 7 /i n10 — 3 1 0 01 . 1 文 章 编 号 :0 2 8 3 (0 0 1— 1 1 0 文献 标识 码 : 中 图分 类 号 :P 7 OI 1.7 8 .s.0 2 8 3 . 1 . 0 js 2 35 10 — 3 1 2 1 )3 0 7 — 4 A T 3

一种基于颜色特征的视频镜头边界检测方法

一种基于颜色特征的视频镜头边界检测方法

得到 的帧序列 [, 1 代表时 间或空 间上连续 的一组 动作 。镜 ]
头边界 的形成是两个镜 头进行 切换 的结果 , 于观察者 来 对 说, 是视 频镜 头的内容发生 了某 种意义上的变化 , 即边界 是
Байду номын сангаас
备 。R B系统提供 了一个 快 速、 G 简单 计算 颜 色 的方法 , 但
它与人眼对颜 色的感 知不一 致[ 。HS 颜色 空 间则 与人 V
王丽红 张桂芸 贾花萍 , ,
W ANG Li o g Z NG Gu-t J A Hu - ig. — n  ̄, HA h i mj,I y apn 1 ・
(. 1天津师范大 学计算机 与信息工程学院 , 天津 3 0 8 ;. 0 3 7 2 渭南师范学院 , 陕西 渭南 7 4 0 ) 10 0
由于视频 内容的不连续造成的 。镜头边界的类型一般可 以 分为突变型和渐变型两种 。 目前已存 在的视频镜头检测技 术分为 以下几类 : 基于像 素差 的方法 、 基于 统计量 的方 法 、 基于灰度或颜色直方图的方法、 基于聚类 的方法 、 基于特征
关 键 词 : 色特 征 ; 头 边界 ; 测 颜 镜 检
Ke r s c lrfau e s o u d r d tcin ywo d :oo e t r ;h tb n ay; ee t o o
中图分类号 : P 9. 1 T 3 1 4
文献标识码 : A
法尽管简单 , 由于它非常依赖 于合理 的阈值 选择 , 但 因此对
C 31 5 / P N4—2 8 T
I N 0 7 1 0 Ss 1 0 - 3 X
计算 机 工程 与科 学
C OMP UTE NG NE R NG & S I NC RE I E I CE E

基于多特征融合的视频镜头边界检测算法

基于多特征融合的视频镜头边界检测算法


要: 为了建立一种通用 、 鲁棒 的镜 头边界 检测算 法 , 根 据镜 头转换 的特性和 多种视 频特征 融合 的思
想, 选取 了 Y U V直方 图特征 、 纹理特征和边缘特征进行 特征融合并计 算帧 间差 值 , 采用 全局 阈值 与 自适应 阈 值相结合 的方法 , 对 镜头边界检测加 以控制 , 提高 阀值选取 的准确性 。实验结果表 明, 该 算法能够有效地实现 视频镜 头边界检测 , 并对闪光 、 字幕有着较强 的鲁棒性 。 关 键词 : 镜头边 界检测 ; 直方 图 ; 特征融合 ; 阈值选取 ; 鲁棒性
因此 , 可将 y分量 的 变化 作 为判 断颜 色 特 征 差 异 的主要依 据 。
Y=0 . 3 0 R +0 . 5 9 G+0 。 l 1 B ( 1 )
有较高 的检测率 , 但 对 包 含 物 体 剧 烈 运 动 或 运
动 较 复 杂 的 视频 存 在 检 测 能 力 不 足 的 问题 。 由 此可见 , 采用 单 一 特 征 进 行 视 频 镜 头 检 测 , 易 出 现检测 能力 不 足 的问题 , 造 成 漏 检 或 误 检 。 因 此, 笔 者提 出 了 一 种 基 于 多 特 征 融 合 的 镜 头 边
其 中 R、 G、 B分别 为 R G B颜 色模 型 中红 、 绿、 蓝 3分量 的值 。
1 . 1 . 2 颜色 特征 表示
界 检 测算 法 , 采 用 颜 色 直 方 图 和 多 特 征 融 合 的思 想 进 行 特 征 提 取 , 较 好 地 避 免 了采 用 单 一
特征所造成 的漏检 或误 检 ; 采 用 全 局 阈 值 与 局
第3 5 卷 第5 期
2 0 1 3年 1 O月

基于视觉注意特征和SVM的镜头边界检测算法

基于视觉注意特征和SVM的镜头边界检测算法

w i m l sS p o V c rM cie (V hc e po u p ̄ et ahn S M)t c si i a a etn f trsbsd o h eerh rsl fpyhl y h y o o l sy v ul tni e ue ae n te rsac eut o scoo . a f s t o a s g
文章提 出了一种基 于视 觉注意特 征和支持矢量机 (V S M) 该算法通过提取符合人类视觉注意 的特 视频镜头的内容发生了某种意义上的变化 , 即边界是 由于视频 的镜头边界检测算法 , 同时采用支持矢量机进行镜头边界检测 。该 内容的不连续造成的。 镜头边界的类型一般可 以分为突变和渐 征作为特征数据 , R VD 2 0 进行对比 变两种。从检测的过程来看 ,整个过程可以归结为 3个阶段 : 算法 的实验结果 与 T E I 0 7公布的评测结果 后 , 明该算法具有较好的性能 。首先概要介绍了视觉注意特 说 () 1特征的提取 ;2帧间差值的构造 ; ) () ( 镜头变换类型的检测 3
1 引言
镜头边界检测是进行视频内容分析的首要步骤 , 是视频语
界。如 A & T T采用了像素域 中特征 , 并结合有限状态机和支持 矢量机进行镜头边界检测的算法 Le等人提出利用压缩域 中 ;e
并结合神经网络进行镜头边界检测 的方法[用机器学习 3 1 , 义、 内容分析的基础 。 镜头是一组连续的相互关联的帧 , 是摄像 特征 , 前的一种发展趋势 。 机 的一次连续拍摄 , 代表时间或空间上连续的一组动作 。镜头 的方法进行镜头边界检测是 目 边界的形成是两个镜头进行切换 的结果 , 对于观察者来说 , 是

要 : 头边界检测是视频分析的基础 。 镜 借鉴心理 学中有关视觉注意的研究成果 , 出了一神采用符合人 类视 觉注意的特征 ,界检测的算法。通过 对 T E V D 0 7数据库进行实验 的结果表 明, R C I 20 该算法在查全率和查准率方
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

二、研究现状
1.镜头边界检测过程 1.镜头边界检测过程
2.不连续值的计算 2.不连续值的计算
1)像素比较法 1)像素比较法
1 X Y Z (k , k + l ) = ∑∑| I k (x, y) − I k +l (x, y) | XY x=1 y=1
2011-4-10 西北大学电子科学系 7
二、研究现状
2011-4-10
西北大学电子科学系
14
二、研究现状
6)骰子(dice)系数D 骰子(dice)系数D 骰子
这是对两个范围内共有帧数目的一个归一化度量,其值在0到1之间。
D = 2 Rg ∩ Rd Rg + Rd
5.总结 5.总结
1) 对压缩域和解压域的不连续值计算方法进行了综述 2) 对各种类型边界的阈值选择方法进行综述 3) 性能评价标准
2011-4-10
西北大学电子科学系
9
二、研究现状
3)基于高斯模型的方法 基于高斯模型的方法
Tb = µ + α δ
那么落入这个阈值范围之外的值将被认为是镜头的边界 4)基于人工神经网络的方法 基于人工神经网络的方法 利用人工神经网络构建多层感知机来实现参数的自适应动态选 择[30],文[30]中通过选取4个与不连续值相关的特征作为网络的输入 ,从而使算法可以自适应的选择参数。但是由于多层感知机是有监督 的进行训练的,所以使用前还需有正确的目标分类来定义正确的网络 行为
3.2 渐变边界的阈值选择方法
渐变类型边界有其自身的特点,以下专门介绍渐变边界的检测方 法,这些方法通常也同时能检测突变边界。
西北大学电子科学系
2011-4-10
10
二、研究现状
1)双边比较法 双边比较法 这种方法的一个缺点是:因为渐变和镜头内部的帧间不连续值往 往差距很小,所以其中低的阈值很难确定,导致对渐变的起始和结束 点的定位不准确。 2)基于统计模型方法 基于统计模型方法 统计方法的基本思想是分别对各种情况建模,以使统计的检测误 差达到最小,即使下式的达到最小:
2.1 直方图统计 1) 一维颜色直方图 统计像素属于某种颜色分量级别的相对频数,是一维直方图,直 方图的分块数为三种颜色分块数之和。
Z (k , k + l ) =
N Bins j =1
∑H
R k
( j ) − H kR+l ( j ) + H kG ( j ) − H kG+l ( j ) + H kB ( j ) − H kB+l ( j )
2011-4-10 西北大学电子科学系 3
内容提纲
研究目的和意义 研究现状 基于颜色信息的镜头边界检测研究 基于梯度信息的镜头边界检测研究 基于镜头划分的字幕检测研究 总 结
2011-4-10
西北大学电子科学系
4
一、研究目的和意义
如何有效的利用现有的多媒体信息
“想找一些鸟类的图片做研究“ “想找一些动作类的影片” “想找出所有有关某人的新闻视频做个专题” ………
2011-4-10 西北大学电子科学系 16
三、基于颜色信息的镜头边界检测研究
4) Munsell\HIS\HSV系列 系列 蒙塞尔(Munsell)色彩体系是由美国色彩学家蒙赛尔提出的, 蒙赛尔的色调分为10个,每色调再细分为10,共有100个色调,蒙赛 尔的亮度共分为11级,而饱和度也因各纯色而长短不同,例如5R纯红 有14阶段,而5BG只有6阶段。 在此基础上,人们提出了许多对Musell系统近似的颜色模型HSB 、HSI和HSV。
3) L*a*b*/ MTM/ MTM/L*u*v*模型 模型
L*a*b*颜色模型是在1931年国际照明委员会(CIE)指定的颜色度 量国际标准的基础上建立的。L*a*b*颜色与设备无关,即不管使用什么 设备(如显示器、打印机、计算机或扫描仪)创建或输出图象,这种颜 色模型产生的颜色都保持一致。 L*a*b*模型是均匀色彩空间,也就是说 人所观察到的两种颜色的区别程度与该颜色空间两点的欧式距离对应。 另外还有均匀颜色空间的MTM, L*u*v*模型。
2011-4-10
西北大学电子科学系
15
三、基于颜色信息的镜头边界检测研究
1.颜色空间 颜色空间
1) RGB 2) YUV/YIQ/YCrCb 系列 YUV/YIQ/YCrCb每一种彩色空间都产生一种亮度分量信号和两种色度 分量信号,而每一种变换使用的参数都是为了适应某种类型的显示设备 。其中,YIQ适用于NTSC彩色电视制式,YUV适用于PAL和SECAM彩色电视 制式,而YCrCb适用于计算机用的显示器。
2011-4-10
西北大学电子科学系
8
二、研究现状
对于B帧,当镜头发生变化,B帧和先前的参考帧会差别很大, 而会和下一个参考帧相似,所以会出现大多数宏块采用后向预测. 6) 基于MPEG7描述符的方法 基于MPEG7 MPEG7描述符的方法 可缩放颜色描述符 边缘直方图描述符
3. 阈值选择方法
最简单的阈值选择方法是固定阈值,因为它在整个视频段上是固 定不变的,不符合视频变化的特点,所以其检测效果不能令人满意. 3.1 突变边界的阈值选择方法 1)二次差分法 二次差分法 2)滑动窗口法 滑动窗口法
2011-4-10
西北大学电子科学系
12
二、研究现状
4. 性能评价标准
1)检出率(recall)和准确率 (precision) 检出率( 检出率 ) 检出率: 准确率:
R=
P=
Nc × 100% Nc + Nm
Nc × 100 % Nc + N f
2)漏检率和错误率 漏检率和错误率
3)错误概率 错误概率
(
)
Z=∑
j =1
N Bins
H 1 ( j) − H 1+l ( j ) k k H 1+l ( j) k
2
+
H k2 ( j ) − H k2+l ( j ) H k2+l ( j )
2
+
H k3 ( j ) − H k3+l ( j ) H k3+l ( j)
2
上述各种帧间不相似性测度对于镜头边界检测效果也会因选取不同的 特征而有差别,并不因城区距离法简单而效果差,但也有实验结果[10]表 明相交法要好于城区距离法和欧式距离法。根据[3]中的实验结果来看, 检验确是优化了边界处的不连续值,但是同时加深了运动的影响,所以 总体来说,法并不一定比前三种方法好,而且需要花更多的时间代价。
2011-4-10
西北大学电子科学系
2
视频镜头边界检测研究
类型 1 2 3 4 变换 无 颜色 空间 混合 意义 对镜头直接连接 对颜色值进行改变 对像素空间位置进行变换 空间颜色混合变换 示例 切换 淡入、淡出、溶解 翻页、扫换 变形
据此可以对淡入、淡出和溶解进行建模。
Sin ( x, y, t ) = B( x, y) + Si ( x, y) × (t / L) Sout ( x, y, t ) = So ( x, y ) × (1 − t / L) + B( x, y ) Sd (x, y, t) = Si (x, y) ×(t / Li ) + So (x, y) ×(1− t / Lo )
2011-4-10 西北大学电子科学系 18
三、基于颜色信息的镜头边界检测研究
3) 分块颜色直方图 对视频序列的每一帧进行分块,在每一块上进行⑴或⑵方法的直方 图统计,就形成了分块直方图。 2.2. 直方图不相似性测度 1)城区距离法 1 2) 欧式距离法 Z = | X1 − Y1 |n + | X 2 − Y2 |n + | X 3 − Y3 |n n 3) 相交法 4) χ 2 检验法
2)颜色直方图比较法 颜色直方图比较法
Z (k, k + l ) = ∑ HkR ( j) − HkR+l ( j) + HkG ( j) − HkG+l ( j) + HkB ( j) − HkB+l ( j)
j =1 NBins
பைடு நூலகம்
3)基于边缘的方法 基于边缘的方法
in out xk + l xk ECR ( k , k + l ) = max( , )
2) 三维颜色直方图 通过量化把颜色空间分成一个个颜色小区间,统计落入各小区间 像素的个数得到直方图,是三维直方图,直方图的分块数为三种颜色 分块数之积。 1 Nbins Nbins Nbins Z(k, k + l) = ∑∑∑| Hk (r, g, b) −Hk+l (r, g, b)| N r=0 g=0 b=0
3.3 闪光检测的阈值选择方法
按照一般的检测算法,闪光出现和结束时都会被认为是切变,但 是无论从镜头边界的定义来看还是从视频内容来看,把闪光位置认为 是切变都是不合理的。因此,有必要找出闪光位置,并把它从切变中 除去。有一种简单的闪光检测算法[5],其在局部范围考虑两个条件: ① 最大值和局部第二大值非常接近;② 这两个值比其余值的均值大 得多。
δ k +l
δk
4)基于DCT系数和DC系数的方法 基于DCT系数和DC系数的方法 基于DCT系数和DC C fm ⋅ C fn ϕ =1−
C fm C fn
5)基于预测的统计特性 基于预测的统计特性 对于P帧,当镜头在P帧和前一个P、I帧间发生变化时,会导 致前向预测的中的大多数宏块有一个很高的预测误差,这些宏块 会采用帧内编码,因此我们可以通过帧内编码的宏块占宏块总数 的比例来判断是否有边界出现
2011-4-10 西北大学电子科学系 19
三、基于颜色信息的镜头边界检测研究
相关文档
最新文档