基于线性搜索的快速运动估计算法

合集下载

HEVC运动估计快速算法优化及硬件实现

HEVC运动估计快速算法优化及硬件实现

1 引言高效视频编码(HEVC)作为新一代标准,沿用了上一代标准H.264/ AVC的编码框架[1]。

但是针对不同部分,H.265/HEVC都分别提出了新技术。

比如H.264/AVC是以宏块作为编码单元,而在H.265/HEVC中采用了编码树单元(CTU),其往下划分的结构有编码单元( CU)、预测单元(PU)和变换单元(TU)[2]。

CU的尺寸不再局限于16×16,而可以根据深度划分,从64×64分割到8×8大小。

而在实际编码过程中,计算量最大的是帧间预测部分,这是由于视频图像时间冗余大于空间冗余的特性所造成的。

在模式选择的整个迭代过程中,以运动估计为例,不同尺寸的PU块都需要经过搜索、插值来找到各自最佳的匹配块。

这是一个繁琐且非常耗时的过程。

目前已有很多学者对帧间预测模式选择提出了一些简化算法,文献[3]提出了一种扩展和迭代搜索(S&IS)以及低密度和迭代搜索(LD&IS)的运动估计算法,这种方式因为在遍历每个PU时具有规则的周期数,所以在硬件电路的设计上更加友好,但是运动估计所消耗的周期数受视频序列特点影响大,如果周期数较为固定,可能会对编码性能造成一定影响。

文献[4]提出了用基于运动矢量相似性的运动估计快速终止算法。

利用率宏块内子块运动矢量一致的特点,通过计算排除掉不可能的划分方式,从而达到提前终止运动估计的目的。

文献[5]也是采用基于划分深度的先粗选再细选的搜索方式,但是采用的搜索步长、下采样比例以及搜索方式均和本文不同,且最终结果对编码性能造成比特率增加较大。

文献[6]采用了一种快速中心搜索算法,通过发现一帧图像中,静止宏块、慢速运动宏块和快速运动宏块的比例关系,改变全搜索的遍历顺序,并设置提前终止规则,达到快速中心搜索的目的。

文献[7]采用了一种易于硬件实现的整像素运动估计搜索方式,使用并行聚类树搜索方式同时处理各个PU,并在搜索之后将相同MV候选的PU汇聚成一组,下一次的搜索将以这些组为单位进行统一搜索。

基于运动矢量场和方向自适应的快速运动估计算法

基于运动矢量场和方向自适应的快速运动估计算法

需要检测零矢量点即可完成搜索,极大的节省了计算量。
3.2 运动类型判定 根据性质 2,视频序列的运动矢量场具有一致性特性,
如果利用运动矢量的这种时空相关性便可以对当前块的运
动情况做出预测,利于随后进行自适应搜索。实验统计表明,
当前块与帧内上方、左方和右上方的相邻宏块的相关性最
强,而与其他位置的相关性则较弱,M-DAS 算法选取这 3
摘 要 该文提出了一种基于运动矢量场和方向自适应的快速搜索算法。算法针对序列图像的运动矢量场所具有
的中心偏置性和时空相关性进行预判,对静止块设定阈值直接中止搜索;根据运动类型自适应选择搜索起始点和
搜索策略;采用了两种新的混合搜索方法,对小运动和大运动宏块使用线性-菱形搜索,对中等运动块使用六边形-
菱形搜索算法,搜索模板具有强烈的方向特性。实验结果表明,该文算法的搜索速度和搜索精度优于现有的快速
性质 4 残差图像的误差曲面具有多峰分布的特性,在 大多数情况下,误差曲面含有一个或多个局部极小点[9]。因 此搜索模板不能太小,以免陷入局部极小点。
图 1 运动矢量的空间分布图 图 2 图像宏块的 SAD 分布图 Fig.1 Spatial distribution map of MV Fig.2 Distribution map of SAD
个空间邻块和参考帧中相同位置的时间邻块作为候选点进
行预测。定义运动矢量集合
V = {V0,V1,V2,V3,V4}, V0 = (0,0), Vi = (xi , yi ), i = 1, 2,3, 4, 分别表示 4 个时空邻块的运动矢量,定义运动矢量的绝对值
距离 li 为
li = xi + yi
3 基于运动矢量场和方向自适应的快速运动估计 算法

基于运动矢量时_空特性的快速运动估计算法研究_刘龙

基于运动矢量时_空特性的快速运动估计算法研究_刘龙

2
运动矢量时—空特性分析
运动矢量预测的准确性直接受到其时—空相 关性的影响,相关性程度高,预测的准确性高;反 之,预测的准确性低。本节将从运动矢量相关性程 度的角度对运动矢量的时—空特性进行分析,并给 出运动矢量在时间上的变化程度与空间上相似度 之间的关系。 2.1 特性分析 在时间维度上,运动矢量的变化程度直接反映 了运动矢量在时间上的相关性程度,在相邻时间点 上变化程度越大,相关性越弱;反之,相关性越强。 为了分析运动矢量在时间上的相关性特点,首先定 义运动矢量的变化程度如下。 (1) Lk ,i , j | V || Vk 1,i , j Vk ,i , j | 其中,V k 1,i , j 和 V k ,i , j 分别代表在 k 1 帧和 k 帧中坐 标位置为 (i, j ) 的运动矢量。采用 10 个不同的视频 序列作测试,其中,运动程度整体平缓的视频序 、 “ Mother&Daughter ” ;运 列有: “ Hall Monitor ” 动程度比较剧烈的视频序列有: “ Coastguard”和 “Forman” 。对上述两组数据采 100 帧用全搜索法 进行运动估计,并统计其在横、纵坐标上的变化程 度,其测试结果显示在表 1 中。 表 1 显示了运动矢量在时间上变化的统计数 据。统计数据结果显示大多数的运动矢量在连续 2 个运动矢量场之间不变化或变化很小。经过计算, 对于运动复杂度低的视频序列,超过 70%的运动矢 量没有明显的变化;超过 90%的运动矢量变化幅度
[2]
收稿日期:2011-11-02;修回日期:2012-07-12 基金项目:教育部博士点基金资助项目(20096118120011) ;陕西省自然科学基金资助项目(2009JQ8007) ;国家自然科学 基金资助项目(61072151);西安市科技局创新支撑计划基金资助项目(CXY1132) Foundation Items: Research Project of Ministry of Education of China (20096118120011); The Natural Science Foundation of Shaanxi Province (2009JQ8007); The National Natural Science Foundation of China (61072151); Xi'an Science Program Project (CXY1132)

基于运动矢量场和方向自适应的快速运动估计算法

基于运动矢量场和方向自适应的快速运动估计算法
运动估 计算法 .而搜索精度非常接近于全 搜索法。 关键词 运 动估计 ,块匹配算法 ,视频编码,运动矢量场
中图分类号 : P9 T 31
文献标识码 : A
文 章编号 : 0959(061.270 l0- 6 0)2 7.6 8 2 2
A s o i n Esi t0 g rt m s d 0 o i nVe t rFil n Fa tM to tma inAl o ih Ba e n M to co ed a d
第28卷第12期2006年12月电子与信息学报joumalelectronicsinformation1echnology0128no12dec2006基于运动矢量场和方向自适应的快速运动估计算法叶西安电子科技大学智能控制与图像工程研究所西安710071清华大学自动化系宽带网络媒体实验室北京lo0084摘要该文提出了一种基于运动矢量场和方向自适应的快速搜索算法
维普资讯
第 2 卷第 1 期 8 2 20 年 1 0 6 2月

子 与




Vb.8 .2 1 NO 1 2
J u a f e to is If r o r l Elcr nc & n m ̄inT c n lg n o o o e h oo y
i ito u e ee th tt n r co l k tu r iaigc re t e rhi s nr d c dt d tc esai ayma rbo , stm n t ur n ac mme itl. won v l e r hsr tge o t o c h e n s daey T o e a c tae is s wi t n ie t n l rp r r o td n ldn h n - a n e r h frte ma r bo k wi o o ih h t sr g drci a oe t ae a pe ,icu ig te LieDimo d S ac o h c l t lw rh【 o o p y d o c h g

一种快速运动矢量场搜索的块匹配运动估计算法

一种快速运动矢量场搜索的块匹配运动估计算法

宁波大学学报(理工版)首届中国高校优秀科技期刊奖JOURNAL OF NINGBO UNIVERSITY ( NSEE ) 浙江省优秀科技期刊一等奖一种快速运动矢量场搜索的块匹配运动估计算法摘要: 运动估计作为实时视频编解码中最重要最耗时的部分,大量的研究都是通过减少搜索点数来降低计算量。

而块匹配算法以其简单、高效,便于硬件实现等优点被使用到运动估计中。

针对这一特点,提出一种基于块匹配的快速运动矢量场搜索算法(FMVS)。

FMVS算法通过将视频序列时间相关性与空间相关性相结合,提出的一种新算法。

该算法包括以下五部分:预测搜索起点、动态阈值进行静止块判断、方向性类型判定、运动类型判定及混合模板运用。

对视频标准测试序列的实验结果表明,该算法较MVFAST算法,搜索点数降低30%-50%,对于运动复杂的视频序列峰值信噪比提高0.21dB。

关键词: 运动估计;块匹配算法;运动矢量场;(矢量场自适应搜索)MVFAST;峰值信噪比中图分类号: TP393 文献标识码: A 文章编号:对于视频序列图像,由于相连帧之间存在很大的时间相关性,通过减少时间冗余,可以提高视频编码的效率。

而基于块匹配算法以其简单、高效,便于硬件实现等优点,已经被许多视频编码标准所采纳。

运动估计算法占整个编码器的60%~80%的运算量,很大程度决定编码器的效率。

在块匹配运动估计算法中,全搜索算法精度最高,但是运算量也最大大。

为了解决运算量大,产生了很多快速搜索算法。

一类是快速算法是按照某种搜索策略只对搜索窗口的相关参考点进行计算;如一些经典算法3步法[1],菱形搜索算法[2],六边形搜索算法[3]。

菱形搜索算法,六边形搜索算法为了避免局部最优,采用大的搜索模板,但带来了搜索点数的大量增加;而小菱形搜索算法采用小菱形减少搜索点数,但是带来局部最优的问题。

另一类快速搜索算法是利用运动矢量相关性来预测当前运动矢量。

此类算法考虑时域或空域相关预测当前搜索起点,性能优于前一种。

H.264中运动矢量特征分类的快速运动估计算法

H.264中运动矢量特征分类的快速运动估计算法
维普资讯
第3 2卷 第 1 9期
V 13 o.2






20 0 6年 1 0月
Oc o e 0 6 t b r2 0

l 9
Co put rEng ne r ng m e i ei
多媒体 技 术及应 用 ・
文章编号: o 32( o) 一l _ lo一 48 o6 2 - 3 2 l 3 0
块运 动估计 和模 式判定 的运 用。为 了提高准确度 ,H2 4在 .6
分 或者亚宏块 的方法 ,又可称之为树结构的运动估计 。然后 通过率失真优化准则 R O( a iot nOpi zd( 1) D R t D s ro t e )式() e t i mi
确定最优匹配模式 , 得到的结果 即为该宏块最终的编码模式 。
, m, ( ) A scm)十 … ・ m— =S D(,( ) R( ) () 1
运 动估计 中提供 7种不 同大小的块 ,可以节省 多达 1%的比 5
特率。但 同时也使得处理 时间线性上升 ,计算复杂度大大增 加。在 J T参考软件 J . ,采用 了由 Z io h n eg V M90中 hb e ,P n C
关奠 词 :H 2 ;运动矢量特征 分类 ;方向性菱形模 板 . 4 6
Fa t o i n Esi a i n o e t r a y i s to t M m t f x u eAn l ss o T f rM o i n Ve t ri .6 0 to c o H 2 4 n
中等运 动块 和小运 动块 。对每类 宏块 自适应地选择一种 或者几种编码模式进行预测 ,有效地减少 了由 7种宏块( 亚宏块) 模式 所引起 的计算 量;同时选 用精确 而且快速 的方向性菱形模板 ,对不 同的模式采用不 同的搜索策略 。实验分析表明 ,该算法搜索精度接 近于 全搜索算法 , 而搜索时间只为全搜索算法的 5 %~1 .%。 . 4 05

一种基于AVS的亚像素快速运动估计算法

一种基于AVS的亚像素快速运动估计算法

一种基于AVS的亚像素快速运动估计算法
周城;谭毅华;田金文;柳健
【期刊名称】《中国图象图形学报》
【年(卷),期】2007(012)009
【摘要】AVS是我国自主制定,拥有自主知识产权的音视频编码技术标准.AVS采用了可变大小块以及1/4像素精度的运动估计技术以提高编码效率.基于AVS参考软件提出了一种增强亚像素自适应范围搜索算法.该算法主要使用了小菱形窗的搜索策略和阈值判决方法.与亚像素全搜索算法比较,在平均性能仅下降0.009 3dB的情况下,减少了30.25%的搜索点数.与AVS参考软件中的快速亚像素运动估计算法相比较,在平均性能提高0.022 1dB的同时,节省了8.78%的搜索点数.
【总页数】5页(P1520-1524)
【作者】周城;谭毅华;田金文;柳健
【作者单位】华中科技大学图像所图像处理和智能控制教育部重点实验室,武汉,430074;华中科技大学图像所图像处理和智能控制教育部重点实验室,武
汉,430074;华中科技大学图像所图像处理和智能控制教育部重点实验室,武
汉,430074;华中科技大学图像所图像处理和智能控制教育部重点实验室,武
汉,430074
【正文语种】中文
【中图分类】TN919.81
【相关文献】
1.基于亚像素运动矢量的AVS编码快速搜索算法 [J], 黄敏琪;何明华;文斌
2.一种AVS亚像素运动估计快速算法 [J], 魏建云;彭玉华;刘微
3.基于AVS-M的亚像素运动估计快速算法 [J], 张新安;官彦军;陈爱武
4.基于AVS的快速亚像素运动估计算法 [J], 宋雪桦;包祥;吴问云
5.基于H.264的一种快速1/4像素运动估计算法 [J], 程霖;郭宝龙;孙宏军
因版权原因,仅展示原文概要,查看原文内容请购买。

一种用于H.264的快速运动估计算法

一种用于H.264的快速运动估计算法
Ab ta t I te s r c : n h mu i l c t n s ma in o 2 4 sa d n , l o g f l s a c c n o ti h e t h b o k mo i e t t f H.6 t n a t at u h u l e r h a b a n t e b s o i o h mac i g i th n t
A Ra d g rt m f M o in tm a i n o H .6 pi Al o ih o to Esi to f r 2 4
Xi Ch o J a g Yu n a in mig
( c olo o p trE gn eig X da nvri , ia 0 Sh o fC m ue n ier , iin U ies yX ’n 7 7 ) n t 1 1 0
时 间 冗 余 以 得到 更 高 的 编 码 效 率 。在 运 动估 计 中 . 码 器 在 参 编 考 帧 中对 每 一 个 宏块 进行 搜 索 . 到找 到 一 个 最 佳 的 匹 配 作 为 直
当 前 帧 的预 测 块 . 把 参 考 帧 的抽 样 点 通 过 运 动 向量 的 补偿 作 再
l e qu t i l os ie lt e. t
Ke wo d y r s:H.6 , t n e t t n, al e mia in 2 4 moi si i e r tr n t o ma o y o
1 引 言
在 视 频 编 码 标 准 中 .基 于 块 的运 动 估 计 和 补 偿 ( t n Mo o i
维普资讯

种用于 H. 4的快速运动估计算法 2 6
喜 超 姜昱 明
( 西安 电子科技 大 学计算机 学院 , 西安 7 0 7 ) 10 1

频谱分析仪中YTO本振分波段扫描控制设哥

频谱分析仪中YTO本振分波段扫描控制设哥

2 扫描关键技术
由于 完成 一 次全 程 扫 描要 在 不 同波段 之 间跳
在单一波段扫描的基础之上加入了状态转移控制 变 ,所 以有两个重要 的问题需要解决。一是 波段
模块 ,控制在 几个波段状态之 间跳变,从而实现 分界点要处理好衔 接问题 ,即状态 的可靠转移 ; 分波段扫描。在程序 这 里假设划分为 6 个波段 ) 二是要保证本振扫描步进和中频处理数据的同步 , 波段一至波段六分配固定的状态 0 110 0~1 ,并固化 波段二至波段六 的固定起始频点数据,这样可 以 问题 ,以便正确在屏幕上显 示信号。
每点扫描时间
扫描起始频率 扫描频率步进
控制 中间每个点的扫描停留时间
控制频率扫描的起始频点 控制频率扫描的频率步进量大小
定点 / 扫描切换 波段分 界点扫描频率连续时 间
控制 F T / F 检波模式切换 控制波段跳变时扫描频率连续的停留时间
波段分 界点扫描频率跳变时 间
控制波段跳变时扫描频率跳变的停留时问





皿 l
/\
丧 Байду номын сангаас过 波 1扫 经本 段 \ / 示 袋 描 本段始 l扫从波 开 示
√ 一


翱 溯 溯隧
嬲嘲黼 灌
图 2 分界点处状态转移数 据处理
图 4 分 波段扫描斜坡电压
如图 3 所示为频谱分析仪处于扫描模式的扫
描中断信号 图。该 中断信号用于 同步中频处理数
描法,可用来代替预选器的作用,控制实现方便, 以它 的确定关系着整个扫描过程的准确性、可靠 不需要考虑射频前端的 Y G统调问题 ,简化了电 性。具体控制参数要根据实际的波段 划分、扫描 I

一种新的基于H.264的快速运动估计算法

一种新的基于H.264的快速运动估计算法
Cm ue n i eigad A piaos o p trE gn r n p l t n 计算机工程与应用 e n ci

种新 的基于 H. 4的快速运动估计算法 2 6
李 丽 , 宋 刚
LI i S L . ONG Ga g n
山东大学 信息科学与工程学院 , 济南 200 5 10
p t r a a t eyT i n b e U t a d h n mb r f e r h o ns atn e d p i l. h s v e a l s S o d t e u e o s a c p i t mo e f c e t a d h s mp o e t e e rh p e . r ef inl n t u i r v s h s a c s e d i y Me n i ,h e l o t m lo a o t h d a c d s p c t r n i e r s a c e h oo yS mu a in rs l h w t a h a whl t e n w ag r h as d p s t e a v n e - t r e a a d l a e r h tc n lg . i lt e u t s o h t te e i o i i n o s n w ag r h c n rd c h e rh t b v 0 c mp rd wi h e lo t m a e u e t e s ac i i me a o e 2 % o a e t t e UMHe a o s ag r h a o t d b 2 4 sa d r . h x g n lo t m d p e y H.6 t n a d i Ke r s y wo d :mo in e t t n UMHe a o s ag r h ; d p ie u s - t si i ; o ma o x g n lo t m a a t n y mmer a r s e r h atr i v ti l c o s s a c p t n c e

快速近似最近邻算法

快速近似最近邻算法

快速近似最近邻算法最近邻算法(Nearest Neighbor Algorithm)是一种常用的机器学习算法,用于分类和回归问题。

它的基本思想是找到与目标样本最接近的训练样本,并将其标签作为目标样本的预测结果。

但是,当训练集非常大时,最近邻算法的计算复杂度会变得非常高,这就需要使用快速近似最近邻算法来提高算法的效率。

快速近似最近邻算法(Approximate Nearest Neighbor Algorithm)通过牺牲一定的精确性来换取更高的计算效率。

它的核心思想是利用数据结构或近似算法来降低搜索空间,从而减少计算量。

下面介绍几种常用的快速近似最近邻算法。

1. 局部敏感哈希(Locality Sensitive Hashing,简称LSH)是一种常用的快速近似最近邻算法。

它的基本原理是将高维数据映射到低维空间,通过哈希函数将相似的数据映射到相同的桶中,从而加快相似度搜索的速度。

LSH算法可以在保证一定的查询精度的同时,大大减少计算量,适用于大规模数据集的近似最近邻搜索。

2. 近似最近邻树(Approximate Nearest Neighbor Tree,简称ANN Tree)是一种基于树结构的快速近似最近邻算法。

它通过构建一棵多层的树结构,将训练样本划分到不同的叶节点中,并记录每个叶节点的中心点。

在查询时,通过比较查询样本与每个叶节点中心点的距离,可以快速确定查询样本的搜索路径,从而提高搜索效率。

3. 近似最近邻图(Approximate Nearest Neighbor Graph,简称ANN Graph)是一种基于图结构的快速近似最近邻算法。

它通过构建一个图结构来表示训练样本之间的相似度关系,从而实现最近邻的快速搜索。

在构建ANN图时,可以使用不同的近似算法,如k-means算法或最大最小平均聚类算法,来降低计算复杂度。

4. 近似最近邻线性搜索(Approximate Nearest Neighbor Linear Search)是一种简单但有效的快速近似最近邻算法。

运动估计算法比较 块匹配 全搜索 四步法 三步法

运动估计算法比较 块匹配 全搜索 四步法 三步法

大作业运动估计算法比较一、实验内容简要介绍各种运动估计算法,并比较不同运动估计算法的性能,主要考虑各算法的运算速度和精度。

二、实验背景视频原始图像中存在着大量的信息冗余,如时间冗余、空间冗余、信息熵冗余、谱间冗余、几何结构冗余、视觉冗余和知识冗余等等。

运动估计是视频压缩编码中的核心技术之一,采用运动估计和运动补偿技术可以消除视频信号的时间冗余以提高编码效率。

如何提高运动估计的效率,使运动估计算法的搜索过程更健壮、更快速、更高效成为目前研究的热点。

运动估计的基本思想是尽可能准确地获得序列图像帧间的运动位移,即运动矢量。

因为运动估计越准确,预测补偿的图像质量越高,补偿的残差就越小,补偿编码所需位数越少,需要传输的比特率就越小。

利用得到的运动矢量在帧间进行运动补偿。

补偿残差经过变换、量化、编码后与运动矢量一起经过熵编码,然后以比特流形式发送出去。

运动估计算法多种多样,大体上可以把它们分成四类:块匹配法、递归估计法、贝叶斯估计法和光流法。

其中块匹配运动估计算法因其具有算法简单、便于VLSI实现等优点得到广泛应用。

所以本文将重点介绍块匹配运动估计算法,并对各种块匹配算法在计算速度和估计精度上进行简单比较。

三、实验原理(一)、像素递归技术像素递归技术是基于递归思想。

在连续帧中像素数据的变化是因为物体的移位引起的,郑么如果沿着梯度方向在某个像素周圈的若干像素作迭代运算,运算会最后收敛于一个固定的运动估计矢量,从而预测该像素的位移。

(二)、块匹配运动估计块匹配运动估计是把图像帧划分为若干互不重叠的块,并以块为单位寻找目标帧中每块在参考帧(上一帧或者其它帧)中最优匹配的块的相对位置,假设图像中每块的大小为M×N,dxmax为参考块水平方向可搜索最大位移而dymax为参考块垂直方向可搜索最大位移那么基于块匹配的运动估计就是在参考帧(或者其它上一帧)的(M+2dxmax)×(N+2dymax)候选区搜索窗口中找到和目标帧的当前大小为M×N的块的最匹配的块则参考块的运动矢量可用如下的数学公式描述:R表示相关性评价函数,f(m,n)表示目标或当前帧图像的灰度值。

基于统计分析的仿射运动估计快速算法

基于统计分析的仿射运动估计快速算法

基于统计分析的仿射运动估计快速算法钟煜城;黄晓峰;牛伟宏;崔燕【期刊名称】《计算机科学》【年(卷),期】2024(51)S01【摘要】为降低新一代通用视频编码标准(Versatile Video Coding,VVC)的计算复杂度,提出了一种基于统计分析的仿射运动估计(Affine Motion Estimation,AME)快速算法。

从加速AME过程的角度出发,首先摒弃AME的3种运动矢量(Motion Vector,MV)精度中的整像素和1/16像素精度,保留1/4像素精度;其次利用迭代次数与量化参数(Quantization Parameter,QP)、slice类型以及编码单元(Coding Unit,CU)大小的关系,得到一个迭代次数的自适应计算式来减少AME迭代次数;然后将细粒度搜索(Fine Granularity Search,FGS)算法中CU 4个角落的4个整像素用2个对角分像素进行替代;最后运用绝对变换差和(Sum of Absolute Transform Difference,SATD)代价来替代率失真(Rate Distortion Optimization,RDO)代价。

实验结果表明,与H.266/VVC参考软件VTM-10.0相比,提出的算法在低延迟(Low Delay B,LDB)和随机访问(Random Access,RA)配置下分别节省了8.34%和8.83%的时间,与此同时性能损失仅为0.10%和0.12%。

【总页数】8页(P474-481)【作者】钟煜城;黄晓峰;牛伟宏;崔燕【作者单位】杭州电子科技大学通信工程学院;浙江省经济信息中心【正文语种】中文【中图分类】TN919【相关文献】1.一种基于多层次方法的快速仿射谱聚类算法2.基于四参数仿射模型的快速运动估计算法3.基于已重建先验信息的VVC快速仿射运动估计算法4.基于快速仿射模板匹配的AMCL算法因版权原因,仅展示原文概要,查看原文内容请购买。

基于仿射变换的快速全局运动估计算法

基于仿射变换的快速全局运动估计算法

基于仿射变换的快速全局运动估计算法王思珺;赵建;韩希珍【摘要】Global Motion Estimation is an important tool widely used in computer vision, video processing, and other fields. To reduce the computational complexity of global motion estimation, a global motion estimation method based on the pixel gradient strategy was proposed. With regard to global motion models, six-parameter affine model is adopted because of its reasonable tradeoff between complexity and accuracy. In order to accelerate the algorithm, two-level pyramid is utilized in the calculation. It uses those gradient bigger pixels in the calculation of every pyramid level, and combines Gauss-Newton algorithm. The extensive experiments show that the proposed method is efficient and robust in terms of both computational complexity and accuracy.%全局运动估计是计算机视觉、视频处理等领域广泛采用的手段之一.为了降低全局运动估计计算复杂度,提出一种基于像素梯度的全局运动估计方法.就运动模型而言,采用了复杂性与准确性较好均衡的六参数仿射模型.为了提高计算速度,采用了两层金字塔进行多分辨率计算,而且在每层迭代计算中都抽取梯度较大的特征点进行计算,同时结合了高斯-牛顿优化计算方法.实验验证了提出的全局运动估计算法的计算效率和精度.【期刊名称】《液晶与显示》【年(卷),期】2012(027)002【总页数】4页(P263-266)【关键词】全局运动估计;参数模型;仿射变换;迭代最小二乘法;金字塔计算【作者】王思珺;赵建;韩希珍【作者单位】中国科学院长春光学精密机械与物理研究所,吉林长春130033;中国科学院研究生院,北京100039;中国科学院长春光学精密机械与物理研究所,吉林长春130033;中国科学院长春光学精密机械与物理研究所,吉林长春130033【正文语种】中文【中图分类】TP3911 引言图像中像素点的位置可能会随着时间而改变,称之为像素运动。

【国家自然科学基金】_运动估计算法_基金支持热词逐年推荐_【万方软件创新助手】_20140803

【国家自然科学基金】_运动估计算法_基金支持热词逐年推荐_【万方软件创新助手】_20140803

107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160
科研热词 运动估计 块匹配 h.264 运动补偿 运动矢量 角点检测 视频编码 菱形搜索 粒子滤波 码率控制 目标跟踪 图像配准 卡尔曼滤波 kalman滤波 h.264/avc 运动目标检测 运动检测 车辆检测 跟踪 视频压缩 视频 红外图像 粒子滤波器 立体视觉 空时自适应处理 点目标 比特分配 模式选择 核密度估计 最小二乘法 无味kalman滤波 扩展卡尔曼滤波 帧间预测 小波变换 姿态估计 奇异性 复杂噪声 图像序列 噪声估计 参数估计 动态规划 冠状动脉 全局运动估计 修正rodrigues参数 mpeg-4 h.264标准 麦克风阵列 高阶统计量 高阶统计显著性检验 高速运动分析 高超声速 飞行器控制、导航技术
视觉里程计 视觉跟踪 视觉标定算法 视差空间 血管造影 融合 蒙特卡罗方法 自适应空时滤波 自适应滤波 自适应 自底向上合并 自主控制重构 背景差分 背景估计 肤色模型 联合状态估计 联合变换相关 缩放系数 编码器 绝对误差和 绝对差分误差和 结构随机跳变系统 结构相似度 结构元 纳米粒子 红外系统 红外目标跟踪 系统误差 粒子滤波(pf) 符号截断特征 立体视频编码 立体对 空间预测 空天飞行器 移动机器人 离散小波变换 离散余弦变换 短时滑窗相参积累 相关性 相似性测度 相似性 目标检测 电子稳像 电力系统 率失真优化 状态观测器 特征点匹配 特征检测 片上可编程系统 点扩展函数 灰度投影 滤波器设计 混合估计 沿航迹干涉

《多媒体通信》期中思考题及答案

《多媒体通信》期中思考题及答案

《多媒体通信》期中思考题第一章1、请论述什么是多媒体和多媒体技术的基本特征。

2、多媒体系统有哪几种主要的类型?每一种类型中最关键的技术有哪些?3、简述多媒体数据处理与一般数据处理的差异。

第二章1、什么叫空间频率?在不涉及和涉及观察者的两种情况下,图像空间频率的高、低各与哪些因素有关?第三章1、为什么内插滤波器和抗混叠滤波器通常都使用FIR 滤波器,而不是IIR 滤波器?2、在具有运动补偿的帧间预测编码中,如果运动矢量估计得不准确产生的后果是什么,会不会引起解码后的图像失真,为什么?3、对图1所述三种8×8的亮度图形进行DCT 变换后,估计(不必实际计算)在系数矩阵的哪些位置上,变换系数有较大数值。

图1 三种8×8的亮度图形4、设有一离散无记忆信源1234560.30.20.20.10.10.1S S S S S S X ⎧⎫=⎨⎬⎩⎭(1)计算该信源的熵;(2)为该信源构造一霍夫曼码,并计算平均码长及编码效率;(3)为什么该码的编码效率小于1?试总结在什么情况下,霍夫曼码的编码效率能够达到1?(提示:符号S i 的码字的码长是多少?)。

5、假设有下表所示的5种运动矢量,其出现的概率如表所示。

试用一般算术编码对MV 序列{-2, -1, 0, 2}进行编码(1)给出编码过程和最后输出的码字(允许最后一位不能正确解码);(2)输出码字需要用几比特表示?编码效率为多少?(3)同一序列若采用霍夫曼编码,编码效率为多少?6、说明视频编码中运动估计的必要性以及相应的块匹配方法,掌握三步搜索法和二维对数法这两种常用的快速运动搜索方法。

7、说明在图像编码和视频编码中广泛使用离散余弦变换的原因。

8、掌握霍夫曼编码和算术编码的编解码方法。

9、掌握子带编码的工作原理以及正交镜像滤波器组和时域混叠消除的相关方法。

10、说明在时域量化和在变换域量化的差别。

11、举例说明在音频和图像压缩时如何利用人类认知系统的非线性特性。

一种新的视频编码的块运动估计算法

一种新的视频编码的块运动估计算法

一种新的视频编码的块运动估计算法
骆立俊;邹采荣;何振亚
【期刊名称】《通信学报》
【年(卷),期】2000(021)002
【摘要】本文提出了一种连续判别的非线性预测搜索NPSSD块运动估计算法,可以用于视频压缩的一些国际标准,如H.261,H.263,MPEG1,MPEG2,HDTV
中.NPSSD算法充分利用了序列图像的实际运动矢量与预测矢量之间位移的空间分布特性--中心偏置分布特性和时间上的相关特性,并在搜索过程中采用了中止判别和搜索判别,可以明显地减少运动搜索复杂度.仿真表明这种算法减少了搜索次数,提高了搜索效率,降低了运动估计总的搜索复杂性.本文还详细地给出了NPSSD算法与其它常用快速搜索算法的比较结果.
【总页数】5页(P55-59)
【作者】骆立俊;邹采荣;何振亚
【作者单位】东南大学无线电工程系,江苏,南京,210096;东南大学无线电工程系,江苏,南京,210096;东南大学无线电工程系,江苏,南京,210096
【正文语种】中文
【中图分类】TN949.17
【相关文献】
1.一种用于AVS视频编码的块运动估计算法 [J], 郑金华;杨平;杨志伟
2.一种用于视频编码的块运动估计算法——块特征匹配预测搜索算法 [J], 何振亚;
邹采荣
3.视频编码中的块运动估计算法 [J], 骆立俊;邹采荣
4.视频编码中的块运动估计算法分析(一) [J], 骆立俊;邹采荣
5.一种用于视频编码的块运动估计新算法 [J], 汪超;彭嘉雄
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第38卷 第2期2004年2月 西 安 交 通 大 学 学 报J OU RNAL OF XI′AN J IAO TON G UN IV ERSIT YVol.38 №2Feb.2004基于线性搜索的快速运动估计算法丁贵广,郭宝龙(西安电子科技大学机电工程学院,710071,西安)摘要:为了减小快速运动估计算法的计算复杂度和提高运动补偿的准确性,提出了一种新的块匹配运动估计算法,称为线性正方形搜索算法.该算法采用运动估计的线性搜索策略,对于不重要的搜索区域利用线性搜索技术进行快速搜索以减小算法的计算复杂度,而对于重要搜索区域,即最佳点所在区域,用9点的正方形模块进行精细搜索以提高算法的搜索精度.实验结果证明,该算法与菱形算法相比不仅计算复杂度减小了10%以上,而且视频编码效率可以提高约011dB.关键词:块匹配算法;运动估计;线性搜索;视频编码中图分类号:TP391 文献标识码:A 文章编号:0253-987X(2004)02-0136-04N e w F ast Motion Estimation Algorithm B ased on Line SearchDi ng Guiguang,Guo B aolong(School of Electromechanical Engineering,Xidian University,Xi′an710071,China)Abstract:In order to reduce the computational complexity of the fast motion estimation and improve the accuracy of motion compensation,a new block2matching algorithm called line2square search(L SS)algorithm was pro2 posed,in which the strategy of the line search was introduced.The L SS algorithm performed the line search for the unimportant area to reduce the computation complexity.For the important search area in which optimal points were existed,a square search pattern consisted of9checking points was used to carry out the refined search,thus the search accuracy and the prediction quality were pared with the diamond search algorithm,experimental results showed that the computational complexity could be reduced up to10%and the coding efficiency could be increased about011dB by the L SS algorithm.K eyw ords:block2m atchi ng al gorithm;motion esti m ation;li ne search;vi deo codi ng 对于视频序列图像,由于相邻帧之间存在很大的时间相关性,即时间冗余,所以通过减少时间冗余,可以大幅度提高视频编码的效率.基于块匹配的运动估计算法是一种有效的方法,它已经被许多视频编码标准所采纳[1,2].在块匹配运动估计算法中,全搜索(FS)算法精度最高,但由于它要对搜索区内的每个搜索点进行检测,因此计算复杂度高,软硬件实现困难.后来人们相继提出了许多快速搜索算法,如三步法(TSS)[3]、四步法(FSS)[4]、二维对数法(TDL)[5]、基于块的梯度下降法(BB G DS)[6]、交叉法(CS)[7]和菱形法(DS)[8,9\〗等,它们通过设计不同的搜索模板和搜索策略,在计算复杂度上比FS 减小了许多,但搜索的准确性比不上FS.因此,有必要寻找更加高效的块匹配运动估计算法.本文在分析运动矢量和绝对差和(Sum of Ab2 solute Difference,SAD)的空间分布特性的基础上,设计了一种新的搜索算法———线性正方形搜索算法(Line2Square Search,L SS).实验结果表明,本文提出的L SS算法在计算复杂度和准确性上都明显优于DS等块匹配算法.收稿日期:2003-05-05. 作者简介:丁贵广(1976~),男,博士生;郭宝龙(联系人),男,教授,博士生导师. 基金项目:国家自然科学基金资助项目(69975015);教育部优秀青年教师计划资助项目.1 DS算法DS算法即菱形搜索(Diamond Search,DS)算法[8],是快速算法中性能最为优异的算法之一,它的综合性能明显优于其他几种快速算法.在DS算法中采用两种搜索模板,分别是有9个搜索点的大模板LDSP(Large Diamond Search Pattern)和有5个搜索点的小模板SDSP(Small Diamond Search Pattern).搜索时先用LDSP计算,当最小块误差(Minimum Block Distortion,MBD)点出现在中心点处时,将LDSP换为SDSP,再进行匹配计算,这时5个点中的MBD即为最优匹配点.否则,改变中心点位置,仍用LDSP重复计算[8].DS算法的特点在于它分析了视频图像中运动矢量的基本规律,选用了大小两种形状的搜索模板.先用LDSP大范围搜索,再用SDSP来准确定位,所以它的性能优于其他算法.但是,DS算法只是一种搜索策略的折中处理,其性能上的缺陷表现在2个方面:①对于大运动的序列,DS算法在搜索最佳点所在区域时,广度搜索和梯度下降搜索同时进行,即同等地对待搜索区域的各部分,造成较大的搜索冗余,影响了算法的搜索速度;②对于保持静止的图像序列,即运动矢量为0的情况,DS算法也要经历由LDSP到SDSP的变化过程,要对13个搜索点进行搜索,所以对于小运动序列,DS算法还有待改进.2 L SS算法L SS算法根据SAD分布的空间方向性和运动矢量分布的中心偏移性,设计了正方形搜索模板和线性搜索策略.通过并行搜索和线性搜索减小了算法的计算复杂度,使用小的正方形模板保证了算法的搜索精度.L SS算法很好地克服了DS等快速算法搜索速度慢的缺点.2.1 LSS算法描述L SS算法的模板和搜索策略如图1所示.根据运动矢量分布的中心偏移性及并行处理的思想,并考虑到视觉中心凹的特点(中心密、四周疏),设计了如图1a所示的正方形模板(Square Pat2 tern,SP).此模板上有9个搜索点(称为内模板)和8个虚拟搜索点(称为外模板,图中的虚线圆),内模板用于精确搜索,外模板用于确定线性搜索的方向,图1b显示了8个可能的线性搜索方向.图1c和图1d 分别说明了MBD在水平方向和对角线方向上进行线性搜索的策略.(a)L SS的正方形搜索模板(b)8个可能的线性搜索方向(c)沿水平方向上的搜索策略(d)沿对角线方向上的搜索策略图1 L SS算法的模板和搜索策略 在描述L SS算法的具体搜索步骤之前,给出如下定义.731 第2期 丁贵广,等:基于线性搜索的快速运动估计算法定义1 中心点是指SP模板的中心位置.定义2 线搜索点是指在搜索过程中SAD值最小的搜索点,中心点和线搜索点一起确定了线性搜索的方向.L SS算法的具体搜索步骤如下.(1)以搜索区原点作为SP的中心点.(2)在SP内模板上的9个点处分别计算出对应的SAD,找出MBD点.若MBD点位于中心,则执行步骤(4);否则,计算此MBD点所在方向上的虚拟搜索点的SAD;若其SAD值大于MBD的SAD 值,则以MBD点为SP的中心点,重新执行步骤(2);若其SAD值小于MBD的SAD值,则以此虚拟搜索点为线搜索点,执行步骤(3).(3)在中心点和线搜索点所确定的方向上计算下一个检测点的SAD,若其SAD值小于线搜索点的SAD,则以线搜索点为中心点,以此检测点为线搜索点,重新执行步骤(3);否则,以线搜索点为SP的中心点,执行步骤(2).(4)将该MBD点作为最佳匹配点,得到运动矢量.由此可以看出,L SS算法具有如下特点:(1)根据SAD分布的空间方向性,提出线性搜索的思想,对于大运动序列,减少了搜索冗余,提高了搜索速度;(2)根据运动矢量分布的中心偏移性,提出了9搜索点、8搜索点的正方形模板,保证了搜索算法的精度;(3)提出基于视觉原理的并行处理的思想,在确定搜索方向的同时进行精确搜索,对于小运动序列,减少了搜索冗余,进一步提高了搜索速度;(4)从算法的实现步骤上看,算法复杂度低,便于软硬件实现.2.2 算法性能分析上面详细论述了L SS算法的原理和执行步骤,下面将通过一个具体例子来说明L SS算法相对于DS算法在速度上的优越性.图2显示了用两种算法搜索到运动矢量(7,-2)的例子.图2a显示了DS 算法的搜索路径,总共搜索了28个点;图2b是用L SS算法搜索到同样点的路径,共搜索了24个点. L SS算法比DS算法少用了4个搜索点,这说明L SS 算法比DS算法的计算复杂度低.从图2b也可以看出,在进行最佳点搜索时,L SS算法对于不重要的区域根据梯度下降法进行线性搜索,减少了不必要的搜索冗余,对于重要区域利用正方形模板进行(a)DS算法搜索路径(b)L SS算法搜索路径图2 两种算法搜索运动矢量(7,-2)的图例精确搜索,提高了算法的搜索精度.3 实验结果比较为了验证L SS算法的性能,在相同条件下对FS、TSS、FSS、DS和L SS进行了计算机仿真实验.用平均搜索点数和搜索准确性2个测度作为算法性能的验证标准.实验以3个标准序列作为测试序列,每个序列选前100帧,其中Claire序列是一种典型的视频会议序列,属于小运动序列;Mobile序列为CIF(Common Intermediate Format)标准灰度格式.选取的宏块大小为16×16,搜索范围为15×15,匹配准则为SAD.实验得到各算法的平均搜索点数如表1所示.从表中可以看出,L SS算法在各种序列中所用的平均搜索点数都是最少的,说明L SS算法是其中搜索速度最快的算法.为了验证LSS算法的准确性,直接用各算法得到的运动矢量,由上一帧恢复出当前图像(注:这里专为测试运动估值的效果,所以过程中跳过了图像编码和解码部分),然后逐帧计算出峰值信噪比(P SNR),最后将所有100帧求平均,结果如表2所示.831西 安 交 通 大 学 学 报 第38卷 表1 几种运动估计算法每块平均搜索点数比较算法Claire序列平均搜索点数加速倍数Mobile序列平均搜索点数加速倍数Football序列平均搜索点数加速倍数FS225.00 1.00225.00 1.00225.00 1.00 TSS25.009.0025.009.0025.009.00 FSS16.5613.5916.9611.1619.3911.60 DS13.3816.8213.2317.0116.8413.36 L SS9.6123.4112.0318.7014.9915.01 表2 几种运动估计算法的平均P SNR比较 dB算法Claire序列P SNRΔP SNR Mobile序列P SNRΔP SNRFootball序列P SNRΔP SNRFS41.460.0022.730.0022.560.00 TSS41.1420.3222.4120.3221.5321.03 FSS41.4020.0622.6420.0921.7720.79 DS41.4520.0122.6620.0721.7420.83L SS41.460.0022.7220.0121.8120.75 注:ΔPSNR为各算法的P SNR值与FS算法的P SNR值之差. 从表2中可以看出,FS算法的平均P SNR最高,说明效果最好;在Claire序列中L SS算法与FS算法的平均P SNR相同,说明对于小运动序列L SS的准确性非常高;在另外2个序列中,L SS算法与FS算法的平均P SNR也非常接近,而且明显高于其他算法.这说明L SS算法在准确性上要比DS等算法更好,是最接近FS算法准确性的快速估计算法.图3显示了测试序列为100帧的Football序列时,不同算法的性能比较结果.从图3a可以看出, L SS算法搜索点数最少,也就是搜索速度最快、计算复杂度最低.图3b为用不同算法求出每一帧对应的P SNR的比较结果.可以看出,L SS算法的P SNR曲线与FS算法更接近,这说明在搜索精度上L SS算法接近于全搜索,优于DS等快速估计算法.DS算法是MPEG2VM编码器中采用的快速运动估计算法,其综合性能代表了当前的国际先进水平.上面的实验结果表明,L SS算法在搜索准确性和速度上均优于DS算法,是一种更高效的快速估计算法.4 结束语本文依据SAD分布的空间方向性和运动矢量的中心偏移性,提出了L SS算法.该算法采用线性搜索确定最佳点所在区域,用正方形模板进行精确(a)平均每块搜索点数比较(b)P SNR比较图3 不同算法的性能比较搜索和选择线性搜索方向.实验结果表明,L SS算法在算法复杂度和准确性上都优于以往的快速运动估计算法.下一步将系统研究线性搜索的原理,并结合并行处理的思想探索线性搜索的最佳方案.参考文献:[1] ITU2T Rec.H.263(1995),Video Coding for Low BitrateCommunication[S].(下转第173页)931 第2期 丁贵广,等:基于线性搜索的快速运动估计算法(b )口径面尺寸为18×8图5 平面波斜投射在矩形口径上时E面的空时方向图(a )口径面尺寸为8×18面波正投射时,都有随着口径面积的增大辐射场的峰值变大,方向性变好,但波形变宽的特性.在柱面波投射时,第2个脉冲波形的宽度大于第1个脉冲波形的宽度.同时,在口径尺寸大于激励脉冲在自由空间展布的宽度时,第2个波形有明显的畸变,这是由于中心场产生的辐射与边缘场产生的辐射时延增大造成的.在平面波斜投射于相同面积的矩形口径时,如口径的宽边与极化方向一致,则在E 面最大方向将偏离主轴方向,而在H 面并无此现象.在口径窄边与极化方向一致或口径尺寸小于激励脉冲在自由空间展布的宽度时,此现象并不明显.同时亦可看出,对相同面积的矩形口径而言,若矩形口径的窄边与极化方向一致,则该口径辐射场的辐射幅度与辐射脉冲的持续时间大于矩形口径的宽边与极化方向一致时的辐射情况.由此还可得出结论,改变口径面的形状和大小可改变辐射特性.参考文献:[1] 汪文秉.瞬态电磁场[M ].西安:西安交通大学出版社,1991.[2] Baum C E.Radiation of impulse 2like transient field [R ].Sensor and Simulation Notes ,Note 321.New Mexico ,USA :Air force Weapons Laboratory ,1989.[3] Sulliven D ,Y oung J L.Far 2field time 2domain calculationfrom aperture radiators using the FDTD method [J ].IEEE Trans on AP ,2001,49(3):464~469.[4] 王向晖,蒋延生,汪文秉.超宽带天线口径辐射效应的时域研究[J ].现代雷达,2003,25(9):38~41.[5] Y ee K S.Numerical solution of initial boundary valueproblems involving Maxwell ’s equations in isotropic media [J ].IEEE Trans on AP ,1966,14(5):302~307. (编辑 刘 杨)(上接第139页)[2] ITU 2T Rec.H.264/ISO/IEC 11496210(2002),Ad 2vanced Video Coding [S].[3] Li R ,Zeng B ,Liou M L.A new three 2step search algo 2rithm for block motion estimation [J ].IEEE Trans Cir 2cuits Systems for Video Technology ,1994,4(4):438~442.[4] Po M L ,Ma C W.A novel four 2step search algorithm forfast block motion estimation [J ].IEEE Trans Circuits Systems for Video Technology ,1996,6(6):313~317.[5] Jain J ,Jain A.Dis placement measurement and its appli 2cation in interframe imger coding [J ].IEEE Trans Com 2munication ,1981,29(12):1799~1808.[6] Liu L K ,Feig E.A block 2based gradient descent searchalgorithm for block motion estimation invideo coding[J ].IEEE Trans Circuits Systems for Video Technolo 2gy ,1996,6(8):419~423.[7] Ghanbari M.The cross 2search algorithm for motion esti 2mation [J ].IEEE Trans Communication ,1990,38(7):950~953.[8] Zhu S ,Ma K K.A new diamond search algorithm forfast block 2matching motion estimation [J ].IEEE Trans Image Processing ,2000,9(2):287~290.[9] Tham Y J ,Ranganath S ,Ranganath M ,et al.Anovelunrestricted center 2biased diamond search algorithm for block motion estimation [J ].IEEE Trans Circuits S ys 2tems for Video Technology ,1998,8(8):369~377.(编辑 刘 杨)371 第2期 王向晖,等:口径天线瞬态辐射特性的研究。

相关文档
最新文档