基于新型十字_菱形搜索的块匹配算法

合集下载

基于方向自适应十字搜索的快速块匹配运动估计算法

基于方向自适应十字搜索的快速块匹配运动估计算法

0 引言
运动估计是视频编码 中的核心技术 , 运动估计 的好坏直接 影响到编码 的效率和 图像 恢复 的质量。块 匹配运动估 计算法
( MA 是消除视频数据时间冗余最 基本 且最重要 的方法 。由 B )
Da n erh C S [ 。由于运 动矢量 ( i mo dSac ,K D )6 j MV) 有 中心分 具
cudsedu 4 6 % , 97 % , 2 4 % , n .4 oe teDa odSac ( S ,oaeD ( D ) CosDa od o l pe p7 .5 3 .8 4 .4 ad7 8 % vrh im n erh D ) Sur—S S S , rs—im n Sa h C S , n m lC S S D )a o tm , epc vl, n ol ana es i r erhacrc. er ( D ) a dS a —D ( C S l rh s rset e a dicudm it nt ml ac cuay c l gi i y t i h i as
关键词 :块 匹配 ;运动估计 ;方向 自适应十 字搜 索 中图分 类号 :T 3 16 P 0. 文献标 志码 :A 文章编 号 :1 0 —6 5 2 0 ) 5 0 4 ・2 0 1 3 9 ( 0 7 0 —0 4 0
No e in e a tv o sS ac o v lOre td Ad p ie Cr s e rh fr
基 于方 向 动估 计 算 法 术
杨 恒 ,王 庆
( 西北工 业大 学 计算机 学院 , 西 西安 707 ) 陕 10 2

要:提 出了一种方向 自 适应十字搜索算法, 通过 自 适应地使用小十字模板 、 大十字模板和四种方向的 T形

菱形搜索算法

菱形搜索算法

毕业论文(设计) 2013届通信工程专业 0913071 班级题目菱形搜索运动估计算法研究及实现姓名学号指导教师职称二零一三年五月二十四日内容提要运动估计是视频压缩编码中的核心技术之一。

采用运动估计和运动补偿技术可以消除视频信号的时间冗余,从而提高编码效率;运动估计搜索算法是帧间编码的基础,常用的运动估计搜索算法采用在搜索区域内搜索最佳绝对误差和(SAD,Sum of Absolute Differences)匹配点来进行宏块匹配,获得宏块的运动矢量。

不同的搜索方法在搜索最佳SAD点上采用不同的搜索策略。

常见的快速搜索算法有三步法、新三步法、四步法、块梯度下降法以及菱形搜索算法等,本文主要研究菱形搜索运动估计算法并实现,首先阐述了课题的背景与意义和运动估计的研究现状,其次详细介绍了运动估计的原理以及典型块运动估计算法,分析它们的技术特点,然后重点介绍了菱形搜索算法,并在Visual C++ 6.0环境下编写程序代码将之实现,最后进行仿真得出实验结果。

关键词视频压缩;运动估计;块匹配;菱形搜索The Realization Of Diamond Searching MotionEstimation AlgorithmAuthor: Tutor:AbstractMotion estimation is the video compression coding technology of the core. Using motion estimation and motion compensation techniques can eliminate temporal redundancy of the video signal, thereby improving the encoding efficiency; motion estimation search algorithm based on inter-coded, the common motion estimation search algorithm of the search area to search the best absolute error and SAD (Sum of Absolute Differences) matching points to the macro block matching motion vector of the macro block obtained. Different search method searches for the best SAD point different search strategies. Common fast search algorithm has three steps, the new three-step method, four-step, block gradient descent and diamond search algorithm, etc. This paper studies the diamond search motion estimation algorithm and implementation, first describes the background and significance of the subject and motion estimation research status, followed by details of the motion estimation principle and the typical block motion estimation algorithm to analyze their technical characteristics, and then focuses on the diamond search algorithm, and the Visual C + + 6.0 environment to prepare the program code of the implementation, and finally the simulation The experimental results obtained.KeywordsVideo Compression Motion Estimation Block Matching Diamond Search目录内容提要................................. 错误!未定义书签。

基于十字模板的特征点匹配方法

基于十字模板的特征点匹配方法
C m ue n i eiga d p l ain "" o p tr gn r n A p i t sH算机 工程 与应 用 E e n c o
2 1 .6 2 ) 0 0 4 (9
17 6
基 于 十 字模 板 的特 征 点 匹 配 方 法
任 洪娥 , 常颖 丽 , 董本 志
REN o — CHA N G Yi —i DO N G n.hi H ng e, ng l, Be z

i g s a e o t i e . h n t e e e td tmp a e r a s ma e r b an d T e h s l ce e lt a e i mac e y t e c o s t mp ae ma c i g m eh d; n l f a r o t th d b h r s e l t t h n to f al e t e p i s i y, u n a e m ac e y h Eu l e n itn e n e h c n iu t c n t i t h e u t o o a ai e t ss h w t a t e r s r th d b t e ci a d sa c u d r t e o t i d n y o sr n . e r s l a T s f c mp r t e t v s o h t h c o s tmp a e s a t a d h s h g a c r c f au e p i t e lt i f s n a i h c u a y; e t r o n s ma c i g th n meh d a e o t e c o s e l t s i l a d ei b e t o b s d n h r s tmp a e i s mp e n r l l , a

一种基于预测性运动向量的菱形搜索方法

一种基于预测性运动向量的菱形搜索方法
q ai o ma e n s ac s e d s o s t f dF r e ov n t e r b e u t f i g a d e rh p e i l y n t a i e . o rs li g h p l m b te , i a e p e e t a i r v d s i o et r t s h p p r rs ns n mp e o d a n s a c a g r h i mo d e r h l oi m b s d n t a e o mo in e tr r d c in, n i a e i in y mp v t e e fr n c f v d o t v co p e it o o a d t n f c e t i r e h p r maБайду номын сангаасe o i e c l o o
M o i n Ve t r P e ito to c o r d c i n
He W e nwe Zha Hu i o i
( co lo nom t n S i c n n ier g S a d n nvri , ’a 5 10 S h o fIfr ai c n e a d E gn e n ,h n o g U i sy j nn 2 0 0 ) o e i e t i
3 算法描 述
大量实验表 明 , 图像 的 大 部 分 分 块 运 动 是 平 滑 的 , 使 得 这 运 动矢 量 总 是 集 中 在搜 索 窗 口 的 中心 附 近 , 现 中心 分 布 的规 呈
了便 于 V s 实 现 , 目前 MP G和 H2 4标 准 普 遍 采 用 基 于 块 LI E .6 匹 配 的 运 动 估 计 法 。 而 块 匹 配 法 由 于是 将 图像 分 割 成 子块 进 然

基于起点预测的十字-六边形-菱形运动估计算法

基于起点预测的十字-六边形-菱形运动估计算法

基于起点预测的十字-六边形-菱形运动估计算法
王艳营
【期刊名称】《电子测量技术》
【年(卷),期】2009()5
【摘要】为了解决运动估计算法精度不高和运算量大的问题,有必要寻找一种有效的运动估计算法。

本文在讨论块运动类型的判定和起始搜索点预测的基础上,分析
了针对整像素的六边形-菱形(HDSP)的搜索过程和针对半像素的十字形(CSP)的搜
索条件,从而提出了基于起点预测的十字-六边形-菱形的运动估计算法(IPP-CHDS)。

文中详细研究了该算法的搜索过程和流程,并利用三个序列进行测试,测试结果表明,IPP-CHDS算法的搜索精度与FS算法接近,但它的运算量却大大的减少。

【总页数】5页(P54-57)
【关键词】运动类型;整像素;半像素;起点预测
【作者】王艳营
【作者单位】黑龙江科技学院计算机与信息工程学院
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于起点预测的自适应交叉-准菱形运动估计算法 [J], 梁燕;刘文耀
2.一种起点预测的十字形快速运动估计算法 [J], 谢帅铃;蔡志勇;柳丹青
3.基于改进的十字-菱形搜索算法的运动估计 [J], 刘海华;雷奕;谢长生
4.自适应简单菱形六边形运动估计搜索算法 [J], 韩波;秦水介
5.基于起点预测的单位十字快速运动估计算法 [J], 林兆花;谢存禧;邹焱飚
因版权原因,仅展示原文概要,查看原文内容请购买。

基于菱形搜索的局部求精比特平面匹配图像稳定算法

基于菱形搜索的局部求精比特平面匹配图像稳定算法

术。 这里所指的电子稳像实际上是指应用数字图像处
理 的方 法 ,采用 稳 像 算法 来 直接 确 定像 偏移 并 进行 补 偿 的数 字 电子稳像 技 术 。电子稳 像 技术 由于具 有稳 定 精度 高 ,轻 便 等特 性 ,发展 前 景 十分广 阔 。 电子 图像 稳 定 系 统 通 常 可 分 为两 个 基 本 的 子 系 统 ,运 动估 计 系统 和 运动 校 正系 统 。一般 来说 ,运 动 估 计 子 系 统 采 用 块 匹 配 算 法 在 位 于 图像 不 同 位 置 的 子 图像 中 获得 一组 局 部运 动 矢 量 。运 动 校 正子 系统 通
L UO u , S Jn ONG n , S Xi g HEN h n k n Z e —a g
( ain la AT ,h ol e fEet cl c n e n n ie r g N t a bo R T eC l g lcr a i c dE gnei , o l f e o i Se a n Nain l nvri o De n e e hooy Hua h n sa4 0 7 , hn ) t a ies f f s c n lg, n nC a gh 10 3 C ia o U  ̄ e T
Abs r t t ac :A m a t b lz n l o ih ba e a t o ly r fn d g a — o d bi— a thi g ba e i gesa ii i g a g rt m s d on af s cal e e r y- de tplnema c n s d l i c - o i mon e r h a d me a — s d m o i n c r ea i n wh c r al e uc st e c mpu a i n ll a nda d s a c n din ba e to o r l to i h g e tyr d e h o t to a o d whie l

一种快速的块匹配运动估计新算法

一种快速的块匹配运动估计新算法

[ ( 1 一 m+ , + ) ( ) f m,) 一( n l 2 k 2

们相 继 提 出 许 多 快 速 搜 索 算 法 , 三 步 搜 索 法 如
(S ) T S 四 步 搜 索 法 ( S ) 、二 维 对 数 法 F S
( D )2、 T L [ 菱形法 ( S J , 们 在计 算 复 杂度 上 1 D) 等 它
( )最 小均方 误差 函数 ( E 1 MS )
1 M N
间冗余 , 通过减少 时 间冗 余 可 以大 幅度 地 提高 视频
编码 的效 率 。基 于块 匹 配 的 运 动估 计算 法是 一 种 很 有效 的方法 。块 匹配运 动估计算 法在 M E - P G4和 H 2 3中都得 到 了广泛应 用 … 。 .6

分别 为 当 前 帧 和上 一 帧 图像 的灰 度 值 。 因为
因此 , 有必 要寻找更 加有效 的块匹配 运动估计 算法 。 在分析 了诸多 算法 的基础 上 取长 补 短 , 计 出 设 了一 种新 的搜 索算 法—— 新菱 形 搜索 算 法 ( D ) NS。 实验结 果表 明 , D N S算 法在 计算 复 杂度 上 和准 确 度
达到最小 时 , 该点 即为最 优匹配 点 。
在式 ( ) 1 和式 ( ) , i ) 2 中 ( , 为位 移 矢量 , ≤ 一
i. , 为 搜 索 范 围 , xN 为 块 的 大 小 , 和 ,≤ J M

比F S减小 了许 多 , 是 搜 索 的准 确 度 比 不 上 F 。 但 S
比较 实 用 , 度 得 到 广 泛 的 应 用 , 采 用 MA 一 现 D
算法 。 ( )对于块 匹配运 动估计搜 索算法 性能 的衡 量 3

基于方向自适应十字搜索的快速块匹配运动估计算法

基于方向自适应十字搜索的快速块匹配运动估计算法

基于方向自适应十字搜索的快速块匹配运动估计算法
杨恒;王庆
【期刊名称】《计算机应用研究》
【年(卷),期】2007(24)5
【摘要】提出了一种方向自适应十字搜索算法,通过自适应地使用小十字模板、大十字模板和四种方向的T形模板,有效地减少了搜索点数,提高了搜索速度.实验结果表明,该算法在保持与菱形搜索(DS)、正方形-菱形搜索(SDS)、十字-菱形搜索(CDS)和小十字-菱形搜索(SCDS)四种算法相同搜索精度的同时,速度上比DS、SDS、CDS和SCDS算法分别提高了74.65%、39.78%、42.44%和7.84%.【总页数】3页(P44-45,65)
【作者】杨恒;王庆
【作者单位】西北工业大学,计算机学院,陕西,西安710072;西北工业大学,计算机学院,陕西,西安710072
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.基于边缘局部偏差搜索的快速块匹配运动估计算法 [J], 卢紫微;钟修皓;张燕;敬博
2.用于快速块匹配运动估计的自适应十字模式搜索 [J], 王晓燕;郑建宏
3.基于预测搜索距的快速块匹配运动估计算法 [J], 余颖;胡继承
4.一种基于块匹配的自适应快速运动估计算法 [J], 舒振宇;高智勇;陈心浩;刘海华
5.基于方向自适应采样搜索的快速运动估计算法 [J], 王强;李月娥
因版权原因,仅展示原文概要,查看原文内容请购买。

改进的十字菱形搜索算法INCDS

改进的十字菱形搜索算法INCDS
西北大学学报 ( 自然科 学版 ) 2 1 年 4月 , 4 卷第 2期 ,p. 2 1 , o. 1N . 01 第 l A r ,0 1 V 1 , o2 4 Junl f otw s U i r t N t a SineE io ) ora o r et nv sy( a rl cec dt n N h ei u i
改 进 的十 字 菱 形 搜 索算 法 I C S N D
张万绪 , 吴佳 丽 , 丽平 , 赵 李应超 , 艾 娜
( 西北大学 信息科 学与技术学院 , 陕西 西安 7 0 2 ) 1 17
摘要 : 目的
减 少运 动估 计搜 索点数 , 高搜 索速度 。 方法 提
通 过对 图像 运动 矢量 分布 特征 和 十字
改进 的算 法提 高 了搜 索提 前 退 出的概 率 , 少 了运 动估 计 的 时间 消耗 。 减
中图分类号 :N 4 T 91
文献标识码 : A
文章编号: 0 - 4 2 1 )2 26 5 1 0 7 X(0 10 - 2 - 0 2 0 0
I pr v d n w r s - i m o d s a c l o ih NCDS m o e e c o sd a n e r h ag rt m I
Ab t a t sr c :Ai m T e u e t e s a c i g p i t fmoi n e t t n a d i rv h e r h s e d M e h d o r d c h e r h n on s o t s mai n mp o e t e s ac p e . t o s o i o T e i g t n v co it b t n a d c o sd a n lo t m r t d e h ma e moi e t rd s u i n r s i mo d a g r h a e su id,t e i r v me t o c r s t e i i a o i r o i h mp o e n n e n t c h n i l p i tp e it n, e rir t r n t n ag rt m , s a c i c in o h e r h p o e s a d t e sae o v n o n r d ci o a l e mi ai l o h e o i e h dr t f t e s a c r c s n h tt f mo i g r e o b o k . s l An i r v d I DS a g r h i p o o e . n l so T e r s l h w t a e i rv d a g ・ l c s Re u t s mp o e NC lo t m s r p s d Co c u i n i h e u t s o t mp o e o s h t h l r h c n i c e s e p o a i t fe l emi ai n a d r d c e t fmoi n e t t n i m a n r a e t r b b l y o a y tr n t n e u e t i o t s ma i . t h i r o h me o i o

视频压缩感知中基于菱形快速搜索的双匹配区域预测

视频压缩感知中基于菱形快速搜索的双匹配区域预测

视频压缩感知中基于菱形快速搜索的双匹配区域预测杨春玲;戴超【摘要】多假设预测是视频压缩感知多假设预测残差重构算法的关键技术之一,但目前的多假设预测算法对运动剧烈的视频序列依然存在计算复杂度高且质量不佳的缺陷,而且由于观测值与真实信号是一对多的关系,只采用观测值的绝对误差和准则选择假设块容易引入噪声,从而限制了重构质量.针对这些问题,文中结合视频前/后景的运动特征,提出了基于菱形快速搜索的双匹配区域多假设预测算法(MH-DS),即利用菱形快速搜索方式确定当前解码块的前景/后景的运动矢量,获得两个最佳搜索窗,从中搜索多假设匹配块组;在匹配过程中,采用融合最小均方误差和最大匹配像素统计的块匹配准则,以得到更相关的假设块.仿真结果表明,基于菱形快速搜索的双匹配区域多假设算法能够有效地降低重构端多假设预测过程的计算复杂度,与现有最优视频压缩感知预测-重构算法相比,提升了预测精度和重构质量.【期刊名称】《华南理工大学学报(自然科学版)》【年(卷),期】2018(046)003【总页数】9页(P49-57)【关键词】视频压缩感知;多假设预测;菱形搜索;块匹配准则【作者】杨春玲;戴超【作者单位】华南理工大学电子与信息学院,广东广州510640;华南理工大学电子与信息学院,广东广州510640【正文语种】中文【中图分类】TN919.82006年Donoho[1]、Candès等[2]提出并论证了压缩感知(CS)理论,即只需要按照特定的条件将可压缩信号的高维信号投影到一个低维空间上,就可以通过重构算法利用少量观测值重建出原始信号,该理论突破了传统的奈奎斯特信号采集理论.之后压缩感知理论在图像/视频压缩与重建领域受到广泛的关注[3- 16].最初是对图像/视频帧直接观测,但实际应用中图像/视频帧的信息量较大,导致压缩感知中测量矩阵规模较大,计算复杂度较高.为此,文献[3]提出了分块压缩感知及其重构算法(BCS),即先对图像进行分块观测,再利用投影Landweber迭代算法重构,并在迭代过程中引入维纳滤波以消除重构图像的块效应.BCS算法提高了图像压缩感知的重构质量,大大降低了重构计算复杂度,被认为是图像压缩感知的经典重构算法,在图像和视频压缩感知研究中备受重视.文献[4]在BCS基础上,提出了在离散余弦变换(DCT)、离散小波变换(DWT)、离散双树小波变换(DDWT)域进行阈值处理的BCS算法(BCS-SPL),进一步提高了重构质量;将该算法应用到视频压缩感知中,实现了视频压缩感知重构,但由于没有充分利用视频的帧间相关性,重构性能不太理想.基于视频信号的帧间相关性,文献[5]提出了一种观测域多假设预测视频压缩感知重构算法,即将相邻帧作为参考帧,从参考帧中选取一组假设块的加权线性组合作为当前块的预测,然后对得到的更加稀疏的残差信号做稀疏重构,取得了很好的重构性能.基于多假设预测的视频压缩感知重构的相关研究的不断深入,使视频压缩感知的研究得到了突破性进展.在观测域多假设预测研究中,文献[5]提出的添加Tikhonov正则化项求解最优权值方法,具有计算简单和重构效果好的优点;文献[6]联合Iasso模型中的l1范数正则化及岭回归模型中的l2正则化求解最优权值;文献[7]提出了在l2范数正则化项中加入权重调整函数,并优化了假设集合.文献[6- 7]对权值分配求解过程作出了改善,重构质量得到了一定的提升,但计算复杂度大大增加,实用性不高.观测域多假设预测算法由于预测块的不重叠分块处理,使其预测结果和重构结果依然存在着块效应.因此,文献[8- 9]基于Tikhonov正则化多假设预测模型[5]提出了两阶段多假设预测模式,分为观测域多假设预测和像素域多假设预测,利用像素域灵活分块的特性,在像素域进行重叠块多假设预测,有效地削弱了重构图像的块效应,相比于文献[6- 7]的算法,重构质量更高且计算复杂度更低.但多假设预测方案[5- 9]依然存在如下不足:①对于运动剧烈的视频序列,如果需要匹配到较好的假设块,则需要扩大搜索范围,全搜索模式将导致计算复杂度呈指数级增长,不符合实际应用,如果限制搜索范围,则导致预测精度不高;②在观测域使用欧式距离作为相似块匹配准则不太合理,有可能引入新的噪声而降低重构质量.基于上述分析,文中在两阶段多假设预测重构[8- 9]的框架基础上,提出了一种基于菱形快速搜索的双匹配区域多假设预测算法(MH-DS),针对视频压缩感知多假设预测中方形全搜索模式预测精度与计算复杂度不能兼顾的问题,基于视频中前景和后景通常运动方向相反的事实,先以菱形快速搜索方式确定前景/后景的运动矢量,然后分别以两个运动矢量末端点为中心确定假设块双匹配域,以保证在计算复杂度增加幅度不大的前提下提高预测精度;针对观测域匹配准则的不合理性,文中提出了基于最小均方误差(MMSE)和最大匹配像素统计(MPC)的融合匹配准则来优化假设块集合.1 多假设预测算法视频压缩感知采用分块观测模式[10- 13],其主要原理为:将每个视频帧分成若干个不重叠的B×B大小的图像子块,对每个图像子块采用高斯随机观测矩阵Φ进行观测,即yi=Φxi(1)式中,xi为第i个图像块,Φ为M×B2维的高斯随机矩阵,yi为第i个图像块的观测值,采样率为M/B2.在视频压缩感知重构中,通常将整个视频序列分成若干个图像组(GOP).每个图像组的首帧为关键帧,其余帧为非关键帧.对于关键帧,利用CS重构算法进行帧内独立重构;对于非关键帧,由于视频帧间相关性非常大,故在当前帧的相邻几帧内大概率存在当前帧图像块的相似块,可以将相邻几帧作为参考帧[14]进行多假设预测.多假设预测的核心思想是选取一定数量的相似块作为假设块组,然后对假设块组加权线性组合以获得更接近于原始图像的预测帧,对于当前t帧中第i个B×B解码块,多假设预测的目的是尽可能使得预测信号与原始信号间的残差信号e的能量W(e2)最小,即W(e2)=min(2)式中:xt,i为列向量化的当前块;Ht,i为假设块组,维数为B2×K,每一列由列向量化的假设块组成,K为假设块的个数,w为权重列矢量.对式(2)中Ht,i的线性组合进行优化,则式(2)转化为(3)式中,wt,i为最优权值向量,利用最小二乘优化算法求解.由于在视频压缩感知中,解码端只有当前块的观测值矢量yt,i,yt,i=Φxt,i(4)因此,文中对式(3)采用观测域的优化方法求解wt,i:(5)由于各图像子块的观测点数通常小于假设块数量K,即方程个数小于未知数的个数,因此式(5)为不适定问题,文献[5]采用Tikhonov正则项来求解此问题,以的l2范数作为惩罚函数添加到目标函数式(6)中,即2(6)式中,为尺度参数,Γ为惩罚权重,则可以求得闭式解:(7)当前块的预测值为目前视频压缩感知重构最常用的是预测-残差重构框架[15- 16],即在多假设预测之后利用CS重构算法恢复出原始观测值与预测观测值之间的残差帧,再将恢复后的残差帧与预测帧相加得到最后的重构视频帧,其框图如图1所示.图1 预测-残差重构流程图Fig.1 Flowchart of prediction-residual reconstruction2 基于四步菱形搜索的双匹配区域多假设预测算法文献[5- 9]采取在参考帧中以当前待重构块的空间位置为中心的全搜索模式搜寻假设块,但在运动剧烈的视频序列中,由于图像块的运动速度较快,在参考帧中,与当前待重构块最相似的图像块可能已经远离它的空间位置,那么只能扩大搜索窗,但在全搜索模式中,搜索窗的扩大将导致计算复杂度呈指数级增长.另外,视频序列中的前景和后景通常运动方向相反,如果沿一个方向搜索确定一个运动矢量,很有可能只是当前图像块的前景或者后景信息所在的匹配区域,因此会丢掉前景或后景的有效信息.结合传统块匹配搜索方案并根据视频前/后景的运动特征,文中提出了基于菱形快速搜索的最优双匹配区域预测算法(MH-DS),其框图如图2所示,全搜索模式如图3所示.图2 中算法框架图Fig.2 Framework of the proposed algorithm2.1 基于菱形快速搜索的最优双匹配区域选择在搜索最优匹配区域的过程中,选用不同大小的搜索模版[17],如图4所示,黑点为中心点,红点与黑点组成小菱形搜索模版(SDSP),灰点与黑点组成大菱形搜索模版(LDSP).双匹配区域的菱形快速搜索步骤如下:(1)确定前景/后景初步运动位移点.以当前待重构块位置为中心在参考帧中构造LDSP,分别比较9个搜索点,找出其中最相似的两个点(搜索点所代表的图像块与当前块的均方误差(MSE)越小则越相似),这两个点的运动矢量表示前景和后景的运动方向,因此将这两个点称为前景、后景初步运动位移点.(2)搜索菱形模版.分别以前景与后景初步运动位移点为中心构建新的菱形搜索模版,若位移点(图5中蓝点)位于菱形搜索模版的中心,则以此位移点为中心点构建SDSP,并计算其中未被匹配计算过的点(图5(b)中红点),分别比较这5个搜索点,找出其中最相似的点作为更新相似点;若位移点位于原模板的其他位置,则以此位移点为中心点构建LDSP,并计算其中未被匹配计算过的点(图5(c)、5(d)中红点),分别比较这9个搜索点,找出其中最相似的点,将前景运动位移点或者后景运动位移点更新为最相似点.(3)若得到的前景运动位移点或者后景运动位移点位于菱形模版中心且在上一步搜索中菱形模版为SDSP,则停止搜索并将此点作为最终位移点;否则返回步骤(2),当且仅当步骤(2)重复执行3次后停止搜索并输出最终位移点.(4)生成双匹配区域.分别以上述菱形快速搜索算法得到的位移点a和b为中心构造匹配域,即得到双匹配区域,如图6所示.2.2 基于MMSE和MPC的最优假设块组的选择文献[5]假设块组为搜索窗内所有的图像块,这种假设块组的选取方式不但增加了计算复杂度,而且由于搜索窗内的假设块并不全是有效匹配块,反而会影响重构质量,因此只保留和当前块测量值的绝对误差和SAD最小的前若干块作为最优匹配块组[14],在降低计算复杂度的同时,也避免了低匹配度的噪声影响,在一定程度上提升了重构质量.但测量值的SAD大小并不能很好地反映假设块的好坏,考虑到在观测域多假设预测后,待重构图像已经包含图像块像素信息,文中提出了一种结合图像块像素信息、MMSE匹配准则和MPC的融合匹配准则来保证假设块集合最优.MPC可在像素域中计算,也可在观测域中计算(文中选择在像素域中计算),MPC阈值处理过程如下:(8)图3 以待重构块在参考帧的对应空间位置为中心的全搜索模式示意图Fig.3 Schematic diagram of the full search pattern with spatial location of the current block to reference frame as the center图4 菱形快速搜索模版Fig.4 Fast diamond search template图5 菱形搜索示意图Fig.5 Schematic diagram of diamond search图6 最优双匹配区域示意图Fig.6 Schematic diagram of the best double match regions式中,t为估算阈值,I(p)为当前块位于p点的像素值/观测值,R(p)为假设块位于p点的像素值/观测值.由式(9)可计算块中像素点的匹配个数[18](9)式中,I为当前块,R为假设块.若块中像素点的匹配个数越多即MPC 越大,则表示当前块与假设块越相近.文中提出的融合匹配机制选择假设块的具体步骤如下:(1)粗选假设块.若要为当前块选出最优的K个假设块,则利用像素域的MMSE和MPC以及测量域的MMSE匹配准则在搜索窗中分别选出3K个最优匹配块,共选出9K个匹配块(有重叠).(2)精选假设块.若3种匹配准则所选取的匹配块集合分别表示为O、M、N,则最终选取的匹配块集合为P=O∩M∩N.(3)控制误差.若匹配块集合P中的元素超过K个,则取前K个元素;若不足K个,则再从观测域MSE准则选取的匹配块集合C中选取MSE较小的元素补充至匹配块集合P,直至有K个元素为止.2.3 基于像素域信息的多假设块预测在假设块线性加权步骤中,式(6)中的Tikhonov正则项Γ为[5](10)文献[12]提出联合欧式距离与相关系数加权的Tikhonov正则项来改善文献[5]中的正则化失真,即(11)(12)(13)式中,E(·)和D(·)分别计算期望和方差,M维的y和yi,h分别为当前块和第i个假设块的观测值.为进一步改善预测性能,文中基于文献[12],结合第一阶段的像素域重构信息,将ci修改为(14)式中,M维的x和xi,h分别为当前块和第i个假设块的像素值.3 实验结果及分析为验证文中所提算法的有效性,将文中算法(MH-DS)与近年来视频压缩感知重构算法的最新算法进行性能对比.由于部分文献算法程序无法复制,为了保证对比的公平性,文中在与对比文献基本条件一致的情况下对比重构算法的性能.3.1 仿真实验结果及性能对比分析实验1 仿真条件与文献[6,8]中相同,GOP长度为16,采用6个qcif@15 Hz的标准视频序列(Foreman、Coastguard、Hall、Football、Soccer、Suize,每个序列取前96帧共6组GOP)进行测试,分块大小为16×16,观测矩阵为随机高斯矩阵,每个GOP的关键帧采样率均为0.7,采用BCS-SPL-DDWT算法[4]进行独立帧内重构;非关键帧采样率依次取0.1~0.5,采用预测-残差重构模型进行帧间重构,残差重构选用BCS-SPL-DDWT算法.各算法在不同采样率下的平均PSNR见表1,Soccer序列第2帧的重构视觉效果见图7.表1 不同非关键帧采样率下4种算法的平均PSNR对比Table 1 Comparison of average PSNR among four algorithms with different sampling rates for non-key frames视频序列重构算法PSNR/dBM/B2=0.1M/B2=0.2M/B2=0.3M/B2=0.4M/B2=0.5均值CoastguardwElasticNet[6]28.2430.3532.1933.8135.5432.02Fw_2sMHR[8]28. 9130.8232.4433.9435.4832.32Gw_2sMHR[8]28.8931.0132.8434.3636.0732.6 3MH-DS29.1131.2733.3434.7336.3732.97FootballwElasticNet25.9428.0129.7531. 0532.5129.45Fw_2sMHR26.4628.7330.4431.9133.4130.19Gw_2sMHR26.352 8.7230.5332.0333.5630.24MH-DS26.6728.9631.0632.5034.1130.66ForemanwElasticNet32.0234.9337.1439. 3141.4236.96Fw_2sMHR33.2536.1738.3840.1541.9237.97Gw_2sMHR32.973 5.9238.1540.1241.9937.83MH-DS33.5536.4339.1840.7142.4638.46HallwElasticNet32.1833.8435.0836.1237. 2834.90Fw_2sMHR32.8834.7636.2137.2638.0435.83Gw_2sMHR32.3134.283 5.6936.8437.6135.34MH-DS32.9634.9136.4737.5338.0735.98SoccerwElasticNet28.8931.8834.1836.49 38.5433.99Fw_2sMHR29.3232.4234.8136.5138.4234.29Gw_2sMHR29.0832.3 934.9136.9338.9734.45MH-DS30.0533.1235.8037.5939.5535.22SuizewElasticNet36.3338.4440.0841.544 3.0139.88Fw_2sMHR37.8240.0641.6343.0744.4241.40Gw_2sMHR37.5239.83 41.4843.0644.4841.27MH-DS37.9140.1141.9343.2544.7641.59图7 3种算法的重构视觉效果对比Fig.7 Comparison of reconstructed vision effect among three algorithms由表1可见,文中MH-DS算法对于各序列的PSNR均明显高于wElasticNet、Fw_2sMHR和Gw_2sMHR算法,在非关键帧采样率为0.1~0.5时,MH-DS算法对于6个序列的平均PSNR比wElasticNet算法的最大PSNR提高了1.71 dB,比Fw_2sMHR算法的最大PSNR提高了0.93 dB,比Gw_2sMHR算法的最大PSNR提高了0.77 dB.由图7可见:在wElasticNet算法的重构效果图中,3个运动员的小腿区域出现明显的模糊块,背景也极其模糊;在Fw_2sMHR算法的重构效果图中,模糊块虽然得到一定的改善,但依然在视觉上存在一定的模糊;在MH-DS算法的重构效果图中,小腿附近的模糊块基本消除,并且球员的球衣号码15大大增强了辨识度.这是因为在基于菱形快速搜索双匹配区域的多假设预测中,充分利用了观测信号的先验信息和视频的帧间相关性,并且在选取假设块的过程利用融合匹配准则,避免了虚假噪声块的干扰,从而提高了重构质量.实验2 实验条件完全按照文献[7,15]中给出的设置,采用3组CIF@30 Hz的标准视频序列(Foreman,Hall,Coastguard)的前88帧(GOP为8,关键帧采样率为0.7)进行实验,不同非关键帧采样率下文中算法与视频压缩感知算法HD-BDCVS[15]、Up-Se-AWEN-HHP算法[7]的平均PSNR如表2所示.从表中可知,在不同采样率下,MH-DS算法对Foreman、Coastguard、Hall序列的平均重构PSNR比Up-Se-AWEN-HHP算法分别高出1.71、0.71、2.23 dB,比HD-BDCVS算法分别高出2.83、1.00、1.38 dB.可见,在不同的采样率下,文中算法的重构性能都有一定的提升.这是因为在多假设预测中充分利用了先验信息,采用双匹配区域寻找的匹配块更加合理,更加符合视频运动特征.在观测域假设块匹配阶段,先利用像素域MMSE、观测域MMSE和MPC三种匹配准则,大范围剔除了不相关的匹配块,然后进一步选择同时符合3种匹配准则的假设块,避免引入噪声块而导致重构质量变差的情况出现.在权值分配上,文中算法更加注重匹配块与当前块的相关性,使得权重调整更为合理,因此重构质量得到提升.实验3 仿真条件完全参照文献[16]设置,即采用5个cif@30 Hz的标准视频序列的前16帧(GOP为8,关键帧采样率为0.7,非关键帧采样率为0.2),分块大小为32×32,各视频序列在不同算法下的平均PSNR如表3所示.由表中可见,对比文献[16]中算法,MH-DS算法的PSNR值提升明显,对Paris、Foreman、Silent、Mother-daughter、Akiyo视频序列分别提升了0.73、0.41、0.86、1.04和0.22 dB,这是因为MH-DS算法充分利用了有效信息,并且文中的块匹配准则精准性优于文献[16]的匹配准则,权值调整更为合理,因此得到了较高的重构质量.表2 不同非关键帧采样率下MH-DS算法与文献[7,15]算法的平均PSNR对比Table 2 Comparison of average PSNR among MH-DS and algorithms in references [7,15] with different sampling rates for non-key frames视频序列重构算法PSNR/dBM/B2=0.1M/B2=0.2M/B2=0.3M/B2=0.4M/B2=0.5均值ForemanHD-BDCVS[15]33.6236.2337.8839.5240.8837.62Up-Se-AWEN-HHP[7]36.1738.1539.6540.8642.0839.38MH-DS37.6339.3140.7041.8542.7840.45HallHD-BDCVS35.7537.3238.2439.2540.3238.17Up-Se-AWEN-HHP35.1536.5037.5138.3739.1137.33MH-DS37.2338.7639.8340.6141.3339.55CoastguardHD-BDCVS30.1532.4134.2336.4538.1034.26Up-Se-AWEN-HHP30.8632.9434.6736.2937.9934.55MH-DS31.8933.7235.3136.9338.4535.26表3 MH-DS算法与文献[16]算法的平均PSNR对比Table 3 Comparison of average PSNR between MH-DS and algorithm in reference [16]算法PSNR/dBParisForemanSilentMother-daughterAkiyo文献[16]32.5439.0137.844.6545.75MH-DS33.2739.4238.6645.6945.973.2 算法复杂度分析通过实验仿真对比了基于菱形块匹配搜索的多阶段多假设算法与基于全搜索的多假设预测算法的重构质量和时间复杂度,FS(32,32)表示全搜索窗大小为32,DS(16,16,4,2)表示本文的四步菱形搜索法,其中16为最终搜索窗半径,4为LDSP搜索步长,2为SDSP搜索步长;GOP为8,关键帧采样率为0.7,非关键帧采样率为0.1,都使用MH-BCS-SPL算法进行预测.文中的仿真实验环境为Inter Core i5 3.30 GHz处理器,内存4 GB,操作系统Wndows 7.所有仿真实验均在Mtalab R2014a上进行.表4给出了两个运动比较剧烈的序列(Soccer和Football)的前88帧的实验结果,其中时间复杂度以解码端平均每帧的多假设预测实际时间作为度量标准,PSNR为预测结果.由表4可知,菱形快速搜索匹配区域在保证重构性能的情况下,大大降低了匹配时间,这是因为菱形搜索算法满足视频序列运动矢量中心偏置分布特性,并且步长由大到小地逐步寻找最优匹配块的区域保证了匹配的精准性,避免了将大量计算成本用在与当前块并不相关的区域,有效地降低了寻找匹配块的搜索复杂度.表4 两种搜索算法的时间复杂度与重构质量对比Table 4 Comparison of time complexity and reconstruction quality between two searching algorithms视频序列FS(32,32)时间/sPSNR/dBDS(16,16,4,2)时间/sPSNR/dBSoccer19.3129.418.1629.28Football19.4526.328.3426.254 结论文中提出了基于菱形快速搜索的双匹配区域多假设算法(MH-DS),基于视频前/后景的运动特征,利用菱形搜索方式确定前/后景的运动矢量,然后分别以两个运动矢量的末端为中心建立两个匹配区域,在这两个匹配区域内搜寻假设块并进行多假设预测;采用融合最小均方误差(MMSE)和最大匹配像素统计(MPC)的块匹配准则,在假设块选择过程中利用两种匹配准则对假设块集合进行筛选,剔除其不相关的假设块,避免噪声块的干扰.文中所提出的菱形快速搜索算法中双匹配区域的设定很好地契合了视频前/后景的运动性质,与现有多假设预测算法相比,提高了预测精度;而双重匹配准则中由粗到细的选择假设块机制,进一步优化了假设块集合.仿真实验结果表明:相比于现有视频压缩感知重构算法,MH-DS算法的性能有了明显的提升,MH-DS算法的PSNR比HD-BDCVS算法的最大PSNR提高了2.8 dB左右;与全搜索方式相比,MH-DS算法的计算复杂度减少了一半以上;对于运动剧烈的视频序列,文中快速搜索算法在降低计算复杂度的同时还能保证视频重构质量,尤其在低采样率时,由于文中算法充分利用了有限的先验知识,故其重构效果提升更为明显.参考文献:[1] DONOHO D pressed sensing [J].IEEE Transactions on Information Theory,2006,52(4):1289- 1306.[2] CANDS E J,TAO T,ROMBERG J,et al.Exact signal reconstruction from highly incomplete frequency information [J].IEEE Transactions on Information Theory,2006,52(2):489- 509.[3] LU G.Block compressed sensing of natural images [C]∥Proceedings of the 15th International Conference on Digi-tal Signal Processing.Cardiff:IEEE,2007:403- 406.[4] MUN S,FOWLER J E.Block compressed sensing of images using directional transforms [C]∥Proceedings of IEEE International Conference on Image Processing.Cairo:IEEE,2009:3021- 3024.[5] CHEN C,TRAMEL E W,FOWLER J pressed-sensing recovery of images and video using multihypothesis predictions [C]∥ Proceedings of the 45th Asilomar Conference on Singals,Systems,andComputers.Pacific Grove:IEEE,2011:1193- 1198.[6] JIAN C,CHEN Y,DONG Q,et al.An elastic net-based hybrid hypothesis method for compressed video sensing [J].Multimedia Tools & Applications,2013,74(6):1- 24.[7] KUO Y,WU K,CHEN J.A scheme for distributed compressed video sensing based on hypothesis set optimization techniques[J].Multidimensional Systems & Signal Processing,2017,28(1):129- 148.[8] OU Wei-Feng,YANG Chun-Ling,LI Wen-Hao,et al.A two-stage multi-hypothesis reconstruction scheme in compressed video sensing [C]∥Proceedings of IEEE International Conference on Image Processing.Phoenix:IEEE,2016:2494- 2498.[9] 杨春玲,欧伟枫,戴超.一种视频压缩感知中两级多假设重构及实现方法 [J].电子与信息学报,2017,39(7):1688- 1696.YANG Chunling,OU Weifeng,DAI Chao.A two-stage multi-hypothesis reconstruction and two implementation schemes for compressed video sensing [J].Journal of Electronics & Information Technology,2017,39(7):1688- 1696.[10] 王蓉芳,焦李成,刘芳,等.利用纹理信息的图像分块自适应压缩感知 [J].电子学报,2013,41(8):1506- 1514.WANG Rong-fang,JIAO Li-cheng,LIU Fang,et al.Block-based adaptive compressed sensing of image using texture information [J].Acta Electronica Sinica,2013,41(8):1506- 1514.[11] 练秋生,田天,陈书贞,等.基于变采样率的多假设预测分块视频压缩感知 [J].电子与信息学报,2013,35(1):203- 208.LIAN Qiu-sheng,TIAN Tian,CHEN Shu-zhen,et al.Block compressedsensing of video based on variable sampling rates and multihypothesis predictions [J].Journal of Electronics & Information Technology,2013,35(1):203- 208.[12] 常侃,覃团发,唐振华.基于联合总变分最小化的视频压缩感知重建算法 [J].电子学报,2014,42(12):2415- 2421.CHANG Kan,QIN Tuan-fa,TANG Zhen-hua.Reconstru-ction algorithm for compressed sensing of video based on joint total vasriation minimzation [J].Acta Electronica Sinica,2014,42(12):2415- 2421.[13] 李然,干宗良,崔子冠,等.联合时空特征的视频分块压缩感知重构 [J].电子与信息学报,2014,36(2):285- 292.LI Ran,GAN Zong-liang,CUI Zi-guan,et al.Block compressed sensing reconstruction of video combined with temporal-spatial characteristics [J].Journal of Electro-nics & Information Technology,2014,36(2):285- 292.[14] 杨春玲,欧伟枫.CVS中基于多参考帧的最优多假设预测算法 [J].华南理工大学学报(自然科学版),2016,44(1):1- 8.YANG Chun-ling,OU Wei-feng.Multi-reference frames-based optimal multi-hypothesis prediction algorithm for compressed video sensing [J].Journal of South China University of Technology(Natural Science Edition),2016,44(1):1- 8.[15] CHEN Jian,WANG Ning,XUE Fei,et al.Distributed compressed video sensing based on the optimization of hypothesis set update technique [J].Multimedia Tools and Applications,2017,76(14):15735- 15754.[16] ZHAO C,MA S W,LIU J,et al.Video compressive sen-sing reconstruction via reweighted residual sparsity [J].IEEE Transactions on Circuits & Systems for Video Technology,2017,27(6):1185- 1195.[17] ZHU S,MA K K.A new diamond search algorithm for fast block matching motion estimation [J].IEEE Tran-sactions on Image Processsing,2000,9(2):287- 290.[18] CHEN M J,CHEN L G,CHIUEH T D,et al.A new block-matching criterion for motion estimation and its implementation [J].IEEE Transactions on Circuits and Systems for Video Technology,1995,5(3):627- 635.。

可预测起始搜索点的自适应准十字菱形搜索算法

可预测起始搜索点的自适应准十字菱形搜索算法

可 预 测起 始 搜 索点 的 自适应 准 十 字 菱形 搜 索算 法
叶 唏
( 京交 通大学 通信 与信 息系统北 京市 重点实验 室 , 北 北京 lo4 ) O 0 4

要 : 析 了视 频 图像 现 有块 匹配运 动估 计 的技 术特 点 , 分 通过 实验数 据 定量评 价 了各 算法 的优 缺
t g sa d d s d a t g s t r u h t e d t o r m x e i n s a e n ia V n a e h o g h a a g tf o e p rme t . An i r V d mo i n e t t n fs mp o e t s i i a t o ma o ag rt m sp o 0 e lo i h i r p s d,wh c sa a t e q a i r s— i mo d s a c l o ih b s d 0 r d c ie i i ih i d p i u s c o sd a n e r h a g rt m a e n p e itV n — V -
点 , 出的 一种 改进 的 自适应 运 动估计 算 法 : 于起 始搜 索点预 测 的 准 十 字菱 形搜 索算 法 . 算 法 提 基 该 根 据序 列 图像 中运动 矢量 的十 字 中心偏 置分布 特性 和 运动 矢量 间的 时 空相 关性 , 设计 了一 种 准十 字 菱形搜 索模板 , 对静 止块设 定 阈值 , 并 直接 中止搜 索; 结合起 始搜 索点预 测 , 并根据 运 动类 型 自适
Th l oih i hs p p r s b tn il mp o e h t n e t t n s e d whl e s rs t e eag rt m n t i a e u sa t 1 i r V s t e mo i si i p e , ay o ma o i n u e h e

基于新型十字-菱形搜索的块匹配算法

基于新型十字-菱形搜索的块匹配算法
wh c wo a y ih t s mme rc l e r h p t e n r mp o e .S mu a i n h w t a t ia a c a t r s a e e l y d s i l t s s o h tNCDS i p o e h e r h n p e o m r v st e s a c i g s e d b p t 0 ,a o y u o 2 s c mp r d t h r s — i mo d a g r h a e o t e c o s da n l o i m. t Ke wo d M o i n e t to y rs t si o ma i n。B o k ma c i g,n w r s — i mo d a g rt m l c — th n e co sda n lo i h
c o sda n e rh ( r s imo dsa c NCDS)ag rt m sn h s mmercda n e r hp te n i p o o e nt i p p r n lo ih u igt eay ti imo ds a c at r s r p s di hs a e ,i
TP 9 文 献 标 识 码 31 A 文章编号 1 7—3 1 2 0 ) 10 5 —3 24 2 (0 6 0— 0 10 6 中囤 分 类 号

Ne Cr s — a o e r h Al o ihm o o k Ba e oto tm a i n w o s Di m nd S a c g r t f r Bl c s d M i n Es i to
运动估 计是视 频压 缩 系统 中 的一个 重要组 成部
位 置进 行 搜 索 , 因此 , 时非 常 长. 此人 们 提 出了 耗 为

基于块匹配运动估计的自适应十字形搜索算法

基于块匹配运动估计的自适应十字形搜索算法

基于块匹配运动估计的自适应十字形搜索算法摘要:运动估计在运动补偿视频编码框架中起着重要作用。

由于详细搜索的高度复杂性,许多理想的替代快速搜索算法的建议,都是为了达到失真和搜索速度间最佳的平衡。

我们观察到,失真梯度是搜索点从全局最小点开始的在失真块表面上单调递减和单调递增过程。

基于这个特性,我们提出了一种新的自适应交叉搜索( ACS )的算法,它可以分配计算能力以提高搜索空间的效率。

模拟结果表明,ACS具有重建视觉效果以及减少计算量的竞争力。

关键词( 3-8字):运动估计,块匹配,运动补偿,视频压缩一引言在运动补偿视频编码系统中,它的优势是具有时间相关性的连续帧都实现了高压缩比,由一个参照系预测当前帧,只对预测误差和运动矢量进行编码和传送。

运动估计(ME),它的目的是找出连续帧之间的运动关系,在运动补偿视频编码框架中扮演重要角色。

在很多ME算法中,块匹配运动估计(BMME)由于它很简单,被广泛地采用在很多视频压缩标准中。

例如 MPEG-4 [1] 和H.263 [2].在BMME中,每一帧被分成块,运动估计算法在参照系中搜索最佳匹配块,并返回一个运动矢量表示块匹配的点。

全搜索块匹配算法彻底测试所有预定搜索窗口的候选位置,从而始终保证最佳的解决方案。

但是全搜索具有极高的计算复杂性,因此高度期待快速而准确地BMME 以减少编码延迟,同时保持视频品质。

许多快速的块匹配算法被提了出来。

三步搜索算法(TSS)是一种流行的快速运动估计,由于它的简单性和规律性。

他的二次抽样的候选位置在搜索空间内部是均匀的,基于偏向零点的运动矢量。

新三步搜索算法添加了8个接近零运动矢量的邻近搜索点。

另一个快速BMMEs算法包括两位对数搜索,十字搜索,基于块的梯度递减搜索,钻石搜索,等等。

这些快速搜索算法结合了不同的搜索策略和搜索模式。

它们有效的减少了计算的复杂性并使搜索的准确性接近全搜索。

在这篇文章中我们提出了一种自适应十字搜索(ACS )算法,可以有效地在搜索空间中分配计算能力。

运动估计算法比较 块匹配 全搜索 四步法 三步法

运动估计算法比较 块匹配 全搜索 四步法 三步法

大作业运动估计算法比较一、实验内容简要介绍各种运动估计算法,并比较不同运动估计算法的性能,主要考虑各算法的运算速度和精度。

二、实验背景视频原始图像中存在着大量的信息冗余,如时间冗余、空间冗余、信息熵冗余、谱间冗余、几何结构冗余、视觉冗余和知识冗余等等。

运动估计是视频压缩编码中的核心技术之一,采用运动估计和运动补偿技术可以消除视频信号的时间冗余以提高编码效率。

如何提高运动估计的效率,使运动估计算法的搜索过程更健壮、更快速、更高效成为目前研究的热点。

运动估计的基本思想是尽可能准确地获得序列图像帧间的运动位移,即运动矢量。

因为运动估计越准确,预测补偿的图像质量越高,补偿的残差就越小,补偿编码所需位数越少,需要传输的比特率就越小。

利用得到的运动矢量在帧间进行运动补偿。

补偿残差经过变换、量化、编码后与运动矢量一起经过熵编码,然后以比特流形式发送出去。

运动估计算法多种多样,大体上可以把它们分成四类:块匹配法、递归估计法、贝叶斯估计法和光流法。

其中块匹配运动估计算法因其具有算法简单、便于VLSI实现等优点得到广泛应用。

所以本文将重点介绍块匹配运动估计算法,并对各种块匹配算法在计算速度和估计精度上进行简单比较。

三、实验原理(一)、像素递归技术像素递归技术是基于递归思想。

在连续帧中像素数据的变化是因为物体的移位引起的,郑么如果沿着梯度方向在某个像素周圈的若干像素作迭代运算,运算会最后收敛于一个固定的运动估计矢量,从而预测该像素的位移。

(二)、块匹配运动估计块匹配运动估计是把图像帧划分为若干互不重叠的块,并以块为单位寻找目标帧中每块在参考帧(上一帧或者其它帧)中最优匹配的块的相对位置,假设图像中每块的大小为M×N,dxmax为参考块水平方向可搜索最大位移而dymax为参考块垂直方向可搜索最大位移那么基于块匹配的运动估计就是在参考帧(或者其它上一帧)的(M+2dxmax)×(N+2dymax)候选区搜索窗口中找到和目标帧的当前大小为M×N的块的最匹配的块则参考块的运动矢量可用如下的数学公式描述:R表示相关性评价函数,f(m,n)表示目标或当前帧图像的灰度值。

用于块匹配运动估值的正方形-菱形搜索算法

用于块匹配运动估值的正方形-菱形搜索算法

第25卷 第7期2002年7月计 算 机 学 报CH I N ESE J 1COM PU T ER SV o l .25N o.7Ju ly 2002用于块匹配运动估值的正方形-菱形搜索算法刘海峰 郭宝龙 冯宗哲(西安电子科技大学机电工程学院 西安710071)收稿日期:2001207216;修改稿收到日期:2002202228.本课题得到国家自然科学基金(69975015)资助.刘海峰,男,1978年生,硕士研究生,研究兴趣包括数字图像处理、图像通信、神经网络、模式识别等.E 2m ail :liuw est @ ;liuw est @sina .com .郭宝龙,博士,教授,博士生导师,主要研究领域为神经网络与模式识别、智能信息处理、电路与系统、图像处理、图像通信等.冯宗哲,副教授,研究生导师,研究方向有电路与系统、神经网络、模式识别等.摘 要 运动估值在视频图像编码中占有重要地位,该文首先研究了运动估值中的经典搜索算法并重点分析了菱形(D S )算法;然后设计了一种新的综合模板(SD P ),它体现了粗定位和准确定位并行处理的思想,在此基础上提出了一种新的用于块匹配的运动估值搜索算法——正方形2菱形搜索(SD S )算法.最后通过实验验证了该算法的有效性.关键词 块匹配,运动估值,菱形算法,正方形2菱形搜索算法中图法分类号:T P 391A Square -D i am ond Search A lgor ithm for Block M otion Esti m a tionL I U H ai 2Feng GU O B ao 2L ong FEN G Zong 2Zhe(S chool of M echan 2E lectron ic E ng ineering ,X id ian U niversity ,X i ′an 710071)Abstract T h is p ap er firstly analyzes som e typ ical search algo rithm s in m o ti on esti m ati on ,esp e 2cially the D iam ond Search (D S )algo rithm .It is found that these algo rithm s are all based on serial p rocessing ideas ,since their search step s can on ly be changed degressively ,in o ther w o rds ,first coarse locati on and second accu rate o rien tati on ,w h ich m ake the search b lindness.Secondly ,ai m ed at questi on s ex isting in these algo rithm s ,the au tho rs design a new in tegrative p attern —Square D iam ond Pattern (SD P ),w h ich is com po sed of a diam ond and a square .T he SD P can real 2ize con ten t 2based search fo r fo llow ing th ree po ssib ilities w hen it p erfo rm s m atch ing com p u tati on .If the m in i m um b lock disto rti on (M BD )po in t in the m iddle of the p attern ,it show s that i m age is still and com p letes search by one step ,if the M BD po in t is at one of the diam ond ’s fou r co rners ,it show s there is s m all m o ti on in the i m age ,if the M BD po in t is at one of the square ’s fou r co r 2ners ,it show s there is large m o ti on in the i m age .T he nex t step of search w ill adap tively u se dif 2feren t p attern acco rding to m o ti on typ es.T herefo re ,SD P is based on p arallel p rocessing idea of coarse locati on and accu rate o rien tati on determ ined by its structu re .T h irdly ,au tho rs p resen t a new Square 2D iam ond Search (SD S )A lgo rithm fo r b lock m atch ing m o ti on esti m ati on w ith SD P .F inally ,the resu lts of exp eri m en ts show that no t on ly the new SD S is m uch faster than traditi on 2al algo rithm s ,bu t also its PSN R and visual quality of the retrieval i m ages are better than tho se of o ther algo rithm s ,and as nearly good as that of FS .Keywords b lock m atch ing ,m o ti on esti m ati on ,diam ond search ,square 2diam ond search algo rithm (SD S )1 引 言对于视频序列图像,由于相邻的帧间存在很大的时间相关性,即时间冗余(tem po ral redundancy),所以通过减小这种时间冗余,可以提高视频编码效率.这方面一种有效方法是基于块匹配的运动估值(M o ti on E sti m ati on,M E),它目前已被许多视频编码标准所采纳,例如M PEG21、M PEG22、M PEG24、ITU2T H.261和H.263等[1,2].在块匹配算法(B lock2M atch ing A lgo rithm, BM A)中,首先将图像分割成M×N的宏块M B (M acro B lock),并假设块内像素作相同的运动,且只作平移运动,然后用当前图像的每一宏块在上一帧的一定范围内搜索最优匹配.最简单而且可靠的搜索算法是全搜索或穷尽搜索法(FS),它对搜索范围内的每一个像素点处进行匹配运算以得到一个最优的运动矢量M V(M o ti on V ecto r).但FS运算量太大,软件实时性不好.后来人们相继提出了许多快速搜索算法,例如三步法(T SS)[3],四步法(FSS)[4],二维对数法(TDL)[5],基于块的梯度下降法(BB GD S)[6],交叉法(CS)[7]和菱形法(D S)[8210],它们通过不同的搜索模板和搜索方式,在速度上的确比FS提高了许多,但性能都比不上FS,因为这些快速算法减少了搜索点数,因此,有必要寻找更加高效的(快速、准确)块匹配运动估值算法.本文通过分析D S算法指出现有的快速搜索算法都是基于串行处理机制,并在D S搜索模板的基础上,设计了使用大小模板并行处理的综合模板,并提出了一种新的搜索算法——正方形2菱形搜索算法(Square2D iam ond Search,SD S).最后的实验结果表明,本文提出的SD S算法速度和性能都明显优于D S等算法,其运动估计的准确性与FS相当.2 D S算法D S算法即菱形搜索(D iam ond Search)算法[8,9],是快速算法中性能最优异的算法之一,最近该算法被M PEG24VM标准所接受[10].2.1 D S算法的思想搜索模板的形状和大小不但影响整个算法的运行速度,而且也影响它的性能.块匹配的误差在搜索范围内构成了误差表面函数,该函数的全局最小点即对应着最佳运动矢量.由于这个误差表面通常并不是单调的,所以搜索窗口太小,就容易陷入局部最优;而搜索窗口太大,又容易产生错误的搜索路径.另外,统计数据表明,视频图像中进行运动估值时,最优点通常在零矢量周围(以搜索窗口中心为圆心,两像素为半径的圆内)[8],如图1所示.基于这两点事实,D S算法采用了两种搜索模板,分别是有9个检测点的大模板LD SP(L arge D i2 am ond Search Pattern)和有5个检测点的小模板SD SP(Sm all D iam ond Search Pattern),如图2和图3所示.搜索时先用大模板LD SP在搜索区域中心及周围8个点处进行匹配计算,当最小块误差M BD 点(M in i m um B lock D isto rti on)(M AD值最小的点)出现在中心点处时,将大模板LD SP换为SD2 SP,再进行匹配计算,这时5个点中的M BD即为最优匹配点;否则,改变中心点位置,仍用LD SP重复计算.847计 算 机 学 报 2002年2.2 对D S算法的分析D S算法的特点在于它分析了视频图像中运动矢量的基本规律,选用了两种形状的搜索模板LD2 SP和SD SP.先用LD SP大范围搜索,再用SD SP来准确定位,所以它的性能优于其它算法.但是,D S算法只是一种搜索策略的折衷处理,其性能上的缺陷表现在两个方面:(1)对于运动稍微大一点的图像,如果取常用的±7个像素点的搜索范围,速度就比不上FSS,因为FSS[8]采用5×5的正方形搜索窗,它的覆盖范围比LD SP大;(2)对于保持静止的图像序列,即运动矢量为零矢量的情况,D S算法必须要依次计算LD SP和SD SP两个模板的13个点,而理想情况是只需计算SD SP的5个点,即对于小运动搜索D S算法还有待改进.综合分析D S及其它快速算法后可以发现,它们都是基于串行处理思想的,即为了保证算法的效率和收敛性,搜索模板和搜索步长只能由大到小,先进行粗定位,然后再准确定位.这种串行搜索方式带有盲目性,不能根据图像的内容(运动类型)作灵活处理,这对小运动来说是一种浪费,而且当第一步的步长较大时还会误导搜索方向,影响搜索的速度和准确性.针对这些问题,本文提出了一种新的搜索算法——正方形2菱形算法(Square2D iam ond Search),简称SD S算法,较好地解决了上面几个问题,使得SD S在时间和性能上都优于以往的快速运动估值算法.3 S D S算法3.1 S D S 算法原理及描述SD S的模板是在D S的小模板基础上,增加向四周延伸的正方形的4个顶点,形成一个新的综合模板,称为正方形—菱形模板SD P(Square D iam ond Pattern),如图4所示.这也是该算法称作SD S的原因.SD S算法在进行运动估值的匹配运算时,有3种可能的情况,下面以具体的搜索步骤来说明:Step1.以搜索区原点对应SD P中心,在SD P上9个点处分别进行匹配计算,然后判断找出M BD点,若M BD点位于中心,说明图像是静止的,SD S算法一步结束,进行Step4;若M BD点位于正方形4个顶点处,说明图像的运动较大,则进行Step2;若M BD点位于菱形4个顶点处,说明图像的运动较小,则进行Step3;Step2.以上一次找到的M BD点作为中心点,进行与Step1相同的运算;Step3.以上一次的M BD点作为中心点,将SD P收缩为图5所示的菱形模板D P(D iamond Pattern),在5个点处分别计算,然后找出新的M BD点,若M BD点位于中心,则进行Step4;若M BD点位于周围4个点处,则重复Step3;Step4.将该中心点作为最佳匹配点,得到运动矢量;由此可以看出,SD S算法有如下特点:(1)SD S算法的搜索不需要经历模板由大到小的必然过程,有时一步即可完成搜索;(2)使用SD S算法,可以根据图像中的运动类型(如上述3种情况),自适应选择下一步相应的搜索模板,实现了基于内容的搜索,从而得到较好的估值结果;(3)直观地讲,SD P是正方形和菱形两种模板的组合,SD P综合模板的运算可以看作是两种不同模板并行运算的结果;(4)用SD P搜索时,正方形模板保持了大模板粗定位的特性,而菱形模板则有准确“聚焦”的特性,这从本质上体现了SD P是粗定位和准确定位的并行实施;上述特点说明SD S算法是基于并行处理的. SD S算法在搜索模板改变位置时,总有两个重叠的点,所以当重复使用SD P时只需计算7个新的检测点,重复使用D P时只要计算3个新的检测点,这就提高了搜索效率.图6给出了搜索过程中模板改变的3种情况.9477期刘海峰等:用于块匹配运动估值的正方形2菱形搜索算法3.2 S D S 算法分析SD S 算法在最低代价(最少检测点)下引入了大小模板并行处理的思想.运动较大时,可以持续用大步长来搜索,而同时保持了在局部范围内的“聚焦”特性,当真正遇到小运动时,又会灵活使用小步长的模板.例如零矢量的情况,SD S 算法只需检测9个点即可获得运动矢量,而其它算法如T SS 需要检测25个点、FSS 需要检测17个点、D S 也需要检测13个点.按视频图像运动矢量的统计规律,假设最佳点就在图1所示的圆内,对D S 和SD S 两种算法需要检测的点数进行比较,如表1所示,从表中可以看出SD S 总比D S 少1—4个搜索点.表1 比较D S 和S D S 在零矢量周围的搜索算法最佳点位置中心点半径为1处半径为2处半径为2处D S13131618SD S9121415文献[8]举了一个用D S 算法搜索到运动矢量(-4,-2)的例子,如图7所示,搜索共有5步,使用了四次LD SP 和一次SD SP ,总共搜索了24个点.图8是用SD S算法搜索到同样点的可能路径.可以看出,SD S 算法有四步,用了两次SD P 和两次D P ,总共22个点,每一步检测的新点数分别为9、7、3和3点.总之,SD S 要比D S 在速度上有所提高.SD S 算法和D S 算法一样,没有限制搜索的步数,而且搜索范围不必固定,所以使用起来非常灵活,同时SD S 算法的收敛性是可以保证的.由于M PEG 标准中对运动矢量编码时字长有限制,也即限制了最大搜索范围,所以在算法中我们也加入了边界条件的约束.4 实验分析下面用搜索时间和搜索准确性两个测度来验证SD S 的性能.实验采用C IF (Comm on In term ediate Fo rm at )标准灰度化序列图像,宏块大小为16×16,搜索范围为15×15,即±7个像素点,匹配准则为SAD ,即求和绝对误差(the Sum of A b so lu te D iffer 2ence ),其定义为SA D (i ,j )=∑Mm =1∑Nn =1 fk(m ,n )-fk -1(m +i ,n +j )(1)式(1)中,(i ,j )为位移矢量,f k 和f k -1分别为当前帧和上一帧的灰度值,M ×N 为宏块的大小.57计 算 机 学 报 2002年4.1 搜索时间搜索时间是这样测定的:分别在T enn is ,Sales 2m an 和M iss Am erica 序列中选3个宏块,各代表大运动、中等运动和小运动,然后分别用7种算法进行运动估计.实验是在P 866、256M 内存的PC 机上进行的,用V isual C ++6.0编程实现,为了时间测试的准确性,每个算法的运动估计都循环了10000次,相当于25帧352×288图像总的运动估值计算量,如此连续测试3帧.结果如表2所示,对每一类运动“1”、“2”、“3”表示连续3帧依次进行的运动估计.表2 搜索时间测试结果(时间单位:m s M V 单位:像素)序列算法FST SSFSSTDLCSD SSD ST ennis18602(0,0)1342(0,0)1792(0,0)1202(0,0)721(0,0)661(0,0)460(0,0)29674(0,4)1322(0,5)1161(0,4)1332(0,4)972(0,4)1112(0,4)1092(0,4)313590(0,7)1192(0,7)1152(1,5)1312(0,7)681(1,7)1062(0,6)1072(1,7)Sales m an111186(4,1)1342(7,3)1322(4,1)1662(6,2)991(4,0)1261(6,2)1261(4,1)210796(5,2)1422(3,1)1332(5,2)1602(4,2)761(6,2)1262(-3,2)1272(5,2)310235(3,2)1432(3,2)1402(3,2)1242(2,1)1061(4,2)1312(2,2)1011(3,2)M iss Am erica 18252(1,0)1372(1,0)1532(1,0)1242(1,0)761(1,0)671(2,0)621(1,0)29423(1,1)1362(1,1)1643(1,1)1242(1,1)1031(1,1)842(1,1)791(1,1)39194(1,1)1372(1,1)1562(1,1)1402(1,1)1041(1,1)851(1,1)791(1,1)从表2中可以看出:(1)FS 得到的运动矢量可以看作是最佳值,但时间消耗的确太大,最长时间为13590m s ;(2)对T enn is 序列,除TDL 外,其余算法都有误差,SD S 对(0,0)M E 用时仅为460m s ,几乎是FS 的1 20,对(0,7)的估计差了一个像素;(3)对Sales m an 序列,其它算法的准确性都很差,只有CS在速度上有一定优势,而SD S 不但M E 最准确,速度也较快;(4)对M iss Am erica 序列,M E 准确性都一样,但SD S 在速度上表现了其优越性.这些实验数据表明:以FS 的运动估值结果为标准,SD S 算法总体上比其它算法都快,而且性能与FS 相当.4.2 准确性比较比较方法:仅选取M iss U SA 序列,直接用各个算法得到的运动矢量,由上一帧恢复出当前帧图像(注:这里专门测试运动估值的效果,所以过程中跳过了图像编码和解码的部分),然后逐帧计算出PSN R .将所有146帧的PSN R 求平均值,结果如表3所示.表3 PSN R 比较算法FS T SS FSS TDL CS D S SD S PSN R av (dB )36.4235.1336.0136.0534.3136.1236.32表3中FS 的平均PSN R 最高,达到36.42dB ,说明效果最好;CS 最低,仅为34.31,SD S 为36.32,高于D S 、FSS 和TDL 等,仅次于FS 算法0.10dB .图9直观地显示了不同算法对相同序列(M iss Am erican )计算产生的PSN R ,图9(a )清楚地显示出SD S 的性能与FS 十分接近,而优于D S .图9(b )显示出SD S 比FSS 、CS 及T SS 等其它算法的性能提高很多.1577期刘海峰等:用于块匹配运动估值的正方形2菱形搜索算法实验结果表明:SD S算法不论在搜索时间还是搜索的准确性方面都优于现有的快速算法.5 结 论本文依据并行处理思想,设计了一种大小模板并存的综合模板SD P,提出了一种新的用于块匹配的正方形2菱形搜索算法SD S.实验结果表明,SD S 在时间和性能上都优于以往的快速运动估值算法. SD P体现了一定的生物视觉的特性,例如,人眼视网膜上神经元感受器的排列也是中央密(称中央凹),两边稀少,同时可以实现聚焦和大范围搜索的工作.这说明视觉系统中具有这种并行处理的规律.下一步我们将系统研究并行模板的结构,探索并行处理的原理.参考文献1V ideo Coding fo r L ow B itrate Comm unicati on.Internati onal T elecomm unicati on U ni on,ITU2T R ecomm endati on H.263, 1995.2Special Issue on M PEG24.IEEE T rans C ircuits System s fo r V ideo T echno logy,1997,7(2)3L i R,Zeng B,L i ou M L.A new th ree2step search algo rithm fo r block mo ti on esti m ati on.IEEE T rans C ircuits System s fo r V ideo T echno logy,1994,4(4):438-4424Po M L,M a C W.A novel four2step search algo rithm fo r fast block mo ti on esti m ati on.IEEE T rans C ircuits System s fo r V ideo T echno logy,19966(6):313-3175Jain J,Jain A.D isp lacem ent m easurem ent and its app licati on in interfram e i m age coding.IEEE T rans Comm unicati on, 1981,29(12):1799-18086L K L iu,E Feig.A block2based gradient descent search algo2 rithm fo r block mo ti on esti m ati on in video coding.IEEE T ransC ircuits System s fo r V ideo T echno logy,1996,6(8):419-423 7Ghanbari M.T he cro ss2search algo rithm fo r mo ti on esti m a2 ti on.IEEE T rans Comm unicati on,1990,38(7):950-9538Zhu S,M a K K.A new diamond search algo rithm fo r fast block2m atch ing mo ti on esti m ati on.IEEE T rans I m age P rocess2 ing,2000,9(2):287-2909T ham Y J,R anganath S,R anganath M et al.A novel unre2 stricted center2biased diamond search algo rithm fo r block mo2 ti on esti m ati on.IEEE T rans C ircuits System s fo r V ideo T ech2 no logy,1998,8(8):369-37710Tourap is M A,Shen G et al.A new p redictive diamond search algo rithm fo r block based mo ti on esti m ati on.In:P roc V isual Comm unicati ons and I m age P roceedings,A ustralia,2000,3: 1765-1773L IU Ha i-Feng,bo rn in1978,re2ceived the B.S.degree in m easu rem en tcon tro l engineering and apparatu s fromX idian U n iversity in1999.Cu rren tly heis m aj o ring the M.S.degree in signaland info rm ati on p rocessing in X idian U2n iversity.H is research in terests includedigital i m age p rocessing,i m age comm un icati on,neu ral net2w o rk s,and pattern recogn iti on.GUO Bao-L ong,m ale,received the B.S.,the M.S.and Ph.D.degree from X idian U n iversity in1984,1988and1995,respectively,all in comm un icati on and electron ic sys2tem.H e is cu rren tly a fu ll p rofesso r of pattern recogn iti onand in telligen t system at the X idian U n iversity.H is re2search in terests are neu ral netw o rk s,pattern recogn iti on,in telligen t info rm ati on p rocessing,i m age p rocessing and i m2age comm un icati on.FENG Zong-Zhe,m ale,received the B.S.degree fromX idian U n iversity in comm un icati on and electron ic system.H e is cu rren tly an associate p rofesso r of pattern recogn iti onand in telligen t system at the X idian U n iversity.H is re2search in terests are circu it and system,neu ral netw o rk s,pattern recogn iti on.257计 算 机 学 报 2002年。

基于空间关系的改进菱形块匹配策略

基于空间关系的改进菱形块匹配策略
Байду номын сангаас
z i n g d i a m o n d s e a r c h( D S )a l g o i r t h m.N e x t b y t a k i n g a d v a n t a g e o f t h e n e i g h b o r c o n t a c t b e t w e e n n e i g h b o i r n g b l o c k s ,i t d e s i g n s a n e w b l o c k
Ke y wo r d s B l o c k ma t c h Mo t i o n e s t i ma t i o n D i a mo n d a l g o r i t h m Vi d e o c o mp r e s s i o n
略来降低搜索次数 , 虽然在信噪 比方 面 比不上 E s法 , 但 是大 大
的视频还是流媒体都 得到 了极 大 的传 播 。在 帧间编码 中 , 由于 图像序列邻近 帧中的景 物存 在着一 定 的相关性 , 即 帧间存在 一
薛丽霞 王 祥 王佐成
( 重庆邮电大学计算机科学与技术学院 ( 重 庆邮电大学软件学院 重庆 4 0 0 0 6 5 ) 重庆 4 0 0 0 6 5 )


研究运动估计( ME ) 中的经典块 匹配算法 ( B M A) 并 重点分 析菱形 ( D s ) 算 法, 然 后利用 相邻块之 间 空间关系 , 设计 一种
T P 3 9 1
AN I MP ROVED DI AM oND BLo CK M ATCHI NG S TRATEGY
BAS ED oN NEI GHBoR CONTACT

基于方向自适应菱形搜索的运动估计算法

基于方向自适应菱形搜索的运动估计算法

基于方向自适应菱形搜索的运动估计算法
李荣;张其善;杨东凯
【期刊名称】《北京航空航天大学学报》
【年(卷),期】2008(034)009
【摘要】基于对运动矢量分布特性的研究,提出了一种基于方向自适应菱形搜索的运动估计算法.该算法对搜索起始点进行预测;设置"双阈值",针对匹配块提前中止搜索;并根据运动特征,自适应地选择小菱形模板和4种新型的方向自适应菱形模板,具有强烈的搜索方向性.实验结果证明,该算法不仅大幅度地减少了平均搜索点数,而且在一定程度上提高了重建图像的信噪比,其搜索速度和精度均优于传统的快速运动估计算法.
【总页数】5页(P1065-1069)
【作者】李荣;张其善;杨东凯
【作者单位】北京航空航天大学,电子信息工程学院,北京,100191;北京航空航天大学,电子信息工程学院,北京,100191;北京航空航天大学,电子信息工程学院,北
京,100191
【正文语种】中文
【中图分类】TN919.81
【相关文献】
1.基于新方向性菱形-弧形搜索的运动估计算法 [J], 林舒静;陈坚
2.基于方向自适应采样搜索的快速运动估计算法 [J], 王强;李月娥
3.基于方向自适应十字搜索的快速块匹配运动估计算法 [J], 杨恒;王庆
4.自适应方向菱形搜索快速运动估计算法 [J], 孙涛;王宏霞
5.基于小菱形搜索模板的运动矢量估计算法 [J], 杨磊;贾彦斌;徐文莹;薛红平因版权原因,仅展示原文概要,查看原文内容请购买。

基于改进的十字-菱形搜索算法的运动估计

基于改进的十字-菱形搜索算法的运动估计

基于改进的十字-菱形搜索算法的运动估计
刘海华;雷奕;谢长生
【期刊名称】《数据采集与处理》
【年(卷),期】2006(21)4
【摘要】通过对序列运动矢量概率分布分析,发现了该概率分布的方向性特性,提出了一种新的块匹配运动估计算法--改进的十字-菱形搜索(ICDS)算法.该算法在搜索的初始阶段使用小十字搜索模型对小运动矢量进行搜索,强调运动矢量分布的中心偏置特征;而对于大的运动矢量使用具有方向性的菱形搜索模型进行搜索,强调运动矢量分布的方向性,从而提高了运动矢量的搜索速度.该算法与菱形(DS)和十字-菱形块(CDS)匹配算法相比,在保证搜索质量的前提下,其搜索速度分别可以提高60%和35%.理论分析和实验结果证明ICDS算法有效,且具有较强的鲁棒性.
【总页数】6页(P403-408)
【作者】刘海华;雷奕;谢长生
【作者单位】中南民族大学电子信息工程学院,武汉,430074;华中科技大学计算机科学与技术学院,武汉,430074;中南民族大学电子信息工程学院,武汉,430074;华中科技大学计算机科学与技术学院,武汉,430074
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于菱形搜索算法的运动估计器的FPGA实现 [J], 李旭;刘军民;刘军
2.基于块运动类型的自适应菱形运动估计搜索算法 [J], 杨晓珍;吴延海;王锋
3.改进的十字-菱形运动估计搜索算法研究与实现 [J], 刘海华;雷奕;谢长生
4.改进的十字菱形搜索算法INCDS [J], 张万绪;吴佳丽;赵丽平;李应超;艾娜
5.十字-菱形快速运动估计搜索算法改进 [J], 孟伟;李华
因版权原因,仅展示原文概要,查看原文内容请购买。

基于VOP的块特性的自适应十字搜索模式运动估计法

基于VOP的块特性的自适应十字搜索模式运动估计法

基于VOP的块特性的自适应十字搜索模式运动估计法
夏金祥;黄顺吉
【期刊名称】《通信学报》
【年(卷),期】2005(26)8
【摘要】提出的利用VOP的块特性的自适应十字搜索模式运动估计法(ARPS-CB-VOP)充分利用VOP的块的特性,不同的块采用不同的运动估计策略.VOP的边框内块分为透明块、边界块和模糊块.当前块为透明块时,不进行运动估计,由解码端直接生成.当前块为边界块时,参考帧不填充,边界块间的SAD计算采用二值α平面值计算.当前块为模糊块时,模糊块的SAD计算采用灰度值计算.另外,对进行运动估计的块,先排除静止块,对运动块,采用自适应十字搜索模式.利用ARPS-CB-VOP法极大地提高了搜索效率,同时计算量显著减少,并且具备较好的峰值信噪比,是一种较有潜力的运动估计和补偿算法.
【总页数】5页(P117-121)
【作者】夏金祥;黄顺吉
【作者单位】电子科技大学,电工学院电子工程系,四川,成都,610054;电子科技大学,电工学院电子工程系,四川,成都,610054
【正文语种】中文
【中图分类】TN91
【相关文献】
1.用于快速块匹配运动估计的自适应十字模式搜索 [J], 王晓燕;郑建宏
2.基于块特性与自适应搜索窗口的运动估计算法 [J], 赵永利;陈进成;马健;朱宝忠;张杰
3.利用块特性的自适应十字搜索模式运动估计法 [J], 夏金祥;黄顺吉
4.一种基于块分类的自适应运动估计搜索算法 [J], 冯文江;向宫
5.基于方向自适应十字搜索的快速块匹配运动估计算法 [J], 杨恒;王庆
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第25卷第1期 中南民族大学学报(自然科学版) V o l.25N o.1 2006年3月 Journal of South2Central U niversity fo r N ati onalities(N at.Sci.Editi on) M ar.2006α基于新型十字—菱形搜索的块匹配算法雷 奕 陈州徽 刘海华(中南民族大学电子信息工程学院,武汉430074)摘 要 指出了块匹配算法是运动估计的有效方法,搜索模板的类型、大小很大程度上影响了搜索的效果.对运动向量的分布进行了深入研究,提出了以新型非完全对称的搜索模板为基础的十字—菱形搜索算法.该算法以十字搜索模型对小运动矢量进行搜索,而使用非完全对称菱形对大运动矢量进行搜索.理论分析和实验表明:新十字菱形算法和原有的十字菱形算法相比,其搜索的速度可以提高20%左右.关键词 运动估计;块匹配;新十字-菱形搜索算法中图分类号 T P391 文献标识码 A 文章编号 167224321(2006)0120051203New Cross-D i am ond Search A lgor ithm for Block Ba sed M otion Esti m a tionL ei Y i Chen Z houhu i L iu H a ihuaAbstract In block2m atch ing mo ti on esti m ati on,the search pattern w ith different shape and size can i m pact the search perfo r m ance very m uch.Based on the study of the search pattern and the mo ti on vecto r distributi on,a new cro ss diamond search(N CD S)algo rithm using the asymm etric diamond search pattern is p ropo sed in th is paper,in w h ich tw o asymm etrical search patterns are emp loyed.Si m ulati ons show that N CD S i m p roves the search ing speed by up to20%,as compared to the cro ss2diamond algo rithm.Keywords M o ti on esti m ati on,B lock2m atch ing,new cro ss2diamond algo rithmL e iY i M aster′s Candidate,Co llege of E lectronics and Info r m ati on Engineering,SCU FN,W uhan,430074,Ch i2 na 运动估计是视频压缩系统中的一个重要组成部分.其基本的原理是利用视频图像序列中相邻帧之间存在的时间相关性,建立序列相邻帧之间表达上的相互关系,从而减少时间冗余,提高视频压缩编码的效率.运动估计的方法主要分为两类:块匹配算法(BM A)和像素递归算法(PRA).其中块匹配运动估计是一种简单而有效的视频压缩编码方法.BM A 就是把当前帧分成M×N个宏块(M B),然后以M B 为单位,以一个预先定义的匹配标准为参考,并以参考帧中相对应块为中心的搜索区域中进行搜索,寻找一个最佳匹配块.则当前块和最佳匹配块之间的偏移为该块的运动向量(M V).最简单且最可靠的块匹配算法是全搜索算法(FS),该算法对所有可能位置进行搜索,因此,耗时非常长.为此人们提出了各种改进的快速算法,如:三步搜索法(T SS)[1]、新三步搜索法(N T SS)[2]、四步搜索法(4SS)[3]、菱形搜索法(D S)[4]和十字菱形搜索算法(CD S)[5]等.这些算法采用不同的搜索点模型和搜索方法,其目的是为了使得搜索所得到的运动向量值能够更接近全搜索所获得的运动向量值,其中CD S是目前性能最好,搜索时间最快的算法.为了更进一步提高性能,加快搜索时间,本文对CD S进行了改进,提出了一种利用新型的非完全对称搜索模板的搜索算法新十字菱形搜索法(N CD S).1 运动向量的分布在快速匹配算法当中,不同类型、大小搜索模板α收稿日期 2006201220作者简介 雷 奕(19822),女,硕士研究生,研究方向:图像处理与传输,E2m ail:w ingclouds@m 基金项目 国家民委自然科学基金资助项目(M ZZ04004)很大程度上决定了搜索的效果和效率.为了获得更好的效果,确定搜索模板的类型,必须分析运动向量分布的状况.纵观快速算法的发展过程,人们提出新的搜索模板,以确定的新搜索算法,都是建立对现实序列运动向量分布完成的.三步搜索算法使用的大正方形的搜索点模板,是依据人们假设运动向量都是均匀分布的,因此利用正方形搜索点模型均匀的对搜索窗内的点进行搜索.随着人们对现实视频序列进行深入研究后发现序列的中心偏移性(M VD),即实际中绝大多数图像序列的运动都很小,其运动矢量分布通常集中在搜索窗的中心位置附近.因此,利用比以前小的搜索模板,提出了N T SS、4SS等搜索方法;当发现现实序列的菱形中心偏移性(DCB)和十字形中心偏移性(CCB),于是利用菱形搜索模板和十字搜索模板,提出了D S和CD S[4,5].与以前的算法,它们搜索点的更少,却可以获得更好的搜索效果,尤其是针对运动位移比较小的运动序列.表1 8个常用测试序列序列格式序列名称C IF(352×288)Coast2guard,Fo r m an,Silent,M iss2Am ericanS IF(352×240)Foo tball,Garden,Stefan,T ennis表2 8个序列在 w ≤7平均概率分布垂直方水平方向半径向半径0123456700.31270.15110.13940.03790.01630.01270.00590.018510.06180.03880.01660.00960.00740.00580.00420.011220.01220.00920.00570.00610.00320.00200.00180.005930.00560.00450.00320.00450.00220.00140.00160.004840.00400.00270.00210.00220.00180.00100.00130.003950.00190.00290.00150.00200.00120.00080.00080.004060.00350.00190.00110.00140.00180.00070.00120.003470.00280.00190.00150.00310.00240.00200.00220.0113 本文对表1所列举的8个序列进行测试,并统计这些序列运动向量分布.其中表1所列举的视频序列为不同种类型的标准常用序列,其运动矢量的平均概率分布如表2所示.横向为水平方向半径的绝对值,纵向为垂直方向半径的绝对值.测试通过全搜索搜索算法进行,并以绝对差和(SAD)为匹配准则;同时,所有序列采用16×16的搜索块,7×7的搜索窗.从表2中可观测到实际序列的平均概率分布具有明显的十字形中心偏移性CCB.因此,Cheung C2 H等提出了CD S算法,并且被广泛应用.在CD S算法中,主要采用了3种搜索模板,十字形,大、小菱形.其搜索过程首先采用十字形的模板,因为沿十字方向分布的概率最大,如表2第1行和1列的概率分布,这种搜索是非常有效的;然后,利用大模板搜索.但是,菱形结构搜索所需要的搜索点较多,因此需要重新设计.根据上述运动矢量的分析可以预测图像运动矢量分布具有方向.为了更有效地进行搜索,节约搜索点数,因此不使用大模型的菱形搜索方法,而是根据完成初始搜索后,运动矢量次数按照两种条件进行统计:条件1:当点(±2,0)是初始搜索的最佳匹配点,如表3;条件2:当点(0,±2)是初始搜索的最佳匹配点,如表4.表3 满足条件1的运动向量分布垂直方水平方向半径向半径01234567-20522312521099686300-10199883754668960284563 0005555913695330622078412245 10182986556313271235725 2070223286140112121463表4 满足条件2的运动相量分布垂直方水平方向半径向半径-3-2-10123 551356214561325745810212347218383623106129227106840721914622342635102921557167185921380116133311046000000 由表3和表4我们可以看出,运动向量的方向是可以通过初始搜索所获得的最佳匹配点进行预测的.在表3中,运动的向量分布主要集中在水平方向的分布;而在表4中,运动向量主要集中在垂直方向的分布.根据运动矢量分布的这种特性,将搜索模型分为水平方向和垂直方向两种类型,并由前一个步骤中所得到的匹配点的方向来确定此次所需要使用的搜索点的模板.2 新十字菱形算法2.1 搜索模板根据上述分析,提出了新十字菱形算法(N CD S).该算法在搜索过程中的第一步、第二步采用和CD S算法一样的搜索模型,如图1(a)所示的大、小十字形搜索模型(SCSP,L CSP).在后继的搜索中,把大菱形搜索模型上的点,依照水平方向和垂直方向把它压缩成水平菱形搜索模型(HD SP)和垂直菱形搜索模型(VD SP),如图1(b)和1(c)所示. 2.2 新十字菱形算法搜索步骤步骤1 以搜索窗口中心为起始点,使用L CSP 进行搜索,如果最小的SAD是中心点,则进入步骤5,否则,进入步骤2;25 中南民族大学学报(自然科学版)第25卷(a)SCSP L CSP (b)HD SP (c)VD SP图1 搜索模型步骤2 若最小的点是在(±1,0),或者(0,±1),则以最小点为中心,利用SCSP搜索,例如,最小的点是(1,0),则继续搜索(1,1),(1,-1),如果最小SAD点仍然在中心点,则进入第5步,否则,进入步骤3;步骤3 首先确定获得的最小SAD点相对于中心点是水平方向,还是垂直方向,若是水平方向,则采用HD SP模型进行搜索,若是垂直方向,则VD SP 模型进行搜索.如果找到的点是中心点,则进入到步骤4,否则重复步骤3;步骤4 使用SCSP继续查找剩下的两个点(图1(b)或图1(c)中被挖空的两个点),找到最小的SAD 点,进入到步骤5;步骤5 以该点作为最佳匹配点,得到运动向量. 3 实验结果为了验证搜索算法效果,将表1中所列举的序列在通用PC上进行测试.为了衡量搜索算法的效果,从4个方面来考察算法的性能:(1)信噪比PSN R;(2)每个宏块的搜索点数;(3)与真实运动矢量(即全搜索获得的运动矢量)的距离;(4)相对于全搜索算法速度加快的比率.如表5列举了4个常用C IF格式的标准测试序列(前100帧)使用不同块匹配搜索算法进行搜索的结果.由表5可以看出,对于运动位移比较小的序列,如M o ther and D augh ter,Silen t序列所示,N CD S算法和CD S算法相比,其搜索速度分辨提升了12.2%,7.4%;对于运动比较剧烈的序列,如Ste2 fan,Coast2Guard序列所示,其搜索速度分辨提升了25.0%,26.8%.这说明N CD S算法相对CD S算法而言其搜索速度有所提高,并且对于大运动序列搜索速度的改善要不小运动序列的速度改善大.该结果验证了运动矢量分布的方向性.从搜索质量PSN R值可以发现,N CD S算法与CD S相比有轻微的下降,但其下降值在0.06以内,对图像质量几乎没有影响.从N CD S搜索结果与“真正”运动矢量之间的距离同样可以发现其搜索质量与CD S基本相同.这说明N CD S算法在保证搜索质量的前提下,改善了运动估计的搜索速度.表5 标准测试序列不同算法搜索结果SEQ BM A PSN R N SP D IS RA T I OFS38.2145204.28301.003SS38.102923.28561.11678.77M o ther and4SS38.112216.85881.042312.12D augh ter D S38.114813.61721.030915.00CD S38.072711.40911.033517.91N CD S38.052810.01481.038720.40FS34.4047204.28301.003SS34.20923.21350.184598.80 Silent4SS34.105516.39860.1965412.46D S34.057713.2010.1931715.47CD S33.978710.36350.2074919.71N CD S33.91359.59910.2307521.28FS23.4701204.28301.003SS23.0623.30180.921728.774SS22.559518.74911.250510.90 Stefan D S22.522917.27611.205211.82CD S22.443617.54831.245311.64N CD S22.398813.16911.262915.51FS28.1561204.28301.003SS27.899923.28420.284538.77 Coast2Guard4SS27.892318.57480.2798511.00D S27.970616.72420.2311312.21CD S27.963317.0590.2355811.98N CD S27.951212.48660.2429116.36 4 结语本文根据运动矢量分析方法,提出了一种新十字菱形快速块匹配运动估值算法.经过测试分析,新十字菱形算法和原有的十字菱形算法相比,搜索的速度进一步加快,其搜索的速度可以提高20%左右.参 考 文 献[1] Koga T,Iinum a K,H irano A,et al.M o ti oncompen2sated interfram e coding fo r video conferencing[J].P roc N TC81,1981,11:C9612965.[2] L i R,Zeng B,L i ou M L.A new th ree2step search al2go rithm fo r block mo ti on esti m ati on[J].IEEE T ransC ircuits Syst V ideo T echno l,1994,4(8):4382443.[3] Po L M,M aW C.A novel four2step search algo rithmfo r fast block mo ti on esti m ati on[J].IEEE T rans C ir2 cuits Syst V ideo T echno l,1996,6(1):3132317.[4] T ham J Y,R anganath S.R anganath M,et al.A nov2el unrestricted center2biased diamond search algo rithmfo r block mo ti on esti m ati on[J].IEEE T rans C ircuitsSyst V ideo T echno l,1998,8(4):3692377.[5] Cheung C2H,Po L2M.A novel cro ss2diamond searchalgo rithm fo r fast block mo ti on esti m ati on[J].IEEET rans C ircuits Syst V ideo T echno l,2002,12(12):116821177.35第1期 雷 奕,等:基于新型十字—菱形搜索的块匹配算法 。

相关文档
最新文档