数字视频处理中的块匹配运动估计技术

合集下载

视频压缩中运动估计块匹配算法分析与研究

视频压缩中运动估计块匹配算法分析与研究

应用。 1运动估计 的基本原理 11 动估计 的基本思想 .运 运动估 计的基本 思想是 将帧 分成 许多 互 不重叠的宏块或其 它大小 的块 ,假设 当前帧中 的象素块 是前一 帧或后一帧 图像 中某个象素块 移动而来 , 未发生移 动, 或 宏块中的每个 象素 均 做相同的运 动并认为宏块 内所有像素的位移 量 都相同 。 然后根据 匹配准则 。 对当前帧中的每一 块到前一 帧或后一 帧在某一给定搜索范围内找 出与当前 块最相 似的块 , 即最佳匹配块。 由最佳 匹配块与 当前 块的相对位置计算 出运动位 移 , 该位移即为当前块 的运动矢量。 1 . 匹配准则 2块 块匹配准则是判断块相似程度 的依 据 , 因 此 匹配 准则 的好坏 直接 影响 了运动 估计 的精 参 考 文 献 度, 也是提高运动估计算法 的速度 的一种途径。 算法采用 比较实用 的绝对误差和 D 准刚。 A ) 与 的运动矢 量之差 的绝对值都小 于给定 的 I le og L uWe u . lc — a e at — l  ̄ n i. i nB o k B sd F s t S Mo in t mai n l o i h n d, o e— 2 常见运动估计搜索算法与分析 阈值 L ,则认为与 c块相邻 的各块之 间运动 的 to Esi to A g rt ms i Vi e, C mprs i m h  ̄ Au u s 4 1 98 8 1 . 最 简单 的块 匹 配 运 动估 计 是 全 搜 索 法 相关性较高 ,表明该区域的变化 比较 平缓 。否 so T e , g e t 2 . 9 : — 0 (u er , S ,它穷尽参考帧搜索窗内所 有 则 。 F l Sa h F ) l c 认为与 c块 相邻的各块 之问运动 的相关性 【】 2叶学兵. 视频 压缩 中运 动估计 的研 究【 】 D.硕 表明该 区域变化 比较剧烈日 。 士 论 文 : 化 工 大学 2 0 .1 1 北京 051: . 3 可能的点进行比较 。找 到块匹配运动估计最小 较低 , r1 德 宝. 于 H. 4的 帧 内 与 帧 间预 测 方 法 3王 基 2 6 的匹配块 。F 是最 直接的搜索方 法 , S 也是精度 3 D A 法搜 索模板 的选择 .AS 算 3 最高的搜索方法。但 运算 量大 , 占到整个编 D. 硕 合 0. 94 . 5: 由于 A S D A算法搜 索过程 中要判 断搜索 方 研 究 『1 士 论 文 : 肥 工 业 大 学20 7 3 —4 4李戌祯. 频压缩中运动估计 算法的研 究【】 视 D. 码运算量的 7 ‰ 9 O ∞ 。 向并按搜索方 向进行探测 , 以采用 的搜索 模 f】 所 SS 2 0 .4 57 F s巨大的时问开销 不利于视频实 时编码 式应该具有较强 的方 向性。 D P方 向性较强符 太原 理 工 大 学硕 士 论 文 ,0 8 : . 5宗 H. 6 朔压 的应用 , 因此 , 很多学者研 究并提 出了各种类型 合 这一点被本算法采用 ,同时采用了六边形模 『1 怡. 2 4视 li 缩 关 键 技 术 的研 究 与 应 用 的快速算法 : 三步搜索法、 交叉搜索法 、 四步法 、 式 , 并对其搜索方 向进行 了极化 : 由六边形搜索 [I 士论 文: 大 学 , 0 . 1. D. 硕 中北 2 8 :3 0 5 作者简介 : 郭孝存( 7 -, 山 东成武人 , 1 7) 9 男, 菱形搜索法 、 六边形搜索法等。 这些算法 中菱形 得 出的 S D值最小点非 中心点 时 , A 如果最小点 内蒙 古科 技 大 学信 息 工程 学 院在 读 硕 士 , 搜索算法性能 比较优越 ,被 国际视频压缩标准 的 Y坐标 与 中心 点 同 ,则 直 接 用 中 心 点 到该 点 讲 师 , 视 H24 . 标准和 M E - 标 准所 采用。六边形搜 的方 向为新 的搜索方 向;否则取与中心点 到该 研 究 方 向 : 频 图像 压 缩 研 究 。 6 PG4 索算法是菱形搜索法的一种改进算法 ,它将菱 点 的方 向相近似 的 Y 轴方 向为新 的搜索方向。 形搜 索法(S的大菱形搜 索模式(D P改成六 I) ) L S) 34 A A算法的步骤 . DS 第一步 ,根据时空上的相关性确定出当前 边形模式 , 小菱形搜索模式( S )j S P 然保 留。 D  ̄ 改 进 后的优点为 : 六边形模式 更接近于 以 2为 块的预测运 动矢量 , 出初始搜索点并 作为搜 得 半 径的圆 , 使得搜 索效率更高 .. L S b比 D P减少 索中心点 。 第 二步 ,由相关性分析判断 出搜索当前搜 2个搜索点 。 以上算法 中基本都 是先用 大搜索 模式 在 索块与相邻块之 间的运动相关性 ,如果相邻块 则进入第三步 ; 否则进人第 定范 围内搜索 , 再用小模式进行 “ 聚焦” 位。 之间的相关性 较低 , 定 但 是这些算法在背景静止的视频序列 中 , 其 四步搜索。 尤 是 对那 些 运 动 矢 量 近 乎 为 零 的 块 的运 动 估计 搜 第 三步 ,选择六边形搜索模式搜索匹配计 个 A A 索 , 在很大的计算冗余, 存 而且对所有 的参考 图 算相应 的 7 点的 S D值 ,如果最小 S D值 像都采用固定 的步长 。无法兼顾对运 动剧烈 的 不在中心 , 则将该点标记 为准最优 匹配点 , 进入 否则转入第四步。 图像和变化缓慢 的图像 :对于运动剧烈的图像 第五步 , 第 四步 ,选择 S S 模式 搜索匹配计算相 DP 会 出现局部最优 现象 。对于变化缓慢 的图像出 应的5 个点 的 S D值 ,如果最小 S D值在 中 A A 现计算冗余现象。

一种快速运动矢量场搜索的块匹配运动估计算法

一种快速运动矢量场搜索的块匹配运动估计算法

宁波大学学报(理工版)首届中国高校优秀科技期刊奖JOURNAL OF NINGBO UNIVERSITY ( NSEE ) 浙江省优秀科技期刊一等奖一种快速运动矢量场搜索的块匹配运动估计算法摘要: 运动估计作为实时视频编解码中最重要最耗时的部分,大量的研究都是通过减少搜索点数来降低计算量。

而块匹配算法以其简单、高效,便于硬件实现等优点被使用到运动估计中。

针对这一特点,提出一种基于块匹配的快速运动矢量场搜索算法(FMVS)。

FMVS算法通过将视频序列时间相关性与空间相关性相结合,提出的一种新算法。

该算法包括以下五部分:预测搜索起点、动态阈值进行静止块判断、方向性类型判定、运动类型判定及混合模板运用。

对视频标准测试序列的实验结果表明,该算法较MVFAST算法,搜索点数降低30%-50%,对于运动复杂的视频序列峰值信噪比提高0.21dB。

关键词: 运动估计;块匹配算法;运动矢量场;(矢量场自适应搜索)MVFAST;峰值信噪比中图分类号: TP393 文献标识码: A 文章编号:对于视频序列图像,由于相连帧之间存在很大的时间相关性,通过减少时间冗余,可以提高视频编码的效率。

而基于块匹配算法以其简单、高效,便于硬件实现等优点,已经被许多视频编码标准所采纳。

运动估计算法占整个编码器的60%~80%的运算量,很大程度决定编码器的效率。

在块匹配运动估计算法中,全搜索算法精度最高,但是运算量也最大大。

为了解决运算量大,产生了很多快速搜索算法。

一类是快速算法是按照某种搜索策略只对搜索窗口的相关参考点进行计算;如一些经典算法3步法[1],菱形搜索算法[2],六边形搜索算法[3]。

菱形搜索算法,六边形搜索算法为了避免局部最优,采用大的搜索模板,但带来了搜索点数的大量增加;而小菱形搜索算法采用小菱形减少搜索点数,但是带来局部最优的问题。

另一类快速搜索算法是利用运动矢量相关性来预测当前运动矢量。

此类算法考虑时域或空域相关预测当前搜索起点,性能优于前一种。

视频图像运动估计中的一维块匹配算法

视频图像运动估计中的一维块匹配算法

第33卷第3期计算机辅助设计与图形学学报Vol.33No.3 2021年3月Journal of Computer-Aided Design & Computer Graphics Mar. 2021视频图像运动估计中的一维块匹配算法刘泉洋, 刘云清*, 史俊, 颜飞, 张琼(长春理工大学电子与信息工程学院长春 130022)(**************.cn)摘要: 运动估计是视频图像压缩和视频图像修复等领域的基础问题, 传统的块匹配法搜索质量较好, 但搜索速度不够快. 针对传统块匹配法搜索速度上的不足, 提出一种快速的一维块匹配运动估计算法. 首先对运动矢量正交分解, 使用特殊权重系数矩阵对二维匹配块做降维处理, 得到2组一维特征矩阵; 然后选择一维三步搜索法作为搜索策略, 最小绝对误差和准则作为匹配准则, 使用2组一维特征矩阵搜索匹配运动矢量的2个分量; 最后将分量组成完整的运动矢量. 通过多组对比实验的结果表明, 该算法在保证定量评价PSNR的前提下, 显著提升运动估计的搜索速度, 视频清晰度越高、匹配块像素尺寸越大, 运动估计搜索速度提升越明显.关键词: 运动估计; 块匹配算法; 正交分解; 特征矩阵; 三步搜索法中图法分类号: TP391.41 DOI: 10.3724/SP.J.1089.2021.18343One-dimensional Block Matching Algorithm in Video Image Motion EstimationLiu Quanyang, Liu Yunqing*, Shi Jun, Yan Fei, and Zhang Qiong(School of Electronics and Information Engineering, Changchun University of Science and Technology, Changchun 130022)Abstract: Motion estimation is a basic problem in the fields of video image compression and video image restoration. The traditional block matching methods have good search quality, but the search speed is not fast enough. Aiming at the shortcomings of the search speed in the traditional block matching methods, we pro-posed a fast one-dimensional block matching motion estimation algorithm. Firstly, the motion vector is or-thogonally decomposed, and the two-dimensional matching block is reduced by a special weight coefficient matrix to obtain two sets of one-dimensional feature matrices. Then the one-dimensional three step search method is selected as the search strategy. The sum of absolute differences criterion is used as the matching criterion. The two sets of one-dimensional feature matrices are used to search for the two components of the matching motion vector. Finally the two components are formed into a complete motion vector. The results of multiple sets of comparative experiments show that the search speed of motion estimation is significantly improved while the algorithm is guaranteed to quantitatively evaluate the PSNR. The higher the video defi-nition and the larger the pixel size of the matching block, the better the algorithm can improve the search speed of motion estimation.Key words: motion estimation; block matching algorithm; orthogonal decomposition; feature matrix; three-step search收稿日期: 2020-05-04; 修回日期: 2021-01-08. 基金项目: 吉林省科技厅重点项目(20190303080SF, 20190303034SF).刘泉洋(1995—), 男, 硕士研究生, 主要研究方向为传感与信号处理; 刘云清(1970—), 男, 博士, 博士生导师, 论文通讯作者, 主要研究方向为智能信息处理、自动控制; 史俊(1996—), 男, 硕士研究生, 主要研究方向为模式识别与智能系统; 颜飞(1987—), 男, 博士, 硕士生导师, 主要研究方向为智能信息处理; 张琼(1991—), 女, 博士, 讲师, 主要研究方向为数据处理.第3期刘泉洋, 等: 视频图像运动估计中的一维块匹配算法 425运动估计是视频修复和视频压缩的关键技术, 其主要目的是利用图像帧间信息修复视频并减少图像帧间的信息冗余[1-2]. 目前, 已有很多运动估计算法, 其中, 由于块匹配算法(block matching algorithm, BMA)在计算处理和硬件实现上较为容易[3], 因此被许多视频压缩编码标准所采用, 如H.261/3/4[4]和MPEG-2/4[5].BMA计算量较大, 给实时处理带来较大压力. 为了减少运动估计的计算量, 近些年有很多学者对块匹配法进行改进. 改进方式主要有2种: 一种是改变匹配块的形状和位置, 但依然使用二维匹配块进行搜索, 如局部区域匹配法[6]将中间的匹配块变为4个等大小的小方块, 其准确性和实时性比BMA略有提高. 还有许多学者针对搜索策略进行优化并提出许多不同的搜索方式, 其速度较三步搜索法(three step search, TSS)有一定的提高, 如文献[7]通过运动矢量概率分布分析, 发现了运动矢量概率分布具有除中心十字偏置特性以外的方向性特性, 提出了一种快速的双十字搜索运动估计算法, 在保持相当搜索质量的前提下, 与菱形搜索算法和十字菱形搜索算法相比, 其搜索速度均有提高. 切换的快速运动估计算法[8]采用了提前停止和选择性搜索技术来提高编码速度, 以小菱形作为起始搜索模式, 然后过渡到六边形模式, 最后使用正方形搜索模式进行细化; 该算法对于各种运动情况的视频序列具有强普适性, 速度也有所提高. 还有从其他角度优化运动估计算法, 如文献[9]以像素块为单位, 利用块内外点的比例判定前景区域, 同时引入马尔可夫聚类方法进行后处理, 有效地提高了运动对象的定位精度; 通过对目标函数引入权重系数增强对残差的鲁棒性, 以进一步提高算法的估计精度. 此外, 文献[9]基于像素掩模的3层金字塔构建序列图像, 并将改进的梯度方法引入到优化过程中, 提高了算法的实时性. 文献[10]基于运动分解估算的运动估计算法, 利用矩阵分解原理将全局运动分解成帧间运动和前帧运动, 保证了场景快速变化条件下运动估计的准确性和时效性.这些算法均采用为二维匹配块搜索匹配运动矢量的最优值, 而完整二维匹配块存在大量的信息冗余, 会增大搜索匹配过程中的计算量, 很难通过优化搜索策略和匹配块位置大幅度提升算法运算速度. 文献[11]提出基于边界灰度投影匹配的全局运动估计算法, 将图像边界水平投影和垂直投影值作为匹配特征, 较好地估计了全局运动参数; 但是其特征提取模型和搜索策略存在缺陷, 不能有效地提高搜索速度. 为了进一步提高算法的速度, 降低算法实现的复杂度, 本文提出了一维块匹配运动估计算法(one-dimensional BMA, OBMA).1 一维特征矩阵和一维TSS1.1一维特征矩阵通过对运动矢量的特点进行分析, 运动矢量精度是单位像素, 方向和大小均不确定. 因此, 本文采用将运动矢量MV分解为水平方向分量x和垂直方向分量y, 如图1所示.图1 运动矢量正交分解求解x和y需要使用一维特征矩阵X和一维特征矩阵Y, 一维特征矩阵求解过程为[]1nλ=A(1)[]1mμ=B(2)=X AP(3)T=Y BP(4) 其中, A为权重系数矩阵, λ为A的权重系数; B 为权重系数矩阵, μ为B的权重系数; P为匹配块矩阵, 形状为(),n m; X的形状为()1,m; TP 形状为(),m n; Y的形状为()1,n.为了更直观地表示一维特征矩阵的特点, 选取连续3帧1 080P测试图像, 从测试图像中提取P. λ和μ设置为1256. A的形状为()1,540, B 的形状为()1,960; 得到3幅连续测试图像的一维特征矩阵如图2所示. 其中, X的形状为()1,960, Y的形状为()1,540, 纵坐标表示一维矩阵中每个元素的数值.分析图2的发现, 连续视频图像匹配块的一维特征矩阵具有整体趋势相似的特点, 利用此特点进行运动估计, 可以有效地减少信息冗余, 提高后续搜索匹配的速度.1.2一维TSS相比于全搜索法(full search, FS)要遍历匹配块426计算机辅助设计与图形学学报 第33卷图2 连续3帧视频图像特征矩阵折线图的所有像素点, TSS 搜索点数大幅减少[12]. 有别于逐一遍历所有像素点, 如图3所示, TSS 每步搜索对搜索边界上的8个点以及正方形的中心点共9个搜索点进行比较, 搜索步长等于或者略大于最大搜索范围的一半; 上一步比较得到的最佳匹配点作为下一个新的搜索步的搜索中心. 搜索范围大于7时, 搜索步骤不止3步.图3 二维TSS本文的特征矩阵X 和特征矩阵Y 是一维矩阵, 因此需要将二维TSS 改为一维TSS. 一维TSS 的搜索步骤与二维TSS 类似, 每一搜索步对搜索边界上的2个点以及中心点共3个搜索点进行比较, 搜索步长等于或者略大于最大搜索范围的一半; 上一步比较后得到的最优匹配点作为下一步的搜索中心. 一维TSS 如图4所示.图4 一维TSS一维TSS 实际使用时需要确定搜索步数, 确定一维TSS 搜索步数就是确定搜索半径. 搜索半径r 与搜索步数steps 的关系为steps 21r =-(5) 本文算法将()M ,x y V 分解为x 和y , 因此x 和y 可以针对不同r 设置不同的steps . 测试数据使用400帧清晰度为1 080P 的连续视频图像序列, 求出运动矢量, 制作散点图如图5所示.图5 M V 散点图通过图5散点图的分析, 散点图中点的整体分布呈菱形, 水平方向的范围大于垂直方向的范围, 在实际的运动估计计算中, 可以针对不同的范围设置不同的r , 减少不必要的steps , 提高搜索速度. 以图5为例, 设水平方向的r 为I , 垂直方向的r 为J , 则应设I =31, J =15; 将其分别代入式(5)求出搜索步数分别为5步和4步.2 OBMA2.1 算法概述本文提出的OBMA 整体流程图如图6所示. 2.2 匹配块匹配块选择当前帧图像S 的中心区域, 图像S 的形状为(),N M , P 的形状为(),n m , 在S 的位置如图7所示.第3期刘泉洋, 等: 视频图像运动估计中的一维块匹配算法 427图6 算法流程图图7 匹配块前一帧图像的匹配块记为1-P , 1-P 的最大可能出现区域用R 表示, 区域R 包括区域1-P 以及水平方向的搜索半径I 和垂直方向的搜索半径J 包含的区域, R 的形状为()2,2n I m J ++, 区域R 如图8所示.图8 区域R 示意图区域P 和区域R 的计算公式分别为:,:22222222N n N n M m M m ⎛⎫=-+-+ ⎪⎝⎭P S (6)1:,:22222222N n N n M m M m J J I I -⎛⎫=--++--++ ⎪⎝⎭R S (7)其中, 1-S 是图像S 的前一帧图像, R 是图像1-S 匹配块1-P 的最大可能出现区域.2.3 特征矩阵A 和B 的λ和μ设为灰度级的倒数. 8位深度的图像灰度级为256, 设λ=μ=1. 区域R 的特征矩阵为R 1(+2)1256n J ⎡⎤=⎢⎥⎣⎦X R (8)T R 1(+2)1256m I ⎡⎤=⎢⎥⎣⎦Y R (9)其中, R X 和R Y 为区域R 的特征矩阵; R X 形状为()1,2m I +,R Y 形状为()1,2n J +.特征矩阵组X 和i X 分别为1()1256n ⎡⎤=⎢⎥⎣⎦X P (10)()R :i I i m I i =+++X X(11)其中, i X 的形状为()1,m ; i 为水平方向的偏移量.特征矩阵组Y 和j Y 分别为T 1()1256m ⎡⎤=⎢⎥⎣⎦Y P (12)()R :j J j n J j =+++Y Y(13)其中, j Y 的形状为()1,n ; j 为垂直方向的偏移量.2.4 搜索最优值搜索策略使用一维TSS, 匹配准则使用SAD [13]. 以运动矢量分量x 的搜索步数等于3为例, 具体搜索步骤如下:输入. 特征矩阵X 与i X .输出. 运动矢量分量x .Step1. 以0中心搜索点, 加上中心点左右步长为4的2个搜索点, 计算3个搜索点X 与i X 的SAD.Step2. 将上一步的最佳匹配点设为中心搜索点, 计算中心点左右步长为2的2个搜索点X 与i X 的SAD, 与上一步最佳匹配点比较,更新最佳匹配点.Step3. 步长改为1, 同上一步, 最佳匹配点为x .运动矢量分量x 和运动矢量分量y 除了一维TSS 的搜索步数不同, 其他搜索步骤均相同, 这里不再赘述.428计算机辅助设计与图形学学报 第33卷3 实验结果为了验证本文提出OBMA, 选择主观评价与客观指标相结合的评价方式. 主观评价为不同算法运动补偿后的前后帧差值图像; 客观评价指标选择峰值信噪比(peak signal to noise ratio, PSNR)和搜索时间. PSNR 将未加入运动补偿的前后帧差值图像作为原图像, 加入运动补偿后的前后帧差值图像为处理后图像.3.1 实验平台本文进行实验的计算机配置为AMD Ryzen52600 CPU(3.40 GHz), 内存为16 GB; 操作系统为Windows 10; 编程环境为Python 3.6.3.2 主观评价为了直观地对比本文的OBMA 与BMA 的实际效果, 选取测试视频图像序列中5个不同场景, 将未加入运动补偿的前后帧差值图像与加入运动补偿后的前后帧差值图像进行对比. 考虑差值图像对比度较低, 为了提高差值图像的对比度, 对样本的结果进行直方图均衡化处理, 最后得到对比度增强后的差值图像如图9所示. 图9a 所示为与前一帧参考帧的差值图像; 图9b 所示为加入a. 无运动补偿b. BMA [3]c.OBMA图9 不同场景下前后帧差值图像第3期刘泉洋, 等: 视频图像运动估计中的一维块匹配算法 429BMA 运动补偿后与前一帧参考帧的差值图像; 图9c 所示为加入OBMA 运动补偿后与前一帧参考帧的差值图像.通过图9中5个不同场景下运动补偿后的差值图像对比分析发现, 本文提出的运动估计算法的实际补偿效果与传统块匹配法基本一致.3.3 客观评价客观评价使用1 080P 和720P 测试视频中的连续50帧视频图像序列作为测试样本. 对比实验分别为相同清晰度测试视频图像序列、不同匹配块比例; 相同匹配块、不同清晰度测试视频图像序列.为了验证匹配块大小对算法性能的影响, 测试实验选择1 080P 测试视频图像序列, 2种不同尺寸的匹配块作对比实验, 分别是测试图像尺寸的1/2(540像素×960像素)和1/4(270像素×480像素). 图10a 所示为匹配块尺寸为1/2(540像素×960像素)时, OBMA 与BMA 的PSNR 和运行时间对比图; 图10b 所示为匹配块尺寸为1/4(270像素×480像素)时, OBMA 与BMA 的PSNR 和运行时间对比图.为了验证视频清晰度对算法性能的影响, 本文选择720P 测试视频与上述1 080P 测试视频进行对比实验. 图10c 是匹配块尺寸为1/4(180像素×320像素)时, OBMA 与BMA 的PSNR 和运行时间对比图.图10 BMA 和OBMA 的PSNR 和运行时间对比对表1中的实验结果进行分析: 当匹配块尺寸和测试视频清晰度相同时, OBMA 与BMA 的PSNR 基本相同, 这说明它们具有同样搜索质量. 匹配块为测试图像尺寸的1/2(540像素×960像素),OBMA 的平均运行时间是BMA 的29.5%, 搜索速度提高238.6%; 匹配块为测试图像尺寸的1/4(270像素×480像素), OBMA 的平均运行时间是BMA 的59.6%, 搜索速度提高67.64%; 匹配块为测试图像尺寸的1/4(180像素×320像素), OBMA 的平均运行时间是BMA 的80.1%, 搜索速度提高24.72%.由上述数据分析可知, 与传统的BMA 相比,在搜索质量相同的情况下, OBMA 实时性优于BMA. 运动估计使用的匹配块尺寸越大, 搜索速度提高越明显; 视频清晰度越高, 搜索速度提高越表1 2种算法连续5帧视频图像序列关键指标横向对比 算法 分辨率匹配块平均PSNR/dB 平均搜索 时间/s 1 080P 1/2 28.87 0.143 05 1 080P 1/428.840.052 59720P 1/4 27.36 0.016 85 1 080P1/2 28.83 0.042 24 1 080P 1/429.160.031 37OBMA 720P1/4 27.42 0.013 51明显. 本文提出OBMA 更适用于清晰度较高的视频. 随着视频分辨率的不断提高, 2K, 4K 和8K 视频的普及, 运动估计需要的块尺寸也会随之增大, 传统BMA 庞大的数据量会占据更多的资源, 而使用本文提出OBMA 可以有效地解决此问题.BMA [3]430 计算机辅助设计与图形学学报第33卷4 结语目前主流运动估计算法依然停留在直接使用二维视频图像的二维信息直接计算运动矢量, 本文通过对视频帧间相关性的研究发现, 经过特定的权重系数矩阵对二维匹配块降维后, 一维特征矩阵具备二维矩阵的部分特征, 使用一维特征矩阵代替二维矩阵进行运动估计, 减少计算量. 通过对比实验表明, 本文提出的OBMA与BMA相比, 在搜索质量相当的前提下, 能有效地提高运动估计的计算速度, 具有一定实用价值.参考文献(References):[1] Yu Yinghuai, Wang Jinrong. High accuracy sub-pixel globalmotion estimation based on upsampled gradient cross-correla-tion algorithm[J]. Journal of Image and Graphics, 2012, 17(12):1492-1499(in Chinese)(余应淮, 王锦荣. 高精度亚像素全局运动估计的上采样梯度互相关算法[J]. 中国图象图形学报, 2012, 17(12): 1492-1499)[2] Li Ziyin, Zhu Shanan. A fast efficient partial distortion searchalgorithm for block motion estimation[J]. Journal of Image andGraphics, 2006, 11(4): 480-485(in Chinese)(李子印, 朱善安. 一种快速高效的部分失真块运动估计搜索算法[J]. 中国图象图形学报, 2006, 11(4): 480-485)[3] Zhao N N, O’Connor D, Basarab A, et al. Motion compensateddynamic MRI reconstruction with local affine optical flow es-timation[J]. IEEE Transactions on Biomedical Engineering, 2019, 66(11): 3050-3059[4] Mukaddim R A, Meshram N H, Mitchell C C, et al. Hierarchi-cal motion estimation with Bayesian regularization in cardiacelastography: simulation and in-vivo validation[J]. IEEE Transactions on Ultrasonics, Ferroelectrics, and Frequency Control, 2019, 66(11): 1708-1722[5] Qin Rong, Ma Zhiqiang, Zhang Xiaoyan, et al. A fast and ro-bust global motion estimation algorithm[J]. Journal of Air Force Engineering University: Natural Science Edition, 2012,13(6): 55-59(in Chinese)(秦荣, 马志强, 张晓燕, 等. 一种快速鲁棒的全局运动估计算法[J]. 空军工程大学学报: 自然科学版, 2012, 13(6): 55-59)[6] Tang Jialin, Zheng Jiefeng, Li Xiying, et al. Video stabilizationalgorithm based on feature matching and motion compensa-tion[J]. Application Research of Computers, 2018, 35(2): 608- 610(in Chinese)(唐佳林, 郑杰锋, 李熙莹, 等. 基于特征匹配与运动补偿的视频稳像算法[J]. 计算机应用研究, 2018, 35(2): 608-610) [7] Liu Haihua, Lei Yi, Xie Changsheng. Fast block-matching mo-tion estimation based on a dual-cross search algorithm[J]. Comp-uter Research and Development, 2006, 43(9): 1666-1673(in Chinese)(刘海华, 雷奕, 谢长生. 双十字搜索算法的快速块匹配运动估计[J]. 计算机研究与发展, 2006, 43(9): 1666-1673) [8] Li Hejun, Li Heping, Li Jianxiong. A multi-pattern switchingalgorithm for fast motion estimation[J]. Journal of Electronics & Information Technology, 2013, 35(3): 689-695(in Chinese)(李贺军, 李和平, 李建雄. 一种采用多模式切换的快速运动估计算法[J]. 电子与信息学报, 2013, 35(3): 689-695) [9] Li Qiaoliang, Wang Guoyou, Zhang Guilin, et al. Accurateglobal motion estimation based on pyramid with mask[J].Journal of Computer Aided Design & Computer Graphics, 2009, 21(6): 758-762(in Chinese)(李乔亮, 汪国有, 张桂林, 等. 基于掩模金字塔的高精度全局运动估计算法[J]. 计算机辅助设计与图形学学报, 2009, 21(6): 758-762)[10] Zhang Maolei, Chen Jianguo, Yuan Hongyong, et al. Videostabilization on a six-rotor aircraft platform[J]. Journal of Tsinghua University: Science and Technology, 2014, 54(11): 1412-1416(in Chinese)(张毛磊, 陈建国, 袁宏永, 等. 六旋翼飞行平台的视频稳像技术[J]. 清华大学学报: 自然科学版, 2014, 54(11): 1412-1416) [11] Zhang T, Fei S M, Li X D, et al. Fast global motion estimationand moving object extraction algorithm in image sequences[J].Journal of Southeast University: English Edition, 2008, 24(2): 192-196[12] Li R X, Zeng B, Liou M L. A new three-step search algorithmfor block motion estimation[J]. IEEE Transactions on Circuits and Systems for Video Technology, 1994, 4(4): 438-442 [13] Xu Jin. Research on key technology of digital restoration ofmotion picture film[D]. Shanghai: Shanghai Jiaotong Univer-sity, 2009(in Chinese)(徐进. 电影胶片数字修复关键技术研究[D]. 上海: 上海交通大学, 2009)。

一种快速的块匹配运动估计新算法

一种快速的块匹配运动估计新算法

[ ( 1 一 m+ , + ) ( ) f m,) 一( n l 2 k 2

们相 继 提 出 许 多 快 速 搜 索 算 法 , 三 步 搜 索 法 如
(S ) T S 四 步 搜 索 法 ( S ) 、二 维 对 数 法 F S
( D )2、 T L [ 菱形法 ( S J , 们 在计 算 复 杂度 上 1 D) 等 它
( )最 小均方 误差 函数 ( E 1 MS )
1 M N
间冗余 , 通过减少 时 间冗 余 可 以大 幅度 地 提高 视频
编码 的效 率 。基 于块 匹 配 的 运 动估 计算 法是 一 种 很 有效 的方法 。块 匹配运 动估计算 法在 M E - P G4和 H 2 3中都得 到 了广泛应 用 … 。 .6

分别 为 当 前 帧 和上 一 帧 图像 的灰 度 值 。 因为
因此 , 有必 要寻找更 加有效 的块匹配 运动估计 算法 。 在分析 了诸多 算法 的基础 上 取长 补 短 , 计 出 设 了一 种新 的搜 索算 法—— 新菱 形 搜索 算 法 ( D ) NS。 实验结 果表 明 , D N S算 法在 计算 复 杂度 上 和准 确 度
达到最小 时 , 该点 即为最 优匹配 点 。
在式 ( ) 1 和式 ( ) , i ) 2 中 ( , 为位 移 矢量 , ≤ 一
i. , 为 搜 索 范 围 , xN 为 块 的 大 小 , 和 ,≤ J M

比F S减小 了许 多 , 是 搜 索 的准 确 度 比 不 上 F 。 但 S
比较 实 用 , 度 得 到 广 泛 的 应 用 , 采 用 MA 一 现 D
算法 。 ( )对于块 匹配运 动估计搜 索算法 性能 的衡 量 3

数字视频处理-运动估计方法

数字视频处理-运动估计方法

菱形法
搜索方式与四步法类似, 只是搜索模板换为两个菱形 模板。
六边形法
搜索方式与菱形法类似, 只是大搜索模板换为一个六 边形模板。
固定模式搜索法的缺点
没有利用图像本身的相关信息,不能根据物体运动的剧 烈程度自适应的改变搜索起点和搜索半径。
以菱形法为例,对背景图像,也要经历从大模板到小 模板的转换过程,至少需要13个搜索点,搜索速度还有待 改进。
匹配准则
常见的块匹配运动估计匹配准则有三种:MAD、MSE和 NCCF,由于MAD没有乘除操作,不需做乘法运算,实现简单 方便,所以使用较多。通常使用求和绝对误差(SAD)代替 MAD 。
全搜索法
➢对搜索区域的所有 位置进行穷尽搜索。
➢精度最高 ➢计算复杂,难以实时
处理 ➢必须研究相应的块匹 配运动估计快速算法
运动估计的分类:4种运动模型
a 全局运动估计 b 基于象素点的运动估计 c 基于块的运动估计 d 基于区域的运动估计
运动估计的分类:基于块的运动估计
块匹配运动估计因算法简单、便于硬件实现得到广泛应 用。
块匹配运动估计的定义
基本思想是将图像序列的每 一帧分成许多互不重叠的宏块, 并认为宏块内所有象素的位移量 都相同,然后对每个宏块到参考 帧某一给定特定搜索范围内根据 一定的匹配准则找出与当前块最 相似的块,即匹配块,匹配块与 当前块的相对位移即为运动矢量。 视频压缩的时候,只需保存运动 矢量和残差数据就可以完全恢复 出当前块。
块匹配运动估计快速算法分类
分层的和多分辨率的快速块匹配方法 基于连续消除的快速块匹配方法 基于象素子抽样的快速块匹配方法 固定搜索模式的快速块匹配方法 基于时空相关性和视觉特性的快速块匹配方法
分层的或多分辨率法

数字视频技术6.ppt

数字视频技术6.ppt

§6.2 块匹配运动估计
Logo
§6.2 块匹配运动估计
Logo
子块大小的选择:
匹配 窗必须大足小够:大S,=太(N小+2会d发)×生(N匹+配2到d)有;
相同像素值但与场景无关的块;块小
d为也垂会直增加和运水算平量方,向同时上增的加最所大需位传输移。
的运动矢量信息;
必须足够小,若一个块里存在不同 的运动矢量,匹配块不能提供准确有 效估计。
法。
§6.1 运动估计研究现状
Logo
一、 运动补偿预测的基本原理
自然场景的视频图像只有其中的部分区域在运动,同一场景 相邻的两帧图像之间差异也不会太大,编码器无需将视频序 列中每帧图像的所有信息都进行编码后传输给解码器端,只 要将当前帧中目标的运动信息告知解码器端,解码器可根据 运动信息和前一帧图像内容来更新当前帧图像,获得当前帧 的真实数据;(可有效降低编码所需数据量)
个局部结构在前一帧图像中的位置,从而可以估计出这
个结构的位移,用运动矢量表示;
运动补偿——由位移的估值建立局部结构在不同帧的空
间位置对应关系,用前一帧图像中的对应部分对当前帧
中的局部结构进行预测。
§6.1 运动估计研究现状
Logo
二、运动估计与运动补偿预测编码步骤:
分割图像为若干局部结构——划分静止和运动区域; 最简单方法分块;
Logo
§6.列的每一帧都划分为许多大小相同、互不重叠的子块(并做 假设:子块内所有像素具有运动一致性,并且只做平移运动,不包含 旋转、伸缩);
然后对每个子块到参考帧某一给定特定搜索范围(匹配窗)内根据一 定的匹配准则找出与当前块最相似的块,即预测块(匹配块);
预测块与当前块的相对位移即为运动矢量(Motion Vector, MV), 预测块和当前块之间的差值称为残差图像;

H.264块匹配运动估计中UMHexagonS算法的优化

H.264块匹配运动估计中UMHexagonS算法的优化

UMHexagonS 算法中,阈值的确定依据两个因素:当前的量化
参数(QP)和先前块的运动编码代价(MCOST)信息,而在 ET
设计中,ET 操作被用于不同的搜索步骤后:(1)所有搜索点预
测之后;(2)非对称十字菱形之后;(3)5×5 的正方形搜索之后;
(4)非均匀多层次六边形格点搜索之后。当一个 ET 条件被满
进 。因此在 UMHexagonS 算法中,根据文献[8]提出的运动象
限分布区域(图 2),将多层次六边形网格搜索模板(图 3)划分
YE Wenlong,YUAN Youwei,WANG Shiyu,et al.Optimization of UMHexagonS on block matching motion estimation algorithms in puter Engineering and Applications,2011,47(25):133-136.
基金项目:国家自然科学基金(the National Natural Science Foundation of China under Grant No.60871007);浙江省自然科学基金(No.Y6090312)。 作者简介:叶文龙(1983—),男,硕士研究生,研究方向为视频技术处理;袁友伟(1964—),男,教授;汪世瑜(1986—),女,硕士研究生;周成武
般取 A=0.9,B=0.3。
3.2 运动矢量象限搜索的加入
UMHexagonS 算法中主要部分是使用了六边形搜索算
法,包括非均匀多层次六边形网格搜索模板和扩展的六边形
搜索,非均匀多层次的六边形网格搜索点的数目为 N=16×4=
64,扩展的六边形的搜索数目为 M=7+3×n+4。此处的多层次

运动估计算法比较 块匹配 全搜索 四步法 三步法

运动估计算法比较 块匹配 全搜索 四步法 三步法

大作业运动估计算法比较一、实验内容简要介绍各种运动估计算法,并比较不同运动估计算法的性能,主要考虑各算法的运算速度和精度。

二、实验背景视频原始图像中存在着大量的信息冗余,如时间冗余、空间冗余、信息熵冗余、谱间冗余、几何结构冗余、视觉冗余和知识冗余等等。

运动估计是视频压缩编码中的核心技术之一,采用运动估计和运动补偿技术可以消除视频信号的时间冗余以提高编码效率。

如何提高运动估计的效率,使运动估计算法的搜索过程更健壮、更快速、更高效成为目前研究的热点。

运动估计的基本思想是尽可能准确地获得序列图像帧间的运动位移,即运动矢量。

因为运动估计越准确,预测补偿的图像质量越高,补偿的残差就越小,补偿编码所需位数越少,需要传输的比特率就越小。

利用得到的运动矢量在帧间进行运动补偿。

补偿残差经过变换、量化、编码后与运动矢量一起经过熵编码,然后以比特流形式发送出去。

运动估计算法多种多样,大体上可以把它们分成四类:块匹配法、递归估计法、贝叶斯估计法和光流法。

其中块匹配运动估计算法因其具有算法简单、便于VLSI实现等优点得到广泛应用。

所以本文将重点介绍块匹配运动估计算法,并对各种块匹配算法在计算速度和估计精度上进行简单比较。

三、实验原理(一)、像素递归技术像素递归技术是基于递归思想。

在连续帧中像素数据的变化是因为物体的移位引起的,郑么如果沿着梯度方向在某个像素周圈的若干像素作迭代运算,运算会最后收敛于一个固定的运动估计矢量,从而预测该像素的位移。

(二)、块匹配运动估计块匹配运动估计是把图像帧划分为若干互不重叠的块,并以块为单位寻找目标帧中每块在参考帧(上一帧或者其它帧)中最优匹配的块的相对位置,假设图像中每块的大小为M×N,dxmax为参考块水平方向可搜索最大位移而dymax为参考块垂直方向可搜索最大位移那么基于块匹配的运动估计就是在参考帧(或者其它上一帧)的(M+2dxmax)×(N+2dymax)候选区搜索窗口中找到和目标帧的当前大小为M×N的块的最匹配的块则参考块的运动矢量可用如下的数学公式描述:R表示相关性评价函数,f(m,n)表示目标或当前帧图像的灰度值。

视频压缩中的运动估计技术研究

视频压缩中的运动估计技术研究

视频压缩中的运动估计技术研究在如今数字化的时代,视频已经成为人们记录和分享生活的重要方式之一。

为了方便存储和传输,视频文件也需要进行压缩处理。

而在视频压缩中,运动估计技术是非常重要的一环。

本文将对视频压缩中的运动估计技术进行探究。

一、什么是运动估计在视频压缩中,运动估计技术是一种重要的数据压缩方法。

它采用了基于编码预测的方式,不仅可以大幅度地减小视频文件大小,还可以提高视频压缩的效率。

换句话说,运动估计是一种计算机技术,利用已知的前后帧视频数据来预测当前的视频帧,从而实现视频数据的压缩和处理。

运动估计技术往往应用于视频压缩的关键帧(I帧)、前向预测帧(P帧)和双向预测帧(B帧)。

在压缩开始时,关键帧被完整地编码,并且用作压缩后的参考帧。

接下来的P帧和B帧,都是通过运动估计技术来预测并编码。

二、运动估计的分类运动估计大致可以分为两种类型:全搜索算法和其它搜索算法。

全搜索算法,也称为蛮力算法,是最容易想到的、也是最保险的计算方式,即穷举每一个可能的结果,从而达到一个最小化误差的解。

但这种算法计算量巨大,不适用于实际应用场景。

因此,目前所使用的主要是非全搜索算法,如区域搜索算法、精度搜索算法、渐进搜索算法等。

1. 区域搜索算法区域搜索算法是一种局部搜索算法。

该算法首先将当前帧分割为许多宏块,每个宏块都具有一定数量的像素,并且所有宏块的空间范围相等。

然后,将参考帧划分为与当前帧相同大小和数量的宏块,对于运动块,只在参考帧的相应区域中进行搜索。

2. 精度搜索算法精度搜索算法是一种全局搜索算法,它通过迭代将搜索空间逐步减小,从而实现更好的搜索效果。

这种算法的特点是速度较快,同时可以实现较高的搜索准确性。

其主要思路是,在当前帧和参考帧之间分配一个由连续几个宏块组成的搜索窗口,然后在搜索窗口中沿着某个方向进行搜索,直到找到最小的错误数据。

3. 渐进搜索算法渐进搜索算法是一种结合局部和全局搜索的方法。

该算法通过对搜索空间进行多次缩小来实现逐步更新搜索位置,从而实现更好的搜索效果。

一种适用于H.264的高效块匹配运动估计算法

一种适用于H.264的高效块匹配运动估计算法
进。
每个运动矢量和预测块模式标志进行编码和传输 , 解码器根据
预测块模式标志和运动矢量进行宏块解码 。

在深入研究 H.6 视频编码标准及 其运动矢 量统计特征 2 4 的基础上, 提出 了采用一种基于节点模型的可变形块 匹配运 动
余, 一直 是视频 编码研究 的热点 。运 动估计方法一般基 于块 匹
配搜索 , 现有 的视频编码标准也都基 于 D T 或类 D T) C( C 变换 。 通常将一帧图像按 1 6的图像块进行 编码 。如 在编 码某一 6X1 P帧 中的一个宏块 M 时 , 在参考 帧相应 位 置的一 定范 围 内搜 索最 为匹配的块 R作为 宏块 中某一 块 M的参 考块 , 当前块 将
& E gnen N r ws r o t h i lU i rt X ’ S ax 10 2 hn ) n i r g, o h et P l e n a nv sy, i∞ h ni 0 7 ,C ia ei t e n yc c ei 7
Absr c t a t: Ex rme t ho t a h f c e to si to lo ih p o os d c n f t e e u e b o k mac n so ・ pe i n s s w h tt e e intmoi n e tmai n ag rt m r p e a urh rr d c l c thig ditr i
其主要特点是具有更高 的编码效率 和更好 的网络适 应性 。在 相 同重构图像质量下 , 2 预测精度 达到 了 14像素 , H. H.6 4 / 与
23和 M E . 准相 比能节约 5 % 的码流 , 是所 带来 的结 6 P G 4标 0 但 果是 , 其运算 的复杂度 是 H.6 2 3编码 复杂度 的 四倍。运动估

基于块匹配的运动估计的改进算法

基于块匹配的运动估计的改进算法

基于块匹配的运动估计的改进算法论文导读:运动估量是视频处理系统的一个重要的组成部分。

下面是综合运用多个提升搜索速度的途径得到兼有各类快速算法优点的混合快速算法。

关键词:运动估量,快速搜索算法,混合快速算法运动估量是视频处理系统的一个重要的组成部分,它是降低视频信号时刻冗余的最差不多和最重要的方法之一,运动矢量的准确性直截了当阻碍整个编码系统的,并对最终视频系统的质量和实时性有专门大关系。

因此需要综合考虑运动估量准确度和运算复杂度的关系,得到它们之间的折中点也成为了视频压缩编码领域的一个研究热点课题。

1 运动估量原理运动估量的差不多思想是将图像序列的每一帧分成许多互不重叠的宏块,并假设宏块内所有的像素的位移量都相同,然后关于当前帧中的每一块在前一帧或后一帧的某一给定搜索范畴内依照一定的匹配准则找出与当前块最相似的块,即匹配块。

由匹配块与当前块的相对位置运算出运动位移,所得的运动位移即为当前块的运动矢量(Motion Vector)。

利用搜索到的运动矢量在参考帧上进行运动补偿,补偿残差通过DCT变化、量化、行程编码后与运动矢量共同经熵编码,然后以比特流形式传出去。

快匹配法是现在最差不多的运动估量法。

2 典型估运算法及优缺点下面介绍一下常见的典型的快匹配算法。

全搜索算法FS(Full Search)[1] 是按一定的顺序运算出搜索窗口(以当前宏块位置(0,0)为中心的±S个像素的搜索范畴)内每一个点的求和绝对误差值SAD(Sum of Absolute Difference),找出SAD最小的点所在的位置的算法。

FS 算法简单、可靠,搜索成效好,且能够得到全局最优的结果,通常是其他算法性能比较的标准,但它运算量相当大,也是最耗时,这就限制了在需要实时压缩场合的应用,因此有必要进一步研究改进算法。

三步搜索法TSS(Three Step Search)[2] 总共进行三步搜索,它差不多上保持了FS的性能,逐步减小搜索步长。

运动估值与补偿技术的研究

运动估值与补偿技术的研究

指挥技术学院学报JOURNAL OF INSTITUTE OF COMMAND ANDTECHNOLOGY1999年 第10卷 第4期 vol.10 No.4 1999运动估值与补偿技术的研究杜晋军 赵洪利 张宝玲 摘 要 论述了三种运动估值技术,并讨论了运动补偿方法解决图象抖动问题,最后列举了该技术的几个典型应用实例。

关键词 运动估值;运动补偿;块匹配;内插 分类号 TP391.4The Research of Motion Estimation and Compensation TechniquesDu Jinjun(Department of Basic Theories,Institute of Command and Technology)Zhao Hongli(Department of Measurement and Control,Institute of Command and Technology)Zhang Baoling(Department of Basic Theories,Institute of Command and Technology) Abstract Three methods of motion estimation and the methods to process the dithering images by using the motion compensation are discussed in this paper. Finally, several applied examples are introduced. Key words motion estimation; motion compensation; block matching; interpolation1 问题的提出 运动估值是活动图像编码和计算机视觉领域中的一项关键技术。

视频编码中的块运动估计算法分析(三)

视频编码中的块运动估计算法分析(三)

视频编码中的块运动估计算法分析(三)
骆立俊;邹采荣
【期刊名称】《广播与电视技术》
【年(卷),期】1997(24)12
【总页数】8页(P30-37)
【作者】骆立俊;邹采荣
【作者单位】东南大学;东南大学
【正文语种】中文
【中图分类】TN941.1
【相关文献】
1.一种用于AVS视频编码的块运动估计算法 [J], 郑金华;杨平;杨志伟
2.一种用于视频编码的块运动估计算法——块特征匹配预测搜索算法 [J], 何振亚;邹采荣
3.视频编码中的块运动估计算法 [J], 骆立俊;邹采荣
4.视频编码中的块运动估计算法分析(一) [J], 骆立俊;邹采荣
5.视频编码中的块运动估计算法分析(二) [J], 骆立俊;邹采荣
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文章编号!!""#$%&’#"#""(#!"#!!$%#!&!"#$%&’()*+,-./01张骥祥! 戴居丰! 张春田"天津大学 电信学院! 天津 )"""*##!(论文(# 摘 要 $ 阐述了用于运动图像位移估计的块匹配技术$通过计算机模拟对各种算法性能进行了分析比较$提出了块匹配运动跟踪和补偿算法的改进方法%%关 键 词& 运动估计& 块匹配& 运动补偿 %中 图 分 类 号& +,’(!-!’ +.)"!-& %文 献 标 识 码 & / "#$%&’()*%+,-. ($*,$- /0*,1)*,$- 23%+-,453 6$7 8,.,*)# 9,:3$ ;7$%300,-.01/,2 34$54678$ 9/: 3;$<=78$ 01/,2 >?;7$@467"!"#$$% $& ’%(")*$+," -+. /+&$*0-),$+ ’+1,+((*,+12 3,-+4,+ 5+,6(*7,)82 3,-+4,+ 9:::;<! =#,+-$%<=0*7)%*& :7 @?4A B 6B =C D E F G H I $J 6@H ?478 J =@?G K <GC K 4A B F 6H =J =7@ =A @4J 6@= 4A K =A H C 4E =K- >G J B 6C 4A G 7 G< @?= 6F 8G C 4@?J B C G B =C @4=A ’AK G 7= EL H G J B ;@=C A 4J ;F 6@4G 7- :J B C G M =K J =@?G K A <GC J G @4G 7 @C 6H I 478 67K H G J B =7A 6@4G 7 6C = B C =A =7@=K-%>3? @$7:0& J G @4G 7 =A @4J 6@4G 7’ E F G H I $J 6@H ?478 J =@?G K ’ J G @4G 7 H G J B =7A 6@4G 7引言目前$ 在数字视频技术中最常见的运动估值技 术是块匹配算法%在块匹配算法中$估计运动矢量最 准确的方法是全搜索’N ;FF A =6C H ?(O !P 块匹配算法$ 但 因其计算量大$ 算法效率低$ 难以应用于实时处理% 为减少搜索次数D 常常使用快速搜索方案$其典型算 法有三步搜索法)+?C ==$A @=B Q =6C H ?(O #P * 交叉搜索法 ">C GAA $A =6C H ?(O )P 和分级块匹配算法"1R S (O (P % 以上算 法中$全搜索算法的搜索次数最多$交叉搜索次数最 少$三步法和分级块匹配介于两者之间%位移估计的 精度与运算量相关% 上述快速算法虽然减小了计算 量$但实现比较复杂$而且上述快速算法由于搜索中 存在大量的搜索空区$ 所以存在搜索到非最优点的 情况$从而使帧间预测误差增大%本文提出了对 S -R 4=CF 478 的分级块匹配运动跟 踪和补偿算法的改进方法$ 消除了以上快速算法的 缺点$同时$具有相对较小的计算量和较高的估计精的搜寻块会有相似或相同的像素模式$因此$需要大 测量窗匹配大位移&若选取很大测量窗$在窗内位移 矢量场可能不是常量$因而导致估计不精确%分级块匹配算法$使用 ) 次大小不同的测量窗$ 重复 ) 次使用三步搜索法! 第一步" 第一级( 使用较 大的测量窗&第二步在第一级的基础上$使用一个较 小的测量窗$再次进行位移估计&第三步在第二级估 计的基础上用更小的测量窗$ 得到一个精确的位移 估计% 这样$两个连续传输帧" 第 >$! 帧和第 > 帧( 帧间的位移矢量$可由这 ) 次使用的测量窗得到的估 计矢量之和求得$分级位移估计基本原理示于图 !%! 度$可应用于 19+T 信源编码% 计算机模拟结果表 明$此种算法能够适应帧间大位移$如典型的文艺节 目和运动场景$且能保证亚像素的估计精度%分级块匹配改进算法的设计 二级分级块匹配根据分级块匹配原理$ 笔者设计了二级块匹配A B A 分级运动估计算法的改进分级块匹配算法原理块匹配算法位移估计的可靠性和精度$ #-#-!#A B C 算法参数% 其基本搜索处理是 F 8 "?($A @=B 技术$ 它 依赖于 是修正的三步法$? 依赖于最大位移 . "?U . VJ 65 J 65 测量窗尺寸的选择以及它对帧间运动的适应性% 一 些快速搜索方法都是使用一个固定尺寸的测量窗$ 这对于帧间运动不大的场合能有好的补偿效果$ 但 物体的运动较为剧烈时$效果可能不太好$原因之一!W % 第一级测量窗大小选为 !&X !& B=F $搜索范围为Y * B=F &第二级测量窗大小选为 %X % B=F $搜索范围是Y ) B=F % 因此$此种算法搜索能力是Y !" B=F % 第一级匹 配点的间隔是 !& B=F $第二级是 % B=F % 即在第一级的 水平和垂直方向上$ 每 !& 个点计算一次位移估计$ 就在于物体已经移到搜索范围之外% 如果选择测量 窗尺寸过小$而帧间位移大时$ 位移估计不可靠$ 因 为在相应小搜寻区域内$在匹配准则下$运动不相关在第二级每 % 个样点进行一次位移估值% 第一级一 个 !&X !& B=F 块的初始位移矢量$ 被第二级把它一Z 天津市自然科学基金资助项目!D A E F DD CCC "分为四的! 个"#"$%&块所采用!作为初始估计矢基础上!采用双线性内插技术!双线性内插模板为量"此种位移估计算法搜索过程如图’所示!其参数如表( 所示"( (( ((!第二级也采用全搜索方法!搜索在内插后的图像上进行!得到( 0 )$%&精度的位移矢量"此种算法能搜索的最大位移是1(2*3$%&"若采用普通的单级全搜索方法达到此种性能# 位移估值1(2*3$%&!(0 )$%&精度$!计算一个位移矢量!搜索次数为3 !,( 次!而此算法只需!3,次!大大减少了计算量!同时也保证了位移估值精度%算法的参数列于表) 中"第一级测量窗尺寸为(45(4$%&!搜索范围是1(!$%&!位移估计精度是)$%&&第二级在第一级粗估计的基础上进行精估计!测量窗尺寸是"#"$%&!为第一级测量窗面积的( 0 !!最大搜索位移是1.*3$%&!位移估计精度是( 0 )$%&%表)改进算法参数表表(分级结构位移估值器各层参数分级块匹配位移估计算法由粗估计和精估计得到两种精度的位移矢量!可根据码率状况或图像内容适当地选择位移矢量!从而达到自适应运动补偿的目的%矢量选择既要保证图像质量!也要考虑位移二级分级块匹配的改进本文提出了一种用于运动补偿的位移估值算法!运动估计矢量由粗估计和精估计两级运动矢量合成!通过矢量选择器输出"此分级结构自适应的位移估算法!不仅适用于大的位移估计!同时保证了估计精度!估计精度可以达到亚像素水平"图像的多分辨率表达形式可用于块匹配算法来)*)*)矢量编码效率%笔者设定一个阈值门限!!同时!计算当前帧与参考帧对应块间的预测误差!取对应块间的"#$值%当"%&值!!时输出精估计位移矢量!当"%&值’!时!只输出粗估计位移矢量%仿真实验实验采用意大利无线电研究中心提供的’6789:;<*=9;>9?@(A;B=测试序列对3 种块匹配算法C全搜索法)DE$*三步搜索法)B EE$*正交搜索法)F E$*二级块匹配算法)A8?$及改进算法G进行了计算机模拟%实验中对测试序列3,H4,帧作了模拟实验!计算出了各帧的运动补偿图像与原始图像的均方根误差*信噪比%算法实验参数如表. 所示&图! 为第3!帧*33帧帧间位移示意图&图 3 和图 4 分别给出了预测图像与原始图像的均方根误差和信噪比曲线%从实验数据分析可看出!改进算法和原二级块匹配算法)A8?$相比!具有较小的均方根误差和较高的信噪比!因而能够进行更好的运动补偿预测%.改善运动估计"为了实现位移估值由粗估计到精估计!笔者吸取了分级块匹配的基本思想!同时把图像按分辨率分层"在粗估计级!为了减少计算量!对像素进行亚抽样"同时!为减少在使用匹配准则时的风险!提高估计的可靠性!使得亚抽样信号充分反映图像的实际情况!具有充分的代表性!对像素进行预处理+低通平均滤波"采用的滤波模板为( ( (( )( ( (((,图像滤波后!进行)-(亚抽样!第一级在原图像亚抽样栅上全搜索!搜索栅如图.!/为起始点"J4 J!J) , ) ! 4( + ( , ( , ( , ( , ( ,( ( , ( , ( , ( , ( , ( ,( ( , ( , ( , ( , ( , ( ,( ( , ( , ( ,/, ( , ( ,( ( , ( , ( , ( , ( , ( ,( ( , ( , ( , ( , ( , ( ,( ( , (,(,(,(,(,(4!),J)J!J4图.第一级搜索栅估计精度由第二级来提高!第二级在第一级的小结本文对块匹配运动估计的几种算法性能# > 运算 量进行了分析比较: 并设计了一种由粗估计到精估计的分级块匹配算法$仿真实验结果表明$此算法具 有简单#计算量较小#搜索位移大#精度高等优点%不 仅能适应大位移情况$同时$位移估计矢量场也能精 确地适应图像的局部特性%参考文献F CG 7"i 13’ QJ %1( L 4 ^&-&(13 X &,") ’%)R "##&*-4 C ??b 4 a2 T %"k *(&R " n 133: T 7O 4F ;G h 1’’1-1*(J 31 I : O 1) h O 4 Q )(&)* R )9’"*#1(", &*("%8%19" &91-" ’%",&R (&)*4 \]]] 7%1*# )* S )99J *&R 1(&)*#: C ?_b: S l Q E ==@C <c B C <CC E C <C b 4 F =Go /1*a 1%& Q 47/" R %)## E #"1%R / 13-)%&(/9 8)% 9)(&)*"#(&91(&)*4 5]]] 7%1*#4 S )99J *4: C ??<: =_B ?b <E ?b =4 F >G e &"%3&*- Q 4 ^&#’31R "9"*( "#(&91(&)* a2 /&"%1%R /&R 13 a 3)R i E 91(R /&*-4 T %)R 4 K &#J 13 S )994 1*, 591-" T %)R 4: I T 5] C ??_: C <<C B ?>;E ?b C 4F bG n J 1*- N: p /1*- q n : N 1*- S I 4 7.) a 3)R i E a 1#", 9)k (&)* R )9’"*#1(&)* 9"(/),# 8)% X &,") R ),&*-4 S I K 7: C??D: D @C c B C ;=E C ;D 45]]] 7%1*#表 = 几种算法实验参数表F DG 范宏寅$ 张 春 田4 一 种 改 进 的 T ^S 块 匹 配 运 动 估 值 算 法4 信号处理$C ??U $C =@;c &C bb E CD <4 作者简介#张骥祥!(+$$)"$博士生&戴居丰$教授$博导&张春田$教授$博导( !责任编辑# 刘伯义收稿日期# !""&)(!)"#"""""""""""""""""""""""""""""""""""""""""""""!上接第 !"页" !"#$%&’(&)* +),&*- .&(/ 01*2 +/1**"3#4 5666 7%1*#4 5*8)%94 7/")%2: ;<<=: >?@?A B ;C <D E ;CC >4F DGH &* I/J E *1*: K "(%) L : M 1*- N 1)4 O 1("E P &#()%(&)* L *132#&# )8 (/" Q J 3(&’3" !"#R %&’(&)* Q )(&)* S )9’"*#1(&)* K &,") +),&*-I R /"9"4 5666 5+L II T: ;<<=: !B ><C E ><>4F UG 7&1* +: V "919& I I 4 W *&X "%#13 Q J 3(&’3" P "#R %&’(&)*I R 131% YJ 1*(&Z 1(&)*B L *132#&# 1*, P "#&-*4 [%)R "",&*-# )8 (/" \]]] ^1(1 S )9’%"##&)* S )*8"%"*R ": ;<<=4F _G ‘1X %&3"#R J L 5: Q J *("1*J L : "( 134 69a ",,", Q J 3(&’3" W #&*- Q J 3(&’3" ^"#R %&’(&)* Q )(&)* S )9’"*#1(&)*4 5ddd 7%1*# )* S &%R J &(# 1*, I 2#("9# 8)% K &,") 7"R /*)3)-2: ;<<;: C ; @D c B >=_E >b ;4F C =G V J 1*- S /J *-EH &*: "( 134 Q J 3(&’3" ^"#R %&’(&)* 1*, Q 1(k R /&*- T J %#J &( S ),&*- 8)% K &,") 7%1*#9&##&)* )X "% (/" 5*("%*"(4 5ddd 5S L II T: ;<<=: @=c B >;b E >;_4 F C >GH )(81331/ l L :T 1*R /1*1(/1* I 4L ,1’(&X " Q J 3(&’3"^"#R %&’(&)* S ),&*- 8)% \*("%*"( K &,")4 \]]] \S L II T: ;<<=:@b c B U =;E U =b 4F C bGH "" N "*E S /&: L 3(J *a 1#1i N J R "34 L S )331a )%1(&X " Q J 3k (&’3" ^"#R %&’(&)* 7%1*#8)%9 S ),&*- 1*,I (1(&#(&R 13 ]%%)% S )*R "139"*( Q "(/), 8)% ]%%)% O "#&3&"*( K &,") I (%"19&*- )X "% m )&#2 S /1**"3#4 \]]] \S L II T: ;<<;: @;c B ;<UU E ;<_<4F CDGH "" N "*E S /&: "( 134 L S ))%,&*1(", Q J 3(&’3" ^"#R %&’(&)*I R 131% YJ 1*(&Z "% 1*, ]%%)% S )*R "139"*( L 3-)%&(/9 8)% ]%%)% P "#R %&’(&)*I R 131%YJ 1*(&Z "%#8)%T %)-%"##&X "591-"7%1*#9&##&)*4 5666 5S L II T: ;<<=: @b c B U =D E U =?4F ?G M 1*- N 1): O "&a 91* L O: "( 134 L* 59’%)X "9"*( () Q J 3(&’3" P "#R %&’(&)* 7%1*#8)%9 +),&*-4 5ddd 7%1*#4 )* I &-*13 T %)R "##&*-: ;<<;: b <@CC c B ;_>=E ;_b >4F C <G e 1f &R 5 K: M )),# g M 4 P )91&*E e 1#", Q J 3(&’3" P "#R %&’(&)* S ),&*- )8 591-"# 1*, K &,")4 5ddd 7%1*#4 )* 591-" T %)R "##&*-: ;<<=: C ;@C <c B C ;CC E C ;;b 4F CCG h &9 S /1*-E I J :H ""I 1*-E W i 4 QJ 3(&’3" P "#R %&’(&)* S ),&*- )8 Q )(&)* j &"3,# 8)% O )a J #(K &,") 7%1*#9&##&)*4 5ddd 7%1*# )* S &%R J &(# 1*, I 2#("9# 8)% K &,") 7"R /*)3)-2: ;<<C : CC @?c B ???E C <C <4F C ;G M 1*- N 1):H &* I/J E *1*4 d %%)%E O "#&3&"*( K &,") S ),&*-O "#&3&"*( K &,") I (%"19&*- )X "% H )##2 S /1**"3#4 \]]] \*("%*1(&)*13 S )*8"%"*R " )* S )99J *&R 1(&)*# ;<<;: b @;c B ?? EC <=4作者简介#!刘 杰 平 $ 副 教 授 $ 在 职 博 士 生% 主 要 研 究 方 向 图 像 % 视 频编码与传输&余英林$教授$博士导师’ 责任编辑# 蔡国良收稿日期# !""&’(!)(*。

相关文档
最新文档