基于块划分的HEVC运动目标分割方法

合集下载

运动图像压缩中基于图像块的运动补偿技术的研究

运动图像压缩中基于图像块的运动补偿技术的研究

运动图像压缩中基于图像块的运动补偿技术的研究引言随着现代通信及多媒体技术的发展,视频图像压缩技术日趋成熟,MPEG-1、MPEG-2、MPEG-4及MPEG-7标准相继颁布实施。

其中对提高图像质量及压缩率起着至关重要作用的关键技术之一的运动补偿技术也在不断发展和完善。

近年来提出了许多针对高版本MPEG的运动补偿技术。

1、MPEG标准的发展及其应用MPEG(Moving Picture Experts Group)即活动图像专家组,本是图像和音频压缩编码技术的国际标准化委员会的名称,是国际标准化组织ISO和国际电工委员会IEC的下级机构,正式全名为ISO/IECTC/SC29/WG11。

不过现在已演变成图像和音频压缩技术标准的代名词。

到目前已经有多个版本。

MPEG-1(ISO11172)是针对1.5Mbps以下数据传输率的数字存储媒质的编码和压缩的国际标准。

用于解决声音图像信息在CD-ROM上的存储。

应用实例:VCD。

MPEG-2(ISO13818),是针对3Mbps---10Mbps数据传输率的编码标准。

用于解决常规数字电视、高清晰度电视及其伴音的压缩编码。

应用实例:DVD和DVB (Digital Video Broadcasting)数字广播电视。

MPEG-3最初是为HDTV开发的编码的压缩标准。

但是由于MPEG-2的高速发展,MPEG-3的功能已经被淘汰,其原来的工作由MPEG-2小组承包。

MPEG-4(ISO14496)用于无线窄带可视通信以及可视电话。

MPEG-4试图达到两个目标:一是低比特率下的多媒体通信,二是多工业的多媒体通信的综合。

据此目标,MPEG-4引入了AV对象(Audio/VisualObject),使得更多的交互操作成为可能。

同时,引入视频对象平面VOP(Video Object Plane),直接导致了基于内容的压缩,为提供更高的压缩打下了基础,同时也将传统的基于帧的时空可伸缩性扩展到基于图像中内容的时空可伸缩性。

HEVC关键技术2

HEVC关键技术2

HEVC关键技术摘要:随着人们视觉感受要求的提高,视频的分辨率和应用场合发生了重大变化。

但是现有的视频压缩标准已经不能满足需求,这就要求研究人员提出新的视频压缩标准,进一步提高视频的压缩效率,高效视频编码标准应运而生。

高效视频编码标准主要目标是在现有的H.264/A VC high profile的基础上,压缩效率提高一倍,可以允许适当提高编码端的复杂度。

本文主要从高效视频编码标准的关键技术入手,比较全面地介绍了基于四叉树结构的分割技术、细粒度slice分块边界、预测编码技术、环路滤波、熵编码、并行化设计等技术。

同时,对高效视频编码标准的发展前景进行了预测。

关键词:高效视频编码标准,预测编码技术,环路滤波、熵编码、并行化设计1 HEVC的背景H.264是当前普遍的视频编码标准,它将视频压缩效率提高到一个更高的水平。

由于其高效的压缩效率,以及良好的网络亲和性,使得该标准在较短的时间内得到广泛普及。

然而,随着网络技术和终端处理能力的不断提高和发展,人们提出了更高的要求,希望能够提供高清、3D、移动无线,以满足新的家庭影院、远程监控、数字广播、移动流媒体、便携摄像、医学成像等新领域的应用。

如果继续采用H.264编码就会出现如下一些局限性[1]:1.宏块个数的爆发式增长,会导致用于编码宏块的预测模式、运动矢量、参考帧索引和量化级等宏块级参数信息所占用的码字过多,用于编码残差部分的码字明显减少。

2.由于分辨率的大大增加,单个宏块所表示的图像内容的信息大大减少,这将导致相邻的4×4或8×8块变换后的低频系数相似程度也大大提高,导致出现大量的冗余。

3.由于分辨率的大大增加,表示同一个运动的运动矢量的幅值将大大增加,H.264中采用一个运动矢量预测值,对运动矢量差编码使用的是哥伦布指数编码,该编码方式的特点是数值越小使用的比特数越少。

因此,随着运动矢量幅值的大幅增加,H.264中用来对运动矢量进行预测以及编码的方法压缩率将逐渐降低。

hevc deblock原理

hevc deblock原理

hevc deblock原理HEVC Deblock原理HEVC(High Efficiency Video Coding)是一种高效的视频编码标准,能够提供更高的视频质量和更低的比特率。

而在HEVC编码中,Deblock滤波是一种常用的图像增强技术,用于减少压缩带来的块效应和边缘伪影,从而提高视频的视觉质量。

Deblock滤波的原理是在编码过程中对压缩后的视频进行解码,然后对解码图像的边缘进行处理,以减少由于压缩引起的边缘伪影。

在HEVC中,每个图像块被分成若干个小块,每个小块都有自己的边界。

Deblock滤波的目标是通过调整这些边界像素的值,使得边界更加平滑,减少人眼的感知。

具体来说,Deblock滤波通过以下几个步骤实现:1. 边界检测:在解码图像中,首先要检测出边界像素。

这些边界像素与相邻块之间的边界有关,需要通过计算得到边界像素的值。

2. 强度决策:通过计算边界像素的强度,判断是否需要进行Deblock滤波。

强度决策是根据边界像素的梯度和方向来确定的,只有当边界像素的强度超过一定阈值时,才会进行滤波处理。

3. 滤波过程:对于需要进行滤波处理的边界像素,Deblock滤波采用一种线性滤波的方式进行处理。

具体来说,它通过计算边界像素和相邻像素之间的差值,然后根据一定的滤波规则进行调整,从而达到平滑边界的效果。

4. 边界重构:经过滤波处理后,边界像素的值发生了变化,需要进行边界重构,使得边界与相邻块之间的过渡更加平滑。

边界重构是通过根据滤波后的边界像素值,重新计算边界像素的值,从而得到最终的重构边界。

总的来说,HEVC Deblock滤波通过对解码图像边界像素的处理,减少了压缩带来的块效应和边缘伪影,提高了视频的视觉质量。

通过边界检测、强度决策、滤波过程和边界重构等步骤,Deblock滤波使得视频的边界更加平滑,提高了人眼的感知。

然而,Deblock滤波也存在一些问题。

首先,Deblock滤波会增加视频编码的复杂度,导致编码时间的增加。

基于运动分析的高性能视频编码(HEVC)优化

基于运动分析的高性能视频编码(HEVC)优化

基于运动分析的高性能视频编码(HEVC)优化基于运动分析的高性能视频编码(HEVC)优化随着互联网的普及和网络带宽的提升,视频成为了人们获取信息、娱乐休闲的重要方式。

然而,高质量视频的传输和存储会占用大量的带宽和存储空间。

为了解决这一问题,高效视频编码技术逐渐发展起来。

高性能视频编码(HighEfficiency Video Coding,HEVC)作为最新一代视频编码标准,具备了更高的压缩比和更好的图像质量。

其中,基于运动分析的优化是HEVC实现高压缩率和高画质的关键。

视频编码通过捕捉图像帧间的冗余性,通过编码变换和熵编码技术来达到高压缩率。

而运动分析则是指对帧间预测中的运动矢量进行估计和编码,以便进行运动补偿。

运动分析是HEVC中的一个核心环节,其目的是通过利用时间和空间的冗余性来减少编码视频序列的数据量。

在运动分析中,首先进行帧间预测,即利用参考帧和当前帧之间的差异进行压缩编码。

而运动矢量(Motion Vector,MV)则是表示参考帧和当前帧之间的运动关系的重要信息。

传统的运动测量算法主要使用全搜索法,即在搜索范围内逐个计算所有可能的运动矢量,并选择最佳的来表示运动关系。

然而,全搜索法的计算量太大,在实际应用中难以满足实时性的要求。

为了提高运动分析的效率和准确性,研究者们提出了一系列的运动估计和运动补偿算法。

一种常用的优化方法是基于运动矢量预测的运动估计算法。

该方法通过利用当前帧相邻小区块的运动矢量和参考帧下采样来预测当前小区块的运动矢量,从而减少搜索范围和计算量。

另一种常用的方法是快速搜索算法。

该算法通过限定搜索范围,在一定程度上牺牲了搜索的准确性,但能显著减少计算量。

此外,运动补偿也是优化HEVC编码中的重要环节。

运动补偿是指通过在参考帧上根据运动矢量的指示进行像素的复制,从而重建当前帧。

传统的运动补偿算法主要使用整像素运动补偿(Integer Motion Compensation,IMC),即将运动矢量取整。

一种改进的HEVC编码单元划分方法

一种改进的HEVC编码单元划分方法

一种改进的HEVC编码单元划分方法谢晓燕;王欢;石鹏飞【摘要】针对高效率视频编码(HEVC)帧内预测中的率失真优化(RDO)算法计算复杂度高的问题,该文提出了一种基于统计学的率失真优化的改进方法.通过对不同量化参数的率失真代价概率分布图产生的阈值进行统计,得到最大编码单元(LCU)划分过程中不同深度的闽值方程,并利用该阈值提前终止编码单元的划分从而达到降低计算复杂度的目的.实验表明该文所提出的改进方法与HEVC的测试模型HM10.0相比,在保证视频质量和码率基本不变的前提下(码率仅增加了0.5%,Y-PSNR只降低了0.019dB),减少了26.7%的编码时间,提高了编码效率.【期刊名称】《西北大学学报(自然科学版)》【年(卷),期】2015(045)003【总页数】5页(P389-393)【关键词】HEVC;帧内预测;编码单元划分;率失真优化【作者】谢晓燕;王欢;石鹏飞【作者单位】西安邮电大学计算机学院,陕西西安710061;西安邮电大学计算机学院,陕西西安710061;西安邮电大学计算机学院,陕西西安710061【正文语种】中文【中图分类】TN919.81近年来,数字视频已经成为许多电子应用媒体的主要形式[1],高清晰率、高帧率、高压缩率的发展趋势愈加明显,而已颁布的视频标准H.264/AVC在这些方面呈现出一定的局限性[2]。

因此在2010年1月,ITU-T VCEG(video coding experts group)视频编码专家组和ISO/IEC MPEG(moving picture experts group)运动图像专家组成立了JCT-VC(joint collaborative team on video coding)联合小组,制定了新一代高效率视频编码标准:HEVC(high efficiency video coding)[3],其核心目的是在H.264/AVC的基础上,将压缩效率提高一倍[4]。

h265(HEVC)编解码相关技术概述

h265(HEVC)编解码相关技术概述

H265(HEVC Heigh Efficiency Video Coding)介绍1 概要H.265(高效率视频编码(HEVC))是现行“H.264/MPEG-4 AVC”标准于2003年实现标准化以来时隔10年推出的新标准,将成为支撑未来十年的影像服务和产品的视频压缩技术。

其特点是,支持1080p以上的4K×2K和8K×4K分辨率,将视频压缩率提高至H.264的约2倍。

也就是说,能以原来一半的编码速度发送相同画质的视频。

例如,按照20Mbit/秒发送的H.264格式视频内容,在相同画质的条件下用HEVC格式只需10Mbit/秒的速度。

1.1 H.265发展背景H.264虽然是一个划时代的数字视频压缩标准,但是随着数字视频产业链的高速发展,H.264的局限性逐步显现,并且由于H.264标准核心压缩算法的完全固化,并不能够通过调整或扩充来更好地满足当前高清数字视频应用。

视频应用向以下几个方面发展的趋势愈加明显:(1)高清晰度(Higher Definition):数字视频的应用格式从720P向1080P全面升级,在一些视频应用领域甚至出现了4K*2K、8K*4K的数字视频格式(2)高帧率(Higher frame rate):数字视频帧率从30fps向60fps、120fps甚至240fps的应用场景升级(3)高压缩率(Higher Compression rate):传输带宽和存储空间一直是视频应用中最为关键的资源,因此,在有限的空间和管道中获得最佳的视频体验一直是用户的不懈追求。

由于数字视频应用在发展中面临上述趋势,如果继续采用H.264编码就出现如下一些局限性:(1)宏块个数的爆发式增长,会导致用于编码宏块的预测模式、运动矢量、参考帧索引和量化级等宏块级参数信息所占用的码字过多,用于编码残差部分的码字明显减少。

即:单个宏块所表示的图像内容的信息大大减少,导致4*4或8*8块变换后的低频率相似程度也大大提高,会出现大量的冗余(2)分辨率的大幅增加,表示同一个运动的运动矢量的幅值将大大增加,H.264中采用一个运动矢量预测值,对运动矢量差编码使用的是哥伦布指数编码,该编码方式的特点是数值越小使用的比特数越少。

hevc 量化公式(一)

hevc 量化公式(一)

HEVC(High Efficiency Video Coding)是一种高效的视频编码标准,它采用了先进的量化算法来实现更高质量的视频压缩。

在HEVC中,量化是一个非常重要的步骤,它决定了视频的压缩效率和最终的视觉质量。

本文将对HEVC的量化公式进行详细的解释,并举例说明其在视频编码中的应用。

1. HEVC量化公式概述在HEVC中,量化是指将视频信号的变化范围划分为一系列离散的量化级别,从而减少视频数据的表示精度,实现压缩。

HEVC采用了一种分块的量化方法,即将视频帧分成若干个块,然后对每个块进行独立的量化处理。

量化公式是确定每个块中的每个像素值如何映射到具体的量化级别的数学表达式。

2. HEVC量化公式详解HEVC量化公式主要包括两部分:量化参数和量化计算公式。

量化参数包括量化步长、量化矩阵等,而量化计算公式则是具体的数学表达式,用于计算每个像素值的量化级别。

量化参数在HEVC中,量化参数是由量化参数矩阵(Quantization Parameter Matrix)来确定的。

量化参数矩阵是一个二维数组,其中的每个元素都代表了一个量化级别。

不同的量化参数矩阵可以对不同的视频块采用不同的量化级别,从而实现更好的压缩效果。

量化计算公式量化计算公式是对视频块中的每个像素值进行量化级别的计算。

在HEVC中,常用的量化计算公式包括线性量化和非线性量化。

线性量化公式通常采用以下形式:Q( x, y ) = round( f( x, y ) / ( s * QP ) )其中,Q( x, y )代表了坐标为( x, y )的像素值的量化级别,f( x, y )是原始像素值,s是量化步长,QP是量化参数。

通过这个公式,可以将原始像素值根据量化参数映射到特定的量化级别。

3. HEVC量化公式举例举例来说,假设一个视频块中的原始像素值为{10, 20, 30, 40},量化步长为2,量化参数为{4, 8, 16, 32}。

利用深度学习的HEVC帧内编码单元快速划分算法

利用深度学习的HEVC帧内编码单元快速划分算法

2021年2月第2期Vol. 42 No. 2 2021小型微 型计算 机系统Journal of Chinese Computer Systems利用深度学习的HEVC 帧内编码单元快速划分算法易清明,林成思,石敏(暨南大学信息科学技术学院,广州510632)E-mail :linchengsil23@ stu2017. jnu. edu. cn摘 要:新一代视频编码标准高效视频编码(High Efficiency Video Coding,HEVC)中编码单元(Coding Unit,CU )大小不同的特性使得编码效率得到显著提升,但同时带来了极高的计算复杂度.为了去除CU 划分中多余的计算从而降低编码复杂度,本 文提出了一种利用深度学习的编码单元快速划分算法.首先使用原始视频亮度块及编码信息建殳了一个HEVC 中CU 划分的 数据库,用于接下来本文深度学习神经网络的训练.然后,为了更好地砧合编码单元划分的层级结构,本文提出了一种基于In ­ception 模块的神经网络结构,使之内嵌于HEVC 编码框架中对编码单元的划分进行提前预测,有效地去除了 All Intra 配置下中冗余的CU 划分计算.实验结果表明,本文提出的算法与HEVC 官方测试模型(HM16. 12)相比,编码时间平均降低了61.31% ,而 BD-BR 与 BD-PSNR 仅为 1.86% 和O 13dB.关键词:HEVC ;编码单元划分;深度学习;Inception 模块中图分类号:TP391文献标识码:A 文章编号:1000-1220(2021 )02-0368-06Fast HEVC Coding Units Partitioning Algorithm Based on Deep LearningYI Qing-ming , LIN Cheng-si , SHI Min(College of Information Science and Technology ,Jinan University ,Guangzhou 510632,China)Abstract : The different size of the coding unit ( CU ) in the new generation of videocoding standard , highefficiency video coding (HEVC ) makes the coding efficiency significantly improved , but at the same time brings high computational complexity. In order toremove the redundant calculation in CU partition and reduce the coding complexity , this paper proposes a fast partitioning algorithmbased on deep learning. Firstly , a database of CU partition in HEVC is established by the original video luminance block and coding in ­formation ,which provides data guarantee for trainingthedeep learning model. Then , in order to better fit the hierarchical structure of coding unit partition , this paper uses a neural network structure based on Inception Module , which isembeddedin the HEVC coding framework to predict the partition of coding units in advance , effectively eliminating the redundant CU partition calculation in All Intraconfiguration. The experimental results show that compared with the HEVC official test model ( HM16. 12) ,the proposed algorithm re ­duces the coding time by an average of 61.31% .while the BD-BR and BD-PSNR are only 1.86% and -0.13dB.Key words : HEVC ; coding unit partition ; deep learning ; Inception module1引言H. 265/HEVC ( High Efficiency Video Coding ,高效视频编码)是ITU-T 和ISO/IE 在2013年联合发布的继H. 264/ AVC 之后的新一代高效视频编码压缩标准⑴.HEVC 标准致 力于在保证视频编码质量的前提下,在编码效率上比AVC 提升一倍,为此HEVC 引入了一系列新的技术.但同时编码复杂度急剧增加,使得在多媒体应用上HEVC 存在对设备的运算能力要求的较高门槛,因此HEVC 亟需通过算法优化降低编码复杂度.在HEVC 中,为了适应视频图像平缓区域和复杂区域的不同编码特性,一幅图像可以被划分为互不重叠的编码树单 元[21(CTU),在CTU 内部采用基于四叉树的循环分层结构 划分为若干个CU,这个递归过程占据了 HEVC 编码时间的80%以上,其原因在于对于每一个CU 划分的可能方案 HEVC 采用了暴力递归的做法遍历每一种方案通过计算RD代价(RD-cost)以寻求最优码率,这个过程存在大量的冗余 计算⑶.自HEVC 标准发布以来,许多针对HEVC 编码单元快速 划分的优化方案被陆续提出,不同程度地减少了 CU 划分的 冗余计算.文献[4]所提出的算法定义了基于RD 代价(RD-cost) 的贝叶斯决策方法, 在每个 CU 深度级别执行提前CU分裂和修剪,减少CU 分割遍历次数.文献[5]利用前一帧以 及当前帧相邻CU 的划分结果,对当前帧的CU 划分方式进行预判.文献[6]利用了输入图像纹理梯度等特性,利用纹理复杂度自适应地跳过一些CU 大小.文献[7 ]提供自适应决策 能力来扩展基于关键点的CU 深度决策(KCD)方法,一定程度上降低了编码计算复杂度.以文献[8,9]为代表的基于支收稿日期;2020-02-28收修改稿日期:202045-12基金项目:国家自然科学基金项目(61603153)资助;广州市“羊城创新创业领军人才支 持计划”之创新领军人才项目(领军人才2019019)资助;广州市产业技术重大攻关计划项目(201802010028)资助.作者简介:易清明,女,1965 年生,博士,教授,研究方向为IC 设计、视频编码等;林成思,男,1995年生,硕士,研究方向为视频编码;石敏,女,1977年生,博士,副教授,研 究方向为图像处理、视频编解码等.2期易清明等:利用深度学习的HEVC帧内编码单元快速划分算法369持向量机(SVM)的快速CU大小决策算法提取图像特征来判断CU复杂度,然后基于SVM建立CU大小决策的分类器结构.文献[10]同样使用SVM来进行预测帧内CU划分,同时结合帧内角度预测模式,进一步减少帧内预测的计算复杂度.另外,随着深度学习的不断发展,很多深度学习方法被应用到视频编解码的领域.文献[11]使用了一个两层的卷积神经网络结构来预测单个CU是否划分的二分类问题.文献[12]使用了一个更深的3层CNN结构来预测整个CTU的模型,并建立了一个针对CU划分的数据库CPIH,改善了网络的学习能力.上述帧内CU划分快速选择算法都能够在一定程度上减少CU划分冗余计算,缩减编码时间,但仍存在自身缺陷.例如早期启发式方法如文献[4-7]依赖与人为指定的经验特征,无法挖掘CU划分过程中的深层次特征.文献[8-10]利用的SVM的方法学习能力有限,相比深度学习模型在预测能力上稍显不足,准确率不能得到保证.而深度学习方法如文献[11,12]等也存在着一些问题,如分开使用3个同样的CNN来分别预测3种大小的CU划分,在不同深度的CU划分中没有建立联系;同时每次网络只判断一层的CU划分情况,需要反复调用多次才能预测出整个CTU的划分,仍有改进的空间.本文针对以上问题,提出一种基于深度学习编码单元快速划分算法.首先与一些三级分类器方法需要反复调用分类器不同的是,本文方法一次性预测整个CTU的CU划分情况,将同一个CTU中不同深度的CU划分建模为一个整体;另外,为了更好地适应CU划分的层级结构,本文算法使用了一种基于Inception模块的神经网络结构,使之内嵌于HEVC编码框架中,直接根据亮度像素值对编码单元的划分进行提前预测,有效地去除了All Intra配置下中冗余的CU 划分计算.2基于深度学习的快速编码单元划分算法与上一代编码标准H.264相比,HEVC新引入了通过四叉树方式灵活划分的树形结构单元(CTU),-个CTU大小一般为64x64,可以划分为不同大小编码单元(CU).为了贴合不同视频图像的纹理特征,每个CU共设有4种可能划分尺寸:64x64、32x32、16X16和8x8.图1为CTU划分为图1HEVC CU划分结构示意图Fig.1HEVC CU Splitting StructureCU的示意图.本文深度学习模型以整个CTU的亮度块像素作为输入,各个尺寸的CU分割模式作为输出,经过训练学习以获得较为准确的CU划分预测效果.2.1划分模式建模根据HEVC中CTU的分割结构,经过划分之后一个CU 最多可能有4种大小,包括64x64,32x32,16x16和8x8,分别对应于CU划分的深度0、1、2和3.如图2所示,我们用Ze10,1,2,3)来表示不同深度,用y,来表示在深度/-1的CU是否要划分为深度为I的子CU这一划分决策,例如几代表64x64的CU是否要划分为32x32的子CU这一决策.对于每一个大小316X16的CU来说,都存在一个“是否要划分为更小的CU”的决策.为了更好地区分不同深度、同一深度不同位置的CU划分决策,本文分别用几、{%.,}:“、{".,显”。

h265(HEVC)编解码相关技术概述

h265(HEVC)编解码相关技术概述

H265(HEVC Heigh Efficiency Video Coding)介绍1 概要H.265(高效率视频编码(HEVC))是现行“H.264/MPEG-4 AVC”标准于2003年实现标准化以来时隔10年推出的新标准,将成为支撑未来十年的影像服务和产品的视频压缩技术。

其特点是,支持1080p以上的4K×2K和8K×4K分辨率,将视频压缩率提高至H.264的约2倍。

也就是说,能以原来一半的编码速度发送相同画质的视频。

例如,按照20Mbit/秒发送的H.264格式视频容,在相同画质的条件下用HEVC格式只需10Mbit/秒的速度。

1.1 H.265发展背景H.264虽然是一个划时代的数字视频压缩标准,但是随着数字视频产业链的高速发展,H.264的局限性逐步显现,并且由于H.264标准核心压缩算法的完全固化,并不能够通过调整或扩充来更好地满足当前高清数字视频应用。

视频应用向以下几个方面发展的趋势愈加明显:(1)高清晰度(Higher Definition):数字视频的应用格式从720P向1080P全面升级,在一些视频应用领域甚至出现了4K*2K、8K*4K的数字视频格式(2)高帧率(Higher frame rate):数字视频帧率从30fps向60fps、120fps甚至240fps的应用场景升级(3)高压缩率(Higher Compression rate):传输带宽和存储空间一直是视频应用中最为关键的资源,因此,在有限的空间和管道中获得最佳的视频体验一直是用户的不懈追求。

由于数字视频应用在发展中面临上述趋势,如果继续采用H.264编码就出现如下一些局限性:(1)宏块个数的爆发式增长,会导致用于编码宏块的预测模式、运动矢量、参考帧索引和量化级等宏块级参数信息所占用的码字过多,用于编码残差部分的码字明显减少。

即:单个宏块所表示的图像容的信息大大减少,导致4*4或8*8块变换后的低频率相似程度也大大提高,会出现大量的冗余(2)分辨率的大幅增加,表示同一个运动的运动矢量的幅值将大大增加,H.264中采用一个运动矢量预测值,对运动矢量差编码使用的是哥伦布指数编码,该编码方式的特点是数值越小使用的比特数越少。

hevc原理

hevc原理

hevc原理HEVC(High Efficiency Video Coding)是一种视频压缩编码标准,旨在通过更高的压缩比和更好的视觉质量来提供更高效的视频传输和存储。

本文将深入探讨HEVC的原理,从视频压缩和编码角度阐述其工作机制。

一、HEVC概述HEVC是一种基于块的视频编码标准,它对视频内容进行时域和空域的分析,并使用一系列编码技术对视频进行压缩和解压缩。

相比之前的视频编码标准,如H.264,HEVC能够提供更高的压缩比,并在相同的码率下保持更好的视觉质量。

二、视频压缩在了解HEVC原理之前,我们先来了解视频压缩的基本原理。

视频压缩主要包括两个步骤:去冗余和编码。

去冗余是指在视频中删除冗余信息,以减少数据量。

冗余信息通常包括时间冗余和空间冗余。

时间冗余是指视频连续帧之间存在的冗余,而空间冗余是指同一帧内存在的冗余。

编码是指将去冗余后的视频数据进行有效的表示和存储。

编码过程主要包括预测、变换、量化和熵编码等步骤。

三、HEVC编码原理HEVC编码过程主要包括预处理、编码单元划分、预测、变换、量化和熵编码等步骤。

1. 预处理在预处理阶段,视频帧首先被划分为多个编码单元(CTU),然后每个CTU进一步划分为多个帧内编码单元。

这种层次化的划分可以提高编码效率。

2. 编码单元划分编码单元是视频编码的基本单元,它的大小以CTU为单位进行划分。

每个CTU包括多个帧内编码单元,每个帧内编码单元可以包含一个或多个预测单元(PU)和变换单元(TU)。

3. 预测在HEVC中,预测是通过参考帧来进行的。

编码单元中的每个PU 都可以通过参考帧中相似区域的像素进行预测。

根据预测的准确度,预测模式可以细分为帧间预测和帧内预测。

4. 变换变换将编码单元中的像素从时域域转换为频域域,以方便压缩。

HEVC采用了高效的正交变换,如4x4离散余弦变换(DCT)或16x16离散余弦变换(DCT)。

5. 量化量化是将变换系数量化为离散级别的过程,目的是减少数据的精度。

基于帧间差的分算法的运动目标检测研究论文 案例范本

基于帧间差的分算法的运动目标检测研究论文 案例范本

基于帧间差的分算法的运动目标检测研究论文案例范本摘要本文提出了一种基于帧间差的分算法的运动目标检测方法。

该方法通过计算相邻帧之间的差异来检测出视频中的运动目标,并采用自适应阈值法来进行目标的分割和去除噪声。

实验结果表明,该方法在运动目标检测方面具有较高的准确率和鲁棒性。

关键词:运动目标检测;帧间差;自适应阈值法;噪声去除AbstractIn this paper, a motion target detection method based on frame difference segmentation algorithm is proposed. This method detects moving targets in the video by calculating the differences between adjacent frames, and uses an adaptive threshold method to segment the targets and remove noise. The experimental results show that the proposed method has high accuracy and robustness in motion target detection.Keywords: motion target detection; frame difference; adaptive threshold method; noise removal1.引言运动目标检测是计算机视觉领域的一个重要研究方向,其应用广泛,包括视频监控、交通管理、自动驾驶等。

目前,运动目标检测方法主要分为两类:基于背景建模的方法和基于帧间差的方法。

前者适用于静态场景,后者适用于动态场景。

本文提出了一种基于帧间差的分算法的运动目标检测方法,该方法具有较高的准确率和鲁棒性。

HEVC运动估计快速算法优化及硬件实现

HEVC运动估计快速算法优化及硬件实现

1 引言高效视频编码(HEVC)作为新一代标准,沿用了上一代标准H.264/ AVC的编码框架[1]。

但是针对不同部分,H.265/HEVC都分别提出了新技术。

比如H.264/AVC是以宏块作为编码单元,而在H.265/HEVC中采用了编码树单元(CTU),其往下划分的结构有编码单元( CU)、预测单元(PU)和变换单元(TU)[2]。

CU的尺寸不再局限于16×16,而可以根据深度划分,从64×64分割到8×8大小。

而在实际编码过程中,计算量最大的是帧间预测部分,这是由于视频图像时间冗余大于空间冗余的特性所造成的。

在模式选择的整个迭代过程中,以运动估计为例,不同尺寸的PU块都需要经过搜索、插值来找到各自最佳的匹配块。

这是一个繁琐且非常耗时的过程。

目前已有很多学者对帧间预测模式选择提出了一些简化算法,文献[3]提出了一种扩展和迭代搜索(S&IS)以及低密度和迭代搜索(LD&IS)的运动估计算法,这种方式因为在遍历每个PU时具有规则的周期数,所以在硬件电路的设计上更加友好,但是运动估计所消耗的周期数受视频序列特点影响大,如果周期数较为固定,可能会对编码性能造成一定影响。

文献[4]提出了用基于运动矢量相似性的运动估计快速终止算法。

利用率宏块内子块运动矢量一致的特点,通过计算排除掉不可能的划分方式,从而达到提前终止运动估计的目的。

文献[5]也是采用基于划分深度的先粗选再细选的搜索方式,但是采用的搜索步长、下采样比例以及搜索方式均和本文不同,且最终结果对编码性能造成比特率增加较大。

文献[6]采用了一种快速中心搜索算法,通过发现一帧图像中,静止宏块、慢速运动宏块和快速运动宏块的比例关系,改变全搜索的遍历顺序,并设置提前终止规则,达到快速中心搜索的目的。

文献[7]采用了一种易于硬件实现的整像素运动估计搜索方式,使用并行聚类树搜索方式同时处理各个PU,并在搜索之后将相同MV候选的PU汇聚成一组,下一次的搜索将以这些组为单位进行统一搜索。

HEVC标准中的图像分割(1),slice,tile,CTU,CU,PU,TU等

HEVC标准中的图像分割(1),slice,tile,CTU,CU,PU,TU等

HEVC标准中的图像分割(1),slice,tile,CTU,CU,PU,TU等HEVC标准中的图像分割(1),slice,tile,CTU,CU,PU,TU等2017年10⽉26⽇ 18:47:33 messi_cyc 阅读数:145H.265的标准可以从⽹上免费下载。

这⾥写⼀些我个⼈对HEVC(H.265)标准的解读,难免有些错误,欢迎⼤家积极积极留⾔讨论。

图像分割,就是说⼀帧图像从⼏何空间上在标准中是如何划分的。

与h.264不同,265引⼊了tile的概念。

⾸先,图像被分成slices和tiles。

⼀个Slice包含⼀个slice segment或者以⼀个independent slice segment为⾸⼀系列的slice segments。

Slice和tile都由⼀系列的coding tree units组成,简称CTU(相当于以前宏块的概念)。

例⼦a1,如下图中,图像被分成了两个slice,第⼀个slice⼜分成了3个slice segments,其中第⼀个slice segment是⼀个包含4个coding tree units的independent slice segment。

⽽第⼆个slice只有⼀个slice segment。

例⼦a2,如下图(a)中,图像被分成2个tiles,图像只有⼀个slice,包含⼀个independent slice segment 和四个dependent slice segments。

图(b)中,图像也被分成了2个tiles,第⼀个tile有⼀个两个slices,第⼆个有⼀个slice。

(a)(b)Tiles异于slices的⼀点是,tiles必须为长⽅形。

⽽且通过分析后续标准中关于语法元素的介绍,可以肯定,tiles的划分必须满⾜每⼀⾏的tiles有相同的⾼度,每⼀⾏的tiles有相同的宽度。

标准中给出了⼀下条件来约束slices和tiles的相互关系。

基于LightGBM的HEVC编码单元快速划分算法

基于LightGBM的HEVC编码单元快速划分算法

基于LightGBM的HEVC编码单元快速划分算法
董于静
【期刊名称】《信息与电脑》
【年(卷),期】2022(34)1
【摘要】针对高效视频编码帧间预测过程中,编码单元率失真代价计算导致编码复杂度较高的问题,提出一种基于LightGBM的高效视频编码标准(High Efficiency Video Coding,HEVC)快速划分算法。

算法将编码单元(Coding Unit,CU)的划分情况视为分类问题,采用LightGBM对CU块进行划分分类预测。

实验结果表明,在低时延模式下,该算法与标准编码器相比,平均码率变换率增加1.95%,平均节省的编码时间效率为27.72%,具有较高的编码效率。

【总页数】3页(P68-70)
【作者】董于静
【作者单位】上海电力大学电子与信息工程学院
【正文语种】中文
【中图分类】TN919.81
【相关文献】
1.HEVC帧内编码单元快速划分算法
2.基于深度预测的HEVC编码单元快速划分算法
3.基于时空相关与纹理特性的HEVC编码单元快速划分算法
4.基于梯度结构相似度的HEVC帧内编码单元快速划分算法
5.基于梯度结构相似度的HEVC帧间编码单元快速划分算法
因版权原因,仅展示原文概要,查看原文内容请购买。

全景媒体(OMAF_VR)的系统架构研究综述

全景媒体(OMAF_VR)的系统架构研究综述

全景媒体(OMAF)的系统架构研究综述1 概述虚拟现实技术是一种通过计算机仿真来创建和体验虚拟世界的技术,其中,交互式的三维动态视景与用户实体行为的融合大大丰富了用户的观看体验。

目前,VR(virtual reality,虚拟现实)已成为一项热门技术,它通过展现360度的视频为观看者提供了沉浸式的“亲身体验”和“现实生活”。

用户可以交互性地随时切换他们观看的视角,并且动态地查看他们所期望看到的部分场景。

VR在很多领域都有它独特的应用魅力,如VR模拟、VR游戏、VR视频直播等。

从用户体验的角度看,VR技术的最独特之处在于全景视频,也称360度全景视频或沉浸式视频。

全景媒体是指能够根据用户的观看视角进行渲染的图像、视频及其相关联的音频。

在拍摄端,全景视频一般由指向不同方向的多个照相机拍摄并拼接而成。

由于人的视野有限,因此无法在特定视角看全整体画面,而是通常将注意力放在特定的感兴趣的区域。

在渲染端,全景视频播放已经使用许多显示设备实现。

但是,VR服务的核心问题在于如何将全景视频从相机拍摄端向最终的显示端进行传输和存储。

全景媒体的技术架构主要由视频拼接与映射、视频编解码、存储与传输等技术构成。

目前,已有多家公司提出了视频拼接算法,关于映射方法也有多种模型方案。

此外,一些组织和标准正在制定针对全景媒体的编解码和传输的优化算法。

同时,全景媒体技术面临很多巨大的挑战。

首先,全景视频分辨率是一个技术瓶颈,相机组拼接带来的不同步、变形等因素将严重降低视频质量;其次,全景媒体庞大的数据传输与计算给传输带宽和终端的解码能力提出了巨大的挑战;此外,端到端的时延也是一个影响用户体验的关键参数。

目前,市场上出现的虚拟现实产品标准不一,需要新的行业标准的约束。

因此,为了将VR技术扩展到更广泛的市场,需要定义一种通用的应用架构标准,可以在不同的VR设备之间进行全景视频的存储、管理、交换、编辑和呈现。

2 全景媒体应用的发展与演进OMAF(omnidirectional media application format,全景媒体的应用格式)最先由MPEG(moving picture experts group,动态图像专家组)组织在2015年10月的113届MPEG会议上提出,它提出的重要意义在于它为VR系统的输入输出接口设定了标准,便于扩展到科学研究和商业领域。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
NIU Zhiguo, LIANG Jiuzhen, WU Qin. Moving object segmentation method based on block in HEVC compressed domain. Computer Engineering and Applications, 2016, 52(14):202-208.
202 2016,52(14)
Computer Engineering and Applications 计算机工程与应用
基于块划分的 HEVC 运动目标分割方法
牛志国,梁久祯,吴 秦
NIU Zhiguo, LIANG Jiuzhen, WU Qin
江南大学 物联网工程学院 智能系统与计算研究所,江苏 无锡 214122 Institute of Intelligent Systems and Network Computing, School of Internet of Things Engineering, Jiangnan University, Wuxi, Jiangsu 214122, China
1 引言
运 动 目 标 分 割 是 视 频 监 控 、视 频 数 据 浏 览 、视 频 目 标解释等应用中一个很关键的问题。视频分割方法主 要可在压缩域和像素域 进 [1] 行。目前,运动目标分割技 术主要在像素域 进 [2-3] 行,但随着视频应用中分辨率的不 断 提 高 ,传 统 的 像 素 域 分 割 的 实 时 性 受 到 很 大 的 限 制 , 而压缩域进行运动目标分割以其较低的计算复杂度和 较少的内存占用等优势受到了越来越多的关注 。 [4-5]
近年提出的压缩域分割算法都大多应用 2003 年制 定 的 视 频 编 码 标 准 H.264[6],提 取 的变换 DCT[8-9]系数。由于从编码 码流中提取的运动矢量信息是从编码的角度得到的,不 能代表真正的运动目标,所以一般在进行运动目标分割 前 要 对 其 进 行 预 处 理 ,Liu[10] 通 过 归 一 化 运 动 矢 量 将 视 频帧分割为平坦区域,并利用二叉划分树方法对各区域 进行合并来分割运动对象,之后 Liu 等人 又 [11-12] 对运动矢 量进行后向迭代得到累加运动矢量场,使得特征信息更 加凸显。为了去除背景噪声,Zhang 和 Liu[13]假定背景噪 声服从高斯分布,利用 Higher-Order 统计方法很好地滤 除噪声,但是对不同场景处理的稳定性不高。刘[14]和孔[15]
Abstract:To solve the problem that the segmentation accuracy of moving object is not high enough under complex background in compressed domain video, this paper proposes a moving object segmentation method based on the up-to-date video coding standard HEVC. Firstly, block partitions and corresponding motion vectors extracted from the HEVC bitstream are classified based on spatial and temporal consistency in intra frame and inter frames. Then the MRF model is selectively exploited to refine the classification result for more accurate video object. Experimental results show that the proposed method can achieve an effective and reliable segmentation result, and the method is better than the other comparison methods especially for multiple target motion video segmentation. Key words:High Efficiency Video Coding(HEVC); moving object segmentation; block partition; Markov Random Field (MRF)
基金项目:国家自然科学基金(No.61170121,No.61202312)。 作者简介:牛志国(1990—),男,硕士,CCF 学生会员,主要研究方向为计算机应用技术;梁久祯(1968—),男,博士,教授,主要研
究方向为机器视觉、图像处理、模式识别;吴秦(1978—),女,副教授,主要研究方向为模式识别、计算机视觉。 收稿日期:2015-06-05 修回日期:2015-09-08 文章编号:1002-8331(2016)14-0202-07 CNKI 网络优先出版:2015-09-29, /kcms/detail/11.2127.TP.20150929.1045.008.html
摘 要:针对压缩域视频的运动对象分割在复杂背景下分割精度不高的问题,提出一种基于最新压缩编码 HEVC 的 运动分割方法。首先从 HEVC 压缩码流中提取块划分和相对应的运动矢量信息,并分别在帧内和帧间对运动矢量 进行空域和时域的标签分类,然后利用 MRF 模型对标签场进行运动一致性估计,得到更精确的运动目标,最后输出 MRF 分割后形成的掩模信息。通过实验证明,该运动分割方法能够达到有效并可靠的分割效果,尤其对于多目标运 动的视频分割效果优于其他比较的方法。 关键词:高效率视频编码(HEVC);运动目标分割;块划分;马尔可夫随机场(MRF) 文献标志码:A 中图分类号:TP391 doi:10.3778/j.issn.1002-8331.1506-0050
相关文档
最新文档