视频编码国际标准

合集下载

H.261和H.263标准

4.6.3 H.261和H.263标准
1. H.261标准
H.261标准是视频图像压缩编码国际标准。由于各个领域对利用综合服务数字网（Integrated Services Digital Network，ISDN）提供电视服务的需求不断增长，CCITT的第XV研究小组于1984年组建了一个关于可视电话编码的特别小组，它的目标是建立一个传输率为m×384kbps（m=1，2，…， 5）的视频编码标准。
要在低于64k的传输通道中同时传输视频、音频和其他控制信号，就需要对源数据进行大量的压缩。就视频信号为例，对于一个 176×144大小的图像，以Y：U：V = 4：1：1的格式进行采样，如果按每秒15帧的速度播放，则不压缩时要求的传输带宽为： 176×144×(8+2+2)×30＝9 123 840（bps）而以带宽为28.8k的通用电话网作为传输通道时，则要求图像压缩比为316.8。这是一个十分惊人的压缩比例。以JPEG静态图像压缩标准为例，图像的压缩比大约为20~30。而现在最常用的VCD运动图像压缩标准MPEG-I，它的压缩比大约为30左右。对于新一代的DVD 运动图像压缩标准MPEG-II，它的压缩比也大致为30左右。现在对运动图像压缩比的要求达到300，这就需要采用新的标准对运动图像进行编码了。
H.263编解码模块图
CIF
QCIF
行/帧
像素/行
行/帧
像素/行
亮度(Y)
288
360(352)
144
180(176)
色度(CB)
144
180(176)
72
9ቤተ መጻሕፍቲ ባይዱ(88)
色度(CR)
144
180(176)

h.264标准的特点及应用

H.264标准的特点及应用随着人类精神需求和空间需求的提升，人们不再满足面对面的语言交流，空间距离的增加导致人们面对面的语言交流变得越来越少，人们更需要在时空中交流与交往。

当传统的交流方式难以实现时，更需要视觉、感观以及信息交流。

正因为如此，促进了卫星通信、微波通信、有线/无线传输技术的发展，也推动信息压缩技术和宽带传输技术，同时推动了安防业的迅猛发展。

视频信息传输和视频通讯的猛增，给视频压缩技术带来了很大挑战。

无论是互联网还是无线网络，都需要一种新型的压缩算法，新算法要求高压缩比，且能适应不同的网络环境。

以较小的失真、较高的压缩比、更小的花费、较低的码率在信道中传递视频，进行多媒体通信是今后视频压缩技术研究的一个方向。

H.264，又称MPEG-4part10，也称AVC(AdvancedVideoCoding)，是一个数字视频压缩标准，由VCEG(ITU-TVideoCodingExpertsGroup)和MPEG(ISO/IECMovingPictureExpertsGroup)联合组成的JVT(JointVideoTeam)于2003年3月正式发布[1，2]。

H.264标准的主要目标就是在同等保真条件下，提高编码效率。

这是一对矛盾，既然要求图像不失真，则图像传输的比特数就大，在网络带宽一定的情况下，图像信号传输的速度就快，因此，只有提高编码效率才能实现。

H.264的源起在以往众多的视频编码算法中，被广泛认可并应用于实际的是ISO/IEC制定的MPEG-X和ITU-T制定的H.26x两大系列视频编码国际标准。

H.261是早期的编码标准，主要是规范ISDN网上的会议电视和可视对讲。

它采用的是可减少时间冗余的帧间预测和减少空间冗余的DCT变换的混合编码方法，以及ISDN信道匹配，其输出码率是P×64kbit/s。

P较小时，传输清晰度不太高的图像;P较大时，可以传输清晰度较好的会议电视图像。

视频压缩技术有：MPEG-4、H263、H263+、H264等.doc

视频压缩技术有：MPEG-4、H263、H263+、H264等
MPEG-4视频编码技术介绍
MPEG是“Moving Picture Experts Group”的简称，在它之前的标准叫做JPEG，即“Joint Photographic Experts Group”。当人们用到常见的“.jpg”格式时，实际上正在使用JPEG的标准。JPEG规范了现代视频压缩的基础，而MPEG把JPEG标准扩展到了运动图象。MPEG-4视频编码标准支持MPEG-1、MPEG-2中的大多数功能，它包含了H.263的核心设计，并增加了优先特性和各种各样创造性的新特性。它提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码，同时也支持基于内容的图像编码。采纳了基于对象(Object-Based)的编码、基于模型(Model-based)的编码等第二代编码技术是MPEG-4标准的主要特征。
H.263+视频压缩标准
1.ITU-T在H.263发布后又修订发布了H.263标准的版本2，非正式地命名为H.263+标准。它在保证原H.263标准核心句法和语义不变的基础上，增加了若干选项以提高压缩效率或改善某方面的功能。原H.263标准限制了其应用的图像输入格式，仅允许5种视频源格式。H.263+标准允许更大范围的图像输入格式，自定义图像的尺寸，从而拓宽了标准使用的范围，使之可以处理基于视窗的计算机图像、更高帧频的图像序列及宽屏图像。为提高压缩效率，H.263+采用先进的帧内编码模式；增强的PB-帧模式改进了H.263的不足，增强了帧间预测的效果；去块效应滤波器不仅提高了压缩效率，而且提供重建图像的主观质量。为适应网络传输，H.263+增加了时间分级、信噪比和空间分级，对在噪声信道和存在大量包丢失的网络中传送视频信号很有意义；另外，片结构模式、参考帧选择模式增强了视频传输的抗误码能力。

视频监控系统中H.265、SVAC、GBT28181、ONVIF、PSIA有什么区别？

H.264，H.264是ITU-T以H.26x系列为名称命名的视频编解码技术标准之一。

国际上制定视频编解码技术的组织有两个，一个是“国际电联（ITU-T）”，它制定的标准有H.261、H.263、H.263+等，另一个是“国际标准化组织（ISO）”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。

而H.264则是由两个组织联合组建的联合视频组（JVT）共同制定的新数字视频编码标准，所以它既是ITU-T的H.264，又是ISO/IEC的MPEG-4高级视频编码（Advanced Video Coding，AVC），而且它将成为MPEG-4标准的第10部分。

因此，不论是MPEG-4 AVC、MPEG-4 Part 10，还是ISO/IEC 14496-10，都是指H.264。

H.265是ITU-T VCEG 继H.264之后所制定的新的视频编码标准。

H.265标准围绕着现有的视频编码标准H.264，保留原来的某些技术，同时对一些相关的技术加以改进。

新技术使用先进的技术用以改善码流、编码质量、延时和算法复杂度之间的关系，达到最优化设置。

具体的研究内容包括：提高压缩效率、提高鲁棒性和错误恢复能力、减少实时的时延、减少信道获取时间和随机接入时延、降低复杂度等。

H264由于算法优化，可以低于1Mbps的速度实现标清数字图像传送；H265则可以实现利用1~2Mbps的传输速度传送720P（分辨率1280*720）普通高清音视频传送。

H.265旨在在有限带宽下传输更高质量的网络视频，仅需原先的一半带宽即可播放相同质量的视频。

这也意味着，我们的智能手机、平板机等移动设备将能够直接在线播放1080p的全高清视频。

H.265标准也同时支持4K(4096×2160)和8K(8192×4320)超高清视频。

可以说，H.265标准让网络视频跟上了显示屏“高分辨率化”的脚步。

SVAC《安全防范监控数字视音频编解码技术标准》（简称SVAC，Surveillance Video and Audio Coding）。

vvc标准

VVC标准什么是VVC标准VVC标准是指Versatile Video Coding（多功能视频编码）标准，由国际电信联盟和国际标准化组织共同制定。

VVC标准是用于视频编码的新一代压缩标准，旨在提供更高的压缩性能和更好的视频质量。

VVC标准的发展历程1. H.264/AVC标准H.264/AVC标准于2003年发布，是当前广泛使用的视频编码标准。

它提供了高压缩率和良好的视频质量，在多种应用领域得到广泛应用，如互联网视频、电视广播和移动通信。

2. HEVC标准由于高清视频的兴起和4K、8K等超高清视频的广泛应用，对视频压缩技术的需求更高。

为了满足这一需求，HEVC（High Efficiency Video Coding，高效视频编码）标准于2013年发布。

相比于H.264/AVC标准，HEVC标准提供了更高的压缩性能，可实现更低的比特率和更好的视频质量。

3. VVC标准的提出尽管HEVC标准在视频压缩方面取得了显著进展，但随着超高清视频需求的不断增长，仍然存在压缩性能提升的空间。

因此，国际电信联盟和国际标准化组织于2020年发布了VVC标准。

VVC标准的优势VVC标准相比于HEVC标准具有以下优势：1.更高的压缩性能：VVC标准通过引入更多的编码工具和算法，实现了更高的压缩性能。

相同比特率下，采用VVC编码的视频相比HEVC编码的视频可以获得更好的视觉质量。

2.适应性编码：VVC标准支持适应性编码，可以根据不同设备和网络的要求，选择合适的编码参数。

这使得VVC编码的视频在不同终端上具有更好的兼容性和可扩展性。

3.更好的弱网络环境下的表现：VVC标准在弱网络环境下具有更好的鲁棒性，这意味着在网络带宽较低或不稳定的情况下，VVC编码的视频可以保持较好的观看体验。

VVC标准的应用VVC标准可以应用于各类视频应用领域，包括但不限于：1. 互联网视频VVC标准可以为互联网视频提供更高的压缩性能和更好的视频质量。

mpeg国际标准

MPEG（Moving Picture Experts Group）是一个国际标准化组织，致力于制定数字音频和视频编码标准。

MPEG 国际标准涉及多种多媒体技术，其中最著名的是MPEG-1、MPEG-2、MPEG-4 和MPEG-7。

1. MPEG-1：于1993年发布，最初设计用于压缩视频和音频，以适应CD-ROM存储。

它是数字视频和音频的首个国际标准。

2. MPEG-2：于1995年发布，广泛用于数字电视、DVD、蓝光光盘等广播和储存媒体。

MPEG-2支持高质量视频压缩，并允许多个音频流。

3. MPEG-4：于1999年发布，旨在提供更高的压缩效率和更多的功能。

MPEG-4标准不仅支持视频和音频压缩，还包括对3D图形、虚拟现实、交互性和其他多媒体元素的支持。

4. MPEG-7：是一个于2002年发布的标准，旨在定义一组描述多媒体内容的元数据，以便更有效地检索和管理这些内容。

这些标准由国际电工委员会（IEC）和国际电信联盟（ITU）联合组成的JTC 1/SC 29 （图像、声音和多媒体编码标准化委员会）制定和维护。

这些标准的制定旨在促进全球多媒体应用和服务的
互操作性和互通性。

新一代的视频编码标准H.264

新一代的视频编码标准H.264文 / 摘要：H.264是国际电联最新通过的新一代甚低码率视频编码标准。

本文旨在阐述H.264视频编码标准的关键技术，并介绍了其在视频会议中的应用。

关键词：H.264 视频编码多帧预测视频会议一、引言ITU-T和ISO/IEC JTC1是目前国际上制定视频编码标准的正式组织，ITU-T的标准称之为建议，并命名为H.26x 系列，比如H.261、H.263等。

ISO/IEC的标准称为MPEG-x，比如MPEG-1、MPEG-2、MPEG-4等。

H.26x系列标准主要用于实时视频通信，比如视频会议、可视电话等；MPEG系列标准主要用于视频存储(DVD) 、视频广播和视频流媒体（如基于Internet、 DSL的视频，无线视频等等）。

除了联合开发H.262/MPEG-2标准外，大多数情况下，这两个组织独立制定相关标准。

自1997年，ITU-T VCEG与ISO/IEC MPEG再次合作，成立了Joint Video Team (JVT)，致力于开发新一代的视频编码标准H.264。

1998年1月，开始草案征集；1999年9月，完成了第一个草案；2001年5月，制定了其测试模式TML-8；2002年6月，JVT第5次会议通过了H.264的FCD板；2002年12月，ITU-T 在日本的会议上正式通过了H.264标准，并于2003年5月正式公布了该标准。

国际电信联盟将该系统命名为H.264/AVC，国际标准化组织和国际电工委员会将其称为14496-10/MPEG-4 AVC。

二、H.264标准概述H.264和以前的标准一样，也是DPCM加变换编码的混合编码模式。

但它采用“回归基本”的简洁设计，不用众多的选项，获得比H.263++好得多的压缩性能；加强了对各种信道的适应能力，采用“网络友好”的结构和语法，有利于对误码和丢包的处理；应用目标范围较宽，以满足不同速率、不同解析度以及不同传输（存储）场合的需求。

H.266VVC新一代通用视频编码国际标准

第４１卷第２期２０２１年４月㊀南京邮电大学学报（自然科学版）ＪｏｕｒｎａｌｏｆＮａｎｊｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＰｏｓｔｓａｎｄＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ（ＮａｔｕｒａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ）㊀Ｖｏｌ．４１Ｎｏ．２Ａｐｒ２０２１ｄｏｉ：１０．１４１３２／ｊ．ｃｎｋｉ．１６７３⁃５４３９．２０２１．０２．００１Ｈ．２６６／ＶＶＣ：新一代通用视频编码国际标准朱秀昌，唐贵进（南京邮电大学江苏省图像处理与图像通信重点实验室，江苏南京㊀２１０００３）摘要：在２０１３年制定的Ｈ．２６５／ＨＥＶＣ视频编码标准获得成功后，新一代视频编码国际标准Ｈ．２６６／ＶＶＣ在ＩＴＵ⁃Ｔ的ＶＣＥＧ和ＩＳＯ／ＩＥＣ的ＭＰＥＧ通力合作下已于２０２０年７月完成㊂尽管ＶＶＣ视频编码层的结构仍然是传统的基于块的混合视频编码模式，但ＶＶＣ提供了多项先进的视频编码工具，较先前的ＨＥＶＣ标准，其压缩率大约提高了一倍㊂文中主要对ＶＶＣ标准中新编码技术的特点和性能进行综述㊂关键词：Ｈ．２６６／ＶＶＣ；ＨＥＶＣ；视频编码标准；联合视频专家组；视频压缩中图分类号：ＴＮ９１９．８㊀㊀文献标志码：Ａ㊀㊀文章编号：１６７３⁃５４３９（２０２１）０２⁃０００１⁃１１Ｈ．２６６／ＶＶＣ：ｖｅｒｓａｔｉｌｅｖｉｄｅｏｃｏｄｉｎｇｉｎｔｅｒｎａｔｉｏｎａｌｓｔａｎｄａｒｄＺＨＵＸｉｕｃｈａｎｇ，ＴＡＮＧＧｕｉｊｉｎＪｉａｎｇｓｕＰｒｏｖｉｎｃｅＫｅｙＬａｂｏｎＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ＆ＩｍａｇｅＣｏｍｍｕｎｉｃａｔｉｏｎ，ＮａｎｊｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＰｏｓｔｓａｎｄＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ，Ｎａｎｊｉｎｇ２１０００３，Ｃｈｉｎａ()Ａｂｓｔｒａｃｔ：ＡｆｔｅｒｔｈｅｐｒｏｆｏｕｎｄｓｕｃｃｅｓｓｏｆｄｅｆｉｎｉｎｇＨ．２６５／ＨＥＶＣｖｉｄｅｏｃｏｄｉｎｇｓｔａｎｄａｒｄｉｎ２０１３，ｔｈｅｎｅｗｇｅｎｅｒａｔｉｏｎｖｉｄｅｏｃｏｄｉｎｇｉｎｔｅｒｎａｔｉｏｎａｌｓｔａｎｄａｒｄＨ．２６６／ＶＶＣｗａｓｃｏｌｌａｂｏｒａｔｉｖｅｌｙｆｉｎａｌｉｚｅｄｉｎＪｕｌｙ２０２０ｂｙｂｏｔｈｔｈｅＩＴＵ⁃ＴＶＣＥＧａｎｄＩＳＯ／ＩＥＣＭＰＥＧｏｒｇａｎｉｚａｔｉｏｎｓ．ＡｌｔｈｏｕｇｈｔｈｅｓｔｒｕｃｔｕｒｅｏｆＶＶＣｖｉｄｅｏｃｏｄｉｎｇｌａｙｅｒｉｓｃｏｎｖｅｎｔｉｏｎａｌｂｌｏｃｋ⁃ｂａｓｅｄｈｙｂｒｉｄｖｉｄｅｏｃｏｄｉｎｇｆｒａｍｅｗｏｒｋ，ＶＶＣｓｔｉｌｌｏｆｆｅｒｓｓｅｖｅｒａｌａｄｖａｎｃｅｄｖｉｄｅｏｃｏｄｉｎｇｔｏｏｌｓｃｏｍｐａｒｅｄｗｉｔｈｐｒｅｖｉｏｕｓｓｔａｎｄａｒｄｓ．Ｔｈｕｓ，ｔｈｅｃｏｍｐｒｅｓｓｉｏｎｒａｔｅｏｆＶＶＣｉｓａｂｏｕｔｄｏｕｂｌｅｔｈａｔｏｆＨＥＶＣ．Ｆｉｎａｌｌｙ，ｔｈｅｔｅｃｈｎｉｃａｌｆｅａｔｕｒｅｓａｎｄｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｔｈｅＶＶＣｓｔａｎｄａｒｄａｒｅｓｕｍｍａｒｉｚｅｄ．Ｋｅｙｗｏｒｄｓ：Ｈ．２６６／ＶＶＣ；ＨＥＶＣ；ｖｉｄｅｏｃｏｄｉｎｇｓｔａｎｄａｒｄｓ；ＪＶＥＴ；ｖｉｄｅｏｃｏｍｐｒｅｓｓｉｏｎ收稿日期：２０２１⁃０３⁃０４㊀㊀本刊网址：ｈｔｔｐ：ʊｎｙｚｒ．ｎｊｕｐｔ．ｅｄｕ．ｃｎ作者简介：朱秀昌，男，教授，博士生导师，ｚｈｕｘｃ＠ｎｊｕｐｔ．ｅｄｕ．ｃｎ引用本文：朱秀昌，唐贵进．Ｈ．２６６／ＶＶＣ：新一代通用视频编码国际标准［Ｊ］．南京邮电大学学报（自然科学版），２０２１，４１（２）：１－１１．㊀㊀视频信息压缩技术在过去３０余年以来的一系列视频编码国际标准中得到充分的体现㊂从２０世纪９０年代初的第一代视频编码标准Ｈ．２６１／ＭＰＥＧ⁃１［１］㊁Ｈ．２６２／ＭＰＥＧ⁃２起，到第二代视频编码标准Ｈ２６４／ＡＶＣ［２］，第三代视频编码标准Ｈ．２６５／ＨＥＶＣ［３－４］，每进化一代视频压缩的效率都大致提高一倍㊂ＨＥＶＣ第一版２０１３年发布７年后的今天，经两大国际标准化组织ＩＴＵ⁃Ｔ和ＩＳＯ／ＩＥＣ的有关部门通力合作，又完成了第四代视频编码标准，简称通用视频编码（ＶｅｒｓａｔｉｌｅＶｉｄｅｏＣｏｄｉｎｇ，ＶＶＣ）标准，已于２０２０年７月发布第一版，其正式名称在ＩＴＵ⁃Ｔ为Ｈ２６６，在ＩＳＯ／ＩＥＣ为ＶＶＣ（２３０９０⁃３）［５］㊂ＶＶＣ比ＨＥＶＣ可以提高大约一倍的编码效率，也就是说编码相同可视质量的视频内容，大约只需要ＨＥＶＣ的５０％的比特，ＡＶＣ的２５％的比特㊂ＶＶＣ的出现能够减轻世界网络的负担，因为目前视频流量已经占到互联网流量的８０％左右，还有上升的趋势㊂此外，将通用（Ｖｅｒｓａｔｉｌｉｔｙ）这个词用作这个标准的标题，说明ＶＶＣ的目标是支持多种类型的网络视频应用，如超高清视频㊁高动态范围视频㊁ＶＲ（ＶｉｒｔｕａｌＲｅａｌｉｔｙ）视频㊁３６０ʎ全景视频及屏幕内容等［６］㊂ＶＶＣ中的编码算法没有根本性的改进措施，它的技术手段和前面几代视频编码标准基本类似，仍然是在基于块的混合编码框架内，但几乎对编码的每个环节都进行了改进，挤压尚未除尽的信息冗余，达到总体编码效率提高一倍的要求㊂从ＩＴＵ⁃Ｔ和ＩＳＯ／ＩＥＴ联合制定视频标准Ｈ２６２／ＭＰＥＧ⁃２于１９９４年推出开始，历经Ｈ．２６４／ＡＶＣ㊁Ｈ．２６５／ＨＥＶＣ，到如今的Ｈ．２６６／ＶＶＣ，ＶＣＥＧ和ＭＰＥＧ的一个矢志不渝的目标为减半，即每推出新一代标准都要求码率减半㊂以此算来，压缩同样的视频内容，在同样的解码视频质量的要求下，ＶＶＣ的码率只有ＭＰＥＧ⁃２的１／８㊂２０１５年１０月，ＩＴＵ⁃Ｔ的ＶＣＥＧ和ＩＳＯ／ＩＥＣ的ＭＰＥＧ成立了联合视频探索小组（ＪｏｉｎｔＶｉｄｅｏＥｘｐｌｏｒａｔｉｏｎＴｅａｍ，ＪＶＥＴ），面向全球征集提案㊂２０１８年，新一代视频编码标准化工作正式开始，在同年ＪＶＥＴ的第１０次会议上，联合视频探索小组正式更名为联合视频专家组（ＪｏｉｎｔＶｉｄｅｏＥｘｐｅｒｔｓＴｅａｍ，ＪＶＥＴ），简称仍然是ＪＶＥＴ，并决定将下一代视频编码标准正式命名为ＶＶＣ，在ＩＴＵ⁃Ｔ登记为Ｈ．２６６，在ＩＳＯ／ＩＥＣ登记为２３０９０⁃３［６］㊂ＶＶＣ标准对应的参考软件平台为ＶＴＭ（ＶＶＣＴｅｓｔＭｏｄｅｌ）［７］，目前最新版本是ＶＴＭ１１．２㊂制定ＶＶＣ有两个基本目标，其一为高压缩性能，定义一套视频编码技术，其压缩性能要远优于以往的同类标准；其二为宽应用领域，能够有效地用于比先前标准更广阔的范围㊂ＶＶＣ标准面向多种应用，如高清㊁超高清视频（ＵｌｔｒａＨｉｇｈＤｅｆｉｎｉｔｉｏｎＶｉｄｅｏ，ＵＨＤＶ），它们具有３８４０ˑ２１６０或７６２０ˑ４３２０图像分辨率，１０比特精度，高动态范围（ＨｉｇｈＤｙｎａｍｉｃＲａｎｇｅ，ＨＤＲ）和宽彩色ｇａｍｕｔ；再如沉浸式媒体（ＩｍｍｅｒｓｉｖｅＭｅｄｉａ），使用普通投影格式所投影的３６０ʎ全景视频（ＯｍｎｉｄｉｒｅｃｔｉｏｎａｌＶｉｄｅｏ）等㊂当然，ＶＶＣ同样支持先前标准中所设置的那些应用㊂本文后续部分将主要介绍ＶＣＣ所提供的新编码工具㊂从第１节到第６节共６个部分基本按照编码过程来介绍，包括图像分块㊁预测㊁变换㊁量化㊁熵编码和环路滤波等环节㊂最后是对ＶＶＣ现有成果的小结，对其后续工作和应用前景的简单说明㊂１㊀图像划分如图１所示，ＶＶＣ在编码原理和基本结构方面没有突破，仍沿用从Ｈ．２６１就开始的基于块的混合视频编码框架，即预测加变换的分块编码方式；ＶＶＣ在编码细节上和ＨＥＶＣ很接近，也包含帧内预测㊁帧间预测㊁运动估计与补偿㊁正交变换㊁量化㊁熵编码和环路滤波等模块㊂但是，和ＨＥＶＣ相比较，ＶＶＣ几乎在每一个编码环节上都采取了一项或多项改进措施，尽管每一项措施的效率提高并不显著，然而诸多措施的总体效果确使其编码效率比ＨＥＶＣ提高了一倍㊂当然，ＶＶＣ付出的代价就是编码复杂度也比ＨＥＶＣ提高了好几倍㊂图１㊀Ｈ．２６６／ＶＶＣ编码框图１．１㊀３种编码结构ＶＶＣ与ＨＥＶＣ一样，为了应对不同应用场合，设立了３种编码结构，即全帧内（ＡｌｌＩｎｔｒａ，ＡＩ）编码㊁低延迟（ＬｏｗＤｅｌａｙ，ＬＤ）编码和随机接入（ＲａｎｄｏｍＡｃｃｅｓｓ，ＲＡ）编码㊂在ＡＩ编码中，每一帧图像都是按帧内方式进行空间域预测编码，不使用时间参考帧㊂在ＬＤ编码中，只有第一帧图像按照帧内方式进行编码，并成为即时解码更新（ＩｎｓｔａｎｔａｎｅｏｕｓＤｅｃｏｄｉｎｇＲｅｆｒｅｓｈ，ＩＤＲ）帧，随后的各帧都作为普通Ｐ和Ｂ帧（ＧｅｎｅｒａｌｉｚｅｄＰａｎｄＢＰｉｃｔｕｒｅ，ＧＰＢ）进行编码，这主要是为交互式实时通信设计的㊂在ＲＡ编码中，主要是分层Ｂ帧结构（ＨｉｅｒａｒｃｈｉｃａｌＢＳｔｒｕｃｔｕｒｅ）帧，周期性地插入一廋随机访问（ＣｌｅａｎＲａｎｄｏｍＡｃｃｅｓｓ，ＣＲＡ）帧，成为编码视频流中的随机访问点（ＲａｎｄｏｍＡｃｃｅｓｓＰｏｉｎｔ，ＲＡＰ）㊂这些随机访问点可以独立解码，不需要参考码流中前面已经解码的图像帧㊂１．２㊀图像的条／片／子图像划分ＶＶＣ在编码时将每一帧图像都划分为相同尺寸㊁紧密排列的编码树单元（ＣｏｄｉｎｇＴｒｅｅＵｎｉｔ，ＣＴＵ），根据编码图像局部特征的不同，编码树单元又可以灵活地划分为更小的编码单元（ＣｏｄｉｎｇＵｎｉｔ，ＣＵ）㊂和ＨＥＶＣ基本相同，ＶＶＣ允许将图像帧划分为若干条（Ｓｌｉｃｅ），条由相邻的整数个ＣＴＵ组成㊂ＶＶＣ支持两种排列类型的Ｓｌｉｃｅ，顺序扫描Ｓｌｉｃｅ模式和矩２南京邮电大学学报（自然科学版）㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀２０２１年形Ｓｌｉｃｅ模式㊂ＶＶＣ中也允许用水平和垂直的若干条边界将图像帧划分为多个矩形区域，每个区域就是一个片（Ｔｉｌｅ），每一个片包含整数个ＣＴＵ㊂ＶＶＣ的Ｓｌｉｃｅ和Ｔｉｌｅ大体上和ＨＥＶＣ一致㊂和ＨＥＶＣ不同，ＶＶＣ还新增了矩形的子图像（Ｓｕｂｐｉｃｔｕｒｅ）划分［５］㊂一个子图像可包含一个或多个Ｓｌｉｃｅｓ，这些Ｓｌｉｃｅｓ共同覆盖图像的一个矩形区域㊂相应地，每个子图像的边界总是Ｓｌｉｃｅ的边界㊂图２是包含Ｓｕｐｐｉｃｔｕｒｅ的划分一例，一帧图像被划分为１８个Ｔｉｌｅｓ，其中１２个较大的Ｔｉｌｅｓ在左边，每个Ｔｉｌｅ覆盖一个４ˑ４ＣＴＵ的Ｓｌｉｃｅ；其余的６个较小的Ｔｉｌｅｓ在右边，每个覆盖２个２ˑ２ＣＴＵ的Ｓｌｉｃｅｓ，这样总共形成２４个Ｓｌｉｃｅｓ和２４个子图像（每个Ｓｌｉｃｅ就是一个子图像）㊂图２㊀包含ｓｕｂｐｉｃｔｕｒｅ的划分一例１．３㊀ＣＴＵ的多类型树划分在ＶＶＣ中为了适应４Ｋ㊁８Ｋ等高清㊁超高清视频编码的需要，将ＣＴＵ的最大尺寸扩大到１２８ˑ１２８，最小尺寸还是４ˑ４㊂ＣＴＵ可进一步分为若干编码单元（ＣＵ），最大的ＣＵ可等同于ＣＴＵ，最小的ＣＵ为４ˑ４㊂在ＨＥＶＣ中每个ＣＵ又可以划分为预测单元（ＰｒｅｄｉｃｔｉｏｎＵｎｉｔ，ＰＵ）和变换单元（ＴｒａｎｓｆｏｒｍＵｎｉｔ，ＴＵ），但在ＶＶＣ中将不再区分ＣＵ㊁ＰＵ和ＴＵ，大多数情况下三者统一为ＣＵ㊂不同于ＨＥＶＣ，ＶＶＣ的ＣＴＵ除了４叉树划分方式外，还引进了多类型树（Ｍｕｌｔｉ⁃ＴｙｐｅＴｒｅｅ，ＭＴＴ）划分，包括２叉树（ＢｉｎａｒｙＴｒｅｅ，ＢＴ）和３叉树（ＴｅｒｎａｒｙＴｒｅｅ，ＴＴ）［８］㊂一个ＣＴＵ首先按４叉树方式进行一次划分，４叉树的每个叶子节点既可以继续４叉树划分，也可以进一步按照多类型树方式进行划分：水平或垂直２叉树划分，水平或垂直３叉树划分，如图３所示㊂２叉树和３叉树划分可以交替并嵌套进行㊂但是需要注意，一旦采用了２叉树或者３叉树划分，就不再允许进行４叉树划分㊂图４中给出了一个６４ˑ６４的ＣＴＵ的４叉树和嵌套多类型树划分的示例，这种划分方式可以根据图像内容自适应进行，提升了划分灵活性㊂图３㊀多类型树划分模式图４㊀４叉树和嵌套多类型树划分示例前面介绍的是亮度ＣＴＵ的ＭＴＴ划分，对于图像的色度部分，考虑到同一位置的亮度和色度信号可能具有的不同特性，因而在ＶＶＣ中，Ｉ帧ＣＴＵ的亮度分量和色度分量的划分方式可以不同，这时亮度和色度分量各使用一个编码树表示㊂对于Ｐ帧和Ｂ帧，则同一个ＣＴＵ中的亮度和色度必须有相同的划分㊂由于色度信号的亚取样影响，色度信号在单独划分时禁止出现２ˑ２㊁２ˑ４或４ˑ２尺寸的色度块㊂至此可以看到，图像划分从单一㊁固定划分不断朝着多样㊁灵活的划分结构发展㊂１．４㊀图像格式对于输入视频和重建视频，ＶＶＣ支持ＩＴＵ⁃ＲＢＴ．６０１建议规定的４ʒ４ʒ４㊁４ʒ２ʒ２和４ʒ２ʒ０图像亮度（Ｙ）和色度（Ｃｂ和Ｃｒ）信号的取样结构；支持的ＩＴＵ⁃ＲＢＴ．２１００的宽色彩空间；最少支持１６级高动态范围（ＨＤＲ）视频，最高亮度可达１０００／４０００／１００００尼特㊂像素的最大比特数表示图像灰度分辨率，又称为比特深度（ＢｉｔＤｅｐｔｈ），其值通常为８比特，２５６个等级㊂这对于人眼的观赏已经足够了，但是对于编码处理或某些特殊应用场合，有时需要更高的比特深度㊂为此，ＶＶＣ支持８至１６比特深度的输入和输出视频，最常见是１０比特深度㊂ＶＶＣ支持视频的０１２０Ｈｚ可变帧率，以适应不同视频应用的需求㊂支持环绕立体视频或多角度视频编码，如３６０ʎ㊁１８０ʎ等全景视频㊂３第２期朱秀昌，等：Ｈ．２６６／ＶＶＣ：新一代通用视频编码国际标准至于尚存的隔行扫描（ＩｎｔｅｒｌａｃｅｄＳｃａｎｎｉｎｇ）视频，ＶＶＣ和ＨＥＶＣ一样，不再提供专门的工具，只是将隔行视频的一帧看作两个独立的场，对各个场数据分别进行编码，简化了编码器的实现㊂１．５㊀档次㊁水平和等级为了提供应用的灵活性，和ＨＥＶＣ一样，ＶＶＣ在附录Ａ中定义了编码的不同的档次（Ｐｒｏｆｉｌｅ）㊁水平（Ｌｅｖｅｌ）和等级（Ｔｉｅｒ）［５］㊂档次规定了视频编码采用什么编码工具和编码算法㊂ＶＶＣ档次规定了一套用于产生不同用途码流的编码工具或算法，共有４个主档次，即常规１０比特像素深度的Ｍａｉｎ１０，支持静止图像的Ｍａｉｎ１０ＳｔｉｌｌＰｉｃｔｕｒｅ，支持全取样的Ｍａｉｎ１０４ʒ４ʒ４，支持全取样静止图像的Ｍａｉｎ１０４ʒ４ʒ４ＳｔｉｌｌＰｉｃｔｕｒｅ㊂２个多层主档次，ＭｕｌｔｉｌａｙｅｒＭａｉｎ１０和ＭｕｌｔｉｌａｙｅｒＭａｉｎ１０４ʒ４ʒ４㊂档次的主要技术指标包括：像素的比特深度㊁色度采样方式和解码缓存的图像容量等㊂水平规定了某一档次㊁等级的编码参数，如采样率㊁码率㊁压缩率㊁缓冲区容量等㊂ＶＶＣ设置了１．０，２．０，２．１，３．０，３．１，４．０，４．１，５．０，５．１，５．２，６．０，６．１，６．２共１３个水平，一个水平实际上就是一套对编码比特流的一系列编码参数的限制，如视频采样格式㊁图像分辨率（如从１７６ˑ１４４到８１９２ˑ４３２０）㊁最大输出码率等㊂如果说一个解码器具备解某一水平码流的能力，则意味着该解码器具有解码等于和低于这一水平所有码流的能力㊂等级规定了每一水平的比特率的高低㊂对同一水平，按照最大码率和缓存容量要求的不同，ＶＶＣ设置了两个等级，高等级（ＨｉｇｈＴｉｅｒ）和主等级（ＭａｉｎＴｉｅｒ）㊂主等级可用于大多数场合，要求码率较低；高等级可用于有特殊要求的场合，包括５．０到６．２的６个水平，允许码率较高㊂２㊀帧内预测２．１㊀亮度分量的预测模式ＶＶＣ的帧内预测技术［９］的原理和ＨＥＶＣ类似，采用基于块的多方向帧内预测方式来消除图像的空间相关性，但是比ＨＥＶＣ预测方向更细㊁更灵活㊂如图５所示，ＶＶＣ为亮度预测块定义了６５种不同的基本帧内预测方向，相当于在ＨＥＶＣ帧内预测３３个方向的每两个方向中间增加一个方向，连同平面（Ｐｌａｎａｒ）和直流（ＤＣ）模式，共６７种预测模式㊂ＶＶＣ亮度帧内预测单元的尺寸从４ˑ４到６４ˑ６４，其中包含矩形单元㊂考虑到方便矩形帧内预测块的宽角度（Ｗｉｄｅ⁃Ａｎｇｌｅ）模式，ＶＶＣ的帧内预测在６５种方向的基础上分别增加了－１到－１４和６７到８０方向，共２８个方向，这样ＶＶＣ帧内预测编码总共有９３个方向㊂图５㊀帧内预测方向ＤＣ模式的编码块所有像素的预测值都等于其左侧和上方已编码的所有参考像素的平均值㊂Ｐｌａｎａｒ模式的预测值由待编码的亮度块的水平和垂直两个方向上的参考像素的线性内插产生，它们一般适用于图像的平坦区域㊂２．２㊀帧内子块划分ＶＶＣ的帧内子块划分（ＩｎｔｒａＳｕｂ⁃Ｐａｒｔｉｔｉｏｎｓ，ＩＳＰ）就是根据编码块的尺寸将亮度预测块在水平或垂直方向上分为２个或４个子块㊂ＶＶＣ规定每个帧内预测块至少要有１６个样点，因此４ˑ４块不再划分㊂允许ＩＳＰ划分的最小块尺寸是４ˑ８或８ˑ４，可划分为２个子块，如图６（ａ）所示；如果大于４ˑ８或８ˑ４则划分为４个子块，如图６（ｂ）所示㊂图６㊀帧内子块划分２．３㊀色度的跨分量线性模式ＨＥＶＣ色度块采用依附亮度块的简化预测，共有５种模式，即Ｐｌａｎａｒ㊁ＤＣ㊁水平方向㊁垂直方向和派生模式（ＤｅｒｉｖｅｄＭｏｄｅ，ＤＭ），ＤＭ直接复制对应亮度块的预测模式㊂ＶＶＣ色度分量除了沿用这５种预４南京邮电大学学报（自然科学版）㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀２０２１年测模式外，还考虑到亮度和色度之间的相关性，对色度分量增加了一种跨分量线性模型（Ｃｒｏｓｓ⁃ＣｏｍｐｏｎｅｎｔＬｉｎｅａｒＭｏｄｅｌ，ＣＣＬＭ）预测模式㊂在ＣＣＬＭ中，色度样值Ｃ（ｉ，ｊ）从同一个编码单元对应的已重建的亮度样值Ｌᶄ（ｉ，ｊ）通过线性模型预测得到，即Ｃ（ｉ，ｊ）＝α㊃Ｌᶄ（ｉ，ｊ）＋β，α和β为ＣＣＬＭ参数，可利用当前块左侧和上方相邻的像素通过计算得到㊂此外，还有单独使用左侧相邻像素预测的ＬＭ＿Ｌ模式；或者上方相邻像素预测的ＬＭ＿Ａ模式㊂这样，色度分量在５种传统帧内预测模式的基础上，新增了ＣＣＬＭ㊁ＬＭ＿Ａ和ＬＭ＿Ｌ三种模式，共有８种预测模式㊂２．４㊀多行参考帧内预测传统的帧内预测利用和当前块紧相邻的行和列的像素作为参考像素㊂如果当前块和参考行在内容上不连续，可能会导致较大的预测误差，为此ＶＶＣ新增了多行参考（ＭｕｌｔｉｐｌｅＲｅｆｅｒｅｎｃｅＬｉｎｅ，ＭＲＬ）帧内预测技术，将参考行从相邻参考行０扩展为参考行０㊁参考行１和参考行３［９－１０］㊂实际预测时从３行中选择预测误差最小的参考行作为最终预测使用的最佳参考行，如图７所示㊂图７中Ａ和Ｆ区域的已重建像素与当前块距离较远，有可能引入较大的误差，因此Ａ区域的像素由Ｂ区域距离最近的像素填充，Ｆ区域的像素由Ｅ区域距离最近的像素填充㊂图７㊀多行参考方式２．５㊀帧内预测模式的编码帧内预测时，编码器需要从多种预测模式中选择一种最佳模式使得编码效率最优㊂如果直接对预测模式信息进行编码，需要较多的编码比特㊂考虑到相邻块之间的帧内预测模式也存在空间相关性，即当前块的预测模式很有可能与相邻块的预模式一致，因此可以从相邻块的模式来预测当前块最可能的模式（ＭｏｓｔＰｒｏｂａｂｌｅＭｏｄｅ，ＭＰＭ）［１１］㊂当前块的预测模式被划分为ＭＰＭ和其余模式，然后对这两类模式分别编码，以提升编码效率㊂３㊀变换和量化视频压缩中的变换是将空间域的图像信号转换到频率域，大幅度解除了图像信号之间的相关性，为后续的量化压缩创造条件㊂因此，选择何种变换函数和采用什么量化方法就显得分外重要［１２－１３］㊂在ＨＥＶＣ中，对帧内预测生成的４ˑ４亮度残差块采用离散正弦变换（ＤｉｓｃｒｅｔｅＳｉｎｅＴｒａｎｓｆｏｒｍ，ＤＳＴ）方式，对于其他的残差块，则使用离散余弦变换（ＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ，ＤＣＴ）方式㊂通过残差４叉树（ＲｅｓｉｄｕａｌＱｕａｄＴｒｅｅ，ＲＱＴ）对变换块系数进行排序和量化㊂与ＨＥＶＣ不同，ＶＶＣ为了提高压缩性能，在变换环节提供了更多可供选择的变换函数和不可分离的二次变换，在量化环节采用了基于率失真优化的量化方式和简洁的系数排序方式㊂３．１㊀多变换选择ＶＶＣ将最大变块换尺寸扩展到６４ˑ６４，在ＨＥＶＣ的ＤＣＴ⁃２变换基础上，采用了多变换选择（ＭｕｌｔｉｐｌｅＴｒａｎｓｆｏｒｍＳｅｌｅｃｔｉｏｎ，ＭＴＳ）技术，增加了ＤＳＴ⁃７和ＤＣＴ⁃８两种变换函数，形成一组候选变换函数集，成为ＶＶＣ中的主变换（ＰｒｉｍａｒｙＴｒａｎｓｆｏｒｍ）㊂对于长或宽等于６４的大尺寸变换块，直接舍弃高频变换系数，仅保留低频变换系数㊂例如，对于长宽为ＭˑＮ的块，若Ｍ等于６４，只保留左边３２列系数，若Ｎ等于６４，只保留上方３２行系数㊂针对帧间预测的ＣＵ，ＶＶＣ还采用了子块变换（Ｓｕｂ⁃ＢｌｏｃｋＴｒａｎｓｆｏｒｍ，ＳＢＴ）技术㊂ＳＢＴ假设帧间预测残差分布的局部性，仅分布在残差块的局部１／２或１／４区域，从而降低变换系数的高频分量，减少标记残差块是否为０的编码代价，提高压缩性能㊂对不同的预测方式，编码器可以根据哪一种变换的编码效率最高来选择不同的变换方式㊂３．２㊀二次变换由于不可分离变换比可分离变换具有更好的去相关效果，ＶＶＣ采用了基于归零（Ｚｅｒｏ⁃Ｏｕｔ）的不可分离二次变换（Ｎｏｎ⁃ＳｅｐａｒａｂｌｅＳｅｃｏｎｄａｒｙＴｒａｎｓｆｏｒｍ，ＮＳＳＴ）技术㊂所谓二次变换，就是对主变换系数进行第二次变换，将信号从一个变换域转换至另外一个变换域后再进行量化㊁熵编码等操作，其目的是进一步提高变换效率㊂ＡＶＣ和ＨＥＶＣ都提供了自己的二次变换技术㊂ＶＶＣ采用了ＮＳＳＴ技术对高频系数采用归零方案，也就是仅保留二次变换的低频系数，高频系数假设为０，ＮＳＳＴ也因此被称作低频不５第２期朱秀昌，等：Ｈ．２６６／ＶＶＣ：新一代通用视频编码国际标准可分离二次变换（ＬｏｗＦｒｅｑｕｅｎｃｙＮｏｎ⁃ｓｅｐａｒａｂｌｅＳｅｃｏｎｄａｒｙＴｒａｎｓｆｏｒｍ，ＬＦＮＳＴ）㊂ＬＦＮＳＴ仅用于帧内编码的块，其变换集的选择与帧内预测模式有关㊂以１６ˑ１６预测残差块为例，仅对左上角的３个４ˑ４子块所包含的变换系数（拉成４８ˑ１的数据条）进行二次变换，因此一个ＬＦＮＳＴ变换核的大小为１６ˑ４８，变换的结果为１６个系数㊂３．３㊀率失真优化的量化普通量化是以量化失真最小为设计目标，但在视频编码中，编码比特率的高低也是非常重要的判断指标，两者并不完全一致㊂因此视频编码中的量化器设计需要权衡失真与比特率㊂对于一个变换系数，给出多个可选的量化值，用率失真优化准则选出最优的量化值，这就是率失真优化量化（ＲａｔｅＤｉｓｔｏｒｔｉｏｎＯｐｔｉｍｉｚｅｄＱｕａｎｔｉｚａｔｉｏｎ，ＲＤＯＱ）方法㊂ＶＶＣ在ＲＤＯＱ量化时，需遍历编码块内系数㊂如果当前ＣＵ每一个４ˑ４系数组（ＣｏｅｆｆｉｃｉｅｎｔＧｒｏｕｐ，ＣＧ）量化后是全零ＣＧ，那么只需发送全零标志；否则，需要传送ＣＧ中量化后的系数㊂和ＨＥＶＣ一样，ＶＶＣ也是标量量化方式，但最大量化参数（ＱＰ）从５１扩大为６３㊂ＶＶＣ采用了一种依赖性标量量化（ＤｅｐｅｎｄｅｎｔＳｃａｌａｒＱｕａｎｔｉｚａｔｉｏｎ，ＤＳＱ）方法，它定义了两个不同重建水平的标量量化器，系数的量化按照一定的规则自适应地在这两个标量量化器间转换㊂其本质在于，在同一个量化间隔中有两个输出量化值供选择，可以降低量化误差㊂与ＨＥＶＣ相同，ＶＶＣ也支持默认量化矩阵和用户自定义量化矩阵㊂使用量化矩阵的目的是对不同位置的系数采用不同的量化步长，以适应人眼的视觉特性，比如人眼对高频分量不敏感，就可以对高频系数使用更大的量化步长㊂３．４㊀系数组和扫描顺序在视频编码中，一般须将变换块中量化后的系数通过特定的扫描方式形成一维数据，然后对它进行熵编码㊂ＶＶＣ将ＷˑＨ的变换块量化后的变换系数值排列成一个ＷˑＨ的矩阵㊂为了保证对所有尺寸的块统一进行扫描处理，也为了增加变换块的编码效率，考虑到编码块中信号能量一般集中在水平或垂直方向的低频率处，因此将变换块的系数分为若干系数组（ＣＧ），对每个ＣＧ及ＣＧ内系数使用多扫描路径以统一的方式进行编码㊂由于ＶＶＣ也支持宽度和高度小于４的块，ＣＧ的形状取决于变换块尺寸㊂对于１ˑＮ或Ｎˑ１（Ｎȡ１６）的ＣＵ，ＣＧ的尺寸为１ˑ１６或１６ˑ１；对于２ˑＮ或Ｎˑ２（Ｎȡ８）的ＣＵ，ＣＧ的尺寸为２ˑ８或８ˑ２；其他ＣＵ的ＣＧ尺寸都是４ˑ４㊂ＣＧ的编码顺序为图８所示的反向对角扫描（ＲｅｖｅｒｓｅＤｉａｇｏｎａｌＳｃａｎ）顺序，和ＣＧ尺寸无关㊂图８中每个小方块表示一个ＣＧ㊂系数块的ＣＧ从右下到左上的对角顺序处理，这里每个对角方向都是朝左下方向进行㊂为了限制解码器复杂度的最差情况，ＶＶＣ将大变换块的高频系数强制置零㊂非零的量化指数只能表示在变换块的ｍａｘ（Ｗ，３２）ˑｍａｘ（Ｈ，３２）的左上角区域，而这一区域以外的ＣＧ就无需编码，从而也无需扫描，如图８（ｄ）所示㊂ＣＧ内部系数的扫描顺序由相同的对角扫描方式来定义，图８（ｂ）中的扫描也可表示４ˑ４ＣＧ中的系数值的扫描顺序㊂图８㊀ＣＧ的反向对角扫描示意４㊀熵编码输入视频在预测㊁变换和量化以后，还需对量化㊁扫描后的变换系数进行熵编码（ＥｎｔｒｏｐｙＣｏｄｉｎｇ），以获得进一步的信息压缩㊂在熵编码中常见的有较为简单的变长编码（如Ｈｕｆｆｍａｎ编码）和效率较高的算术编码两大类㊂如果将编码方式和编码的内容联系起来，则可获得更高的编码效率，这就是常见的上下文自适应变长编码（Ｃｏｎｔｅｘｔ⁃ＡｄａｐｔｉｖｅＶａｒｉａｂｌｅＬｅｎｇｔｈＣｏｄｉｎｇ，ＣＡＶＬＣ）和上下文自适应二进制算术编码（Ｃｏｎｔｅｘｔ⁃ＡｄａｐｔｉｖｅＢｉｎａｒｙＡｒｉｔｈｍｅｔｉｃＣｏｄｉｎｇ，ＣＡＢＡＣ）㊂这两类熵编码都是高效㊁无损的压缩方法㊂其中ＣＡＢＡＣ要胜过ＣＡＶＬＣ一筹，尤其是在高码率的情况下更是如此㊂ＶＶＣ和ＨＥＶＣ一样，熵编码采用的是ＣＡＢＡＣ，但在ＨＥＶＣ基础上有所改进㊂由于上下文自适应二进制算术编码（ＣＡＢＡＣ）较普通的变长编码的性能优越，在ＡＶＣ标准中是可选的两种熵编码方法之一，而在ＨＥＶＣ和ＶＶＣ中则成为唯一的熵编码方法㊂尽管和ＨＥＶＣ采用同样６南京邮电大学学报（自然科学版）㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀２０２１年的编码引擎，ＶＶＣ为常规编码模式设计了一种新的灵活㊁高效的编码引擎㊂编码引擎由两部分组成：概率估计和码字匹配㊂概率估计的目的在于确定下一个二进制符号其值为１的概率㊂这种估计是基于使用相同上下文的已编码符号值的历史，利用指数衰减窗口进行的㊂ＨＥＶＣ的编码引擎采用１２８状态单一有限状态机作为指数平滑估计器，虽然ＶＶＣ也采用这样的估计器，但有很大的不同：为了改进压缩性能，ＶＶＣ为每个上下文维持两个估计器，每个估计器有自己的衰减系数，实际用于编码的概率是两个估计器的平均值㊂在概率估计中，ＶＶＣ不使用状态机，而是由回归函数计算导出㊂实际上主要的差别在于ＶＶＣ为每个上下文导出的值表示一个实际概率（线性空间），而在ＨＥＶＣ中，它表示状态机的一种状态（对数空间）㊂至于码字匹配，当前的间隔被分为两个子间隔，每个子间隔对应二进制符号的值，０或１㊂每个子间隔的范围由当前间隔范围Ｒ和相对应的概率估计值相乘获得㊂在ＨＥＶＣ中，使用查表来近似这个乘法运算，以确定和最小概率符号（ＬｅａｓｔＰｒｏｂａｂｌｅＳｙｍｂｏｌ，ＬＰＳ）相关的子间隔范围ＲＬＰＳ㊂而在ＶＶＣ中，就直接使用乘法获得ＬＰＳ的子间隔范围㊂一旦ＲＬＰＳ确定后，ＨＥＶＣ和ＶＶＣ的编码引擎就以相同的方式工作了㊂５㊀帧间预测ＨＥＶＣ的帧间预测有３种模式：跳过（Ｓｋｉｐ）模式，无需预测残差，运动矢量从相邻块运动矢量得到，不需要编码运动参数；合并（Ｍｅｒｇｅ）模式，需要预测残差，当前块的运动参数由相邻块的运动参数得到，只需传递Ｍｅｒｇｅ模式的候选编号；普通帧间（Ｉｎｔｅｒ）模式，需预测残差，需进行运动估计获得运动矢量（ＭｏｔｉｏｎＶｅｃｔｏｒ，ＭＶ），并利相邻块得到运动矢量预测（ＭＶＰｒｅｄｉｃｔｉｏｎ，ＭＶＰ），ＭＶ和ＭＶＰ相减得到运动矢量差（ＭＶＤｉｆｆｅｒｅｎｃｅ，ＭＶＤ），需参考图像索引㊂ＶＶＣ在ＨＥＶＣ３种预测模式的基础上，对帧间预测工具作了多方面的扩展和新增㊂５．１㊀扩展Ｍｅｒｇｅ模式（１）扩展的Ｍｅｒｇｅ预测（ＥＭＰ）ＶＶＣ采用了扩展Ｍｅｒｇｅ预测（ＥｘｔｅｎｄｅｄＭｅｒｇｅＰｒｅｄｉｃｔｉｏｎ，ＥＭＰ）模式：增加了候选列表长度，由ＨＥＶＣ的５增加到现在的６；在列表构建过程中，首先检查空域各个邻编码块运动矢量预测（ＭＶＰ），接着检查时域候选块，检查过程与顺序都和ＨＥＶＣ相同㊂如果候选列表没有被填满，ＶＶＣ增加了一种填充候选的基于历史运动矢量预测（ＨｉｓｔｏｒｙｂａｓｅｄＭＶＰ，ＨＭＶＰ）方法［１４］，维护并更新一个ＨＭＶＰ列表，当编码完一个块后，将该块的运动参数作为一个新的候选添加到ＨＭＶＰ列表的末尾，按照先进先出的规则将最前面的候选用作填充㊂添加完ＨＭＶＰ候选后，将列表中的前４个候选ＭＶ，两两进行平均，再将平均值后有效的ＭＶ按一定顺序添加进Ｍｅｒｇｅ候选列表中㊂如果依然没有填满候选列表，则使用０运动矢量填满㊂这样候选列表的顺序为：空间域相邻块候选，时间域候选，历史候选，空间平均值候选，０运动矢量㊂当候选列表构造好了之后，编码器就要对候选列表中的每一个候选进行率失真代价的计算，以得到一个性能最优的候选㊂（２）带运动矢量差的Ｍｅｒｇｅ模式（ＭＭＶＤ）在ＨＥＶＣ中的Ｍｅｒｇｅ模式中，Ｍｅｒｇｅ列表中的ＭＶＰ直接用于当前ＣＵ的预测，ＶＶＣ的Ｍｅｒｇｅ模式和Ｓｋｉｐ模式中可引入带有ＭＶＤ的Ｍｅｒｇｅ模式（ＭｅｒｇｅｍｏｄｅｗｉｔｈＭＶＤ，ＭＭＶＤ），ＭＶＰ与ＭＶＤ相加，得到真实的运动矢量ＭＶ，用于当前ＣＵ的帧间预测，是否使用ＭＭＶＤ的标志需要传至解码端㊂采用ＭＭＶＤ模式时，选择普通Ｍｅｒｇｅ列表中的前两个候选ＭＶ作为初始运动矢量，然后对该ＭＶ进行扩展，一个ＭＶ要在４个方向以８种步长进行扩展，两个ＭＶ就有４ˑ８ˑ２＝６４种新的ＭＶ，对所有６４个扩展ＭＶ进行率失真代价比较，从中选择出最优的一个作为最终的ＭＶ传递至解码端㊂５．２㊀改进运动估计５．２．１㊀带有ＣＵ权重的双向预测（ＢＣＷ）对于一般双向预测块，最终的预测值Ｐｂｉ由两侧的两个运动矢量预测值Ｐ０和Ｐ１平均得到：即Ｐｂｉ＝（Ｐ０＋Ｐ１＋１）／２㊂实际应用中同一内容随着时间变化有可能会产生光线强弱变化或阴影等现象，导致不同帧之间场景很相似，但是明暗差别较大，而且局部内容也会产生类似的光线变化，采用简单的平均方式会使得帧间预测的误差较大㊂为此，ＶＶＣ提出了一种带有ＣＵ权重的双向预测（Ｂｉ⁃ｐｒｅｄｉｃｔｉｏｎｗｉｔｈＣＵ⁃ｌｅｖｅｌＷｅｉｇｈｔ，ＢＣＷ）方法，它不是简单地求均值，而是在ＣＵ层面对两个预测值进行加权求和：Ｐｂｉ＝（（８－ｗ）∗Ｐ０＋ｗ∗Ｐ１＋４）／８㊂加权系数ｗ的范围为｛－２，３，４，５，１０｝，低时延应用中的权重可从这５个系数中选取，其他应用则从｛３，４，５｝这３个系数７第２期朱秀昌，等：Ｈ．２６６／ＶＶＣ：新一代通用视频编码国际标准。

视频编码标准

视频编码标准H.264/AVCH.264/AVC 是ITU-T VCEG 和ISO/IEC MPEG 共同开发的视频处理标准，ITU-T作为标准建议H.264，ISO/IEC作为国际标准14496-10（MPEG-4 第10部分）高级视频编码（AVC）。

MPEG-2视频编码标准（又称为ITU-T H.262[2]）已有10年的历史了，由MPEG-1扩充而来，支持隔行扫描。

使用十分广泛，几乎用于所有的数字电视系统，适合标清和高清电视，适合各种媒体传输，包括卫星、有线、地面等，都能有效地传输。

然而，类似xDSL、UMTS（通用移动系统）技术只能提供较小的传输速率，甚至DVB-T，也没有足够的频段可用，提供的节目很有限，随着高清电视的引入，迫切需要高压缩比技术的出现。

应用于电信的视频编码经历了ITUT H.261、H.262（MPEG-2）、H.263、H.263+、H.263++，提供的服务从ISDN和T1/E1到PSTN、移动无线网和LAN/INTERNET网。

最近MPEG-4 第二部分进入了实用领域，提供了视频形状编码，目标是与MPEG-2一样获得广泛的数字电视应用。

1998年，视频编码专家组（VCEG-ITU-T SG16 Q.6）启动了H.26L工程，旨在研制出新的压缩标准，与以前的任何标准相比，效率要提高一倍，同时具有简单、直观的视频编码技术，网络友好的视频描述，适合交互和非交互式应用（广播、存储、流煤体）。

2001年12月，VCEG和运动图像专家组（MPEG-ISO/IEC JTC 1/SC 29/WG 11）组成了联合视频组（JVT，Joint Video Team），研究新的编码标准H.264/AVC，该标准于2003年3月正式获得批准。

视频的各种应用必须通过各种网络传送，这要求一个好的视频方案能处理各种应用和网络接口。

H.2 64/AVC为了解决这个问题，提供了很多灵活性和客户化特性。

视频编码的国际标准

视频编码的国际标准视频编码是指将视频信号转换为数字信号的过程，它是数字视频处理中的重要环节。

在数字视频处理中，视频编码的国际标准对于视频质量、传输效率、存储空间等方面起着至关重要的作用。

本文将介绍视频编码的国际标准，包括H.264/AVC、H.265/HEVC以及未来的视频编码标准。

H.264/AVC是一种广泛应用的视频编码标准，它由ITU-T Video Coding Experts Group (VCEG) 和ISO/IEC Moving Picture Experts Group (MPEG) 共同制定。

H.264/AVC采用了先进的视频压缩技术，能够在保持较高视频质量的同时，实现更高的压缩比。

这使得H.264/AVC成为了广泛应用于视频会议、数字电视、蓝光光盘等领域的主流视频编码标准。

随着视频应用场景的不断拓展，对视频编码标准的需求也在不断提升。

H.265/HEVC作为H.264/AVC的后继者，采用了更加先进的压缩技术，能够将视频压缩率提高约50%，同时保持与H.264/AVC相当的视频质量。

H.265/HEVC在4K、8K超高清视频、虚拟现实等领域有着广泛的应用前景，成为了当前和未来视频编码的重要标准。

除了H.264/AVC和H.265/HEVC之外，未来的视频编码标准也备受关注。

随着5G、物联网、人工智能等技术的发展，对视频编码标准的需求将会更加多样化和个性化。

未来的视频编码标准将会更加注重对多种场景的适配性，包括移动端、云端、边缘计算等不同的应用场景。

总的来说，视频编码的国际标准在数字视频处理中起着至关重要的作用。

H.264/AVC和H.265/HEVC作为当前的主流视频编码标准，分别在不同的应用场景中发挥着重要作用。

未来的视频编码标准也将会不断演进，以适应多样化的视频应用需求。

视频编码的国际标准的不断完善和创新，将会推动数字视频处理技术的发展，为用户带来更加优质、高效的视频体验。

AVS和H264的区别及详细介绍说明

AVS和H.264的区别及详细介绍说明AVS是数字音视频编解码技术标准的英文简称，是我国牵头制定的第二代数字音视频信源标准，具有自主知识产权，在今年被批准为国家标准，并与3月1日正式实施。

它的编码效率与竞争性国际标准MPEG-4／H.264相当，代表了国际先进水平，广泛应用于广播、通信、电视、娱乐等各个领域。

破AVS标准为我国构建“技术→专利→标准→芯片与软件→整机与系统制造→数字媒体运营与文化产业”的产业链条提供了难得的机遇。

国际上音视频编解码标准主要两大系列：ISOIECJTC1制定的MPEG系列标准；ITU 针对多媒体通制定的H.26x系列视频编码标准和G.7系列音频编码标准。

1994年由MPEG 和ITU合作制定的MPEG-2是第一代音视频编解码标准的代表，也是目前国际上最为通行的音视频标准。

经过十年多演变，音视频编码技术本身和产业应用背景都发生了明显变化，后起之秀辈出。

目前音视频产业可以选择的信源编码标准有四个：MPEG-2、MPEG-4、MPEG-4 AVC(简称H.264，也称JVT、AVC)、AVS。

可以推测，由于技术陈旧需要更新及收费较高等原因，MPEG-2即将退出历史舞台。

AVS与H.264谁将成为数字音视频产业的标准？这个问题悬而未决，对这两个标准的比较成为业界关注的焦点。

AVS是我国具备自主知识产权的第二代信源编码标准。

顾名思义，“信源”是信息的“源头”，信源编码技术解决的重点问题是数字音视频海量数据(即初始数据、信源)的编码压缩问题，故也称数字音视频编解码技术。

显而易见，它是其后数字信息传输、存储、播放等环节的前提，因此是数字音视频产业的共性基础标准。

AVS标准是《信息技术先进音视频编码》系列标准的简称，AVS标准包括系统、视频、音频、数字版权管理等四个主要技术标准和一致性测试等支撑标准。

H.264是由ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)联合组建的联合视频组(JVT：joint video team)提出的一个新的数字视频编码标准，它既是ITU-T的H.264，又是ISO/IEC的MPEG-4的第10部分。

图像视频编码的国际标准以及每种图像和视频编码的技术特点

H.261是ITU-T针对可视电话和会议电视、窄带ISDN等要求实时编解码和低延时应用提出的一个编码标准。该标准包含的比特率为p*64Kbit/s，其中p是一个整数，取值范围为1～30，对应比特率为64Kbit/s～92Mbit/s。
6、H.261
H.261标准大体上分为两种编码模式：帧内模式和帧间模式。对于缓和运动的人头肩像，帧间编码模式将占主导位置；而对画面切换频繁或运动剧烈的序列图像，则帧间编码模式要频繁地向帧内编码模式切换。
1）输入/输出图像彩色分量之比可以是4∶2∶0，4∶2∶2，4∶4∶4。
2）输入/输出图像格式不限定。
3）可以直接对隔行扫描视频信号进行处理。
4）在空间分辨率、时间分辨率、信噪比方面的可分级性适合于不同用途的解码图像要求，并可给出传输上不同等级的优先级。
JPEG-2000另一个极其重要的优点就是感兴趣区（ROI，Region Of Interest）特性。用户在处理的图像中可以指定感兴趣区，对这些区域进行压缩时可以指定特定的压缩质量，或在恢复时指定特定的解压缩要求，这给人们带来了极大的方便。在有些情况下，图像中只有一小块区域对用户是有用的，对这些区域采用高压缩比。在保证不丢失重要信息的同时，又能有效地压缩数据量，这就是感兴趣区的编码方案所采取的压缩策略。基于感兴趣区压缩方法的优点，在于它结合了接收方对压缩的主观要求，实现了交互式压缩。
JEPG对图像的压缩有很大的伸缩性，图像质量与比特率的关系如下：
a)15～20比特/像素：与原始图像基本没有区别（transparent quality）。
b)075～15比特/像素：极好（excellent quality），满足大多数应用。
c)05～075比特/像素：好至很好（good to very good quality），满足多数应用。

rec.2020国际标准文件

《深度解读rec.2020国际标准文件》一、引言在当今信息化和数字化进程不断加快的时代背景下，各类标准文件的重要性变得愈发凸显。

而rec.2020国际标准文件作为其中的一份重要文件，其内容和意义更是备受关注。

在本文中，我们将对rec.2020国际标准文件进行全面解读，帮助读者更好地理解其中的深度内容和广度意义。

二、rec.2020国际标准文件概述rec.2020国际标准文件是指由国际电信联盟（ITU）制定的有关视频编解码、传输、显示等方面的国际标准文件。

该标准文件是为了适应超高清视频、广色域视频等新一代视频技术的发展而制定的，涵盖了视频技术领域的众多重要方面。

其发布旨在推动全球数字多媒体产业的快速发展和标准化发展，为全球数字化进程提供技术支撑和智力支持。

三、深度评估1. 视频编解码技术rec.2020国际标准文件中涉及了视频编解码技术的最新标准和规范，其中包括了对视频信号的采样方式、色域范围、亮度范围等方面的技术要求。

这些内容展现了该标准文件在视频编解码技术方面的深度研究和规范制定，为视频技术的发展提供了重要的技术标准支持。

2. 视频传输技术该标准文件还对视频传输技术进行了全面的规范，包括了视频码流的格式、传输协议、错误处理等方面的规范要求。

这些内容有助于优化视频数据的传输方式，提高视频传输的可靠性和稳定性，为视频通信技术的发展提供了重要的技术保障。

3. 视频显示技术rec.2020国际标准文件中还包括了对视频显示技术的要求和规范，其中涵盖了显示设备的分辨率、色彩还原、亮度均匀性等方面的要求。

这些内容有助于提升视频显示品质，改善观看体验，为视频娱乐产业的发展提供了重要的技术支持。

四、广度评估1. 全球影响rec.2020国际标准文件的发布对全球数字多媒体产业的发展具有重要的意义。

该标准文件的实施将有助于促进各国间的数字多媒体产业合作和交流，推动全球数字化进程的深入发展，为全球数字多媒体产业的蓬勃发展提供了重要的技术保障和规范支持。

目前主流的几种数字视频压缩编解码标准（转载）

⽬前主流的⼏种数字视频压缩编解码标准（转载）上⼀篇主要讲了H.264，接下来我们看⼀下其他编解码标准。

参看：参看：参看：JPEG联合图⽚专家组（JPEG，Joint Photographic Experts Group）是作为国际标准化组织（ISO）与电报电话国际协会（CCITT，国际电信联盟ITU的前⾝）的联合⼯作委员会于1987年成⽴的，于1988年成⽴JBIG（Joint Bi-level Image Experts Group），现在同属ISO/IECJTC1/SC29 WG1(ITU-T SG8)，专门致⼒于静⽌图⽚（still images）压缩。

JPEG已开发三个图像标准。

第⼀个直接称为JPEG标准，正式名称叫“连续⾊调静⽌图像的数字压缩编码”（Digital Compression and Coding of Continuous-tone still Images）, 1992年正式通过。

JPEG开发的第⼆个标准是JPEG-LS（ISO/IEC 14495, 1999）。

JPEG-LS仍然是静⽌图像⽆损编码，能提供接近有损压缩压缩率。

JPEG 的最新标准是JPEG 2000（ISO/IEC 15444, 等同的ITU-T编号T.800），于1999年3⽉形成⼯作草案，2000年底成为正式标准（第⼀部分）。

根据JPEG专家组的⽬标，该标准将不仅能提⾼对图像的压缩质量，尤其是低码率时的压缩质量，⽽且还将得到许多新功能，包括根据图像质量，视觉感受和分辨率进⾏渐进传输，对码流的随机存取和处理，开放结构，向下兼容等。

JPEG标准制定了四种⼯作模式：（1）顺序的基于DCT（Sequential DCT-based ）模式,由DCT（离散余弦变换）系数的形成、量化和熵编码三步组成。

从左到右，从上到下扫描信号，为每个图像编码。

（2）累进的基于DCT（Progressive DCT-based）模式,⽣成DCT系数和量化中的关键步骤与基本顺序编码解码器相同。

常见的视频编码技术和标准123

78基础知识讲座2006 NO.9&10 记录媒体技术随着我国具有自主知识产权的视频编码国家标准AVS 的发布，视频编码技术和标准引起了行业内人士的极大兴趣和关注。

光盘行业比较熟悉的视频编码国际标准是MPEG 系列编码标准，这是因为MPEG-1标准成功地推动了VCD 产业，而MPEG-2标准带动了DVD 及数字电视等多种消费电子产业的快速发展。

随着视频编码技术的广泛应用和迅速发展，更多的视频编码技术和标准展现在我们面前。

目前，最为重要的视频编码国际标准包括国际标准化组织(ISO)和国际电工委员会(IEC)关于静止图像的编码标准JPEG ，国际电信联盟(ITU-T)关于可视电话和电视会议的视频编码标准H.261、H.263、H.264，以及国际标准化组织的运动图像专家组的系列标准MPEG-1、MPEG-2、MPEG-4。

此外，在互联网上被广泛应用的还有Real-Networks 公司的RealVideo 、微软公司的WMV 、Apple 公司的QuickTime 等格式。

这些视频编码技术融合了各种性能优良的图像编码算法，代表了目前图像编码的发展水平。

下面就光盘相关的视频编码技术和标准进行简要的评述。

一、H.261、H.263、H.264系列标准ITU-T 与ISO/IEC 是制定视频编码标准的两大国际组织，其中ITU-T 制定的标准包括H.261、H.263、H.264，主要应用于实时视频通信领域，如视频会议；MPEG 系列标准是由ISO/IEC 制定的，主要应用于视频存储、广播电视、因特网或无线网络的流媒体等。

两个组织也共同制定了一些标准，H.262标准等同于MPEG-2的视频编码标准，而最新的H.264标准则被纳入MPEG-4的第10部分。

1. H.261H.261又称为P*64，其中P 为64kb/s 的取值范围，是1到30的可变参数，它最初是针对在ISDN 上实现电话会议(特别是面对面的可视电话和视频会议)而设计常见的视频编码技术和标准(I)◇祖晟的。

主流编解码格式

主流的编解码格式包括MPEG-2、MPEG-4、H.262、H.263等。

1. MPEG-2：也被称为ITU-TH.262，是目前消费类电子视频设备中是最广泛的视频编码标准。

MPEG-2视频常用于广播信号（卫星电视、有线电视）的视频和音频编码，经过后期不断修改，不仅成为DVD 的核心技术，还应用于HDTV高清电视传输。

2. MPEG-4：于1998年11月公布，原预计1999年1月投入使用的国际标准。

它不仅是针对一定比特率下的视频、音频编码，更加注重多媒体系统的交互性和灵活性。

3. H.262：也被称为MPEG2Video，常用于数字电视广播，包括陆地、海底电缆和直接卫星广播。

此外，它也是DVD-V中必需的编解码器。

4. H.263：最初设计为基于H.324的系统进行传输（即基于公共交换电话网和其他基于电路交换的网络进行视频会议和视频电话）。

后来发现H.263也可以成功的应用于H.323（基于RTP/IP网络的视频会议系统），H.320（基于综合业务数字网的视频会议系统），RTSP （流媒体传输系统）和SIP（基于因特网的视频会议）。

以上信息仅供参考，如有需要，建议查阅相关网站。

视频编码国家标准AVS解析

１、技术对比
％像素仅在半像素＊像素位置采用６％像素位置采用４运动位置进行双拍滤波，像素位拍滤波，像素位基本相当补偿线性插值置线性插值置采用４拍滤波、线性插值
ＡＶＳ视频与ＭＰＥＧ标准都采用混合编码框架（见图１），包括变换、
量化、熵编码、帧内预测、帧间预测、环路滤波等技术模块，这是当前
主流的技术路线。ＡＶＳ的主要创新在于提出了一批具体的优化技术，在较低的复杂度下实现了与国际标准相当的技术性能，但并未使用国际标准背后的大量复杂的专利。ＡＶＳ一视频当中具有特征性的核心技术包括：８ｘ８整数变换、量化、帧内预测、１，４精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等。ＡＶＳ视频编码器框图如下图所示。
多参
术先进音视频编码》系列标准的简称，是我国具备自主知识产权的第二
代信源编码标准，也是数字音视频产业的共性基础标准。现在，国际上音视频编解码标准主要两大系列：ＩＳＯＨＥＣＪＴＣ１制定的ＭＰＥＧ系列标准；ｒＩ＇ｕ针对多媒体通信制定的Ｈ．２６ｘ系列视频编码标准和Ｇ．７系列音频编码标准。音视频产业可以选择的信源编码标准有四
２０１９年第１７期
电子信息科学与技术
视频编码国家标准ＡＶＳ解析
■华筱怡
Ａｖｓ是我国具备自主知识产权的第二代信源编码标准，也是数字音

视频图像编码技术及国际标准

三、编/解码原理
1、编码原理
仍然采用经典的运动补偿混合编码算法；编码图像分为3种：I帧、P帧和B帧；此外H.264还定义了新的SP帧和SI帧，用以实现不同的传输速率、不同图像质量码流间的快速切换以及信息丢失的快速恢复等功能； H.264将一视频图像编码成一个或多个片，一个片由一系列按光栅扫描顺序排列的宏块构成每片包含整数个宏块或一幅图像的全部宏块。
2.行和场
行：传统CRT模拟电视里,一个电子束在水平方向的扫描被称之为行,或行扫描. 场：传统CRT模拟电视里,一个电子束按垂直的方向扫描被称之为场,或场扫描.
一帧图像包括两场——顶场和底场
3.颜色空间
1.三基色原理自然ห้องสมุดไป่ตู้中，绝大多数的彩色都可以由三种基色按不同的比例相加混合得到。三种基色彼此独立，其中一种基色不能用其它两种基色混合得到。 • 混色规律： • 红+绿=黄
在ISO/IEC中正式名称为MPEG-4 Part 10，称之为 “ISO/IEC 14496 Part 10高级视频编码算法”（ ISO/IEC 14496 10 AVC
H.264/AVC视频编码和解码
H.264/AVC视频编码和解码
二、档次与等级 H.264主要支持4:2:0格式的连续或隔行视频的编解码， 4:2:2和4:4:4可作为额外的参考信息参数；根据应用领域不同，制定了不同的算法集合和技术限定，共分为3个档次：基本档、主档和扩展档；在每一档次设臵了不同的参数，每个档次下面又划分为不同的等级；基本档是扩展档的子集，但不是主档的子集。
6.数字视频采样格式
• 根据电视信号的特征，亮度信号的带宽是色度信号带宽的两倍。因此其数字化时可采用幅色采样法，即对信号的色差分量的采样率低于对亮度分量的采样率。用Y：U：V来表示YUV三分量的采样比例，则数字视频的采样格式分别有4：1：1、4：2：2和4：4：4三种。电视图像既是空间的函数，也是时间的函数，而且又是隔行扫描式，所以其采样方式比扫描仪扫描图像的方式要复杂得多。分量采样时采到的是隔行样本点，要把隔行样本组合成逐行样本，然后进行样本点的量化，YUV到RGB色彩空间的转换等等，最后才能得到数字视频数据。

视频通信中新一代视频编码国际标准HEVC扩展述评

视频通信中新一代视频编码国际标准HEVC扩展述评作者：宋悦凯来源：《中国新技术新产品》2015年第18期摘要：视频通信已经成为通信的主要方式之一，视频编码是视频通信中一个非常重要的组成部分。

近年来，随着高清晰度电视、DVD、蓝光盘等设备的出现，分辨率越来越高的视频得到广泛的应用，高效视频编码标准（High Efficiency Video Coding，HEVC）正是为满足此需求而制定的。

然而，为了满足更多的应用需求，需要对HEVC进行扩展，主要包括可伸缩扩展和精度扩展。

本文主要对HEVC扩展的基本概念、关键编码技术和研究热点进行了详细介绍。

关键词：视频编码；HEVC；可伸缩扩展；精度扩展中图分类号：TN919.81 文献标识码：A1 引言通信技术主要研究信号的产生、信息的传输、交换和处理，研究领域包括计算机通信、视频通信、数字通信、卫星通信、光纤通信、蜂窝通信、个人通信、平流层通信等方面。

近20年来，随着视频业务需求的迅速增长和业务质量要求的提高，视频通信已经成为通信的主要方式之一。

视频通信是对视频业务进行采集、压缩、传输和恢复的过程。

视频编码是视频通信中一个非常重要的组成部分。

多年来，媒体存储、会议电视、可视电话、IPTV、网络电视、视频监控和移动流媒体等一系列的应用，促使了视频编码标准的产生和发展。

国际电信联盟远程通信标准化组（ITU-T for ITU Telecommunication Standardization Sector，ITU-T）与国际标准化组织（International standard organization， ISO）是制定视频编码国际标准的两大组织，已经制定出H.261、MPEG-1、MPEG-2、H.263、MPEG-4 和H.264/AVC等多个标准。

近年来，随着高清晰度电视、DVD、蓝光盘等设备的出现，分辨率越来越高的视频得到广泛的应用，从而相应地产生了对这些视频进行高效率且低复杂度编码的需求，新一代视频编码国际标准即高效视频编码标准（High Efficiency Video Coding，HEVC）正是为满足此需求而制定的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

四、视频帧类型
帧内图（intra picture，I帧）——对I帧的编码类似于
JPEG，支持随机存取，压缩比低；预测图（predicted picture，P帧）——是运动主体在与I 帧相隔一定时间，在同一背景上已有明显变化的画面。以前面I帧为参考，相同信息不发送只发送主体变化差值，
进行具有运动补偿的前向预测；
数字视频技术
第 3章视频编码国际标准 2011年11月
Logo 主要内容
视频图像编码标准 MPEG-1视频编码和解码 MPEG-2视频编码和解码 MPEG-4视频编码和解码 H.263视频编码和解码 H.264/AVC视频编码和解码
Logo §3.1 视频图像编码标准
Logo §3.1 视频图像编码标准
一、 H.261 H.261是用于视频会议和可视电话业务的以p×64kbps, p=1,…,30的速率在综合业务数字网（ISDN）上传送视频信号的压缩标准。
64kbps (p=1) 用于低端的可视电话业务，其中视频信号传输占用48 kbps的带宽，剩下的16 kbps用于音频信号； 384 kbps（p=6）或更高的速率用于高端的视频会议业务；在ISDN信道上最高传输率为19.2Mbps (p=30)，足以传送VHS质量的视频信号。
MPEG-2不仅接受逐行扫描视频，也可以接受隔行扫描视
频，高清晰度视频，提供可伸缩调节的位流，提供改进的量化和编码选项。
Logo §3.1 视频图像编码标准
五、MPEG-4 低于64kbps的低数据率，交互式多媒体应用标准； MPEG-4利用了人眼视觉特性，抓住了图像信息传输的本质，从轮廓、纹理思路出发，基于对内容的访问； AV对象（AVO，Audio Visual Object）是MPEG-4为支持基于内容编码而提出的重要概念；视音频已不再是图像帧的概念，而是一个个视听场景；把编码对象从图像帧到任意形状的视频对象，实现从基于像素的传统编码到基于对象和内容的现代编码。采用开放的编码系统，可随时加入新的编码算法模块，同时也可根据不同应用需求现场配置解码器，以支持多种多媒体应用；
Logo §3.2 MPEG-1视频编码和解码
“开放性”的视频码流：
I 帧在码流中出现的位置和频率，可根据图像序列中随机存取和景物切换的需要进行选择。
相邻最近的I与P帧或P帧之间的B帧数目可以选择。
I，P，B三种图象的数据压缩比： 2～5：1， 5～10：1， 20～30：1
图象的编码顺序和显示顺序不相同。
Logo §3.1 视频图像编码标准
四、MPEG-2/H.262
MPEG-2是1993年通过的视频压缩标准，用于高清晰度视
频和音频的编码，也包含用于可视电话中的超低码率（832kbps）的压缩编码； MPEG-2是MPEG-1的兼容扩展，广泛应用于各种速率（ 2-20Mbps）和各种分辨率情况下的场合；
忽略水平和垂直空白间隔
量化10bits到8bits
Logo §3.2 MPEG-1视频编码和解码
DPCM
DCT＋量化
Z扫描＋VLC Huffman编码
进一步数据压缩
Logo §3.2 MPEG-1视频编码和解码
五、MPEG-1视频编码器 1、MPEG标准并没有定义特定的编码过程，只是定义了编码比特流的语法和解码过程。
面向电视电话、电视会议和Internet多媒体的新一代国际视频编码标准；具有较强的抗误码特性，可适应丢包率高、干扰严重的信道中的视频传输；支持不同网络资源下的分级编码传输，在图像主观质量和码率方面有大幅改进，是目前综合性能最优、应用前景最广泛的编码标准。
Logo §3.1 视频图像编码标准
Logo §3.1 视频图像编码标准
H.261的编码方案是基于DCT和DPCM的预测编码算法，运动每帧图象分成8x8的子块，再组成宏块、块组，宏块由4个8x8的亮度块和2个8x8的色度块组成，每个块组由 3x11个宏块组成。
每幅QCIF图象有3个块组；
每幅CIF图象有12个块组，形成一个多层次的块结构。
1 2 3 量化从10bits降为8bits 省略水平和垂直空白间隔降低垂直方向色度分辨率(4:2:0) 有损无损有损
4 5
6 7
活动图像的DPCM (Differential Pulse Code
Modulation)差分脉冲编码调制，简称差值编码
பைடு நூலகம்
无损有损
无损无损
DCT和量化
Z扫描和零序列的游程编码 Huffman编码
Logo §3.2 MPEG-1视频编码和解码
2、关键技术（1）帧序重排在编码器端需要对输入图像重新排序，对按显示顺序输入
的序列，经过帧序重排后成为按编码顺序排列，然后按I
、B、P帧分别进行编码；
（2）运动估计和补偿
（3）比特流缓冲器
Logo §3.2 MPEG-1视频编码和解码
图像压缩首先处理I帧图像，然后是P帧，最后在两者的基础上才处理B帧； MPEG编码器算法允许选择I图像频率（指每秒钟出现I图像的次数）和位置（时间方向上帧所在的位置）；一个典型的I、P、B图像排列如下：I的距离为15；P的距离为3；
任意任意
多媒体检索未来视频编码工业标准
Logo §3.2 MPEG-1视频编码和解码
一、标准简介编号为ISO/IEC 11172；规定视频信息与伴音信息经压缩之后的数据速率上限为 1.5Mbps（其中视频约为1.2Mbps，音频约为0.3Mbps）；可以在CD-ROM、硬盘、可写光盘、数字音频磁带等介质
H.261颁布于1990年，主要用于双向视频通信，允许的最大编码延迟为150ms。它的输入图象格式为通用（同时适用于 625线和525线的视频标准）中间格式CIF (352x288)，低端可用其四分之一大小的QCIF (176x144)格式，桢率为 30,15,10,7.5四种，隔行（interlaced）视频，宽高比4:3。
双向预测图（bidirectional picture，B帧）——传送I、P 帧间的画面，只反映运动主体变化情况，重放时即参考I
也参考P，本身不做参考帧使用，不能用作预测参考；
Logo §3.2 MPEG-1视频编码和解码
Logo §3.2 MPEG-1视频编码和解码
Logo §3.2 MPEG-1视频编码和解码
Logo §3.2 MPEG-1视频编码和解码
Logo
§3.2 MPEG-1视频编码和解码
显示顺序上在前的B帧图像，由于预测时参照靠后的P帧
图像，在传输存储和解码是必须先处理P帧图像，因此在编码顺序上P帧图像反而在B帧图像之前；
由于编码顺序和显示顺序之间的差异，带来编、解码总延
时达0.8～1s；
基于语义
对象特征
提取
MPEG-7
基于对象
MPEG-4
对象形成及跟踪
基于像素
MPEG-1
MPEG-2
Logo §3.1 视频图像编码标准
编码标准 H.261 全称传输码率
P×64kbps P=1～30
主要应用
ISDN视频会议
P×64kbps的音/视频服务的编/解码面向数字存储的运动图像及伴音编码运动图像及伴音的通用编码低比特率通信的视频编码音/视频对象的通用编码多媒体内容描述接口高级视频编码算法
二、H.263
H.263是在H.261的基础上针对低码率（低于64kbp）视频压缩提出的标准，与之不同的是采用半象素精度运动补偿算法和变长编码，并引进了16种可协商的编码选项用于提高压缩性能和支持新增加的功能。
Logo §3.1 视频图像编码标准
三、MPEG-1 MPEG-1是1992年通过的视频压缩标准，用于CIF格式的视频在速率约1.5Mbps的各种数字存储介质（如CDROM,DAT,硬盘及光驱等）上的编码表示，主要应用在交互式多媒体系统中； MPEG-1算法与H.261算法相似，它在1.2Mbps（视频信号）速率下压缩和解压缩CIF格式的视频质量与VHS记录的模拟视频质量相当；它是一种通用标准，规定了编码位流的表示语法和解码方法，提供的支持操作有运动估计、运动补偿预测、DCT、量化和变长编码。 MPEG-1的特点有：(1)随机存取，(2)支持快速双向搜索，(3)允许大约1秒的编码/解码延迟，比H.261的150ms内的严格限制松得多。
这种延时对广播性质的图像传输不会带来任何影响，因为用户并不能发现发射端与接收端信号起始时间的差异；对于交互性质的图像传输，如数字会议电视会带来不便，如甲方向乙方提问，由于双向延时则会1.8～2s以后得到回答；
Logo §3.2 MPEG-1视频编码和解码
为减小延时采用方法：通过减少B帧使两个I帧之间的帧数减少，则编、解码总延时下降；为进一步减小延时，可以把B帧、P帧全部去掉。这样可得零延时，此方式称M-JPEG方式；
Logo §3.1 视频图像编码标准
MPEG-7：多媒体内容描述标准，支持对多媒体资源的组织管理、搜索、过滤和检索；
MPEG-21：多媒体框架和综合应用方面的框架。目标是建立一个交互的多媒体框架该标准致力于在大范围的网络上实现透明的传输和对多媒体资源的充分利用。六、H.264/AVC
Logo §3.2 MPEG-1视频编码和解码
三、输入图像格式 MPEG-1输入视频信号采用源输入格式（SIF, Source Input Format），采用YCrCb色空间；采样格式4：2：0； MPEG-1最大的图像尺寸只能是352×288（对应25Hz帧频）。
Logo §3.2 MPEG-1视频编码和解码
上进行存储，也可在局域网、ISDN上进行视频与伴音信息