H264优化方案调研总结(博)

合集下载

H.264总结

帧内预测：原理：用周围邻近的像素值来预测当前的像素值，然后对预测误差进行编码。

优点：对I帧的编码是通过利用空间相关性而非时间相关性实现的，这样可以极大提高压缩效率。

帧间预测：特点：同样是使用运动估计和运动补偿来消除时间冗余，但具有5个不同特点：1.预测时所用块的大小可变；解释：由于基于块的运动模型假设块内的所有像素都做了相同的平移，在运动比较剧烈或者运动物体的边缘处这一假设会与实际输入较大，导致较大的预测误差，这时，采用减小块的大小可以使假设在小的块中依然成立（因为造成的预测误差较小）。

H.264可以采用7中方式对一个较大的宏块进行分割，每种分割方式得到的小块的大小和形状都不同，如此，使得编码器可以根据图像的运动情况选择较好的预测模式（即灵活选择分割方式）。

使码率节约15%。

（具体有哪7中？如16X16）2.更精细的预测精度；解释：在H.264中，Luma分量的运动矢量（MV）使用1/4像素精度。

Chroma分量的MV由Luma MV导出，由于chroma分辨率是Luma的一半，所有它的精度为1/8.使码率节约20%。

3.多参考帧（multiple reference frames）；解释：H.264支持多参考帧，即1~5个的当前帧之前解码的帧可以作为参考帧产生对当前帧的预测。

这样做，改善了运动估计（ME）的性能，提交了错误恢复能力。

特别适用于含有周期性运动的情况。

使码率节约5~10%。

4.Deblocking Filter（抗块效应滤波器）；解释：作用是消除经反量化和反变换后重建图像中由于预测误差产生的块效应（即块边缘处的像素值跳变），另外可以减少预测误差。

H.264中的Deblocking Filter还能根据图像内容做出判断，支对块效应产生的像素值跳变进行平滑，而对图像中物体边缘处的像素值不连续给与保留，以免造成边缘模糊。

不同之处：经过滤波后的图像将根据需要放在缓存中用于帧间预测。

5.SP Slice；整数变换H.264对帧内或帧间预测的残差（residual）进行DCT变换编码。

H_264帧内预测算法的研究与优化

CHINA NEW TELECOMMUNICATIONS1引言H.264是ITU-T 和ISO/IEC 制定的视频编码标准。

在该标准中引入了先进的技术，例如：4×4整数变换、自适应块运动补偿、多参考帧、CABAC 、帧内预测等。

在这些新的特性中，帧内预测是H.264优于其他标准的主要因素之一。

对于亮度分量，H.264有两种预测类型：Intra16×16和Intra4×4，对含有较多图像细节的宏块采用4×4预测，而对于较平坦的区域采用16×16的预测模式。

前者共有9种预测模式可供选择，后者共有4种预测模式可供选择。

两个色度分量常用同一种预测模式，4种预测模式类似于16×16宏块的4种预测模式，只是编号不同而已。

在Intra4×4中，每一个4×4块内的像素以及周围像素的分布如图1所示，其中小写英文字母a 到p 表示块内部的16个像素，大写字母A 到Q 表示块周围的像素（已编码并重构的像素）。

预测值将利用周围已知像素的值来计算：除了DC 预测模式来预测整个的4×4块之外，还有8个方向的预测如图2所示，块内同一方向上的像素点具有相同的预测值，以此来近似地逼近不同方向纹理特性的图像。

对于Intra16×16预测，整个宏块使用了4种预测模式。

预测模式0（垂直预测）、模式1（水平预测）、模式2（DC 预测）类似于Intra4×4中的模式，还有模式3（平面预测）。

帧内色度预测独立于亮度，两个色度分量U 、V刘明李欣杨霖（中国海洋大学信息科学与工程学院青岛266100）摘要H.264作为最新的视频编码标准，为了获得最佳的帧内和帧间预测，H.264采用了率失真优化（RDO ）技术，提高了编码质量，降低了比特率。

RDO 技术对所有的帧内/帧间预测模式采用全搜索算法，导致了很高的计算复杂度。

本文中，引入了一种新颖的快速帧内预测算法，改变模式选择的顺序，利用临块之间预测模式的相关性，通过阈值比较及绝对差值和排序的方式，对H.264帧内预测算法进行了优化。

H.264视频编码器在DSP上的实现与优化(精)

H.264视频编码器在DSP上的实现与优化摘要：在DM642EVM平台上实现了H.264视频编码器，并从内存分配、Cache优化、代码优化以及汇编程序级优化等几个方面对编码器进行了优化。

实验结果表明，优化后的编码器能保持较高的图象质量和压缩效率，并具有较好的实时性能。

1引言H.264/AVC是ITU-T视频编码专家组和ISO/IEC运动图象专家组联合提出的新一代视频编码标准。

在相同的条件下，与MPEG-1、MPEG-2、H.263、MPEG-4等标准相比，H.264/AVC能够减少50%的码流。

但是，H.264的高编摘要：在DM642EVM平台上实现了 H.264视频编码器，并从内存分配、Cache优化、代码优化以及汇编程序级优化等几个方面对编码器进行了优化。

实验结果表明，优化后的编码器能保持较高的图象质量和压缩效率，并具有较好的实时性能。

1 引言H.264/AVC是ITU-T视频编码专家组和ISO/IEC运动图象专家组联合提出的新一代视频编码标准。

在相同的条件下，与MPEG-1、MPEG-2、H.263、MPEG-4等标准相比，H.264/AVC能够减少50%的码流。

但是，H.264的高编码效率是以高运算量和高复杂度为代价的。

本文采用具有较高运算速度和较强数据处理能力的DM642 EVM作为H.264视频编码器实现和优化的DSP硬件平台，实现了 H.264视频编码算法，并对算法程序进行了综合优化。

实验结果表明，经过优化的 H.264视频编码器能保持较高的图象质量和压缩效率，并具有较好的实时性能。

2 H.264视频编码技术及DM642 EVM开发平台2.1 H264视频编码技术H.264压缩算法采用与H.263和MPEG-4类似的基于块的混和编码方法，采用帧内(Intra)和帧间(Inter)两种编码模式。

为了提高编码效率、压缩比和图象质量，H.264采用了许多新的编码技术，这些技术主要有：⑴ H.264标准压缩系统由视频编码层(VCL，Video Coding Layer)和网络抽象层(NAL，Network Abstrac ti on Layer)两部分组成。

H264AVC率失真优化技术综述

万方数据万方数据种编码模式，针对不同图像类型，编码模式集见表ｌ。

表ｌ编码模武集另外，ＩＮＴＲＡ４×４亦有多种预测模式选择，见图２。

田２ＩＮＴＲＡ４×４预测模式ＩＮｌｒＩ认４ｘ４的预测模式选择率失真优化计算公式为Ｊ（ｓ，ｃ，ＩＭＯＤＥｆＱＰ，Ａ删）辎Ｄ（５，ｃ，ＩＭＯＤＥＩＱＰ）＋Ａ＿伽·Ｒ（ｓ，ｃ，ＩＭＯＤＥｌ口Ｐ）式中：ＩＭＯＤＥ代表可选的多种预测模式，ＳＳＤ（ｓ，ｃ，ＩＭＯＤＥＩＱＰ）表示失真，Ｒ（ｓ，ｃ，ＩＭＯＤＥＩＱＰ）表示编码输出比特数。

包括帧内预测模式和ＤＣＴ亮度系数所需比特数。

４Ｈ．２６４／ＡＶＣ率失真优化算法及改进情况４．１ＪＭ７．６率失真优化算法以测试模型ＪＭ７．６为例。

下面分析视频标准Ｈ．２６４／ＡＶＣ在宏块编码所采用的率失真优化算法详细步骤。

算法描述如下：１）参数初始化，确定宏块的量化参数卵及参考帧信息，依照当前编码图像类型，计算拉格朗日参数Ａ脚，Ａ麒删；２）决定当前宏块决定最佳ＩＮＴＲＡ４ｘ４预测模式；３）通过计算ＳＡ（Ｔ）Ｄ，最小值对应的预测模式为当前宏块最佳ＩＮＴＲＡｌ６ｘ１６预测模式：４）为当前宏块选取运动估计的最佳参考帧及相应一．堕巡！塑一［３运动信息ｏ５）在２），３），４）基础上，计算各种编码模式下的率失真开销－，，选取最小值对应的编码模式作为当前宏块最佳的编码模式：６）当前宏块编码后续处理，准备下一宏块的编码。

４．２各种改进率失真优化算法在Ｈ．２６４／ＡＶＣ进行编码时，要依据率失真优化，对Ｉ，Ｐ，Ｂ帧的多种模式（见表１）进行遍历计算。

但在实际的编码过程中，可以依据图像中的某些相关信息，例如纹理，对编码模式进行预判。

从而减少计算的复杂性。

Ｄ．Ｗｕ，Ｆ．Ｐａｎ等人就提出了一种改进的算法阎，该算法对纹理比较均匀，变化比较缓慢的视频，在视频质量ＰＳＮＲ减少小于０．０６ｄＢ时，编码时间可节省近５０％。

目前，针对Ｈ．２６４／ＡＶＣ的率失真优化技术的改进较多，大致分为：１）建立视频图像在时间、空间域相关性基础之上的算法。

H.264帧内预测优化与帧内方向预测的研究的开题报告

H.264帧内预测优化与帧内方向预测的研究的开题报告题目：H.264帧内预测优化与帧内方向预测的研究一、选题背景和意义H.264/AVC是一种现代视频编码标准，已经被广泛应用于数字视频传输和存储。

它采用了先进的压缩技术，在相同的比特率下，能够提供更高质量的视频图像。

其中，H.264的帧内预测技术可以减少视频编码器中的冗余信息，从而有效地提高视频编码器的压缩性能。

在H.264中，帧内预测是一种基于已有像素点的局部预测方法，用于预测当前像素点的像素值。

基于这种预测方法，视频编码器可以将当前像素点的像素值与预测值之间的残差进行编码，从而减少编码数据量。

然而，帧内预测技术也存在一些问题，例如预测误差和预测方向等，这会导致视频图像的失真度增加，从而降低视频质量。

因此，研究H.264帧内预测的优化和方向预测技术，对于提高视频编码器的压缩性能和视频质量具有重要意义。

二、研究内容及目标本文主要研究H.264帧内预测的优化和方向预测技术，探讨如何改进H.264的帧内预测算法以及如何提高预测精度和方向选择准确性。

具体研究内容如下：1.研究帧内预测技术在H.264中的原理和实现方法，分析其存在的问题和不足之处；2.对H.264中的帧内预测算法进行优化和改进，设计新的预测算法，并通过实验验证其性能和效果；3.研究帧内方向预测技术在H.264中的应用方法和原理，并提出新的方向预测算法；4.通过实验比较分析不同帧内预测算法和方向预测算法的性能和效果，找出最优解并进行性能评估。

研究目标包括：1.提高H.264编码器的压缩性能，减少编码数据量；2.提高H.264视频图像的质量和稳定性，减少失真度；3.提出新的帧内预测和方向预测算法，为视频编码标准的改进和升级提供参考。

三、研究方法和技术路线本文采用实验和理论相结合的方法，对H.264中的帧内预测算法和方向预测技术进行研究和优化。

具体技术路线如下：1.研究H.264编码器中的帧内预测技术，分析其应用原理和算法，确定改进方向和思路；2.设计新的帧内预测算法，包括预测模式的改进和选择策略的优化，通过实验分析不同预测算法的性能和效果；3.研究帧内方向预测技术，对常用算法进行分析和改进，提出新的方向预测算法，并通过实验比较不同算法的性能和效果；4.评估和比较不同帧内预测算法和方向预测算法的性能和效果，找出最优解。

H.264／AVC解码器优化的研究

ＫｅｗｏｄＨ．６／ｙｒｓ２４ＡＶＣ，ｄｃｄｒｐｉｚｔｎｉｉｌｓｎｌｒｃｓｉｇＤＳｅｏｅ，ｏｔａｉ，ｄｇｔｉａｏｅｓｎ（Ｐ）ｍｉｏａｇｐ
约相当于Ｈ．６２３的２倍。测试结果表明，２４Ｈ．６
ＬＵｅｇｆｉＩＰｎ —ｅ，ＬＩｉＵＺｈ，ＡＮＰｉｇ，ＺＨＡＮＧｈａ — ａｇｎＺｏｙｎ
（ｃｏｌｆＣｍｍｕｉｔｎａｄＩｏｍｔｎＥｇｎｅｎＳａｇａｎｖｒｔ，ｈｎｈｉ００２Ｓｈｏｏｏｎａｉｎｎｒａｉｎｉｅｒｇ，ｈｎｈｉＵｉｅｉＳａｇａ０７）ｃｏｆｏｉｓｙ２
文献标识码：Ａ文章编号：１０ —９１２０）１１２ —４０６８６（０６ｌ．６７０中图法分类号：Ｎ１．１Ｔ９９８
Ｒｅｅｒｈｏ．６／ｓａｃｆＨ２４ＡＶＣｃｄｒＯｐｔｍｉａｉｎＤｅｏｅｉｚｔｏ
效率和差错鲁棒性，是这些编码效率的提高是以增加编码器和解码器的复杂度为代价的。研究表明，于但由
Ｈ．６／Ｖ２４ＡＣ编解码器的计算复杂度比其他视频压缩标准高出几倍甚至十几倍，因此实现实时编解码器需要寻找
高效的优化方法。为了对解码器进行优化，软件和硬件平台的角度提出了一种解码器的优化方法，后进行了从最

视频编码标准分析及优化方案研究

视频编码标准分析及优化方案研究一、引言视频编码是现今互联网技术中的重要分支之一，是许多实时和非实时视频应用的关键。

随着互联网视频应用的不断增加，尤其是4K、8K等高清视频应用的出现，视频编码的重要性变得尤为突出。

本文将对常见的视频编码标准进行分析，并提出优化方案。

二、视频编码标准分析（一）H.264H.264是一种基于块大小的视频压缩标准。

它采用了先进的预测模式和变长编码技术，在视频压缩方面取得了巨大成果。

H.264标准能够提供更好的视频画质和视频压缩能力。

同时，它具有广泛的平台兼容性，能够广泛应用于各种系统和设备上。

（二）H.265H.265标准是目前国际上应用最广的视频编码标准之一。

它采用了类似于H.264的技术，但在压缩性能和画质方面更为优秀。

由于H.265标准能够提供更加高效的视频压缩能力，它可以在相同的带宽和存储空间下提供更高质量的视频。

（三）VP9VP9是Google开发的一种高效视频压缩编码格式，它主要应用于网络视频方案中。

VP9标准具有更广泛的视频压缩性能和更高画质，可以在较低带宽下提供更高质量的视频。

三、优化方案（一）采用高级预测模式预测模式是视频编码中的核心技术之一，通过对视频画面的预测，实现视频压缩。

对于同等比特率，采用高级预测模式可以提高视频的画质。

H.265标准中采用的更高级别的预测技术比H.264标准更优秀，能够提供更高质量的视频。

（二）采用自适应分辨率技术自适应分辨率技术可以根据设备的网络带宽和硬件能力，在不影响视频画质的前提下，调整视频帧率和分辨率。

这种技术能够保证在不同网络环境下，用户可以获得更稳定的视频体验。

（三）采用高效的编码算法H.265和VP9标准中采用了更加高效的变长编码技术和帧间预测技术，能够提高视频压缩性能和画质。

同时，使用多线程编码算法能够提高编码速度，缩短视频编码时间。

四、总结随着互联网视频应用的不断增加，视频编码标准的优化越来越受到关注。

本文介绍了常见的视频编码标准，同时提出了优化方案，通过采用高级预测模式、自适应分辨率技术和高效的编码算法，能够提高视频的画质和压缩性能。

H.264视频编码率失真优化和码率控制技术研究进展

Ｈ畅２６４视频编码率失真优化和码率控制技术研究进展崔子冠１，２，朱秀昌１，２，干宗良１，２，唐贵进１，２，刘　峰１，２（１．南京邮电大学江苏省图像处理与图像通信重点实验室，江苏南京２１０００３；２．南京邮电大学宽带无线通信与传感网技术教育部重点实验室，江苏南京２１０００３）摘　要：　在Ｈ畅２６４率失真优化和码率控制（ＲＣ）技术研究的基础上，根据控制目的将率失真优化和ＲＣ的发展分为３个阶段：即率失真建模，考虑质量波动对主观质量的影响，以主观失真为指导的ＲＣ．分析了各阶段有代表性的ＲＣ技术及其特点，指明了ＲＣ需要进一步研究的关键和难点问题．对面向传输的错误弹性编码、可分级编码、多描述编码、以及立体与多视编码中的ＲＣ技术进行总结，分析进一步发展趋势．对下一代高性能视频编码（ＨＥＶＣ）中的ＲＣ应该如何发展进行了探讨．关键词：　视频编码；率失真优化；码率控制；Ｈ畅２６４中图分类号：　ＴＮ９１９畅８文献标识码：　Ａ文章编号：　０３７２－２１１２（２０１３）１２－２４４３－０８电子学报ＵＲＬ：ｈｔｔｐ：／／ｗｗｗ．ｅｊｏｕｒｎａｌ．ｏｒｇ．ｃｎ　ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．０３７２－２１１２．２０１３．１２．０１９ＡｄｖａｎｃｅｓｉｎＲａｔｅＤｉｓｔｏｒｔｉｏｎＯｐｔｉｍｉｚａｔｉｏｎａｎｄＲａｔｅＣｏｎｔｒｏｌＴｅｃｈｎｉｑｕｅｓｆｏｒＨ．２６４ＶｉｄｅｏＣｏｄｉｎｇＣＵＩＺｉ－ｇｕａｎ１，２，ＺＨＵＸｉｕ－ｃｈａｎｇ１，２，ＧＡＮＺｏｎｇ－ｌｉａｎｇ１，２，ＴＡＮＧＧｕｉ－ｊｉｎ１，２，ＬＩＵＦｅｎｇ１，２（１．ＩｍａｇｅＰｒｏｃｅｓｓｉｎｇａｎｄＩｍａｇｅＣｏｍｍｕｎｉｃａｔｉｏｎＬａｂ，ＮａｎｊｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＰｏｓｔｓａｎｄＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ，Ｎａｎｊｉｎｇ，Ｊｉａｎｇｓｕ２１０００３，Ｃｈｉｎａ；２．ＫｅｙＬａｂｏｆＢｒｏａｄｂａｎｄＷｉｒｅｌｅｓｓＣｏｍｍｕｎｉｃａｔｉｏｎａｎｄＳｅｎｓｏｒＮｅｔｗｏｒｋＴｅｃｈｎｏｌｏｇｙ，ＮａｎｊｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＰｏｓｔｓａｎｄＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓ，ＭｉｎｉｓｔｒｙｏｆＥｄｕｃａｔｉｏｎ，Ｎａｎｊｉｎｇ，Ｊｉａｎｇｓｕ２１０００３，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：　Ｂａｓｅｄｏｎｔｈｅｒｅｓｅａｒｃｈｅｓｏｆｒａｔｅｄｉｓｔｏｒｔｉｏｎｏｐｔｉｍｉｚａｔｉｏｎ（ＲＤＯ）ａｎｄｒａｔｅｃｏｎｔｒｏｌ（ＲＣ）ｔｅｃｈｎｉｑｕｅｓｆｏｒＨ．２６４，ｔｈｉｓｐａｐｅｒｄｉｖｉｄｅｓｔｈｅｄｅｖｅｌｏｐｍｅｎｔｏｆＲＤＯａｎｄＲＣｉｎｔｏｔｈｒｅｅｐｈａｓｅｓｂａｓｅｄｏｎＲＣｉｎｔｅｎｔｉｏｎ，ｎａｍｅｌｙｒａｔｅｄｉｓｔｏｒｔｉｏｎｍｏｄｅｌｉｎｇ，ｃｏｎｓｉｄｅｒｉｎｇｔｈｅｅｆｆｅｃｔｏｆｑｕａｌｉｔｙｆｌｕｃｔｕａｔｉｏｎｏｎｓｕｂｊｅｃｔｉｖｅｑｕａｌｉｔｙ，ｓｕｂｊｅｃｔｉｖｅｄｉｓｔｏｒｔｉｏｎｇｕｉｄｅｄＲＣ；ａｎａｌｙｚｅｓｔｈｅｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｒｅｐｒｅｓｅｎｔａｔｉｖｅＲＣｔｅｃｈｎｉｑｕｅｓｏｆｅａｃｈｐｈａｓｅ，ａｎｄｆｏｃｕｓｅｓｏｎｔｈｅｋｅｙａｎｄｄｉｆｆｉｃｕｌｔｉｓｓｕｅｓｏｆＲＣｎｅｅｄｅｄｔｏｂｅｆｕｒｔｈｅｒｒｅｓｅａｒｃｈｅｄ．ＴｈｅｎｓｕｍｍａｒｉｚｅｓｔｈｅＲＣｓｃｈｅｍｅｓｆｏｒｔｒａｎｓｍｉｓｓｉｏｎｏｒｉｅｎｔｅｄｅｒｒｏｒｒｅｓｉｌｉｅｎｔｖｉｄｅｏｃｏｄｉｎｇ，ｓｃａｌａｂｌｅｖｉｄｅｏｃｏｄｉｎｇ（ＳＶＣ）ａｎｄｍｕｌｔｉｐｌｅｄｅｓｃｒｉｐｔｉｏｎｃｏｄｉｎｇ（ＭＤＣ）ａｓｗｅｌｌａｓｓｔｅｒｅｏａｎｄｍｕｌｔｉ－ｖｉｅｗｖｉｄｅｏｃｏｄｉｎｇ，ａｎｄａｎａｌｙｚｅｓｆｕｒｔｈｅｒｒｅｓｅａｒｃｈｔｒｅｎｄｓ．Ｆｉｎａｌｌｙ，ｈｏｗｔｏｄｅｖｅｌｏｐｔｈｅＲＣｓｃｈｅｍｅｓｆｏｒｈｉｇｈｅｆｆｉｃｉｅｎｃｙｖｉｄｅｏｃｏｄｉｎｇ（ＨＥＶＣ）ｉｓｄｉｓｃｕｓｓｅｄ．Ｋｅｙｗｏｒｄｓ：　ｖｉｄｅｏｃｏｄｉｎｇ；ｒａｔｅｄｉｓｔｏｒｔｉｏｎｏｐｔｉｍｉｚａｔｉｏｎ；ｒａｔｅｃｏｎｔｒｏｌ；Ｈ畅２６４１　引言目前主流的Ｈ畅２６４编码标准基于预测加变换的混合框架，采用多种帧内与帧间模式和基于率失真优化（ＲａｔｅＤｉｓｔｏｒｔｉｏｎＯｐｔｉｍｉｚａｔｉｏｎ，ＲＤＯ）的模式选择等技术，获得了极高的压缩效率．下一代高性能视频编码（ＨｉｇｈＥｆ－ｆｉｃｉｅｎｃｙＶｉｄｅｏＣｏｄｉｎｇ，ＨＥＶＣ）即Ｈ畅２６５在许多编码模块中进一步改进，其压缩效率比Ｈ．２６４又提高一倍．码率控制（ＲａｔｅＣｏｎｔｒｏｌ，ＲＣ）是视频编码（ＶＣ）中的关键模块，根据各种约束（如目标码率、缓冲区、延迟、计算复杂度、信道状况等）自适应调节编码参数来规范输出码流使之适合信道带宽，并最优化视频质量．ＲＣ分两步：一是在收稿日期：２０１２－１２－２５；修回日期：２０１３－０７－０１；责任编辑：孙瑶基金项目：国家自然科学基金（Ｎｏ．６１０７１０９１，Ｎｏ．６１０７１１６６，Ｎｏ．６１０７１１６７，Ｎｏ．６１１０１１０５）；江苏省高校自然科学基金（Ｎｏ．１２ＫＪＢ５１００１９）；南邮校科研基金（Ｎｏ．ＮＹ２１２０１５，Ｎｏ．ＮＹ２１２０８３）；教育部博点基金（Ｎｏ．２０１１３２２３１２０００１）；工业与信息化部通信软科学课题（Ｎｏ．２０１１－Ｒ－７０）；江苏高校优势学科建设工程—“信息与通信工程”；江苏省自然科学青年基金（Ｎｏ．ＢＫ２０１３０８６７）第１２期２０１３年１２月电子学报ＡＣＴＡＥＬＥＣＴＲＯＮＩＣＡＳＩＮＩＣＡＶｏｌ．４１　Ｎｏ．１２Ｄｅｃ．　２０１３约束条件下为编码单元（ＢａｓｉｃＵｎｉｔ，ＢＵ）分配最优目标比特；二是根据率失真模型（ＲａｔｅＤｉｓｔｏｒｔｉｏｎＭｏｄｅｌ，ＲＤＭ）设计准确的控制技术使实际码率尽量接近目标码率．公式表述如下：ｍｉｎ１Ｎ∑Ｎｉ＝１Ｄｉ（Ｑｉ），ｓ．ｔ．∑Ｎｉ＝１Ｒｉ（Ｑｉ）尘ＲＴ（１）其中Ｑｉ为量化参数，Ｄｉ（Ｑｉ）与Ｒｉ（Ｑｉ）为第ｉ个ＢＵ的失真与码率，ＲＴ为目标码率．此有约束的最优化问题可由Ｌａｇｒａｎｇｅ乘子法转化为无约束问题，建立Ｌａｇｒａｎｇｅ代价函数，通过调节参数使代价函数最小即可，即：ｍｉｎＪ＝Ｄ＋λＲ（２）其中λ是Ｌａｇｒａｎｇｅ乘子，Ｊ是代价函数．鉴于ＲＣ对ＶＣ的重要性，近年来针对Ｈ畅２６４在各种环境下的编码与传输问题，已经提出了很多有效的ＲＣ技术．文献［１］对２００７年之前的ＲＣ技术进行了综述，但不断出现的新需求使ＲＣ的发展日新月异．本文主要对２００７年以后ＲＣ的最新发展进行总结．第２节根据控制目的将单层ＶＣ（即一个信源编码产生一个码流）的ＲＣ分为ＲＤＭ建模、考虑质量波动对主观质量的影响、以主观失真为指导的ＲＣ这３个阶段，总结各阶段有代表性的ＲＣ技术及其特点．在此基础上，第３节重点指明单层ＶＣ的ＲＣ需要进一步研究的关键和难点问题．第４节对面向传输的错误弹性编码（ＥｒｒｏｒＲｅｓｉｌｉｅｎｔＶｉｄｅｏＣｏｄｉｎｇ，ＥＲＶＣ）、可分级编码（ＳｃａｌａｂｌｅＶｉｄｅｏＣｏｄｉｎｇ，ＳＶＣ）、多描述编码（ＭｕｌｔｉｐｌｅＤｅｓｃｒｉｐｔｉｏｎＣｏｄｉｎｇ，ＭＤＣ）、以及立体与多视编码（Ｍｕｌｔｉ－ＶｉｅｗＶｉｄｅｏＣｏｄｉｎｇ，ＭＶＣ）中的ＲＣ技术进行总结，分析进一步发展趋势．第５节对ＨＥＶＣ中的ＲＣ应该如何发展进行探讨．第６节总结全文．２　单层ＶＣ中ＲＤＯ和ＲＣ研究进展２畅１　ＲＤＭ建模Ｈ畅２６４在２００３年颁布之后，由于其高效的压缩性能和网络适应性，基于Ｈ畅２６４的各种应用开始蓬勃发展，亟需准确的ＲＤＭ和高效的ＲＣ技术以精确控制码率．Ｈ畅２６４基于ＲＤＯ选择最优的编码模式，新技术的引入使得编码残差呈现出与以往标准不同的特性．因此这一阶段的主要任务在于考虑Ｈ畅２６４编码特性对残差分布准确建模，并建立准确的ＲＤＭ．目前精确控制Ｈ畅２６４的Ｉ帧及Ｐ帧输出码率的目标已基本实现．由于Ｉ帧及Ｐ帧编码特性不同，导致ＲＤＭ也不相同．下面分别对Ｉ帧及Ｐ帧的残差分布及有代表性的ＲＤＭ进行对比和分析．２．１．１　Ｐ帧残差分布及有代表性的ＲＤＭ残差ＤＣＴ系数的分布对ＲＤＭ建模非常重要，文献［２］认为ＤＣＴ系数服从Ｌａｐｌａｃｉａｎ分布并给出严格数学分析．目前Ｈ畅２６４ＲＣ中广泛使用的二次ＲＤＭ就是根据Ｌａｐｌａｃｉａｎ分布推导而来［３，４］．文献［５］发现Ｌａｐｌａｃｉａｎ分布具有指数形式，导致拖尾衰减过快，而实际ＤＣＴ系数直方图常有大量的拖尾系数，因此用Ｃａｕｃｈｙ分布对ＤＣＴ系数进行建模更准确．文献［６］直接建立Ｒ及Ｄ与ＤＣＴ系数为零的比率ρ之间的关系，也取得了准确的控制效果．基于这些统计分布提出的有代表性的ＲＤＭ及其特点总结于表１．注意，这一阶段ＲＣ的目标主要是为了精确控制Ｒ，因此ＲＤＭ常表现为Ｒ－量化步长（Ｑｓｔｅｐ）的函数关系，而Ｄ模型常用简单的Ｄ＝ｋＱｓｔｅｐ或Ｄ＝ｋＱ２ｓｔｅｐ这种形式，即认为Ｄ与Ｑｓｔｅｐ或Ｑ２ｓｔｅｐ成正比．如Ｈ畅２６４最有代表性的ＲＣ提案ＪＶＴ－Ｇ０１２［３］采用线性ＭＡＤ预测模型解决蛋鸡悖论，根据流量传输模型为ＢＵ分配目标比特，并用二次ＲＤＭ计算Ｑｓｔｅｐ，以较低的计算复杂度获得了较好的ＲＣ效果．基于ＲＤＭ的ＲＣ算法具有类似的控制框架，在此框架下很多学者提出了有效的改进机制，主要集中于ＲＤＭ的进一步改进［７］、ＢＵ目标比特的优化分配、ＢＵ的灵活划分、头码率的准确估计、缓冲区与延迟的有效管理、编码复杂度的有效测量、模型参数更新时历史数据点的有效选择等方面．表１　Ｐ帧残差分布及有代表性的ＲＤＭ残差分布文献ＲＤＭＬａｐｌａｃｉａｎ分布［３］Ｒ－Ｈ＝ａ／Ｑｓｔｅｐ＋ｂ／Ｑ２ｓｔｅｐ×ＭＡＤ［４］Ｒ－Ｈ＝Ａ×Ｑ２ｓｔｅｐ＋Ｂ×Ｑｓｔｅｐ＋Ｃ［８］Ｒ－Ｈ＝α·ＳＡＴＤ（Ｑｓｔｅｐ）／ＱｓｔｅｐＣａｕｃｈｙ分布［５］Ｒ＝ａＱ－αｓｔｅｐ，Ｄ＝ｂＱβｓｔｅｐρ域模型［６］Ｒ（ρ）＝θ×（１－ρ），Ｄ（ρ）＝σ２ｅ－α（１－ρ）２畅１畅２　Ｉ帧复杂度测量及ＲＣ编码常采用ＧＯＰ结构，大部分帧都采用Ｐ帧编码，因此Ｐ帧ＲＣ研究较多而Ｉ帧ＲＣ研究较少，但Ｉ帧作为每个ＧＯＰ的起始参考帧非常重要，有效进行Ｉ帧ＲＣ将有助于提高整个ＧＯＰ的编码质量．文献［９］采用梯度信息测量Ｉ帧复杂度，计算简单但与Ｉ帧编码特性不符，改进效果有限．文献［１０］用统计窗中所有像素与其均值的平均绝对差测量Ｉ帧复杂度，且分析４×４块是否具有水平、垂直、及左右对角线方向的条纹，若存在复杂度即设为零．此方法是想将Ｈ畅２６４帧内预测特性考虑进去，但只判断４种条纹方向及判断出条纹后复杂度即设为零与Ｈ畅２６４帧内编码特性不符，导致Ｉ帧复杂度测量仍不够准确．Ｉ帧ＲＣ要解决好３个问题：（ａ）准确的Ｉ帧复杂度４４４２电子学报２０１３年测量；（ｂ）Ｉ帧目标比特最优分配；（ｃ）准确的Ｉ帧Ｒ－Ｑ模型．针对这３个问题，文献［１１］通过边缘检测估计４×４块的预测模式和残差，用残差的平均绝对值测量Ｉ帧复杂度，之后提出一种新的Ｒ－Ｑｓｔｅｐ模型，同时考虑缓冲区和序列特性为Ｉ帧分配合适的目标比特，得到了较好的Ｉ帧ＲＣ效果，ＩＰＰＰ方式编码时序列ＰＳＮＲ波动减少了６０％以上．文献［１１］与ＪＶＴ－Ｇ０１２［３］及ＪＶＴ－Ｗ０４２对Ｍｏｂｉｌｅ序列编码的效果如图１．２畅２　考虑质量波动对主观质量的影响通过建立准确的Ｒ－Ｑ模型精确控制输出码率的目标基本完成之后，ＲＣ研究的重点开始转向在Ｒ限制下为用户提供更好的主观感受，其中最小化失真变化的ＲＣ和基于感兴趣区域（ＲＯＩ）的ＲＣ很有代表性．２畅２畅１　最小化失真变化的ＲＣ之前ＲＣ的目标都是在Ｒ限制下最小化平均失真（ＭＩＮＡＶＥ），由于视频内容的多样性这种优化策略在编码时可能产生明显的质量波动，从而影响主观感受．针对Ｒ限制下对质量平稳性要求严格的应用（如视频流），就需要将最大失真（ＭＩＮＭＡＸ）或失真方差（ＭＩＮ－ＶＡＲ）最小化，目的在于得到平滑一致的视频质量．公式表示如下：ｍｉｎ（ｍａｘｉ∈１，…，ＮＤｉ（Ｑｉ）），ｓ．ｔ．∑Ｎｉ＝１Ｒｉ（Ｑｉ）尘ＲＴ（３）如文献［１２］，为常质量应用，基于ＭＩＮＭＡＸ提出一种帧层多次编码方法，在最大失真与平均失真的控制上都好于ＪＭ算法．文献［１３］在Ｒ约束下对时域滑动窗中的帧实施ＭＩＮＶＡＲ准则，并用Ｌａｇｒａｎｇｅ乘子法进行求解，得到了一致的图像质量．文献［１４］对质量平滑和码率（缓冲区）平稳这一矛盾问题进行研究，提出自适应窗口大小机制在保持质量平滑的同时保证缓冲区在安全水平以内．２畅２畅２　基于ＲＯＩ的ＲＣ针对传统ＲＣ把图像所有区域同等看待的缺点，利用人眼对图像不同区域的关注度不同，首先检测出ＲＯＩ区域如人脸、运动目标等，之后在Ｒ限制下对ＲＯＩ细量化，对非ＲＯＩ粗量化，以保证ＲＯＩ的空时质量来优化主观感受［１５］．基于ＲＯＩ的ＲＣ在低码率应用中（如视频会话）有广泛的应用前景．难点在于：（ａ）编码之前要先检测出ＲＯＩ，准确地分割视频对象需要较高计算量而较小的计算量无法得到准确的检测效果；（ｂ）根据关注度设定经验加权系数在ＲＯＩ与非ＲＯＩ之间进行Ｒ分配和ＱＰ调整，会产生较明显的方块效应；（ｃ）最大问题在于ＲＤＭ仍以（加权）ＭＳＥ作为失真度量，其编码结果是使（加权）ＰＳＮＲ最优，与主观质量仍不完全一致．２畅３　以主观失真为指导的ＲＣＲＣ第二阶段开始考虑为用户提供更好的主观感受，但失真准则仍是客观失真．基于均方误差的峰值信噪比（ＰＳＮＲ）计算简单且物理意义明确，在视频质量评价中广泛应用，但ＰＳＮＲ与主观质量并不成正比，这是由于人类视觉系统（ＨＶＳ）对视频质量的感知是高度非线性的，以ＰＳＮＲ为指导的ＲＣ不能得到最优的主观质量．因此如何根据ＨＶＳ特性建立一种主观质量评价方法并用以指导视频编码成为一项重要的研究课题［１６，１７］．即ＲＣ第三阶段的研究重点由第一阶段Ｒ模型的精确建模（以精确控制输出码率）转到主观Ｄ模型的有效建模（以获得最优的主观Ｒ－Ｄ性能）．视频质量专家组（ＶＱＥＧ）和相关学者在这方面也做了初步研究，其中最具代表性的有基于视觉失真敏感度（ＶＤＳ）或显著度（Ｓａｌｉｅｎｃｙ）的ＲＣ、基于恰可察觉失真（ＪＮＤ）的ＲＣ和基于结构相似性（ＳＳＩＭ）的质量评价与编码方法．２畅３畅１　基于ＶＤＳ或Ｓａｌｉｅｎｃｙ的ＲＣ这类方法与基于ＲＯＩ的ＲＣ有些类似，区别在于更充分地利用ＨＶＳ特性建立ＶＤＳ或Ｓａｌｉｅｎｃｙ图，以此进行优化的Ｒ分配．相比ＲＯＩ与非ＲＯＩ两级划分，Ｒ分配更加合理，主观质量更优．如文献［１８］根据运动、纹理及空时掩模效应建立ＶＤＳ图进行Ｒ分配以优化视觉质量．文献［１９］融合运动、色彩、方向等多种特征建立Ｓａｌｉｅｎｃｙ图来指导Ｒ分配．２畅３畅２　基于ＪＮＤ的ＲＣＪＮＤ指人眼不能感知到的最大失真，即人眼对ＪＮＤ阈值以下的Ｄ不敏感．ＪＮＤ可对感知冗余有效建模，考虑了空时对比敏感度、亮度适应效应、对比度掩模效应等对主观失真建模及Ｒ调节具有很好的指导作用，如可对感知重要的区域细量化以保证质量而对感知冗余进行有效删除．文献［２０］基于多种空时视觉特性建立ＪＮＤ模型以此指导视频编码．文献［２１］根据视网膜的凹５４４２第　１２　期崔子冠：Ｈ畅２６４视频编码率失真优化和码率控制技术研究进展性（Ｆｏｖｅａｔｉｏｎ）增强ＪＮＤ提出ＦＪＮＤ模型，并用于ＭＢ层ＱＰ及λ调整．２畅３畅３　基于ＳＳＩＭ的质量评价与编码方法文献［２２］基于ＨＶＳ对结构信息更加敏感的特性提出基于块的ＳＳＩＭ测量，克服了ＰＳＮＲ基于点而忽略像素之间相关性的缺点，与主观质量非常一致且计算量较小，已被引入ＪＭ中以评价编码视频的主观质量．基于ＳＳＩＭ的质量评价及编码方法近年来得到广泛研究，但ＳＳＩＭ形式较为复杂，其与Ｒ或Ｑ之间的闭解形式很难得到，是ＳＳＩＭ用于ＶＣ的难点所在．文献［２３］提出ＳＳＩＭ失真与Ｒ存在指数关系，在ＢＵ层进行基于ＳＳＩＭ失真的最优Ｒ分配；之后将ＳＳＩＭ失真引入ＲＤＯ模式选择中，发现基于ＳＳＩＭ的Ｒ－Ｄ曲线与基于ＭＳＥ的Ｒ－Ｄ曲线相邻点处切线的坡度非常相似，使用之前关键帧的ＲＤＭ和前一编码帧的Ｒ－Ｄ数据对来自适应的预测当前帧的λ．文献［２４，２５］将ＳＳＩＭ失真引入ＲＤＯ框架后，先提出一种减少参考的ＳＳＩＭ估计模型并结合Ｒ模型提出了帧层自适应的λ，之后在ＭＢ层进一步根据运动信息和视觉速度感知的不确定性来调节λ．文献［２６，２７］首次提出ＳＳＩＭ－Ｑｓｔｅｐ存在线性关系，并结合Ｒ模型进行ＳＳＩＭ最优的ＭＢ层ＲＣ；进一步将ＳＳＩＭ引入ＲＤＯ框架，提出ＭＢ层自适应的分析型λ来更好地调节Ｒ和ＳＳＩＭ失真．相比之前算法的最大贡献在于得到了λ与Ｑｓｔｅｐ以及图像特性（复杂度）之间的解析式．文献［２６，２７］与ＪＶＴ－Ｇ０１２［３］对Ｄｅａｄｌｉｎｅ序列的编码效果如图２．３　单层ＶＣ需要进一步研究的问题（１）对场景变换（ＳＣ）的处理及ＧＯＰ变长编码．目前编码大多采用固定ＧＯＰ结构，即周期性地插入Ｉ帧而不考虑序列特性．当序列包含ＳＣ或剧烈运动时编码效率很低且质量波动较大，在低码率应用中尤其严重，如果在编码时考虑ＳＣ并自适应地插入Ｉ帧则可更好地对Ｐ帧进行预测从而提高编码性能．如文献［２８］基于ＳＣ检测提出了ＧＯＰ长度自适应的编码机制．（２）λ自适应调整．在ＭＢ层ＱＰ确定之后，Ｈ畅２６４引入λ进行ＲＤＯ模式选择，λ仅是ＱＰ的函数并控制着Ｒ与Ｄ之间的权衡．不同图像具有不同的率失真特性，根据图像内容自适应地调整λ有望获得更好的率失真性能．如文献［２９］对基于ＭＳＥ的ＲＤＯ中的λ在ＭＢ层根据编码复杂度自适应调整．文献［３０］发现λ与视频信号的Ｒ－Ｄ特性之间存在线性关系，提出一种启发式的不依赖于ＱＰ的λ计算方法，改进了编码效率．（３）多维ＲＣ．传统ＲＣ都是在Ｒ约束下调节ＱＰ来优化视频质量，而帧率与图像分辨率常作为预定值独立于ＱＰ．这类机制在高码率应用中性能较好，但在低码率应用中常导致空间质量很低甚至被动跳帧引起时域质量的大幅波动．如ＪＭ通过监测缓冲区，一旦超过阈值（缓冲区的８０％）就跳过下一帧，这种被动跳帧在以下两种情况经常发生：一是Ｉ帧编码后由于Ｒ剧增导致后续Ｐ帧被连续跳过；二是剧烈运动或ＳＣ时，由于Ｉ宏块数增加导致后续带有重要信息的帧被跳过．ＨＶＳ对低运动序列更注重空间质量而对高运动序列更注重时域连续性［３１］，因此低码率应用中可以根据序列特性和缓冲区联合调节帧率、空间分辨率和ＱＰ（即多维ＲＣ）以优化空时质量．如何准确估计跳过帧与编码帧的失真，并用以确定跳帧数目和下一编码帧的ＱＰ使局部窗中帧平均失真最小是研究难点．编码端自适应跳帧与解码端插帧相结合［３２］，以及编码端空间下采样与解码端上采样相结合［３３］来提高编码效率和解码端空时质量是今后一个重要的研究课题．（４）便于硬件实现的ＲＣ．传统ＲＣ都是基于软件实现的，由于算法的复杂性不适合硬件系统采用．但近年来随着视频电话、数字摄像机等广泛应用，亟需适合硬件实现的ＲＣ机制来提高这些设备的编码性能．便于硬件实现的ＲＣ算法［３４］需要具备以下特性：（ａ）低复杂度，考虑到计算能力和功耗；（ｂ）较小的缓冲区需求和延迟，考虑到编码实时性；（ｃ）算法设计上要便于硬件实现，比如指令级优化．（５）联合功率或复杂度ＲＤＯ（ＰＲＤＯ、ＣＲＤＯ）的ＲＣ．随着便携设备和网络技术的发展，带宽不再是限制视频通信的唯一条件，便携设备的功耗和续航能力也是设计编码算法时要考虑的关键因素之一．功耗主要来自于编码与传输两部分，编码功耗随计算复杂度单调增加，而传输功耗与压缩码流的大小成正比．因此如何在功耗或复杂度约束下最优化视频的Ｒ－Ｄ性能成为一项重要的研究课题．目前大多数研究是将功耗约束转化为计算复杂度约束，并在传统Ｒ－Ｄ分析的基础上加上功率或复杂度约束，建立统一的功率［３５］或复杂度Ｒ－Ｄ分析模型［３６］，通过调整复杂度控制参数达到功耗和Ｒ－Ｄ性能的联合最优．关键问题在于：（ａ）建立合适的功耗或计算复杂度测量方法；（ｂ）建立简单有效的ＰＲＤ或ＣＲＤ分析模型；（ｃ）对分析模型的有效求解．（６）视频流中的ＲＣ及多路复用中的ＲＣ．随着６４４２电子学报２０１３年Ｈ畅２６４在视频流和多路复用中的广泛应用，需要有效的ＲＣ算法在延迟受限的情况下进行常质量控制．文献［３７］为视频流提出一种延迟失真优化（ＤＤＯ）分析框架，以寻求延迟与失真之间的最优平衡来保证接收端连续高质量的播放．文献［３８］为多路视频在共享信道中的高效传输使用双帧技术进行码流间及帧间联合最优比特分配，以最小化总体ＭＳＥ失真．另外把编码端的Ｒ－Ｄ分析与网络参数联合优化以提供端到端的服务质量保证（ＱｏＳ）也是将来的一个研究热点．（７）视频转码的ＲＣ．转码是指码流从一个码率转换到另一个码率，或在不同编码格式之间相互转化．其中ＲＣ是视频转码中的关键问题［３９］，对码率自适应、码流串连影响重大，ＲＣ的好坏直接影响转码过程中引入的质量下降程度．４　面向传输及多视中的ＲＣ进展４畅１　ＥＲＶＣ与联合信源信道ＲＣ无线网络中如何在编码端根据丢包特性通过调节编码参数以提高码流的抗误码性能是一项重要的研究课题．Ｈ畅２６４的抗误码机制主要有：帧内ＭＢ刷新，自适应参考帧，自适应冗余图像，数据分区等．帧内ＭＢ刷新主要有随机或定期刷新、基于运动信息或视觉关注度的刷新，但这类机制没有充分考虑信源与信道的状况无法达到编码效率与抗误码性能的最优平衡．由于信源和信道的时变特性，帧内ＭＢ刷新数目和位置的选择至关重要，因为帧内ＭＢ会降低压缩效率而位置不佳将不能阻止误码传播，因此有必要建立一种针对丢包环境下的ＲＤＭ和ＲＣ机制在Ｒ－Ｄ最优意义下选择帧内刷新率与刷新位置［４０］．自适应参考帧［４１］是为了解决由于信道误码造成的编码端与解码端参考帧不匹配的问题．自适应冗余图像［４２］通过编码适当的冗余信息以减轻信道误码对解码质量的影响．数据分区可以将编码信息按照重要性分开传输，以便对重要数据实施更强的保护．联合信源信道ＲＣ与ＥＲＶＣ类似，也是基于端到端ＲＤＭ联合最优地选择编码模式和ＱＰ．文献［４３］针对丢包网络提出一种ＲＤＭ，克服了ＲＣ与误码恢复互不相关的缺点，在Ｒ限制下能充分利用信道带宽并使得信源编码与信道传输的总失真最小．文献［４４］把端到端总失真视为信源量化失真、错误传播失真和错误隐藏失真三项之和，很好地揭示了丢包环境下真正的Ｒ－Ｄ关系．无线网络鲁棒视频传输最核心的问题在于：（ａ）端到端失真的准确建模；（ｂ）在编码端准确估计解码端失真；（ｃ）用总失真指导编码参数的调整．如文献［４５］的帧层失真估计尤其考虑了Ｈ．２６４的新特性（如分像素的运动补偿、帧内预测和去块效应滤波等内插操作）对失真建模的影响．文献［４６］使用有限状态Ｍａｒｋｏｖ链对连续丢包信道中的传输失真进行建模．最近文献［４７，４８］对传输失真中的截断与误码扩散两个重要特性进行建模，并根据信源与信道特性得到了传输失真的递归计算公式，相比之前的失真模型更加准确而且计算复杂度更低．４畅２　ＳＶＣ的ＲＣＳＶＣ将视频编码成一个基本层和多个增强层，解码端根据运算能力及网络状况选择解码部分码流以获得所需的视频质量．ＳＶＣ中ＲＣ的关键问题在于根据各层之间相关性进行最优的Ｒ分配与控制［４９，５０］，难点在于：（ａ）根据不同层的特性提出更加准确的ＲＤＭ；（ｂ）不同层之间的最优Ｒ分配；（ｃ）如何保证ＳＶＣ编码质量的平稳性．４畅３　ＭＤＣ的ＲＣＭＤＣ相比ＳＶＣ的优点是每个描述均可独立解码，而ＳＶＣ中基本层一旦丢失，则增强层无用．ＭＤＣ中ＲＣ的关键问题在于根据不同的多描述方案［５１］在多个描述之间最优分配Ｒ以最小化Ｄ．目前ＭＤＣ的ＲＣ算法较少且控制效果一般，这是因为不同的ＭＤＣ方案会产生不同的编码特性，导致不同描述及其之间的Ｒ－Ｄ特性难以建模．因此ＭＤＣ的ＲＣ需要根据具体的多描述方案来分析Ｒ和Ｄ特性，如文献［５２］为基于分层次Ｂ帧的ＭＤＣ进行最优Ｒ分配以平衡编码效率和错误弹性．４畅４　立体与ＭＶＣ的ＲＣ立体与ＭＶＣ除了提供２Ｄ视频信息，还提供表现３Ｄ场景的深度或多视信息，丰富了用户体验，必将成为今后ＶＣ领域的研究热点．立体与ＭＶＣ中ＲＣ的关键问题在于２Ｄ视频与深度之间以及多个视点之间有效分配Ｒ以最优化视频的感知质量，其中深度序列编码的Ｒ－Ｄ特性和不同视点之间相关性分析与建模是ＲＣ成功的必要条件，这也是立体与ＭＶＣ中ＲＣ今后研究的热点，比如文献［５３］为分别从视点层、视频／深度层、及帧层分配Ｒ，满足了信道与缓冲区的需求；文献［５４］利用二次Ｒ模型和线性Ｄ模型对３ＤＴＶ广播的左／右视点的Ｒ进行联合控制．另外，２ＤＶＣ中基于主观质量或ＥＲＶＣ思想都可以推广到３ＤＶＣ的ＲＣ中以改进主观Ｒ－Ｄ性能与错误鲁棒性．如文献［５５］为ＭＶＣ提出基于立体视觉关注度的Ｒ分配算法．文献［５６］对ＭＶＣ在丢包网络中传输由于随机丢帧产生的信道失真进行建模．５　ＨＥＶＣ的ＲＣ针对高清视频的ＨＥＶＣ在２０１３年颁布之后，必然会在视频编码领域引发新一轮的研究热潮．但截止目前，极少有对ＨＥＶＣ中ＲＣ进行研究的文献出现．ＨＥＶＣ７４４２第　１２　期崔子冠：Ｈ畅２６４视频编码率失真优化和码率控制技术研究进展中ＲＣ研究的关键问题在于：（ａ）考虑新的编码技术对纹理信息和头信息码率所产生的影响，建立准确的纹理与非纹理ＲＤＭ来指导Ｒ的分配与控制，在准确控制Ｒ的同时提高编码Ｒ－Ｄ性能；（ｂ）引入主观失真，在一定Ｒ下通过调节ＱＰ以最优化主观质量．文献［５７］认为ＨＥＶＣ编码单元或变换单元预测与变换的深度不同，四叉树预测残差的统计特性也不同，用Ｌａｐｌａｃｉａｎ混合分布来描述残差，得到ＨＥＶＣ编码的Ｒ和Ｄ模型．文献［５８］同样基于Ｌａｐｌａｃｉａｎ分布推导出Ｒ－Ｑ与Ｄ－Ｑ模型，计算ＱＰ时同时考虑了帧间质量波动和缓冲区约束，得到了一致的视频质量．６　结论从对ＲＣ最新研究成果的分析可见，针对Ｈ畅２６４的基于客观质量的ＲＤＭ和ＲＣ研究得已较为成熟，而主观失真建模及在ＲＣ中的应用、面向无线网络的ＥＲＶＣ、面向异构网络的ＳＶＣ及ＭＤＣ中的ＲＣ、丰富用户体验的立体与ＭＶＣ中的ＲＣ、以及针对高清视频的ＨＥＶＣ中的ＲＣ研究成果较少，控制精度不够且复杂度高，将成为今后ＲＣ技术研究的重点和难点．参考文献［１］ＣｈｅｎＺＺ，ＮｇａｎＫＮ．Ｒｅｃｅｎｔａｄｖａｎｃｅｓｉｎｒａｔｅｃｏｎｔｒｏｌｆｏｒｖｉｄｅｏｃｏｄｉｎｇ［Ｊ］．ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ：ＩｍａｇｅＣｏｍｍｕｎｉｃａｔｉｏｎ，２００７，２２（１）：１９－３８．［２］ＬａｍＥ，ＧｏｏｄｍａｎＪＷ．ＡｍａｔｈｅｍａｔｉｃａｌａｎａｌｙｓｉｓｏｆｔｈｅＤＣＴｃｏｅｆｆｉｃｉｅｎｔｄｉｓｔｒｉｂｕｔｉｏｎｓｆｏｒｉｍａｇｅｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ，２０００，９（１０）：１６６１－１６６６．［３］ＬｉＺＧ，ＰａｎＦ，ＬｉｍＫＰ．ＡｄａｐｔｉｖｅｂａｓｉｃｕｎｉｔｌａｙｅｒｒａｔｅｃｏｎｔｒｏｌｆｏｒＪＶＴ［Ａ］．Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ７ｔｈＪＶＴ－Ｇ０１２Ｍｅｅｔｉｎｇ［Ｃ］．ＰａｔｔａｙａＩＩ，Ｔｈａｉｌａｎｄ：ＪＶＴ，２００３．１－３３．［４］袁武，林守勋，牛振东，等．Ｈ．２６４／ＡＶＣ码率控制优化算法［Ｊ］．计算机学报，２００８，３１（２）：３２９－３３９．ＹｕａｎＷｕ，ＬｉｎＳｈｏｕ－ｘｕｎ，ＮｉｕＺｈｅｎ－ｄｏｎｇ，ｅｔａｌ．ＥｆｆｉｃｉｅｎｔｒａｔｅｃｏｎｔｒｏｌｓｃｈｅｍｅｓｆｏｒＨ．２６４／ＡＶＣ［Ｊ］．ＣｈｉｎｅｓｅＪｏｕｒｎａｌｏｆＣｏｍ－ｐｕｔｅｒｓ，２００８，３１（２）：３２９－３３９．（ｉｎＣｈｉｎｅｓｅ）［５］ＫａｍａｃｉＮ，ＡｌｔｕｎｂａｓａｋＹ，ＭｅｒｓｅｒｅａｕＲＭ．ＦｒａｍｅｂｉｔａｌｌｏｃａｔｉｏｎｆｏｒｔｈｅＨ．２６４／ＡＶＣｖｉｄｅｏｃｏｄｅｒｖｉａＣａｕｃｈｙ－ｄｅｎｓｉｔｙ－ｂａｓｅｄｒａｔｅａｎｄｄｉｓｔｏｒｔｉｏｎｍｏｄｅｌｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２００５，１５（８）：９９４－１００６．［６］ＨｅＺ，ＭｉｔｒａＳＫ．Ｏｐｔｉｍｕｍｂｉｔａｌｌｏｃａｔｉｏｎａｎｄａｃｃｕｒａｔｅｒａｔｅｃｏｎ－ｔｒｏｌｆｏｒｖｉｄｅｏｃｏｄｉｎｇｖｉａρ－ｄｏｍａｉｎｓｏｕｒｃｅｍｏｄｅｌｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２００２，１２（１０）：８４０－８４９．［７］霍炎，李生红，荆涛．基于广义拉普拉斯分布的低时延速率控制算法［Ｊ］．电子学报，２０１０，３８（５）：１０７８－１０８３．ＨｕｏＹａｎ，ＬｉＳｈｅｎｇ－ｈｏｎｇ，ＪｉｎｇＴａｏ．Ｌｏｗ－ｄｅｌａｙｒａｔｅｃｏｎｔｒｏｌｂａｓｅｄｏｎｇｅｎｅｒａｌｉｚｅｄＬａｐｌａｃｉａｎｄｉｓｔｒｉｂｕｔｉｏｎ［Ｊ］．ＡｃｔａＥｌｅｃｔｒｏｎｉ－ｃａＳｉｎｉｃａ，２０１０，３８（５）：１０７８－１０８３．（ｉｎＣｈｉｎｅｓｅ）［８］ＫｗｏｎＤ，ＣｈｅｎＭ，ＫｕｏＣ．ＲａｔｅｃｏｎｔｒｏｌｆｏｒＨ．２６４ｖｉｄｅｏｗｉｔｈｅｎｈａｎｃｅｄｒａｔｅａｎｄｄｉｓｔｏｒｔｉｏｎｍｏｄｅｌｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２００７，１７（５）：５１７－５２９．［９］ＹａｎＢ，ＳｕｎＫ．ＪｏｉｎｔｃｏｍｐｌｅｘｉｔｙｅｓｔｉｍａｔｉｏｎｏｆＩ－ｆｒａｍｅａｎｄＰ－ｆｒａｍｅｆｏｒＨ．２６４／ＡＶＣｒａｔｅｃｏｎｔｒｏｌ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１２，２２（５）：７９０－７９８．［１０］ＬｅｅＧ，ＬｉｎＨ，ＷａｎｇＭ．Ｒａｔｅｃｏｎｔｒｏｌａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｉｎｔｒａ－ｐｉｃｔｕｒｅｃｏｍｐｌｅｘｉｔｙｆｏｒＨ．２６４／ＡＶＣ［Ｊ］．ＩＥＴＩｍａｇｅＰｒｏｃｅｓｓ－ｉｎｇ，２００９，３（１）：２６－３９．［１１］崔子冠，朱秀昌．Ｈ．２６４图像复杂度自适应的Ｉ帧码率控制算法［Ｊ］．电子与信息学报，２０１０，３２（１１）：２５４７－２５５３．ＣｕｉＺｉ－ｇｕａｎ，ＺｈｕＸｉｕ－ｃｈａｎｇ．Ｉｍａｇｅｃｏｍｐｌｅｘｉｔｙａｄａｐｔｉｖｅｉｎｔｒａ－ｆｒａｍｅｒａｔｅｃｏｎｔｒｏｌａｌｇｏｒｉｔｈｍｆｏｒＨ．２６４［Ｊ］．ＪｏｕｒｎａｌｏｆＥｌｅｃ－ｔｒｏｎｉｃｓａｎｄＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ，２０１０，３２（１１）：２５４７－２５５３．（ｉｎＣｈｉｎｅｓｅ）［１２］ＣｈｅｒｎｉａｖｓｋｙＮ，ＳｈａｖｉｔＧ，ＲｉｎｇｅｎｂｕｒｇＭＦ，ｅｔａｌ．ＭｕｌｔｉＳｔａｇｅ：ＡＭＩＮＭＡＸｂｉｔａｌｌｏｃａｔｉｏｎａｌｇｏｒｉｔｈｍｆｏｒｖｉｄｅｏｃｏｄｅｒｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈ－ｎｏｌｏｇｙ，２００７，１７（１）：５９－６７．［１３］ＬｅｅＨ，ＳｕｌｌＳ．ＡＶＢＲｖｉｄｅｏｅｎｃｏｄｉｎｇｆｏｒｌｏｃａｌｌｙｃｏｎｓｉｓｔｅｎｔｐｉｃｔｕｒｅｑｕａｌｉｔｙｗｉｔｈｓｍａｌｌｂｕｆｆｅｒｉｎｇｄｅｌａｙｕｎｄｅｒｌｉｍｉｔｅｄｂａｎｄ－ｗｉｄｔｈ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＢｒｏａｄｃａｓｔｉｎｇ，２０１２，５８（１）：４７－５６．［１４］ＸｕＬ，ＬｉＳ，ＮｇａｎＫＮ，ｅｔａｌ．Ｃｏｎｓｉｓｔｅｎｔｖｉｓｕａｌｑｕａｌｉｔｙｃｏｎｔｒｏｌｉｎｖｉｄｅｏｃｏｄｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓ－ｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１３，２３（６）：９７５－９８９．［１５］ＷｕＧ，ＦｕＹ，ＨｕａｎｇＳ，ｅｔａｌ．Ｐｅｒｃｅｐｔｕａｌｑｕａｌｉｔｙ－ｒｅｇｕｌａｂｌｅｖｉｄｅｏｃｏｄｉｎｇｓｙｓｔｅｍｗｉｔｈｒｅｇｉｏｎ－ｂａｓｅｄｒａｔｅｃｏｎｔｒｏｌｓｃｈｅｍｅ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ，２０１３，２２（６）：２２４７－２２５８．［１６］ＮａｃｃａｒｉＭ，ＰｅｒｅｉｒａＦ．ＡｄｖａｎｃｅｄＨ．２６４／ＡＶＣ－ｂａｓｅｄｐｅｒｃｅｐｔｕ－ａｌｖｉｄｅｏｃｏｄｉｎｇ：ａｒｃｈｉｔｅｃｔｕｒｅ，ｔｏｏｌ，ａｎｄａｓｓｅｓｓｍｅｎｔ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１１，２１（６）：７６６－７８２．［１７］ＷｕＧ，ＷｕＴ，ＣｈｉｅｎＳ．Ａｌｇｏｒｉｔｈｍａｎｄａｒｃｈｉｔｅｃｔｕｒｅｄｅｓｉｇｎｏｆｐｅｒｃｅｐｔｉｏｎｅｎｇｉｎｅｆｏｒｖｉｄｅｏｃｏｄｉｎｇａｐｐｌｉｃａｔｉｏｎｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＭｕｌｔｉｍｅｄｉａ，２０１１，１３（６）：１１８１－１１９４．［１８］ＴａｎｇＣＷ．Ｓｐａｔｉｏｔｅｍｐｏｒａｌｖｉｓｕａｌｃｏｎｓｉｄｅｒａｔｉｏｎｓｆｏｒｖｉｄｅｏｃｏｄ－ｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＭｕｌｔｉｍｅｄｉａ，２００７，９（２）：２３１－２３８．［１９］ＬｉＺＣ，ＱｉｎＳＹ，ＩｔｔｉＬ．Ｖｉｓｕａｌａｔｔｅｎｔｉｏｎｇｕｉｄｅｄｂｉｔａｌｌｏｃａｔｉｏｎｉｎｖｉｄｅｏｃｏｍｐｒｅｓｓｉｏｎ［Ｊ］．ＩｍａｇｅａｎｄＶｉｓｉｏｎＣｏｍｐｕｔｉｎｇ，２０１１，２９（１）：１－１４．［２０］ＷｅｉＺ，ＮｇａｎＫＮ．Ｓｐａｔｉｏ－ｔｅｍｐｏｒａｌｊｕｓｔｎｏｔｉｃｅａｂｌｅｄｉｓｔｏｒｔｉｏｎｐｒｏｆｉｌｅｆｏｒｇｒａｙｓｃａｌｅｉｍａｇｅ／ｖｉｄｅｏｉｎＤＣＴｄｏｍａｉｎ［Ｊ］．ＩＥＥＥ８４４２电子学报２０１３年ＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２００９，１９（３）：３３７－３４６．［２１］ＣｈｅｎＺＺ，ＧｕｉｌｌｅｍｏｔＣ．Ｐｅｒｃｅｐｔｕａｌｌｙ－ｆｒｉｅｎｄｌｙＨ．２６４／ＡＶＣｖｉｄｅｏｃｏｄｉｎｇｂａｓｅｄｏｎｆｏｖｅａｔｅｄｊｕｓｔ－ｎｏｔｉｃｅａｂｌｅ－ｄｉｓｔｏｒｔｉｏｎｍｏｄｅｌ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１０，２０（６）：８０６－８１９．［２２］ＷａｎｇＺ，ＢｏｖｉｋＡＣ，ＳｈｅｉｋｈＨ，ｅｔａｌ．Ｉｍａｇｅｑｕａｌｉｔｙａｓｓｅｓｓ－ｍｅｎｔ：ｆｒｏｍｅｒｒｏｒｖｉｓｉｂｉｌｉｔｙｔｏｓｔｒｕｃｔｕｒａｌｓｉｍｉｌａｒｉｔｙ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ，２００４，１３（４）：６００－６１２．［２３］ＯｕＴ，ＨｕａｎｇＹＨ，ＣｈｅｎＨＨ．ＳＳＩＭ－ｂａｓｅｄｐｅｒｃｅｐｔｕａｌｒａｔｅｃｏｎｔｒｏｌｆｏｒｖｉｄｅｏｃｏｄｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１１，２１（５）：６８２－６９１．［２４］ＷａｎｇＳＱ，ＲｅｈｍａｎＡ，ＷａｎｇＺ，ｅｔａｌ．ＳＳＩＭ－ｍｏｔｉｖａｔｅｄｒａｔｅ－ｄｉｓｔｏｒｔｉｏｎｏｐｔｉｍｉｚａｔｉｏｎｆｏｒｖｉｄｅｏｃｏｄｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１２，２２（４）：５１６－５２９．［２５］ＷａｎｇＳＱ，ＲｅｈｍａｎＡ，ＷａｎｇＺ，ｅｔａｌ．ＰｅｒｃｅｐｔｕａｌｖｉｄｅｏｃｏｄｉｎｇｂａｓｅｄｏｎＳＳＩＭ－ｉｎｓｐｉｒｅｄｄｉｖｉｓｉｖｅｎｏｒｍａｌｉｚａｔｉｏｎ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ，２０１３，２２（４）：１４１８－１４２９．［２６］崔子冠，朱秀昌．Ｈ．２６４结构相似性最优的宏块层码率控制算法［Ｊ］．电子与信息学报，２０１１，３３（６）：１３３９－１３４４．ＣｕｉＺｉ－ｇｕａｎ，ＺｈｕＸｉｕ－ｃｈａｎｇ．ＳｔｒｕｃｔｕｒａｌｓｉｍｉｌａｒｉｔｙｏｐｔｉｍａｌＭＢｌａｙｅｒｒａｔｅｃｏｎｔｒｏｌａｌｇｏｒｉｔｈｍｆｏｒＨ畅２６４［Ｊ］．ＪｏｕｒｎａｌｏｆＥｌｅｃｔｒｏｎ－ｉｃｓａｎｄＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ，２０１１，３３（６）：１３３９－１３４４．（ｉｎＣｈｉｎｅｓｅ）［２７］崔子冠，朱秀昌．基于结构相似的Ｈ．２６４主观率失真性能改进机制［Ｊ］．电子与信息学报，２０１２，３４（２）：４３３－４３９．ＣｕｉＺｉ－ｇｕａｎ，ＺｈｕＸｉｕ－ｃｈａｎｇＳｕｂｊｅｃｔｉｖｅｒａｔｅ－ｄｉｓｔｏｒｔｉｏｎｐｅｒｆｏｒ－ｍａｎｃｅｉｍｐｒｏｖｅｍｅｎｔｓｃｈｅｍｅｆｏｒＨ．２６４ｂａｓｅｄｏｎＳＳＩＭ［Ｊ］．ＪｏｕｒｎａｌｏｆＥｌｅｃｔｒｏｎｉｃｓａｎｄＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙ，２０１２，３４（２）：４３３－４３９．（ｉｎＣｈｉｎｅｓｅ）［２８］ＰａｕｌＭ，ＬｉｎＷＳ，ＬａｕＣ，ｅｔａｌ．ＥｘｐｌｏｒｅａｎｄｍｏｄｅｌｂｅｔｔｅｒＩ－ｆｒａｍｅｓｆｏｒｖｉｄｅｏｃｏｄｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１１，２１（９）：１２４２－１２５４．［２９］ＺｈａｎｇＪ，ＹｉＸＱ，ＬｉｎｇＮ，ｅｔａｌ．ＣｏｎｔｅｘｔａｄａｐｔｉｖｅＬａｇｒａｎｇｅｍｕｌｔｉｐｌｉｅｒ（ＣＡＬＭ）ｆｏｒｒａｔｅ－ｄｉｓｔｏｒｔｉｏｎｏｐｔｉｍａｌｍｏｔｉｏｎｅｓｔｉｍａ－ｔｉｏｎｉｎｖｉｄｅｏｃｏｄｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１０，２０（６）：８２０－８２８．［３０］袁武，牛振东，林守勋，等．不依赖于量化参数的视频编码控制优化技术［Ｊ］．计算机学报，２０１１，３４（８）：１５１９－１５２７．ＹｕａｎＷｕ，ＮｉｕＺｈｅｎ－ｄｏｎｇ，ＬｉｎＳｈｏｕ－ｘｕｎ，ｅｔａｌ．ＡｎａｄａｐｔａｂｌｅＱＰ－ｉｎｄｅｐｅｎｄｅｎｔａｐｐｏｒａｃｈｔｏｒａｔｅ－ｄｉｓｔｏｒｔｉｏｎｏｐｔｉｍｉｚａｔｉｏｎｆｏｒｖｉｄｅｏｃｏｄｉｎｇ［Ｊ］．ＣｈｉｎｅｓｅＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒｓ，２０１１，３４（８）：１５１９－１５２７．（ｉｎＣｈｉｎｅｓｅ）［３１］ＭａＺ，ＸｕＭ，ＯｕＹ，ｅｔａｌ．Ｍｏｄｅｌｉｎｇｏｆｒａｔｅａｎｄｐｅｒｃｅｐｔｕａｌｑｕａｌｉｔｙｏｆｃｏｍｐｒｅｓｓｅｄｖｉｄｅｏａｓｆｕｎｃｔｉｏｎｓｏｆｆｒａｍｅｒａｔｅａｎｄｑｕａｎｔｉｚａｔｉｏｎｓｔｅｐｓｉｚｅａｎｄｉｔｓａｐｐｌｉｃａｔｉｏｎｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃ－ｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１２，２２（５）：６７１－６８２．［３２］ＣｕｉＺＧ，ＧａｎＺＬ，ＺｈｕＸＣ．Ｊｏｉｎｔｓｐａｔｉａｌ－ｔｅｍｐｏｒａｌｑｕａｌｉｔｙｉｍｐｒｏｖｅｍｅｎｔｓｃｈｅｍｅｆｏｒＨ．２６４ｌｏｗｂｉｔｒａｔｅｖｉｄｅｏｃｏｄｉｎｇｖｉａａｄａｐｔｉｖｅｆｒａｍｅｓｋｉｐ［Ｊ］．ＫＳＩＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｒｎｅｔａｎｄＩｎ－ｆｏｒｍａｔｉｏｎＳｙｓｔｅｍｓ，２０１２，６（１）：４２５－４４４．［３３］ＲｈｅｅＣ，ＫｉｍＪ，ＬｅｅＨ．Ｂｉｔｒａｔｅｃｏｎｔｒｏｌｕｓｉｎｇａｈｅｕｒｉｓｔｉｃｓｐａｔｉａｌｒｅｓｏｌｕｔｉｏｎａｄｊｕｓｔｍｅｎｔｆｏｒａｒｅａｌ－ｔｉｍｅＨ．２６４／ＡＶＣｅｎｃｏｄｅｒ［Ｊ］．ＥＵＲＡＳＩＰＪｏｕｒｎａｌｏｎＡｄｖａｎｃｅｓｉｎＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，２０１２，８７：１－１２．［３４］ＫｕｏＣ，ＣｈａｎｇＬ，ＦａｎＫ，ｅｔａｌ．Ｈａｒｄｗａｒｅ／ｓｏｆｔｗａｒｅｃｏｄｅｓｉｇｎｏｆａｌｏｗ－ｃｏｓｔｒａｔｅｃｏｎｔｒｏｌｓｃｈｅｍｅｆｏｒＨ．２６４／ＡＶＣ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１０，２０（２）：２５０－２６１．［３５］ＨｅＺ，ＣｈｅｎｇＷ，ＣｈｅｎＸ．Ｅｎｅｒｇｙｍｉｎｉｍｉｚａｔｉｏｎｏｆｐｏｒｔａｂｌｅｖｉｄｅｏｃｏｍｍｕｎｉｃａｔｉｏｎｄｅｖｉｃｅｓｂａｓｅｄｏｎｐｏｗｅｒ－ｒａｔｅ－ｄｉｓｔｏｒｔｉｏｎｏｐｔｉｍｉｚａｔｉｏｎ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２００８，１８（５）：５９６－６０８．［３６］ＳｕＬ，ＬｕＹ，ＷｕＦ，ｅｔａｌ．Ｃｏｍｐｌｅｘｉｔｙ－ｃｏｎｓｔｒａｉｎｅｄＨ．２６４ｖｉｄｅｏｅｎｃｏｄｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２００９，１９（４）：１－１５．［３７］ＯｚｃｅｌｅｂｉＴ，ＴｅｋｌａｐＡＭ，ＣｉｖａｎｌａｒＭＲ．Ｄｅｌａｙ－ｄｉｓｔｏｒｔｉｏｎｏｐｔｉ－ｍｉｚａｔｉｏｎｆｏｒｃｏｎｔｅｎｔ－ａｄａｐｔｉｖｅｖｉｄｅｏｓｔｒｅａｍｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＭｕｌｔｉｍｅｄｉａ，２００７，９（４）：８２６－８３６．［３８］ＴｉｗａｒｉＭ，ＧｒｏｖｅｓＴ，ＣｏｓｍａｎＰＣ．Ｄｅｌａｙｃｏｎｓｔｒａｉｎｅｄｍｕｌｔｉ－ｐｌｅｘｉｎｇｏｆｖｉｄｅｏｓｔｒｅａｍｓｕｓｉｎｇｄｕａｌ－ｆｒａｍｅｖｉｄｅｏｃｏｄｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈ－ｎｏｌｏｇｙ，２０１０，１９（４）：１０２２－１０３５．［３９］ＸｕＬ，ＫｗｏｎｇＳ，ＷａｎｇＨＬ，ｅｔａｌ．Ａｕｎｉｖｅｒｓａｌｒａｔｅｃｏｎｔｒｏｌｓｃｈｅｍｅｆｏｒｖｉｄｅｏｔｒａｎｓｃｏｄｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒ－ｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１２，２２（４）：４８９－５０１．［４０］宋彬，蒋小兵，秦浩，等．基于Ｈ．２６４具有抗分组丢失能力的帧内刷新算法［Ｊ］．电子学报，２００９，３７（１）：２２１－２２４．ＳｏｎｇＢｉｎ，ＪｉａｎｇＸｉａｏ－ｂｉｎｇ，ＱｉｎＨａｏ，ｅｔａｌ．Ａｐａｃｋｅｔｌｏｓｓｒｅ－ｓｉｌｉｅｎｔｉｎｔｒａｒｅｆｒｅｓｈａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎＨ畅２６４［Ｊ］．ＡｃｔａＥｌｅｃ－ｔｒｏｎｉｃａＳｉｎｉｃａ，２００９，３７（１）：２２１－２２４．（ｉｎＣｈｉｎｅｓｅ）［４１］ＴｕＷ，ＳｔｅｉｎｂａｃｈＥ．Ｐｒｏｘｙ－ｂａｓｅｄｒｅｆｅｒｅｎｃｅｐｉｃｔｕｒｅｓｅｌｅｃｔｉｏｎｆｏｒｅｒｒｏｒｒｅｓｉｌｉｅｎｔｃｏｎｖｅｒｓａｔｉｏｎａｌｖｉｄｅｏｉｎｍｏｂｉｌｅｎｅｔｗｏｒｋｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈ－ｎｏｌｏｇｙ，２００９，１９（２）：１５１－１６４．［４２］ＺｈｕＣ，ＷａｎｇＹ，ＨａｎｎｕｋｓｅｌａＭ，ｅｔａｌ．Ｅｒｒｏｒｒｅｓｉｌｉｅｎｔｖｉｄｅｏｃｏｄｉｎｇｕｓｉｎｇｒｅｄｕｎｄａｎｔｐｉｃｔｕｒｅｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２００９，１９（１）：３－１４．［４３］陈川，余松煜．联合编码模式选择的码率控制算法［Ｊ］．电子学报，２００４，３２（５）：７６３－７６８．ＣｈｅｎＣｈｕａｎ，ＹｕＳｏｎｇ－ｙｕ．Ｊｏｉｎｔｃｏｄｉｎｇｍｏｄｅｓｅｌｅｃｔｉｏｎａｎｄｒａｔｅｃｏｎｔｒｏｌａｌｇｏｒｉｔｈｍ［Ｊ］．ＡｃｔａＥｌｅｃｔｒｏｎｉｃａＳｉｎｉｃａ，２００４，３２９４４２第　１２　期崔子冠：Ｈ畅２６４视频编码率失真优化和码率控制技术研究进展（５）：７６３－７６８．（ｉｎＣｈｉｎｅｓｅ）［４４］ＺｈａｎｇＹ，ＧａｏＷ，ＬｕＹ，ｅｔａｌ．Ｊｏｉｎｔｓｏｕｒｃｅ－ｃｈａｎｎｅｌｒａｔｅ－ｄｉｓｔｏｒ－ｔｉｏｎｏｐｔｉｍｉｚａｔｉｏｎｆｏｒＨ畅２６４ｖｉｄｅｏｃｏｄｉｎｇｏｖｅｒｅｒｒｏｒ－ｐｒｏｎｅｎｅｔ－ｗｏｒｋｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＭｕｌｔｉｍｅｄｉａ，２００７，９（３）：４４５－４５４．［４５］ＷａｎｇＹ，ＷｕＺ，ＢｏｙｃｅＪＭ．Ｍｏｄｅｌｉｎｇｏｆｔｒａｎｓｍｉｓｓｉｏｎ－ｌｏｓｓ－ｉｎ－ｄｕｃｅｄｄｉｓｔｏｒｔｉｏｎｉｎｄｅｃｏｄｅｄｖｉｄｅｏ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２００６，１６（６）：７１６－７３２．［４６］ＬｉＺＣ，ＣｈａｋａｒｅｓｋｉＪ，ＮｉｕＸ，ｅｔａｌ．ＭｏｄｅｌｉｎｇａｎｄａｎａｌｙｓｉｓｏｆｄｉｓｔｏｒｔｉｏｎｃａｕｓｅｄｂｙＭａｒｋｏｖ－ｍｏｄｅｌｂｕｒｓｔｐａｃｋｅｔｌｏｓｓｅｓｉｎｖｉｄｅｏｔｒａｎｓｍｉｓｓｉｏｎ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓ－ｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２００９，１９（７）：９１７－９３１．［４７］ＣｈｅｎＺＦ，ＰａｈａｌａｗａｔｔａＰＶ，ＴｏｕｒａｐｉｓＡＭ，ｅｔａｌ．Ｉｍｐｒｏｖｅｄｅｓ－ｔｉｍａｔｉｏｎｏｆｔｒａｎｓｍｉｓｓｉｏｎｄｉｓｔｏｒｔｉｏｎｆｏｒｅｒｒｏｒ－ｒｅｓｉｌｉｅｎｔｖｉｄｅｏｃｏｄ－ｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１２，２２（４）：６３６－６４７．［４８］ＣｈｅｎＺＦ，ＷｕＤＰ．Ｐｒｅｄｉｃｔｉｏｎｏｆｔｒａｎｓｍｉｓｓｉｏｎｄｉｓｔｏｒｔｉｏｎｆｏｒｗｉｒｅｌｅｓｓｖｉｄｅｏｃｏｍｍｕｎｉｃａｔｉｏｎ：Ａｎａｌｙｓｉｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃ－ｔｉｏｎｓｏｎＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ，２０１２，２１（３）：１１２３－１１３７．［４９］刘家瑛，郭宗明，ＣｈｏＹ．面向Ｈ．２６４／ＳＶＣ空域－质量域可伸缩编码的码率分配算法［Ｊ］．电子学报，２０１０，３８（９）：２１１２－２１１７．ＬｉｕＪｉａ－ｙｉｎｇ，ＧｕｏＺｏｎｇ－ｍｉｎｇ，ＣｈｏＹ．ＢｉｔａｌｌｏｃａｔｉｏｎａｌｇｏｒｉｔｈｍｉｎＨ畅２６４／ＳＶＣｓｐａｔｉａｌ－ｑｕａｌｉｔｙｗｉｔｈｄｅｐｅｎｄｅｎｔＲ－Ｄｍｏｄｅｌｉｎｇ［Ｊ］．ＡｃｔａＥｌｅｃｔｒｏｎｉｃａＳｉｎｉｃａ，２０１０，３８（９）：２１１２－２１１７．（ｉｎＣｈｉｎｅｓｅ）［５０］李晓峰，周宁，刘洪盛，等．一种基于缩减栅格算法的ＳＶＣ联合信源／信道编码方法［Ｊ］．电子学报，２０１１，３９（４）：８５９－８６４．ＬｉｕＸｉａｏ－ｆｅｎｇ，ＺｈｏｕＮｉｎｇ，ＬｉｕＨｏｎｇ－ｓｈｅｎｇ，ｅｔａｌ．Ａｊｏｉｎｔｓｏｕｒｃｅ／ｃｈａｎｎｅｌｃｏｄｉｎｇｗｉｔｈｒｅｄｕｃｅｄｔｒｅｌｌｉｓａｌｇｏｒｉｔｈｍｆｏｒｔｈｅｓｃａｌａｂｌｅｅｘｔｅｎｓｉｏｎｏｆＨ畅２６４／ＡＶＣ［Ｊ］．ＡｃｔａＥｌｅｃｔｒｏｎｉｃａＳｉｎｉ－ｃａ，２０１１，３９（４）：８５９－８６４．（ｉｎＣｈｉｎｅｓｅ）［５１］ＫａｍｎｏｏｎＮ，ＡｇｒａｆｉｏｔｉｓＤ，ＣａｎａｇａｒａｊａｈＣ．Ｆｌｅｘｉｂｌｅａｄａｐｔｉｖｅｍｕｌｔｉｐｌｅｄｅｓｃｒｉｐｔｉｏｎｃｏｄｉｎｇｆｏｒｖｉｄｅｏｔｒａｎｓｍｉｓｓｉｏｎ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１２，２２（１）：１－１１．［５２］ＴｓａｉＷ，ＹｏｕＨ．ＭｕｌｔｉｐｌｅｄｅｓｃｒｉｐｔｉｏｎｖｉｄｅｏｃｏｄｉｎｇｂａｓｅｄｏｎｈｉｅｒａｒｃｈｉｃａｌＢｐｉｃｔｕｒｅｓｕｓｉｎｇｕｎｅｑｕａｌｒｅｄｕｎｄａｎｃｙ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１２，２２（２）：３０９－３２０．［５３］ＬｉｕＹＷ，ＨｕａｎｇＱＭ，ＭａＳＷ，ｅｔａｌ．Ａｎｏｖｅｌｒａｔｅｃｏｎｔｒｏｌｔｅｃｈｎｉｑｕｅｆｏｒｍｕｌｔｉｖｉｅｗｖｉｄｅｏｐｌｕｓｄｅｐｔｈｂａｓｅｄ３Ｄｖｉｄｅｏｃｏｄ－ｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＢｒｏａｄｃａｓｔｉｎｇ，２０１１，５７（２）：５６２－５７１．［５４］ＣｈａｎｇＹ，ＫｉｍＭ．Ａｊｏｉｎｔｒａｔｅｃｏｎｔｒｏｌｓｃｈｅｍｅｉｎａｈｙｂｒｉｄｓｔｅｒｅｏｓｃｏｐｉｃｖｉｄｅｏｃｏｄｅｃｓｙｓｔｅｍｆｏｒ３ＤＴＶｂｒｏａｄｃａｓｔｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＢｒｏａｄｃａｓｔｉｎｇ，２０１３，５９（２）：２６５－２８０．［５５］ＺｈａｎｇＹ，ＪｉａｎｇＧＹ，ＹｕＭ，ｅｔａｌ．Ｓｔｅｒｅｏｓｃｏｐｉｃｖｉｓｕａｌａｔｔｅｎ－ｔｉｏｎ－ｂａｓｅｄｒｅｇｉｏｎａｌｂｉｔａｌｌｏｃａｔｉｏｎｏｐｔｉｍｉｚａｔｉｏｎｆｏｒｍｕｌｔｉｖｉｅｗｖｉｄｅｏｃｏｄｉｎｇ［Ｊ］．ＥＵＲＡＳＩＰＪｏｕｒｎａｌｏｎＡｄｖａｎｃｅｓｉｎＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，２０１０，６０：１－２４．［５６］ＺｈｏｕＹ，ＨｏｕＣＰ，ＸｉａｎｇＷ，ｅｔａｌ．Ｃｈａｎｎｅｌｄｉｓｔｏｒｔｉｏｎｍｏｄｅｌ－ｉｎｇｆｏｒｍｕｌｔｉ－ｖｉｅｗｖｉｄｅｏｔｒａｎｓｍｉｓｓｉｏｎｏｖｅｒｐａｃｋｅｔ－ｓｗｉｔｃｈｅｄｎｅｔｗｏｒｋｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓｆｏｒＶｉｄｅｏＴｅｃｈｎｏｌｏｇｙ，２０１１，２１（１１）：１６７９－１６９２．［５７］ＬｅｅＢ，ＫｉｍＭ．Ｍｏｄｅｌｉｎｇｒａｔｅｓａｎｄｄｉｓｔｏｒｔｉｏｎｓｂａｓｅｄｏｎａｍｉｘ－ｔｕｒｅｏｆＬａｐｌａｃｉａｎｄｉｓｔｒｉｂｕｔｉｏｎｓｆｏｒｉｎｔｅｒ－ｐｒｅｄｉｃｔｅｄｒｅｓｉｄｕｅｓｉｎｑｕａｄｔｒｅｅｃｏｄｉｎｇｏｆＨＥＶＣ［Ｊ］．ＩＥＥＥＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＬｅｔ－ｔｅｒｓ，２０１１，１８（１０）：５７１－５７４．［５８］ＳｅｏＣ，ＭｏｏｎＪ，ＨａｎＪ．Ｒａｔｅｃｏｎｔｒｏｌｆｏｒｃｏｎｓｉｓｔｅｎｔｏｂｊｅｃｔｉｖｅｑｕａｌｉｔｙｉｎｈｉｇｈｅｆｆｉｃｉｅｎｃｙｖｉｄｅｏｃｏｄｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ，２０１３，２２（６）：２４４２－２４５４．作者简介崔子冠　男，１９８２年１月出生于河南郑州．２０１１年获南京邮电大学工学博士学位，现为南京邮电大学通信与信息工程学院讲师，主要研究方向为视频编码与传输．Ｅ－ｍａｉｌ：ｃｕｉｚｇ＠ｎｊｕｐｔ．ｅｄｕ．ｃｎ朱秀昌　男，１９４７年８月出生于江苏丹徒．教授，博士生导师，江苏省图像处理与图像通信重点实验室主任，主要研究方向为图像处理与多媒体通信．干宗良　男，１９７９年９月出生于新疆石河子．２００７年获南京邮电大学工学博士学位，现为南京邮电大学通信与信息工程学院讲师，主要研究方向为图像处理与视频通信．０５４２电子学报２０１３年。

高清视频编解码技术的优化和改进研究

高清视频编解码技术的优化和改进研究随着高清视频在互联网上的流行，对视频编解码技术的要求也越来越高。

然而，视频编解码技术的发展并不容易。

当前，市面上的主流视频编解码技术主要是H.264、H.265以及VP9。

这三种编码技术各有优点和缺点，但都有一些需要优化和改进的方面。

一、H.264编码技术H.264是目前最广泛应用的视频编码技术之一，因为它拥有高压缩比和良好的视觉质量。

不过，随着分辨率的不断提高和网络速度的提升，H.264编码技术的缺点也渐渐暴露出来。

首先，H.264所需要的算力非常高，因为它采用了复杂的算法来提高视频的压缩率和画质。

其次，H.264格式的解码器体积非常大，这使得移动设备上播放视频时需要消耗更多的电量和资源。

为了解决这些问题，可以尝试采用一些新的技术来优化和改进H.264编码技术。

例如，可以采用更高效的算法来提高压缩率和画质，并尝试减少解码器的体积和消耗。

二、H.265编码技术H.265编码技术是目前最新的视频编码技术之一。

相比H.264，H.265具有更高的压缩率和更好的画质，可以解决H.264在高分辨率和高码率情况下的压缩问题。

不过，H.265也有其缺点。

首先，H.265格式的解码器需要更高的算力，这在移动设备上可能会导致卡顿和电量消耗增加。

其次，H.265的编码复杂度也非常高，这使得它的编码速度较慢，不利于实时性要求较高的应用。

为了解决这些问题，可以寻找更高效的视频编解码算法，并尝试通过硬件加速和其他优化技术来提高编码速度和优化移动设备上的解码器性能。

三、VP9编码技术VP9是Google开发的视频编码技术，目前在YouTube等Google产品中广泛应用。

相比于H.264和H.265，VP9通过更加高效的算法消耗更少的带宽，从而提供更好的视频体验。

它还具有更广泛的兼容性，可以应用于不同的设备和平台。

不过，VP9在优化方面也存在一些挑战。

为了获取更高的压缩率和画质，VP9对编码算法有着更高的要求，这可能需要更多的算力来实现。

超高清视频编码标准的研究与优化

超高清视频编码标准的研究与优化随着科技的不断进步和发展，我们的视野也在不断地拓展和升级。

从最初的黑白电视到如今的液晶电视、4K电视，人们的观看体验得到了很大的提升。

在视频领域，超高清视频编码标准的研究与优化正是为了进一步提高视频的画质和视觉体验。

一、超高清视频编码标准的现状目前，主流的超高清视频编码标准主要包括H.264、H.265和VP9等编码标准。

其中，H.264是最早被广泛采用的压缩标准，具有广泛的应用范围和高效的压缩率，但在超高清视频领域存在局限性；H.265相比H.264，在保证视频质量的前提下，可以进一步提高压缩效率，适合在高清视频和超高清视频的编码过程中使用，但相对来说还没有得到广泛的普及和采用；VP9则是由Google开发的一种全新的视频编码标准，适用于4K和8K超高清视频，但因为它的授权问题和设备兼容性的限制，目前大多数厂商并没有采用这种编码标准。

二、超高清视频编码标准的优化与应用为了进一步优化超高清视频的压缩效率和画质表现，人们在H.264和H.265等超高清视频编码标准的基础上进行了深入的研究和探索，通过不断地优化编码算法和加强压缩技术，取得了不小的进展。

在这个过程中，深度学习技术也被广泛应用于视频编码领域，例如Google的BPG（Better Portable Graphics）格式，通过深度学习技术，可以将图像和视频的细节再现得更为真实和逼真。

同时，随着4K和8K超高清视频的商业应用，一些高端智能电视和监视摄像头等设备的硬件性能和存储容量也得到了大幅提升，这也为视频编码带来了更多的选择和可能性。

例如，由于4K和8K视频数据量较大，采用HEVC/H.265进行编码可以有效地降低视频数据的大小，节省存储空间，同时也提高了视频的色彩深度和清晰度。

另外，一些短视频网站和应用也采用了H.265编码来实现更高质量、更小的视频。

三、超高清视频编码标准面临的挑战和展望尽管目前超高清视频编码标准的研究和优化已经取得不小的进展，但是仍然面临着一些挑战和问题。

H.264AVC编码技术研究及快速运动估计算法改进中期报告

H.264AVC编码技术研究及快速运动估计算法改进中期报告一、研究背景随着视频应用需求的不断增加，视频编码技术日益成为一个重要的领域。

作为一种先进的视频编码标准，H.264/AVC在视频压缩领域占有重要地位。

然而，由于该标准的算法复杂度较高，在实际应用中也存在一些问题，比如编码时间过长、占用计算资源过多等。

因此，对H.264/AVC编码技术进行研究和改进，尤其是针对其运动估计算法进行优化，具有重要的理论意义和应用价值。

二、研究目的和内容本次研究的目的是对H.264/AVC编码技术进行深入的探究和改进，主要内容包括以下方面：1. 改进快速运动估计算法。

在H.264/AVC标准中，运动估计是一个关键的环节。

为了实现更高效的运动估计，本次研究将对快速运动估计算法进行改进，以优化运动估计效果和计算速度。

2. 优化码率控制算法。

码率控制是视频编码中的一个重要问题，影响着视频的压缩比和视觉质量。

本次研究将对H.264/AVC标准中的码率控制算法进行优化，以提高视频质量和压缩比。

3. 提高编码效率和性能。

在H.264/AVC编码中，由于算法复杂度较高，在实际应用中常常需要大量的计算资源和时间。

本次研究将着重探索如何提高编码效率和性能，以缩短编码时间和降低计算资源的占用。

三、预期成果本次研究的预期成果主要包括以下方面：1. 提出改进的快速运动估计算法，实现更高效的运动估计和加速编码过程。

2. 优化H.264/AVC标准中的码率控制算法，提高视频质量和压缩比。

3. 实现更高效的编码速度和性能，缩短编码时间，降低计算资源占用。

四、研究进展目前，我们已经对H.264/AVC标准的相关文献进行了深入研读，并针对其中的快速运动估计算法和码率控制算法进行了一些初步探索和实验，取得了一些初步进展，同时还在进一步完善研究方案，在接下来的研究中将深入探究和优化以上几方面内容。

H.264帧内预测解码器的优化与硬件实现的开题报告

H.264帧内预测解码器的优化与硬件实现的开题报告【导言】随着高清视频流媒体服务的兴起，视频编解码技术发展越来越快，成为一个备受关注的领域。

在视频编解码技术中，H.264是当前应用最广泛的一种技术。

H.264编码器的性能得到了极大的改善，现在已经能够满足各种不同的应用场景。

但随着使用场景的扩大，解码器的性能也成为了制约应用的瓶颈之一。

因此，本文将从H.264帧内预测解码器优化和硬件实现两个方面进行研究。

【研究背景】随着高清视频应用的广泛普及，解码器的性能也成为了一个关键问题。

在目前市场上，H.264解码器很常见，但解码速度较慢的问题也时常出现。

为了解决这个问题，本文选取H.264解码器中最耗时的部分——帧内预测算法进行优化，从而提高其解码速度。

此外，为了提高优化效果，本文还对此算法进行了硬件实现，进一步提高了解码速度。

【研究内容】（1）H.264帧内预测算法的分析和优化措施在H.264解码器中，帧内预测算法是耗时最久的部分之一。

为了提高解码速度，本文将分析和优化这一算法。

具体措施包括以下几个方面：- 视频像素访问方式的优化- 提高相关系数的处理速度- 提高内存访问效率- 去除冗余计算（2）H.264解码器的硬件实现为了更好地发挥H.264解码器的性能，本文将对解码器进行硬件实现。

具体包括以下内容：- 硬件平台的选择和搭建- 系统设计与实现- 硬件解码器的优化措施【预期研究成果】通过本文的研究，期望能够实现对H.264帧内预测算法的优化和硬件实现，并提高解码速度。

同时，本文也会对优化和硬件实现的效果进行评估，以验证其实用性和可行性。

最终，本文的成果可望为H.264解码器的发展做出贡献。

【研究计划】（1）H.264帧内预测算法的分析和优化措施- 研究现有H.264解码器的实现细节，判断耗时最多的部分- 分析H.264帧内预测算法的性能瓶颈- 针对瓶颈点提出优化措施（2）H.264解码器的硬件实现- 选择硬件平台并进行搭建- 根据H.264帧内预测算法的特点设计硬件实现方案- 实现硬件解码器并进行优化（3）系统测试和性能评估- 利用不同分辨率和比特率的视频进行测试- 测试结果分析和性能评估- 根据评估结果进行调整和完善【结论】通过对H.264帧内预测解码器的优化和硬件实现，本文旨在提高其解码速度，为高清视频应用提供更好的服务。

H.264帧内预测优化方法研究的开题报告

H.264帧内预测优化方法研究的开题报告一、选题背景H.264/AVC是一种广泛应用于现代视频编码的标准。

它可以实现更高效的压缩和比特率控制，从而为视频传输和存储提供更高的图像质量和较小的存储空间。

其中，帧内预测技术是H.264/AVC的核心部分，并且占据了视频压缩过程中的重要地位。

H.264/AVC帧内预测过程中，需要使用各种不同的预测模式，以尽可能地减少帧内的冗余信息，例如空间冗余和时间冗余。

根据国内外研究发现，帧内预测方法的质量直接影响视频图像的可观性和编码效率。

因此，在H.264/AVC视频压缩领域，如何有效地提高帧内预测性能已成为一个研究重点。

二、选题目的和意义H.264/AVC帧内预测技术在视频压缩领域起着重要的作用，并广泛应用于视频监控、视频会议和视频直播等领域。

如何提高帧内预测的性能，将直接影响到视频编码的压缩效率和图像质量。

因此，本课题旨在研究H.264/AVC帧内预测优化方法，提高视频编码的压缩效率和图像质量，为视频传输、存储等应用提供更好的服务。

三、主要内容和研究方法本课题将研究H.264/AVC帧内预测优化方法，主要内容包括以下几个方面：1. 研究帧内预测算法的基本原理和各种预测模式的特点，分析其优缺点和适用范围；2. 提出一种新的帧内预测算法，通过对预测模式进行优化，实现图像质量和压缩效率的最优化，并与传统方法进行对比和验证；3. 采用评价指标，对新算法和传统方法进行性能分析和评估；4. 利用实验数据，通过计算机模拟，验证新算法的可行性和优越性。

本课题的研究方法主要包括文献调研、理论研究和实验验证。

通过文献调研，对已有的帧内预测算法进行归纳和总结，从而找出存在的问题和改进空间；通过理论研究，提出一种新的帧内预测方法，优化预测模式，提高压缩效率和图像质量；最后，利用实验数据，通过计算机模拟，验证新方法的可行性和优越性。

四、预期研究成果本课题的预期研究成果包括以下几个方面：1. 研究H.264/AVC帧内预测技术的基本原理和相关知识，形成一份较为系统的文献综述；2. 提出一种新的帧内预测算法，并与传统方法进行对比和验证，证明该算法具有更好的性能和应用前景；3. 通过实验数据，证明新算法的可行性和优越性，为视频编码领域的研究和实践提供有益的参考和借鉴。

H.264预测编码算法研究与优化的开题报告

H.264预测编码算法研究与优化的开题报告
一、选题背景及意义
随着互联网、移动通信和多媒体技术的飞速发展，视频成为人们生活中不可或缺的一部分。

H.264/AVC，也称为MPEG-4 Part 10，是目前应用最广泛的视频编码标准之一。

H.264/AVC的出现使得视频领域在图像质量、压缩比、灵活性、编码复杂度等方面得到了很大的提高。

H.264/AVC相关技术的研究和优化，不仅有助于改善视频的压缩性能和质量，还有助于降低视频通信带宽和存储空间的需求，提高视频应用的性能和体验。

二、选题内容和研究方法
本文主要针对H.264/AVC视频编码中的预测编码算法进行研究和优化，着重考虑以下方面：
1. 对H.264/AVC的预测编码算法进行详细介绍，并分析其优缺点。

2. 对H.264/AVC的预测编码算法进行优化，针对其中需要改进的部分进行深入研究。

3. 实现和比较优化算法，分别使用标准的H.264/AVC编码和改进后的算法进行编码，测试压缩率和质量提升的情况。

4. 对比分析使用不同算法进行H.264/AVC视频编码的延时、算法复杂度等实际应用问题。

本研究主要采用搜集相关文献材料、分析和比较算法的性能指标、编写程序实现算法等研究方法。

三、预期的研究成果和意义
本研究将对H.264/AVC视频编码中的预测编码算法进行详细介绍和改进，并通过实验验证改进算法的效果。

通过本研究，可以提高H.264/AVC视频编码的压缩率、图像质量和平均功率消耗，并缩小预测编码算法与标准图像视频编码器的性能差距，从而使H.264/AVC技术在实际应用中更为广泛。

新一代视频压缩编码标准H264学习心得_

新一代视频压缩编码标准H264学习心得_新一代视频压缩编码标准H264学习心得新一代视频压缩编码标准H264学习心得第一章和第二章绪论和数字视频1.一个是压缩比2.保持主观质量和客观质量信噪比〔S/N〕视频压缩可能性的根据：1.预测编码，根据帧内相关性和帧间的相关性，即找到相应的参考像素或参考帧作为预测值，已到达视频压缩编码。

2.变换编码，视频信号在能量上包含着的大部分都是直流和低频部分〔图像的平坦部分〕，少量的高频部分〔图像细节〕。

用数学变换后得到2维矢量空间，其中大部分的直流和低频是一样的，能够不必用码去表示，结果完成压缩编码视频压缩技术基本构造新一代视频压缩编码标准H264学习心得新一代视频压缩编码标准H264学习心得根据信源模型可将视频编码区分为基于波形的编码和基于内容的编码，信源模型采用“一副图像由很多像素构成〞，视频编码是基于波形的编码，其采用把预测编码和变换编码组合起来的基于块的混合编码把一副图像分割成块8x8(像素)或者16x16，然后进行压缩处理信源模型采用“一个分量有几个物体构成〞，视频编码是基于内容的编码块的编码方式在边界时会有高的预测误差和失真。

MPEG-4采用的编码方式就是既基于块的混合编码，也采用基于内容的编码方法低于15帧的视频质量不高，一般要25要30，可视频会议可取15-20帧每秒。

数字视频数值电视的优势。

数值电视的PCM原理：取样，就是在时间轴上连续变化的模拟信号变为离散量的经过。

量化取样后得到的脉冲信号在时间上是离散的，但是在赋值上空间上仍然是连续的，比方能够取3.56，3.7812344等等，我们采用四舍五入将其变为有限个值。

这种将信号幅值由连续量变为离散量的经过称为量化。

由于四舍五入参数的失真称为“量化噪音〞。

新一代视频压缩编码标准H264学习心得新一代视频压缩编码标准H264学习心得PCM编码对于量化后的信号，通常用二进制表示，这时的编码称为脉冲编码调制-即PCM编码。

论坛最近经常有人问H264的效果等问题

论坛最近经常有人问H.264的效果等问题，我实在是没时间一一做答，再者各人观点不同，干脆给出个测试报告，大家自己评价吧。

测试条件：1、赛扬1G，256MB SDRAM，Win98SE2、H.264只支持16x16、8x8、4x4模式，部分MMX优化(量化等耗时部分没有优化)3、只测试 300 kbps、500 kbps、1000 kbps、1500 kbps几种环境4、MPEG4为半点MV，H.264为1/4点MV5、I帧间隔一律为646、帧率均设置为25 Hz7、MPEG4为了提高PSNR，没有使用MMX/SSE等简化算法测试序列：A、电影中截取的250帧，含有渐亮、渐暗、场景渐渐切换、全屏横向运动等复杂环境备注：1、MPEG4编码器输出的总PSNR均值和YUV分量和的均值不同，所以我重新计算了一下，新的值比编码器给出的大约大1左右；2、H.264编码器没有码率控制，只好使用修改Qp来控制了，在实际使用中由于有码率控制，所以效果应该比我的测试结果好。

3、H.264由于是简化版本，所以其编码速度约为1 fps4、H.264的码率只能精确到整数部分，小数部分均设为0了5、为了便于比较，H.264部分增测了一些码率测试结果(均为平均值)：1、MPEG4部分视频序列A、H263量化方式：379.00 kbps: PSNR=39.767(Y=37.040, U=40.998, V=41.262) 559.22 kbps: PSNR=42.480(Y=40.432, U=43.298, V=43.709) 1073.48 kbps: PSNR=44.714(Y=42.861, U=45.415, V=45.865) 1583.01 kbps: PSNR=45.634(Y=43.598, U=46.378, V=46.926)视频序列A、MPEG4量化方式：375.12 kbps: PSNR=39.954(Y=37.059, U=41.297, V=41.505) 562.53 kbps: PSNR=42.647(Y=40.355, U=43.554, V=44.033) 1054.25 kbps: PSNR=45.140(Y=43.157, U=45.852, V=46.411) 1539.31 kbps: PSNR=46.311(Y=44.318, U=46.961, V=47.653) 2541.80 kbps: PSNR=47.082(Y=45.049, U=47.727, V=48.470)2、H.264部分视频序列A、2参考帧、CAVLC：295.00 kbps: PSNR=41.375(Y=38.805, U=42.424, V=42.894)489.00 kbps: PSNR=43.923(Y=42.187, U=44.500, V=45.081)533.00 kbps: PSNR=44.512(Y=42.664, U=45.151, V=45.720)1027.00 kbps: PSNR=46.866(Y=45.672, U=47.114, V=47.811)视频序列A、5参考帧、CAVLC：322.00 kbps: PSNR=41.855(Y=39.297, U=42.854, V=43.413)488.00 kbps: PSNR=43.896(Y=42.122, U=44.504, V=45.060)1024.00 kbps: PSNR=46.860(Y=45.650, U=47.118, V=47.813)视频序列A、2参考帧、CABAC：265.00 kbps: PSNR=41.925(Y=39.461, U=42.875, V=43.439)359.00 kbps: PSNR=43.362(Y=41.347, U=44.088, V=44.651)510.00 kbps: PSNR=44.712(Y=43.246, U=45.155, V=45.736)1015.00 kbps: PSNR=47.198(Y=46.067, U=47.406, V=48.122)视频序列A、5参考帧、CABAC：164.00 kbps: PSNR=39.635(Y=36.014, U=41.295, V=41.597)262.00 kbps: PSNR=41.855(Y=39.297, U=42.854, V=43.413)505.00 kbps: PSNR=44.722(Y=43.253, U=45.172, V=45.740)1008.00 kbps: PSNR=47.193(Y=46.050, U=47.419, V=48.110)视频序列A、1参考帧、CAVLC、2个B帧：536.00 kbps: PSNR=41.794(Y=39.420, U=42.723, V=43.239)。

H.264

H.264运动估计算法的优化研究摘要:通过对H.264中运动估计的分析,选择合适的快速搜索算法来对H.264算法进行化简,对菱形快速搜索算法、分像素的运动估计算法进行了改进,减少了H.264解码器巨大的计算量。

关键词: H.264/A VC视频压缩编码运动估计搜索算法分像素预测H.264图像编码标准是ITU-T的视频编码专家组(VCEG)和ISO的活动图像专家组(MPEG)共同制定的新一代国际编码标准。

它具有多个闪光点,如统一的VLC符号编码,高精度、多模式的位移估计,基于4×4块的整数变换,以及分层的编码语法等[1]。

这些使H.264具有很高的编码效率,可适应高图像质量和低速率应用的要求。

H.264在编码效率方面的成功是以增加复杂度为代价的,复杂的运算成为了制约其发展的因素。

如何简化H.264的计算是当今视频编码的热点问题。

为此本文提出对H.264的运动估计算法进行优化,改进算法中的不足以达到减少运算的效果。

1 整像素运动估计算法优化在视频压缩编码领域,为了减少计算复杂度并保证图像质量,通常采用简化全搜索算法运动估计的方法,因为其占用整个编码器大约80%的计算量。

为了减少搜索次数,研究人员提出了多种快速搜索方法,主要有对数搜索法(LOGS)、三步搜索法(TSS)、新三步搜索法(NTSS)、新六边形搜索法(HEXBS)、预测搜索法等。

除了矩形窗搜索模式外,还出现了菱形模式、六边形模式、十字形模式以及这些模式相结合的混合模式等[2-3]。

4T搜索算法是一种新的搜索算法,它能很好地捕捉剧烈的运动或变换的边缘部分,但是,对于平缓区,却不可避免的带来了图像信噪比的下降。

在各种算法中,菱形搜索算法(DS)的综合性比较优越。

它采用两种搜索模板:9搜索点的大模板LDSP和5搜索点的小模板SDSP。

搜索时先设定固定的阈值,再用LDSP计算。

当最小宏块误差点出现在中心点处时,将LDSP换为SDSP进行计算。

视频编解码技术与性能优化研究

视频编解码技术与性能优化研究随着智能手机、平板电脑和笔记本电脑的广泛普及，人们对高质量视频的需求越来越高。

在现代信息时代，视频成为媒体最重要的内容之一，人们不仅希望看清楚，还需要稳定、快速的视频流。

在这样的背景下，视频编解码技术相应得到了越来越多的关注。

一、视频编解码技术视频编解码技术（Video Codec）指的是用压缩技术将原始视频进行编码成压缩格式的过程，以及将压缩格式的视频解码回原始视频的过程。

目前视频编解码技术比较广泛的压缩格式有 H.264、H.265、VP9 和 AV1 等。

这些压缩格式的特点是带宽、存储、传输等资源占用较少，对于高清、全高清、4K 及以上的高清视频都能较好地进行压缩和传输。

H.264（Advanced Video Coding，AVC）是一种广泛采用的视频压缩标准，它可以实现极高的压缩比，同时保持画面清晰、色彩鲜艳。

而 H.265（High Efficiency Video Coding，HEVC）则是 H.264 的升级版，可以将视频数据流压缩至原来 H.264 的一半左右，是一种更为先进的视频压缩技术。

VP9 是一种由 Google 推出的编解码器，可以实现更高的编码效率和图像质量。

AV1 则是一个集合了多种优秀技术的视频编解码器，具有更好的压缩压缩性能和更高的图像质量。

二、视频编解码技术的性能优化在实际应用中，对于视频编解码技术的性能优化，可以从以下几个方面入手。

1. 硬件加速硬件加速是一种提高性能和效率的方案，它可以有效减少 CPU 的负担，提高数据的传输速度。

通常采用图形处理器（GPU）或数字信号处理器（DSP）来处理视频流数据，这些设备的处理效率比 CPU 高很多。

2. 多线程技术多线程技术是指将工作分解为多个独立的任务，通过多个线程同时执行，以提高系统的响应速度和处理能力。

在视频编解码技术中，可以采用多线程技术并行编解码，以提高效率。

3. 分辨率和帧率的控制分辨率是指图像的尺寸，是视频画面的清晰程度的重要指标。

H.264标准中运动估计与补偿算法的研究和改进的开题报告

H.264标准中运动估计与补偿算法的研究和改进的开题报告一、选题背景及意义随着现代信息技术的迅猛发展，视频通信和视频娱乐应用越来越普及，其中，H.264作为现今最常用的视频编码标准，被广泛应用于数字电视、网络视频、视频会议、移动通信等领域。

然而，H.264标准中的运动估计与补偿算法对编码效率和视频质量具有重要影响。

因此，对H.264标准中的运动估计与补偿算法进行研究和改进，对于提高视频编码的效率和质量具有重要意义。

二、研究内容及技术路线本文主要研究H.264标准中运动估计与补偿算法的改进，具体包括以下内容：1. 运动估计算法的分析和优化：分析现有的运动估计算法，从速度、精度、复杂度等方面进行评价，提出优化方向并进行实验验证。

2. 运动补偿算法的分析和改进：对传统的运动补偿算法进行改进，提高编码效率和视频质量。

3. 算法性能评价和比较：对比所提出算法和传统算法的编码效率和视频质量，并进行评估和比较。

技术路线：1. 研究H.264标准中的运动估计与补偿算法原理和算法优化方法。

2. 分析现有的运动估计算法，从速度、精度、复杂度等方面进行评价，并提出相应的优化方向。

3. 对传统的运动补偿算法进行改进，提高编码效率和视频质量。

4. 实验评估所提出算法和传统算法的编码效率和视频质量，并进行评估和比较。

5. 总结所得成果，探讨算法的应用前景和发展方向。

三、研究难点及解决途径运动估计与补偿算法是H.264标准中的核心技术之一，对视频编码效率和视频质量有着重要影响。

本文研究的难点主要有以下方面：1. 研究运动估计算法的改进方法，提高算法的速度和精度。

解决途径：通过对现有算法进行分析和评价，提出改进方向，优化算法实现。

2. 研究运动补偿算法的改进方法，提高编码效率和视频质量。

解决途径：对现有算法进行改进和优化，提高算法的编码效率和视频质量。

3. 研究算法的性能比较和评估方法。

解决途径：使用公认的视频质量评估标准，如PSNR、SSIM等，对所提出的算法和传统算法进行性能比较和评估。