h.264标准的特点及应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H.264标准的特点及应用
随着人类精神需求和空间需求的提升,人们不再满足面对面的语言交流,空间距离的增加导致人们面对面的语言交流变得越来越少,人们更需要在时空中交流与交往。
当传统的交流方式难以实现时,更需要视觉、感观以及信息交流。
正因为如此,促进了卫星通信、微波通信、有线/无线传输技术的发展,也推动信息压缩技术和宽带传输技术,同时推动了安防业的迅猛发展。
视频信息传输和视频通讯的猛增,给视频压缩技术带来了很大挑战。
无论是互联网还是无线网络,都需要一种新型的压缩算法,新算法要求高压缩比,且能适应不同的网络环境。
以较小的失真、较高的压缩比、更小的花费、较低的码率在信道中传递视频,进行多媒体通信是今后视频压缩技术研究的一个方向。
H.264,又称MPEG-4part10,也称AVC(AdvancedVideoCoding),是一个数字视频压缩标准,由
VCEG(ITU-TVideoCodingExpertsGroup)和MPEG(ISO/IECMovingPictureExpertsGroup)联合组成的
JVT(JointVideoTeam)于2003年3月正式发布[1,2]。
H.264标准的主要目标就是在同等保真条件下,提高编码效率。
这是一对矛盾,既然要求图像不失真,则图像传输的比特数就大,在网络带宽一定的情况下,图像信号传输的速度就快,因此,只有提高编码效率才能实现。
H.264的源起
在以往众多的视频编码算法中,被广泛认可并应用于实际的是ISO/IEC制定的MPEG-X和ITU-T制定的H.26x两大系列视频编码国际标准。
H.261是早期的编码标准,主要是规范ISDN网上的会议电视和可视对讲。
它采用的是可减少时间冗余的帧间预测和减少空间冗余的DCT变换的混合编码方法,以及ISDN信道匹配,其输出码率是P×64kbit/s。
P较小时,传输清晰度不太高的图像;P较大时,可以传输清晰度较好的会议电视图像。
H.263是低码率图像压缩标准,在技术上是H.261的改进和扩充,且支持码率小于64kbit/s的应用。
后期263+、263++已能支持全码率应用,支持众多图像,可看出,其支持多格式图像信息传输,如Sub-QCIF、QCIF、CIF、4CIF、16CIF等格式。
MPEG-1标准的码率为1.2mbit/s,可实现30帧/sCIF(352×288)图像传输,它与H.261和H.263相似,也采用运动补偿的帧间预测、二维DCT及VLC游程编码等措施。
此外还引入帧内帧(I)、预测帧(P)、双向预测帧(B)和直流帧(D)等概念,进一步提高了编码效率。
在MPEG-1的基础上,MPEG-2将针对提高分辨率、兼容数字电视方面做一些改进。
从编码方面知,MPEG-4标准编码技术是简单档次(SimpleProfile),比如Microsoft的WindowsMediaPlayer就是这种档次的媒体系统。
这种传统的编码技术因为基于对象编码的难点就是对象的提取,所以影响实用进程。
从传输方面分析,目前流行的基于MPEG-4的流媒体技术其本质上没有采用14496-6所提出的传输多媒体集成框架(DMLF),而是根据IEIF提出的传输建议来实现的,还不成熟,目前可实际应用的编码技术仍然是基于帧编码的技术。
H.261、H.263、MPEG-1/2/4都是在尽可能低的码率(存储容量)下获得尽可能好的图像质量。
目前,H.264标准被广泛应用于有线/无线视频远程监控、网络交互媒体、数字电视及视频会议等等。
H.264的关键技术及优势
H.264是基于帧编码的技术,和以前的标准一样也是采用DPCM加变换编码的混合编码模式。
但它采用“回归基本”的简洁设计,不用众多的选项,可获得比H.263++好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;基于系统是开放的,H.264的应用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需求。
H.264标准采用的关键技术有帧内预测、帧间预测、整数DCT变换、熵编码(CAVLC和CABAC)等。
(1)帧内预测
H.264在帧内预测的实现上相对于以往标准有明显的改进,规定4种16×16、9种8×8、9种4×4和4种色度8×8的预测模式,允许使用左侧和上侧像素点进行预测的方法,可以明显提高在空间域上相似性很高的图像帧内压缩效率。
(2)帧间预测
相比于帧内预测是利用空间相关性去除冗余信息,帧间预测是利用时间相关性来去除冗余信息。
其基本思想是:在选取的块匹配模式下,通过参考帧图像中的块和运动估计求得的最优运动矢量共同来得到当前帧图像中相应块的参考值。
一般情况下进行预测的基本单元是宏块(MacroBlock,MB),即一个宏块对应一个运动矢量。
H.264视频编码标准定义了7种块划分模式,目的是为了做到更为精确的块匹配和更好的图像质量。
(3)整数DCT变换
相对于以往的数字视频编码标准,H.264首次引入了整数变换的实现方式,包括4×4和8×8两种自适应的变换方法。
整数变换的引入,一方面可以大大降低H.264实现的功耗,另一方面由于整数变换没有以往标准中浮点运算带来的精度损失问题,可以更大程度提高残差变化后的解码鲁棒性。
(4)熵编码
H.264的熵编码主要包含两部分:一是针对语法元素的熵编码,包括对参数信息、宏块模式信息、预测矢量信息等,使用的是哥伦布指数编码方法(Exp-Golomb),这种方法能够对高概率出现的低数值系数使用最少的比特数,根据概率最大化得到压缩参数信息;二是针对量化后残差系数的熵编码方法,有CAVLC和CABAC两种。
其中CAVLC是一种低复杂度,基于上下文自适应的熵编码方法,其系数的比特数设计是根据经验统计的概率分布情况对H.264系数进行码表设计,应用时根据实际的系数分布状况进行上下文关联查表编码。
而CABAC是一种基于内容的算术编码方法,复杂度比CAVLC更高,压缩效率也比CAVLC更高。
H.264的优势
H.264标准中的优秀之处,如帧内、帧间预测技术,统一的VLC符号编码,高精度、多模式的位移估计,整数变换编码,分层的编码语法,以及先进的量化处理和滤波处理,它既保留了以往压缩技术的优点和精华,又具有其它压缩技术无法比拟的许多优点。
H.264标准最大的优势是具有很高的数据压缩比,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是传统MPEG-4的1.5~2倍。
H.264标准的主要优点有[4,5]:
一、低码率:和MPEG-2及MPEG-4ASP等压缩技术相比,在同等图像质量下,采用H.264技术压缩后的数据量只有MPEG-2的1/8,MPEG-4的1/3。
显然,H.264压缩技术的采用将大大节省用户的下载时间和数据流量收费。
二、高质量的图像:H.264在所有码率下都能持续提供较高的视频质量。
三、对信道时延的适应性较强:H.264能工作在低延时模式以适应实时通信的应用(如视频会议),同时又能很好地工作在没有延时限制的应用,如视频存储和以服务器为基础的视频流式应用。
四、容错能力强:H.264提供了解决在不稳定网络环境下容易发生的丢包等错误的必要工具。
五、网络友好性:H.264提供了网络抽象层(NetworkAbstractionLayer),使得H.264的文件能容易地在不同网络上传输(例如互联网、CDMA、GPRS、WCDMA、CDMA2000等)。
高性能DSP对H.264的贡献
由于不断推出有高性能的芯片,所以算法不断与高性能芯片的结合是必然的。
DSP芯片,全称是数字信号处理器,是一种具有特殊结构的微处理器,它有处理能力强、开发周期短、用户开发自由度大等特点,被越来越多地应用于视频压缩领域。
美国TI公司有很丰富的经验,是业界的领导者,产品系列有C20x,24×5x,54x,62x,64x定点DSP和C3x,4x,67xx等浮点DSP。
DSP芯片的内部采用程序和数据分开的哈佛结构[6],可以用来快速地实现各种数字信号处理算法。
DSP芯片与通用微处理器相比,主要区别在于它的应用强调某方面的计算功能,并降低相应的费用。
Philips为MPEG、H.264设计了高清类消费产品,围绕数字图像处理常用算法进行改进,但系统不稳定,无法进行算法的升级与更新,因而很难应用于其它领域。
而DSP具有高性价比和极高的运算速度等优势,因此被广泛应用。
DSP分为定点DSP和浮点DSP,相对来说浮点DSP更具有优势,其动态范围要大很多。
定点DSP的字长每增加1bit,动态范围扩大6dB,16bit 字长的动态范围为96dB,这时就必须时刻关注溢出的发生。
而32bit浮点DSP的动态范围可以作到1536dB,这不仅大大扩大了动态范围,提高了运算精度,还大大节省了运算时间和存储空间。
因此,用浮点DSP实现对H.264算法的升级具有一定的优势,这也成为当今视频行业的热点技术之一。
H.264的主要应用领域和未来发展
视频监控是H.264部署的重要方向之一,这得益于H.264强大的压缩能力、通用性,以及对网络性能的容忍能力。
H.264的应用领域极为宽泛,视频监控只是其主要的应用方向之一,而不能视作主体方向。
可以说,当前所有的视频应用都可以通过H.264获得高质量的实现,例如数字电视广播、高清电视、在线视频的存储和点播、3G视频电话等等。
然而,H.264中采用的编码技术复杂度很高,与以往编码技术相比,高出了几倍甚至几十倍,严重限制了该技术的应用和推广。
特别在一些硬件资源受限和实时性要求比较高的嵌入式应用中更是如此。
因此,在保证数据压缩比和图像质量的前提下,如何最大限度降低算法的复杂度成为H.264应用前景的关键所在。
总体而言,H.264标准被视作目前视频编解码应用的最佳实现之一,被普遍认为是具有竞争力的标准。
H.264的应用至少能够促进以下几个方面的发展[7]:
1.视频监控的全IP化和高清化;
2.高清摄像机市场的发展;
3.蓝光DVD及上下游硬件设备的发展;
4.局域网容量需求的上升,以及由此带动的网络存储容量升级;
5.数字电视、IPTV发展的提速,以及上下游产品和内容源质量提升;
6.网络带宽的进一步升级等。
结束语H.264作为新一代视频编码标准,具有低码率、高图像质量、对信道时延适应性强、容错能力强、良好的网络友好性等优点。
在相同图像质量的情况下,其可以比H.263及传统MPEG-4节省一半的码率,但其高压缩率是以高编码复杂度为代价的,如果不降低编码时耗,很难在实时视频通信中得到广泛的应用。
因此,下一代数字视频编码标准H.265的提出是必然的,其目标是在保证视频质量及码率的前提下尽可能地降低复杂度,避免海量存储及海量信息检索难度,这也将是视频领域未来的重点研究方向。