H264快速运动估计算法的改进
H.264与mpeg4比较

H.264与mpeg4比较JVT(Joint Video Team,视频联合工作组)于2001年12月在泰国Pattaya成立。
它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。
JVT的工作目标是制定一个新的视频编码标准,以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。
目前JVT的工作已被ITU-T接纳,新的视频压缩编码标准称为H.264标准,该标准也被ISO接纳,称为AVC(Advanced Video Coding)标准,是MPEG-4的第10部分。
H.264标准可分为三档:基本档次(其简单版本,应用面广);主要档次(采用了多项提高图像质量和增加压缩比的技术措施,可用于SDTV、HDTV 和DVD等);扩展档次(可用于各种网络的视频流传输)。
H.264不仅比H.263和MPEG-4节约了50%的码率,而且对网络传输具有更好的支持功能。
它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。
H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。
H.264支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。
H.264能适应于不同网络中的视频传输,网络亲和性好。
一、H.264视频压缩系统H.264标准压缩系统由视频编码层(VCL)和网络提取层(Network Abstraction Layer,NAL)两部分组成。
VCL中包括VCL编码器与VCL解码器,主要功能是视频数据压缩编码和解码,它包括运动补偿、变换编码、熵编码等压缩单元。
NAL则用于为VCL提供一个与网络无关的统一接口,它负责对视频数据进行封装打包后使其在网络中传送,它采用统一的数据格式,包括单个字节的包头信息、多个字节的视频数据与组帧、逻辑信道信令、定时信息、序列结束信号等。
包头中包含存储标志和类型标志。
存储标志用于指示当前数据不属于被参考的帧。
类型标志用于指示图像数据的类型。
H264详解

h.264详解:什么是H.264编码H.264是什么格式2009-04-24 12:53一、H.264与其他标准的比较1.1在画质上H.264概述随着市场的需求,在尽可能低的存储情况下获得好的图像质量和低带宽图像快速传输已成为视频压缩的两大难题。
为此IEO/IEC/和ITU-T两大国际标准化组织联手制定了新一代视频压缩标准H.264。
1.2在编码上H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。
但它采用“回归基本”的简洁设计,不用众多的选项,获得比MEPG-4好得多的压缩性能;H.264加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误友和丢包的处理;H.264应用目标范围较宽,可以满足不同速率、不同解析度以及不同传输(存储)场合的需求。
1.3在技术上H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4块的整数变换、分层的编码语法等。
这些措施使得H.264得算法具有很高的编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。
H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。
1.4在传输上H.264能以较低的数据速率传送基于联网协议(IP)的视频流,在视频质量、压缩效率和数据包恢复丢失等方面,超越了现有的MPEG-2、MPEG-4和H.26x视频通讯标准,更适合窄带传输。
1.5在算法上MPEG-1标准视频编码部分的基本得法与H.261/H.263相似,也采用运动补偿的帧间预测、二维DCT、VLC游程编码等措施。
此外还引入了帧内帧(I)、预测帧(P)、双向预测帧(B)和直流帧(D)等概念,进一步提高了编码效率。
在MPEG-1的基础上,MPEG-2标准在提高图像分辨率、兼容数字电视等方面做了一些改进,例如它的运动适量的精度为半像素;在编码运算中(如运动估计和DCT)区分“帧”和“场”;引入了编码的可分级性技术,如空间可分级性、时间可分级性和信噪比可分级性等。
H.264和x264的联系和区别

H.264随着HDTV的兴起,H.264这个规范频频出现在我们眼前,HD-DVD和蓝光DVD均计划采用这一标准进行节目制作。
而且自2005年下半年以来,无论是NVIDIA还是ATI都把支持H.264硬件解码加速作为自己最值得夸耀的视频技术。
H.264到底是何方“神圣”呢?什么是H.264?H.264是一种高性能的视频编解码技术。
目前国际上制定视频编解码技术的组织有两个,一个是“国际电联(ITU-T)”,它制定的标准有H.261、H.263、H.263+等,另一个是“国际标准化组织(ISO)”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。
而H.264则是由两个组织联合组建的联合视频组(JVT)共同制定的新数字视频编码标准,所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高级视频编码(Advanced Video Coding,AVC),而且它将成为MPEG-4标准的第10部分。
因此,不论是MPEG-4 AVC、MPEG-4 Part 10,还是ISO/IEC 14496-10,都是指H.264。
H.264最大的优势是具有很高的数据压缩比率,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。
举个例子,原始文件的大小如果为88GB,采用MPEG-2压缩标准压缩后变成3.5GB,压缩比为25∶1,而采用H.264压缩标准压缩后变为879MB,从88GB到879MB,H.264的压缩比达到惊人的102∶1!H.264为什么有那么高的压缩比?低码率(Low Bit Rate)起了重要的作用,和MPEG-2和MPEG-4 ASP等压缩技术相比,H.264压缩技术将大大节省用户的下载时间和数据流量收费。
尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。
H.264算法的优势H.264是在MPEG-4技术的基础之上建立起来的,其编解码流程主要包括5个部分:帧间和帧内预测(Estimation)、变换(Transform)和反变换、量化(Quantization)和反量化、环路滤波(Loop Filter)、熵编码(Entropy Coding)。
新一代的视频编码标准H.264

新一代的视频编码标准H.264文 / 摘要:H.264是国际电联最新通过的新一代甚低码率视频编码标准。
本文旨在阐述H.264视频编码标准的关键技术,并介绍了其在视频会议中的应用。
关键词:H.264 视频编码多帧预测视频会议一、引言ITU-T和ISO/IEC JTC1是目前国际上制定视频编码标准的正式组织,ITU-T的标准称之为建议,并命名为H.26x 系列,比如H.261、H.263等。
ISO/IEC的标准称为MPEG-x,比如MPEG-1、MPEG-2、MPEG-4等。
H.26x系列标准主要用于实时视频通信,比如视频会议、可视电话等;MPEG系列标准主要用于视频存储(DVD) 、视频广播和视频流媒体(如基于Internet、 DSL的视频,无线视频等等)。
除了联合开发H.262/MPEG-2标准外,大多数情况下,这两个组织独立制定相关标准。
自1997年,ITU-T VCEG与ISO/IEC MPEG再次合作,成立了Joint Video Team (JVT),致力于开发新一代的视频编码标准H.264。
1998年1月,开始草案征集;1999年9月,完成了第一个草案;2001年5月,制定了其测试模式TML-8;2002年6月,JVT第5次会议通过了H.264的FCD板;2002年12月,ITU-T 在日本的会议上正式通过了H.264标准,并于2003年5月正式公布了该标准。
国际电信联盟将该系统命名为H.264/AVC,国际标准化组织和国际电工委员会将其称为14496-10/MPEG-4 AVC。
二、H.264标准概述H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。
但它采用“回归基本”的简洁设计,不用众多的选项,获得比H.263++好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需求。
H.264编码技术简介.

H.264编码技术简介摘要:本文介绍了H.264编码基本概况,技术特点,并与其他标准进行了比较。
简单介绍了H.264视频编码标准的几个关键技术,并针对目前H.264在监控领域的应用做了讲解。
目录摘要: (1)一.引言 (2)二. H.264视频编码基本概况 (2)2.1 什么是H.264编码? (2)2.2 720P H.264高清成市场主流 (2)2.3 H.264 视频编码标准状况 (2)2.4 H.264 视频编码技术先进性 (3)2.5 H.264的核心竞争力是什么? (5)2.6 Main Profile (6)三、H.264与其他标准的比较 (6)3.1H.264与其他标准的比较 (6)3.2 H.264的技术特点 (8)3.2.1 分层设计 (8)3.2.2 高精度、多模式运动设计 (8)3.2.3 帧内预测功能 (8)3.2.4 4×4块的整数变换 (8)3.2.5 统一的VLC (8)3.3 H.264的主要特点 (9)四、关键技术 (10)五、H.264在监控的应用 (12)5.1 TOYA SDVR 7IV 系统简介 (12)5.2 TOYA SDVR 7IV 系统主要特点 (12)5.3 主要技术规格 (13)5.4 系统功能 (13)5.5 TOYA SDVR 7IV系统应用 (13)六、H.264的总体优缺点 (14)七、小结 (15)八、参考文献 (16)一.引言随着社会的不断进步和多媒体信息技术的发展,人们对信息的需求越来越丰富,方便、快捷、灵活地通过语音、数据、图像与视频等方式进行多媒体通信已成不可或缺的工具。
其中视觉信息给人们直观、生动的形象,因此图像与视频的传输更受到广泛的关注。
然而,视频数据具有庞大的数据量,以普通的25帧每秒,CIF格式(分辨率为352×288)的视频图像为例,一秒钟的原始视频数据速率高达3.8M字节。
不对视频信号进行压缩根本无法实时传输如此庞大的数据量,因此,视频压缩技术成为研究热点。
基于结构调整的H.264环路滤波器快速DSP实现

基于结构调整的H .264环路滤波器快速DSP 实现张 鹏1,曹铁勇2,王 耿1,庞高杰3(1.解放军理工大学通信工程学院研究生4队,江苏南京210007;2.解放军理工大学指挥自动化学院信息作战系,江苏南京210007;3.总参谋部陆航部通信站,北京101114)摘 要:文章首先介绍了H .264/AV C [1]视频编码框架下的环路滤波算法和滤波器结构,然后以T M S 320DM 642DSP 为平台,在调整环路滤波器结构的基础上,综合运用各种底层代码优化技术,用线性汇编语言实现环路滤波器的核心算法,提升了环路滤波器的效率。
关键词:新一代视频压缩编码标准;环路滤波;数字信号处理芯片;优化与实现中图分类号:T P 391文献标识码:B 文章编号:CN 32-1289(2010)04-0046-06Fast Realization of Loop Filter in H .264Based on TMS 320DM 642ZH AN G Peng 1,CA O T ie -y ong 2,W AN G Geng 1,PA N G Gao -j ie 3(1.Po stgr adua te team 4ICE ,PL A U ST ,N anjing 210007,China ;2.D epar tment o f Infor matio n Operat ion Studies ICA ,PL A U ST ,N anjing 210007,China ;municatio n Statio n of A r my A viatio n Co mmand ,PL A Gener al St uff Headquar ters ,Beijing 101114,China )Abstract :The architecture of the lo op filter was firstly described to gether with its algo rith-mic realizatio n under the framew ork of H .264/AVC .T hen thro ug h adjusting band order of thefilter operation,the co re algor ithm o f loop filter w as realized by using line assembly w ith severaloptim ization technolo gies based on T MS 320DM 642DSP .After conducting optimization ,the effi-ciency of the optimized loop filter w as impr oved remarkably.Key words :H.264/AVC;lo op filter;TM S320DM 642DSP;optim izatio n and realizatio n在H .264/AVC 视频编码标准框架下,编解码器反变换量化后图像会出现方块效应。
H.264视频编码标准分析和算法优化

H.264编码标准的分析和算法优化一、研究背景:随着社会的不断进步和多媒体信息技术的发展,人们对信息的需求越来越丰富,方便、快捷、灵活地通过语音、数据、图像与视频等方式进行多媒体通信已成不可或缺的工具。
其中视觉信息给人们直观、生动的形象,因此图像与视频的传输更受到广泛的关注。
然而,视频数据具有庞大的数据量,以普通的25帧每秒,CIF格式(分辨率为352×288)的视频图像为例,一秒钟的原始视频数据速率高达3.8M字节。
不对视频信号进行压缩根本无法实时传输如此庞大的数据量,因此,视频压缩技术成为研究热点。
随着近几年来视频图像传输领域的不断扩展,以往的标准己经难于适应不同信道的传输特征及新兴的应用环境。
为此,ISO/IEC&ITU-T共同开发了最新视频编码标准H.264/AVC。
相对以前的视频编码标准,H.264集成了许多新的视频压缩技术,具有更高的压缩效率和图像质量。
在同等的图像质量条件下,H.264的数据压缩比是应用于当前DVD系统MPEG-2的2~3倍,比MPEG-4高1.5~2倍,并且具有更好的网络友好性。
但是H.264高压缩比的代价是编码器计算复杂度大幅度地提高。
因此在保持编码效率几乎不变的同时尽可能提高编码速度是H.264/AVC视频编码标准能否得到广泛应用的关键。
在上述研究背景下,本文深入探讨了H.264/AVC标准,分析了编码器主要耗时模块的工作原理,提出三种降低H.264/AVC高计算复杂度的优化算法――快速帧内预测模式选择算法、快速帧间预测模式选择算法以及快速运动估计算法。
实验结果表明:本文所提快速算法都可大幅度地降低H.264编码器的计算复杂度,并且保持基本不变的编码效率。
二、新一代视频编码标准H.264简介:编码标准演进过程:H.261 MPEG-1 MPEG-2 H.263 MPEG-4从视频编码标准的发展历程来看,视频编码标准都有一个不断追求的目标:在尽可能低的码率(或存储容量)下获得尽可能好的图像质量。
H264 运动估计算法在 Imagine 流处理器上的加速实现

发表在计算机科学与工程2006年第28卷9期H.264运动估计算法在Imagine流处理器上的加速实现Accelerated Implementation of H.264 Motion Estimation Algorithm on Imagine Stream Processor 李海燕1,张春元,文梅,伍楠,李礼,荀长庆LI Hai-yan, ZHANG Chun-yuan, WEN Mei, WU Nan, LI Li, XUN Chang-qing(国防科技大学计算机学院,湖南长沙 410073)(School of Computer Science, National University of Defense Technology,Changsha 410073, China)摘要:Imagine是一款媒体处理的流体系结构芯片,它提供三级带宽层次,能够充分开发数据局域性和并行性,获得很高的性能。
H.264是目前最新的数字视频编码标准,它性能优越却计算复杂。
并且,视频图像具有自然的流特性,空间局域性很好而时间相关性也有限。
因此,我们认为H.264编解码过程能够利用流处理来提高其性能。
本文将H.264编码中耗时较大的运动估计算法映射在Imagine模拟平台上,实验结果表明,QCIF图像编码效率可达438fps,远高于实时要求。
与V1304 H.264编码器的25fps相比,加速比达到17.5倍,流处理的加速效果是非常明显的。
由此证明,H.264是适于Imagine实现的。
Abstract: Imagine is a stream-based prototype chip designed for media processing. It uses a three-level bandwidth hierarchy to exploit available parallelism and data locality. It has good performance in media processing. H.264 is the newest digital video coding standard. It can achieve high coding efficiency at the cost of complex computation. In addition, video pictures have natural stream features, such as good special locality and limited temporal dependency. So it is thought that H.264 can increase its coding efficiency by stream processing. An accelerated implementation of motion estimation, which is the most time-consuming part in H.264 coding framework, on Imagine stream processor is presented in this paper. Experimental results show that the coding efficiency for QCIF format can be up to 438fps and meet real-time need. Compared with V1304 H.264 encoder, the speedup rate is 17.5x. The accelerated effect of stream processing is obvious. It proves that H.264 coding is suitable for implementation on Imagine.关键词:Imagine流处理器;H.264视频编码;运动估计Key words: Imagine stream processor; H.264 video coding; motion estimation1引言Imagine流处理器是Stanford大学于2002年4月研制成功的原型芯片,我们对其流体系结构进行了深入研究[1,2]。
H.264中SKIP和帧内模式的快速判断算法

H.264中SKIP和帧内模式的快速判断算法H.264中SKIP和帧内模式的快速判断算法摘要:随着多媒体数据的广泛应用,H.264编码标准成为了当前最为先进的视频压缩标准之一。
其中,SKIP和帧内模式是H.264编码过程中非常重要且常用的两种模式。
本文针对H.264编码中SKIP和帧内模式的快速判断算法进行了研究和分析,并提出了一种基于特征优化的算法,以提高编码效率和降低计算复杂度。
1. 引言随着网络带宽的提升和移动设备的普及,人们对于高质量视频的需求日益增长。
为了满足这一需求,H.264编码标准应运而生。
H.264通过采用多种编码策略和技术,实现了卓越的压缩性能和视频质量,成为当前最为先进和广泛应用的视频压缩标准之一。
2. H.264编码中的SKIP和帧内模式SKIP和帧内模式是H.264编码中两种常用且重要的模式。
SKIP模式用于跳过对当前宏块的编码过程,直接将参考帧中的宏块进行复制。
这种模式适用于宏块中没有明显运动或者运动矢量难以获取的情况,能够有效地降低编码复杂度。
而帧内模式则是对当前宏块进行帧内预测,通过分析当前宏块周围的像素值来预测当前宏块的像素值,从而实现高效的编码。
3. SKIP和帧内模式快速判断算法在H.264编码中,为了选择合适的编码模式,需要对每个宏块进行判断和选择。
然而,传统的判断方法往往需要较高的计算复杂度,降低了编码效率。
因此,提出一种快速判断算法对于提高编码效率和降低计算复杂度具有重要意义。
3.1 特征提取在提出的算法中,首先对每个宏块进行特征提取。
通过分析宏块中像素的变化情况、纹理复杂度和运动矢量的大小等特征,可以有效地判断宏块适合使用SKIP模式还是帧内模式。
3.2 特征优化在特征提取的基础上,进一步对提取的特征进行优化。
通过对特征进行加权和标准化处理,可以得到更加准确和可靠的判断结果。
同时,可以根据编码的实际需求和场景对特征进行灵活调整,以提高算法的适用性和鲁棒性。
基于H264AVC视频解码器的VLSI设计与研究

AVS(Advanced Video System)是基于我国创新技术和部分公开技术的自主标准,该标准实现了编码增益、运算复杂度与当前VLSI设计技术和制造工艺之间比较好的平衡。为了达到良好的编码增益,一些由于实现复杂度太高而在过去的标准中不予考虑的工具在AVS新标准中被大量采用。在实现代价可以接受的前提下,编码效率较MPEG-2标准提高了2-3倍,与H.264/AVC相当,且技术方案简洁,达到了第二代标准的最高水平,是目前图像通信研究领域的热点问题之一。 AVS视频解码芯片实现复杂度较H.264/AVC低,但其运算复杂度也略为增加,再加上实际应用环境中实时运算的限制,它对硬件实现提出了巨大的挑战。其中系统流水线设计和存储器接口工作效率历来是影响视频解码系统性能的两个主要因素。 为了使AVS标清视频解码器实现实时高清解码,本文首先分析了AVS标清视频解码器的设计和性能,确立了两个重点改进方向,“优化现有流水策略以减少解码时间”和“提高存储器控制模块读写效率以满足实时高清解码的带宽需求”。 为了优化现有的流水策略,本文在对AVS标清视频解码器流水策略进行详细分析的基础上,提出了三级宏块流水、两级块流水高效改进流水策略。与原流水线的设计相比,新流水线设计通过有效的控制机制,减少了存储头信息的开销,在提高系统解码速度的同时并未显著增加硬件资源的占用。 为了提高存储器控制模块读写效率,本文提出了更优设计的帧图像存储方法和多请求仲裁机制,改进了标清存储器控制模块设计,从而使存储器控制模块的读写效率满足了高清解码的要求。
.该环路滤波器可用于AVS高清实时解码器芯片中.
5.期刊论文叶波.秦东.章倩苓.Ye Bo.Qin Dong.Zhang Qianling适用于MPEG2标准的逆量化器的VLSI设计-半导
HEVC关键技术2

HEVC关键技术摘要:随着人们视觉感受要求的提高,视频的分辨率和应用场合发生了重大变化。
但是现有的视频压缩标准已经不能满足需求,这就要求研究人员提出新的视频压缩标准,进一步提高视频的压缩效率,高效视频编码标准应运而生。
高效视频编码标准主要目标是在现有的H.264/A VC high profile的基础上,压缩效率提高一倍,可以允许适当提高编码端的复杂度。
本文主要从高效视频编码标准的关键技术入手,比较全面地介绍了基于四叉树结构的分割技术、细粒度slice分块边界、预测编码技术、环路滤波、熵编码、并行化设计等技术。
同时,对高效视频编码标准的发展前景进行了预测。
关键词:高效视频编码标准,预测编码技术,环路滤波、熵编码、并行化设计1 HEVC的背景H.264是当前普遍的视频编码标准,它将视频压缩效率提高到一个更高的水平。
由于其高效的压缩效率,以及良好的网络亲和性,使得该标准在较短的时间内得到广泛普及。
然而,随着网络技术和终端处理能力的不断提高和发展,人们提出了更高的要求,希望能够提供高清、3D、移动无线,以满足新的家庭影院、远程监控、数字广播、移动流媒体、便携摄像、医学成像等新领域的应用。
如果继续采用H.264编码就会出现如下一些局限性[1]:1.宏块个数的爆发式增长,会导致用于编码宏块的预测模式、运动矢量、参考帧索引和量化级等宏块级参数信息所占用的码字过多,用于编码残差部分的码字明显减少。
2.由于分辨率的大大增加,单个宏块所表示的图像内容的信息大大减少,这将导致相邻的4×4或8×8块变换后的低频系数相似程度也大大提高,导致出现大量的冗余。
3.由于分辨率的大大增加,表示同一个运动的运动矢量的幅值将大大增加,H.264中采用一个运动矢量预测值,对运动矢量差编码使用的是哥伦布指数编码,该编码方式的特点是数值越小使用的比特数越少。
因此,随着运动矢量幅值的大幅增加,H.264中用来对运动矢量进行预测以及编码的方法压缩率将逐渐降低。
H.264/AVC帧内预测模式不同快速算法的分析

H. 6 2 4的亮 度 帧 内 预 测 方 式 分 别 是 基 于 1 ×1 6 6
和4 ×4两种 不 同块 尺 寸进 行 。对 4 ×4亮 度 块 提供 了
化 ) 式 获得 编码 的性 能提 高 , 这 是 以 高计 算复 杂度 为代 价 的 。 为 了解 决 这 个 问题 , 先 对 H. 6 / VC 的 帧 内预 测 算 法 模 但 首 24A
进行研究 , 随后 对 不 同快 速 算 法 进 行 分 析 , 明其 都 以不 同方 式 大 幅 度 提 高 了 H. 6/ C 帧 内预 测 的 速 度 , 时 保 持 了较 证 2 4 AV 同 高的 预 测 精 度 和 主 观 图像 质 量 。
关 键 词 : 2 4 视 频 编 码 ; 测 编 码 ; 内预 测 ; 失 真 优 化 H. 6 ; 预 帧 率
中图 分 类 号 : P 1 . T 99 8
文 献 标 识 码 : B
文 章 编 号 :0 4— 7 X(0 8 2 —1 3 4 1 0 3 3 2 0 ) 3 0 一O
Re e r h o f e e tFa tAl o ih o . 6 n r s a c f Dif r n s g r t m f r H 2 4 I t a— p e i to r dci n
CAIF n pn H UANG i , UANG ht n a g ig, Jn H S ia
( n M ir Xi c o—ee to i Te h o o yRe e r h I s i t , n, 1 0 5 C ia a lcr nc c n lg sa c t u e Xi n t a 7 0 7 , hn)
【技术】论H264技术优势及其在H323系统中的应用

【关键字】技术论H.264技术优势及其在H.323系统中的应用摘要论述H.264视频编解码标准和技术优势,并对其在H.323系统中的实现进行。
关键词:H.264 视频编解码标准H.323引言视讯会议系统从产生至今,发展了多种适于各类通信网络的系统,目前传输多媒体信息的主要有H.323、H.324和H.320等系统。
IP技术的开放性特点使得它非常适合承载多种业务,随着IP的安全和QoS等问题的逐步解决,以IP作为承载网的优势将更加明显,下一代网络也将采用IP技术作为承载网技术。
H.264是由JVT为实现视频的更高压缩比,更好的图像质量和良好的网络适应性而提出的新的视频编解码标准。
事实证明,H.264编码更加节省码流,它内在的抗丢包、抗误码能力和良好网络适应性使它非常适于IP传输,H.264有望成为H.323系统中首选的视频标准。
H.323系统对视频编解码标准提出了以下三个主要要求:一些IP网络接入方式如xDSL可提供的带宽有限,除去音频、数据占用的带宽,传输视频的可用带宽就更少,这就要求视频编解码压缩率高,这样就可以在一定的比特率下具有更好的图像质量。
抗丢包性能和抗误码性能好,适应各种网络环境,包括丢包和误码严重的无线网络。
网络适应性好,便于视频流在网络中传输。
1 H.264适于H.323系统的三个技术优势H.264在制定时充分考虑了多媒体通信对视频编解码的各种要求,并借鉴了以往视频标准的研究成果,因而具有明显的优势。
以下将结合H.323系统对视频编解码技术的要求,阐述H.264的三个优势。
1.1 压缩率和图像质量方面可变块大小:在宏块划分上H.264采用了16×16,16×8,8×16,8×8四种模式;当划分为8×8模式时,又可进一步采用8×4、4×8、4×4三种子宏块划分模式(见图1)进一步划分,这样可以使运动物体的划分更加精确,减小预测误差,提高编码效率。
基于SIP协议和H264编解码优化的IP可视电话设计

基于SIP协议和H.264编解码优化的IP可视电话设计摘要IP可视电话是一种实现点到点的视频通信的工具,它能利用互连网双向实时传输通话双方的图像和语音信号。
它集数字信号处理技术、宽带互联网技术、多媒体通信技术于一体,是下一代通信网的主要业务之一。
本项目还预留了良好的扩展性,如增加IPTV、录像、家庭多媒体网关等功能,真正成为一个智能终端。
本论文主要研究IP可视电话的关键技术,在TI 公司的DM642平台上实现H.264编解码的优化、SIP呼叫协议、IP可视电话硬件平台的开发等关键技术。
在分析H.264编解码算法的运动估计、整型变换、熵编码等关键算法特点的基础上,结合本系统的具体应用,提出了改进的算法并用软件实现。
在H.264优化部分主要的研究内容如下:1.研究了H.264编码运动估计算法,在运动估计搜索算法中比较了全搜索法、钻石搜索法和小菱形搜索算法的特点,提出了一种新的改进的小菱形搜索算法,结果表明,该算法复杂性较小、效率更高。
2.通过对H.264编码的整型变换的研究,结合DM642的并行数据处理特性,对原整型变换中的功能处理模块进行了调整,以充分发挥DSP海量数据处理的能力,并减少了程序中不必要的内存访问。
实践结果表明,改进后的算法的执行速度得到了很大的提高,而且减少了总的代码量。
3.分析了H.264编码的熵编码中自适应变长编码的算法,在查找模块的实现中,采用的基于分组的查表技术,提高了查表的效率,使熵编码的运算时间减小了大约三分之一。
SIP协议部分,在研究IETF RFC3261的国际标准--SIP协议栈的基础上,重点分析了开源的OSIP协议栈,并利用其开发出了SIP 的用户代理UA (User Agent),结合本系统的具体应用,简单、高效地实现了系统所需要的SIP呼叫功能。
为了验证本系统的功能和性能,建立了两个测试模型。
除了对SIP协议的实现、IP可视电话的功能进行了验证外,还对H.264编解码的运动估计、整型变换、熵编码等关键算法的优化前后的处理时间进行了的测试,对优化前后CPU的占有率、图像质量进行了比较验证。
基于H264和AVS的流媒体传输技术研究

3.会议论文陶品.杨春博.杨士强变速率流媒体传输中的缓冲管理2006
将预先录制的实景视频在行车过程中即时的播放出来,可以让驾驶员通过对比视频和实地场景来"认路",更好地实现导航,但是由于实际的车速是不断变化的,因此预先录制的实景视频流的回放速率也应该自适应地连续变化,这对视频流式传输的服务器端和接收回放端都提出了更高的要求。本文设计并实现了针对新一代视频编码标准──H.264/AVC的变速率传输与回放系统,客户端回放采用DirectShow框架,通过修改H.264解码器Filter以支持可变速率的解码回放,服务器端可根据客户端的反馈信息实时调整服务器的数据发送速率,服务器与客户端之间采用RTP/RTCP协议传输多媒体数据流,并通过动态缓冲区管理实现了系统的变速率传输与播放功能.实验结果表明,该系统成功地实现了流媒体连续可变速率的传输与回放,主观视觉效果无明显抖动.
H.264流媒体传输的时域误码掩盖方法、交织编码及RTCP传输控制算法(丢包率的低通滤波平滑和改进型AIMD算法),从而保障本系统的健壮性、可靠性和服务质量。 (4)根据视频监控的需要,构建了简单的无线网络,并且在无线视频监控中实现流媒体传输,在确定传输控制中各参数后,对传输进行测试。经测试,本论文设计的H.264无线流媒体传输丢包率控制在1%以内,接收端收到的每个发送端有效数据量在95kbps,并且接收端接收到的视频YUV分量的PSNR值均达到了35dB以上,传输性能有了较好的质量保障。
5.学位论文徐廷生基于Windows 的H.264视频解码系统设计2006
随着计算机技术、通信技术和微电子技术的不断提高,嵌入式技术取得了飞速发展。特别是近年来,Internet与网络的广泛应用,使消费电子、计算机、通信一体化趋势日益明显,嵌入式系统也再度成为研究与应用的热点。与此同时,视频处理与应用技术有了快速的发展。针对当前网络带宽不够,无线通信信道误码率较高的情况,如何在现有的技术水平和网络环境条件下实现合理、优化、实时的多媒体通信一直是近年来通信领域关注的话题。 H。264/AVC是ITU-T视频编码专家组和ISO/IEC运动图像专家组联合提出的新一代视频编码标准。H.264/AVC不论从编码效率方面,还是从有效的适应各种网络和各种应用领域的灵活性方面,都体现着视频编码技术的许多优势。因此,将H.264视频压缩标准的先进技术和稳定的嵌入式处理系统相结合,实现高效的媒体通信平台有着一定的工程意义和市场价值。 本文以Windows 嵌入式操作系统,实现H.264压缩视频通信作为研究对象,主要开展了以下几个方面的工作: 深入研究了windows 操作系统的体系结构,以及windows 的软、硬件开发平台,在此基础上,根据实际硬件平台的需要,自己定制了一个windows 操作系统。 研究了流媒体传输原理,流媒体传输/控制协议RTP/RTCP,以及RTP/RTCP的程序实现方法,分析了JRTPLIB库接口函数的使用。 深入研究了H.264视频压缩标准和它的体系结构,对参考代码JM82解码程序的整数变换部分进行了优化。 完成了H.264视频解码库在Windows 下的移植,并在嵌入式操作系统下编写了H.264视频播放程序,该程序能够实现本地H.264文件的播放,以及远程文件的RTP播放。
h264规范

h264规范H.264是一种广泛使用的视频压缩标准,也被称为MPEG-4 Part 10或AVC(Advanced Video Coding)。
它提供了出色的视频质量和高压缩比率,适用于各种应用,包括广播、视频会议、流媒体和视频存储。
H.264规范定义了一种视频编码方式,将视频分割成块,并对每个块进行压缩。
编码过程包括运动估计、变换、量化和熵编码。
首先,H.264使用运动估计来减少冗余信息。
它检测相邻帧之间的运动向量,然后利用这些向量来预测当前帧的内容。
当两个帧之间存在较小的运动时,只需编码运动向量和残差信息,而无需编码整个帧。
这有效地减少了编码所需的比特数。
接下来,H.264使用变换来将时间域上的连续像素值转换为频域上的系数。
采用离散余弦变换(DCT)来减少冗余,并且可以通过量化来减小系数的值。
量化过程将频域系数除以一个量化矩阵,并将结果四舍五入成整数,从而减少了系数的精度。
随后,H.264使用熵编码来对量化后的系数进行编码。
它采用可变长度编码(VLC)和上下文自适应二进制算术编码(CABAC)来压缩剩余系数,并通过利用统计特性来实现高效的编码。
除了上述的编码过程,H.264还定义了一些其他的特性,以进一步提高编码效率。
例如,它引入了多个帧类型,如关键帧和预测帧,以便可以对帧进行更加有针对性的编码。
它还支持多个参考图像,这允许在运动估计过程中使用多个相邻帧的信息。
H.264还提供了灵活的比特率控制和层次化编码机制。
比特率控制可以根据网络带宽和质量要求来调整编码的比特率。
层次化编码允许在不同的分辨率和质量层之间进行逐步编码和传输,以便在带宽变化的情况下提供更好的用户体验。
总体而言,H.264规范通过运动估计、变换、量化和熵编码等技术,实现了高效的视频压缩和高质量的视频播放。
它在广泛的应用中发挥着重要的作用,并被广泛支持和采用。
H264编码原理详解

H264编码原理详解前言•在日常生活中我们知道,电脑中的视频文件先要通过视频采集设备对物体进行采集,然后通过编码核心部件得到mp4,rmvb等格式进行保存。
有没有可能不经过上述核心编码部件采集之后直接进行显示呢?答案是可以的。
那为什么还要进行编码呢?答案是原始采集到的视频数据为YUV格式,这种格式不经过处理的话特别大,对于网络传输和永久保存非常不利,为了解决这个问题,就需要对原原始的视频数据进行压缩处理。
而H264则是目前一种流传广泛,成熟的视频压缩算法。
•先来看一个例子在学习H.264编码之前,我们先了解一下在手机相机拍摄视频的过程,如果Camera采集的YUV图像不做任何处理进行传输,那么每秒钟需要传输的数据量是多少?Camera采集的YUV图像通常为YUV420,根据YUV420的采样结构,YUV图像中的一个像素中Y、U、V分量所占比例为1:1/4:1/4,而一个Y分量占1个字节,也就是说对于YUV图像,它的一个像素的大小为(1+1/4+1/4)Y=3/2个字节。
如果直播时的帧率设置为30fps,当分辨率为1280x720,那么每秒需要传输的数据量为1280720(像素)30(帧)3/2(字节)=39.5MB;当分辨率为1920x720,那么每秒需要传输的数据量接近60MB,这对于手机的存储空间有很大考验,因此,我们就必须在拍摄形成视频文件保存在本地之前对采集的视频数据进行压缩编码。
H26X简介H261•目前国际上制定视频编解码技术的组织有两个,一个是“国际电联(ITU-T)”,它制定的标准有H.261、H.263、H.263+等,另一个是“国际标准化组织(ISO)”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。
•H.261是1990年ITU-T制定的一个视频编码标准,属于视频编解码器。
设计的目的是能够在带宽为64kbps的倍数的综合业务数字网(ISDN forIntegrated Services Digital Network)上质量可接受的视频信号。
H.264文献综述

基于H.264/A VC视频编码算法综述Abstract: H.264/AVC is the video coding standard jointly developed by ITU-T Video Coding Experts Group(VCEG) and ISO /IEC Moving Picture Experts Group(MPEG).This coding standard has high coding efficiency which is significantly increased in the low bit-rate compared with MPEG-4, and is available for the low-bandwidth,high-quality network video applications.In order to facilitate the realization of H.264 in the low bit rate and real-time application system the coding algorithm has to be optimized.After the analysis of H.264 encoder we can get that,motion estimation is one of the mainly technology for the video compression coding, and with the motion compensation technology they can eliminate time redundant of video signal to improve the coding efficiency.As a result,how to improve the efficiency of motion estimation to make the search process more robust,faster and more efficient becomes one of the hot spots of the current study.This paper first discusses the basic principles and key technologies of H.264 video coding standard;then introduces several existing classical Block-Matching Motion Estimation and analyses their strengths and weaknesses respectively;while,in depth analyses the H.264 recommended core algorithm of motion estimation UMHexagonS and Other fast optimization algorithm.Key words: H.264/A VC, motion estimation, motion vector, video compression摘要:H.264/AVC是由ITU-T视频编码专家组VCEG(Video Coding Experts Group)和ISO/IEC运动图象专家组MPEG(Moving Picture Experts Group)共同制定的视频编码标准,这一编码标准可获得很高的编码效率,尤其是在低码率方面比MPEG-4有明显提高,适合低宽带、高质量网络视频应用的需要。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
D厂队气。
一
\V.,r
E
图1 UMhe)【agons混合搜索模板 Fig.1 Mixed search patterns of UMhe】‘agonS
(3)采用了半路中止条件。在采用(2)中混
合模板搜索的同时,针对不同的宏块分割类型和 不同的参考帧,UMhexagonS可以设置在当前模 板搜索结束后,跳过部分搜索模板,直接进行后面 的模板搜索。
引言
运动估计是视频压缩领域中的一项关键技 术,而块匹配方法由于其适合硬件实现,因此被广 泛应用于运动估计中。在已有的块匹配方法中, 全搜索算法(FS)是对给定的搜索窗口内的所有 点进行匹配,因此能够得到最佳的运动估计效果, 但是随着搜索半径的增大,其运算量成倍增长,导 致整个编码过程时间消耗过多。
为了减少运动估计消耗时间,提高视频编码 效率,近年来国内外学者提出了各种快速算法。 其中,新三步法(NTSS)…、钻石法(DS)[2|、以及 基于六边形的搜索法(HEXBS)[31等,都是利用运 动矢量的中心偏置分布特性n]来进行搜索模板和 搜索方法设计,加快了搜索速度,而且在视频序列 运动比较平缓的情况下表现出良好运动估计效 果。但是,这些算法没有考虑到运动矢量的相关 性,在运动剧烈的情况下容易陷入局部最优而导 致运动估计效果降低。而后来提出的运动矢量场 自适应快速搜索算法(MVFAST)[5],以及可预测 运动矢量场自适应快速搜索算法(PMVFAST)[63 则在先前基础上进一步考虑到运动矢量的时空相 关性【7 J,对运动矢量进行精确的起点预测,缩小了 搜索区域范围,同时降低了搜索陷入局部最优的 可能性,不过这些算法搜索模板相对单一,搜索策 略不够灵活,并且运动估计效果依然有待改进。 作为被H.264/AVC参考编码模型JMlO.2所采 纳的快速运动估计算法之一,非对称十字型多层 次六边形搜索算法(UMhexagonS)利用运动矢量 的水平垂直偏置分布特性和合适的半路中止条 件【8],结合其他搜索方法的部分优点,提出了混合 搜索策略,能够在比FS节省约90%的计算量下, 得到非常接近FS的运动估计效果,并且能够适 应于各种运动类型的视频序列。但是。该算法没 有利用运动矢量的方向性曲],搜索过程中会进行 不必要的搜索,因此,为了加快搜索速度,需要进 行改进。
收稿日期:2010—01—22;修订日期:2010—04—13. 基金项目:中国科学院知识创新工程领域前沿项目
万方数据
光学精密工程
第18卷
Key words:video compression;area partition;UMhexagonS algorithm;motion estimation;statistical characteristics
2基于UMhexagonS的改进算法
2.1 UMhexagons算法介绍
UMhexagonS算法主要包含了以下3个部 分。
(1)精确的运动矢量起点预测。预测矢量集 包含了当前宏块的中值预测矢量、时间相关块预
测矢量、上层预测矢量、邻近参考帧预测矢量。运 动矢量起点预测就是在上述预测矢量集中找出能 够使得公式(1)给出的拉格朗日代价函数最小的
运动矢量,以此作为最佳起点运动矢量(记为 M’,PRED)。
m,=argmin{DDFD(Si,研)+AM‘)TI()NRM‘m()N(Sl,m, 卅∈M
rP厂)},
(1)
式(1)中,Si表示当前宏块,M为可以得到的
编码模式的集合,RM。删,、为编码运动矢量棚和对 应参考帧心,所需比特数,DDFD为失真度。
摘要:为了提高视频压缩效率.对H.264中采用的快速运动估计算法UMhexagonS进行了改进。首先。在起点预测后加
入一个结束搜索条件。判断是否结束对当前宏块的运动估计。然后。对于需要进一步运动估计的宏块。从两个方面对原
算法进行了改进。提出了搜索模板分割方法,在进行十字形模板和大六边形模板搜索时。只需要根据该方法选择少量搜 索点进行运动估计。根据运动矢量的统计特点.减少了正方形模板和扩展六边形模板的搜索点数。同时验证了所采用 的搜索Ⅸ域分割方法的合理性。实验结果显示。改进算法的运动估计时间比原算法平均减少了15.59%,而峰值信噪比
索,最终得到的运动矢量就是当前宏块的最佳运
动矢量(记为My黼)。
万方数据
第11期
李桂菊,等:H.264快速运动估计算法的改进
i佧起点运磁 队帚T\ ‘擗一 I l— —J● J● ●● ¨ ■ ● ■■ JL— — 一n
一一一一-\一一 L 一一一一一一
▲▲一▲▲
一
一
r一
一一一一一
一
A
}}丧嵝涌矬髓
(2)混合搜索模板的使用。对于预测得到的
最佳搜索起点,UMhexagonS算法以该点为中 心,进行如图1所示的非对称十字形模板(记为 A)搜索,找到该模板中最小代价所在点后。以此 为中心,再进行[一2,+2]范围内的正方形模板搜
索(记为B),同样找到最佳点后,再以该点为中心 进行大六边形模板(记为C)搜索,然后用相同的 方法依次对六边形模板D、小菱形模板E不断搜
2.2 UMhexagonS搜索模板的优化 由上述UMhexagonS搜索过程可以看到,混
合搜索模板需要搜索的候选点数过多,这就制约
了UMhexagonS的速度。如果能够采用一定的 限制条件缩小搜索范围,那么可以有效地减少搜
索点数。由于UMhexagonS采用了精确的起点 预测,因此可以利用起点运动矢量方向对最佳运
curMV∈area4
为了验证该划分方法的合理性,本文记
MvPRED和MVBEsT落入相同区域areaI,area2,are—
a。,area。的概率分别为户,,户:,加,p。,并令N,表
示My,阳,和Mh阿落入某一相同区域的视频序
列宏块数,N。表示所统计的宏块总数。那么
pi—Nf/N。 (i一1,2,3,4),
(5)
因此MyP蹦,和MyBEsT落入相同区域的总概率p。
计算方式如下:
4
A=艺p。,
(6)
i=l
这里选择QCIF和CIF格式的8种代表不同
运动类型的标准测试序列,在JMl0.2下采用
baseline方式分别编码前100帧来测试户。的大
a。)共4个角度范围,如图2所示,因此整个运动
物体所处平面为:
area=areal
U U U area2
area3
aread,
(2)
如果将当前宏块运动估计得到的最佳运动矢
量记为curM’,(cur—mvx,cur—mVy),则该运动矢
量方向的计算方法为
口=argtan盖黑,
(3)
图2运动矢量所属4个区域
LI Gui—jul,LIU Gan91~,LIANG Jing—qiul
(1.Cha投gch砧铃l视s£itM£e o,optics,Fi靠P Mechnnics nnd Physics t (Ⅵi,2P5P Af口dP优y o厂SfiP竹fPs,C^口行gc^“,2 130033,(、^i以n;
和码率基本不变。并且能够适应各种运动类型的视频序列。得到的结果表明改进箅法提高了总体编码性能。
关键词:视频压缩;区域分割;UMhexagonS算法;运动估计;统计特点
中图分类号:TN941.1:TP301.6
文献标识码:A
doi:lO.3788/()PE.20101811.2489
ImproVement of fast motion estimation algorithm used in H.264
动矢量方向所落入的角度范围进行预测,只要预 测精确度足够高,那么只需要在该角度范围内搜 索就可以找到最佳搜索点,有效地节省搜索点数。
考虑到文献[4]中统计得到的运动矢量在水 平和垂直方向的偏置特性,本文提出的改进算法
将运动矢量方向划分为偏向正z轴方向(标记为
area,),偏向正y轴方向(标记为area2),偏向负y 轴(标记为area。),偏向负z轴方向(标记为are—
第18卷第11期 20lO年11月
光学精密工程
()ptics and Precision Engineering
V01.18 No.11 Nov.2010
文章编号 1004—924X(20lO)11—2489一08
H.264快速运动估计算法的改进
李桂菊1,刘 刚1’2,梁静秋1 (1.中国科学院长春光学精密机械与物理研究所,吉林长春130033;2.中国科学院研究生院,北京lo0039)
Fig.2
Four areas of motion vectors
判断该运动矢量落入区域的方法如下: if(一45。f<口<45。c
cu“订y∈areal
elseif(45。f<口<135。f)
curMV∈area2
elseif(1 35。f:日<225。f)’
“’
curMV∈area3
elseif(225。f<口<315。f)
2.G,‘口d“口£P U衍iuPr5i£y o厂C,li竹已se Acc工dP,咒y o,SfiP咒cPs,BPiJi,zg 100039,@i卵n)
Abst阮ct:A fast motion estimation algorithm used in H.264,UMhexagonS,is optimized to improve the efficiency of video compression. Firstly,a stop—search technique is used to judge whether the mo— tion estimation of current macro block should be stopped after the initial search point is predicted. Then,the original algorithm is improved in two respects for macro blocks which need further motion estimation. ()ne improvement is that fewer search points are used in motion estimation by the pro— posed partition method when multi—hexagon—grid pattern or cross pattern are adopted,and the other impmvement is that the search points of square search pattern and extended—hexagon search pa“ern are reduced according to statistical characteristics of motion Vectors.JVIoreover,the rationality of the partition method is proved. Experimental results show that the aVerage time of motion estimation is reduced by 15.59%compared with that of the original algorithm,whereas,the Peak Signal to Noise Ratio(PSNR)and bit rate remain almost unchanged. The proposed algorithm improVes the coding performance and is suitable for various types of video sequences.