数字视频图像的处理技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多媒体技术及其应用
本栏目责任编辑:李桂瑾
1引言
视频信号经过数字化处理后具有巨大的数据量。

按照国际电信联盟(ITU)601的建议,如果存储在硬盘上,1GB的硬盘空间只能记录49秒的电视视频信号。

在现有的硬件和软件的条件下,对不压缩视频信号无论是实时处理,还是存储和传输都存在困难。

因此,需要对数字视频图像进行压缩,以降低其数据率。

信息理论为编码和压缩提供了理论基础。

信息理论认为对信号量化后的原始编码与它所包含的信息量并不相等,二者的差就是冗余。

压缩编码的目的是尽量减少冗余,争取以最少的编码表达最完整的信息。

2视频压缩编码的基本概念
视频压缩的目标是尽可能在保证视觉效果的前提下减少视频数据率。

由于视频可以看成是连续的静态图像,因此其压缩编码算法与静态图像的压缩编码算法有些共同之处,但运动视频还有其本身的特性,所以在压缩时还应考虑其运动特性才能达到高压缩的目标。

在视频压缩中常用到以下一些基本概念:
2.1有损压缩和无损压缩
在视频压缩中有损和无损的概念与静态图像中基本类似。

无损压缩也即压缩后的数据和压缩前的原始信号完全一致。

无损压缩的压缩比太低,这限制了在视频压缩中的应用。

有损压缩是解压缩后的数据与压缩前的数据不一致。

在压缩过程中要丢失一些人眼和人耳所不敏感的图像和音频信息,而且丢失的信息不可恢复。

几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标。

丢失的数据率与压缩比有关,压缩比越高,丢失的数据越多,解压缩后的效果一般越差。

此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。

2.2帧内压缩和帧间压缩
帧内压缩也称为空间压缩。

当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。

帧内一般采用有损压缩算法,由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。

帧内压缩一般达不到很高的压缩比。

采用帧间压缩是基于视频或动画的相邻帧具有很大的相关性,或者说前后两帧变化很小,根据连续视频其相邻帧之间具有冗余信息这一特性,压缩相邻帧之间的冗余就可以进一步增加压缩量,提高压缩比。

帧间压缩也称为时间压缩,它通过比较时间轴上不同帧之间的数据进行压缩。

帧间压缩一般是无损的。

帧差值算法是一种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。

2.3对称编码和不对称编码
对称性是压缩编码的一个关键特征。

对称意味着压缩和解压缩中用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频。

把视频预先压缩处理后,然后再播放就是采用不对称编码。

不对称意味着压缩时需要花费大量的处理能力和时间,而解压
缩时则能较好地实时回放,也即压缩和解压缩的速度不同。

一般来说,压缩一段视频的时间比回放(解压缩)该视频的时间要长。

3常用视频压缩技术
3.1预测编码
预测编码(DPCM)也称为差值编码,是根据原始信号的统计
特性进行预测,通过差值除去视频图像信号的相关性,以达到压缩的目的。

预测编码既可以在帧内预测,也可以在帧间预测。

帧内预测编码的理论依据是电视图像在水平方向上和垂直方向上相邻像素之间存在着相关性,可以根据前面已知的几个像素值来推测当前像素的值,这些像素可以是同一扫描行内或相邻的不同扫描行上,分别称为一维或二维预测,然后对实际值与预测值的差值进行量化和编码。

这种编码方式硬件实现比较简单,但会产生误码扩散,导致图像质量明显下降。

帧内预测编码效率较低,压缩比只有两三倍,使用范围有限。

帧(场)间预测编码依据视频信号的相邻帧(场)间存在的相关性进行压缩。

采用这种编码可以获得较高的压缩比,在运动慢的区域,帧间预测性能较好,但在运动剧烈的区域,帧间预测性能差,一般在这种情况下采用帧内编码方法。

帧间预测编码广泛应用于常规电视、高清晰度电视、会议电视和电视电话等视频信号的压缩编码。

3.2离散余弦变换编码
预测编码是为了除去视频信号的相关性,除去信号视频间的相关性更为有效的方法是进行正交变换。

在视频压缩中,离散余弦变换(DCT)是最常用的编码方法。

变换编码之所以被广泛使用,是因为在变换域里描述视频图像比空间域里简单,利用变换编码,视频图像的相关性明显下降,信号能量集中在几个变换系数上,可有效压缩数据,具有较强的抗干扰能力,传输过程中的误码对图像质量的影响远小于预测编码。

DCT编码有快速算法,能实现实时视频压缩,此外变换编码还能充分利用人眼的视觉特性。

3.3分形图像压缩
分形几何方法是一种较新的图像压缩方法,几何学的自相似原理告诉我们无论物体几何尺度如何变化,景物任何一小部分的形状都与较大部分的形状极其相似。

分形几何研究的对象是那些不规则而有自相似性的形状。

分形编码实际就是把图像分割成若干个子图像,子图像通过迭代函数反复迭代而成,这些迭代函数只需几个参数即可确定,因此得到较高的压缩比。

分形理论用于
收稿日期:2007-06-20
作者简介:江铁成(1971-),男,安徽潜山人,讲师,工程师,主要从事影视制作、非线性编辑课程的教学和研究;孙灿明(1951-),女,安徽无为人,高级工程师,主要从事电视节目制作和编辑工作。

数字视频图像的处理技术
江铁成1,孙灿明2
(1.安徽广播影视职业技术学院,安徽合肥230022;2.安徽电视台,安徽合肥230066)
摘要:数字视频压缩已成为数字视频图像处理的关键技术之一。

本文描述了视频压缩编码的基本概念,论述了常用视频压缩技术,然后较详细的介绍了视频压缩格式。

关键词:数字视频;压缩;编码;图像处理;视频压缩格式中图分类号:TN911文献标识码:A文章编号:1009-3044(2007)13-30213-02
TheProcessingTechnologyofDigitalVideos
JIANGTie-cheng1,SUNCan-ming2
(1.AnhuiBroadcastingMovie&TVVocationalCollege,Hefei230022,China;2.AnhuiTVStation,Hefei230066,China)
Abstract:Thetechnologyofdigitalvideocompressionhasalreadybecomeakeyoneintheprocessionofdigitalvideos.Thepaperpresentsthecommontechnologyofvideocompressionaswellasthebasicdefinitionofthevisualcompressionandcode,anditalsointroducestheformatofvideocompression.
Keywords:digitalvideo;compression;code;videoprocession;theformatofvideocompression
213
多媒体技术及其应用
本栏目责任编辑:李桂瑾
电脑知识与技术
图像压缩十分有效,因为自然界中普遍存在分形物体,它们表面上具有非常复杂的统计特性和视觉特性,都只有很少的信息含义,可以用几条简单的确定规则迭代出来。

传统的压缩技术几乎不能压缩这类图像,而分形编码只需几条变换规则进行编码,得到很高的压缩比。

分形图像压缩技术还未成熟,是一种很有潜力的压缩技术。

3.4小波压缩
针对DCT编码存在的一些缺点,最近小波变换也应用于图像压缩编码中。

小波压缩采用局部函数在频域和时域同时分析法,将图像信号分解成不同频率区域,然后根据图像统计特性和人眼生理特性,在不同的频域采用不同的压缩方法,使视频数据量减少。

小波变换具有频率上的自由伸缩性,不受图像带宽的限制,在编码过程中即使取较大的压缩比,仍可得到高质量的重建图像。

目前,小波变换压缩技术正在发展之中,有些厂家虽然做过实验,但仍未实际应用在非线性编辑系统之中,它将成为图像压缩领域研究的重要方向。

4视频压缩格式
视频处理卡的重要功能就在于对视频信号进行采集压缩,然后解压播放。

不同厂家的处理卡采用的压缩技术也不同,这决定了视频信号的质量也有所不同。

视频压缩标准化对集成电路的大量生产、降低生产成本、解决不同厂家设备的兼容性有重要意义。

目前应用于数字图像处理技术的几种压缩方式包括:M-JPEG、MPEG、DV压缩格式等。

4.1M-JPEG压缩格式
M-JPEG是Motion-JPEG的简称,是目前数字视频图像处理中最常用的一种压缩格式,非线性编辑系统虽然采用M-JPEG压缩方式,但不能相互通用,不同的厂家是在JPEG的基础上各自开发出M-JPEG技术。

JPEG(JointPhotographicExpertGroup)即联合图像专家组,它是由国际标准化组织ISO、国际电报电话咨询委员会CCITT、国际电工委员会IEC共同联合于1986年正式开始制定的标准。

它主要用于连续色调(灰度和彩色)静止图像压缩。

JPEG最初虽然是为静止图像设计的,但实际上只要硬件处理速度足够快,完全可以应用于视频压缩。

因此,许多视频处理系统生产厂家在JPEG的基础上开发了M-JPEG压缩技术。

Motion-JPEG可以理解为活动图像的JPEG压缩,它是将静态图像压缩格式JPEG优化后,用来对活动图像进行实时的帧内压缩。

帧内压缩有一个好处就是可以精确定位每一帧图像,这一点非常适合非线性编辑。

在编辑过程中,可以随机存取任意一帧图像,对于帧编辑十分理想。

M-JPEG采用DCT编码技术,DCT是一种有信息损失的压缩技术,在压缩过程中,图像的信息会丢失,图像的压缩一般通过专用处理器来实现,可以大大提高处理速度和提高图像还原质量。

M-JPEG压缩处理器的主要功能是实时压缩和解压缩动态黑白和彩色图像。

M-JPEG是一种对称的压缩方式,压缩过程和解压缩过程是可逆的,两个过程都是实时处理的。

非对称压缩方式的压缩过程需要更多的处理步骤,产生一定的延时,因此非线性编辑、可视电话等实时性强的系统多采用对称式压缩方式。

4.2MPEG压缩格式
MPEG(MovingPictureExpertGroup)即活动图像专家组。

M-JPEG是基于静态图像的压缩技术,MPEG却是基于动态图像的压缩标准。

MPEG的主要任务是为了把计算机系统和广播电视系统结合起来,建立同一的信息网络,即多媒体网络。

MPEG压缩标准于1990年制订,是一种既可以通过软件实现,也可以通过硬件实现的标准。

MPEG又是一个标准系列,依发表的时间顺序为MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21等。

各有不同的特点和应用:
4.2.1MPEG-1
MPEG-1以4:2:0采样压缩,每秒1.2Mbits的传输码率,图像大小352×288,MPEG-1采用帧间编码技术,帧间编码比帧内编码可达到更高的压缩比,而且能够进行自适应帧内/帧间编码。

图像
活动剧烈时,视频信号的帧间相关性下降,帧内相关性增强;图像
活动缓慢或静止时,帧间相关性增强,因此采用自适应帧内/帧间编码使帧间预测误差减小,提高编码效率。

MPEG-1标准提供的图像质量比电视略强,适合于非专业视频领域,如VCD等,但用于广播电视方面其视频质量是远远不够的。

4.2.2MPEG-2
MPEG-2是一种高质量视频的压缩标准,也有人称它为用于广播电视的视频压缩标准。

MPEG-2视频体系包括5类4个等级,适应广播、通信、计算机和家电视听工业的不同需求。

MPEG-2的专业版本采用4:2:2采样压缩,传输码率每秒可达50-60Mbits。

在同等视频质量下,MPEG-2所占空间为M-JPEG的10%-15%,同时MPEG-2已经成为DVD和DVB的标准。

因此,有些非线性编辑系统也采用MPEG-2这种压缩方式。

4.2.3MPEG-4
继成功制定了MPEG-1、MPEG-2标准后,MPEG于1994年开始制定MPEG-4标准,历时5年多完成。

它是一种广域传输标准,传输码率在10kbps到1Mbps之间。

MPEG-4具有很多新功
能,最关键的是打破了以往基于像素的编码概念,而采取了完全崭新的“基于音频和可视对象的编码”技术。

MPEG-4应用范围非常广,一般说来能满足各种不同应用的需要,能适应不同传输带宽、不同尺寸和分辨率不同的图像质量。

如视频会议、视频电话、交互式视频游戏、多媒体通信、多媒体邮件、远程教育、交互电视、电子节目指南等。

4.2.4MPEG-7
MPEG-7标准又称为多媒体内容描述接口。

它不是信息压缩编码技术,而是多媒体内容描述的标准。

MPEG-7的描述可以独
立于它所描述的媒体而存在,其应用范围很广。

例如:多媒体图书馆、多媒体编辑、多媒体查询、购物、音乐词典等。

4.2.5MPEG-21
MPEG-21的正式名称是多媒体框架,又称数字视听框架,是
一个在交互通信中的多媒体框架、综合应用标准,其目标是“将标准集成起来相互支持和相互协调以管理多媒体商务。

”在这个框架下一个用户可以和另一个用户自由地交换信息并进行处理。

4.3DV压缩格式
DV(DigitalVideo)是一种专门用来在专用盒式录像带上记录和播放数字视频的压缩格式标准,它是由日本索尼、松下十多个国际性大公司于1996年联合推出,并由国际电信联盟批准使用。

目前世界上有60多个厂家的数字摄像机产品都采用了DV格式标准。

经过性能检测,DV产品的信号质量完全能达到专业广播级水平。

DV格式水平清晰度达500线,图像清晰度高。

DV标准使用分量记录方式,它使用的是4:1:1(PAL)数字分量编码系统。

DV标准采用基于DCT的帧内压缩算法,可以提供精确到帧的随机存取访问,压缩比为5:1,压缩后的视频记录码率为25Mb/s,此信号还可以进一步处理后再记录在磁带上。

5结束语
视频信号数字化已成为视频领域的发展方向,而由于数字化引起的比特率的明显增加,给数字视频信号的传输和处理带来很大困难,因此产生的数字视频压缩可有效地解决这个问题。

数字视频处理领域中使用较多的M-JPEG、MPEG和DV三种压缩编码,各有其特点和发挥其作用的场合,同时它们也各自存在不足之处甚至有明显缺点。

在目前情况下,无论选用MPEG还是DV作为视频格式标准,都可以得到满意的结果。

参考文献:
[1]江铁成.如何选择非线性编辑系统[J].电视技术,2000,(8):71-75.
[2]冯锡增.非线性编辑应用基础[M].北京:中国广播电视出版社,2000.
[3]方德葵,杨盈昀,等.电视节目编辑与制作技术[M].北京:中国广播电视出版社,2005.
[4]江铁成.非线性编辑系统的硬件平台和应用软件[J].电脑知识与技术,2006,(35):104-106.
[5]王敏,江铁成,熊飞.3dsmax动画标准教程[M].北京:中国青年出版社,2007.
214。

相关文档
最新文档