数字视频图像的处理技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多媒体技术及其应用

本栏目责任编辑:李桂瑾

1引言

视频信号经过数字化处理后具有巨大的数据量。按照国际电信联盟(ITU)601的建议,如果存储在硬盘上,1GB的硬盘空间只能记录49秒的电视视频信号。在现有的硬件和软件的条件下,对不压缩视频信号无论是实时处理,还是存储和传输都存在困难。因此,需要对数字视频图像进行压缩,以降低其数据率。信息理论为编码和压缩提供了理论基础。信息理论认为对信号量化后的原始编码与它所包含的信息量并不相等,二者的差就是冗余。压缩编码的目的是尽量减少冗余,争取以最少的编码表达最完整的信息。

2视频压缩编码的基本概念

视频压缩的目标是尽可能在保证视觉效果的前提下减少视频数据率。由于视频可以看成是连续的静态图像,因此其压缩编码算法与静态图像的压缩编码算法有些共同之处,但运动视频还有其本身的特性,所以在压缩时还应考虑其运动特性才能达到高压缩的目标。在视频压缩中常用到以下一些基本概念:

2.1有损压缩和无损压缩

在视频压缩中有损和无损的概念与静态图像中基本类似。无损压缩也即压缩后的数据和压缩前的原始信号完全一致。无损压缩的压缩比太低,这限制了在视频压缩中的应用。有损压缩是解压缩后的数据与压缩前的数据不一致。在压缩过程中要丢失一些人眼和人耳所不敏感的图像和音频信息,而且丢失的信息不可恢复。几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标。丢失的数据率与压缩比有关,压缩比越高,丢失的数据越多,解压缩后的效果一般越差。此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。

2.2帧内压缩和帧间压缩

帧内压缩也称为空间压缩。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内一般采用有损压缩算法,由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩比。

采用帧间压缩是基于视频或动画的相邻帧具有很大的相关性,或者说前后两帧变化很小,根据连续视频其相邻帧之间具有冗余信息这一特性,压缩相邻帧之间的冗余就可以进一步增加压缩量,提高压缩比。帧间压缩也称为时间压缩,它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值算法是一种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。

2.3对称编码和不对称编码

对称性是压缩编码的一个关键特征。对称意味着压缩和解压缩中用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频。把视频预先压缩处理后,然后再播放就是采用不对称编码。不对称意味着压缩时需要花费大量的处理能力和时间,而解压

缩时则能较好地实时回放,也即压缩和解压缩的速度不同。

一般来说,压缩一段视频的时间比回放(解压缩)该视频的时间要长。

3常用视频压缩技术

3.1预测编码

预测编码(DPCM)也称为差值编码,是根据原始信号的统计

特性进行预测,通过差值除去视频图像信号的相关性,以达到压缩的目的。预测编码既可以在帧内预测,也可以在帧间预测。

帧内预测编码的理论依据是电视图像在水平方向上和垂直方向上相邻像素之间存在着相关性,可以根据前面已知的几个像素值来推测当前像素的值,这些像素可以是同一扫描行内或相邻的不同扫描行上,分别称为一维或二维预测,然后对实际值与预测值的差值进行量化和编码。这种编码方式硬件实现比较简单,但会产生误码扩散,导致图像质量明显下降。帧内预测编码效率较低,压缩比只有两三倍,使用范围有限。帧(场)间预测编码依据视频信号的相邻帧(场)间存在的相关性进行压缩。采用这种编码可以获得较高的压缩比,在运动慢的区域,帧间预测性能较好,但在运动剧烈的区域,帧间预测性能差,一般在这种情况下采用帧内编码方法。帧间预测编码广泛应用于常规电视、高清晰度电视、会议电视和电视电话等视频信号的压缩编码。

3.2离散余弦变换编码

预测编码是为了除去视频信号的相关性,除去信号视频间的相关性更为有效的方法是进行正交变换。在视频压缩中,离散余弦变换(DCT)是最常用的编码方法。变换编码之所以被广泛使用,是因为在变换域里描述视频图像比空间域里简单,利用变换编码,视频图像的相关性明显下降,信号能量集中在几个变换系数上,可有效压缩数据,具有较强的抗干扰能力,传输过程中的误码对图像质量的影响远小于预测编码。DCT编码有快速算法,能实现实时视频压缩,此外变换编码还能充分利用人眼的视觉特性。

3.3分形图像压缩

分形几何方法是一种较新的图像压缩方法,几何学的自相似原理告诉我们无论物体几何尺度如何变化,景物任何一小部分的形状都与较大部分的形状极其相似。分形几何研究的对象是那些不规则而有自相似性的形状。分形编码实际就是把图像分割成若干个子图像,子图像通过迭代函数反复迭代而成,这些迭代函数只需几个参数即可确定,因此得到较高的压缩比。分形理论用于

收稿日期:2007-06-20

作者简介:江铁成(1971-),男,安徽潜山人,讲师,工程师,主要从事影视制作、非线性编辑课程的教学和研究;孙灿明(1951-),女,安徽无为人,高级工程师,主要从事电视节目制作和编辑工作。

数字视频图像的处理技术

江铁成1,孙灿明2

(1.安徽广播影视职业技术学院,安徽合肥230022;2.安徽电视台,安徽合肥230066)

摘要:数字视频压缩已成为数字视频图像处理的关键技术之一。本文描述了视频压缩编码的基本概念,论述了常用视频压缩技术,然后较详细的介绍了视频压缩格式。

关键词:数字视频;压缩;编码;图像处理;视频压缩格式中图分类号:TN911文献标识码:A文章编号:1009-3044(2007)13-30213-02

TheProcessingTechnologyofDigitalVideos

JIANGTie-cheng1,SUNCan-ming2

(1.AnhuiBroadcastingMovie&TVVocationalCollege,Hefei230022,China;2.AnhuiTVStation,Hefei230066,China)

Abstract:Thetechnologyofdigitalvideocompressionhasalreadybecomeakeyoneintheprocessionofdigitalvideos.Thepaperpresentsthecommontechnologyofvideocompressionaswellasthebasicdefinitionofthevisualcompressionandcode,anditalsointroducestheformatofvideocompression.

Keywords:digitalvideo;compression;code;videoprocession;theformatofvideocompression

213

相关文档
最新文档