数字视频图像的处理技术

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

多媒体技术及其应用
本栏目责任编辑：李桂瑾
１引言
视频信号经过数字化处理后具有巨大的数据量。

按照国际电信联盟（ＩＴＵ）６０１的建议，如果存储在硬盘上，１ＧＢ的硬盘空间只能记录４９秒的电视视频信号。

在现有的硬件和软件的条件下，对不压缩视频信号无论是实时处理，还是存储和传输都存在困难。

因此，需要对数字视频图像进行压缩，以降低其数据率。

信息理论为编码和压缩提供了理论基础。

信息理论认为对信号量化后的原始编码与它所包含的信息量并不相等，二者的差就是冗余。

压缩编码的目的是尽量减少冗余，争取以最少的编码表达最完整的信息。

２视频压缩编码的基本概念
视频压缩的目标是尽可能在保证视觉效果的前提下减少视频数据率。

由于视频可以看成是连续的静态图像，因此其压缩编码算法与静态图像的压缩编码算法有些共同之处，但运动视频还有其本身的特性，所以在压缩时还应考虑其运动特性才能达到高压缩的目标。

在视频压缩中常用到以下一些基本概念：
２．１有损压缩和无损压缩
在视频压缩中有损和无损的概念与静态图像中基本类似。

无损压缩也即压缩后的数据和压缩前的原始信号完全一致。

无损压缩的压缩比太低，这限制了在视频压缩中的应用。

有损压缩是解压缩后的数据与压缩前的数据不一致。

在压缩过程中要丢失一些人眼和人耳所不敏感的图像和音频信息，而且丢失的信息不可恢复。

几乎所有高压缩的算法都采用有损压缩，这样才能达到低数据率的目标。

丢失的数据率与压缩比有关，压缩比越高，丢失的数据越多，解压缩后的效果一般越差。

此外，某些有损压缩算法采用多次重复压缩的方式，这样还会引起额外的数据丢失。

２．２帧内压缩和帧间压缩
帧内压缩也称为空间压缩。

当压缩一帧图像时，仅考虑本帧的数据而不考虑相邻帧之间的冗余信息，这实际上与静态图像压缩类似。

帧内一般采用有损压缩算法，由于帧内压缩时各个帧之间没有相互关系，所以压缩后的视频数据仍可以以帧为单位进行编辑。

帧内压缩一般达不到很高的压缩比。

采用帧间压缩是基于视频或动画的相邻帧具有很大的相关性，或者说前后两帧变化很小，根据连续视频其相邻帧之间具有冗余信息这一特性，压缩相邻帧之间的冗余就可以进一步增加压缩量，提高压缩比。

帧间压缩也称为时间压缩，它通过比较时间轴上不同帧之间的数据进行压缩。

帧间压缩一般是无损的。

帧差值算法是一种典型的时间压缩法，它通过比较本帧与相邻帧之间的差异，仅记录本帧与其相邻帧的差值，这样可以大大减少数据量。

２．３对称编码和不对称编码
对称性是压缩编码的一个关键特征。

对称意味着压缩和解压缩中用相同的计算处理能力和时间，对称算法适合于实时压缩和传送视频。

把视频预先压缩处理后，然后再播放就是采用不对称编码。

不对称意味着压缩时需要花费大量的处理能力和时间，而解压
缩时则能较好地实时回放，也即压缩和解压缩的速度不同。

一般来说，压缩一段视频的时间比回放（解压缩）该视频的时间要长。

３常用视频压缩技术
３．１预测编码
预测编码（ＤＰＣＭ）也称为差值编码，是根据原始信号的统计
特性进行预测，通过差值除去视频图像信号的相关性，以达到压缩的目的。

预测编码既可以在帧内预测，也可以在帧间预测。

帧内预测编码的理论依据是电视图像在水平方向上和垂直方向上相邻像素之间存在着相关性，可以根据前面已知的几个像素值来推测当前像素的值，这些像素可以是同一扫描行内或相邻的不同扫描行上，分别称为一维或二维预测，然后对实际值与预测值的差值进行量化和编码。

这种编码方式硬件实现比较简单，但会产生误码扩散，导致图像质量明显下降。

帧内预测编码效率较低，压缩比只有两三倍，使用范围有限。

帧（场）间预测编码依据视频信号的相邻帧（场）间存在的相关性进行压缩。

采用这种编码可以获得较高的压缩比，在运动慢的区域，帧间预测性能较好，但在运动剧烈的区域，帧间预测性能差，一般在这种情况下采用帧内编码方法。

帧间预测编码广泛应用于常规电视、高清晰度电视、会议电视和电视电话等视频信号的压缩编码。

３．２离散余弦变换编码
预测编码是为了除去视频信号的相关性，除去信号视频间的相关性更为有效的方法是进行正交变换。

在视频压缩中，离散余弦变换（ＤＣＴ）是最常用的编码方法。

变换编码之所以被广泛使用，是因为在变换域里描述视频图像比空间域里简单，利用变换编码，视频图像的相关性明显下降，信号能量集中在几个变换系数上，可有效压缩数据，具有较强的抗干扰能力，传输过程中的误码对图像质量的影响远小于预测编码。

ＤＣＴ编码有快速算法，能实现实时视频压缩，此外变换编码还能充分利用人眼的视觉特性。

３．３分形图像压缩
分形几何方法是一种较新的图像压缩方法，几何学的自相似原理告诉我们无论物体几何尺度如何变化，景物任何一小部分的形状都与较大部分的形状极其相似。

分形几何研究的对象是那些不规则而有自相似性的形状。

分形编码实际就是把图像分割成若干个子图像，子图像通过迭代函数反复迭代而成，这些迭代函数只需几个参数即可确定，因此得到较高的压缩比。

分形理论用于
收稿日期：２００７－０６－２０
作者简介：江铁成（１９７１－），男，安徽潜山人，讲师，工程师，主要从事影视制作、非线性编辑课程的教学和研究；孙灿明（１９５１－），女，安徽无为人，高级工程师，主要从事电视节目制作和编辑工作。

数字视频图像的处理技术
江铁成１，孙灿明２
（１．安徽广播影视职业技术学院，安徽合肥２３００２２；２．安徽电视台，安徽合肥２３００６６）
摘要：数字视频压缩已成为数字视频图像处理的关键技术之一。

本文描述了视频压缩编码的基本概念，论述了常用视频压缩技术，然后较详细的介绍了视频压缩格式。

关键词：数字视频；压缩；编码；图像处理；视频压缩格式中图分类号：ＴＮ９１１文献标识码：Ａ文章编号：１００９－３０４４（２００７）１３－３０２１３－０２
ＴｈｅＰｒｏｃｅｓｓｉｎｇＴｅｃｈｎｏｌｏｇｙｏｆＤｉｇｉｔａｌＶｉｄｅｏｓ
ＪＩＡＮＧＴｉｅ－ｃｈｅｎｇ１，ＳＵＮＣａｎ－ｍｉｎｇ２
（１．ＡｎｈｕｉＢｒｏａｄｃａｓｔｉｎｇＭｏｖｉｅ＆ＴＶＶｏｃａｔｉｏｎａｌＣｏｌｌｅｇｅ，Ｈｅｆｅｉ２３００２２，Ｃｈｉｎａ；２．ＡｎｈｕｉＴＶＳｔａｔｉｏｎ，Ｈｅｆｅｉ２３００６６，Ｃｈｉｎａ）
Ａｂｓｔｒａｃｔ：Ｔｈｅｔｅｃｈｎｏｌｏｇｙｏｆｄｉｇｉｔａｌｖｉｄｅｏｃｏｍｐｒｅｓｓｉｏｎｈａｓａｌｒｅａｄｙｂｅｃｏｍｅａｋｅｙｏｎｅｉｎｔｈｅｐｒｏｃｅｓｓｉｏｎｏｆｄｉｇｉｔａｌｖｉｄｅｏｓ．Ｔｈｅｐａｐｅｒｐｒｅｓｅｎｔｓｔｈｅｃｏｍｍｏｎｔｅｃｈｎｏｌｏｇｙｏｆｖｉｄｅｏｃｏｍｐｒｅｓｓｉｏｎａｓｗｅｌｌａｓｔｈｅｂａｓｉｃｄｅｆｉｎｉｔｉｏｎｏｆｔｈｅｖｉｓｕａｌｃｏｍｐｒｅｓｓｉｏｎａｎｄｃｏｄｅ，ａｎｄｉｔａｌｓｏｉｎｔｒｏｄｕｃｅｓｔｈｅｆｏｒｍａｔｏｆｖｉｄｅｏｃｏｍｐｒｅｓｓｉｏｎ．
Ｋｅｙｗｏｒｄｓ：ｄｉｇｉｔａｌｖｉｄｅｏ；ｃｏｍｐｒｅｓｓｉｏｎ；ｃｏｄｅ；ｖｉｄｅｏｐｒｏｃｅｓｓｉｏｎ；ｔｈｅｆｏｒｍａｔｏｆｖｉｄｅｏｃｏｍｐｒｅｓｓｉｏｎ
２１３
多媒体技术及其应用
本栏目责任编辑：李桂瑾
电脑知识与技术
图像压缩十分有效，因为自然界中普遍存在分形物体，它们表面上具有非常复杂的统计特性和视觉特性，都只有很少的信息含义，可以用几条简单的确定规则迭代出来。

传统的压缩技术几乎不能压缩这类图像，而分形编码只需几条变换规则进行编码，得到很高的压缩比。

分形图像压缩技术还未成熟，是一种很有潜力的压缩技术。

３．４小波压缩
针对ＤＣＴ编码存在的一些缺点，最近小波变换也应用于图像压缩编码中。

小波压缩采用局部函数在频域和时域同时分析法，将图像信号分解成不同频率区域，然后根据图像统计特性和人眼生理特性，在不同的频域采用不同的压缩方法，使视频数据量减少。

小波变换具有频率上的自由伸缩性，不受图像带宽的限制，在编码过程中即使取较大的压缩比，仍可得到高质量的重建图像。

目前，小波变换压缩技术正在发展之中，有些厂家虽然做过实验，但仍未实际应用在非线性编辑系统之中，它将成为图像压缩领域研究的重要方向。

４视频压缩格式
视频处理卡的重要功能就在于对视频信号进行采集压缩，然后解压播放。

不同厂家的处理卡采用的压缩技术也不同，这决定了视频信号的质量也有所不同。

视频压缩标准化对集成电路的大量生产、降低生产成本、解决不同厂家设备的兼容性有重要意义。

目前应用于数字图像处理技术的几种压缩方式包括：Ｍ－ＪＰＥＧ、ＭＰＥＧ、ＤＶ压缩格式等。

４．１Ｍ－ＪＰＥＧ压缩格式
Ｍ－ＪＰＥＧ是Ｍｏｔｉｏｎ－ＪＰＥＧ的简称，是目前数字视频图像处理中最常用的一种压缩格式，非线性编辑系统虽然采用Ｍ－ＪＰＥＧ压缩方式，但不能相互通用，不同的厂家是在ＪＰＥＧ的基础上各自开发出Ｍ－ＪＰＥＧ技术。

ＪＰＥＧ（ＪｏｉｎｔＰｈｏｔｏｇｒａｐｈｉｃＥｘｐｅｒｔＧｒｏｕｐ）即联合图像专家组，它是由国际标准化组织ＩＳＯ、国际电报电话咨询委员会ＣＣＩＴＴ、国际电工委员会ＩＥＣ共同联合于１９８６年正式开始制定的标准。

它主要用于连续色调（灰度和彩色）静止图像压缩。

ＪＰＥＧ最初虽然是为静止图像设计的，但实际上只要硬件处理速度足够快，完全可以应用于视频压缩。

因此，许多视频处理系统生产厂家在ＪＰＥＧ的基础上开发了Ｍ－ＪＰＥＧ压缩技术。

Ｍｏｔｉｏｎ－ＪＰＥＧ可以理解为活动图像的ＪＰＥＧ压缩，它是将静态图像压缩格式ＪＰＥＧ优化后，用来对活动图像进行实时的帧内压缩。

帧内压缩有一个好处就是可以精确定位每一帧图像，这一点非常适合非线性编辑。

在编辑过程中，可以随机存取任意一帧图像，对于帧编辑十分理想。

Ｍ－ＪＰＥＧ采用ＤＣＴ编码技术，ＤＣＴ是一种有信息损失的压缩技术，在压缩过程中，图像的信息会丢失，图像的压缩一般通过专用处理器来实现，可以大大提高处理速度和提高图像还原质量。

Ｍ－ＪＰＥＧ压缩处理器的主要功能是实时压缩和解压缩动态黑白和彩色图像。

Ｍ－ＪＰＥＧ是一种对称的压缩方式，压缩过程和解压缩过程是可逆的，两个过程都是实时处理的。

非对称压缩方式的压缩过程需要更多的处理步骤，产生一定的延时，因此非线性编辑、可视电话等实时性强的系统多采用对称式压缩方式。

４．２ＭＰＥＧ压缩格式
ＭＰＥＧ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔＧｒｏｕｐ）即活动图像专家组。

Ｍ－ＪＰＥＧ是基于静态图像的压缩技术，ＭＰＥＧ却是基于动态图像的压缩标准。

ＭＰＥＧ的主要任务是为了把计算机系统和广播电视系统结合起来，建立同一的信息网络，即多媒体网络。

ＭＰＥＧ压缩标准于１９９０年制订，是一种既可以通过软件实现，也可以通过硬件实现的标准。

ＭＰＥＧ又是一个标准系列，依发表的时间顺序为ＭＰＥＧ－１、ＭＰＥＧ－２、ＭＰＥＧ－４、ＭＰＥＧ－７、ＭＰＥＧ－２１等。

各有不同的特点和应用：
４．２．１ＭＰＥＧ－１
ＭＰＥＧ－１以４：２：０采样压缩，每秒１．２Ｍｂｉｔｓ的传输码率，图像大小３５２×２８８，ＭＰＥＧ－１采用帧间编码技术，帧间编码比帧内编码可达到更高的压缩比，而且能够进行自适应帧内／帧间编码。

图像
活动剧烈时，视频信号的帧间相关性下降，帧内相关性增强；图像
活动缓慢或静止时，帧间相关性增强，因此采用自适应帧内／帧间编码使帧间预测误差减小，提高编码效率。

ＭＰＥＧ－１标准提供的图像质量比电视略强，适合于非专业视频领域，如ＶＣＤ等，但用于广播电视方面其视频质量是远远不够的。

４．２．２ＭＰＥＧ－２
ＭＰＥＧ－２是一种高质量视频的压缩标准，也有人称它为用于广播电视的视频压缩标准。

ＭＰＥＧ－２视频体系包括５类４个等级，适应广播、通信、计算机和家电视听工业的不同需求。

ＭＰＥＧ－２的专业版本采用４：２：２采样压缩，传输码率每秒可达５０－６０Ｍｂｉｔｓ。

在同等视频质量下，ＭＰＥＧ－２所占空间为Ｍ－ＪＰＥＧ的１０％－１５％，同时ＭＰＥＧ－２已经成为ＤＶＤ和ＤＶＢ的标准。

因此，有些非线性编辑系统也采用ＭＰＥＧ－２这种压缩方式。

４．２．３ＭＰＥＧ－４
继成功制定了ＭＰＥＧ－１、ＭＰＥＧ－２标准后，ＭＰＥＧ于１９９４年开始制定ＭＰＥＧ－４标准，历时５年多完成。

它是一种广域传输标准，传输码率在１０ｋｂｐｓ到１Ｍｂｐｓ之间。

ＭＰＥＧ－４具有很多新功
能，最关键的是打破了以往基于像素的编码概念，而采取了完全崭新的“基于音频和可视对象的编码”技术。

ＭＰＥＧ－４应用范围非常广，一般说来能满足各种不同应用的需要，能适应不同传输带宽、不同尺寸和分辨率不同的图像质量。

如视频会议、视频电话、交互式视频游戏、多媒体通信、多媒体邮件、远程教育、交互电视、电子节目指南等。

４．２．４ＭＰＥＧ－７
ＭＰＥＧ－７标准又称为多媒体内容描述接口。

它不是信息压缩编码技术，而是多媒体内容描述的标准。

ＭＰＥＧ－７的描述可以独
立于它所描述的媒体而存在，其应用范围很广。

例如：多媒体图书馆、多媒体编辑、多媒体查询、购物、音乐词典等。

４．２．５ＭＰＥＧ－２１
ＭＰＥＧ－２１的正式名称是多媒体框架，又称数字视听框架，是
一个在交互通信中的多媒体框架、综合应用标准，其目标是“将标准集成起来相互支持和相互协调以管理多媒体商务。

”在这个框架下一个用户可以和另一个用户自由地交换信息并进行处理。

４．３ＤＶ压缩格式
ＤＶ（ＤｉｇｉｔａｌＶｉｄｅｏ）是一种专门用来在专用盒式录像带上记录和播放数字视频的压缩格式标准，它是由日本索尼、松下十多个国际性大公司于１９９６年联合推出，并由国际电信联盟批准使用。

目前世界上有６０多个厂家的数字摄像机产品都采用了ＤＶ格式标准。

经过性能检测，ＤＶ产品的信号质量完全能达到专业广播级水平。

ＤＶ格式水平清晰度达５００线，图像清晰度高。

ＤＶ标准使用分量记录方式，它使用的是４：１：１（ＰＡＬ）数字分量编码系统。

ＤＶ标准采用基于ＤＣＴ的帧内压缩算法，可以提供精确到帧的随机存取访问，压缩比为５：１，压缩后的视频记录码率为２５Ｍｂ／ｓ，此信号还可以进一步处理后再记录在磁带上。

５结束语
视频信号数字化已成为视频领域的发展方向，而由于数字化引起的比特率的明显增加，给数字视频信号的传输和处理带来很大困难，因此产生的数字视频压缩可有效地解决这个问题。

数字视频处理领域中使用较多的Ｍ－ＪＰＥＧ、ＭＰＥＧ和ＤＶ三种压缩编码，各有其特点和发挥其作用的场合，同时它们也各自存在不足之处甚至有明显缺点。

在目前情况下，无论选用ＭＰＥＧ还是ＤＶ作为视频格式标准，都可以得到满意的结果。

参考文献：
［１］江铁成．如何选择非线性编辑系统［Ｊ］．电视技术，２０００，（８）：７１－７５．
［２］冯锡增．非线性编辑应用基础［Ｍ］．北京：中国广播电视出版社，２０００．
［３］方德葵，杨盈昀，等．电视节目编辑与制作技术［Ｍ］．北京：中国广播电视出版社，２００５．
［４］江铁成．非线性编辑系统的硬件平台和应用软件［Ｊ］．电脑知识与技术，２００６，（３５）：１０４－１０６．
［５］王敏，江铁成，熊飞．３ｄｓｍａｘ动画标准教程［Ｍ］．北京：中国青年出版社，２００７．
２１４。