图像压缩技术的发展现状与趋势

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

图像压缩技术的发展现状与趋势
耿玉静1 赵华2
1燕山大学信息科学与工程学院河北秦皇岛（066004）
2河北师范大学电子系河北保定（071003）
E-mail: gyjlunwen@
摘要文章简要论述了图像和视频压缩技术的研究状况，就目前国际上正在研究的压缩标准和方法作了介绍，并对图像和视频压缩技术的发展趋势和前景进行了初步探讨。

关键词图像压缩，视频编码，视频对象，压缩标准
1．图像压缩的可行性
图像编码压缩的目的是对要处理的图像源数据按一定的规则进行变换和组合[1]，从而达到以尽量少的比特数来表征图像，同时尽可能好的复原图像的质量，使它符合预定应用场合的要求。

图像数据之所以可以进行压缩，是因为有以下几个方面的原因:组成图像的各像素之间，无论在行方向还是列方向都存在一定的相关性，即原始图像数据是高度相关的，应用某种编码方法提取或减少这些相关性，便可达到压缩数据的目的；从信息论看，描述图像信源的数据是由有效信息量和冗余量两部分组成的，去除冗余量能够节省传输和存储中的开销，同时又不损害图像信源的有效信息量；有些场合允许图像编码有一定的失真，也是图像可以压缩的一个重要原因。

2．图像压缩的分类
图像压缩编码的方法目前有很多种，出发点不同其分类亦有差异。

以信息保真度为出发点，可以分为两大类：一类是冗余度压缩法。

如著名的哈夫曼编码、香农编码、游程编码等，其特征是压缩比较低（一般不超过8:1），但不丢失任何数据，可以严格恢复原图像，实现编/解码的互逆，故又称可逆编码或无损压缩。

另一类是熵压缩法。

如预测编码、变换编码、统计编码等，由于在压缩过程中要丢失一些人眼所不敏感的图像信息，且所丢失的信息不可恢复，即图像还原后与压缩前不完全一致，故又称有损压缩。

以具体编码技术为出发点，可以分为：预测编码、变换编码、统计编码、轮廓编码、模型编码等。

3．图像压缩技术的现状
20世纪80年代后，ISO、IEC和ITU陆续制定了各种数据压缩与通信的标准与建议。

3.1静止图像压缩标准：JPEG标准&JPEG 2000 标准
3.1.1 JPEG 标准
JPEG 全名为Joint Photographic Experts Group，是一个在国际标准组织（ISO）下从事静止图像压缩标准制定的委员会。

JPEG标准从1986年正式开始制订，1988年决定采用以图像质量最好的ADCT（Adaptive Discrete Cosine Transform）方式为基础的算法作标准[2]，于1991年3月提出10918号标准[3]“连续色调静止图像的数字压缩编码”，即JPEG标准[4,5]。

它在较低的计算复杂度下，能提供较高的压缩比与保真度。

- 1 -
JPEG采用4种编解码方式：串行DCT(Discrete Cosine Transform)方式、渐进浮现式DCT 方式、无失真方式和分层方式[6]。

由于JPEG优良的品质，使它在短短几年内就获得极大的成功。

随着多媒体应用领域激增，传统的JPEG压缩技术已无法满足人们对多媒体影像资料的要求。

因此，更高压缩率以及更多功能的新一代静止影像压缩技术JPEG2000就诞生了。

3.1.2 JPEG2000
JPEG2000，正式名称为“ISO 15444”[2,6,7]，亦是由JPEG组织负责制定。

自1997年3月开始筹划，2000年规定基本编码系统的最终协议草案才提出。

JPEG2000与JPEG最大的不同，在于它放弃了JPEG所采用的以DCT为主的区块编码方式，而改用以DWT（Discrete Wavelet Transform）为主的多分辨率编码方式[6]。

JPEG2000的新特征有：
① JPEG2000作为JPEG的升级版，具有良好的低比特率性能，特别是对细节丰富的图像以
0.25bpp的比特率进行压缩时，总体上其压缩率比JPEG高约30%左右。

② JPEG2000同时支持有损和无损压缩；而JPEG只支持有损压缩。

③ JPEG2000能实现渐进传送。

它先传输图像的轮廓，然后逐步传输图像数据的细节，接
收端重构图像时让图像由朦胧到清晰显示，而不像JPEG那样由上到下由左到右的显示。

④ JPEG2000支持所谓的“感兴趣区域”编码（Region of interest coding）[7]。

可任意指定
图像上感兴趣区域的压缩质量，亦可以选择指定的部分先解压缩以突出重点。

3.2运动图像压缩标准：MPEG-X系列&H.26X系列
3.2.1 MPEG 系列
MPEG(Moving Picture Experts Group)运动图像专家组成立于1988年，专门从事运动图像和伴音编码的标准制定。

MPEG最初的三个任务是制定1.5Mb/s，10Mb/s，40Mb/s的压缩编码标准，即MPEG-1、MPEG-2、MPEG-3，后因MPEG-2的功能使MPEG-3多余，故MPEG-3被撤消[8]。

MPEG-4于1994年开始制定，其目的是实现甚低码率的音/视频压缩编码。

MPEG-1是1991年11月提出草案，1992年11月通过，1993年8月公布的。

它适用于1.5Mb/s速率的数字存储媒体的运动图像及伴音的压缩编码。

MPEG-1追求高的压缩比，去除图像序列的时间冗余度，同时满足多媒体等随机存取的要求。

它的图像类型有三种：I图像，采用内部编码，不参照其他图像，亦称内部编码图像；P图像，采用预测编码，参照前一幅I或P图像作运动补偿编码，亦称预测编码；B图像，采用双向预测编码，参照前一幅和后一幅I或P图像作双向运动补偿编码，亦称双向预测图像[9]。

MPEG-2制定于1994年，其设计目标是高级工业标准的图像质量以及更高的传输率。

它进一步提高了压缩比，改善了音频、视频质量，采用的核心技术是分块DCT和帧间运动补偿预测技术[10]。

MPEG-2所能提供的传输率在3～10Mb/s间，在NTSC制下的分辨率可达720×486；可提供广播级的视像和CD级的音质；向下兼容MPEG-1，使得大多数MPEG-2解码器可播放MPEG-1格式的数据，如VCD；MPEG-2除了作为DVD的指定标准外，还可以用于为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频；MPEG-2可提供一个较广范围的压缩比[11]，以适应不同画面质量、存储容量以及带宽的要求。

MPEG-4是对数字音/视频数据进行压缩、通信、存取和操作管理等的新标准，并为各种通信环境提供一种通用的技术解决方案。

MPEG专家组深入分析了信息领域中计算机、通
- 2 -
信以及以电视为代表的消费电器即3C交叉融合的方式后[12]，认为MPEG-4应提供用于通信的新方式，其中心是基于内容的AV信息存储、处理与操作，支持交互性、高压缩比以及通用存储性等功能。

在其结构上应具有适应性与可扩张性，以适应软、硬件技术的不断发展，及时融合新的技术。

由于MPEG-4的中心是基于内容与交互性的，它就不再对低码率范围做出特别要求。

MPEG-4在通信信息描述中，首次提出了对象的概念[13]，如视频对象VO（Video Object）、音频对象AO（Audio Object）等，这是一个新的飞跃。

在编码方案上，MPEG-4仍是以块为基础的混合编码。

MPEG-4标准主要应用于视频电话、视频电子邮件和电子新闻等，其传输速率要求较低，在4.8～64kb/s之间，分辨率为176×144。

MPEG-4利用很窄的带宽，通过帧重建技术，压缩和传输数据，以求以最少数据获得最佳图像质量。

MPEG-4更适用于交互AV服务以及远程监控。

MPEG-7由MPEG委员会于1998年10月提出提议，2001年9月正式成为国际标准，又称为“多媒体内容描述接口（Multimedia Content Description Interface）”[12]，其目标是建立对多媒体信息内容的标准化描述，试图规范不同种类多媒体信息的描述而不受表达形式的限制。

这些描述要与信息内容直接相关以便用来快速有效的查询、访问各种多媒体信息。

MPEG-7的应用范围广泛，既可以应用于存储，也可用于流式应用（如广播、将模型加入Internet等）。

它可以在实时或非实时环境下应用，如数字图书馆、多媒体编辑等。

另外，MPEG-7在教育、新闻、导游信息、娱乐、研究业务、地理信息系统、医学、购物、建筑等各方面均有较深的应用潜力。

MPEG-21是基于“多媒体框架（Multimedia Framework）标准”[12]的，其最终目的是建立一个多媒体框架，以通过预购网络和设备使多媒体资源在用户之间透明方便的使用。

MPEG-21的基本框架要素包括数字项目说明、内容表示、数字项目的识别和描述、内容管理和使用、知识产权管理和保护、终端和网络、事件报告等。

它支持的功能有：通过网络存储，使用并交互操作多媒体对象；实现多种业务模型，包括对版权和交易的自动管理；对内容进行隐私的尊重等。

目前，这一标准仍处于开发当中。

3.2.2 H.26X系列
1984年国际电报电话咨询委员会的第23研究组建立了一个专家组专门研究电视电话的编码问题。

经过研究与努力，1988年形成草案，1990年12月通过ITU-T的H.261建议。

H.261是ITU-T针对可视电话和会议、窄带ISDN等要求实时编码和低延时应用提出的一个编码标准[12]。

它允许“采用p×64kbit的图像业务的图像编解码”，因而H.261简称p×64。

其中p是一个整数，取值范围为1～30，对应比特率为64kb/s～1.92Mb/s[14]。

它建议采用中间格式CIF（Common Intermediate Format）和QCIF（Quarter CIF）解决不同制式通信的矛盾；解决了编码算法问题。

H.261采用了运动补偿预测和离散余弦变换相结合的混合编码方案，获得很好的图像压缩效果。

1995年，在H.261的基础上，ITU-T总结当时国际上视频图像压缩编码的最新进展，针对低比特率视频应用制定了H.263标准。

它提高了运动补偿的精度，常用于超低速率的图像传输，被公认为是以像素为基础的采用第一代编码技术的混合编码方案所能达到的最佳结
- 3 -
果。

之后，ITU-T又对其进行了补充，以提高编码效率，增强编码功能。

补充修订的版本有1998年的H.263+，2000年的H.263++[12]。

H.263采用第一代编码技术，在低速率视频传输质量，抗误码能力方面有明显提高，在视频业务传输中得到广泛应用。

与H.261只能工作在CIF、QCIF两种格式不同，H.263的信源编码器可以工作于5种图像格式：QCIF、Sub-QCIF、CIF、4CIF、16CIF。

另外，H.263还在H.261基本编码算法的基础上提供了四种可选编码模式：非限制运动矢量模式、基于语法的算术编码模式、高级预测模式以及PB帧模式[15,17]。

由于仅限于五种固定图像大小、形状和时钟频率，它应用的灵活性较低。

H.263+即ITU-T在1998年通过的H.263第二版，增加了12个新的高级模式，修正了第一版中的非限制运动矢量模式[16,18]。

修订版首先在视频格式多样性上做了改进，还提出一些新技术：如附加增强信息模式和增强参考帧再采样模式，进一步扩大适用范围，支持图像冻结和快照，以及多分辨率视频的应用，同时还增加了一些新技术来增强抗误码的能力：如分片结构模式、增强参考帧选择模式等，使视频信号经过压缩编码后能够在具有较大噪声干扰的窄带信道PSTN（Integrate Services Digital Network）和无限移动信道等上传输。

通过使用去方块效应滤波器，降低分辨率更新模式和修正量化模式等新技术，重建图像的主观质量显著提高。

由于H.263+的高级模式有些不能同时使用，有些需结合使用，如何选择合适的编码模式结合，对使用者来说很困难，因此ITU-T于2000年11月提出了H.263++，称为H.263的第三版。

它在H.263+的基础上增加了三个高级模式。

H.26L标准是ITU-T和ISO/IEC联合制定的最新的图像压缩编码标准，它最先由ITU-T 的VCEG于1997年提出的，它的目标是提出一种更高性能的视频质量有实质性提高的视频编码标准。

该标准于2003年3月完成，在ITU-T中被称为Recommendation H .264而在ISO/IEC中成为MPEG-4标准的第10部分（ISO/IEC 14496-10 AVC，简称MPEG-4-10）。

H.26L的一个基本概念是引入了两个不同的层次：视频编码层（VCL：Video Coding Layer）以及网络适配层（NAL：Network Adapter Layer）[19]，前者负责对视频进行高效的压缩，后者则负责根据网络的传输需要进行编码数据的打包。

H.26L相对于其他标准有以下的特点：低码率、高质量、可达到比H.263+提高一倍以上的编码效率；广阔的应用范围，既可用于严格时延限制的实时通信，可用于对时延要求不高的其他应用；稳健性，在网络中传输时，有较强的抗误码性能；对各种网络的友好性，提供了友好的网络接口。

4．图像压缩技术的发展趋势
从国际数据压缩技术的发展尤其是MPEG的发展可以看出，基于内容的图像压缩编码方法是未来编码的发展趋势。

它不仅能满足进一步获得更大的图像数据压缩比的要求，而且能够实现人机对话的功能。

另外，任意形状物体的模型建立的关键问题还没有解决，这严重影响其应用的广泛性。

因此，视频编码将朝着多模式和跨模式的方向发展。

通过元数据进行编码也是今后编码的发展方向。

元数据是指详细的描述音/视频信息的基本元素，利用元数据来描述音视频对象的同时也就完成了编码，因为此时编码的对象是图像的一种描述而不再是图像本身。

从另一个角度来说，进一步提高压缩比，提高码流的附属功能（码流内容的可访问性、抗误码能力、可伸缩性等）也将是未来的编码的两个发展方向。

- 4 -
5．结束语
从图像和视频压缩的发展可以看到：图像压缩的操作对象由像素到块再走向对象；压缩的分辨率逐渐提高，可扩展性逐渐增强；压缩的目的由单纯的减少数据量走向功能的多元化：交互性、可分级性、灵活性；压缩的方法由单一化走向自适应的使用多种压缩工具。

压缩技术的发展与社会的需求息息相关。

随着数学理论、信息论和计算机视觉等的发展必然会有功能更全面的更有效的图像压缩编码技术的产生。

参考文献
[1] 夏得深, 傅得胜. 现代图像处理技术与应用. 南京: 东南大学出版社, 2001, 84-85
[2] 朱秀昌, 刘峰, 胡栋.数字图像处理与图像通信. 北京: 北京邮电大学出版社, 2002, 199-204
[3] JPEG 2000. Signal Processing: Image Communication 17. 2002: 1-2
[4] Michael W, Marcellin A. An overview of JPEG-2000[A]. Proc.IEEE Data Compression Conference[C], 2000
[5] 丁莉, 张琦. JPEG2000关键技术. 电视技术, 2003, 1: 74-78
[6] 刘方敏, 吴永辉, 俞建新. JPEG2000图像压缩技术过程及原理概述[J]. 计算机辅助设计与图形学学报,
2002, 14(10): 905-916
[7] Majid Rabbani, Rajan Joshi. An overview of the JPEG2000 still image compression standard. Signal
Processing: Image Communication, 2002, 17: 3–48
[8] 尹显东, 李在铭, 姚军. 图像压缩标准研究的发展与前景. 信息与电子工程, 2003, 1(4): 326-331
[9] 薛文通, 宋建设,袁礼海,沈涛. 图像压缩技术的现状与发展. 计算机工程与应用, 2003: 65-67
[10] ISO/IEC 144961-2: Information Technology-Coding of Audio-Visual Objects, Part 2: Visual [S]. 2001
[11] Tingting, Zhang,Ulf, Jennehag, Youshi Xu. Numerical modeling of transmission errors and video quality of
MPEG-2. Signal Processing: Image Communication, 2001, 16: 817-825
[12] 沈兰荪, 卓力. 视频编码与低速率传输. 北京: 电子工业出版社, 2001: 30-50, 230-248
[13] Marius Preda,Fran-coise Preteux. Insights into low-level avatar animation and MPEG-4 standardization.
Signal Processing: Image Communication, 2002, 17: 717-741
[14] ITU-T Recommendation H.261, Video coding for audiovisual services at p×64kbit[S]. Rev.2, 1993
[15] ITU-T Recommendation H.263, Video coding for Low Bit Rate Communication [S]. 1995, Geneva
[16] ITU-T Recommendation H.263 Version 2(H.263+), Video coding for Low Bit Rate Communication [S]. 1998
[17] Chi-Chang Kuoa, Jin-Jang Leoub. A new rate control scheme for H.263 video transmission. Signal Processing:
Image Communication, 2002, 17: 537-557
[18] James T.H. Chung-How, David R. Bull Loss resilient H.263+ video over the Internet. Signal Processing:
Image Communication, 2001, 16: 891-908
[19] Sheng-Wei Lin, Jin-Jiang Leou, and Li-Wei Kang. An error resilient coding scheme for H.26L video
transmission based on data embedding. J. Vis. Commun. Image R, 2004, 15: 214-240
Current Research and developing trends of
ImageCompression Technologie s
Geng Yu-jing1ZhaoHua2
1The College of information science and engineering, YanShan University Qinhuangdao 066004
2 HeBei Normal University, Hebei Shijiazhuang 071003
Abstract
This paper is to describe the research of the image and video compression technologies in brief，and introduce the standard and method of image compression，which in present the international is researched。

At the end of paper ，the trends of image compression coding technologies and some experience on it are also discussed and predicted.
Keywords：Image compression; Video coding; Video Object; Compression standard
作者简介：
耿玉静：(1980-)女，硕士研究生，主要研究课题是视频图像压缩及视频监控系统设计.
赵华：(1980-)男，硕士研究生，主要研究课题是微弱信号检测
- 5 -。