图像压缩研究背景意义及现状

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图像压缩研究背景意义及现状

1图像压缩的可能性与必要性

2图像压缩方法的分类

3静止图像压缩的发展历史与现状

4图像压缩的基本原理

图像是对客观事物的一种相似性的、生动的描述,是对客观对像的一种比较直观的表示方式。它包含了被描述对像的有关信息,是人们最主要的信息源。据统计,一个人获得的信息大约有75%来自视觉。进入信息化时代人们将越来越依靠计算机获取和利用信息,而数字化后的多煤体信息具有数据海量性,与当前硬件技术所能提供的计算机存储资源和网络带宽之间有很大的差距。这样,就对信息的存储和传输造成了很大困难,成为阻碍人们有效获取和利用信息的一个瓶颈问题。图像信息作为计算机上最重要的资源,对其进行有效的压缩处理无疑将会给人们带来巨大的好处。静止图像压缩不但是各种动态图像压缩、传输的基础,而且还是影响其效果好坏的重要因素。

1图像压缩的可能性与必要性

图像数字化后的数据量是很大的,例如,一幅1024*768的24位BMP图像,其数据量约为2.25MB。大数据量的图像信息会给存储器的存储容量,通信干线信道的带宽,以及计算机的处理速度增加极大的压力。单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方法来解决这个问题是不现实的,这时就要考虑压缩。数字图像的冗余主要表现在以下几种形式:

(1) 空间冗余。在一幅图像中,规则物体和规则背景(所谓规则就是指表面有序而不是完全杂乱无章的排列)等所具有的相关性,应用一些算法提取并减少这些图像素之间的相关性就可以达到数据压缩的目的。

(2) 时间冗余。指序列图像(电视图像,运动图像)所包含的相邻图像之间的相关性。

(3) 结构冗余。有些图像有着非常强的纹理结构(如草席的图案)或自相似性,称之为结构上的冗余。

(4) 信息熵冗余。如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像存在冗余,这种冗余称为信息熵冗余。

(5) 视觉冗余。人眼接收信息的能力是有限的,对图像的分辨率也是有限的。去掉或减少人眼不能感知或不敏感的那部份图像信息,从而达到压缩的目的。

(6) 知识冗余。指有些图像中包含与先验知识有关的信息,如人脸的固定结构。

图像数据的这些冗余信息为图像压缩编码提供了依据。

因此针对图像的特点对其数据进行压缩编码,以提高储存、传输和处理速度,节省存储空间。数字图像压缩的主要问题就是数据冗余。这并非一个抽象的概念,在数学上我们也可以对其进行量化。用1n 和2n 表示两个具有相同信息的数据集合中所携载信息单元的数量,则第一个数据集合(1n 表示的集合)的相对数据冗余D R 可以定义为:

R

D C R 11-= (1) 这里R C 通常称为压缩率,定义为:

2

1n n C R = (2) 对于2n =1n 的情况,R C =1, D R =0表示(相对于第二个数据集合)信息的第一种表达方式不包含冗余数据。当2n <<1n 时,∞→R C ,1→D R ,意味着显著的压缩和大量的冗余数据。最后当2n >>1n 时,0→R C ,-∞→D R ,表示第二个集合中含有的数据大大超过原表示方式的数据量。

2图像压缩方法的分类

图像压缩编码的方法很多,可以从多种方式对其进行分类。根据编码过程中是否存在信息的损耗可以将图像编码分为有损压缩编码和无损压缩编码。无损压缩编码无信息损失,解压时可以从压缩数据精确地恢复到原始图像;有损压缩编码则有信息丢失不能完全恢复原始图像,存在一定程度失真。根据编码原理可以将传统的图像编码分为熵编码、预测编码、变换编码和混合编码等。

(1)熵编码:熵编码是纯粹基于信号统计特性的编码技术,是一种无损的编码。熵编码的基本原理是给出概率较大的符号赋予的一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。常见的熵编码有行程编码、哈夫曼编码和算术编码。

(2)预测编码:预测编码是基于图像数据空间或时间冗余特性,用相邻的已知像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和编码。预测编码可分为帧内预测和帧间预测,常用的预测编码有差分脉码调制和运动补偿法。

(3)变换编码:变换编码通常是将空间域上的图像经过正交变换映射到另一变换域上,使变换后的系数之间的相关性降低。图像变换本身不能压缩数据,但

变换后图像的大部分能量只集中到少数几个变换上,采用适当的量化和熵编码就可以有效地压缩图像。

(4)混合编码:混合编码是指综合了熵编码、预测编码或变换编码的编码方法。如JPEG标准和MPEG标准。

除了以上介绍的几种编码外,随着图像编码技术的不断发展,一些新颖的压缩方法也已经被人们提出来并应用到实际的操作中。如,利用人工神经网络(ANN)的压缩编码,基于对像的压缩编码(Object Based Coding)、基于模型的压缩编码(Model Based Coding)和分形编码(Fractal Coding)。

3静止图像压缩的发展历史与现状

图像压缩编码技术可以追溯到1984年提出的电视信号数字,到今天已经有60年的历史了。

Kunt提出了第一代数据压缩编码的概念,他把20世纪40年代中研究的以去除冗余为基础的编码方法称为第一代编码。如PCM、DPCM、亚取样编码法、变换编码法等。直至五十年代和六十年代,图像压缩技术仅仅停留在预测编码、亚采样以及内插复原等技术的研究上,而且还很不成熟.A. Huffman于1952年第一次发表了他的论文“最小冗余度代码的构造方法”,从此,数据压缩开始在商业程序中实现并被应用在许多技术领域。

第二代数据压缩编码从20世纪90年代开始,数学家们因为不满足于Huffman编码中的某些致命弱点,设计出另一种更为精确,更能接近信息论中“熵”极限的编码方法—算术编码。在算术编码的基础上又发展了变换编码,如金字塔编码法,Fractal编码。其中最具代表性的是LZ77和LZ78,经基于这一思路的编码放大称作“字典”式编码。字典式编码不但在压缩效果上大大超过了Huffman,而且易于实现,其压缩与解压缩的速度也异常惊人。1984年,LZ78算法的一个变种—LZW(Lewpel-Ziv&Welch,无损压缩算法)产生了。LZW继承了LZ77和LZ78压缩效果好,速度快的优势,而且在算法描述上更容易被人们接受。70年代末和80年代初,人们逐渐意识到对于很多灰度或彩色图像、乃至声音文件,均未忠实地保留其所有信息,在允许一定的精度损失的情况下,可以实现更为有效地压缩方法。到80年代末,许多人已经在这一领域取得了收获,设计出了一批在压缩效果上让人惊讶不已的声音和图像压缩算法。

第三代数据压缩编码技术主要从90年代至今,图像压缩技术的主要成果体现在小波编码、分形编码等。矢量量化编码技术也有较大的发展。由于小波变换理论、分形理论、人工神经网络理论和视觉仿真理论的建立,人们开始突破传统的信源编码理论,例如不再假设图像是平稳的随机场。有关图像编码技术的科技成果和科技论文也与日俱增,图像编码技术开始走向繁华。现代编码技术的特点

相关文档
最新文档