第6章多媒体数据压缩(改)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
6.1.2 多媒体数据的冗余
对于如此巨大的多媒体数据,如果不经过压缩,不 仅超出了计算机的存储和处理能力,而且在现在的通信 信道的传输速率下,是无法完成大量多媒体信息的传输 的,多媒体数据的高速传输和储藏所需要的巨大容量已 经成为多媒体数据通信技术的最大障碍。因此,为了存 储、处理和传输这些数据,必须进行压缩。
--通过大量实验,发现以下视觉的非均匀特 征。
✓ 视觉系统对图像的亮度和色彩度的敏感性相差很大; ✓ 随着亮度的增加,视觉系统对量化误差的敏感度降低; ✓ 人眼的视觉系统在图像的边缘和非边缘区域分开来处理; ✓ 人类的视觉系统总是把视网膜上的图像分解成若干个空间 有向的频率通道后再进一步处理。
图像区域的相同性冗余
5
6.1.2 多媒体数据的冗余
一般而言,多媒体数据中存在的数据冗余情况主要 有以下几种(P107):
•信息熵冗余 •空间冗余 •时间冗余 •结构冗余 •知识冗余 •视觉冗余 •听觉冗余 •纹理的统计冗余
6
信息熵冗余
信息熵定义为一组数据所表示的信息量,即
N 1
E pi log2 pi i0
--它是指在图像中的两个或多个区域所对应的所有像素值相 同或相近,从而产生的数据重复性存储,这就是图像区域的相似 性冗余。
--在以上的情况下,记录了一 个区域中各像素的颜色值,则与其 相同或相近的其他区域就不在记录 其中各像素的值。
--向量量化方法就是针对这种 冗余性的图像压缩编码方法。
纹理的统计冗余
--可以通过改变物体表面颜色 的像素存储方式来利用空间连贯性, 达到减少数据量的目的。
时间冗余
--这是序列图像(电视图像、运动图像)表示中经常包 含的冗余。
--序列图像一般为位于一时间轴区间内的一组连续画面, 其中的相邻帧往往包含相同的背景和移动物体,只不过移动 物体所在的空间位置略有不同,所以后一帧的数据与前一帧 的数据有许多共同的地方,这种共同性是由于相邻帧记录了 相邻时刻的同一场景画面,所以称为时间冗余。
例如: 一页在A4(216mm×300mm)纸上的照片,以300dpi(12像素 /mm)采样,每个像素用24位真彩色信号表示,其数据量约为 27MB/页,650MB的CD-ROM只可放24页;
双声道立体声光盘,采样率是44.1kHz,采样精度16位,一秒钟数 据量是44.1×16×2/8=172KB/s,一张CD只能存放约1小时的声音。
比特),这样得到的D必然大于E。这种因码元编码长度
的不经济带来的冗余称为信息熵冗余或编码冗余。
信息熵冗余
图 26个英文字母相对频率
空间冗余
--同一景物表面上各采样点的 颜色之间往往存在着空间连贯性,但 是基于离散像素采样来表示物体颜色 的方式通常没有利用景物表面颜色的 这种空间连贯性,从而产生了空间冗 余。
M=D-∆d 其中M表示实际媒体信息,D表示数字化后的采 样数据,∆d表示数据冗余量。
数据压缩就是从采样数据中去除冗余,即保留原始信息 中变化的、特征性信息,去除重复的、确定的或可推知的 信息,在实现更接近实际媒体信息描述的前提下,尽可能 的减少描述用的信息量。
3
6.1.2 多媒体数据的冗余
随着计算机技术的高度发展以及通信、计算机和大众传媒三大技 术的相互融合,计算机已经不再局限于数值计算、文字处理的范 畴,而成为处理图形、图像、视频、音频等多种信息的工具。但 数字化后的声音、图像、视频和音频等多媒体数据是非常庞大的。
16wk.baidu.com
下列哪一种说法是正确的: A. 信息量等于数据量与冗余量之和 B. 信息量等于信息熵与数据量之差 C. 信息量等于数据量与冗余量之差 D. 信息量等于信息熵与冗余量之和
17
6.1.3 数据压缩技术的发展过程
20世纪40年代,人们开始系统地研究数据压缩技术;主要表现在 数据压缩算法方面:
首先是Claude Shannon与R.M.Fano的Shannon-Fano编码方法; 1952年,D.A.Huffman提出了Huffman编码方法; 1968年,P.Elias 发展了Shannon-Fano编码,构造出更为完美的 Shannon-Fano-Elias 编码。 1976年,J.Rissanen 提出了一种可以成功地逼近信息熵极限的编码 方法——算术编码。 1982年,Rissanen 和G.G.Langdon 一起改进了算术编码。 1977年,Jacob Ziv和Abraham Lempel提出了LZ77编码算法,78 年又作了改进,被称为LZ78编码算法。 1984年,Terry Welch提出了LZ78算法的变种算法——LZW。 LZ77、LZ78、LZW三种压缩技术就是目前无损压缩领域中最为流 行的、被称为“字典式编码”的压缩技术。
--有些图像纹理尽管不严格服 从某一分布规律,但是它在统计的 意义上服从该规律。利用这种性质 也可以减少表示图像的数据量,所 以我们称之为纹理的统计冗余。
思考:
图像序列中的两幅相邻图像,后一幅图像与前一幅图 像之间有较大的相关,这是( )。 (A) 空间冗余 (B)时间冗余 (C) 信息熵冗余 (D) 视 觉冗余
结构冗余
--在有些图像的纹理区,图像 的像素值存在着明显的分布模式,例 如,方格状的地板图案等。我们称此 为结构冗余。
--已知分布模式,可以通过某 一过程生成图像。
知识冗余
--有些图像的理解与某些知识有相当 大的相关性。例如,人脸的图像有固定的 结构。这类规律性的结构可由先验知识和 背景知识得到,我们称此类冗余为知识冗 余。
--根据已有的知识,对某些图像中所 包含的物体,我们可以构造其基本模型, 并创建对应各种特征的图像库,进而图像 的存储只需要保存一些特征参数,从而可 以大大减少数据量。知识冗余是模型编码 主要利用的特性。
视觉冗余
--事实表明,人类的视觉系统对图像场的敏感性是非均匀 和非线性的。然而,在记录原始的图像数据时,通常假定视觉 系统是线性和均匀的,对视觉敏感和不敏感的部分同等对待, 从而产生了比理想编码(即把视觉敏感和不敏感的部分区分开 来编码)更多的数据,这就是视觉冗余。
第6章 多媒体数据压缩
本章主要内容 6.1 数据压缩技术概述 6.2 数据压缩技术原理 6.3 JPEG静止图像压缩标准 6.4 运动图像压缩标准MPEG
2
6.1 数据压缩技术概述
6.1.1 数据压缩的概念
采样数据不仅仅是所代表的原始信息本身,还包含着其 它一些没必要保留的(确定的、可推知的)信息,即存在 着数据冗余。
式中,E为信息熵,N为数据的种类(或称码元)个数, Pi为第i个码元出现的概率。 一组数据的数据量显然等于各记录码元的二进制位数 (即编码长度)与该码元出现的概率乘积之和,即
N 1
D pibi i0
式中,D为数据量,为第i个码元的二进制位数。
一般取 b0 b1 bN1(如ASCII编码把所有码元都编码为7
6.1.2 多媒体数据的冗余
对于如此巨大的多媒体数据,如果不经过压缩,不 仅超出了计算机的存储和处理能力,而且在现在的通信 信道的传输速率下,是无法完成大量多媒体信息的传输 的,多媒体数据的高速传输和储藏所需要的巨大容量已 经成为多媒体数据通信技术的最大障碍。因此,为了存 储、处理和传输这些数据,必须进行压缩。
--通过大量实验,发现以下视觉的非均匀特 征。
✓ 视觉系统对图像的亮度和色彩度的敏感性相差很大; ✓ 随着亮度的增加,视觉系统对量化误差的敏感度降低; ✓ 人眼的视觉系统在图像的边缘和非边缘区域分开来处理; ✓ 人类的视觉系统总是把视网膜上的图像分解成若干个空间 有向的频率通道后再进一步处理。
图像区域的相同性冗余
5
6.1.2 多媒体数据的冗余
一般而言,多媒体数据中存在的数据冗余情况主要 有以下几种(P107):
•信息熵冗余 •空间冗余 •时间冗余 •结构冗余 •知识冗余 •视觉冗余 •听觉冗余 •纹理的统计冗余
6
信息熵冗余
信息熵定义为一组数据所表示的信息量,即
N 1
E pi log2 pi i0
--它是指在图像中的两个或多个区域所对应的所有像素值相 同或相近,从而产生的数据重复性存储,这就是图像区域的相似 性冗余。
--在以上的情况下,记录了一 个区域中各像素的颜色值,则与其 相同或相近的其他区域就不在记录 其中各像素的值。
--向量量化方法就是针对这种 冗余性的图像压缩编码方法。
纹理的统计冗余
--可以通过改变物体表面颜色 的像素存储方式来利用空间连贯性, 达到减少数据量的目的。
时间冗余
--这是序列图像(电视图像、运动图像)表示中经常包 含的冗余。
--序列图像一般为位于一时间轴区间内的一组连续画面, 其中的相邻帧往往包含相同的背景和移动物体,只不过移动 物体所在的空间位置略有不同,所以后一帧的数据与前一帧 的数据有许多共同的地方,这种共同性是由于相邻帧记录了 相邻时刻的同一场景画面,所以称为时间冗余。
例如: 一页在A4(216mm×300mm)纸上的照片,以300dpi(12像素 /mm)采样,每个像素用24位真彩色信号表示,其数据量约为 27MB/页,650MB的CD-ROM只可放24页;
双声道立体声光盘,采样率是44.1kHz,采样精度16位,一秒钟数 据量是44.1×16×2/8=172KB/s,一张CD只能存放约1小时的声音。
比特),这样得到的D必然大于E。这种因码元编码长度
的不经济带来的冗余称为信息熵冗余或编码冗余。
信息熵冗余
图 26个英文字母相对频率
空间冗余
--同一景物表面上各采样点的 颜色之间往往存在着空间连贯性,但 是基于离散像素采样来表示物体颜色 的方式通常没有利用景物表面颜色的 这种空间连贯性,从而产生了空间冗 余。
M=D-∆d 其中M表示实际媒体信息,D表示数字化后的采 样数据,∆d表示数据冗余量。
数据压缩就是从采样数据中去除冗余,即保留原始信息 中变化的、特征性信息,去除重复的、确定的或可推知的 信息,在实现更接近实际媒体信息描述的前提下,尽可能 的减少描述用的信息量。
3
6.1.2 多媒体数据的冗余
随着计算机技术的高度发展以及通信、计算机和大众传媒三大技 术的相互融合,计算机已经不再局限于数值计算、文字处理的范 畴,而成为处理图形、图像、视频、音频等多种信息的工具。但 数字化后的声音、图像、视频和音频等多媒体数据是非常庞大的。
16wk.baidu.com
下列哪一种说法是正确的: A. 信息量等于数据量与冗余量之和 B. 信息量等于信息熵与数据量之差 C. 信息量等于数据量与冗余量之差 D. 信息量等于信息熵与冗余量之和
17
6.1.3 数据压缩技术的发展过程
20世纪40年代,人们开始系统地研究数据压缩技术;主要表现在 数据压缩算法方面:
首先是Claude Shannon与R.M.Fano的Shannon-Fano编码方法; 1952年,D.A.Huffman提出了Huffman编码方法; 1968年,P.Elias 发展了Shannon-Fano编码,构造出更为完美的 Shannon-Fano-Elias 编码。 1976年,J.Rissanen 提出了一种可以成功地逼近信息熵极限的编码 方法——算术编码。 1982年,Rissanen 和G.G.Langdon 一起改进了算术编码。 1977年,Jacob Ziv和Abraham Lempel提出了LZ77编码算法,78 年又作了改进,被称为LZ78编码算法。 1984年,Terry Welch提出了LZ78算法的变种算法——LZW。 LZ77、LZ78、LZW三种压缩技术就是目前无损压缩领域中最为流 行的、被称为“字典式编码”的压缩技术。
--有些图像纹理尽管不严格服 从某一分布规律,但是它在统计的 意义上服从该规律。利用这种性质 也可以减少表示图像的数据量,所 以我们称之为纹理的统计冗余。
思考:
图像序列中的两幅相邻图像,后一幅图像与前一幅图 像之间有较大的相关,这是( )。 (A) 空间冗余 (B)时间冗余 (C) 信息熵冗余 (D) 视 觉冗余
结构冗余
--在有些图像的纹理区,图像 的像素值存在着明显的分布模式,例 如,方格状的地板图案等。我们称此 为结构冗余。
--已知分布模式,可以通过某 一过程生成图像。
知识冗余
--有些图像的理解与某些知识有相当 大的相关性。例如,人脸的图像有固定的 结构。这类规律性的结构可由先验知识和 背景知识得到,我们称此类冗余为知识冗 余。
--根据已有的知识,对某些图像中所 包含的物体,我们可以构造其基本模型, 并创建对应各种特征的图像库,进而图像 的存储只需要保存一些特征参数,从而可 以大大减少数据量。知识冗余是模型编码 主要利用的特性。
视觉冗余
--事实表明,人类的视觉系统对图像场的敏感性是非均匀 和非线性的。然而,在记录原始的图像数据时,通常假定视觉 系统是线性和均匀的,对视觉敏感和不敏感的部分同等对待, 从而产生了比理想编码(即把视觉敏感和不敏感的部分区分开 来编码)更多的数据,这就是视觉冗余。
第6章 多媒体数据压缩
本章主要内容 6.1 数据压缩技术概述 6.2 数据压缩技术原理 6.3 JPEG静止图像压缩标准 6.4 运动图像压缩标准MPEG
2
6.1 数据压缩技术概述
6.1.1 数据压缩的概念
采样数据不仅仅是所代表的原始信息本身,还包含着其 它一些没必要保留的(确定的、可推知的)信息,即存在 着数据冗余。
式中,E为信息熵,N为数据的种类(或称码元)个数, Pi为第i个码元出现的概率。 一组数据的数据量显然等于各记录码元的二进制位数 (即编码长度)与该码元出现的概率乘积之和,即
N 1
D pibi i0
式中,D为数据量,为第i个码元的二进制位数。
一般取 b0 b1 bN1(如ASCII编码把所有码元都编码为7