第5章图像编码与压缩-Read

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

这些概念无论是静态的文字、图像,还是动态的 音频、视频都是适用的。
数据压缩的实现:信源编码和解码:
编码是对原始的信源数据进行压缩;
解码是编码的反过程,还原被压缩的数据。
信道编码主要针对编码传输的可靠性。
压缩的原理
数据压缩技术利用了数据固有的冗余性和 不相干性,将一个大的数据文件转换成较 小的文件。
算术编码对整条信息(无论信息有多么 长),其输出仅仅是一个数,而且是一个 介于 0 和 1 之间的二进制小数。
算术编码的效率高于huffman编码。
课堂练习
采 用 huffman 编 码 对 信 号 : aaa bbbbb ccccccc dd eee 进行编码,写出编码结果。 (要求画出 huffman 树,以及 huffman 树的 形成过程)。
r=1-H(x)/R(x)
编码效率η定义为:
η=H(x)/R(x)=1/(1+r)
当平均码长接近H(x)时,冗余度下降至0,编 码效率提高至1。这正是高效编码追求的目标。
3.压缩比
压缩比Cr(compression ratio)是衡量数据压缩方 法压缩程度的一个指标,反映了压缩效率。通常将 Cr 定义为压缩前图像像素的平均码长 rb 与压缩后图 像像素平均码长rc之比。
很多时候,对图像质量的评价是根据人的主观感觉 而定的。主观评价结果可以用参与测试组全体组员 的平均判分MOS统一衡量。
评 分 5 4 3 评价 优秀 良好 中等 图像质量非常好 图像质量高,有很小的干扰但不影响观看 图像质量可接受,但有一些干扰,对观看稍有妨 碍 图像质量差,对观看有妨碍 图像质量很差,无法观看 说明
Huffman编码在无失真的编码方法中效率优于其 他的编码方式,是一种最佳变长码。 当信源数据成分复杂时,使Huffman码表较大,码 表生成的计算量增加,译码速度变慢。 不等长编码使译码电路实现困难。
Huffman编码算法已经被集成到一些编译码集成 电路中,并被许多国际标准采用。
huffman编译码系统
5.2.1
Huffman 编码
定理:在变长编码中,如果码字长度严格按照信 号中符号出现概率大小的相反顺序排列,则平均 码字长度一定小于其他符号顺序排列方式的平均 码字长度。
D. A. Huffman (哈夫曼)在 1952 年根据可变长 最佳编码定理,提出了依据信源集中符号出现的 概率分配不同长度的唯一可译码的算法。接收端 在得到哈夫曼编码后,通过解码可以得到与输入 完全一致的信号。
图像数据的熵的定义为:如果一幅图像像素 的灰度级为 xi ( i = 1 , 2 , … , M ),若 xi 出 现的概率为p(xi),则图像熵定义为
H=-∑P(xi)log2[P(xi)]
图像熵表示像素灰度级集合的平均比特数。 熵的单位为比特/字符。
2.图像冗余度与编码效率 冗余度r的定义为(R(x)指平均码长):
统计编码的基本原理是,在信号概率分布情 况已知的基础上,概率大的信号对应的码字 短,概率小的信号对应的码字长,这样降低 了平均码字长度。
各种统计编码的差异在于信号与编码对应 的规则不同,性能亦有差异。 概率分布越不均匀,统计编码的编码效率 越高。 莫尔斯电报码是一个最早的例子。
“e”设置为最短的一个“点”; “z”设置为最长的“横、横、点、点”。
x1 x2 x3 x4 x5 x6
概率分布 累积概率 位数
0.40 0.20 0.12 0.11 0.09 0.08 0 0.40 0.60 0.72 0.83 0.92 2 3 4 4 4 4
编码
00 011 1001 1011 1101 1110
5.2.3 算术编码
[例]输入序列0110,求输出编码。 begin:0-0.5, 0.5-1 input 0→ output :0-0.5 input 1→ output :0.25-0.5 input 1→ output :0.375-0.5 input 0→ output :0.375-0.4375 输出一个在0.375-0.4375之间的数:0.4 输出100. 算术编码的解码是编码的逆过程
你的妻子将于明晚6点零5分在Logan机场接你。
没有信息损失。
删除不相干信息(irrelevancy)(不需要):
Helen将于明晚6点在Logan接你。 准确度损失不大,不影响信息的传达目的。
压缩算法
压缩算法包括无损压缩和有损压缩。
无损压缩的算法删除的仅仅是冗余的信息, 因此可以在解压缩时精确复原原图像。 有损压缩的算法把不相干的信息也删除掉 了,因此只能对原图像进行近似的重构。
TIF格式, 703KB
BMP格式 265KB
JPEG格式 28KB
该图片的大小是258×350=90.3K
TIFF格式 30.5KB
BMP格式 30.8KB
JPG格式 2.84KB
该图片的大小是191×159=30.4K
第五章 图象编码与压缩(1)
5.1 概述
图像数据需要一些有效的方法来存储和传 输。
C r = r b / rc
4.客观评价信噪比: SNR
客观评价 SNR 指压缩前的图像信号方差与解压缩后 重建误差方差的比值。定义如下:
2 x SNR 10 log 2 e
显然, SNR 越大,在压缩过程中引入的失真越小, 图像质量越高。
5.主观评价(MOS: Mean Opinion Score)
的。那些达到最高压缩比的算法常常不是最快的,
所以,还要在压缩比和算法复杂度(速度)之间 进行折中。
5.1.2 图像编码压缩的必要性
按一幅图像大概 300KB 的大小来计算 ,数字 电视的数码率要达到 400Mbps 这样的数据率和现在 存储介质的容量 、计 算机的总线速度及网 络的传输率不相匹配。 (数据量太大)
图像输入→ 概率统计→ 构造huffman树 →生成huffman树→ 压缩编码→ 传输 → 解码输出
Shannon编码
将N个灰度级按其概率递减进行排列 求概率为pi的二进制位数ni
-log2pi≤ni ≤-log2pi+1
使编码成为唯一可译码(短码不会成为长码 的起始部分)
符号集
2.像素间的相关性形成的冗余
图像由按一定规则排列起来的像素组成的。
同同一帧的邻近像素间、在活动图像中的 同一位置的相邻帧像素间的灰度和色度往 往相同或相近,我们称这种相关性为像素 间冗余或空间冗余。
例如:二值传真信息的数据流是由大量的 “白”数据串和“黑”数据串构成的。我 们没有必要将全部数据加以发送,只需以 “起始串,第二串长,第三串长, …”表示 即可。 利用像素间的相关性进行压缩的原理实际 上是将二维像素的矩阵表示成数据量更小 的表达形式。
3.视觉特性和显示设备的误差容差允许压缩
受到生理和心理的影响,人眼对黑白与彩色信息的 空间分辨率、时间分辨率等是有限的。光学上不一 致的图像在视觉上可能是一样的。因此可以利用人 眼的误差容差进行压缩
显示设备受到制作工艺的影响,有一定限度的失真
例如人在电视上看到的都是有一定程度失真的图像, 但并不影响人们对画面的理解和欣赏
算术编码
有损编码:
预测编码 变换编码
5.2 统计编码 (statistic coding)
统计编码是根据信源的概率分布特性,分配 具 有 唯 一 可 译 性 的 可 变 长 码 字 ( variablelength code ), 降低平均码字长度,以提高 信息的传输速度,节省存储空间。
[例]建立huffman码的过程:
概率分布
合并
合并
合并
合并
合并
x1
x2 x3 x4 x5 x6
0.40
0.20 0.12 0.11 0.09 0.08
0.40
0.20 0.17 0.12 0.11
0.40
0.23 0.20 0.17
0.40
0.37 0.23
0.60
0.40
1
Huffman编码的性能
Huffman编码的算法如下:
(1)将图像的灰度等级按概率大小进行升序排序。
(2)在灰度级集合中取两个最小概率相加,合成一 个概率。
(3)新合成的概率与其它的概率成员组成新的概率 集合。 (4)在新的概率集合中仍然按照步骤(2)-(3) 的规则,直至新的概率集合中只有一个概率为 1的成 员。这样的归并过程可以用二叉树描述。 (5)从根结点按前缀码的编码规则进行二进制编码。
由压缩的文件可以在以后需要的时候以精 确的或近似的方式将原文件恢复出来。 两个文件的大小之比(压缩比)确定了压 缩的程度。
冗余信息和不相关的信息
一个商人在旅行的归途中收到如下消息:
你的妻子 , Helen , 将于明天晚上 6 点零 5 分在波士顿
的Logan机场接你。
删除冗余信息(redundancy)(已知信息):
2
1

很差,劣
5.1.5 数据压缩方法的分类
数据压缩的方法很多,而且人们还在不断地研究 新方法。
一般数据压缩按信息损失的程度来分类:无损编 码和有损编码。 常见的有20多种常用数据压缩方法。
本章介绍图像压缩方法: 无损压缩(统计编码):
Huffman编码 Shannon编码
信息源的熵定义如下:
H=E{I(ak)}=-∑P(ak)log[P(ak)]
信息源的熵总是非负的,当所有的符号出 现的概率相等时,有最大值。
如果计算中的对数 log 是以 2 为底的,那么 计算出来的信息熵就以比特(bit)为单位。 熵的度量信息量的大小,熵越大表示信息 的不确定性越大。
350×258×24/8=270KB
5.1.3 图像编码压缩的可能性
1.编码冗余 经典的数据压缩理论是建立在信息论基础之上。 信息论明确指出,去除信源编码中的冗余量可以 在对信息无损的前提下减少代表信息的数据量。 (信息论的奠基人香农提出:I=D-du)
对图像进行编码时,如果编码码本(codebook) 不 能使每个像素所需的平均比特数最小,则说明存 在编码冗余,就存在压缩的可能性。
有损压缩比无损压缩算法有更高的压缩比。 对于多数图像来说,为了得到更高的压缩比, 保真度的轻微损失是可以接受的。 对于不允许进行修改的图像,则只能进行无 损压缩。
压缩的原则
对于有损压缩,采用同一种方法,压缩比越大, 信息损失越大,因此பைடு நூலகம்们要在压缩比和保真度之
间选择。
文件进行压缩和解压缩所需要的时间是不可忽略
5.1.4 图像编码压缩的技术指标
熵:
假设有一个无记忆的信息源,它用到一个 字母表{ak},k=0,1, …K-1。每一个字母出现 的概率是P(ak)。在无记忆的消息中,字母 出现的顺讯是无关紧要的,重要的是它是 否出现。 Shannon定义了一种信息的度量标准,
I(ak)=-log[P(ak)]
数据压缩技术就属于这样的有效技术,可 以实现图像数据的快速存储和传输。 图像压缩主要是通过图像的数据编码实现 的,数据编码不仅可以实现信息的压缩存 储和传输,还可以实现信息保密。
5.1.1 数据压缩的基本概念
数据压缩:以较少的数据量表示原始信源的信息
数据压缩的目的:节省存储空间、传输时间、信 号频带或发送能量等 图像压缩的原理:删除冗余的或者不相关的信息, 减少数据量的技术。
相关文档
最新文档