多媒体技术07-无损压缩算法

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第7章无损压缩算法
内容

基本概念行程长度编码变长度编码字典编码算术编码无损图像压缩
2015-1-22
南京大学多媒体研究所
2
一、基本概念
1. 数据压缩的必要性
中(低)等质量图像: 640x480x16bits = 5Mb /帧中(高)等质量图像: 1024x768x24bits = 18Mb /帧 CCIR 601数字电视: 720x576x16bitsx25 = 158Mb /s 高清晰度数字电视: 1280x720x24bitsx50= 1.05Gb/s
2015-1-22
南京大学多媒体研究所
13
变长度编码
Shannon-Fano算法
① ② ③
首先统计出每个符号出现的概率；
从左到右对上述概率从大到小排序；
从这个概率集合中的某个位置将其分为两个子集合，并尽量使两个子集合的概率和近似相等，给前面一个子集合赋值为 0，后面一个子集合赋值为1；重复步骤3，直到各个子集合中只有一个元素为止；将每个元素所属的子集合的值依次串起来，即可得到各个元素的香农-范诺编码。
2015-1-22
南京大学多媒体研究所
6
重建图象的质量评价1
客观评价法
均方误差：
En
原始图像的像素重建图像的像素
原始图像信号均值
e2 1 x 2 (i ) n i 1 n i
1 ( x(i ) x(i ))2 n i
信噪比：
e2 SNR(dB) 10 lg 2 d

神经网络（Artificial Neural Network， ANN）
分形编码（Fractal Coding）基于对象的压缩编码（Object Based Coding）

基于模型的压缩编码（Model Based Coding）

小波变化编码
2015-1-22
南京大学多媒体研究所
11
行程长度编码
一般，清楚地看（听）出有失真，对视听稍有影响
4 3 2 1
差，失真明显，对视听有影响非常差，失真严重，非常严重地妨碍视听
来自百度文库
受评价者的经验、爱好、观察图像的内容、观察条件等影响
2015-1-22
南京大学多媒体研究所
8
5. 压缩方法的分类

lossless(无损压缩)

run-length coding(RLC) 预测编码 Huffman(哈夫曼编码) Arithmetic coding(算术编码) Lempel-Ziv & Welch ( LZW编码, 词典编码 ) 亚取样变换编码矢量编码特征抽取(分析--合成法) (模型编码)
2015-1-22
南京大学多媒体研究所
4
数据压缩的必要性（续）
存储：硬盘传输 PC机系统总线：5MB/s（ISA），133MB/s（PCI） CD-ROM 读出速率：40 x 150KB/s = 6MB/s ETHERNET 传输速率：10~100Mb~1Gb/s 普通电话接入速率：28.8 , 33.3 , 56 Kb/s
2015-1-22
南京大学多媒体研究所
22
算术编码
算术编码与Huffman编码的比较

压缩效率可提高 5~10% 硬件实现稍复杂通信过程中差错会扩散不必使用码表自适应算术编码能够根据已经编码的信息串来调整当前符号的概率估计，从而更有效地进行编码
2015-1-22
南京大学多媒体研究所
南京大学多媒体研究所

lossy (有损压缩)

2015-1-22
9
第一代压缩编码技术

统计（熵）编码。统计编码的基本原理是给出现概率较大的符号赋予一个短码字，而给出现概率较小的符号赋予一个长码字，从而使得最终的平均码长很小。

预测编码。预测编码是基于图像数据的空间或时间冗余特性，用相邻的已知像素（或像素块）来预测当前像素（或像素块）的取值，然后再对预测误差进行量化和编码。
RLC的分析

方法直观，简单，速度快。
是一种无损压缩技术。
压缩比取决于图像本身的特点：

如果图像中具有相同颜色的图像块越大，且图像块数目越少，
获得的压缩比就越高。反之，压缩比就越小。

特别适合于扫描产生的黑白文稿和工程图纸，对颜色丰富的自然图像效果较差。

不仅用于图像数据的压缩，也可应用于其他数字媒体的压缩。
④ ⑤
2015-1-22
南京大学多媒体研究所
15
Shannon-Fano编码举例
2015-1-22
南京大学多媒体研究所
16
3 Huffman 编码
基本原理：将在图象中出现次数多的像素值给一个短的编码，将出现次数少的像数值给一个长的编码。哈夫曼编码的一般算法如下：（1）首先统计信源中各符号出现的概率，按符号出现的概率从大到小排序。（2）把最小的两个概率相加合并成新的概率，与剩余的概率组成新的概率集合。（3）对新的概率集合重新排序，再次把其中最小的两个概率相加，组成新的概率集合。如此重复进行，直到最后两个概率的和为1。（4）分配码字。码字分配从最后一步开始反向进行，对于每次相加的两个概率，给大的赋“0”，小的赋“1”
ADSL速率：512kb~2Mb/s,
2015-1-22
南京大学多媒体研究所
5
2. 图像数据压缩的可能性
(1) 时间、空间冗余 (2) 信息熵冗余 (3) 视觉冗余

眼睛空间综合能力的局限性（亮度等级，可区分弧度，高频成分的非线性，...）

思维(mind)的时间综合能力的局限性
(4) 其他冗余，包括结构冗余、知识冗余等。因此，在允许存在一定失真的前提下，可以对图象数据进行很大程度的压缩。
( a1=10,a2= 11, a3= 000, a4= 001, a5= 010, a6= 0110, a7=0111 )
11 010 10 001 10 11 10 0111 a2 a5 a1 a4 a1 a2 a1 a7

编码方式不唯一，但平均码长相同
编码效率受信源概率分布影响传输中误码影响较大必须先存储/传输码表必须预先知道信源的统计特性图像过大时，应划分成小块编码
2015-1-22
南京大学多媒体研究所
26
JPEG无损编码
原理: 1 利用相邻象素之间的相关性进行预测：预测值=a1*A+a2*B+a3*C 2 计算预测误差，预测误差＝当前象素数值－预测值 3 对预测误差进行编码
C
B
当前象素
A
2015-1-22
南京大学多媒体研究所
27
预测公式
P1 P2 P3 P4 P5 P6 P7 A B C A+B-C A+(B-C)/2 B+(A-C)/2 (A+B)/2
变换编码。变换编码通常是将空间域上的图像经过正交变换映射到另一变换域上，使变换后的系数之间的相关性降低。图像变换本身并不能压缩数据，但变换后图像的大部分能量只集中到少数几个变换系数上，采用适当的量化和熵编码就可以有效地压缩图像。

2015-1-22
南京大学多媒体研究所
10
第二代压缩编码技术

其中
d2
x(i) x(i)2
误差图像信号均值
x2 峰值信噪比： PSNR(dB) 10 lg max d2
原始图像信号峰值
2015-1-22 南京大学多媒体研究所
7
重建图象的质量评价2

主观评价法(MOS)
分值 5 重建图像（声音）的质量
非常好，丝毫看（听）不出失真好，虽能看（听）出失真，但没有什么影响
24
无损图像压缩
差分编码

自然世界中的灰度变化是连续的差分运算后的图像的直方图分布较窄，信息熵较低，有可能达到较低的平均码长常用的差分算子有：
d ( x, y ) I ( x, y ) I ( x 1, y ) d ( x, y ) 4 I ( x, y ) I ( x, y 1) I ( x, y 1) I ( x 1, y ) I ( x 1, y )
2015-1-22
1 0
1 0 1
0 1
0.2
1.0
0 1
0
0.4
0.6
0
0.4
a1 1 a2 01 a3 000 a4 0010 a5 0011 a1 00 a2 10 a3 11 a4 010 a5 011
18
0 1
0.2
南京大学多媒体研究所
1
0.6
1 0
1.0
Huffman 编码的分析

每个编码均非其它码的前缀，因此唯一可译
2015-1-22
南京大学多媒体研究所
19
Huffman编码在不同概率分布下的编码效果对比
2015-1-22
南京大学多媒体研究所
20
字典编码
LZW编码

时间：

1977年，LZ77，LZ78 1984年，LZW

应用：gif，tif 压缩比：1:1.5～1:1.3 原理：

LZW压缩算法的基本思想是建立一个编码表(转换表)，韦尔奇称之为串表，将输入字符串映射成定长的码字输出，通常码长设为12bit。
2015-1-22
南京大学多媒体研究所
28
2015-1-22 南京大学多媒体研究所 17
两种Huffman 编码的比较
例：设有5个符号： a1, a2, a3, a4, a5, 出现的概率是: 0.4, 0.2, 0.2, 0.1, 0.1,
a1 (0.4) a2 (0.2) a3 (0.2) a4 (0.1) a5 (0.1) a1 (0.4) a2 (0.2) a3 (0.2) a4 (0.1) a5 (0.1)