多媒体技术07-无损压缩算法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第7章 无损压缩算法
内容
基本概念 行程长度编码 变长度编码 字典编码 算术编码 无损图像压缩
2015-1-22
南京大学多媒体研究所
2
一、基本概念
1. 数据压缩的必要性
中(低)等质量图像: 640x480x16bits = 5Mb /帧 中(高)等质量图像: 1024x768x24bits = 18Mb /帧 CCIR 601数字电视: 720x576x16bitsx25 = 158Mb /s 高清晰度数字电视: 1280x720x24bitsx50= 1.05Gb/s
2015-1-22
南京大学多媒体研究所
13
变长度编码
Shannon-Fano算法
① ② ③
首先统计出每个符号出现的概率;
从左到右对上述概率从大到小排序;
从这个概率集合中的某个位置将其分为两个子集合,并尽量 使两个子集合的概率和近似相等,给前面一个子集合赋值为 0, 后面一个子集合赋值为1; 重复步骤3,直到各个子集合中只有一个元素为止; 将每个元素所属的子集合的值依次串起来,即可得到各个元 素的香农-范诺编码。
2015-1-22
南京大学多媒体研究所
6
重建图象的质量评价1
客观评价法
均方误差:
En
原始图像 的像素 重建图像 的像素
原始图像 信号均值
e2 1 x 2 (i ) n i 1 n i
1 ( x(i ) x(i ))2 n i
信噪比:
e2 SNR(dB) 10 lg 2 d
神经网络(Artificial Neural Network, ANN)
分形编码(Fractal Coding) 基于对象的压缩编码(Object Based Coding)
基于模型的压缩编码(Model Based Coding)
小波变化编码
2015-1-22
南京大学多媒体研究所
11
行程长度编码
一般,清楚地看(听)出有失真,对视听稍有影响
4 3 2 1
差,失真明显,对视听有影响 非常差,失真严重,非常严重地妨碍视听
来自百度文库
受评价者的经验、爱好、观察图像的内容、观察条件等影响
2015-1-22
南京大学多媒体研究所
8
5. 压缩方法的分类
lossless(无损压缩)
run-length coding(RLC) 预测编码 Huffman(哈夫曼编码) Arithmetic coding(算术编码) Lempel-Ziv & Welch ( LZW编码, 词典编码 ) 亚取样 变换编码 矢量编码 特征抽取(分析--合成法) (模型编码)
2015-1-22
南京大学多媒体研究所
4
数据压缩的必要性(续)
存储:硬盘 传输 PC机系统总线:5MB/s(ISA),133MB/s(PCI) CD-ROM 读出速率:40 x 150KB/s = 6MB/s ETHERNET 传输速率:10~100Mb~1Gb/s 普通电话接入速率:28.8 , 33.3 , 56 Kb/s
2015-1-22
南京大学多媒体研究所
22
算术编码
算术编码与Huffman编码的比较
压缩效率可提高 5~10% 硬件实现稍复杂 通信过程中差错会扩散 不必使用码表 自适应算术编码能够根据已经编码的信息串来调 整当前符号的概率估计,从而更有效地进行编码
2015-1-22
南京大学多媒体研究所
南京大学多媒体研究所
lossy (有损压缩)
2015-1-22
9
第一代压缩编码技术
统计(熵)编码。统计编码的基本原理是给出现概率较大的符号赋 予一个短码字,而给出现概率较小的符号赋予一个长码字, 从而 使得最终的平均码长很小。
预测编码。预测编码是基于图像数据的空间或时间冗余特性,用相 邻的已知像素(或像素块)来预测当前像素(或像素块)的取值, 然后再对预测误差进行量化和编码。
RLC的分析
方法直观,简单,速度快。
是一种无损压缩技术。
压缩比取决于图像本身的特点:
如果图像中具有相同颜色的图像块越大,且图像块数目越少,
获得的压缩比就越高。反之,压缩比就越小。
特别适合于扫描产生的黑白文稿和工程图纸,对颜色丰富的自 然图像效果较差。
不仅用于图像数据的压缩,也可应用于其他数字媒体的压缩。
④ ⑤
2015-1-22
南京大学多媒体研究所
15
Shannon-Fano编码举例
2015-1-22
南京大学多媒体研究所
16
3 Huffman 编码
基本原理:将在图象中出现次数多的像素值给一个短 的编码,将出现次数少的像数值给一个长的编码。 哈夫曼编码的一般算法如下: (1) 首先统计信源中各符号出现的概率, 按符号出 现的概率从大到小排序。 (2) 把最小的两个概率相加合并成新的概率, 与剩 余的概率组成新的概率集合。 (3)对新的概率集合重新排序, 再次把其中最小的 两个概率相加, 组成新的概率集合。如此重复进行, 直到 最后两个概率的和为1。 (4) 分配码字。码字分配从最后一步开始反向进行, 对于每次相加的两个概率,给大的赋“0”, 小的赋“1”
ADSL速率:512kb~2Mb/s,
2015-1-22
南京大学多媒体研究所
5
2. 图像数据压缩的可能性
(1) 时间、空间冗余 (2) 信息熵冗余 (3) 视觉冗余
眼睛空间综合能力的局限性(亮度等级,可区分弧度,高 频成分的非线性,...)
思维(mind)的时间综合能力的局限性
(4) 其他冗余,包括结构冗余、知识冗余等。 因此,在允许存在一定失真的前提下,可以对图象数据进行很 大程度的压缩。
( a1=10,a2= 11, a3= 000, a4= 001, a5= 010, a6= 0110, a7=0111 )
11 010 10 001 10 11 10 0111 a2 a5 a1 a4 a1 a2 a1 a7
编码方式不唯一,但平均码长相同
编码效率受信源概率分布影响 传输中误码影响较大 必须先存储/传输码表 必须预先知道信源的统计特性 图像过大时,应划分成小块编码
2015-1-22
南京大学多媒体研究所
26
JPEG无损编码
原理: 1 利用相邻象素之间的相关性进行预测: 预测值=a1*A+a2*B+a3*C 2 计算预测误差,预测误差=当前象素数值-预测值 3 对预测误差进行编码
C
B
当前象素
A
2015-1-22
南京大学多媒体研究所
27
预测公式
P1 P2 P3 P4 P5 P6 P7 A B C A+B-C A+(B-C)/2 B+(A-C)/2 (A+B)/2
变换编码。变换编码通常是将空间域上的图像经过正交变换映射到 另一变换域上,使变换后的系数之间的相关性降低。图像变换本身 并不能压缩数据,但变换后图像的大部分能量只集中到少数几个变 换系数上,采用适当的量化和熵编码就可以有效地压缩图像。
2015-1-22
南京大学多媒体研究所
10
第二代压缩编码技术
其中
d2
x(i) x(i)2
误差图像 信号均值
x2 峰值信噪比: PSNR(dB) 10 lg max d2
原始图像 信号峰值
2015-1-22 南京大学多媒体研究所
7
重建图象的质量评价2
主观评价法(MOS)
分值 5 重建图像(声音)的质量
非常好,丝毫看(听)不出失真 好,虽能看(听)出失真,但没有什么影响
24
无损图像压缩
差分编码
自然世界中的灰度变化是连续的 差分运算后的图像的直方图分布较窄,信息熵较低, 有可能达到较低的平均码长 常用的差分算子有:
d ( x, y ) I ( x, y ) I ( x 1, y ) d ( x, y ) 4 I ( x, y ) I ( x, y 1) I ( x, y 1) I ( x 1, y ) I ( x 1, y )
2015-1-22
1 0
1 0 1
0 1
0.2
1.0
0 1
0
0.4
0.6
0
0.4
a1 1 a2 01 a3 000 a4 0010 a5 0011 a1 00 a2 10 a3 11 a4 010 a5 011
18
0 1
0.2
南京大学多媒体研究所
1
0.6
1 0
1.0
Huffman 编码的分析
每个编码均非其它码的前缀,因此唯一可译
2015-1-22
南京大学多媒体研究所
19
Huffman编码在不同概率分 布下的编码效果对比
2015-1-22
南京大学多媒体研究所
20
字典编码
LZW编码
时间:
1977年,LZ77,LZ78 1984年,LZW
应用:gif,tif 压缩比:1:1.5~1:1.3 原理:
LZW压缩算法的基本思想是建立一个编码表(转换 表),韦尔奇称之为串表,将输入字符串映射成定 长的码字输出,通常码长设为12bit。
2015-1-22
南京大学多媒体研究所
28
2015-1-22 南京大学多媒体研究所 17
两种Huffman 编码的比较
例:设有5个符号: a1, a2, a3, a4, a5, 出现的概率是: 0.4, 0.2, 0.2, 0.1, 0.1,
a1 (0.4) a2 (0.2) a3 (0.2) a4 (0.1) a5 (0.1) a1 (0.4) a2 (0.2) a3 (0.2) a4 (0.1) a5 (0.1)
内容
基本概念 行程长度编码 变长度编码 字典编码 算术编码 无损图像压缩
2015-1-22
南京大学多媒体研究所
2
一、基本概念
1. 数据压缩的必要性
中(低)等质量图像: 640x480x16bits = 5Mb /帧 中(高)等质量图像: 1024x768x24bits = 18Mb /帧 CCIR 601数字电视: 720x576x16bitsx25 = 158Mb /s 高清晰度数字电视: 1280x720x24bitsx50= 1.05Gb/s
2015-1-22
南京大学多媒体研究所
13
变长度编码
Shannon-Fano算法
① ② ③
首先统计出每个符号出现的概率;
从左到右对上述概率从大到小排序;
从这个概率集合中的某个位置将其分为两个子集合,并尽量 使两个子集合的概率和近似相等,给前面一个子集合赋值为 0, 后面一个子集合赋值为1; 重复步骤3,直到各个子集合中只有一个元素为止; 将每个元素所属的子集合的值依次串起来,即可得到各个元 素的香农-范诺编码。
2015-1-22
南京大学多媒体研究所
6
重建图象的质量评价1
客观评价法
均方误差:
En
原始图像 的像素 重建图像 的像素
原始图像 信号均值
e2 1 x 2 (i ) n i 1 n i
1 ( x(i ) x(i ))2 n i
信噪比:
e2 SNR(dB) 10 lg 2 d
神经网络(Artificial Neural Network, ANN)
分形编码(Fractal Coding) 基于对象的压缩编码(Object Based Coding)
基于模型的压缩编码(Model Based Coding)
小波变化编码
2015-1-22
南京大学多媒体研究所
11
行程长度编码
一般,清楚地看(听)出有失真,对视听稍有影响
4 3 2 1
差,失真明显,对视听有影响 非常差,失真严重,非常严重地妨碍视听
来自百度文库
受评价者的经验、爱好、观察图像的内容、观察条件等影响
2015-1-22
南京大学多媒体研究所
8
5. 压缩方法的分类
lossless(无损压缩)
run-length coding(RLC) 预测编码 Huffman(哈夫曼编码) Arithmetic coding(算术编码) Lempel-Ziv & Welch ( LZW编码, 词典编码 ) 亚取样 变换编码 矢量编码 特征抽取(分析--合成法) (模型编码)
2015-1-22
南京大学多媒体研究所
4
数据压缩的必要性(续)
存储:硬盘 传输 PC机系统总线:5MB/s(ISA),133MB/s(PCI) CD-ROM 读出速率:40 x 150KB/s = 6MB/s ETHERNET 传输速率:10~100Mb~1Gb/s 普通电话接入速率:28.8 , 33.3 , 56 Kb/s
2015-1-22
南京大学多媒体研究所
22
算术编码
算术编码与Huffman编码的比较
压缩效率可提高 5~10% 硬件实现稍复杂 通信过程中差错会扩散 不必使用码表 自适应算术编码能够根据已经编码的信息串来调 整当前符号的概率估计,从而更有效地进行编码
2015-1-22
南京大学多媒体研究所
南京大学多媒体研究所
lossy (有损压缩)
2015-1-22
9
第一代压缩编码技术
统计(熵)编码。统计编码的基本原理是给出现概率较大的符号赋 予一个短码字,而给出现概率较小的符号赋予一个长码字, 从而 使得最终的平均码长很小。
预测编码。预测编码是基于图像数据的空间或时间冗余特性,用相 邻的已知像素(或像素块)来预测当前像素(或像素块)的取值, 然后再对预测误差进行量化和编码。
RLC的分析
方法直观,简单,速度快。
是一种无损压缩技术。
压缩比取决于图像本身的特点:
如果图像中具有相同颜色的图像块越大,且图像块数目越少,
获得的压缩比就越高。反之,压缩比就越小。
特别适合于扫描产生的黑白文稿和工程图纸,对颜色丰富的自 然图像效果较差。
不仅用于图像数据的压缩,也可应用于其他数字媒体的压缩。
④ ⑤
2015-1-22
南京大学多媒体研究所
15
Shannon-Fano编码举例
2015-1-22
南京大学多媒体研究所
16
3 Huffman 编码
基本原理:将在图象中出现次数多的像素值给一个短 的编码,将出现次数少的像数值给一个长的编码。 哈夫曼编码的一般算法如下: (1) 首先统计信源中各符号出现的概率, 按符号出 现的概率从大到小排序。 (2) 把最小的两个概率相加合并成新的概率, 与剩 余的概率组成新的概率集合。 (3)对新的概率集合重新排序, 再次把其中最小的 两个概率相加, 组成新的概率集合。如此重复进行, 直到 最后两个概率的和为1。 (4) 分配码字。码字分配从最后一步开始反向进行, 对于每次相加的两个概率,给大的赋“0”, 小的赋“1”
ADSL速率:512kb~2Mb/s,
2015-1-22
南京大学多媒体研究所
5
2. 图像数据压缩的可能性
(1) 时间、空间冗余 (2) 信息熵冗余 (3) 视觉冗余
眼睛空间综合能力的局限性(亮度等级,可区分弧度,高 频成分的非线性,...)
思维(mind)的时间综合能力的局限性
(4) 其他冗余,包括结构冗余、知识冗余等。 因此,在允许存在一定失真的前提下,可以对图象数据进行很 大程度的压缩。
( a1=10,a2= 11, a3= 000, a4= 001, a5= 010, a6= 0110, a7=0111 )
11 010 10 001 10 11 10 0111 a2 a5 a1 a4 a1 a2 a1 a7
编码方式不唯一,但平均码长相同
编码效率受信源概率分布影响 传输中误码影响较大 必须先存储/传输码表 必须预先知道信源的统计特性 图像过大时,应划分成小块编码
2015-1-22
南京大学多媒体研究所
26
JPEG无损编码
原理: 1 利用相邻象素之间的相关性进行预测: 预测值=a1*A+a2*B+a3*C 2 计算预测误差,预测误差=当前象素数值-预测值 3 对预测误差进行编码
C
B
当前象素
A
2015-1-22
南京大学多媒体研究所
27
预测公式
P1 P2 P3 P4 P5 P6 P7 A B C A+B-C A+(B-C)/2 B+(A-C)/2 (A+B)/2
变换编码。变换编码通常是将空间域上的图像经过正交变换映射到 另一变换域上,使变换后的系数之间的相关性降低。图像变换本身 并不能压缩数据,但变换后图像的大部分能量只集中到少数几个变 换系数上,采用适当的量化和熵编码就可以有效地压缩图像。
2015-1-22
南京大学多媒体研究所
10
第二代压缩编码技术
其中
d2
x(i) x(i)2
误差图像 信号均值
x2 峰值信噪比: PSNR(dB) 10 lg max d2
原始图像 信号峰值
2015-1-22 南京大学多媒体研究所
7
重建图象的质量评价2
主观评价法(MOS)
分值 5 重建图像(声音)的质量
非常好,丝毫看(听)不出失真 好,虽能看(听)出失真,但没有什么影响
24
无损图像压缩
差分编码
自然世界中的灰度变化是连续的 差分运算后的图像的直方图分布较窄,信息熵较低, 有可能达到较低的平均码长 常用的差分算子有:
d ( x, y ) I ( x, y ) I ( x 1, y ) d ( x, y ) 4 I ( x, y ) I ( x, y 1) I ( x, y 1) I ( x 1, y ) I ( x 1, y )
2015-1-22
1 0
1 0 1
0 1
0.2
1.0
0 1
0
0.4
0.6
0
0.4
a1 1 a2 01 a3 000 a4 0010 a5 0011 a1 00 a2 10 a3 11 a4 010 a5 011
18
0 1
0.2
南京大学多媒体研究所
1
0.6
1 0
1.0
Huffman 编码的分析
每个编码均非其它码的前缀,因此唯一可译
2015-1-22
南京大学多媒体研究所
19
Huffman编码在不同概率分 布下的编码效果对比
2015-1-22
南京大学多媒体研究所
20
字典编码
LZW编码
时间:
1977年,LZ77,LZ78 1984年,LZW
应用:gif,tif 压缩比:1:1.5~1:1.3 原理:
LZW压缩算法的基本思想是建立一个编码表(转换 表),韦尔奇称之为串表,将输入字符串映射成定 长的码字输出,通常码长设为12bit。
2015-1-22
南京大学多媒体研究所
28
2015-1-22 南京大学多媒体研究所 17
两种Huffman 编码的比较
例:设有5个符号: a1, a2, a3, a4, a5, 出现的概率是: 0.4, 0.2, 0.2, 0.1, 0.1,
a1 (0.4) a2 (0.2) a3 (0.2) a4 (0.1) a5 (0.1) a1 (0.4) a2 (0.2) a3 (0.2) a4 (0.1) a5 (0.1)