第十一章图像的压缩编码
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Helen将于明天晚上6点在Logan接你。
结论:只要接收端不会产生误解,就可以减少承载信息 的数据量。
• 图像中的数据冗余
描述语言: 1)“这是一幅 2×2的图像,图像的第一 个像素是红的,第二个像素是红的,第三 个像素是红的,第四个像素是红的”。
2)“这是一幅2×2的图像,整幅图都是红色 的”。
00 10 0111 00 10 0110 010 010 1111100 1101 00 00 10 (共39bit)
由于是变字长编码,所以在编码时必须保证不能出现一个 码字和另一个码字的前几位相同的情况,否则会发生译码错 误,霍夫曼编码算法能够保证这一点。
霍夫曼编码的步骤:
信源 s={s1, s2, s3, s4, s5, s6},其概率分布为p1=0.4 p2=0.3 p3=0.1 p4=0.1 p5=0.06 p6=0.04,求最佳 Huffman码。
输入 输入概率 第一步 第二步 第三步 第四步
S1
0.4
0.4
0.4
0.4
0.6 0
S2 0.3 0.3 0.3 0.3 0 0.4 1
S3 0.1 0.1 0.2 0 0.3 1
S4
0.1
0.1 0 0.1 1
S5 0.06 0 0.1 1
S6 0.04 1
输入 输入概率 第一步 第二步 第三步 第四步
S1 0.4
0.4
0.4
0.4
0.6 0
S2 0.3 0.3 0.3 0.3 0 0.4 1
(4个1,5,7,5,9,3,3)
行程编码的步骤:
0黑 1白
第一步:对每一行交替出现的白长和黑长进行统计;
第二步:再对游长进行变长编码,即根据其不同的出现概率 分配以不同长度的码字(霍夫曼编码)。
行程编码同样适用于灰度或彩色图像:
缺点:
在最坏的情况下,如果每两个相邻像素的灰度都不同,这种 算法不但不能压缩,反而使数据量增加一倍。
所以播放时,需要27.648MB/s的通信回路(参考数据:宽带网 为512Kb/s,电话线为56Kb/s)。如果存储在650MB的光盘中,在 不考虑音频的情况下,每张光盘只能播放24s。
传真数据 如果只传送二值图像,以200dpi的分辨率传输,一张A4
稿纸的内容的数据量为:
(200210/ 25.4) (200297/ 25.4) 3866948bit
当其中一个灰度级 s j的出现概率 p(s j ) 1时,其余灰度 si
的出现概率 p(si ) 0 (i j) ,此时 H 0 ;
当各个 si 出现的概率均等时 ( p(si ) 1/ k) ,则具有最大熵值
为 H log2 k ;
熵值总有 0 H log2 k 。
由此我们知道,基于整体图像的描述方法可以达到压缩的目的。
例:图像冗余无损压缩
RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB
16 RGB 从原来的16×3×8=284bits压缩为:(1+3)×8=32bits
• 图像中的视觉冗余
2、霍夫曼编码(熵编码)
基本原理:以变字长编码理论为依据,按编码输入信息符号出 现的统计概率不同,给输出码字分配以不同的字长,对于出现 概率大的信息符号编以较短字长的码,对于出现概率小的信息 符号编以较长字长的码。
举例说明:
一个图像中出了8种灰度级{ s0,s1,s2,s3,s4,s5,s6,s7},假设 编码成:
2.42
6
平均码长: L Li p(si ) i 1 20.25 20.25 20.20 30.15 40.10 40.05
2.45
编码效率: H 100% 2.42 100% 98.8%
L
2.45
冗余度: r L 1 2.45 1 0.012 1.2% H 2.42
图像数据压缩的目的是在满足一定图像质量条件下,用尽 可能少的比特数来表示原始图像,以提高图像传输的效率和减 少图像存储的容量,在信息论中称为信源编码。分为无失真编 码(或称为信息保持编码)和有失真编码(或称为限失真编码 两类。
1)无失真编码理论
信息量:假设一幅数字图像共有K个灰度级{s1, s2 sk},并
第十章
数字图像的压缩 编码
一、概 述
1、图像压缩编码的必要性
彩色视频信息
对于电视画面的分辨率为640×480像素的彩色图像(24bit/ 像素),其数据量为:
64048024 7372800bit 921.6KB
如果以每秒30帧的速度播放,则每秒的数据量为:
6404802430 221.184Mbit 27.648MB
D
R(D)
C
4、压缩编码系统评价
1)基于压缩编码参数的评价
一般来讲,压缩比越大,则说明被压缩掉的数据量越多。 一个编码系统要研究的问题是设法减小编码的平均码字长度, 使编码效率尽量趋于1,而冗余度尽量趋于0。
例:一个有6个灰度级的数字图像,其霍夫曼编码为:
符号 概率 码字
s1
0.25 01
s2
0.25 10
s0 000 s1 001 s4 100 s5 101
s2 010 s6 110
s3 011 s7 111
那么像素序列s0s1s7s0s1s6s2s2s3s4s5s0s0s1经编码后变成:
000 001111 000 001110 010 010 011100 101 000 000 001 (共42bit)
峰值信噪比:
PSNR 10 lg
f2 max
MSE
• 主观保真度准则
5、图像压缩编码的分类
从解码结果对原图像的保真程度,可分为两大类:
无损压缩(无失真编码、冗余度压缩)
是一种解码时可以精确地恢复原图像,没有任何损失的 编码方法。典型代表有:行程编码、霍夫曼编码等。
有损压缩(限失真编码、熵压缩)
按目前14.4Kb/s的电话线传输速率,需要传送的时间是:270秒 (4.5分)。
问 题:
通信信道的传输带宽、速度、存储器容量有限,如何用软 件的手段来解决硬件上的物理极限?
解决途径: 数据的压缩
2、图像压缩编码的可能性 • 数据冗余的概念
你的妻子,Helen,将于明天晚上6点零5分在波士顿的Logan机场接你。 你的妻子将于明天晚上6点零5分在Logan机场接你。
持编码定理。
冗余度:用平均码字长度与图像熵的差值来表示编码后存在
于图像中的冗余量,则冗余度定义为:
r L 1 H
编码效率: H 100% 1 100%
L
1 r
冗余度接近于0,或编码效率接近于1的编码称为高效码。
压缩比:若编码前图像的平均码长为n,则压缩比定义为:
C n L
原始图像f (x, y)将存在差别,由两者的均方误差来定义失真度:
D {[ fˆ ( x, y) f ( x, y)]2}
1
M 1N 1
[ fˆ(x, y) f (x, y)]2
MN x0 y0
在给定最大容许失真度 D* 的条件下,信源编码所能达到的压 缩比的极限码率R(D*) ,称为率失真函数R。(D) 为D 的单调递 减函数:
且出现的概率分别为{p(s1), p(s2 ) p(sk )} ,则图像中每一
个像素值所具有的信息量定义为:
I (si ) log2 p(si )
信息熵:指图像的平均信息量,表示各个灰度级位数的统计
平均值:
k
H p(si )log2 p(si )
i 1
熵的性质:
熵是一个非负数,即总有 H 0;
2)基于保真度准则的评价 • 客观保真度准则
保真度准则——对信息的损失进行测度,以描述解码图像相 对于原始图像的偏离程度。
均方误差: MSE
1
M 1N 1
[ fˆ(x, y) f (x, y)]2
MN x0 y0
M 1 N 1
fˆ(x, y)2
方均信噪比:SNR 10 lg x0 y0 MN MSE
彩 色: R G B
224 16777216 种颜色
人眼只能辨别出上千种不同色度和亮度的色彩
(248,27,4)
(251,32,15)
(248,27,4)
(248,27,4)
灰 度:
28 256 种灰度
人眼只能区分出40多种不同等级的灰度
例:图像冗余有损压缩
36 35 34 34 34 34 34 32 34 34 33 37 30 34 34 34 34 34 34 34 34 35 34 34 31
统计:符号s0,s1,s2 出现的频率比较大,分别为4/14、3/14、 2/14;其余符号出现频率较小,各为1/14。
若采用霍夫曼编码: s0 00 s1 10 s4 1100 s5 1101
s2 010 s6 0110
s3 111 s7 0111
上述像素序列经编码后变成:
34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34
25 34
从原来的5×5×8=200bits压缩为:(1+1)×8=16bits
图像冗余信息分析结论:
由于一幅图像存在大量的数据冗余和主观上的视觉冗余,使 得图像数据压缩成为可能;
s3
0.20 11
s4
0.15 000
s5
0.10 0010
s6
0.05 0011
根据以上数据,计算出该图像的熵值、平均码长、编码效率和 冗余度。
熵:
6
H p(si )log2 p(si ) i 1
0.25 log2 0.25 0.25 log2 0.25 0.20 log2 0.20
由Shannon定理可得,无失真编码时的最大压缩比为:CM
n H
2)限失真编码理论
严格的无失真编码的压缩比一般是不大的。编码效率的 提高往往要以采用较复杂的编码方法为代价;另一方面,用 户通常允许图象有一定的失真,这为图象数据压缩提供了较 大的可能性,因此人们非常注意限失真编码问题。
失真度:当使用有损压缩编码时,解码恢复的图像 fˆ ( x, y)与
平均码字长度:设 Li为数字图像中对灰度级 si(出现的概率
为p(si ))编码时所对应的码字长度,则该数字图像所赋予的平 均码字长度为:
k
L Li p在无外界干扰的条件下,存在一种无失真的编
码方法,使编码的平均码字长度 L 与信源的熵 H任意地 接近,即:L H ,其中ε为任意小的正数,但以H 为其下限,即:L H,这就是香农(Shannon)的信息保
用户或应用环境允许图像有一定程度的失真,当接收端图像 显示设备的分辨率较低时,降低输入的原始图像的分辨率对输 出图像分辨率影响不大;
用户对原始图像的信号不全都感兴趣,可用特征提取和图像 识别的方法,丢掉大量无用的信息。提取有用的信息,使必须 传输和存储的图像数据量大大减少。
3、信源编码的基本理论
解码时只能近似原图像,不能无失真地恢复。典型代表 有:预测编码、变换编码(DCT编码)等。
二、图像无损压缩技术
1、行程编码
基本原理:通过改变图像的描述方式,来实现压缩。将一行 中颜色值相同的相邻像素用一个计数值和该颜色值来代替。
举例说明: aaaa bbb cc d eeeee fffffff (共22×8=176bits)
4a3b2c1d5e7f (共12×8=96bits)
把具有相同灰度值的相邻像素组成的序列称为一个游程,游程 中像素的个数称为游程长度,简称游长。
行程编码对于二值图像效果尤为显著:在每一扫描行上,总是 可以分割成若干个白像素段(白长)和黑像素段(黑长)之和, 由于白长和黑长是交替出现的,所以在编码时,只需对每一行 的第一个像素赋予一个标志,以区分该行是以白长还是以黑长 开始的,后面只写游长即可。
步骤一:将信源符号按出现概率从大到小排成一列,然后把最末 两个符号的概率相加,合成一个概率;
步骤二:把步骤一中得到的合成概率看成是一个新的组成符号的 概率,重复步骤一的做法,直到最后剩下两个概率为止;
步骤三:从最后一步剩下的两个概率开始逐步向前进行编码。 每一步有两个分支,各赋予一个二进制码,如对概率大的赋予 码元0,对概率小的赋予码元1。
结论:只要接收端不会产生误解,就可以减少承载信息 的数据量。
• 图像中的数据冗余
描述语言: 1)“这是一幅 2×2的图像,图像的第一 个像素是红的,第二个像素是红的,第三 个像素是红的,第四个像素是红的”。
2)“这是一幅2×2的图像,整幅图都是红色 的”。
00 10 0111 00 10 0110 010 010 1111100 1101 00 00 10 (共39bit)
由于是变字长编码,所以在编码时必须保证不能出现一个 码字和另一个码字的前几位相同的情况,否则会发生译码错 误,霍夫曼编码算法能够保证这一点。
霍夫曼编码的步骤:
信源 s={s1, s2, s3, s4, s5, s6},其概率分布为p1=0.4 p2=0.3 p3=0.1 p4=0.1 p5=0.06 p6=0.04,求最佳 Huffman码。
输入 输入概率 第一步 第二步 第三步 第四步
S1
0.4
0.4
0.4
0.4
0.6 0
S2 0.3 0.3 0.3 0.3 0 0.4 1
S3 0.1 0.1 0.2 0 0.3 1
S4
0.1
0.1 0 0.1 1
S5 0.06 0 0.1 1
S6 0.04 1
输入 输入概率 第一步 第二步 第三步 第四步
S1 0.4
0.4
0.4
0.4
0.6 0
S2 0.3 0.3 0.3 0.3 0 0.4 1
(4个1,5,7,5,9,3,3)
行程编码的步骤:
0黑 1白
第一步:对每一行交替出现的白长和黑长进行统计;
第二步:再对游长进行变长编码,即根据其不同的出现概率 分配以不同长度的码字(霍夫曼编码)。
行程编码同样适用于灰度或彩色图像:
缺点:
在最坏的情况下,如果每两个相邻像素的灰度都不同,这种 算法不但不能压缩,反而使数据量增加一倍。
所以播放时,需要27.648MB/s的通信回路(参考数据:宽带网 为512Kb/s,电话线为56Kb/s)。如果存储在650MB的光盘中,在 不考虑音频的情况下,每张光盘只能播放24s。
传真数据 如果只传送二值图像,以200dpi的分辨率传输,一张A4
稿纸的内容的数据量为:
(200210/ 25.4) (200297/ 25.4) 3866948bit
当其中一个灰度级 s j的出现概率 p(s j ) 1时,其余灰度 si
的出现概率 p(si ) 0 (i j) ,此时 H 0 ;
当各个 si 出现的概率均等时 ( p(si ) 1/ k) ,则具有最大熵值
为 H log2 k ;
熵值总有 0 H log2 k 。
由此我们知道,基于整体图像的描述方法可以达到压缩的目的。
例:图像冗余无损压缩
RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB
16 RGB 从原来的16×3×8=284bits压缩为:(1+3)×8=32bits
• 图像中的视觉冗余
2、霍夫曼编码(熵编码)
基本原理:以变字长编码理论为依据,按编码输入信息符号出 现的统计概率不同,给输出码字分配以不同的字长,对于出现 概率大的信息符号编以较短字长的码,对于出现概率小的信息 符号编以较长字长的码。
举例说明:
一个图像中出了8种灰度级{ s0,s1,s2,s3,s4,s5,s6,s7},假设 编码成:
2.42
6
平均码长: L Li p(si ) i 1 20.25 20.25 20.20 30.15 40.10 40.05
2.45
编码效率: H 100% 2.42 100% 98.8%
L
2.45
冗余度: r L 1 2.45 1 0.012 1.2% H 2.42
图像数据压缩的目的是在满足一定图像质量条件下,用尽 可能少的比特数来表示原始图像,以提高图像传输的效率和减 少图像存储的容量,在信息论中称为信源编码。分为无失真编 码(或称为信息保持编码)和有失真编码(或称为限失真编码 两类。
1)无失真编码理论
信息量:假设一幅数字图像共有K个灰度级{s1, s2 sk},并
第十章
数字图像的压缩 编码
一、概 述
1、图像压缩编码的必要性
彩色视频信息
对于电视画面的分辨率为640×480像素的彩色图像(24bit/ 像素),其数据量为:
64048024 7372800bit 921.6KB
如果以每秒30帧的速度播放,则每秒的数据量为:
6404802430 221.184Mbit 27.648MB
D
R(D)
C
4、压缩编码系统评价
1)基于压缩编码参数的评价
一般来讲,压缩比越大,则说明被压缩掉的数据量越多。 一个编码系统要研究的问题是设法减小编码的平均码字长度, 使编码效率尽量趋于1,而冗余度尽量趋于0。
例:一个有6个灰度级的数字图像,其霍夫曼编码为:
符号 概率 码字
s1
0.25 01
s2
0.25 10
s0 000 s1 001 s4 100 s5 101
s2 010 s6 110
s3 011 s7 111
那么像素序列s0s1s7s0s1s6s2s2s3s4s5s0s0s1经编码后变成:
000 001111 000 001110 010 010 011100 101 000 000 001 (共42bit)
峰值信噪比:
PSNR 10 lg
f2 max
MSE
• 主观保真度准则
5、图像压缩编码的分类
从解码结果对原图像的保真程度,可分为两大类:
无损压缩(无失真编码、冗余度压缩)
是一种解码时可以精确地恢复原图像,没有任何损失的 编码方法。典型代表有:行程编码、霍夫曼编码等。
有损压缩(限失真编码、熵压缩)
按目前14.4Kb/s的电话线传输速率,需要传送的时间是:270秒 (4.5分)。
问 题:
通信信道的传输带宽、速度、存储器容量有限,如何用软 件的手段来解决硬件上的物理极限?
解决途径: 数据的压缩
2、图像压缩编码的可能性 • 数据冗余的概念
你的妻子,Helen,将于明天晚上6点零5分在波士顿的Logan机场接你。 你的妻子将于明天晚上6点零5分在Logan机场接你。
持编码定理。
冗余度:用平均码字长度与图像熵的差值来表示编码后存在
于图像中的冗余量,则冗余度定义为:
r L 1 H
编码效率: H 100% 1 100%
L
1 r
冗余度接近于0,或编码效率接近于1的编码称为高效码。
压缩比:若编码前图像的平均码长为n,则压缩比定义为:
C n L
原始图像f (x, y)将存在差别,由两者的均方误差来定义失真度:
D {[ fˆ ( x, y) f ( x, y)]2}
1
M 1N 1
[ fˆ(x, y) f (x, y)]2
MN x0 y0
在给定最大容许失真度 D* 的条件下,信源编码所能达到的压 缩比的极限码率R(D*) ,称为率失真函数R。(D) 为D 的单调递 减函数:
且出现的概率分别为{p(s1), p(s2 ) p(sk )} ,则图像中每一
个像素值所具有的信息量定义为:
I (si ) log2 p(si )
信息熵:指图像的平均信息量,表示各个灰度级位数的统计
平均值:
k
H p(si )log2 p(si )
i 1
熵的性质:
熵是一个非负数,即总有 H 0;
2)基于保真度准则的评价 • 客观保真度准则
保真度准则——对信息的损失进行测度,以描述解码图像相 对于原始图像的偏离程度。
均方误差: MSE
1
M 1N 1
[ fˆ(x, y) f (x, y)]2
MN x0 y0
M 1 N 1
fˆ(x, y)2
方均信噪比:SNR 10 lg x0 y0 MN MSE
彩 色: R G B
224 16777216 种颜色
人眼只能辨别出上千种不同色度和亮度的色彩
(248,27,4)
(251,32,15)
(248,27,4)
(248,27,4)
灰 度:
28 256 种灰度
人眼只能区分出40多种不同等级的灰度
例:图像冗余有损压缩
36 35 34 34 34 34 34 32 34 34 33 37 30 34 34 34 34 34 34 34 34 35 34 34 31
统计:符号s0,s1,s2 出现的频率比较大,分别为4/14、3/14、 2/14;其余符号出现频率较小,各为1/14。
若采用霍夫曼编码: s0 00 s1 10 s4 1100 s5 1101
s2 010 s6 0110
s3 111 s7 0111
上述像素序列经编码后变成:
34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34
25 34
从原来的5×5×8=200bits压缩为:(1+1)×8=16bits
图像冗余信息分析结论:
由于一幅图像存在大量的数据冗余和主观上的视觉冗余,使 得图像数据压缩成为可能;
s3
0.20 11
s4
0.15 000
s5
0.10 0010
s6
0.05 0011
根据以上数据,计算出该图像的熵值、平均码长、编码效率和 冗余度。
熵:
6
H p(si )log2 p(si ) i 1
0.25 log2 0.25 0.25 log2 0.25 0.20 log2 0.20
由Shannon定理可得,无失真编码时的最大压缩比为:CM
n H
2)限失真编码理论
严格的无失真编码的压缩比一般是不大的。编码效率的 提高往往要以采用较复杂的编码方法为代价;另一方面,用 户通常允许图象有一定的失真,这为图象数据压缩提供了较 大的可能性,因此人们非常注意限失真编码问题。
失真度:当使用有损压缩编码时,解码恢复的图像 fˆ ( x, y)与
平均码字长度:设 Li为数字图像中对灰度级 si(出现的概率
为p(si ))编码时所对应的码字长度,则该数字图像所赋予的平 均码字长度为:
k
L Li p在无外界干扰的条件下,存在一种无失真的编
码方法,使编码的平均码字长度 L 与信源的熵 H任意地 接近,即:L H ,其中ε为任意小的正数,但以H 为其下限,即:L H,这就是香农(Shannon)的信息保
用户或应用环境允许图像有一定程度的失真,当接收端图像 显示设备的分辨率较低时,降低输入的原始图像的分辨率对输 出图像分辨率影响不大;
用户对原始图像的信号不全都感兴趣,可用特征提取和图像 识别的方法,丢掉大量无用的信息。提取有用的信息,使必须 传输和存储的图像数据量大大减少。
3、信源编码的基本理论
解码时只能近似原图像,不能无失真地恢复。典型代表 有:预测编码、变换编码(DCT编码)等。
二、图像无损压缩技术
1、行程编码
基本原理:通过改变图像的描述方式,来实现压缩。将一行 中颜色值相同的相邻像素用一个计数值和该颜色值来代替。
举例说明: aaaa bbb cc d eeeee fffffff (共22×8=176bits)
4a3b2c1d5e7f (共12×8=96bits)
把具有相同灰度值的相邻像素组成的序列称为一个游程,游程 中像素的个数称为游程长度,简称游长。
行程编码对于二值图像效果尤为显著:在每一扫描行上,总是 可以分割成若干个白像素段(白长)和黑像素段(黑长)之和, 由于白长和黑长是交替出现的,所以在编码时,只需对每一行 的第一个像素赋予一个标志,以区分该行是以白长还是以黑长 开始的,后面只写游长即可。
步骤一:将信源符号按出现概率从大到小排成一列,然后把最末 两个符号的概率相加,合成一个概率;
步骤二:把步骤一中得到的合成概率看成是一个新的组成符号的 概率,重复步骤一的做法,直到最后剩下两个概率为止;
步骤三:从最后一步剩下的两个概率开始逐步向前进行编码。 每一步有两个分支,各赋予一个二进制码,如对概率大的赋予 码元0,对概率小的赋予码元1。