第十一章图像的压缩编码

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Helen将于明天晚上6点在Logan接你。
结论：只要接收端不会产生误解，就可以减少承载信息的数据量。
• 图像中的数据冗余
描述语言： 1）“这是一幅 2×2的图像，图像的第一个像素是红的，第二个像素是红的，第三个像素是红的，第四个像素是红的”。
2）“这是一幅2×2的图像，整幅图都是红色的”。
00 10 0111 00 10 0110 010 010 1111100 1101 00 00 10 （共39bit）
由于是变字长编码，所以在编码时必须保证不能出现一个码字和另一个码字的前几位相同的情况，否则会发生译码错误，霍夫曼编码算法能够保证这一点。
霍夫曼编码的步骤：
信源 s={s1, s2, s3, s4, s5, s6}，其概率分布为p1=0.4 p2=0.3 p3=0.1 p4=0.1 p5=0.06 p6=0.04，求最佳 Huffman码。
输入输入概率第一步第二步第三步第四步
S1
0.4
0.4
0.4
0.4
0.6 0
S2 0.3 0.3 0.3 0.3 0 0.4 1
S3 0.1 0.1 0.2 0 0.3 1
S4
0.1
0.1 0 0.1 1
S5 0.06 0 0.1 1
S6 0.04 1
输入输入概率第一步第二步第三步第四步
S1 0.4
0.4
0.4
0.4
0.6 0
S2 0.3 0.3 0.3 0.3 0 0.4 1
（4个1，5，7，5，9，3，3）
行程编码的步骤：
0黑 1白
第一步：对每一行交替出现的白长和黑长进行统计；
第二步：再对游长进行变长编码，即根据其不同的出现概率分配以不同长度的码字（霍夫曼编码）。
行程编码同样适用于灰度或彩色图像：
缺点：
在最坏的情况下，如果每两个相邻像素的灰度都不同，这种算法不但不能压缩，反而使数据量增加一倍。
所以播放时，需要27.648MB/s的通信回路（参考数据：宽带网为512Kb/s,电话线为56Kb/s）。如果存储在650MB的光盘中，在不考虑音频的情况下，每张光盘只能播放24s。
传真数据如果只传送二值图像，以200dpi的分辨率传输，一张A4
稿纸的内容的数据量为：
(200210/ 25.4) (200297/ 25.4) 3866948bit
当其中一个灰度级 s j的出现概率 p(s j ) 1时，其余灰度 si
的出现概率 p(si ) 0 (i j) ，此时 H 0 ；
当各个 si 出现的概率均等时 ( p(si ) 1/ k) ，则具有最大熵值
为 H log2 k ；
熵值总有 0 H log2 k 。
由此我们知道，基于整体图像的描述方法可以达到压缩的目的。
例：图像冗余无损压缩
RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB RGB
16 RGB 从原来的16×3×8=284bits压缩为：(1+3)×8=32bits
• 图像中的视觉冗余
2、霍夫曼编码（熵编码）
基本原理：以变字长编码理论为依据，按编码输入信息符号出现的统计概率不同，给输出码字分配以不同的字长，对于出现概率大的信息符号编以较短字长的码，对于出现概率小的信息符号编以较长字长的码。
举例说明：
一个图像中出了8种灰度级{ s0,s1,s2,s3,s4,s5,s6,s7}，假设编码成：
2.42
6
平均码长： L Li p(si ) i 1 20.25 20.25 20.20 30.15 40.10 40.05
2.45
编码效率： H 100% 2.42 100% 98.8%
L
2.45
冗余度: r L 1 2.45 1 0.012 1.2% H 2.42
图像数据压缩的目的是在满足一定图像质量条件下，用尽可能少的比特数来表示原始图像，以提高图像传输的效率和减少图像存储的容量，在信息论中称为信源编码。分为无失真编码（或称为信息保持编码）和有失真编码（或称为限失真编码两类。
1）无失真编码理论
信息量：假设一幅数字图像共有K个灰度级{s1, s2 sk}，并
第十章
数字图像的压缩编码
一、概述
1、图像压缩编码的必要性
彩色视频信息
对于电视画面的分辨率为640×480像素的彩色图像（24bit/ 像素），其数据量为：
64048024 7372800bit 921.6KB
如果以每秒30帧的速度播放，则每秒的数据量为：
6404802430 221.184Mbit 27.648MB
D
R(D)
C
4、压缩编码系统评价
1）基于压缩编码参数的评价
一般来讲，压缩比越大，则说明被压缩掉的数据量越多。一个编码系统要研究的问题是设法减小编码的平均码字长度，使编码效率尽量趋于1，而冗余度尽量趋于0。
例：一个有6个灰度级的数字图像，其霍夫曼编码为：
符号概率码字
s1
0.25 01
s2
0.25 10
s0 000 s1 001 s4 100 s5 101
s2 010 s6 110
s3 011 s7 111
那么像素序列s0s1s7s0s1s6s2s2s3s4s5s0s0s1经编码后变成：
000 001111 000 001110 010 010 011100 101 000 000 001 （共42bit）
峰值信噪比：
PSNR 10 lg
f2 max
MSE
• 主观保真度准则
5、图像压缩编码的分类
从解码结果对原图像的保真程度，可分为两大类：
无损压缩（无失真编码、冗余度压缩）
是一种解码时可以精确地恢复原图像，没有任何损失的编码方法。典型代表有：行程编码、霍夫曼编码等。
有损压缩（限失真编码、熵压缩）
按目前14.4Kb/s的电话线传输速率，需要传送的时间是：270秒（4.5分）。
问题：
通信信道的传输带宽、速度、存储器容量有限，如何用软件的手段来解决硬件上的物理极限？
解决途径：数据的压缩
2、图像压缩编码的可能性 • 数据冗余的概念
你的妻子，Helen，将于明天晚上6点零5分在波士顿的Logan机场接你。你的妻子将于明天晚上6点零5分在Logan机场接你。
持编码定理。
冗余度：用平均码字长度与图像熵的差值来表示编码后存在
于图像中的冗余量，则冗余度定义为：
r L 1 H
编码效率： H 100% 1 100%
L
1 r
冗余度接近于0，或编码效率接近于1的编码称为高效码。
压缩比：若编码前图像的平均码长为n，则压缩比定义为：
C n L
原始图像f (x, y)将存在差别，由两者的均方误差来定义失真度：
D {[ fˆ ( x, y) f ( x, y)]2}

1
M 1N 1
[ fˆ(x, y) f (x, y)]2
MN x0 y0
在给定最大容许失真度 D* 的条件下，信源编码所能达到的压缩比的极限码率R(D*) ，称为率失真函数R。(D) 为D 的单调递减函数：
且出现的概率分别为{p(s1), p(s2 ) p(sk )} ，则图像中每一
个像素值所具有的信息量定义为：
I (si ) log2 p(si )
信息熵：指图像的平均信息量，表示各个灰度级位数的统计
平均值：
k
H p(si )log2 p(si )
i 1
熵的性质：
熵是一个非负数，即总有 H 0；
2）基于保真度准则的评价 • 客观保真度准则
保真度准则——对信息的损失进行测度，以描述解码图像相对于原始图像的偏离程度。
均方误差： MSE
1
M 1N 1
[ fˆ(x, y) f (x, y)]2
MN x0 y0
M 1 N 1
fˆ(x, y)2
方均信噪比：SNR 10 lg x0 y0 MN MSE
彩色： R G B
224 16777216 种颜色
人眼只能辨别出上千种不同色度和亮度的色彩
(248,27,4)
(251,32,15)
(248,27,4)
(248,27,4)
灰度：
28 256 种灰度
人眼只能区分出40多种不同等级的灰度
例：图像冗余有损压缩
36 35 34 34 34 34 34 32 34 34 33 37 30 34 34 34 34 34 34 34 34 35 34 34 31
统计：符号s0,s1,s2 出现的频率比较大，分别为4/14、3/14、 2/14；其余符号出现频率较小，各为1/14。
若采用霍夫曼编码： s0 00 s1 10 s4 1100 s5 1101
s2 010 s6 0110
s3 111 s7 0111
上述像素序列经编码后变成：
34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34 34
25 34
从原来的5×5×8=200bits压缩为：(1+1)×8=16bits
图像冗余信息分析结论：
由于一幅图像存在大量的数据冗余和主观上的视觉冗余，使得图像数据压缩成为可能；
s3
0.20 11
s4
0.15 000
s5
0.10 0010
s6
0.05 0011
根据以上数据，计算出该图像的熵值、平均码长、编码效率和冗余度。
熵：
6
H p(si )log2 p(si ) i 1
0.25 log2 0.25 0.25 log2 0.25 0.20 log2 0.20
由Shannon定理可得，无失真编码时的最大压缩比为：CM

n H
2）限失真编码理论
严格的无失真编码的压缩比一般是不大的。编码效率的提高往往要以采用较复杂的编码方法为代价；另一方面，用户通常允许图象有一定的失真，这为图象数据压缩提供了较大的可能性，因此人们非常注意限失真编码问题。
失真度：当使用有损压缩编码时，解码恢复的图像 fˆ ( x, y)与
平均码字长度：设 Li为数字图像中对灰度级 si（出现的概率
为p(si )）编码时所对应的码字长度，则该数字图像所赋予的平均码字长度为：
k
L Li p在无外界干扰的条件下，存在一种无失真的编
码方法，使编码的平均码字长度 L 与信源的熵 H任意地接近，即：L H ，其中ε为任意小的正数，但以H 为其下限，即：L H，这就是香农(Shannon)的信息保
用户或应用环境允许图像有一定程度的失真，当接收端图像显示设备的分辨率较低时，降低输入的原始图像的分辨率对输出图像分辨率影响不大；
用户对原始图像的信号不全都感兴趣，可用特征提取和图像识别的方法，丢掉大量无用的信息。提取有用的信息，使必须传输和存储的图像数据量大大减少。
3、信源编码的基本理论
解码时只能近似原图像，不能无失真地恢复。典型代表有：预测编码、变换编码（DCT编码）等。
二、图像无损压缩技术
1、行程编码
基本原理：通过改变图像的描述方式，来实现压缩。将一行中颜色值相同的相邻像素用一个计数值和该颜色值来代替。
举例说明： aaaa bbb cc d eeeee fffffff (共22×8=176bits)
4a3b2c1d5e7f (共12×8=96bits)
把具有相同灰度值的相邻像素组成的序列称为一个游程，游程中像素的个数称为游程长度，简称游长。
行程编码对于二值图像效果尤为显著：在每一扫描行上，总是可以分割成若干个白像素段（白长）和黑像素段（黑长）之和，由于白长和黑长是交替出现的，所以在编码时，只需对每一行的第一个像素赋予一个标志，以区分该行是以白长还是以黑长开始的，后面只写游长即可。
步骤一：将信源符号按出现概率从大到小排成一列，然后把最末两个符号的概率相加，合成一个概率；
步骤二：把步骤一中得到的合成概率看成是一个新的组成符号的概率，重复步骤一的做法，直到最后剩下两个概率为止；
步骤三：从最后一步剩下的两个概率开始逐步向前进行编码。每一步有两个分支，各赋予一个二进制码，如对概率大的赋予码元0，对概率小的赋予码元1。