数字信号处理 第六章 图像压缩与编码
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
预测编码的理论基础是现代统计学和控制理论。其 基本原理是利用邻近像素/帧之间存在的相关性, 将某一像素点的灰度值用与它相邻近的像素点的 灰度值来估计,并把估计值与实际值的差作为样 本的编码,以达到信息压缩的目的。
6.5.1 DPCM工作原理 6.5.2 线性预测编码 6.5.3 自适应预测编码 6.5.4 自适应量化器
1 N 1 N 1 2 D 2 f ( x, y ) g ( x, y ) u ( s)dxdy N 0 0 1, f ( x, y ) g ( x, y ) T u ( s) 0, f ( x, y ) g ( x, y ) T
6.5 预测编码(prediction coding)
6.1 图像信息的冗余
2 时间冗余 对于动画或电视图像所形成的图像序列 (帧序列),相邻两帧图像之间有较大的 相关性,其中有很多局部甚至完全相同, 或变化极其细微,这就形成了数据的时间 冗余。
6.1 图像信息的冗余
3 信息熵冗余 又称编码冗余,即实际数据量大于理论数 据量。
6.1 图像信息的冗余
图像的质量主要取决于主观感觉,人眼的视 觉系统并不能察觉图像的所有失真。
有损压缩编码的压缩比一般比无损压缩编码 高,但一般来讲,压缩比越大,丢失的信 息越多,失真越大。 6.4.1 率失真理论 6.4.2 其他失真理论
6.4.1 率失真理论
编码数据率:每个像素的平均编码长度(位数), 又称编码比特率、编码率。
~ a x(n i) x i
i 1 p
重建信号:
ˆ ˆ x(n) e(n) ~(n) e(n) ai x(n i) x
i 1
p
6.5.2 线性预测编码
一个DPCM系统的数据压缩率的大小取决于 预测器性能的好坏。最佳线性预测就是选 择合适的系数ai使得误差信号en的均方值最 小。 线性预测是以原图像信号xN为一平稳的随机 过程且其相关函数与像素位置无关的假设 为前提的,所得到的最佳线性预测系数也 是一组与位置无关的常数。
6.3.3 算术编码
解码过程: (1)[0.23,0.236)<[0.2,0.5),故第一个字符为a2。 (2)去掉间隔低端,[0.23-0.2,0.236-0.2)/(0.50.2)=[0.1,0.12)<[0.0,0.2),故第二个字符为a1。 (3)去掉间隔低端,[0.1-0.0,0.12-0.0)/(0.20.0)=[0.5,0.6)<=[0.5,0.6),故第三个字符为a3。
在预测编码中,要对差值信号e进行量化。只 要设计了一个最佳量化器,才能使复原图 像的质量达到最优效果。 最佳量化器的设计方法:1)在量化器的分层 数k已经给定的情况下,以量化误差的均方 值最小为设计准则;2)在保证量化误差不 超出视觉的可见阈值的前提下,尽可能减 少量化器的分层数。
客观评价常用于压缩系统设计和调整。主观评价才 是对一幅图像质量的最终评价。
6.3 无损压缩及其编码方法
无损压缩要求压缩后不丢失信息量,即对图 像进行压缩编码后再译码可以不失真地复 原图像。压缩比一般较小。
6.3.1 香农信息保持编码定理 6.3.2 哈夫曼编码 6.3.3 算术编码 6.3.4 双字长编码
允许失真度越小,编码比特率越大;允许失 真度越大,编码比特率越小。
6.4.1 率失真理论
若定义最大允许失真度为D’,则其对应的编 码比特率的下限R(D’)是D’的单调递减函数, 称为率失真函数。 率失真函数表明:一个具有率失真函数R(D’) 的信源,若R<R(D’),则不存在任何编码会 使失真度小于D’。即不存在一种编码方法 可以使平均编码比特率小于R(D’)而同时使 失真度小于D’。
6.3.3 算术编码
编码过程:令H是编码间隔的高端,L为编码 间隔的低端,编码间隔的长度为Rang=H- L。Rang_H为编码信元分配的间隔高端, Rang_L为编码信元分配的间隔低端。一个 信元编码后,新的H和L按下式计算: Li+1=Li+Rangi×Rang_Li+1 Hi+1=Li+Rangi×Rang_Hi+1 Rangi+1=Hi+1-Li+1 i的初值为0。
6.2 数字图像的质量评价
图像保真度的客观评价是输入图像和输出图像之间 的均方误差
1 MSE 2 N [ g (i, j ) f (i, j )]2
i 0 j 0
N 1 N 1 i 0 j 0
N 1 N 1
和输出图像的均方信噪比
SNR N 2 [ g (i, j )]2 MSE
6.3.1 香农信息保持编码Baidu Nhomakorabea理
设有某无干扰信息源的熵值为H(x),如果能 找到一种编码方法,其编码平均长度L接近 于信源熵值,则有关系: L=H(x)+ε 其中, ε是任意小的数,即最佳信息保持编 码的平均码长无限接近于信源熵值。 若L<H(x),则一定会产生重构图像的译码失 真。
6.3.2 哈夫曼编码
6.5.1 DPCM工作原理
s (n)
+
d (n)
s p (n)
量化 器
d q (n)
编码 器 +
sr (n)
I (n)
预测 器
I ' ( n)
解码 器
d q (n)
+
sp (n)
sr (n)
预测 器
6.5.1 DPCM工作原理
在DPCM系统中,采用线性预测的方法得到预测 信号,可以采用N阶全极点预测器,预测信号由前 n时刻之前的P个重建信号样点线性组合得到。
6.3.3 算术编码
(2) a1 H1=0.5,L1=0.2,Rang1=0.3,Rang_H1=0.2,Rang_L1=0.0 L2=0.2+0.3×0.0=0.2 H2=0.2+0.3×0.2=0.26 Rang2=0.26-0.2=0.06 (3) a3 H2=0.26,L2=0.2,Rang2=0.06,Rang_H2=0.6,Rang_L2=0.5 L3=0.2+0.06×0.5=0.23 H3=0.2+0.06×0.6=0.236 Rang3=0.236-0.23=0.006
6.3.3 算术编码
例如:设某信源有信元a1,a2,a3,a4,a5,其在信源中出现 的概率分别为0.2(范围[0.0,0.2))、0.3(范围 [0.2,0.5))、0.1(范围[0.5,0.6))、0.2(范围 [0.6,0.8))、0.2(范围[0.8,1.0))。设待编码的信元 数据串为a2a1a3。则有: (1) a2 H0=1,L0=0,Rang0=1.0,Rang_H0=0.5,Rang_L0=0.2 L1=0+1.0×0.2=0.2 H1=0+1.0×0.5=0.5 Rang1=0.5-0.2=0.3
6.5.1 DPCM工作原理
DPCM:差分脉冲编码调制(Differential Pulse Code Modulation)采用预测编码的方式传输 信号,所谓预测编码就是根据过去的信号 样值来预测下一个信号样值,并仅把预测 值与现实样值的差值加以量化,编码后进 行数字信号传输。在接收端经过和发送端 相同的预测操作,便可恢复出与原始信号 相近的波形。
6.5.3 自适应预测编码
图像在局部上一般是不平稳的。
自适应预测是非线性的编码方法,可以充分 利用图像的统计特性,使预测系数尽可能 地与图像的局部特性相匹配,以使系统降 低预测误差,并减少比特率,提高压缩比。 自适应预测系统首先对图像的纹理进行检测 和分类,然后设计适合于各类纹理的预测 器。
6.5.4 自适应量化器
6 视觉冗余 人眼的视觉系统并不能感知图像的所有变化, 人眼一般的分辨能力约为2^6灰度级,而一 般图像的量化均采用2^8灰度级,因此存在 大量的冗余。 7 其他冗余
6.2 数字图像的质量评价
图像质量的度量一般采用三个指标:分辨率、 像素比特率、保真度。 分辨率:表示了可分辨的最小靠近的物体, 分辨率越高,图像质量越好。 像素比特率:表示图像灰度分辨率的参数, 每个像素的比特数越大,图像质量越好。 保真度:对输入图像中的理想阶跃边缘, 数字化后图像中边缘的平均陡度,用单位 长度中的线数来度量。
6.3.3 算术编码
基本原理:对[0,1]区间不断分割。将编码的信息表 示为实数0到1之间的一个间隔,信息越长,其编 码表示的间隔越短,表示这一间隔所需要的二进 制位数越多。 在信源中出现概率高的信元其算术编码的范围大; 出现概率低的信元其算术编码的范围小。算术范 围大的二进制码长比算术范围小的短。 主要特点:不必预先定义信元出现的概率模型,而 是直接对输入的信源符号序列进行编码,根据各 个信元出现的概率自适应地调节码长。 算术编码属于非分组码,从全序列出发,考虑符号 之间的依赖关系来进行编码。
4 结构冗余 有些图像存在纹理或图元(分块子图)的 相似结构,例如布纹图像,这就在图像的 结构上产生了冗余。
6.1 图像信息的冗余
5 知识冗余 有些图像的理解与某些知识有相当大的相 关性,对某些图像的理解可以由先验知识 和背景知识得到,因此只要抓住了某些特 征即可识别,而不需要更多的信息。
6.1 图像信息的冗余
第6章
图像压缩与编码
引言
计算机处理的图像都是用点阵表示且以图像 文件的形式存储、传输。
图像中存在大量的冗余信息,有较大的压缩 空间。 数字图像处理面临的主要问题是数据量巨大, 尤其是视频图像和运动图像。为了便于图 像的传递、交换与存储,必须进行压缩。
6.1 图像信息的冗余
1 空间冗余 在同一幅图像中,规则物体或规则背景的 物理表面特性具有相关性,这种相关性会 使它们的图像结构趋于有序和平滑,表现 出空间数据的冗余。
6.3.4 双字长编码
双字长编码使用两种固定长度的字长对信息 进行编码,对出现频率高的信元使用短码 字,出现频率低的使用长码字,且在短码 字集中留下一个不用,将其作为长码字的 前缀。
双字长编码的压缩比不如哈夫曼,但易于硬 件实现,抗干扰能力也比哈夫曼编码强, 是一种亚最佳编码方法。
6.4 有损压缩编码
6.4.2 其他失真理论
1 绝对误差
1 D 2 N
0
N 1
N 1
0
f ( x, y ) g ( x, y ) dxdy
6.4.2 其他失真理论
2 频率加权误差 人眼对图像信号中不同频率成分的响应有所区别,故应对 不同频率成分的误差赋予不同的权重。 相当于让误差e(x,y)=f(x,y)-g(x,y)通过一个滤波器,而用滤 波器的输出功率作为评价指标。 设滤波器的阶跃响应为Q(x,y),则有
p ( x, y ) 1 D 2 N
0
e( , )Q( x , y )dd
2
p( x, y) dxdy
N 1 N 1 0
6.4.2 其他失真理论
3 超视觉阈值均方误差 图像信号的误差只有达到或超过某一阈值时, 人眼才能感觉到图像的失真,该阈值称为视觉 阈值(T)。
失真度:从压缩图像重构原始图像产生的误差。定 义为:
即重构图像与原始图像的均方误差。
D E f ( x, y ) g ( x, y ) 1 N 1 N 1 2 2 f ( x, y ) g ( x, y ) dxdy N 0 0
2
6.4.1 率失真理论
根据香农信息保持编码定理可知,只要在大 于信源熵值的条件下编码,是可以达到信 息无损译码的,但是压缩比较小;若允许 有一定程度的失真,则可以获得更低的编 码比特率。
霍夫曼(Huffman)编码是1952年为文本文件而建立,是一 种统计编码,属于无损压缩编码。 霍夫曼编码具有一些明显的特点: 1) 编出来的码都是异字头码,保证了码的唯一可译性。 2) 由于编码长度可变。因此译码时间较长,使得霍夫曼编 码的压缩与还原相当费时。 3) 编码长度不统一,硬件实现有难度。 4) 对不同信号源的编码效率不同,当信号源的符号概率为 2的负幂次方时,达到100%的编码效率;若信号源符号的 概率相等,则编码效率最低。 5) 由于"0"与"1"的指定是任意的,故由上述过程编出的最 佳码不是唯一的,但其平均码长是一样的,故不影响编码 效率与数据压缩性能。
6.5.1 DPCM工作原理 6.5.2 线性预测编码 6.5.3 自适应预测编码 6.5.4 自适应量化器
1 N 1 N 1 2 D 2 f ( x, y ) g ( x, y ) u ( s)dxdy N 0 0 1, f ( x, y ) g ( x, y ) T u ( s) 0, f ( x, y ) g ( x, y ) T
6.5 预测编码(prediction coding)
6.1 图像信息的冗余
2 时间冗余 对于动画或电视图像所形成的图像序列 (帧序列),相邻两帧图像之间有较大的 相关性,其中有很多局部甚至完全相同, 或变化极其细微,这就形成了数据的时间 冗余。
6.1 图像信息的冗余
3 信息熵冗余 又称编码冗余,即实际数据量大于理论数 据量。
6.1 图像信息的冗余
图像的质量主要取决于主观感觉,人眼的视 觉系统并不能察觉图像的所有失真。
有损压缩编码的压缩比一般比无损压缩编码 高,但一般来讲,压缩比越大,丢失的信 息越多,失真越大。 6.4.1 率失真理论 6.4.2 其他失真理论
6.4.1 率失真理论
编码数据率:每个像素的平均编码长度(位数), 又称编码比特率、编码率。
~ a x(n i) x i
i 1 p
重建信号:
ˆ ˆ x(n) e(n) ~(n) e(n) ai x(n i) x
i 1
p
6.5.2 线性预测编码
一个DPCM系统的数据压缩率的大小取决于 预测器性能的好坏。最佳线性预测就是选 择合适的系数ai使得误差信号en的均方值最 小。 线性预测是以原图像信号xN为一平稳的随机 过程且其相关函数与像素位置无关的假设 为前提的,所得到的最佳线性预测系数也 是一组与位置无关的常数。
6.3.3 算术编码
解码过程: (1)[0.23,0.236)<[0.2,0.5),故第一个字符为a2。 (2)去掉间隔低端,[0.23-0.2,0.236-0.2)/(0.50.2)=[0.1,0.12)<[0.0,0.2),故第二个字符为a1。 (3)去掉间隔低端,[0.1-0.0,0.12-0.0)/(0.20.0)=[0.5,0.6)<=[0.5,0.6),故第三个字符为a3。
在预测编码中,要对差值信号e进行量化。只 要设计了一个最佳量化器,才能使复原图 像的质量达到最优效果。 最佳量化器的设计方法:1)在量化器的分层 数k已经给定的情况下,以量化误差的均方 值最小为设计准则;2)在保证量化误差不 超出视觉的可见阈值的前提下,尽可能减 少量化器的分层数。
客观评价常用于压缩系统设计和调整。主观评价才 是对一幅图像质量的最终评价。
6.3 无损压缩及其编码方法
无损压缩要求压缩后不丢失信息量,即对图 像进行压缩编码后再译码可以不失真地复 原图像。压缩比一般较小。
6.3.1 香农信息保持编码定理 6.3.2 哈夫曼编码 6.3.3 算术编码 6.3.4 双字长编码
允许失真度越小,编码比特率越大;允许失 真度越大,编码比特率越小。
6.4.1 率失真理论
若定义最大允许失真度为D’,则其对应的编 码比特率的下限R(D’)是D’的单调递减函数, 称为率失真函数。 率失真函数表明:一个具有率失真函数R(D’) 的信源,若R<R(D’),则不存在任何编码会 使失真度小于D’。即不存在一种编码方法 可以使平均编码比特率小于R(D’)而同时使 失真度小于D’。
6.3.3 算术编码
编码过程:令H是编码间隔的高端,L为编码 间隔的低端,编码间隔的长度为Rang=H- L。Rang_H为编码信元分配的间隔高端, Rang_L为编码信元分配的间隔低端。一个 信元编码后,新的H和L按下式计算: Li+1=Li+Rangi×Rang_Li+1 Hi+1=Li+Rangi×Rang_Hi+1 Rangi+1=Hi+1-Li+1 i的初值为0。
6.2 数字图像的质量评价
图像保真度的客观评价是输入图像和输出图像之间 的均方误差
1 MSE 2 N [ g (i, j ) f (i, j )]2
i 0 j 0
N 1 N 1 i 0 j 0
N 1 N 1
和输出图像的均方信噪比
SNR N 2 [ g (i, j )]2 MSE
6.3.1 香农信息保持编码Baidu Nhomakorabea理
设有某无干扰信息源的熵值为H(x),如果能 找到一种编码方法,其编码平均长度L接近 于信源熵值,则有关系: L=H(x)+ε 其中, ε是任意小的数,即最佳信息保持编 码的平均码长无限接近于信源熵值。 若L<H(x),则一定会产生重构图像的译码失 真。
6.3.2 哈夫曼编码
6.5.1 DPCM工作原理
s (n)
+
d (n)
s p (n)
量化 器
d q (n)
编码 器 +
sr (n)
I (n)
预测 器
I ' ( n)
解码 器
d q (n)
+
sp (n)
sr (n)
预测 器
6.5.1 DPCM工作原理
在DPCM系统中,采用线性预测的方法得到预测 信号,可以采用N阶全极点预测器,预测信号由前 n时刻之前的P个重建信号样点线性组合得到。
6.3.3 算术编码
(2) a1 H1=0.5,L1=0.2,Rang1=0.3,Rang_H1=0.2,Rang_L1=0.0 L2=0.2+0.3×0.0=0.2 H2=0.2+0.3×0.2=0.26 Rang2=0.26-0.2=0.06 (3) a3 H2=0.26,L2=0.2,Rang2=0.06,Rang_H2=0.6,Rang_L2=0.5 L3=0.2+0.06×0.5=0.23 H3=0.2+0.06×0.6=0.236 Rang3=0.236-0.23=0.006
6.3.3 算术编码
例如:设某信源有信元a1,a2,a3,a4,a5,其在信源中出现 的概率分别为0.2(范围[0.0,0.2))、0.3(范围 [0.2,0.5))、0.1(范围[0.5,0.6))、0.2(范围 [0.6,0.8))、0.2(范围[0.8,1.0))。设待编码的信元 数据串为a2a1a3。则有: (1) a2 H0=1,L0=0,Rang0=1.0,Rang_H0=0.5,Rang_L0=0.2 L1=0+1.0×0.2=0.2 H1=0+1.0×0.5=0.5 Rang1=0.5-0.2=0.3
6.5.1 DPCM工作原理
DPCM:差分脉冲编码调制(Differential Pulse Code Modulation)采用预测编码的方式传输 信号,所谓预测编码就是根据过去的信号 样值来预测下一个信号样值,并仅把预测 值与现实样值的差值加以量化,编码后进 行数字信号传输。在接收端经过和发送端 相同的预测操作,便可恢复出与原始信号 相近的波形。
6.5.3 自适应预测编码
图像在局部上一般是不平稳的。
自适应预测是非线性的编码方法,可以充分 利用图像的统计特性,使预测系数尽可能 地与图像的局部特性相匹配,以使系统降 低预测误差,并减少比特率,提高压缩比。 自适应预测系统首先对图像的纹理进行检测 和分类,然后设计适合于各类纹理的预测 器。
6.5.4 自适应量化器
6 视觉冗余 人眼的视觉系统并不能感知图像的所有变化, 人眼一般的分辨能力约为2^6灰度级,而一 般图像的量化均采用2^8灰度级,因此存在 大量的冗余。 7 其他冗余
6.2 数字图像的质量评价
图像质量的度量一般采用三个指标:分辨率、 像素比特率、保真度。 分辨率:表示了可分辨的最小靠近的物体, 分辨率越高,图像质量越好。 像素比特率:表示图像灰度分辨率的参数, 每个像素的比特数越大,图像质量越好。 保真度:对输入图像中的理想阶跃边缘, 数字化后图像中边缘的平均陡度,用单位 长度中的线数来度量。
6.3.3 算术编码
基本原理:对[0,1]区间不断分割。将编码的信息表 示为实数0到1之间的一个间隔,信息越长,其编 码表示的间隔越短,表示这一间隔所需要的二进 制位数越多。 在信源中出现概率高的信元其算术编码的范围大; 出现概率低的信元其算术编码的范围小。算术范 围大的二进制码长比算术范围小的短。 主要特点:不必预先定义信元出现的概率模型,而 是直接对输入的信源符号序列进行编码,根据各 个信元出现的概率自适应地调节码长。 算术编码属于非分组码,从全序列出发,考虑符号 之间的依赖关系来进行编码。
4 结构冗余 有些图像存在纹理或图元(分块子图)的 相似结构,例如布纹图像,这就在图像的 结构上产生了冗余。
6.1 图像信息的冗余
5 知识冗余 有些图像的理解与某些知识有相当大的相 关性,对某些图像的理解可以由先验知识 和背景知识得到,因此只要抓住了某些特 征即可识别,而不需要更多的信息。
6.1 图像信息的冗余
第6章
图像压缩与编码
引言
计算机处理的图像都是用点阵表示且以图像 文件的形式存储、传输。
图像中存在大量的冗余信息,有较大的压缩 空间。 数字图像处理面临的主要问题是数据量巨大, 尤其是视频图像和运动图像。为了便于图 像的传递、交换与存储,必须进行压缩。
6.1 图像信息的冗余
1 空间冗余 在同一幅图像中,规则物体或规则背景的 物理表面特性具有相关性,这种相关性会 使它们的图像结构趋于有序和平滑,表现 出空间数据的冗余。
6.3.4 双字长编码
双字长编码使用两种固定长度的字长对信息 进行编码,对出现频率高的信元使用短码 字,出现频率低的使用长码字,且在短码 字集中留下一个不用,将其作为长码字的 前缀。
双字长编码的压缩比不如哈夫曼,但易于硬 件实现,抗干扰能力也比哈夫曼编码强, 是一种亚最佳编码方法。
6.4 有损压缩编码
6.4.2 其他失真理论
1 绝对误差
1 D 2 N
0
N 1
N 1
0
f ( x, y ) g ( x, y ) dxdy
6.4.2 其他失真理论
2 频率加权误差 人眼对图像信号中不同频率成分的响应有所区别,故应对 不同频率成分的误差赋予不同的权重。 相当于让误差e(x,y)=f(x,y)-g(x,y)通过一个滤波器,而用滤 波器的输出功率作为评价指标。 设滤波器的阶跃响应为Q(x,y),则有
p ( x, y ) 1 D 2 N
0
e( , )Q( x , y )dd
2
p( x, y) dxdy
N 1 N 1 0
6.4.2 其他失真理论
3 超视觉阈值均方误差 图像信号的误差只有达到或超过某一阈值时, 人眼才能感觉到图像的失真,该阈值称为视觉 阈值(T)。
失真度:从压缩图像重构原始图像产生的误差。定 义为:
即重构图像与原始图像的均方误差。
D E f ( x, y ) g ( x, y ) 1 N 1 N 1 2 2 f ( x, y ) g ( x, y ) dxdy N 0 0
2
6.4.1 率失真理论
根据香农信息保持编码定理可知,只要在大 于信源熵值的条件下编码,是可以达到信 息无损译码的,但是压缩比较小;若允许 有一定程度的失真,则可以获得更低的编 码比特率。
霍夫曼(Huffman)编码是1952年为文本文件而建立,是一 种统计编码,属于无损压缩编码。 霍夫曼编码具有一些明显的特点: 1) 编出来的码都是异字头码,保证了码的唯一可译性。 2) 由于编码长度可变。因此译码时间较长,使得霍夫曼编 码的压缩与还原相当费时。 3) 编码长度不统一,硬件实现有难度。 4) 对不同信号源的编码效率不同,当信号源的符号概率为 2的负幂次方时,达到100%的编码效率;若信号源符号的 概率相等,则编码效率最低。 5) 由于"0"与"1"的指定是任意的,故由上述过程编出的最 佳码不是唯一的,但其平均码长是一样的,故不影响编码 效率与数据压缩性能。