图像压缩

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3
4 5 6
可通过的
边缘的 劣等的 不能用
图像质量可以接受,干扰不讨厌
图像质量较低,希望能加以改善,干扰有些讨厌 图像质量很差,尚能观看,干扰显著地令人讨厌 图像质量非常之差,无法观看
压缩模型
输入 图像
信源编 码器
编码 器
信道编 码器
信道
信道解 码器
信源解 码器
f^(x,y)
源自文库
Encoder Removes input redundancies Increases the noise immunity
输入 n 0 1 f 14 15 f^ - 14.0
编码器 e - 1.0 e. - 6.5 f. 14.0 20.5
解码器 f^ - 14.0 f. 14.0 20.5
误差 [f-f.] 0.0 -5.5
2
3 …
14
15 …
20.5
14.0 …
-6.5
1.0 …
-6.5
6.5 …
14.0
20.5 …
输入图像
fn
+
S
-
符号编 压缩图像 码器
预测误差, en
预测误差: en=fn-f^n
预测器
整数 舍入
f^n
压缩图像
符号解 码器
en +
S
+
f^n
预测器
fn
解压图像
通过预测可以消除相当多的象素间冗余,所以预测误差的概 率密度函数一般在0点有1个高峰,并且与输入灰度值分布 相比,其方差较小,事实上,预测误差的概率密度函数一般 用0均值不相关拉普拉斯概率密度函数表示
H (d ) N log n
N log n H (d ) Rd 1 N log n
5、压缩比 压缩比是衡量数据压缩程度的指标之一。目前常 用的压缩比定义为
LB Ld Pr 100% LB
其中LB为源代码长度,Ld为压缩后代码长度,Pr 为压缩比。 压缩比的物理意义是被压缩掉的数据占据源数据 的百分比。当压缩比Pr接近100%时压缩效果 最理想。
DM编码示例
取上述公式中的a=1和c=6.5。设输入序列为{14,15, 14,15,13,15,15,14,20,26,27,28,27, 27,29,37,47,62,75,77,78,79,80,81, 82,82}。编码开始时,先将第一个输入象素直接传给编 码器。在编码器和解码器两端都建立初始条件f.0=f0=14后, 其余的f^,e,e.,和f.可用上述公式计算得到 给出DM编码例子,如表所示
6、互信息 信源编码输出为bk给出的关于ai的信息量究竟为多少呢? 为此将引入另外一个信息量度-互信息 对给定的两个离散信源X和Y,Y中事件bk的发生给出关 于X中事件ai的互信息I(ai:bk)定义为:
I (ai ; bk ) I (ai ) I (ai | bk ) log p(ai | bk ) p ( ai )
pe(e) =
2 e exp 2e e 1
有损压缩
• 有损预测编码 • 变换编码
有损预测编码
在无损预测编码系统基础上,加1个量化器构成,如图所示
输入图像
fn
S
-
en
量化器
e. n
符号编 码器
压缩图像
f^n
压缩图像
预测器
f.n
S
解压图像
符号解 码器
e. n
S
f^n
信源熵为:
H=-∑Pilog2Pi =-(0.4log20.4+0.3log20.3
+2*0.1log20.1+0.06log20.06+0.04log20.04)
=2.14比特/符号
码字 长度
平均码字长度:R=∑βiPi R= ∑βiPi =0.4×1+0.3 × 2+0.1 × 3+0.1 × 4+0.06 × 5+0.04 × 5=2.2比特/符号
20.5
14.0 …
14.0
20.5 …
0.0
-5.5 …
14
15 16 17 18 19 …
29
37 47 62 75 77 …
20.5
27.0 33.5 40.0 46.5 53.0 …
8.5
10.0 13.5 22.0 28.5 24.0 …
6.5
6.5 6.5 6.5 6.5 6.5 …
27.0
客观保真度准则
• 当所损失的信息量可用编码输入图像与 解码输出图像的函数表示时,基于客观 保真度准则的。
常用的准则有: 均方根误差erms 总误差 均方信噪比SNRrms
主观保真度准则
• 一般情况下,解压图像最终是依靠人的 视觉来判断的,用主观保真度准则。
如对电视图像质量进行绝对评价的尺度为
评分 1 2 评价 优秀的 好的 优秀的具有极高质量的图像 是可供观赏的高质量的图像,干扰并不令人讨厌 说明
3、平均码字长 • 借助熵的概念可以定义量度任何特定码的 性能的准则,即平均码字长度。
N i p(d i )
m
• 其中βi为灰度级di所对应的码字长度。的单 位也是比特/字符。
i 1
4、编码效率 编码符号是在字母集合A={a1,a2,a3,…am}中选取的。如果编 码后形成一个新的等概率的无记忆信源,字母数为n,则 它的最大熵应为logn比特/符号。因此这是一个极限值。如 果H(d)/ =logn,则可以认为编码效率已经达到100%,如 果H(d)/ <logn,则可认为编码效率较低。
2、离散无记忆信源(DNMS)的信息量度量: (1)信源符号 的自信息量定义为:
(a)、非负性; (b)、信息量的单位: 底为2时——单位为:比特(bit) 底为e时——单位为:奈特(Nat) 底为10时——单位为:哈特
(2)、信源平均自信息量(信息熵) 离散无记忆信源A的平均自信息量(信息熵)定 义为:
对重复出现的字符、字符连续重复的个数以及起 始位置进行编码,就能恢复该字符串
重复字符 游程标志 游程长度
基本RLC结构
从RLC基本数据占用3个字节,即只有当重复字符串长度大 于24(即连续有24个象素取值相同)时,才有数据压缩效益。 先判断游程长度,再决定是否使用RLC
从根本上讲,游程编码依然是通过去除图像象素间 的相关性,来达到数据压缩的目的
1、图像的空间冗余;-象素间冗余
相同的目标 相同的直方图
象素间的相 关性不同
2、图像彩色光谱空间的冗余; 3、视频图像信号在时间上的冗余; 4、图像的视觉心理冗余; ——压缩的目的就是去除信息冗余
• 如何评价图像编码中的解码图像与原始 图像之间的偏离程度? • 通过保真度(逼真度)准则 • 两大类准则:客观保真度准则,主观保 真度准则
• 哈夫曼编码 • 游程编码 • 无损预测编码
哈夫曼编码
• 50年代提出,一种无损的统计编码方法 • 用变长的码使冗余量达到最小,用一棵 二叉树来编码,使常出现的字符用较短 的码表示,不常出现的字符用较长的码 表示。
用一个例子来介绍哈夫曼编码的步骤
给出一组初始信源的概率分布
符号 概率 a1 0.1 a2 0.4 a3 0.06 a4 0.1 a5 0.04 a6 0.3
的时域相关 性
• 线性预测法通常称为差值脉冲编码调制法 (Differential Pulse Code Modulation),简 称DPCM
该象素的当前 或现实值与预 测值的差
差组成
预测误 差序列
预测误差的熵为 信源的高阶熵
• 预测编码的基本思想:通过仅提取每个象素中 的新信息并对它们编码,来消除象素间的冗余
Decoder
信息理论
(一)、信源空间概述 1、信息:事物运动状态或存在方式的不确定性的描述; 2、信源空间:随机符号及其出现概率的空间; 3、信源的分类: (1)、 连续信源—离散信源—混合信源; (2)、无记忆信源—有记忆信源(相关信源)—有限 长度记忆信源(Markov信源)
(二)、信息的度量 1、信息公理 (1)、信息由不确定性程度进行度量; 确定事件的信息量为零。 (2)、不确定性程度越高信息量越大; (3)、相互独立性与信息量可加性; 独立事件的联合信息等于两个独立事件的信息 总和。 满足上述公理的函数为:
0.2
0.1
3
0.3
0.3
a3
a5
0.06
0.04
1
0.1
0.1
• 2、对每个信源赋值-先从(消减到)最小的信源开 始,逐步回到初始信源,过程如表所示。对一个 只有2个符号的信源,最短长度的二元码由符号0 和1组成,将它们赋予对应最右列2个概率的符号
初始信源 对消减信源的赋值
符号 概率
a2 a6 0.4 0.3
码字
1 00
1
0.4 0.3
码字
1 00
2
0.4 0.3
码字
1 00
3
0.4
码字
1
4
0.6 0.4
码字
0 1
0.3 00
a1
a4
0.1
0.1
011
0100
0.1
0.1
011
0100
0.2 010
0.1 011
0.3 01
2
1
a3
a5
0.06 01010
0.04 01011
0.1
0101
4
3
• 哈夫曼编码效率
(二)、图像数据压缩的应用领域:
1、办公自动化; 2、医学图像处理; 3、卫星遥感遥测系统; 4、高清晰度电视HDTV; 5、可视电话、会议电视; 6、移动多媒体图像及视频传输: 彩信业务,手机视频;…… 凡是涉及到图像数据的传输、交换与存储的领域均要 求进行图像数据的压缩。
(三)、图像中冗余信息的主要表现:
33.5 40.0 46.5 53.0 59.5 …
20.5
27.0 33.5 40.0 46.5 53.0 …
27.0
33.5 40.0 46.5 53.0 59.5 …
预测器
量化器插在符号编码器与预测误差产生处之间,把原来无损 编码器中的整数舍入模块吸引进来,它将预测误差映射进有 限个输出e.n中,e.n确定了有损预测编码中的压缩量和失真量 为接纳量化步骤,需要改变无损编码器,以使编码器和解 码器所产生的预测能相等 从上图可以看出,将有损编码器的预测器放在1个反馈环中, 这个环的输入是过去预测和与其相对应的量化误差的函数: f.n=e.n+f^n 这样一个闭环结构,其目的是能防止在解码器的输出端产生误差
其中,p(ai|bk)表示信源编码输出为bk,估计信 源输入为ai的条件概率。I(ai|bk)称为条件自信 息量,表示在发现信源编码输出为bk,对信源 输入为ai的不确定性的猜测或知道bk后ai还保 留的信息量。I(ai)表示ai的不确定性。两者值 差即为bk解除的ai不确定性的多少。
无损压缩编码
编码效率:η=H/R(%) η=H/R=2.14/2.2=0.973=97.3%
游程编码-RLC
• 根据对各类图像的统计,发现图像信源中象素的空间相 关性比较强。在经过采用和量化形成数字彩色图像后, 其相邻象素的相关性体现在相邻象素亮度取值变化不大
对典型的黑白文本图像进行分析发现,前一象素为白色象素时,当前象 素取值为白的条件概率P(W|W)平均在97%以上,而由白象素变为黑象 素的概率P(B|W)仅为3%,类似的,当前一象素为黑,当前象素为黑的 条件概率P(B|B)平均为75%,由黑变白的概率P(W|B)仅为25%。
第6章图像压缩
图像压缩
• • • • • 压缩模型 信息理论 无损压缩 有损压缩 图像压缩标准
引言
(一)、图像数据压缩的重要性和必要性:
# A4大小300dpi二值扫描——1MB # 640*480的24bit真彩色图像——0.92MB # 3656*2664的24bit电影胶片——29MB #PAL制数字视频——20M #高清晰度电视HDTV——166MB
德尔塔调制(DM)是1中最简单的有损预测编码方法,其预测 器和量化器分别定义为:
f^n=af.n-1 -c 其它 其中a是预测系数(一般小于等于1),c是1个正的常数 因为量化器的输出可用单个位符表示(输出只有2个值),所以 上图编码器中的符号编码器只用长度固定为1bit的码,由DM 方法得到的码率是1比特/象素 e . n= +c 对en>0
• 1、缩减信源符合数量-将概率从大到小排列,再将两 个概率最小的符号结合得到1个组合符号,如果剩下的 符号多余2个,继续上述过程,直到只剩2个符号为止。
初始信源 信源的消减步骤
符号 概率
a2 a6 0.4 0.3
1
0.4 0.3
2
0.4
3
0.4 0.3
4
4
0.6 0.4
a1
a4
0.1
0.1
0.1
2
但是它不仅仅只利用一个相邻象素的信息,实际上, 利用了图像多个象素间的相关性,其熵为高阶熵
数字传真压缩编码标准 二值文本图像
无损预测编码
相邻像素间 的空域相关 性
• 预测编码有线性预测和非线性预测两大类, 可以在一幅图像内进行,即所谓的帧内预测 法,也可以在多幅图像之间进行,即所谓的 帧间预测法。 相邻帧之间
相关文档
最新文档