第六章 图像编码基础(2015)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信源符号, 信源符号发生概率 [p(a1),p(a2),…,p(an)] bi为码串
a1 b1
a2 b2
an bn
b1 b2 bn
➢编码技术中的几个常用的概念
❖ 码,码字(字符集)
❖ 变长码
等长码
❖ 单一性代码(解码唯一性)
任意一个有限长度的码字序列,只有一个有意义的分割。
[00,10,001,101]
a4
a3
b 6= a1 0.23360
a6 a5
a4
a3
a2
a2
a2
a1 0
a1 0.2
a1 0.20
a2
a1 0.230
ρ=NbfB
若N=512512, b=8, fB=25, 则ρ=52.4Mbps
例2
地球资源卫星(LANDSAT)一帧图像(4幅)的数据量为
2340 2340 7 4 = 153,316,800 153Mb
卫星每天要获取很多幅图像,这些数据都先暂时存储在卫星体内 的磁性存储器中,当卫星飞过地面接收站的有效接收区域时,迅 速将这些数据全部送到地面。
6.2 一些基本的压缩方法
➢Huffman编码
原图像输入
概率统计
构造H树
解码复原
存储 传输
生成H树 编码压缩
基本哈夫曼编码系统框图
去除编码冗余
❖算法 1)将灰度等级按概率大小进行排序(降序),
每个灰度等级作为一个叶子结点,形成一棵树; 2)将两个根节点概率最小的树,合并(规则:这
两个结点构造一个双亲结点,双亲结点的概率 大小是两者之和);重复1) 2), 直到只有一个树为止; 3)设所有左后代为0,右后代为1
一方法编码,4)对每块都用平移符号进行区分。
➢Shannon-Fano编码
算法 1)将消息非递增排序 2)按概率之和相近或相等原则将消息集一分为二 3)将以上分割准则递归地应用到消息子集,直止 最终
子集只有一个消息为止 4)在分割过程中,分别给所分得的两个子集赋予0和1
去除编码冗余
例7
x1 x2 x3 x4 x5 x6 x7 x8
x5:1111
x2:0.18 0.19
x3:0.10
0.13
x6:1110 x7:10101
0.9 x4:0.10
x6:0.06
x5:0.07
x8:10100
x8:0.04
x7:0.05 黄色连线表示0,红色连线表示1 信源符号N,则信源消减次数为N-2(子树合并次数)
平均码长:
8
R(d ) p(di )i i 1 0.40 1 0.18 3 0.10 3 0.10 4 0.07 4 0.06 4 0.05 5 0.04 5 2.61
R(d )
Rd 1
Kunt的观点: 1948-1988年40年研究的以去除冗余为基础的编码方法为第一代 编码方法。(PCM, DPCM, 经典变换编码,统计编码等)
80年代以后发展的许多新方法,是第二代编码方法。基于神经网络 理论,小波变换理论,分形理论等开发的编码技术,大多属于这一 类。
从实用方案角度来分,可分为三大类:预测编码,统计编码,变 换编码。
m
H (d ) p(di ) log 2 p(di )(单位:比特/象素) i 1
令 {1, 2 , , m}是对应象素灰度级的编码长度,
定义
m
R(d ) p(di )i (单位:比特/象素) i 1
称H(d)为该图像的平均信息熵,R(d)为平均编码长度。
➢编码效率 ➢冗余度
H (d ) (%)
c =4 b4 0.0366
b4 0.0341
b3
b2
b 0.0282 1
算术解码过程图解(2)
b1= a2 1
a6
编码序列 b2= a1
0.5 a6
a5
a5
a4
a4
a3
a3
b 3= a3 0.26
a6 a5
a4
a3
b 4= a3 0.236
a6 a5
a4
a3
b5 = a6 0.2336
a6 a5
1 1. 1 1. 2 1. 3 1. 4 1. 5
10/7
10
20
30
40
50
060
colormap(gray); imagesc(1:256);
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
50
100
150
11/7
200
0250
colormap(gray); imagesc(1:64);
编码效率: H (d ) (%) 2.25 / 3.44 65.4%
R(d )
➢算术编码 算术编码过程图解(1)
c1= b1 1
b4
编码序列 c2= b2
0.1 b4
b3
b3
c =3 b3 0.048
b4
b3
b2 b 01
b2 b 01
b2 b 0.01 1
信源符号和码字之间不存在一一对应关系。
➢相对数据冗余度
RD
1
1 CR
第一种编码方案下的数 据集合相对于第二种编 码方案下的数据集合的 冗余量。
RD
RD
1 1 CR
的函数图像
1
0
-1
-2
-3
-4
-5
-6
-7
-8
-9
0
1
2
3
4
5
6
7
8
9
10
CR
(2)图像编码压缩分类
a)从应用角度分类 静止图像编码,活动图像编码,二值图像编码
b)从信息保持程度角度分类 有损压缩(保真度编码,特征抽取编码) 无损压缩(信息保持压缩,熵保持压缩)
50
100
150
200
250
300
例5 视觉冗余
colormap(jet); imagesc(1:128);
0. 5 0. 6 0. 7 0. 8 0. 9
1 1. 1 1. 2 1. 3 1. 4 1. 5
20
40
60
colormap(gray); imagesc(1:64);
80
100
120
0. 5 0. 6 0. 7 0. 8 0. 9
例3 编码冗余
a=imread('2.bmp'); b= uint16(a); imagesc(b*255);
a=imread('2.bmp'); c= uint8(a); imagesc(c);
50
50
100
100
150
150
200
200
250
250
300
300
50
100
150
200
250
300
图像编码的目的:节省存储空间;减少传输时间;利于处理,降 低处理成本。
图像数据经过编码压缩、传输、解码以及重建图像数据的流程如 下图所示:
原始图像数据
信源编(解)码
重建图像数据
编码器
信道编(解)码
解码器
被压缩的图像数据流
信道
被压缩的图像数据流
信息保持型编码
信息损失型编码
➢压缩率
CR
n1 n2
n1:第一种编码方案下的数据量; n2:第二种编码方案下的数据量.
0.40 0.18 0.10 0.10 0.07 0.06 0.05 0.04
0
1
0
1
01
0
1
01
0101
x1:00 x2:01 x3:100 x4:101 x5:1100 x6:1101 x7:1110 x8:1111
平均码长:
8
R(d ) p(di )i i 1 0.40 2 0.18 2 0.10 3 0.10 3 0.07 4 0.06 4 0.05 4 0.04 4 3.44
编码效率: H (d ) (%) 2.25 / 2.61 97.8%
R(d )
例6-2
信源符号
a1 a2 a3 a4 a5 a6 a7
概率
编码过程
0.20
0
0.19 0.18
1
1
0.39
0.17 0.15 0.10 0.01
0
0
1 0.35
0
0
1 0.61
0
1 0.26
1
0.11
Huffman编码过程
[0,01,1,11]
❖ 非续长代码
前缀码;任意一个码字都不是另一个的续长。
[0,10,11]
[0,01,11]
❖ 即时码(解码即时性) 判断一个码字的时候,无须等待下一个码的出现,只需当前所 得到的码就可以译码。 [0,10,110,111] [0,01,011,0111]
❖ 最佳编码 平均码长最接近于熵的无损编码。
几个基本概念
信源编码:通过对表示信息的数据体的形式的变换,祛除数据冗余,从而 达到以尽可能少的数据代码表示尽可能多的信息的目的,实现数据压 缩目标.
信道编码:主要指用于确保信道传输可靠性和安全性的各类纠错编码、 密码(加密)、信息隐藏等。通过信道编码,对数码流进行相应的处 理,使系统具有一定的纠错能力和抗干扰能力,可极大地避免码流传 送中误码的发生 .
➢熵与平均码字长度 1)H(d)<<R(d)时,一定可以设计出某种平均码字长更短的无 失真编码方法。 2)平均码字长小于H(d)的无失真编码方法不存在.
➢熵编码 使编码后的图像的平均码字长度尽可能接近图像的熵H。 基本思路是:概率大的灰度级用短码字,概率小的,用长码字。
根据图像像素灰度值出现的概率的分布特性而进行的压缩编码叫统 计编码。
源自文库
Huffman码
10 11 000 001 010 0110 0111
哈夫曼码的改型
亚最优编码方法,通过牺牲编码效率来换取编码计算量的减少。 截断哈夫曼码:对最可能出现的M个符号进行哈夫曼编码,对其他码都用一
个合适的定长码之前加一个前缀码来表示。 平移哈弗曼码:1)按概率排序,2)等分成块,3)对所有块中元素采用同
信息熵:
8
H (d ) p(di ) log 2 p(di ) i 1 0.40 log 2 0.40 0.18log 2 0.18 0.10 log 2 0.10 0.10 log 2 0.10 0.07 log 2 0.07 0.06 log 2 0.06 0.05log 2 0.05 0.04 log 2 0.04 2.55
信息熵:
8
H (d ) p(di ) log 2 p(di ) i 1 0.40 log 2 0.40 0.18log 2 0.18 0.10 log 2 0.10 0.10 log 2 0.10 0.07 log 2 0.07 0.06 log 2 0.06 0.05log 2 0.05 0.04 log 2 0.04 2.55
➢编码的必要性 一幅模拟图像必须经过脉码调制(PCM—Pulse Code Modulation) 才能变成数字图像。(PCM有时也指对信号进行采样、量化并以 适当码字将其编码的各个过程的总称)
PCM的过程: 模拟图像
中间体
空间采样
幅值量化
中间体
编 码
数字图像 例1 设一幅活动图像的空间分辨率为N,灰度分辨率为b, 时间分辨率为fB, 则在实时传输过程中,该图像在传输通道里的传输率至少应该为
0.5
0.6
0.7
0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
10
20
30
40
50
60
(4)图像的编码质量评价
图像品质的核心问题是逼真度问题。经过处理的图像(包括经过压缩 编码后的图像)与一个标准图像之间的偏差可以作为图像逼真度(保 真度)的度量。这一偏差,包括亮度,色度,分辨率以及某些心理物 理学参数。
❖特点 优点:即时码;最优码 缺点:当需要对大量符号进行编码时,构造最优哈 夫曼码的 计算量会很大。
x1 x2 x3 x4 x5 x6 x7 x8
例6-1
0.40 0.18 0.10 0.10 0.07 0.06 0.05 0.04
0.10
x1:0
x1:0.40 0.37
0.60 0.23
x2:100 x3:110 x4:1011
1)客观评价准则
设f(x,y)是输入图像,f’(x,y)是输出图像, 定义偏差e(x,y)=f(x,y)f’(x,y),则以下的参数可作为保真度准则:
(5) 编码定理 问题:如何度量编码方法的优劣?(编码的性能参数)
➢图像信息熵与平均码字长度
令 d {d1, d2 , , dm} 是图像象素灰度级集合 其对应的频率为 p(d1), p(d2 ), , p(dm ) 定义
第六章 图像编码
主要内容: 1.图像编码的必要性 2.图像编码的分类 3.图像编码中的保真度准则 4.编码的性能参数 5.统计编码 6.预测编码 7.变换编码 8.图像编码的国际标准
6.1 图像压缩和数据冗余
(1)图像编码的必要性
➢图像编码与压缩
图像编码与压缩,本质上来说,就是对图像源数据按一定的规则 进行变换和组合,从而达到以尽可能少的代码来表示尽可能多的 数据信息。压缩通过编码来实现,或者说编码带来压缩的效果, 所以,一般把此项处理称之为压缩编码。
c)从具体的编码技术角度分类 空域法,变换域法 预测编码,变换编码,统计编码,等
(3)图像数据的冗余
冗余大致分为三大类 1)编码冗余(也称为信息熵冗余)
符号序列码字(码字长度)
2)象素间相关性冗余 帧间象素信息冗余(时间冗余),帧内象素信息冗余 (空间冗余)
3)视觉冗余 人眼对所有视觉信息并不是都具有相同的敏感度; 人眼的空间分辨率,时间分辨率。