第6章 图象编码与压缩
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
1
4/25 +(2/5)×(12/125) = 124/625
(12/125)×(3/5) = 36/625
5
1
124/625 +(2/5)× (36/625)= 692/3125
(36/625)×(3/5) = 108/625
6.3.5 行程编码(RLE)
行程:具有相同灰度值的像素序列 编码思想:
0.001110 0.010=00 0.0011。
2
所以,二进序列的算术编码为0011。
算术编码算法的计算步骤实例
ste p
x
s
l
10
0
2/5
21
0 +(2/5)×(2/5)= 4/25
(2/5)×(3/5)= 6/25
3 0 2/5 + 0 × 6/25 = 4/25
(6/25)×(2/5)= 12/125
(1)将N个灰度级xi按其概率递减进行排列。
(2)求概率分布pi的第i个灰度级的二进制位数ni。
log2 pi ni log2 pi 1
(3)计算与pi相对应的累积概率Pi, 把与Pi相对应的二进码 和接下去与pk(k>i)相应的码相比较,前面的ni位至少有
一位以上的数字是不同的。
主要研究数据表示、传输、变换和编码的方 法
目的:减少存储数据所需要的空间和传输过 程所需要的时间
图象压缩的必要性:
举例1:一张A4(210mm×297mm) 大小的照片, 若用中等分辨率(300dpi)的扫描仪按真彩色扫描, 其数据量为多少?(注:dpi表示每英寸像素,1 英寸=25.4mm)
M 1 N 1
( fˆ ( x, y) f ( x, y))
均方根误差:
x0 y0
1/ 2
erms
1
MN
M 1 N 1
( fˆ (x, y)
x0 y0
f
(
x,
y))2
如果将fˆ (x, 看y) 作信号 f和(x,噪y)声信号 的e和(x,,那y) 么解
不等长编码致使硬件译码电路实现困难。上述原因致使 Huffman编码的实际应用受到限制。
4.图像的Huffman编译码系统
6.3.3 Shannon编码与Pano编码
1.Shannon提出了将信源符号依其概率降序排列, 用符号序列累积概率的二进制表示作为对信源的唯 一可译编码。
其应用于图像编码的步骤如下:
≧2.5分
6.3 统计编码
统计编码
根据信源的概率分布特性,分配具有惟一可译性的 可变长码字,降低平均码字长度,以提高信息的传 输速度,节省存储空间。
基本原理
在信号概率分布情况已知的基础上,概率大的信号 对应的码字短,概率小的信号对应的码字长,这样 就降低了平均码字长度。
6.3.1 图象的冗余度与编码效率
Huffman编码示意图
左图所示为建立码的过程 右图所示为从根开始,经各中间节点到叶节点的路 径采用二进制编码的情况
编码过程举例
第1行和第2行列举了一个信源的统计特性 结果如第三行所示
符号集{xi}
x1 x2
x3
x4
x5
x6
概率分布{pi} 0.40 0.20 0.12 0.11 0.09 0.08
Huffman编码 1 010 000 001 0110 0111
3.Huffman编码的性能
优点:
实现Huffman编码的基础是统计源数据集中各信号的概 率分布。
Huffman编码在无失真的编码方法中效率优于其他编码 方法,是一种最佳变长码,其平均码长接近于熵值。
缺点:
当信源数据成分复杂时,庞大的信源集致使Huffman码 表较大,码表生成的计算量增加,编译码速度相应变慢
上表的信源为例说明Fano编码
6.3.4 算术编码
在信源各符号概率接近的条件下,算术编码是一 种优于Huffman编码的方法。
根据信源的概率分布进行算术编码。已知信源的 概率分布为
0 1 X 2 3
5 5
求二进制序列01011的编码。
解:步骤如下: (1)二进制信源只有x1 = 0和x2 = 1两种符号,相
定义冗余度为:
r B 1 H
定义编码效率为:
H 1
B 1 r
6.3.2 Huffman编码
1.前缀码(Prefix Code)
4层树形结构的编码情况
2.Huffman编码
算法: ① 将图像的灰度等级按概率大小进行升序排序。 ② 在灰度级集合中取两个最小概率相加,合成一个 概率。 ③ 新合成的概率与其他的概率成员组成新的概率集 合。 ④ 在新的概率集合中,仍然按照步骤②~③的规则, 直至新的概率集合中只有一个概率为1的成员。这样 的归并过程可以用二叉树描述。 ⑤ 从根节点按前缀码的编码规则进行二进制编码。
若按每像素3个字节计算,上述结果为约26M
举例2:目前的WWW互联网包含大量的图像信 息,如果图像信息的数据量太大,会使本来就已 经非常紧张的网络带宽变得更加不堪重负 (World Wide Web变成了World Wide Wait)
视频数据量:
对于电视画面的分辨率640*480的彩色图像,每 秒30帧,则一秒钟的数据量为: 640*480*24*30=221.12M
实时传输:在10M带宽网上实时传输的话,需要 压缩到原来数据量的0.045
存储: 1张CD可存640M,如果不进行压缩,1 张CD则仅可以存放2.89秒的数据
可见,单纯依靠增加存储器容量和改善信道 带宽无法满足需求,必须进行压缩
图象压缩的可能性
数据冗余: 设n1和n2是指原始图像和编码后图像每个像素的平均比特 数 压缩率(压缩比)——用于描述图像压缩效果 CR = n1 / n2 其中,n1是压缩前的数据量,n2是压缩后的数据量 相对数据冗余: RD = 1 – 1/CR=(n1-n2)/n2
PSNR
101g
M
1
N
1
f 2 max
( fˆ (x, y) f (x, y))2
x0 y0
相同客观保真度的不同图象,人的视觉可能 产生不同的视觉效果.
客观保真度是以后总统计平均意义下的度量 准则,不能够反映出图象的细节.
主观保真度标准:通过视觉比较两个图像, 给出一个定性的评价,如很粗、粗、稍粗、 相同、稍好、较好、很好等,可以对所有人 的感觉评分计算平均感觉分来衡量
例:原图像数据:234 223 231 238 235
压缩后数据:234 11 3 -4 -1,我们可以对一 些接近于零的像素不进行存储,从而减小了数 据量
视觉信息冗余
一些信息在一般视觉处理中比其它信息的相对重要 程度要小,这种信息就被称为视觉心理冗余。
33K
15K
Lena.bmp(原图)
压图象均方根信噪比SNRms 为:
M 1 N 1
M 1 N 1
SNRms fˆ (x, y)2 ( fˆ(x, y) f (x, y))2
x0 y0
x0 y0
实际使用中将 SNRms 归一化并使用分贝表示.
1 M 1 N 1
f
f (x, y)
MN x0 y0
图像质量的主观评价等级 评价也可对照某种绝对尺度进行。下表给出一种对电 视图像质量进行绝对评价的尺度,根据图像的绝对质 量进行判断打分。
评分 评价
说明
5 优秀 图像质量非常好
4 良好 图像质量高,有很小的干扰但不影响观看
3
中等
图像质量可接受,但有一些干扰,对观看稍 有妨碍
2
差 图像质量差,对观看有妨碍
Lenna.jpg (压缩率9.2)
Lenna.jpg (压缩率18.4)
Lenna.jpg (压缩率51.6)
图象编码压缩技术分类
图像 压缩
无损 压缩
有损 压缩
行程编码
LZW编码
哈夫曼编码
算术编码
无损预测编码
位平面编码
K-L变换
Walsh.Hadamard变换
离散余弦变换
变换编码
离散傅立叶变换 斜变换
1 很差,劣 图像质量很差,无法观看
图像编码主、客观评价的内在关系
图像类型 高分辨率广播电视 普通数字广播电视
数据库图像
传输数码率 74Mb/s 34Mb/s
识别图像
压缩后图像 客观评价SNR
≧48dB ≧43dB ≧36dB
会议电视
64kb/s
≧30dB
主观评价 ≧4.5分 ≧4.0分
≧3.0分
分为几种冗余: 编码冗余 像素冗余 视觉心理冗余
编码冗余
如果一个图像的灰度级编码,使用了多于实际需要 的编码符号,就称该图像包含了编码冗余
例:如果用8位表示下面图像的像素,我们就说 该图像存在着编码冗余,因为该图像的像素只有 两个灰度,用一位即可表示。
像素冗余
由于任何给定的像素值,原理上都可以通过它的 相邻像素预测到,单个像素携带的信息相对是小 的。对于一个图像,很多单个像素对视觉的贡献 是冗余的。这是建立在对邻居值预测的基础上。
小波变换
有损预测编码 分形编码 模型编码 子带编码 神经网络编码
6.2 图象保真度准则
客观保真度标准:图像压缩过程对图像信息的损
失能够表示为原始图像与压缩并解压缩后图像的
函数。 一般表示为输出和输入之差:e(x, y) fˆ (x, y) f (x, y)
两个图像之间的总误差:
SNR
101g
M
M 1 N 1
[
x0 y0 1 N 1
f
(x,
y)2
f
]2
( fˆ (x, y) f (x, y))2
x0 y0
如果令fmax=max[f(x,y)],则x=0,1,…,M1,y=0,1,…,N-1,于是得峰值信噪比PSNR
图象的数据:有用数据与冗余数据。
根据Shannon无干扰信息保持编码原理,若对原始图象数 据的信息进行信源的无失真图象编码,压缩后的平均码率
存在下限,就是信源的信息熵H。
理论上最佳信息保持编码的平均码长可以无限的接近信
源信息熵H。原始图象的平均码长B 为: l 1 B i pi i0
其中Bi为灰度级i对应的码长,pi为灰度级i出现的概率。
最后子区左端起始位置
s (3619225)十进 (0.001110)二进
最后子区长度
e
( 692 3125
160285)十进
(13225)十进
(0.01000)二进
最后子区右端终止位置e
( 692 3125Leabharlann 108 625)十进
(13225)十进
(0.01000)二进
编码结果为子区起始位置与终止位置之中点
将一行中颜色值相同的相邻象素(行程)用一个 计数值(行程的长度)和该颜色值(行程的灰度) 来代替,从而去除像素冗余。
例:设重复次数为iC,重复像素值为iP 编码为:iCiP iCiP iCiP 编码前:aaaaaaabbbbbbcccccccc 编码后:7a6b8c
对于有大面积色块的图像,压缩效果很好
计算该信源的Shannon编码 平均码字长度为2.92,较Huffman编码为长。
2.Fano编码步骤
(1)将图像灰度级xi其概率大小按递减顺序进行
排序。
(2)将xi分成两组,使每组的概率和尽量接近。
给第一组灰度级分配代码“0”,第二组分配代 码“1”。
(3)若每组还是由两个或以上的灰度级组成,重 复上述步骤,直至每组只有一个灰度级为止。
应的概率为pc = 2/5,pe = 1- pc =3/5 (2)设s为区域左端起始位置,e为区域右端终止
位置,l为子区的长度,则
符号“0”的子区为[0,2/5),子区长度为2/5;
符号“1”的子区为[2/5,1],子区长度为3/5.
(3)随着序列符号的出现,子区按下列公式减少长度: 新子区左端 = 前子区左端 + 当前子区左端×前子区长度 新子区长度 = 前子区长度×当前子区长度 设初始子区为[0,1],步序为step,则编码过程参见可见,
第六章 图象编码与压缩
本章主要内容
与文字信息不同,图像信息占据大量的 存储容量,而且传输的带宽有限
本节课我们学习图像编码与压缩:
图像压缩的基本概念 有损压缩和无损压缩 统计编码 预测编码 变换编码 图像压缩编码标准。
6.1 图像压缩的基本概念
数据压缩:按照特定的编码机制用比未经编码 少的数据位元表示信息的过程 .