数字图像的压缩
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通过以下的公式对其做二维DCT变换即可:
其中:p=0,1......N-1
q=0,1......N-1
29
Chapter
第四部分
4
图像压缩标准
30
4.1 常见的图像压缩编码标准
制定图像标准的国际组织ISO和CCITT联合组织下进行制定的 标准的类型(三类):
二值图像压缩标准:面向传真而设计 静止帧黑白、彩色压缩:面向静止的单幅图像(JPEG) 连续帧黑白、彩色压缩:面向连续的视频影像(MPEG)
通常来说,如果图像的灰度级在编码时用的编码符号数多于表示每个灰度 级实际所用的符号数,也就是说这个编码无法使Lavg得到最小值,那么用那个 这种编码图像得到的图像包含编码冗余。
6
编码冗余的例子:
rk3 pr(rk) 编码1 l1(rk) 编码2 l2(rk)
r0=0
r1=1/7 r2=2/7 r3=3/7 r4=4/7 r5=5/7
——将最常出现的符号用最短的编码
——将最少出现的符号用最长的编码
例如:
元素 概率 编码 xi P(xi) wi x1 0.4 1 x2 0.3 00 x3 0.1 011 x4 0.1 0100 x5 0.06 01010 x6 0.04 01011
17
Huffman编码过程:
1.把信源X中的消息按出现的概率从大到小的顺序排列。 2.把最后两个出现概率最小的消息合并成一个消息,从而使信源的消息数减少一 个,并同时再次将信源中的消息概率从大到小排列一次。
11
Chapter
第二部分
2
无误差压缩
12
2.1 无误差压缩的必要性
➣在医疗或商业文件的归档,有损压缩因为法律原因而被禁止。
➣卫星成像的收集,考虑数据使用和所花费用,不希望有任何数据损失。 ➣X光拍片,信息的丢失会导致诊断的正确性……
无误差压缩技术
➣减少像素间冗余
➣减少编码冗余
13
2.2 变长编码
某些视觉信息对于视觉系统而言是无法区分的。
35k
22k
➣图像在色彩,亮度,空间频率等方面超出了人眼的接收范围和可区分程度。 9 ➣图像中某些目标或区域的信息不太容易引起人眼的注意。
1.2 保真度准则—评价压缩算法的准则
保真度准则
图像压缩可能会导致信息损失,如去除心理视觉冗余数据。
需要评价信息损失的测度以描述解码图像相对于原始图像的偏离程度,这些测度称为保 真度准则。
常用的图像压缩技术指标:
➣图像冗余度与编码效率 ➣压缩比 ➣客观评价SNR ➣主观评价
10
图像质量的主观评价等级
评分
5 4 3 2
评价
优秀 良好 中等 差 图像质量非常好
说明
图像质量高,有很小的干扰但不影响观看 图像质量可接受,但有一些干扰,对观看稍 有妨碍 图像质量差,对观看有妨碍
1
很差,劣 图像质量很差,无法观看
28
采用8*8的图像块原因是由于计算量和像素之间关系的数量,许多研究表明, 在15或20个像素之后,像素间的相关性开始下降。就是说,一列相似的像素 通常会持续15到20个像素那么长,在此之后,像素就会改变幅度水平或反向。 模拟图像经采样后成为离散化的亮度值然后分成一个个宏块,而一个宏块有分 成8*8大小的块,可以用一个矩阵来表示这个块。
量化器
符号编 辑器
2.图像的解压缩:
压缩 图像 符号解码 器 反变换 合并 n*n子 图像 解压缩图 像
26
对变换方法的评价:
计算量 封装能力 视觉效果 (块效应) 一般 较强 较弱 较弱
KLT FFT(DFT) DCT WHT
极大 较小 较小 较小
很好 一般 很好 较好
DCT由于其算法简单,计算量小以及在封装能力和块效应方面较好的性能成为压 缩编码首选的变换方式,已经得到国际上的公认。
0.19
0.25 0.21 0.16 0.08 0.06
000
001 010 011 100 101
3
3 3 3 3 3
11
01 10 001 0001 00001
2
2 2 3 4 5
r6=6/7
r7=1
0.03
0.02
110
111
3
3
000001
000000
6
6
7
1.1.2 像素间冗余
什么是像素间冗余?
➣算术编码器对整个消息只产生一个码字,因此译码器必须在接受到这个实数 后才能统一进行译码,无法即时译码。
➣算术编码对错误比较敏感。
20
Chapter
第三部分
3
有损压缩
21
3.1 有损压缩的必要性
举一个很简单的有损压缩的例子: 压缩前:
原产于在秘鲁和墨西哥,最初被称为“狼桃”的,全体生 粘质腺毛,小叶极不规则的,大小不等,卵形或矩圆形的, 边缘有不规则锯齿或裂片的水果或蔬菜反射全谱可见光后 主要的波长和人类的血类似。
在静态图像压缩编码标准中,比较著名的有JPEG、JBIG等标准。 视频可看成是一幅幅不同但相关的静态图像的时间序列。 静态图像的压缩技术和标准可以直接应用于视频的单帧图像。 介绍: 适用于静态图像的JPEG标准和JBIG标准 新的JPEG2000压缩国际标准
5
假设区间[0,1]内的一个离散随机变量 rk表示图像的灰度级,并且每个rk出现的 概率为pr(rk),则有:
k=0,1,2......L-1
这里L是灰度级数,nk是第k个灰度级在图像中出现的次数,n是图像中的像 素总数,如果用于表示每个rk值的比特数为l(rk),则表达每个像素所需的平均 比特数为:
3.重复上述步骤,直到信息源最后为两个信息源为止。
4.对最后的信息源赋予1和0或0和1,并逐步向前编码。 通过上述步骤就可以构成Huffman码(最优变长码)。
18
2.2.2 Shannon编码
Shannon编码与Huffman编码相反,采用从上到下的方法。Shannon编码算 法步骤:
(1)按照符号出现的概率减少的顺序将待编码的符号排成序列。
➣反映图像中像素之间的相互关系。
➣因为任何给定像素的值可以根据与这个像素相邻的像素进行预测,所以 单个像素携带的信息相对较少。
例如:原图像数据:234 223 231 238 235 压缩后数据:234 -11 8 7 -3
8
1.1.3 视觉心理冗余 什么是视觉心理冗余?
这是由于眼睛对所有视觉信息感受的灵敏度不同。 有些信息在通常的视觉 过程中与另外一些信息相比并不那么重要,这些信息被认为是视觉心理冗余的, 去除这些信息并不会明显降低图像质量。
压缩后: 西红柿是红的。
22
有损压缩的可能性
——图像中存在很大的冗余度。 ——用户通常允许图像失真。
常用的有损压缩技术
——有损预测编码 ——变换编码 ——基于模型编码 ——分形编码 ——其他编码
23
3.2 有损预测编码
有损预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或 多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行 编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以 用比较少的比特进行编码,达到压缩数据的目的。 有损预测编码中典型压缩方法有脉冲编码调制(PCM Pulse Code Modulation)、差分脉冲编码调制(DPCM,Differential Pulse Code Modulation)、自适应差分脉冲编码调制(ADPCM,Adaptive Differential Pulse Code Modulation)等,它们较适合于声音、图像数据的压缩,因为 这些数据由采样得到,相邻样值之间的差相差不会很大,可以用较少位来表示。
(2)将符号分成两组,使这两组符号概率和相等或几乎相等。 (3)将第一组赋值为0,第二组赋值为1。wenku.baidu.com(4)对每一组,重复步骤2的操作。
19
2.2.3 算数编码
算术编码:是一种非模块式的编码方法,它是对信源的符号串直接进行编码;而 非对信源的每一个符号赋予固定的码字再根据符号串进行排列。
基本思想:根据一个固定长度的符号串可能出现的概率,将该符号串映射到开区 域[0 ,1)中的一个子区域,计算该子区域的过程采用了条件概率的理念。 ➣理论上平均码长能够无限逼近最小平均码长,但由于实际的计算机精度不可 能无限长,运算中会出现溢出情况。
27
离散余弦变换(DCT)
离散余弦变换(Discrete Cosine Tranform,简称DCT)是一种与傅立叶变换 紧密相关的数学运算。在傅立叶级数展开式中,如果被展开的函数式是偶函数, 那么其傅立叶级数中只包含余弦项,再将其离散化可导出余弦变换,因此称之 为离散余弦变换。时间域中信号需要许多数据点表示;在x轴表示时间,在y轴 表示幅度。信号一旦用傅立叶变换转换到频率域,就只需要几点就可以表示这 个相同的信号。如我们已经看到的那样,原因就是信号只含有少量的频率成分。 这允许在频率域中只用几个数据点就可以表示信号,而在时间域中表示则需要 大量数据点。 在JPEG各类图像压缩算法中,基于离散余弦变换的图像压缩编码过程称为基本 顺序过程,它应用于绝大多数图像压缩场合, 并且它能在图像的压缩操作中获得 较高的压缩比。彩色图像有像素组成,这些像素具有RGB彩色值。每个像素都 带有x,y坐标,对每种原色使用8*8或者16*16矩阵。在灰度图像中像素具有 灰度值,它的x,y坐标由灰色的幅度组成。为了在JPEG中压缩灰度图像,每 个像素被翻译为亮度或灰度值。
数字图像的压缩
1
1
数据压缩基本概念 无误差压缩 有损压缩 图像压缩编码标准
C
目录
2 3
ONTENTS
4
2
Chapter
第一部分
1
数据压缩的 基本概念
3
1.1 数据冗余
数据冗余的概念
数据是用来表示信息的。如果不同的方法为表示给定量的信息使用了不同的数 据量,那么使用较多数据量的方法中,有些数据必然是代表了无用的信息,或 者是重复地表示了其它数据已表示的信息,这就是数据冗余的概念。
三种基本的数据冗余
➣编码冗余 ➣像素间冗余 ➣心理视觉冗余 如果能减少或消除上述三种冗余的一种或多种冗余,就能取得数据压缩的效果。
4
1.1.1 编码冗余
什么是编码冗余?
如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包 含了编码冗余。
例:黑白二值图像编码
如果用 8 位表示该图像的像素,我们 就说该图像存在编码冗余,因为该图像 的像素只有两个灰度,用1位即可表示。
24
3.3 变换编码
变换编码是指先对信号进行某种函数变换,从一种信号变换到另一种,然后再 对信号进行编码。如将时域信号变换到频域,因为声音、图像大部分信号都是 低频信号,在频域中信号的能量较集中,再进行采样、编码,那么可以肯定能 够压缩数据。
变换编码系统中压缩数据有变换、变换域采样和量化三个步骤。变换本身并不 进行数据压缩,它只把信号映射到另一个域,使信号在变换域里容易进行压缩, 变换后的样值更独立和有序。这样,量化操作通过比特分配可以有效地压缩数 据。
14
2) 平均码字长度
设ßk为数字图像第k个码字Ck的长度。其相应出现的概率为Pk ,则该数字 图像所赋予的码字平均长度为:
3) 编码效率
在一般情况下,编码效率往往用下列简单公式表示:
15
2. 变长最佳编码定理
在变长码中,对出现概率大的信息符号赋予短码字,而对于出现概率小的信息 符号赋予长码字。如果码字长度严格按照所对应符号出现概率大小顺序排列, 则编码结果平均码字长度一定小于任何其它排列方式。 变长编码是统计编码中最为主要的一种方法。
2.2.1 Huffman编码
Huffman编码是根据最佳编码定理,应用Huffman算法而产生的一种编码方 法。它的平均码字长度在具有相同输入概率集合的前提下,比其它任何一种单 义码都小。因此也常称其为紧凑码。通过减少编码冗余来达到压缩的目的。
16
Huffman编码方法
Huffman编码基本思想 1) 统计所有符号的出现概率 2) 建立一个概率统计表
一些基本概念
1. 图像熵和平均码字长度 1) 图像熵(Entropy) 设数字图像像素灰度级集合为(X1,X2,......,Xk,......,XM),其对应的概率分别为 P1,P2,......,Pk,......,PM。按信息论中信源信息熵定义,数字图像的熵H为:
熵表示每个像素提供的平均信息量为多少比特,对图像进行无损编码时所需的 平均位数不得低于H,熵是编码所需比特数的下限。
在变换编码系统中,用于量化一组变换样值的比特总数是固定的,它总是小于 对所有变换样值用固定长度均匀量化进行编码所需的总数,所以量化使数据得 到压缩,是变换编码中不可缺少的一步。在对量化后的变换样值进行比特分配 时,要考虑使整个量化失真最小。
25
变换编码的压缩过程: 1.图像的压缩:
输入 图像 构建 n*n子 图像 正变换 压缩 图像