6 图像编码基础
第六章图像编码技术()
6.3 基础理论
信息量 概率为P(E)的随机事件 E 的信息量
1 I ( E ) log logP ( E ) P( E )
I(E )称为E的自信息(随概率增加而减少) 特例:P(E ) = 1(即事件总发生),那么I(E ) = 0 信息的单位:比特(log以2为底)
产生单个信源符号的自信息:I (aj) = –logP(aj)
2
峰值信噪比(PSNR)
2 PSNR 10 lg MN f max f max max{f ( x, y )}
M 1 N 1 x 0 y 0
ˆ ( x, y ) f ( x, y ) 2 f
2. 主观保真度准则 观察者对图像综合评价的平均 P151 例6.2.1 电视图像质量评价
SNRms
g x, y
2
g x, y f x, y
2
将 SNRms 归一化信噪比并用分贝(dB)表示.令
1 M 1 f MN x 0
N 1 y 0
f ( x, y )
则有
M 1 N 1 2 f ( x, y ) f x 0 y 0 SNR 10 lg M 1 N 1 ˆ f ( x, y ) f ( x, y ) x 0 y 0
哈夫曼的编法并不惟一 (2)
例:单符号离散无记忆信源
X x1 , x2 , x3 , x4 , x5 , P( X ) 0.4 0.2 0.2 0.1 0.1 ,用
两种不同的方法对其编二进制哈夫曼码。
方法一:合并后的新符号排在其它相同概率符号的后面。
(完整word版)图像编码基本方法
一、霍夫曼编码(Huffman Codes)最佳编码定理:在变长编码中,对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码,如果码字长度严格按照符号出现概率大小的相反的顺序排列,则平均码字长度一定小于按任何其他符号顺序排列方式的平均码字长度。
霍夫曼编码已被证明具有最优变长码性质,平均码长最短,接近熵值。
霍夫曼编码步骤:设信源X 有m 个符号(消息)⎭⎬⎫⎩⎨⎧=m m p x p p x x X ΛΛ2121,1. 1. 把信源X 中的消息按概率从大到小顺序排列,2. 2. 把最后两个出现概率最小的消息合并成一个消息,从而使信源的消息数减少,并同时再按信源符号(消息)出现的概率从大到小排列;3. 3. 重复上述2步骤,直到信源最后为⎭⎬⎫⎩⎨⎧=o o o o o p p x x X 2121为止;4. 4. 将被合并的消息分别赋予1和0,并对最后的两个消息也相应的赋予1和0;通过上述步骤就可构成最优变长码(Huffman Codes)。
例:110005.0010010.000015.01120.00125.01025.0654321x x x x x x P Xi 码字编码过程则平均码长、平均信息量、编码效率、冗余度为分别为:%2%9842.2)05.0log 05.01.0log 1.015.0log 15.02.0log 2.025.0log 25.02(45.205.041.0415.0320.0225.022===⨯+⨯+⨯+⨯+⨯⨯-==⨯+⨯+⨯+⨯+⨯⨯=Rd H N η二 预测编码(Predictive encoding )在各类编码方法中,预测编码是比较易于实现的,如微分(差分)脉冲编码调制(DPCM )方法。
在这种方法中,每一个象素灰度值,用先前扫描过的象素灰度值去减,求出他们的差值,此差值称为预测误差,预测误差被量化和编码与传送。
接收端再将此差值与预测值相加,重建原始图像象素信号。
图像编码入门指南
图像编码入门指南图像编码是一种将图像数据进行压缩和编码的技术,广泛应用于数字图像处理、通信和存储等领域。
本文将介绍图像编码的基本原理、常见的编码算法和应用。
一、图像编码的基本原理图像编码的基本原理是利用图像中的冗余性进行压缩。
图像中的冗余性包括空间冗余、时间冗余和精度冗余。
空间冗余指的是图像中相邻像素之间的相关性;时间冗余指的是连续视频帧之间的相关性;精度冗余是指图像中像素值的冗余,即像素值在某一范围内的重复程度。
二、常见的图像编码算法1. 无损压缩算法:无损压缩算法能够在不丢失图像质量的情况下进行压缩。
常见的无损压缩算法有Huffman编码、LZW压缩算法和无损JPEG压缩。
- Huffman编码通过统计图像中像素值的出现频率,将出现频率高的像素值用较短的编码表示,从而达到压缩的效果。
- LZW压缩算法根据图像中出现的连续子串进行编码,并在解码时进行还原。
该算法常用于GIF图像的压缩。
- 无损JPEG压缩算法通过预测、去除冗余和差分编码等技术进行压缩,以减小图像文件的体积。
2. 有损压缩算法:有损压缩算法在压缩的过程中会丢失图像的一定信息,从而导致图像质量的损失。
常见的有损压缩算法有JPEG压缩、Fractal压缩和小波变换压缩。
- JPEG压缩是一种广泛应用的图像压缩算法,通过将图像转换到频域,并基于量化表对图像的高频信息进行舍弃,从而减小图像的体积。
- Fractal压缩算法通过寻找图像中的自相似结构来进行压缩。
该算法在有损压缩领域有着重要的应用。
- 小波变换压缩将图像转换为其在小波基函数下的系数,通过对系数进行量化和编码,从而达到压缩的目的。
三、图像编码的应用图像编码广泛应用于数字媒体、电视广播、医学影像、安防监控等领域。
1. 数字媒体:在数字媒体领域,图像编码可以用于图像的存储和传输。
通过图像编码,可以减小图像文件的体积,从而提高存储和传输的效率。
2. 电视广播:在电视广播领域,图像编码可以用于数字电视的压缩传输。
数字图像处理~图像编码
1 2 3 4 5 6 7 8 图像编码的基本知识 图像压缩编码的方法 哈夫曼编码 香农-范诺编码 行程编码 算术编码 离散小波变换DWT 离散余弦变换DCT
1 图像编码的基本知识 数字化后的图像信息数据量非常大,图像压 缩利用图像数据存在冗余信息,去掉这些冗 余信息后可以有效压缩图像。
1.空间(像素间、几何):在同一幅图片中,规则物体和规则背景(所
第一个0 第二个0 第三个0 第四个0
第五个0
该0前1的个数为0
读0+2个字符
00+01=01(1)
开始搜索
010110 1011011 11 010000 00 0 0 0
第一个0 第二个0 第三个0 第四个0 第五个0 该0前1的个数为0 该0前1的个数为2 该0前1的个数为0 该0前1的个数为2 该0前1的个数为0 读0+2个字符 读2+2个字符 读0+2个字符 读2+2个字符 读0+2个字符 10+01=11 1011+0001=1100 11+01=100 1000+0001=1001 00+01=01(1)
(3)第一个被压缩的符号为“b”,其初始间隔为[0.4, 0.6);
(4)第二个被压缩的符号为“a”,由于前面的符号“b”的取值 区间被限制在[0.4, 0.6)范围内,所以“a”的取值范围 应在前一符号间隔[0.4, 0.6)的[0, 0.4)子区间内:
起始位为0.4+0×(0.6-0.4)=0.4 终止位为0.4+0.4×(0.6-0.4)=0.48
2 图像编码的方法
l l l
(2) 预测编码:基于图像数据的空间或时间冗余特性,用 相邻的已知像素(或像素块)来预测当前像素(或像素块) 的取值,然后再对预测误差进行量化和编码。
第9(1)章-图像编码基础.
第十一章图像编码(压缩基础学习目的要求1、了解图像压缩的必要性和可能性熟练掌握图像中熵、平均码长、编码效率、冗余度和压缩比的概念和计算掌握图像压缩评价中采用的均方误差、均方信噪比的计算了解基本编码定理和编码失真概念掌握算术编码掌握变长编码原理以及哈夫曼 (Huffman、香农⎯法诺编码方法11.1 基本概念图像压缩的必要性:对于 lena 图像,其字节 512×512×8bit=256KB;对于卫星图像,一般是 12bit 灰度级,其字节2340×3240×12bit ≈10MB ;而遥感图像,通常又为多频谱图像;而对于视频图像,每秒 30帧图像压缩编码的目的:图 11-1Lena 图像减少数据存储量;降低数据率以减少传输带宽(信道容量;压缩信息量,便于特征抽取,缩短图像加工处理时间。
11.1.1 数据冗余从信息论观点来看, 图像作为一个信源, 描述信源的数据是信息量 (信源熵和信息冗余量之和。
冗余量减少可以减少数据量而不减少信源的信息量。
从数学上讲,图像可以看作一个多维函数,压缩描述这个函数的数据量实质是减少其相关性。
另外在一些情况下,允许图像有一定的失真,而并不妨碍图像的实际应用,那么数据量压缩的可能性就更大了。
信息冗余量有许多种,如空间冗余,时间冗余, 结构冗余, 知识冗余, 视觉冗余等,数据压缩实质上是减少这些冗余量。
在图像压缩中,有三种基本的数据冗余:编码冗余、像素间冗余、心理视觉冗余。
1. 编码冗余这里出现了多个概念,这些编码的最最基础,必须清楚、理解!! 这些概念包括:消息 (或事件 /信息即数据、 (消息出现的概率、码本、、码字的长度、比特数、自然码和变长码。
下面以一个例子来说明。
在数字图像中有 0~255共 256种事件或消息,它们各自出现的概率不同,构成不同的一幅图像。
用来表示这幅图像的这些 0~255事件就是数据。
下面再以一个简单的、只有 0, 1, 2, 3, 4, 5, 6, 7八种事件来说明以上概念。
第6章节 图像编码
10
离散信源的熵表示
设一个离散信源X: 其概率分布:
( x1 , x2 ,, x N ) { p1 , p2 ,, p N }
无记忆信源
满足
p
i 1
N
i
1
离散信源类型 有记忆信源
11
离散信源的熵表示
考虑无记忆信源X ,某个信源符号xk,如果它出现的概率是pk
xk的自信息量
1 I ( xk ) log log p k pk
26
Huffman编码
特点
(3)Huffman编码的信源概率是2的负幂时,效率达 100%,但是对等概率分布的信源,产生定长码,效 率最低,因此编码效率与信源符号概率分布相关, 故Huffman编码依赖于信源统计特性,编码前必须有 信源这方面的先验知识,这往往限制了哈夫曼编码 的应用。 ( 4 ) Huffman 编码只能用近似的整数位来表示单个 符号,而不是理想的小数,这也是Huffman编码无法 达到最理想的压缩效果的原因。
符号 00 01 10 概率 0.1 0.4 0.2 初始编码间隔 [0, 0.1) [0.1, 0.5) [0.5, 0.7)
11 0.3 [0.7, 1)
如果二进制消息序列的输入为:10 00 11 00 10 11 01。
I (a) 1.152,I (b) 2, I (c) 2.4739 , I (d ) 3.0589
信源熵
H ( X ) 0.45*1.152 0.25* 2 0.18* 2.4739 0.12 * 3.0589 1.8308
用例7.2第二种编码方法 ,平均码长1.85大于信源熵
香农信息论已证明,信源熵是进行无失真编码的理论极限。低于 此极限的无失真编码方法是不存在的,这是熵编码的理论基础。 而且可以证明,考虑像素间的相关性,使用高阶熵一定可以获得 更高的压缩比。
第6章 图像编码
第6章 图像编码
信息冗余度为:
1
每秒钟所需的传输比特数bps为:
压缩比r为:
M NR bps t d r R
第6章 图像编码
均方根信噪比为:
第6章 图像编码
(2) 主观保真度准则 图像处理的结果,大多是给人观看,由研 究人员来解释的,因此,图像质量的好坏, 既与图像本身的客观质量有关,也与视觉系 统的特性有关。 有时候,客观保真度完全一样的两幅图像 可能会有完全不相同的视觉质量,所以又规 定了主观保真度准则,这种方法是把图像显 示给观察者,然后把评价结果加以平均,以 此来评价一幅图像的主观质量。 另外一种方法是规定一种绝对尺度,如:
通常使用的客观保真度准则有输入图像 和输出图像的均方根误差;输入图像和输出图 像的均方根信噪比两种。 均方根误差: 设输入图像是由N×N个像 素组成,令其为f (x ,y),其中x ,y=0,1,2,…,N1。这样一幅图像经过压缩编码处理后,送至 受信端,再经译码处理,重建原来图像,这里 令重建图像为g (x ,y)。它同样包含N×N个像 素,并且x ,y=0,1,2,…,N-1。
第6章 图像编码
Huffman编码
输入 输入概率 0.4 S1 0.3 S2 0.1 S3 0.1 S4 0.06 S5 0.04 S6
第6章 图像编码
Huffman编码
输入 输入概率第一步 0.4 0.4 S1 0.3 0.3 S2 0.1 0.1 S3 0.1 0.1 S4 0.06 0.1 S5 0.04 S6
第6章 图像编码
Huffman编码
输入 输入概率第一步第二步第三步第四步 0.4 0.4 0.4 0.4 0.6 0 S1 0.3 0.3 0.3 0.3 0 0.4 1 S2 0.1 0.1 0.2 0 0.3 1 S3 0.1 0.1 0 0.1 1 S4 0.06 0 0.1 1 S5 0.04 1 S6 S3=011
第六章 图像编码基础(2015)
fˆn 是根据前面几个像素的亮度值
f n1, f n2 , , f nk
预测而得.
n fn fˆn
量化器:对n进行舍入,整量化.
编码器:可采用成熟的编码技术,如Huffman编码等.
解码器:编码器的逆.
线性预测器:
n1
fˆn F ( fn1, fn2 , , fnk ) ak fk , ak 1 k l
(5) 编码定理 问题:如何度量编码方法的优劣?(编码的性能参数)
➢图像信息熵与平均码字长度
令 d {d1, d2 , , dm} 是图像象素灰度级集合 其对应的频率为 p(d1), p(d2 ), , p(dm ) 定义
m
H (d ) p(di ) log 2 p(di )(单位:比特/象素) i 1
编码效率: H (d ) (%) 2.25 / 2.61 97.8%
R(d )
例6-2
信源符号
a1 a2 a3 a4 a5 a6 a7
概率
编码过程
0.20
0
0.19 0.18
1
1
0.39
0.17 0.15 0.10 0.01
0
0
1 0.35
0
0
1 0.61
0
1 0.261ຫໍສະໝຸດ 0.11Huffman编码过程
根据图像像素灰度值出现的概率的分布特性而进行的压缩编码叫统 计编码。
几个基本概念
信源编码:通过对表示信息的数据体的形式的变换,祛除数据冗余,从而 达到以尽可能少的数据代码表示尽可能多的信息的目的,实现数据压 缩目标.
信道编码:主要指用于确保信道传输可靠性和安全性的各类纠错编码、 密码(加密)、信息隐藏等。通过信道编码,对数码流进行相应的处 理,使系统具有一定的纠错能力和抗干扰能力,可极大地避免码流传 送中误码的发生 .
图像编码入门指南(一)
图像编码入门指南图像编码是将图像数据转换为更紧凑的表示形式的过程,以便于存储和传输。
它在数字媒体和通信领域扮演着重要的角色。
本文将介绍图像编码的基础知识和常见的编码算法,帮助读者了解和掌握图像编码的基本原理和技术。
一、图像编码基础图像编码的目标是用较少的比特数来表示图像,并且尽可能保留图像的质量。
了解图像编码的基本原理是学习和应用编码算法的基础。
像素和图像的表示图像由像素组成,每个像素代表图像中的一个点。
每个像素可以由灰度值或颜色值表示,以控制亮度和色彩。
图像编码的基本单位一般是像素。
图像压缩原理图像压缩可以分为有损压缩和无损压缩。
有损压缩会删除一些不显著的细节以减少数据量,而无损压缩则保持图像的原始质量。
图像编码的重点是有损压缩。
二、图像编码算法本节将介绍几种常见的图像编码算法,包括JPEG、PNG和GIF。
它们是应用最广泛的图像编码标准,具有不同的特点和适用场景。
JPEG编码JPEG是一种广泛使用的有损压缩算法,适用于彩色图像。
它基于离散余弦变换(DCT)原理,将空域的图像变换为频域的信号。
通过量化和熵编码,JPEG可以减少图像的数据量并保持视觉上的质量。
PNG编码PNG是一种无损压缩算法,适用于需要保持图像质量的场景。
PNG 使用了预测编码和无损压缩技术,通过检测图像中的重复模式来减少数据的冗余。
它支持透明度和多种颜色空间,通常用于网络传输和文件存储。
GIF编码GIF是一种使用LZW算法的无损压缩算法,适用于动画图像。
GIF 可以将多帧图像合成为一个文件,播放时可以循环显示。
它适合于简单的图形和动态图像,但对于复杂的彩色图像效果不佳。
三、图像编码应用图像编码在众多领域都有广泛的应用,包括数字媒体、通信和医学图像等。
数字媒体图像编码在数字媒体中扮演着重要的角色。
通过图像编码,媒体数据能够以更高效的方式进行存储和传输,提高了媒体的传播和共享效率。
例如,在视频会议和流媒体领域,图像编码可以实现高质量的图像传输。
6 图像编码基础
自动化工程学院电子工程系教研室 王汉萍 主讲
基本概念: 熵
H ( X ) P ( x ) log
2
P (x)
自信息
I ( E ) log P ( E )
零记忆信源
完全用(B,u)描述,信源符号统计独立的信源就成为零 记忆信源。
B {b1 , b 2 , , b J }, b( j 1,2, , J )称为信源符号 j
香农第二定理(有失真编码定理): 在给定保真度准则的前提下,如何来确定最小的编码 所用数据率(每像素的平均比特数)? 如果允许最大可能的失真,就可获得最小的信息率。 通俗的说,允许的失真度越大,图像的压缩率就越高。
6.4 哈夫曼编码
变长编码是基于统计模型的,也有人称熵编码, 可以减少图像的编码冗余。
最常用的变长变码方法有哈夫曼编码和香农-法诺编码。
6.4.1 霍夫曼编码
设原始信源有M个消息,即 可用下述步骤编出哈夫曼码:
u 1 , u 2 , , u M X P1 , P2 , , PM
第一步,把信源X中出现的消息按出现的概率从大到小的 顺序排列即 P1 P2 PM 。
M 1 N 1
x0 y0
ˆ ( x , y ) f ( x , y )] 2 [f
3) 均方根信噪比
M 1 N 1
SNR
rms
x0 y0
图像编码中的编码标准与规范解析(六)
图像编码是一项用于将图像数据转换为易于传输和存储的压缩形式的技术。
编码标准和规范在图像编码中起着至关重要的作用,它们确保了在不同设备之间的兼容性和一致性。
本文将对图像编码中的编码标准与规范进行解析。
一、JPEG编码标准与规范解析JPEG是一种广泛使用的图像编码标准,它通过压缩图像数据,减小文件大小,并保持图像质量。
JPEG编码标准定义了编码和解码图像所需的算法和规则。
它使用了离散余弦变换(DCT)和量化技术来降低图像数据的冗余性。
在JPEG编码过程中,图像被分为若干8×8的像素块,每个像素块经过DCT变换后,通过量化表进行量化。
量化表用于降低图像的精度,从而减小文件大小。
编码后的图像数据经过熵编码,最终生成JPEG文件。
二、编码标准与规范解析是一种广泛应用于视频编码的标准,它在图像编码中也有重要应用。
编码标准定义了一套用于压缩视频数据的算法和规则。
它利用了运动估计、空间预测、变换编码和熵编码等技术来降低视频数据的冗余性。
在编码过程中,视频被分为若干帧和宏块。
对于静止的帧,通过空间预测技术进行编码;对于运动的帧,通过运动估计和运动补偿将差异信息编码。
然后,经过离散余弦变换和量化后,通过熵编码生成压缩视频数据。
三、WebP编码标准与规范解析WebP是一种由谷歌公司开发的图像编码格式,旨在提供更高的压缩率和更好的图像质量。
WebP编码标准基于视频编码技术,结合了预测编码和变换编码等方法。
在WebP编码过程中,图像数据被分解成多个小块,并通过预测编码来提取冗余性。
然后,使用有损和无损压缩算法对图像数据进行编码。
WebP编码标准还支持无损动画和透明度编码,使其在应用中得到广泛应用。
四、HEIF编码标准与规范解析HEIF(High Efficiency Image Format)是一种现代的图像编码格式,旨在提供更高的压缩效率和更多的图像信息。
HEIF编码标准使用了HEVC(High Efficiency Video Coding)压缩技术,并结合了多种其他技术。
第六章图像编码技术
哈夫曼编码
哈夫曼编码步骤
(2) 对每个信源符号赋值 对消减信源的赋值 初始信源 从(消减到)最小的信源开始,逐步回到初始信源
符号 a2 a6 a1 a
4
概率 0.4 0.3 0.1 0.1 0.06 0.04 1
码字 00 011 0100 01010 01011
1 0.4 1 0.3 00 0.1 011 0.1 0100 0.1 0101
4
目的:节省图像存储容量;减少传输信 道容量;缩短图像加工处理时间。 原因:
图像像素之间、行之间、帧之间有较强的相 关性。
从统计的观点,某点像素的灰度与其邻域灰 度有密切关系; 从信息论关系,减少图像信息中冗余信息。
5
压 缩 率
9.2
6
压 缩 率
18.4
7
压 缩 率
51.6
8
无失真信源编码器不需要量化器
第21页
映射器:通过将输入数据变换以减少像素相关 冗余; 量化器:通过减少映射器输出的精度来减少心 里视觉冗余; 符号编码器:通过将最短的码赋给最频繁出现 的量化器输出值以减少编码冗余。
6.2 图像保真度
23
24
6.2 图像保真度
客观保真度准则
所损失的信息量可用编码输入图与解码输出 图的某个确定函数表示 均方根(rms)误差:
1 / 2 *1 1 / 4 * 2 1 / 8 * 3 1 / 8 * 3 1.75
平均码长等于信源的熵
41
离散信源的熵表示
例
设
X {a, b, c, d}
p(a) 0.45, p(b) 0.25, p(c) 0.18, p(d ) 0.12
第六章 图像编码(3)
第六章:图象压缩
概述
基本知识 统计编码 预测编码
变换编码 国际标准
6.3.2 位平面编码
6. 编码方法比较
(1)各方法得到的码率都比一阶熵估计要小,这说明各方法 都能消除一定的象素间冗余,其中游程编码效果最好。
(2)灰度编码能得到的(比二值编码的)改进约为1比特/象素。
(3)所有5中方法的压缩率都仅在1~2之间,这主要是因为它 们对低位面的压缩效果差。有时数据会有膨胀现象。
压缩比: 0.989
原图象文件: 72768字节
行程编码文件: 72972字节
压缩比: 0.997
原图象文件: 277560字节
行程编码文件: 279860字节
压缩比: 0.992
原图象文件: 66616字节
行程编码文件: 9272字节
压缩比: 7.185
第六章:图像编码
一:概述和分类 二:基本概念和理论 三:统计编码
第六章:图象压缩
概述
基本知识 统计编码 预测编码
变换编码 国际标准
6.4.1 无损预测编码
ˆ 3. 用当前像素值fn ,通过预测器得到一个预测值 f n , 对当前值和预测值求差,对差编码,作为压缩数据 流中的下一个元素。由于差比原数据要小,因而编 码要小,可用变长编码。大多数情况下, fn的预测 是通过m个以前像素的线性组合来生成的。
第六章:图象压缩
概述
基本知识 统计编码 预测编码
变换编码 国际标准
变换编码 国际标准
6.3.2 位平面编码
第六章:图象压缩
概述
基本知识 统计编码 预测编码
变换编码 国际标准
6.3.2 位平面编码
由这些图可见低位面图比高位面图复杂,即低位
第六章 图像编码(2)
第六章:图象压缩
概述
基本知识 简单编码 预测编码
变换编码 国际标准ቤተ መጻሕፍቲ ባይዱ
6.2.4 信息论简介
仍用上例 A={0,1},n=2 ,选择编码方式0, 10,110,111,则平均码长
1 1 1 1 7 N 1 2 3 3 2 4 8 8 4
7 Hx 4 1 N log 2 n 7 1 4
1 I(E) log p(E) log p(E)
第六章:图象压缩
概述
基本知识 简单编码 预测编码
变换编码 国际标准
6.2.4 信息论简介
要辨识1到32中选定的某一个数,可先提问
:“是否大于16?”,得到回答就消去半数可
能事件。每提问一次得到回答,可以得到1bit
信息量(二进制位)。这里共需5次,因此所需
基本知识 简单编码 预测编码
变换编码 国际标准
6.3.1 变长编码--一些亚最优变长码
B码
B码是单义码但是是续长码,译码时要向
前看一位延续比特;
B码编码时也是将出现概率最大的消息安
排最少长度的码字,然后依次排列下来,它的
p1 , p 2 , , p n
1 2 n
熵[entropy]的定义:由于P(aj)是一个随机变量, 也可以定义信源的信息量的统计平均为熵:
Hx P a j log 2 Pa j
k j1
第六章:图象压缩
概述
基本知识 简单编码 预测编码
变换编码 国际标准
的信息量为 log 32 5 2 。
第六章:图象压缩
概述
基本知识 简单编码 预测编码
变换编码 国际标准
6.2.4 信息论简介
06图像编码
码长 1 3 3 3 3
平均码长 Huffman编码过程示意图
L p(si)li 2.2
i 1
5
22
例 :设有编码输入 X x1 , x2 , x3 , x4 , x5 , x6 。频率分布分别 为 P( x ) 0.4, P( x ) 0.31, P( x ) 0.11, P( x ) 0.1, P( x ) 0.06, P( x ) 0.02 ,现求其最佳霍夫曼编码 W w1 , w2 , w3 , w4 , w5 , w6 。
平均感觉分MOS的主观评价可定义
MOS
n C
i 1 k i
k
i
n
i 1
i
MOS得分越高,解码后图像的主观评价好
20
霍夫曼码(Huffman)编码
利用编码冗余实现的变长编码。
基本思想:出现概率大的信号赋予较短的码字,出现概率 小的,赋予较长的码字。 Huffman编码步骤如下:
(1)将信源符号xi按其出现的概率,由大到小顺序排列。 (2)将两个最小的概率的信源符号进行组合相加,并重复这一步骤,始 终将较大的概率分支放在上部,直到只剩下一个信源符号且概率达到 1.0为止; (3)对每对组合的上边一个指定为1,下边一个指定为0(或相反:对上 边一个指定为0,下边一个指定为1); (4)画出由每个信源符号到概率1.0处的路径,记下沿路径的1和0; (5)对于每个信源符号都写出1、0序列,则从右到左就得到非等长的 Huffman码。
G 8 6 4 2 0
4
L
I 1 2 3
gi 2 5 4
li 3 7 2
8
12
16
20
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4) 峰值信噪比
PSNR 10 lg 1 MN 2 f max M 1 N 1 ˆ ( x , y ) f ( x , y )] 2 [f x0 y0
其中,f max max{ f ( x , y ), x 0 ,1, 2 , , M 1, y 0 ,1, 2 , , N 1}
X
0
u 10 0 P1
0 u2 0 P2
第四步,将被合并的消息分别赋以1和0或0和1。对最后的 0 X0也即对 u 10 和 u 2 对应的赋以1和0或0和1。
重复上述步骤就可以构成哈夫曼编码。 例 求下述信源的哈夫曼码:
u2 0 .4 u3 0 . 06 u4 0 .1 u5 0 . 04 u6 0 .3
第二步,把最后出现概率最小的消息合并成一个消息,从 而使信源的消息数减少一个,同时把信源中的消息的概率 从大到小排列一次。 得
X1 u 1 ' , u 2 ' , , u M 1 ' P1 ' , P2 ' , , PM 1 '
第三步,重复上述步骤,直到信源最后为X0为止
数据冗余与信息 表达无用信息的数据就叫数据冗余。 数据冗余可用数学定量的描述。设n1和n2分别代表用来 表达相同信息的两个数据集合中的信息载体单位的个数, 那么第一个数据集合(相对于第二个数据集合)的相对 数据冗余RD定义为:
RD 1 1 CR
其中CR为压缩率: R n 1 / n 2 C
2. 主观保真度准则
常用方法是对一组精心挑选的观察者展示以傅典型的 图像并将它们对该图的评价综级量表
值 1
2
3 4
5 6
等级 极好
好
过得去 勉强可以
差 不可用
描
述
具有极高品质的图像,和希望的一样好
高品质的图像,感觉良好,其中的干扰可以接受
[0.0592,0.0624) [0.0624,0.0688) [0.0688,0.072)
[0.06624,0.06752)
[0.0624,0.06368) [0.06368,0.06624)
[0.06752,0.0688)
练 习
1. 求下述信源的哈夫曼编码,以及熵、平均码长、效率和 冗余度。
X u1 0 . 25 u2 0 . 25 u3 0 . 20 u4 0 . 15 u5 0 . 10 u6 0 . 05
6.5
算术编码
算术编码仅用到了算术运算和移位运算,这就是其名 称的由来,它的解码过程可以借助于编码过程来进行。
C R 和 R D 分别在开区间( 0, )和( , 1)
数据冗余的分类
在数字图像压缩中,可以确定三种基本的数据冗余: 编码冗余、像素间冗余、心理视觉冗余。当这三种冗余的 一种或多种得到了减少或消除时,就实现了数据压缩。 1. 编码冗余
利用图像的灰度级直方图来深入了解编码结构,从 而减少表达图像所需的数据量。
6.4.3 亚最优变长码
根据哈夫曼方法的原理,当需要对大量符号进行编码 时,构造最优哈夫曼码的计算量会很大,此时常采用一些 亚最优的变长编码方法。下面仅介绍两种基于哈夫曼方法 的截断哈夫曼码和平移哈夫曼码。
1.截断哈夫曼码 截断哈夫曼码是对哈夫曼码的一种改型。只对最可能 出现的M个符号进行哈夫曼编码,而对其它的码都用在一 个合适的定长码前加一个前缀码来表示。 2. 平移哈夫曼码 平移码由以下几个步骤产生:重新排列信源符号使得 它们的概率单减;将符号总数分成相同大小的符号块;对 所有的块中的各个元素采用同样方法编码;对每个 块加 上专门的平移符号以区别它们。
自动化工程学院电子工程系教研室 王汉萍 主讲
6 图像编码基础
6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 数据冗余和压缩 图像保真度 无失真编码定理 哈夫曼编码 算术编码 位平面编码 无损预测编码 有损预测编码
简
介
网上的许多信息是以图像形式存储的,所以对于存 储和通信的需求是无限的。而数据压缩方法比起数据的 存储和传输具有更为突出的实用价值和商用意义。
最常用的变长变码方法有哈夫曼编码和香农-法诺编码。
6.4.1 霍夫曼编码
设原始信源有M个消息,即 可用下述步骤编出哈夫曼码:
u 1 , u 2 , , u M X P1 , P2 , , PM
第一步,把信源X中出现的消息按出现的概率从大到小的 顺序排列即 P1 P2 PM 。
熵: 基本概念 设某个无记忆信源共有M个消息,记作{u 1 , u 2 , , u M } 。其 { 中消息u i ( i 1, 2 , , M ) ,各自出现的概率分别为:P1 , P2 , , PM } 可把这个信源用下式表示: u 1 , u 2 , , u M
X P1 , P2 , , PM
2. 像素间冗余
像素间冗余也称空间冗余或几何冗余,来自图像中 对象之间的结构或几何关系。
如何消除像素间冗余呢? 利用相邻像素间的差异描绘图像,这种变化被认为是 映射。比如行程编码。
3. 心理视觉冗余
心理视觉冗余产生是由于眼睛并不是对所有视觉信息 有相同的敏感度。有些信息在通常的视感觉过程中与另外 一些信息相比来说不那么重要,这些信息可以认为有心理 视觉冗余,去除这些信息不会明显的降低所感受到的图像 质量。 如何消除心理视觉冗余呢? 通过“改进灰度级量化”过程消除心理视觉冗余, 量化的结果导致数据的有损压缩。
变长码都是基于统计模型的,哈夫曼编码和香农-法诺编码都是所谓 的块码,因为它们都将每个信源符号映射成一组固定次序的码符号, 这样在编码时可以一次编一个符号。
从解码的角度:人们常关注两个特性:即时性和唯一性。 (1)即时性(也称非续长性) 任意一个码字都不是其它码字的续长。
(2)唯一性(单义性)
任意一个有限长的码字序列只能被分割成一个一个的码字,而 任何其他分割方法都会产生一些不属于码字集合中的码字。符合这 个条件的代码叫单义代码。 非续长代码一定是单义的,单义代码却不一定是非续长代码。
L avg
l (r
k 0
l 1
k
) p r ( rk )
自然码是每个随机事件用来自m比特二进制技术序列的 2m个m比特二进制码的其中一个来表示,是等长码。当一 幅图像的灰度级直接用自然二进制编码来表示时,冗余总 是存在的。 如何消除编码冗余呢? 采用变长编码,比如哈夫曼编码,香农编码等。
u [ P ( b1 ) P (b2 ) P (b J ) ]
T
香农第一定理(无失真编码定理):
如果不允许失真,什么是图像传输率的最终极限? 无损信源编码编码的平均码字长度可以接近信源的熵, 但不能小于信源的熵。这也是无损信源压缩的极限
n
lim [
L avg n
'
] H (u )
算术编码的过程:
a1 0.2 [0,0.2) [0,0.04) [0.04,0.048) [0.056,0.0592) a2 0.4 [0.2,0.4) [0.04,0.08) [0.048,0.056) a3 0.8 [0.4,0.8) [0.08,0.16) [0.056,0.072) a4 1 [0.8,1) [0.16,0.2) [0.072,0.08)
基本概念: 熵
H ( X ) P ( x ) log
2
P (x)
自信息
I ( E ) log P ( E )
零记忆信源
完全用(B,u)描述,信源符号统计独立的信源就成为零 记忆信源。
B {b1 , b 2 , , b J }, b( j 1,2, , J )称为信源符号 j
N
M
Pi N i
编码效率:
N log
i 1
H (X )
2
n
冗余度:
Rd 1 N log
2
n H (X )
2
N log
n
统计编码的目的就是要设法减小 N ,使得 1 。显然 N 有一个最低限,当 1 时, N 的最低限 H ( X ) / log 2 n 。 可以根据这一准则来衡量编码方法的优劣。
图像压缩所解决的问题是尽量减少表示数字图像时 需要的数据量,减少数据量的基本原理是除去其中多余 的数据。以数学观点来看,实际上就是将二维像素阵列 变换为一个在统计上无关联的数据集合。 图像压缩方法分类: 信息保存型和信息损失型。
6.1 数据冗余和压缩
图像编解码过程
存储
原始图像
编码
编码结果
解码 传输
1 2
根据该信源的消息集合,在字母集 A { a , a , , a } 中选取 ai进行编码。一般情况下取二元字母集 A { 0 ,1} 根据信息 论中熵的定义,可算出该信源的熵为:
n
H ( X ) Pi log
i 1
M
2
Pi
平均码长: 设对应于每个消息的码字由Ni个符号组成,也就是说每 个消息对应的码字长度各为Ni。
香农第二定理(有失真编码定理): 在给定保真度准则的前提下,如何来确定最小的编码 所用数据率(每像素的平均比特数)? 如果允许最大可能的失真,就可获得最小的信息率。 通俗的说,允许的失真度越大,图像的压缩率就越高。
6.4 哈夫曼编码
变长编码是基于统计模型的,也有人称熵编码, 可以减少图像的编码冗余。
M 1 N 1
x0 y0
ˆ ( x , y ) f ( x , y )] 2 [f
3) 均方根信噪比
M 1 N 1
SNR
rms
x0 y0