北京交通大学图像处理--第5章 图像编码(4)
图像处理课程4图像的编码技术共65页文档
彩色视频数据量分析
实时传输:
在10M带宽网上实时传输的话,需要压缩到原来数 据量的0.045, 即0.36bit/pixel。
存储: (按1张光盘可存640M计算)
如果不进行压缩,1张CD则仅可以存放23秒的数据。 存2小时的信息则需要压缩到原来数据量的0.0004, 即:0.003bit/pixel。
传输带宽、速度、存储器容量的限制。
给我们带来的一个难题,也给了我们一个 机会:
如何用软件的手段来解决硬件上的物理极限。
图像编码的研究背景 —— 海量数据带来的需求
数码图像的普及,导致了数据量的庞大。 图像的传输与存储,必须解决图像数据的
压缩问题。
彩色视频数据量分析
对于电视画面的分辨率640*480的彩色图 像,每秒30帧,则一秒钟的数据量为: 640*480*24*30=221.12M
图像信源 解码
显示图像
讨论的内容
数据的冗余 图像压缩编码简介 行程编码 Huffman编码 DCT变换编码 混合编码
谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利
传真数据量分析
如果只传送2值图像,以200dpi的分辨 率传输,一张A4稿纸的数据量为: 1654*2337*1=3888768bit =390K
按目前56.6K的电话线传输速率,需要 传送的时间是:67.5秒
图像通信系统模型
图像信息源
数字图像处理:第5章 图像编码(第二讲)
由此可得
2 i
E[( xi
xˆi )xi ]
当 i 0 时,则
2 0
E[
x
2 0
x0 x0 ]
将 x0 1x1 2 x2 n xn
(5—48) (5—49)
代入式(5—49),并引入协方差之定义,则
2 0
R00
(1R01
2 R02
n R0n )
(5—50)
式中 R00 是原序列X的方差。由式(5—50)可见,
发“0”码。
df 0 dt
交替出现 “0” “1” 码。
在接收端, 当译码器收到“1”时,信号则产生一个正跳变, 收到“0”时,则信号电压产生一个负的跳变, 由此即可实现译码。
首先讨论一下译码电路。译码器应具有下述三 个功能:
(1)收到“1”时,产生一个正斜变电压,当 连续收到“1”时,则连续上升;
nt RC
U0
(5—59)
只要 nt 远小于RC,则电容器上的电压会一直随
时间线性增长,保证在收到连“1”码时,每次上
升同样一个量化级,上升的斜率就是
t E0 RC
。
电容器能够保持电荷,因而具有记忆作用。
由式(5—58)知道,收到“1”时电压会上升一个 量化阶,当收到“0”时,相当于图5—29中开关 接到 -E0 ,此时会使电容上的电压下降一个量 化阶,所以,简单的RC电路就能实现增量调制编 码器的译码。
(2)收到“0”时,产生一个负斜变电压,当 连续收到“0”时,则连续下降;
(3)正、负斜率相等,且具有记忆功能。
图 5—28 译码原理
R
Uc
K
E0
C -E0
Uc
U0
t
(完整word版)图像编码基本方法
一、霍夫曼编码(Huffman Codes)最佳编码定理:在变长编码中,对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码,如果码字长度严格按照符号出现概率大小的相反的顺序排列,则平均码字长度一定小于按任何其他符号顺序排列方式的平均码字长度。
霍夫曼编码已被证明具有最优变长码性质,平均码长最短,接近熵值。
霍夫曼编码步骤:设信源X 有m 个符号(消息)⎭⎬⎫⎩⎨⎧=m m p x p p x x X ΛΛ2121,1. 1. 把信源X 中的消息按概率从大到小顺序排列,2. 2. 把最后两个出现概率最小的消息合并成一个消息,从而使信源的消息数减少,并同时再按信源符号(消息)出现的概率从大到小排列;3. 3. 重复上述2步骤,直到信源最后为⎭⎬⎫⎩⎨⎧=o o o o o p p x x X 2121为止;4. 4. 将被合并的消息分别赋予1和0,并对最后的两个消息也相应的赋予1和0;通过上述步骤就可构成最优变长码(Huffman Codes)。
例:110005.0010010.000015.01120.00125.01025.0654321x x x x x x P Xi 码字编码过程则平均码长、平均信息量、编码效率、冗余度为分别为:%2%9842.2)05.0log 05.01.0log 1.015.0log 15.02.0log 2.025.0log 25.02(45.205.041.0415.0320.0225.022===⨯+⨯+⨯+⨯+⨯⨯-==⨯+⨯+⨯+⨯+⨯⨯=Rd H N η二 预测编码(Predictive encoding )在各类编码方法中,预测编码是比较易于实现的,如微分(差分)脉冲编码调制(DPCM )方法。
在这种方法中,每一个象素灰度值,用先前扫描过的象素灰度值去减,求出他们的差值,此差值称为预测误差,预测误差被量化和编码与传送。
接收端再将此差值与预测值相加,重建原始图像象素信号。
《图像编码》PPT幻灯片PPT
游程长度编码
❖基本原理
对二值图像的每一扫描行来看,总是由若干段连着的黑象素段和 连着的白象素段组成,分别称为“黑长”和“白长”。黑长和白 长总是交替发生。对于不同长度按其发生概率分配以不同长度的 码字,这就是游程长度编码(RLC)。
设二值图象中有长度为1, 2, …,N等不比特率,必须知道图像游程长度的概率分布。这是 十分复杂的测量技术,往往采用某些实用的游程长度概率模型来计算。
准最佳可变长编码
线性码(A码)
线性码是一种码字的长度近似地正比于游程长度,常称为A码。它对每 一个游程长度分配一个或多个固定长度块的二进制码字。如果每一块 有N个比特,则称为AN码。
即每个象素的熵h为用游程长度编码所得的最小比特率的估计值
为了进一步减小比特率,可以将黑长和白长分开分开分别编码,因为它们
出现的概率不同。
N
H w Piw log Piw i 1
H
--白长熵
w
Piw 白长为 i的概率
对白长进行最优编码后,应该有:
Hw Bw Hw 1 Bw为平均比特数
令Ew为表示白长的平均长度
其后,该委员会与CCITT/SG VIII合并,组成了JPEG(Joint Photograhic Coding Experts Group)。
标准化的要求条件转到使更多的应用环境都能使用标准化编码的目 标上,应用对象扩大到了彩色传真、静止图像、电话会议、印刷及 新闻图片的传送上。 图像表示的对象将硬拷贝也包括了进去,分辨率也从软拷贝用的低 分辨率到硬拷贝用的高分辨率的较宽范围。
于是,
N
Ew iPiw i1
hw
bw
hw
1 Ew
hw
Hw Ew
,
第5章 图像编码(第2讲)
数字图像处理学第5章图像编码(第二讲)5. 4 统计编码高效编码的主要方法是尽可能去除信源中的冗余成份,从而以最少的数码率传递最大的信息量。
冗余度存在于像素间的相关性及像素值出现概率的不均等性之中。
对于有记忆性信源来说首先要去除像素间的相关性,从而达到压缩数码率的目的。
对于无记忆性信源来说,像素间没有相关性,可以利用像素灰度值出现概率的不均等性,采用某种编码方法,也可以达到压缩数码率的目的。
这种根据像素灰度值出现概率的分布特性而进行的压缩编码叫统计编码。
5.4.1 编码效率与冗余度5.4.2几种常用的统计编码法5.4.1 编码效率与冗余度为了确定一个衡量编码方法优劣的准则,编码效率冗余度设某个无记忆信源共有M个消息,记作。
其中消息各自出现的概率分别为。
可把这个信源用下式表示{}u u u u M123,,,, {}p p p p M 123,,,, X u u u u p p p p M M =⎧⎨⎩⎫⎬⎭123123,,,,,,,, (5—22)根据该信源的消息集合,在字母集中选取符号进行编码。
一般情况下取二元字母集A {1, 0}。
通常,这一离散信源中的各个消息出现的概率并不相等。
根据信息论中熵的定义,可计算出该信源的熵如下式:A a a a a n {,,,}123ia i M i P P X H log 1∑=-=)((5—23)式中H (X )代表熵,P i 代表第i 个消息出现的概率。
例如,设一离散信源如下X u u u u =⎧⎨⎪⎩⎪⎫⎬⎪⎭⎪123412 14 18 18 由式(5—23)可算出该信源的熵H X p p i i i()log =-=∑142=----=1212141418181818742222log log log log 比特/消息设对应于每个消息的码字由N i 个符号组成。
也就是说每个消息所对应的码字长度各为N i 。
那么,每个消息的平均码长可用下式表示ii M i N P N ∑=-=1(5—24)式中代表平均码长,M为信源中包含的消息的个数,Pi 为第i个消息出现的概率,Ni为第i个消息对应的码长。
图形编码知识点总结
图形编码知识点总结一、概念图形编码是一种用来表示和传输图像信息的技术。
它是数字图像处理技术的一部分,用来把图像信息转换成数字信号,以便能够存储和传输。
图形编码技术是基于数字信号处理的基础上,通过压缩技术和编码方式,将图像信息转化成数字信号并保存在计算机或其他数字媒体上。
二、图像编码的分类1、无损编码无损编码是指在保持图像质量不变的情况下,将图像数据进行压缩,并进行编码以便于传输和存储。
常见的无损编码算法有无损压缩算法、赫夫曼编码和算术编码等。
无损编码的优点是能够保持图像质量不变,但缺点是无损编码算法产生的文件体积大,传输和存储成本高。
2、有损编码有损编码是指在一定情况下,将图像数据进行压缩并编码,在达到一定压缩比的同时,牺牲一定图像质量的编码方式。
有损编码通过舍弃图像数据中的一些细节信息,将图像数据压缩至较小的存储空间。
有损编码的优点是可以取得较大的压缩比,降低存储和传输成本,但缺点是会对图像质量造成一定程度的影响。
三、图像编码的基本原理1、信号采样信号采样是图像编码的第一步,它是将连续的图像信号转化为离散的数据点。
通过对图像进行采样,可以获得图像在空间和时间上的离散表示。
2、量化量化是将采样得到的离散数据映射为有限数量的离散数值。
量化的目标是将连续的图像信号转化为离散的数字信号集合,以方便图像编码和传输。
3、编码编码是将量化后的离散数据进行数字化处理,通过一定的编码方式将图像数据压缩并进行编码以便传输和存储。
编码方式常见有熵编码、差分编码、矢量量化和小波变换等。
四、常见的图像编码技术1、JPEGJPEG是一种常见的有损图像压缩标准,它采用的是DCT变换和量化技术,能够取得较大的压缩比。
JPEG压缩技术在图像编码中应用广泛,被用于数字摄影、网络传输和数字视频等领域。
2、PNGPNG是一种无损图像压缩标准,它将图像数据进行无损压缩和编码,以便于图像的存储和传输。
PNG压缩技术在需要无损图像保真度的场合得到广泛应用。
图像编码
一部90分钟的彩色电影,每秒放映24帧。把它 数字化,每帧512x512象素,每象素的R、G、B 三分量分别占8 bit,总比特数为 90x60x24x3x512x512x8bit=97,200M
若一张CD光盘可存600兆字节数据,这部电影光 图象(还有声音)就需要160张CD光盘用来存储。
信源:指能够产生信息的事物。 在数学上信源是一概率场 ,若信源 X 可 能产生的信息是 x1 , x2 ,, xn 这些信息出现 的概率分别是 p1 , p2 ,, pn 则该信源可表 示为 :
x1 , x2 , , xn p1 , p 2 ,, p n
信息量: 设 si 为信源中的一个符号,则信息量 为: I (s ) = I [ p(s )] = log Ps
编码效率:
H ( s) = L log 2 n
n 为符号集中符号种类个数
若只包含 0,1 ,则 n=2
H ( s) = L
原始图象冗余度定义为:
r = 1
冗余度接近于0,或编码效率接近于1的编码 称为高效码。
例: 信源 信源熵为
x1 , x 2 , x3 , x 4 X = 1 , 1 , 1 , 1 2 4 8 8
f 2 max
ˆ [ f ( x, y ) f ( x, y )]2
]
2、主观保真度准则:
用主观的方法来测量图象的质量——
采用一组观察者对图像进行评价,并综合得 到统计的质量评价结果。 应用不方便
无失真编码定理
图象数据压缩的目的是在满足一定图象质量 条件下,用尽可能少的比特数来表示原始图象 ,以提高图象传输的效率和减少图象存储的容 量,在信息论中称为信源编码。 信源编码可分为两大类,一类是无失真编码 ,另一类是有失真编码或称限失真编码。
数字图像处理-图像编码PPT课件
.
11
2. 信息量和信息熵
数据压缩技术的理论基础是信息论。 从信息论的角度来看,压缩就是去掉信息 中的冗余,即保留不确定的信息,去掉确定的 信息(可推知的)。
.
12
信息论中信源编码理论解决的主要问题: (1)数据压缩的理论极限 (2)数据压缩的基本途径
.
8
图像保真度
保真度标准——评价压缩算法的标准
客观保真度标准:图像压缩过程对图像信息的 损失能够表示为原始图像与压缩并解压缩后图 像的函数。
一般表示为输出和输入之差:
两个图像之间的总误差:
均方根误差:
主观保真度标准:通过视觉比较两个图像,给出一 个定性的评价,如很粗、粗、稍粗、相同、稍好、 较好、很好等,可以对所有人的感觉评分计算平均 感觉分来衡量
若按每像素3个字节计算,上述结果为约?M
举例2:目前的WWW互联网包含大量的图像信 息,如果图像信息的数据量太大,会使本来就 已经非常紧张的网络带宽变得更加不堪重负 (World Wide Web变成了World Wide Wait)
.
2
视频数据量:
对于电视画面的分辨率640*480的彩色图像, 每秒30帧,则一秒钟的数据量为:?
例:原图像数据:234 223 231 238 235
压缩后数据:234 11 -8 -7 3,我们可以对 一些接近于零的像素不进行存储,从而减小了 数据量
.
7
视觉冗余
人眼不能感知或不敏感的那部分图像信息, 人类视觉系统对图像的敏感度是非均匀的。 但是,在记录原始的图像数据时,通常假定视觉
系统是近似线性的和均匀的,对视觉敏感和不敏 感的部分同等对待,从而产生视觉冗余。
第5章图像编码
5.2.1 客观保真度准则
当图像编解码所损失的信息量可以用编码输 入图像与解码输出图像的某个确定的函数表示时, 一般说它基于客观保真度准则。通常使用的客观 保真度准则有输入图像和输出图像的 均方误差(MSE); 均方根误差; 峰值信噪比(PSNR: Peak Signal Noice Ratio)
e(x, y) g(x, y) f (x, y)
(5-1)
22 2019/6/11
而包含 MxN 像素的图像之均方误差为
M 1N 1
e2 1 MN
e2(x, y)
x0 y0
M 1N 1
1 MN
[g( x, y) f ( x, y)]2
x0 y0
由式(5-2)可得到均方根误差为
8 2019/6/11
• 第二代编码方法多是20世纪80年代以后提出的新的编 码方法,如金字塔编码法、Fractal编码、基于神经元 网络的编码方法、小波变换编码法、模型基编码法等。 现代编码法的特点是: ①充分考虑人的视觉特性; ②恰当地考虑对图像信号的分解与表述; ③采用图像的合成与识别方案压缩数据率。
从光度特征出发可分为单色图像、彩色图像和 多光谱图像编码。
从灰度层次上分可以分为二值图像和多灰度图 像编码。
15 2019/6/11
按照信号处理形式可分为模拟图像编码和数字图像编码。 从处理维数出发可以分成行内编码、帧内编码和帧间编
码。 从信源编码的角度来分类,图像编码大致可分为匹配编
L-1 为图像彩色分量取值的峰值,通常对于8 bit 精
度彩色分量的图像,L=256。
24
2019/6/11
---------------- Average data all frames -----------
图像编码的原理与流程详解
图像编码是一种将图像数据转换为更紧凑表示的过程,它在数字图像处理和传输中起着至关重要的作用。
本文将详细解析图像编码的原理和流程,从数据压缩到图像还原,逐步揭示其工作机制。
一、图像编码的基本原理图像编码的基本原理是基于人眼的视觉特性和图像的空间相关性。
人眼对图像的敏感度不均匀,对细节和变化较大的区域更敏感。
因此,图像编码可以通过降低对细节和变化较小的区域的精度来实现压缩。
此外,图像中的相邻像素之间存在一定的相关性,这种相关性可以通过差分编码来利用。
二、图像编码的流程图像编码一般包括以下几个主要的步骤:预处理、变换、量化、编码和解码。
1. 预处理预处理是对原始图像进行一些基本操作,以准备好数据进行后续处理。
常见的预处理操作包括图像去噪、颜色空间转换和亮度调整等。
2. 变换变换是将图像从空间域转换到频域的过程。
常用的变换方法包括离散余弦变换(DCT)和小波变换。
变换的目的是将图像的能量集中在少数重要的频率成分上,减小冗余信息。
3. 量化量化是将变换后的频域系数映射到有限数量的离散级别,以减小数据表示的精度。
量化通常使用固定或自适应的量化表,对不同频率的系数施加不同的量化步长。
4. 编码编码是将量化后的系数进行压缩表示的过程。
常用的编码方法有霍夫曼编码、算术编码和熵编码等。
这些编码方法利用了频率统计和冗余信息的特性,实现了高效的数据压缩。
5. 解码解码是编码的逆过程,将压缩表示的图像数据恢复为原始的图像信息。
解码过程包括解码器的反量化和反变换操作,以及任何必要的后处理步骤。
三、图像编码的应用和发展图像编码技术在图像和视频传输、存储和处理中得到了广泛的应用。
随着网络宽带的提升和存储设备的发展,人们对图像质量和数据压缩比的要求越来越高,图像编码技术也在不断进步。
目前,主流的图像编码标准有JPEG、JPEG 2000和HEVC等。
JPEG 是最常用的静态图像编码标准,它利用了DCT、量化和霍夫曼编码等技术,实现了相对较高的压缩比。
第5章 图像编码(第4讲)
数字图像处理学第5章图像编码(第四讲)5. 6 变换编码图像编码中另一类有效的方法是变换编码。
变换编)映射变换量化器编码器变换编码主要由映射变换、量化及编码几部分操作组成。
映射变换是把图像中的各个像素从一种空间变换到另一种空间,然后针对变换后的信号再进行量化与编码操作。
在接收端,首先对接收到的信号进行译码,然后再进行反变换以恢复原图像。
映射变换的关键在于能够产生一系列更加有效的系数,对这些系数进行编码所需的总比特数比对原始图像进行编码所需要的总比特数要少得多,因此,使数据率得以压缩。
映射变换的方法很多。
图像变换编码基本可分为两大类,某些特殊的映射变换编码法,函数变换编码法。
5.6.1 几种特殊的映射变换编码法特殊映射变换编码法包括诸如行程编码,轮廓编码等一些变换编码方法。
它们特别适用于所谓二值图像的编码。
这类图像包括业务信件、公文、气象图、工程图、地图、指纹卡片及新闻报纸等。
当然在编码技术上同样可分为精确编码和近似编码两类。
•精确编码可以不引入任何畸变,在接收端可以从编码比特流中精确恢复出原始图像。
近似编码会引入一些畸变,但是,这种方法却可以在保证可用性的前提下获得较高的压缩比。
下面通过几种具体的编码方法说明这种变换编码法的基本概念。
1、一维行程编码一维行程编码的概念如图5—42所示。
假如沿着某一扫描行的像素为,它们所具有的灰度值可能为。
在编码之前,可以首先把这些像素映射为成对序列,和。
N x x x x , , , ,321 4321 ,g ,g ,g g ),),,(2211l (g l g ),(33l g ),44l (g其中表示某一灰度值,表示第i 次运行的行程。
也可以说是连续取值为灰度值的像素的个数。
经过这样映射变换后就可以对编码,而不必对像素直接编码。
i l g i ),i i l (g g i由于有些图像如前面提到的二值图像,连续取同一灰度级的像素很多,对映射后的序列进行编码会大大压缩比特率。
图像编码-霍夫曼编码
1
图像编码概述
数据 冗余 的类 别
(1)空间冗余 (2)视觉冗余
(3)编码冗余
数据冗余
同一景物表面上各采样点的颜色之间存在着空间 连贯性,但是基于离散像素采样来表示物体颜色的方 式通常没有利用景物表面颜色的这种空间连贯性。
1
图像编码概述
数据 冗余 的类 别
(1)空间冗余 (2)视觉冗余
(3)编码冗余
图像编码-霍夫曼编码
目录 CONT
概
述
1
压
缩
编
码
方
法
2
霍
夫
曼
编
码
3
霍夫曼编码特点 4
霍夫曼编码应用 5
1
图像编码概述
图像编码背景
与文本信息不同,图像信息占据大量的储存容量,而且传输的带宽有限。然而图像压缩与编 码的目的就是对图像数据按一定的规则进行变换与组合,从而达到以尽可能少的代码(符号)表示 尽可能多的图像信息。
(3)编码冗余
数据冗余 利用图像的灰度级直方图来深入了解编码结构,从而减 少表达图像所需要的数据量。
k=0,1,2,...L-1
n 说明:L是灰度级数,nk是第k个灰k度级在图像中出现的 P ( r ) 次数,n是图k像中的像k素总数。随机变量rk∈[0,1]表示 n 图像的灰度级。
2
图像压缩编码的方法
例题
设有一幅简单的4*4的图像, f= 119 123
123
119
16
119
119
10
107
107
11
其数字符号对应出现的概率
P= 0.1875 0.5 0.125 0 0 0 0 0.1875,用霍夫曼编码对其进行数据压缩。
图像编码常用方法介绍(四)
图像编码是一种将图像数据以最小的存储空间来表示和传输的技术。
在数字图像处理中,图像编码是一个重要的研究领域,它的主要目标是提高图像的压缩比和图像质量。
本文将介绍几种常用的图像编码方法。
1. 无损编码无损编码是一种能够完全恢复原始图像数据的编码方法。
它能够准确地保存图像中的所有细节,并且不会引入任何失真。
无损编码方法有很多,其中最常用的是RLE(Run Length Encoding)和Huffman编码。
RLE编码是一种基于重复像素的编码方法。
它将连续重复的像素值用一个数字来代替,并记录连续重复的次数。
这种编码方法特别适合处理大面积颜色相同的区域。
Huffman编码则是一种根据像素出现的频率来编码的方法。
频率越高的像素用较短的码字来表示,频率越低的像素则用较长的码字来表示。
2. 有损编码有损编码是一种在压缩图像时会引入一定的失真的编码方法。
它通过牺牲一部分图像细节来获得更高的压缩比。
有损编码方法有很多,其中最常见的是JPEG(Joint Photographic Experts Group)和MPEG (Moving Pictures Experts Group)。
JPEG是一种广泛应用于静态图像压缩的编码方法。
它利用了图像中的冗余和人眼对图像的感知特性,将图像分为若干8×8的小块,对每个小块进行离散余弦变换(DCT),再利用量化和熵编码来压缩数据。
JPEG编码在保持图像质量的同时,能够获得较高的压缩比,所以广泛应用于图像传输和存储。
MPEG是一种主要用于视频压缩的编码方法。
它将视频分解为一系列的帧,然后对每一帧进行压缩。
MPEG编码主要利用了图像序列帧间的冗余性和时间域的相关性。
通过在关键帧(I帧)中存储全部信息,而在非关键帧(P帧和B帧)中只存储和参考关键帧之间的差异,MPEG 能够获得很高的压缩比和好的视觉质量。
3. 神经网络编码随着深度学习的快速发展,神经网络编码在图像编码中也得到了广泛应用。
图像编码.
图像编码——图像处理第G 组LZW编码:LZW编码对信源输出的不同的长度的符号序列分解固定的长度的码字,且不需要有关符号出现的概率的知识。
LZW编码方法是一种字典方法,在编码的开始阶段要构造一个对信源符号进行编码的码本(字典)。
方法:对于一个固定灰度的图像,开始时字典储存图像所要表示的灰度范围。
比如8比特灰度,那么字典初始化就有0-255灰度条目。
对于编码后的字典条目,直接在后面添加。
在编码时,当前识别序列和字典条目,我们采取了数组的储存方式,但也尝试过采取使用MATLAB中的元胞类型,但编码的效率很低速度很慢。
这是由于在查找字典匹配序列时,使用元胞类型时在电脑的运行内部要经常进行指针的大范围的跳转,查找效率很低。
采用了数组储存后指针指在小范围内移动效率得到明显的提高。
编码的规则很简单。
对图像从行列进行像素扫描,对于第一个像素不进行输出,只当作下一次的当前识别序列。
而对其它的有当前事变序列连接上当前处理的像素值组成一个序列,如果该序列能在字典里找到对应的序列,那么该序列作为下一个的当前序列其它什么也不做。
如果不能找到,则编码输出当前识别序列的字典中的索引值。
这样一直到最后,把最后一个当前的识别序列的字典的索引值直接作为编码接在编码输出序列后面。
对于解码来说,也采用上面的数组的储存结构。
我们只要以编码值在对应建立的字典中去找到对应的字典条目输出就可以的。
但这里存在着一个问题,对一些连续的出现相同的像素的编码值,在解码时不能在字典里面找到字典条目。
难点:正确的解码。
解决方法:对于不能在字典中找到的条目,采用条件判断,之后取前面的识别序列连接上识别序列的第一个像素值作为像素序列的输出和字典输出,当结束后再把当前处理的编码值赋给识别序列。
一切就很正常的进行了由于LZW编码,在编码时运算量特别大,所以编码的效率很低。
主要有几个原因:1、对算有像素都要进行一次扫描2、对于很少出现相似的像素,字典会非常大3、每一次都要去查找一下字典改进方法:1、选取图像像素的最大值(如果少于255,那么可以减少字典大小,同时减少一些计算量)2、采用向后查找方式3、对于字典储存方式上的数组改进方式。
第5章1 图像编码
图像数据的冗余
一般来说,图像数据中存在以下几种冗余:
空间冗余:图像内部相邻像素之间存在较强的相关性所造 成的冗余。 时间冗余:视频图像序列中的不同帧之间的相关性所造成 的冗余。 结构冗余:是指图像中存在很强的纹理结构或自相似性。 信息熵(编码)冗余: 视觉冗余:是指人眼不能感知或不敏感的那部分图像信息。
*
25
第五章 图像编码 5.1.4 图像压缩编码的系统评价
在图像编码中,编码质量是一个非常重要的概念,怎样以尽可
能少的比特数来存储或传输一幅图像,同时又让接收者感到满意,
这是图像编码的目标。 对于图像编码的质量评价主要体现在基于压缩编码参数的评 价、基于保真度(逼真度)准则的评价、算法的适用范围、算法的 复杂度等四个方面。
表 几种常见应用的码率
*
14
第五章 图像编码
视觉冗余度 :允许图象编码有一定的失真也是图象可以压缩的 一个重要原因,只要这些失真并不被人眼所察觉,在许多情况 下是完全可以接受的,这就给压缩比的提高提供了十分有利的 条件, 在多数应用中,人眼往往是图象信息的最终接收者,如果能 充分利用人眼的视觉特性,就可以在保证所要求的图象主观 质量的前提下实现较高的压缩比,这就是利用了视觉冗余度, 其实人类的视觉系统(HVS)是缺陷的,对某些失真不敏感, 难以觉察, 一个图象编码方法如果能充分利用这些特性,就可取得较好 的效果,即在复原图象主观质量较好的前提下得到较高的压 缩比。
5
*
第五章 图像编码
数据冗余:
设:n1和n2是指原始图像和编码后图像每个像素的 平均比特数 压缩率(压缩比)——用于描述图像压缩效果
CR = n1 / n2 其中,n1是压缩前的数据量,n2是压缩后的数据量
数字图像处理 第5章 图像编码技术(课堂PPT)
47
5.8 变换编码
48
5.8 变换编码
• (3) 量化 阈值编码
随子图象不同而保留不同位置变换系数 (1)对所有子图象用一个全局阈值 (2)对各个子图象分别用不同的阈值 (3)根据子图象中各系数的位置选取阈值
10
5.1 数据冗余和压缩
11
5.2 图象保真度
• 图象保真度
信息保存型 信息损失型 描述解码图象相对于原始图象的偏离程 主观保真度准则
主观测量图象的质量 应用不方便
• 客观保真度准则
用编码输入图与解码输出图的某个确定函数表示损失 的信息量
便于计算或测量
44
5.8 变换编码
• 变换编码
(1)构造子图象 子图象尺寸影响
(2)变换 变换的选择
(3)量化 分区编码 阈值编码
(4)符号编码
45
5.8 变换编码
46
5.8 变换编码
• 变换编码
• (2)变换
变换的选择
压缩并不是在变长步骤取得的 是在量化变换的系数时取得的
变换将图象能量或信息集中于某些系数
20
5.4 哈夫曼编码
21
5.4 哈夫曼编码
22
5.4 哈夫曼编码
23
5.4 哈夫曼编码
• 哈夫曼码改型
亚最优 牺牲编码效率来换取编码速度
• 截断哈夫曼码
只一部分用哈夫曼编码
• 平移哈夫曼码
分组有哈夫曼编码
24
5.4 哈夫曼编码
25
5.4 哈夫曼编码
26
5.4 哈夫曼编码
27
5.4 哈夫曼编码
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字图像处理学第5章图像编码(第四讲)5. 6 变换编码图像编码中另一类有效的方法是变换编码。
变换编)映射变换量化器编码器变换编码主要由映射变换、量化及编码几部分操作组成。
映射变换是把图像中的各个像素从一种空间变换到另一种空间,然后针对变换后的信号再进行量化与编码操作。
在接收端,首先对接收到的信号进行译码,然后再进行反变换以恢复原图像。
映射变换的关键在于能够产生一系列更加有效的系数,对这些系数进行编码所需的总比特数比对原始图像进行编码所需要的总比特数要少得多,因此,使数据率得以压缩。
映射变换的方法很多。
图像变换编码基本可分为两大类,某些特殊的映射变换编码法,函数变换编码法。
5.6.1 几种特殊的映射变换编码法特殊映射变换编码法包括诸如行程编码,轮廓编码等一些变换编码方法。
它们特别适用于所谓二值图像的编码。
这类图像包括业务信件、公文、气象图、工程图、地图、指纹卡片及新闻报纸等。
当然在编码技术上同样可分为精确编码和近似编码两类。
•精确编码可以不引入任何畸变,在接收端可以从编码比特流中精确恢复出原始图像。
近似编码会引入一些畸变,但是,这种方法却可以在保证可用性的前提下获得较高的压缩比。
下面通过几种具体的编码方法说明这种变换编码法的基本概念。
1、一维行程编码一维行程编码的概念如图5—42所示。
假如沿着某一扫描行的像素为,它们所具有的灰度值可能为。
在编码之前,可以首先把这些像素映射为成对序列,和。
N x x x x , , , ,321 4321 ,g ,g ,g g ),),,(2211l (g l g ),(33l g ),44l (g其中表示某一灰度值,表示第i 次运行的行程。
也可以说是连续取值为灰度值的像素的个数。
经过这样映射变换后就可以对编码,而不必对像素直接编码。
i l g i ),i i l (g g i由于有些图像如前面提到的二值图像,连续取同一灰度级的像素很多,对映射后的序列进行编码会大大压缩比特率。
图5—42所示的例子可映射成表5—14所示的序列对。
在这个例子中有8级灰度,24个像素。
如果对编码,总的比特数至少要24×3=72bit 。
x i如果对表5—14的序列对编码,灰度值用3位码,行程长度用4位码,每对参数用7位码,共4对,总比特数只要28bit就够了。
可见压缩率是很可观的。
表5—14 序列对i g i l i1 3 625 1034 248 6行程编码可分为行程终点编码和行程长度编码。
如果行程终点的位置由扫描行的开始点算起,并且由到达行程终点的像素计数来确定,就称为行程终点编码。
如果行程终点位置由这一终点与前一终点的相对距离确定,就称为行程长度编码。
对于二值图像来说采用行程长度编码,甚至不需要传送灰度信息。
假定某一扫描线含有3个白色像素,其后是2个黑色像素,接着又是10个白色像素。
这样,在行程长度编码中,只传送行程长度3、2和10就可以了。
每个行程长度告诉沿扫描线的下一个边界点的相对位置。
6.1.2 二维行程编码二维行程编码也叫预测微分量化器(Predictive Differential Quantizer),简称PDQ。
其基本算法如图5—43所示。
PDQ的基本算法是将图像元素阵列变换为整数对△′和△″的序列。
这里△′是相邻扫描行上行程的开始点之间的差。
图中△′是A点和B点的差。
△″是这相邻行行程的差。
对应于A起始点的行程为l1,对应于B起点的行程为l2,因此,△″=l2—l1。
△′是相邻扫描行上行程的开始点之间的差△″是这相邻行行程的差“开始”“消失”•另外,对于图中的暗面积还要有一个“开始”和“消失”的标记。
这样就把一幅图像的像素阵列按相继扫描行变换为△′、△″、开始、消失四个参量的序列,然后便可对这四个参量来编码。
PDQ法利用了扫描线间的相关性,因此,它有更大的压缩潜力。
另外一种方法叫做双重增量编码(Double Delta coding ),简称DDC 。
它是对△′和进行编码而不是对△′和△″编码。
是前一扫描行的暗区后边界与相继扫描行暗区后边界的差。
实验证明,这种方法的压缩比较PDQ 法更大。
∆'''∆'''△′是相邻扫描行上行程的开始点之间的差△///是前一扫描行的暗区后边界与相继扫描行暗区后边界的差“开始”“消失”当在图像中有少数大的暗区时二维行程编码更有效,对于有许多小暗区的图像来说,一维行程编码更有效。
6.2 正交变换编码变换编码中另一类方法是正交变换编码法(或称函数变换编码法)。
这种方法的基本原理是通过正交函数变换把图像从空间域转换为能量比较集中的变换域。
然后对变换系数进行编码,从而达到缩减比特率的目的。
6.2.1 正交变换编码的基本概念正交变换编码的基本原理框图如图5—50所示。
编码器由预处理、正交变换、量化与编码几部分组成,译码器由译码、反变换及后处理组成。
在编码操作中,模拟图像信号首先送入预处理器,将模拟信号变为数字信号。
然后把数字信号分块进行正交变换,通过正交变换就使空间域信号变换到变换域。
然后对变换系数进行量化和编码。
在信道中传输或在存储器中存储的是这些变换系数的码字。
这就是编码端的处理过程。
在译码端,首先将收到的码字进行译码,然后进行反变换以使变换系数恢复为空间域样值,最后经过处理使数字信号变为模拟信号以供显示。
预处理正交变换量化编码传输、存储后处理解码反变换图5—50 正交变换编码原理框图正交变换编码之所以能够压缩数据率,主要是它有如下一些性质:(1)正交变换具有熵保持性质。
这说明通过正交变换并不丢失信息,因此,可以用传输变换系数来达到传送信息的目的。
(2)正交变换有能量保持性质。
这就是第三章提到的各种正交变换的帕斯维尔能量保持性质。
它的意义在于:只有当有限离散空间域能量全部转移到某个有限离散变换域后,有限个空间取样才能完全由有限个变换系数对于基础矢量加权来恢复。
(3)能量重新分配与集中。
这个性质使我们有可能采用熵压缩法来压缩数据。
也就是在质量允许的情况下,可舍弃一些能量较小的系数,或者对能量大的谱点分配较多的比特,对能量较小的谱点分配较少的比特,从而使数据率有较大的压缩。
(4)去相关特性。
正交变换可以使高度相关的空间样值变为相关性很弱的变换系数。
换句话说,正交变换有可能使相关的空间域转变为不相关的变换域。
这样就使存在于相关性之中的多余度得以去除。
综上所述,由于正交变换的结果,相关图像的空间域可能变为能量保持、集中且为不相关的变换域。
如果用变换系数来代替空间样值编码传送时,只需对变换系数中能量比较集中的部分加以编码,这样就能使数字图像传输或存贮时所需的码率得到压缩。
6.2.2 变换编码的数学模型分析正交变换编码的编码过程主要是在变换域上进行。
在这个基础上可以建立以下变换编码的数学模型。
设一图像信源为一向量]['X [][]1210,,-='N X X X X X (5—95)变换后输出一向量[]'Y[][][]Y T X = (5—97)[][] ,, , ,1210-='N Y Y Y Y Y (5—96)取正交变换为[T],那么[X]与[Y]之间的关系为由于[T]是正交矩阵,所以[][][][][]T T I T T -1'==(5—98)这里[I]为单位矩阵,是[T]的转置,是[T]的逆。
反之也有[]'T []T -1[][][]Y T X '=(5—99)也就是说在编码端利用正变换得到[Y],在译码端可用反变换来恢复[X]。
(5—100)[][]][][ ,, , ,][0012100Y T X Y Y Y Y Y M '=='- 0][Y 如果在传输或存贮中只保留M 个分量,M<N ,则可由[Y]的近似值来恢复[X]。
当然是[X ]的近似值。
但是只要选取得当,仍可保证失真在允许的范围内。
][0X 显然,关键问题在于选取什么样的正交变换[T],才能既得到最大的压缩率,又不造成严重的失真。
因此,有必要研究一下由正交变换得到[Y]的统计特性。
[Y]的统计特性中最为重要的是协方差矩阵。
下面讨论一下正交变换后得到的[Y]的协方差矩阵采用何种形式。
当然,[X ]的统计特性可以测得。
[][] ,, , ,1210-=N X X X X X (5—101)设图像信号是N维向量[X ]的协方差矩阵[]()()⎭⎬⎫⎩⎨⎧'--=][][][][X X X X E C X 式中[C X ] 是[X ]的协方差矩阵,是[X]的均值,E 是求数学期望值。
[]X (5—102)又设变换系数向量为[][] ,, , ,1210-='N Y Y Y Y Y (5—103)[C Y ]为[Y ]的协方差矩阵,所以[]()()⎭⎬⎫⎩⎨⎧'--=][][][][Y Y Y Y E C Y (5—104)式中是[Y ]的均值。
][Y由正交变换的定义,有][][][]][[][Y T X X T Y '==因此]][][[ ]}[)][]])([[]{([][ }][)][]])([[]]([{[ })]][[]][])([][[]][{[ })][]])([[]{([]['=''--=''--='--='--=T C T T X X X X E T T X X X X T E X T X T X T X T E Y Y Y Y E C X Y式(5—105)说明,变换系数的协方差矩阵可以通过空间域图像的协方差矩阵的二维变换得到。
由此可以得出结论:]][[ ][]['=T C T C X Y (5—105)即变换系数的协方差矩阵决定于变换矩阵[T]和空]。
间域图像的协方差矩阵[CX] 是图像本身所固有的,因此,关键在而[CX于寻求合适的[T]。
我们希望的两个结果:1) 、如果[C] 是一个对角形矩阵,那就说明系数Y间的相关性完全解除了。
也就是说解除了包含在相关性中的冗余度,为无失真压缩编码打下了基础。
2) 、还希望对角形矩阵中元素的能量尽量集中,以便使舍去若干系数后造成的误差不致于太大,这样,就为熵压缩编码提供了条件。
综上所述,变换编码要解决的关键问题是合理地寻求变换矩阵[T]。
3 . 最佳变换问题在研究各种变换矩阵[T]的过程中,自然要比较它们的优劣,因此,就有一个比较准则问题。
下面讨论最佳变换问题。
(1)最佳变换应满足的条件1).能使变换系数之间的相关性全部解除;2).能使变换系数之方差高度集中。
显然,第一个条件希望变换系数的协方差矩阵为对角形矩阵;第二个条件希望对角形矩阵中对角线上的元素能量主要集中在前M项上,这样就可以保证在去掉N-M 项后的截尾误差尽量小。