北京交通大学图像处理--第5章 图像编码(1)
(完整word版)图像编码基本方法
一、霍夫曼编码(Huffman Codes)最佳编码定理:在变长编码中,对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码,如果码字长度严格按照符号出现概率大小的相反的顺序排列,则平均码字长度一定小于按任何其他符号顺序排列方式的平均码字长度。
霍夫曼编码已被证明具有最优变长码性质,平均码长最短,接近熵值。
霍夫曼编码步骤:设信源X 有m 个符号(消息)⎭⎬⎫⎩⎨⎧=m m p x p p x x X ΛΛ2121,1. 1. 把信源X 中的消息按概率从大到小顺序排列,2. 2. 把最后两个出现概率最小的消息合并成一个消息,从而使信源的消息数减少,并同时再按信源符号(消息)出现的概率从大到小排列;3. 3. 重复上述2步骤,直到信源最后为⎭⎬⎫⎩⎨⎧=o o o o o p p x x X 2121为止;4. 4. 将被合并的消息分别赋予1和0,并对最后的两个消息也相应的赋予1和0;通过上述步骤就可构成最优变长码(Huffman Codes)。
例:110005.0010010.000015.01120.00125.01025.0654321x x x x x x P Xi 码字编码过程则平均码长、平均信息量、编码效率、冗余度为分别为:%2%9842.2)05.0log 05.01.0log 1.015.0log 15.02.0log 2.025.0log 25.02(45.205.041.0415.0320.0225.022===⨯+⨯+⨯+⨯+⨯⨯-==⨯+⨯+⨯+⨯+⨯⨯=Rd H N η二 预测编码(Predictive encoding )在各类编码方法中,预测编码是比较易于实现的,如微分(差分)脉冲编码调制(DPCM )方法。
在这种方法中,每一个象素灰度值,用先前扫描过的象素灰度值去减,求出他们的差值,此差值称为预测误差,预测误差被量化和编码与传送。
接收端再将此差值与预测值相加,重建原始图像象素信号。
数字图象处理-第5章图像编码
由量化带来的噪声 量化噪声 过载噪声
5.4.3 编码器、译码器
编码器的任务是把一个多值的数字量用多比特的二进制来表示 译码器是把每一位的码字转换为实际灰度值
(a)
(b)
(c)
(d)
(e)
(f)
图 5—4 编码位数对画面质量的影响
5.3.4 非线性PCM 编码 在线性PCM编码中,量化阶是均匀的 非线性PCM编码的量化阶不均匀
u5 0.10 u6 0.05
0.55 0
0 0.15
1
0.30 0.25 0.25 0.20 0
1
0.45 0.30 0 0.25 1 0
1
0.45 1
图5—17 信源X的 霍夫曼编码图
5.5.4 仙农-费诺码
仙农-费诺码的编码程序可由下述几个步骤来完成:
第一步:设信源X有非递增的概率分布
X
up11
编氏法 应
码取
法
法样
编
码
法
标 自 标自 行 轮
准 适 准适 程 廓
法 应 法应 编 编
法
法码 码
5. 2 图像编码中的保真度准则 客观保真度准则 主观保真度准则
5. 3 PCM编码
5.3.1 PCM 编码的基本原理 脉冲编码调制(Pulse coding Modulation—PCM )是将模拟图像 信号变为数字信号的基本手段
集合中的字母数。
显然,如果 100% ,就说明还有冗余度。因此,冗
余度如下式表示:
Rd
1
N log 2 n H ( X ) N log 2 n
(5—27)
例: 一个信源X和一个字母集合A如下
X
数字图像处理~图像编码
Eb = -log2(0.3) = 1.737
Ec = -log2(0.2) = 2.322
总信息量也即表达整个字符串需要的位数为:
E = Ea * 5 + Eb * 3 + Ec * 2 = 14.855 位
举例说明:
如果用二进制等长编码,需要多少位?
数据压缩技术的理论基础是信息论。
2.信息量和信息熵
A
B
数据压缩的基本途径
数据压缩的理论极限
信息论中信源编码理论解决的主要问题:
信息量等于数据量与冗余量之差
I = D - du
数据是用来记录和传送信息的,或者说数据
是信息的载体。
数据所携带的信息。
信息量与数据量的关系:
du—冗余量
I— 信息量
D— 数据量
叁
实时传输:在10M带宽网上实时传输的话,需要压缩到原来数据量的?
肆
存储: 1张CD可存640M,如果不进行压缩,1张CD则仅可以存放?秒的数据
伍
可见,单纯依靠增加存储器容量和改善信道带宽无法满足需求,必须进行压缩
1 图像编码概述
数字化后的图像信息数据量非常大,图像压缩利用图像数据存在冗余信息,去掉这些冗余信息后可以有效压缩图像。
01.
02.
03.
04.
问题:
把某地区天气预报的内容看作一个信源,它有6种可能的天气:晴天(概率为0.30)、阴天(概率为0.20)、多云(概率为0.15)、雨天(概率为0.13)、大雾(概率为0.12)和下雪(概率为0.10),如何用霍夫曼编码对其进行编码?平均码长分别是多少?
哈夫曼编码
30
10
914775-数字图像处理-图像压缩编码第五讲正交变换编码
M x
1 L
L l 1
Xl
国家级精品资源共享课
(5-11)
➢ Mx协方差矩阵可以由
Mx
E{( X
M x )( X
M x )T }
1 L
L l 1
Xl
XlT
MlMlT
(5-12)
来估计。协方差矩阵是实对称的。对角元素
最佳变换的核心在于经变换后能使 Y 为对角阵。 若采用某种变换矩阵A,变换后的 Y 接近于对角阵, 则这种变换称为准最佳变换。
国家级精品资源共享课
K-L变换 是能满足均方误差准则下最佳变换。 K-L变换与图像数据有关,运算复杂,没有快速算 法,因此K-L变换在使用性受到了很大的限制。 傅立叶变换、沃尔什变换、离散余弦变换, 是常用 的准最佳变换。
国家级精品资源共享课
根据式(5-10)得:
Y E[( AX AX )(AX AX )T ] AE[( X X )( X X )T ]AT
AX AT
可见,Y的协方差 Y 可由 X 作二维正交变换得到。 X 是图像固有的,因此关键是要选择合适的A,使 变换系数Y之间有更小的相关性。另外去掉了一些
国家级精品资源共享课
解码部分由与编码部分相反排列的一系列逆操作模 块构成。由于量化是不可逆的,所以解码部分没有 对应的模块。
国家级精品资源共享课
5.5.2 正交变换的性质
正交变换具有如下的性质: (1) 正交变换是熵保持的,说明正交变换前后不丢失
信息。因此用图像各像素灰度存储或传送和用变 换系数去存储或传输一样。 (2) 正交变换熵能量保持的。 (3) 正交变换重新分配能量。常用的正交变换,如傅 立叶变换,能力集中于低频区,在低频区变换系 数能量大而高频区系数能力小得多。这样可用
图像编码(一)
si1 , si 2 ,, si m
p( si1 , si 2 ,, si m , si ) log 2 p(
i1 1 i2 1 im 1 i 1
si1 , si 2 ,, si m
在多数情况下,只是相邻的少数符号间 的相关性比较大,因此,可以用阶数较低 的Markov过程作为信源近似的数学模型。 特别是对零阶Markov信源(即独立信源) 只要考虑q个可能输入值s1, s2,…, sq出现的 概率p(si), 可定义一级熵:
方法: i. 将信源符号按出现概率从大到小排成一 列,然后把最末两个符号的概率相加, 合成一个概率。
ii. 把这个符号的概率与其余符号的概率按 从大到小排列,然后再把最末两个符号 的概率加起来,合成一个概率。 iii. 重复上述做法,直到最后剩下两个概率 为止。 iv. 从最后一步剩下的两个概率开始逐步向 前进行编码。每步只需对两个分支各赋 予一个二进制码,如对概率大的赋予码 元0,对概率小的赋予码元1。
图象压缩与编码
90x60x24x3x512x512x8bit=97,200M。 如一张CD光盘可存600兆字节数据,这 部电影光图象(还有声音)就需要160张 CD光盘用来存储。
对图象数据进行压缩显得非常必要。 本章讨论的问题:在满足一定条件下, 能否减小图象bit数,以及用什么样的编码 方法使之减少。
输入 输入概率第一步第二步第三步第四步 0.4 0.4 0.4 0.4 0.6 S1 0.3 0.3 0.3 0.3 0.4 S2 0.1 0.1 0.2 0.3 S3 0.1 0.1 0.1 S4 0.06 0.1 S5 0.04 S6
图象压缩与编码
2.原始图象越有规则,各象素之间 的相关性越强,它可能压缩的数据就 越多。 值得指出的是:当前采用的编码方 法得到的结果,离可能压缩的极限还 相差很远,这说明图象数据压缩的潜 力是很大的,直到目前为止,它还是 个正在继续研究的领域。
第 05 章 图像分割——数字图像处理及应用北航谢凤英课件PPT
灰度
目标
边界
背景
梯度
c 多波段:
R、G、B可分别组成R-B, G-B, R-B两维直方图, 图上强的地方反映一个区。
5.2 边缘检测
1 边缘检测原理 其导数在边缘方向取得极值
0
0
(a) 一幅纵向 0 边缘的图像
(b) 每行像素的 灰度剖面图
(c) 一阶导数 (d) 二阶导数
从数学上看,图像的模糊相当于图像被平均或积分,为实现图象的 锐化,必需用它的反运算“微分”--加强高频分量作用,使轮廓清晰。
图像分割:将图像中有意义的特征或需要应用的特征提 取出来。
(简单而又难于实现的最基础的识别工作。人的视觉系统对图像分 割是十分复杂的,也是相当有效的。但分割原理和模型都未搞清 楚。)
第五章 图像的分割
5.1 阈值分割 5.2 边缘检测 5.3 区域分割 5.4 Hough变换 5.5 近邻法分割 5.6 基于动态聚类的分割 5.7 基于神经网络的分割 5.8 其它分割方法
2 (1,2 ) w0,1[w0 (0 0,1)2 w1(1 0,1)2 ]
w12[w1(1 1,2 )2 w2 (2 1,2 )2 ] w0,2[w0 (0 0,2 )2 w2 (2 0,2 )2 ]
概率统计的阈值选取法 如:目标占整幅图像面积百分比
3 影响因素 噪音、照度不均匀,结构特征等。
-1 -c -1 -1 1 -c c
1 c 1 -1 1
c1 1 -1
-1 -c
1c -1 1 -c -1
注意:边缘检测对噪声敏感,常在作边缘检测前对图
像进行某些预处理,如平滑处理等。
2 典型算子 f) 二阶微分算子--- laplace算子
2
1.2多媒体编码(图片编码)
1.2多媒体编码(图片编码)1.2 多媒体编码 (图片编码)1.2.1 图片编码概述图片编码是将图像数据转换为数字形式以便存储、传输或处理的过程。
图像编码的目标是尽可能减少图像数据的存储空间和传输带宽,同时保持图像质量。
1.2.2 图片编码算法1.2.2.1 无损压缩算法无损压缩算法是通过对图像数据进行编码和解码,以实现不丢失任何图像信息的方式进行压缩。
无损压缩算法常用的包括LZW、Huffman和Run-length等算法。
1.2.2.2 有损压缩算法有损压缩算法是通过对图像数据进行一定的近似处理,以降低存储空间和传输带宽需求的方式进行压缩。
有损压缩算法常用的包括JPEG、JPEG2000和GIF等算法。
1.2.3 JPEG压缩算法JPEG压缩算法是一种广泛使用的有损压缩算法,适用于几乎所有类型的图像。
JPEG压缩算法将图像分为8x8的小块,对每个小块进行离散余弦变换(DCT)并进行量化和编码,以达到压缩的效果。
1.2.3.1 JPEG编码过程1.2.3.1.1 块分割将图像划分为8x8的块。
1.2.3.1.2 离散余弦变换 (DCT)对每个块进行DCT变换。
1.2.3.1.3 量化根据量化表,对DCT系数进行量化。
1.2.3.1.4 编码将量化后的系数进行熵编码。
1.2.3.2 JPEG解码过程1.2.3.2.1 解码对熵编码的数据进行解码。
1.2.3.2.2 逆量化根据量化表,对解码后的系数进行逆量化。
1.2.3.2.3 逆离散余弦变换 (IDCT)对逆量化后的系数进行IDCT变换。
1.2.3.2.4 重构图像将解码后的块进行重组,得到重构的图像。
1.2.4 JPEG2000压缩算法JPEG2000是一种新一代的有损压缩算法,相对于JPEG,它具有更高的压缩效率和更好的图像质量。
JPEG2000压缩算法采用小波变换(Wavelet Transform)和基于位平面的编码技术。
1.2.4.1 JPEG2000编码过程1.2.4.1.1 小波变换对图像进行小波变换。
914775-数字图像处理-图像压缩编码第五讲正交变换编码
系数使得 Y 误差不大。 总之,选择合适的A和相应的A1,使变换系数Y之间 的相关性全部解除和使Y的方差高度集中,就称为
最佳变换。
国家级精品资源共享课
最佳变换A选择的准则: 若选择变换矩阵A,使 Y 为对角阵,那么变换系 数之间的相关性可完全解除。接着选择集中主要能 量的Y系数前M项,则得到的 Y 将引起小的误差, 使Y的截尾误差小。
国家级精品资源共享课
解码部分由与编码部分相反排列的一系列逆操作模 块构成。由于量化是不可逆的,所以解码部分没有 对应的模块。
国家级精品资源共享课
5.5.2 正交变换的性质
正交变换具有如下的性质: (1) 正交变换是熵保持的,说明正交变换前后不丢失
信息。因此用图像各像素灰度存储或传送和用变 换系数去存储或传输一样。 (2) 正交变换熵能量保持的。 (3) 正交变换重新分配能量。常用的正交变换,如傅 立叶变换,能力集中于低频区,在低频区变换系 数能量大而高频区系数能力小得多。这样可用
国家级精品资源共享课
5.5.3 变换编码的数学分析
设A为正交矩阵,则有
Y=AX
(5-10)
由于A为正交矩阵,有
AAT=AA-1=E
传输或存储利用变换得到的Y,在接收端,经逆变
换可恢复X
X=A-1 Y=ATY
若在允许失真的情况下,传输和存储只用Y的前
M(M<N)个分量,这样就得到Y的近似值:
国家级精品资源共享课
是个随机变量的方差,非对角元素是它们的
协方差。
• 定义一个线性变换T,它可由任何X向量产生一个新向量Y: Nhomakorabea•
Y T ( X M x ) (5-13)
• 式中,T的各行是Mx的特征向量,即T的行向 量就是Mx的特征向量。
图像编码实验报告
图像压缩编码(实验报告)一、实验目的1.理解图像压缩目的及意义;2.理解有损压缩和无损压缩的概念;3.了解几种常用的图像压缩编码方法;4.利用MATLAB程序进行图像压缩。
二、实验原理图像压缩主要目的是为了节省存储空间,提高存储、处理、传输速度。
虽然表示图像需要大量的数据,但数据是高度相关的,或者说存在冗余(Redundancy),去掉这些冗余信息可以有效地压缩图像,同时不会损坏图像的有效信息。
信息的冗余量有许多种,如空间冗余,时间冗余,结构冗余,知识冗余,视觉冗余等,数据压缩实质上是减少这些冗余量。
高效编码的主要方法是尽可能去除图像中的冗余成分,从而以最小的码元包含最大的图像信息。
图像压缩的理想标准是信息丢失最少,压缩比例最大。
不损失图像质量的压缩称为无损压缩,无损压缩不可能达到很高的压缩比;损失图像质量的压缩称为有损压缩,高的压缩比是以牺牲图像质量为代价的。
压缩的实现方法是对图像重新进行编码,希望用更少的数据表示图像。
编码压缩方法有许多种,从不同的角度出发有不同的分类方法,从信息论角度出发可分为两大类。
(1)冗余度压缩方法,也称无损压缩、信息保持编码或嫡编码。
具体说就是解码图像和压缩编码前的图像严格相同,没有失真,从数学上讲是一种可逆运算。
(2)信息量压缩方法,也称有损压缩、失真度编码或烟压缩编码。
也就是说解码图像和原始图像是有差别的,允许有一定的失真。
应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分为以下几类:(1)熵编码。
熵编码是纯粹基于信号统计特性的编码技术,是一种无损编码。
熵编码的基本原理是给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。
常见的熵编码有:哈夫曼(Huffman)编码,算术编码,行程(RLE)编码。
(2)预测编码。
预测编码是利用图像信号的空间或时间相关性,用已传输的像素对当前的像素进行预测,然后对预测值与真实值的差(预测误差)进行编码处理和传输。
图像编码.
图像编码——图像处理第G 组LZW编码:LZW编码对信源输出的不同的长度的符号序列分解固定的长度的码字,且不需要有关符号出现的概率的知识。
LZW编码方法是一种字典方法,在编码的开始阶段要构造一个对信源符号进行编码的码本(字典)。
方法:对于一个固定灰度的图像,开始时字典储存图像所要表示的灰度范围。
比如8比特灰度,那么字典初始化就有0-255灰度条目。
对于编码后的字典条目,直接在后面添加。
在编码时,当前识别序列和字典条目,我们采取了数组的储存方式,但也尝试过采取使用MATLAB中的元胞类型,但编码的效率很低速度很慢。
这是由于在查找字典匹配序列时,使用元胞类型时在电脑的运行内部要经常进行指针的大范围的跳转,查找效率很低。
采用了数组储存后指针指在小范围内移动效率得到明显的提高。
编码的规则很简单。
对图像从行列进行像素扫描,对于第一个像素不进行输出,只当作下一次的当前识别序列。
而对其它的有当前事变序列连接上当前处理的像素值组成一个序列,如果该序列能在字典里找到对应的序列,那么该序列作为下一个的当前序列其它什么也不做。
如果不能找到,则编码输出当前识别序列的字典中的索引值。
这样一直到最后,把最后一个当前的识别序列的字典的索引值直接作为编码接在编码输出序列后面。
对于解码来说,也采用上面的数组的储存结构。
我们只要以编码值在对应建立的字典中去找到对应的字典条目输出就可以的。
但这里存在着一个问题,对一些连续的出现相同的像素的编码值,在解码时不能在字典里面找到字典条目。
难点:正确的解码。
解决方法:对于不能在字典中找到的条目,采用条件判断,之后取前面的识别序列连接上识别序列的第一个像素值作为像素序列的输出和字典输出,当结束后再把当前处理的编码值赋给识别序列。
一切就很正常的进行了由于LZW编码,在编码时运算量特别大,所以编码的效率很低。
主要有几个原因:1、对算有像素都要进行一次扫描2、对于很少出现相似的像素,字典会非常大3、每一次都要去查找一下字典改进方法:1、选取图像像素的最大值(如果少于255,那么可以减少字典大小,同时减少一些计算量)2、采用向后查找方式3、对于字典储存方式上的数组改进方式。
第5章1 图像编码
图像数据的冗余
一般来说,图像数据中存在以下几种冗余:
空间冗余:图像内部相邻像素之间存在较强的相关性所造 成的冗余。 时间冗余:视频图像序列中的不同帧之间的相关性所造成 的冗余。 结构冗余:是指图像中存在很强的纹理结构或自相似性。 信息熵(编码)冗余: 视觉冗余:是指人眼不能感知或不敏感的那部分图像信息。
*
25
第五章 图像编码 5.1.4 图像压缩编码的系统评价
在图像编码中,编码质量是一个非常重要的概念,怎样以尽可
能少的比特数来存储或传输一幅图像,同时又让接收者感到满意,
这是图像编码的目标。 对于图像编码的质量评价主要体现在基于压缩编码参数的评 价、基于保真度(逼真度)准则的评价、算法的适用范围、算法的 复杂度等四个方面。
表 几种常见应用的码率
*
14
第五章 图像编码
视觉冗余度 :允许图象编码有一定的失真也是图象可以压缩的 一个重要原因,只要这些失真并不被人眼所察觉,在许多情况 下是完全可以接受的,这就给压缩比的提高提供了十分有利的 条件, 在多数应用中,人眼往往是图象信息的最终接收者,如果能 充分利用人眼的视觉特性,就可以在保证所要求的图象主观 质量的前提下实现较高的压缩比,这就是利用了视觉冗余度, 其实人类的视觉系统(HVS)是缺陷的,对某些失真不敏感, 难以觉察, 一个图象编码方法如果能充分利用这些特性,就可取得较好 的效果,即在复原图象主观质量较好的前提下得到较高的压 缩比。
5
*
第五章 图像编码
数据冗余:
设:n1和n2是指原始图像和编码后图像每个像素的 平均比特数 压缩率(压缩比)——用于描述图像压缩效果
CR = n1 / n2 其中,n1是压缩前的数据量,n2是压缩后的数据量
数字图像处理课程作业答案
Homework 1
在BR部分
(2400 H 3600 )
H H 240 ຫໍສະໝຸດ g 1 / 31 S
1 S cos H b 1 3 cos(600 H )
r 1 ( g b)
如前所述,可由 r、g、b值得到 R、G、B 值。
20 0 0 0 40 0 0 0 20 20 20 0.500 0.653 0.500 0.271 0 0 0 0.500 0.271 0.500 0.653 0 0 0 0.500 0.271 0.500 0.653 0 0 0 0.500 0.653 0.500 0.271 0 0 0 0 0 0 0 0 0 0 0 0
20
Homework 2
解: N=4时,DCT的变换矩阵
0.500 0.500 0.500 0.500 0.653 0.271 0.271 0.653 A 0.500 0.500 0.500 0.500 0.271 0.653 0.653 0.271
16
Homework 2
P175 3. 二维Fourier变换有哪些性质? 答:二维 Fourier 变换具有 (1) 可分性 (2) 线性 (3) 共轭对称性 (4) 旋转性 (5) 比例变换特性
(6) 帕斯维尔(Parseval)定理 (7) 相关定理 (8) 卷积定理
17
Homework 2
相关。
8
Homework 1
25. 如何由RGB模型转换为HSI 模型?
答: 为了由[0,1]范围的 RGB 值得到同样在[0, 1]范围内的 HSI 值,可以得出了以下几个表达 式: I 1 / 3( R G B)
数字图像处理 第5章 图像编码技术(课堂PPT)
47
5.8 变换编码
48
5.8 变换编码
• (3) 量化 阈值编码
随子图象不同而保留不同位置变换系数 (1)对所有子图象用一个全局阈值 (2)对各个子图象分别用不同的阈值 (3)根据子图象中各系数的位置选取阈值
10
5.1 数据冗余和压缩
11
5.2 图象保真度
• 图象保真度
信息保存型 信息损失型 描述解码图象相对于原始图象的偏离程 主观保真度准则
主观测量图象的质量 应用不方便
• 客观保真度准则
用编码输入图与解码输出图的某个确定函数表示损失 的信息量
便于计算或测量
44
5.8 变换编码
• 变换编码
(1)构造子图象 子图象尺寸影响
(2)变换 变换的选择
(3)量化 分区编码 阈值编码
(4)符号编码
45
5.8 变换编码
46
5.8 变换编码
• 变换编码
• (2)变换
变换的选择
压缩并不是在变长步骤取得的 是在量化变换的系数时取得的
变换将图象能量或信息集中于某些系数
20
5.4 哈夫曼编码
21
5.4 哈夫曼编码
22
5.4 哈夫曼编码
23
5.4 哈夫曼编码
• 哈夫曼码改型
亚最优 牺牲编码效率来换取编码速度
• 截断哈夫曼码
只一部分用哈夫曼编码
• 平移哈夫曼码
分组有哈夫曼编码
24
5.4 哈夫曼编码
25
5.4 哈夫曼编码
26
5.4 哈夫曼编码
27
5.4 哈夫曼编码
数字图像处理:第5章 图像编码(第二讲)
由此可得
2 i
E[( xi
xˆi )xi ]
当 i 0 时,则
2 0
E[
x
2 0
x0 x0 ]
将 x0 1x1 2 x2 n xn
(5—48) (5—49)
代入式(5—49),并引入协方差之定义,则
2 0
R00
(1R01
2 R02
n R0n )
(5—50)
式中 R00 是原序列X的方差。由式(5—50)可见,
发“0”码。
df 0 dt
交替出现 “0” “1” 码。
在接收端, 当译码器收到“1”时,信号则产生一个正跳变, 收到“0”时,则信号电压产生一个负的跳变, 由此即可实现译码。
首先讨论一下译码电路。译码器应具有下述三 个功能:
(1)收到“1”时,产生一个正斜变电压,当 连续收到“1”时,则连续上升;
nt RC
U0
(5—59)
只要 nt 远小于RC,则电容器上的电压会一直随
时间线性增长,保证在收到连“1”码时,每次上
升同样一个量化级,上升的斜率就是
t E0 RC
。
电容器能够保持电荷,因而具有记忆作用。
由式(5—58)知道,收到“1”时电压会上升一个 量化阶,当收到“0”时,相当于图5—29中开关 接到 -E0 ,此时会使电容上的电压下降一个量 化阶,所以,简单的RC电路就能实现增量调制编 码器的译码。
(2)收到“0”时,产生一个负斜变电压,当 连续收到“0”时,则连续下降;
(3)正、负斜率相等,且具有记忆功能。
图 5—28 译码原理
R
Uc
K
E0
C -E0
Uc
U0
t
第5章 图像编码(第4讲)
数字图像处理学第5章图像编码(第四讲)5. 6 变换编码图像编码中另一类有效的方法是变换编码。
变换编)映射变换量化器编码器变换编码主要由映射变换、量化及编码几部分操作组成。
映射变换是把图像中的各个像素从一种空间变换到另一种空间,然后针对变换后的信号再进行量化与编码操作。
在接收端,首先对接收到的信号进行译码,然后再进行反变换以恢复原图像。
映射变换的关键在于能够产生一系列更加有效的系数,对这些系数进行编码所需的总比特数比对原始图像进行编码所需要的总比特数要少得多,因此,使数据率得以压缩。
映射变换的方法很多。
图像变换编码基本可分为两大类,某些特殊的映射变换编码法,函数变换编码法。
5.6.1 几种特殊的映射变换编码法特殊映射变换编码法包括诸如行程编码,轮廓编码等一些变换编码方法。
它们特别适用于所谓二值图像的编码。
这类图像包括业务信件、公文、气象图、工程图、地图、指纹卡片及新闻报纸等。
当然在编码技术上同样可分为精确编码和近似编码两类。
•精确编码可以不引入任何畸变,在接收端可以从编码比特流中精确恢复出原始图像。
近似编码会引入一些畸变,但是,这种方法却可以在保证可用性的前提下获得较高的压缩比。
下面通过几种具体的编码方法说明这种变换编码法的基本概念。
1、一维行程编码一维行程编码的概念如图5—42所示。
假如沿着某一扫描行的像素为,它们所具有的灰度值可能为。
在编码之前,可以首先把这些像素映射为成对序列,和。
N x x x x , , , ,321 4321 ,g ,g ,g g ),),,(2211l (g l g ),(33l g ),44l (g其中表示某一灰度值,表示第i 次运行的行程。
也可以说是连续取值为灰度值的像素的个数。
经过这样映射变换后就可以对编码,而不必对像素直接编码。
i l g i ),i i l (g g i由于有些图像如前面提到的二值图像,连续取同一灰度级的像素很多,对映射后的序列进行编码会大大压缩比特率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字图像处理学第5章图像编码(第一讲)模拟图像信号在传输过程中极易受到各种噪声的干扰,而且模拟图像信号一旦受到污染则很难完全得到恢复。
另外,在模拟领域中,要进行人与机器(计算机或智能机),机器与机器之间的信息交换以及对图像进行诸如压缩、增强、恢复、特征提取和识别等一系列处理都是比较困难的。
•所以无论从完成图像通信与数据通信网的结合方面来看,还是从对图像信号进行各种处理的角度来看,图像信号数字化都是首当其冲的重要问题。
图像数字化的关键是编码。
本章将对图像编码进行较为详细的讨论。
5. 1 信源编码图像编码属于信源编码范畴。
其特点是利用图像信号的统计特性及人眼睛的生理和心理特性对图像进行高效编码。
在信息论中将数字通信过程概括为图5—1的形式。
信源信源编码信道编码调制传输信道噪声解调信道解码信源解码信宿图5—1所示的模型是一个数字通信系统模型。
在这样一个模型中有二次编、译码,信源编码、信源译码信道编码、信道译码。
信源编码的主要任务是解决有效性问题,也就是对信源实现压缩处理,使处理后的信号更适宜数字通信系统。
解决有效性问题就是在编码过程中尽量提高编码效率,也就是力求用最少的数码传递最大的信息量。
信道编码的任务是解决可靠性问题。
也就是尽量使处理过的信号在传输过程中不出错或少出错,既使出了错也要有能力尽量纠正错误。
因此,在信道编码中往往引进用作误差控制的数码,以实现自动检错和纠错。
图像编码主要是要研究压缩数码率,即高效编码问题。
编码是信息处理科学中的经典研究课题,就图像编码而言,已有近五十年的历史。
近年来,M.Kunt提出第一代、第二代编码的概念。
•M.Kunt把1948年至1988年这四十年中研究的以去除冗余为基础的编码方法称为第一代编码,如:PCM、DPCM、△M、亚取样编码法,变换域的DFT、DCT、Walsh-Hadamard变换编码等方法以及以此为基础的混合编码法均属于经典的第一代编码法。
第二代编码方法多是八十年代以后提出的新的编码方法,如金字塔编码法、Fractal编码、基于神经元网络的编码方法、小波变换编码法、模型基编码法等。
现代编码法的特点是:①充分考虑人的视觉特性;②恰当地考虑对图像信号的分解与表述;③采用图像的合成与识别方案压缩数据率。
这种分法尽管并没得到图像编码界全体同仁的广泛认可,但笔者认为对了解图像编码发展进程是有益的。
图像编码这一经典的研究课题,经五十多年的研究已有多种成熟的方法得到应用,特别是所谓的第一代编码更是如此。
随着多媒体技术的发展已有若干编码标准由ITU-T制定出来,如JPEG、H.261、H.263、MPEG1、MPEG2、MPEG4、MPEG7、JBIG(二值图像压缩) (Joint Bo-level Image Coding Expert Group)等。
相信经广大科技工作者的不懈努力,在未来会有更多、更有效的编码方法问世,以满足多媒体信息处理及通信的需要。
信源编码的目的是提高编码效率。
是否能提高编码效率?回答是肯定的。
从信息论的角度看,各种信源都存在大量的冗余成分。
如果去掉这些冗余成分,就能提高编码效率。
所以,所谓第一代编码就是围绕着去除冗余度这一中心思想实现数据压缩的。
冗余度在那里?冗余度主要存在于两个主要方面:1)、存在于信源的相关性之中;2)、存在于图像信源各个元素出现概率的不均等之中。
因此,无论是记忆性信源还是无记忆性信源都由压缩的可能。
去掉了冗余成分的信源固然精练了,但是,也变得脆弱了。
抗干扰性能也变差了。
因此,在传书过程中,还要加入一些冗余成分以增加抗干扰能力。
这就是信道编码的任务了。
图像编码的分类图像编码大致可分三类:1)、匹配编码;2)、变换编码;3)、识别编码:(1)、匹配编码这种编码方法是使代码长度与图像信源的概率分布相匹配。
如:出现概率大的编短码,概率小的编长码,总的码率就会下降。
这种编码的长短不一,使得传输、译码、存储均不方便,另一个缺点是编码的先决条件是要知道图像信源的概率分布。
解决办法:1)、寻找一个大体上能代表图像信源的数学模型,如正态分布,指数分布等;2)、实际统计图像信源的概率分布,这种方法更切合实际,但是,往往找不到合适的数学模型,给分析带来不便。
(2)、变换编码首先把图像信源从一个空间变换到另外一个空间,然后对变换系数进行编码。
变换方式大体上可分为两类;预测变换函数变换(3)、识别编码这种方法的关键是识别。
基本原理是用另外一套符号代替原来的信源中的消息,如:电报、速记等均可认为是识别编码的例子。
主要方法:a)关联识别,需要一定数量的样本。
信息与样本比较,判别相似程度。
b)、逻辑识别没有样本,是用逻辑表达式判别被识别对象。
这种编码方法与实际应用还有距离。
从压缩的角度也可以分为;1)、熵压缩法:不可逆的编码法,压缩中有信息损失,但在视觉角度看失去的信息是无关紧要的信息。
2)、无失真编码:是可逆的编码方法。
没有信息损失。
另外,如果从目前已有的实用方案的角度来分类,可以分为三大类,即预测编码,变换编码及统计编码。
而这些方法既适用于静止图像编码,也适用于电视信号编码。
就具体编码方法而言可简略地概括在表5—1中。
表5—1图象高效编码法PCM 预测法正交变换法统计编码其他方法常规编码法亚奈氏取样编码法标准法自适应法标准法自适应法标准法自适应法行程编码轮廓编码DPCM ΔMK-LHT, DWTDFTSTDCTTHar霍夫曼仙农—费诺最后需要着重提及的是,上述各种具体方案并不是孤立的、单一的使用,往往是各种方法重迭、交叉使用,以达到更高的编码效率,在ITU-T的建议标准中这一点尤为突出。
5. 2 图像编码中的保真度准则图像信号在编码和传输过程中会产生误差,尤其是在熵压缩编码中,产生的误差应在允许的范围之内。
在这种情况下,保真度准则可以用来衡量编码方法或系统质量的优劣。
通常,这种衡量的尺度可分为客观保真度准则和主观保真度准则。
5.2.1 客观保真度准则5.2.2 主观保真度准则5.2.1 客观保真度准则通常使用的客观保真度准则有输入图像和输出图像的均方根误差;输入图像和输出图像的均方根信噪比两种。
输入图像和输出图像的均方根误差是这样定义的。
设输入图像是由N×N个像素组成,令其为f(x,y),其中x,y=0,1,2,3…N-1 。
这样一幅图像经过压缩编码处理后,送至受信端,再经译码处理,重建原来图像。
这里令重建图像为g(x,y) 。
它同样包含N N个像素,并且x,y=0,1,2…N-1 在0,1,2,3…..N-1 范围内(x,y)处的任意值,输入像素和对应的输出图像之间的误差可用下式表示而包含N ×N 象素的图像之均方误差为e x y g x y f x y (,)(,)(,)=-2101022101022)],(),([1),(1y x f y x g N y x e N e N y N x N y N x -==∑∑∑∑-=-=-=-=(5—2)(5—1)由式(5—2)可得到均方根误差为[]212e=(5—3) erms如果把输入、输出图像间的误差看作是噪声,那么,重建图像g(x,y)可由下式表示=+(5—4) (,)(,)(,)g x y f x y e x y在这种情况下,另一个客观保真度准则—重建图像的均方信噪比如下式表示21010210102101021010)],(),([),(),(),(y x f y x g y x g y x e y x g N S N y N x N y N x N y N x N y N x s m -==⎪⎭⎫ ⎝⎛∑∑∑∑∑∑∑∑-=-=-=-=-=-=-=-=(5—5)均方根信噪比为S N g x y g x y f x y r m s x N y N x N y N ⎛⎝ ⎫⎭⎪=-⎧⎨⎪⎪⎩⎪⎪⎫⎬⎪⎪⎭⎪⎪=-=-=-=-∑∑∑∑ 010*********(,)[(,)(,)](5—6)5.2.2 主观保真度准则图像处理的结果,绝大多数场合是给人观看,由研究人员来解释的,因此,图像质量的好坏与否,既与图像本身的客观质量有关,也与人的视觉系统的特性有关。
有时候客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量,所以又规定了主观保真度准则。
这种方法是把图像显示给观察者,然后把评价结果加以平均,以此来评价一幅图像的主观质量。
一种方法是规定一种绝对尺度,例如:(1)优秀的:具有极高质量的图像;(2)好的:是可供观赏的高质量的图像,干扰并不明显;(3)可通过的:图像质量可以接受,干扰不讨厌;(4)边缘的:图像质量较低,希望能加以改善,干扰有些讨厌;(5)劣等的:图像质量很差,尚能观看,干扰显著地令人讨厌;(6)不能用:图像质量非常之差,无法观看。
另外常用的还有两种准则,即妨害准则和品质准则。
妨害准则如下五级:(1)没有妨害感觉;(2)有妨害,但不讨厌;(3)能感到妨害,但没有干扰;(4)妨害严重,并有明显干扰;(5)不能接收信息。
品质准则如下七级:(1)非常好;(2)好;(3)稍好;(4)普通;(5)稍坏;(6)恶劣;(7)非常恶劣。
除此之外,还可以采用成对比较法,也就是同时出示两幅图像,让观察者表示更喜欢哪一幅图像,借此排出图像质量的等级。
也有采用随机抽取法来评定图像质量的。
这种方法是把数量相等的原始图像和经编译码后的图像混杂在一起,然后让观察者挑出他认为质量差的图像。
质量较差的图像可定义为处理过的图像,然后统计错挑的概率,显然错挑概率越大说明图像经处理后的劣化越小。
总之,主观保真度评价方法的准则可不同,但其基本原理都一样,当然,对观察者的视觉条件应有一定的要求。
5. 3 PCM编码5.3.1 PCM 编码的基本原理5.3.2 PCM 编码的量化噪声5.3.3 编码器、译码器5.3.1 PCM 编码的基本原理脉冲编码调制(Pulse coding Modulation—PCM )是将模拟图像信号变为数字信号的基本手段。
图像信号的PCM 编码与语音信号PCM 编码相比并没有原则上的区别。
但是,图像信号,特别是电视信号占的频带宽,要求响应速度快,因此,电路设计与实现上有较大的难度。
图像信号PCM 编、译码原理方框图如图5—2所示。
图像信号PCM 编码由前置低通滤波器、取样保持电路、量化器、编码器组成。
图像低通滤波取样保持编码传输信道解码低通滤波解码图像量化图5—3 PCM 编、译码原理方框图限制频带,防止折叠误差时间离散化幅度离散化多值变多比特多比特变多值内插及平滑前置低通滤波器的作用:1)、为满足取样定理的带限要求,以减少折迭误差;2)、对杂散噪声也有一定的抑制作用。
取样保持电路:将完成把时间上连续的模拟信号进行时间离散化的任务。