数字图像处理-预测编码
多媒体技术量化和变换编码和预测编码
量化分类
量化可以分为两类:
(1) 标量量化:
输入信号的所有分量使用同一个量化器进行量化,每 个分量的量化都和其它分量无关,也称为零记忆量化。
(2)矢量量化:
从码本集合中选出最适配于输入信号的一个码字作为 输入信号的近似,这种方法以输入信号与选出的码字 之间失真最小为依据。
矢量量化与标量量化相比有更大的数据压缩能力。
xˆn1 Tn1n sˆn1
有 xˆn1 xn1
为什么变换
变换的本质就是将信号在一组基函数上投影,得 到一组投影值,即信号的变换域表达。
变换的目的就是将一个实际的物理信号分解为变 换域(频域)上有限的或无限的小的信号“细胞”, 以便了解信号的性质,提取信号的有用信息
为什么变换
犏
犏犏臌eTM - 1
e1 ... en- 1 ]
轾 犏 e0T
Cy=犏 犏 犏 犏 e1T [e0
犏 犏 犏 臌 eTn-1
e1...
轾 犏 l0
en-1]犏 犏 犏l1
犏 犏 犏 臌
轾 犏e0T
Cy
=
犏 犏 犏e1T 犏
[Cxe0 Cxe1 ...Cxen- 1]
犏
犏 犏 臌eTM- 1
轾 犏 l0 =犏 犏 犏l1
邋 邋 = M 1 M i= - 0 1 X iX iT -m x ( M 1 M i= - 0 1 X iT ) -( M 1 M i= - 0 1 X i) m x T + M 1 M i= - 0 1 m x m x T
å =M 1M i= -0 1X iX iT-m xm xT-m xm xT+m xm xT å =M 1 M i=-01XiXiT- mxmxT
图像编码
§9.2 信息量和信息熵
“信息”是指对消息接收者来说预先不知道的报 导。从概率统计的角度来看,由信息源发出一系 列消息{a k },出现概率率 p(ak ), k = 0,1, 2,..., K − 1 其中, 为消息源的总数量。 K 假定接收者接收到符号为 ak的概率为p (ak ),则信 息量定义为 I = − log[ p(a k )]
9
北京大学遥感所
§9.3 图像信息熵值和信息剩余度
一幅图像在一般情况下各亮度值总是非等概率 的,因此其熵值总是小于等概率的熵值。去掉这 些冗余的信息,便压缩编码后的图像熵值不低于 图像信息源熵值,就不会丢失图像的有用信息。 相对熵和剩余度:一个信息源实际输出的熵与该 信息源的最大可能熵之比称为相对熵 h ,信源的剩 余度定义为 r = 1 − h 编码效率:
16
北京大学遥感所
§9.4.2 行程编码
0 0 1 2 3 4 5 6 行程编码;编码为((11144)(214)(52355)).
17
1
2
3
4
5
6
北京大学遥感所
§9.4.3 链码
链码:描述物体的边界,链码中的符号一般对应 于图像基元的邻接关系。如下图所示。链码可以 用静态数据结构来表示,如1维数组,取其大小为 链码的最大可能长度;也可以用动态数据结构来 表示,且这样在节省存储空间方面更合适。
研究图像编码技术的目的:在保证图像观察质量 的前提下,尽可能最大限度地降低码率(单位时 间内所传输图像数据的比特-bit数),以利于节省 图像数据的存储空间,减少传输时间、传输通 道,降低成本。流程图如下:
原始图像数据 传输 被压缩的 图像数据 编码器 被压缩的 图像数据 传输
解码器
数字图像处理~图像编码
Eb = -log2(0.3) = 1.737
Ec = -log2(0.2) = 2.322
总信息量也即表达整个字符串需要的位数为:
E = Ea * 5 + Eb * 3 + Ec * 2 = 14.855 位
举例说明:
如果用二进制等长编码,需要多少位?
数据压缩技术的理论基础是信息论。
2.信息量和信息熵
A
B
数据压缩的基本途径
数据压缩的理论极限
信息论中信源编码理论解决的主要问题:
信息量等于数据量与冗余量之差
I = D - du
数据是用来记录和传送信息的,或者说数据
是信息的载体。
数据所携带的信息。
信息量与数据量的关系:
du—冗余量
I— 信息量
D— 数据量
叁
实时传输:在10M带宽网上实时传输的话,需要压缩到原来数据量的?
肆
存储: 1张CD可存640M,如果不进行压缩,1张CD则仅可以存放?秒的数据
伍
可见,单纯依靠增加存储器容量和改善信道带宽无法满足需求,必须进行压缩
1 图像编码概述
数字化后的图像信息数据量非常大,图像压缩利用图像数据存在冗余信息,去掉这些冗余信息后可以有效压缩图像。
01.
02.
03.
04.
问题:
把某地区天气预报的内容看作一个信源,它有6种可能的天气:晴天(概率为0.30)、阴天(概率为0.20)、多云(概率为0.15)、雨天(概率为0.13)、大雾(概率为0.12)和下雪(概率为0.10),如何用霍夫曼编码对其进行编码?平均码长分别是多少?
哈夫曼编码
30
10
预测编码
4.4预测编码1.预测编码的基本原理预测编码(Prediction Coding)是根据某一种模型,利用以前的(已收到)一个或几个样值,对当前的(正在接收的)样本值进行预测,将样本实际值和预测值之差进行编码。
如果模型足够好,图像样本时间上相关性很强,一定可以获得较高的压缩比。
具体来说,从相邻像素之间有很强的相关性特点考虑,比如当前像素的灰度或颜色信号,数值上与其相邻像素总是比较接近,除非处于边界状态。
那么,当前像素的灰度或颜色信号的数值,可用前面已出现的像素的值,进行预测(估计),得到一个预测值(估计值),将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法称为预测编码方法。
预测编码的基本思想建立一个数学模型利用以往的样本数据对新样本值进行预测将预测值与实际值相减对其差值进行编码,这时差值很少,可以减少编码码位。
2.预测编码的分类最佳预测编码:在均方误差最小的准则下,使其误差最小的方法。
线性预测:利用线性方程计算预测值的编码方法。
非线性预测:利用非线性方程计算预测值的编码方法。
线性预测编码方法,也称差值脉冲编码调制法(Differention Pulse Code Modulation,DPCM)。
如果根据同一帧样本进行预测的编码方法叫帧内预测编码。
根据不同帧样本进行预测的编码方法叫帧间预测编码。
如果预测器和量化器参数按图像局部特性进行调整,称为自适应预测编码(ADPCM)在帧间预测编码中,若帧间对应像素样本值超过某一阈值就保留,否则不传或不存,恢复时就用上一帧对应像素样本值来代替,称为条件补充帧间预测编码。
在活动图像预测编码中,根据画面运动情况,对图像加以补偿再进行帧间预测的方法称为运动补偿预测编码方法。
3.DPCM编码算法一幅二维静止图像,设空间坐标(i,j)像素点的实际样本为f(i,j),是预测器根据传输的相邻的样本值对该点估算得到的预测(估计)值。
编码时不是对每个样本值进行量化,而是预测下一个样本值后,量化实际值与预测值之间的差。
数字图像编码技术
试论数字图像编码技术[摘要] 本文论述了数字图像编码技术的必要性和可行性.介绍了三种编码方式(信息保持编码、保真度编码、特征提取),并对具体的编码方法进行了分类(平均信息法、预测编码法、变换编码方法等),最后对图像编码技术的发展方向进行了展望。
[关键词] 数字图像、编码编码方法中图分类号:tn131+.4 文献标识码:a 文章编号:1 引言数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。
早期图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。
图像处理中,输入的是质量低的图像,输出的是改善质量后的图像。
常见的图像处理有图像数字化、图像编码、图像增强、图像复原、图像分割与图像分析等。
图像编码是对图像信息进行编码,可以压缩图像的信息量,以便满足传输与存储的要求。
本文主要介绍了图像编码的基本原理和技术方法。
一幅二维数字图像可以由一个二维亮度函数通过采样和量化后而得到的一个二维数组表示。
这样一个二维数组的数据量通常很大,从而对存储、处理和传输都带来了许多问题,提出了许多新的要求。
为此人们试图采用对图像新的表达方法以减少表示一幅图像需要的数据量,这就是图像编码所要解决的主要问题。
压缩数据量的主要方法是消除冗余数据,从数学角度来讲是要将原始图像转化为从统计角度看尽可能不相关的数据集。
这个转换要在图像进行存储、处理和传输之前进行,然后将压缩了的图像解压缩以重建原始图像,即通常所称的图像编码和图像解码。
2 传统编码方法传统的编码方法可以分成两大类,预测编码方法(对应空域方法)和变换编码方法(对应频域编码方法)。
预测编码方法的优点是:算法一般较简单,易于用硬件实现;缺点是:压缩比不够大,承受误码的能力较差。
由于它采用的最小均方误差准则不能反映人眼的视觉心理特性,近年来已较少单独采用,而是与其他方法混合使用。
另外,由于dpcm编码系统会引起斜率过载、界线繁忙、颗粒噪声和轮廓噪声,在使用中应加以考虑。
实验4 DPCM预测编码
实验4 DPCM预测编码一、实验目的1了解图像压缩的意义和手段;2熟悉DPCM预测编码的基本性质;3熟练掌握DPCM预测编码的方法与应用;4掌握利用MA TLAB编程实现数字图像的DPCM预测编码。
二、实验原理DPCM编码,简称差值编码,是对模拟信号幅度抽样的差值进行量化编码的调制方式(抽样差值的含义请参见“增量调制”)。
这种方式是用已经过去的抽样值来预测当前的抽样值,对它们的差值进行编码。
差值编码可以提高编码频率,这种技术已应用于模拟信号的数字通信之中。
对于有些信号(例如图像信号)由于信号的瞬时斜率比较大,很容易引起过载,因此,不能用简单增量调制进行编码,除此之外,这类信号也没有像话音信号那种音节特性,因而也不能采用像音节压扩那样的方法,只能采用瞬时压扩的方法。
但瞬时压扩实现起来比较困难,因此,对于这类瞬时斜率比较大的信号,通常采用一种综合了增量调制和脉冲编码调制两者特点的调制方法进行编码,这种编码方式被简称为脉码增量调制,或称差值脉码调制,用DPCM表示。
三、实验报告内容1.用MATLAB编程实现对图像的DPCM预测编码2叙述实验过程;3提交实验的原始图像和结果图像。
解:Matlab程序如下:%本文是数字图像处理的一个源程序%实现的功能是DPCM编码%DPCM编码,简称差值编码,是对模拟信号幅度抽样的差值进行量化编码的调制方式%本程序实现一阶/二阶/三阶/四阶DPCM数字信号预测%一阶/二阶/三阶/四阶预测的区别不仅在于信号的清晰度,而更重要在于%阶数越高,图像越光滑.clcclearclose all;%从D盘导入图片,以学校风光图片为例实现DPCMI03=imread('图片3.jpg');%把RGB图像转化为灰度图像I02=rgb2gray(I03);I=double(I02);fid1=fopen('mydata1.dat','w');fid2=fopen('mydata2.dat','w');fid3=fopen('mydata3.dat','w');fid4=fopen('mydata4.dat','w');[m,n]=size(I);%对预测信号将边缘锁定,防止程序运行时抓不到数据J1=ones(m,n);J1(1:m,1)=I(1:m,1);J1(1,1:n)=I(1,1:n);J1(1:m,n)=I(1:m,n);J1(m,1:n)=I(m,1:n);J2=ones(m,n);J2(1:m,1)=I(1:m,1);J2(1,1:n)=I(1,1:n);J2(1:m,n)=I(1:m,n);J2(m,1:n)=I(m,1:n);J3=ones(m,n);J3(1:m,1)=I(1:m,1);J3(1,1:n)=I(1,1:n);J3(1:m,n)=I(1:m,n);J3(m,1:n)=I(m,1:n);J4=ones(m,n);J4(1:m,1)=I(1:m,1);J4(1,1:n)=I(1,1:n);J4(1:m,n)=I(1:m,n);J4(m,1:n)=I(m,1:n);%一阶DPCM编码for k=2:m-1for l=2:n-1J1(k,l)=I(k,l)-I(k,l-1);endendJ1=round(J1);cont1=fwrite(fid1,J1,'int8');cc1=fclose(fid1);%二阶DPCM编码for k=2:m-1for l=2:n-1J2(k,l)=I(k,l)-(I(k,l-1)/2+I(k-1,l)/2);endJ2=round(J2);cont2=fwrite(fid2,J2,'int8');cc2=fclose(fid2);%三阶DPCM编码for k=2:m-1for l=2:n-1J3(k,l)=I(k,l)-(I(k,l-1)*(4/7)+I(k-1,l)*(2/7)+I(k-1,l-1)*(1/7));endendJ3=round(J3);cont3=fwrite(fid3,J3,'int8');cc3=fclose(fid3);%四阶DPCM编码for k=2:m-1for l=2:n-1J4(k,l)=I(k,l)-(I(k,l-1)/2+I(k-1,l)/4+I(k-1,l-1)/8+I(k-1,l+1)/8);endendJ4=round(J4);cont4=fwrite(fid4,J4,'int8');cc4=fclose(fid4);%==================================================================== =%以上是DPCM编码的编码过程,为了使程序具有连贯性,将编码和解码放在同一个M文件目录下%==================================================================== =%以下是DPCM解码fid1=fopen('mydata1.dat','r');fid2=fopen('mydata2.dat','r');fid3=fopen('mydata3.dat','r');fid4=fopen('mydata4.dat','r');I11=fread(fid1,cont1,'int8');I12=fread(fid2,cont2,'int8');I13=fread(fid3,cont3,'int8');I14=fread(fid4,cont4,'int8');tt=1;for k=1:mI1(k,l)=I11(tt); tt=tt+1;endendtt=1;for l=1:nfor k=1:mI2(k,l)=I12(tt); tt=tt+1;endendtt=1;for l=1:nfor k=1:mI3(k,l)=I13(tt); tt=tt+1;endendtt=1;for l=1:nfor k=1:mI4(k,l)=I14(tt); tt=tt+1;endendI1=double(I1);I2=double(I2);I3=double(I3);I4=double(I4);J1=ones(m,n);J1(1:m,1)=I1(1:m,1);J1(1,1:n)=I1(1,1:n);J1(1:m,n)=I1(1:m,n);J1(m,1:n)=I1(m,1:n);J2=ones(m,n);J2(1:m,1)=I2(1:m,1);J2(1,1:n)=I2(1,1:n);J2(1:m,n)=I2(1:m,n);J2(m,1:n)=I2(m,1:n);J3=ones(m,n);J3(1:m,1)=I3(1:m,1);J3(1,1:n)=I3(1,1:n);J3(1:m,n)=I3(1:m,n);J3(m,1:n)=I3(m,1:n);J4=ones(m,n);J4(1:m,1)=I4(1:m,1);J4(1,1:n)=I4(1,1:n);J4(1:m,n)=I4(1:m,n);J4(m,1:n)=I4(m,1:n);%一阶解码for k=2:m-1for l=2:n-1J1(k,l)=I1(k,l)+J1(k,l-1);endendcc1=fclose(fid1);J1=uint8(J1);%二阶解码for k=2:m-1for l=2:n-1J2(k,l)=I2(k,l)+(J2(k,l-1)/2+J2(k-1,l)/2);endendcc2=fclose(fid2);J2=uint8(J2);%三阶解码for k=2:m-1for l=2:n-1J3(k,l)=I3(k,l)+(J3(k,l-1)*(4/7)+J3(k-1,l)*(2/7)+J3(k-1,l-1)*(1/7));endendcc3=fclose(fid3);J3=uint8(J3);%四阶解码for k=2:m-1for l=2:n-1J4(k,l)=I4(k,l)+(J4(k,l-1)/2+J4(k-1,l)/4+J4(k-1,l-1)/8+J4(k-1,l+1)/8) ;endendcc4=fclose(fid4);J4=uint8(J4);%分区画图figure(1)subplot(3,2,1);imshow(I03);%隐藏坐标轴和边框,以免坐标轴与标题重叠axis offbox offtitle('原始图像','fontsize',11,'fontname','隶体');subplot(3,2,2);imshow(I02);axis offbox offtitle('灰度图像','fontsize',11,'fontname','隶体');subplot(3,2,3);imshow(J1);axis offbox offtitle('一阶预测','fontsize',11,'fontname','隶体');subplot(3,2,4);imshow(J2);axis offbox offtitle('二阶预测','fontsize',11,'fontname','隶体');subplot(3,2,5);imshow(J3);axis offbox offtitle('三阶预测','fontsize',11,'fontname','隶体');subplot(3,2,6);imshow(J4);axis offbox offtitle('四阶预测','fontsize',11,'fontname','隶体');实验的原始图片和运行后的图片分别是:四、思考题1.DPCM预测编码有什么特点?答:预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。
预测编码理论
预测误差门限型:(非线性预测器) ei ui ui 1 仅与前一样值作预测 若
ei K 则不传送 u i ; ei
K
则传送
ui
K为最大误差的门限值,即信宿可接收的最大误差
信号相关性越强,则此时传送的数据越少。
谢谢大家!
一、预测编码原理
对于有记忆信源,信源输出的各个分量之间是 有统计关联的,这种统计关联性可以加以充分利用, 预测编码就是基于这一思想。它不是直接对信源输 出的信号进行编码,而是将信源输出信号通过预测 变换后再对预测值与实际值的差值进行编码,其原 理图见下图。
一、预测编码原理
预测编码是利用信源的相关性来压缩码率的。
第五章预测编码
本章内容
预测编码原理 预测编码理论基础 预测编码方法 预测编码的应用
一、预测编码原理
预测编码是数据压缩三大经典技术(统计编 码、预测编码、变换编码)之一。预测编码 是建立在信号数据的相关性之上,较早用于 信源编码的一种技术。它根据某一模型,利 用以往的样本值对新样本值进行预测,以减 少数据在时间和空间上的相关性,达到压缩 数据的目的。
设信源第i瞬间的输出值为ui,而根据信源ui的前 k(k<i)个样值,给出的预测值为
u i f (ui 1 , ui 2
^
, ui k )
式中:f(· )——预测函数。 f可以是线性也可以是非线性函数。 则第i个样值的预测误差值为
ei ui u i
^
根据信源编码定理,若直接对信源输出ui进行编 码,则其平均码长 Lu 应趋于信源熵:
H (U ) p(ui )loga p(ui ), ui U
若对预测变换后的误差值e进行编码,其平均码 长 Le 应趋于误差信号熵:
第四章 预测编码和变换编码
一、静止图像的二维预测编码
选择值 预测值
c a
b d x
0
1 2 3 4
非预测
a b c a+b-c a+(b-c)/2 b+(a-c)/2
三邻域预测法
5 6
7
(a+b)/2
这种压缩算法被应用到JPEG标准的无损压缩模式之中, 中等复杂程度的图像压缩比可达到2:1。 Lossless JPEG
发送端预测器带有存储器,把tn时刻以前的采样值x1, x2, x3,…, xk-1
^ ek为xn与Xk的差值, ek’为ek经量化器量化的值
xk’是接收端的输出信号 误差ek为
^ 存储起来并据此对xk进行预测,得到预测值 X
k
^ ek= xk- xk’= xk-( k +ek’)= (xkXk )- ek’= ek - ek’ X
自适应量化
在一定量化级数下减少量化误差或在同样的误
差条件下压缩数据,根据信号分布不均匀的特 点,希望系统具有随输入信号的变化区间足以 保持输入量化器的信号基本均匀的能力,这种 能力叫自适应量化。
示例二:
ADPCM采用与DPCM相同的预测器,但对误差量化时采用自 适应改变量化器的量化阶数的压缩结果
^
实际上就是发送端的量化器对误差ek’量化的误差 对 ek’的量化越粗糙,压缩比越高,失真越大.
为接纳量化步骤,需要改变图4-1中的无损编码器以使编码器和解 码器所产生的预测能相等。为此在图4-2中将有损编码器的预测器 放在1个反馈环中。这个环的输入是过去预测和与其对应的量化误 差的函数
’ =e ’ + ^ x k k Xk
DM编码失真示例
预测编码
31
5.3 语音信号的预测编码
语音压缩的依据 语音信号本身的冗余度和人类的听觉感知机理。
语音压缩的质量要求:下面三方面的折中 保持可懂度和音质; 限制比特率; 降低编码过程的计算代价。
使得预测误差的均方值
2 e
E{( xk
xˆk
)2}
最小。
19
当N 给定后,σe2是依赖预测系数ai的函数,使MSE最小, σe2对ai求导等于0,有 :
2 e
ai
E 2(xk
xˆk
)
xˆk ai
0,
i 1, 2,L , N
将式(5.2-1)之 xˆk 带入, 得到:
34
⑤ 静止系数(话音间隔): 话音间隙使得全双工话路的典型效率为通话时间40%(或静 止系数为60%),话音间隙本身是一种冗余,若能检测(或预 测出)该静止段,便可“插空”传输更多的信息。
⑥ 长时间自相关函数: 在较长的时间间隔(短时间隔一般为20ms,长时为几十秒) 进行统计,便得到长时的自相关函数。长时统计表明,8kHz 取样语音的相邻样本间,平均相关系数高达0.9。
同年,该实验室的C.C.Culter取得了DPCM (Differential Pulse Code Modulation, 差分脉冲 编码调制)系统的专利,奠定了真正实用的预测 编码系统的基础。
10
直观理解: 预测编码技术: 从过去的符号样本来预测下一个符号样本的值。
根据:
认为在信源符号之间存在相关性。如果符号的预测值 与符号的实际值比较接近,它们之间的差值幅度的变 化就比原始信源符号幅度值的变化小,因此量化这种 差值信号时就可以用比较少的位数来表示差值。
数字图像处理 第六章图像压缩与编码
变换编码
变换编码系统
最佳变换
最佳变换:全部解除Y系数之间的相关性,Y方差高度 集中的变换。 最佳变换准则:P133
均方误差最小准则 选择变换矩阵A使 Y为对角阵,从而去除相关性;
Y
A X AT, 其中 Y X 分别为X , Y的协方差矩阵
同时选择集中主要能量的Y系数前M 项,减少传输和存储时Y ˆ 的误差。 近程中没有信息
损失 . 霍夫曼编码,行程编码,算术编码 有损压缩:能取得较高的压缩率,但压缩后 不能通过解压缩恢复原状. 预测编码,变换 编码,小波变换
图像压缩的方法
消除冗余数据
从数学角度看,将原始图像转化为从统计角
度看尽可能不相关的数据集
基本概念
1.
霍夫曼编码
排序与合并
霍夫曼编码
赋值与编码
霍夫曼编码
霍夫曼解码
解码通过查询表的方式完成
最长码串匹配原则
霍夫曼解码例题
例 一个有8个符号的信源Y,各个符号出现的概率为 Y= 符号:y1 y2 y3 y4 y5 y6 y7 y8 概率:0.40 0.18 0.10 0.10 0.07 0.06 0.05 0.04 试进行霍夫曼编码,并计算编码效率、压缩比、冗余度 等。 解 :霍夫曼编码算法过程如图所示。
K-L变换
K-L变换
1、由原始图像X求协方差矩阵 X
T = E [( X X )( X X ) ] X
其中,X E[ X ],表示均值 2、求 X 的特征值i 3、将i由小到大排列后算出对应单位特征向量i, 各特征向量组合构成正交矩阵A 4、用A对图像进行正交变换,得到变换后图像Y
数字图像处理技术的应用第6章 图像编码
6.2 图像压缩概述
2、平均码字长度:
Assume:
kis第k个码字Ck的长度二进制代码的位数出现的概率pk
码字平均长度R:
M
R= k pk bit
R1
3、编码效率:
H 100%
R
6.2 图像压缩概述
4、冗余度:
r 1 r 可压缩的余地越小
6.2 图像压缩概述
1)数据冗余:将图像信息的描述方式改变之后,压缩 掉这些冗余。
2)主观视觉冗余:忽略一些视觉不太明显的微小差异, 可以进行所谓的“有损”压缩。
6.2 图像压缩概述
图像数字化关键是编码 compression code:在满足一定图像质量前提下,能获得减少数
据量的编码
一.Compression code及分类 研究处理的对象: 数据的物理容量
图像序列(x、y、t)50~200倍
6.2 图像压缩概述
3、从图像的光谱特征出发: 单色image coding; color image coding; 多光谱image coding。
4、从图像的灰度层次上: 多灰度编码; 二值图像code
5、从处理图像的维数出发;
行内coding; 帧内coding; 帧间code。
图像一大特点是数据量大,为其存贮、传输带来困难,需压缩。
eg:电话线传输速率一般为56Kbits/s(波特率) 一幅彩色图像512×512×24bit = 6M bits大小。传一幅图像需2分钟左右。 实时传送:512×512×24bits×25帧/秒=150Mbits/S 如压缩20倍,传一幅图6秒左右,可以接受,实用。 实时,要专用信道(卫星、微波网、专线网等技术)。 另外,大量资料需存贮遥感、故宫、医学CT、MR。
数字图像处理-图像变换编码
式中:
u = − N ,− N + 1,..., N − 1
1 当 u = 0, Fs (0) = N
∑ f ( x)
x =0
N −1
1 当 u = − N , ( x) cos(− xπ − 2 ) = 0
x =0
N −1
π
u = ±1,±2,...,± ( N − 1), Fs (u ) = Fs ( −u )
T e1 T e2 A= ⋅ ⋅ ⋅ eT 2 N
CX矩阵与其特征值λi和特征向量ei应符合关系:
C X ei = λi ei
i = 1,2,..., N
2
λ1 λ2 CY = ⋅⋅⋅ ⋅⋅⋅ λN 2
式中:m X
= E{X }
M −1 −1 i =0
M个向量的平均值向量由下式定义:
1 mX ≈ M
M −1
∑ Xi
M −1
X向量的协方差矩阵:
1 CX = M
1 T T ∑( Xi − mX )(Xi − mX ) = M [ ∑Xi Xi ] − mX mX i=0 i=0
T
令λi和ei是协方差矩阵CX的特征值和对应的特征向量:
一维离散偶余弦逆变换公式:
f ( x) =
1 2 N −1 2x +1 C (0) + ∑ C (u ) cos( 2 N uπ ) N N n =1
2、离散K-L变换表达式 K
Y = A( X − m X )
X - m x 是中心化图像向量
可得到K-L变换结果向量Y的协方差矩阵为:
CY = E{(Y − mY )(Y − mY ) }
第7讲 图像编码概述
数字图像处理技术-2016-01
7. 3 PCM编码
线性PCM 编码
一般采用等长码,也就是说每一个码字都有相同的比特数。其中
用得最为普遍的是自然二进码,也有用格雷码的。以M=8为例的自然 二进码和格雷码列入表(5—2)。
数字图像处理技术-2016-01
表5.2
M=8的自然二进码和格雷码
输入
m1
自然二进码 0 0 0
数字图像处理技术-2016-01
(5—11)
7. 3 PCM编码
由式(5—11)可见,每增加一位码可得到6dB的 信噪比得益。 值得注意的是量化噪声不同于其他噪声,它 的显著特点是仅在有信号输入时才出现,所以 它是数字化中特有的噪声。一般情况下,直接 测量比较困难。
数字图像处理技术-2016-01
7. 3 PCM编码
式中 Ns 为过载噪声,x 是输入信号值,p(x)为输入 幅度的概率密度。如果用信噪比作为客观保真度准则
的话,可推得PCM 编码在均匀量化下的量化信噪比
如下:
数字图像处理技术-2016-01
7. 3 PCM编码
因为
V 2n 2 PQ 12
所以
V2 n 2 (2 ) PQ 12
2
g ( j, k ) f ( j, k )
数字图像处理技术-2016-01
图像压缩系统评价
2、 主观保真度:主观评价
图像处理的结果,绝大多数场合是给人观看,由研究人员来解释
的,因此,图像质量的好坏与否,既与图像本身的客观质量有关,也
与人的视觉系统的特性有关。
把图像显示给观察者,然后把评价结果加以平均,以此来评价一幅
0 0 1
格雷码 0 0 0
图像编码中的预测编码原理与应用(一)
图像编码是数字图像处理领域中非常重要的一项技术,它可以将图像数据通过压缩的方式储存和传输。
而在图像编码中,预测编码是一种常见且有效的编码方法。
本文将从预测编码的原理和应用两个方面进行论述,以帮助读者更好地了解图像编码中的预测编码。
一、预测编码的原理预测编码的基本原理是利用当前像素点与其周围像素点之间的相关性进行编码。
在图像中,相邻像素点之间往往存在一定的空间相关性和统计相关性。
预测编码利用这些相关性,推断当前像素点的取值,并与其真实取值之间的差异进行编码。
主要应用的原理有如下两种。
空间域预测编码空间域预测编码是一种基于像素点之间空间相关性的编码方法。
它通过分析当前像素点与其周围像素点之间的关系,以预测当前像素点的取值。
一般常用的预测方法有平均预测、最近邻预测和线性预测等。
当预测得到当前像素点的取值后,再对其与真实取值之间的差异进行编码传输。
这种编码方法可以在一定程度上减小了重复信息的传输,从而实现了图像数据的压缩。
统计域预测编码统计域预测编码是一种将当前像素点与周围像素点的统计相关性应用于编码的方法。
其核心思想是通过分析图像中不同像素点之间的统计规律,并基于这种规律进行编码。
主要应用的方法有上下文建模和自适应预测等。
在统计域预测编码中,一个重要的概念是熵编码,即根据不同像素点的概率分布进行编码传输。
这种编码方法可以充分利用图像中像素点之间的统计规律,提高编码效率。
二、预测编码的应用预测编码在图像编码领域有着广泛的应用。
下面将从图像压缩和图像传输两个方面具体介绍其应用。
图像压缩图像压缩是预测编码最常见的应用之一。
通过预测当前像素点的取值,并与真实取值之间的差异进行编码,可以大大减小图像数据的冗余信息,从而实现压缩效果。
预测编码方法可以利用空间域和统计域的相关性,提高压缩比,同时也能保持较好的图像质量。
图像传输在图像传输中,预测编码可以减少图像数据的传输量,提高传输速度。
通过预测和编码的方式,只需传输图像数据的差异部分,而不需要传输全部的像素点信息。
数字图像处理-预测编码
预测编码
预测编码是根据某一模型利用以往的样本值对于新样 本值进行预测,然后将样本的实际值与其预测值相减 得到一个误差值,然后对这一误差值进行编码。
E{[X N(a1X1 a2 X2 ... aN1X N1)]X N1} 0
即: E{[X N Xˆ N ]Xi} 0
... ...
令Xi和Xj的协方差Rij为:
Rij E{xi , x j}
E{[X N(a1X1 a2 X2 ... aN1X N1)]X1} 0 E{[X N(a1X1 a2 X2 ... aN1X N1)]X2} 0
tN时抽样值的线性预测值为:
Xˆ = ai X i= a1X1 + a2 X2 +...+ aN-1X N-1
定义XN的均方误差为:
E{[X N Xˆ N ]2}
ai
E{[ X N
Xˆ N
]2}
ai
E{[ X
N(a1X1
a2 X 2
... aN 1X N 1)]2}
预测方式简介:
前一行
X6
X2 X3
X4 X7
现在行 X5 X1 X
前值预测:利用同一扫描行中前面最邻近像素值来预测。 一维预测:利用同一扫描行中前面若干个像素值来预测。 二维预测:利用同一扫描行和前几扫描行中若干个像素值来预测。
三维预测:利用同一扫描行和前几扫描行以及前几帧中的若干个 像素值来预测。
在搜索范围内寻找某一块使其与被匹配的块的差平方或
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
... ...
E { X N [ ( a 1 X 1 a 2 X 2 . .a N . 1 X N 1 )X 1 ] } 0 E { X N [ ( a 1 X 1 a 2 X 2 . .a N . 1 X N 1 )X 2 ] } 0
E { X N [ ( a 1 X 1 a 2 X 2 . .a N . 1 X N 1 )X i ] } 0
e' = emax e' = emin
m自动增大 m自动减小
2、自适应量化
根据图像局部区域的特点,自适应地修改和调整量化器的 参数。
五、帧间预测编码
帧间编码技术处理的对象是序列图像(Sequence Image)
狭义帧间预测:设 xˆ = x'
则预测误差为:
=x-xˆ
复合差值预测:xˆ=x' -(A-A')
设有一幅静止黑白图像,经过逐帧逐行扫描而获得的图像信号是 一个均值为0、方差为2 的平稳随机过程,X(t)在t1,t2,…,tn-1 时刻抽样值分别为X1,X2,…,XN-1 ;
tN时抽样值的线性预测值为:
X ˆ= a i X i= a 1 X 1 + a 2 X 2 + .+ .a . N - 1 X N - 1
E { X N [ ( a 1 X 1 a 2 X 2 . .a N . 1 X N 1 )X N ] 1 } 0
即:
E {X [NX ˆN]Xi}0
... ...
令Xi和Xj的协方差Rij为:
RijE{xi,xj}
E { X N [ ( a 1 X 1 a 2 X 2 . .a N . 1 X N 1 )X 1 ] } 0 E { X N [ ( a 1 X 1 a 2 X 2 . .a N . 1 X N 1 )X 2 ] } 0
E { X N [ ( a 1 X 1 a 2 X 2 . .a N . 1 X N 1 )X i ] } 0
E { X N [ ( a 1 X 1 a 2 X 2 . .a N . 1 X N 1 )X N ] 1 } 0
上式可以写成为:
R N = ia 1 iR 1 j+ a 2 iR 2 j+ .+ .a .N - 1 ,iR N - 1 ,j
预测方式简介:
前一行
X6
X2 X3
X4 X7
现在行 X5 X1 X
前值预测:利用同一扫描行中前面最邻近像素值来预测。 一维预测:利用同一扫描行中前面若干个像素值来预测。 二维预测:利用同一扫描行和前几扫描行中若干个像素值来预测。
三维预测:利用同一扫描行和前几扫描行以及前几帧中的若干个 像素值来预测。
运动补偿技术的实质是跟踪画面内的运动情况并对其加 以补偿之后再进行帧间预测。
运动向量的估值方法(块匹配算法):
fk (m,n) :当前帧图像亮度信号; fk-Ns (m,n) :前一次传送的图像信号;
假设: 当前帧中的一个M N子块是从第k-Ns帧平行移动而来, 并设M N子块内所有像素都具有一个位移值(i,j);同时运动 物体在帧差时间内水平和垂直最大位移均为L。
MSE是均方误差,MAD是帧间绝对值,取MSE或MAD最小时 的i,j值就是水平和垂直的偏移量。
在搜索范围内寻找某一块使其与被匹配的块的差平方或
绝对值达到最小,就认为子块已经匹配,得到水平和垂直 位移(i,j)。
则预测误差为:
=x-x ˆ=(x-x ˆ)-(A -A ')
1、条件补充法
如果帧间各对应像素的亮度差超过阈值,则把这些像素存 在缓冲存储器中,并以恒定的传输速度传送;而阈值以下的像 素则不传送,在接收端用上一帧相应像素值来代替。
条件补充法和内插法相结合应用,称为条件次取样。
2、运动补偿技术(motion comபைடு நூலகம்ensation)
四、自适应预测编码(ADPCM)
Adaptive Differential Pulse Code Modulation
预测器的预测系数和量化器的量化参数,能够根据图像 的局部区域分布特点而自动调整。
1、自适应预测
f ˆ ( i ,j ) = a 1 f ( i ,j - 1 ) + a 2 f ( i - 1 ,j - 1 ) + a 3 f ( i - 1 ,j )
定义XN的均方误差为:
E{X [ NXˆN]2}
ai
E{[XNXˆN]2}
a iE {X N [ (a 1 X 1 a 2 X 2 . .a .N 1 X N 1 )2 } ]
2 E { X N [ ( a 1 X 1 a 2 X 2 . .a N . 1 X N 1 )X i ] }
计算两帧中子块的相关函数:
MN
fk(m,n)fkNs(mi,nj)
NC(iC ,j)F m1n1 MN
1 MN
1
[
fk2(m,n)]2[
fk2Ns(mi,nj)2 ]
m1n1
m1n1
当相关函数NCCF(i,j)达到最小值时,它的i和j值就认定为子 块的水平和垂直位移值。
增加一个可变参数m得:
f ˆ ( i ,j ) = m • [ a 1 f( i ,j - 1 ) + a 2 f( i - 1 ,j - 1 ) + a 3 f( i - 1 ,j )
设量化器最大输出为emax,最小输出为emin,对于一个误差的量 化输出为e'
当:
emin<e' <emax
m不变
为了减小计算工作量,常用下式代替:
MN
M (i,S j) m E in [fk(m ,n ) fk N s(m i,n j)2] m 1n 1
或
MN
M(i,A j) m Din fk(m ,n ) fk N s(m i,n j) m 1n 1
线性预测编码 预测编码
非线性预测编码
帧内预测编码 预测编码
帧间预测编码
二、线性预测(DPCM)基本原理
像素点的实际灰度值: X N 像素点的预测灰度值: Xˆ N
预测误差: eN =XN-XˆN
Xˆ N 为根据tN时刻以前已知的像素亮度取样值X1,X2,…,XN-1 对XN所作的预测值;
e N 为差值信号,也称误差信号;
q N 为量化器的量化误差,
e
' N
为量化器输出信号
qN =eN -eN '
接收端输出为:
XN ' =XˆN+eN '
在接收端复原的像素值与发射端的原输入像素值之间的 误差为:
XN-XN '
=q N
结论:DPCM系统中的误差来源是发射端的量 化器,而与发射端无关;如果去掉量化器,就 可以完全无失真地恢复输入信号,从而实现信 息保持编码。 三、最佳线性预测
预测编码
预测编码是根据某一模型利用以往的样本值对于新样 本值进行预测,然后将样本的实际值与其预测值相减 得到一个误差值,然后对这一误差值进行编码。
一、预测编码的基本原理
预测编码方法是从相邻像素之间的强的相关性特点出发, 即:当前像素的灰度或颜色信号的数值可用前面已出现的像 素的值,进行预测,得到一个预测值,然后将其与实际值求 差,对这个差值信号进行编码、传送。