视频图像压缩编码基本原理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
预测编码方案
一维预测:同一行的相邻像素来预测当前像素。 二维预测:同一行及相邻行的数个像素来预测当 前像素。 三维预测:帧间预测,是利用帧间的相关性,使 用前一帧图像同一位置上的像素来预测当前像素。 常用的一种预测器优化设计准则是最小均方误差 (MMSE)准则。
运动补偿预测法
一、运动估值: 对运动物体的位移作出估计。即对运动物体从 前一帧到当前帧位移的方向和像素数作出估计。 (求出运动矢量) 二、运动补偿预测 根据求出的运动矢量,找到当前帧的像素是从 前一帧的哪个位置移动过来的,从而得到当前 帧像素的预测值。
行程编码
行程编码(Run-length Coding)是相对简单 的编码技术,主要思路是将一个相同值的连续 串用一个代表值和串长来代替。 游程编码的压缩率不高, 但编码、 解码的速 度快, 仍被得到广泛的应用, 特别是在变换 编码后再进行游程编码, 有很好的效果。 行程编码对传输差错很敏感,一位符号出错就 会改变行程编码的长度,从而使整个图像出现 偏移,因此一般要用行同步、列同步的方法把 差错控制在一行一列之内。
离散余弦变换(DCT,Discrete Cosine Transform)
– – – –
量化编码
对DCT变换后的(频率的) 系数进行量化 量化目的是降低非“0” 系数的幅度以及增加“0” 值系数的数目 用图5-4所示的均匀量化 器量化 量化是造成图像质量下 降的最主要原因 ˆ (u , v ) ro u n d ( F (u , v ) ) F 量化用右式计算 Q (u , v )
视频图像压缩编码方法
——按压缩编码算法原理分类 基于图像统计特性编码: 1、预测编码 2、变换编码 3、霍夫曼编码 4、算术编码 5、游程编码 基于人眼视觉特性编码: 1、子带编码 2、多分辨率编码 3、矢量量化 4、形状编码 5、纹理编码
预测编码
一、基本原理
由图像的统计特性可知,相邻像素之间有着较强的相关
算术编码
算术编码是另一种常用的变字长编码,利用信源 概率分布特性、能够趋近熵极限的编码方法。它的编 码过程与 Huffman 编码不相同,而且在信源概率分布 比较均匀的情况下其编码效率高于 Huffman 编码。它 和 Huffman 编码最大的区别在于它不是使用整数码。 算术编码是把各符号出现的概率表示在单位概率 [0,1] 区间之中,区间的宽度代表概率值的大小。符 号出现的概率越大对应于区间愈宽,可用较短码字表 示;符号出现概率越小对应于区间愈窄,需要较长码 字表示。
量 化 DCT 系数输出 DCT 系数输入百度文库
量化编码分类
标量量化 输入信号的所有分量 使用同一个量化器进行 量化,每个分量的量化 都和其它分量无关,也 称为零记忆量化。
矢量量化 从码本集合中选出 最适配于输入信号的一 个码字作为输入信号的 近似,这种方法以输入 信号与选出的码字之间 失真最小为依据。
预测编码、变换编码、量化 编码和熵编码的基本原理
第三组 成员:李楠0915231028 王冰冰0915231050
视频图像压缩编码的基本原理
一是利用图像信号的统计性质。图像信号间存 在较强的相关性,有大量的冗余可供压缩,并 且这种冗余度在解码后可以无失真恢复。 二是利用人眼的视觉特性,在不被主观视觉察 觉的容限内,通过减少表示信号的精度,以一 定的客观失真换取数据压缩。
性,即相邻像素的灰度值相同或相近,因此,某像素的
值可根据以前已知的几个像素值来估计、来猜测,正是 由于像素间的相关性,才使预测成为可能。 二、基本思想 模型→利用以往的样本数据→对下一个新的样本值进 行预测→ 将预测所得的值与实际值的差值进行编码→ 由于差值很小,可以减少编码的码位。
DPCM系统原理框图
运动物体的帧间位移
K-1帧时运动物体中心 位于(X1,Y1),该 物体在K帧时移动到了 (X1+dx,Y1+dy),该 物体移动了MV= (dx,dy),这就是运动 矢量。
, x1
y
1
运动矢量估计不足
运动估计是利用视频图像的时域相关性, 产生的运动矢量,尽可能准确地描述对象(块 或宏块)的时域运动。因此运动矢量的精度越 高,运动估计的残差越小,这样在降低码率的 同时提高重建视频质量。同理,运动矢量估计 不足,引起某个帧出错同时影响到后面的帧, 从而影响到重建视频的质量。
视频图像信号的冗余度
空间冗余:图像的相邻像素相关,帧内相关性。 时间冗余:相邻视频帧对应像素之间相关,帧 间相关性 结构冗余:图像的像素值存在着明显的分布模 式。 知识冗余:有些图像与某些知识有相当大的相 关性,这类规律性的结构可由先验知识得到。 视觉冗余:人眼具有视觉非均匀特性, 对视 觉不敏感的信息可以适当地舍弃。
变换编码的系统原理框图
变换编码方法
KL变换
– –
最佳变换编码方法 变换矩阵不是恒定的,需要临时计算 准最佳变换,利用三角函数进行的一种变换 DCT的基向量由余弦函数构成 一维DCT变换和二维DCT变换,变换后输出DCT变换系数,将 幅度变成频率 广泛应用于图像与视频压缩中,如JPG,MPEG
6 8 1 09 1 03 7 7 8 1 1 04 1 13 9 2 1 03 1 21 1 20 1 01 1 12 1 00 1 03 9 9
色度量化步长表
17 18 24 47 99 99 99 99 18 21 26 66 99 99 99 99 24 26 56 99 99 99 99 99 47 66 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99
矢量量化与标量量化相比有更大的数据压缩能力。
亮度量化步长表
16 12 14 14 18 24 49 72 11 12 13 17 22 35 64 92 10 14 16 22 37 55 78 95 16 19 24 29 56 64 87 98 24 26 40 51 40 58 57 87 51 60 69 80 61 55 56 62
熵编码
熵编码(Entropy Coding)是无损编码,用这 种编码结果经解码后可无失真地恢复出原图像。 熵编码的目的就是要使编码后的图像平均码长 R尽可能接近图像熵H,一般是根据图像灰度 级数出现的概率大小赋予不同长度码字,出现 概率大的灰度级用短码字,出现概率小的灰度 级用长码字。可以证明,这样的编码结果所获 得的平均码字长度最短。 熵编码方法:霍夫曼编码、算术编码、行程编 码等。
霍夫曼编码
Huffman编码是一种利用概率分布特性从下到 上的编码方法,是一种统计最优的变码长符号 编码,编码效率最高。 Huffman编码构造出来的编码值不是唯一的。 Huffman编码对不同的信源其编码效率是不同 的。 Huffman 码是非歧义的,在解码过程中,每个 符号的编码都是唯一可译的。
变换编码
变换编码的基本概念就是将原来在空间域上描述 的图像等信号,通过一种数学变换(常用二维正交变 换如傅立叶变换、离散余弦变换、沃尔什变换等), 变换到变换域中进行描述,达到改变能量分布的目的,
即将图像能量在空间域的分散分布变为在变换域的能
量的相对集中分布,达到去除相关性的目的,再经过 适当的方式量化编码,进一步压缩图像。
霍夫曼编码步骤
将输入信号符号以出现概率由大至小为序排成 一列。 将两处最小概率的符号相加合成为一个新概率, 再按出现概率的大小排序。 重复步骤(2), 直至最终只剩两个概率。 编码从最后一步出发逐步向前进行, 概率大 的符号赋予“0”码, 另一个概率赋予“1”码, 直至到达最初的概率排列为止。