数据压缩与编码技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

时间冗余示例
多媒体技术基础与应用
视觉冗余

视觉冗余是针对人眼的视觉特性而言的。 人对图像的敏感性是非均匀、非线性的, 例如视觉系统对亮度比对色度敏感,对低 频信号比对高频信号敏感等特性。
多媒体技术基础与应用
多媒体数据压缩的分类
多媒体技术基础与应用
无损压缩
无损压缩算法是为保留原始多媒体对象 (包括图像、语音和视频)而设计的。在无 损压缩中,数据在压缩或解压缩过程中不会 改变或损失,解压缩产生的数据是对原始对 象的完整复制。
多媒体技术基础与应用
第三代编码技术
近年来,出现了一类充分利用人类视觉特
性的编码方法,有人称之为第三代编码技 术,如小波变换的编码。这类方法使用不 同类型的线性数字滤波方法,对视频(图 像)进行整体的分解,然后根据人类视觉 特性对不同频段的数据进行粗细不同的量 化处理,以达到更好的压缩效果。
多媒体技术基础与应用
多媒体技术基础与应用
香农-范诺编码示例分析
多媒体技术基础与应用
香农-范诺编码步骤
多媒体技术基础与应用
香农-范诺编码示例

在最终得到的编码树中,拥有较大频率的3个 符号(ADB)被两位编码,其他两个频率较低的 符号(EC)被三位编码。如下表所示:
多媒体技术基础与应用
霍夫曼编码步骤
1.信源符号按概率递减顺序排列; 2.把两个最小的概率加起来,作为新符号 的概率; 3.重复步骤⑴与⑵,直到概率和等于1为 止; 4.完成上述步骤后,再沿路径返回进行编 码。
多媒体技术基础与应用
有损压缩
有损压缩是指使用压缩后的数据进行重构,
重构后的数据与原来的数据有所不同,但 不会使人对原始资料表达的信息造成误解。 通常声音、图像与视频的数据压缩都采用 有损压缩。有损数据压缩方法通常需要在 压缩速度、压缩数据大小以及质量损失这 三者之间进行折衷。
多媒体技术基础与应用
多媒体技术基础与应用
离散余弦变换的理解

源图像在进行DCT变换之前,首先把源图像 划分为若干个8×8像素的子块,然后对8×8像素 块逐一进行FDCT变换。例如,如果源图像为 640480的分辨率(即由640480像素组成,则划 分后的图像将包含8060这样多的子块。
多媒体技术基础与应用
离散余弦变换的理解
多媒体技术基础与应用
数据压缩与编码的基本概念
信息冗余是传输消息所用数据位的数目与
消息中所包含的实际信息的数据位的数目 的差值。数据压缩是一种用来消除不需要 的冗余的方法。 多媒体数据存在大量的冗余,通过去除那 些冗余数据可以使原始数据极大地减少, 因此,多媒体数据压缩编码技术就是研究 如何利用多媒体数据的冗余性来减少数据 量的方法。
多媒体技术基础与应用
离散余弦变换

离散余弦变换(DCT:Discrete Cosine Transformation)具有快速算法,且易于实现等 优点,它的快速算法已可由专用芯片来实现,因 而被广泛采用。离散余弦变换方法研究较早,技 术成熟,图像压缩实践证明DCT是许多图像的最 佳变换,它允许将88图像的空间表达式转换为频 率域,只需要少量的数据点来表示图像。
多媒体技术基础与应用
离散余弦变换

DCT压缩过程中最关键的步骤是一个称为 DCT的数学变换。DCT和著名的快速傅立叶变换 (FFT)属于同一类数学运算,这类变换的基本 运算是将信号从一种表达形式变成另一种表达形 式,并且这种变换过程是可逆的,即在两个变换 过程中除开舍入误差和截断误差,本质是无损失 的。
多媒体技术基础与应用
DPCM工作原理方框图
多媒体技术基础与应用
自适应差分脉冲编码-ADPCM

自适应差分脉冲编码就是使量化间隔大小的 变化自动地去适应输入信号大小的变化。它根据 信号分布不均匀的特点,使系统具有随输入信号 的变化而改变量化区间的大小,以保持输入量化 器的信号基本均匀的能力。自适应量化必须具有 对输入信号的幅值进行估计的能力,有了估值才 能确定相应的改变量。若估值在信号的输入端进 行,称前馈自适应;若在量化输出端进行,称反 馈自适应。
多媒体技术基础与应用
离散余弦变换的理解

假设每个像素的灰度值(或颜色值)用8比特 来表示,那么共有256个灰度等级(0~255)。这 样,可以定义一个8行×8列的二维矩阵P来表示 图像子块中各像素的灰度值和颜色值(P[x][y]表示 第x行第y列的值),利用离散余弦变换公式,于是 可得到变换以后的频率域矩阵T。
多媒体技术基础与应用
离散余弦变换的理解
多媒体技术基础与应用
小波变换

顾名思义,“小波”就是小区域、长度有限、 均值为0的波形。所谓“小”是指它具有衰减性; 而称之为“波”则是指它的波动性,其振幅正负 相间的震荡形式。与傅立叶变换相比,小波变换 是时间(空间)频率的局部化分析,它通过伸缩平 移运算对信号(函数)逐步进行多尺度细化 (Multiscale Analysis),最终达到高频处时间 细分,低频处频率细分,能自动适应时频信号分 析的要求,从而可聚焦到信号的任意细节,解决 了傅立叶变换不能解决的许多困难问题,
多媒体技术基础与应用
霍夫曼编码示例分析
多媒体技术基础与应用
霍夫曼编码示例
多媒体技术基础与应用
平均码长和信源符号的信息熵H(x)
多媒体技术基础与应用
行程编码

在一幅图像中具有许多颜色相同的图 块。在这些图块中,许多行上都具有相同 的颜色,或者在一行上有许多连续的像素 都具有相同的颜色值。不需要存储每一个 像素的颜色值,而仅仅存储一个像素的颜 色值,以及具有相同颜色的像素数目即可, 这种压缩编码称为行程长度编码,用 RLE(Run Length Encoding)表示。
多媒体技术基础与应用
“第二代”编码方法
“第一代”编码技术只是以信息论和数字信号处 理技术为理论基础,旨在去除图像数据中的线性相 关性的一类编码技术。 “第二代”编码技术充分利用人的视觉生理、心理 和图像信源的各种特征,实现从“波形”编码到 “模型”编码的转变,以便获得更高压缩比。 “第二代”编码方法主要有:基于分形的编码、 基于模型的编码、基于区域分割的编码和基于神 经网络的编码等。
多媒体技术基础与应用
一些术语和概念
压缩(compress)
解压缩/还原/重构(decompress) 编码(encode/coding)
解码/译码(decode)
多媒体技术基础与应用
信息冗余的几种形式
信息熵冗余

为表达数据需要用一系列符号,用这些符号 根据一定的规则来表达就是对数据的编码。对每 个信息或事件所赋的符号序列称为码字,而每个 码字里的符号个数称为码字的长度。
多媒体技术基础技术基础与应用
算术编码的示例
多媒体技术基础与应用
信源的算术编码过程
多媒体技术基础与应用
信源的算术编码过程
多媒体技术基础与应用
10.3 预测编码

预测编码是有损数据压缩理论的一个重 要分支,它是根据离散信号之间存在着一 定的相关性,利用前面的一个或多个信号 对下一信号进行预测,然后对实际值和预 测值的差进行编码。
1948年,Oliver提出了第一个编码理论——脉冲
编码调制;同年,Shannon的经典论文——“通 信的数学原理”首次提出并建立了信息率失真函 数概念;1959年,Shannon进一步确立了码率失 真理论,以上工作奠定了信息编码的理论基础。 主要编码方法有预测编码、变换编码和统计编 码,也称为三大经典编码方法。经典编码技术又 可以称为“第一代”编码技术。
第10章 数据压缩与编码技术
10.1 数据压缩编码技术概述
10.2 无失真压缩编码
10.3 预测编码
10.4 变换编码
10.5 其他编码
多媒体技术基础与应用
10.1 数据压缩编码技术概述
信息为什么能压缩? 从信息论的角度来看,压缩就是去掉信息
中的冗余,即保留不确定的信息,去除确 定的信息(可推知的),也就是用一种更接 近信息本质的描述来代替原有冗余的描述。
多媒体技术基础与应用
行程编码示例
例如对一个由16*10像素组成的小图像,每个小 格表示一个像素,设每个像素的颜色值用8位表示, 试用行程编码表示。
多媒体技术基础与应用
行程编码示例
多媒体技术基础与应用
算术编码的基本思想

实现算术编码首先需要知道信源发出每个符 号的概率大小,然后再扫描符号序列,依次分割 相应的区间,最终得到符号序列所对应的码字。 整个编码需要两个过程,即概率模型建立过程和 扫描编码过程。显然,一串符号序列发生的概率 越大,对应的子区间就越宽,要表达它所用的比 特数就减少,因而相应的码字就越短。
多媒体技术基础与应用
空间冗余
空间冗余是静态图像中最主要的一种冗余。例如, 通常的图像都描述了某个场景,其相邻像素点之间 存在一定的空间连贯性。如果编码时不考虑这一相 关性,就会造成空间冗余。 由于任何给定的像素值,原理上都可以通过它 的邻域值预测到,单个像素携带的信息相对是小的。 对于一个图像,很多单个像素对视觉的贡献是冗余 的。
多媒体技术基础与应用
DPCM-差分脉冲编码

DPCM(Differential Pulse Code Modulation,差分脉冲编码调制)与PCM不同, 它编码的不是采样样本值,而是样本值及其预测 值的差分,即量化的是已知的样本值与预测值之 间的差值。DPCM是从过去的几个采样值的线性 组合来预测推断现在的采样值,进而用实际采样 值与预测采样值之差(称作预测误差)及线性预 测系数进行编码,从而达到信息压缩的一种方法。
多媒体技术基础与应用
ADPCM编码框图
多媒体技术基础与应用
10.4 变换编码

变换编码是一种有损编码方法,采用不同的 变换方式,压缩的数据量和压缩速度都不一样。 典型的变换编码有离散余弦变换、KL变换,以及 近来流行的小波变换等。实践证明,无论对单色 图像、彩色图像、静态图像还是运动图像,变换 编码都是非常有效的方法,变换编码抗干扰性较 好,有比预测编码更高的压缩比,其缺点是易于 产生方块效应。
预测编码
预测编码是数据压缩理论的一个重要分支, 它是根据离散信号之间存在着一定的相关性, 利用前面的一个或多个信号对下一信号进行 预测,然后对实际值和预测值的差值进行编 码。就图像压缩而言,预测编码可分为帧内 预测和帧间预测两种类型。
多媒体技术基础与应用
10.2 无失真压缩编码

无失真压缩编码也称熵编码。它是利用信源 的统计特性,减少信源所具有的冗余度而缩短了 码长的编码方法。由于熵编码没有丢失信源所持 有的信息量,所以是无失真数据压缩,可以从接 收的熵码中正确解码原始信息。 常见的熵编码有:香农编码、霍夫曼编码、 行程编码和算术编码等。
多媒体技术基础与应用
行程编码

RLE所能获得的压缩比有多大,主要取决于 图像本身的特点。如果图像中具有相同颜色的图 像块越大,图像块数目越少,则获得的压缩比就 越高。反之,压缩比就越小。译码时按照与编码 时采用的相同规则进行,还原后得到的数据与压 缩前的数据完全相同,由此可见,RLE是一种无 损压缩技术。
对称压缩和不对称压缩
压缩技术的基本方式有两种:即对称压缩和 不对称压缩。 在对称压缩中,压缩的算法和解压缩的算法 是一样的。它是一种可逆操作。对称压缩的 优点在于双方都以同一种速度进行操作。 另一种压缩技术是不对称压缩,是指压缩和 解压缩的运算速率是互不相同的。
多媒体技术基础与应用
第一代编码技术
多媒体技术基础与应用
香农-范诺编码方法

香农-范诺编码方法:将符号从最大可能到最 少可能排序,将排列好的信源符号分化为两大组, 使两组的概率和近于相同,并各赋予一个二元码 符号“0”和“1”。只要组内有两个或两个以上 符号,就以同样的方法重复以上分组,以此确定 这些符号的连续编码数字。依次下去,直至每一 组只剩下一个信源符号为止。
多媒体技术基础与应用
算术编码的实现步骤

算术编码进行编码时,从实数区间[0,1)开始。 按照符号的频度将当前的区间分割成多个子区间。 根据当前输入的符号选择对应的子区间,然后从 选择的子区间中继续进行下一轮的分割。不断的 进行这个过程,直到所有符号编码完毕。对于最 后选择的一个子区间,输出属于该区间的一个小 数。这个小数就是所有数据的编码。
多媒体技术基础与应用
空间冗余图片示例
多媒体技术基础与应用
时间冗余
时间冗余是视频中常见的一种冗余。在 视频序列中,相邻帧往往包含有相同的背景 和运动物体,只是运动物体的位置有所变化, 因此相邻两帧的数据差别较小,具有时间上 的连贯性。如果编码时不考虑这一相关性, 就会造成时间冗余。
多媒体技术基础与应用
相关文档
最新文档