L34-合集-大学-多媒体技术基础与应用-课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多媒体数据压缩的分类
无损压缩
无损压缩算法是为保留原始多媒体对象 (包括图像、语音和视频)而设计的。在无 损压缩中,数据在压缩或解压缩过程中不会 改变或损失,解压缩产生的数据是对原始对 象的完整复制。
有损压缩
▪ 有损压缩是指使用压缩后的数据进行重构,
重构后的数据与原来的数据有所不同,但 不会使人对原始资料表达的信息造成误解。
空间冗余图片示例
时间冗余
时间冗余是视频中常见的一种冗余。在 视频序列中,相邻帧往往包含有相同的背景 和运动物体,只是运动物体的位置有所变化, 因此相邻两帧的数据差别较小,具有时间上 的连贯性。如果编码时不考虑这一相关性, 就会造成时间冗余。
时间冗余示例
视觉冗余
▪ 视觉冗余是针对人眼的视觉特性而言的。 人对图像的敏感性是非均匀、非线性的, 例如视觉系统对亮度比对色度敏感,对低 频信号比对高频信号敏感等特性。
均值为0的波形。所谓“小”是指它具有衰减性; 而称之为“波”则是指它的波动性,其振幅正负 相间的震荡形式。与傅立叶变换相比,小波变换 是时间(空间)频率的局部化分析,它通过伸缩平 移运算对信号(函数)逐步进行多尺度细化 (Multiscale Analysis),最终达到高频处时间 细分,低频处频率细分,能自动适应时频信号分 析的要求,从而可聚焦到信号的任意细节,解决 了傅立叶变换不能解决的许多困难问题,
离散余弦变换
▪ 离散余弦变换(DCT:Discrete Cosine
Transformation)具有快速算法,且易于实现等 优点,它的快速算法已可由专用芯片来实现,因 而被广泛采用。离散余弦变换方法研究较早,技 术成熟,图像压缩实践证明DCT是许多图像的最 佳变换,它允许将88图像的空间表达式转换为频 率域,只需要少量的数据点来表示图像。
另一种压缩技术是不对称压缩,是指压缩和 解压缩的运算速率是互不相同的。
第一代编码技术
▪ 1948年,Oliver提出了第一个编码理论——脉冲
编码调制;同年,Shannon的经典论文——“通 信的数学原理”首次提出并建立了信息率失真函 数概念;1959年,Shannon进一步确立了码率失 真理论,以上工作奠定了信息编码的理论基础。
▪ 源图像在进行DCT变换之前,首先把源图像
划分为若干个8×8像素的子块,然后对8×8像素 块逐一进行FDCT变换。例如,如果源图像为 640480的分辨率(即由640480像素组成,则划 分后的图像将包含8060这样多的子块。
离散余弦变换的理解
离散余弦变换的理解
▪ 假设每个像素的灰度值(或颜色值)用8比特
行程编码
▪ RLE所能获得的压缩比有多大,主要取决于
图像本身的特点。如果图像中具有相同颜色的图 像块越大,图像块数目越少,则获得的压缩比就 越高。反之,压缩比就越小。译码时按照与编码 时采用的相同规则进行,还原后得到的数据与压 缩前的数据完全相同,由此可见,RLE是一种无 损压缩技术。
行程编码示例
香农-范诺编码示例分析
香农-范诺编码步骤
香农-范诺编码示例
▪ 在最终得到的编码树中,拥有较大频率的3个
符号(ADB)被两位编码,其他两个频率较低的 符号(EC)被三位编码。如下表所示:
霍夫曼编码步骤
1.信源符号按概率递减顺序排列; 2.把两个最小的概率加起来,作为新符号 的概率; 3.重复步骤⑴与⑵,直到概率和等于1为 止; 4.完成上述步骤后,再沿路径返回进行编 码。
空间冗余
空间冗余是静态图像中最主要的一种冗余。例如, 通常的图像都描述了某个场景,其相邻像素点之间 存在一定的空间连贯性。如果编码时不考虑这一相 关性,就会造成空间冗余。
由于任何给定的像素值,原理上都可以通过它 的邻域值预测到,单个像素携带的信息相对是小的。 对于一个图像,很多单个像素对视觉的贡献是冗余 的。
预测编码
预测编码是数据压缩理论的一个重要分支, 它是根据离散信号之间存在着一定的相关性, 利用前面的一个或多个信号对下一信号进行 预测,然后对实际值和预测值的差值进行编 码。就图像压缩而言,预测编码可分为帧内 预测和帧间预测两种类型。
10.2 无失真压缩编码
▪ 无失真压缩编码也称熵编码。它是利用信源
算术编码的实现步骤
▪ 算术编码进行编码时,从实数区间[0,1)开始。
按照符号的频度将当前的区间分割成多个子区间。 根据当前输入的符号选择对应的子区间,然后从 选择的子区间中继续进行下一轮的分割。不断的 进行这个过程,直到所有符号编码完毕。对于最 后选择的一个子区间,输出属于该区间的一个小 数。这个小数就是所有数据的编码。
小波压缩效果示例(压缩比:50:1)
小波变换在JPEG 2000图像压缩的应用
10.5 其他编码
LZW编码 ▪ LZW算法中,首先建立一个字符串表,把每
一个第一次出现的字符串放入串表中,并用一个 数字来表示,这个数字与此字符串在串表中的位 置有关,并将这个数字存入压缩文件中,如果这 个字符串再次出现时,即可用表示它的数字来代 替,并将这个数字存入文件中。压缩完成后将串 表丢弃因此,在词典编码中仅仅把字符串看成是 一个号码,而不去管它代表什么意思。
▪ “第二代”编码方法主要有:基于分形的编码、
基于模型的编码、基于区域分割的编码和基于神 经网络的编码等。
第三代编码技术
▪ 近年来,出现了一类充分利用人类视觉特
性的编码方法,有人称之为第三代编码技 术,如小波变换的编码。这类方法使用不 同类型的线性数字滤波方法,对视频(图 像)进行整体的分解,然后根据人类视觉 特性对不同频段的数据进行粗细不同的量 化处理,以达到更好的压缩效果。
离散余弦变换
▪ DCT压缩过程中最关键的步骤是一个称为
DCT的数学变换。DCT和著名的快速傅立叶变换 (FFT)属于同一类数学运算,这类变换的基本 运算是将信号从一种表达形式变成另一种表达形 式,并且这种变换过程是可逆的,即在两个变换 过程中除开舍入误差和截断误差,本质是无损失 的。
离散余弦变换的理解
算术编码的算法定义
算术编码的示例
信源的算术编码过程
信源的算术编码过程
10.3 预测编码
▪ 预测编码是有损数据压缩理论的一个重 要分支,它是根据离散信号之间存在着一 定的相关性,利用前面的一个或多个信号 对下一信号进行预测,然后对实际值和预 测值的差进行编码。
DPCM-差分脉冲编码
▪ DPCM(Differential Pulse Code
的统计特性,减少信源所具有的冗余度而缩短了 码长的编码方法。由于熵编码没有丢失信源所持 有的信息量,所以是无失真数据压缩,可以从接 收的熵码中正确解码原始信息。
▪ 常见的熵编码有:香农编码、霍夫曼编码、
行程编码和算术编码等。
香农-范诺编码方法
▪ 香农-范诺编码方法:将符号从最大可能到最
少可能排序,将排列好的信源符号分化为两大组, 使两组的概率和近于相同,并各赋予一个二元码 符号“0”和“1”。只要组内有两个或两个以上 符号,就以同样的方法重复以上分组,以此确定 这些符号的连续编码数字。依次下去,直至每一 组只剩下一个信源符号为止。
ADPCM编码框图
10.4 变换编码
▪ 变换编码是一种有损编码方法,采用不同的
变换方式,压缩的数据量和压缩速度都不一样。 典型的变换编码有离散余弦变换、KL变换,以及 近来流行的小波变换等。实践证明,无论对单色 图像、彩色图像、静态图像还是运动图像,变换 编码都是非常有效的方法,变换编码抗干扰性较 好,有比预测编码更高的压缩比,其缺点是易于 产生方块效应。
一些术语和概念
▪ 压缩(compress) ▪ 解压缩/还原/重构(decompress) ▪ 编码(encode/coding) ▪ 解码/译码(decode)
信息冗余的几种形式
▪ 信息熵冗余
▪ 为表达数据需要用一系列符号,用这些符号
根据一定的规则来表达就是对数据的编码。对每 个信息或事件所赋的符号序列称为码字,而每个 码字里的符号个数称为码字的长度。
霍夫曼编码示例分析
霍夫曼编码示例
平均码长和信源符号的信息熵H(x)
行程编码
▪ 在一幅图像中具有许多颜色相同的图
块。在这些图块中,许多行上都具有相同 的颜色,或者在一行上有许多连续的像素 都具有相同的颜色值。不需要存储每一个 像素的颜色值,而仅仅存储一个像素的颜 色值,以及具有相同颜色的像素数目即可, 这种压缩编码称为行程长度编码,用 RLE(Run Length Encoding)表示。
数据压缩与编码的基本概念
▪ 信息冗余是传输消息所用数据位的数目与
消息中所包含的实际信息的数据位的数目 的差值。数据压缩是一种用来消除不需要 的冗余的方法。
▪ 多媒体数据存在大量的冗余,通过去除那
些冗余数据可以使原始数据极大地减少, 因此,多媒体数据压缩编码技术就是研究 如何利用多媒体数据的冗余性来减少数据 量的方法。
分形编码
▪ 大自然中许多常见的不规则的复杂现象,如
山峦和云团的外形.曲折的海岸线等。它们处处 无规则可言,但整体与其局部有相似性,因而导 致了分形理论。
▪ 分形最早是由IBM研究中心的数学家Benoit
第10章 数据压缩与编码技术
▪ 10.1 数据压缩编码技术概述 ▪ 10.2 变换编码 ▪ 10.5 其他编码
10.1 数据压缩编码技术概述
▪ 信息为什么能压缩? ▪ 从信息论的角度来看,压缩就是去掉信息
中的冗余,即保留不确定的信息,去除确 定的信息(可推知的),也就是用一种更接 近信息本质的描述来代替原有冗余的描述。
来表示,那么共有256个灰度等级(0~255)。这 样,可以定义一个8行×8列的二维矩阵P来表示 图像子块中各像素的灰度值和颜色值(P[x][y]表示 第x行第y列的值),利用离散余弦变换公式,于是 可得到变换以后的频率域矩阵T。
离散余弦变换的理解
小波变换
▪ 顾名思义,“小波”就是小区域、长度有限、
DPCM工作原理方框图
自适应差分脉冲编码-ADPCM
▪ 自适应差分脉冲编码就是使量化间隔大小的
变化自动地去适应输入信号大小的变化。它根据 信号分布不均匀的特点,使系统具有随输入信号 的变化而改变量化区间的大小,以保持输入量化 器的信号基本均匀的能力。自适应量化必须具有 对输入信号的幅值进行估计的能力,有了估值才 能确定相应的改变量。若估值在信号的输入端进 行,称前馈自适应;若在量化输出端进行,称反 馈自适应。
▪ 通常声音、图像与视频的数据压缩都采用
有损压缩。有损数据压缩方法通常需要在 压缩速度、压缩数据大小以及质量损失这 三者之间进行折衷。
对称压缩和不对称压缩
压缩技术的基本方式有两种:即对称压缩和 不对称压缩。
在对称压缩中,压缩的算法和解压缩的算法 是一样的。它是一种可逆操作。对称压缩的 优点在于双方都以同一种速度进行操作。
Modulation,差分脉冲编码调制)与PCM不同, 它编码的不是采样样本值,而是样本值及其预测 值的差分,即量化的是已知的样本值与预测值之 间的差值。DPCM是从过去的几个采样值的线性 组合来预测推断现在的采样值,进而用实际采样 值与预测采样值之差(称作预测误差)及线性预 测系数进行编码,从而达到信息压缩的一种方法。
例如对一个由16*10像素组成的小图像,每个小 格表示一个像素,设每个像素的颜色值用8位表示, 试用行程编码表示。
行程编码示例
算术编码的基本思想
▪ 实现算术编码首先需要知道信源发出每个符
号的概率大小,然后再扫描符号序列,依次分割 相应的区间,最终得到符号序列所对应的码字。 整个编码需要两个过程,即概率模型建立过程和 扫描编码过程。显然,一串符号序列发生的概率 越大,对应的子区间就越宽,要表达它所用的比 特数就减少,因而相应的码字就越短。
▪ 主要编码方法有预测编码、变换编码和统计编
码,也称为三大经典编码方法。经典编码技术又 可以称为“第一代”编码技术。
“第二代”编码方法
“第一代”编码技术只是以信息论和数字信号处 理技术为理论基础,旨在去除图像数据中的线性相 关性的一类编码技术。 “第二代”编码技术充分利用人的视觉生理、心理 和图像信源的各种特征,实现从“波形”编码到 “模型”编码的转变,以便获得更高压缩比。
相关文档
最新文档