多媒体技术PPT-第三章多媒体数据压缩(2)
合集下载
多媒体信息处理技术之多媒体数据的分类及特点(ppt 61页)
Navigator浏览器中的LiveAudio也支持AIFF格
式,SGI及其它专业音频软件包也同样支持AIFF
格式。AIFF支持ACE2、ACE8、MAC3和MAC6
压缩,支持16位44.1kHz立体声。
MP3相关知识:
MP3全称是动态影像专家压缩标准音频层 面3(Moving Picture Experts Group Audio Layer III)。是当今较流行的一种 数字音频编码和有损压缩格式,它设计用 来大幅度地降低音频数据量,而对于大多 数用户来说重放的音质与最初的不压缩音 频相比没有明显的下降。它是在1991年由 位于德国埃尔朗根的研究组织FraunhoferGesellschaft的一组工程师发明和标准化 的。
3.按声音格式 声卡处理的声音信息在计算机中以文
件的形式存储。Windows使用的标准数字 音频文件称为波形文件,扩展名为WAV; 扩展名为VOC的声音文件主要用于DOS程 序;扩展名为MID的文件用于存储MIDI类 声音信息;它比WAV文件更节省空间。声 音存储文件的格式有很多种,除以上介绍 的以外,经常用到的还有AIF、MP3等。
地进行大小和音质的改良,而不影响旧有的编码器或播
放器。
补充:目前最好的有损格式之一,MP3部分支持,
智能手机装软件部分可以支持,最高比特率500kbps。
(三)图形、图像
在计算机中,一般将图形分为两大类: 矢量图 矢量图英文为 Vector ,将它称做为图形,矢量
图对于每个对象来说都是自成一体的实体,就可以在维持它 原有清晰度和弯曲度的同时,多次移动和改变它的属性,而 不会影响图例中的其他对象。矢量图与分辨率没有任何关系。 所以这就意味着它们可以按最高分辨率显示到输出设备上。
多媒体数据压缩技术ppt课件
多媒体数据压缩技术
• PCM是概念上最简单、理论上最完善的编 码系统,是最早研制成功、使用最为广泛 的编码系统,它仅仅是对输入信号进行采 样和量化,但也是数据量最大的编码系统
• 下图中的“防失真滤波器”是一个低通滤 波器,用来滤除声音频带以外的信号; “波形编码器”可暂时理解为“采样器”, “量化器”可理解为“量化阶大小(stepsize)”生成器或者称为“量化间隔”生成 器。
• 利用子带编码达到既压缩声音数据又尽可 能保留声音原有质量的目的。
• 这种方法的具体思想是首先把时域中的声 音数据变换到频域中的多个子带当中,对 每个子带里的信号分别进行量化和编码, 根据心理声学模型确定样本的精度,从而 达到压缩数据量的目的。
完整最新ppt Tianjin University
SLIDE 16
③ 层3的编码器最为复杂,编码器的输出数 据率为64 kb/s,广泛用于INTERNET传播。
完整最新ppt Tianjin University
SLIDE 14
音频压缩标准
• MPEG-1 Audio (ISO/IEC 11172-3)压缩算 法是世界上第一个高保真声音数据压缩国 际标准,并且得到了极其广泛的应用。虽 然MPEG声音标准是MPEG标准的一部分,但 它也完全可以独立应用。数据的输入/输 出图如下:
SLIDE 1
频域分析
信号频谱X(f)代表了信号在不同频率分量成分的大小,能够 提供比时域信号波形更直观,丰富的信息。
幅值
时域分析
频域分析
完整最新ppt Tianjin University
SLIDE 2
频域分析
时域和频域的 对应关系
完整最新ppt Tianjin University
多媒体信息的数据压缩PPT课件
3) 对上面得到的树林重复 2 的做法,直到所有符号都连入树中为止。这一步完成后,我们有这样的二叉树:
根(root)
0|1
+------+----------------+
|
0|
1
|
+---------+-----------+
|
0 |1 0 | 1
a
+-------+------+ +-------+-------+
编辑版pppt
20
(1)、行程编码(RLE) RLE 编码是将数据流中连续出现的
字符用单一记号表示。 例如,字符串AAABCDDDDDDDDBBBBB
可以压缩为3ABC8D5B 。
RLE编码简单直观,编码/解码速度 快,因此许多图形和视频文件,如.BMP .TIFF及AVI等格式文件的压缩均采用此 方法.
1、信息存储量之比 2、压缩的算法 3、恢复效果
大 简单 好
编辑版pppt
6
1.5.2 数据压缩方法
压缩处理一般是由两个过程组成: 一是编码过程,即将原始数据经过编码 进行压缩,以便存储与传输;二是解码 过程,此过程对编码数据进行解码,还 原为可以使用的数据。
数据压缩可分为两种类型:一种叫 做无损压缩,另一种叫做有损压缩。
2. 时间冗余
3. 视觉冗余
编辑版pppt
2
空间冗余
一幅图像表面上各采样点的颜色之 间往往存在着空间连贯性,基于离散像 素采样来表示物体表面颜色的像素存储 方式可利用空间连贯性,达到减少数据 量的目的。
例如,在静态图像中有一块表面颜 色均匀的区域,在此区域中所有点的光 强和色彩以及饱和度都是相同的,因此 数据有很大的空间冗余。
根(root)
0|1
+------+----------------+
|
0|
1
|
+---------+-----------+
|
0 |1 0 | 1
a
+-------+------+ +-------+-------+
编辑版pppt
20
(1)、行程编码(RLE) RLE 编码是将数据流中连续出现的
字符用单一记号表示。 例如,字符串AAABCDDDDDDDDBBBBB
可以压缩为3ABC8D5B 。
RLE编码简单直观,编码/解码速度 快,因此许多图形和视频文件,如.BMP .TIFF及AVI等格式文件的压缩均采用此 方法.
1、信息存储量之比 2、压缩的算法 3、恢复效果
大 简单 好
编辑版pppt
6
1.5.2 数据压缩方法
压缩处理一般是由两个过程组成: 一是编码过程,即将原始数据经过编码 进行压缩,以便存储与传输;二是解码 过程,此过程对编码数据进行解码,还 原为可以使用的数据。
数据压缩可分为两种类型:一种叫 做无损压缩,另一种叫做有损压缩。
2. 时间冗余
3. 视觉冗余
编辑版pppt
2
空间冗余
一幅图像表面上各采样点的颜色之 间往往存在着空间连贯性,基于离散像 素采样来表示物体表面颜色的像素存储 方式可利用空间连贯性,达到减少数据 量的目的。
例如,在静态图像中有一块表面颜 色均匀的区域,在此区域中所有点的光 强和色彩以及饱和度都是相同的,因此 数据有很大的空间冗余。
第6讲—第三章 数据压缩技术(2)
6
变换编码原理 ● 变换编码 (Transform coding) 卡胡南·劳埃夫变换 卡胡南 劳埃夫变换 有损压缩编码, 图像数据)的压缩 有损压缩编码,用于对统计冗余 (图像数据 的压缩。 离散傅里叶变换 图像数据 的压缩。 离散余弦变换 WHT变换 变换
● 工作原理 然后在频域上对变换后的信号进行编码。在频域上, 然后在频域上对变换后的信号进行编码。在频域上, 信息是按照频谱的能量和频率分布进行排列的。 信息是按照频谱的能量和频率分布进行排列的。 统计编码原理
编码方法得到的代码为: 用RLE编码方法得到的代码为:80315084180。 编码方法得到的代码为 。 ● 编码特点 [1] 适合于拥有大面积相同颜色区域的图像 出现极限情况,即每个相邻的像素颜色均不相同, [2] 出现极限情况,即每个相邻的像素颜色均不相同,这时经过 RLE压缩出来的数据串会比原数据串长一倍 压缩出来的数据串会比原数据串长一倍
12
算术编码原理 ● 算术编码 —— 无损压缩编码,属于统计编码。 无损压缩编码,属于统计编码。 20世纪 年代由 世纪60年代由 提出, 世纪 年代由Elias提出,某些方面优于霍夫曼编码。因此, 提出 某些方面优于霍夫曼编码。因此, 标准的扩展系统中, 在JPEG标准的扩展系统中,算术编码已经取代了霍夫曼编码。 标准的扩展系统中 算术编码已经取代了霍夫曼编码。 ● 基本原理 将被编码的信息表示成实数轴上0和 之间的间隔 信息越长,间隔越小, 之间的间隔, 将被编码的信息表示成实数轴上 和1之间的间隔,信息越长,间隔越小, 表示这一间隔所需的二进制位数就越多。 表示这一间隔所需的二进制位数就越多。 ● 特点 1) 算术编码有基于概率统计的固定模式,也有相对灵活的自适应模式。 算术编码有基于概率统计的固定模式,也有相对灵活的自适应模式。 2) 自适应模式适用于不进行概率统计的场合。 自适应模式适用于不进行概率统计的场合。 3) 当信号源符号的出现概率接近时,算术编码的效率高于霍夫曼编码。 当信号源符号的出现概率接近时,算术编码的效率高于霍夫曼编码。 4) 算术编码的实现相应地比霍夫曼编码复杂,但在图像测试中表明, 算术编码的实现相应地比霍夫曼编码复杂,但在图像测试中表明, 算术编码效率比霍夫曼编码效率高5%左右。 算术编码效率比霍夫曼编码效率高 %左右。
变换编码原理 ● 变换编码 (Transform coding) 卡胡南·劳埃夫变换 卡胡南 劳埃夫变换 有损压缩编码, 图像数据)的压缩 有损压缩编码,用于对统计冗余 (图像数据 的压缩。 离散傅里叶变换 图像数据 的压缩。 离散余弦变换 WHT变换 变换
● 工作原理 然后在频域上对变换后的信号进行编码。在频域上, 然后在频域上对变换后的信号进行编码。在频域上, 信息是按照频谱的能量和频率分布进行排列的。 信息是按照频谱的能量和频率分布进行排列的。 统计编码原理
编码方法得到的代码为: 用RLE编码方法得到的代码为:80315084180。 编码方法得到的代码为 。 ● 编码特点 [1] 适合于拥有大面积相同颜色区域的图像 出现极限情况,即每个相邻的像素颜色均不相同, [2] 出现极限情况,即每个相邻的像素颜色均不相同,这时经过 RLE压缩出来的数据串会比原数据串长一倍 压缩出来的数据串会比原数据串长一倍
12
算术编码原理 ● 算术编码 —— 无损压缩编码,属于统计编码。 无损压缩编码,属于统计编码。 20世纪 年代由 世纪60年代由 提出, 世纪 年代由Elias提出,某些方面优于霍夫曼编码。因此, 提出 某些方面优于霍夫曼编码。因此, 标准的扩展系统中, 在JPEG标准的扩展系统中,算术编码已经取代了霍夫曼编码。 标准的扩展系统中 算术编码已经取代了霍夫曼编码。 ● 基本原理 将被编码的信息表示成实数轴上0和 之间的间隔 信息越长,间隔越小, 之间的间隔, 将被编码的信息表示成实数轴上 和1之间的间隔,信息越长,间隔越小, 表示这一间隔所需的二进制位数就越多。 表示这一间隔所需的二进制位数就越多。 ● 特点 1) 算术编码有基于概率统计的固定模式,也有相对灵活的自适应模式。 算术编码有基于概率统计的固定模式,也有相对灵活的自适应模式。 2) 自适应模式适用于不进行概率统计的场合。 自适应模式适用于不进行概率统计的场合。 3) 当信号源符号的出现概率接近时,算术编码的效率高于霍夫曼编码。 当信号源符号的出现概率接近时,算术编码的效率高于霍夫曼编码。 4) 算术编码的实现相应地比霍夫曼编码复杂,但在图像测试中表明, 算术编码的实现相应地比霍夫曼编码复杂,但在图像测试中表明, 算术编码效率比霍夫曼编码效率高5%左右。 算术编码效率比霍夫曼编码效率高 %左右。
中职教育-《多媒体技术及应用教程》第三版课件:第3章 多媒体关键技术(电子工业出版社).ppt
• ቤተ መጻሕፍቲ ባይዱVD概述
DVD盘光道之间的间距由原来的1.6m m缩小到0.74m m, 而记录信息的最小凹凸坑长度由原来的0.83m m缩小到 0.4m m
3.1.5 DVD简介
• DVD概述
加大盘的数据记录区域也是提高记录容量的有效途径。 DVD盘的记录区域从CD盘的86 cm2提高到86.6 cm
提高DVD存储容量的另一个重要措施是使用盘片的两个 面来记录数据,以及在一个面上制作好几个记录层。当 然,这无疑会大大增加DVD盘的容量。
3.2.4 动态图像MPEG压缩编码技术
• 运动补偿预测 • 运动补偿插值
3.3 多媒体网络技术
3.3.1系统组成及特点 3.3.2音频和视频信息处理的网络需求 3.3.3多媒体通信网 3.3.4Internet 与TCP/IP
3.3.1 系统组成及特点
• 多媒体通信的体系结构 (5个方面) • 多媒体通信具有以下3个特点。
3.3.3 多媒体通信网
• 基于局域网的多媒体通信网
➢ 双绞线 ➢ 同轴电缆 ➢ 光缆 ➢ 无线通信 ➢ 卫星通信 ➢ 传输介质的选择
3.3.3 多媒体通信网
• 基于宽带网的多媒体通信网
➢ ISDN ➢ ADSL ➢ Cable Modem ➢ STB机顶盒
3.3.4 Internet 与TCP/IP
3.2.2 数据压缩压缩算法
• 无损压缩编码
➢霍夫曼编码 ➢算术编码 ➢行程编码 ➢Lempel zev编码
3.2.2 数据压缩压缩算法
• 霍夫曼编码的实际编码过程按照如下步骤进行: • ①将信源符号概率按递减顺序排列。 • ②将两个最小出现概率进行合并相加,得到的结果作
为新符号的出现概率。 • ③重复这二个步骤,直到概率达到1.0为止。 • ④在每对组合中的上部指定为1(或0),下部指定为0
DVD盘光道之间的间距由原来的1.6m m缩小到0.74m m, 而记录信息的最小凹凸坑长度由原来的0.83m m缩小到 0.4m m
3.1.5 DVD简介
• DVD概述
加大盘的数据记录区域也是提高记录容量的有效途径。 DVD盘的记录区域从CD盘的86 cm2提高到86.6 cm
提高DVD存储容量的另一个重要措施是使用盘片的两个 面来记录数据,以及在一个面上制作好几个记录层。当 然,这无疑会大大增加DVD盘的容量。
3.2.4 动态图像MPEG压缩编码技术
• 运动补偿预测 • 运动补偿插值
3.3 多媒体网络技术
3.3.1系统组成及特点 3.3.2音频和视频信息处理的网络需求 3.3.3多媒体通信网 3.3.4Internet 与TCP/IP
3.3.1 系统组成及特点
• 多媒体通信的体系结构 (5个方面) • 多媒体通信具有以下3个特点。
3.3.3 多媒体通信网
• 基于局域网的多媒体通信网
➢ 双绞线 ➢ 同轴电缆 ➢ 光缆 ➢ 无线通信 ➢ 卫星通信 ➢ 传输介质的选择
3.3.3 多媒体通信网
• 基于宽带网的多媒体通信网
➢ ISDN ➢ ADSL ➢ Cable Modem ➢ STB机顶盒
3.3.4 Internet 与TCP/IP
3.2.2 数据压缩压缩算法
• 无损压缩编码
➢霍夫曼编码 ➢算术编码 ➢行程编码 ➢Lempel zev编码
3.2.2 数据压缩压缩算法
• 霍夫曼编码的实际编码过程按照如下步骤进行: • ①将信源符号概率按递减顺序排列。 • ②将两个最小出现概率进行合并相加,得到的结果作
为新符号的出现概率。 • ③重复这二个步骤,直到概率达到1.0为止。 • ④在每对组合中的上部指定为1(或0),下部指定为0
多媒体数据压缩
式中,E为信息熵,N为数据的种类(或称码元)个数, Pi为第i个码元出现的概率。 一组数据的数据量显然等于各记录码元的二进制位数 (即编码长度)与该码元出现的概率乘积之和,即
N 1
D pibi i0
式中,D为数据量,为第i个码元的二进制位数。
一般取 b0 b1 bN1(如ASCII编码把所有码元都编码为7
16
下列哪一种说法是正确的: A. 信息量等于数据量与冗余量之和 B. 信息量等于信息熵与数据量之差 C. 信息量等于数据量与冗余量之差 D. 信息量等于信息熵与冗余量之和
17
6.1.3 数据压缩技术的发展过程
20世纪40年代,人们开始系统地研究数据压缩技术;主要表现在 数据压缩算法方面:
首先是Claude Shannon与R.M.Fano的Shannon-Fano编码方法; 1952年,D.A.Huffman提出了Huffman编码方法; 1968年,P.Elias 发展了Shannon-Fano编码,构造出更为完美的 Shannon-Fano-Elias 编码。 1976年,J.Rissanen 提出了一种可以成功地逼近信息熵极限的编码 方法——算术编码。 1982年,Rissanen 和ngdon 一起改进了算术编码。 1977年,Jacob Ziv和Abraham Lempel提出了LZ77编码算法,78年 又作了改进,被称为LZ78编码算法。 1984年,Terry Welch提出了LZ78算法的变种算法——LZW。 LZ77、LZ78、LZW三种压缩技术就是目前无损压缩领域中最为流 行的、被称为“字典式编码”的压缩技术。
M=D-∆d 其中M表示实际媒体信息,D表示数字化后的采 样数据,∆d表示数据冗余量。
数据压缩就是从采样数据中去除冗余,即保留原始信息 中变化的、特征性信息,去除重复的、确定的或可推知的 信息,在实现更接近实际媒体信息描述的前提下,尽可能 的减少描述用的信息量。
N 1
D pibi i0
式中,D为数据量,为第i个码元的二进制位数。
一般取 b0 b1 bN1(如ASCII编码把所有码元都编码为7
16
下列哪一种说法是正确的: A. 信息量等于数据量与冗余量之和 B. 信息量等于信息熵与数据量之差 C. 信息量等于数据量与冗余量之差 D. 信息量等于信息熵与冗余量之和
17
6.1.3 数据压缩技术的发展过程
20世纪40年代,人们开始系统地研究数据压缩技术;主要表现在 数据压缩算法方面:
首先是Claude Shannon与R.M.Fano的Shannon-Fano编码方法; 1952年,D.A.Huffman提出了Huffman编码方法; 1968年,P.Elias 发展了Shannon-Fano编码,构造出更为完美的 Shannon-Fano-Elias 编码。 1976年,J.Rissanen 提出了一种可以成功地逼近信息熵极限的编码 方法——算术编码。 1982年,Rissanen 和ngdon 一起改进了算术编码。 1977年,Jacob Ziv和Abraham Lempel提出了LZ77编码算法,78年 又作了改进,被称为LZ78编码算法。 1984年,Terry Welch提出了LZ78算法的变种算法——LZW。 LZ77、LZ78、LZW三种压缩技术就是目前无损压缩领域中最为流 行的、被称为“字典式编码”的压缩技术。
M=D-∆d 其中M表示实际媒体信息,D表示数字化后的采 样数据,∆d表示数据冗余量。
数据压缩就是从采样数据中去除冗余,即保留原始信息 中变化的、特征性信息,去除重复的、确定的或可推知的 信息,在实现更接近实际媒体信息描述的前提下,尽可能 的减少描述用的信息量。
三多媒体信息的压缩PPT优秀资料
频分辨率和视频显示分辨率(显示的像素点数)。 颜色数:指视频中最多能使用的颜色数。颜色位数越多,色彩越逼真,
数据量也越大。 压缩比:压缩比较小时对图像质量不会有太大影响,而超过一定倍数后,
将会明显看出图像质量下降,而且压缩比越大在回放时花费在解压的时 间越长。 关键帧:视频数据具有很强的帧间相关性,动态视频压缩正是利用帧间 相关性的特点,通过前后两个关键帧动态合成中间的视频帧。因此对于 含有频繁运动的视频图像序列,关键帧数少就会出现图像不稳定的现象。
JPEG主要不同的地方。而JPEG X2
0.
创作环境:用于创作的整套硬件、固化软件(永久性内建在硬件里的软件)和软件。
MPEG采用了帧间数据压缩、运动补偿和双向预测,这是和JPEG主要不同的地方。
分析合成方法,如LPC
和 MPEG 相 同 的 地 方 均 采 用 了 (2)模拟音频信号幅度太大,超过了量化器范围。
音频冗余主要表现为时域冗余度、频域冗 余度。
音频信号的编码方式大致分为三大类: 1).波形编码,如PCM、APC、SDC、ATC 2).分析合成方法,如LPC 3).混合编码方法
6.了解音频信号压缩编码标准,影响音频 信号质量的因素
7.视频信号压缩编码的标准(JPEG、 MPEG)
1).多媒体系统中图像压缩方法主要利用消除图像在空间上和时间上很强的相 关性带来的数据冗余度来满足应用要求。分为有损压缩和无损压缩两种类型。
另外,MPEG中视频信号包含有静止画面(帧内图)和运动 信息(帧间预测图)等不同的内容,量化器的设计比JPEG 压缩算法中量化器的设计考虑的因素要多。
难点分析2:
关于压缩比 衡量一个压缩算法好坏的标准,除了解压后的数据有无失真
或失真程度之外,是看压缩比的大小。压缩比常用的定义有 两种: 采样压缩比 采样压缩比=压缩前输入的总采样数/压缩后输出的总采样数 由于计算机中信号都是数字信号,通常要增加一些信息,以 便顺利解压。因此,下面的比特压缩比更实用。 比特压缩比 比特压缩比=压缩前输入的总比特数/压缩后输出的总比特数 不管具体采用哪种定义来计算压缩比,显然这两种定义都能 反映压缩前数据同压缩后数据之比。
数据量也越大。 压缩比:压缩比较小时对图像质量不会有太大影响,而超过一定倍数后,
将会明显看出图像质量下降,而且压缩比越大在回放时花费在解压的时 间越长。 关键帧:视频数据具有很强的帧间相关性,动态视频压缩正是利用帧间 相关性的特点,通过前后两个关键帧动态合成中间的视频帧。因此对于 含有频繁运动的视频图像序列,关键帧数少就会出现图像不稳定的现象。
JPEG主要不同的地方。而JPEG X2
0.
创作环境:用于创作的整套硬件、固化软件(永久性内建在硬件里的软件)和软件。
MPEG采用了帧间数据压缩、运动补偿和双向预测,这是和JPEG主要不同的地方。
分析合成方法,如LPC
和 MPEG 相 同 的 地 方 均 采 用 了 (2)模拟音频信号幅度太大,超过了量化器范围。
音频冗余主要表现为时域冗余度、频域冗 余度。
音频信号的编码方式大致分为三大类: 1).波形编码,如PCM、APC、SDC、ATC 2).分析合成方法,如LPC 3).混合编码方法
6.了解音频信号压缩编码标准,影响音频 信号质量的因素
7.视频信号压缩编码的标准(JPEG、 MPEG)
1).多媒体系统中图像压缩方法主要利用消除图像在空间上和时间上很强的相 关性带来的数据冗余度来满足应用要求。分为有损压缩和无损压缩两种类型。
另外,MPEG中视频信号包含有静止画面(帧内图)和运动 信息(帧间预测图)等不同的内容,量化器的设计比JPEG 压缩算法中量化器的设计考虑的因素要多。
难点分析2:
关于压缩比 衡量一个压缩算法好坏的标准,除了解压后的数据有无失真
或失真程度之外,是看压缩比的大小。压缩比常用的定义有 两种: 采样压缩比 采样压缩比=压缩前输入的总采样数/压缩后输出的总采样数 由于计算机中信号都是数字信号,通常要增加一些信息,以 便顺利解压。因此,下面的比特压缩比更实用。 比特压缩比 比特压缩比=压缩前输入的总比特数/压缩后输出的总比特数 不管具体采用哪种定义来计算压缩比,显然这两种定义都能 反映压缩前数据同压缩后数据之比。
多媒体数据压缩基础PPT31页
三 结构冗余 图像大面积上存在着重复出现的相同
或相近的纹理结构,称为结构冗余
四 知识冗余 人对图像的理解与图像所表现内容的
基础知识有相当大的相关性,从中可以 总结出某种规律性变化
五 视觉冗余 图像数据中存在着大量人眼觉察不到
的细节
2.2 图像数据压缩算法 数据编码的前提:数字化 数据压缩的目的:便于存储和传输
2.2.2 哈夫曼编码 基本思路:出现频率越高的值其对应的编 码长度越短,反之出现频率越低的值其对 应的编码长度越长
编码步骤
1 统计信号源出现的概率 2 将信号源符号按概率递减顺序排列 3 把两个最小的概率值加起来,作为一个 新组合符号的概率
4 重复步骤2、3,直到概率和达到1为止 5 在每次合并信号源时,将合并的信号源 分别标记1和0 6 寻找从每一信号源符号到概率为1的路 径,记录下路径上的1和0 7 对每一符号写出1和0序列
2.2.3 预测编码 预测:用先前像素数据对当前像素数据进 行预计,将预测数据与实际数据的差值进 行熵编码 差分编码调制(DPCM) 其基本原理是基 于图像中相连像素之间的相关性,每个像 素可通过与之相关的几个像素来作预测。
例:假设输入信号已经量化差值不再进 行量化。系统输入为(0,1,2,1,1, 2,3,3,4,4…..)
压缩算法标准评价: 压缩比 指压缩编码后的数据与原始数 据大小的比值 算法的复杂性和运算速度 失真度
要求:压缩比要大。既压缩前后所需的 信息存储量之比要大 实现压缩的算法要简单,压缩/解压缩速 度要快,尽可能地做到适时压缩/解压缩 恢复效果要好,尽可能恢复原来的数据
编码的分类:(按编码前后数据是否一 致分类) 1) 无损编码:解码后的数据与编码前 的数据完全一致,没有任何失真 2) 有损编码:解码后的数据与原始数 据有一定程度的失真
多媒体技术ppt好资源-第03讲多媒体数据压缩基础
符号 A B
CD
E
出现的次数 15 7
7
6
5
H(S) = (15/40)* (40/15) + (7/40)* (40/7) + + (5/40) * (40/5) =2.196
这就是说每个符号用2.196位表示,40个象素需用87.84位
Shannon-Fano编码例1
符号
A
B C D E
出现的次
– e=01100101 – 空=00100000
压缩比为:72/192=
等长与不等长编码
• 不等长编码方法
– 字符 次数 概率 码字 字长
– E 8 1/3 0 1
– D 4 1/6 100 3
– C 4 1/6 101 3
– 空 4 1/6 110 3
–a
2 1/12 1110 4
– B 2 1/12 1111 4
● 数据压缩的可能性 P16
[1] 空间冗余—— 规则物体的物理相关性 [2] 时间冗余—— 视频与动画画面间的相关性 [3] 统计冗余—— 具有空间冗余和时间冗余 [4] 结构冗余—— 规则纹理、相互重叠的结构表面 [5] 信息熵冗余—— 编码冗余,数据与携带的信息 [6] 视觉冗余—— 视觉、听觉敏感度和非线性感觉 [7] 知识冗余—— 凭借经验识别
●压缩和解压缩速度
● 在许多应用中,压缩和解压可能不同时用,在不同的位置不 同的系统中。所以,压缩、解压速度分别估计。静态图象中, 压缩速度没有解压速度严格;动态图象中,压缩、解压速度都 有要求,因为需实时地从摄像机或VCR中抓取动态视频。
教学进程
3.2数据压缩编码简介
(3) 数据压缩编码分类
• 无损压缩
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对语音波形的分析表明,取样数据的最大 相关性存在于邻近样本之间。当取样频率 为8kHz时,相邻取样值间的相关系数大于 0.85;甚至在相距10个样本之间,还可有 0.3左右的数量级。如果取样速率提高, 样本间的相关性将更强。因而根据这种较 强的一维相关性,利用N阶差分编码技术, 可以进行有效的数据压缩。
Source: /wiki/Image:Ulaw_alaw.png
33
选作作业
采用滤波的方法能否滤出量化噪声?为什 么? 某信号幅度介于[-5V, 5V](动态范围是 10V),要求 NoiseRMS 小于5mV,计算需 要的量化精度(即bit数)
自适应增量调制
思路:自动调整量化阶△的大小;在检测 到斜率过载的时候增大△,在输入信号斜 率减小时降低△ CFDM(Constant Factor Adaptive DM)
根据量化器符号的判断当前区域是斜率过载 还是颗粒噪声,进而改变△ 如果连续出现三个相同值△加大,反之减小
CVSD(Continuously Variable Slope DM)
人们在描述声音信号的时候 采用了这样两种思想,同样 在音频编码方面也存在类似 的两种思想 21
第三章 多媒体数据压缩
§3.1 无损数据压缩 §3.2 音频数据的压缩标准
§3.2.1 话音编码基础 §3.2.2 三种话音编码器
波形编译码器 音源编译码器 混合编译码器
§3.2.3 MPEG Audio §3.2.4 移动通信网中的音频编码
不利用生成话音信号的知识产生而是产生一种 重构信号,重构信号的波形和原始话音波形尽 可能一致,这种编译码器的复杂程度低。 PCM(脉冲编码调制)
波形编码代表
24
Review
声卡的工作原理
采样
量化
编码
25
脉冲编码调制(PCM)
26
量化误差的概念
一道简单的概率计算题:某仪器表盘的刻 度单位是0.2,读取刻度时选取偏差最小的 刻度。请计算利用该仪器读取测量数值的 误差小于0.04的概率是多大?误差大于 0.05的概率是多大?
男声“Every salt breeze comes from the sea”
17
(6)长时自相关函数
上述样本、周期间的一些相关性,都是在 20ms时间的间隔内进行统计的所谓短时自 相关。如果在较长的时间间隔(比如几十 秒)进行统计,便得到长时自相关函数。 长时统计表明,8kHz的取样语音的相邻样 本间,平均相关系数高达0.9。 SRD---short Range dependent LRD---long Range dependent
19
语音特有的短时功率谱密度
Review
用比特串表示的声音
用一个“阶梯化”的波形尽可能精确地去 模拟一个真实的声音波形(采样频率、样 本精度) 用一系列基本信号尽可能逼真地合成一个 模拟世界的声音
Байду номын сангаас
20
Review
殊途同归
思路一:针对现有的信号波形,将实际波 形进行数字化的纪录 思路二:针对波形信号的特性,尽量从数 学角度寻求一个统一的描述方法
34
增量调制(△M)
△调制(Delta Modulation,DM)是PCM编码 的一种变形。PCM是对每个采样信号的 整个幅度进行量化编码,因此它具有对 任意波形进行编码的能力;DM是对实际 的采样信号与预测的采样信号之差的极 性进行编码,将极性变成“0”和“1”这 两种可能的取值之一。由于DM编码只须 用1位对话音信号进行编码,所以DM编 码系统又称为“1位系统”。 35
39
SACD(Super Audio CD)
DSD
40
―绝对” vs. ―相对”
绝对数值和相对数值均可以表示信息,根 据需要可以择其一 绝对和相对的互相转换 表示文件位置的绝对路径与相对路径 电脑屏幕上的绝对坐标与相对坐标
41
自适应脉冲编码调制 (APCM)
前向自适应
后向自适应
自适应脉冲编码调制 (Adaptive Pulse Code Modulation,APCM)是 根据输入信号幅度大小 来改变量化阶大小的一 种波形编码技术。
频域信息的冗余度
人的听觉感知机理
11
(1)幅度的非均匀分布
统计表明,语音中的小幅度样本比大幅度 样本出现的概率要高。又由于通话中必然 会有间隙,更出现了大量的低电平样本。 此外,实际讲话信号功率电平也趋向于出 现在编码范围的较低电平端。因此,语音 信号取样值的幅度分布是非均匀的。
12
(2)样本间的相关
Analog signals Digital signals 如家用音响的Hi-Fi功放 AV功放
趋势
10
音频信号的冗余
时域信息的冗余度
幅度的非均匀分布、样本间的相关 、周期之 间的相关、基音之间的相关 、静音系数 、长 时自相关函数
非均匀的长时功率谱密度 语音特有的短时功率谱密度
编码结果为: 0 100 101 110 111
0100100110101111 BDDACE 1100100110101111 ABDACE
6
RLE讨论
WWWWWWWBWWWWWWWWWW WBBB 7W1B11W3B WBWBWBWBWBWBWB 1W1B1W1B1W1B1W1B1W1B1W1B1W1 B
2
e(t)
0.5DV
DV DV 2 e(t ) t 2 T DV 2t 2 DV 2t DV 2 2 T T 4
t T
1 T RMS e(t ) 2 dt T 0
- 0 . 5D V
NoiseRMS
DV 2 12 29
SNR
假定信号为正弦波形 2 N -1 DV sin t
13
(3)周期之间的相关
当声音中只存在少数几个频率时,就会像某些振 荡波形一样,在周期与周期之间,存在着一定的 相关性。利用语音周期之间信息冗余度的编码器, 比仅仅只利用邻近样本间的相关性的编码器效果 要好,但要复杂得多。
14
(4)基音之间的相关
第一类称为浊音 (voiced sound), 一种准周期脉冲激励 所发出的音。浊音表 现在音节上有高度的 周期性,其值在220ms之间,这个周期 性称为长期周期性。 第二类称为清音 (unvoiced sound), 由不稳定气流激励所 产生的,这种气流是 在声门处打开状态下 强制空气在声道里高 速收缩产生的。 第三类称为爆破音 (plosive sound),它 是在声道关闭之后产 生的压缩空气然后打 开声道所发出的音。
15
基音之间的相关举例
16
(5)静止系数
两个人之间打电话,平均每人的讲话时间为通话 总时间的一半,另一半时间听对方讲。听的时候 一般不讲话,而即使是在讲话的时候,也会出现 字、词、句之间的停顿。通过分析表明,话音间 隙使得全双工话路的典型效率约为通话时间的40 %(或静止系数为0.6)。显然,话音间隔本身就 是一种冗余,若能正确检测出该静止段,便可 “插空”传输更多的信息。
§3.1 无损数据压缩 §3.2 音频数据的压缩标准
§3.2.1 §3.2.2 §3.2.3 §3.2.4
话音编码基础 三种话音编码器 MPEG Audio 移动通信网中的音频编码
§3.3 图像数据的压缩标准 §3.4 视频数据的压缩标准
9
音频信号处理
应用范围
无线电广播、电话、电视信号中的声音 移动通信、卫星通信、音频文件
自适应是和交互 性紧密关联的
44
差分脉冲编码调制 (DPCM)
根据过去的样本去估算(estimate) 下一个样本信号的幅度大小, 这个值称为预测值,然后对实 际信号值与预测值之差进行量 化编码,从而就减少了表示每 个样本信号的位数。 45
怎样做预测
根据摩尔定律预测芯片发展 利用概率模型预测不及格学生人数 利用遥感技术预测农业产量 2025年中国老年人比例预测 K线图的走势分析 我看这学期你
42
题外话:自适应的过程
自适应:根据输入信息: 吃葡萄不吐葡萄皮,不吃葡萄倒吐葡萄皮
自动找出重复出现的词或短语
43
再讲讲“自适应”
1、10M/100M自适应网卡 2、自适应软件开发?? 3、“这一新成绩是与编辑部采用自我激励、 约束和管理的自适应工作模式分不开的” 4、“一是倾听客户呼声,二是全心全意不 断学习,这些理念都包含在一种新的商业 模式中,那就是自适应销售”
第一类:用指针替换重复出现过的信息 从输入的数据中创建一个“短语词典” 80315084180
4
算术编码
词典编码
Review
RLE编码
求霍夫曼编码压缩比
1 0.9 0.8 0.7 0.6
频度
0.5 0.4 0.3 0.2 0.1 0 50 100 150 200 250
灰度级
5
Huffman讨论
27
3bit量化过程中量化误差示意
111 110
Digital Output
101 100 011 010 001 000 Analog Input
DV