数字通信第三章语音信号的压缩编码精品PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 任何信号,不论语音或图像,采用直接采样-量化-编码的方式 进行编码,都会发现码组之间具有很强的相关性.
在压缩通用数据时,我们绝不会容忍任何精度上的损失,但在压缩和 显示一幅数码照片时,如果一片树林里某些树叶的颜色稍微变深了一 些,看照片的人通常是察觉不到的
• 通过在用户的忍耐范围内损失一些精度,我们可以把图像 (也包括音频和视频)压缩到原大小的十分之一、百分之一 甚至千分之一,这远远超出了通用压缩算法的能力极限。-> 退一步海阔天空
数字通信LCU
8
本章内容
把数码率低于64kbps的语音编码方法称为语音压缩编码技术。
• 自适应差值脉冲调制 32kbps
• 增量调制
32kbps
• 子带编码
16kbps
• 矢量量化编码* 1.2kbps
• 参数编码
4.8kbps以下
数字通信LCU
9
第1节DPCM学习提纲
• (1)差分脉冲编码调制原理和方框图,差值信号、预测信 号、重建信号的含义,差分脉冲编码调制的编码增益;
44100x2声道x2字节x60秒x4分钟=40.4MB 如果下载传输率为56kbps,则下载时间为:
40.4x106x8/56x103x60= 96分钟 即使是1M的宽带网也需5分钟以上。
数字通信LCU
2
一、无损压缩
• 以香农第一定理作为理论基础,即在一定的概率模型下,无损 压缩的编码长度不可能小于信息熵。Shannon 编码->Fano>Huffman编码
第3章 语音信号的压缩编码
数字通信原理与技术LCU
1
补充: 1、数据压缩简介
•PCM音频流的码率是采样率值×采样大小值×声道数 bps。 采用PCM脉冲编码调制的数字电话的数码率为64kb/s;
•视频:如320×233窗口中,以25帧/秒速度播放1分钟颜色数为 8bit的视频信号,其数据量为:
320 ×233 ×8×25×60/(8×1024 ×1024) ≈107(M) •对一首长约4分钟的歌曲采样,将其存储在磁盘上,以CD音质 的WAV格式抽样,抽样率为44.1kHz,即每秒钟接收44100个值, 立体声,每次抽样数据为16位(2字节),则这首歌占的空间为:
• MP3音频压缩包含编码和解码两个部分。编码是将WAV文件 中的数据转换成高压缩率的位流形式,解码是接受位流并将 其重建到WAV文件中。
数字通信LCU
7
•在MP3编码中 ,输入的数字音频信号即 PCM采样信号进入子带 滤波器组后 ,被分成 32 个子带信号 •MDCT(改进离散余弦变换)把子带的输出在频域里进一步地细 分成 18 个频线 ,这样共产生 576 个频线.然后利用 心理声学模 型计算出子带信号的信掩比 ,根据这些信掩比决定分配给 576个 频线的比特数 ,分别对他们进行比特分配和可变步长量化.量化后 的样值再经过无失真的哈夫曼编码 ,以提高编码效率 ,并与比特 分配和量化产生的边信息一起组成一帧数据. •MP3 编码的一帧数据包括两个组 ,每组有576个频线和与他们 相关的边信息 ,边信息被存储在每一帧的帧头中.对这样一帧一帧 组成的比特流 ,MP3解码器可以独立的进行解码 ,而不需要额外 的信息了.
一个字符串引用通过下面的方式来表示:
类1.似唯字一典的中标的记页码2.和偏行移号数代量替3文.章字中符每串个长单度词
• 应用: PKZIP 、 WinZIP 、 WinRAR 、 gzip 等压缩工具
数字通信LCU
3
二、有损压缩
• 香农ห้องสมุดไป่ตู้三定理-限失真信源编码定理
• 如果在压缩这一类图像数据时允许改变一些不太重要的像素 值,或者说允许损失一些精度我们就有可能在压缩效果上获 得突破性的进展。
数字通信LCU
4
2.1 JPEG
• 在图像压缩领域,著名的 JPEG 标准是有损压缩算 法中的经典。
• JPEG 以离散余弦变换( DCT )为核心算法,通过 调整质量系数控制图像的精度和大小。
• 对于照片等连续变化的灰度或彩色图像, JPEG 在 保证图像质量的前提下,一般可以将图像压缩到原 大小的十分之一到二十分之一。如果不考虑图像质 量, JPEG 甚至可以将图像压缩到“无限小”。
颜颜
颜颜
数字通信LCU
频率系数量化->整数。质量因子的选取值过大, 可以大幅度提高压缩比,但是图像质量就比较 差;反之,质量因子越小(最小为1),图像 重建质量越好,但是压缩比越低。 编码采用两种机制:一是0值的行程长度编码; 二是熵编码(EntropyCoding)。 6
2.2 mp3
• 人耳感受声音的频率范围是20Hz-20kHz,MP3截掉了大量的 冗余信号和无关的信号,编码器通过混合滤波器组将原始声 音变换到频率域,利用心理声学模型,估算刚好能被察觉到 的噪声水平,再经过量化,转换成Huffman编码,形成MP3 位流。
• (2)线性预测原理,极点预测和零点预测的基本概念和物 理意义;
• (3)自适应预测和自适应量化的基本概念和物理意义。
数字通信LCU
10
一、 DPCM的基本原理
• 一般PCM对样值信号编码都是按照样值幅度独立进行,每 一编码码组允许的信号动态范围就是原信号的动态范围,它 比较大,需要较多编码位数。
• Ziv 和 Lempel 于 1977 年发表题为“顺序数据压缩的一个通用 算法”的论文,提出了 LZ77 算法。
• LZ算法被认为是字符串匹配的算法。例如:在一段文本中某字 符串经常出现,并且可以通过前面文本中出现的字符串指针来 表示。当然这个想法的前提是指针应该比字符串本身要短。
例如,在上一段短语“字符串”经常出现,可以将除第一个字 符串之外的所有用第一个字符串引用来表示,从而节省一些空 间。
数字通信LCU
5
颜颜颜颜 颜颜颜颜 DCT颜 颜
YUV颜色模式->RGB图像数据结构
一般采用的采样比例是2:1:1或4:2:2。采 样后图像数据量将压缩为原来的一半。
DCT(DiscreteConsineTransform)是将图 像信号在频率域上进行变换,分离出高频和 低频信息的处理过程。然后再对图像的高频 部分(即图像细节)进行压缩,以达到压缩 图像数据的目的。变换后得到一个频率系数 矩阵,其中的频率系数都是浮点数。
相关文档
最新文档