各种音频编码方式的比对

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一. 各种音频编码方式的比对

PCM编码(原始数字音频信号流)

类型：Audio

制定者：ITU-T

所需频宽：1411.2 Kbps

特性：音源信息完整，但冗余度过大

优点：音源信息保存完整,音质好

缺点：信息量大，体积大，冗余度过大

应用领域：voip

版税方式：Free

备注：在计算机应用中，能够达到最高保真水平的就是PCM编码，被广泛用于素材保存及音乐欣赏，CD、DVD以及我们常见的W A V文件中均有应用。

因此，PCM约定俗成了无损编码，因为PCM代表了数字音频中最佳的保

真水准，并不意味着PCM就能够确保信号绝对保真，PCM也只能做到最

大程度的无限接近。要算一个PCM音频流的码率是一件很轻松的事情，

采样率值×采样大小值×声道数bps。一个采样率为44.1KHz，采样大小

为16bit，双声道的 PCM编码的W A V文件，它的数据速率则为 44.1K×16

×2 =1411.2Kbps。我们常见的Audio CD就采用了PCM编码，一张光盘的

容量只能容纳72分钟的音乐信息。

WMA(Windows Media Audio)

类型：Audio

制定者：微软公司

所需频宽：320～112kbps（压缩10～12倍）

特性：当Bitrate小于128K时，WMA几乎在同级别的所有有损编码格式中表现得最出色，但似乎128k是WMA一个槛，当Bitrate再往上提升时，不会有

太多的音质改变。

优点：当Bitrate小于128K时，WMA最为出色且编码后得到的音频文件很小。

缺点：当Bitrate大于128K时，WMA音质损失过大。WMA标准不开放，由微软掌。

握应用领域：voip

版税方式：按个收取

备注：WMA的全称是Windows Media Audio，它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3，

更是远胜于RA(Real Audio)，即使在较低的采样频率下也能产生较好的音

质，再加上WMA有微软的Windows Media Player做其强大的后盾，所以

一经推出就赢得一片喝彩。

ADPCM( 自适应差分PCM)

类型：Audio

制定者：ITU-T

所需频宽：32Kbps

特性：ADPCM(adaptive difference pulse code modulation)综合了APCM的自

适应特性和DPCM系统的差分特性，是一种性能比较好的波形编码。

它的核心想法是：

①利用自适应的思想改变量化阶的大小，即使用小的量化阶(step-size)去编码

小的差值，使用大的量化阶去编码大的差值；

②使用过去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间

的差值总是最小。

优点：算法复杂度低，压缩比小（CD音质>400kbps），编解码延时最短（相对其它技术）

缺点：声音质量一般

应用领域：voip

版税方式：Free

备注：ADPCM (ADPCM Adaptive Differential Pulse Code Modulation), 是一种针对16bit (或者更高?) 声音波形数据的一种有损压缩算法, 它将声音流中每次采样的 16bit 数据以 4bit 存储, 所以压缩比 1:4而压缩/解压缩算法非常的简

单, 所以是一种低空间消耗,高质量声音获得的好途径。

LPC(Linear Predictive Coding，线性预测编码)

类型：Audio

制定者：

所需频宽：2Kbps-4.8Kbps

特性：压缩比大，计算量大，音质不高，廉价

优点：压缩比大,廉价

缺点：计算量大，语音质量不是很好，自然度较低

应用领域：voip

版税方式：Free

备注：参数编码又称为声源编码，是将信源信号在频率域或其它正交变换域提取特征参数，并将其变换成数字代码进行传输。译码为其反过程，将收到

的数字序列经变换恢复特征参量，再根据特征参量重建语音信号。具体说，参数编码是通过对语音信号特征参数的提取和编码，力图使重建语音信号

具有尽可能高的准确性，但重建信号的波形同原语音信号的波形可能会有

相当大的差别。如：线性预测编码（LPC）及其它各种改进型都属于参数

编码。该编码比特率可压缩到2Kbit/s- 4.8Kbit/s，甚至更低，但语音质量只

能达到中等，特别是自然度较低。

CELP(Code Excited Linear Prediction码激励线性预测编码)

类型：Audio

制定者：欧洲通信标准协会（ETSI）

所需频宽：4～16Kbps的速率

特性：

改善语音的质量：

①对误差信号进行感觉加权，利用人类听觉的掩蔽特性来提高语音的主观质量；

②用分数延迟改进基音预测，使浊音的表达更为准确，尤其改善了女性语音的质

量；

③使用修正的MSPE准则来寻找“最佳”的延迟，使得基音周期延迟的外形更LPC(Linear Predictive Coding，线性预测编码)

类型：Audio

制定者：

所需频宽：2Kbps-4.8Kbps

特性：压缩比大，计算量大，音质不高，廉价

优点：压缩比大,廉价

缺点：计算量大，语音质量不是很好，自然度较低

应用领域：voip

版税方式：Free

备注：参数编码又称为声源编码，是将信源信号在频率域或其它正交变换域提取特征参数，并将其变换成数字代码进行传输。译码为其反过程，将收到的数字序列经变换恢复特征参量，再根据特征参量重建语音信号。具体说，参数编码是通过对语音信号特征参数的提取和编码，力图使重建语音信号具有尽可能高的准确性，但重建信号的波形同原语音信号的波形可能会有相当大的差别。如：线性预测编码（LPC）及其它各种改进型都属于参数编码。该编码比特率可压缩到2Kbit/s- 4.8Kbit/s，甚至更低，但语音质量只能达到中等，特别是自然度较低。

CELP(Code Excited Linear Prediction码激励线性预测编码)

类型：Audio

制定者：欧洲通信标准协会（ETSI）

所需频宽：4～16Kbps的速率

特性：

改善语音的质量：

①对误差信号进行感觉加权，利用人类听觉的掩蔽特性来提高语音的主观质量；

②用分数延迟改进基音预测，使浊音的表达更为准确，尤其改善了女性语音的质量；

③使用修正的MSPE准则来寻找“最佳”的延迟，使得基音周期延迟的外形更为平滑

④根据长时预测的效率，调整随机激励矢量的大小，提高语音的主观质量；

⑤使用基于信道错误率估计的自适应平滑器，在信道误码率较高的情况下也能

合成自然度较高的语音。

结论：

① CELP算法在低速率编码环境下可以得到令人满意的压缩效果；

②使用快速算法，可以有效地降低CELP算法的复杂度，使它完全可以实时地实现；

③CELP可以成功地对各种不同类型的语音信号进行编码，这种适应性对于真实

环境，尤其是背景噪声存在时更为重要。

优点：用很低的带宽提供了较清晰的语音

缺点：-

应用领域：voip

版税方式：Free

备注：1999年欧洲通信标准协会（ETSI）推出了基于码激励线性预测编码（CELP）的第三代移动通信语音编码标准自适应多速率语音编码器（AMR），其中最低速率为4.75kb/s，达到通信质量。

CELP码激励线性预测编码是Code Excited Linear Prediction的缩写。CEL是近10年来最成功的语音编码算法。CELP语音编码算法用线性预测提取声道参数，用一个包含许多典型的激励矢量的码本作为激励参数，每次编码时都在这个码本中搜索一个最佳的激励矢量，这个激励矢量的编码值就是这个序列的码本中的序号。CELP已经被许多语音编码标准所采用，美国联邦