数字音频格式

合集下载

一、数字音频格式
1、PCM格式及其分类
PCM 是未压缩(无损)的数字音频格式。

其采样速率为可以为6、8、11.025、16、22.05、32、44.1、48、64、88.2、96、192KHz,采样精度可以为8、12、13、16, 20, 或24 bits。

可以有1到8个声道。

最大比特速率为6.144 Mbps，如果有5个或更多声道,这个最大速率就限制了采样率和比特位数。

例如音频CD为44.1 kHz/16 bits/双声道；DVD不仅能够播放2声道的超高保真音响（192KHz/24bit/双声道），还能播放线性PCM 最多6个声道的环绕声音响（96kHz/24bit/6声道）。

PCM格式又根据其量化方式可以分为线性PCM（linear PCM）和非线性PCM(non-linear PCM)，前者
是均匀量化得到的，后者是非均匀量化得到的。

●均匀量化
如果采用相等的量化间隔对采样得到的信号作量化，那么这种量化称为均匀量化。

均匀量化就是采用相同的“等分尺”来度量采样得到的幅度，也称为线性量化，如图1所示。

图1 均匀量化
●非均匀量化
非线性量化的基本想法是，对输入信号进行量化时，大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔，如图2所示。

这样就可以在满足精度要求的情况下用较少的位数来表示。

声音数
据还原时，采用相同的规则。

在非线性量化中，采样输入信号幅度和量化输出数据之间定义了两种对应关系，一种称为u律压扩
(companding)算法，另一种称为A律压扩算法。

u律(u-Law)压扩(G.711)主要用在北美和日本等地区的数字电话通信中。

它的输入和输出关系是对数关系，所以这种编码又称为对数PCM。

A律(A-Law)压扩(G.711)主要用在欧洲和中国大陆等地区的数字电话通信中。

A律压扩的前一部分是线性的，其余部分与u律压扩相同。

对于采样频率为8 kHz，样本精度为13位、14位或者16位的输入信号，使用u律压扩编码或者使用
A律压扩编码，经过PCM编码器之后每个样本的精度为8位。

图2 非均匀量化
2、DSD音频格式
PCM脉码调制数字音频格式是70年代末发展起来的，记录媒体之一的CD，80年代初由飞利浦和索尼公司共同推出。

PCM的音频格式也被DVD-A所采用，它支持立体声和5.1环绕声，1999年由DVD讨论
会发布和推出的。

PCM的比特率，从14-bit发展到16-bit、18-bit、20-bit直到24-bit；采样频率从44.1kHz发展到192kHz。

到目前为止PCM这项技术可以改善和提高的方面则越来越来小。

只是简单的增加PCM比特率和采样率，不能根本的改善它的根本问题。

其原因是PCM的主要问题在于： 1）任何PCM数字音频系统需要在其输入端设置急剧升降的滤波器，仅让20 Hz - 22.05 kHz的频率通过（高端22.05 kHz是由于CD 44.1 kHz的一半频率而确定），这是一项非常困难的任务。

2）在录音时采用多级或者串联抽选的数字滤波器（减低采样率），在重放时采用多级的内插的数字滤波器（提高采样率），为了控制小信号在编码时的失真，两者又都需要加入重复定量噪声。

这样就限制了PCM技术在音频还原时的
保真度。

为了全面改善PCM 数字音频技术，获得更好的声音质量，就需要有新的技术来替换。

近年来飞利浦和索尼公司再次联手，共同推出一种称为直接流数字编码技术DSD的格式, 其记录媒体为超级音频
CD即SACD，支持立体声和5.1环绕声。

DSD音频格式简化了信号流程，去掉了PCM使用的多级滤波器，将模拟音频直接以2.8224MHz的高采样频率，按1-bit的数字脉冲来记录。

虽然DSD格式表示的声音信号是数字化数据，但是它又与真正
的声波非常接近，可完整的记录当今最佳模拟系统的信息。

最好的30ips半英寸模拟录音机能记录的频率能超过50KHz，而DSD格式的频率响应指标为从DC到100KHz。

能覆盖高级模拟调音台的动态范围，通过其音频频段的剩余噪声功率，保持在-120dB。

DSD的频率响应和动态范围，是任何数字和模拟的录音系统无法与之比拟的。

从声音的质量上来说, 数字音频技术是为了接近模拟声音的质量。

DSD
音频格式的发展将更有利的与模拟音频系统配合。

二、数字音频接口
常见的数字音频接口有I2S接口、PCM接口和SPDIF接口。

这里只作简要介绍。

● I2S接口：
只能传输单声道或双声道立体声的数字音频，数据格式为PCM格式。

该接口又派生出三类：左对齐格式、右对齐格式、I2S格式。

I2S时差性能要优于SPDIF，适合短距离通讯。

● PCM接口：
也叫DSP模式音频接口。

一般用来传输单声道或双声道立体声的数字音频，但是理论上也可以传输多
声道的数字音频。

数据格式为PCM格式。

● SPDIF接口：
SPDIF(Sony Phillips Digital Interface) SONY、PHILIPS数字音频接口。

它的传输载体有同轴和光纤两种，后者抗干扰能力更强。

SPDIF能传输PCM流，也能传输杜比数字（Dolby Digital）、DTS 这类环绕声压缩音频信号。

PCM流是原始、未经压缩的音频信号，杜比数字、DTS也是来源于PCM流。