数字音频格式

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、数字音频格式
1、PCM格式及其分类
PCM 是未压缩(无损)的数字音频格式。

其采样速率为可以为6、8、11.025、16、22.05、32、44.1、48、64、88.2、96、192KHz,采样精度可以为8、12、13、16, 20, 或24 bits。

可以有1到8个声道。

最大比特速率为6.144 Mbps,如果有5个或更多声道,这个最大速率就限制了采样率和比特位数。

例如音频CD为44.1 kHz/16 bits/双声道;DVD不仅能够播放2声道的超高保真音响(192KHz/24bit/双声道),还能播放线性PCM 最多6个声道的环绕声音响(96kHz/24bit/6声道)。

PCM格式又根据其量化方式可以分为线性PCM(linear PCM)和非线性PCM(non-linear PCM),前者
是均匀量化得到的,后者是非均匀量化得到的。

●均匀量化
如果采用相等的量化间隔对采样得到的信号作量化,那么这种量化称为均匀量化。

均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化,如图1所示。

图1 均匀量化
●非均匀量化
非线性量化的基本想法是,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,如图2所示。

这样就可以在满足精度要求的情况下用较少的位数来表示。

声音数
据还原时,采用相同的规则。

在非线性量化中,采样输入信号幅度和量化输出数据之间定义了两种对应关系,一种称为u律压扩
(companding)算法,另一种称为A律压扩算法。

u律(u-Law)压扩(G.711)主要用在北美和日本等地区的数字电话通信中。

它的输入和输出关系是对数关系,所以这种编码又称为对数PCM。

A律(A-Law)压扩(G.711)主要用在欧洲和中国大陆等地区的数字电话通信中。

A律压扩的前一部分是线性的,其余部分与u律压扩相同。

对于采样频率为8 kHz,样本精度为13位、14位或者16位的输入信号,使用u律压扩编码或者使用
A律压扩编码,经过PCM编码器之后每个样本的精度为8位。

图2 非均匀量化
2、DSD音频格式
PCM脉码调制数字音频格式是70年代末发展起来的,记录媒体之一的CD,80年代初由飞利浦和索尼公司共同推出。

PCM的音频格式也被DVD-A所采用,它支持立体声和5.1环绕声,1999年由DVD讨论
会发布和推出的。

PCM的比特率,从14-bit发展到16-bit、18-bit、20-bit直到24-bit;采样频率从44.1kHz发展到192kHz。

到目前为止PCM这项技术可以改善和提高的方面则越来越来小。

只是简单的增加PCM比特率和采样率,不能根本的改善它的根本问题。

其原因是PCM的主要问题在于: 1)任何PCM数字音频系统需要在其输入端设置急剧升降的滤波器,仅让20 Hz - 22.05 kHz的频率通过(高端22.05 kHz是由于CD 44.1 kHz的一半频率而确定),这是一项非常困难的任务。

2)在录音时采用多级或者串联抽选的数字滤波器(减低采样率),在重放时采用多级的内插的数字滤波器(提高采样率),为了控制小信号在编码时的失真,两者又都需要加入重复定量噪声。

这样就限制了PCM技术在音频还原时的
保真度。

为了全面改善PCM 数字音频技术,获得更好的声音质量,就需要有新的技术来替换。

近年来飞利浦和索尼公司再次联手,共同推出一种称为直接流数字编码技术DSD的格式, 其记录媒体为超级音频
CD即SACD,支持立体声和5.1环绕声。

DSD音频格式简化了信号流程,去掉了PCM使用的多级滤波器,将模拟音频直接以2.8224MHz的高采样频率,按1-bit的数字脉冲来记录。

虽然DSD格式表示的声音信号是数字化数据,但是它又与真正
的声波非常接近,可完整的记录当今最佳模拟系统的信息。

最好的30ips半英寸模拟录音机能记录的频率能超过50KHz,而DSD格式的频率响应指标为从DC到100KHz。

能覆盖高级模拟调音台的动态范围,通过其音频频段的剩余噪声功率,保持在-120dB。

DSD的频率响应和动态范围,是任何数字和模拟的录音系统无法与之比拟的。

从声音的质量上来说, 数字音频技术是为了接近模拟声音的质量。

DSD
音频格式的发展将更有利的与模拟音频系统配合。

二、数字音频接口
常见的数字音频接口有I2S接口、PCM接口和SPDIF接口。

这里只作简要介绍。

● I2S接口:
只能传输单声道或双声道立体声的数字音频,数据格式为PCM格式。

该接口又派生出三类:左对齐格式、右对齐格式、I2S格式。

I2S时差性能要优于SPDIF,适合短距离通讯。

● PCM接口:
也叫DSP模式音频接口。

一般用来传输单声道或双声道立体声的数字音频,但是理论上也可以传输多
声道的数字音频。

数据格式为PCM格式。

● SPDIF接口:
SPDIF(Sony Phillips Digital Interface) SONY、PHILIPS数字音频接口。

它的传输载体有同轴和光纤两种,后者抗干扰能力更强。

SPDIF能传输PCM流,也能传输杜比数字(Dolby Digital)、DTS 这类环绕声压缩音频信号。

PCM流是原始、未经压缩的音频信号,杜比数字、DTS也是来源于PCM流。

相关文档
最新文档