数字音频技术及其应用与发展_一_
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
’()"*
压缩编码的输入数据源和解码输出数据形式的一般 选择) 。这里有必要提示, 在 B* ;3IAJ8K 环境下, 可 以用来处理波形音频文件的几种主要函数有: -FK/
音信息, 会占用大量的磁盘空间, 因此通常利用 -./ 除非音乐只有几秒钟时间长时才使用 +. 声音格式, 波形音频。 决定波形音频质量的因素主要有 0 个,采样频 率( 采样率) 、 信息量和通道数。 一般采样率越高音频 质量越好。 表 ! 列出了波形音频常用的音频采样率。 表!
1%6Q 系统的开发目的就是为了改善和提高三
维声场的重现能力。传统的立体声系统仅仅能够提 供听者面前的二维声场, 而无法描述三维空间感。 通 过增加左、 右环绕声及中置声道, 以多声道音频重放 的方式来重现三维立体空间,就是 1%6Q 环绕声系 统所要实现的。具体一些说, 1%6Q 采用全音域 TB< 声道( 运行方式, 即位于室内前部的 > 个离散声道) 左前( 、 中置( 、 右前( 三个声道和用于高精度 U) %) 9) 定位音场、 提高现场实效的左环绕( 、 右环绕( U,) 9,) 声道以及一个附加超低音R UVK S 声道。其中前 T 个 而 声道的频响范围都是音频全频带即 Q CDWLA ;CD, 仅占整个频谱的 UVK 声道的频响范围是 QW<LA CD, 十分之一, 因此又称为 TB< 声道环绕声系统。 1%6Q 传 输 速 率 为 QLW>@A ;N’0 ? ,, 动 态 范 围 为 采样频率支持 QL ;CD, 输 LA N’0, @@B< ;CD 和 @X ;CD, 出声道数目可变。 1%6Q 的压缩比可以达到 <Y<L , 能 够 以 QX@ ;N’0 ? , 的 速 率 播 放 TB< 声 道 声 音 。 可 见 , 1%6Q 确是一种完善而又灵活的编码方案。 1%6Q 音频压缩编码依据心理声学模型去除信 号的主观冗余信息,以及采用耦合和声道重组等技 术消除客观冗余信息。采用的主要技术包括时域混 叠抵消( 技术、 声道耦合与重组、 指数策略、 变 Z#1%) 参比特分配、 对话电平归一化、 动态范围压缩、 声道 兼容技术等等。
!"#"$%& ’()"* 数字声频
数字音频技术及其应用与发展( 一)
杨 俊,蔡宣平,颜飞翔 ( 国防科技大学 电子科学与工程学院,湖南 长沙 &’(()*) 【 摘
・ 新技术介绍 ・
要】 介绍了各种数字音频编码技术的发展现状和应用前景, 具体阐述了目前多媒体声
频行业中的波形文件、 $#+* 数字音频和 ,-./ 系列伴音标准等,对这几种重要的音频编码技术的 多方面性能进行了比较并分析了各自不同的应用领域。 【 关键词】 数字音频;,-./+0 伴音标准;杜比 $#+* 【 !"#$%&’$】 12 3456 7879: ;9 <=>?6 =2 349 7:96923 82@ @9A9B=7C923 =< 6=C9 D52@6 =< @5E538B
换声音信息的常用音频编码技术,由微软公司和
1O, 公司作为 M52@=;6 *G’ 的多媒体资源交互文件 格 式 S1TT US96=?:>9 1239:>482E9 T5B9 T=:C83 V 的
一部分制定开发和所有。 波形音频是一种电子数字声音,一般用于存储 各种非乐曲的音频数据, 包括语音和音效。 播放波形 文件时, 不论音响设备是何种类型, 都会听到相似的 声音,唯一的差别是声音的质量。在这一点上相比 较, ,1%1 音频则严重依赖于播放设备,声音的差别 非常大。 波 形 音 频 是 最 常 用 的 M52@=;6 多 媒 体 特 性 之 一。 波形音频设备可以通过传声器捕获声音, 并将其 转换为数字信号,然后把它们以波形文件的形式保 存到内存或者磁盘上。 这样声音就可以播放了。 但令 人遗憾的是,用非压缩的波形文件存储数字化的声
SVJ8 中 的 相 关 *X- 接 口 函 数 则 是 比 低 级 的 波 形 音频函数更低级的 <B. 函数, 主要用于游戏设计和
三维音频特效的仿真实现,是当前音频媒体程序设 计人员强有力的开发工具,通过它可以最有效地发 挥音频加速硬件的作用, 尽可能提高其运行速度, 减 少 *BD 的 占 用 时 间 。 而 且 +3HFU4SJTIA 和 +3/
音频类型 语音 高质量的音乐和语音效果
K9PFQFFR , BC9GSJTIA 和 KIABC9GSJTIA 等 <B. 函数;
调用; -*. ( -FA39 *JI4HJC .I4FH?9UF ) ;9:F 低 级 设 备 函数; +3HFU4SJTIA, +3HFU40+SJTIA 或 +3HFU4SVJ8 S+W 函数应用。 其中前三类函数中每一类的处理水平都比前面 的一类低级, 处理起来更复杂, 但控制上却更灵活全 面, 功能也就更强。 其实, 每种方法各有利弊, 用户应 该根据需要在复杂程度和性能之间做出选择。而微 软 所 提 供 的 +3HFU4SJTIA , +3HFU40+SJTIA 和 +3HFU4/
结起来的手段和控制乐器所用的软硬件设备的规 范,是电子音乐领域中相当重要的标准。-.+. !&’ 由 .-< " --< ( .I4FHI943JI9C -.+. <KKJU3943JI " -.+. 并 由 --< 维 -9IT?9U4THFHK <KKJU3943JIY 完 成 规 范 , 护。 该标准明确了将计算机和电声乐器、 录音设备连 接起来的电缆、 硬件和通信协议。通过 -.+. 接口的 这种连接使计算机系统可以录制和播放音乐。一个
R
数字音频格式
目前数字音频领域流行的音频编码技术以数据
量的压缩性能分为非压缩音频 ( 如波形音频、 ,1%1 音频和 #% 音频等) 和压缩音频( 如 ,-./ 音频和杜 比 $#+* 等) 两类。现将几种常用的音频编码技术简 要介绍如下。
ຫໍສະໝຸດ Baidu
./0
波形音频 波形( 音频 是 一 种 用 于 -# 机 之 间 交 ;8A9<=:C)
教授, 中国自动化学会 #$% 专业委员会委员, 中 ! 作者简介 " 蔡宣平, 国电子学会高级会员。主要研究领域: 多媒体技 术、 计算机图形学; 颜飞翔, 博士, 主要研究方向: 图形图像编码; 杨 俊, 通信与信息工程专业硕士研究生。
《 电声技术》 !""# 年第 $ 期总第 #%# 期
)
数字声频 !"#"$%&
8?@5= 92>=@52E 39>42=B=EF G 12 @9385BH ;8A9<=:C 8?@5= <5B9 H $#+* %5E538B $?@5= H ,-./+0 $?@5= 6382@8:@6H 82@ 6= =2 H8:9 907835839@ 52 3495: <983?:9 <?2>35=26 82@ 877B5>835=26 IF >=C78:52E =2 C82F 69>35=26G 【 ()* +,%-#】 @5E538B 8?@5=;,-./+0 8?@5= 6382@8:@6;%=BIF $#+*
!"* ’$+# 音频
美国杜比实验室开发的数字音频编码系统, 是 性能较为优秀的一种音频压缩技术,其中, 1%6< 用 于卫星通信和数码有线广播, 1%6L 用于专业音频的 传输和存储, <MM< 年 推 出 的 杜 比 数 码 环 绕 声 系 统 ( , 即 1/)’* %*)2 P/-N24 Q #*5NE #’H’035 O/44*/()) 起初被用于电影制作和相关音视频产品, 以 R1%6QS, 获得 > 声道压缩编码。
常用音频采样率
采样率 " #$%
!!&’() ((&’)’ ,,&!’’
*+ 质量的采样
信息量由编码位长来表示,一般的采样码长为 音 1 234 或 !5 234。码长越长对波形的模拟就越精确, 质也就越好。波形音频支持一个声道( 单声道) 和双 声道( 立体声) 两种模式。 在进行立体声音频采样时, 左右声道的信号实际上是分别记录的,因此虽然立 体声的效果相对更好,但需要录制的数据量是单声 道的两倍。 波 形 音 频 文 件 的 格 式 为 6.77 文 件 的 一 种 , 扩 展名为 &89: 。一个基本的波形文件的实际结构是一 个 ;<=> 部分, 它包括 ?@4 部分和 A949 部分。 ?@4 部 分先于 A949 部分, 其中包括了波形文件的诸多声音 信息( 如 ;<=> 格式类型标识、 声道数、 采样率和音 频数据块对齐等等) ,而在 A949 部分则包含了具体 的音频编码数据。 缺省的 ;<=> 格式是微软的脉冲 编码调制( 格式。另外, 可选的波形格式还有 B*-)
’
引言
多媒体作为多种数据流类型的集成,包括连续
目前电声领域几种主流的数字音频编码技术进行综 合介绍,并对它们的技术性能和应用前景进行系统 比较和分析。
媒体流( 音频、 视频和动画) 及离散媒体流( 文本、 数 据、 图形和图像等) 。随着多媒体技术特别是宽带多 媒体通信技术的迅速发展,多媒体计算机技术正在 成为目前计算机工业中的热门课题,它的应用正改 变着人们的工作、 商业、 教育、 培训、 科学工程研究、 信息通信以及家庭娱乐的各个方面,如视频点播 ( , 远程教育, 视频会议, 计算机支持协同工作 JK%) ( 等等。研究多媒体计算机系统的一项重要 #L#M) 技术就是多媒体数据的压缩 N 解压缩技术。 数字化的 图像( 静态图像、 视频图像) 和声音信号的数据量是 非常大的,要使实时处理和传输这些庞大的数据成 为可能必须对数据信息进行编码压缩。没有压缩技 术的进步, 多媒体计算技术是难以走向实用的。 在声频媒体方面,人类听觉特性理论的深入发 展和数字化技术的广泛应用,以及市场对消费类音 乐质量的趋高要求,促使数字音频编解码技术成为 了消费电子学的一个重要的研究领域,并已被广泛 地应用于数字音频广播 ( 、高清晰度电视 %$O) ( 、 伴音多媒体网络通信等领域中。下文将对 P%QJ)
-.+. 系 统 能 够 控 制 可 以 响 应 -.+. 信 息 的 所 有 乐
器, 如音乐键盘、 打击乐器、 管乐器和录音设备等。 当 播放 -.+. 音频文件时, 将模拟发出该乐器的声音。
-.+. 音频格式文件以 &@3A 为扩展名,文件的
数据结构几乎都是位结构,整个文件由不同长度的 块( 组成, 类似于 6.77 文件。块的类型只有两 UVTI#) 种: 头块( 和若干音轨块( 。 VF9AFH UVTI#K) 4H9U# UVTI#K) 而与波形文件不同的是,在 -.+. 文件中并没有存 储实际的音频采样数据而是乐器事件。因此, -.+. 音频相对于波形音频具有更小的存储空间和更低的 数据传输速率,这使得 -.+. 音频成为应用程序背 景音乐的理想选择。另外还与波形音频文件不同,
</C98 B*-, D/E98 B*- 和自适应微分脉冲编码调 制( 格式。 波形文件被微软公司大力推荐为 <+B*-)
音频文件交换格式的首选,同时由于微软已将波形 音频软件( 如 -FA39BC9GFH ) 作 为 标 准 ;3IAJ8K 附 件 软件包捆绑于操作系统共同发售,同时各 ;3IAJ8K 操作系统( 包 括 ;.L0&M " NM " LO " (’’’ ) 又自带有多 种支持波形音频文件处理的 <B. 函数, 这也就意味 着波形文件作为标准音频交换形式还将长期存在下 去。目前因特网上的大多数普通声音文件仍然是以 波形声频形式存储、 传输和交换的。此外, 微软也定 义了新型带压缩 ;<= 格式, 实际是标准 ;<= 格式 的扩展类型, 其扩展部分定义了关于其中非 B*- 音 频采样数据的描述和音频压缩的格式信息。 由于波形音频( 的播控技术事实上是实现 B*-) 各种压缩类编码音频的软件解码和播控的基础及关 键工具 ( 或者说, B*- 音频采样是实际的多种音频
函数 ( 包括前缀为 -’)’"( 和 -’)’./0 的 1$" 函数) 读取和播放 !"#" 音乐, 来达到对 !"#" 播放设备的 完全控制;也可以利用 !%" ( !2)’3 %*(04*5 "(0246 调用来 处 理 音 频 文 件 , 后者相对容易使用, 又 7382 ) 能满足大多数用户的性能要求。 目前 !"#" 已被绝大多数声频板卡所支持。除 了用于电子乐器的连接以外, !"#" 标准还广泛的用 于利用计算机生成易于转换的声音格式。
1
《 电声技术》 !""# 年第 $ 期总第 #%# 期
!"#"$%& ’()"* 数字声频
而不能包 !"#" 文件只能包含乐器指令事件和乐序, 含语音。 支持 1I" 序列中音频的处理和播控, 可以较为容易 地加以利用和进行进一步的开发。
$% &’()*+, 环 境 下 可 以 使 用 !"#" 低 级 设 备
HFU40+SJTIA 允许在同一个三维空 间 中 同 时 运 行 多
个声音文件和移动声音源, 以及软件仿真音效特技。
!"! #$%$ 音频 -.+. 音 频 也 是 一 种 重 要 的 多 媒 体 组 成 元 素 。 -.+. 即乐器数字化接口( -TK3U9C .IK4HT@FI4 +3P349C , 它是一种通信形式, 提供了将电子乐器连 .I4FH?9UF )