数字音频技术及其应用与发展_二_

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

!"#$%& MM1 标 准 是 一 种 新 的 技 术 音 频 表 述
(F@8@D =Q @RD 8;@ 8G<A= ) 标准, 支持 (/ )BA@ 5 F 码率下 相当高音质的多声道应用。它支持 /7 个主声道, ’( 个低频效声道, ’( 个多语言 5 解说 词 通 道 和 ’( 路 数据流。 MM1 继承了 !"#$%’ 5 & H8ID; # (即 !"6 ) 同样的基本编码模式,但在细节上附加了新的编码 工具并作了技术改进。技术上的改进包括带有高频 解决方案的滤波器组 (QAC@D; B8E) ) 和更 加 优 化 的 熵 编码和立体声编码。 另外, 两个新的编码工具是后向 自适应预测器和时域降噪平滑技术。所以, MM1 比
!"#$%’ 向 后 兼 容 的 多 声 道 扩 展 , 它 支 持 单 声 道 (>=E= ) 、 双声道 (F@D;D= 和 <G8C >=E= ) 和多声道 (环
绕立 体 声 ) 等编码模式, 附加了一个 “低 频 扩 展 ” 声 道, 从而提升到 . 声道编码。至此, !"#$%’ 音频和
!"#$%& 音频都具有三层编码结构,并具有向上和
!"#$%& MM1 (234 5 2#1 ’67’7%L M<N8E9D< MG<A= —!"#$%& 先进音频编码。 它在 7JK( )*+ 的 1=<AEO ) 采样率范围内提供了 ’J/7 个主声道的可选范围的 高质量音频编码。它适用于码率从 7 )BA@ 5 F 的单声 道电话音质到 ’(- )BA@ 5 F 的多声道超高质量音频范 围内的编码, 且允许对多媒体进行编解码。 MM1 增
高保真音乐的方法在众多领域得到广泛应用。 然而, 存储和传输高质量的声音数据需要很高的比特率, 以 ’. )*+ 码长、 //9’ (@A 采样率的 BC 音频记录格式 为例, 每声道需要高达 ?>. ()*+ , - 的码率。这样高的 数据传输速率在技术上和经济上对大多数应用都是 不现实的,因而需要用高效的数据压缩方法来降低 传输速率和减少存储空间。"#$% 音频就是诸多压 缩音频中始终最具代表性和实用价值的一族数字音 频压缩标准, 而且还处于迅速应用和不断发展中。 (运动图像专家小组) 是 DEF , D$B 的一个 "#$% 工作组, 负责制定有关活动图像、 音频及其组合的压 缩、 解压缩、 处理和编码等方面的技术标准。目前,
/8’ .8’ ’!8’


’7 <= =7
!9’:!9. <9.:<90
/; /;
"#$%&’ 音频支持采样率为 <!, //9’, /0 (@A 的 单声 道 (1JKJ ) 及双声道 (-+565J 和 CL3M 1JKJ ) 等编
码模式,并利用心理声学模型来控制音频信号的量 化编码。 "#$%&’ 共有三个不同层次的音频压缩算 法: 23456!, 23456" 和 23456# ,它们对应不同的要 求, 具有不同的复杂度和不同的压缩效率。 文件形式扩展名一般为 23456! 即 "#’ 音频, 是 "OEDBP" 算法的简化方案, 复杂度 91N’ 或91N3,
"#$%&’ 音频的三层编解码都可以利用软件和 硬件来实现,至于 "#$%&’ 音频的具体编码性能和 应用情况请参见表 < , 表 / 和表 = 的有关说明。 目前因特网上又出现了所谓的 "#/ 音频格式, 实 际 上 "#/ 并 不 是 "#$%&/ 或 者 "#$%&’ 音 频 23456 $ , 而 是 下 面 将 要 介 绍 的 "#$%&! PPB SDEF , D$B ’<0’0&? PTU3KV5T PLT*J BJT*KW X 技术。 !9.9! "#$%&! 音频 "#$%&! 是 "#$% 于 ’77/ 年 ’’ 月针对数字电
著特性, 下面将从几个问题简单加以讨论。 (’) !"#$%& 01 的多通道兼容性
!"#$%& 编码位流的核心还是一个 !"#$%’ 码 流。 这使得其解码器完全兼容于 !"#$%’ 解码器, 同
《电声技术》 !""# 年第 $ 期总第 #%! 期
’6
数字声频 !"#"$%& ’()"*
(!) "#$%&’ (() 与 "#$%&’ *) 的选择应用
数字声频 !"#"$%& ’()"*
数字音频技术及其应用与发展 (二)
杨 俊,蔡宣平,颜飞翔 (国防科技大学 电子科学与工程学院,湖南 长沙 /’>>?< )
Baidu Nhomakorabea
・ 新技术介绍 ・
!"#
$%&’ 音频
近年来, 数字化音频作为一种存储、 处理和传输
最低,压缩效率也最低。压缩数据流的预设位率为
<!://0 ()*+ , -,主要用于编码速率为 ’7! ()*+ , - 的
证音质的损失最小。 现在将它们分别简单介绍如下。
"#$%&’ 音频的编码效率
!9.9’
"#$%&’ 音频 "#$%&’ 音频作为数字存储媒体的运动图像和 伴 音 的 编 码 标 准 的 一 部 分 由 DEF , D$B ’’’?! 标 准 的第三部分 (简称 ’’’?!&< ) 规定。 "#$%&’ 压缩标准 旨在直接播控源于 BC&HF" (数据传输率约为 ’9= 或类似的光学存储设备和磁存储介质 (包括 ")*+ , -)
加了诸如对立体声的完美再现、 比特率效果音扫描、 多媒体控制、降噪平滑等 !"6 所不具备的特性, 使 得该压缩音频在解压后仍能完美的再现 1P 音质。
’ 视频结合使用。同样, !"#$%’ 音 频 也 可 以 与 而无须任何重新构建。 任何 !"#$%& 视频共同使用, !"#$%’ 和 !"#$%& 01 音 视 频 的 合 成 处 理 都 是 由 编 解 码 系 统 依 据 指 定 的 !"#$ 标 准 的 系 统 部 分 来 规范的,对于 !"#$%’ 为 234 5 2#1 ’’’L&%’ , 对 于 !"#$%& 为 234 5 2#1 ’67’7%6 。 (/ ) !"#$%& MM1 代替 !"6 的可能性 !"6 是目前应用中接近 1P 音质数字音频的理 想选择。然而, MM1 在保持更高音质的条件下支持
磁带在内) 的非交错音视频格式的数据, 以支持与普 通 I@E 录影带质量相当的数字化影像媒体设备。
目标编码速率 典 型 音 质 音 质 理论延迟 压缩比(./ ()*+ , - ) (’!0 ()*+ , -) ()*+ , , 1-
23456 ! 23456 " 23456 #
’7! ’!0 ./
DECR 网络传输和存储。近年来,从 "#< 流行范围
广、 传输速度快、 技术容易掌握的优势而成为因特网 上非常热门的娱乐资源,但却忽视了著作者和出版 者应享有的版权待遇。 表 ! 是 "#$%&’ 三层音频编码效率的比较。 表!
编码 层次
"#$% 已经 完 成 了 "#$%&’, "#$%&!, "#$%&/ 第 一 版 , 正 在 完 善 制 定 "#$%&/ 第 二 版 和 "#$%&? , 就其音频方面来说, 主要就是感知编码系 "#$%&!’。 统, 它能实现 ’G0 至 ’G’. 甚至更高的压缩比, 同时保
’B!B-
"#$%5 音频
虽 然 "#$%&, 和 "#$%&’ 标 准 已 为 N)M, MNM
(() 和 "#$%&’ *) 两者都支持 + 声道编码模
式, 然而, (() 具有比 "#$%&’ *) 更高的编码效率 和更好音质, 并且在几乎所有的 “联播” 情形或不必 考虑向后兼容性的情况下适用。 "#$%&, 双声道解 码器可以解码 "#$%&’ *) 的 + 声道码流,而 (() 就没有这种向后兼容性的要求,对于 + 声道音频信 号来说, "#$% 有关正式试听实验表明, (() 在 -’.
视技术提出的, 标题为 “通用的运动图像和音频编码 (%5K56*V VJT*KW JY 1JU*KW N*V+L65- 3KT 3LT*J ) ” 。 在
’!
《电声技术》 !""# 年第 $ 期总第 #%! 期
!"#"$%& ’()"* 数字声频
音频方面, !"#$%& 现 已 经 历 了 三 个 阶 段 的 发 展 过 程,首先是相对于 !"#$%’ 增加了低采样频率 (’( , 接 下 来 就 是 !"#$%& 01 )*+, &&,-. )*+, &/ )*+) (234 5 2#1 ’67’7%6 089):8;< 1=>?8@ABCD ) 音 频 对 时还避免了 “联播” (即将位流转成两路, 一路用于立 体声广播, 另一路用于多通道音频节目) 的工作, 而 这 样 做 相 对 于 !"#$%& MM1 的 非 后 向 兼 容 性 (V01) 编码算法的不足在于编码效率的降低。 (& ) !"#$%’ 解码器能从接受到的 !"#$%& 01 音频码流中获得全部通道的信息 通过 !"#$%’ 解码器可以获得一个合适的来源 于 !"#$%& 01 音频所有通道经向下混合而形成的 双声道信息。这种向下混合的左右声道就是通过兼 容性矩阵方程得来的, 包含了所有通道的应有信息。 (6) !"#$%’ 音频 5 视频与 !"#$%& 视频 5 01 音 频的兼容性 这种兼容性使 !"#$%& 01 音频可以同 !"#$%
了更高的压缩比,另外它还可以满足更高的编码要 求, 如高精度采样 (如 K( )*+ 的采样率) 下音频的播 控、 多语言通道支持、 环绕立体声和低码率传输应用 等。看来, MM1 必定是取代 !"6 的数字音频压缩技 术(如在利用固态存储的新式便携播放设备的应用 方面) 的首选。 (. ) !"#$%& MM1 性能优于 P=CBI M1%6 (F@8@D%=Q%@RD%8;@ ) 音频压缩 MM1 是一种技术表述 算法, 性能明显优于 M1%6 的旧算法。 MM1 和 M1%6 都 是 变 换 编 码 器 , 但 MM1 利 用 滤 波 器 组 (QAC@D; , 具有更好的频域解决方案, 可以优化音频信 B8E)) 号的压缩。 MM1 还使用了许多新的编码技术, 如时 域噪声平滑 (@D>?=;8C E=AFD FR8?AEO ) , 后向自适应 线性预测 (B89):8;< 8<8?@AND CAED8; ?;D<A9@A=E ) , 联 合立体声编码技术(W=AE@ F@D;D= 9=<AEO @D9REAXGDF) 和 量 化 因 子 的 *GQQ>8E 编 码 (*GQQ>8E 9=<AEO =Q 等, 提供了许多附加的音频压 XG8E@A+D< 9=>?=EDE@F) 缩性能。同时, MM1 比 M1%6 具 有 更 大 的 灵 活 性 , MM1 支持宽带宽的采样率和传输率,支持 -J/7 个 主音频通道, -J’. 个低频附加通道、多语言解说词 和 -J’. 个辅助嵌入数据流。
!"6 在编码位率上效率提高大约 6-S。 (!8AE MM1 标准包括 6 个协议子集,即主子集 , 低复杂性子集 (H=: 1=>?CDTA@I ";=QACD ) 和 ";=QACD) 可伸缩采样子集 (398C8BCD 38>?CAEO U8@D ";=QACD ) 。 作 为 !"#$%’ 的 扩 展 , !"#$%& 音 频 有 许 多 显
向后兼容性。 !"#$%& 01 的压缩数据流的预设位率 为: H8ID; ! , 6&J&.( )BA@ 5 F; H8ID; " 和 H8ID; # , 7J
’(- )BA@ 5 F。
在第三阶段,为了提高对 . 声道实例的编码效 率, 一种向后不兼容 (如不能被 !"#$%’ 音频解码器 读 5 译 ) 的 音 频 编 码 策 略 在 ’KKL 年 完 成 定 义 , 即
应用场合。 文件形式扩展名一般为 23456" 即 "#! 音频, 它的编码较为复杂, 能去掉更多的冗 91N! 或 91N3, 余信息, 压缩效率较 "#’ 有所提高。压缩数据流的 预 设 位 率 为 <!:<0/ ()*+ , -, 目 标 编 码 速 率 为 ’!0 已被应用于 CPQ 和 IBC 的伴音编码。 ()*+ , -, 文件形式扩展名为 91N< 。 23456#即 "#< 音频, 压缩性能也最好。压缩数据流 "#< 算法最为复杂, 的预设位率为 <!:<!> ()*+ , -,目标编码速率为 ./ 压缩比在 ’G’>:’G’! 时 , 接 近 BC 音 质 , 它主 ()*+ , -, 要针对于低位率音频传输的应用,特别适合应用于
相关文档
最新文档