AAC音频编码解析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
度之间进行折衷。
www.soppt.cn
www.themegallery.com
Principle
❖ 编码开始后首先根据心理感知模型计算输入音频信号的允 许失真,滤波器组采用改进离散余弦变换( MDCT) 把输 入信号从时域变换到频域。在频域,编码器利用声道间冗 余等信号特征对频谱信号进行处理,并依据心理声学模型 计算的允许失真,对MDCT频谱进行非线性量化处理,以 去除主观冗余。
www.soppt.cn
www.themegallery.com
Principle
❖ 真正的压缩是在量化模块中进行的,前面的处理都是为量 化作的预处理。
❖ 优点:相对于mp3,AAC格式的音质更佳,文件更小。 ❖ 不足:AAC属于有损压缩的格式,与时下流行的
APE[1]、FLAC等无损格式相比音质存在“本质上”的 差距。加之,传输速度更快的USB3.0和16G以上大容 量MP3正在加速普及,也使得AAC头上“小巧”的光环 不复存在了。
❖ 前景:以发展的眼光来看,正如“高清”正在被越来越多 的人所接受一样,“无损”必定是未来音乐格式的绝对主 流。AAC这种“有损”格式的前景不容乐Baidu Nhomakorabea。
www.soppt.cn
www.themegallery.com
Principle
❖ MPEG-2 /4 AAC 音频编码技术 MPEG-2 /4AAC 是一种感知音频编码算法,通过去除音频信
号的客观和主观冗余达到压缩音频信号的目的,编码的过程是将模拟 音频信号经模数转换( A/D) 后形成的二进制序列PCM( Pulse Code Modulation)压缩编码成ADTS( Audio Data Transport Stream) 码流,压缩比可达到为11 ∶ 1。
www.themegallery.com
Principle
音频编码流程图
www.soppt.cn
❖ AAC系统包含了滤波器组、心 理声学模型、量化与编码、预 测、TNS、立体声处理和增益 控制等多种高效的编码工具。 这些模块或过程的有机组合形 成了AAC系统的基本编解码流 程。在实际应用中,并不是所 有的功能模块都是必需的,下 表列出了各模块的可选性:
www.themegallery.com
Principle
为了能够适应于不同的应用场合,在AAC标准中定义了三种不同复杂度 的框架(Profile)。分别为:
❖
Main Profile:在这种框架具有最高的复杂度,可以用于存储量和计
算能力都很充足的场合。在这种框架中,利用了除增益控制以外的所有编码
LOGO
AAC音频编码 项目报告
谢征 杨诚 刘英玉
1. Introduction 2.Principle 3.Module analyzes 4. Conclusion
www.themegallery.com
Contents
www.soppt.cn
www.themegallery.com
Introduction
❖ AAC(Advanced Audio Coding),中文称为“高 级音频编码”,出现于1997年,基于 MPEG-2的音频 编码技术。由诺基亚,苹果等公司共同开发,目的是取代 MP3格式。2000年,MPEG-4标准出现后,AAC 重 新集成了其特性,加入了SBR技术和PS技术,为了区别 于传统的 MPEG-2 AAC 又称为 MPEG-4 AAC。
工具来提高压缩效率。
❖
LC(Low Complexity) Profile:这种框架用于要求在有限的存
储空间和计算能力的条件下进行压缩场合。在这种框架中,没有预测和增益
控制这两种工具,TNS的阶数比较低。
❖
SSR(Scalable Sample Rate) Profile:在这种框架中,使用了
增益控制工具,但是预测和耦合工具是不被允许的,具有较低的带宽和TNS
❖ ADTS (音频传输流) 是AAC 音频码流的封装格式之一。一个ADTS 帧由帧头和帧净
荷组成。帧头定义了音频采样率、声道数和帧长度等关键信息,用于 帧净荷数据的解析和解码。音频经压缩后的AAC 格式码流以原始帧 形式存在,帧净荷主要由原始帧组成,一个ADTS 帧以包含1 至4 个原始帧。
www.soppt.cn
www.soppt.cn
www.themegallery.com
Introduction
❖ 压缩算法 作为一种高压缩比的音频压缩算法,AAC通常压缩比为18:1,也有资料说 为20:1,远胜mp3,而音质由于采用多声道,和使用低复杂性的描述方式, 使其比几乎所有的传统编码方式在同规格的情况下更胜一筹。不过直到 2006年,使用这一格式储存音频的并不多,可以播放该格式的mp3播放器 更是少之又少,前所知仅有苹果iPod,而手机支持AAC的相对要多一些, 此外电脑上很多音频播放软件都支持AAC格式,如苹果iTunes。
❖ 运算法则 AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的 功能来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些 压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、 更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。号称「最 大能容纳48通道的音轨,采样率达96 KHz,并且在320Kbps的数据速率 下能为5.1声道音乐节目提供相当于ITU-R广播的品质」。
阶数。对于最低的一个PQF子带不使用增益控制工具。当带宽降低时,SSR
框架的复杂度也可降低,特别适应于网络带宽变化的场合。
❖
Main和LC框架式变化编码算法,采用MDCT作为其时/频分析模块,
SSR框架则采用混合滤波器组,先将信号等带宽地分成4个子带,再作
MDCT变换。在三种方案里,通过选用不同模块在编码质量和编码算法复杂
工具(模块) 码流打包 无噪声编码 量化器 缩放因子处理 M/S立体声处理
预测 IS(强度立体声) / 耦合声道处理
TNS 滤波器组 增益控制(预处理) 心理声学模型(感 知模块)
www.themegallery.com
Principle
可选性 必 必 必 必 选 选
选
选 必 选
必
www.soppt.cn