数字音频处理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

A律压扩
其特性可表示为:
A律压扩
很明显,小信号时为线性特性,大信号 时近似为对数特性。这种压扩特性常把 压缩、量化和编码合为一体。A律可用13 段折线逼近(相当于A=87.6),便于用 数字电路实现。
2.2.3数字音频的技术指标
衡量数字音频的主要指标包括: ➢ 采样频率 ➢ 量化位数 ➢ 通道(声道)个数
在多媒体系统中,处理的信号主要是音频信 号。
2.1概述
声音包含三个要素:音调、音强和音色。 ➢ 基频与音调:一个声源每秒钟可产生成百上 千个波,通常把每秒钟波峰所产生的数目称之为 信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表 示。
人对声音频率的感觉表现为音调的高低,在 音乐中称为音高。音调正是由频率ω所决定的。
动态范围=20×log(信号的最大强度/信号的最小强度) (dB)
2.1概述
➢ 音宽与频带:频带宽度,也称为带宽,它是描 述组成复合信号的频率范围。
客观上,通常用频带宽度、动态范围、信噪比 等指标衡量音频信号的质量。音频信号的频带越 宽,所包含的音频信号分量越丰富,音质越好。 动态范围越大,信号强度的相对变化范围越大, 音响效果越好。
根据奈奎斯特定理,只有采样频率高于声音信 号最高频率的两倍时,才能把数字信号表示的声 音还原为原来的声音。
2.2.2量化
每个采样值在幅度上进行离散化处理的过程称 为量化 。
量化可分为均匀量化和非均匀量化。均匀量化 是把将采样后的信号按整个声波的幅度等间隔分 成有限个区段,把落入某个区段内的样值归为一 类,并赋于相同的量化值。以8bit或16bit的方式来 划分纵轴为例,其纵轴将会被划分为28个和216个 量化等级,用以记录其幅度大小。
6 440 52.8
7 494 53.8
2.1概述
➢ 谐波与音色:n×ωo称为基波ωo的n次谐波分量 (n就是高次谐波的方次,n× ωo就是基波ωo的n次 谐波),也称为泛音。音色是由混入基音的泛音所决 定的 。 ➢ 幅度与音强:信号的幅度是从信号的基线到当前波 峰的距离。幅度决定了信号音量的强弱程度。幅度越 大,声音越强。一般用动态范围定义相对强度:
2.2.1采样
图2.5 模拟信号的采样
所谓采样就是在某些特定的时刻对模拟信号 进行取值,如上图所示。采样的过程是每隔一个 时间间隔在模拟声音的波形上取一个幅值,把时 间上的连续信号变成时间上的离散信号。
2.2.1采样
采样时间间隔称为采样周期t,其倒数为采样频 率fs=1/t。一般来讲,采样频率越高,则在单位时 间内计算机得到的声音样本数据就越多,对声音 波形的表示也越精确,声音失真越小,但用于存 储音频的数据量越大。
根据函数f(x)的不同,非均匀压扩可以分为u律压 扩算法和A律压扩算法。
量化会引入失真,并且量化失真是一种不可逆失 真,这就是通常所说的量化噪声。
A律和μ律
μ律压扩
μ律压扩的数学解析式:
其中:x为输入信号的归一化值;y为压扩 后的信号。对话音信号编码,常采用 μ=255,这样适量化信噪比改善约24dB。
第2章 数字音频处理
本章重点: 模拟音频与数字音频的概念 数字音频的获取 音频信号压缩编码 音乐合成和语音识别
第2章 数字音频处理
2.1概述 2.2数字音频的获取 2.3音频信号压缩编码 2.4音乐合成和MIDI 2.5语音识别 2.6实验部分 2.7本章小结
2.1概述
空气压强

+

0 t

一个周期 图2.1 空气压强振荡的波形示意图
人耳能识别的声音频率范围大约在20~20kHz,
通常称为音频(audio)信号。
2.1概述
音频信号所携带的信息大体上可分为语音、音 乐和音效三类。 ➢ 语音,指具有语言内涵和人类约定俗成的特殊 媒体 。 ➢ 音乐,指规范的符号化了的声音 。 ➢ 音效,指人类熟悉的其他声音。
数据传输率是计算机处理时基本参数。未经压 缩的数字音频数据传输率可按下式计算:
数据传输率=采样频率×量化位数×声道数
2.2.3数字音频的技术指标
例:假定语音信号的带宽是50 Hz—10kHz,而音乐信号的是
15Hz —20 kHz。采用奈奎斯特频率,并用12bit表示语音信 号样值,用16bit表示音乐信号样值,计算这两种信号数字化 以后的比特率以及存储一段10分钟的立体声音乐所需要的存 储器容量。 解:语音信号:取样频率=2×10kHz=20kHz;
2.1概述
音乐中音阶的划分是在频率的对数坐标 (20×log)上取等分而得的。如表所示, 20×log261=48.3,20×log293=49.3等。
音阶
C
D
E
F
G
A
B
简谱符号 1 频率(HZ) 261 频率(对数) 48.3
2 293 49.3
3 330 50.3
4 349 50.8
5 392 51.8
有用信号的平均功率 SNR 噪声的平均功率
信噪比越大,声音质量越好。
2.2数字音频的获取
2.2.1采样 2.2.2量化 2.2.3数字音频的技术指标 2.2.4数字音频的文件格式
模拟音 频信号Biblioteka Baidu
采样
量化
编码

图 2.4 音频信息处理框图
按不同应用目 标进行压缩
音频信息处理结构框图
2.1概述
声音是携带信息的重要媒体。研究表明,人类从 外部世界获取的信息中,10%是通过听觉获得的, 因此声音是多媒体技术研究中的一个重要内容。
声音是由物体振动产生的,这种振动引起周围空 气压强的振荡,从而使耳朵产生听觉的印象。
声音的种类繁多,人的语音是最重要的声音。此 外,还有动物、乐器等发出的声音,风声、雨声、 雷声等自然声音,以及机器合成产生的声音等。
(1) 连续模拟声音信号
(2) 离散数据声音信号
均匀量化
(3) 幅值量化
2.2.2量化
非均匀量化是根据信号的不同区间来确定量化
间隔。对于信号值小的区间,其量化间隔也小; 反之,量化间隔就大。
非均匀量化的实现方法通常是将采样值x通过一个 变换y=f(x)后,再对y进行均匀量化,这种变换通常 叫做压扩。
CD-DA FM广播 AM广播 电话
10 20 50 200
3.4K 7K 15K 22K f(Hz) 图2.3 几种音频业务的频带宽度
CD-DA数字音乐、FM广播、AM广播和电话的带宽
2.1概述
声音的质量可以通过信噪比来度量。信噪比 (SNR,Signal to Noise Ratio)是有用信号与噪声 之比的简称,定义为:
相关文档
最新文档