第3章音频信息的获取与处理教材

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本章主要介绍音频的相关知识。
2019年4月26日3时41分
2.1.1模拟音频和数字音频
一、模拟音频
规则音频是一种连续变化的模拟信号,可用一条连续的曲线来表示, 称为声波。因声波是在时间和幅度上都连续变化的量,我们称之为 模拟量。 用声音录制软件记录的英文单词“Hello”的语音实际波形
2019年4月26日3时41分
2019年4月26日3时41分
模拟音频的数字பைடு நூலகம்过程
数字化的声音易于用计算机软件处理,现在几乎所有 的专业化声音录制、编辑器都是数字方式。对模拟音频数字 化过程涉及到音频的采样和量化。
采样和量化的过程可由A/D转换器实现。A/D转换器以固定的 频率去采样,即每个周期测量和量化信号一次。经采样和量化 后声音信号经编码后就成为数字音频信号,可以将其以文件形 式保存在计算机的存储介质中,这样的文件一般称为数字声波 文件。
幅度限
周期
基线
2019年4月26日3时41分
二、数字音频
声音的A/D与D/A转换
A/D转换就是把模拟信号转换成数字信号的过程,模拟电信 号变为了由“0”和“1”组成的Bit信号。这样做的好处是显而 易见的,声音存储质量得到了加强,数字化的声音信息使计 算机能够进行识别、处理和压缩 。 A/D转换的一个关键步骤是声音的采样和量化,得到数字音 频信号,它在时间上是不连续的离散信号。 借助于A/D或D/A转换器,模拟信号和数字信号可以互相转 换。
模拟音频信号的两个重要参数
模拟音频信号有两个重要参数:频率和幅度。声音的频率体现音调的高 低,声波幅度的大小体现声音的强弱。
一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰所发生的数 目称之为信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表示。信号的幅 度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。 幅度越大,声音越强。对音频信号,声音的强度用分贝(dB)表示,分贝 的幅度就是音量。
2019年4月26日3时41分
3、单声道与双声道
反映音频数字化质量的另一个因素是通道(或 声道)个数。记录声音时,
如果每次生成1个声波数据,称为单声道; 如果每次生成2个声波数据,称为立体声(双声道)。 立体声更能反映人的听觉感受,数字音频还受其他一 些因素(如扬声器质量)的影响。
2019年4月26日3时41分
失真在采样过程中是不可避免的,如何减少失真呢? 可以直观地看出,我们可以把上图中的波形划分成更为细 小的区间,即采用更高的采样频率。同时,增加量化精度, 以得到更高的量化等级,即可减少失真的程度。在下图(左)中, 采样率和量化等级均提高了一倍,分别为2000次/秒和20个量化等 级。在下图(右)中,采样率和量化等级再提高了一倍,分别达 到4000次/秒和40个量化等级。从图中可以看出,当用D/A转换器 重构原来信号时(图中的轮廓线),信号的失真明显减少,信号 质量得到了提高。
2019年4月26日3时41分
1. 采样频率
信息论的奠基者香农(Shannon)为实现A/D转换,需要把 模拟音频信号波形进行分割,这种方法就是采样(Sampling)。 采样的过程是把时间上的连续信号变成时间上的离散信号。该 时间间隔称为采样周期,其倒数为采样频率。采样频率是指计 算机每秒钟采集多少个声音样本。采样频率越高,声音失真越 小,存储音频的数据量也越大。常用的有8kHz , 11.025kHz, 22.05, kHz 16kHz, 44.1kHz, 48kHz等。
第2章音频信息的获取和处理
2.1 数字音频基础 2.2 声卡的组成与工作原理 2.3 音频编码基础和标准 2.4 音乐合成和MIDI标准
2019年4月26日3时41分
2.1数字音频基础
随着多媒体信息处理技术的发展,计算 机数据处理能力的增强,音频处理技术受到 重视,并得到了广泛的应用,如:视频图像 配以娓娓动听的音乐和语音 ;静态或动态图 像配以解说和背景音乐 ;立体声音乐可增加 空间感 ;游戏中的音响效果等。
声音数字化分为采样和量化两个步骤:
• 采样就是每隔一段时间就读一次声音信号的幅度,记录下 来的原始模拟声波在某一时刻的状态,称之为样本;每秒 钟抽取声波幅度样本的次数,称为采样频率;
• 量化:把采样得到的声波幅度转化为数字值,也就是把某 一幅度范围内的电压用一个数字表示。
2019年4月26日3时41分
以下图所示的原始模拟波形为例进行采样和量化。
假设采样频率为1000次/秒,即每1/1000秒A/D转换器采 样一次,其幅度被划分成0到9共10个量化等级,并将其采样的 幅度值取最接近0~ 9之间的一个数来表示,如下图所示。图中每 个正方形表示一次采样。
0
1
2
3
4
5
6
7
8
9
10 ms
2019年4月26日3时41分
2019年4月26日3时41分
2. 量化数据位数(也称量化级、样本尺寸等)
采样只解决了音频波形信号在时间坐标(即横轴)上把一个波形 切成若干个等分的数字化问题,但是还需要用某种数字化的方法来 反映某一瞬间声波幅度的电压值大小。该值的大小影响音量的高低。 我们把对声波波形幅度的数字化表示称之为“量化”。量化位数 是 每个采样点能够表示的数据范围,有8/12/16/32位。量化级 的大 小决定了声音的动态范围,即被记录和重放的声音最高与最低之间 的差值。量化的过程是先将采样后的信号按整个声波的幅度划分成 有限个区段的集合,把落入某个区段内的样值归为一类,并赋于相 同的量化值。如何分割采样信号的幅度呢? 我们还是采取二进制的方 式,以8位(bit)或16位(bit)的方式来划分纵轴。也就是说在一个以8 位为记录模式的音效中,其纵轴将会被划分为一个量化等级,用以 记录其幅度大小。量化位数越高音质越好,数据量也越大。
100101100011101
模拟信号的数字化过程
2019年4月26日3时41分
2.1.2音频的数字化
多媒体计算机产生声音的方式主要有3种: 由外部声音源进行录制与重放的波形音频、MIDI音 乐的MIDI音频
http://www.tudou.com/programs/view/AB0N4boBhFY/
相关文档
最新文档