雷运发第3章音频信息处理

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5
3. 声音的A/D与D/A转换
A/D转换就是把模拟信号转换成数字信号的过程,模拟电信号 变为了由“0”和“1”组成的Bit信号。这样做的好处是显而 易见的,声音存储质量得到了加强,数字化的声音信息使计 算机能够进行识别、处理和压缩 。
A/D转换的一个关键步骤是声音的采样和量化,得到数字音频 信号,它在时间上是不连续的离散信号。
3)音强:声音的强度,也被称为声音的响度,常说的“音量” 也是指音强。音强与声波的振幅成正比,振幅越大,强度越大。 唱盘、CD激光盘以及其他形式声音载体中的声音强度是一定的, 通过播放设备的音量控制,可改变聆听时的响度。
整理ppt
8
5.声音的频谱
声音的频谱有线性频谱和连续频谱之分。线性频谱是具有 周期性的单一频率声波;连续频谱是具有非周期性的带有 一定频带所有频率分量的声波。纯粹的单一频率的声波只 能在专门的设备中创造出来,声音效果单调而乏味。自然 界中的声音几乎全部属于非周期性声波,该声波具有广泛 的频率分量,听起来声音饱满、音色多样且具有生气。
整理ppt
12
以下图所示的原始模拟波形为例进行采样和量化。假设采样 频率为1000次/秒,即每1/1000秒A/D转换器采样一次,其幅度被 划分成0到9共10个量化等级,并将其采样的幅度值取最接近0~ 9 之间的一个数来表示,如下图所示。图中每个正方形表示一次 采样。
一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰 所发生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹 (kHz)表示。信号的幅度是从信号的基线到当前波峰的距离。 幅度决定了信号音量的强弱程度。幅度越大,声音越强。对音 频信号,声音的强度用分贝(dB)表示,分贝的幅度就是音量。
幅度限
周期
基线
整理ppt
整理ppt
9
3.1.2 模拟音频的数字化过程
数字化的声音易于用计算机软件处理,现在几乎所有的专 业化声音录制、编辑器都是数字方式。对模拟音频数字化过程 涉及到音频的采样、量化和编码。
采样和量化的过程可由A/D转换器实现。A/D转换器以固定的 频率去采样,即每个周期测量和量化信号一次。经采样和量化 后声音信号经编码后就成为数字音频信号,可以将其以文件形 式保存在计算机的存储介质中,这样的文件一般称为数字声波 文件。
100101100011101
模 拟 信 号 的 数 字 化 过 程
整理ppt
10
1. 采样
信息论的奠基者香农(Shannon)指出:在一定条件下,用 离散的序列可以完全代表一个连续函数,这是采样定理的基本 内容。
为实现A/D转换,需要把模拟音频信号波形进行分割,这种 方法称为采样(Sampling)。采样的过程是每隔一个时间间隔在 模拟声音的波形上取一个幅度值,把时间上的连续信号变成时 间上的离散信号。该时间间隔称为采样周期,其倒数为采样频 率。采样频率是指计算机每秒钟采集多少个声音样本。
采样频率与声音频率之间有一定的关系,根据奈奎斯特 (Nyquist)理论,只有采样频率高于声音信号最高频率的两 倍时,才能把数字信号表示的声音还原成为原来的声音。
fs 2f
整理ppt
11
2. 量化
采样只解决了音频波形信号在时间坐标(即横轴)上把一个波 形切成若干个等分的数字化问题,但是还需要用某种数字化的 方法来反映某一瞬间声波幅度的电压值大小。该值的大小影响 音量的高低。我们把对声波波形幅度的数字化表示称之为“量 化”。
第3章 音频信息处理
学习目标 l 了解声音信号的特点、存储格式及质量的度量方法 l 理解音频信号压缩方法及音频编码标准 l 掌握常用的音频处理软件对声音信号进行处理 l了解语音识别技术及其应用
整理ppt
1
3.1 音频信息处理基础
音频信息在多媒体中的应用极为广泛:视频图像配以娓 娓动听的音乐和语音 ;静态或动态图像配以解说和背景音 乐 ;立体声音乐可增加空间感 ;游戏中的音响效果等。
量化的过程是先将采样后的信号按整个声波的幅度划分成有 限个区段的集合,把落入某个区段内的样值归为一类,并赋于 相同的量化值。如何分割采样信号的幅度呢? 我们还是采取二进 制的方式,以8位(bit)或16位(bit)的方式来划分纵轴。也就是说 在一个以8位为记录模式的音效中,其纵轴将会被划分为个量化 等级,用以记录其幅度大小。
整理ppt
3
规则音频是一种连续变化的模拟信号,可用一条连续的曲线 来表示,称为声波。因声波是在时间和幅度上都连续变化的量, 我们称之为模拟量。
用声音录制软件记录的英文单词“Hello”的语音实际波形
整理ppt
4
2.模拟音频信号的两个重要参数
模拟音频信号有两个重要参数:频率和幅度。wenku.baidu.com音的频率 体现音调的高低,声波幅度的大小体现声音的强弱。
借助于A/D或D/A转换器,模拟信号和数字信号可以互相转换。
整理ppt
6
4. 声音的三要素
1)音调:代表了声音的高低。音调与频率有关,频率越高, 音调越高,反之亦然。
读者也许有这样的经验,当提高磁带录音机的转速时,其 旋转加快,声音信号的频率提高,其喇叭放出来声音的音调 提高了。同样,在使用音频处理软件对声音的频率进行调整 时,也可明显感到音调随之而产生的变化。各种不同的声源 具有自己特定的音调,如果改变了某种声源的音调,则声音 会发生质的转变,使人们无法辨别声源本来的面目。
音频处理技术主要包括电声转换、音频信号的存储、重 放技术、加工处理技术以及数字化音频信号的编码、压缩、 传输、存取、纠错等。
整理ppt
2
3.1.1 音频信号的特点
1.音频信号的分类
音频信号可分为两类:语音信号和非语音信号。 语音是语言的物质载体,是社会交际工具的符号, 它包含了丰 富的语言内涵,是人类进行信息交流所特有的形式。 非语音信号主要包括音乐和自然界存在的其他声音形式。非语 音信号的特点是不具有复杂的语义和语法信息,信息量低、识 别简单。
整理ppt
7
2)音色:即特色的声音。声音分纯音和复音两种类型。所 谓纯音,是指振幅和周期均为常数的声音;复音则是具有不同 频率和不同振幅的混合声音。大自然中的声音绝大部分是复音。 在复音中,最低频率的声音是“基音”,它是声音的基调。其 他频率的声音称为“谐音”,也叫泛音。基音和谐音是构成声 音音色的重要因素。各种声源都具有自己独特的音色,例如各 种乐器的声音、每个人的声音、各种生物的声音等,人们就是 依据音色来辨别声源种类的。
相关文档
最新文档