多媒体技术及应用第二章音频信息的获取与处理

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

采样声音波形之后的结果
2.2.2 数字音频获取
● 采样
采样定理奈奎离斯散特信号( Nxy(qnuTs)t是) 从采连样续定信理号：只x(t要) 上采取样出频的率一大部于分或值者，等那于么信用号x中(n所T)包能够含惟的一最地高恢频复率出的x(两t) 倍吗；即当信号是最高频率时，每个周期至少采样两个点，则理论上就可以完全恢复原来的信号。
声音的特色，主要影响因素是复音；复音指具有不同频率和不同振幅的混合声音，其中最低频率是 “基音”，是声音的基调钢，琴其他频吉率他的声音小为号“谐音小(提泛琴音)”
声音的主要性质
连续性声音具有连续性。在时间轴上是连续信号，具有连续性和过程性
相关性声音具有相关性。构成声音的数据，前后之间具有强烈的相关性
周期
用声音录制软件记录的英文单词“Hello”的语音实际波形
2.1.2 声音特点
● 声音的传播方式
声音是依靠介质 ( 比如：空气、液体、固体 ) 的振动进行传播的声源是一个振荡源，它使周围介质产生振动，并以波的形式传播人耳感觉到这种传播过来的振动，反映到大脑，就意味听到声音声音在不同的介质中传播，其传播速度和衰减速率都是不一样的
声音的频率范围
次声波 < 20 Hz
人耳可听域 20 ~ 20,000 Hz
超声波 > 20,000 Hz
男性语音
100 Hz ~ 9,000 Hz
女性语音声
源
电话语音
150 Hz ~ 10,000 Hz 频
200 Hz ~ 3,400 Hz
带
种
调幅广播(AM)
50 Hz ~ 7,000 Hz
宽
多媒体技术及其应用
第二章音频信息的获取与处理
● 主要知识点
2.1声音概述 2.2数字化音频 2.3音乐合成与 MIDI 2.4音频卡 2.5数字音频压缩标准
2.1.1 声音定义 ● 声音概念 ● 声音特性
2.1.2 声音基本特点 ● 声音传播 ● 声音频率 ● 声音传播方向 ● 声音三要素 ● 声音连续、相关及
实时性声音具有实时性。对处理声音的计算机硬件和软件提出很高要求
2.2 数字化音频
转换
模拟信号
数字信号
音频数字化需要考虑的问题
采样、量化、编码
模拟信号的数字化过程
100101100011101
音频信号处理过程流程
音
频采
开信样
始
号频
频率
率
采样
量化
保存为声音文件
结束
2.2.2 数字音频获取
● 采样
采样概念
声波是连续信号，或称连续时间函数 x(t)。用计算机处理这些信号时应先离散化，即按一定的时间间隔 (T) 取值，得到 x(nT) ( n为整数 )，T 称采样周期，1/T 称采样频率 ( 每秒钟采样次数 )，x(nT) 称采样值 ( 或离散信号 )
采样过程
按固定间隔采样声音波形
● 声音从声源发出后，经过多次反射到达人类听觉器官的声音是 “反射声”
●声音的三要素
● 音调 —— (高低)
● 音强 —— (强弱) ● 音色 —— (特质)
代表声音的高低，与频率有关；使用音频处理软件对声音的频率进行调整时，(低其) 音调也会随之发(高生)变化
声音的强度 (响度或音量)，与声波振幅成正比；唱盘、CD 盘等声音载体中的音强不变，通过播放设备的音量控制可改变聆听时强(度弱)；音频处理(强软)件可提高声(停源) 音强
2.2.2 数字音频获取
则可由 x(nT) 完全确定 x(t)。当 fN = 1/(2T) 时，称 fN 为奈奎斯特频率
常用音频采样率：8kHz、11.025kHz、16kHz、22.05kHz、44.1kHz 及 48kHz
2.2.2 数字音频获取
● 量化
量化概念
通过采样得到的表示声音强弱的函数 x(nT) 是连续的，为把 x(nT) 存入计算机，就必须将采样值离散化，即量化成一个有限个幅度值的集合 x(nT)
采样方法语设音连信续号信频号谱x在(t)高的频频处谱迅为速x下(f)降，，以但采非样限间带隔。T应采用样时得只到对离一散定信频号率x范(nT围) 内如的果信满号足感：兴当趣|，f |就≥ 可fc (以fc对是经信滤号波高限端带截的止音频频率信)号时采，样有。这样，在采样前，用一个锐截止模拟低通T滤≤波1/器(2f对c) 音或频fc信≤ 号1/(进2T行) 滤波。
实时
音频是多媒体的重要媒体之一
语音言语
清音/浊音爆破音
音频Audio
非语音声音
乐音杂音（音响）
认识声音
空气、液体、固体
声音是机械振动在弹性介质中传播的机械波，称为声波。
声音转换为电信号时，声音的电信号在时间和幅度上都是连续的模拟信号。
● 声音特性
振幅
● 振幅 — 波的高低幅度，表示声音的强弱 ● 周期 — 两个相邻波之间的时间长度 ● 频率 — 每秒钟波振动的次数，单位是 Hz
量化原理
先将整个幅度划分成为有限个小幅度 (量化阶距) 的集合，把落入某个阶距内的样值归为一类，并赋予相同的量化值。如果量化值是均匀分布的，称
为均匀量化。设为量化阶距，量化器最大范围是 Xmax，则： = 2Xmax/2B
根据对人类听觉响度感觉测定： 8 位量化位数采样可满足于电话通信的要求 16 位量化位数采样则可从好的家用立体声中重现理想效果，相当于 CD 音质
类
度
调频广播(FM)
20 Hz ~ 15,000 Hz
宽带音响放大器
10 Hz ~ 40,000 Hz
声音的传播方向
● 声音以振动波的形式从声源向四周传播
人类在辨别声源的位置时，首先依靠声音到达左、右两耳的微小时间差和强度差异进行辨别，然后经过大脑综合分析而判断出声音来自何方
● 从声源直接到达人类听觉器官的声音是 “直达声”
wk.baidu.com
2.2.2 数字音频获取
● 编码
编码概念音频模拟信号经过采样与量化之后，为把数字化音频存入计算机，需对其编码，即用二进制数表示每个采样的量化值，完成整个模数转换过程
PCM 编码一种最方便简单的编码方法是脉冲编码调制，常称为 PCM (Pulse Code Modulation) 编码。它是一种未经压缩的数字音频信号，常作为一种参考信号，以便其他编码方法与之比较，或在此基础上作进一步压缩编码

多媒体技术及应用 第二章 音频信息的获取与处理

多媒体技术及应用第二章音频信息的获取与处理