多媒体技术及应用 第二章 音频信息的获取与处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
采样声音波 形之后的结果
2.2.2 数字音频获取
● 采样
采样定理 奈奎离斯散特信号( Nxy(qnuTs)t是) 从采连样续定信理号:只x(t要) 上采取样出频的率一大部于分或值者,等那于么信用号x中(n所T)包能 够含惟的一最地高恢频复率出的x(两t) 倍吗;即当信号是最高频率时,每个周期至少采样两个 点,则理论上就可以完全恢复原来的信号。
声音的特色,主要影响因素是复音;复 音指具有不同频率和不同振幅的混合声 音,其中最低频率是 “基音”,是声音的 基调钢,琴其他频吉率他的声音小为号“谐音小(提泛琴音)”
声音的主要性质
连续性 声音具有连续性。在时间轴上是连续信号,具有连续性和过程性
相关性 声音具有相关性。构成声音的数据,前后之间具有强烈的相关性
周期
用声音录制软件记录的英文单词“Hello”的语音 实际波形
2.1.2 声音特点
● 声音的传播方式
声音是依靠介质 ( 比如:空气、液体、固体 ) 的振动进行传播的 声源是一个振荡源,它使周围介质产生振动,并以波的形式传播 人耳感觉到这种传播过来的振动,反映到大脑,就意味听到声音 声音在不同的介质中传播,其传播速度和衰减速率都是不一样的
声音的频率范围
次声波 < 20 Hz
人耳可听域 20 ~ 20,000 Hz
超声波 > 20,000 Hz
男性语音
100 Hz ~ 9,000 Hz
女性语音 声
源
电话语音
150 Hz ~ 10,000 Hz 频
200 Hz ~ 3,400 Hz
带
种
调幅广播(AM)
50 Hz ~ 7,000 Hz
宽
多媒体技术及其应用
第二章 音频信息的获取与处理
● 主要知识点
2.1声音概述 2.2数字化音频 2.3音乐合成与 MIDI 2.4音频卡 2.5数字音频压缩标准
2.1.1 声音定义 ● 声音概念 ● 声音特性
2.1.2 声音基本特点 ● 声音传播 ● 声音频率 ● 声音传播方向 ● 声音三要素 ● 声音连续、相关及
实时性 声音具有实时性。对处理声音的计算机硬件和软件提出很高要求
2.2 数字化音频
转换
模拟信号
数字信号
音频数字化需要考虑的问题
采样、量化、编码
模拟信号的数字化过程
100101100011101
音频信号处理过程流程
音
频采
开信 样
始
号 频
频 率
率
采 样
量 化
保 存 为 声 音 文 件
结 束
2.2.2 数字音频获取
● 采样
采样概念
声波是连续信号, 或称连续时间函数 x(t)。 用计算机处理这些信号时应先 离散化,即按一定的时间间隔 (T) 取值,得到 x(nT) ( n为整数 ),T 称采样 周期,1/T 称采样频率 ( 每秒钟采样次数 ),x(nT) 称采样值 ( 或离散信号 )
采样过程
按固定间隔 采样声音波形
● 声音从声源发出后,经过多次反射到达人类听觉器官的声音是 “反射声”
●声音的三要素
● 音调 —— (高低)
● 音强 —— (强弱) ● 音色 —— (特质)
代表声音的高低,与频率有关;使 用音频处理软件对声音的频率进行 调整时,(低其) 音调也会随之发(高生)变化
声音的强度 (响度或音量),与声波振幅成 正比;唱盘、CD 盘等声音载体中的音强 不变,通过播放设备的音量控制可改变聆 听时强(度弱);音频处理(强软)件可提高声(停源) 音强
2.2.2 数字音频获取
则可由 x(nT) 完全确定 x(t)。 当 fN = 1/(2T) 时,称 fN 为奈奎斯特频率
常用音频采样率:8kHz、11.025kHz、16kHz、22.05kHz、44.1kHz 及 48kHz
2.2.2 数字音频获取
● 量化
量化概念
通过采样得到的表示声音强弱的函数 x(nT) 是连续的,为把 x(nT) 存入计 算机,就必须将采样值离散化,即量化成一个有限个幅度值的集合 x(nT)
采样方法 语设音连信续号信频号谱x在(t)高的频频处谱迅为速x下(f)降,,以但采非样限间带隔。T应采用样时得只到对离一散定信频号率x范(nT围) 内如的果信满号足感:兴当趣|,f |就≥ 可fc (以fc对是经信滤号波高限端带截的止音频频率信)号时采,样有。这样,在采样 前,用一个锐截止模拟低通T滤≤波1/器(2f对c) 音或频fc信≤ 号1/(进2T行) 滤波。
实时
音频是多媒体的重要媒体之一
语音 言语
清音/浊音 爆破音
音频Audio
非语音 声音
乐音 杂音(音响)
认识声音
空气、液体、固体
声音是机械振动在弹性介质中传播的机械波, 称为声波。
声音转换为电信号时,声音的电信号在时间 和幅度上都是连续的模拟信号。
● 声音特性
振幅
● 振幅 — 波的高低幅度,表示声音的强弱 ● 周期 — 两个相邻波之间的时间长度 ● 频率 — 每秒钟波振动的次数,单位是 Hz
量化原理
先将整个幅度划分成为有限个小幅度 (量化阶距) 的集合,把落入某个阶距 内的样值归为一类,并赋予相同的量 化值。如果量化值是均匀分布的,称
为均匀量化。设 为量化阶距,量化 器最大范围是 Xmax,则: = 2Xmax/2B
根据对人类听觉响度感觉测定: 8 位量化位数采样可满足于电话通信的要求 16 位量化位数采样则可从好的家用立体声中重现理想效果,相当于 CD 音质
类
度
调频广播(FM)
20 Hz ~ 15,000 Hz
宽带音响放大器
10 Hz ~ 40,000 Hz
声音的传播方向
● 声音以振动波的形式从声源向四周传播
人类在辨别声源的位置 时,首先依靠声音到达 左、右两耳的微小时间 差和强度差异进行辨别, 然后经过大脑综合分析 而判断出声音来自何方
● 从声源直接到达人类听觉器官的声音是 “直达声”
wk.baidu.com
2.2.2 数字音频获取
● 编码
编码概念 音频模拟信号经过采样与量化之后,为把数字化音频存入计算机,需对 其编码,即用二进制数表示每个采样的量化值,完成整个模数转换过程
PCM 编码 一种最方便简单的编码方法是脉冲编码调制,常称为 PCM (Pulse Code Modulation) 编码。 它是一种未经压缩的数字音频信号,常作为一种参 考信号,以便其他编码方法与之比较,或在此基础上作进一步压缩编码