音频处理技术详解.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本的编码方法,它主要包括采样、量化和编码3 个过程。
采样是每隔一定的时间测量一次声音信号的幅值。如
果采样的时间间隔相等,称为均匀采样; 量化是将采样得到的数值限定在几个有限的数值中; 编码(coding)是将量化后的信号转换成一个二进制 码。比如,量化得到的数据中只会出现两个数值51 和80,则只用一位二进制的数表示即可,用0表示51, 用1表示80。若量化级别为256(有256级量化数据), 则可用8位二进制数表示,这种编码方法称为自然编 码。
4
声音的物理特 性
频率/周期/带宽
单位时间内声源振动的次数称为声源的频率f, 单位赫兹(Hz)
频带宽度:带宽,它描述组成复合信号的频率范 围
5
声压和声强
声波造成空气中的气压发生变化,相当于在无声 波气压上叠加一个变化的压强,叠加上的压强称 为声压,记作P。单位有帕斯卡(Pa)和微巴 (μbar)。 人耳刚能听到声音时的声压称为可听阈 声波有能量。 单位时间内通过垂直于声波传播方向的单位面积 内的声波能量为声强,记作I,单位为瓦/米2 (W/m2)。 声强与声压最大值的平方成正比关系。
和音色。它们与声波的频率、声压和频谱结构对 应。 音调
人对声音频率的感觉表现为音调的高低,即音高。 音调与基频的对数(20×lg)成线性关系,单位
为美(mei)。基频越低,给人的感觉越低沉。 基频频率增加一倍,音乐上称提高了一个八度
12
频率与音调的关系
13
响度
响度是人耳对声音强 弱的感觉程度
动态范围不仅用来表示一个声源产生的最大声压 级与最小声压级之间的差值,录音设备或声音载 体用动态范围表示能够处理信号的电平范围。
9ຫໍສະໝຸດ Baidu
如磁带的动态范围为50dB~60dB, CD光盘96dB,
频谱
物体在一定位置的附近作来回往复的运动,称为 简谐振动。
简谐振动会产生一个特定音调的纯音,听起来感
觉单薄。 乐器很少产生单一频率的纯音,而是复音。 复音可以分解为许多不同振幅和不同频率的简谐 振动叠加。 简谐振动的振幅按频率排列的图形称为频谱。频 谱可一目了然地看出复杂振动的频率结构。
10
钢琴(基频为253Hz)的复音频谱
11
(2)声音的心理学特性
从声学心理角度,声音的三个要素是音调、响度
音频信号所包含的谐波分量越丰富,音色越好。 用声音信号所包含的谐波分量的频率范围来衡量
声音的质量,即带宽。
18
不同质量的声音的频带对比示意图
(2)动态范围
动态范围越大,说明音频信号强度的相对变化范
围越大,音响效果越好。 动态范围一般用dB为单位来计量。
FM广播的动态范围约60dB,
AM广播的动态范围约40dB。 CD—DA的动态范围约100dB,
响度与声压有一定关
系,但声压大的感觉不 一定响。
响度还与频率有关。等响度曲线描述响度、声压以及声 源频率之间的关系。 从曲线看出,当音量开到使声压级为80 dB时,就可做 到高低频声音丰满 响度的单位是宋(Sone)
14
音色
音色又称音品,是声音的音调和响度以外的音质
差异。 声音的音色取决于该声音的频谱结构或是频谱包 络(声波曲线)。 高次谐波越丰富,音色就越有明亮感和穿透力。 此外,音色还与诸多其他因素有关,如听音条件 等。 它是一个主观量,常用柔和、刺耳、饱满等词描 述。
6
声压和声强
在声学中引用分贝来表示声压或声强的变化程度。 人的听觉神经的刺激程度不与刺激量大小成正比, 而是按刺激量以10为底的对数增长
7
8
动态范围
声音的动态范围指声音的最大声压级和最小声压 级之间的差值。
每种声源的动态范围依据各自的特性有所不同。
如女声的动态范围为25~50dB, 男声为30~50dB, 交响乐队的动态范围大于100dB。
空间感
一个声源发出的声音同时向各个方向散开,直接
和经反射到达的两个声音存在时间差。当时间差 超过一定数量时,听者会听到先后到达的两个声 音,从而产生回音。经多次反射,造成余声。 回声与余音的感觉可使听者感受出房间大小、高 低及内表面结构上的差异,这便是空间感。
17
2.音频信号的质量指标
(1) 频带宽度
数字电话约50dB。
19
(2)信噪比
信噪比SNR(Signal Noise Ratio)是有用信号与噪
声之比的简称,即有用信号的平均功率与噪声的 平均功率之比 信噪比大,在一定程度上能够掩蔽噪声,从而获 得较好的声音效果。 录制时应尽可能减小环境噪音。输出时应使音量 适当大,以减少环境噪音对听音的影响。
15
掩蔽效应
称听不到的声音为被掩蔽声,而起掩蔽作用
的声音为掩蔽声。 掩蔽效应的一般规律是强音压低音、低频率 声音压高频率。 利用掩蔽效应可以用有用信号去掩蔽无用的 信号,只需要把无用声音的声压级降低到掩 蔽阈以下即可。 在数字音频处理中,还可以利用掩蔽效应去 掉人耳听不到的那部分信号进行声音数据的 16 压缩。
音频处理技术
西安交通大学计算机教学实验中心
1
简述
音频是多媒体技术中媒体的一种,由于音频信号
是一种连续变化的模拟信号,而计算机只能处理 和记录二进制的数字信号,因此,音频信号必须 经过一定的变化和处理,变成二进制数据后才能 送到计算机进行编辑和存储。
2
声音的基本特 性
音频信号所携带的信息大体上可分为语音、音乐
20
2.2 数字音频
1.声音的数字化
数字化就是将连续信号变成离散信号。 对音频信号,首先在时间上离散,取有限个时间
点,称为采样。 然后在幅度上离散,取有限个幅度值,称为量化。 再将得到的数据表示成计算机容易识别的格式, 称为编码。
21
(1) PCM编码
PCM是一种把模拟信号转换成数字信号的最基
和音响三类。
语音是指具有语言内涵和人类约定的特殊媒体;
音乐是规范的符号化了的声音;
而音响指其他自然声音,如动物的叫声、机器的 轰鸣声、风雨雷电声等
3
音频信号的特 征
机械振动引起周围弹性媒质发生波动,产生声波。产生
声波的物体为声源(如人的声带、乐器等),声波传到人耳, 经过人类听觉系统的感知就是声音。 声波在时间和幅度上都是连续的,称为模拟音频信号。 声波可以分解成一系列正弦波的线性叠加: