多媒体音频信息处理技术优秀课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
c f
4.1.2 声音信号的形式与特征
❖ (2) 幅度:是指信号的基线到当前波峰的距离, 即声波振动的强弱,决定了信号音量的强弱 程度。
A. 在物理上,通常用声压和声压级来衡量声音的 强弱程度。
❖声压:指在声场中某处由声波引起的压强的变化值, 单位为“帕斯卡(Pa)”。
正常人刚刚能听到的最微弱声音的声压为2X10-5Pa,这个声 压值称为人耳的“听阈”。
❖频率的倒数为周期
具有周期性的声音通常会更悦耳动听。
4.1.2 声音信号的形式与特征
也可用声音的波长来描述声音
❖波长:沿声音传播方向,振动一个周期所传播的距离; 或在波形上相位相同的两个相邻点间的距离,单位m.
声音的频率也反映了声音的速度
❖声速:单位时间内声音传播的距离,单位m/s.
声速、周期、波长的关系为
4.1.1 声音处理技术的历史回顾
❖ 4. 数字化声音处理技术
依靠数字信号来记录并播放声音 核心技术是对声音的采样。
4.1.2 声音信号的形式与特征
❖ 1. 什么是声音?(声音的形式)
声音是一种振动波,是机械振动或气流扰动引起 周围的弹性介质发生波动的现象。
❖许多声音的波形混合在一起可能构成交响乐、交谈声, 也可能完全是噪声。
(3) 音响:
❖即声音的响度,是声音振幅的主观属性。 ❖振幅越大,响度越大,但它们也不是线性关系。
音乐中的音阶:
❖就是按频率的对数取等分来确定的。 ❖每八度的声音,其频率就升高或降低一倍。
4.1.3 声音质量的评价
❖ 声音质量的评价是很困难的,也是一个值得 研究的课题。
❖ 目前,主要有两种度量方法
1. 声音质量的客观度量 2. 声音质量的主观度量
1. 声音质量的客观度量法
❖ 即用仪器对声波进行测量和分析 ❖ 常用仪器:声级计
SNR 10lg PS PN
是一种能对声音做出类似人耳反应的仪器,它能进行客观
且可重复的声压测量和声级测量。
❖ 主要指标:信噪比SNR
即有用信号与噪声之比,单位为分贝。
❖ 2. 声音的听觉特征(主观感受)
(1) 音调:
❖即声音频率的主观反映,也称音高。 ❖一般地,音调的高低与频率的高低是一致的。当频率
不变时,强度的变化对音调稍有影响(强度增大时, 低频率音调显得更低,高频率音调显得更高)。
(2) 音色:
❖日常生活中通常是复合音,包括基音和谐音成分。 ❖人耳对复合音中各种谐音成分总和起来的主观印象,
多媒体音频信息处理技术
4.1 认识声音
4.1.1 声音处理技术的历史回顾 4.1.2 声音信号的形式与特征 4.1.3 声音质量的评价
4.1.1 声音处理技术的历史回顾
❖ 1. 自古以来
人类很早就开始研究声音,并利用当时已掌握的 声音的某些规律来制造乐器、进行建筑设计或传 声装置设计等,使声音更悦耳动听或传得更远。
称为音色。
4.1.2 声音信号的形式与特征
谐音的频率和振 幅决定音色
任何复杂的周期性振动都可分解为许多谐 波,称为傅里叶定律;把复杂的振动分解 成各种频率成分的过程称为傅里叶分析, 也称频谱分析;分析结果称为谱图。
4.1.2 声音信号的形式与特征
❖例如:
基音为100Hz的钢琴声约有15个振幅不同的谐音 基音为100Hz的黑管声约有9个振幅不同的谐音. 语音:特殊的复合音,包括元音和辅音。
请举出古代利用声音的例子
❖天坛的回音壁、三音石,古代乐器,等 ❖铁路工人用铁锤敲击铁轨、医生的听诊器、行军打仗
的号角鼓声
这个时期,声音处理技术的特征:
❖凭耳朵辨别声音,不能记录和存储声音
4.1.1 声音处理技术的历史回顾
❖ 2. 机械方法记录和播放
19世纪爱迪生发明留声机
❖启发现象
电话传话器里的膜板随着说话声会引起震动的现象
率级LW和声强级LI,其公式为
Lw
10 lg
W1 W0
LI
10 lg
I1 I0
其中W0=10-12w,
I0=10-12w/s2
❖声强级与声压级的关系为
LI Lp b
b10lg
293 273t
10p0
b与媒介的声特性阻抗有关,因此与 空气的温度t和压强p有关,可查表。
4.1.2 声音信号的形式与特征
❖ (3) 声音的相加和相减
即两个以上独立声源作用于某一点叠加形成的声 音。
声音的能量(声功率W,声强I)是可以代数相加的, 但声压(声压P,声压级L)不能直接相加。
一些主要结论:
❖两个声音相加,总声压级不会比其中一个大3dB以上 ❖两个声音的声压级相差10dB以上时,叠加增量可以忽
略不计。
4.1.2 声音信号的形式与特征
SNR 20lg VS VN
❖是一种播放声音的机械装置,预先按声音波形特征刻 制在唱片表面(弧形凹槽),播放时引起探针的不同幅 度的振动并传递发声。
4.1.1 声音处理技术的历史回顾
❖ 3. 电声技术
依靠电信号来记录并播放声音
❖通过电压产生模拟声波变化的电流信号,灌录成早期 的唱片或磁带,这种电流信号称为模拟信号。
源自文库❖磁带上的磁极变化或唱片音槽内的纹路起伏变化都是 声音信号的变化对应成正比的。
使人耳产生剧烈疼痛感觉的声音的声压约为20Pa,这个声压 值称为人耳的“痛阈”。
4.1.2 声音信号的形式与特征
经研究发现:人耳对声音强弱的感觉大体上与声 压的对数成正比,称为声压级,单位为分贝(dB)
❖分贝数的计算公式为
LP
20 lg
P1 p0
其中P0为基准声压值,取P0=2X10-5Pa
4.1.2 声音信号的形式与特征
B. 在物理上,也可用声功率和声强来衡量声音 的强弱程度。
❖声功率:是指单位时间内,声波通过垂直于传播方向 某指定面积的声能量,单位为W。
❖声强:是指单位时间内,声波通过垂直于传播方向的 单位面积的声能量,单位为W/S2。
❖声压与声强的关系为
I P c
4.1.2 声音信号的形式与特征
❖也可用声功率或声强计算声音分贝数,分别称为声功
在物理上,声音可用一条连线的曲线来表示,它 是在时间和幅度上都连续变化的量,所以称为模 拟量。
4.1.2 声音信号的形式与特征
❖ 2. 声音的物理特征
(1)频率:即声波振动的快慢,单位Hz。
❖根据频率,声音可分为
A. 次声波:低于20Hz B. 正常声音:20Hz—20KHz (语音:300Hz—3KHz) C. 超声波:高于20KHz
4.1.2 声音信号的形式与特征
❖ (2) 幅度:是指信号的基线到当前波峰的距离, 即声波振动的强弱,决定了信号音量的强弱 程度。
A. 在物理上,通常用声压和声压级来衡量声音的 强弱程度。
❖声压:指在声场中某处由声波引起的压强的变化值, 单位为“帕斯卡(Pa)”。
正常人刚刚能听到的最微弱声音的声压为2X10-5Pa,这个声 压值称为人耳的“听阈”。
❖频率的倒数为周期
具有周期性的声音通常会更悦耳动听。
4.1.2 声音信号的形式与特征
也可用声音的波长来描述声音
❖波长:沿声音传播方向,振动一个周期所传播的距离; 或在波形上相位相同的两个相邻点间的距离,单位m.
声音的频率也反映了声音的速度
❖声速:单位时间内声音传播的距离,单位m/s.
声速、周期、波长的关系为
4.1.1 声音处理技术的历史回顾
❖ 4. 数字化声音处理技术
依靠数字信号来记录并播放声音 核心技术是对声音的采样。
4.1.2 声音信号的形式与特征
❖ 1. 什么是声音?(声音的形式)
声音是一种振动波,是机械振动或气流扰动引起 周围的弹性介质发生波动的现象。
❖许多声音的波形混合在一起可能构成交响乐、交谈声, 也可能完全是噪声。
(3) 音响:
❖即声音的响度,是声音振幅的主观属性。 ❖振幅越大,响度越大,但它们也不是线性关系。
音乐中的音阶:
❖就是按频率的对数取等分来确定的。 ❖每八度的声音,其频率就升高或降低一倍。
4.1.3 声音质量的评价
❖ 声音质量的评价是很困难的,也是一个值得 研究的课题。
❖ 目前,主要有两种度量方法
1. 声音质量的客观度量 2. 声音质量的主观度量
1. 声音质量的客观度量法
❖ 即用仪器对声波进行测量和分析 ❖ 常用仪器:声级计
SNR 10lg PS PN
是一种能对声音做出类似人耳反应的仪器,它能进行客观
且可重复的声压测量和声级测量。
❖ 主要指标:信噪比SNR
即有用信号与噪声之比,单位为分贝。
❖ 2. 声音的听觉特征(主观感受)
(1) 音调:
❖即声音频率的主观反映,也称音高。 ❖一般地,音调的高低与频率的高低是一致的。当频率
不变时,强度的变化对音调稍有影响(强度增大时, 低频率音调显得更低,高频率音调显得更高)。
(2) 音色:
❖日常生活中通常是复合音,包括基音和谐音成分。 ❖人耳对复合音中各种谐音成分总和起来的主观印象,
多媒体音频信息处理技术
4.1 认识声音
4.1.1 声音处理技术的历史回顾 4.1.2 声音信号的形式与特征 4.1.3 声音质量的评价
4.1.1 声音处理技术的历史回顾
❖ 1. 自古以来
人类很早就开始研究声音,并利用当时已掌握的 声音的某些规律来制造乐器、进行建筑设计或传 声装置设计等,使声音更悦耳动听或传得更远。
称为音色。
4.1.2 声音信号的形式与特征
谐音的频率和振 幅决定音色
任何复杂的周期性振动都可分解为许多谐 波,称为傅里叶定律;把复杂的振动分解 成各种频率成分的过程称为傅里叶分析, 也称频谱分析;分析结果称为谱图。
4.1.2 声音信号的形式与特征
❖例如:
基音为100Hz的钢琴声约有15个振幅不同的谐音 基音为100Hz的黑管声约有9个振幅不同的谐音. 语音:特殊的复合音,包括元音和辅音。
请举出古代利用声音的例子
❖天坛的回音壁、三音石,古代乐器,等 ❖铁路工人用铁锤敲击铁轨、医生的听诊器、行军打仗
的号角鼓声
这个时期,声音处理技术的特征:
❖凭耳朵辨别声音,不能记录和存储声音
4.1.1 声音处理技术的历史回顾
❖ 2. 机械方法记录和播放
19世纪爱迪生发明留声机
❖启发现象
电话传话器里的膜板随着说话声会引起震动的现象
率级LW和声强级LI,其公式为
Lw
10 lg
W1 W0
LI
10 lg
I1 I0
其中W0=10-12w,
I0=10-12w/s2
❖声强级与声压级的关系为
LI Lp b
b10lg
293 273t
10p0
b与媒介的声特性阻抗有关,因此与 空气的温度t和压强p有关,可查表。
4.1.2 声音信号的形式与特征
❖ (3) 声音的相加和相减
即两个以上独立声源作用于某一点叠加形成的声 音。
声音的能量(声功率W,声强I)是可以代数相加的, 但声压(声压P,声压级L)不能直接相加。
一些主要结论:
❖两个声音相加,总声压级不会比其中一个大3dB以上 ❖两个声音的声压级相差10dB以上时,叠加增量可以忽
略不计。
4.1.2 声音信号的形式与特征
SNR 20lg VS VN
❖是一种播放声音的机械装置,预先按声音波形特征刻 制在唱片表面(弧形凹槽),播放时引起探针的不同幅 度的振动并传递发声。
4.1.1 声音处理技术的历史回顾
❖ 3. 电声技术
依靠电信号来记录并播放声音
❖通过电压产生模拟声波变化的电流信号,灌录成早期 的唱片或磁带,这种电流信号称为模拟信号。
源自文库❖磁带上的磁极变化或唱片音槽内的纹路起伏变化都是 声音信号的变化对应成正比的。
使人耳产生剧烈疼痛感觉的声音的声压约为20Pa,这个声压 值称为人耳的“痛阈”。
4.1.2 声音信号的形式与特征
经研究发现:人耳对声音强弱的感觉大体上与声 压的对数成正比,称为声压级,单位为分贝(dB)
❖分贝数的计算公式为
LP
20 lg
P1 p0
其中P0为基准声压值,取P0=2X10-5Pa
4.1.2 声音信号的形式与特征
B. 在物理上,也可用声功率和声强来衡量声音 的强弱程度。
❖声功率:是指单位时间内,声波通过垂直于传播方向 某指定面积的声能量,单位为W。
❖声强:是指单位时间内,声波通过垂直于传播方向的 单位面积的声能量,单位为W/S2。
❖声压与声强的关系为
I P c
4.1.2 声音信号的形式与特征
❖也可用声功率或声强计算声音分贝数,分别称为声功
在物理上,声音可用一条连线的曲线来表示,它 是在时间和幅度上都连续变化的量,所以称为模 拟量。
4.1.2 声音信号的形式与特征
❖ 2. 声音的物理特征
(1)频率:即声波振动的快慢,单位Hz。
❖根据频率,声音可分为
A. 次声波:低于20Hz B. 正常声音:20Hz—20KHz (语音:300Hz—3KHz) C. 超声波:高于20KHz