音频基础知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一般认为20Hz-20kHz是人耳听觉频带,称为“声频”。这个频段的声音称为“可闻声”,高于20kHz的称为“超声”,低于20Hz的称为“次声“。(《广播播控与电声技术》p3) 所谓声音的质量,是指经传输、处理后音频信号的保真度。目前,业界公认的声音质量标准分为4级,即数字激光唱盘CD-DA质量,其信号带宽为10Hz~20kHz;调频广播FM质量,其信号带宽为20Hz~15kHz;调幅广播AM质量,其信号带宽为50Hz~7kHz;电话的话音质量,其信号带宽为200Hz~3400Hz。可见,数字激光唱盘的声音质量最高,电话的话音质量最低。除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。由于电子平衡与变压器平衡的区别,所以二者的接线方法是不一样的,应引起注意。
声学的基本概念音频频率范围一般可以分为四个频段,即低频段(30 ̄150Hz);中低频段(30 ̄150Hz);中低频(150 ̄500Hz);中高频段(500 ̄5000Hz);高频段(5000 ̄20000Hz)。30 ̄150Hz频段:能够表现音乐的低频成分,使欣赏者感受到强劲有力的动感。150 ̄500Hz频段:能够表现单个打击乐器在音乐中的表现力,是低频中表达力度的部分。500 ̄5000Hz频段:主要表达演唱者或语言的清淅度及弦乐的表现力。5000 ̄20000Hz频段:主要表达音乐的明亮度,但过多会使声音发破。音频频率范围一般可以分为四个频段,即低频段(30 ̄150Hz);中低频段(30 ̄150Hz);中低频(150 ̄500Hz);中高频段(500 ̄5000Hz);高频段(5000 ̄20000Hz)。30 ̄150Hz频段:能够表现音乐的低频成分,使欣赏者感受到强劲有力的动感。150 ̄500Hz频段:能够表现单个打击乐器在音乐中的表现力,是低频中表达力度的部分。500 ̄5000Hz频段:主要表达演唱者或语言的清淅度及弦乐的表现力。5000 ̄20000Hz频段:主要表达音乐的明亮度,但过多会使声音发破。所谓声音的质量,是指经传输、处理后音频信号的保真度。目前,业界公认的声音质量标准分为4级,即数字激光唱盘CD-DA质量,其信号带宽为10Hz~20kHz;调频广播FM质量,其信号带宽为20Hz~15kHz;调幅广播AM质量,其信号带宽为50Hz~7kHz;电话的话音质量,其信号带宽为200Hz~3400Hz。可见,数字激光唱盘的声音质量最高,电话的话音质量最低。除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。音质评价方法评价再现声音的质量有主观评价和客观评价两种方法。例如: 1.语音音质评定语音编码质量的方法为主观评定和客观评定。目前常用的是主观评定,即以主观打分(MOS)来度量,它分为以下五级:5(优),不察觉失真;4(良),刚察觉失真,但不讨厌;3(中),察觉失真,稍微讨厌;2(差),讨厌,但不令人反感;
1(劣),极其讨厌,令人反感。一般再现语音频率若达7kHz以上,MOS可评5分。这种评价标准广泛应用于多媒体技术和通信中,如可视电话、电视会议、语音电子邮件、语音信箱等。 2.乐音音质乐音音质的优劣取决于多种因素,如声源特性(声压、频率、频谱等)、音响器材的信号特性(如失真度、频响、动态范围、信噪比、瞬态特性、立体声分离度等)、声场特性(如直达声、前期反射声、混响声、两耳间互相关系数、基准振动、吸声率等)、听觉特性(如响度曲线、可听范围、各种听感)等。所以,对音响设备再现音质的评价难度较大。所谓声音的质量,是指经传输、处理后音频信号的保真度。目前,业界公认的声音质量标准分为4级,即数字激光唱盘CD-DA质量,其信号带宽为10Hz~20kHz;调频广播FM 质量,其信号带宽为20Hz~15kHz;调幅广播AM质量,其信号带宽为50Hz~7kHz;电话的话音质量,其信号带宽为200Hz~3400Hz。可见,数字激光唱盘的声音质量最高,电话的话音质量最低。除了频率范围外,人们往往还用其它方法和指标来进一步描述不同用途的音质标准。
音质评价方法评价再现声音的质量有主观评价和客观评价两种方法。例如: 1.语音音质评定语音编码质量的方法为主观评定和客观评定。目前常用的是主观评定,即以主观打分(MOS)来度量,它分为以下五级:5(优),不察觉失真;4(良),刚察觉失真,但不讨厌;3(中),察觉失真,稍微讨厌;2(差),讨厌,但不令人反感;1(劣),极其讨厌,令人反感。一般再现语音频率若达7kHz以上,MOS可评5分。这种评价标准广泛应用于多媒体技术和通信中,如可视电话、电视会议、语音电子邮件、语音信箱等。 2.乐音音质乐音音质的优劣取决于多种因素,如声源特性(声压、频率、频谱等)、音响器材的信号特性(如失真度、频响、动态范围、信噪比、瞬态特性、立体声分离度等)、声场特性(如直达声、前期反射声、混响声、两耳间互相关系数、基准振动、吸声率等)、听觉特性(如响度曲线、可听范围、各种听感)等。所以,对音响设备再现音质的评价难度较大。通常用下列两种方法:一是使用仪器测试技术指标;二是凭主观聆听各种音效。由于乐音音质属性复杂,主观评价的个人色彩较浓,而现有的音响测试技术又只能从某些侧面反映其保真度。所以,迄今为止,还没有一个能真正定量反映乐音音质保真度的国际公认的评价标准。但也有报道,国际电信联盟(ITU-T)近期已批准一种客观评价音质的被称之为电子耳的新型测量方法,可对任何音响器材的音质进行客观听音评价,也可用于检测电话通讯语音编码系统的缺陷。
现将乐音音质评价方法综述如下:
(1)主观听判音效通常,据乐音音质听感三要素,即响度、音调和愉快感的变化和组合来主观评价音质的各种属性,如低频响亮为声音丰满,高频响亮为声音明亮,低频微弱为声音平滑,高频微弱为声音清澄。下面结合声源、声场及信号特性介绍几种典型的听感。
①立体感主要由声音的空间感(环绕感)、定位感(方向感)、层次感(厚度感)等所构成的听感,具有这些听感的声音称为立体声。自然界的各种声场本身都是富有立体感的,它是模拟声源声象最重要的一个特征。德·波尔效应证明,人耳的生理特点是:人耳在两声源的对称轴上,当声压差△p=0dB和时间差△t=0ms时,感觉两声源声象相同,分不出有两个声源;而当△p>15dB或△t>3ms时,人耳就感觉到有两个声源,声像往声压大或导前的声源移动,每5dB的声压差相当于lms的时间差。哈斯效应又进一步证明,当△t=5ms~35ms 时,人耳感到有两个声源;而当近次反射声、滞后直达声或两个声源的时间差△t>50ms时,即使一次反射声(又称近次或前期反射声)或滞后声的响度比直达声或导前声的响度大许多倍,声源方位仍由直达声或导前声决定。根据人耳的这个生理特点,只要通过对声音的强度、延时、混响、空间效应等进行适当控制和处理,在两耳人为的制造具有一定的时间差△t、相位差△θ、声压差△P的声波状态,并使这种状态和原声源在双耳处产生的声波状态完全相同,人就能真实、完整地感受到重现声音的立体感。与单声道声音相比,立体声通常具有声象分散、各声部音量分布得当、清晰度高、背景噪声低的特点。
②定位感若声源是以左右、上下、前后不同方位录音后发送,则接收重放的声音应能将原声场中声源的方位重现出来,这就是定位感。根据人耳的生理特点,由同一声源首先到达两耳的直达声的最大时间差为0.44ms~0.5ms,同时还有一定的声压差、相位差。生理心理学证明:20Hz~200Hz低音主要靠人两耳的相位差定位,300Hz~4kHz中音主要靠声压差定位,更高的高音主要靠时间差定位。可见,定位感主要由首先到达两耳的直达声决定,而滞后到达两耳的一次反射声和经四面八方多次反射的混响声主要模拟声象的空间环绕感。
③空间感一次反射声和多次反射混响声虽然滞后直达声,对声音方向感影响不大,但反射声总是从四面八方到达两耳,对听觉判断周围空间大小有重要影响,使人耳有被环绕包围的感觉,这就是空间感。空间感比定位感更重要。
④层次感声音高、中、低频频响均衡,高音谐音丰富,清澈纤细而不刺耳,中音明亮突出,丰满充实而不生硬,低音厚实而无鼻音。⑤厚度感低音沉稳有力,重厚而不浑浊,高