三章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 .声音的产生
声音是指通过一定介质(如空气、水等)传播的一种连续波,其本质是机械振动或气流扰动引起周围弹性媒质发生波动的现象,它是一个随着时间连续变化的模拟信号,在物理学中称为声波。声波具有普通波所具有的特性,即反射(Reflection)、折射(Refraction)和衍射(Diffraction)
2 .声音的几个重要指标
(1)基准线——提供模拟信号的基准点。
(2)振幅(Amplitude)——波的高低幅度,表示声音的强弱。
(3)周期(Period)——两个相邻波之间的时间长度。
(4)频率(Frequency)——每秒钟振动的次数,以Hz为单位。
•音频(Audio)信号
•亚音信号,或称为次音信号(subsonic)
•超音频信号,或称超声波(ultrasonic)信号(应用)
•话音(speech)信号(300~3000 Hz)
人的发音器官发出的声音频率大约是80~3400 Hz。
在多媒体技术中,处理的信号主要是音频信号,它包括音乐、话音、自然声等。
声音的三要素为音调、音色和音强。就听觉特性而言,这三者决定了声音的质量。
1)音调——代表声音的高低。音调与频率有关,频率越高,音调越高,反之亦然。当人们提高唱盘的转速时,声音频率提高,音调也提高。当使用音频处理软件对声音进行处理时,频率的改变可造成音调的改变。
2)音强——代表声音的强度,也称“响度”,“音量”是指音强。音强与声波的振幅成正比,振幅越大,强度越大。定量描述声音强弱的方式有多种,声压和声压级就是其中的两种形式。3)音色——具有特色的声音,它与声波的形状有关,是由混入基音的泛音决定。
通常的声音分为纯音和复音两种类型。所谓纯音,是指振幅和周期均为常数的声音,一般只会出现在专用的电子设备中;复音则是具有不同频率和振幅的混合音,大自然中的声音大部分是复音。复音中最低的频率称为基频,即“基音”,它是声音的基调。其他频率复音称为“谐音”,也叫泛音,复音中的基频和谐音决定了复音的音质和音色。各种声源都有自己独特的音色,如各种乐器、不同的人、各种生物等,即使在同一音高和同一声音强度的情况下,人们也能根据音色辨别声源种类。
1.声压(P)
声波引起某处媒质压强的变化量称为该处的声压。(单位为Pa(帕斯卡),即牛顿/米2是压强的量纲)
也就是说:有声波时该处的压强值与没有声波时
该处的压强值的差值
由于人耳对声音强弱的感觉并不与声压的大小成线性关系,而是大体上与声压有效值的对数成正比。因此,为了适应人类听觉的这一特性,通常对声压的有效值取对数,用其对数值来表示声音的强弱即声压级。
a . Pref为具有正常听力的年轻人对1 kHz的声音刚好能察觉的声压值。
b .声压级实际上是一种相对量,是某点的声压与零声压的比,是描述声音变化的动态范围的物理量
3.音频与音高
音频是指声音信号的频率;音高则是指音调的高低。
人对于声音频率的感觉表现为音调的高低。音高与声音频率的关系也大体上呈对数关系。
4.音频带宽20 Hz~20 kHz是人类的听觉频带
①人耳对不同频率的敏感程度有很大差别。
②中频段(2 kHz~4 kHz)最为敏感,幅度很低的信号都能被人耳听到。
③低频区和高频区较不敏感,能被人耳听到的信号幅度比中频段要高得多
5.响度与响度级
响度是指人类所感受到声音大小的程度,而响度级则是以1 kHz信号的声压级数定义的响度的数值,单位是“方”(Phon)。
注:声压级是客观量,而响度级则是主观量。
6.等响度曲线
具有相等响度的不同频率的点连接起来构成的一条条曲线被称为等响度曲线
7.绝对听阈
在安静环境中,能被人耳听到的纯音的最小值(该曲线为0方响度级等响度曲线,即该曲线在1 kHz时声压级为0 db)
掩蔽听阈: 频域中的一个强音会掩蔽与之同时发声的附近的弱音。
注:①某一频率强音的存在会改变其附近的绝对听阈曲线,而改变部分称为掩蔽听阈曲线。
②改变后的听阈曲线以下的各种声音将不能被人耳察觉。
1.模拟信号
从时间上以及幅值上都连续(不间断)变化的信号称为模拟信号
注: ①模拟信号强调在时间上的连续性。
②模拟信号强调在幅值上的连续性。
③计量和描述方式,一般采用十进制数。
在时间上和幅值上都是离散(不连续)的信号称为数字信号。
注:①数字信号强调在时间上和幅值上都不连续。
②数字信号的描述方式采用二进制数量来表示。
③二进制数与数字信号是两个概念,前者只是对后者的一种描述,在数字信号中强调的是状态。
④正逻辑是人们用“1”表示有脉冲或电源接通,而用“0”表示无脉冲或电源断开。
⑤二进制与十进制的关系:
仅从三个方面分析
1. 音频信号的动态范围
①实际声场中声音强弱的变化达120 dB。
②传统的模拟音响设备的动态范围:采用模拟信号处理方式记录和重放音频信号。比如:磁带录音机等,其动态范围不会超过60 dB。
③数字音响设备的动态范围。
结论:数字系统的音频信号动态范围比模拟系统提高了近一倍。这也是CD技术之所以获得高水准的音质的重要原因。
采用16 bit量化(如16位声卡),则声音的强弱范围就可划分成:个等级,因而动态范围可达。
2. 噪声容限(对噪声的承受能力)
①传统的音响设备的失真情况
在重放时,由于失真、噪声、电机转速不匀等原因,重放效果大打折扣。
②数字音响设备的失真情况
数字系统只要能识别码的长短或脉冲的有无,即可再现出原来的信号。
结论:数字信号的噪声容限比较高
3. 与计算机的兼容性
多媒体是以计算机控制为基础的,而计算机处理、存储的都是数字信息,即“0”、“1”信号,所以在多媒体中的音频、视频信号必须是数字信号。
数字化特点:
①动态范围大。若采用16 bit量化方法,音频信号的幅度可分为65536个量化级,动态范围达96 dB。
②信息易处理。可以通过计算机对音频、视频信号进行各种特技及非线性编辑。
③媒体易保存。使用时间长,采用数字化的光盘,重放时不存在机械磨损,使用寿命长。
④成本低。数字化信息便于大规模集成电路的存储和处理,可降低成本。
⑤可靠性高。数字信号只要求脉冲的有无,而不依赖信号的幅值大小,对硬件一致性和稳定性要求下降了许多,从而提高了可靠性。
1.模拟信号的数字化
将模拟信号转变成数字信号的处理过程称为模拟信号的数字。
2.模拟信号的数字化方法
①采样:以适当的时间间隔观测模拟信号波形幅值的过程叫采样。
②量化:将采样时刻的信号幅值归整(四舍五入)到与其最接近的整数标度叫做量化。
③编码:将量化后的整数,用一个二进制数码序列来表示叫做编码。
1.采样周期
两次采样的时间间隔大小叫做采样周期, 用T s表示
3. 采样频率的选择
①与采样精度和采样后的数据量大小有关。
在单位时间内采样次数越多,则对信号的描述越细腻,越接近真实信号,即采样频率f s应尽量高。但一味提高采样频率,增大数据量,给数据处理带来了麻烦,增加了技术实现上的困难。
②与被测信号的变化速度有关。
在过短的时间里反复测量体温或是河流水位的变化是完全没有必要的。这就是说,采样频率的选择必须考虑被采样信号变化的快慢程度,f s是一个相对值。
4. 采样定理
采样频率f s必须高于被采样信号所含最高频率的两倍。
该定理指出:当对连续变化的信号波形进行采样时,若采样频率f s高于该信号所含最高频率的两倍,那么可以由采样值通过插补技术正确地恢复原信号的波形,否则将会引起频谱混叠(Aliasing)产生混叠噪声(Aliasing Noise),而重叠的部分是不能恢复。这一定理不仅适用于模拟音频信号,也同样适用于模拟视频信号的采样。
1.量化过程
对非整数的采样值整数化(四舍五入)的过程
2. 量化级
对满幅度信号所取的量化份数为量化级
3. 量化级差