音频信号分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

音频信号分析-- 关于带宽、动态范围和正常操作电平

音频信号主要指的是语言和音乐。在这篇文章中我将研究一些工作中常常涉及到的问题,例如各种信号在带宽、动态范围和电平上的要求。我们将讨论语言和音乐信号的峰值电平,以及处理信号峰值和电平变化的标准方法。

频谱

图( 15-1 )的数据向我们显示出在音乐厅中,人们面对面交谈时的正常感觉。这些东西包括:语言和音乐的带宽和动态的范围。参加测试者为听力正常的年轻人。音乐的频率的传播范围是很有限的,特别是高频部分。未扩声的语言只能存在于很小的范围之中。

如果我们以倍频程为单位来分析语言信号,见图 15-2 ,这是一位普通成年男人的语言频谱。频谱显示在 250hz 处为能量的最大值。 250hz 两边都呈下滑趋势。 1khz 以上的倍频呈每倍频 6dB 开始衰减。

图15-3 显示了古典音乐与摇滚音乐信号的长期能量谱。大家有没有注意到,古典音乐与语言的频谱在中频和高频两个范围是相似的。

请比较图15-2与图15-3 。

Figure 15-3: Long-term octave-wide power spectra for

classical and rock music.

倍频程与可懂度

见图15-4 ,在普通的语言能量谱中,完全独立的倍频部分十分有助于语言的可懂度。语言的可懂度并不意味着声音的听起来真实。众所周知,我们用电话的时候,我们的语言频率范围被限制在300hz-3000hz 之间。

看图,在1khz 到4khz 之间的频段对可懂度是最有影响力。这就是为什么在非常嘈杂的环境中,扩声系统一般在这个频段显得不足。最为理想的是,我们主动的去再生或增强语言信号,以同时获得真实度与可懂度。在合理的安静的环境中这是很有可能的。

可懂度与环境噪声水平之间的关系

在理想的情况下,本底噪音电平低于语言信号电平(平均值)25dB ,以得到真实的语言扩声。如果噪音电平只低于语言信号15dB ,大多数听众对于信息的理解并不感到困难。不过,此时已有少数人开始抱怨噪音。如果信噪比继续降低,对于所有的听众来说,字词之间的可懂度就没有了。激励器可以增加语言信号的响度,然而,处理的量是有限的。

什么时候的语言音量太吵耳?正常面对面交谈的声压级在60dB-65dB 之间。然而为大多数语言扩声时声压级被定在70-75dB 。当语言扩声超过85-90dB, 可懂度的增加就很少了。并且大多数听众开始抱怨音量太大了。如果音量继续增加,很多听众确确实实感到难以忍受,“音量太大了!!!”。图15-5 显示显示了声压级与可懂度之间的关系。

这里有一个语言扩声的最佳范例。例如在非常安静的环境中以65-75dB 的声压级来扩声,这简直是完美的。当噪声不断增加的时候,必须提高信号电平,以保证信噪比至少为15dB 。这里有一种典型峰值,当噪音在60-65dB 的范围,于是让系统声压级的峰值在80dB ,这样可以得到最好的可懂度。

体育场经常出现人群的欢呼声,声压级范围在85-95B 之间。在这种情况下想让扩声系统发挥作用是根本不可能的。最好等人群的欢呼声退去之后,再开始播音和讲解。

相关文档
最新文档