浅谈音频响度控制在播出中的应用

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

浅谈音频响度控制在播出中的应用

由于电视台的节目信号源来源不同，各个制作单位的音频的制作准则也不一，因此会导致在节目播出时不同节目源的声音电平或响度差异很大。在电视节目播出时，如果连续播出的两条节目响度差异较大，在节目切换时会让观众感到刺耳。尤其是电视节目中间插播的广告，为引发观众的注意，通常音频响度都远高于其它的节目，特别是语音和对白，是人耳最敏感的音频频率区间，使得观众尤为感到不适和烦躁。响度问题的出现已经严重影响到了节目的播出效果及用户在家收看电视节目的声音效果。因此，响度控制成为了我们现今在播出系统中需要解决的问题。

本刊特别编辑了两篇音频响度方面的文章，与大家共同交流探讨。

一. 基本概念的理解

响度(Loudness)，电信号转换为声波振动时度量声音能量的一个指标。响度实际上是针对人耳对不同声音的感应强弱而提出来的一个衡量标准，它的大小不仅跟声音的幅度大小有关，还和声音的频率有关。声压级相同，频率不同的声音，听起来响亮程度也不同。结合声压、频率和人耳的感觉得到的曲线关系称“等响度曲线”，如图1所示。

图1 等响度曲

二. 如何处理播出系统中的音频响度问题

一般情况下，电视台的播出系统在节目播出时对音频信号不会做相应的处理，而是完全依赖于节目素材本身的音频质量。在过去，对响度的控制方法主要是利用分立的电阻、电容和电感原件组成的控制系统。由于这样的系统过于简单，不能调整参数，对动态范围大的音频信号处理效果不好，影响了对电视节目的欣赏。但也有部分电视台在播出系统的输出设备中增加了音频压缩限幅处理设备。音频压缩限幅处理器使用VU表来测量音频电平，而在数字系统中则使用峰值表严格控制和检测峰值。该设备用于专业音频人员调整并固化参数，以改善音频播出的质量，在一定程度上有效地控制了音频播出的电平，但VU表、PPM表的指示值

不能表示音频信号的响度；而一些非音频专业的技术人员容易将电平和响度混为一谈，错误地理解为控制电平就是控制了最终还原的音频响度。

当我们在控制节目的电平时，对节目响度的异常现象通常是没有什么好的办法，因此导致很多节目如广告及老版的模拟节目内容，由于前期制作阶段对音频

信号进行了压缩限幅处理，使得音频电平非常标准，可是没有想到还原出来的响度却严重破坏了频道整体的平均响度水平，从而造成音频信号的刺耳播出。因此，在这种情况下，我们需要提供一种控制灵活、可以对动态范围大的音频信号进行良好处理的响度控制系统及控制方法。

为了更好的解决播出中存在的响度问题，我台测试了大连捷成的PD-DAP嵌入音频响度动态范围控制模块，该模块能够对SDI信号中所嵌入音频的功率或响度特征进行提取和处理，从而对音频信号的动态范围进行压缩、限幅、扩张控制及增益调整，其中压缩和扩展门限可根据音频VU值和响度值进行选择，使输入音频信号瞬时稳定在设置好的范围内，解决了在节目播出时，不同节目音频信号增益的不均衡问题。

三. 响度的控制解决方式

根据以上介绍，我们可以知道决定响度的重要因素是平均电平而不是峰值电平，因此在在解决响度问题时，我们首先要提取响度特征值，再进行相关的音频处理：如压缩或限制扩展等动态范围内的信号处理方式，以便我们更好的处理响度问题，具体解决方法流程如图2：

图2

1. 提取响度特征值

首先我们需将串行的需要处理的音频数据和与之同步的时钟信号接入FPGA 芯片，完成信号的串并转移，将串行的数据流转变成并行的24bit的音频数据，便于接下来的处理和运算；一个24bit音频数据对应一个音频的采样点（我们听的声音就是由若干个连续的采样点组成）。

将连续的串并转移后的24bit音频数据采样值，送入FPGA内部的FIR数字滤波器，提取我们所要的响度音频数值（音频数据中3K~5K的数据）；同时将表示响度特征的音频数据做多次累加，再取其平均值；这样做的目的是能够更准确的提取响度特征值。我们把提取出的这个响度值作为实施响度控制的一个依据参数。

2. 压缩限幅

将提取出来的响度特征值与设定好的压缩门限值做比较，当响度特征值大于门限值时，系统启动音频压缩功能，并根据压缩比率产生一个压缩系数；同时由于上面对音频采样数据滤波、累加再计算其平均值需要一定的运算时间，也就是说在这一段时间内的音频采样数据是不能输出的，这就需要在FPGA内部做一个RAM将这段音频采样数据存储，等待压缩系数产生以后再将存储区的音频采样数据提取出来，并与压缩系数相乘。这样就得出了我们想要的音频数据；同时为了使输出的音频数据听起来感觉更好，在此增加了两个效果处理的时间，即跟踪时间和释放时间。跟踪时间就是在压缩功能启动后，在音频采样数据乘以压缩系数并达到最后稳定输出的时间，而释放时间正好与之相反是在压缩过程中，当响度特征值小于压缩门限时，要关闭压缩功能，从关闭到最后稳定的时间就是释放时间。这两个时间是根据需要，用户自行设定，目的就是在启动压缩和撤销压缩的时候保证信号不会突变，使最后输出的效果更佳。

压缩限幅的处理方式不同于我们常采用的自动增益控制处理，主要区别是：自动增益控制处理是将源信号中的所有信号都进行了缩小处理，这样做虽然保证将幅度很大的信号电平减小，但是同时也会将小信号进行了缩小处理，从而使信号失去原有的完整性。

3. 扩展，提高音频信号的动态范围

该模块在进行压缩限幅处理的同时也考虑到了信号提升后出现的问题：一是过分提升后，系统在应对突变信号时变得脆弱，很容易导致信号溢出；二是提升后会不同程度的将极小信号的噪音电平也同时提升；三是信号在高、低电平的临界线出现变化时，自动增益控制的固有特性会使声音听起来有不连贯或喘气的感

觉。PD-DAP嵌入音频响度动态范围控制模块对以上各种问题采取了比较有效的

控制措施，采用音频电平扩展（向下扩展）的处理模式，对突变的信号进行有效监测，同时设定保护门槛电平，避免了小信号提升后的溢出问题。

扩展Downward Expansion（向下扩展），即把低于门限的弱小信号变得更弱。扩展实际上是压缩的反过程，压缩是缩小信号的动态范围，而扩展是增大信号的动态范围，就是说超过扩展门限的信号保持原来的信号幅度不变，而低于扩展门限的信号，我们可以按照一定的比例使其变得更小，也就是所说的向下扩大了动态范围。 [Page]

其中比率、跟踪时间和释放时间同样是根据需求可进行响应的调节。由于扩展功能的比率变大之后低于门限的信号会变得更小，以至于被淹没掉。而当比率很大的时候扩展器实际就是一个噪声门，设置带有噪音门槛参数的设置，极为有效地消除和抑制输出的噪音电平。

以上各参数的设置，可以更好的提高音频的动态范围，有效的解决了超过扩展门限的信号保持原来的信号幅度不变，而低于扩展门限的信号将会提高它的动态范围，即向下扩大了其动态范围。

4. 噪声处理

该模块同时具有噪音门槛参数的设置，较为有效地消除和抑制输出的噪音电平，我们可以通过系统自行设置噪音门限值：当输入信号的门限值达到所设定的系统默认值时，系统会直接默认此信号为噪音信号，并对此直接进行音频噪音衰减处理。同时，音频噪音衰减参数可以有效地消除和抑制噪音信号，这种信号处理方式常用于人声场合，以便将噪音值降到最低，以保证人耳的最佳听觉状态。

通过以上的对PD-DAP嵌入音频响度动态范围控制模块各项参数设置的方式，使得我们播出系统的输出音频信号既提高音量、减少音频失真，又保证音质的极佳效果。

四. 结语

响度问题的解决已成为各大电视台播出系统的首要问题，同时各种响度控制