3D音效深度探究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3D音效深度探究
随着电脑的家用市场和游戏市场逐渐为人们所重视,“多媒体”这个词几乎在一夜间传遍了大街小巷,这时的PC已经不再只有简单的主机、显示器、鼠标键盘三大件了,音箱也成了它最显著的标志。
一、音效技术的发展
早期,出于对电子乐器彼此交换信息的需要,MIDI生产商协会(MIDI Manufacturers Association)制订了音色及打击乐器排列表的电子乐器数字化接口,简称为MIDI。从80年代开始许多计算机就已经拥有了这些接口,不过那时计算机所扮演的角色只是音序器而已,声卡的最主要用途便基于此了。
幸运的是,在电脑游戏的刺激下,声音产生的技术得到了进一步的发展。到了九十年代, Y amaha公司开始让频率调制(FM)技术出现在当时的电脑上,虽然其效果无法和今天的三维音效相比,但同PC小喇叭提供的效果相较不知要好多少倍。
不过人们并没有就此满足,90年代中期,波表合成的方式开始崭露头角。它的原理是预先对乐器声音进行取样,并将之保存下来,重放时靠声卡上的微处理器或PC系统内的CPU经过处理来发声。根据处理方式的不同主要又分为软波表和硬波表两种。
这时的声卡已经开始走向成熟。FM合成和波表合成技术;内建可控制外部的电子乐器、甚至还身兼二职提供游戏操纵杆功能的MIDI接口、CD音频连接线、线路输入、话筒输入等等都成为比较固定的模式。不过为了建立临场的真实感人们开始了更深层次的寻求。最初大家的注意力都集中在如何更好地再现音场的方向上,下面我们就来看看这些现在已经普遍使用的方法。
1.单声道(Mono)
所谓的单声道就是声音由一只音箱产生的效果,听众可以很明显地听出声音的来源就是音箱所摆放的位置,其本身的表现力较为平淡。(图1)
2.立体声(Stereo)
立体声系统需要一对音箱来完成任务,它通过调整系统中两只音箱发出声音的大小,让我们误认为声源来自两只音箱之间直线段中的任意位置。特别是当使用耳机的时候,由于左右两边的声音串音情况很少发生,所以声音的定位比较准确;再加上比较真实的音场感觉,使它能够带给我们比单声道真实许多的表现力。(图2)
3.增强立体声(Extended stereo)
这种技术是对传统立体声的一种延续,通过某种算法对两只音箱系统中的声音进行处理后,过去只能反映两只音箱连线间的声源位置被扩展到了其延长线上。这对于当两支音箱放置相距较近的情况有很大帮助。(图3)
4.四声道(Quadraphonics)
实际上这也是对基本的立体声概念进行的扩展,它需要的音箱数目是四只。这样的安排可以表达在四个音箱摆布所构成的矩形边上的声源位置。虽然这已经很类似我们需要的定位音场的需要,不过实际上这和真正的3D声音效果是有区别的。(图4)
5.环绕立体声(Surround-Sound)
还是基于立体声的概念,它在标准的四声道系统中在听众正面增加一只音箱来覆盖四只卫星音箱所包围的范围内的声音定位。这就是5声道系统,甚至为了有更好的低音域表现力,还有人单独再放置一个低音单元,也就是俗称的5.1系统。(图5)
如果需要更加精确定位声音的通路,你甚至可以在听众的上方、下方来放置音箱,得到从上面和下面传来声音的效果。这些所有的效果很大程度上都是通过实际音箱的摆放位置来实现的。
不过以上的音箱设置方式只让我们觉得置身其中,却没有办法找出准确方位来。于是3D音效闪亮登场了。
二、 3D音效的理论
1.进入双声道技术(binaural)
在单个音箱系统中,声音的来源总是一个位置,我们一下子就能确定它的位置,而过去的多音箱系统,则靠同时从不同位置产生声音,欺骗大脑对声音位置的辨识。现在双声道系统则通过两个不同的信号来处理声音,让两只耳朵分别接受,并误当作它就是从同一个位置发来的到达两个耳朵的不同信号,从而确定出声音的位置。
显然这和立体声是有本质区别的。(图6)和立体声不同,当两个外部音箱被用来传送双声道效果的时候,声音必须分别传送到特定的耳朵里,而不是像立体声那样让两只音箱的声音都同时到两个耳朵。这之间的差异就是两者间声音定位准确与否的关键因素。(图7)
由两只音箱来产生一个真3D音效是非常困难的。首先,这样的位置效果容易因听众位置的不同而大打折扣;其次,听众探明两支音箱的准确位置后,会对两股声音流所产生的位置识别感产生抵触情绪。
最成功的从外部声源传送能够准确表达声音方位的系统是采用4只音箱的配置,但很不幸即使采用了4只音箱,也很少有系统是真的在用4路3D声音,并且采用4路串音消除技术。绝大多数系统都是使用两路独立的双声道设计,然后用立体声来混合前置和后置音箱的发声状况。更有甚者是只在前置音箱采用了真3D音效,而其他部分都用传统4声道或环绕立体声加以混合。
2.我们的大脑是如何判断声源方位的呢?
当一个声音位于听众身体一侧的时候,距离更近这一边的耳朵能够听到更大的声音,而且可以提前一点听到。这种差别在声学方面有两个术语IAD(Inter-aural Amplitude Difference)和ITD(Inter-aural Time Difference)来加以说明。大脑就是依靠这两个细微的差别来确定声音的位置。(图8)耳朵的固有形状实际上会增强或削弱不同的声音频率。依靠声音位置的不同,外耳首先负责解决前后方向的不同,因为耳朵都是朝前的,自然前面的声音会大些,而后面的就会小些了。而且由于外耳的形状上下也不对称,还可以借此来确定声音的高度。(图9)
声音在环境方面的效果不但对我们确定所处环境类型有很重要的提示,而且反射效果也帮助我们的大脑来判断声音的距离。另外,声音被环境中建筑物等的反射和吸收,比如像墙、门等等也提供给大脑一个重要的位置信息,所有这些因素都需要被考虑,如果我们要完整地再现一个3D Audio 效果。不过要明白,这些效果有的是由人自己的结构所产生而另外的则由外部结构和环境所产生呢。
(1)由人体自身结构产生的效果
在1927年,一个叫做W·Bartlett Jones的人利用一个带有麦克风以及内耳通道的人头部模型来录音。当这个头被使用的时候,它的结构影响到了声音,用这种简单的方法,人自身的结构对声音的影响被纪录了下来。靠这种方法,当声音后来回放时,经由耳机让听众体验到非常逼真的3D声效。
虽然现在已经看不到这种技术的使用,但用人造头部模型来从事人对声音的反应方面的研究却依然在延续。
除去了前面我们所说的IAD和ITD,我们要接触到的最核心的判断声音方位的技术是HR TF,简单说这就是个头部反应传送函数(Head-Response Transfer Function)。要具体点呢,可以分成几个主要的步骤来描述其功用。
第一步:制作一个头部模型并安装一支麦克风到耳膜的位置;
第二步:从固定的位置发出一些声音;
第三步:分析从麦克风中得到声音并得出被模型所改变的具体数据;
第四步:设计一个音频过滤器来模仿那个效果;
第五步:当你需要模仿某个位置所发出的声音的时候就使用上述过滤器来模仿即可。
HRTF这个概念确实为我们实现对声音的定位带来了无限的好处,但实际生活中这个数据是变化多端的,毕竟每个人的头部和耳朵的大小形状都不完全相同。事实上,目前成功地设置HRTF都是一种提供给大多数人的近似值。这也就是为什么这里有这么多不同的技术来实现它的原因了。
(2)靠外部环境产生的效果
当一个声音被产生,听众首先听到直接传送过来的声波,很短的时间间隔以后,一些经过折射或反射的声波会又传入听众的耳膜。根据时间两者之间的响度差别等等数据给了我们关于声源距离的线索。当反