人声合成技术在音乐中的应用_徐恩慧

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

最近,英国音乐人Imogen Heap的一首歌《Hide and Seek》引起了全世界的注视。这支被誉为“将合成人声的使用发展到了极限”的歌曲被广为流传。为什么Imogen Heap的人声合成音乐会有如此大的影响和划时代的意义,主要表现在:

(1)它改变了现代音乐的创作思维;

(2)改变了传统意义上音乐的演奏方法;

(3)歌手现场演出的形式发生了本质的变化;

(4)用技术去表达艺术感觉,用人声和合成人声互动,开拓了一种崭新的音乐表现方式。

于是,人声合成器以全新的概念再次走到了音乐制作舞台的最前面。这首完全用最新的、现场的人声合成技术编配和演唱的歌曲所表现出的独特的魅力在于,观众既可以感受到无伴奏清唱的纯净,又能听到人声配器和声进行的情感色彩,犹如将人置身于一片寂静之中,面对镜子中的自己,看到回忆的点滴。合成人声好像是机器在演唱,并没有太多感情倾向的表达,但那种非常融合的和声的包容感和特殊的效果,却给人一种非常新鲜和宁静的效果,给人特别、生动和舒服的感觉。1 人声合成技术简介

上面提到的人声合成技术到底是一种什么样的技术呢?在现代的音乐中它是怎样应用的呢?完全使用人声合成进行和声配乐及现场表演和演唱是怎样做到的呢?

现以这首作品为例,将它剖析开来,展现给大家现代人声合成在音乐上应用的技术原理和效果,以及在电子技术飞速发展的今天,人声合成技术带给音乐制作及创作的变化,给专业录音及音响工作者以启发。

人声合成器其实是声码器的一种应用,最早是通信领域开发的一项技术,所以,人声合成技术在早前少有如此出彩的机会。早在20世纪30年代,世界上第一台人声合成器是伴随着关于减少电话频段的研究而诞生的。一直到20世纪70年代,伴随Wendy Carlos和Robert Moog制作出第一台为音乐制作而专门打造的人声合成器的诞生,人声合成技术才开始陆陆续续地在音乐制作中崭露头角。

当时,由Wendy Carlos负责制作的Stanley Kubrick 的电影《A Clockwork Orange》的原声音乐采用了大量

人声合成技术

在音乐中的应用

[摘 要] 根据人声合成技术的基本原理及分类,分析了英国音乐人Imogen Heap的著名歌曲

《Hide and Seek》及其音乐的风格、合成过程,表明现代音乐在人声合成表演形式

上的新思维的探索。

[关键词] 人声合成技术 连接合成 共振峰合成 Imogen Heap的人声合成

徐恩慧 张磊

声码器合成的音色。之后,德国的电子乐队Kraftwerk 也在他们很多作品中运用了合成人声的效果。70年代后期开始,人声合成器开始进入流行音乐。例如,Electric Light Orchestra,Pink Floyd,Styx,Daft Punk,Rockets,Myth,Madonna等音乐人都在其音乐作品中使用人声合成效果。但那时使用的也都局限在音乐的某个段落或者某个部分使用,合成人声只是作为效果使用。

如今人声合成器已经有了很大的发展。尤其是随着软件和插件形式的声码器的出现,对于合成人声的制作和多彩多样的应用也变得越来越多和更加方便。

2 人声合成技术的基本原理

现在来剖析这首划时代的音乐作品所使用的技术手段。对于人声合成技术的了解,首先要从了解人声开始。

人的发声器官好比一件乐器。一般来说,乐器结构主要有三部分:动力部分、振动部分和共鸣部分。从人的发声器官来看,呼吸器官(肺、横隔膜、气管、胸廓和腹肌等)属动力部分;喉部声带属振动部分;口腔、咽腔和鼻腔属共鸣部分。咬字器官包括唇、舌、腭和齿。无论在解剖生理方面或在声音物理方面,振动器官——声带当属人声发声系统最为重要的器官,声带振动发出喉原音的质量直接影响人声的音色及其音响效果。

从声学上来说,声音有四个特征:音高、音强、音色和音值。同样地,发声器官在发声生理上与声音的四个特征是有着密切的关系的。

(1)音高

人声的音高取决于声带振动次数也就是频率。振动次数越多,频率就越高,音就越高。声带振动次数与声带长度、厚度和张力都有关系。声带长、厚并且张力低,被称作发声音调低;声带短、薄并且张力强,则被称作发声音调高。

(2)音强

由声带振动幅度的大小决定。人声的强弱首先与气息有关,气息强,声带振幅大,声音就强;反之就弱。其次,音强与共鸣腔有关。共鸣腔越大,腔体结构质地越硬,则声音就越强。共鸣在发声中是最重要的因素,它赋予了嗓音的音量和音质,并且加强了其响亮度。

(3)音色

指声音的色彩,这是由声带振动体的质量决定的。不同的人,声带振动体产生的复音、声波的数目是不同的。复音中的许多声波,其中频率最低、振幅最大的叫基音,其余频率高于基音,或基音频率整数倍的声波,叫泛音。基音决定音高,泛音的多少或强弱决定音色。

(4)音值

音值是指声音的持续时间的长短。从发声生理来讲,音值的长短与发声气息长短和声门闭合阻抗大小有关。

除了音高以外,其他的三个特征都直接和共鸣腔有关系,共鸣腔也就是所谓的共振区域。由此,就引出一个对于声音合成非常重要的概念——共振峰。

在当前主要使用的语音合成技术中,有2种用于产生合成语音波形:连接合成(Concatenative Synthesis)和共振峰合成(Formant Synthesis)。 就目前而言,连接合成技术更多是使用在一些较为简单且合成语句较为固定的情况下,这是由于这项技术本身所限制的。而在音乐制作中所使用的人声合成器,大多是使用共振峰合成技术来实现的。

通过前面简单的介绍可知,共振峰指的就是声音的自然频谱峰值。在人声和大多数乐器的很宽的频谱分布中都存在一些固定的频率峰值,这种频率峰值在声音频谱中就叫作共振峰(Formants)。事实上,共振峰就是频谱图上包络线的极大值,它代表着在其频谱波峰包络曲线中,所形成的一个或几个明显的波峰。这个波峰总是位于一定的频率,不随发音频率的变化而变动。因此,共振峰也就自然成为了乐器音色的主要特征指标。

在语音声学中,人声因为受自身生理如鼻孔、咽腔、口腔大小的影响,也有自身的共振峰区(Formant Regions)。通过利用这些共鸣空间的形状和大小的变化,例如改变咽喉、嘴形等,就能改变声音的共振峰,见图1。人们之所以能够区分不同的人声、元音,

相关文档
最新文档