基于“AI”作曲程序需求的音乐常用结构特征辨识原理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于“AI”作曲程序需求的音乐常用结构特征
辨识原理
康隽瑞 / 陈贝 / 康和
摘 要:目前,大多数由电脑音乐系统制作的背景音乐和舞曲音乐以及人工智能作曲程序等,很少在结构的辨识上做深入的研究,从而造成作品表现范畴的极度狭窄。
本文推出的结构辨识方法,可以为人工智能作曲创作更多具有表现力题材打开一扇窗户。
关键词:结构辨识;同分异合;方整与非方整型结构;非歌唱性与歌唱性中图分类号:J614 文献标识码:A
作者简介:康隽瑞(1985-),男,硕士研究生,深圳大学教育学部教育技术系人工智能教育实验室实验员;陈贝(1980-),男,硕士研究生,深圳大学艺术学部音乐舞蹈学院教师;康和(1955-),男,大学本科,深圳大学艺术学部音乐舞蹈学院教授。
目前基于“AI”的作曲研究开始兴起,而人工智能作曲的基础是从万千优秀作品里总结出的规律和结构模式,作曲程序将这些规律和模式量化,以便对具有创新意义的主题进行处理和扩展,最终完成一部作品的加工和生产。
现在的问题是,如何按照音乐的陈述特征和结构规律组织音乐的各种要素,是我们首先要面对的问题。
这需要我们用恰当的方式总结概括已成型的结构原理,并用电脑程序可以识别的数字化方式呈现出来。
目前文献更多的关注点是如何生成简单的旋律。
不同人对作品的理解和审美千差万别,要智能地模仿和表达出演奏者的情感,首先要能对生成的作品的特点有一定的理解。
从目前的参考文献上看,[1]指出了计算机自动作曲的几大模块,这些角度的研究,很难看出对结构
要素特别是具有矛盾冲突段落的规划设计;[2]指出了现
代音乐的两大流派“序列音乐”和“频谱音乐”之间的区别,不论哪一种都无法解释复杂的展开性段落是怎么形成的。
所以不论是工业界还是音乐界都对结构或形式化、人性化工作缺少一个完整的定义。
我们的考察研究对象主要包含以抒情见长的标题性中小型器乐曲、歌曲等。
AI 作曲程序对音乐曲式结构的辨识问题
在电脑程序里,所有的音乐元素都需要以数据的方式呈现,电脑才能识别。
AI 作曲需要识别的音乐元素很多,在这里我们主要对旋律结构辨识牵扯到的曲式结构元素尤其是乐句和
乐段进行梳理。
再复杂的音乐作品,基础都是由动机(最小的音乐单位)或乐节或乐句构成。
一个乐句,有时可以分为几个不同长短和音高特征的动机或两三个乐节,但有时也会不可分,这种可分与不可分是由“同分异合”规律决定的。
既相同或相似的音级组合(包含音高和音长)趋于分开,相异的音级组合趋于不可分。
“同分异合”也可以体现在更大规模的结构划分上,比如大多数乐段就是由两个以上节奏组合相似或基本相似的乐句构成,而乐段的结束标志,则是以停留在句尾相对的主音长音上或者两个到四个对仗的乐句(方整型结构)终端为标志。
另外音乐的曲式结构细节会因不同的演奏方式而有所不同,人的歌唱和管乐器的旋律因为需要换气,所以乐句末尾一般都会有明显长于其他部位的长音或者一定时值的休止;弦乐旋律不需要换气,所以它们的乐句末尾音既可以像歌唱一样很长,也可以很短,如果没有长于其他部位的长音,乐句的划分就会依赖“同分异合”的原理进行划分。
一、方整型结构
方整型结构歌唱式作品的乐句乐段划分比较简单,比如,下例图表是典型的歌唱型方整结构《国际歌》的旋律结构数据图。
它共有三十二个小节,可以分为两个十六小节构成的段落,第一个十六小节因为每个八小节音群的末尾有一个比较完满的终止式(分别停在了降B 大调的主音和F 大调的主音)所以又可分为两个八小节
三、非歌唱性器乐作品旋律特征
器乐作品的旋律结构也可以分为两种类型,即歌唱型和非歌唱型。
歌唱型的特征同人声没有什么区别,而非歌唱型的特征主要四种情况:一是句子长于一口气可以演唱的长度限制,二是没有可供吸气的长音或休止气口,三是演奏音域远超人声可以达到的范围,四是连续快速的大跳音型和密集的音阶音型等。
下列图表是莫扎特的土耳其进行曲第一段的数据结构统计(谱例略)。
它是典型的动机式结构,其四句体乐段的前两句,四个十六分音符+四分音符构成的动机展开式分句和由八分音符构成的对比分句并置以及它们的重复构成;第三句是对比乐句,它由暗示关系大调的八分、十六分与四分音值组合构成的乐节的重复和下三度的移位构成;第四句是第一句的变化再现,其变化的特征是旋律进行到了具有终止意义的调式主音上,从而结束了乐段的陈述。
其结构数据图如下:
小节序号1-45-89-1213-16基本音值、十六分音符和四分音符初始速度、每分钟126拍
弹性速度从总体计算,第三句以八分音符为主的音值因为比第一、第二、第四乐句以十六分音符为主的音值长一倍,为
了艺术夸张,可比初始速度慢每分钟3-6拍或更多
乐句长度(0.5+0.5+0.25+0.25+0.5+2)+(0.5+0.5+0.25+0.25+0.5+2)+(1+1+1+1)+(0.5+0.5+0.25+0.25+0.5+2)
4 + 4 + 4 + 4
音材料的同异 a+a+b+a1乐段结构特征 A 一段体调性特征a小调+C大调
+a小调
音符布局十六分音符、十度音域十六分音符、十度音域八分音符为主、七度音域十六分音符十度音域
弹性力度可在mp和f之间进行渐
强渐弱处理
可在p和mf之间进行渐
强渐弱处理
可在mf和p之间进行渐弱
处理
可在mp和f之间进行渐
强渐弱处理
段落性质起阶段承阶段转阶段合阶段
下图所列贝多芬的月光奏鸣曲第三乐章的主题(谱例略)是典型的大跨度分解和弦式的乐句,其四个乐句分别由主和弦、属和弦、下属和弦的属和弦、下属和弦+属和弦的导七和弦+属和弦构成。
其乐句音域宽达三个八度。
其主要音值为十六分音符,乐句的划分特征为十六分休止符+八分音符+周期性的大上升。
划分结果为四个乐句构成的开放式(终止在不稳定功能上)乐段。
其结构数据图如下:
小节序号1-23-45-67-8基本音值十六分音符
初始速度每分钟184
弹性速度四个乐句均由三个八度大上升的分解和弦构成,为了艺术夸张,每个乐句的起始速度可以比标记速度慢每分钟二十拍左右,以便为伴随上升的渐快格局做准备
乐句长度2+2+2+2
材料同异a+a1+a2+a3
结构特征A一段体
调性特征升C小调+升f小调+升G大调
音域音长十六分音符为主、二十四度音域
弹性力度其力度可伴随旋律的上升在mp和ff之间进行渐强处理
段落性质起阶段承阶段转阶段合阶段
四、调性的辨识方法综述
调性是音高组织的基础,它决定了除主旋律外其它伴奏音级的选择。
对调性进行辨识不应只局限在调号的外在标记上,这是因为音高组织的实际运用,尤其是器乐曲,往往会呈现出更为复杂的调性变化。
所以外在的升降记号统计,有时并不可靠,因为音级的使用是有主次之分的,骨干音级(调式的自然音级)可以被半音(临时变化音级)进行装饰,且还可进行同主音调式音级的互借,
上例第一段的前三小节是对第二段前三小节的半音化装饰。
后三小节是转调。
五、展开性段落的特征、辨识与建构过对旋律和和声进行半音变化,创造出更加复杂的音乐色彩和动力性表现形式。
展开部在接近再现部时达到高潮时,通常会通过属持续音为主题和主调的再现
音乐作品的分析立足于当时西班牙音乐的整体状况,从分析音乐的整体特征对分析伴奏的风格特点,细致研究了波琳娜音乐的特点以及西班牙音乐的独特之处。
在对西班牙音乐风格以及乐感训练的深入研究和分析当中,切身剖析了波琳娜西班牙音乐风格的作品,对于西班牙音乐风格的形态有了大致的了解,也更加深入地西班牙音乐风格的迷人之处,乐感的训练注重音乐要素的积累,音乐构成的要素是音乐的重要基础,是精准把握音乐含义的关键。
对波琳娜声乐伴奏的分析,为研究当时的西班牙音乐奠定了基础。
■
参考文献
[1] 付宁.戈雅之画钢琴演奏中动感与美的探究
[D].中央音乐学院,2010.
[2] 宋洁.走进西班牙——格纳拉多斯和他的钢琴组曲〈戈雅之画〉[D].天津音乐学院,2009.
[3] [美]露丝.史兰倩斯卡:指尖下的音乐(王润婷译)[M].广西师范大学出版社,2008.
[4] 张佳林.钢琴演奏与伴奏技巧[M].中央音乐学院出版社,2004.
[5] 于润洋译,卓菲娅·丽莎音乐美学译著新编[M].中央音乐学院出版社,2003.
[6] 甘宁.钢琴音乐的多维度研究[M].中国书籍出版社,2014.
[7] 万芊芊.巴洛克时期声乐作品钢琴伴奏的风格和特点[J].艺海,2016:61-62.
[8] 张悦.浅析巴洛克时期声乐作品钢琴伴奏的风格和特点[J].音乐时空,2014:169.
仔细分析上例对应关系我们可以看出,速度变化产生的紧张度张力变化序列和人的心跳是相关联的,正常情况下,也就是人在放松状态下,心跳是每分钟七十左右,逐渐加快,则紧张度增加并逐渐激动起来;逐渐减慢,则紧张度衰减,会变得越来越懈怠、悲伤沉重、阴郁等。
另外,上例的对应关系只是个大概,因为速度在音乐形象的构建中只是诸多因素中的一个主要因素,其它因素的变化,比如调式、调性、音型、和声、音响浓度、织体、音区、力度等,完全可使其音乐形象超出这个表现范围。
人工智能程序在进行弹性处理时,可根据初始速度的设定、节奏密度的变化、旋律的上升下降、长短搭配方式、句始句末特征、作品的音乐形象特征等,判断情感张力的变化,以便进行弹性力度和速度的调整。
需要再次提醒注意的是,慢于中速的节奏布局,是为了追求懈怠感、深沉感,所以相对的短音值,反而需要更慢一些,才可能符合表现需求;反之,快于中速的节奏布局,是为了追求兴奋度和紧张度的增加,所以相对的短音值大多暗示的是兴奋度和紧张度的提升,所以更快一些才可能符合表现需求。
当然这种处理方式,只是一种可能性,为了消除缺乏人性化的机械感,调整其他音乐要素,比如织体、调性、音区、音色变化也可以做到,但力度和速度的变化很可能是有效性更大的方法。
根据上例的表情模型,我们提出了以下的可能性:[3]通过在预先定义的乐汇上增加表情标记,从而经过逻辑组合,推算出不同风格的美感需要进行处理的弹性速度和力度。
[4]基于复杂度计算网络的相似度分类,来分析出相似的片段应该用什么表情标记(渐强渐弱、渐快渐慢、忽强忽弱等)。
所以表情的添加在有人干预的情况下,可以最大化地达到演奏家的控制强度。
结 语
目前,大多数由电脑音乐系统制作的背景音乐和舞曲音乐以及人工智能作曲程序等,很少在结构的辨识上做深入的研究,从而造成作品表现范畴的极度狭窄。
本文推出的结构辨识方法,可以为人工智能作曲创作更多具有表现力题材打开一扇窗户,当然这些方法还需在数据化上进行表达和对应研究,希望有人能为此作出贡献为盼。
■
参考文献
[1] 井音吉,李圣辰.计算机自动作曲综述:一种通用框架[J].复旦学报(自然科学版),2020,(06):639-657.
[2] 吴粤北.基于算法的频谱作曲技法[J].黄钟(中国.武汉音乐学院学报),2010,(04):3-10+203.
[3] KABAYIZA SAMUEL.自动作曲系统的研究[D].厦门大学,2019.
[4] 王晓丽.基于复杂网络的音乐分析与辅助作曲
[D].青岛大学,2010.
(上接第52页)。