从骨笛到人工智能音乐—对音乐科技发展历程的感悟

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

34
韩宝强
中国音乐学院
—对音乐科技发展历程的感悟
从骨笛到人工智能音乐
【摘要】从事音乐科学研究，必须知道
该学科的基本属性，是艺术科学？是社会科学？还是自然科学？中西方文艺理论都曾涉及人与自然、主观与客观的和谐统一，这些观点对认识音乐科学的基本属性有很大的启发。

19世纪欧洲工业革命的兴起，为“心物”关系研究提供了实证条件，费希纳通过大量实验找到了主、客观之间的量化关系；亥姆霍兹则用实验方法探明了音乐的内在规律。

最早的音乐技术皆与乐器制作有关，从石制乐器、骨笛到编钟，再到管弦乐队的发展，人类从不吝惜用最好的技术来满足听觉审美需求。

随着科技急速发展，音乐科学与音乐技术的边界已变得模糊不清。

当前的人工智能音乐追求所谓“端到端”技术风格，很容易千篇一律；作曲家的创作过程本质上是主、客观不断交互的过程，其中蕴含着多年积累的经验和技巧，以及骤然迸发的创作灵感，人工智能很难学到。

而音乐永远是主观的艺术，无论技术发展到何种程度，音乐科技研究都应以人的听觉感受为本，传统音乐、电子音乐、未来的人工智能音乐乃至机器人音乐都应如此。

【关键词】音乐科技；音乐科学；音乐技
术；骨笛；人工智能音乐
引言
从中文字面上理解，“音乐科技”完整的意思应为“音乐科学与技术”，对应的英文应该是music science and technology ，但英文文献中常见的词汇却是music technology ，并不包含science ，一些国外大学的专业目录经常使用的也是music and technology （音乐与科技）。

笔者曾问过国外同行music science 与music technology 的区别，他们说music science 一般指用科学原理分析、解释音乐现象的学科，等同于系统音乐学（system musicology ）；music technology 则多指技术性、实践性较强的音乐专业。

笔者分析认为，系统音乐学发源于欧洲，主要包括基本乐理、乐律学、音乐声学、音乐心理学、乐器学以及作曲技术理论（不含创作）等，其特点是用科学实证方法研究音乐的基本属性和规律，这意味着系统音乐学本身就具有较强的艺术与科学的双重属性。

德语中的“音乐学”（Musikwissenschaft ）一词就是音乐（Musik ）与科学（Wissenschaft ）两个单词的合成体。

我国的教学体制将系统音乐学学科一分为二，作曲技术理论部分被划归作曲系，其余皆被
35
从骨笛到人工智能音乐—对音乐科技发展历程的感悟[1] 郑玄注，孔颖达疏：《礼记正义》卷三十七《礼记》，阮元校刻
《十三经注疏》下册，中华书局1980年版，第1527页。

[2] 关于《礼记·乐记》的作者和成书年代，学界主要有两种观点：其一，认为作者是战国时期的公孙尼子；其二，认为作者是西汉河间献王刘德、毛生等人。

参见薛永武：《〈礼记·乐记〉研究》，光明日报出版社2010年版，第2页。

本文采用出自西汉河间献王刘德及毛生的观点。

划归音乐学系。

音乐学系因主要承袭音乐史学、民族民间音乐和音乐评论的研究传统，社会科学色彩比较浓厚；而作曲系一般以音乐创作为中心，通常不太重视研究技术理论的科学内涵，这些都导致系统音乐学原有的科学属性被整体弱化。

近年来，为赶上国外音乐科技的发展速度，国内很多音乐院校组建与音乐科技相关的院、系和专业，此举对解决我国音乐科学研究长期“贫血”的问题有一定帮助，然而新专业往往偏重技术和制作，忽视了音乐科学层面的理论建设，因此中国音乐理论体系的科学短板依然存在，在技术层面也很难拿出具有自主版权的成果。

受邀撰写此文，笔者主要依据的是多年从事律学、音乐声学和乐器学研究与教学的工作经验，包括2011至2017年在中国音乐学院组建、管理音乐科技系过程中积累的一些心得，希望能对刚进入或准备进入音乐科技领域的同学、同行有所帮助。

另外需要说明的是，鉴于我国较少使用“系统音乐学”一词，为表述清晰，笔者用“音乐科学”指代那些属于系统音乐学的学科，用“音乐技术”指代技术性和实践性较强的学科（如音乐制作、录音、乐器工程等），二者重叠时使用“音乐科技”。

一、音乐科学发端于对“心物”关系的探索
从事音乐科学研究，必须要知道该学科的基本属性，是艺术科学？是社会科学？还是自然科学？在没有出现音乐科技专业之前，从事音乐科学研究的人通常来自两个领域：音乐领
域或科技领域。

不同的知识背景肯定会影响人看问题的角度：有音乐背景的人习惯以主观感受为中心，强调音乐的主观性；有科技背景的人更相信仪器，一切以客观数据为依据。

笔者认为，在这个问题上要特别重视汉代《礼记·乐记》中的一段话：“音之起，由人心生也。

人心之动，物使之然也。

感于物而动，故形于声。

声相应，故生变；变成方谓之音。

”[1]此言明确告知我们音乐具有主观和客观双重属性，主、客观之间有规律的互动和变化才形成音乐。

这一观点虽产生于汉代[2]，但在今天仍可作为认识音乐科学属性的座右铭。

它与老庄所崇尚的“天人合一”观点也有某种契合之处：“天”可类比为《乐记》中的“物”，“人”即《乐记》中的“心”，当“心物合一”的时候，才能产生美妙的音乐。

西方音乐科学理论的原点在古希腊，作为哲学家兼数学家的毕达哥拉斯经常思索音乐与数学的关系，其理论的独特之处在于，他把宇宙、人和音乐三者的关系都用整数比来表达，并推测所有行星轨道间存在协和的“天体和音”，只因人类缺乏听到这些“天体音乐”的能力而无法欣赏。

毕达哥拉斯对音乐的具体贡献是提出了建立在简单整数比基础上的五度相
36艺术学研究 2023年第2期
生律理论，该理论至今仍被音乐界广泛使用。

从《乐记》的“心物论”、老庄的“天人合一”到毕达哥拉斯的“天体音乐”，这些观点都涉及人与自然、主观与客观的和谐统一，对认识音乐科学的基本属性帮助极大，启发性更强。

只是限于古代的生产力和科技水平低下，这些宏大想象和理论假说只能留待后人给予验证。

19世纪欧洲工业革命的兴起，不仅促进了人类生产力的发展，也给“心物”关系研究提供了实证条件。

在此背景下，医学出身的德国哲学家兼物理学家古斯塔夫·西奥多·费希纳（Gustav Theodor Fechner，1801—1887）首先通过大量实验找到了主、客观之间的量化关系。

他在1860年出版的《心理物理学纲要》（Elemente der Psychophysik）中，用一个简明的公式将多年辛勤实验的成果展现给世人，即S=K lg R （S是主观感觉强度，R是客观量强度，K是常数，lg是常用对数符号）[1]。

该公式表明：主观感觉量与客观物理量之间是一种对数关系，当主观感觉量按算数级增长时，相应的客观物理量以指数级增加。

以音高感知为例，当我们主观感觉上听到国际标准音高A时，其对应的客观物理量是频率为440Hz的振动（Hz代表每秒钟的振动次数）。

高1个八度时，其对应的频率要乘以2（440×2=880），高2个八度要乘以4（440×4=1760），高3个八度要乘以8（440×8=3520），依此类推[2]。

人耳对音量的感知也符合费希纳定律，譬如目前我们常用的衡量音量大小的“分贝”（dB，用来表示声压级的单位）与所对应的物理量声压也是对数关系：分贝=20log10（p/p0）（公式中，p代表被测发音体的声压，p0代表介质的基准声压，空气的基准声压为20微帕）。

根据公式可知，若空气中发音体（客观量）增加1倍，声压级（主观量）只增加6分贝。

具体以小提琴为例，假设1把小提琴的平均音量为40分贝，2把小提琴的演奏音量则约为46分贝，4把小提琴约为52分贝。

假设大型管弦乐队拥有32把小提琴，其全奏时的总音量理论值约为70分贝。

费希纳定律不仅适用于听觉和视觉，还适用于嗅觉、温感和压感等感知系统，在哲学、心理学、美术学和音乐学领域都产生了巨大影响。

费希纳在研究过程中甚至付出了健康的代价，为获得视觉实验的第一手资料，他的眼睛受到太阳光的灼伤，但他依旧对自己的理论创建感到自豪，他说：“巴别塔因工人们语言混乱而无法建成，而我的心理物理学之塔则因无懈可击而永存于世。

”[3]
然而费希纳定律后来还是被一些实验证明存在局限性，即当客观刺激量超出一定强度范围时，相应的主观感受会出现偏差。

以音高感知为例，当振动频率超过中、高音区时（约在大字组至小字三组之间），人的感知就会出现
[1] 参见Gustav Theodor Fechner, Elemente der Psychophysik (Leipzig: Breitkopf and Hartel, 1907). 心理物理学的主要研究模式是在精确控制客观刺激变量的同时，记录人的主观感受，通过大量数据分析二者之间的对应关系并以量化的形式表达，该学科由费希纳首创。

[2] 费希纳本人并未从事音乐感知方面的研究，本文所述旨在解释定律的普适性。

[3] 转引自Thomas D. Rossing, The Science of Sound (Addison-Wesley Publishing Company, 1990), 70.
图1亥姆霍兹共鸣器
图片来源：https:///infoinstructors/ newguides/images
波中的所有信息。

亥姆霍兹超越费希纳之处在于，他用自己设计的工具—亥姆霍兹共鸣器（图1），探测到了不可见的声音。

这种研究模式不仅极大地推进了音乐声学、音乐生理学
38艺术学研究 2023年第2期
今天看来也存在一定缺陷，如音高辨识方面的“竖琴说”、协和感知方面的“拍音说”以及音色感知方面的“泛音列说”等[1]。

这或许从另外一个角度说明，较之纯粹的数理科学，音乐科学研究由于有主观因素的参与，其复杂度和困难度更高，研究结果被质疑、补充和进一步完善的概率也更高。

三、欧洲音乐科学
对中国音乐理论的影响
研究音乐科学有何意义？它对中国音乐能产生哪些影响？对此，可用前面提及的两位人物的经历，以及他们的研究对中国音乐所产生的影响，来加以说明。

作为亥姆霍兹科学思想的崇拜者，施通普夫坚持以实证主义的观念全身心地投入对乐音和音乐感知的深入研究：他与霍恩博斯特尔等人合作建立了著名的柏林音响资料馆，专门搜集整理东南亚、太平洋沿岸各国（包括中国）[2]和美洲印第安人的音乐；他还与霍恩博斯特尔和英国工程师兼音乐学家埃利斯（Ellis，1814—1890）等人共同创立了比较音乐学（comparative musicology），从音响比较的角度对不同民族的音乐进行形态学研究；随后，又在比较音乐学基础上加入文化背景元素研究，将其发展为当今拥有广泛影响力的民族音乐学（ethnomusicology），这一学科对中国民族音乐研究的影响有目共睹。

同样作为亥姆霍兹研究模式的继承者，里曼则专注于将乐音、音程听感研究与欧洲古典音乐联系在一起[3]。

他归纳总结的“功能和声体系”对音乐教学和创作都产生了深远影响。

中国学界最为熟悉的斯波索宾和声学体系的内核基本上都源自里曼的研究。

基于对自然泛音列和音级理论的认同，加之斯波索宾和声学教材的普及，功能和声理论对中国音乐创作和分析理论的发展所起到的作用既广泛又深远。

然而随着比较音乐学和民族音乐学的兴起，里曼体系在中国、印度、印度尼西亚爪哇岛以及阿拉伯国家和地区的民族音乐面前，包括面对欧洲晚期浪漫派的音乐时，往往出现理论“失灵”的情况。

中国音乐家很早便从听感角度意识到，用功能和声体系配出的民族音乐与东方音乐风格不符。

很多作曲者也曾尝试通过各种变通方法解决这一问题，譬如构造非三度叠置和弦结构、增加附加音、根据民族调式调整和声功能序进等。

以“民族调式和声体系”命名的专著出版了很多，但总体上看，都无法取代功能和声体系的霸主地位，各类音乐入学考试的内容中居于主导地位的依然是旧有的欧洲体系。

其实，欧洲系统音乐学体系“失灵”的情况不仅存在于基本乐理和功能和声体系，也存
[1] 参见韩宝强：《音的历程：现代音乐声学导论》，人民音乐出版社2016年版，第22—33、45—72页。

[2] 中国艺术研究院音乐研究所的金经言曾在音乐研究所保存的资料中，搜集到杨荫浏先生本人于20世纪20年代演唱的昆曲《琵琶记》录音，录音策划人正是霍恩博斯特尔。

参见金经言：《关于杨荫浏先生演唱的一段昆曲录音》，《人民音乐》1999年第11期。

[3] 参见[德]贝塞勒：《近代音乐听赏问题》，[德]克奈夫等著《西方音乐社会学现状—近代音乐的听赏和当代社会的音乐问题》，金经言译，人民音乐出版社2002年版，第1—4页。

图2德国考古发现的距今约43000年、用猛犸象象牙制成的骨笛
图片来源：https:///wiki/Paleolithic_f l utes 图3德国考古发现的距今约35000年、用秃鹫尺骨制成的骨笛
图片来源：https:///wiki/Paleolithic_f l utes
图4 贾湖骨笛图片来源：http:// /articles/43865图7 曾侯乙编钟，战国早期，钟架长7.48米、高2.65米，湖北省
博物馆藏
图8 曾侯乙编钟锉磨调音痕迹
平（图5）。

贾湖骨笛是用丹顶鹤的尺骨或腿骨制成。

早期人类常用鸟类骨头制笛是因为鸟骨有个共同特点，就是鸟骨中空（为获得更多氧气），很适合用来制作吹奏乐器；但鸟骨质地较硬，制作乐器时首先碰到的困难，便是必须找到比它还坚硬的钻
孔材料。

考古人员发现，贾湖人用于钻孔
图5 贾湖骨笛上的刻痕图片来源：http:// /articles/43865
图6 用于制作贾湖骨笛的石英钻头
图片引自河南省文物考古研究所编著：《舞阳贾湖》，科学出版社1999年版
的材料为石英石（在贾湖地区也发现了石英石矿脉），其硬度恰好比鸟骨高一级。

制笛的钻头有多种，较大的用于钻通骨管，较小的用于钻音孔，
钻头最尖锐处仅约2毫米（图6）[1]。

研究音乐技术的发展历史，会发现一个有趣的现
[1] 参见河南省文物考古研究所编著：《舞阳贾湖》上卷，科学出版社1999年
版，第358页。

41从骨笛到人工智能音乐—对音乐科技发展历程的感悟
象：人类从不吝惜用最好的技术来满足听觉审美需求，石器时代如此，青铜时代更为显著。

曾侯乙编钟可谓达到当时世界乐器制造技术的巅峰（图7），从制模浇铸到锉磨调音（图8），即使在科技水平已远超2000多年前的当今时代，仔细观察编钟的各种制作细节，仍会被当时工匠的高超技术所折服。

18世纪中叶后，欧洲借助领先的工业技术，以及通过亥姆霍兹、里曼等人在音乐科学理论方面的深入研究，其乐器科技水平得到大幅提升，良好的音准、音量控制，合理、科学的结构设计，不仅促进了管弦乐队的发展，也为音乐表演和音乐教育普及等提供了很好的基础条件，同时间接推动了西洋音乐在全球范围的推广。

这一史实提示我们，弘扬本民族音乐，应重视自己乐器的精良程度，而要实现这一点的前提就是重视音乐技术研究。

如果说在亥姆霍兹的时代，尚能区分出音乐科学与音乐技术的不同；那么随着当今科技的急速发展，以及信息的无延迟传播，音乐科学与音乐技术的边界已变得模糊不清。

从事音乐科学理论研究的人必须了解前沿技术的发展状况，从事音乐技术的工程师也要关注最新音乐科技理论的研究进展。

在中国音乐学院音乐科技系成立之初，为达到让学生在科学与技术领域协同发展的目标，学院在专业设计上有意识地设立了一个偏基础理论的专业—“音乐声学”，一个兼顾理论与技术的专业—“乐器学”，两个偏重音乐应用技术的专业—“电子音乐”和“录音与扩声”。

事实证明，这种培养音乐科技人才的模式更有利于培养出被社会认可的复合型音乐科技人才[1]。

五、音乐科技研究者应重视艺术判断力
和主、客观交互能力的培养
当今，用人工智能生成的音乐已应用于很多商业公司的视频配乐中，这既可以节约制作成本，还避免了知识产权纠纷。

但由此也引出一些新问题，比如人们最关心的是人工智能是否会代替作曲家？在笔者看来，要回答这个问题必须有一个前提条件：那就是要代替哪种类型的作曲家？如果要代替低水平的作曲家（或应称作曲人），答案是有可能。

实际上，在人工智能出现之前，类似技术就已经存在，譬如一些软件将常用的作曲规则编入程序，只要随便写条旋律，软件就能自动配好和声和其他乐器声部，包括打击乐。

若前提条件是要代替高水平作曲家，笔者认为从逻辑上讲根本不可能，因为音乐作品的水平高低是由人而不是人工智能来判断的，而人作出判断的前提是具有艺术判断力，目前再强大的人工智能神经网络也不具备艺术判断力。

通常衡量作曲家水平高低的标准之一，就是看其作品的体裁和风格是否多样化，绝对不能是千篇一律的。

即便为影视作品作曲，也要按照剧情要求在情绪和节奏变化上做精心设计。

但当前的人工智能追求所谓“端到端”的技术风格，即在音乐生成过程中不用人工参与，
[1] 这一点可以从毕业生的就业情况得到证明，大部分学生毕业后都能找到与音乐科技相关的工作，其中不乏在高校从事音乐科技教学工作或在知名信息公司从事音乐科技研究工作。

42艺术学研究 2023年第2期
很容易产生千篇一律的感觉，这样的音乐即便免费、高产，也难以成为人们听赏的对象。

人工智能无法取代高水平作曲家的另一个原因是，作曲家的创作过程本质上是主、客观不断交互的过程，主观想象的音乐要通过客观（乐器）进行表达，接着主观根据接收到的客观音响对作品及时进行分析、判断和修改，这个交互过程中蕴含着作曲家多年积累的作曲经验和技巧，更包含脑海中骤然迸发的创作灵感，而人工智能若想掌握这个交互过程，不啻让工程师放弃编程改学作曲。

笔者曾就德国用人工智能技术续写贝多芬《第十交响曲》一事写过文章，研究了这个国际化的人工智能团队续写《第十交响曲》的创作过程[1]。

通过分析发现，在整个团队中，人工智能只负责生成大量贝多芬风格的音乐片段，接下来的所有工作都由音乐家接手：由研究贝多芬音乐的专家负责将片段拼接成完整的旋律并补充和声、对位，最后由作曲家完成配器。

换言之，人工智能在整个续写过程中只提供了大量可能性，最终完成作品还要靠人的艺术判断以及把控主、客观交互的能力。

这里再用笔者制作高音质半导体收音机的例子，来说明主、客观交互能力培养对音乐科技研究的重要性。

20世纪六七十年代，少年的我忙于给别人攒半导体收音机，慕名而来者皆因我的收音机音质好—在当年的单声道时代，这就达到听觉审美的极高境界了。

而这“音质好”背后有多种因素的支撑：我会在电源电路中增加一个去耦电容以滤掉交流噪声，在输出电路中增加旁路电容以消减过多的高频信号，最重要的是有主观听觉参与其中。

因为当时我除了攒收音机还喜欢拉小提琴，因此对收音机音质有较高的判断力，能够通过调整每个元器件的数值来保证每台机器的音质。

如果把组装半导体收音机视为音乐技术的一个缩影，可以从中看清这样一个道理：音乐永远是主观的艺术，无论技术发展到何种程度，音乐科技研究都应以人的听觉感受为本，传统音乐如此，电子音乐如此，未来的人工智能音乐、机器人音乐也必然如此。

结语
从43000年前旧石器时代的骨笛，到今天遍布世界每个角落的网络音乐，可以清晰地看出，音乐科技正在以指数级的加速度向前发展。

展望音乐科技的未来走向，笔者只能说出一个想法，就是会有更多的可能和更多的交叉，然而再多的可能与交叉，也改变不了荀子当年在《乐论篇》中对音乐本质的界定—“夫乐者，乐也，人情之所必不免也”。

责任编辑：赵轶峰[1] 韩宝强：《人工智能续创贝多芬第十交响曲带给我们的启示》，《南京艺术学院学报（音乐与表演）》2022年第1期。