口型同步动画的规律keithlango
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
口型同步动画的规律
作者:Keith Lango
编译:Luonaldo
日期:2006年1月1日
简介
最近有几个朋友问我, (实际上不只几个) 他们想要涉足面部动画和口型同步动画。提出这一问题的大多是看过我之前的教程Pose-to-Pose Organized Keyframing的读者,他们想要一些帮助他们深入进面部动画和口型同步的一些建议。
起先我回答说面部动画和口型同步是对我来说还不太确定的动画领域。但是我的意思是说,我还没有花时间坐下来认真考虑我自己在逻辑上是怎样实现面部动画和口型同步的。我总是差不多“做完了”,让这部分工作随大流了事。我喜欢只是给面部一直向前地做动画,而对口型同步则采用不同的方式动画,然后就可以算上是结束了。我乐意承认,对口型同步我根本不预先作计划。而且我同样也不会去花费大量时间为面部表情作breakdown。我会标记几个我想要捕捉的基本情感,但是我不会像做身体动画那样进行良好的组织规划。基本上,面部动画和口型同步对我来说是心中真正艺术的最后堡垒,我承认我很勉强才能达到一些艺术的奇妙境界。:o) 但是最近我做了些工作好让这部分工作量化为具体步骤。
这里我有一些想法,我觉得读者可能会想要知道。让我事先声明,我不认为自己在这方面有任何权威。我只是说说自己的想法而已,读者可能会不赞同我关于怎样制作口型同步的观点,但是我努力要达成的效果是试着给出一些具体的可操作的建议以供动画师参考。我尽量避免这些想法演变成规则之类的东西。它们只不过是些想法和理论,可能会帮助一些动画师从另外一个不同的角度对口型同步动画有一个认识。既然已经对读者进行了告诫,下面我将会详细阐述我自己实现口型同步的细节。
这篇文章并不是在详尽阐述,但确是开始表述我关于口型同步的一些概念性的想法。在此文中,我先把讨论话题限定在口型同步上。目前我还在思考着打另一个关于面部表情动画的腹稿,两篇文章合起来,就是讲述怎样动画角色的面部,从而呈现令人信服的讲话和充满感情的表演。
首先……
口型同步首先是一个机敏的停顿。许多动画中都有优秀的范例,来展示每个人是怎样实现它的。趋向是这样的:
1)听声音的目标是要捕捉像“M”、“E”、“Th”和“F”这样的声音。(有些人甚至还把“H”“G”和“J”“Z”这样的发音也算了进去)。
2)听声音轨迹。
3)在你听到的每个声音中尽量100%的捕捉这些声音目标。
4)给口型同步做一个预览渲染。
5)留心口型的开合不要让其失去控制。
6)查看哪里出了错。
至少我一开始是这么做的。它的问题在于把动画一个角色的说话过程阐述的过于书面化了,试着去给单词中的字母做动画,而不是把重点放在搞清楚讲话主旨所必须的那些主要音素上面。
讲话中没有字母这回事……
请注意我把单词“sound”用引号括起来了,为什么?因为初学者很常犯的一个错误就是把“字母”和“声音”混为一谈了。
原理#1:字母不是声音,声音不是字母,在口型同步动画中没有字母。
它们适用于相近的情况,但是以不同的形式。字母是纸面上的代表符号(对应着相应的,给定的声音),当它们组合在一起形成单词时,传达的是一种思想。但是字母是为了书写不是为了说话而造出来的。而我们是给说话而不是给书写做动画。声音是我们说话的方式(对应着给定的字母,用来承载声音),当被解释为我们理解的单词时,传达了一种思想。声音是为说话服务的,而不是用来书写。看到相似性和不同点了么?所以当你给说话做动画时,别动画字母。说话中没有字母,只有声音,而且我们的脸部塑出形状也是为了发出这些声音。
我知道这听起来好像是车轱辘话,但是相信我,差别是显而易见的。并且当你开始从动画声音形状的角度而不是从字母的角度学习制作口型同步时,你就会明白得更加透彻了。
那么,对动画来说那意味着什么呢?
让我们看一个例子,从10-second Club's November 2001 soundtrack(十秒动画俱乐部2001年11月音轨)中取得的“you hafta get”这句话要花25帧来说。最初来看,好像应该循着下面的这些关键短语:
Y (一个褶皱形状)
Ooo
H
Aa
V
T
Uh
G
Eh
T
对于一个人怎样说出“you hafta get”,这是很字面化的解释。但是如果你继续往下做,按照这种方式去设置关键帧的话,你很快就会发现这会导致播放时嘴的飞速闪动。那些口型pose有些只在屏幕上存在一帧,信息太多了,观众根本
没有足够的时间去解读它。经过快速分析可以看出,你让口型从非常大开(hafta 里的Ah)到非常紧闭(hafta里的F)然后又回到大张的状态(hafta的结尾a)。结果就是嘴从开到合,再到开,却只花了三帧的时间,这样不好看,伙计。
但是我的字母怎么办…嗯…我的意思是说发出“声音”的口型?
很多时候初学者会按照人脸孤立发出一个“字母”的样子严格复制一个“音素”到口型同步中。所以当我们说“E”时我们就作出一个“E”的音素。基于我们对照镜子说“kuh”的样子,就作出了“K”的音素。乍一看这样最符合逻辑不过了。问题是当你说字母“T”本身时发音是“tuh”,这时候你的脸部的形态和你说比如“skate”时的大不一样。而且“skate”里的“t”和“petstore”里的“t”发音口型也截然不同。那个“t”和当你说“goatee”时的“t”又有很大的区别。
原理#2:给口型做声音的匹配动画时一定要考虑上下文的关系
关于上下文,我的意思是:
前面的声音口型会影响当前的声音口型,同样,后面的声音口型也要在当前的口型中做预备动作。
因此,所要展示的口型一定要和前面和后面的声音一起通盘考虑。当你把声音中所有的“t”都做成一个样子,而不去管之前或之后的声音/口型的时候,你就会把你的口型动画得太快太跳跃了。记住原理#1-动画语音不是动画字母。口型同步是要动画一个口型“流”,这就需要当前的口型一定要融入正在传达的东西中。
好吧,异想天开先生,我到底应该怎样去动画口型同步呢?
比较好的方法是去解读语音,去捕捉音轨中记录的传递信息的关键音素。去“侧耳倾听”,努力捕捉讲话中的整体感觉。
让我们看看艺术史吧。
直到十九世纪晚期之前的许多年,艺术表现要努力达到的效果就是小心翼翼的进行现实的精确再现。真实感就是目标,循规蹈矩的用绘画去释义也被视为规范。而后,一群艺术家们想出一个点子,只是捕捉一幅图像的整体感觉。它们开始把兴趣点不是放在捕捉一棵树上的每片树叶,而是开始关注光线和阴影以及颜色色调怎样通过投射使这棵树进入另一种境界。这种新的境界是一种经过解释的领域,叶子没有形态、颜色、色调和对比度重要。起初这些人被嘲笑是懒惰的艺术家,对深入细节无能为力。但是很快,世界就接受了这种新式绘画方法,并惊异于它的生命力与美感,而之前那里只是些叶子罢了。印象派的时代诞生了,我们都更加乐在其中。
那么把这样的观念应用在我们的口型同步上如何呢?
这里就是方法:就像抛开写实主义捕捉图像的观念的印象派画家那样,我们也需要在口型同步的动画中成为印象派。