系统功能语言学的形式化进程——兼评《系统功能语法在自然语言生成中的应用》
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
系统功能语言学的形式化进程——兼评《系统功能语法在自
然语言生成中的应用》
李学宁;张德禄
【摘要】系统功能语言学在自然语言生成中得到了广泛的应用.在应用的过程中,反过来推动了理论本身的形式化发展.继Nigel语法之后,Elke Teich提出了一种新的形式化分析方法——依存系统功能语法.这种方法能够在一定程度上克服系统功能语言学和Nigel语法中的“组合沟”现象,但是在理论模型和实验结果方面均存在较大的局限性.随着人工智能和自然语言处理技术的发展,一个新兴的研究范式是采用人工神经网络来更全面地表征系统功能语言学理论框架.
【期刊名称】《山东外语教学》
【年(卷),期】2012(033)001
【总页数】6页(P27-32)
【关键词】形式化;依存系统功能语言学;类型特征结构;人工神经网络
【作者】李学宁;张德禄
【作者单位】山东大学外国语学院博士后流动站,山东济南250100;山东大学外国语学院博士后流动站,山东济南250100;同济大学外国语学院,上海200092
【正文语种】中文
【中图分类】H0-06
1.0 系统功能语言学形式化研究的动因
系统功能语言学自诞生之日起,就与计算语言学结下了不解之缘。
早在20世纪50年代,韩礼德就密切关注计算语言学的发展,并对机器翻译、电子词典编纂等多个分支领域进行了深入的研究。
(Webster,2007)1972年,他的学生Winograd 设计了一个比较简单的人工智能系统SHRDLU,将系统功能语言学的应用范围扩展到了自然语言生成领域。
此后,各种自然语言生成系统不断涌现,比较著名的有PROTEUS、BABEL、TEXT、PAULINE、PENMAN、KOMET等等。
(Matthiessen & Bateman,1991:39-42)
这些研究工作有力地推动了系统功能语言学与计算语言学,尤其是自然语言生成之间的对话。
一方面,系统功能语言学已经成为了自然语言生成系统中运用最为广泛的语言理论。
另一方面,自然语言生成对于系统功能语言学理论本身的可计算性提出了更高的要求。
从计算语言学的角度来看,语言学理论必须进行形式化的处理,即通过数理逻辑的方法和手段对原来的理论体系结构进行更加严密和明晰的表征。
只有这样,才能够进一步编制程序在计算机上得以实现。
(靳光瑾,2001:1)同时,人们在设计自然语言生成系统的过程中也开始认识到不能一成不变地按照韩礼德的系统功能语言学理论框架。
(Clippinger,1978)
对于系统功能语言学的形式化,韩礼德本人是持肯定态度的。
他充分意识到需要对“纵聚合关系”,即“系统”进行形式化处理,并率先尝试引入概率逻辑和模糊逻辑来进一步丰富和发展其语言学理论体系。
以“系统”思想的发展为例:缺乏定量分析的“系统”只是表征了不同的选项及其析取关系,解释的是可能性问题。
引入“概率”这一个概念后,就能进一步揭示在不同选项中进行选择的概率大小。
这样一来,系统就不仅仅是一个可能性系统,而且是一个概率系统。
与计算机技术,尤其是语料库技术结合起来,就能对自然语言进行更加精确的定量分析和研究。
(Webster,2007:ix,xvii)
在后续的系统功能语言学形式化研究中,许多学者做出了贡献。
部分学者甚至提出了新的语法模型,例如Matthiessen的Nigel语法和Fawcett的公共语法(朱永生, 严世清, 2001: 13)。
其中,Nigel语法在自然语言生成领域产生较大的影响。
下面,重点介绍Elke Teich(1999)的形式化研究成果——《系统功能语法在自然
语言生成中的应用》。
她是德国著名的Saabrücken大学的科研人员,曾经参加
了PENMAN、KOMET等多个自然语言生成系统的研制工作。
在研究过程中,她
发现韩礼德的系统功能语言学理论体系和Nigel语法都存在一定的局限性。
结合
依存语法,她提出了新的语法分析模型——依存系统功能语法(Dependency Systemic Functional Grammar)。
通过引入“依存”和“配价”的概念,能够在一定程度上克服了原有的“组合沟”现象,从而完善了系统功能语言学的句法表征手段。
然而,这种研究方法也存在诸多的局限性,例如理论模型失真,实验结果不理想。
那么,我们在系统功能语言学的形式化进程中是沿着Elke的思路进行下去,还是
另辟蹊径,采用新的研究范式?这是本文试图回答的一个关键问题。
2.0 系统功能语言学理论的“组合沟”现象及其在自然语言生成中的体现
在现代语言学的研究中,组合关系和聚合关系是一组重要的范畴:前者指的是语言单位和其他单位处于同一序列而具有的关系,即构式中组构成分(“组合成分”)之间的关系;后者指在一特定上下文里一个语言单位具有的与其他单位的一组替换关系。
(戴维·克里斯特尔,2002:255,Richards,et al.,2000:463)
从这组范畴出发,可以将当代一些语言学理论分为两大传统。
第一类侧重组合关系,例如美国的结构主义、转换生成语法和当代绝大多数句法学和语义学理论。
在进行语法分析的时候,它们一般采用“项目和配列”或“项目和过程”两种基本的模式。
第二类侧重聚合关系的描写,包括欧洲的结构主义和弗斯的语言学理论。
它们采用
的是“项目与聚合体”分析模式。
在计算语言学中,第一类理论往往用于自然语言理解领域,而第二类理论则用于自然语言生成的研究。
(Matthiessen & Bateman,1991:77)
系统功能语言学属于第二类。
它从社会符号学的角度出发,将语言视为资源或意义潜势,其表征手段为系统(网络)。
在语篇生成的过程中,需要结合语境对系统中的项目进行不断的选择。
(Elke,1999:2)因此,Matthiessen和Bateman(1991:77-78)认为系统语法理论的基础是聚合关系及其系统网络。
2.1 系统功能语言学理论中的“组合沟”现象
在一个具有可计算性的语言学理论中,应该将聚合关系的描写与组合关系的描写有机地结合起来。
然而,在将聚合关系“映射”(mapping)或“体现”(realization)为组合关系的时候,Elke Teich(1999:2)认为系统功能语言学理论体系中存在一个“组合沟”(syntagmatic gap)现象。
简单地说,“组合沟”现象包含了两层含义:
1)在精密度方面,组合关系的描写明显弱于聚合关系的描写。
在系统功能语言学中,聚合关系的描写十分充分、细腻,而组合关系的描写在复杂程度上与其不处于同一个级别。
2)从级阶的角度来看,系统功能语言学的句法表征手段不统一。
在词组层,一般为单变结构类型(univariant structure);而在小句层却是多变结构(multivariant structure)。
在表征经验功能、人际功能和谋篇功能的时候,分别采用了如下三种不同的结构形式(胡壮麟等,2005:203):
切分性:[小句] 中介+过程+施为者+地点+时间
韵律性:[小句] 语气+剩余部分+附加疑问
突出性:[小句] 主位+述位
在这几种结构形式之中,切分性,即成分分析法最为完善,但是它却不足以描写其
他句法组织模式;而其他的分析法却不够明确,难以揭示自然语言中出现的所有现象。
(Elke,1999:73)
2.2 “组合沟”现象在自然语言生成系统中的负面作用
“组合沟”现象在一定程度上降低了系统功能语言学理论在计算机上的可操作性,并且对于自然语言生成系统的研制也产生了一定的负面影响。
以小句的层次分析为例,在系统功能语言学中一般采用句法功能与词类相结合的标注体系,但是各家的具体做法存在差异。
与Hudson(1976)等人所不同的是,韩
礼德只对功能进行了明确的标记。
至于词类,他采用了层级实现(interrealization),即预选(preselection)的操作来进行指派。
当韩礼德的理论框架应用于PENMAN研制的时候,在相应的Nigel语法中出现
了大量的预选操作,因此显得十分累赘。
以下为及物性系统中的选择程序。
其实,在情态系统和主位系统中也存在类似的情况。
图1 Nigel语法中及物性系统的选择(Elke,1999:61)
3.0 Elke的解决方案:“组合沟”的逻辑功能分析
在系统功能语言学理论体系中,系统网络中的选择与语言的基本功能,即元功能存在对应关系。
在系统功能语言学理论框架中划分了几个层次:语境层、语义层、音系层等。
这些层次均按照元功能的原则进行组织。
例如,语境层根据概念功能、人际功能和语篇功能分为了语场、语旨和语式。
在语法层的小句级阶上,根据上述三个元功能相应地区分及物性系统、语气系统和主位系统。
从上述思路出发,Elke试图从元功能的角度来解决“组合沟”现象。
她认为问题
的症结在于词汇-语法层面的概念功能,更准确地说是逻辑功能的分析。
在系统功
能语言理论框架中划分了5个级阶,从小到大依次为:词素、词、词组/短语、小
句和句。
在Nigel语法中,词素和词合为了一个级阶。
它们的一个共同特点是对
于句法结构及其内部组成关系的描写缺乏统一性和概括性。
下面,我们在词、词组和小句三个主要级阶上对系统功能语言学和生成语法的句法分析方法进行对比分析:
1. 生成语法的句法分析方法
在生成语法理论体系中,X-阶标理论采用如下图式对于各种句法结构的内部结构
和共有的结构特征进行了统一的处理。
(温宾利,2002:68-101)
图2 X-阶标图式
1) 当X代表N、V、A、Adv或P的时候,所生成的短语结构分别为名词词组(NP)、动词词组(VP)、形容词词组(AP)、副词词组(AdvP)或介词短语(PP)。
此时,词和词组/短语之间的关系为投射关系。
所生成的结构均为向心结构,它们都有一
个中心。
2) 当X代表I或C的时候,分别生成屈折词短语(IP)和标句词分句(CP),即限定性小句和由if、whether、for、that等词引导的非限定性小句。
这些结构与上述词
组具有相同的句法结构和特征。
从系统功能语言学的角度来说,X-bar理论中的所有结构类型均为单变结构,并且这个单变结构具有一个中心即X。
通过投射关系,清晰地揭示了词、词组和小句等不同层次单位之间的区别和联系。
从计算语言学的角度来说,这种统一的处理模式有助于后续的程序编写和执行。
2. 系统功能语言学的句法分析方法
在小句层,出现了切分性、韵律性和突出性三种不同的结构形式。
在这些结构形式中,所揭示的是功能成分之间的功能关系,而不是组成分成之间的句法结构关系。
在生成句子的时候,需要通过预选操作将功能成分用句法范畴表示出来。
此外还需要进行相应的插入(insertion)和合并(conflation)操作,才能将功能成分插入句子
成分结构之中并与其他成分进行语序的调整。
以英语中某情态系统的实现为例:
图3 英语情态系统及其实现命题节略图(Elke,1999:17)
在该系统中,具有相应的实现命题。
特征[indicative]的实现命题是‘+Subject’,意为‘插入主语’。
特征[declarative]的实现命题是‘Subject ∧Finite’,表示“主语在先,谓语在后”。
因此,所体现的局部句法结构为:
与X-阶标理论中的结构相比,系统功能语言学中的大部分结构类型及其所体现的
句法结构缺乏一个共同的中心,因此不是向心结构,而是离心结构。
尤为棘手的是,在小句和词组两个级阶之间,功能成分的实现主要依靠各种预选操作,因此在语言学理论体系的一致性方面显得不是很连贯。
在计算语言学中,这种处理方式的一个重要后果就是在程序编写的过程中会出现大量的Bug。
4.0 依存系统功能语言学的核心思想及其形式化表征
4.1 “依存”与“配价”概念的引入
在自然语言处理的发展中,最先广泛采用的是基于N. Chomsky句法理论的短语
结构模型。
然而,这种模型具有许多局限性,尤其是语法的生成能力太强,区分歧义结构的能力很差。
因此,在自然语言生成的时候会产生大量的歧义句。
此后,人们提出了一些新的语法理论,例如1)基于合一运算的形式模型,包括Kaplan的词汇功能语法(Lexical Functional Grammar,LFG)、Martin Kay的功能合一语法(Functional Unification Grammar,FUG)、Gazdar的广义短语结构语法(Generalized Phrase Structure Grammar,GPSG)、中心词驱动的短语结构语法(Head-Driven Phrase Structure Grammar,HPSG)等等;2)基于依存和配价的形式模型,包括Tesniere的依存语法和Herbig等人的配价语法;3)基于格语法的
形式模型;4)基于词汇主义的形式模型等等。
(冯志伟,2010:173-354)
在上述几种形式模型中,Elke借鉴的是基于依存和配价的形式模型。
她试图提出
一种新的语法模型——依存系统功能语法,目的是对句法结构及其内部组成进行
统一的描写与表征。
与短语结构语法相比,依存语法中没有词组这个层次。
这样一来,每一个节点都与句子中的单词相对应,因此能够直接处理词与词之间的关系,大大减少了节点的数目。
(冯志伟,2010:266)在相应的依存系统功能语言学中,Elke对传统的级阶理论进行了重新表述:
图4 依存系统功能语法级阶示意图(Elke,1999:192)
在上图中,首先在精密度上提出了两大类级阶:词汇类和非词汇类。
然后,进一步将词汇类分为词汇中心和词汇非中心;将非词汇类区分为小句、名词词组和介词短语等不同子类。
在其理论体系中,同样没有设定词组这个中间层次,保留了依存语法的简洁明了的特点。
值得特别关注的是,Elke试图将所有的依存结构处理为一个具有中心词的向心结构。
在词汇中心子类中,包含了动词、名词和介词三种代表性词类。
在更大的句法结构中,它们分别构成了小句、名词词组和介词短语的中心词。
与配价语法结合起来,可以更加精确地揭示依存成分与中心词之间的支配关系。
以德语中的名词词组为例,可以更加充分地揭示依存成分与中心词之间存在性、数、格的一致性。
4.2 “类型特征结构”表征方法的采用
在现代语言学的研究中,特征是一个重要的分析方法和表征手段。
它首先在结构主义音位学的研究中得到应用,此后进一步应用于其他学派的句法和语义分析。
(李学宁、陆汝占,2007)
特征分析法在系统功能语言学的研究中也得到了广泛的应用。
在系统网络中,不同的选择通过特征来进行表征。
(Matthiessen & Bateman,1991:77)然而,系统功能语言学中特征的性质及其组织与广义短语结构语法、中心词驱动的短语结构语法等其他一些当代语法理论存在差异。
首先,系统功能语言学中的特征主要是功能驱动的,而其他语法中的特征主要是形式驱动的,从而便于后续的句法结构生成。
其次,系统功能语言学中的特征是基元(rimitive),因此不便于进一步分解。
而在其
他语法体系中往往采用特征结构,包括特征和不同的值。
(Elke,1999:172-174)
在系统功能语言学形式化研究中,一个重要的动态是借鉴其他语法理论中的特征结构对原来的理论体系进行重新表征。
最先开展这方面研究工作的是
Kasper(1988:177)。
他借鉴的是特征合一语法中的功能描写框架,其理由是系统
功能语言学和特征合一语法都强调语言结构中的聚合关系。
此后,Bateman et al.(1992)首次提出采用类型特征结构对系统功能语言学进行计算表征,即具有可
计算性的表征。
Elke沿用了Bateman等人的研究思路。
然而,她的一个创新之处是采用类型特征结构有效地表征了句法结构的依存关系。
例如,采用类型特征结构可以将图4中
的信息表征如下:
图5 类型特征结构示意图(Elke,1999:192)
4.3 实验反馈结果
Elke(1999:204)在计算机上对所提出的依存系统功能语言学进行了实验。
具体做法是:某人对计算机提出一个具体的“生成询问”,计算机则自动生成下列某个英语、德语句子的依存特征结构:1)Kim devours a cookie. — Kim verschlingt einen Keks. 2) Kim sings. — Kim singt. 3) Kim gives Jodie a cookie. — Kim gibt Jodie einen Keks. 4) Kim gives a cookie to John. — Kim verschenkt eninen Keks an John.
与Nigel语法相比,依存系统功能语言学在某些方面展示了优越性。
首先,采用“依存关系”对于不同的句法结构和句法特征进行了一定程度的概括,从而能够对于大量的预选操作中的共性部分进行统一的处理。
在对德语句法结构进行分析的时候,这种方法更加能够显示其合理性。
其次,采用了计算语言学中主流的类型特征结构表征方法对系统功能语法体系进行了重新表征,有利于后续的计算机上的执行
与操作。
毋庸讳言,Elke的理论研究和实验中存在较大的局限性:1)在句法结构研究方面,她只是初步考虑了小句、名词词组和介词短语;2)在聚合关系研究方面,她主要涉及了概念功能中的及物性系统,并且将语气系统预设为陈述。
对于语篇功能及其主位系统则缺乏相应的研究;3)在实验方面,她主要是对一些片语的生成进行了考察。
能够投入使用进行真实语篇的生成还有待进一步考察。
5.0 人工神经网络技术的兴起与形式化研究的转向
在人工智能和自然语言处理的研究中,传统的研究范式是物理符号系统,即一个物理系统表现智能行为的充要条件是它有一个物理符号系统。
在这种研究范式的指导下,人们希望对研究问题(包括语言问题)进行抽象,并用一系列的物理符号系统及其规则来表征一个物理系统的存在和运行。
这种方法的根本缺陷是在进行形式化的过程中需要舍弃大量的信息,从而导致形式化之后的系统难以表达出物理系统的完整面貌。
(蒋宗礼,2001:4)胡壮麟等(2005:8)在谈到乔姆斯基的逻辑句法学时曾指出:“为了达到高度的形式化和理想化所花的代价太大,以至自然语言成了人造句法学,被简约得面目全非。
”
从人工智能的角度来看,Elke等人的形式化研究在本质上也属于物理符号系统研
究范式。
因此,必然会遇到物理符号系统所面临的困难:一方面会导致面目全非,另一方面会因为复杂性问题导致系统难以具有良好的结构。
在她所提出的依存系统功能语法中,只能采用类型特征结构对于概念功能中的及物性系统及其部分句法结构进行处理,而难以进一步泛化处理其他的元功能及其相应的句法结构。
人工神经网络技术的兴起为系统功能语言学的形式化研究的转向带来了新的契机:人们有可能采用联结主义的新范式来建立系统功能语言学的计算模型。
基于联结主义的人工神经网络具有一系列特点,与系统功能语言学的语言学观点和理论框架丝丝吻合。
首先,神经网络具有不同的层次,能够充分地表征系统功能语言学的基本
理论框架:语境层、语义层和词汇-语法层。
其次,神经网络采用的一个基本信息处理结构为并行分布处理。
在其输入层,能够同时处理多种不同的信息。
这可以有效地表征系统功能语言学理论框架中各层次的三元功能组织原则。
最后,可以对于“组合沟”现象提出新的解决方案。
从本质上说,“组合沟”是句法功能与词类范畴进行匹配时所出现的非一一对应的关系。
这不是系统功能语言学理论框架中独有的一种现象。
目前看来,这种多-多对应关系也难以用几条有限的语法规则或逻辑规则进行概括和说明。
如果采用神经网络技术,我们可以通过机器学习的方式来训练功能与词类的匹配。
基于BP算法,我们可以进一步利用输出层的误差来估计前导层的误差,从而实现网络结构的不断优化。
因此,基于联结主义的神经网络技术能够充分表征系统功能语言学理论框架的完整性和灵活性,是实现系统功能语言学理论的计算表征的新途径。
参考文献
[1] Bateman, J. A., M. Emele & S. Momma. The nondirectional representation of systemic-functional grammars and semantics as typed feature structure[R]. In Proceedings of the 14th International Conference on Computational Linguistics (COLING-92), Vol. III, 1992.
[2] Clippinger, J. Meaning and Discourse: A Computer Model of Psychoanalytic Speech and Cognition[M]. Baltimore: Johns Hopkins University, 1978.
[3] Elke, T. Systemic Functional Grammar in Natural Language Generation[M]. London & New York: CASSEL, 1999.
[4] Hudson, R. A. Arguments for a Non-transformational Grammar[M]. Chicago: Chicago University Press, 1976.
[5] Kasper, T. T. Systemic grammar and functional unification grammar[A].
In J. D. Benson & W. S. Greaves (eds.). Systemic Functional Approaches to Discourse[C]. Norwood: Ablex, 1988.
[6] Matthiessen, C. M. I. M. & J. A. Bateman. Text Generation and Systemic-Functional Linguistics[M]. London: Printer Publishers, 1991.
[7] Richards, J. C. et al. Longman Dictionary of Language Teaching & Applied Linguistics[M]. Beijing: Foreign Language Teaching and Research Press, 2000.
[8] Webster, J. Computational and Quantitative Studies[C]. Beijing: Peking University Press, 2007.
[9] 戴维·克里斯特尔. 现代语言学词典[M]. 北京:商务印书馆,2002.
[10] 冯志伟. 自然语言处理的形式模式[M]. 合肥:中国科学技术大学出版社,2010.
[11] 胡壮麟,朱永生,张德禄,李战子. 系统功能语言学概论[M]. 北京:北京大学出版社,2005.
[12] 李学宁,陆汝占. 一词多义研究中的特征分析法[J]. 江南大学学报,2007,(6):105-108,126.
[13] 蒋宗礼. 人工神经网络导论[M]. 北京:高等教育出版社,2001.
[14] 靳光瑾. 现代汉语动词语义计算理论[M]. 北京:北京大学出版社,2001.
[15] 温宾利. 当代句法学导论[M]. 北京:外语教学与研究出版社,2002.
[16] 朱永生,严世清. 系统功能语言学多维思考[M]. 上海:上海外语教育出版社,2001.。