第四章 典型的短语歧义格式举例及相应的排歧策略
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章现代汉语短语结构歧义的消解策略分析
§5.1 现代汉语短语结构歧义消解策略概述
实际上在第三章介绍具体的短语结构规则和在第四章宏观地分析现代汉语短语结构组合的各种歧义类型时,已经涉及到了不少有关解决歧义结构分析问题的具体措施,并提出了一些原则性的看法。本章主要是在此基础上,更集中地来讨论短语结构歧义的消解策略。
概括而言,所有的短语结构歧义,都应该可以转化为两项成分的搭配问题来描述1。这包括:
(一)两项成分能否搭配2。表现在形式规则上就是,有没有一条关于某两个成分的组合规则。比如,假设一个规则集合中只有一条“vp->vp np”规则,那么关于vp跟np两项成分组合,不会有歧义,但如果再引入一条规则“np->vp np”,显然就会发生歧义,即vp 跟np组合,既可以理解为vp,也可以理解为np。
不难看出,向规则集中增加规则,提高了规则对所描述的语言对象的覆盖能力。但必须意识到,增加一条规则,就必然增加更多的歧义可能性。
(二)两项成分搭配时需要满足什么条件。这是看规则中有没有以合一等式表达的关于某两个成分搭配的限制条件。比如规则集中有规则“vp->vp np”和“np->vp np”,如果没有关于其中vp和np的任何限制,那么任何一个vp加上一个np就既可以理解为vp,也可以理解为np。但假如规定符合条件C1的vp加上符合条件C2的np才能形成vp,符合条件C3的vp加上符合条件C4的np才能形成np,那么对不同的具体的vp+np组合,就可能正确判断其到底应该理解为vp还是理解为np了(参见上文有关规则的条件说明)。
不难看出,给出两项成分的搭配条件,是提高分析的精度(降低歧义),但同时会导致规则的覆盖面降低,即本来应该能分析出来的结构,可能由于条件的限制分析不出来了。
很显然,(一)、(二)两方面也是关于规则集合的两个指标。前者可以大致表示规则对语言现象的覆盖能力,后者则决定了规则所能达到的对语言对象分析的精度。这两个指标间有制约关系。规则最终的整体表现,是在这两个指标间寻求一种平衡(参见3.6小结中相关说明)。
以上述认识为背景,再来看如何处理第四章中区分出的不同歧义类型,问题可以得到进一步的清晰化。这里以“外显型歧义格式”和“内含型歧义格式”两种歧义类型的区分为主,同时兼及“真歧义”和“准歧义”的情况,来展开说明。
(1)对“简单外显型歧义格式”,有可能在两项成分能否搭配的层面就可以解决歧义,或者可能在这个层面部分地解决。
(2)对“复杂外显型歧义格式”和“内含型歧义格式”,光在“能否搭配”这个层面不能解决歧义问题,只有准确描述了两项成分的搭配条件,才有可能解决歧义问题。但根据歧义是“准歧义”还是“真歧义”,又有所不同。
(3)对“内含型歧义格式”,同时又是“准歧义”类型的歧义情况,在短语结构层面通过描述两项成分的搭配条件,是可能解决歧义问题的。
(4)对“内含型歧义格式”,同时又是“真歧义”类型的歧义情况,不可能在短语结构层面,以规则加条件描述的方式完全解决歧义问题。
下面我们以三个歧义格式为例,分三个小节展开说明能通过短语组合规则加条件约束方式解决的歧义问题的情况。最后在“小结”中对在目前的分析框架下难以解决的歧义问题作些简单的说明。
104
§5.2 现代汉语短语结构歧义的消解举例
5.2.1 “p<对> np 的 vp”格式歧义分析
这个格式的歧义主要是短语结构的定界歧义,具体来说,就是“p<对>+np+的+vp”排列格式可以有下面两种组合(层次切分)方式。
a. p<对>+np+的+vp 例:对爷爷的死
| | | |
b. p<对>+np+的+vp 例:对祖国的热爱
| || |
按a方式组合,“p<对>+np+的+vp”格式的整体功能类是pp;按b方式组合,“p<对>+np+的+vp”格式的整体功能类是np。虽然上面两例分别都是单义的,但在实际语言使用中,也很容易找到有歧义的实例,如“对王经理的批评”,既可以按a分析为pp,也可以按b分析为np。因此,这个歧义格式实际上是一个“绝对外显型”的“真歧义”格式。
从现代汉语短语结构的整体系统来看,pp跟np两个功能类基本不出现在同样的结构位置(类似与语音上互补的两个音位)。从搭配的角度就是,pp跟np基本没有共同的搭配对象。比如pp最典型的搭配是可以跟vp搭配形成一个状中式vp,而np没有这种搭配情况。同时,np的典型搭配是跟vp搭配形成主谓式dj(np+vp)或述宾式vp(vp+np),这也是pp所没有的搭配情况。因此当“p<对>+np+的+vp”格式出现在实际的句子中时,通常是很容易判别其应该按哪一种组合方式进行分析的。比如:
(1)A 小组长对王经理的批评产生了抵触情绪。 (按a切分,pp作状语)
B 对王经理的批评有点太过分了。 (按b切分,np作主语)
尽管“对王经理的批评”本身是歧义短语结构,但出现在例(1A)中时,只能理解为pp;出现在例(1B)中时,只能理解为np。因为如果把例(1A)中的“对王经理的批评”按b方式切分来理解为np,全句分析不出结构。而按a方式切分标记为pp,则恰好能分析为后面vp“产生了抵触情绪”的状语成分,全句可以分析成功。例(1B)也是如此。
需要指出的是,pp跟np有一个虽然结构位置不同,但在计算机看来也会被认为是同样的搭配的组合情况,即“pp+dj”和“np+dj”组合模式。这两个组合模式分别形成的更大组合体的功能类都是dj,差别只是前者为状中式dj(pp在状语位置),后者为主谓式dj(np 在主语位置)。但对计算机来说,当“p<对>+np+的+vp”格式出现在dj前时,既可能形成状中式dj,也可能形成主谓式dj。这种情况下,要做出准确区分,就只能诉诸搭配条件了。这个条件比较容易给出。我们可以在“dj->np !dj”规则中限制主语np不能是“p<对>+np+的+vp”格式,即这条规则有绝对条件:
IF %np.内部结构=定中,%np.中心语.cpcat=np,%np.定语.内部结构=的字,%np.定语.中心语.
cpcat=pp,%np.定语.中心语.原形=对 FALSE
有了这个限制后,当“p<对>+np+的+vp”格式出现在dj前时,只能分析为pp,不能分析为np。比如:
(2)对王经理的批评他们总是当耳边风。 (按a切分,pp作状语)
从上述对消解“p<对>+np+的+vp”格式歧义的分析中不难看出,要解决这个格式的歧义问题,基本可以不考虑格式内部组成成分的性质(如其中np和vp的句法语义性质),主要是关注这个格式所处上下文环境(搭配对象)的情况。这是消解歧义格式最简单的一种处理方式。当然,上述分析也只是能对“p<对>+np+的+vp”这个格式进行正确的层次切分而已,
105