基于实例的汉语句法结构分析歧义消解
深层结构和表层结构与对外汉语歧义现象的分析
深层结构和表层结构与对外汉语歧义现象的分析摘要歧义是一种普遍存在语言现象,在对外汉语教学中,尤其是对留学时间不长的留学生来说,他们用汉语所表达或写作出来的语句,往往不太规范,容易造成歧义甚至是错误的,基于此,本文试以乔姆斯基的深层结构和表层结构理论对留学生中产生的歧义现象进行简要分析,并试图找出原因,提出对对外汉语教学歧义分析的启示。
关键词深层结构和表层结构歧义现象对外汉语教学启示引言所谓歧义,指的是句法多义,即同一个句式含有几种不同的理解,主要可归纳为语音歧义,词汇歧义和句法歧义。
汉英语言中,歧义现象大量存在着,而在二语习得过程中,歧义现象也十分普遍。
有语音方面的歧义,如(1)他在办公室看材料。
“看”有“kan51”和“kan55”两读,这对刚接触汉语不深的留学生来说,理解起来难免会产生误会。
也有词汇方面的歧义,如(2)你别上去。
“别”既可以理解一动词“用别针等把另一物体附着或固定在纸、布等物体上”,又可以理解为一副词“不要”。
此外,也有句法方面的歧义,如(3)学生家长都来了。
其中,“学生”和“家长”既可以是偏正关系,表示“学生的家长”,也可以是并列关系,表示“学生和家长”等意义。
基于以上歧义现象,本文拟以乔姆斯基的“深层结构和表层结构”理论,分析二语习得过程中,留学生产生歧义现象的原因并提出相应的教学对策。
一深层结构(DS)与表层结构(SS)理论二十世纪五十年代末乔姆斯基转换生成语法理论的问世,在语言学界掀起了一场“乔姆斯基革命”。
他的转换生成语法理论从五十年代起,大致经历了如下五个阶段:古典理论,标准理论,扩充式标准理论,管约论和最简理论。
而表层结构与深层结构理论的提出,是在1965年到1972年间的标准理论阶段,并构成了这一时期主要的语言学理论。
乔姆斯基认为,任何一个句子都有深层结构和表层结构,而表层结构是由深层结构转换而成的。
所谓深层结构是指句子的抽象句法表达,也就是结构组织的底层平面,它是短语结构规则的产物。
第四章典型的短语歧义格式举例及相应的排歧策略
面向中文信息处理的现代汉语短语结构规则研究第五章现代汉语短语结构歧义的消解策略分析§5.1 现代汉语短语结构歧义消解策略概述实际上在第三章介绍具体的短语结构规则和在第四章宏观地分析现代汉语短语结构组合的各种歧义类型时,已经涉及到了不少有关解决歧义结构分析问题的具体措施,并提出了一些原则性的看法。
本章主要是在此基础上,更集中地来讨论短语结构歧义的消解策略。
概括而言,所有的短语结构歧义,都应该可以转化为两项成分的搭配问题来描述1。
这包括:(一)两项成分能否搭配2。
表现在形式规则上就是,有没有一条关于某两个成分的组合规则。
比如,假设一个规则集合中只有一条“vp->vp np”规则,那么关于vp跟np两项成分组合,不会有歧义,但如果再引入一条规则“np->vp np”,显然就会发生歧义,即vp 跟np组合,既可以理解为vp,也可以理解为np。
不难看出,向规则集中增加规则,提高了规则对所描述的语言对象的覆盖能力。
但必须意识到,增加一条规则,就必然增加更多的歧义可能性。
(二)两项成分搭配时需要满足什么条件。
这是看规则中有没有以合一等式表达的关于某两个成分搭配的限制条件。
比如规则集中有规则“vp->vp np”和“np->vp np”,如果没有关于其中vp和np的任何限制,那么任何一个vp加上一个np就既可以理解为vp,也可以理解为np。
但假如规定符合条件C1的vp加上符合条件C2的np才能形成vp,符合条件C3的vp加上符合条件C4的np才能形成np,那么对不同的具体的vp+np组合,就可能正确判断其到底应该理解为vp还是理解为np了(参见上文有关规则的条件说明)。
不难看出,给出两项成分的搭配条件,是提高分析的精度(降低歧义),但同时会导致规则的覆盖面降低,即本来应该能分析出来的结构,可能由于条件的限制分析不出来了。
很显然,(一)、(二)两方面也是关于规则集合的两个指标。
前者可以大致表示规则对语言现象的覆盖能力,后者则决定了规则所能达到的对语言对象分析的精度。
汉语短语结构定界歧义类型分析及分布统计
中 文 信 息 学 报第13卷第3期JOURNAL OF CHINESE INFORMATION PR OCESSING V ol.13No.3汉语短语结构定界歧义类型分析及分布统计Ξ詹卫东 常宝宝3 俞士汶3北京大学中文系 北京 1008713北京大学计算语言学研究所 北京 100871摘要 本文对汉语短语结构的定界歧义做了全面考察,从歧义格式的组成成分,歧义对外造成的影响,模式歧义和实例歧义的对应关系三方面考察了短语结构定界歧义的不同类型,并对汉语短语结构定界歧义的不同类型进行了初步统计。
希望能将计算机处理汉语时碰到的短语结构边界歧义问题进一步清晰化,供理论研究者和应用系统开发人员参考。
关键词 短语 短语定界歧义 自然语言处理一、引 言计算机处理汉语会在不同层次上遭遇多种歧义问题。
本文考察汉语短语结构的边界判定歧义,目的是使计算机处理汉语的短语结构定界问题进一步清晰化。
全文分两大部分。
第一部分分析汉语短语结构定界歧义的不同类型。
本文对短语结构定界歧义的考察从抽象的句法格式入手,而不是从语言中具体的歧义实例开始。
对有定界歧义的排列式,我们选择了这样三个考察角度。
(1)考察其中组成成分有何特征;(2)考察不同的定界方式造成的对外影响;(3)考察抽象的格式歧义和具体的实例歧义的对应关系;本文在阐述对汉语短语结构不同类型的歧义的认识时,理论基础是短语(词组)本位语法体系[1,2,14],同时参考了前人有关汉语歧义现象的研究[3,4,5,6,7,8],用到的短语功能分类体系及短语功能标记可参阅文献[11,12,14,15]。
这里必须强调的是,本文涉及的汉语短语结构定界歧义现象,仅仅在观察视角和表述上是以词组本位语法体系为理论背景的,而歧义问题本身,跟具体采用什么语法体系以及基于何种短语标记体系来描述是无关的。
不管基于何种语法理论,在中文信息处理的一定阶段,都必然会遭遇到本文所谈到的这些汉语短语结构定界歧义现象。
由朱德熙先生的《汉语句法中的歧义现象》说开论文
由朱德熙先生的《汉语句法中的歧义现象》说开论文由朱德熙先生的《汉语句法中的歧义现象》说开论文论文摘要:朱德熙先生的“汉语句法歧义现象”一文对歧义语言现象的分析给我们许多有益的启示,本文在对朱先生研究成果评述基础上,试图由实例来分析歧义产生的语言根源及歧义的分化。
以使我们对于汉语语法现象的观察和分析更加深入。
论文关键词:歧义,分化,语用一、引言大多歧义现象容易引起误解,导致不必要的麻烦出现,吕叔湘、朱德熙《语法修辞讲话》把“歧义”看成是与“费解”“堆砌”等并列的重要语病之一。
中学语文教师在教学中也一直想方设法找出各种方法消除“歧义”这种语病。
为了避免歧义现象的出现,将歧义带来的消极影响降到最低,消除歧义的方法逐步增多起来。
朱德熙先生《“的”字结构和判断句》(1978)对“的”字结构判断句的歧义问题进行了详细考察,并提出了“歧义指数”概念。
朱德熙先生较早接受了结构主义语法理论,他的《汉语句法里的歧义现象》(1980)比较有代表性,奠定了语法歧义研究的基础。
二、简评《汉语句法中的歧义现象》1.1朱德熙先生的语法论著《现代汉语语法研究》选了八篇论文,主要探索一种新的切合汉语语法研究的方法来分别揭示现代汉语中种种语法事实或规律。
其中《汉语句法歧义现象》(1980)一文从语言事实出发,对歧义这种典型的汉语语法现象进行了科学精细的分析,总结出了富有创建的研究方法和理论,给后辈学人以启迪。
1.2在这一文里,朱先生并不满足于对个别多义句的一般分析,而是着重探索语言歧义现象中带有规律性的东西。
朱先生首先将语言中的多义句分两种,一种是词汇上的多义句,另一种是语法上的多义句。
词汇上的多义句是由句子里有某些词是多义引起的。
例如“他一天不吃饭也不行。
”歧义点在“饭”,或指米饭,或指每天吃的饭食。
与此相应,这个句子一种意思是说天天都要吃米饭,另一种意思是说他一天也不能饿着。
(170页)朱先生指出这种多义句不牵涉句子结构,是词汇范围里的事,与语法无关。
对外汉语教学中歧义与消歧探析
收稿日期:2013-01-20作者简介:许杨(1991-),女,辽宁大连人,对外汉语专业本科生,从事对外汉语教学理论与实践研究。
对外汉语教学中歧义与消歧探析许杨(辽宁师范大学文学院,辽宁大连116081)所谓歧义是指同一表层结构的语句对应着两种或两种以上的深层含义,简单地说,就是一种形式对应着两种或两种以上的解释[1]。
也就是说,出现歧义的语句,在结构上符合语法规则,语义上符合逻辑常理,但在意义理解上却包含两种或两种以上不同的释义。
这就形成了语言交流,特别是对外交流中一个独特的研究领域。
一、汉语歧义的本质从本质上说,语言歧义是语言的形式与意义之间矛盾的反映。
世界上任何一种语言,其形式都是有限的,而人类所要表达的内容总是无穷的。
以有限的语言形式来表达无尽的内容,自然无法避免“一形多义”现象。
这种复杂的语言现象,一般而言对交流是具有阻碍作用的,这是不争的事实;但如果利用得当,也可以成就一种语言的艺术,这也是毋庸置疑的。
因此,在歧义句研究这一领域,在研究方向上有两个基本走向,其一是基本面研究,即规避歧义的消歧研究;其二为特别面研究,即利用歧义的“双关性”制造幽默的修辞研究。
本文鉴于主题主要就基本面进行相关探讨即消歧分析。
由于歧义句的含义本身具有“模棱两可”性,可能引起两种或者两种以上的理解与解释,因而也可能导致人际沟通中的误解,或不能准确地传递信息,因而消除或避免语言的歧义就显得十分必要,这一方法或过程被习惯性简称为消歧。
即所谓消歧,是指为维护人们语言交际顺畅有序,运用句内、外调整的方法,使一种表层结构对应一种固定解释,最终促成“一形一义”的过程。
消歧策略就是在语法系统内“换一个方式”表达,以避免“一形多义”产生的方法。
在语言交流中,消歧是必要的;在汉外教学中,由于文化背景、生活习惯、语系风格等巨大差异,消歧尤其是必要的。
可以说,消歧是贯穿汉外教学始终的重要的教学原则。
二、汉语歧义现象的成因消歧的关键是找到造成歧义的原因。
浅谈现代汉语中的歧义问题
浅谈现代汉语中的歧义问题浅谈现代汉语中的歧义问题歧义是自然语言中普遍存在的现象,歧义现象的研究对探讨语言形式和内容的关系,揭示语法规律是很有意义的,“一种语言语法系统里的错综复杂和精细微妙之处往往在歧义现象里得到反映。
现代汉语的歧义研究作为歧义研究的一个组成部分,是随着现代意义上的中国语言学的产生而产生的,并且因为歧义本身纠集着太多语言学中的璞玉浑金,集中体现了语言形式和意义之间的矛盾,所以现代汉语的歧义研究一直是汉语语言学研究中一个非常引人关注的问题。
因此,分析歧义现象会给我们许多有益的启示,使我们对于语法现象的观察和分析更深入。
”一、歧义的意义与成因。
歧义是指同一语言形式包含两种或多种不同意义的现象。
歧义又叫同形,一个着眼于内容,一个着眼于形式,是一个问题的两个方面。
歧义必须以同形作为前提,不同形就无所谓歧义。
语符系统的有限性给歧义的存在创造了必要的条件。
语言以有限的符号结合生成无限个言语形成。
语义内容和形式之间没有必然的联系。
不同的语言形式可以表达相同的意思,同一语言形式也可以表达不同的意思。
关于歧义的成因大致可以归纳为以下几个方面:1.由同音词或同音词语造成的歧义。
2.由同形多义词或同形短语造成的歧义。
3.结构关系不同。
4.结构层次不同。
5.语义关系不同。
6.语义指向不同。
7.施受关系不同。
8.词语辖域不同。
9.词语范围所指不同。
10.词的次范畴小类的语义特征不同。
11.蕴含不同。
12.预设不同。
13.隐含共联项。
歧义的产生从根本上说,它是由客观世界的无限复杂性同语言表达手段的有限性之间的矛盾造成的。
二、歧义的类型。
歧义的类型研究。
关于歧义的类型是歧义问题中研究得最早、最多的方面。
石安石《说歧义》从不同的角度来分类: 从语体的角度可以分为书面语的歧义和口语的歧义; 从歧义产生的语言系统内部根源的角度, 歧义又可以为词汇歧义和组合歧义。
吴英才、李裕德合著的《现代汉语的歧义》则把歧义分为: 词引起的歧义, 简单词组的歧义, 复杂词组的歧义, 句子的歧义, 修辞性歧义, 标点符号的歧义。
句子语境中汉语同形异音词的歧义消解
句子语境中汉语同形异音词的歧义消解汉语中的同形异音词简单来说就是指同样的形状或字形但是却有不同的音节和含义的字词。
这类词语,因为音节的不同而造成了很多语言学上的歧义,造成了很多不必要的误解或者误会。
因此,对于这类词的消解问题是经常被讨论的一个问题。
本文将介绍汉语中的同形异音词的歧义消解及其相关案例。
一、歧义消解的概念和重要性歧义消解是指在一个句子中,根据上下文的含义,消解语句中句子成分存在的歧义。
在汉语这个相当特别的语言中,因为存在同形异音的词语,在造句时经常会出现歧义。
而歧义的存在,则会让人们产生误解和其他不必要的问题。
歧义的消解,就是避免和纠正这类问题,确保交流无障碍,避免出现不必要的误解和误会。
歧义消解的重要性在于,在正常的人际交流中如果存在歧义,会产生不必要的误解和问题,并对交流造成困扰,影响交流的质量和效果,降低沟通的效率,而在商业活动中甚至可能对业务产生损失或者错失商机。
因此,对于同形异音词的消解问题,应引起足够的重视。
二、同形异音词的例子及其歧义消解方法1. 会会是一个同形异音词,可以表示会议、会员、能力等。
当“会”字在语境中出现时,应该结合上下文具体含义来理解。
比如:我今天有个会。
- 会指的是会议我是一个书法会的会员。
- 会指的是组织他数学很好,只要学一遍就会了。
- 会指的是能力2. 行行,可以表示走,可行性、行业等。
同样的,行在语境中的具体含义要根据上下文情况而定。
比如:我明天不行,有事情要处理。
- 行指的是能否做某件事情这份合同还可以行吗?- 行指的是可行性评估他是从事IT行业的。
- 行指的是职业方向3. 坐坐是一个很容易产生歧义的同形异音词,可以表示做、坐在上面等。
比如:我坐在沙发上看电视。
- 表示坐在上面今天有事,去公司坐了一天。
- 表示在公司工作别坐着不动,出去散散步。
- 表示停留在某个地方4. 挂挂可以表示衣服、电话或者情绪等,这也是一个同形异音词的例子。
比如:他挂了电话之后就立刻进入了工作状态。
基于语境信息的汉语组合型歧义消歧方法
文 章 编 号 :1 0 —0 7 2 0 ) 60 1 — 4 0 30 7 ( 0 7 0 —组合 型 歧 义 消 歧 方 法
冯 素 琴 , 惠 明 陈
( 州 师 范 学 院 计 算 机 科 学 与技 术 系 , 西 忻 州 0 4 0 ) 忻 山 3 0 0
t r sa d e t b ih s a c n e t o e u i g l g l ei o d r to y wo d n s a l e o t x d l sn o i l o a i .A i h ac l t n f r l i d sg e o sd s m k h weg tc lu a i o mu a s e i n d c n i — o
进 行 实验 , 者 的 平 均 准 确 率 为 8 . 3 , 者 的 平 均 准 确 率 为 9 . O 。 实验 证 明使 用 语 境 信 息 之 和 对 消 解 组 合 前 4 9 后 5 6
型 分 词 歧 义具 有 良好 效 果 。 关 键 词 :计 算机 应 用 ; 中文 信 息 处 理 ; 自然 语 言 处理 ; 语 自动 分 词 ; 合 型 切 分 歧 义 ; 汉 组 对数 似 然 比 ; 境 信 息 语
e n 1 i h f e u n e a i u u r s h v r g c u a y o h o me eh d r a h s 8 . 3 ,a d t a f d o h g —r q e c mb g o s wo d ,t e a e a e a c r c f t e f r rm t o e c e 4 9 4 n h t o
FEN G — i Su q n,CH EN u — i g H im n
( p . o mp t rS in e a d Te h o o y o n h u Te c e s De t fCo u e ce c n c n l g fXi z o a h r ’Co lg ,Xi z o l e e n h u,S a x 3 0 0 h n i 4 0 。Ch n ) 0 ia
基于组合范畴语法的汉语指代歧义消解
收稿日期:2020-11-28基金项目:国家社科基金重大招标项目“面向计算机人工智能的组合范畴语法研究”,项目编号:17&ZDA027。
作者简介:周正(1997-)男,重庆巴南人,四川师范大学哲学所硕士研究生。
研究方向:自然语言逻辑。
2021年第2期第39卷(总第211期)NO.2,2021Vol.39General No.211贵州工程应用技术学院学报JOURNAL OF GUIZHOU UNIVERSITY OF ENGINEERING SCIENCE 摘要:组合范畴语法通过把不同的范畴指派给同一词条,以及改变证明树里词条的毗连顺序,能够从范畴推演和λ-演算两个方面消解汉语的指代歧义。
带有指代算子的组合范畴语法是通过在组合范畴语法中增加指代算子“│”和若干指代规则而得到的,能够有针对性地处理涉及语义资源重复使用的汉语指代歧义现象。
通过给代词指定不同的先行词,可以得到不同语义理解的证明树,从而完成指代歧义的消解。
关键词:反身代词;指代歧义;歧义消解;范畴中图分类号:B81文献标识码:A 文章编号:2096-0239(2021)02-0043-07基于组合范畴语法的汉语指代歧义消解周正(四川师范大学哲学研究所,四川成都610066)一、引言在自然语言中经常会出现非连续现象,这类语言现象的特点是“在语义上结合但在句法上却分离”,其中就包括指代现象。
在语言学中,先行词就是指代词所指的对象,指代消解(anaphora resolu ⁃tion )就是为某个指代词确定先行词。
例如:(a )小兰上班去了,但她忘了带伞。
(a )句中指代先行词“小兰”的就是指代词“她”。
这里的“小兰”不仅要作为主语与其他语言成分进行运算,还要作为“她”这个代词的先行词,所以就多次使用了词条“小兰”。
根据子结构逻辑的相关结论,传统命题逻辑包含了三条结构规则:单调规则、缩并规则、交换规则。
因为兰贝克演算处于子结构逻辑序列的底层,所以三条规则都不具备。
歧义的产生和消除(网友来稿)
歧义的产生和消除(网友来稿)武进市西林职业高级中学吴亚芳语言的准确性是语言表达的先决条件。
它是语言的鲜明性、生动性的前提。
人们无论是说话或写文章,准确性是最重要的。
只有正确地传达语意,才能给接受者以正确的信息,在听或读的时候不致造成误解。
因而研究歧义产生的原因及消除的方法,就显得致关重要。
汉语句子的表达形式相同,但意义不同,这种同形异义的句子称为歧义句。
这里所谓的“句子”,实际上包含了若干个句子。
它能作几种理解就能有几个句子。
造成句子歧义的因素很多,它包括词汇、语法、语义及语用等多方面,消除句子歧义的办法相应也有好多种。
一、词汇方面1、词的兼类由于一个词可以同时兼有不同的词性,造成这个词在句子中的句法功能不明确,从而形成句子的歧义。
例如:(1)我的自行车没有锁。
(2)我跟他去过。
(3)我要炒鸡蛋。
句(1)中的“没有”和“锁”可以分别是动词和名词,表示自行车没有安装锁,也可以分别是副词和动词,表示自行车装了锁,但没有锁上。
(2)中的“跟”可以是介词,有“随”之意,也可以是连词,有“和”之意。
例(3)中的“要”可以是动词,意为我需要一份炒鸡蛋,炒鸡蛋则为偏正词词组,也可以是副词,意为将要,我将要炒鸡蛋了。
这样就造成了对句子的不同理解,从而形成歧义。
这种由于词性不明的歧义句,要消除它的歧义,应明确兼词的具体词性,可采用改换词语,增加词语,限定语境,近义词替换等方法来明确词性,消除歧义,像(1)可换词语,变为“没有锁上”(副词、动词)或“没有装锁”(动词、名词);(2)可近义词替换“我和他去过”(连词)、“我跟着他去过”(介词);(3)可限定语境,增加上下文,改成“现在,我要炒鸡蛋了(副词)”、“我还需要一份炒鸡蛋(动词)”这样便排除了歧义。
2、词语的多义这里所说的是一个词语的词性虽然相同,但一词有多种含义,使词义在句中不够明确,从而造成句子歧义,例:(4)这是我校的一辆机动车。
(5)洪书记,那个工程队就是让你停了职的那个王长兴承包的。
《系统功能语言学视角下英汉偏正结构歧义对比分析》范文
《系统功能语言学视角下英汉偏正结构歧义对比分析》篇一一、引言系统功能语言学作为一门研究语言结构和功能的学科,对于语言中的各种现象有着深入的解读。
在语言实践中,偏正结构是一种常见的语言现象,尤其在英汉两种语言中都有所体现。
然而,由于英汉两种语言在语法、文化等方面的差异,其偏正结构在表达时常常会产生歧义。
本文旨在从系统功能语言学的视角出发,对比分析英汉偏正结构的歧义现象。
二、系统功能语言学理论基础系统功能语言学是一种强调语言使用及其功能的语言学理论,它将语言看作是一种系统,通过与其他社会活动紧密相关的功能性作用来表现其价值。
在这种理论下,语言的任何一个结构都与整体语言系统的运行有着紧密的联系。
三、英汉偏正结构的概述偏正结构是语言中常见的一种结构形式,它通常由修饰语(偏)和中心语(正)组成。
在英汉两种语言中,偏正结构都起着重要的作用,但两者在表达方式上存在差异。
英语偏正结构多以定语或状语的形式出现,而汉语则多以中心词和修饰词的组合形式出现。
四、英汉偏正结构的歧义现象虽然英汉两种语言的偏正结构有其共性,但在具体表达时却经常出现歧义。
这主要表现在以下几个方面:1. 修饰语与中心语的关系不明确:在英汉两种语言中,修饰语与中心语的关系有时并不明确,容易造成歧义。
例如,在英语中,“a virtual reality game”(一个虚拟现实游戏)的修饰语“virtual”可以理解为“虚拟的”,也可以理解为“真实的”,这取决于语境的不同。
在汉语中,“红色汽车”的“红色”可以指代颜色,也可以指代某种象征意义。
2. 语法结构差异:英汉两种语言的语法结构存在差异,这也导致了偏正结构在表达时产生歧义。
例如,汉语中的“红玫瑰”和“红颜色玫瑰”在英语中可能翻译为“red rose”或“rose of red color”,而不同的翻译方式可能产生不同的语义理解。
3. 文化背景差异:英汉两种语言所处的文化背景不同,这也会影响偏正结构的理解。
浅析汉语语法中的歧义现象
浅析汉语语法中的歧义现象浅析汉语语法中的歧义现象摘要:汉语歧义现象长期以来一直是汉代汉语语法研究的一个热点,进入21世纪之后,学者在前人研究的基础上进一步对汉语歧义现象进行了探讨.在本次课程论文中,我将从汉语语法中的歧义类型、影响和消除办法三方面对歧义现象进行浅析.关键字: 现代汉语语法歧义什么是歧义?一言以蔽之,歧义是指一个语言片段可以作两种或两种以上的解释。
如:1、开刀的是他父亲。
句中“开刀的”既可指主刀做手术的大夫,也可指“被做手术的患者”。
同一个句子出现不止一种的理解,这就是我们所要浅析的现象——歧义。
而我今天将从歧义的分类、影响和消除的办法这三方面对汉语中歧义现象进行论述一、歧义的种类歧义在划分种类时可以有多种依据,这里我将歧义划分为句法结构和语法结构两大类。
(一). 句法结构造成的歧义1句法结构关系不同。
汉语语法中结构关系有五种基本类型,分别是主谓结构、偏正结构、述宾结构、述补结构和联合结构。
一个歧义句可以划分为不同的句法结构,如:2、学生家长都来了3、他想起来了。
例五,是谁来了?句中的“学生家长”,到底是联合结构“学生和家长”,还是偏正结构“学生的家长”呢?而例六,是他要起床了,还是他想起了什么事?我们是该理解为述宾还是述补?(2)层次构造不同,句法结构关系相同。
(3)语义特征不同造成的歧义最后,我们来看语义特征不同造成歧义的现象。
但当语义特征有多种意思时,句子便会产生歧义!如:11、小张租了一辆车“租”既可以理解从他人处取得,也可以是给予,到底是小李将车借给别人了,还是说小李从他人那里借到了车?这个我们不得而知。
因为语义特征指代不明致使产生歧义的现象在我们的口语交际中数不胜数,二、歧义的作用任何一种语言现象都有它产生的原因, 在其产生后也必将起到一定的作用, 歧义现象也不例外。
在言语交际中, 我们可以把它的作用概括为两类: 积极作用和消极作用。
( 一) 积极作用交际者善动心思, 巧用歧义话语, 则会产生一些意想不到的语用效果。
汉语句法里的歧义现象
汉语句法里的歧义现象汉语句法里的歧义现象可真是个有趣又有点让人头疼的事儿呢。
咱就说“咬死了猎人的狗”这句话吧。
你看啊,这就有两种理解。
一种呢,是有个什么东西把猎人的狗给咬死了,这个“什么东西”在句子里没明说;另一种理解就是一只狗,这只狗干了“咬死猎人”这么个吓人的事儿。
这就像是一个盒子,你从不同的角度看,能看到不同的画面一样。
这歧义有时候就像调皮的小精灵,在句子里捣乱,让我们得停下来好好琢磨琢磨到底啥意思。
再好比“鸡不吃了”。
这是说鸡吃饱了,不想再吃食物了呢,还是说人不想再吃鸡这道菜了呀?这就像两扇门,我们得想办法搞清楚到底要推开哪一扇才能理解正确的意思。
要是在日常聊天里,可能我们根据当时的情景啊、说话人的表情啊还能猜个大概。
可是要是在书面上,这歧义就容易让人迷糊了。
还有像“开刀的是他父亲”。
这是说他父亲是那个给病人开刀的医生呢,还是他父亲是要被开刀的病人啊?这就像一条路分了两个岔口,我们站在路口,得想办法知道该往哪边走。
这歧义有时候就会在交流中引起误会。
你想啊,如果是在医院里,这要是理解错了,那可不得了啊。
那为啥汉语里会有这么多歧义现象呢?其实啊,汉语的灵活性在这儿就体现出来了。
汉语的词没有太多形态变化,语序和虚词就特别重要。
可有时候语序一变或者虚词用得模棱两可,歧义就冒出来了。
比如说“他在火车上写标语”,我们能明白是他在火车这个交通工具里面写标语。
可要是说“他在黑板上写字”,这就是他站在黑板跟前,对着黑板写字,而不是像在火车里那样在黑板的内部写。
这就像同样是两个容器,一个火车,一个黑板,可人和它们的关系因为不同的事物性质就有了不同的理解方式。
那遇到歧义的句子我们该咋办呢?要是在口语里,咱就多问一句呗。
“你刚说的鸡不吃了,是鸡饱了还是咱不吃鸡啦?”这样就能搞清楚。
要是在书面语里呢,就可以调整语序或者加些词来明确意思。
就像刚刚说的“咬死了猎人的狗”,如果想表达是某个东西咬死了猎人的狗,可以说“把猎人的狗咬死了的(东西)”;要是想说狗把猎人咬死了,可以说“猎人被狗咬死了”。
现代汉语中歧义句的消解方法.
本科生毕业论文(设计)题目现代汉语中歧义句的消解方法姓名刘慧君学号2011410445院系文学院专业汉语言文学指导教师刑慎宝职称讲师2015 年4 月23日曲阜师范大学教务处制目录摘要 (1)关键词 (1)Abstract (1)Key words (1)引言 (1)一、补充解释法 (2)二、语气表意法 (3)三、语法消歧法 (3)(一)层次分析法消除歧义 (3)(二)替换分析法消除歧义 (4)(三)语义指向分析法消除歧义 (5)(四)句子成分分析法消除歧义 (6)(五)语境消歧法 (6)四、语法手段+词汇手段消歧法 (7)(一)调整语序+改换字词 (7)(二)转变句式+增加字词 (7)结语 (7)致谢 (8)参考文献 (8)现代汉语中歧义句的消解方法汉语言文学专业学生刘慧君指导老师邢慎宝摘要:歧义句在人们的学习生活中经常出现,它有着巨大的研究价值,所以有关歧义句的研究在现代汉语研究中占有重要地位,学者们也给予了广泛关注。
要想充分地利用歧义句或解决歧义句带来的问题,必须深入研究歧义句的消解方法。
对于歧义句消解方法的研究可以从歧义句的定义着手,先简单地阐明歧义句的定义,然后根据歧义句的成因,用一些歧义句的实例,从语音、词汇、语法、语境四个方面对歧义句的消除方法进行深入的分析探讨,以深化人们对歧义句的了解应用。
关键词:现代汉语歧义句消解方法Elimination Methods of Ambiguous Sentences in Modern Chinese Student majoring in Chinese Language and Literature Liu HuijunTutor Xing Shenbao Abstract:Ambiguous sentences often appeared in daily life, it has great value of research, so the researches on ambiguous sentences occupy an important position in the study of modern Chinese, and scholars have paid more attention to the research of ambiguous sentences. In order to make full use of ambiguous sentences or solve the ambiguous problem, we must study the method of ambiguous resolution . Research on the resolution method of ambiguous sentences can proceed from the definition of ambiguity,first briefly expounds the definition of ambiguity, then according to the causes of ambiguity and some examples of ambiguous sentences, in-depth analyzing the methods which eliminate the ambiguity from four aspects of pronunciation, vocabulary, grammar and context, in order to make people understand the application of ambiguous sentences.Key words: modern Chinese;ambiguous sentences; digestion引言歧义问题是现代汉语研究中的一个重要课题,早在建国初期,我国的一些语言学家就针对歧义问题进行了探讨研究,并取得了一系列骄人成绩。
基于信息论的汉语结构歧义自动消解研究
收稿日期:2019-06-02;修回日期:2019-08-19基金项目:国家教育部语委项目(YB135-91);汉语海外传播河南省协同创新中心资助项目作者简介:杨泉(1977-),女,山东平度人,副教授,硕导,博士,主要研究方向为计算语言学、对外汉语教学(yangquan @bnu.edu.cn );冯志伟(1939-),男,云南昆明人,研究员,博导,主要研究方向为计算语言学.基于信息论的汉语结构歧义自动消解研究*杨泉1,冯志伟2(1.北京师范大学汉语文化学院,北京100875;2.国家教育部语言文字应用研究所,北京100816)摘要:运用信息论的理论基础,给出了一个结构歧义的信息熵模型,用此模型分析了利用上下文信息对歧义结构进行消解的数学原理,建立了度量歧义结构歧义强度的定量方法和消歧策略的收益率模型。
在基于规则的上下文排歧中,引进了基于统计的信息熵和互信息方法,把基于规则的理性主义方法与基于统计的经验主义方法巧妙地结合起来,分析了基于信息论的汉语结构歧义自动消解的最优策略法和上下文信息最优策略法中所依据的语言学知识及数学原理,并通过“v +n ”结构的具体实例验证了提出的理论和方法的有效性。
最终展示了语言学本体知识对于突破当前计算机消歧算法中瓶颈问题的重要作用。
关键词:结构歧义;歧义消解;歧义强度;信息熵;互信息0引言随着信息技术的发展,使用计算机处理自然语言起到了越来越重要的作用。
歧义问题是计算机处理自然语言每个阶段都会遇到的问题,如歧义字段切分、多义词义项选择、结构歧义消解等。
结构歧义是短语层面的歧义,是歧义问题中较为复杂的一类问题,也一直是中文信息处理的瓶颈问题。
结构歧义问题的合理解决直接关系到计算机是否能够正确理解句子的结构、语法、语义关系,因此也引起了各相关领域研究者的广泛关注。
语言学界对歧义结构的研究有以下几个方面:a )个别歧义例句的语法、语义现象;b )歧义结构与其他语言理论的关系;c )歧义结构的歧义指数与歧义度;d )歧义结构的产生与消除;e )一种或几种歧义结构。
汉语句法歧义消解的认知机制
汉语句法歧义消解的认知机制周明强【摘要】The meaning of the syntactic aspect,which is composed of the meanings of the words and the syntactic structure,is more flexible and changes with the syntactic changes.The awareness of the ambiguity in the ambiguous syntactic structure is reflected in the activation rate and rejection,which are determined by the difficulty of cognition.Its basic law is that the ambiguity of cognitive activation is inversely proportional to the speed and the difficulty of cognition,while rejection is proportional to the degree of cognitive difficulty.In addition to the cognitive ability for reducing ambiguity is related to one's language ability and the characteristics of the syntactic structure.%句法结构体的意义由词语的意义和句法结构形成的意义共同构成,其意义较为灵活,它随句法结构的变化而变化。
对有歧义的句法结构所存在的歧义情况的认知,反映在激活速度和抑制程度上,它们由认知难度决定,其基本规律是,歧义的认知激活速度与认知难度成反比,抑制度与认知难度成正比。
基于词语搭配关系的一种中文分词歧义性消除方法
基于词语搭配关系的一种中文分词歧义性消除方法郭丙华;俞亚;李中华【摘要】In Chinese there are the fix collocation relationships between words.This paper presents a disambiguation method for Chinese segmentation based on word collocation.It firstly pre-segments the sentences by using the forward maximum matching method and backward maximum matching method,and carries out the word ambiguity detection and tags the part of speech,and then it matches the ambiguous words with word collocation dictionary or makes distinguishment on verb-object collocations,thus achieves the more accurate results of document words disambiguation.The proposed method reaches good results as shown in contrast experiments of word ambiguity detection and word collo-cation detection.%汉语中词与词之间存在固定的搭配关系,基于词语搭配关系提出一种分词歧义性消除方法。
该方法先利用正向和逆向最大匹配方法进行句子预切分,并对词的歧义性进行检测和词性标注,再对歧义词与词语搭配词典进行匹配或者动宾搭配判断,实现了较为准确的文档词语歧义性消除。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于实例的汉语句法结构分析歧义消解*杨晓峰李堂秋洪青阳厦门大学计算机系,厦门,361005摘要本文论述了一种基于实例的汉语句法结构分析的消歧方法。
本文首先提出了这种方法的总体思路,并对其语义知识资源—《知网》作了简要的介绍。
然后详细地描述了基于实例的排歧法的主要算法。
最后给出的算法实验结果例子证明,这种方法是对汉语的结构分析排歧是有效的。
关键词歧义消解基于实例相似度知网依存关系树Example-Based Chinese Syntactic Structure DisambiguationYang Xiaofeng Li Tangqiu Hong QingyangDepartment of Computer Science, Xiamen University,Xiamen,361005 Abstract This paper presents a description of the method of Example-based Chinese syntactic structure disambiguation method. First we put forward the general idea about this method and give a brief introduce to its semantic knowledge resource —the Hownet Dictionary. Then the main algorithm for the method of example-based disambiguation is proposed with detail. The experiment result given in the end proves our method to be effective.Keywords Disambiguation Example-Based Similarity HowNet Dependency Tree一.引言在进行文本的自动句法分析中,歧义的自动消解是一个关键而又尚未完全解决的问题。
传统语法认为歧义包括词汇的多义歧义和结构的同形歧义[1]。
歧义消解存在着基于“制约”和基于“优先”的方法。
基于“制约”的方法是利用规则的形式来对分析进行约束排歧;而基于“优先”的方法则是从若干个已分析出的歧义侯选结构中根据某种选择原则(preference)挑出一个最优的结构。
在实际运用中,常常把这两种方法结合起来,先用规则约束对句子进行分析,再选取分析结果中的最优者作为最终的分析结果[2]。
在“选优”中,存在着基于语法和基于语义的两种方法。
前者从语法的角度来进行优选,如根据动词的配价满足度进行排歧[3];而后者则将语义作为选优的依据。
如用语义关联网来排除汉语句法分析的歧义[4]。
单纯依靠语法来进行排歧对处理某些问题是无能为力的,例如“维修图书馆的空调”和“装修图书馆的工人”,两者具有相似的语法的形式,但是句法结构却分别是“(维修(图书馆的空调))”和“((装修图书馆)的工人)”。
这类问题的解决需要有语义的知识:“空调”不能做“维修”的主语;“工人”不能做“装修”的宾语。
通过语义关联网可以描述这些词类之间的搭配关系,从而确定最终的分析结构,但是在实际的应用中一个完善的语义关联网需要总结各种可能的语义搭配关系,并且在描述搭配关系中要注意把握抽象的程度,而这些完备性和准确性的问题的解决是比较复杂的。
在自然语言处理中一般采用《同义词词林》作为语义知识资源,但是《同义词词词林》编篡的本义并非是用于自然语言处理,它的体系结构与语义的分类并不十分适用于句法分析*本文的研究工作得到国家863课题支持(项目编号:863-306-ZT03-06-1)消歧处理。
本文提出的基于实例的歧义消解方法也是一种基于语义的优选法,这种方法利用《知网》为语义知识资源,通过实例比较的方法对候选句法结构中的实义词间的搭配关系进行评价,并计算整个分析结构的最优评价值,把评价值最高的那个分析结果作为分析的最终结果。
用这种分析方法,我们可以同时解决词汇和结构上的歧义的问题。
二.基于实例的歧义消解基于实例(example-based)的方法最早是在机器翻译中被提出的,这种方法在一个大规模的双语语料库中找出与输入句最相似的例句,把例句的目标语言作适当的调整作为输入句的翻译结果。
这种方法避免了知识的手工编码和手工获取过程,而从真实文本的语料中抽取翻译的规则。
基于实例的句法消歧方法也是基于此种思想。
汉语中的词语按照意义蕴含的丰富程度可分为实义词与辅助词,其中实义词包括了名词、动词、形容词。
词和词之间会发各种搭配关系,大多数辅助词的作用仅仅用于表示关联和语气,而实义词的语义搭配关系则对句法结构起着重要的影响作用[5]。
我们对句子的某个候选分析结果的评价就是建立在判断句中各实义词之间的语义搭配密切程度之上。
我们在词典中为每个词语的义项指定若干具有区别能力的词语组合实例,这些实例是包含该词语的短语或简单的句型。
把当前句子分析结构中某个实义词的上下文相关词集与字典中该词的所有实例进行比较,找出一个最相似的实例,这个实例所代表的义项就作为该实义词的释义,而比较的相似度则反应了该词在句子结构中与其它实义词的搭配紧密程度,并以此作为实义词的评价依据。
由于句子的不同候选分析结果在结构上存在差异,同一个词的上下文相关词在不同分析结构中不相同,在实例比较中会得到不同的评价分数。
我们可以根据句子中实义词的评价分数总和来选择一个最优的分析结果。
由于我们在比较实例与上下文词集时选择了最大相似度对应的词语义项,因此我们同时也解决了句子大部分实义词的词汇歧义。
为了方便地获得某一实义词的上下文相关词,句法分析结果的结构最好能用依存关系树的形式来表示。
树的根结点是句子的核心词,其它受核心词支配的附属成分就作为根结点的子树,这些子树分别也是以各附属成分为根结点而建立起来的依存关系树。
例如输入句“维修/图书馆/的/空调”的两个可能的句法结构树如下:图1 ((维修 图书馆)的 空调)的树结构 图2 (维修(图书馆 的 空调))的树结构其中树中每个结点代表句中的词及词性、结点间的弧线表示连接词间的附属关系。
词性标 注V , N 对应的是动词,名词;树中弧线上标注含义分别是:SUBJ :主语,OBJ :宾语,ATTR :定语。
三、语义知识资源3.1 知网简介《知网》(英文名称 HowNet )是其创建人董振东先生花费逾十年研究心血的重要成果。
《知网》是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库[6],它是一个网状的有机的知识系统。
语义词典是知网系统的基础文件。
在这个文件中每一个词语义项的概念及其描述形成一个记录。
目前词典中提供汉英双语的记录,每一种语言的每一个记录都主要包含4项内容。
其中每一项都由两部分组成,中间以“=”分隔。
每一个“=”的左侧是数据的域名,右侧是数据的值。
它们排列如下:NO.= 词或短语序号[W_X= 词或短语G_X= 词或短语的词性E_X= 词或短语的例子]+DEF= 概念定义其中的W_X、G_X、E_X构成每种语言的记录,X用以描述记录所代表语种,X为C 则为汉语,为E则为英语。
每个词语由DEF来描述其概念定义,DEF的值由若干个义原及它们与主干词之间的语义关系描述组成。
义原是知网中最基本的、不易于再分割的意义的最小单位,知网通过对约六千个汉字进行考察和分析来抽取了800多个义原,并总结了如部分、主体、客体、从属、时空、材料等若干种义原间的语义关系,这些关系在知网中用义原前附加如“*”、“@”、“$”等相对应符号来表示,因此我们把这些语义关系称之义原的前缀语义关系,而对应的符号为义原的前缀语义关系符。
下面我们用形式化的语言来对DEF进行定义:DEF = [Mark]Atom[,[Mark]Atom]*Mark = * | @ | ? | ! | ~ | # | $ | % | ^ | &ATOM = atom1|atom2|…|atom k所有这些义原及其关系应能对所有的词语概念进行定义。
E_X中存放的是为那些具有多个义项提供的例子。
这些例子强调例子的区别能力而不是它们的释义能力,用以为消除歧义提供可靠的帮助。
下例是动词“打”作“打球”解的义项在词典中的定义:NO.=017140W_C=打G_C=VE_C=~网球,~牌,~秋千,~太极,球~得很棒W_E=playG_E=VE_E=DEF=exercise|锻练,sport|体育上例中E_C项的“~”号代表W_C项的词。
通过DEF的定义我们可以知道在“打球”中“打”和“体育”与“锻练”有关。
除了语义词典外,知网还提供了义原分类树,分类树把各个义原及它们之间的联系以树的形式组织在一起,父子结点的义原具有上下位的关系。
我们可以通过义原分类树计算义原间的语义距离。
在知网中存在ENTITY、EVENT等几棵分类树,如下图是词网中表示事件义原关系的EVENT分类树:图3 EVENT义原分类树的树结构表示知网的词典用文本的方式保存的,我们要事先把它转换成方便系统实现的格式,考虑到系统用LISP实现,我们把词典用表的形式来表示。
词条的E_C项转化为一个以E_C开头的表,而E_C项中的各实例则成为这个表中的元素。
如果义项不是动词,则每个实例除“~”以外的词语构成一个表;如果义项是动词则每个例子又由两个子表构成,它们分别对应该例子以“~”符号分隔开的两部分词语集合,前半部分通常是动词的主语。
而DEF项则被拆分成一系列以语义关系为首位元素的表,DEF中所有的具有相同语义关系的义原都归于相应的子表中。
例如我们可以把“打”的义项文本表示为:((NO 017140)(W_C 打)(G_C v)(W_E play)(G_E v)(E_C (nil(网球))(nil(牌))(nil (秋千))(nil(太极))((球) (得很棒)))(PROPERTY exercise|锻练sport|体育))四、语义计算4.1 分析树的表示及结点上下文窗口的确定设S表示输入的已经过预切分的句子,S=(R1 R2 R3 … Rm),Ri(1≤I≤m)表示句中的第I个词组。
如上节中知网义原分类树的表示方法,我们把分析结果对应的依存关系树中的结点也用表的形式来表示。
设在Ri在树中所处的结点的父结点序号是Parent(i),它的k 个子结点的序号的集合为Children(i),Ri经分析确定的词性为Cat(i),它与父结点的依存关系是Case(i),则该结点表示为:Node i: (I Parent(i) Children(i) Ri Cat(i) Case(i) ) (1≤i≤m)令Tree={Node1 Node2… Node m},则Tree可以完整地表述整棵的关系树。