第五章 句法分析

合集下载

第五章--句法结构分析

第五章--句法结构分析

变换式2: NP+Vf着+N→N+Vf+在+NP A.椅子里坐着客人→A′客人坐在椅子里 B.床上躺着病人→B′病人躺在床上 C.门口蹲着小狗→C′小狗蹲在门口 D.头上戴着鸭嘴帽→D′鸭嘴帽戴在头上 E.门边贴着对联→E′对联贴在门边 F.墙上挂着字画→F′字画挂在墙上
第四十二页,编辑于星期日:七点 三分。
变换式1: N1+V+C+N2→N1+把+N2+V+C
A.我写好了报告→A′我把报告写好了
B.他戴好了帽子→B′他把帽子戴好了 C.他穿破了袜子→C′他把袜子穿破了
D.小王打碎了玻璃→D′小王把玻璃打碎了 E.老李喝完了酒→E′老李把酒喝完了
F.他收拾完了行李→F′他把行李收拾完了
第四十一页,编辑于星期日:七点 三分。
第十四页,编辑于星期日:七点 三分。
(四)对汉语一些特殊结构的处理 1.二分与多分
层次分析法以二分为主,也不排斥多分, 该二分还是多分取决于语段内部的组合 层次。例如:
工人、农民、知识分子 三分:
北京、天津、上海和广州 四分:
第十五页,编辑于星期日:七点 三分。
2.状动宾结构 对一般的有状语有宾语的短语切分顺序,
叫 小王 吃 A B
第十九页,编辑于星期日:七点 三分。
5.双宾语结构 双宾语就是一个动词后边带上一个间接 宾语(往往为与事)和一个直接宾语 (往往为受事)。 用层次分析法对它进行切分,也存在这 种可能: 给他书
A B
第二十页,编辑于星期日:七点 三分。
6.非连续结构 一个语段中的两个直接成分之间,插
第五章 句法结构分析
• 什么是句法结构 • 句法结构指的是词与词之间相互联系、
相互作用的方式。 • 一个具体的句法结构通常称为一个结构

语法研究第五章 句法分析

语法研究第五章 句法分析

由于析句要求一举找出全句的两个中心 词,让其他成分依附于中心词,所以,又把 这种句子成分分析法叫做“中心词分析法”。 “句子成分分析法”是从句子构造即析句 依据上来命名的,“中心词分析法”是从分 析程序上来命名的。
句子成分分析法的特点 重视句子中词与词之间的构造关系,反映 了句子构造的某些方面的特点。 1 分析的对象是单句。 2 认定一个句子由六大成分——主语、述语、 宾语、补足语、形容词性附加语、副词性附 加语。
第五章
句法分析
学习要点:重点介绍新时期汉语句型研究的 问题、方法、思路。 第一节 句子及其成分 (一)判断句子的标准 传统语言学从逻辑角度认识句子,认为句 子也有主语和谓语。 结构主义语言学从形式角度认识句子, 即不被包含在别的语言形式里的独立的语 言单位。
功能主义语言学从交际功能角度认识句 子,即句子是词语对现实的联系,句子具有 表述性特征。 认知语言学从认知心理学角度认识句子, 即句子是意象图式在语言上的投射。
来客人了——客人来了
文学语言——文学、语言 对他有点看法——他有点看法
没有(动)研究——没有(副)研究
关于/巴金的两本书——关于巴金的/两本书
语法形式同语法意义之间的对应关系是 “一对多”和“多对一”的对应关系,而不 是简单的一一对应关系。 多种语法形式可以表达同一种语法意义 (多对一): 我摔破了杯子/ 杯子被我摔破了/ 我杯子摔破了/ 杯子我摔破了
这种巧克力酒心的。 我们都觉得你的心态越来越年轻了。 老先生拿起毛笔在铺开的宣纸上题写了几个大字 3 对正确理解句意,纠正语病有很大的帮助。
缺点明显。 (1)没有区别句子成分和句法成分,把六 大成分平铺在一个平面上,这就抹杀了句子 句法结构的层次性。如果抹杀了层次性,就 会抹杀不同层次关系的句法结构的差异。 一种新型的HN7禽流感病毒

第五章句法分析.

第五章句法分析.

句法成分分析法为什么会有这样的局限性呢? 原因是句子成分分析法在分析的过程中不大关 注语法结构的层次性。 从表面看,一个句子或者句法结构是词的线性 序列,其实句子或句法结构里词与词之间结合的松 紧程度是不一样的,词和词的组合有着层次的透景。 一个句子或者句法结构的词和词,总是按一定的句 法规则一层一层地进行组合的。如:他刚来。 句子或句法结构所具有的这种构造特征,一般 称之为“句法结构的层次性”。
Байду номын сангаас
4.分析的过程是: (1)先看清全句的主要成分,哪个是主语,哪个是谓 语; (2)再看充当谓语的动词是不是及物动词,以决定后 面是否有连带成分宾语; (3)最后指出附加在主语、宾语、谓语前后的所有附 加成分。
二、句子成分分析法表示方法:
1.加线法 比较通用的符号是: 主语= 谓语 —宾语 ~~~ 补语 < >
• 在分析一个句子或句法结构时,将句法构 造的层次性考虑进来,并按其构造层次逐 层进行分析,在分析时,指出每一层面的 直接组成成分,这种分析法就是“层次分 析法”。 • 如:他弟弟喜欢外国小说 • 又称“直接成分分析法”
分析过程
层次分析法的分析过程主要包括两个步骤:第一步切分,第 二步是定性。如: 他 去年 去 了 一趟 美国。 |__||___________________| 主谓关系 |___| |______________| 状中关系 |________| |__| 述宾关系 | _| |__ _| 述补关系 切分过程中应注意: ①第一步切分非常重要,第一步切分不当,后面便容易全都切 错 ②必须逐层切分,直至分析出每个实词 ③为避免切分过程中的遗漏,一般采用从左到右、从上到下、 逐块切分的分析步骤。
• 它只能揭示句法结构的构造层次和直接成 分的显性语法关系(亦称语法结构关系), 不能揭示句法结构内部隐性的语法关系 (亦称语义结构关系)。

第五章句法学(掌握).

第五章句法学(掌握).

第五章句法学(掌握)基本知识点:句法分析They elected him president。

会以S(主语)+V (谓语)+O(宾语)+OC(宾语补语,objective complement)的方式作分析说明。

后来他从事翻译工作,发现遇到难句时,这样的分析相当费事,有时反而混淆不清。

于是他再看O。

他在耶斯柏森(Otto Jespersen,一八六○-一九四三年,丹麦语言学家,研究英语语法专家)的著作,看到耶斯柏森对They elected him president的分析,指出句中的him president是以nexus作为宾语,成为elected的 object。

这个nexus是耶斯柏森的造语,我们称之为“叙述关系”,又称“主(语)谓(语)关系”,或“二元语校”。

Nexus源于拉丁语nectere,是to bind之意,因此作连结、关系、中心、核心解(如 the cash nexus 是“现金交易关系”。

耶斯柏森在一九三七年出版的“分析性句法”(Analytic Syntax)中,对“主谓关系”(又作宾谓结构)解说相当全面。

句法关系1.句法关系syntatic relationship2.并列coordinate3.从属subordination4.修饰modification5.前置修饰pre-modification6.后置修饰post-modification7.限制restriction8.双重限制double-restriction9.非限制non-restriction成分分析法句子成分(Members of the Sentence)为什么又要分词类,又要分句子成分呢?两者既然关系密切,为什么不合并起来谈呢?合并起来,容易造成混乱,因为两者是不同的概念。

同一个词类可以在句中充当不同的成分,同一个句子成分也可以由不同的词类来担任。

那么什么叫句子成分呢?句子成分是句子中起一定功用的一个组成部分。

现代汉语第五章 语法知识

现代汉语第五章 语法知识

現代漢語章五語法一、名詞解釋:1、语法:是词、短语、句子等语言单位的结构规律;2、语法单位:可分为四级,即语素、词、短语、句子,均为音义结合体;3、句子:具有一个句调,可表达一个相对完整的意思的语言单位;4、句类:根据语气划分出的句子类型,可分为四类:陈述句、疑问句、感叹句、祈使句;5、句型:根据句子结构划分出的句子类型,可分为单句和复句两大类;6、句式:句子的特征分类,句式是根据局部特点分出的下位结构类型;7、实词:有词汇意义和语法意义,可充当句法成分的词;8、虚词:没有词汇意义,仅有语法意义,不可充当句法成分的词;9、谓词:指在前面可以加“不”,在句法结构中经常作谓语,同时能作主语和宾语的词。

包括动词、形容词和一部分描述性代词,如“这么”;9、区别词:表示事物的属性,有分类作用的词,其属性常存对立性质,故多成对或成组出现,如中式:西式;10、代词:有代替、指示作用的词,与所代替、指示的语言单位的语法功能大致相当,传统语法按作用将之划分为三大类:代替人或事物的人称代词,表疑问的疑问代词,指称或区别人事物的指示代词;11、拟声词:即模拟声音的词,又称“象声词”,如“叮当”。

有修辞作用,可使语言具体形象,予人以身临其境之感,故常运用于口语及文学作品中;12、短语:即意义上和语法上可搭配而没有句调的一组词,又称词组,是大于词而不成句的语法单位;13、层次分析法:分析短语和句子的一种方法,即尽量将短语或句子划分出两个直接组成成分,除联合结构等可能由多个并列组成的短语或句子外,其余均可采用此法,故又称“二分法”,最能反映出短语和句子的内部组合层次;14、中心语:即偏正短语中的中心成分,可为词或短语。

主要有三种类型:定语中心语、状语中心语、补语中心语;15、独立语:句子中的某个实词或短语与其前后的词语没有结构关系,互不为句法成分,但句意上又是必需的成分,这种没有配对成分的特殊成分即独立语。

按表意作用可将之分为四类:插入语、称呼语、感叹语、拟声语;16、单句:由短语或词充当的,有特定的语调,可独立表达一定的意思的语言单位,据不同的标准可分出句型和句类两类。

语言学中的句法分析

语言学中的句法分析

语言学中的句法分析语言是人类最重要的交流工具之一,它通过词汇和语法来传达思想和意义。

在语言学中,句法分析是一项重要的研究领域,旨在理解和描述句子的结构和组成成分。

本文将介绍句法分析的基本概念和方法,并探讨其在语言学和人工智能领域的应用。

一、句法分析的基本概念句法分析是研究句子结构的学科,它关注句子中的词汇和它们之间的关系。

在句法分析中,句子被看作是由词汇和短语组成的,而这些词汇和短语之间的关系可以通过语法规则来描述。

句法分析的目标是确定句子的句法结构,即句子中各个成分之间的关系和层次。

二、句法分析的方法句法分析有多种方法,包括基于规则的方法、基于统计的方法和基于机器学习的方法。

基于规则的方法是最早的句法分析方法之一,它通过定义一系列语法规则来分析句子的结构。

这些规则可以是基于语言学知识的,也可以是基于实际语料库的。

基于统计的方法则是通过分析大量的语料库数据来学习句子的结构和语法规则。

这些方法使用统计模型来预测句子中不同成分之间的关系。

基于机器学习的方法则是将机器学习算法应用于句法分析任务中,通过训练模型来预测句子的句法结构。

三、句法分析的应用句法分析在语言学和人工智能领域有着广泛的应用。

在语言学中,句法分析可以帮助研究者理解不同语言的句法结构和语法规则。

通过分析句子的句法结构,语言学家可以揭示出不同语言之间的共性和差异,进一步探索语言的本质和演化。

在人工智能领域,句法分析是自然语言处理和机器翻译等任务的基础。

通过对句子的句法结构进行分析,计算机可以更好地理解和处理自然语言,从而实现自动翻译、问答系统等人机交互的应用。

四、句法分析的挑战和发展尽管句法分析在理论和应用方面取得了一些进展,但仍然面临着一些挑战。

首先,不同语言之间的句法结构和语法规则存在差异,这给跨语言句法分析带来了困难。

其次,句法分析需要处理大量的语言数据,包括语料库和语法规则,这对计算资源和算法效率提出了要求。

此外,句法分析还需要解决歧义和多义性等问题,以确保准确分析句子的结构。

第五章 语义特征分析法

第五章 语义特征分析法

• 马庆株的一项研究成果
• 实例:
• (1)A死了三天了

B等了三天了
•C看Leabharlann 三天了•D挂了三天了
• 词类序列相同,层次相同,内部构造相同。
• 表示的语法意义不尽相同,实际代表了四 种不同的情况:
• A句中的时量成分“三天”,只指明“死” 这一行为动作完成、实现后所经历的时间。
• 类似的例子:
• 伤了三天了 • 熄了三天了 • 丢了三天了 • 出现了三天了 • 娶了三天了 • 到任了三天了
• 例如: • 看[+凭借眼睛,-被动感知,+自主,+可控] • 看见[+凭借眼睛,+被动感知,-自主,-可控]
动作者能主观决 定并自由支配的、
有意识的
• “语义特征”这个概念术语借用到语法学中, 有两个目的:
• 一是用以解释造成同形多义句法格式的原 因
• 二是用以说明在某个句法格式中,为什么 同是动词,或同是形容词,或同是名词而 有的能进入,有的不能进入。
• 通过上例发现,我们是通过分析该句法格 式中处于关键位置上的动词在该句法格式 内所呈现的互有差异的不同小类的词的不 同语义特征,来达到说明造成该同形、歧 义句法格式的原因的。
二、关于语义特征
• “语义特征”(semantic feature)原是语义 学中的概念,指的是某个词在意义上所具 有的特点。
第四节 语义特征分析法
一、变换分析的局限与语义特征分析的 产生
• 可以用来分化歧义句式,但不能用来解释 造成歧义现象的原因
• 前面举过用变换分析分化“名词(处所)+ 动词+着+名词”歧义句式的实例。
• 通过变换分化为两个句式:

句法分析

句法分析

句法分析句法分析,作为自然语言处理领域的核心技术之一,主要研究句子内部的语法结构关系以及句子之间的语法关系。

它通过分析句子中的词汇、词性、句法树等要素,帮助人们理解句子的意义和组织结构。

本文将介绍句法分析的基本概念、常见方法以及在自然语言处理中的应用。

句法分析是自然语言处理中的重要任务之一,它对于理解自然语言文本具有重要意义。

在句法分析过程中,常用的方法有基于规则的方法和基于统计的方法。

基于规则的方法是根据语法规则来进行句法分析,它需要人工编写一系列的语法规则。

而基于统计的方法则是利用大规模语料库进行训练,通过统计模型来进行句法分析。

句法分析在自然语言处理领域有着广泛的应用。

其中,句法分析在机器翻译中起到了至关重要的作用。

通过句法分析,可以有效地对源语言句子进行结构化表示,从而更好地进行翻译。

此外,在信息检索、问答系统、文本分类等领域中,句法分析也发挥着重要的作用。

通过对文本进行句法分析,可以帮助计算机更好地理解文本的意思,从而实现更精准的信息抽取和语义推理。

在句法分析的研究中,有许多经典的算法和模型。

其中,最为常见的句法分析算法有基于规则的上下文无关文法(Context-Free Grammar,CFG)、依存句法分析(Dependency Parsing)和成分句法分析(Constituency Parsing)等。

这些算法和模型在句法分析任务中各有优劣,适用于不同的应用场景。

例如,成分句法分析更适用于处理形式更加标准化的新闻文本,而依存句法分析则更适用于处理更为自由化的口语文本。

在实际应用中,句法分析面临着一些挑战和困难。

首先,句法分析需要准确地识别和标注词性,但词性标注的准确率会对句法分析的性能产生很大影响。

其次,句法分析还需要处理歧义性的问题,如歧义词的处理和多义词的消歧,这需要更深入的语义理解。

此外,句法分析还需要处理非标准化的文本,如网络文本、口语文本等,这对于模型的泛化能力提出了更高的要求。

第五章 第八节 复句和句群(答案)

第五章 第八节 复句和句群(答案)

3、特点 没有语音停顿,关联词大多用副词,精练、 紧凑、明快。 4 、运用 (1)可紧缩 你爱去不去。 (2)可独立成句、可充当句子成分、可作分句 没有调查研究就下结论。 没有调查研究就下结论是错误的。 没有调查研究就下结论,你的观点很可能是错 的。
5、区别紧缩复句与复句、单句
句法成分、语音停顿、关联词语 练习(一)
指出下列复句类型: 转折 1.他终于答应了,尽管有些勉强。 2.就算我的看法不对,也不能给我戴自私的帽子 啊。 假设 因果 3.既然孩子喜欢音乐,就给他买一架钢琴吧。 条件 4.不管公鸡叫不叫,天总是要亮的。 5.你要是不忙,就带我到外面转转。 假设 6.注意态度,以免争执。目的 目的 7.你把作业交给老师,好让他批改。
请你转告师长,我是一名八路军战士, 不是你的客人。 我是一名八路军战士,不是你的客人。 (并列)
3)分句间意义关系:联系紧密
*天气冷,可是我身上还在出汗呢。(转折) *生旦净末丑,好汉不回头。
4)复句的停顿:内部,;: 前
后 。?!
① 他把锄头扛在肩上,爬上山去。(顺承) ② 这说明了一个真理:爱美是人类的天性。(解说) ③ 风,在城市上空盘旋;树,脱帽为它送行;街, 成了叶的舞台。 (并列)
偏正类练习
分析多重复句的层次关系
1.任何思想如果不和客观上的实际事物相联系, || (并列)如果没有客观存在的需要, || (并列)如果不是为 人民群众所掌握, | (假设)即使是马克思列宁主义, || (假设)也是不起作用的。 2.三味书屋后面也有一个园, | (并列)虽然小, || (转 折)但在那里也可以爬上花坛折腊梅花, |||(并列)在地 上或桂花树上寻蝉蜕。 3.孔子曾经计划过出色的治国的方法,但那都是为了 治民众者,即权势者设想的方法,为民众的,却一点 也没有。 4.我们所以要隆重纪念爱因斯坦, | (因果)不仅因为他 一生的科学贡献对现代科学的发展有着深远的影响, ||而且还因为他勇于探索、勇于创新、为真理和社会 而献身的精神是值得我们学习的, |||是鼓舞我们为 加速实现四个现代化而奋斗的力量。

现代汉语第五章语法(部分)

现代汉语第五章语法(部分)

第五章语法第一节语法概说1.语法和语法体系(这俩术语均有两种解释)语法:语素、词、短语、句子等语言单位的结构规律1)语法——语法规律,客观的语法事实 + 语法学的理论,学者对语法事实的主观说明语法体系——语法系统,客观存在的语法事实,语法规律的系统性 + 语法学体系,语法学者根据自己的学说解释语法事实时所用的分析方法一个民族的语法系统只有一个,但是一个民族的语法体系可以不止一个。

2)语法研究由句法、语义和语用三个方面的研究组成。

句法:造句的规则(短语、句子的结构规律和类型)——包括传统的词法和句法语义:句法结构的变化对语义的影响及反作用语用:句法结构的变化对语境,句子的语调、口气等的影响及反作用2.语法的性质:1)抽象性:语法不研究个别的,而是从众多的语法单位的组合里抽象出其中共同的组合方式或类型及如何表达语义。

如:汉语中“看看”“学习学习”词的重叠现象。

说明有些动词可以用重叠的方法来表示动作的少量或短时。

2)稳固性:语法的变化比语音、词汇慢得多。

如:词序和虚词是汉语的重要语法手段。

3)民族性:每个民族都有明显的民族特点,不仅表现在语音和词汇上,也表现在语法上。

如:俄语用词形变化(形态)表示词的句法功能,语序比较自由;而汉语里的词没有表示句法功能的形态变化,词在句中充当什么成分,主要靠语序来表示。

3.语法单位:1)语素:语言中最小的音义结合体。

构词的备用单位2)词:最小的能够独立运用的语言单位。

构成短语、句子3)短语:语义上和语法上都能搭配的,没有句调的一组词。

造句的备用单位4)句子:具有一个句调,能够表达一个相对完整的意思的语言单位。

关系:语素可以 = 词词组>语素词可以 = 句子词组可以 = 句子4.句法成分:句子结构的组成成分1)句法成分到底是什么,是凭句法关系定名的。

如:主语是被陈述的对象,谓语是陈述主语的,两者之间是陈述关系。

2)句子成分间的语法关系:主谓、动宾、定中、状中、中补口诀:动前有主状,动后有补宾。

句法分析

句法分析
请阅读P96-99该算法。
自顶向下分析算法
1.初始 当前状态为((s) 1)记为C,候选状态为空
2.当算法未失败且算法未成功,重复:
(1)若C是空字符列且词位置到了句尾,则算法成功, 返回。
(2)若当前状态和候选状态都为空,且词未知未到句 尾,则算法失败,返回。否则,产生新状态:
• 若C中字符列的第一个字符是句子中下一个词的词类,则 从字符列中移去第一个字符,并修改词位置,修改后的状 态为当前状态,记为C,转(2)。
如,使用上述文法,句子:the boys eat apples. 可以用下图所示的推导树表示,同时也表明了该句是合 法的句子。
S
NP
DET
N
V
the
boys eat
VP NP N
apples
面向短语结构语法的句法分析
句法分析例子1
小王和小李的妹妹结婚了
生成规则:
S→NP VP NP →NP C NP NP →N NP →NP de N VP →V le
短语结构语法
一般上下文无关文法所代表的短语结构 语法应用最为广泛。
经典乔理论:一个语法包括:
短语结构(phrase structure) 转换结构(transformational structure) 形态音位(morphophononemics)
• 例:S->NP VP … • XY->YX(掉位转化结构) • Hit->[hit]
• S->NP VP • NP->ART N • NP->ART ADJ N • VP->V • VP->V NP
依存语法
依存语法打破了传统句子中的“主谓关系”, 提高了“谓语”中动词的地位,平等了主语、 宾语、和其他句子补充成分的地位

语言学概论第五章语法

语言学概论第五章语法

特别是表示物体名词的语法属性在有 的语言中表现更为复杂,跟自然的性属几 乎看不出有什么联系.如德语:
die Milch(牛奶 阴性) ←俄语→中性 die Sonne (太阳 阴性)←俄语→中性 die Klasse (班级 阴性)←俄语→阴性
语法范畴反映了古代人对事物的认 识.当然,他们的认识跟现代人是不同一 样的.
mouse--mice go-----went
buy---bought
good---better---best
6 重叠 用词根语素或词干的重复出现来造成 词形变化的方法.
汉语的重叠比较普遍,动词、形容词、 量词都可以重叠.注意:
各种重叠变化所表示语法意义的不 同.
动词重叠:表示短时貌,尝试态.
形容词重叠:表示程度加深.
如英语中单数、复数可以概括为“数” 的语法范畴,阴性、阳性、中性可以概括 为“性”的语法范畴。
语法范畴必须通过一定的语法手段表 现出来。
语法形式可以概括为两大类手段:
综合手段和分析手段
相应地,语法意义可以概括为两大 类范畴:
词法范畴和句法范畴。
由综合手段[词形变化]表现的语 法意义概括起来形成的范畴就是词法范畴。 由分析手段[语序、虚词、语调等]表现 的语法意义概括起来形成的范畴叫句法范 畴。
语法单位的抽象性:以名词为例
名词一般理解为人或事物的名称,但其 来源与表现极不相同:
桌子 铅笔 : 物 张三 李四 : 人
方便 希望 :
技术 科学 :
西方语言的以形态作为划分词类的主
要标准,但形态并无普遍性:
music\ sheep\ cattle\ Chinese\ Japanese 等名词无形态:
量词重叠:表示遍指,每个之意.

第五章 句法成分

第五章 句法成分

第五节 句法成分
(7)可能补语 这衣服晒得晒不得?(动词+得、不得) 看得完/看不完 (肯定/否定形式)
洗得干净/洗不干净
比较:

写得好写不好?——写得好 写不好 写得好不好?——写得(非常)好 写得不 (怎么)好
第五节 句法成分
(二)补语和宾语的顺序 1. 动+补+宾
端来了一碗鸡蛋汤
动 |宾
第五节 句法成分
那些可以有两种位置的状语,放在句首时常常有一些 特别的作用,或者是强调状语,或者是照顾上下文的连 接,或者状语较长,较多,放在句首可以使主语和谓语 中心靠近,使句子结构紧凑,便于理解句意。或者放在 句首修饰几个分句,这样既照顾了结构,避免用语重 复,也照顾了表意。 [午后],天闷得很,风小得只勉强能摇动庄稼叶子。 [当然],房子必须装修。 [按照上级指示],我们必需在天亮之前攻下921高地。
就用每个词语分别修饰中心语,可以修饰就是多层定语。
第五节 句法成分
)( )( )( )( )( )( ) ( ) ( 他家买了一部国产长虹牌34英寸平面直角黑屏幕多制式彩色电视机。 一部国产长虹牌34英寸平面直角黑屏幕多制式彩色电视机
定1 )
定2 ) 定3 )

中 中
定4
)
定5 ) 定6

中 ) 中
语充当。 (1)这个姑娘||很美丽。 (2)这个姑娘||长得很美丽。 (3)鲁迅||浙江人。 (4)她||圆圆的脸庞,大大的眼睛,长长的辫子。
第五节 句法成分
3. 主语的意义类型 施事主语
(1)他||只投进了三个球。 (2)精彩的演出||抓住了观众的心。 受事主语 (1)鞋子||跑掉了。 (2)小明||被人从冰冷的河水里救了上来。 当事主语 (1)这件事||不能怪他。 (2)窗外||烟雨朦胧。

自然语言理解-句法分析概述

自然语言理解-句法分析概述

例子-分析结果之一
例子-分析结果之二
我们会涉及到……
• • • • 句法分析算法 句法分析消岐策略 浅层句法分析 句法理论
句法分析概述
什么是句法分析
• 句法分析(Parsing)和句法分析器(Parser)
– 句法分析是从单词串得到句法结构的过程; – 不同的语法形式,对应的句法分析算法也不尽相同; – 由于短语结构语法(特别是上下文无关语法)应用得 最为广泛,因此以短语结构树为目标的句法分析器研 究得最为彻底; – 很多其他形式语法对应的句法分析器都可以通过对短 语结构语法的句法分析器进行简单的改造得到。
句法结构的歧义消解2
• 我是县长。 • 我是县长派来的。 • 咬死了猎人的狗跑了。 • 就是这条狼咬死了猎人的狗。
• 小王和小李的妹妹结婚了。 • 小王和小李的妹妹都结婚了。
例子-语法
• 小王和小李的妹妹结婚了 规则: 词典: S -> NP VP 小王:N 小李:N NP -> C NP 和:C NP -> N 妹妹:N NP -> NP de N 结婚:V 了:le VP -> V le 的:de
与形式语言句法分析的比较
• 形式语言一般是人工构造的语言,是一种确定性的语言, 即对于语言中的任何一个句子,只有唯一的一种句法结构 是合理的,即使语法本身存在歧义,也往往通过人为的方 式规定一种合理的解释。如程序语言中的if…then if…then…else…结构,往往都人为规定else 子句与最接 近的if 子句配对; • 而在自然语言中,歧义现象是天然地大量存在着的,而且 这些歧义的解释往往都有可能是合理的,因此,对歧义现 象的处理是自然语言句法分析器最本质的要求。 • 由于要处理大量的歧义现象,导致自然语言句法分析器的 复杂程度远高于形式语言的句法分析器。

系统学习NLP(五)--句法分析

系统学习NLP(五)--句法分析

系统学习NLP(五)--句法分析句法分析的基本任务是确定句⼦的语法结构或句⼦中词汇之间的依存关系。

句法分析不是⼀个⾃然语⾔处理任务的最终⽬标,但它往往是实现最终⽬标的关键环节。

句法分析分为句法结构分析和依存关系分析两种。

以获取整个句⼦的句法结构为⽬的的称为完全句法分析,⽽以获得局部成分为⽬的的语法分析称为局部分析,依存关系分析简称依存分析。

⼀般⽽⾔,句法分析的任务有三个:判断输出的字符串是否属于某种语⾔消除输⼊句⼦中词法和结构等⽅⾯的歧义分析输⼊句⼦的内部结构,如成分构成、上下⽂关系等。

第⼆三个任务⼀般是句法分析的主要任务。

⼀般来说,构造⼀个句法分析器需要考虑两部分⼯作:⼀部分是语法的形式化表⽰和词条信息描述问题,形式化的语法规则构成了规则库,词条信息等由词典或同义词表等提供,规则库与词典或同义词表构成了句法分析的知识库;另⼀部分就是基于知识库的解析算法了。

语法形式化属于句法理论研究的范畴,⽬前在⾃然语⾔处理中⼴泛使⽤的是上下⽂⽆关⽂法(CFG)和基于约束的⽂法,后者⼜称合⼀⽂法。

简单的讲,句法结构分析⽅法可以分为基于规则的分析⽅法和基于统计的分析⽅法两⼤类。

基于规则的句法结构分析⽅法的基本思路是,由⼈⼯组织语法规则,建⽴语法知识库,通过条件约束和检查来实现句法结构歧义的消除。

根据句法分析树形成⽅向的区别,⼈们通常将这些⽅法划分为三种类型:⾃顶向下的分析⽅法,⾃底向上的分析⽅法和两者相结合的分析⽅法。

⾃顶向下分析算法实现的是规则推导的过程,分析树从根结点开始不断⽣长,最后形成分析句⼦的叶结点。

⽽⾃底向上分析算法的实现过程恰好想法,它是从句⼦符号串开始,执⾏不断规约的过程,最后形成根节点。

基于规则的语法结构分析可以利⽤⼿⼯编写的规则分析出输⼊句⼦所有可能的句法结构;对于特定领域和⽬的,利⽤有针对性的规则能够较好的处理句⼦中的部分歧义和⼀些超语法(extra-grammatical)现象。

但对于⼀个中等长度的输⼊句⼦来说,要利⽤⼤覆盖度的语法规则分析出所有可能的句⼦结构是⾮常困难的,⽽且就算分析出来了,也难以实现有效的消歧,并选择出最有可能的分析结果;⼿⼯编写的规则带有⼀定的主观性,还需要考虑到泛化,在⾯对复杂语境时正确率难以保证;⼿⼯编写规则本⾝就是⼀件⼤⼯作量的复杂劳动,⽽且编写的规则领域有密切的相关性,不利于句法分析系统向其他领域移植。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

这场错误可以避免。 一场无谓的争吵避免了。
例如,汉语中动词单独作谓语不自由,有很大的 限制,这正是通过层次分析法所获得的一条语法 规律。
2、层次分析的局限
层次分析包含切分和定性两方面内容。 一是切分,找出一个结构的直接组成成分; 二是定性,确立切分所得的直接组成成分之间 是什么句法关系。至于包含在句法结构内部的 实词与实词之间的语义结构关系它则无法揭示。
层次分析法的图解方法
1.分析层次图解法(从大到小)
提高分析问题和解决问题的能力
2.组合层次图解法(从小到大) 提高分析问题和解决问题的能力
层次分析法的优点与局限
1、层次分析法的优点
⑴适用范围广
句子成分分析法只适用于单句的句子成分分 析,这些就把自己限定在很狭窄的适用范围之 内。
层次分析法它既可以用来分析单句的结构, 也可以用来分析复句的结构,还可以用来分析 合成词的结构。
• (6)小芸天资过人,小玲也天资过人。
变换分析的局限
• 变换分析的运用扩大了语法研究的视野, 可以解释更多的语法现象,把语法研究引 向深入,有利于揭示更多的语法规律。但 是,变换分析同其他分析方法一样,也有 它的局限性。具体说,变换分析可以用来 分化歧义句式,但不能用来解释造成歧义 句式的原因。
• 在分析一个句子或句法结构时,将句法构 造的层次性考虑进来,并按其构造层次逐 层进行分析,在分析时,指出每一层面的 直接组成成分,这种分析法就是“层次分 析法”。
• 如:他弟弟喜欢外国小说
• 又称“直接成分分析法”
分析过程
层次分析法的分析过程主要包括两个步骤:第一步切分,第 二步是定性。如:
他 去年 去 了 一趟 美国。 |__||___________________| 主谓关系
• 一、句子成分分析法
• 也叫做中心词分析法,句子成分分析法的特
点是:
第五章
• 1、认定语法分析就是分析一个句子(单句)
的句子成分。 汉语句法分析
• 2、认定一个句子有六大成分:
• 主语、谓语、宾语、定语、状语、补语
• 3、作句子成分的原则上都只能是词
第一节 成分分析法
• 从句法角度来解释说明种种语言现象的分 析方法,称之为“句法分析法”。
这种歧义现象也得用变换分析法来加以分化, 因为A义和B义的差异是由句法结构内部实词与 实词之间不同的语义结构关系所造成的。
• 具体说,例(1)里的“戏台上”(名词[处 所])指明“鲜花”(名词语)存在的处所, 而例(2)里的“戏台上”(名词[处所”指 明“演京戏”(“动词+名词语”)这一活 动进行的场所。下面试用变换分析来分化 上述歧义句式。这里我们不妨假设表示A 义的“名词[处所]+动词+着+名词语”为 [A]式,表示B义的“名词[处所]+动词+着 +名词语”为[B]式。
• (7)[B]式 名词[处所]+动词+着+名词语

→[D]式 名词[处所]+正在+动词+名词语
• 戏台上演着京戏 → 戏台上正在演京戏
• 门外敲着锣鼓
→ 门外正在敲锣鼓
• 外面下着大雨
→ 外面正在下大雨
• 大厅里跳着舞
→ 大厅里正在跳舞
• 这说明,[B]与[D]式之间存在着变换关 系,即:(8)[B]式→[D]式
• 一、句子成分分析法分析要点:
• 1.分析的对象是单句;
• 2.认为句子有六大成分组成——主语、谓 语(或述语)、宾语、补足语、形容词附加 语(即定语)和副词性附加语(即状语和补 语)。这六种成分分为三个级别:主语、谓 语(或述语)是主要成分,宾语、补足语是 连带成分,形容词附加语和副词性附加语是 附加成分;
• 一是我们所要研究分析的句法格式(称为“原句 式”)及其一个个具体的实例;这一部分置于变换矩 阵的左边。
• 二是与原句式在结构上有相关性的另外的句法 格式(称之为“变换式”)及其一个个具体的实例; 这一部分置于变换矩阵的右边。
• 三是表示原句式和变换式之间变换关系的箭头, 置于原句式及其实例和变换式及其实例之间(用一般 的箭头,如“ ”,表示变换关系成立;用加斜杠 的箭头,如,“ ”表示变换关系不成立)。
• 3.作为句子成分的只能是词;
4.分析的过程是:
(1)先看清全句的主要成分,哪个是主语,哪个是谓 语;
(2)再看充当谓语的动词是不是及物动词,以决定后 面是否有连带成分宾语;
(3)最后指出附加在主语、宾语、谓语前后的所有附 加成分。
二、句子成分分析法表示方法:
1.加线法 比较通用的符号是:
主语= 谓语 —宾语 ~~~ 补语 < > 定语( ) 状语[ ]
(淘气的)弟弟 [已经]做<完>了|(今天的)作业
=

~~~
2.图解法
三、句子成分分析法的优点: ⒈采用加线法和图解法分析句子,简明清晰、 形象直观。
⒉有利于确定句型。
⒊有利于识别病句。
三年当中,这个县的粮食总产量,以平均每 年递增百分之二十的速度,大踏步地向前发 பைடு நூலகம்。
四、实际操作上的问题
如: 他从小贪图安逸。 (*他贪图)
他的想法都合乎事实。 (*想法合乎)
封建思想必须清除。 (*思想清除)
1. “主干”离开了“枝叶”就不成立或站不起来。
如: 我弟弟不喜欢京剧。 (≠弟弟喜欢) 你可便宜他了。 (≠你便宜) 无原则的团结对革命事业有害。 (≠团结有害)
2.离了枝叶,“主干”虽成立或站得住,但意思完全 变了。
3.分化歧义的能力差 如“这张照片放大了一点儿”,这个句子是有歧义的:
• “表示总括”理解为“只要前面是表示复数 的名词性成分就能用‘都”’。按此理解, 多数情况下是用得对的,但也会出现用得 不对的病句。例如:
• (1)*麦克生日那天,我们三个人都给他送 了一个大大的蛋糕。
• (2)*佐佐木、冈本俩都是同乡,都出生在 鹿儿岛。
• 原来副词“都”不是一般地表示总括,而 是强调表示“都”后面所说的性状或情况 适用于它所指向的某个集合中的每一个个 体,或无一例外地独自进行了后面所谈到 的行为动作,或无一例外地各自具有后面 所谈到的性状,或无一例外地属于后面所 谈到的情况。
值得注意的是,[A]式只能变换为[C]式, [B]式只能变换为[D]式。 变换分析有效地分化歧义句式 :
• 名词[处所]+动词+着+名词语
变化分析法的作用和局限
• 变化分析法的作用: • 1、更有效的分化歧义句式。 • 2、揭示更多的语法规律。 • 表总括的程度副词“都”确切的语法意义
是什么?是在运用了变换分析法后才进一 步明确的。

• 现在我们再来看一个变换实例。先看实例:

(1)戏台上摆着鲜花。
• (2)戏台上演着京戏。
• 这两个句子格式相同,其词类序列都是:
• (3)名词[处所]+动词+着+名词语
• 如果对它们进行层次分析,切分和定性相同。 (4) 名词[处所] 动词+着 名词语

a.戏台上 摆着 鲜花。

b.戏台上 演着 京戏。
⑵能更好地分化歧义句式
• 例如:“这张照片放大了一点儿”是个歧 义句,句子成分分析法不能加以分化,但 层次分析法可以很好地加以分化。
按A,这张照片放大了一点儿
按B,句子应分析为:
主谓 述宾 /述补 述补
这张照片放大了一点儿
主谓 述补
述补
⑶有助于发现新的现象,揭示新的 语法规律。
这场错误避免 一场无谓的争吵避免
• 例如:
• (3)爸爸、妈妈、姐姐都给我送了礼物。
• (4)小芸和小玲都天资过人。
• 由于“都”表示的是上述语法意义,所以 用“都”的句子往往可以扩充为一个并列 复句,复句里居后的分句中往往用副词 “也”,以强调彼此的类同关系。如例 (3)(4)也可以说成:
• (5)爸爸给我送了礼物,妈妈给我送了礼 物,姐姐也给我送了礼物。
•例如:我写了一封信。
• 它只能揭示句法结构的构造层次和直接成 分的显性语法关系(亦称语法结构关系), 不能揭示句法结构内部隐性的语法关系 (亦称语义结构关系)。
• 要揭示这种隐含在句子里边的实词与实词 之间的语义结构关系,就得寻求新的分析 手段。变换分析法正是适应这种研究的需 要而产生的。它能揭示出同一个句式可能 表示几种不同的动-名语义关系,解决句 法多义的问题。
|___| |______________| 状中关系 |________| |__| 述宾关系 | _| |__ _| 述补关系
切分过程中应注意:
①第一步切分非常重要,第一步切分不当,后面便容易全都切 错
②必须逐层切分,直至分析出每个实词
③为避免切分过程中的遗漏,一般采用从左到右、从上到下、
逐块切分的分析步骤。
• 对于变换分析,首先必须认识清楚,“变 换是句式的变换”。用朱德熙先生(1986) 的话来说,“变换可以理解为存在于两种 结构不同的句式之间的依存关系”。因此, 决不能将变换看作是某两个具体句子之间 的变换。明确这一点很重要。按照这个精 神,作为一个合格的变换,一定得遵守以 下一些原则。
• 作为一个合格的变换,一定得形成一个变换矩阵, 这个变换矩阵由三部分组成:

1
2
1—2 主谓

3
4 3—4 述宾
但例(1)和例(2)所表示的语法意义是不同的。 例(1)表示存在,表静态,“动词着”在意思上 大致相当于“有”。
我们把例(1)所表示的语法意义假定为A义。例 (2)表示活动,表动态,“动词着”在意思上表 示某行为动作正在进行。
我们把例(2)所表示的语法意义假定为B义。
• “名词[处所]+动词+着+名词语”这歧义句式 是怎么造成的呢?变换分析回答不了这个问 题,得寻求别的解决手段。变换分析的局 限就表现在这里。
相关文档
最新文档