句法依存背景知识

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

引子:
在自然语言处理中,我们有时不需要或者不仅仅需要知道整个句子的 短语结构树,而且要知道句子中词与词之间的依存关系。
概念:
用词与词之间的依存关系(支配与被支配的关系)来描述语言结构的框架, 是语义分析的基础,利用依存语法进行句法分析也是自然语言理解的重要 手段之一。 源于法国,传遍全球----法国语言学家Lucien Tensniere 在1959 年提出。
起源:
形式:
有向图,依存树和依存投射树。
由图和符号表示的依存结构形式是连接依存语法和依存句法分析算法的媒介。 它将形式化的语法规则和约束表述为由边链接的点以及它们所携带的信息,使 得句子的依存分析转化为寻找这个句子的一个空间连通结构或一组依存对问题。
依存关系的描述原则:(我们目前的依存标注原则也遵照这一 体系)
单一父 节点
可投射
特点
百度文库
连通
以此保证句子的依存分析结果 是一颗有“根”的树结构,为 依存语法的形式化描述及在计 算机语言学中的应用奠定基础。
无环
针对汉语特点,制定了具体的依存关系规范 1、语义原则 语义上存在联系的词语之间会存在依存关系。
例如:海尔具有先进的经营管理经验。 在这个句子中,我们认为,海尔具有的是“经验”,“具有”和“经验”这两个 词义进行组合,才能产生符合这个句子的语义,所以,“具有”和“经验”之间存 在依存关系。
1、一个句子只有一个独立成分 2、句子的其他成分都从属于某一成分----每个词都应该有出口或者入 口 3、任何一个成分都不能依存于两个或者两个以上的成分----一个词上 面不能有两个入口 4、如果成分A直接从属于成分B,而成分C在句子中位于A和B之间,那 么成分C或者从属于A或者从属于B,或者从属于A和B之间的某一成分。 ---对成分C的范围进行约束,避免了边的交叉 5、中心词左右两边的其它词相互不发生依存关系。 -----中心词两边 边不会有交叉
2、主干原则
。我们在标注依存关系时,尽量保证主要的词作为依存关系的核心, 其附属成分依存于该核心词。这样,对于后面的应用,只要根据依 存关系,抽取句子的主要词语,就能得到句子的主干,我们称之为 “主干原则”

通过句子的依存结构,我 们能够得到句子的主干: 加强是课题。将主语进一 步细化,可以说:加强管 理是课题。
思考:如何得到一个正确的依存关系树。
机器学习+人工标注
依存标注的在自然语言处理流程中的位置:
分词、词性->依存关系分析->语义分析
用户问
标准问
智能客服中,对用户问进行依存和语义分析后,与标准 问中已经存在的依存、语义分析结果进行匹配,通过置 信度匹配来实现对用户问的理解和解答。
自动分词、命名实体识别与词性标注
1. 2. 3. 4.
句法分析概述 依存关系分析概述 依存关系分析与依存关系标注 依存关系和语义分析目前的实际应用
句法分析(syntactic parsing)是自然语言处理中的关键技术之 一。 基本任务:确定句式的句法结构(synatactic structure)或句子 中词汇之间的依存关系。
相关文档
最新文档