描述逻辑手册15章翻译(部分)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

描述逻辑手册15章翻译(部分)
[ 2008-1-23 21:21:00 | By: lvxiu ] 自然语言处理
自KL-ONE的早期开始,描述逻辑的主要应用之一就是自然语言处理中的语义解释。

语义解释是将语句的语法分析转化为其逻辑形式的一种推导过程。

典型地,描述逻辑被用于编码知识库,该知识库含语法、语义元素以辅助语义解释过程。

知识库的一部分组成词汇语义知识,将词及其语法属性与概念结构联系起来,另一部分描述上下文及领域知识,以描述概念深层含义。

语义解释
自然语言组成部分例如名词短语或者动词短语,其用以进行语义表示的逻辑形式的一个基本属性即组合性,即整体的语义表示是其各个子部分语义表示的组合。

这样即使得语法结构与逻辑形式之间可以有紧密的对应关系。

这样,基于语法规则的解析器即可以使用对应的逻辑组合的语汇语义规则(指名各子部分的逻辑表示如何组合以形成整体的逻辑表达)增量地构造语义表示。

因此,每一个词都对应一个逻辑表达式,用来形成用它组成的整体的逻辑表达式。

可以在解析过程中进行有效的语义消歧。

解析器在组合构造整体的逻辑式的每一阶段,通过检查逻辑形式的不一致性排除语义上不合理的解释,这样可以排除许多语法上合理而语义上不合理的解释。

这种消歧在特定领域里非常有效,领域知识可以极大地减少整体可能有的逻辑形式的数量。

显然,给定的上下文及领域知识越多,消歧效果越好。

因此,逻辑形式的一致性检查起到了一个通用的选择限制作用。

一个词的概念应该包含语法关系例如同义,上下位关系,不兼容性,以及词条中预计变元的子类信息。

例如动词paint可概念化为一个事件,这一事件有一施动者词干角色,对应于带有特定选择约束即概念生物名词的主语变元。

语义词条应指名语法结构与概念信息之间合适的对应关系。

例如句子“A painter pai nts a fresco”包含概念Painter、Fresco 及Paint,同时概念Paint有两个词干角色,一个施动者及一个受动者,它们各自的选择约束条件分别是生物名词及非生物名词。

概念系统还应该包含Painter是概念生物名词的子概念,Fresco 是概念非生物名词的子概念,概念生物名词及概念非生物名词是不相交的这些事实。

这些信息足以验证上述句子的合理性,也可排除语义上不合理的句子例如“A fresco paints a painter”。

这些概念及其与语法知识的关系可以编码到描述逻辑知识库中。

上述思想形成了描述逻辑用于语义解释的理论背景[3],每一已实现的系统皆依赖于多层语义体系结构,包含一系列的处理过程:
词汇消歧:这一阶段解析器试图建立一个组合,解析器检查这一组合的语义部分的一致性,同时建立了初步的逻辑形式,其指涉及量词范围仍然是不明确的。

解析器利用语义词典及背景知识表示句子的意义,应用启发式规则获得语义上一
致但词汇上仍然不明确的不同解释的按优先级排序结果。

指称及量化词辖域消解:确定例如确定性名词短语、代名词、指称参照等的指称对象,同时通过不同的一致性解释确定量词的范围,最后通过基于语法的启发式规则确定唯一的一致解释。

上下文解释:决定在给定对话环境中如何反应,考虑问答的类型,上下文,用户兴趣模型。

其中利用了言语行为、对话及用户模型知识。

值得注意的是,所有的方法都旨在获得唯一的一致的逻辑形式。

为此,逻辑形式被认为仅仅是通过组合得到的数据结构,在这一结构上利用知识库中的信息用ad-hoc算法解决不确定性问题。

在消歧阶段并未试图给予“逻辑形式”基于逻辑的语义。

描述逻辑因此仅限于作为词汇知识库,用于构造句子的逻辑形式。

逻辑形式推导
逻辑形式在传统计算语言学中仅仅用做表示字面意义,也就是不考虑上下文含义,明显区别于句子的表层语法组成结构表示及深层语义表示。

因此,逻辑形式起到了语法与深层语义之间的媒介作用。

语言学家认为任何句子只有一个一致的逻辑形式,其歧义产生于约束过少的解释过程,例如没有充分考虑上下文知识。

在这种情形下,不同的推导过程将产生不同结果,并且每一个都是非歧义的。

从计算的角度来看,这是不可行的,首先,不同推导的数量可能成指数级增长,其次,无法考虑不同推导之间的相互依赖性。

另一方面,计算语言学家将歧义看作是句子逻辑表示的一部分,最终的目标是可以从这种不确定的表示中进行推理,以增强表示的简洁性及处理效率。

All en指出将来自然语言处理面临的一个关键问题之一是是否存在能有效地处理不明确性的知识表示形式。

上述经典的计算方法,依赖于语义分析过程的模块性,即多层的语义体系结构,从最初不确定的表示形式产生最终的一致的依赖于上下文的表示形式;面向语义的方法使用表达能力强的逻辑语言以期给许多自然语言现象清晰的语义,特别是给不确定性以清晰的语义。

歧义大致可分为:由介词,名词,动词引起的词汇歧义,结构歧义如介词短语依附歧义,指称歧义如量化词辖域歧义及指代歧义。

第一种方法的缺点在于逻辑形式的使用没有一致的形式化基础,特别是对于不确定性的处理,因此对逻辑形式的操作只能基于启发式规则和ad-hoc过程。

这使得推理含领域知识、不完全逻辑项及歧义逻辑项、未确定的指涉及非明确量化词辖域逻辑形式非常困难。

计算语言学家设计了基于语法,选择约束,格语法以及结构化的信息例如框架及类型层次的结构化的处理技术,以避免或减少消歧逻辑推导中的包含问题。

毫无疑问,这种技术经常需要ad-hoc机制以解决碰到的不确定性问题。

另一方面,一些将描述逻辑应用于自然语言处理的最近的工作采用了一种近
似面向语义的方法,使用最小化概念系统,重视可计算性,试图通过逻辑重构一些基本的问题替代解决自然语言复杂的语义问题,这些基本问题是可组合的,同质的,同时从应用的角度是有意义的。

这些方法认为逻辑形式不仅应表示字面意义,同时应表示词汇不确定性,通过变量及相等性表示未确定的指涉,解释复数实体及量词,同时和丰富的领域公理进行关联。

因此,逻辑语言应有适当的推理机制,同时是可组合的。

自然语言短语例如名词短语或动词短语通常引入指称表明领域内存在的个体或是事件。

引入的指称以存在变量表示。

含有变量及常量的可能性可以用以表示指称歧义。

这是许多逻辑形式形式化的基础。

例如,名词短语A fresco of G iotto 可能以以下的逻辑形式表示
b. Fresco(b) ^ of(b,GIOTTO)
名词短语A fresco painted by Giotto 可能有以下的逻辑形式
b, e. Fresco(b) ^ Paint(e) ^ agent(e, GIOTTO) ^ goal(e, b).
如上所述,对各子部分逻辑形式的一致性检查可以帮助进行语义消歧。

因此,在一个特定的应用领域,像A fresco paints Giotto这种句子即可以被排除,因为其逻辑形式
b, e. Fresco(b) ^ Paint(e) ^ agent(e, b) ^ goal(e, GIOTTO)
将和含有frescoes及生物名词的通用领域公理不一致,领域公理可以以词典形式
x, y. Paint(x)—>(agent(x, y) —>Animate(y))
x. Animate(x) —> ?Inanimate(x)
x. Fresco(x) —>Inanimate(x):
存在。

这些公理化理论起到了含义假定的作用,用于解释出现在逻辑形式中的谓词。

它们也可以被认为是一组谓词公理,使用基于描述逻辑的形式化方法,它们可以被写成如下的公理:
Paint ?agent.Anima
Animate??Inanimate
Fresco ?Inanimate.
在这里,描述逻辑起到了形式化的作用,用于表示通用领域公理以表示领域常识的基本本体属性。

A fresco of Giotto这一名词短语是不确定的,至少含有两种解释,A fresco painted by Giotto或者 A fresco owned by Giotto。

如果
逻辑形式写成以下形式,
b. Fresco(b) ^ (paintedBy∪ownedBy)(b, GIOTTO)
则上述两种解释都清晰地体现了这种不确定性表示。

这样,词典(可以看作是领域公理)中可以给定关系of的含义假定:
x,y. of(x,y) <—> paintedBy(x, y)∪ownedBy(x,y)
用描述逻辑可以写作
of≡paintedBy∪ownedBy.
A fresco of Giotto的不确定性可以在随后的对话中确定,例如通过Giotto p ainted the fresco in Siena或者Gitotto sold his fresco。

上述方法同样可以表示名词的不确定性,例如在The pilot was out,在这里pilot可以是母火也可以是飞行员。

句子He was on the toilet确定了上述句子的解释,因为代词he指代人,所以排除了母火这种解释。

动词的不确定性也可以通过相同的方式得到。

例如可以排除句子The door opens the door。

给定open的两项含义“cause to open”——及物动词,带有一个生物名词作为其施事者;”become open”——不及物动词。

根据这两项含义,“the door opens”及”opens the door”都是一致地,但是连起来则是不一致地。

对于结构歧义,通用常识知识解释Giotto paints the fresco with a brush 的方法应该只有一种,介词短语依附到油漆事件上,即“paints with a brush“,排除了解释“the fres co representing a brush”。

尽早确定介词短语依附在实际应用中很重要,不同解释通常由解析器来进行选择,因此,解析器不需要计算不同的解释。

相关文档
最新文档