对于国内外对于本体认识的综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
要求:05年至今,对于国内外对于本体认识的综述/分析/调研报告一、本体的定义
本体(Ontology)的概念起源于西方哲学,一方面研究存在的本质,另一方面研究客体对象的理论定义,即整个现实世界的基本特征。现在哲学领域较多翻译为“本体论”。
本体在计算机学科的使用可以追溯到上个世纪80年代,Haves(1978)把本体论引入了人工智能领域AI(Artificial Intelligence),给予了新的定义。Alxenader在1986年发表的文章被视为本体在计算机领域获得不同于哲学领域的新的研究的起点。
Guarino(1998)进一步区分了AI(Artificial Intelligence)中的本体与哲学的本体:哲学的本体是反映世界的一种特定分类的观察方法;AI的本体是一些用特殊词汇描述现象的人造物,其本质是人造的概念系统,核心是人工规定的概念与规则体系。本体系统中的概念与一般的实体系统概念不同,它把刻画真实世界的实体概念、关系、属性等全都概念化和形式化,并且加上一些与这些概念相关的领域公理,构成用于人工智能推理系统的逻辑基础。
20世纪90年代初期,国际计算机界举行了多次关于本体的专题研讨会,本体成为包括知识工程、自然语言处理和知识表示在内的诸多人工智能研究团体的热门课题,其主要原因在于本体使人与人、人与机器、机器与机器之间的交流建立在对所交流领域的共识基础上。
本体的定义随着时间的推移也在进行着不断的变化发展,本体发展史中较有代表性的定义列表如下:
目前被大部分人公认的定义是Gruber在1994年提出的:“本体是关于共享概念的一致约定。共享概念包括用来对领域知识进行建模的概念框架、需要互操作的主体之间用于交互的与内容相关的协议,以及用于表示特定领域的理论的共同约定。在知识共享的情况下,本体的形式特化为具有代表性的词汇的定义。一种最简单的形式是一种层次结构,用来详细描述类和它们之间的包含关系。
在国内,陆汝钤院士等从实用的角度出发,对本体定义如下“本体是关于某个主题的形式化和说明性表示,包括它的论域、论域中诸对象的名称、定义及相互关系”。
2005年,中国标准化研究院的李景在总结了国内外学者关于本体概念的各种观点之后,认为本体作为知识组织的重要手段应该具有以下要素:声明(Statement)、公理(Axiom)、概念或类(Concept/C1ass)、属性(Property,Slot)、函数(Function)、实例(Instance)也称个体。
本体作为一种思想、理论和方法,尽管定义众多,但本质上区别不大。概括起来它们都包括四个主要方面:①概念化,客观世界现象的抽象模型,把领域的知识抽象为一个个确定的对象;②明确的定义,对每一个对象的概念及它们之间联系都进行合理地定义;⑨形式化,需对概念及它们之间关系进行数学表达,且达到计算机可读的水平;④共享,本体中反映的知识是其使用者(包括该领域的专家和一般用户)共同认可的。
二、本体的分类
1.按照领域依赖程度:
(1)顶层(top-1evel)本体:描述的是最普通的概念及概念之间的关系,如空间、时间、事件、行为等,完全独立于特定的问题和领域,其他本体都是该类本体的特例。
(2)领域(domain)本体:描述的是特定领域(医学、地理等)中的概念及概念之间的关系。
(3)任务(task)本体:描述的是特定任务或行为中的概念及概念之间的关系。
(4)应用(application)本体:描述的是依赖于特定领域和任务的概念及概念之
间的关系。
在这个分类当中,领域本体和任务本体是处于同一个研发层次的,它们都能应用顶层本体中定义的词汇来描述自己的词汇。应用本体既能应用领域本体中的概念,也能引用任务本体中的词汇。
2.按照细化程度
Guarino从两种不同的维度对本体进行划分。除了依据对领域的依赖程度分类,还提出了以详细程度分类。详细程度是相对的、模糊的一个概念,是描述或刻画建模对象的程度。
参考(reference)本体:详细程度高。
共享(shareable)本体:详细程度低。
3.按照形式化程度
(1)高度非形式化:用自然语言松散表示。
(2)结构非形式化:用限制的结构化的自然语言表示。
(3)半形式记:用半形式化(人工定义的)语言表示。
(4)严格形式化:所有术语都具有形式化的语义,能在某种程度上证明完全性和合理性。
4.按照是否具备推理功能
(1)轻量级本体(Lightweight ontology):轻量级本体不具备逻辑推理功能,例如叙词表和WbrdNet。
(2)中级本体(Middle ontology):中级本体具有简单的逻辑推理功能,系统可以识别一阶谓词逻辑的表达式。
(3)重量级本体(Heavyweight ontology):重量级本体具有复杂的逻辑推理功能,
系统可以识别更加复杂的二阶谓词逻辑的表达式,并为更加复杂的推理功能的实现预留了接口,如cyc本体系引。
5.按本体描述对象的不同,uschold把本体分为特殊领域本体(如医药、地理、
金融等)、一般世界知识本体、问题求解本体和知识表示语言本体等。
6.按不同的研究主题:
(1)知识表示本体(Knowledge Representation ontologies),如Frame ontology和斯坦福大学知识系统实验室提出的知识描述语言KIF(Knowledge Interchange Format)。
(2)通用或常识本体(General/common ontologies),如Cyc本体系统。到2000年为止,Cyc的常识库已有了l600000条知识和几百个微理论(micro—theory)。
(3)领域本体(Domain ontologies),如基因本体Go(Gene ontologies)、爱丁堡大学企业本体。
(4)语言学本体(1inguistic ontologies),关于语言、词汇等的本体,典型实例有GUM(Generalized Upper Model),WbrdNet和MindNet等。
(5)任务本体(Task ontologies),主要研究如Chandrasekaran等人的关于任务和问题求解方法本体的研究。
除了上述几种分类方法外,1999年,Perez和Benjamins在分析和研究了各种本体分类法的基础上,归纳出10种本体:知识表示本体、常识本体、顶级本体、元(核心)本体、领域本体、语-言本体、任务本体、领域-任务本体、方法本体和应用本体。这种分类法是对Guarino提出的分类方法的扩充和细化,但是这10种本体之间存在交叉,层次不够清晰。
三、本体开发方法