关于本体论的研究综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
・综 述・
关于本体论的研究综述
顾金睿,王 芳
(南开大学商学院,天津300017)
摘 要:本文是一篇关于本体论的综述性文章,介绍了本体的概念、本体的理论研究,包括本体
的建模元语、分类、表示语言、构造规则以及目前研究本体的权威机构,对与本体相关的概念进行了介绍,分别探讨了本体与语义网络,本体与语义网,本体与叙词表的关系,最后介绍了本体在信息检索以及其他一些领域的应用。
关键词:本体;语义网络;语义网;叙词表;信息检索中图分类号:G 25217 文献标识码:A 文章编号:1007-7634(2007)06-0949-08
Overvie w of the Subject of Ontology
G U Jin -rui ,WANG Fang
(Business School o f Nankai Univer sity ,Tianjin 300071,China )
Abstract :This is a com prehensive paper on the subject of ontology.It introduces the concept ,the theory re 2search of ontology ,including m odeling primitive ,classification ,dem onstration languages ,construction rules ,and the authoritative agencies that engage in the ontology research recently.The ontology -related con 2cepts are als o presented in this paper.It separately probes into the relationships between ontology and seman 2tic netw ork ,ontology and semantic web ,and ontology and thesaurus as well.Finally what unfolds is the ap 2plication of ontology on the information research and other fields.
K ey w ords :ontology ;semantic netw ork ;semantic web ;thesaurus ;information retrieval
收稿日期:2006-09-18
作者简介:顾金睿(1983-),女,天津人,本科生;王 芳(1970-),女,宁夏中宁人,博士,副教授,硕士生导
师,从事电子政务与信息经济学研究.
本体的概念起源于哲学领域。17世纪,德意志哲学家郭克兰纽(R 1G oclenius )首次提出“On 2tology ”一词。哲学领域的“Ontology ”在苏格拉底提出“始基”问题中萌芽,由柏拉图和亚里士多德奠定了它的雏形,中世纪经院哲学使之最终成熟起来【1】。《牛津现代高级英汉双解词典》(简化汉字本)对于“Ontology ”的英文解释是:“the depart 2ment of metaphysics concerned with nature of existence ;
specific theory of this ”【2】
。从词源来看,英文的“On 2tology ”最早来自拉丁文“Ontologia ”一词,而拉丁
文又源自希腊文。就希腊文的字面意思来说,On 2tologia 是指“on ”的“log os ”。“log os ”译为中文是
指“理念、理性、哲学”,音译为“逻各斯”【3】
。“Ontology ”在汉语中也有不同的译名,如“万有论”、“存有论”、“本体论”、“存在论”等,其中以
“本体论”流传最广【4-5】
。
1 本体的概念
古希腊哲学家亚里士多德将本体定义为研究
第25卷第6期2007年6月
情 报 科 学
V ol.25,N o.6
June ,2007
“存在”的科学,又把它分为两个方面:一方面研究存在的本质,另一方面研究客体对象的理论定义,即整个现实世界(本体)的基本特征【6】。人工智能(AI,Artificial Intelligence)领域将本体概念引入,用于知识表示和知识组织,其概念的内涵也发生了改变。
为区别“本体”分属的两层含义,斯坦福大学的G uarino与G iaretta建议首字母大写的“Ontology”是指哲学领域的本体论研究,而首字母小写“on2 tology”是指AI领域的本体系统和本体理论的研究【7】。
人工智能领域中,Neches等人于1991年最早给出了Ontology的定义,即“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”【8】。
斯坦福大学的G ruber(1993)最早提出本体的定义【9】,其后Borst Pim博士等(1997)在G ruber定义的基础上做了一些修正。两个定义合并以后,表达如下:
“It is an explicit formal specification of a shared conceptualization1“译为中文,即本体是一套得到大多数人认同的、关于概念体系的明确的、形式化的规范说明【10】。
德国卡尔斯鲁厄大学的Studer等学者认为本体有四大特征【11】:
(1)明确(Explicit)。是指“被引用的概念所属的上位类与在使用此概念时的限制条件应预先得到明确的定义和说明”。
(2)形式化(F ormal)。是指“本体应该具有机器可读性”。
(3)共享(Shared)。是指在一个本体中,知识所表达的观念、观点应该“抓住知识的共性,也就是说,它不只是为某一小部分人所接受的,而是为整个群体所接受的”,体现的是共同认可的知识,反映的是相关领域中公认的概念集。
(4)概念化,又称概念模型(C onceptualiza2 tion)。是指“客观世界中某些现象的一个抽象模式,该模式是通过定义了这些现象的相关概念形成的”。
使用最广泛的本体定义是波音公司Michael Uschold博士等在1996年提出的:“It is a v ocabulary of terms and s ome specification of their meaning1“译为中文,即本体是一套术语词表以及术语含义的规范说明【12】。
图书情报领域应用的本体概念等同于AI领域, AI领域的文献中有许多关于本体的定义,其中很多大同小异。斯坦福大学的Natalya F1N oy和Debo2 rah L1McG uinness认为,一个本体其实就是一套关于某一领域概念的规范而清晰的描述,它包括类(classes,有时也被称作概念concepts),每一个概念的属性(properties)描述了有关概念的各种特征和属性(又称slots,有时也被称为roles或attributes),还有属性的限制条件(restrictions,即分面facets,有时也被称作role restrictions或constraints)。一个完整的本体还要包括一系列与某个类相关的实例(instances),这些实例组成了一个知识库(K B-K nowledge Base)。事实上,在本体的终点和知识库的起点之间,有一条非常明确的界限。类是本体结构的核心,它代表了某一领域的概念集合【13】。
我国一些学者也做了许多关于Ontology定义的研究。中国社会科学院哲学研究所的杨学功先生在Ontology的研究方面,有自己独到的见解。他认为,“作为一种特殊的哲学理论形态,Ontology是以追求终极实在为依归,依奠定知识基础为任务,以达到终极解释为目标的哲学”【4】。
中国图书情报学界和AI研究领域,对于“on2 tology”的概念也有多种不同的理解。张晓林博士在《描述知识组织体系的元数据》一文中认为“ontology”是“概念集”。他提到:“所谓概念集(Ontologies),指特定领域公认的关于该领域的对象(实际对象和逻辑对象)及其关系的概念化表述,包含以下部分:本领域对象类的等级体系;对象类的属性及属性取值限制;语义关系体系,即对象类之间的逻辑关系体系;关于对象类及语义关系的推理规则。概念集通过一个标记语言标记后成为显性知识,可在信息系统中表征和交换知识,并可被代理系统自动解析和识别【14】。
浙江大学人工智能研究所的刘柏嵩先生和高济教授在《基于RDF的异构信息语义集成研究》一文中使用了“概念模型(C M———C onceptual M od2 el)”的称谓。他们说:“C M由一个类(概念)层次和类属性以及一组符合有关类或其属性的公理的规则组成。因此通过在检索到的事实组上应用这些规则,可能推理出新的事实。规则可用F-LOGIC 来表达,……基于可伸缩性的原因,为所有可能应用维护一个全局C M(本体)不可取。”按照他们的表述,C M实际上就是本体【15】。
武汉大学的张玉峰教授等在《动态约束性概念
059情 报 科 学 25卷