网格环境下基于本体的知识库模型研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第51卷第5期 2005年10月武汉大学学报(理学版)
J.Wuhan Univ.(Nat.Sci.Ed.)Vol.51No.5 Oct.2005,603~608
收稿日期:2004211210 通讯联系人 E 2mail :chenhr @
基金项目:湖北省教育厅科学研究计划(2003A012);湖北省自然科学基金(2003ABA049)资助项目作者简介:黄 屹(19692),男,博士生,现从事分布式系统与分布式流媒体等研究. E 2mail :huangyi @
文章编号:167128836(2005)0520603206
网格环境下基于本体的知识库模型研究
黄 屹1,顾进广1,2,陈莘萌1 ,陈和平3
(1.武汉大学计算机学院,湖北武汉430072;2.武汉科技大学计算机科学与技术学院,湖北武汉430081;
3.武汉科技大学信息科学与工程学院,湖北武汉430081)
摘 要:针对知识技术仅用于描述网格服务的可用性以及如何被发现、调度和进化的现状,在开放网格服务体系结构(O GSA )的基础上,给出了知识库本体的形式化定义,分析了构建知识库所需的本体,在此基础上提出了网格环境下知识库通用体系结构及基于语义适配器的存储模型,克服了Sesame 存储模型在存储不同格式文件和本体方面所存在的不足,讨论了网格知识库的访问机制.
关 键 词:知识库;开放网格服务体系结构;知识网格;本体中图分类号:TP 391 文献标识码:A
0
引 言 网格[1]作为分布式环境下资源共享与协作计算
的集成基础设施,网格正受到越来越多的关注.网格应用涉及海量数据与密集计算,对目前的互联网和网络基础设施而言是一个极大的挑战,网格中间件正试图在通信、调度、安全、信息、数据访问和错误检测等多个领域迎接挑战.开放网格服务体系结构(O GSA )[1,2]借助Web service 成果,在网格中引入了服务定位.网格服务是Web service 的集合,它遵守一组控制、差错恢复和安全管理协定,并通过标准接口提供服务.知识网格[3]使用知识本体来描述网格资源,是网格和语义网络的一种演变.V EGA 2KG (http :// )[4,5]和PD KD [6,7]是该方面研究的典型范例.
然而,目前关于知识和网格的研究主要集中在使用知识技术来描述网格服务的可用性,描述它们是如何被发现、调用和进化的,并且从服务描述和网络元素中获取知识.相反,网格上的知识却很少讨论.本文提出了一种网格知识应用———在网格的分布式节点上存储知识,使用网格与知识网格的基本概念如面向服务的中间件,网格的知识技术,基于本体的知识表示机制等等,来描述分布式知识库节点的资源处理能力.
作为词汇集和概念关系的形式化说明方法,知
识本体在语义网和知识网格中发挥重要作用.知识本体为确定领域中的应用提供共享概念,减少或消除多个概念和术语之间的混淆,使领域知识的处理更加精确和方便.使用DAML +OIL 等描述逻辑语言来表示基于本体的知识,DAML +OIL 采用一种面向对象的方法进行建模,一个领域通常用类和特性来表示,它在RDF (Resource Description Framework )的基础上进行了扩充,丰富了语言的建模能力.用类Horn 逻辑语言如TRIPL EI [8]表示知识规则.
1 知识库的本体定义
本体的主要目的是提供一种通用的方法,通过该方法,多个应用程序及使用者可以采用通用的方式来理解所涉及的领域知识及概念,达到重用资源的目的.通常用类、关系、函数、定理、实例的集合表示本体,文献[9]中给出了本体、关系、定理和词典的定义,本文在其基础上对本体进行扩充.
定义1 本体O 可用一个八元组来表示,O ∶=(C ,R ,A C ,A R ,≤C ,≤R ,σ,L ),其中,①C 和R 为两个集合,分别表示概念集合和关系集合;②A C ,A R 是两个属性集合容器,分别代表概念属性的集合容器和关系属性的集合容器,容器的每一个元素代表
武汉大学学报(理学版)第51卷
一个概念或关系的属性集合;③≤C是作用于C上的偏序关系,称为概念层次;④≤R是一个作用于R 上的偏序关系,称为关系层次,对于1≤i≤|σ(r1)|,如果r1≤R r2意味着|σ(r1)|=|σ(r2)|而且π
i
(σ(R1))≤Rπi(σ(R2));⑤函数σ:R→C+;⑥假设L为一逻辑语言,本体O的L2axiom系统是一个二元组A∶=(I A,α),其中I A是一个集合,它的元素被称为公理标识,α是公理实例;在本文的系统中,采用类似于TRIPL E风格的逻辑语言表示公理.
在构建知识库的过程中,需要建立以下本体. 1.1 领域本体
领域本体是构建知识库最重要的本体,它通常用类和属性来描述保存于知识库各节点中的知识的概念模型.通常,按以下几个步骤来构建领域本体: Step1 确定目标和范围:定义本体的领域和范围是本阶段最关键的工作.定义包含本体的规范,用途,应用场景,描述特征和粒度的术语集.
Step2 构建本体,可以细分为3个步骤.(a)本体获取:包括知识获取,与阶段1的需求相交互.(b)本体编码:以一种概念模型来组织领域知识.(c)集成现有本体:通过重用现有本体可以加速本体的开发过程.
Step3 评估:本体的确认和评价.
Step4 每个阶段的指导.
在Step2(a)和(b)阶段,采用自顶向下法来构造本体.
首先识别关键的概念和属性.一个非常有用的办法是将这些术语写成一列,用术语造句或者写出它们的解释,以说明这些术语及其属性.自顶向下的开发过程从定义领域中的最通用的概念出发,定义这些概念所采用的说明.一旦完成基本概念的定义,必须用属性来描述它们的内部结构.
其次通过分类关系来定义概念的层次.分类通过单重/多重继承来组织领域中的本体知识.一类是特殊/一般(“is2a”)关系,“is2a”关系说明,如果类A 中的每个实例同时也是类B的一个实例,那么A是B的一个子类.另一类是is2part2of关系,它定义了一个类的子类构成.
开发过程的第3步是公理的构造.公理提供一种方法以表示概念的更多信息,例如内部结构的限制,它们的相互关系,正确性校验和新信息的推理.
在Step2(c),采用自底向上的方法从现有本体中抽取一个新的本体.
1.2 资源本体
在网格环境下,客户获取知识的请求可能在某个节点得不到满足,而被转送到其他的网格节点执行.网格如何知道该节点能否提供客户所需要的服务呢?MDS(Montoring and Discovery Services)服务发现机制是必需的.传统的服务与资源发现和匹配是在对称的、基于属性匹配的基础上完成.在本文的系统中,使用资源本体来定义资源与知识库节点服务,在请求者和提供者之间进行一种有目的的比较,使得资源发现与匹配服务更加高效.
资源本体使用DAML+OIL语言来描述知识库节点所能提供的资源和服务.资源本体能够描述下面的信息:
●节点上的操作系统与版本;
●节点上内存与磁盘信息;
●IP地址及安全级;
●网格环境下节点的角色;
●能够向用户提供何种知识;
●提供它所拥有的知识的视图服务?
●节点能够提供的其他服务.
系统还使用基于规则的公理如TRIPL E来表示一些背景知识以及服务和资源的限制.
1.3 层次本体
在同一知识库节点上保存相同领域的知识是一个较好的选择,它意味着在同一个局域网的单一服务器或服务器对等节点上保存同一领域的知识.当请求者在网格上查询时,如何发现所需的知识呢?在此问题的推动下,有必要在不同的知识库节点上维护一个分类类别.层次本体的一个作用是表示知识库节点上的知识以及不同节点间关系的背景知识;另一个重要作用是维护节点存储的语义背景知识.
2 知识库通用体系结构
2.1 知识库的形式化定义
定义2 知识库可以用一个五元组来表示,K B ∶=(C KB,R KB,I,l C,l R),其中①C KB和R KB是两个集合;集合C KB的元素被称为实例标识符或实例; R KB的元素为知识库的关系实例;②被称为概念实例的函数l C:C KB→R(I);③被称为关系实例的函数l R:R KB→R(I+).
定义3 知识库K B的实例词典可以用一个二元组来表示,I L∶=(S I,R I),其中①集合S I中的元素被称作实例标识;②关系R IΑS I×I被称为实例词典参考.带有词典的知识库是一个二元组(K B, I L),K B是一个知识库,I L是K B的一个实例词典.
406