本体构建方法比较研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

作者简介 : 杜文华 , 女 , 1976 年生 , 讲师 , 博士 , 研究方向为信息系统、 语义网。
24
情报杂志 2005 年第 10 期
必须定义在什么条件下这些问题的解决方 案是完备的。 4 METHONTOLOGY MET HONTOLOGY 法专用于构 建化 学本体( 有关化学元素周期表的本体 ) , 该 方法已被马德里大学理工分校人工智能图 书馆采用。它的流程包括: a. 管理阶段。这 一阶段的系统规划包括任务的进展情况、 需要的资源、 如何保证质量等问题。 b. 开 发阶段。分为规范说明、 概念化、 形式化、 执行以及维护五个步骤。c. 维护阶段。包 括知识获取、 系统集成、 评价、 文档说明、 配 置管理五个步骤。 目前 , 用这种方法开发的本体有: ( On to) 2Agent 是基于本体的 Web 代理, 使用参 考本体作为知识源, 在一定的约束条件下 进行新知识获取的工具; 化学本体是基于 本体的化学教育代理, 允许学生在学习的 基础上自测本身在该专业领域内所达到的 水平; Ontogeneration 使用化学领域本体和 语言本体来生成西班牙语的描述, 并把这 些描述作为对学生关于化学领域问题查询 的答案。 5 KACTUS KACTU S 工程法是基于 KACTUS 项 目而产生的。KACTU S 是 关于多用途复 杂技术系统的知识建模 工程英文的缩写, 是欧洲 ESPRIT 框架下的研发项目之一。 该项目的目的是开发出技术系统全生命周 期的知识重用方法学 , 以便在设计、 诊断、 操作、 维护、 再设计和培训时使用同一知识 库。该方法主要包括 : a. 应用说明。提供应 用的上下文和应用模型所需的组件。b. 相 关本体范畴的初步设计。搜索已存在的本 体, 进行提炼、 扩充。 c. 本体的构造。用最 小关联原则来确保模型既相互依赖, 又尽 可能一致 , 以达到最大限度的系统同构。 6 SENSUS SE NSUS 法是开发用于自然语言处理 的 SENSU S 语言本体的方法, 由美国 U SC/ ISI 研制开发。IS I 自然语言研究小组旨在 为机器翻译提供广泛的概念结构。S EN SU S 为机器翻译提供概念结构, 用该方法 开发的 S ENSUS 本体系统用于自然语言处 理程序。目前 SENS US 语言本体共包括电 子科学领域的 7 万概念。为了能在 S EN SU S 基础上构造特定领域的本体, 必须把 不相关的术语从中剪除。 SENSU S 本体的 构造流程如下: a. 定义 叶子 术语; b. 用手 工方法把叶子术语和 SENS US 术语相连; c. 找出叶子节点到 SENSU S 根节点的 路 径 ; d. 增加和 SENSU S 本体中的域相关但 是还未出现在 SENSU S 本体中的概念 ; e. 用启发式思维找出全部特定域的术语: 某 些有两条以上的路经过的节点必是一棵子 树的父节点, 那么这棵子树上的所有节点 都和该域相关, 是要增加的术语。对于高 层节点则通常有多条路径经过。 现在, 使用 SE NSUS 法所构建的本体 包括武器、 原油、 飞机等用于军事领域的本 体。 7 七步法
参 考 文 献 1 2 陈禹主编 IDE F 建模 分析与设 计方法 清华大学出版社, 1999 M. U schold. Ontologies Principles, M ethods and Applications. 1996; 11( 2) 3 Gruninger M. , Fox M. S. M et hodology fo r the Desig n and Evaluat ion of Ontologies, Workshop on B asic Ontolog ical Issues in K now ledge Sharing, IJCAI- 95. Montreal, 1995 4 Fernandez, M . , Gomez- perez, A. and Juristo, N. Methontology: From Ontological Art To wards Ontolog ical Engineering, AAAI- 97 Spring Sym posium on Onto log ical Eng ineering . Stanford U ni versit y, March 24- 26th, 1997 ( 责编: 钧加勃) Know ledge Eng ineering Review , 北京:
!情报方法!
周期; b . 在 相 关 技 术 方 面 , 七 步 法 有 , M ETHONTOLOGY 法有, 但不全, 其 它方 法则不确定; c. 在本体的应用方面, T OVE 法、 骨架 法和 KACTU S 法只 应用于一 个 域 , 其它方法则用于多个域; d. 在方法的细 节文献方面, T OVE 法少, 骨架法和 KAC TU S 法很少, 其它方法则详细。 由以上两个比较结论不难看出: a. 与 IE EE 标准相比较, 没有一种方法是完全成 熟的 ; b. 七种方法均允许在系统间进行互 操作; c. 七种方法均提供知识共享和复用的 机 制; d. 七 种 方 法 的 成 熟 度 依 次 为: M ETHONTOLOGY 法> IDEF5 法> T OVE 法 > 骨架法 > SENSU S 法> KACT US 法。 综合上述方法, 可以从中总结出本体 的构建原则 : a. 本体的构建要面向特定的应 用目的; b. 本体的构建应该基于一定的专 业领域、 学科背景或研究课题; c. 本体中包 含的概念数目应该尽可能的最小化、 尽可 能将冗余去除 ; d. 本体的规模应该是有限 增长的; e. 本体中的 类 的设计应当秉承独 立性原则 , 即这个类可以独立存在, 不依赖 于某个课题或某个学科专业; f. 类的设计还 应当秉承共享性原则, 即类一旦被确定, 就 一定有被复用的可能和必要。 事实上, 对于构建一个真正的本体来 说 , 并没有一种唯一的途径或方法。对于 任何专业学科领域, 都不存在某一种唯一 适合的途径或模式, 可能存在好几种方法 都是可行的。最佳的方法依赖于本体的构 建者所采用的应用软件以及可以预见的扩 展功能。同时 , 本体的开发和完善是一个 反复叠加的过程, 不会一蹴而就。无论从 客观世界具体对象的角度出发, 还是从抽 象的角度出发 , 本体中概念的设计应贴近 专业领域、 客观对象和对象间的关系法则。
关键词
构建本体的方法是当前本体研究中的 热点问题。由于本体的构建多是面向特定 领域, 如果没有好的方法路线指导, 就难以 在不同领域本体的构建中保持一致, 也不 利于本体的规模化和规范建设。因此, 关 于本体构建方法的研究对于本体的应用有 至关重要的作用。 目前的本体构建方法都不是经权威标 准化机构认证的方法。 M. Ush old ( 1996) 试 图制定出一套构建本体的方法, 但正如他 在文章中指出的 , 他们并不是要给出一套 规范性的指南, 只是要表示这种方法在他 们的研究环境下能很好地发挥作用。 K. M ahesh 和 Batem an 都给出了各自的本体构 建原则, 这些原则都是研究人员在各自的 系统开发经验之上提出的。实际上, 几乎 每一个系统的开发都会导致一些不同的本 体构建方案产生。 出于对各自学科领域和具体工程的不 同考虑, 构建本体的过程各不相同。目前 还没有一套标准的本体构建方法。一般认 为, Gruber 在 1995 年提出的 5 条规则是比 较有影响的: a. 明确性和客观性。本体应该 用自然语言对术语给出明确客观的语义定 义。b. 完整性。所给出的定义是完整的, 能表达特定术语的含义。c. 一致性。知识 推理产生的结论与术语本身的含义不会产 生矛盾。d. 最大单向可扩展性。向本体中 添加通用或专用的术语时, 通常不需要修 改已有的内容。 e. 最少约束。对待建模对 象应该尽可能少列出限定约束条件。 目前大家公认在构建领域本体的过程 中, 需要领域专家的参与和协作。 下面就目前几种主要的本体构建方法 予以介绍 , 然后给出比较分析结论。 1 IDEF5 IDEF 的概念是在 20 世纪 70 年代提出
!情报方法!
Hale Waihona Puke Journal of Information No. 10, 2005
本体构建方法比较研究
杜 文 华
( 中南民族大学 摘 要 武汉 430074)
介绍了七种主要的本体构建方法 , 并将七种方法与 IEEE 标准 相比较 , 总结出本体构建的原则 。 本体 本体构建 IEEE 标准
的 , 它在结构化分析方法的基础上发展起 来的。1981 年美国空军公布的 ICAM ( In tegrated Com pu ter Aided Manu facturing) 工程 中首次用了名为 IDEF 的方法。 IDEF 是 ICAM DE Finition M ethod 的缩写, 到目前为 止它已经发展成为一个系列。 IDE F5 提出 的本体建设方法包括以下五个步骤: a. 组 织和范围。确定本体建设项目的目标、 观 点和语境 , 并为组员分配角色。b. 数据收 集。收集本体建设需要的原始数据。c. 数 据分析。分析数据, 为抽取本体做准备。d. 初始化的本体建立。从收集的数据当中建 立一个初步的本体。e. 本体的精炼与确认。 完成本体建设过程。 IDE F5 方 法提供了 一种结 构化的 方 法 , 利用该方法 , 领域专家可以有效地开发 和维护领域本体。 IDEF 构建本体的方法 在于获取现实世界客观对象的定义, 以及 它们的属性和它们之间的内在联系。 2 骨架法 Mike U shold & M icheal Gruninger 的骨 架法 ( Skeletal Methodology) 在企 业本体基 础之上, 是相关商业企业间术语和定义的 集合, 该方法只提供开发本体的指导方针。 包括如下步骤: a. 确定本体应用的目的和 范围。根据所研究的领域 , 建立相应的领 域本体。领域越大 , 所建本体越大, 因此需 要限制本体的领域范围。 b. 本体分析。定 义本体内所有术语的意义及术语之间的关 系 , 对该领域了解得越多, 所建本体就越完 善。c. 本体表示。一般用语义模型表示本 体。d. 本体的评价。建立本体的评价标准 是清晰性、 一致性、 完善性、 可扩展性。清 晰性就是本体中的术语应被无歧义的 定 义 ; 一致性是指术语之间关系逻辑上应一 致 ; 完整性是指本体的概念及关系应是完 整的, 包括该领域内所有概念, 虽然很难达 到 , 但应不断完善; 可扩展性是指本体应用 能够扩展, 在该领域发展过程中能加入新 的概念。e. 本体的建立。对所有本体按上 述标准进行检验, 符合要求的以文件形式 存放 , 否则重新进行本体分析。如此循环 往复 , 直到对所有步骤的检验结果均达到 要求为止。 3 TOVE 法 Mich eal Grun inger & Mark. S Fox 的企 业建模法( T OVE) 用于 TOVE 项目中, 该项 目是多伦多大学 E IL 实验室 ( Enterprise In tegration Laboratory) 的一个项目, 它的目标 是建立一套为商业和公共企业建模的集成 本体 , 并且已经建成了相关本体。作为该 项目的一部分 , 他们设计了一套创建和评 价 本 体 的方 法 Enterprise Modelling M ethodology 。该方法主要分为以下步骤: a. 激发场景。应用领域的某些场景可以激 发本体的建设 , 因此 , 给出一个场景有助于 理解建设本体的动机。b. 非形式化的能力 问题。提出一个本体应该能够回答的各种 问题。通过指明能力问题和场景之间的关 系 , 可以对新扩展的本体进行一定的非形 式化的判断。这也是一种初始的评价, 来 判断是否需要扩展本体, 或者现有本体是 不是已经可以涵盖所提出的非形式 化问 题。 c. 术语的规范化。从非形式化能力问 题中提取非形式化的术语, 然后用 Ontology 形式化语言进行定义。d. 形式化的能力问 题。把非形式化的能力问题用形式化的术 语定义出来。e. 形式化公理。本体中的公 理指定了术语的定义以及约束。将公理用 一阶谓词逻辑表示出来, 这只是本体的规 格说明, 并不是本体的实现。f. 完备性定 理。当能力问题都被形式化的表述之后,
相关文档
最新文档