本体的简单介绍

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

22
4 基于本体的移动Agent通信模型
• 随着计算机网络尤其是互联网的迅速发展,Agent技术成为 人工智能领域的一个研究热点。 Agent的提出:传统的计算系统是封闭的,需要满足一致性 的要求,然而社会机制是开放的,不能满足一致性条件, 这种机制下的部分个体在矛盾的情况下,需要通过某种协 商机制达成一个可接受的解。Minsky将计算社会中的这 种个体称为Agent。这些个体的有机组合则构成计算社 会——多Agent系统。 Agent的定义:Agent是指驻留在某一环境下,能持续自主 地发挥作用,具备驻留性、反应性、社会性、主动性等特 征的计算实体。
5
1 本体(Ontology)的概述
• Ontology的建模元语(又称为ontology的组成部分): 类:又称为概念,可以指任何事物。类通常由分类来 进行组织,分类是通过具体化和一般化关系来组织本 体中的知识,通过分类,可以进行单一的和多重的继 承。 关系:代表了在领域中概念之间的交互作用 函数:一组特殊的关系,在这种关系中,前n-1个元素 可以唯一的决定第n个元素 公理:代表永断真言。人们用公理对永真的句子进行 建模,其目的是为了限制信息,验证信息正确性以及 推导出新的信息 实例:即元素,是领域中的和某个特定的类关联在一 起的元素(在类中生成实例)
14
3 本体的异构问题
• 在分布式环境中,信息的表示是结构化的,本体可以用来 描述信息的语义。随着web中信息量的增多,本体的数量 也越来越多,并且单个本体不能充分完成目标任务,必须 联合多个本体完成任务。但是,由于本体到目前为止没有 一个统一的标准和规范,因此会因存在创建者不同、使用 的建模方法不同或同一领域内参与的专家不同等原因,使 得当需要多个本体协助工作时出现本体异构问题。 • 异构的本体是不能进行互操作的,但实际中存在很多需要 联合多个本体完成的任务,因此必须解决本体的互操作问 题,也就是本体的异构问题。而本体映射便是解决本体异 构问题的手段之一,其目的是找到不同本体之间的语义联 系
• 本体的获取,可采用循环获取法或DEF-5方法。其中前一 种是从文本中抽取领域本体的方法,采用的是一种环状结 构的开发思路,类似于软件工程中的原型法思想,即先初 步成型再不断改进;后一种方法是一种本体描述获取的方 法 • 本体的重用,可采用基于领域知识重用的虚拟领域本体构 造方法,该方法主要采用本体语义相关度匹配的办法来搜 索和匹配本体,并通过结合手工交互操作与系统自动分析 来实现 • 本体构建工具:现在有大量的本体构建工具存在,它们各 有优点和缺点,能力参差不齐。如:ontosaurus、 ontolingua、OLEd、protégé、ontoEdit等。
10
百度文库
2 本体的构建
• • 举例:构建旅游信息资源本体 过程: ① 确定旅游信息资源本体领域和范畴 ② 列举旅游信息资源本体中的重要术语、概念 ③ 建立旅游信息资源本体框架 ④ 定义类和类的层次体系 ⑤ 定义类的属性及其取值类型 ⑥ 对领域本体编码、形式化
11
2 本体的构建
• 确定本体范围和术语:明确领域本体的目的、范围、表 示方法、用途等,得到目标本体的主要轮廓,最终生成 本体开发目的和详细说明书。 旅游信息本体中重要术语与概念为:人、组织机构、景 区、旅游路线、交通方式、食宿、行程、地理位置、特 产、娱乐活动、民族风情、旅行社、景区管理机构、交 通运输企业、食宿企业、旅游局、保险公司、特产企业、 娱乐企业、水文景观、地文景观、人文景观、历史遗产、 国家非物质文化遗产、全程路线、地接线路……
特产
娱乐活动
民族风情
13
2 本体的构建
• 定义类的属性 由于每个类的属性较多,原则是根据需求来定义该领域 类的属性。如在旅游信息资源本体中,游客及景区的 属性表示为: 游客(姓名,性别,身份证,年龄,旅游类别,爱好, 电话,邮箱) 景区(名称,景点等级,管理机构,景点类别,地址, 容纳人数,服务电话) • 生成本体 通过利用上述信息,结合本体构建的工具,就可以建立 起一个旅游信息资源本体库
23
4 基于本体的移动Agent通信模型
• 移动Agent:是Agent技术中的一个重要的组成部分,它是一 种特殊的Agent,除了具有Agent的基本属性以外,移动性是其 最重要的特点,它可以在异构的网络环境中从一台机器通过网 络移动到另外一台机器上运行,并可以与其他Agent或资源交 互,完成指定任务,是一个自治实体 • 移动Agent系统的通信通常工作于一种较为复杂的,难以预 测的计算环境中(如自知、异构、高度动态的开发网络环 境)。由于移动Agent通信技术是移动Agent系统中的一个关 键技术,因此需要构建正确、可靠、健壮的移动Agent通信 的系统环境 • 本体技术由于能够有效的实现共享、重用和互操作问题,因 此能够应用于移动Agent系统中,解决移动Agent通信中遇到 的部分关键问题
4
1 本体(Ontology)的概述
• 随着研究的不断深入,研究人员最终将Gruber提出的定义 扩展为:“ontology是共享概念模型的明确的形式化规范 说明”。在这个定义中包含了四层含义: 概念模型:指通过抽象出客观世界中一些现象的相关 概念而得到的模型。概念模型所表现的含义独立于具 体的环境状态 明确:指所使用的概念及使用这些概念的约束都有明 确的定义 形式化:指ontology是计算机可读的,即能被计算机处 理的 共享:指ontology中体现的是共同认可的知识,反应的 是相关领域中公认的概念集
8
2 本体的构建
• 在这些方法中,若要了解本体构建的一个完整的过程, 骨架法在所有方法中最具参考性,它提供了一个本体构 建的方法学框架。骨架法的步骤: ① 确定构建本体的目的和范围 ② 构建本体,包括本体获取、本体编码和本体重用 ③ 本体评估 ④ 文档化 ⑤ 做出各阶段的指导方针
9
2 本体的构建
18
3 本体的异构问题
• 映射:根据映射函数,输出映射表,表中每一项对应一个 映射关系。每一项包含四个元素集合:原本体O1中的元素 集合{ei1},目标本体O2中的元素集合{ei2},元素对应的关 系以及关系的相似度数值 • 映射迭代:将所得到的相似度数值进行迭代运行,得到候 选映射的综合预测值
19

12
父类
子类
子子类
旅行社
2 本体的构建
定义类和类的层次结构: 类用于描述抽象的实体对 象,代表着一类具有共性 的实例对象;类具有继承 性并以层次结构的形式组 织。定义类的层次采用自 顶向下的方法,其中顶为 父类。 • 部分旅游信息资源本体类 层次结构如图:

旅游信息
游客 旅游局 组织机构 景区管理 景区 „„ 旅游路线 汽车 交通方式 飞机 食宿 火车 行程 „„ 地理位置
6
1 本体(Ontology)的概述
• Ontology的描述语言 在具体应用中,ontology的表示方式可以是多种多样的, 按照表示和描述的形式化程度不同,可以分为:非形 式化的、半非形式化的、半形式化的以及形式化的语 言。本体论的形式化程度越高,越有利于计算机进行 自动处理。 几个主要的语义web ①的本体描述语言有:OIL、 DAML+OIL、OWL等。其中OWL(ontology web language)是W3C(万维网联盟World Wide Web Consortiu)规定的国际通用的标准本体描述语言。
①语义web :就是建立在一定标准语言基础上的,对web上的数据进行的一种抽象的 表示。它的目标是使得web上的信息具有计算机可以理解的语义,满足智能软件代 理(Agent)对WWW上异构和分布信息的有效访问和搜索。
7
2 本体的构建
• 由于本体构建的方法学还没有成熟的理论指导,而目前的 本体构建方法都是针对具体的项目提出,因而导致了各种 本体构建方法的提出。例如: 骨架法、企业建模法、循环获取法、methontology、 DEF-5、Bernerasetal方法、基于领域知识重用的虚拟 领域本体构建方法等
本体的简单介绍
郑晓洁 201130310067
主要内容
• • • • 本体(Ontology)的概述 本体的构建 本体的异构问题 本体的应用:基于本体的移动Agent通信模 型 • 总结
2
前言
• 近些年来 ,随着计算机应用需求的不断增强 ,计算机科学与 技术的发展不断变化着。然而在这种快速发展的同时 ,也 面临着种种的困难。主要的困难包括:知识的表示、信息 的组织、软件的复用等。特别是由于因特网的快速发展 , 面对信息的海洋 ,如何组织、管理和维护海量信息并为用 户提供有效的服务也就成为一项重要而迫切的研究课题。 为了适应这些要求 ,Ontology作为一种能在语义和知识层 次上描述信息系统的概念模型建模工具 ,自被提出以来就 引起了众多科研人员的关注 ,并在计算机的许多领域得到 了广泛的应用 ,如知识工程、 数字图书、软件复用、信息 检索和 Web上异构信息的处理、 语义 Web等。
15
3 本体的异构问题
• 所谓本体映射,是指有两个本体A、B,对于本体A中的每 个概念试图在本体B中找到一个语义相同或相近的对应概 念,对于本体B中的每个概念也是如此。因而本体映射的 最重要的过程就是发现语义关联 • 目前,对于本体间的映射研究是从本体本身的定义出发的, 本体的映射类型有:概念-概念、属性-概念、属性-属性等 • 本体映射函数的形式化定义如下: map:O1→O2; 如果sim(ei1,ei2)>th,则map(ei1)=ei2 其中,th是阈值,ei1∈O1, ei2 ∈ O2。即当ei1和 ei2相似度 大于某一阈值th时,认为两者之间存在映射关系
3
1 本体(Ontology)的概述
• Ontology的定义 Ontology最初是一个哲学的概念,从哲学的范畴来看, ontology是对客观存在的一个系统的解释和说明,关心 的是客观现实的抽象本质。 之后,Neches等人将ontology引入到了分布式人工智 能(AI)领域,并将其定义为“给出相关领域词汇的基 本术语和关系,以及利用这些术语和关系构成的 规定 这些词汇的 规则的 定义”。 现在ontology的一个最为流行的定义是由Gruber提出的, 即“ontology是概念模型的明确的规范说明”。
16
3 本体的异构问题
• 本体映射模型框架: 输入两个异构的本体,本体映射系统的任务是建立原本 体到目标本体的映射关系。映射过程是一个迭代的过 程,如图所示:
本体
映射迭代 映射
特 征 提 取
用 户 交 互
相 似 度 计 算
映 射 发 现
17
3 本体的异构问题
• 特征提取:解析本体文档,提取出本体词汇(包括概念、 属性、关系等) • 用户交互过程:这是一个可选过程。用户可以通过这个过 程在自动映射之前预先指定一个或多个映射关系,也可以 在映射自动发现之后纠正本体映射系统发现的错误映射, 或者创建遗漏的映射关系。 • 相似度计算:根据概念与属性相似度计算的不同,采用不 同的计算方法:前者考虑从名称、属性、结构和实例四个 方面入手;后者仅从名称、定义域和值域三个方面匹配来 确定其相似度 • 映射发现:此过程基于迭代后的相似度值进行,根据某种 选择策略并结合本体的约束和上下文关系等选择本体间元 素的最优映射关系
21
3 本体的异构问题
• 常用的语义相似度和相关度计算方法 根据世界知识计算的方法:此方法需要计算概念语义 距离。该方法是利用一部同义词词典,同义词词典都 是将所有的词组织在一棵或几棵树状的层次结构中, 一棵树中任何两个结点之间有且只有一条路径,此时 这条路径的长度就可以作为两个概念的语义距离的一 种度量,长度越短,则两个语义越相似 大规模语料库统计的方法:以大规模的语料库为基础, 用统计的方法计算概念之间的语义相关度。
3 本体的异构问题
• 常用的本体映射方法有: 基于语法的映射、基于概念实例的映射、基于概念定义 的映射、基于概念结构的映射、基于规则的映射、基 于统计学的映射、基于机器学习的映射。这里每种方 法参照了本体定义的不同部分
20
3 本体的异构问题
• 概念语义的相似度和相关度 语义的相似度,就是两个概念在不同的上下文中可以 互相交换使用而不改变文本中的句法语义结构的程度。 两个词语如果在不同的上下文中可以互相替换且不改 变文本的句法语义结构的可能性越大,二者的相似度 就越高,否则越低 语义的相关度,反映的是两个概念相互关联的程度, 可以用这两个概念在同一个语境中共同出现的可能性 来衡量
相关文档
最新文档