基于本体论的知识获取

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

本体论知识获取实例分析
用户兴趣模型的表示方法有很多种,如:主题表示法、关键词列表表示法,但这些 方法的一个共同的特点就是结构松散,没有反映兴趣概念间的关系。 如果利用本体论 的思想来组织表示用户兴趣的一组关键词, 那么用户在进行信息查询时, 系统在用户 兴趣模型中的匹配就不再是单纯的关键词匹配, 而是把词与词之间的各种关系也考虑 进来了,这样就能有效地提高检索系统的检索质量,甚至发现用户的潜在兴趣
基于本体的知识检索特征

检索结果综合
这里的检索结果综合有双重含义,既可以表示同一系统下的综合也可以是多系统间的 协作,但考虑到不用系统数据库结构的差异,多系统下的综合具有很大的难度。如果在相 同领域下使用同一本体进行开发,就可以解决数据库异构的问题,也可以将不同服务商联 系起来,使用户得到的知识更加全面。如查询“李宁跑步鞋”,返回的信息就可能不仅包 括李宁跑步鞋的款式图片,还有这种鞋的口碑、制造工艺、相关明星故事等等。
本体的构建方法
本体构建方法是当前研究的热点,国内外研究者总结了一些本体构建 方法,比较著名的有:七步法、骨架法、METHONTOLOGY、TOVE法等 方法。下面介绍最常用的骨架法:
关于本体论的个人理解




本体就是用详细的描述方法定义出来的概念或者概念体系。事实上,人工智能建立本 体的过程就是一个定义概念的过程,只是它与我们平时定义概念的方法恰恰相反而已。通 常情况下,我们都是先对事物进行高度的抽象和概括,然后用抽象出来所谓的本质属性来 定义概念的。 比如说“羊”这个概念,我们忽略了羊长着一只头、两只角、四只蹄子、一身毛、会 吃草、喝水、叫唤等等具体属性,而把它定义为“一种哺乳动物”。而人工智能建构本体 的方法却恰恰与此相反,它要做的不是对事物进行抽象,而是对抽象的概念进行详细的描 述,把抽象的概念还原成具体的东西,把“一种哺乳动物”的羊,描述成一只长着一只头、 两只角、四只蹄子、一身毛,吃草、喝水、会叫唤……的羊。 要想真正理解这一点,我们就得知道人和机器分别是怎样理解概念的。我们知道,每 个概念都代表着现实中的某个事物。通常情况下,我们并不是根据概念的定义来理解事物 的,我们对一个事物的理解是基于对该事物的大量的知识的。比如说,我们知道一只羊是 什么,这并不是因为我们知道它的定义是“一种哺乳动物”。而是因为我们知道,它长着 一只头、两只角、四只蹄子、一身毛,它吃草、喝水、会叫唤……。但是,对于计算机来 说,它并不具备关于羊的这么多的知识,它只能是根据羊的定义来理解什么是羊。而问题 恰恰就出现在这里,我们输入到计算机里的就是那种经过高度抽象和概括的概念,而仅靠 概念的定义,计算机是根本不可能理解什么是羊的,难道“一种哺乳动物”就是羊么?为 了能让计算机能够真正“理解”什么是羊,没有办法,人们只有对抽象的概念再进行还原, 把羊的各种属性重新添加到“羊”这一概念中。这样描述出来的概念就叫做本体。 人工智能的本体论,就是建立本体的那一整套方法。它是通过头、角、蹄子等等概念 与羊之间的关系来说明什么是羊的。
比如,在一个基于本体论的用户 兴趣模型中,用户感兴趣的中医肠道 保健方法的下位类包含有概念词“膏 药”、“按摩”和“针灸”这 3 个概 念词都和“特效穴位”相关,因此 “特效穴位”肯定也是用户的潜在兴 趣概念, 这正是基于本体论的用户 兴趣模型的一个优势。
RDF 是 Resource Description on Framework 的缩写,即资源描述 框架,是万维网联盟(W3C)于 1999 年提出的一组标记语言的技术标 准,以便更丰富地描述和表达网络资源的内容与结构。RDF 将 Web 上 信息的语义内容用元数据(描述数据的数据)清晰表示出来,实现以语 义内容为指导的、具有部分智能化特点的语义化 Web 服务。 RDF框架由三部分组成:① Data Model(数据模型),这是对资 源的形式化描述;②Schema(模式),定义描述资源时所需要的属性 类及其意义特性;③Syntax,把形式描述通过XML 语言转换成机器可以 理解的文件。
什么是知识获取?

“知识获取是人工智能的一项技能。它运用人工智能的原理和方法,为处 理只有具备专家知识才能解决的难题提供便捷途径。恰当运用专家知识 的获取、推理和表达过程中的方法,是设计基于知识系统的重要技术问 题。” ——费根鲍姆

另一表述:专家有针对性地把专家知识从某种知识源(如人类专家、文本、 数据库)中总结和抽取出来,在经过编码和转换,将其以知识的形式储存在 计算机知识库中的过程。
用于问题求解的本 体。通常情况下, 应用本体的构建需 要借助于领域本体 和方法本体,将二 者结合,以包含为 求解特定领域问题 而构建模型时所需 的全部知识。
不同于领域本体, 表示本体并不限定 于任何特定领域, 规定了实体的表示 方式,但不规定表 示的内容。
本体论的应用
人与组织之间的信息交流
软件工程
基于本体伦的信息检索工作原理
从信息检索的一般过程出发,并结合基于本体的知识检索特性,我们可 以将基于本体的知识检索工作原理总结为: (1)针对具体的研究对象,在领域专家帮助下,结合现有的本体资源,建立 基于领域概念的领域知识本体; (2)确定知识源,借助领域本体对知识源内的信息资源进行语义分析与标注, 然后按规定的格式存储在知识库中; (3)对用户输入的检索请求进行解析,形成基于本体的扩展查询式,并根据 具体的知识匹配方法从知识库中匹配出符合条件的初始结果集; (4)初始结果集经过处理后对用户进行可视化的展现。
目前对Ontology概念的统一看法。
本体论的分类
根据本体的描述对象不同,将本体分以下几类:
领域本体 常识本体 应用本体 表示本体
针对特定领域(例如 医学医药等领域), 获取该领域中有用 的知识。
针对常识性知识, 借助于知识获取, 从时间、空间、状 态及事件等角度建 立起有关常识知识 的基本概念,用于 获取有关世界的常 识性知识。

知识定位准确
一词多义多用处的现象很常见,比如“会呼吸的”,既可以是运动鞋性能也可以是生 物描述。传统检索是基于关键词的,停留在语法层面,不能准确把握知识的应用范围,经 常检索出一些无用的信息。以本体作为概念语义分析基础后,就可以缩小范围,准确进行 知识定位,而“会呼吸的”就会因为是基于运动鞋本体而被区分为运动鞋透气性能好的一 种表现。

智能化程度高
在现实生活中,针对同一个知识概念,不同用户检索时使用的查询词汇往往是不相同 的,比如表述“阿迪达斯”这个运动品牌时,一部分人喜欢用全称,而另一部分则倾向于 “阿迪”这个简称,这是因为不同用户的知识结构、检索习惯以及兴趣爱好都是不相同的。 本体包含领域内所有的概念词汇,它可通过词条间的映射关系有效地解决表达差异的问题; 另外,运用本体良好的层次结构关系,可以对概念进行语义扩展,实现用户检索需求的智 能获取。
知识获取的途径

人工知识获取
知识工程师
知识基系统 知识库
领域专家 教科书……

半自动知识获取
知识工程师 知识获取工具
Байду номын сангаас
领域专家 教科书……

知识基系统
知识库
自动知识获取
知识获取工具 知识基系统 知识库
领域专家
知识获取的过程
知识获取是涉及到知识系统构造整个生命周期的一项浩瀚繁杂的系 统工程。一般将知识获取的过程分为如下几步,这几个阶段是不断反 复的过程。 (1)学习某个应用领域 (2)建立目标数据集 (3)数据预处理 (4)数据转换 (5)选定数据挖功能 (6)选定数据挖算法 (7)数据挖掘 (8)解析/评价 (8)知识发现
◆在哲学中的定义——“对世界上客观存在物的系统地描述.” ◆Neches, 1991——“给出构成相关领域词汇的基本术语和关系,以及利用这些术 语和关系构成的规定这些词汇外延规则的定义。”这是 Neches给出的本体论在信息科学中的定义。 ◆Gruber,1993——“概念模型的明确的规范说明” 。 ◆Gruber,1995——“本体论是对概念化的精确描述,用于描述事物的本质。”这 个 定义得到了许多同行的认可 ◆ Borst ,1997——“共享概念模型的形式化规范说明”。 ◆ Studer ——“Ontology是共享概念模型的明确的形式化规范说明。”这也是
基于本体的知识检索特征

具有知识挖掘能力
比如对数字的理解,新词学习等。当nike公司刚刚推出Flywire(飞线科技) 时,一般的电子商务系统是无法将这一技术及时更新进用户查询选择项内的。如 果使用本体作为知识组织方式,就能将Flywire的描述词汇如 “降低鞋内缝线”、 “透气性强”等,对应到本体中的具体概念名,并通过技术推理得出Flywire是 一种运动鞋鞋面设计技术
系统之间的互操作
基于本体的信息检索 基于本体共享的信息访问
基于本体映射的信息访问
本体描述语言
我们可以用自然语言来描述本体,也可以用框架、语义 网络或逻辑语言来描述。目前使用比较广泛的本体构建模语 言有:KIF、Ontolingua、RDF 和 RDFS、PSL、OIL、以及 DAML 和 DAML+OIL 等,本文选用 RDF/RDFS 描述语言, 在此作一简单介绍:
基于本体论的知识获取 研究报告
报 告 人 : 宋玲 报 告 时 间: 2013-10-18 报 告 地 点:计算机院软件实训室
主要内容
1 2 3
本体论概述
知识获取 基于本体论的知识获取 实例分析
4
本体论的定义

本体论(ontology)是哲学概念,它是研究存在的本质的哲学问题。但近几十年里, 这个词被应用到计算机界,并在人工智能、计算机语言以及数据库理论中扮演着 越来越重要的作用。 然而,到目前为止,对于本体论,还没有统一的定义和固 定的定义。
相关文档
最新文档