信息资源组织方法论以及本体方法体系

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

傅雷
Biograph
.........
WK1 hasRelation
Format
“精装”
hasRelation
MN1
1866 .........
hasRelation “平装”
MN2
ST4
inState
MN4
Duration Format
“2 小时”
………
“电影”
手稿 MN0
Creates Format
• To enable reuse of domain knowledge • To make domain assumptions explicit • To separate domain knowledge from the
operational knowledge • To analyze domain knowledge
• (3)本体的一致性。即本体中的概念间的关系在逻辑上 是否严密、一致,能否支持本体在语义逻辑上的推理。
• (4)本体的可扩展性。即本体可否顺利实施进化,本体 能否在层次结构上可扩充,在语义上可丰富与完善,能否 加入新的术语概念。
• (5)本体的兼容性。即本体的开放性和互操作性,本体 能否和其他领域本体及相关资源系统进行映射,包括系统 层、逻辑层、语义层、表现层等的兼容和互操作。
本体工具
• 本体工具一般可以区分为:本体开发工具
(Development tools)与本体映射工具(Mapping Tools)
• 前者包括:Protégé-2000, OntoEdit,OilEd,
WebODE, Ontolingua等
• 后者包括:PROMPT, ONION, OBSERVER,Chimaera, FCA-Merge, GLUE等。
• “本体是对概念体系的明确的、形式化、可共 享的规范说明”“An Ontology is a formal and explicit specification of a shared conceptualisation of a domain of interest” Studer 1998) 。
processes in which objects participate and that occur over time. • 世界以及其中的对象会有不同的状态The world and its objects can
be in different states. • 一个事件会引起另一些事件或状态Events can cause other events
• 元数据应用难以实现元数据方案本身的进化,而知识本体 可以提供信息系统的其它视图,只需要通过自动或半自动 的手段应用新的元数据方案;
• 元数据方案自身难以对不同知识体系、不同“粒度”的资 源进行描述,而知识本体正是起到这个作用,从而实现异 构资源和系统之间的语义联系;
• 单纯的元数据方案对于数字资源的整个生命周期的描述非 常困难,而采用以诸如FRBR模型为基础的知识本体,这 个问题便迎刃而解,不同生命周期的知识产权属性也非常 易于描述;
• 我们因为不涉及具体的应用,所以不关注映射工具。但是 本体领域一直极为关注不同本体的集成、映射等,所以映 射工具也是十分重要的一块。
评价本体开发工具的指标
• 互操作性:包括把其他本体导入到此开发工具; 把用此开发工具编辑出的本体导出为各种本体语 言等
• 知识模型的表达能力(Expressiveness of the knowledge model)
EV0 “手稿”
Involves EV1
hasOutput ST1
rdfType
“平明版”
“1952”
Involves
hasOutput
hasInput
EV2
ST2
atTime
rdfType
atTime
“安徽文艺版
“1990”
………
图2:ABC本体模型描述傅雷翻译作品《约翰 克里斯朵夫》
本体描述语言OWL
• http://xml.com/2002/11/06/Ontology_Editor _Survey.html
本体的种类
• 普通 (一般或常识) 本体 ( 高层本体或顶层本体)
• 领域本体 • 术语本体Terminology Ontologies • 形式本体Formal Ontology • 混合本体Mixed ontology • 表现本体Representational ontologies • 任务/方法本体Task and Method Ontologies • 局部本体Regional ontology
each other. • 属性与关系并不是一成不变的Properties and relations can change
over time. • 不同的时间会发生不同的事情There are events that occur at
different time instants. • 总是有一些事件发生一些过程有一些对象会参与There are
• 本体开发工具 • 内容采集或创建系统 • 存储于检索系统 • 本体推理中介、软件、服务…… • 应用集成
本体描述举例
dc.Creator
罗曼罗兰
DateofBirth Biograph
WK0 dc.Title
hasTranslation Translator
“约翰 克里斯朵夫” 1866
DateofBirth
信息资源组织方法论 本体方法
刘炜 wliu@libnet.sh.cn
目录
• 什么是本体? • 本体有什么作用? • 本体如何发挥作用? • 本体如何生成 • 本体应用举例
什么是知识本体?
• 本体是"概念体系的规范«A specification of a conceptualization» (Gruber, 1993)
本体对于世界的假设
• 世界是由对象组成的There are objects in the world. • 对象有属性特征可以被赋值Objects have properties or attributes
that can take values. • 对象之间有各种关系Objects can exist in various relations with
or states as effects. • 对象会有许多部分组成Objects can have parts.
[Chandrasekaran, etc 1999]
本体对于数字图书馆的作用
• 提供与描述型元数据有关语义描述的知识地图 • 提供资源库领域知识的规范描述 • 提供元数据映射方案,集成到数字图书馆体系中
• 灵活性、可变性 (Scalability) • 可扩展性(Extensibility) • 推理的支持程度Availability and capabilities of
inference services • 可用性(Usability of tools)
本体工具比较的一个案例
• 这是一个全面的对本体工具的对比。共对比了52个本体工具
• 由DAML+OIL发展而来 • 基于RDF和RDFS • 分3个版本Lite/DL/Full
知识本体的创建
本体创建阶段
建立本体的目标、范围、 需求分析
概念(词表)汇总 本体关系分析 本体形式化
领域专家
本体维护/修订 本体维护阶段
反馈 本体
信息本体
领域本体
知识库
知识共享系统
本体操作阶段
最终用户
本体需求分析
• 推理:Constraints and rules that permit reasoning within the ontology
• 服务:Behavior associated with stated or inferred facts
知识表达工具
本体的实现方法比较
本体方法的实现机制
仅仅有形式化的本体是不够的,就像叙词 方法必须要有情报检索系统支持一样。本 体也需要实现机制和系统支持,包括:
通用本体Common Ontologies
• 关于世界的最一般的认知capture general knowledge about the world
• 设计最一般的标识和概念,如时间、空间、状态、时间 等provide basic notations and concepts for things like time, space, state, event etc
本体编码
• 本体的形式化编码阶段就是用选定的本体 语言来描述知识本体
• 多种方法都可以描述本体,例如关系数据 库、逻辑、OWL…,主要要看如何实现
本体评价
• (1)本体的完整性。即本体是否包括了该领域重要概念, 概念及关系是否完整,概念的等级、层次是否多样化。
• (2)本体的清晰性。即本体中的术语是否被清晰无歧义 的定义。除了规范的主题、分类术语外,对本体进化产生 的概念是否给出明确、严格的语义定义。
的元数据服务中,成为协议的一部分 • 提供智能代理与信息环境之间基于语义的理解机
制 • 作为跨平台、跨系统之间的通信中介 • 分布环境下查询请求的语义理解 • 数字图书馆中的数据挖掘
本体方法弥补元数据方法的不足
• 元数据方案不具有普遍适用性。无法克服特殊性与一般性 的矛盾,而形式化的知识本体可以提供一种在元数据方案 之间自动映射的机制,通过语义Web服务的体系架构进行 实现;
本体的功能实现
表现层
浏览
检索
本体层
本体模型
本体映射
元数据层
元数据收获
服务智能代理
元数据映射
内容层
书Baidu Nhomakorabea数据
二次文献
网络资源
裸数据
全文库
……
本体的特点
• 共享:Shared understanding within a community of people
• 描述:Declarative specification of entities and their relationships with each other
• 实现一定程度的领域知识的重用 • 知识本体可以明确领域假设,使领域公理
得到明确描述从而达成共知 • 对于领域知识进行分析、明确,并使其形
式化
Why develop an ontology?
• To share common understanding of the structure of information among people or software agents
– 特殊的关系,关系的前n-1个元素可以唯一决定第n个元素。如 Mother-of就是一个函数,mother-of(x,y)表示y是x的母亲。
• 公理(axioms)
– 代表永真断言,如概念乙属于概念甲的范围。
• 实例(instances)
– 代表元素,就是对象。
本体的功能和作用
• 在人、机器(表现为软件代理)以及人与 机器之间共享对于信息及结构的共同理解
• (1)所构建的知识本体覆盖的学科领域,该学科 领域资源的基本状况。
• (2)知识本体的建设目的、任务要求、实现的社 会与经济效益。
• (3)利用知识本体的基本用户与核心用户,用户 需求的基本特点。
• (4)较之其他资源系统,知识本体将提供什么样 的服务。
• (5)知识本体和其他资源系统的关系,包括资源 的进一步映射和整合。
• (6)知识本体在建设时间、进度上的要求。
本体规划
• (1)明确计划中要达到的工作目标,论证工作的重要性 和必要性。
• (2)明确工作的具体任务和要求,每一时期的中心任务 和工作重点;对任务进行层层分解,列出工作责任矩阵, 确定完成工作的优先次序。
• (3)明确计划中各项工作开始和完成的时间,在任务分 解的基础上进行统筹规划,以便进行有效的控制和协调。
• (4)说明完成计划的方式方法、具体措施,对资源进行 合理分配和集中使用,并进行综合平衡。
• (5)规定控制标准和工作指标,也就是说必须做到什么 程度、达到什么标准才算完成了计划。
• 复用 • 利用工具
本体构建
确定本体概念间关系
• (1)确定领域知识本体的核心概念集 • (2)构建领域知识本体概念关系 • (3)将本体概念及关系模型化
• 本体是对于存在的研究或科学 the science or study of being(见牛津英语辞典)
Ontology建模元素
• 类(classes)或概念(concepts)
– 对象的集合
• 关系(relations)
– 在领域中概念之间的交互作用,如子类关系
• 函数(functions)
相关文档
最新文档