ontology介绍
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Formal Ontology&informal Ontology
Formal ontology:
着重在子类型和上层类型的区分 用逻辑语言或计算机语言描述 公理化ontology由公理和定义陈述
•
用于数学、物理、工程
基于原型ontology由每个子类的典型成员或原型的 比较区分子类型
其他分类系统的索引
Ontology 环境
合并多个Ontology 诊断、升级Ontology
Chimaera Ontology 环境
Knowledge Systems Laboratory , Stanford University Web-based browser environment 接受15种指定格式的输入 提供潜在的合并候选项 支持分类法决议模式,及发现语义包含关 系功能 提供分析功能套件,包括不完全的测试、 分类学分析、语义检查 提供规则语言,以允许用户添加测试工具
文件:ontology
版本信息:
!version: $Revision: 1.48 $ !date: $Date: 2002/01/15 18:25:40 $ !source: $Source: /share/go/cvs/go/doc/GO.doc.html,v $ ! !Gene Ontology ![domain of file] !editors: Michael Ashburner (FlyBase), Midori Harris (GO), Judith Blake (MGD) !Leonore Reiser (TAIR), Karen Christie (SGD) and colleagues !with software by Suzanna Lewis (FlyBase Berkeley).
分子功能、生物学过程、细胞成分 术语定义: XML格式:每月更新
相关文件:
GO名词:
注释:
参与合作的数据库用GO术语注释它们的基因或基因产物 当某文本串(功能、过程、成分)在不同物种含义不同时,GO 加以区别 调用其他数据库中的标识符时,加其缩略名做前缀 DB:identifier 直接非循环图directed acyclic graphs (DAGs) 或网络表示, 父子术语是多对多的关系, 对每一父术语,子术语有不同的关系类
物种特性:
数据库缩略名:
数据表示:
同义词
一个术语有一个或多个同义词
每个术语有一,用做数据库交叉参考 格式 GO:nnnnnnn (7位数字,0补齐) 即唯一标识符 terma; GO:idterma, GO:idtermb, GO:idtermc, ...
唯一标识符:
数据库交叉参考
Terma与termb合并,termb标识做第二标识
术语分裂
作为每个新术语的第二标识
Biological Process (process.ontology) Molecular Function (function.ontology) Cellular Component (component.ontology)
Ontology 介绍
李 荣 2002年3月
内容:
什么是ontology GO:Gene Ontology Ontology 环境
什么是ontology
பைடு நூலகம்
哲学:存在论,讨论对象的存在性,一个 存在的系统说明 在知识共享方面,指概念化的详细说明, a specification of a conceptualization 一个agent或其群体的概念与关系的描述 目的:知识共享与重用 一个ontology就是一个正式词汇表的定义
一个逻辑理论的陈述 一套表达术语的定义 用人类可读的文本定义一个领域内(类型 、关系、功能等)实体名字来描述其含义 ,定义正式公理以限制其解释及这些术语 的形式良好的使用
ontology历史
80、90年代
在专家系统中应用 由知识表示与推理专家建立 多用于图书分类
非分类学专家 未受训公众 研究、电子商务、计算机配置、通用信息站点、生物 数据
XML版本:
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE go:go> <go:go xmlns:go="/dtds/ go.dtd#" xmlns:rdf="/1999/02/22-rdfsyntax-ns#"> <go:version timestamp="Wed May 9 23:55:02 2001" /> <rdf:RDF>
图例:由属性用正规概念分析方法 (FCA)构成
FCA技术
属于数据挖掘 生成子网格,可与更通用的分类网格自动 合并
GO:Gene Ontology
Gene OntologyTM Consortium制定 动态受控的词汇表 用于所有生物体,即使基因与蛋白质在细 胞中的角色知识积累、变化仍然适用 现有的GO:
语法:
父子关系:
parent_term child_term
实体关系: term1既是term0的实体,也是 term2的实体
%term0 %term1 % term2
部 分 关系 : term1 是 term0 的 实体 , 也 是 term2和term3的一部分
%term0 %term1 < term2 < term3
•
用于植物、动物及普通家用物品
Informal ontology:
自然语言中定义或未定义的类型分类 由一个概念和关系的名字集描述 由部分子类型的关系排序、组织
大型ontology用混合方法
KR ontology
基于Knowledge Representation (by John D. Sowa) 基本的类型和区分由逻辑、语言学、AI导 出 系统化的,开放的系统 基于区别的框架,自动生成层次,而不是 基于固定的分类层次
互连网驱动
与分类学的区别
Ontology是类的分类学层次,不是类定义 、包含关系,但不限于此形式 不限于保守的传统逻辑意义上的定义 增加了知识 指定一个概念化要陈述限制名词可能的解 释的公理
Ontology使用
Ontology承诺:同意按照一个ontology 指定的理论一致、连贯地使用词汇表,如 查询,发表声明 按照ontology建立agent, 通过这些agent 共享知识 Agent共享词汇表而不必共享知识库 每个Agent知道的东西其他agent不知道 一个Agent不必回答所有可由共享词汇表 表达的查询,即与ontology一致但不必完 备
<go:term rdf:about= "/go#GO:0003674"> <go:accession>GO:0003674</go:accession> <go:name>molecular_function</go:name> <go:definition>The action characteristic of a gene product.</go:definition> <go:part-of rdf:resource="http: ///go#GO:0003673" /> <go:dbxref> <go:database_symbol>go</go:database_symbol> <go:reference>curators</go:reference> </go:dbxref> </go:term> </rdf:RDF>
基础:概念化 conceptualization
假设在某感兴趣领域存在的对象、概念、 其他实体及其中关系 为实现某目标而期望表示的世界的抽象、 简化的视图 知识库、基于知识的系统、知识层次的 agent都可以对应于某概念化 一个ontology就是一个概念化的显式指定
Ontology的本质
系统发现mammal 和mammalia名字 相似,建议合并
定义:GO.defs 文本文件定义 GO terms
tag: text or value Tag是以下之一:
•术语
GO_id
定义
注释
Bibliography :GO.bib
格式 tag: text or value
database:<identifier> > GO:<term> ; GO:<GO_id> e.g.: TIGR_role:11030 73 Amino acid biosynthesis Glutamate family > GO:glutamine family amino-acid biosynthesis ; GO:0009084