语义网与本体技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


7 April 2009
提要
1 2 3 4
为什么要使用语义网 什么是语义网 怎么样使用语义网 应用于制造业信息化中的思考
7 April 2009
语义网的架构
机器和软件代理可以用它来 唯一的验证某个信息是否由 特定的可信任的来源提供。 规则 信任 除了本体层定义的术语关系 和推理规则外,还需要有一 数据 证明 个功能强大的逻辑语言来实 RDF数据模型提供简单的语义, 数 数据 现推理。 RDF属性可以看作是资源的属性, 逻辑 提供一个明确形式化语言,以准确 字 同时又表达了资源之间的关系; 定义术语语义及术语间的关系。 自描述 签 RDF Schema定义被描述资源的类 XML提供文档结构化的语法,实现了文档结构与 本体 文档 ,并提供约束违例的检测机制。 文档表现形式的分离,根据不同的目的同一个文 名 档可以有不同的表现形式。XML名称空间是名称 一种新的+字符编码标准,它支持 RDF+RDF Schema 的一个集合,用于文档元素和属性名有效性的验 世界上所有的语言。无论在什么 唯一标识Web上的任一资源,其思 证。XML Schema是约束XML文档结构的语言。 平台上,无论在什么程序中,无 想是在需要的时候通过链接引用 XML+NS+XML Schema 名称空间 论使用什么语言,每个字符都对 资源,因此不需要对资源进行拷 应于一个唯一的Unicode编码值。 贝或集中管理。
7 April 2009
形式化描述——谓词
size(x,y) bedrooms(x,y) price(x,y) floor(x,y) garden(x,y) lift(x) pets(x) central(x) y是公寓x的大小(平方米) x有y个卧室 y是x的价格 x是在第y层楼 x有大小为y的花园 在x所在的大楼里有电梯 在x里允许养宠物 x位于市中心 公寓x满足卡洛斯的要求 卡洛斯愿意为x付y美元

实现了文档结构和文档表现形式的分离; 以Java script、VB script和XML等技术为标志; 数字图书馆、网上购物、网上办公自动化等等。
7 April 2009
Web的发展历史——第三代Web
Web的高速发展使得它很快成为一个庞大的知识 库,但同时带来很多问题:

忽略了计算机的处理作用; 大部分有用信息无法得到有效利用。
citizenOf
implicatedIn
date location
Afghanistan
World Trade Center
2001-09-11
Washington, DC
Saudi Arabia
date 2001-09-11 location New York, NY
7 April 2009
本体谱


通过互联网浏览文档成为可能,实现了文档表现形式与文档存储格式 的分离; 以HTML语言、URL和HTTP等技术为标志,以静态页面的形式来展 现信息; 简单易用,但信息单调,维护困难。
7 April 2009
Web的发展历史——第二代Web
允许用户通过交互查询数据库来构建Web应用, 并将数据库中符合要求的结果动态的生成页面, 并展示给用户。 特征:

语义网表示语言


语义网查询技术


语义网安全

7 April 2009
提要
1 2 3 4
为什么要使用语义网 什么是语义网 问题描述 怎么样使用语义网 应用于制造业信息化中的思考
7 April 2009
本体概念
共享概念模型的明确的形式化规范说明

概念模型

通过抽象出客观世界中一些现象的相关概念而得到的模型,概念模型 表现的含义独立于具体的环境状态 概念和概念的约束都有明确的和无歧义的定义 本体能通过本体语言编码,使得计算机可读,并可以被计算机处理 本体体现的是共同认可的知识,反映的是相关领域内公认的概念集
r2,r3,r4,r5,r6>r1 r7: size(X,Y),Y>=45,garden(X,Z),central(X) => offer(X,300+2Z+5(Y-45)) r8: size(X,Y),Y>=45,garden(X,Z), ﹁ central(X) => offer(X,250+2Z+5(Y-45)) r9: offer(X,Y),price(X,Z),Y<Z => ﹁acceptable(X) r9>r1
本体是……
目录 (catalog)
术语表 (glossary)
分类的集合 (collection of taxonomies ) 辞典 (thesaurus)
通用逻辑约束的集合 (set of general logical constraints)
文本文件的集合 (set of text files)
7 April 2009
逻辑与推理——单调规则
A1,A2,……,An —> B 解释:

演绎规则(deductive rules):如果A1,A2,……,An已知为真,那么B也为真。 反应式规则(reactive rules):如果条件A1,A2,……,An为真,那么执行行动 B。
father(X,Y),mother(X,Y),male(X),female(X) father(X,Y) —> parent(X,Y), mother(X,Y) —> parent(X,Y) male(X),parent(P,X),parent(P,Y),notSame(X,Y) —> brother(X,Y) female(X),parent(P,X),parent(P,Y),notSame(X,Y) —> sister(X,Y) brother(X,P),parent(P,Y) —> uncle(X,Y) mother(X,P),parent(P,Y) —> grandmother(X,Y) parent(X,Y) —> ancestor(X,Y), ancestor(X,P),parent(P,Y) —> ancestor(X,Y)
语义网理论与技术探讨
提要
1 2 3 4
为什么要使用语义网 什么是语义网 怎么样使用语义网 应用于制造业信息化中的思考
7 April 2009
提要
1 2 3 4
为什么要使用语义网 什么是语义网 怎么样使用语义网 应用于制造业信息化中的思考
7 April 2009
Web的发展历史——第一代Web
1989 日内瓦欧洲粒子物理实验室 Berners-Lee 特征:
框架的集合 (collection of frames)
复杂度 无自动推理 带有自动推理
7 April 2009
逻辑与推理
为什么使用逻辑来进行本体推理:




它提供一种便于表达知识的高层语言,并且具有很强的表达能力; 它具有易于理解的形式化语义,将无歧义的含义赋予逻辑公式; 提供了精确的逻辑后承(logical consequence)概念,它决定一 个公式是否可由另一些公式(前提)在语义上推出。实际上,逻辑 最原始的动机正是研究逻辑后承的客观规律; 存在由前提集从语法上自动推出结论的证明系统; 存在逻辑后承与语法推导相一致的证明系统。证明系统应当是可 靠的(所有语法可推出的公式都是前提的逻辑后承)和完全的(前提 的所有逻辑后承都可由证明系统推出); 在存在可靠且完全的证明系统的意义上,谓词逻辑是独一无二的。 表达能力更强的逻辑(高阶逻辑)没有这样的证明系统; 由于存在证明系统,可以追踪逻辑后承的推导过程。在此意义上, 逻辑能够提供其结论的理由。
“911”本体描述
Class Terrorist type hasLeader Osama bin Laden al Qaeda type
Class
Terrorist Organization type
Class
Terrorist Event
type
implicatedIn
Pentagon
residesIn
7 April 2009
逻辑与推理——非单调规则
假设一个网上卖家希望在顾客的生日当天给予特别优惠。可以用如下 的规则来简单的表达这个应用:

R1:If birthday, then special discount. R2:If not birthday, then not special discount.
这种解决方案在已经生日的情况下运转良好。但是,假设一个顾客因 为涉及隐私而拒绝提供他的生日。在这种情况下,就不能应用上面的 规则了,因为其前提是未知的。为了处理这种情况,需要写出如下的 规则:

R1:If birthday, then special discount. R2’:If birthday is not known, then not special discount.
7 April 2009
一个例子
卡洛斯正在找一个至少45平方米、至少有两个卧 室的公寓。如果是在三楼或三楼以上,大楼必须 有电梯。而且可以养宠物。 卡洛斯愿意为市中心的45平方米大小的公寓付 300美元,为在市郊的类似公寓付250美元。并 且,他愿意为公寓超出45平方米的部分每平方米 支付5美元,为花园每平方米付2美元。 他的付款总额不会超过400美元。在给定的可选 项中,他将选择最便宜的,第二优先的是有花园 的,最后才是有额外空间的。
Unicode
URI
7 April 2009
语义网研究的问题
目前语义网涉及的主要研究问题有:

语义网知识表示模型

创建和管理本体 本体的扩充、集成和演化 描述逻辑 XML、RDF(S)、OWL 针对不同的表示语言,发展了各自不同的查询语言 包括每一层次的安全以及互用性的安全

语义网逻辑基础

Web信息无法被有效利用:

Web服务存在异构问题:


7 April 2009
Leabharlann Baidu
语义网的思想
Berners-Lee:

对现有Web扩展; 语义网的目标是让Web上的信息能够被机器理解,从而实现Web 信息的自动处理,以适应Web资源的快速增长,更好的为人类服 务。


W3C:
将机器能理解的数据发布在Web上正成为很多组织最优先考虑的 工作,只有Web成为一个自动工具和人能够共享和处理数据的平 台,它的潜能才可能全部发挥; Web上的数据可以被机器自动处理、集成和重用。
但是规则R2’的前提不在谓词逻辑的表达能力之内,于是,就需要一 种新的规则系统。注意规则R1和R2适用于掌握相关情形的完全信息 的情况,而非单调规则R2’则应用于信息不完全的情况。
7 April 2009
逻辑的分类
谓词逻辑 命题逻辑 描述逻辑 Horn逻辑 模态逻辑 直觉主义逻辑 多值逻辑 ……


特征:
实现文档语义与文档结构的分离; 达到使文档具有机器可处理的语义。
7 April 2009
Web的局限性
Web信息无法被自动处理:

计算机只负责显示信息,而没有理解和处理Web信息的能力,在 Web上很难开发各种智能应用。 以最强大的搜索引擎Google来说,它目前能搜索80亿之多的Web页 面,但这仅仅占整个Web规模的25%-30%; 同时,无法精确识别Web上的内容,搜索结果的质量并不令人满意。 Web Service:UDDI、WSDL等技术标准,服务的查全率和查准率 仍然较低;服务集成需要人工干预; 跨平台互操作的中间件:CORBA、COM、EJB等应用,存在中间件 描述、检索和自动化集成等方面的问题; 描述信息的语义二义性导致机器无法自动的理解和处理它们。

明确


形式化


共享

7 April 2009
本体定义
本体可以定义为一个七元组: O=(C,Ac,R,Ar,H,I,X)

C :概念的集合 Ac :概念属性的集合 R:关系的集合 Ar:关系属性的集合 H :层次的集合 I:实例的集合 X:公理的集合
7 April 2009
acceptable(x) offer(x,y)
7 April 2009
形式化描述——规则
r1: =>acceptable(X) r2: r3: r4: r5: r6: bedroom(X,Y),Y<2 => ﹁acceptable(X) size(X,Y),Y<45 => ﹁acceptable(X) ﹁pets(X) => ﹁acceptable(X) floor(X,Y),Y>2, ﹁lift(X) => ﹁acceptable(X) price(X,Y),Y>400 => ﹁acceptable(X)
相关文档
最新文档