语义web与知识管理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语义web与知识管理
计81班李存禄
高春阳
安多
分工明细:
整理ppt及project展示:李存禄
撰写总结论文:高春阳
搜集材料:安多
摘要:
关键词:
语义web、xml、RDF、Ontology、ALC、web服务、知识管理、SHOE、OML、XOL、OWL、智能Agent服务
一、语义Web概况:
历史:
1998年Web的发明者国际W3C主席Tim Berners-Lee首次提出了语义Web 的概念。
2001年9月9日国际W3C“技术与社会领域(Technology and Society Domain)”下的语义Web活动论坛(Semantic Web Activity)正式宣告成立。语义Web活动论坛在其宣言中指出:“语义Web是当前Web的一个扩展,其中信息具有形式化定义的语义,更有助于计算机之间以及计算机与人之间的协同工作。其思想是使Web上的数据以这样一种方式来定义与链接,使其能够在各种不同的应用场景中有效地实现数据的发现、自动化处理、集成与复用。当且仅当Web不仅成为人所共享加工的场所,也成为自动化工具所共享加工的场所时,语义Web方能实现其全部潜力。”
定义:
简单的说,语义就是资源的含义(资源是一个很广泛的概念,它可以是网站、网页,甚至是网页中的部分内容);语义Web是具有明确语义的能够被机器和人理解的网络。也就是说,语义Web是一种能够理解人类语言的智能网络,它使得人-机间及机-机间的交流变得像人-人间的交流一样便利流畅。
语义Web是一个网,它包含了文档和文档的一些部分,描述了事物间的明显关系,且包含语义信息,以便于机器的自动处理。
用途:
万维网之父蒂姆·贝纳斯-李(Tim Berners-Lee)称,使用“语义Web”的用户将可应用远远强于现有网络中任何东西的功能。他表示,在“语义Web”中,用户可将两个毫不相干的东西连接在一起,比如说银行报帐单和日历。用户可以将银行报帐单拖到日历上,也可以将日历拖到银行报帐单上,这样就可以知道何时应当进行支付。他指出,“语义Web”将呈现给人们的是一个所有数据“无缝”式连接的网络。在“语义Web”(semantic Web)技术破土而出之后,目前人们对Facebook和MySpace等社交网站的“痴迷”终将被“无所不连”的网络所取代。
二、语义Web结构:
语义web结构图
如上图所示,语义web共分七层结构,下面逐层介绍:
第一层:Unicode和URI
Unicode是一个字符集,这个字符集中所有字符都用两个字节表示,可以表示65536个字符,基本上包括了世界上所有语言的字符。数据格式采用Unicode 的好处就是它支持世界上所有主要语言的混合,并且可以同时进行检索。URI(Uniform Resource Identifier),即统一资源定位符,用于唯一标识网络上的一个概念或资源。在语义Web体系结构中,该层是整个语义Web的基础,其中Unicode负责处理资源的编码,URI负责资源的标识。
第二层:XML+NS+xmlschema
XML是一个精简的SGML,它综合了SGML的丰富功能与HTML的易用性,它允许用户在文档中加入任意的结构,而无需说明这些结构的含意。NS(Name Space)即命名空间,由URI索引确定,目的是为了避免不同的应用使用同样的字符描述不同的事物。XML Schema是DTD(Document Data Type)的替代品,它本身采用XML语法,但比DTD更加灵活,提供更多的数据类型,能更好地为有效的XML文档服务并提供数据校验机制。正是由于XML灵活的结构性、由URI索引
的NS而带来的数据可确定性以及XML Schema所提供的多种数据类型及检验机制,使其成为语义Web体系结构的重要组成部分。该层负责从语法上表示数据的内容和结构,通过使用标准的语言将网络信息的表现形式、数据结构和内容分离。
第三层:RDF+rdfschema。
RDF是一种描述WWW上的信息资源的一种语言,其目标是建立一种供多种元数据标准共存的框架。该框架能充分利用各种元数据的优势,进行基于Web 的数据交换和再利用。RDF解决的是如何采用XML标准语法无二义性地描述资源对象的问题,使得所描述的资源的元数据信息成为机器可理解的信息。如果把XML看作为一种标准化的元数据语法规范的话,那么RDF就可以看作为一种标准化的元数据语义描述规范。Rdfschema使用一种机器可以理解的体系来定义描述资源的词汇,其目的是提供词汇嵌入的机制或框架,在该框架下多种词汇可以集成在一起实现对Web资源的描述。
第四层:Ontology vocabulary。
该层是在RDF(S)基础上定义的概念及其关系的抽象描述,用于描述应用领域的知识,描述各类资源及资源之间的关系,实现对词汇表的扩展。在这一层,用户不仅可以定义概念而且可以定义概念之间丰富的关系。
第五至七层:Logic、Proof、Trust。
Logic负责提供公理和推理规则,而Logic一旦建立,便可以通过逻辑推理对资源、资源之间的关系以及推理结果进行验证,证明其有效性。通过Proof交换以及数字签名,建立一定的信任关系,从而证明语义Web输出的可靠性以及其是否符合用户的要求。
简单的说,各层的意义如下:
第1层Unicode和URI是整个语义Web的基础。
Unicode是一种字符编码标准,它支持世界上的所有语言;URI是web的核心概念之一,它能够唯一地标识web上的任意一个资源。
第2层XML+NS+XML Schema是语法层,用于表示数据的内容和结构。
XML提供了文档结构化的语法,实现了文档结构与文档表现形式的分离。XML Schema是约束XML文档结构的语言。XML名字空间是名字的一个集合,用于文档元素和属性名有效性的验证,由URI引用来标识。
第3层RDF+RDF Schema是数据层,用于描述Web上的资源及其类型。
RDF是结构化的元数据编码、交换和重用的一个基础。RDF数据模型提供了简单的语义,RDF属性可以看作是资源的属性,同时又表达了资源之间的关系。RDF Schema为RDF模型提供了一个基本的类型系统。
第4层Ontology Vocabulary是本体层,用于描述各种资源之间的联系。
本体层提供一个能明确地形式化地定义术语含义及术语间关系的语言,以准确定义术语语义及术语间的关系。
第5层~第7层是Logic,Proof和Trust,是在下面4层的基础上进行的逻辑推理操作,包括公理和推理规则、认证机制及信任机制。
最后,贯穿全过程的是数字签名和加密。这是实现Web信任机制的关键技术,为机器提供验证某信息是否可信任的证据。
语义web的最大优点是可让计算机具有对网络空间所存储的数据,进行评估的能力。这样,计算机就可以像人脑一样“理解”信息的含义,完成“智能代理”的功能。使用语义web搜索引擎搜索的结果比web更为准确。语义web提供了一种崭新的信息描述和知识表达的手段,而在语义层次上实现信息的互操作,就需要对信息含义的理解达成一致。语义web采用了本体(Ontology)的思想,本体描述的是具有共识的、概念化得事物,它对实现语义层次上的知识共享、知识重用等发挥着核心作用。
三、语义web的关键技术
语义Web的实现依赖于三大关键技术:XML、RDF和Ontology。
XML实现了文档结构化,但文档信息并不包含任何语义;RDF数据模型提供了简单的语义;Ontology使得语义表达能力更加丰富。目前XML,RDF技术相对比较成熟,而本体技术尚待进一步的发展完善。