语义网学习报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语义网学习报告
Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT
语义网学习报告
学院:计算机科学与工程
专业:计算机科学与技术
班级:
学号:
姓名:刘啸宇
指导教师:吴陈
一、语义网的概念与发展
语义网的定义及概述万维网之父——伯纳斯·李(Berners-Lee)在2002年描绘了下一代互联网的前景,并将下一代互联网称为“语义网”(Semantic Web)。他描述道:“语义网是当前网络的延伸,信息在其中被赋予明确含义,从而实现人与计算机的更好协作。”
蒂姆·伯纳斯-李在2006年普林斯顿大学演讲和后期接受媒体采访时公开表示,他最初将这种智能网络命名为语义网或许不够贴切,也许更准确的名称应该是数据网(外语:Data Web)。
语义网就是能够根据语义进行判断的智能网络,实现人与电脑之间的无障碍沟通。它好比一个巨型的大脑,智能化程度极高,协调能力非常强大。在语义网上连接的每一部电脑不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以干人所从事的工作。它将使人类从搜索相关网页的繁重劳动中解放出来,把用户变成全能的上帝。语义网中的计算机能利用自己的智能软件,在万维网上的海量资源中找到你所需要的信息,从而将一个个现存的信息孤岛发展成一个巨大的数据库。
语义网的建立极大地涉及了人工智能领域的部分,与web 智能网络的理念不谋而合,因此语义网的初步实现也作为web 的重要特征之一,但是想要实现成为网络上的超级大脑,需要长期的研究,这意味着语义网的相关实现会占据网络发展进程的重要部分,并且延续于数个网络时代,逐渐转化成"智能网"。
二、语义网的体系结构
erners-Lee于2000年提出了语义网的体系结构,并对此做了简单的介绍。该体系结构共有七层,自下而上其各层功能逐渐增强。
第一层
第一层:""层。
Unicode和URI。Unicode是一个字符集,这个字符集中所有字符都用两个字节表示,可以表示65536个字符,基本上包括了世界上所有语言的字符。数据格式采用Unicode的好处就是它支持世界上所有主要语言的混合,并且可以同时进行检索。
URI(Uniform Resource Identifier),即统一资源定位符,用于唯一标识网络上的一个概念或资源。在语义网体系结构中,该层是整个语义网的基础,其中Unicode负责处理资源的编码,URI负责资源的标识。
第二层
第二层:根层。
XML+NS+xmlschema。XML是一个精简的标准通用标记语言,它综合了标准通用标记语言的丰富功能与HTML的易用性,它允许用户在文档中加入任意的结构,而无需说明这些结构的含意。NS(Name Space)即命名空间,由URI索引确定,目的是为了避免不同的应用使用同样的字符描述不同的事物。XML Schema是文档类型定义(DTD)的替代品,它本身采用XML语法,但比DTD更加灵活,提供更多的数据类型,能更好地为有效的XML文档服务并提供数据校验机制。正是由于XML灵活的结构性、由URI索引的NS而带来的数据可确定性以及XML Schema所提供的多种数据类型及检验机制,使其成为语义网体系结构的重要组成部分。该层负责从语法上表示数据的内容和结构,通过使用标准的语言将网络信息的表现形式、数据结构和内容分离。
第三层
第三层:"资源描述框架"层。
+rdfschema。RDF是一种描述WWW上的信息资源的一种语言,其目标是建立一种供多种共存的框架。该框架能充分利用各种的优势,进行基于Web 的数据交换和再利用。RDF解决的是如何采用XML标准语法无二义性地描述资源对象的问题,使得所描述的资源的元数据信息成为机器可理解的信息。如果把XML看作为一种标准化的元数据语法规范的话,那么RDF就可以看作为一种标准化的元数据语义描述规范。Rdfschema使用
一种机器可以理解的体系来定义描述资源的词汇,其目的是提供词汇嵌入的机制或框架,在该框架下多种词汇可以集成在一起实现对Web资源的描述。
第四层
第四层:"本体词汇"层。
"本体词汇",(外语:Ontology vocabulary)。该层是在RDF(S)基础上定义的概念及其关系的抽象描述,用于描述应用领域的知识,描述各类资源及资源之间的关系,实现对词汇表的扩展。在这一层,用户不仅可以定义概念而且可以定义概念之间丰富的关系。
五至七层
第五至七层:Logic、Proof、Trust。Logic负责提供公理和推理规则,而Logic一旦建立,便可以通过逻辑推理对资源、资源之间的关系以及推理结果进行验证,证明其有效性。通过Proof交换以及,建立一定的信任关系,从而证明语义网输出的可靠性以及其是否符合用户的要求。
三、关于使用protege进行本体构建的探讨
Protégé软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件,或者说是本体开发工具,也是基于知识的编辑器,属于。
Protégé提供了本体概念类,关系,属性和实例的构建,并且屏蔽了具体的本体描述语言,用户只需在概念层次上进行领域本体模型的构建。
Protégé使用JAVA和Open Source作为操作平台,可用于编制本体和知识库(Knowledge Base),protégé可以根据使用者的需要进行定制,通过定制用户的界面以更好地适应新语言的使用;有可自行设置的数据输入模式,可以将protégé的内部表示转制成多种形式的文本表示格式,如:XML、RDF(S)、OIL、、DAML+OIL、OWL等系统语言。Protégé工具本身没有嵌入推理工具,不能实现推理,但它具有很强的可扩展性,可以插入来扩展一些特殊的功能如推理、提问、XML转换等。Protégé提供可扩展的独立平台环境,用于构建和编辑本体以及知识库。Protégé,运行,提供本体建设的基本功能,而且它采用图形化界面,界面风格与OilEd一样,都与WINDOWS操作系统的风格一致,模块划分清晰。另外,protégé本体结构和OntoEdit一样,也是以树形的等级体系结构来显示,用户可以通过点击相应的项目来增加或编辑类、子类、实例等,所以用户使用protégé不需要掌握具体的本体表示语言,是用户比较容易学习、使用的本体开发工具。由于其优秀