语义网学习报告 - 360文档中心

合集下载

相关主题

语义分析实验报告

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

语义网学习报告

Company Document number：WUUT-WUUY-WBBGB-BWYTT-1982GT

语义网学习报告

学院：计算机科学与工程

专业：计算机科学与技术

班级：

学号：

姓名：刘啸宇

指导教师：吴陈

一、语义网的概念与发展

语义网的定义及概述万维网之父——伯纳斯·李(Berners-Lee)在2002年描绘了下一代互联网的前景,并将下一代互联网称为“语义网”(Semantic Web)。他描述道:“语义网是当前网络的延伸,信息在其中被赋予明确含义,从而实现人与计算机的更好协作。”

蒂姆·伯纳斯-李在2006年普林斯顿大学演讲和后期接受媒体采访时公开表示，他最初将这种智能网络命名为语义网或许不够贴切，也许更准确的名称应该是数据网(外语:Data Web)。

语义网就是能够根据语义进行判断的智能网络，实现人与电脑之间的无障碍沟通。它好比一个巨型的大脑，智能化程度极高，协调能力非常强大。在语义网上连接的每一部电脑不但能够理解词语和概念，而且还能够理解它们之间的逻辑关系，可以干人所从事的工作。它将使人类从搜索相关网页的繁重劳动中解放出来，把用户变成全能的上帝。语义网中的计算机能利用自己的智能软件，在万维网上的海量资源中找到你所需要的信息，从而将一个个现存的信息孤岛发展成一个巨大的数据库。

语义网的建立极大地涉及了人工智能领域的部分，与web 智能网络的理念不谋而合，因此语义网的初步实现也作为web 的重要特征之一，但是想要实现成为网络上的超级大脑，需要长期的研究，这意味着语义网的相关实现会占据网络发展进程的重要部分，并且延续于数个网络时代，逐渐转化成"智能网"。

二、语义网的体系结构

erners-Lee于2000年提出了语义网的体系结构，并对此做了简单的介绍。该体系结构共有七层，自下而上其各层功能逐渐增强。

第一层

第一层:""层。

Unicode和URI。Unicode是一个字符集，这个字符集中所有字符都用两个字节表示，可以表示65536个字符，基本上包括了世界上所有语言的字符。数据格式采用Unicode的好处就是它支持世界上所有主要语言的混合，并且可以同时进行检索。

URI(Uniform Resource Identifier)，即统一资源定位符，用于唯一标识网络上的一个概念或资源。在语义网体系结构中，该层是整个语义网的基础，其中Unicode负责处理资源的编码，URI负责资源的标识。

第二层

第二层:根层。

XML+NS+xmlschema。XML是一个精简的标准通用标记语言，它综合了标准通用标记语言的丰富功能与HTML的易用性，它允许用户在文档中加入任意的结构，而无需说明这些结构的含意。NS(Name Space)即命名空间，由URI索引确定，目的是为了避免不同的应用使用同样的字符描述不同的事物。XML Schema是文档类型定义(DTD)的替代品，它本身采用XML语法，但比DTD更加灵活，提供更多的数据类型，能更好地为有效的XML文档服务并提供数据校验机制。正是由于XML灵活的结构性、由URI索引的NS而带来的数据可确定性以及XML Schema所提供的多种数据类型及检验机制，使其成为语义网体系结构的重要组成部分。该层负责从语法上表示数据的内容和结构，通过使用标准的语言将网络信息的表现形式、数据结构和内容分离。

第三层

第三层:"资源描述框架"层。

+rdfschema。RDF是一种描述WWW上的信息资源的一种语言，其目标是建立一种供多种共存的框架。该框架能充分利用各种的优势，进行基于Web 的数据交换和再利用。RDF解决的是如何采用XML标准语法无二义性地描述资源对象的问题，使得所描述的资源的元数据信息成为机器可理解的信息。如果把XML看作为一种标准化的元数据语法规范的话，那么RDF就可以看作为一种标准化的元数据语义描述规范。Rdfschema使用

一种机器可以理解的体系来定义描述资源的词汇，其目的是提供词汇嵌入的机制或框架，在该框架下多种词汇可以集成在一起实现对Web资源的描述。

第四层

第四层:"本体词汇"层。

"本体词汇"，(外语:Ontology vocabulary)。该层是在RDF(S)基础上定义的概念及其关系的抽象描述，用于描述应用领域的知识，描述各类资源及资源之间的关系，实现对词汇表的扩展。在这一层，用户不仅可以定义概念而且可以定义概念之间丰富的关系。

五至七层

第五至七层:Logic、Proof、Trust。Logic负责提供公理和推理规则，而Logic一旦建立，便可以通过逻辑推理对资源、资源之间的关系以及推理结果进行验证，证明其有效性。通过Proof交换以及，建立一定的信任关系，从而证明语义网输出的可靠性以及其是否符合用户的要求。

三、关于使用protege进行本体构建的探讨

Protégé软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件，或者说是本体开发工具，也是基于知识的编辑器，属于。

Protégé提供了本体概念类，关系，属性和实例的构建，并且屏蔽了具体的本体描述语言，用户只需在概念层次上进行领域本体模型的构建。

Protégé使用JAVA和Open Source作为操作平台，可用于编制本体和知识库(Knowledge Base)，protégé可以根据使用者的需要进行定制，通过定制用户的界面以更好地适应新语言的使用;有可自行设置的数据输入模式，可以将protégé的内部表示转制成多种形式的文本表示格式，如:XML、RDF(S)、OIL、、DAML+OIL、OWL等系统语言。Protégé工具本身没有嵌入推理工具，不能实现推理，但它具有很强的可扩展性，可以插入来扩展一些特殊的功能如推理、提问、XML转换等。Protégé提供可扩展的独立平台环境，用于构建和编辑本体以及知识库。Protégé，运行，提供本体建设的基本功能，而且它采用图形化界面，界面风格与OilEd一样，都与WINDOWS操作系统的风格一致，模块划分清晰。另外，protégé本体结构和OntoEdit一样，也是以树形的等级体系结构来显示，用户可以通过点击相应的项目来增加或编辑类、子类、实例等，所以用户使用protégé不需要掌握具体的本体表示语言，是用户比较容易学习、使用的本体开发工具。由于其优秀