语义网介绍及体系结构分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语义网介绍及体系结构分析
作者:张海亮
来源:《声屏世界》2015年第13期
随着网络的迅猛发展,网页上的信息成指数增长,网页已经成为最主要的信息交流渠道。
由于HTML本身的局限性而导致网页上缺乏足够的语义信息,难以实现WEB信息的自动化处理,因此WWW、HTTP和HTML的创始人Tim Berners-Lee在一般万维网的基础上提出了语义网的概念,从而大大改进了人类思维和机器思维之间的差异,提高了机器自动处理网络上信息的能力。
语义网是对未来网络的一个设想,现在与WEB 3.0这一概念结合在一起,是3.0网络时代的特征之一。
简单地说,语义网是一种智能网络,它不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以使交流变得更有效率和价值。
语义网和人工智能中的语义网络是两个不同的概念,所以它采用的方法与自然语言处理不同。
它对现有的WEB进行了语义扩展,从而使其上面的信息能够被计算机理解和处理,从功能上看它将是一个能够“理解”人类信息的智能网络。
在其体系结构中,第一层是Unicode(统一编码)和URI,它是整个语义网的基础。
Unicode是处理资源的编码,URI负责标识资源;第二层是XML+名空间+XML模式,用于表示数据的内容和结构;第三层是RDF和RDF模式,用于描述资源及其类型;第四层是本体词汇,用于描述各种资源之间的联系;第五层是逻辑,在前面四层的基础上进行逻辑推理操作;第六层是验证,根据逻辑陈述进行验证以得出结论;第七层是信任,在用户间建立信任关系。
其中,第二、三、四层是一个语义网的关键层,用于表示WEB信息的语义,也是现在语义网研究的热点所在。
可扩展标记语言XML让每个人都能创建自己的信息标签,来对网页或页面的部分文字进行注释。
资源描述框架RDF的基本结构是对象、属性和值所组成的三元组,也就相当于一个句子中的主语,动词和宾语。
这些三元组可以用XML语法来表示。
用这种结构描述并由机器处理大量数据,是非常自然的方法。
RDF模式是一个描述RDF资源的属性(Property)和类(Class)的词汇表,提供了关于这些属性和类的层次结构的语义。
语义到底是指什么?我们可以将语义简单地看作是数据(符号)所代表的概念的含义,以及这些含义之间的关系,是对数据的抽象或者更高层次的逻辑表示。
以关系数据库为例,数据库中的数据可以简单地存储在一张张表中,例如我们将学生基本信息存入到一张“学生”表中。
这时,对于表中的每一列数据所构成的集合,其所隐含的意思就是该列数据所要表达的对应的概念,这个概念往往体现为设计人员对该列数据对应的属性所给定的名称,例如“姓名”“性别”等。
这些属性之间的关系就相当于数据对应的概念之间所存在的关系,它们都是学生这个实体的属性。
数据库表中的属性和关系都可以看作数据的语义信息。
在了解了什么是语义之后,让我们来进一步讨论语法和语义在数据描述和交换中的作用。
对于人类来说,我们可以通过相同的语言进行交互,交互双方以他们共同遵守的语言组织规律
(相当于语法)对所要表达的信息含义(相当于语义)进行组织才能使对方理解。
人与人之间信息的传递并不需要非常严格的语法,即便是对方在语言表达上存在着一定的错误,我们仍然可以理解对方想要表达的意思。
但对于计算机之间的信息交换来说,语法与语义缺一不可。
数据正确的语法表达是保证计算机之间能够进行信息交换和处理的前提,而数据语义的描述则是数据可被计算机正确理解和推理的基础。
信息的语法描述是有差异的,我们往往通过必要的数据格式转化让目标应用能够处理,理想的情况应该是所有的信息都采用同样的语法来描述。
XML的出现使得不同类型的数据表示成同一格式成为可能。
XML已经成为WEB上数据表示和交换的事实标准,是应用之间或者机器之间共享数据的一种有效方式。
但是XML除了给我们提供了一个可以被应用自动化读取的格式外,并不能进一步促进数据交换的自动化,我们还需要通过专用的程序来对XML数据进行解释,以获取目标应用能够处理的数据。
XML存在的问题是XML不具备语义描述能力,因此万维网联盟推荐以RDF标准来解决XML的语义局限。
RDF提出了一个简单的模型用来表示任意类型的数据。
这个数据类型由节点和节点之间带有标记的连接弧所组成,节点用来表示WEB上的资源,弧用来表示这些资源的属性。
因此,这个数据模型可以方便地描述对象以及它们之间关系。
RDF和XML是互为补充的。
首先,RDF希望以一种标准化、互操作的方式来规范XML 的语义。
通过引用RDF,XML的解析过程与解释过程可以相结合。
也就是说,RDF可以帮助解析器在阅读XML的同时,获得XML所要表达的主题和对象,并根据它们的关系进行推理,从而做出基于语义的判断。
XML的使用可以提高WEB数据基于关键词检索的精度,而RDF与XML的结合则可以将WEB数据的关键词检索推进到对象检索。
其次,由于RDF是以一种建模的方式来描述数据语义的,这使得RDF可以不受具体语法表示的限制。
由于RDF的数据语义描述仍然可能存在语义冲突,所以我们在描述数据语义的时候可以通过引用本体的相关技术,对语义描述结果作进一步的约束,以消除语义冲突。
RDF (Schema)在提供了简单的机器可理解语义模型的同时,为领域化的Ontology语言提供了建模基础,并使得基于RDF的应用可以方便地与这些Ontology语言所生成的Ontology进行合并。
因此,RDF的这一特性使得基于RDF的语义描述结果具备了可以和更多的领域知识进行交互的能力。
(作者单位:山东广播电视台)
参考文献:
[1] Tim Berners-Lee, endler J, Lassila O. The semantic WEB[J]. Scientific American,2001, 284(5): 34-43.
[2]TimBerners-Lee.SemanticWEB-XML2000-slide”Architecture”[EB/OL]. http:
///2000/Talks-xml2k-tbl/Overview. html.
[3] Dan Bricley, Guha R V.RDF vocabulary description language 1.0: RDF schema [EB/OL].2003.http:///TR/2003/WD-rdf-schema-20030123/.
[4] Asunción Gómez-Pérez, Mariano Ferná-nedz-López, Oscar Corcho. Ontological Engiceering [M]. Springer, 2003, 5-25, 230-240.。