linked data
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7
Content
RDF简介 RDF简介
URI
Linked Data
Linked Data的应用 Data的应用
8
为什么引入URI? ? 为什么引入
采用URL( Uniform Resource Location ) 采用 可以用一种统一的格式来描述各种信息资源, 可以用一种统一的格式来描述各种信息资源 包括文件、服务器的地址和目录等。 包括文件、服务器的地址和目录等。目前最 大的缺点是当信息资源的存放地点发生变化 必须对URL作相应的改变。因此人们正 作相应的改变。 时,必须对 作相应的改变 在研究新的信息资源表示方法(URI)。 在研究新的信息资源表示方法 。
9
URI简介 简介
Web上可用的每种资源 —HTML文档、 上可用的每种资源 文档、 文档 图像、视频片段、 图像、视频片段、程序等 —由一个通用资源 由一个通用资源 标志符( 标志符(Uniform Resource Identifier, 简称 “URI”)进行定位。 简单地说,URI是以某 )进行定位。 简单地说, 是以某 种统一的(标准化的)方式标识资源 标识资源的简单 种统一的(标准化的)方式标识资源的简单 字符串。 字符串。
14
为什么叫关联数据? 为什么叫关联数据?
URI 所表示的是数据,而不是文档; 所表示的是数据,而不是文档; URI 的数据资源以 RDF 形式表达,其中有 形式表达, 指向更多数据的 URI,也就是链接; ,也就是链接; RDF 所表达的链接其实是有语义的,不仅 所表达的链接其实是有语义的, 而已, 仅是一个 link 而已,而是表明了当前资源 与被链接资源的关系。 与被链接资源的关系。
13
通俗的说, 通俗的说,关联数据是数据的一种发布 方式, 的方式链接到一个数据对象, 方式,以 URI 的方式链接到一个数据对象, 而不是一个文档; 而不是一个文档;并且这个数据对象基本上 来描述的( 是由 RDF 来描述的(这样才能保证数据具有 语义),而且RDF文件中应该包含更多的 语义),而且 文件中应该包含更多的 ),而且 URI所标识的其它资源。 所标识的其它资源。 所标识的其它资源
10
Content
RDF简介 RDF简介
URI
Linked Data
Linked Data的应用 Data的应用
11
引言
关联数据( 关联数据 linked data)这个概念来自 这个概念来自 W3C, Tim Berners- Lee于2006年首次提出 于 年首次提出 关联数据的思想及四个基本原则。 关联数据的思想及四个基本原则。关联数据 通过网络把以前没有关联的相关数据连接起 已经成为推动语义 语义Web发展的重要力量 来, 已经成为推动语义 发展的重要力量 之一, 并得到了政府、企业、研究机构、 之一 并得到了政府、企业、研究机构、图书 馆等各方面的广泛关注。 馆等各方面的广泛关注。
5
RDF的作用(1) 的作用( ) 的作用
由于使用的是结构化的XML数据 搜 数据,搜 由于使用的是结构化的 数据 索引擎可以理解元数据的精确含义, 索引擎可以理解元数据的精确含义,使 得搜索变得更为智能和准确, 得搜索变得更为智能和准确,完全可以 避免当前搜索引擎经常返回无关数据的 情况。当然前提RDF和标准化的 和标准化的RDF词 情况。当然前提 和标准化的 词 汇表在Web上广泛使用,而且搜索引擎 上广泛使用, 汇表在 上广泛使用 需要能够理解使用的词汇表。 需要能够理解使用的词汇表。
匹配证据的显示: 匹配证据的显示:在结果页 面中, 面中 从每个匹配查询的文 档中提取出包含用户查询关 键词的最小RDF 句子集合 句子集合, 键词的最小 作为证据显示给用户. 作为证据显示给用户
23
Thanks! !
24
16
Content
RDF简介 RDF简介
URI
Linked Data
Linked Data 的应用
17
Linked Data 应用于语义网
语义网就是能够根据语义进行判断的 网络。简单地说, 网络。简单地说,语义网是一种能理解人 类语言的智能网络, 类语言的智能网络,它不但能够理解人类 的语言, 的语言,而且还可以使人与电脑之间的交 流变得像人与人之间交流一样轻松。 流变得像人与人之间交流一样轻松。
关联数据及其应用
1
Content
RDF 简介
URI
Linked Data
Linked Data的应用 的应用
2
Content
RDF 简介
URI
Linked Data
Linked Data的应用 Data的应用
3
RDF的概念 的概念
RDF(Resource Description Framework)即 即 框架, 资源描述框架 它专门用于表达关于Web资 资 资源描述框架,它专门用于表达关于 源的元数据。所谓元数据,就是“描述数据的 源的元数据。所谓元数据,就是 描述数据的 数据”或者 描述信息的信息”。 或者“描述信息的信息 数据 或者 描述信息的信息 。比如书的内容 是书的数据,而作者的名字、 是书的数据,而作者的名字、出版社的地址 或版权信息是书的元数据。 或版权信息是书的元数据。
20
基于RDF句子的语义网文档搜索 句子的语义网文档搜索 基于
在文档模型上, 采用的是基于RDF 句子 在文档模型上 采用的是基于 的向量空间模型, 并引入URI 资源的权威描述 的向量空间模型 并引入 的概念。 的概念。整个语义网文档的索引过程如下图 所示 。
21
22
结果的呈现如下图所示
文档元数据: 文档元数据: 从语义网文 档中提取出文档元数据, 档中提取出文档元数据 从 中筛选出能够帮助用户快速 理解该文档的元数据信息显 示给用户。 示给用户。
语义网的体系结构
第四层: 本体词汇集) 第四层 Ontology vocabulary( 本体词汇集 它用于描述各类资源及资源之间的关系, 它用于描述各类资源及资源之间的关系,实 第三层: 第三层 RDF+ RDF Schema( 资源描述框 现对词汇表的扩展。 现对词汇表的扩展NS ( Namespace ) + 第二层: 第二层 XML + 。 资源描述框架大纲)它负责提供语义模型 架+资源描述框架大纲 它负责提供语义模型 资源描述框架大纲 XMLSchema ( 可扩展标记语言 名域 可 可扩展标记语言+ 名域+ 来描述We Unicode、Proof、Trust。Logic负 来描述 第五至七层: 第一层: 国际码+ 第五至七层:Logic、 URI( 国际码 。 第一层 b 上的信息内容和结构 统一资 负 、 扩展标记语言大纲)它负责从语法上表示数 扩展标记语言大纲+ 它负责从语法上表示数 责提供公理和推理规则, 源标识)它是整个体系结构的基础 它是整个体系结构的基础。 一旦建立, 责提供公理和推理规则,而Logic一旦建立, 源标识 它是整个体系结构的基础。其中 一旦建立 据的内容和结构。 据的内容和结构。 Unicode 是一个字符集 负责处理资源的编 是一个字符集, 便可以通过逻辑推理对资源、 便可以通过逻辑推理对资源、资源之间的关系 负责资源的标识, 它使信息、 码。 URI 负责资源的标识 它使信息、情 以及推理结果进行验证,证明其有效性。 以及推理结果进行验证,证明其有效性。通过 Proof交换以及数字签名,建立一定的信任关 报精确检索成为可能。 交换以及数字签名, 报精确检索成为可能。 交换以及数字签名 系,从而证明语义网输出的可靠性以及其是否 符合用户的要求。 符合用户的要求。
6
RDF的作用(2) 的作用( ) 的作用
RDF解决的是如何采用 解决的是如何采用XML标准语法无 解决的是如何采用 标准语法无 二义性地描述资源对象的问题, 二义性地描述资源对象的问题,使得所描述 的资源的元数据信息成为机器可理解的信息。 的资源的元数据信息成为机器可理解的信息。 如果把XML看作为一种标准化的元数据语法 如果把 看作为一种标准化的元数据语法 规范的话,那么RDF就可以看作为一种标准 规范的话,那么 就可以看作为一种标准 化的元数据语义描述规范。 化的元数据语义描述规范。
15
创建关联数据,应遵循如下四个原则: 创建关联数据,应遵循如下四个原则
1、使用URI(统一资源标识符 作为对象的名称 、使用 统一资源标识符)作为对象的名称 统一资源标识符 作为对象的名称; 2、通过使用 、通过使用HTTP URI, 人们可以定位到具体 的对象; 的对象 3、通过查询对象的 、通过查询对象的URI, 可以提供有意义的信 采用RDF、SPARQL标准 标准); 息( 采用 、 标准 4、提供相关的 链接, 、提供相关的URI链接 以便可以发现更多的 链接 对象。 对象。
12
什么是关联数据? 什么是关联数据?
维基百科中的定义: 维基百科中的定义 关联数据是一种推荐的 最佳实践,用来在语义网中使用URI和RDF 语义网中使用 最佳实践,用来在语义网中使用 和 发布、分享、连接各类数据、信息和知识。 发布、分享、连接各类数据、信息和知识。
(“A term used to describe a recommended best practice for exposing ,sharing ,and connecting pieces of data ,information ,and knowledage on the Semantic Web using URI and RDF.”)
18
未来的语义网
语义网将使人类从 搜索相关网页的繁重劳 动中解放出来。因为网 中的计算机能利用自己 的智能软件,在搜索数 以万计的网页时,通过 “智能代理”从中筛选出 相关的有用信息。而不 像现在的万维网,只给 你罗列出数以万计的无 用搜索结果。
19
在浏览新闻时,语义 网将给每一篇新闻报道 贴上标签,分门别类的 详细描述哪句是作者、 哪句是导语、哪句是标 题。这样,如果你在搜 索引擎里输入“老舍的 作品”,你就可以轻松 找到老舍的作品,而不 是关于他的文章。
4
简单而言,一个 简单而言,一个RDF文件包含多个资源 文件包含多个资源 描述,而一个资源描述是由多个语句构成, 描述,而一个资源描述是由多个语句构成, 一个语句是由资源、属性类型、 一个语句是由资源、属性类型、属性值构成 的三元体,表示资源具有的一个属性。 的三元体,表示资源具有的一个属性。资源 描述中的语句可以对应于自然语言的语句, 描述中的语句可以对应于自然语言的语句, 资源对应于自然语言中的主语, 资源对应于自然语言中的主语,属性类型对 应于谓语,属性值对应于宾语。 应于谓语,属性值对应于宾语。