网络信息检索技术简介.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字图书馆与互联网基础标准体系
标准在数字图书馆建设中的重要性
从图书馆自身建设角度看 ➢ 从资源共享角度来看
标准在数字图书馆建设中的重要性
➢ 从图书馆自身建设角度看
数字图书馆作为基于网络环境提供数 字信息资源和服务的系统机制,需要建立 和遵循关于数字化加工、资源描述、资源 组织、资源互操作和资源服务等方面的标 准和规范,需要采用和遵循内容编码、数 据通信、计算机系统、安全、管理、知识 产权、服务运营等方面的标准和规范,才 能保证所建立的资源和服务的可用性、互 操作性和可持续性。
标准在数字图书馆建设中的重要性
通过从图书馆自身建 设和资源共享两方面分 析,
可以说,在数字化网 络化环境下,任何孤立、 封闭的数字图书馆系统 都将失去生存和发展的 能力,而实现一个开放、 互操作和集成的数字图
书馆系统的基础是标准 规范。
数字图书馆与互联网基础研究
随着数字图书馆研究的进一步发展, 数字图书馆基本概念已经扩展成为“新一 代互联网的信息管理模式”研究。
标准在数字图书馆建设中的重要性
➢ 从资源共享角度来看
随着数字资源的迅速发展和网络化信 息服务的不断丰富,数字图书馆系统正 向开放、集成,并与其它数字信息系统 灵活融合的发展阶段,任何一个数字图 书馆都将作为整个数字信息环境中的一 个模块,按照整体环境的标准规范来组 织资源、提供服务,才能保证自己系统 的资源和服务的通用性,才能有效利用 整体环境中的其它资源与服务来提高对 自己用户的服务能力和效率 。
数字图书馆标准体系
3. 数字信息互操作标准体系。
网络环境下数字信息系统的可用性、互 操作性和可持续性不仅涉及信息资源的组织、 描述、利用和保存,还必然涉及到网络通讯、 计算机系统与数据库、安全机制、知识产权 管理机制、服务管理机制等多方面的标准和 规范,从而全面地建立数字信息系统的互操 作标准体系,也系统地支持网络化数字化的 信息交流与服务。
从互联网发展角度来看,随着信息高速公
路的建设,信息传输技术已经十分发达, 然而人们能够获得的真正有用信息并不很 多。信息资源的飞速增长和用户获取信息 能力相对不足之间的矛盾已经成为互联网 技术进一步发展的瓶颈。
数字图书馆与互联网基础研究
➢ 互联网正在从以传输技术为核心的“互联 时代”发展到以信息检索技术为核心的 “内容时代”,随着互联网技术核心的转 变,其相关的标准体系也需要从保证”互 联”的阶段过渡到以“信息获取”为核心 的新阶段,从底层到应用层的互联网新协 议都应顺应这种互联网建设指导思想的变 化。在这种环境下,一直以信息检索为核 心的图书馆研究也必然被赋予新的历史使 命。
互联网信息检索基础平台
解决方法:以Web技术中的Webservice为 核 心,结合OAI元数据采集系统构 建馆内资源整合系统。
二.组织间的信息共享整合
各个高校科研机构一般都有很多自有的特 色数据资源,但这些资源的使用一般都限 于各个单位内部,缺乏一种协调管理和共 享机制,各单位投入大量的资金,建立的 信息资源的使用效率极为低下,而且存在 很多资源重复建设问题。
标准化建设的主要原则
➢ 选择标准时以国际化原则为主 很多信息资源都购自国外,而一些底
层支持协议也是国外学者制定的,仅仅 是“国家标准”将很难保证所建应用系 统的兼容性和完整性 。此外一些信息检 索标准已经逐步成为互联网的基础性标 准,而互联网显然也不会允许有国家标 准的存在。
标准化建设的主要原则
互联网信息检索基础平台
➢ 相关研究:IETF (Internet Engineering Task force)构建互联网信息检索基础框 架的标准提案“域内资源整合系统” 。 主要思路是利用现存的DNS的分层的分 布式基本体系结构,结合数字图书馆中的 三种结构检索系统,应用 Webservice/UDDI技术,构建了一种较 为完整的信息检索和服务共享平台。
➢ 标准制定时以简单易行为原则,同时加 强和国际化组织的合作。在图书馆这样 的环境中,一些看似精美,但复杂程度 较高的标准一般都难以实施。而要让数 字图书馆的解决方案真正成为整个互联 网的解决方案,和一些互联网标准化组 织如IETF(Internet Engineering Task Force)、W3C(World Wide Web Consortia)等合作,数字图书馆研究要 进一步发展,走国际化合作的道路是必 由之路。
➢ 相关的标准规范是两个领域解决问题的共同手段。 数字图书馆和互联网领域协议规范的交叉研究将
是解决目前互联网信息共享、整合问题的关键。
数字图书馆标来自百度文库体系
数字图书馆领域本身处于不断发展的过 程中,而且数字图书馆和其它系统(如数字 科研、远程教育、数字博物馆、电子商务等) 不断相互融合扩展。因此数字图书馆相应的 标准规范也在不断的发展中。从数字图书馆 建设和应用的角度,至少可从三个方面来界 定数字图书馆标准规范的范围与结构:
数字图书馆与互联网基础研究
➢ 数字图书馆的一个较为公认的定义就是:数字图 书馆是采用现代高新技术支持的数字信息资源系 统,是下一代互联网上信息资源的管理模式,它 将从根本上改变目前互联网上信息分散、不便使 用的现状。
➢ 数字图书馆研究和互联网基础体系研究已经相互 融合而不再是毫不相关的两个独立领域。
数字图书馆与互联网基础标准体系
数字图书馆标准体系和互联网基础标准 中结合较为紧密的两个方面: 互联网信息检索基础平台。 信息服务整合平台。
互联网信息检索基础平台
互联网信息检索问题集中体现在当前的
数字图书馆建设中,主要反映在以下两个方
面:
一.组织级别的资源整合问题
图书馆购买或自建大量数据库,丰富资源 在给读者更多的选择的同时却带来信息检 索的不便。读者若想获得全面而准确的结 果往往需要依次进入各个电子资源的搜索 界面逐一搜索,并且要对各个数据库的搜 索规则有足够的认识,方可获得所需的信 息。这里主要解决图书馆中的异构资源进 行统一检索。
数字图书馆标准体系
1. 数字资源加工和描述标准体系 ,这类
标准体系的内容主要涉及:数字文件 格式标准、数字文件标识标准、数字 对象描述性元数据模式框架和具体描 述格式、元数据内容描述体系。
2. 数字资源生命周期标准框架,围绕数
字资源创建、描述、组织、检索、服 务和长期保存的整个生命周期来规划、 设计、组织标准规范。
标准在数字图书馆建设中的重要性
从图书馆自身建设角度看 ➢ 从资源共享角度来看
标准在数字图书馆建设中的重要性
➢ 从图书馆自身建设角度看
数字图书馆作为基于网络环境提供数 字信息资源和服务的系统机制,需要建立 和遵循关于数字化加工、资源描述、资源 组织、资源互操作和资源服务等方面的标 准和规范,需要采用和遵循内容编码、数 据通信、计算机系统、安全、管理、知识 产权、服务运营等方面的标准和规范,才 能保证所建立的资源和服务的可用性、互 操作性和可持续性。
标准在数字图书馆建设中的重要性
通过从图书馆自身建 设和资源共享两方面分 析,
可以说,在数字化网 络化环境下,任何孤立、 封闭的数字图书馆系统 都将失去生存和发展的 能力,而实现一个开放、 互操作和集成的数字图
书馆系统的基础是标准 规范。
数字图书馆与互联网基础研究
随着数字图书馆研究的进一步发展, 数字图书馆基本概念已经扩展成为“新一 代互联网的信息管理模式”研究。
标准在数字图书馆建设中的重要性
➢ 从资源共享角度来看
随着数字资源的迅速发展和网络化信 息服务的不断丰富,数字图书馆系统正 向开放、集成,并与其它数字信息系统 灵活融合的发展阶段,任何一个数字图 书馆都将作为整个数字信息环境中的一 个模块,按照整体环境的标准规范来组 织资源、提供服务,才能保证自己系统 的资源和服务的通用性,才能有效利用 整体环境中的其它资源与服务来提高对 自己用户的服务能力和效率 。
数字图书馆标准体系
3. 数字信息互操作标准体系。
网络环境下数字信息系统的可用性、互 操作性和可持续性不仅涉及信息资源的组织、 描述、利用和保存,还必然涉及到网络通讯、 计算机系统与数据库、安全机制、知识产权 管理机制、服务管理机制等多方面的标准和 规范,从而全面地建立数字信息系统的互操 作标准体系,也系统地支持网络化数字化的 信息交流与服务。
从互联网发展角度来看,随着信息高速公
路的建设,信息传输技术已经十分发达, 然而人们能够获得的真正有用信息并不很 多。信息资源的飞速增长和用户获取信息 能力相对不足之间的矛盾已经成为互联网 技术进一步发展的瓶颈。
数字图书馆与互联网基础研究
➢ 互联网正在从以传输技术为核心的“互联 时代”发展到以信息检索技术为核心的 “内容时代”,随着互联网技术核心的转 变,其相关的标准体系也需要从保证”互 联”的阶段过渡到以“信息获取”为核心 的新阶段,从底层到应用层的互联网新协 议都应顺应这种互联网建设指导思想的变 化。在这种环境下,一直以信息检索为核 心的图书馆研究也必然被赋予新的历史使 命。
互联网信息检索基础平台
解决方法:以Web技术中的Webservice为 核 心,结合OAI元数据采集系统构 建馆内资源整合系统。
二.组织间的信息共享整合
各个高校科研机构一般都有很多自有的特 色数据资源,但这些资源的使用一般都限 于各个单位内部,缺乏一种协调管理和共 享机制,各单位投入大量的资金,建立的 信息资源的使用效率极为低下,而且存在 很多资源重复建设问题。
标准化建设的主要原则
➢ 选择标准时以国际化原则为主 很多信息资源都购自国外,而一些底
层支持协议也是国外学者制定的,仅仅 是“国家标准”将很难保证所建应用系 统的兼容性和完整性 。此外一些信息检 索标准已经逐步成为互联网的基础性标 准,而互联网显然也不会允许有国家标 准的存在。
标准化建设的主要原则
互联网信息检索基础平台
➢ 相关研究:IETF (Internet Engineering Task force)构建互联网信息检索基础框 架的标准提案“域内资源整合系统” 。 主要思路是利用现存的DNS的分层的分 布式基本体系结构,结合数字图书馆中的 三种结构检索系统,应用 Webservice/UDDI技术,构建了一种较 为完整的信息检索和服务共享平台。
➢ 标准制定时以简单易行为原则,同时加 强和国际化组织的合作。在图书馆这样 的环境中,一些看似精美,但复杂程度 较高的标准一般都难以实施。而要让数 字图书馆的解决方案真正成为整个互联 网的解决方案,和一些互联网标准化组 织如IETF(Internet Engineering Task Force)、W3C(World Wide Web Consortia)等合作,数字图书馆研究要 进一步发展,走国际化合作的道路是必 由之路。
➢ 相关的标准规范是两个领域解决问题的共同手段。 数字图书馆和互联网领域协议规范的交叉研究将
是解决目前互联网信息共享、整合问题的关键。
数字图书馆标来自百度文库体系
数字图书馆领域本身处于不断发展的过 程中,而且数字图书馆和其它系统(如数字 科研、远程教育、数字博物馆、电子商务等) 不断相互融合扩展。因此数字图书馆相应的 标准规范也在不断的发展中。从数字图书馆 建设和应用的角度,至少可从三个方面来界 定数字图书馆标准规范的范围与结构:
数字图书馆与互联网基础研究
➢ 数字图书馆的一个较为公认的定义就是:数字图 书馆是采用现代高新技术支持的数字信息资源系 统,是下一代互联网上信息资源的管理模式,它 将从根本上改变目前互联网上信息分散、不便使 用的现状。
➢ 数字图书馆研究和互联网基础体系研究已经相互 融合而不再是毫不相关的两个独立领域。
数字图书馆与互联网基础标准体系
数字图书馆标准体系和互联网基础标准 中结合较为紧密的两个方面: 互联网信息检索基础平台。 信息服务整合平台。
互联网信息检索基础平台
互联网信息检索问题集中体现在当前的
数字图书馆建设中,主要反映在以下两个方
面:
一.组织级别的资源整合问题
图书馆购买或自建大量数据库,丰富资源 在给读者更多的选择的同时却带来信息检 索的不便。读者若想获得全面而准确的结 果往往需要依次进入各个电子资源的搜索 界面逐一搜索,并且要对各个数据库的搜 索规则有足够的认识,方可获得所需的信 息。这里主要解决图书馆中的异构资源进 行统一检索。
数字图书馆标准体系
1. 数字资源加工和描述标准体系 ,这类
标准体系的内容主要涉及:数字文件 格式标准、数字文件标识标准、数字 对象描述性元数据模式框架和具体描 述格式、元数据内容描述体系。
2. 数字资源生命周期标准框架,围绕数
字资源创建、描述、组织、检索、服 务和长期保存的整个生命周期来规划、 设计、组织标准规范。