信息检索教程第七章
信息检索教程(第三版)PPT8
7.1 现代信息检索技术概述 7.2 倒排索引 7.3 布尔检索模型 7.4 向量空间模型 7.5 检索评价指标 7.6 现代信息检索关联技术
本章要点
● 现代信息检索的处理过程与信息检索模型 ● 倒排索引的基本 ● 布尔检索模型的基本思想与实现方法 ● 向量空间模型的基本思想与实现方法 ● 现代信息检索的不同评价指标与特点
7.1.1 现代信息检索技术的处理对象
在现代信息检索技术兴起之前,关系数据库是常见的信息存储和检索方式,之后,伴 随着互联网的发展以及文字处理软件的广泛应用,产生了大量非结构化的文档,例如 网 页、WORD文档、PDF文档等。
现实世界中的非结构化信息,除文本之外,还包括音频、视频、图像等多媒体数据。 广义上来说,现代信息检索的处理对象包括文本、音频、视频、图片、以及其他二进
D 是文档集的计算机表示形式; Q是查询的计算机表示形式,用于近似替代用户的信息需求; F是文档表示、查询表示以及它们之间关系的模型框架; R (qi,dj)是查询qi与文档dj的相关度大小的评价函数,检索模型利用该评价函数 确定
相关文档集的排列顺序。
7.2 倒排索引
7.2.1 词项-文档关联矩阵
7.5 检索评价指标
7.5.1 无序结果集评价指标
信息检索评价是指对信息检索系统的性能进行评估的活动,主要考察信息检索的结果 是否能够有效满足用户的信息需求。
理想的检索系统应该能够返回与用户信息需求相关的 所有文档,同时过滤掉所有非 相关的信息,然而实际上难以存在这种绝对理想的系统,因 此,检索评价的目标就 是来判断一个系统在满足用户检索需求方面的具体表现如何。
7.3 布尔检索模型
7.3.1 倒排索引的处理流程
《信息检索与利用》课程标准
江苏省新闻出版学校出版与发行专业(五年制高职)《信息检索与利用》课程标准一、概述(一)课程性质《信息检索与利用》是新闻出版与发行专业的专业基础课,通过系统的理论讲授与专门的实践操作训练,旨在帮助学生强化科技信息需求与表达,深入掌握科技信息查询与数据分析的知识、方法与技能,提高学生灵活运用信息资源体系、检索工具和方法解决科技类信息问题的能力,进而促进学生在现代信息环境下基于资源的学习和研究能力的增长,以达到全面强化学生的信息素质的目的。
并通过实践技能训练,提高学生的实践能力、创新能力和职业能力,为学生就业打下坚实的理论基础和职业基础。
(二)课程基本理念注重培养学生的专业思维能力和专业实践能力,把创新意识的培养贯穿于整个教学中。
采用理论与实践相结合的教学方法,培养学生分析问题、解决问题的能力。
通过理论讲述使学生掌握信息检索与数据分析的基本原理和基本方法;通过项目学习与训练使学生进一步理解掌握信息检索与利用的基本方法。
(三)课程设计思路以就业为导向,以能力为本位,以职业技能为主线,以情境单元课程为主题,尽可能形成基于职业岗位、工作过程的课程体系。
在具体学习项目的选择和编排中,以情境单元为基础,通过实训、案例分析、情景模拟、实战训练、上机操作等相结合的形式培养学生分析问题、解决问题的实际能力,以及对理论知识的深化了解。
本课各部分具体内容及课时分配如下表:二、课程目标(一)总目标通过对《信息检索与利用》课程学习,使学生学会信息检索与利用的基本概念、基本理论、基本方法,树立良好的信息检索理念,学会运用信息,培养学生发现、分析和解决问题的能力,熟练掌握信息检索与利用的策略和技术,养成良好的职业道德和职业思想。
(二)具体目标1.素质(1)具备较高的信息素养,理解合理合法构建专业信息资源体系在知识创新中的重要作用。
(2)掌握信息检索的基础知识(信息检索方法、信息检索策略、信息检索步骤、信息检索结果的识别)。
(3)掌握一定的统计分析方法。
信息检索教程-考研笔记
信息检索教程-考研笔记考研季即将来临,为了帮助各位考生顺利备战考试,本篇文章将为大家介绍与信息检索相关的一些知识和技巧。
希望通过本教程的学习,能够帮助大家更加高效地获取所需的学习资源和资料。
一、信息检索的定义与意义信息检索,是指通过计算机或其他技术手段,从大量信息中准确快速地检索出符合用户需求的信息的过程。
在当今信息爆炸的时代,信息检索变得越来越重要。
对于考研学生而言,高效地获取相关的学术文献、重要资料以及历年真题等信息,对于备考至关重要。
二、常用的信息检索工具1.图书馆资源考研生首先可以利用学校图书馆的资源。
图书馆通常会提供各类学术期刊、论文数据库以及电子书籍等,这些资源对于到考生的研究工作非常有用。
2.学术搜索引擎除了图书馆资源外,考生还可以使用学术搜索引擎,如Google Scholar、百度学术、CNKI等。
这些搜索引擎会对全球范围内的学术论文、期刊进行索引,方便考生查找相关的研究成果。
3.在线论坛和社群考生还可以加入一些学术研究相关的在线论坛和社群,与其他同行交流心得和资源。
这些论坛和社群通常会有一些共享资源,能够为考生提供一些有用的资料和信息。
三、信息检索的技巧与方法1.关键词的选择在进行信息检索时,选择合适的关键词非常重要。
考生需要根据自己的研究课题和需求,选择与之相关的关键词,以获取更准确的检索结果。
同时,使用适当的逻辑运算符(如AND、OR、NOT)可以帮助考生缩小或扩大检索范围。
2.筛选与过滤大量的信息中往往夹杂着一些无用的内容,考生需要学会筛选与过滤。
通过设置筛选条件、选择合适的文献类型和年代范围等方式,可以快速定位到所需的信息,提高检索效率。
3.引用文献的检索引用文献是考研学习中重要的参考资源。
考生可以通过检索相关的论文,查找该论文被引用的文献,从而获得更多的研究成果和理论支持。
四、信息检索的注意事项1.了解数据库特点不同的数据库具有不同的特点和检索规则,考生在使用之前应该先了解清楚。
信息检索课件汇总全书电子教案完整版课件(最新)
1.文献按其出版形式分类 (1)图书(Book) (2)期刊(Periodical) (3)会议论文(Conference Paper) (4)专利文献(Patent Document) (5)科技报告(Sci-Tech Report) (6)标准(Standard) (7)学位论文(Dissertation) (8)技术档案(Technical Records)
1.2 计算机信息检索基础
1.2.4 计算机信息检索的原理
1.计算机信息存储过程 2.计算机信息检索过程
1.2 计算机信息检索基础
1.2.5 计算机信息检索系统的构成
1.计算机硬件 2.软件 3.数据库 (1)参考数据库。 (2)源数据库。 4.通信网络
1.2 计算机信息检索基础
1.2.6 计算机信息检索的基本技术
二次检索
3.2 万方数据知识服务平台
3.2.1 快速检索
二次检索结果
3.2 万方数据知识服务平台
3.2.2 Leabharlann 级检索高级检索页面3.2 万方数据知识服务平台
2.1.2 Internet信息资源的特点
1.信息源丰富 2.信息内容多样性 3.信息表现形式多样化 4.信息时效性 5.信息交互性 6.信息关联性 7.信息的开放性 8.免费信息资源丰富 9.信息组织的局部有序性与整体无序性
2.1 Internet信息资源及其组织方式
2.1.3 Internet信息资源及检索方法
2.2 Internet信息资源检索工具
2.2.3 阅读软件的安装和使用
1.Acrobat Reader的安装与启动 2.Acrobat Reader的基本操作 (1)打开文件。 (2)阅读文件。 (3)选择和复制文件。 3.CAJViewer的安装与启动 4.CAJViewer的基本操作
信息检索教程-考研笔记
信息检索教程一、信息的含义广义:指自然界和一切人类活动所传达出来的信号和消息,是事物表现的一种普遍形式。
从本质上说,信息是事物自身(显示其存在方式)的属性,是客观存在的现象。
狭义:指经过搜集、记录、处理和存储的可供检索的文献,数据和事实。
它是人类对客观事物认识,是实践经验的总结,是认识的结果,是我们检索的对象。
二、信息的特征信息的两种基本状态:可存储性和可传递性1.可存储性:人们可以有意识地将流动的信息以某种方式存储在物质媒介上,使信息和物质媒介构成一种依附性很强的、相对稳定的关系,从而有效地避免信息流失,也使信息检索有源可寻2.可传递性:指信息可以通过一定的传输工具和载体进行传递,从而形成信息联系,被人们感受和接收。
信息传递有空间传递和时间传递等不同类型,需要依赖一定的物质载体,具有动态性和方向性的特征。
3.可转换性:表现在两个层面:信息在一定条件下可转化成物质,能量,金钱等其它东西,这种转换主要依靠人类对信息的正确利用。
信息可以从一种形态转换成为另一种形态,自然信息可转换为语言,文字和图像,也可转换为电磁波信号或计算机代码。
4.可处理性:信息可通过分类,整序,分析,综合,压缩,扩充等加工处理,而达到便于识别,效用更高的信息5.可共享性:同一种信息可以同时被许多人共同享用,这是信息不同于物质和能量的一个非常重要特征。
信息可以广泛地扩散和传播,信息交换的双方不会失去原有的信息,而且还会增加新的信息。
6.可识别性:信息做为表现事物特征的一种普遍形式,反映了事物的运动状态和存在方式,人类可以通过自身的器官去直接感觉和知觉信息,通过比较去认识信息,借助于先进的信息技术和手段去识别信息。
7.依附性:信息无法脱离物质而独立存在,在其存储和传递过程中必须依附于一定的物质载体,信息与物质载体构成一个整体。
8.普遍性:信息是物质的基本属性,普遍存在于自然界和人类社会之中,也存在于人类的思维或精神领域之中。
只要有物质存在的地方,就有信息的存在。
信息检索教程学习报告 (500字)
信息检索教程学习报告一.学习自我评价刚开始接触信息检索这门课觉得很茫然,因为从来没有接触过,甚至听说过,所以对这门课很有兴趣,有知识的好奇才是学习的原动力,所以我比较认真的听课,通过这一学期的学习多多少少还是对这个学科有一点了解,随着现代信息技术的快速发展,信息数量呈爆炸性增长,信息的存储和传播方式发生了巨大的变革,而信息的杂乱性、无序性、分散性无疑加大了查找和利用信息的难度,影响了获取信息的质量和效率。
于是信息检索便应运而生,而通过这一学期的学习,我掌握了信息检索的方法和技巧,提高了自己的学习效率,提高了自己解决问题的能力,最主要的还是给生活上提供了很大的方便,最基本的,查找信息的时间大大减少这都得益于信息检索这门课和尚老师的教导,而自己在学习上也比较认真和努力,所以说也算基本掌握了这门课的主要内容,而在生活上的种种收获更让我觉得知识的,通过尚老师的教授和自己对这门课的学习,提高了自己的素质,也十分感谢。
二.课堂学习收获信息检索这门课总共包括九章,虽说每一章内容不一样,但是核心却是一样的,都是服务生活,信息的客观,时效,传递,共享这些属性让我们更全面具体的了解了信息,作为一个喜爱浏览杂志期刊的学生,第四章给我很大的帮助,了解了检索期刊的途径和工具,更是了解到期刊全文数据库,以及检索方法,而通过第五章的学习,更是给我们平时的学习生活提供力很大帮助通过对学术论文的了解,以及对论文检索方法和技巧和地方的学习,给现在提供了很大帮助,耿鬼以后的毕业论文打下了基础,而国外论文的学习更是丰富了我们的学习生活,各种科技报告和文献的学习也是、对我们帮助很大,七八章的学习更是让我们平时的生活丰富和方便,最后我们还有两百道题的学习巩固,更是让我们收获很多,增长见识,让自己在如今的社会中取得一定的优势。
三.上机实验收获上机是对所学知识的应用实践,是巩固提高我们所学知识的手段以及最佳方法,在上机中我们通过网络对老师要求的内容进行检索,让我们对所学知识进行深化,通过布尔逻辑方式,特定文件类型检索,精确匹配——双引号,把搜索范围限定在特定站点中——site等好几种方式去检索。
信息检索教程(第一章)
11
1.2.3 文献
人类的信息、知识的存在形式基本上有三种:
1)存在于人脑的记忆中,属于人们主观精神世界的东西; 2)存在于实物中,如古文物、样品、物品等,人们通过研究实物 获得某种知识; 3)用文字、图形、代码、符号、声频、视频等技术手段记录在一 定的载体上,如甲骨上、纸、胶片、光盘、磁盘等载体上,这就 是文献。
18
(2)根据检索对象形式的不同分类 文献检索:是一种相关检索,凡以文献(包括文摘、题录或全文)为检索对象的
检索,一般它不直接解答用户所提出的技术问题本身,只提供与之相关的文献 供用户参考。 例如:检索北京交大的作者2005年发表的科技文献被SCI、Ei、ISTP收录的情况。
数据或事实检索:是一种确定性检索,凡以数据或事实为检索对象 的, 直接回答用户提出的技术问题,提供用户所需要的确切数据 或事实。检索结果一般是确定性的有或无,对或错。
17
3.信息检索方式
(1)根据信息的存储载体和检索技术手段的不同分类 手工检索:传统检索方法,是指手工翻检的方式,利用工具书 等各种印刷版的检索工具(包括文本式目录、文摘、索引以 及各种卡片等)来检索信息的一种手段。适用于纸质印刷的 书刊文献。 例如:《计算机应用文摘》、《电子科技文摘》等。 计算机检索:使用的是检索系统。系统包括计算机设备、终端 、通信设施、数据库和检索、应用软件等。检索是针对数据 库进行的。即利用计算机检索系统从数据库中检索所需文献 信息。 例如:Dialog、Ei、ISTP、万方数据资源系统等。
的发展,科技技术的进步 都离不开信息资源的开发 利用。 我们怎样快速的查找 信息和有序的整理信息? 信息检索是最快的途径。
● 讨论信息检索系统
● 梳理信息检索方法
5
《信息检索》完整版
第1章信息资源概论1、信息资源的涵义:信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。
2、信息资源的类型及各自的特点(1)电子信息资源的特点:存储形式多样化;资源数字化;可交流程度高;方便利用;内容丰富;载体容量大。
(2)纸质文献资源的特点:携带、书写、保存方便;直观性;以纸质为载体的艺术作品的不可替代性;纸质文献作为收藏品的不可替代性。
第2章信息存储与检索基础1、信息存储与检索的基本原理为了促进信息资源的充分交流和有效利用,使用户在信息集合中快速、精确、全面地获得特定需要的信息资源,必须要对广泛、大量、分散、无序的信息进行搜集、记录、组织、存储,以建成各种信息存取系统。
用户则根据检索需要,将需求转变为系统所能识别的检索式,再与存取系统中表征信息资源特征的标识进行逐一的相符性匹配与比较,两者完全一致或部分一致时,即为命中信息,可按用户要求从存取系统中输出。
2、信息存储与检索的历程信息存储与检索走过了文献检索、情报检索的历程,并且正在向着知识检索的领域迈进3、信息检索通常包括的四种类型1)关于文献的检索;2)关于某事实或事项的知识检索;3)关于数值或数据的情报检索;4)关于图像信息的信息检索.4、索引的概念索引(Index)是存取信息资源“地址”或“出处”的标识系统,是信息存储与检索的基本形式。
索引的基本功能是指示知识点在正文或文献款目中的位置。
传统的文本式检索工具通常由两部分组成,即文摘正文部分和辅助索引部分。
①②③分别代表什么1.)索引标题词2.)说明语3.)地址参考项6、引文索引的概念引文索引是近30年来出现的一种新型的索引形式。
其特点是,把一系列具有引用与被引用关系的科学文献以多向线性的方式联系起来,提供一个以引证关系为依据来检索文献的新途径。
引文索引的主要职能是,回答某作者的论文曾经被哪些人的文章所引证,这些文章何时发表在何种刊物上。
第3/4章信息存取途径与检索策略1、布尔逻辑算符用户利用逻辑算符构造检索式,可将一些具有简单概念的检索词(或检索项)组配成为一个具有复杂概念的检索式,用以表达用户的检索需求。
信息检索技术讲义
中截断主要用于
• 第一,单复数在词中元音上变化的情况 --man men ; goose geese • 第二,动词与名词拼写的不同 --advice advise • 第三,同一单词英美拼写的差异 --defense defence
ORBIT前后截词
CHEMICAL CHEMISTRY CHEMISORPRION CHEMIST ELECTROCHEMICAL ELECTROCHEMISTRY PHYSICOCHEMICAL PHYSICOCHEMISTRY THERMOCHEMICAL THERMOCHEMISTRY
BRS
technique$1
词干后至多跟与截字符相同的字符数
DIALOG child????
child+children+ childish+childlike
ORBIT
child####
BRS
child$4
(2)无限截断(unlimited truncation),也称“开放式截断”
DIALOG中,词干后跟一个“?”
•
4、All that you do, do with your might; things done by halves are never done right. ----R.H. Stoddard, American poet做一切事都应尽力而为,半途而废永远不行
5.26.20215.26.202108:3008:3008:30:5708:30:57
• 布尔逻辑检索反映了检索词之间的逻辑关系, 属于一种定性的信息检索技术,这种定性检索 难以分辨出检索结果之间的重要程度。
• 严格的二值逻辑判断,使单纯布尔逻辑检索的 结果缺乏“量”的比较。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5
二、数字图书馆的含义
1990年美国密执安大学的研究人员首次 1990年美国密执安大学的研究人员首次 提出 : 数字图书馆是若干联合机构的总称, 数字图书馆是若干联合机构的总称,它 使人们能够智能地和实实在在地存取全球网 络上以多媒体数字化格式存在的、 络上以多媒体数字化格式存在的、为数巨大 且仍在不断增多的信息。 的,且仍在不断增多的信息。
10
广受认同的定义
美国数字图书馆联盟(Digital Library Federation) 美国数字图书馆联盟( ) 的定义广受认同,他们认为: 的定义广受认同,他们认为:“数字图书馆是一种提 供信息资源的组织,包括软硬件、网络与专业人员, 供信息资源的组织,包括软硬件、网络与专业人员, 以一致性、永久性的方式将数字化馆藏进行选择、 以一致性、永久性的方式将数字化馆藏进行选择、组 织提供查询、解释、传播与完整保存, 织提供查询、解释、传播与完整保存,以便于这些数 字馆藏,可以迅速、 字馆藏,可以迅速、经济地提供给特定社区与人们使 用。”
2Байду номын сангаас
(一) 网络技术的发展
计算机网络技术经历了四个发展时期 : 第一代—— 面向终端的网络 第一代 第二代—— 分组交换网 第二代 第三代—— 具有体系结构的网络 第三代 第四代—— 综合业务数字网 第四代
3
(二) 数字处理技术的进步
数字技术是指将各种采集到的信息, 数字技术是指将各种采集到的信息, 包括文字、图片、声音、图像、 包括文字、图片、声音、图像、动画等 原始信息,以数字的方式( 原始信息,以数字的方式(在计算机系 统中采用二进制数值“0” 1” 统中采用二进制数值“0”和“1”来表 进行存储、加工、处理、传输, 示)进行存储、加工、处理、传输,再 经转换后输出。 经转换后输出。
15
(一) 数字图书馆的基础结构
数字图书馆的基本结构图 :
16
(二) 数字图书馆的技术资源
数据库技术和网络通讯技术 数据描述和数据创建 全文检索 读书笔记 多媒体、超文本、 多媒体、超文本、超媒体技术 系统运行、维护、保障、 系统运行、维护、保障、开发技术
17
二、数字图书馆的信息组织方式
元数据是描述信息资源或数据本身特征和 属性的数据, 属性的数据,是用来规定数字化信息组织的一种 数据结构标准, 数据结构标准,是数字图书馆的基本信息组织方 Location) 式 。 元 数 据 具 有 定 位 ( Location)、 发 现 Discovery) Evaluation) ( Discovery)、 评 价 ( Evaluation)、 选 择 Selection)等几种功能。 (Selection)等几种功能。
7
2000年 年
杂志》 《D-Lib杂志》的创办者 杂志 的创办者William Y.Arms把 把 数字图书馆非正式地定义为 :
有组织的信息馆藏及相关服务,信息 有组织的信息馆藏及相关服务, 以数字化形式保存, 以数字化形式保存 , 并通过网络进行访 问。
8
国外学者的观点
俄罗斯学者索科洛娃和利雅别夫将数字图书馆定义为: 俄罗斯学者索科洛娃和利雅别夫将数字图书馆定义为: 数字图书馆是一个分布式信息系统,它能够保存、 数字图书馆是一个分布式信息系统,它能够保存、有 效地利用各种各样的电子文献, 效地利用各种各样的电子文献,这些电子文献对于最 终用户可以通过全球网络传输而便利地获取。 终用户可以通过全球网络传输而便利地获取。 日本图书馆情报大学的田佃孝一认为数字图书馆是指 不局限于文本,而且包含画像、映像、 不局限于文本,而且包含画像、映像、音响等在内的 多媒体图书的收集、存储、 多媒体图书的收集、存储、流通以数字信号的形态统 合进行处理的图书馆。 合进行处理的图书馆。
6
1995年 和1996年 年 年
一个题为“交互作用, 一个题为“交互作用,定标及数字图书 馆研究议事日程” 馆研究议事日程”的数字图书馆专题研讨会 给数字图书馆作了如下定义: 给数字图书馆作了如下定义: 一种多媒体数据与把数据表现为信息与知识 信息管理方法的两者的有序集合。 信息管理方法的两者的有序集合。(1995) 数字图书馆是一种多媒体数据与信息管理方 法的有序结合, 法的有序结合,这种管理方法把数据表现为 一种对不同社会环境的人们有用的信息知识。 一种对不同社会环境的人们有用的信息知识。 (1996)
11
三、数字图书馆的特点、功能与作用 数字图书馆的特点、
(一) 数字图书馆的特点 信息资源数字化 信息传递网络化 信息传递网络化 传递 信息提供知识化 信息服务增值化
12
(二) 数字图书馆的功能
大容量地保存文献信息 最大限度地实现文献资源的共享 提供优质的信息服务 最广泛地开展社会教育
13
(三) 数字图书馆的作用
19
(二) 元数据的类型划分
根据数据结构和语义的复杂程度, 根据数据结构和语义的复杂程度 ,元数据可以划分为简单格式的元 数据 、简单结构格式的元数据 、复杂结构式的元数据 。 根据数据的不同作用,元数据可以划分为管理元数据和用户元数据。 根据数据的不同作用 ,元数据可以划分为管理元数据和用户元数据。 根据数据的来源,元数据可以划分为在藏品建立或数字化时产生的 根据数据的来源 , 内部元数据和在藏品建立或数字化之后产生的外部元数据两大类。 内部元数据和在藏品建立或数字化之后产生的外部元数据两大类。 按照数据的组织功能, 按照数据的组织功能,元数据可以划分为描述型元数据 、结构型元 数据 、存取控制型元数据 、评价型元数据 。
22
三、数字图书馆的建设
20世纪90年代,西方发达国家加大了对数字图书馆建设的力度。 20世纪90年代,西方发达国家加大了对数字图书馆建设的力度。 世纪90年代 世界正掀起建设数字图书馆的高潮。 世界正掀起建设数字图书馆的高潮。 数字图书馆已成为高科技竞争 中新的制高点,成为评价一个国家信息基础设施水平的重要标志。 中新的制高点,成为评价一个国家信息基础设施水平的重要标志。 美国处于比较领先的位置。美国国会 、美国国家科学基金、国家宇 美国国家科学基金、 美国处于比较领先的位置。 航局和国防部高级研究项目局等部门为美国数字图书馆的研究和开 发方面提供了很大的支持。 发方面提供了很大的支持。 英国的数字图书馆建设主要以信息存储方式的变革为出发点。 英国的数字图书馆建设主要以信息存储方式的变革为出发点。 新加坡政府在数字图书馆的建设方面是从国家信息化的角度来考虑 的。
18
(一) 元数据的几种格式
MARC(Machine Readable Catable)元数据 ( ) Core)元数据 DC(Dublin Core)元数据 CDWA(Categories for the Description of Works of Art) ( ) 元数据 RDF(Resource Description Framework)元数据 ( ) SGML(Standard Generalized Markup Language)元数据 ( ) XML(Xtensible Markup Language)元数据 ( ) CDF(Channel Definition Format)元数据 ( ) URC(Uniform Resource Characteristics/Citation)元数据 ( )
4
(三) 其他数字图书馆支撑技术的发展
在数字图书馆的发展过程中, 在数字图书馆的发展过程中,分布 式构件技术、检索技术、存储技术、 式构件技术、检索技术、存储技术、信 息安全技术、软件计算模式、硬件技术、 息安全技术、软件计算模式、硬件技术、 数据控制技术、多媒体技术、 数据控制技术、多媒体技术、自然语言 的处理技术等的发展, 的处理技术等的发展,都为数字图书馆 的建设与发展打下了基础。 的建设与发展打下了基础。
数字图书馆是图书馆发展的必由之路 数字图书馆是用户的电子学习空间 数字图书馆保存和弘扬传统文化遗产 数字图书馆是国家信息基础建设的重要组成部分 数字图书馆能加快全球信息化进程
14
第二节 数字图书馆的基本原理与技术
图书馆信息服务的基本模型是: 信息源—— 图书馆 图书馆—— 图书馆信息服务的基本模型是 : “ 信息源 读者” 其中图书馆是一个不可或缺的中间环节, 读者 ” 。 其中图书馆是一个不可或缺的中间环节 , 而数字图书馆的 作用是在各个环节上加固了以上的模型, 作用是在各个环节上加固了以上的模型 , 读者可通过广域网或图书 馆内部的局域网(电子阅览室)发出查询请求, 馆内部的局域网 ( 电子阅览室 ) 发出查询请求 , 经Web服务器处理后 服务器处理后 传递给图书馆服务器(类似于查询目录卡片) 传递给图书馆服务器( 类似于查询目录卡片 ) , 图书馆服务器将查询 结果通知对象服务器并由对象服务器取出最终结果送达读者,从而 结果通知对象服务器并由对象服务器取出最终结果送达读者, 实现了数字图书馆对象数据的发布。 实现了数字图书馆对象数据的发布。 图书馆服务器的作用是负责管 理目录数据的索引和查询,而对象服务器负责管理数字化数据, 理目录数据的索引和查询 , 而对象服务器负责管理数字化数据 ,它 是数字图书馆的信息源。 是数字图书馆的信息源。
第七章 数字图书馆
本章的主要内容为: 本章的主要内容为:数字 图书馆的概念 、数字图书馆 的基本原理与技术、 的基本原理与技术、数字图书 馆的发展与建设和数字图书馆 的应用 。
1
第一节 数字图书馆的概念
一、数字图书馆产生的背景
数字图书馆的建设与发展是社会政治、经济、 数字图书馆的建设与发展是社会政治、经济、技 文化教育等因素共同作用的结果。从技术层面讲, 术、文化教育等因素共同作用的结果。从技术层面讲, 数字图书馆是计算机技术、网络技术、数字技术、 数字图书馆是计算机技术、网络技术、数字技术、标 记语言等各种现代信息技术发展的必然产物。 记语言等各种现代信息技术发展的必然产物。现代信 息技术为数字图书馆的发展提供了必要的基础条件和 技术保障, 技术保障,数字图书馆使现代信息技术有了新的展示 舞台。 舞台。