数字图书馆信息组织

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

12.4.2 数字图书馆用户获取信息的模式(续)



用户浏览信息的方式主要有三种: (1) 平坦浏览 (2) 结构向导浏览 (3) 超文本浏览
12.5 美国国会图书馆的数字图书馆


20 世纪80 年代后期,美国就率先开始了数字图书馆的 研究和建设,“美国记忆”( American Memory )是美国 国会图书馆的数字图书馆试验计划,从1989 ——1994 年, 它选择并复制了一部分收藏,以数字化的形式在美国国 内发布,向用户提供取自100 多个历史收藏的700 多万 份数字化资料,这些资料包括数字化的历史文本、照片、 地图、视频、音频等各种媒体形式。 美国国家数字图书馆计划建立在“美国记忆”成功的基 础上,将上百万收藏品转换为数字形式并通过因特网访 问。

2. 数字图书馆信息组织的特点 (1)以用户为中心 (2)采用自动化手段对信息资源进行加工 (3)提供对信息内容的智能检索服务
12.1.3

国外数字图书馆的发展概况


1992年美国在制定“高性能计算机与通信(HPCC)” 国家攻关项目中,将发展数字图书馆列入“国家级挑 战”。 除了美国,英、法、日、德、加等国也都非常重视 数字图书馆的研制与开发,纷纷制定了本国的信息社会 发展计划,展开了对数字图书馆的研究。 从国外发展看、数字图书馆建设必须以高新技术作 支撑。
第十二章 数字图书馆信息组织

数字图书馆是以数字形式去存储大量的信息,并能 对存储的信息资源进行高效的操作,如收集、选择、组 织、检索提供访问接口、信息保护等。
12.1 数字图书馆概述


12.1.1 数字图书馆的概念 数字图书馆(Digital Library)的概念,最早可以上溯 到1975年R. W. Christian在《电子图书馆:书目数据库: 1975-1976》一书中提出电子图书馆,一般认为电子图书 馆是数字图书馆的早期提法。
12.5.1 “美国记忆”采用的文件格式(续)

⑤对于高清晰度视频动画资源采用运动图像专家组 (Motion Pictures Experts Group,MPEG) 格式存储, 对于清晰度低的动画则采用动态影像的QuickTime 格 式。
12.5.2
“美国记忆”的信息检索和浏览




“美国记忆”采用了多种信息组织方法,提供多种检索、 浏览方式。 资料集+主题 检索+浏览分层次 关键词检索 分类浏览
12.2.1


数字图书馆系统的基本结构(续)
查询服务子系统负责为用户提供查询服务。 调度子系统是一个为数字图书馆资源提供分布式目录服 务的计算机系统。
12.2.2


数字图书馆的信息体系结构

主要构件: 数字对象 句柄:文件描述符 仓储
12.2.2


数字图书馆的信息体系结构


CSTR(计算机科学技术报告项目)最重要的贡献是提 出了数字图书馆体系结构建设的八条原则性问题: (1)统一对数字图书馆有关概念的规范 (2)作为基础的体系结构应和保存在数字图书馆中的信 息内容相分离 (3)名字和标识符是数字图书馆的基础建构块
12.2.1 数字图书馆系统的基本结构

其中,元数据库和对象数据库是数字图书馆的资源库, 存储和管理数字对象的数据体、元数据及其他信息。资 源库常常分布于不同地点。
12.2.1

数字图书馆系统的基本结构(续)
数据加工子系统负责对数字信息(数字化的文本、图片、 声音、影像等)进行加工整理,并将描述数字信息的元 数据(即数字对象的元数据)归人元数据库,
12.2.2


数字图书馆的信息体系结构(续)



(4)数字图书馆数字对象的构成 (5)数字图书馆对象使用时和存储时的形态可能完全不 同 (6)仓储必须保管好所特有的信息 (7)用户需要的是供人利用的知识作品,而非供机器处 理的数字对象 (8)数字图书馆的技术框架存在于法律和社会的框架之 内
12.2.3 数字图书馆体系结构的评价标准
12.3.3

数字图书馆的信息组织方法
2. 主题标引法 建立一个提供跨库主题检索的检索工具,从而满足 用户从主题查找信息资源的需要。
12.4 数字图书馆的信息检索



12.4.1 数字图书馆数字信息的检索 文本信息的检索,就是将文本中的每个字、词都进行标 引,提供检索。目前有两种方式 1. 文本信息的检索 词典标引 单汉字标引
12.5.1 “美国记忆”采用的文件格式(续)


③对于没有行业标准的地图数字文件,则采用新开发的 高清晰图像库(Multiresolution seamless image database, Mrsid) 格式技术。 ④对声音文件,采用供下载后使用的微软公司声音格式 WAVE 和供在线实时传输的RealAudio 两种格式存储。
12.1.2


数字图书馆的特征




1. 数字图书馆信息资源特点 从信息组织的角度来看,数字图书馆的信息资源具有以 下一些特征: (1)经过选择的数字化信息资源 (2)多媒体的信息资源 (3)海量的信息资源 (4)分布式的信息资源 (5)按需提供的信息资源
Байду номын сангаас
12.1.2


数字图书馆的特征(续)
【本章习题】
1. 什么是数字图书馆?它有哪些特征? 2. 结合其它资料,谈谈我国数字图书馆的进展 如何?如何发展我国的数字图书馆事业? 3. 试述数字图书馆的基本结构和信息体系结构。 4. 数字图书馆的评价有哪些标准? 5. 数字图书馆信息组织的基本原则是什么?

【本章习题】

12.5.1 “美国记忆”采用的文件格式


①对文本采用通用标记语言标准(Standard for General Markup Language,SGML ) 编码或采用可移植文档格 式(Portable Document Format,PDF)。 ②对图像照片采用标签图像文件格式( Tag Image File Format,TIFF) 存储或采用联合图像专家组(Joint Photo-graphic Experts’ Group,J PEG) 编码压缩存储。
12.1.4


我国数字图书馆的进展概况

我国从20 世纪90 年代后期开始了数字图书馆的实质性 研制开发。 1997 年8 月,国家图书馆、上海图书馆等7个图书馆联 合承担了国家重点科技项目——中国试验型数字式图书 馆,在我国创建了一个分布式、可扩展、可互操作的、 内容资源横跨全国7个省市3 0个以上的数字资源库群的 试验型数字图书馆,并在因特网上实现了良好的运行。 2000年6月30日,中国数字图书馆网站正式开通。




数字图书馆体系结构的评价标准有很多,但应该包含以 下的内容: (1) 开放性 (2) 互操作性 (3) 扩展性 (4) 可伸缩性
12.3 数字图书馆信息组织的基本原理与方法





12.3.1 数字图书馆信息组织的基本原则 信息资源是数字图书馆建立的基础,对数字图书馆信息 资源组织时应遵循以下几个原则: (1)科学性原则。 (2)系统性原则。 (3)标准化原则。 (4)多维揭示与非线性组织原则。
12.4.1


数字图书馆数字信息的检索

2. 图像检索方法 (1)基于图像可视特征的检索方法:利用计算机分析图像 在颜色、纹理、形状等方面的特征,作为图像的内容进 行匹配、查找。 (2)基于对象和区域的检索方法:利用图像的全局和局 部特征,如总的色调、所包含的对象的数目、图像的总 体视觉结构等特征进行检索。
12.4.1


数字图书馆数字信息的检索(续)


4. 音频检索方法 (1)语音检索方法。语音检索是以语音为中心的检索,采 用语音识别等处理技术。 ①利用语音识别技术进行检索 ②利用子词单元进行检索。 ③利用识别关键词进行检索。
12.4.1


数字图书馆数字信息的检索(续)

(2)音乐检索。在检索系统中,音乐分为两种类型:结 构化的音乐和基于样本的音乐。 ①结构化音乐的检索。 ②基于样本的音乐检索。
12.4.1


数字图书馆数字信息的检索(续)
2. 图像检索方法 (3)基于综合特征及其关系的检索方法:将上述两种基 于内容特征的检索和语义检索的方法结合起来进行复杂 的检索,实现图像的全内容检索。
12.4.1


数字图书馆数字信息的检索(续)


3. 视频检索方法 (1)视频分割。 (2)视频聚类。 (3)关键帧抽取。 (4)运动特性抽取。 (5)视频检索。
12.1 数字图书馆概述

12.1.1 数字图书馆的概念 电子图书馆:以电子形式存储、传递并提供服务的图 书馆,强调借助于计算机技术在一定范围内提供读者服 务
12.1.1

数字图书馆的概念
数字图书馆是由现代高新技术所支持的数字信息资 源系统,以数字形式去存储大量的信息并能对存储的信 息资源进行高效的操作,如收集、选择、组织、检索、 提供访问接口、信息保护等。信息载体的数字化、信息 传播的网络化、信息资源共享化、服务项目的用户化是 数字图书馆的重要特征,
12.1.4 我国数字图书馆的进展概况(续)




(1)数字式图书馆试验项目 (2)基于特征的多媒体信息检索系统的研究开发项目 (3)SGML的图书馆应用 (4)中国试验型数字式图书馆项目 (5)知识网络——数字图书馆系统工程项目
12.2 数字图书馆结构


12.2.1 数字图书馆系统的基本结构 数字图书馆系统从逻辑结构来看主要由对象数据库、 元数据库、数据加工子系统、查询服务子系统、调度子 系统等组成。(如图12-1)
12.3.2 数字图书馆信息组织过程与框架




数字图书馆资源组织主要要经过以下几个步骤: (1) 规划 (2) 收集、整理 (3) 描述 (4) 标引 (5) 归档
12.3.3


数字图书馆的信息组织方法


1. 分类标引法 数字图书馆在分类体系的结构及类目的展开上有很大的 改进,主要表现在: ①重视以事物为中心设置类目,根据用户的需求,按问 题组织相应的资源; ②多维展开类目,对于具有从属于多个上位类的类目, 分别在相应的类目下予以展开; ③利用超文本技术连接类目,有效反映知识之间的联系, 以利于对资源的选择查找; ④及时调整类目的设置,动态维护分类体系。


6. 数字图书馆信息组织过程与框架是什么? 7. 数字图书馆的信息组织方法有哪些? 8. 数字图书馆各类信息各有什么检索方法? 9. 数字图书馆用户获取的信息有哪些模式? 10. 请分析美国记忆”对美国国民教育的发展有什么样 的作用?“美国记忆”对我国数字图书馆建设有什么启发?


6. 数字图书馆信息组织过程与框架是什么? 7. 数字图书馆的信息组织方法有哪些? 8. 数字图书馆各类信息各有什么检索方法? 9. 数字图书馆用户获取的信息有哪些模式? 10. 请分析美国记忆”对美国国民教育的发展有什么样 的作用?“美国记忆”对我国数字图书馆建设有什么启发?
【本章习题】

相关文档
最新文档