信息组织原理_第12章_数字图书馆信息组织
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖除了美国,英、法、日、德、加等国也都 非常重视数字图书馆的研制与开发,纷纷 制定了本国的信息社会发展计划,展开了 对数字图书馆的研究。
❖从国外发展看、数字图书馆建设必须以高 新技术作支撑。
12.1 数字图书馆概述
❖12.1.4 我国数字图书馆的进展概况
❖我国从20 世纪90 年代后期开始了数字图书馆的 实质性研制开发。
分布式目录服务的计算机系统。
12.2 数字图书馆结构
❖12.2.2 数字图书馆的信息体系结构 ❖CSTR最重要的贡献是提出了数字图书馆体
系结构建设的八条原则性问题:
❖(1)统一对数字图书馆有关概念的规范 ❖(2)作为基础的体系结构应和保存在数字图
书馆中的信息内容相分离
❖ (3)名字和标识符是数字图书馆的基础建构 块
❖ ④及时调整类目的设置,动态维护分类体系。
12.3 数字图书馆信息组织的基本原理 与方法 ❖12.3.3 数字图书馆的信息组织方法
❖2. 主题标引法
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索 ❖文本信息的检索,就是将文本中的每个字、
词都进行标引,提供检索。目前有两种方 式 ❖1. 文本信息的检索
❖12.1.2 数字图书馆的特征 ❖2. 数字图书馆信息组织的特点 ❖(1)以用户为中心 ❖(2)采用自动化手段对信息资源进行加工 ❖(3)提供对信息内容的智能检索服务
12.1 数字图书馆概述
❖12.1.3 国外数字图书馆的发展概况
❖1992年美国在制定“高性能计算机与通信 (HPCC)”国家攻关项目中,将发展数字图 书馆列入“国家级挑战”。
12.பைடு நூலகம் 数字图书馆概述
❖12.1.4 我国数字图书馆的进展概况 ❖ (1)数字式图书馆试验项目 ❖ (2)基于特征的多媒体信息检索系统的研究
开发项目 ❖ (3)SGML的图书馆应用 ❖ (4)中国试验型数字式图书馆项目 ❖(5)知识网络——数字图书馆系统工程项目
12.2 数字图书馆结构
❖12.2.1 数字图书馆系统的基本结构
❖1997 年8 月,国家图书馆、上海图书馆等7个图 书馆联合承担了国家重点科技项目——中国试验 型数字式图书馆,在我国创建了一个分布式、可 扩展、可互操作的、内容资源横跨全国7个省市3 0个以上的数字资源库群的试验型数字图书馆,并 在因特网上实现了良好的运行。
❖ 2000年6月30日,中国数字图书馆网站正式开通。
种类型:结构化的音乐和基于样本的音乐。 ❖①结构化音乐的检索。 ❖②基于样本的音乐检索。
12.4 数字图书馆的信息检索
❖12.4.2 数字图书馆用户获取信息的模式 ❖用户浏览信息的方式主要有三种: ❖(1) 平坦浏览 ❖(2) 结构向导浏览 ❖(3) 超文本浏览
12.5 数字图书馆实例:美国国会图书 馆的数字图书馆
❖ 美国国家数字图书馆计划建立在“美国记忆”成 功的基础上,将上百万收藏品转换为数字形式并 通过因特网访问。
12.5 数字图书馆实例:美国国会图书 馆的数字图书馆 ❖12.5.1 “美国记忆”采用的文件格式
❖①对文本采用通用标记语言标准(Standard for General Markup Language,SGML ) 编码或采用可移植文档格式(Portable Document Format,PDF)。
12.1 数字图书馆概述
❖12.1.2 数字图书馆的特征 ❖1. 数字图书馆信息资源特点 ❖从信息组织的角度来看,数字图书馆的信
息资源具有以下一些特征: ❖(1)经过选择的数字化信息资源 ❖(2)多媒体的信息资源 ❖(3)海量的信息资源 ❖(4)分布式的信息资源 ❖(5)按需提供的信息资源
12.1 数字图书馆概述
12.1 数字图书馆概述
❖12.1.1 数字图书馆的概念
❖数字图书馆是由现代高新技术所支持的数 字信息资源系统,以数字形式去存储大量 的信息并能对存储的信息资源进行高效的 操作,如收集、选择、组织、检索、提供 访问接口、信息保护等。信息载体的数字 化、信息传播的网络化、信息资源共享化、 服务项目的用户化是数字图书馆的重要特 征,
12.2 数字图书馆结构
❖12.2.3 数字图书馆体系结构的评价标准 ❖数字图书馆体系结构的评价标准有很多,
但应该包含以下的内容: ❖(1) 开放性 ❖(2) 互操作性 ❖(3) 扩展性 ❖(4) 可伸缩性
12.3 数字图书馆信息组织的基本原理 与方法 ❖12.3.1 数字图书馆信息组织的基本原则
❖(6)共享性原则。
❖(7)安全性原则。
❖(8)知识组织的原则。
12.3 数字图书馆信息组织的基本原理 与方法 ❖12.3.2 数字图书馆信息组织过程与框架
❖数字图书馆资源组织主要要经过以下几个 步骤:
❖(1) 规划
❖(2) 收集、整理
❖(3) 描述
❖(4) 标引
❖(5) 归档
12.3 数字图书馆信息组织的基本原理 与方法 ❖12.3.3 数字图书馆的信息组织方法
❖⑤对于高清晰度视频动画资源采用运动图 像专家组(Motion Pictures Experts Group,MPEG) 格式存储,对于清晰度低 的动画则采用动态影像的QuickTime 格式。
12.5 数字图书馆实例:美国国会图书 馆的数字图书馆 ❖12.5.2 “美国记忆”的信息检索和浏览
❖“美国记忆”采用了多种信息组织方法, 提供多种检索、浏览方式。
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索 ❖4. 音频检索方法 ❖(1)语音检索方法。语音检索是以语音为中
心的检索,采用语音识别等处理技术。 ❖①利用语音识别技术进行检索 ❖②利用子词单元进行检索。 ❖③利用识别关键词进行检索。
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索 ❖ (2)音乐检索。在检索系统中,音乐分为两
【本章习题】
❖1. 什么是数字图书馆?它有哪些特征? ❖2. 结合其它资料,谈谈我国数字图书馆的
进展如何?如何发展我国的数字图书馆事 业?
❖3. 试述数字图书馆的基本结构和信息体系 结构。
❖4. 数字图书馆的评价有哪些标准? ❖5.数字图书馆信息组织的基本原则是什么?
【本章习题】
❖6. 数字图书馆信息组织过程与框架是什么? ❖7. 数字图书馆的信息组织方法有哪些? ❖8. 数字图书馆各类信息各有什么检索方法? ❖9. 数字图书馆用户获取的信息有哪些模式? ❖10.请分析美国记忆”对美国国民教育的发展
❖数字图书馆系统从逻辑结构来看主要由对 象数据库、元数据库、数据加工子系统、 查询服务子系统、调度子系统等组成。(如 图12-1)
❖
12.2 数字图书馆结构
❖12.2.1 数字图书馆系统的基本结构
❖其中,元数据库和对象数据库是数字图书 馆的资源库,存储和管理数字对象的数据 体、元数据及其他信息。资源库常常分布 于不同地点。
❖②对图像照片采用标签图像文件格式( Tag Image ,TIFF) 存储或采用联合图像专家组 (Joint Photo-graphic Experts’ Group,J PEG) 编码压缩存储。
12.5 数字图书馆实例:美国国会图书 馆的数字图书馆 ❖12.5.1 “美国记忆”采用的文件格式
❖③对于没有行业标准的地图数字文件,则 采用新开发的高清晰图像库
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索
❖2. 图像检索方法 ❖(1)基于图像可视特征的检索方法:利用计算
机分析图像在颜色、纹理、形状等方面的特征, 作为图像的内容进行匹配、查找。
❖(2)基于对象和区域的检索方法:利用图像的 全局和局部特征,如总的色调、所包含的对象 的数目、图像的总体视觉结构等特征进行检索。
第12章 数字图书馆信息组织
❖数字图书馆是以数字形式去存储大量的信 息,并能对存储的信息资源进行高效的操 作,如收集、选择、组织、检索提供访问 接口、信息保护等。
12.1 数字图书馆概述
❖12.1.1 数字图书馆的概念
❖数字图书馆(Digital Library)的概念,最早 可以上溯到1975年R. W. Christian在《电 子图书馆:书目数据库:1975-1976》一书 中提出电子图书馆,一般认为电子图书馆 是数字图书馆的早期提法。
(Multiresolution seamless image database,Mrsid) 格式技术。
❖④对声音文件,采用供下载后使用的微软 公司声音格式WAVE 和供在线实时传输的 RealAudio 两种格式存储。
12.5 数字图书馆实例:美国国会图书 馆的数字图书馆 ❖12.5.1 “美国记忆”采用的文件格式
12.2 数字图书馆结构
❖12.2.1 数字图书馆系统的基本结构
❖数据加工子系统负责对数字信息(数字化的 文本、图片、声音、影像等)进行加工整理, 并将描述数字信息的元数据(即数字对象的 元数据)归人元数据库,
12.2 数字图书馆结构
❖12.2.1 数字图书馆系统的基本结构 ❖查询服务子系统负责为用户提供查询服务。 ❖调度子系统是一个为数字图书馆资源提供
12.2 数字图书馆结构
❖12.2.2 数字图书馆的信息体系结构 ❖ (4)数字图书馆数字对象的构成 ❖ (5)数字图书馆对象使用时和存储时的形态
可能完全不同
❖ (6)仓储必须保管好所特有的信息 ❖ (7)用户需要的是供人利用的知识作品,而
非供机器处理的数字对象
❖ (8)数字图书馆的技术框架存在于法律和社 会的框架之内
❖20 世纪80 年代后期,美国就率先开始了数字图 书馆的研究和建设,“美国记忆”( American Memory )是美国国会图书馆的数字图书馆试验计 划,从1989 ——1994 年,它选择并复制了一部 分收藏,以数字化的形式在美国国内发布,向用 户提供取自100 多个历史收藏的700 多万份数字 化资料,这些资料包括数字化的历史文本、照片、 地图、视频、音频等各种媒体形式。
❖ 1. 分类标引法
❖ 数字图书馆在分类体系的结构及类目的展开上有很大的改进, 主要表现在:
❖ ①重视以事物为中心设置类目,根据用户的需求,按问题组 织相应的资源;
❖ ②多维展开类目,对于具有从属于多个上位类的类目,分别 在相应的类目下予以展开;
❖ ③利用超文本技术连接类目,有效反映知识之间的联系,以 利于对资源的选择查找;
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索 ❖ (3)基于综合特征及其关系的检索方法:将
上述两种基于内容特征的检索和语义检索 的方法结合起来进行复杂的检索,实现图 像的全内容检索。
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索 ❖3. 视频检索方法 ❖(1)视频分割。 ❖(2)视频聚类。 ❖(3)关键帧抽取。 ❖(4)运动特性抽取。 ❖(5)视频检索。
有什么样的作用?“美国记忆”对我国数字图 书馆建设有什么启发?
Click to edit company slogan .
❖信息资源是数字图书馆建立的基础,对数 字图书馆信息资源组织时应遵循以下几个 原则:
❖(1)科学性原则。
❖(2)系统性原则。
❖(3)标准化原则。
❖(4)多维揭示与非线性组织原则。
12.3 数字图书馆信息组织的基本原理 与方法 ❖12.3.1 数字图书馆信息组织的基本原则
❖ (5)选择性与完备性原则。
❖从国外发展看、数字图书馆建设必须以高 新技术作支撑。
12.1 数字图书馆概述
❖12.1.4 我国数字图书馆的进展概况
❖我国从20 世纪90 年代后期开始了数字图书馆的 实质性研制开发。
分布式目录服务的计算机系统。
12.2 数字图书馆结构
❖12.2.2 数字图书馆的信息体系结构 ❖CSTR最重要的贡献是提出了数字图书馆体
系结构建设的八条原则性问题:
❖(1)统一对数字图书馆有关概念的规范 ❖(2)作为基础的体系结构应和保存在数字图
书馆中的信息内容相分离
❖ (3)名字和标识符是数字图书馆的基础建构 块
❖ ④及时调整类目的设置,动态维护分类体系。
12.3 数字图书馆信息组织的基本原理 与方法 ❖12.3.3 数字图书馆的信息组织方法
❖2. 主题标引法
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索 ❖文本信息的检索,就是将文本中的每个字、
词都进行标引,提供检索。目前有两种方 式 ❖1. 文本信息的检索
❖12.1.2 数字图书馆的特征 ❖2. 数字图书馆信息组织的特点 ❖(1)以用户为中心 ❖(2)采用自动化手段对信息资源进行加工 ❖(3)提供对信息内容的智能检索服务
12.1 数字图书馆概述
❖12.1.3 国外数字图书馆的发展概况
❖1992年美国在制定“高性能计算机与通信 (HPCC)”国家攻关项目中,将发展数字图 书馆列入“国家级挑战”。
12.பைடு நூலகம் 数字图书馆概述
❖12.1.4 我国数字图书馆的进展概况 ❖ (1)数字式图书馆试验项目 ❖ (2)基于特征的多媒体信息检索系统的研究
开发项目 ❖ (3)SGML的图书馆应用 ❖ (4)中国试验型数字式图书馆项目 ❖(5)知识网络——数字图书馆系统工程项目
12.2 数字图书馆结构
❖12.2.1 数字图书馆系统的基本结构
❖1997 年8 月,国家图书馆、上海图书馆等7个图 书馆联合承担了国家重点科技项目——中国试验 型数字式图书馆,在我国创建了一个分布式、可 扩展、可互操作的、内容资源横跨全国7个省市3 0个以上的数字资源库群的试验型数字图书馆,并 在因特网上实现了良好的运行。
❖ 2000年6月30日,中国数字图书馆网站正式开通。
种类型:结构化的音乐和基于样本的音乐。 ❖①结构化音乐的检索。 ❖②基于样本的音乐检索。
12.4 数字图书馆的信息检索
❖12.4.2 数字图书馆用户获取信息的模式 ❖用户浏览信息的方式主要有三种: ❖(1) 平坦浏览 ❖(2) 结构向导浏览 ❖(3) 超文本浏览
12.5 数字图书馆实例:美国国会图书 馆的数字图书馆
❖ 美国国家数字图书馆计划建立在“美国记忆”成 功的基础上,将上百万收藏品转换为数字形式并 通过因特网访问。
12.5 数字图书馆实例:美国国会图书 馆的数字图书馆 ❖12.5.1 “美国记忆”采用的文件格式
❖①对文本采用通用标记语言标准(Standard for General Markup Language,SGML ) 编码或采用可移植文档格式(Portable Document Format,PDF)。
12.1 数字图书馆概述
❖12.1.2 数字图书馆的特征 ❖1. 数字图书馆信息资源特点 ❖从信息组织的角度来看,数字图书馆的信
息资源具有以下一些特征: ❖(1)经过选择的数字化信息资源 ❖(2)多媒体的信息资源 ❖(3)海量的信息资源 ❖(4)分布式的信息资源 ❖(5)按需提供的信息资源
12.1 数字图书馆概述
12.1 数字图书馆概述
❖12.1.1 数字图书馆的概念
❖数字图书馆是由现代高新技术所支持的数 字信息资源系统,以数字形式去存储大量 的信息并能对存储的信息资源进行高效的 操作,如收集、选择、组织、检索、提供 访问接口、信息保护等。信息载体的数字 化、信息传播的网络化、信息资源共享化、 服务项目的用户化是数字图书馆的重要特 征,
12.2 数字图书馆结构
❖12.2.3 数字图书馆体系结构的评价标准 ❖数字图书馆体系结构的评价标准有很多,
但应该包含以下的内容: ❖(1) 开放性 ❖(2) 互操作性 ❖(3) 扩展性 ❖(4) 可伸缩性
12.3 数字图书馆信息组织的基本原理 与方法 ❖12.3.1 数字图书馆信息组织的基本原则
❖(6)共享性原则。
❖(7)安全性原则。
❖(8)知识组织的原则。
12.3 数字图书馆信息组织的基本原理 与方法 ❖12.3.2 数字图书馆信息组织过程与框架
❖数字图书馆资源组织主要要经过以下几个 步骤:
❖(1) 规划
❖(2) 收集、整理
❖(3) 描述
❖(4) 标引
❖(5) 归档
12.3 数字图书馆信息组织的基本原理 与方法 ❖12.3.3 数字图书馆的信息组织方法
❖⑤对于高清晰度视频动画资源采用运动图 像专家组(Motion Pictures Experts Group,MPEG) 格式存储,对于清晰度低 的动画则采用动态影像的QuickTime 格式。
12.5 数字图书馆实例:美国国会图书 馆的数字图书馆 ❖12.5.2 “美国记忆”的信息检索和浏览
❖“美国记忆”采用了多种信息组织方法, 提供多种检索、浏览方式。
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索 ❖4. 音频检索方法 ❖(1)语音检索方法。语音检索是以语音为中
心的检索,采用语音识别等处理技术。 ❖①利用语音识别技术进行检索 ❖②利用子词单元进行检索。 ❖③利用识别关键词进行检索。
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索 ❖ (2)音乐检索。在检索系统中,音乐分为两
【本章习题】
❖1. 什么是数字图书馆?它有哪些特征? ❖2. 结合其它资料,谈谈我国数字图书馆的
进展如何?如何发展我国的数字图书馆事 业?
❖3. 试述数字图书馆的基本结构和信息体系 结构。
❖4. 数字图书馆的评价有哪些标准? ❖5.数字图书馆信息组织的基本原则是什么?
【本章习题】
❖6. 数字图书馆信息组织过程与框架是什么? ❖7. 数字图书馆的信息组织方法有哪些? ❖8. 数字图书馆各类信息各有什么检索方法? ❖9. 数字图书馆用户获取的信息有哪些模式? ❖10.请分析美国记忆”对美国国民教育的发展
❖数字图书馆系统从逻辑结构来看主要由对 象数据库、元数据库、数据加工子系统、 查询服务子系统、调度子系统等组成。(如 图12-1)
❖
12.2 数字图书馆结构
❖12.2.1 数字图书馆系统的基本结构
❖其中,元数据库和对象数据库是数字图书 馆的资源库,存储和管理数字对象的数据 体、元数据及其他信息。资源库常常分布 于不同地点。
❖②对图像照片采用标签图像文件格式( Tag Image ,TIFF) 存储或采用联合图像专家组 (Joint Photo-graphic Experts’ Group,J PEG) 编码压缩存储。
12.5 数字图书馆实例:美国国会图书 馆的数字图书馆 ❖12.5.1 “美国记忆”采用的文件格式
❖③对于没有行业标准的地图数字文件,则 采用新开发的高清晰图像库
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索
❖2. 图像检索方法 ❖(1)基于图像可视特征的检索方法:利用计算
机分析图像在颜色、纹理、形状等方面的特征, 作为图像的内容进行匹配、查找。
❖(2)基于对象和区域的检索方法:利用图像的 全局和局部特征,如总的色调、所包含的对象 的数目、图像的总体视觉结构等特征进行检索。
第12章 数字图书馆信息组织
❖数字图书馆是以数字形式去存储大量的信 息,并能对存储的信息资源进行高效的操 作,如收集、选择、组织、检索提供访问 接口、信息保护等。
12.1 数字图书馆概述
❖12.1.1 数字图书馆的概念
❖数字图书馆(Digital Library)的概念,最早 可以上溯到1975年R. W. Christian在《电 子图书馆:书目数据库:1975-1976》一书 中提出电子图书馆,一般认为电子图书馆 是数字图书馆的早期提法。
(Multiresolution seamless image database,Mrsid) 格式技术。
❖④对声音文件,采用供下载后使用的微软 公司声音格式WAVE 和供在线实时传输的 RealAudio 两种格式存储。
12.5 数字图书馆实例:美国国会图书 馆的数字图书馆 ❖12.5.1 “美国记忆”采用的文件格式
12.2 数字图书馆结构
❖12.2.1 数字图书馆系统的基本结构
❖数据加工子系统负责对数字信息(数字化的 文本、图片、声音、影像等)进行加工整理, 并将描述数字信息的元数据(即数字对象的 元数据)归人元数据库,
12.2 数字图书馆结构
❖12.2.1 数字图书馆系统的基本结构 ❖查询服务子系统负责为用户提供查询服务。 ❖调度子系统是一个为数字图书馆资源提供
12.2 数字图书馆结构
❖12.2.2 数字图书馆的信息体系结构 ❖ (4)数字图书馆数字对象的构成 ❖ (5)数字图书馆对象使用时和存储时的形态
可能完全不同
❖ (6)仓储必须保管好所特有的信息 ❖ (7)用户需要的是供人利用的知识作品,而
非供机器处理的数字对象
❖ (8)数字图书馆的技术框架存在于法律和社 会的框架之内
❖20 世纪80 年代后期,美国就率先开始了数字图 书馆的研究和建设,“美国记忆”( American Memory )是美国国会图书馆的数字图书馆试验计 划,从1989 ——1994 年,它选择并复制了一部 分收藏,以数字化的形式在美国国内发布,向用 户提供取自100 多个历史收藏的700 多万份数字 化资料,这些资料包括数字化的历史文本、照片、 地图、视频、音频等各种媒体形式。
❖ 1. 分类标引法
❖ 数字图书馆在分类体系的结构及类目的展开上有很大的改进, 主要表现在:
❖ ①重视以事物为中心设置类目,根据用户的需求,按问题组 织相应的资源;
❖ ②多维展开类目,对于具有从属于多个上位类的类目,分别 在相应的类目下予以展开;
❖ ③利用超文本技术连接类目,有效反映知识之间的联系,以 利于对资源的选择查找;
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索 ❖ (3)基于综合特征及其关系的检索方法:将
上述两种基于内容特征的检索和语义检索 的方法结合起来进行复杂的检索,实现图 像的全内容检索。
12.4 数字图书馆的信息检索
❖12.4.1 数字图书馆数字信息的检索 ❖3. 视频检索方法 ❖(1)视频分割。 ❖(2)视频聚类。 ❖(3)关键帧抽取。 ❖(4)运动特性抽取。 ❖(5)视频检索。
有什么样的作用?“美国记忆”对我国数字图 书馆建设有什么启发?
Click to edit company slogan .
❖信息资源是数字图书馆建立的基础,对数 字图书馆信息资源组织时应遵循以下几个 原则:
❖(1)科学性原则。
❖(2)系统性原则。
❖(3)标准化原则。
❖(4)多维揭示与非线性组织原则。
12.3 数字图书馆信息组织的基本原理 与方法 ❖12.3.1 数字图书馆信息组织的基本原则
❖ (5)选择性与完备性原则。