数字图书馆与元数据.

合集下载

数字图书馆中文献元数据自动提取与处理方法

数字图书馆中文献元数据自动提取与处理方法

数字图书馆中文献元数据自动提取与处理方法随着数字图书馆的快速发展和信息技术的不断进步,越来越多的中文文献被数字化并存储在数字图书馆中。

这些文献包含了各种各样的信息,如标题、作者、摘要、关键词等。

然而,由于文献数量庞大,人工提取和处理这些元数据变得非常耗时耗力。

因此,数字图书馆中文献元数据自动提取与处理方法应运而生。

数字图书馆中文献元数据的自动提取与处理是指利用计算机技术,通过对文献中的内容进行智能识别和分析,从中提取出关键信息,并进行进一步的处理和组织,以便更好地管理和利用这些文献。

下面介绍几种常用的方法:1. 文本挖掘技术:文本挖掘技术是一种通过机器学习和自然语言处理等方法,从文本数据中自动提取或推断出有价值的信息的技术。

在数字图书馆中,可以利用文本挖掘技术来提取文献的标题、作者、摘要等信息。

例如,可以使用自然语言处理技术分析文献中的文字,通过识别关键词、实体名称等来提取元数据。

2. 信息抽取技术:信息抽取技术是一种从非结构化文本数据中提取结构化信息的方法。

在数字图书馆中,可以利用信息抽取技术从文献中抽取出各种元数据信息。

例如,可以使用基于规则的抽取方法,通过事先定义的规则来抽取出标题、作者、摘要等字段的值。

另外,还可以使用基于机器学习的抽取方法,通过训练一个模型来自动学习和提取元数据。

3. 文献标引技术:文献标引技术是一种将文献内容与已知的标准词汇进行匹配和标注的方法。

在数字图书馆中,可以利用文献标引技术来提取文献的主题词、关键词等信息。

例如,可以使用现有的文献标引系统,通过匹配文献内容与标准词汇,自动提取出与文献内容相关的术语和关键词。

为了使提取和处理的元数据更加准确和可靠,需要注意以下几个方面:1. 强化数据清洗:在进行元数据提取和处理之前,需要对原始数据进行清洗,去除无用信息和噪声。

例如,去除文本中的HTML标签、过滤掉特殊字符等。

这样可以提高后续处理的准确性和效率。

2. 结合多种方法:元数据的提取和处理是一项复杂的任务,不存在一种单一的方法适用于所有文献。

试论元数据及其在图书馆的运用

试论元数据及其在图书馆的运用
描述信息的元数据 能帮助用 户使用数据 。其 次 ,元 数据能 支持 系统对数据的管 理和维 护,如关 于数据项 存储 方法 的 元数 据,能支持系统 以最有效的方式访 问数据。
化图书馆的信息 发现 、信息检索 和信息组 织诸方 面 ,元 数 据都起着十分重 要的作用 。元数 据在数字 化 图书馆中 的主 要作用是为分布式数据发 现和检索奠 定基础 。数 字化 图书 馆的分布性特征 , 定了元数据体系 的 4 决 个基本功能 范畴 :
特征, 使得数字化图书馆 系统能够通 过元 数据体 系 ,自动
搜索到数字化信息 。从数字 化图书馆 的发 展现状 看 ,数字
化 图书馆首先是一个搜 索引擎 ,它 能够帮 助用户发 现存在 于互联 网络上的数字化 信息 。元数 据体系 就为数字 化 图书 馆 自动信息发现提供 了可能 。它能 为系统 自动分析处 理 数 字化信息提供按 图索骥 的框架。 ()是描述 提问 内容 ,数 2
国在数字图书馆领域里的应用 已初 见成效。本文粗略地介绍 了元数据的基本情况 ,探讨 了元数据在 图书馆 ,尤其是在 数字图书馆 中的运 用。
[ 关键词] 元数据 ;图书馆
[ bt c] Tem t a l s nipr n rei o ai tno t e iom tnad e i a.A r et A s at r h e dt p y ot to gn ao e tn ra o te 1 t e n a a a a m a l n r z i fh n f i n r r v ps
te e dt iui e o dm r i e o d h hbs  ̄ o eule efl o d 诅 b r i h a h t a ti dm r a o t r ,wi i t b tzdi t e i lir y nC n . m a as l z en e nhw l cen i i nh i d f 百 l a i

元数据标准MODS的发展及应用

元数据标准MODS的发展及应用

元数据标准MODS的发展及应用【摘要】本文论述了元数据标准MODS的内涵、特点及其使用的基本原则,介绍了国外MODS近期应用的一些项目。

【关键词】元数据;MODS;数字图书馆【Abstract】This paper expounds the concept and characteristics of MODS metadata and introduces the recent application situation of MODS abroad.【Key words】Metadata;MODS;Digital libraryThe Development and Application of MODS Metadata0 前言到目前为止,描述图书馆资源的元数据标准主要由设计于20世纪60年代的MARC(Machine Readable Cataloge)担当。

人们普遍使用的MARC格式虽然产生比较早,著录格式也修改得越来越完善,但MARC格式过于复杂、繁琐。

随着现代信息技术的发展和普及,为了方便人们通过网络来直接存取图书馆资源,数字图书馆的建设被提上日程,而其中的元数据方案多采用DC(Dublin Core)。

尽管DC较为简单,著录方式也较为容易,但在应用过程中遇到了不少问题,难以满足图书馆文献著录的需要。

同时,用DC描述Web资源中多种多样的资源类型还存在许多有待解决的问题。

MODS就是针对DC和MARC描述图书馆资源存在的不足而开发出来的。

1 MODS的概念MODS(Metadata Object Description Schema,元数据对象描述模式)是美国国会图书馆于2002年6月开发出的,是继MARC之后的第二种以MARC为基础的文献编目元数据。

MODS的元素来自MARC21的字段,是MARC21的一个子集。

它采用XML作为编码语言,是MARC21的XML简略版。

MODS的第一版MODS1.0颁布之后的版本有MODS2.0、MODS3.0和MODS3.1,目前最新的版本是2006年6月1日公布的MODS3.2版。

上海数字图书馆元数据方案

上海数字图书馆元数据方案

上图数字图书馆元数据方案An Approach of Metadata in Shanghai Digital Library Initiative上海图书馆系统网络中心刘炜赵亮ABSTRACT目前的上海数字图书馆是一个综合了七个资源库的网上图书馆,拥有数据近200GB,主要是扫描的影像数据。

系统采用IBM Digital Library version 2.4作为主要开发工具应用平台,系统的元数据方案以Dublin Core作为核心集,多种元数据方法并存,并以基于XML 的以RDF为基础的资源描述体系将它们封装在一起,保证了原始素材内容管理中元数据的完整性与互操作能力。

本文从设计理念,具体实施框架,在实施中的问题探讨以及未来的实施构架设想等几方面对上图的元数据方案及其实施作了介绍。

----------------------------------------------------------------------------------------------------------------上海图书馆以她的一千多万册藏书和三千余万件其它资料服务着上海市1300万人口。

这是个世界上最大的城市图书馆,借助于近二十年中国的高速发展,上海在许多方面领先于全国,与世界同步。

建设国际一流的图书馆,是上海图书馆新馆1996年建成开放后努力追求的目标。

1997年上海图书馆启动了第一个数字化项目,善本古籍的数字化,此后又陆续开始了六个数字化项目,分别是上海图典、上海文典、中国报刊、民国图书、点曲台和科技百花园,集中将极具特色的馆藏和地方文献按计划开发出来,到1999年底,总容量已经达到200GB。

在上海图书馆的数字图书馆项目实施中,元数据方案的选择是其中的一个关键所在。

本文将就上海图书馆数字图书馆实践中所采用的元数据方案作一个简单的介绍,以供国内同行指正参考。

一、元数据方案与设计理念在上图的数字图书馆方案中,我们所采用的元数据方案是以Dublin Core为核心元数据集,多种对应于不同资源类型的元数据方法并存,并以RDF为基础的资源描述体系将它们封装在一起。

数字图书馆中的元数据标准与管理研究

数字图书馆中的元数据标准与管理研究

数字图书馆中的元数据标准与管理研究随着信息技术和互联网的快速发展,数字图书馆的建设已经成为现代图书馆事业中一个重要的方向。

数字图书馆与传统图书馆最大的区别在于其管理的是数字化版本的文献资源,需要建立并维护对应的元数据标准与管理机制。

一、元数据标准的定义元数据是用来描述或解释数据资源的数据,也是数字图书馆管理的重要组成部分。

常见的元数据有描述性元数据、结构性元数据和管理性元数据。

描述性元数据是用来描述资源主要内容和特征的元数据,包括资源的标题、作者、出版日期、主题等信息。

结构性元数据是描述资源内部结构和组织关系的元数据,包括资源的层次、结构、组成等信息。

管理性元数据是描述资源在数字库中的管理、存取和使用等信息。

数字图书馆中,元数据标准是保证数字资源在检索、资源共享、资源交换等方面有效实现的重要保证。

它将资源的描述和管理信息规整化、标准化,可以在检索时提高查找准确性,节约时间成本,实现资源共享和资源交换。

在数字资源的大数据管理中,元数据标准的规范化和管理的重要性不言而喻。

二、元数据标准的分类元数据标准可分为本体论元数据标准和语法元数据标准。

本体论元数据标准是描述资源内容的概念体系,包括对资源性质、属性和逻辑关系等的定义。

本体论元数据标准在元数据框架设计中发挥着十分重要的作用,可以消除资源描述的歧义和不标准化的因素。

语法元数据标准规定描述各类资源的语言、词义、规则等要素。

具体到数字图书馆的建设中,包括少量元数据标准和多量元数据标准。

前者强调资源的描述要素、格式管控、检索项设置等要素,适用于单一类型、小规模文献资源的管理。

后者包括Dublin Core元数据标准、MARC 21元数据标准和EAD元数据标准等众多规范。

三、数字图书馆元数据的管理鉴于数字图书馆涉及到诸多类型和大量数据的管理,并且数字资料可能会不断更新和维护,因此需要建立科学、有效的管理机制,以确保数据的常态化、标准化和协同化。

数字图书馆元数据管理的核心是机器处理,应适当采用元数据处理软件,并应根据不同类型的元数据标准及资源类型进行相关配置。

元数据与图书馆数字资源组织管理

元数据与图书馆数字资源组织管理

元数据与图书馆数字资源组织管理卢笑明;唐琳;李学鸣【摘要】元数据是数字图书馆建设的关键技术,也是数字图书馆进行知识组织和管理的工具.从元数据的定义、格式、编码语言、应用等方面入手,探讨了元数据在数字图书馆资源组织管理方面的规范,提出了元数据在数字图书馆建设中应注意的问题.【期刊名称】《农业网络信息》【年(卷),期】2010(000)012【总页数】2页(P70-71)【关键词】数字资源;元数据;数字图书馆;信息组织【作者】卢笑明;唐琳;李学鸣【作者单位】大连海洋大学图书馆,大连,116023;大连海洋大学图书馆,大连,116023;大连海洋大学图书馆,大连,116023【正文语种】中文【中图分类】G250网络信息资源具有动态性、分布性、多元性和无序性的特点,目前的网络信息资源存在着不规范、不准确、不开放等问题。

如何制定与实施一系列准确、规范和可互操作的网络信息资源描述格式及组织系统已成为一个重要的研究领域。

1 元数据的基本内容1.1 元数据定义“元数据” (Metadata)最早出现于美国航空与宇宙航行局NASA的《目录交换格式》DIF手册中,在一定程度上类似于图书馆的书目信息,但却是传统文本和书目领域之外的一个新概念。

元数据的描述对象主要是网络环境下的电子资源,是关于最广泛意义上的“数据”,包括数据集、文本信息等任何电子化事物的数据信息。

元数据与传统图书馆编目标准的不同之处在于它除了具有描述功能外,还具有控制、管理信息资源的能力。

因此,元数据是适用于描述任何网络数据和资源、促进网络信息资源组织和获取的数据。

目前,关于元数据最常规的定义为:元数据就是关于数据的数据(Data about Data),指任何用于帮助网络电子资源的识别、描述和定位的数据。

1.2 元数据主要格式元数据作为描述信息资源的工具,一般由多个按照规定的编码语言和编码方式对信息资源属性进行特征描述的元素组成,这些元素按照规定的相互关系和整体结构形成具体的元数据格式。

浅谈图书馆元数据的应用

浅谈图书馆元数据的应用

浅谈图书馆元数据的应用【摘要】图书馆元数据作为图书馆信息资源的描述信息,对于图书馆的管理和服务起着至关重要的作用。

本文将从图书馆元数据的定义和作用、图书馆元数据标准、图书馆元数据的建立和维护、图书馆元数据的应用场景以及图书馆元数据的未来发展等方面进行探讨。

通过深入分析,可以更好地理解和应用图书馆元数据,在图书馆资源的组织、检索、利用等方面发挥作用。

随着信息技术的不断发展,图书馆元数据的应用也将更加广泛和深入,为图书馆事业的发展提供更多的可能性和机遇。

对图书馆元数据的理解和研究具有重要的意义,促进图书馆事业的不断发展和提升。

【关键词】图书馆元数据、应用、定义、作用、标准、建立、维护、场景、未来发展、引言、正文、结论。

1. 引言1.1 浅谈图书馆元数据的应用图书馆元数据是图书馆信息资源管理的基础,它是描述和组织图书馆馆藏信息的关键工具。

在数字化时代,图书馆元数据的应用越来越受到重视,它不仅可以帮助图书馆更好地管理馆藏,还可以为用户提供更便捷的检索和浏览服务。

图书馆元数据的应用既包括传统的馆藏管理,也包括数字资源管理。

通过元数据,图书馆可以准确地描述每一本图书、每一个文献资源的属性,如标题、作者、出版日期、摘要等。

这些元数据可以帮助用户更快速、精准地找到所需的信息资源,提高检索效率。

图书馆元数据还可以被用于资源共享与联合开发。

通过统一的元数据标准,不同图书馆可以更方便地实现资源的共享与互联互通,提高图书馆服务的质量和效率。

图书馆元数据的应用对于提升图书馆的服务质量和用户满意度起着关键作用。

随着信息技术的不断发展,图书馆元数据的应用也将不断拓展和深化,为图书馆和用户带来更多的便利和价值。

2. 正文2.1 图书馆元数据的定义和作用图书馆元数据是指描述图书馆资源的数据,包括图书、期刊、论文、音像资料等各类文献的描述信息。

它是图书馆信息资源组织和管理的基础,具有极为重要的作用。

图书馆元数据可以帮助用户更好地找到所需的文献资源。

浅谈图书馆元数据的应用

浅谈图书馆元数据的应用

浅谈图书馆元数据的应用【摘要】图书馆元数据是图书馆管理和服务中不可或缺的重要组成部分。

本文从引言、正文和结论三个部分探讨了图书馆元数据的应用。

在介绍了图书馆元数据的定义和重要性。

接着在分别从书目管理、检索系统、数字化项目和知识组织等方面阐述了图书馆元数据的多种应用。

最后在结论部分指出,图书馆元数据的应用对图书馆服务的提升具有重要意义,图书馆元数据的质量将直接影响图书馆服务的效果,因此图书馆应加强对元数据工作的重视和投入。

通过本文的探讨,可以帮助读者深入了解图书馆元数据的作用和必要性,进一步认识到图书馆元数据在图书馆服务中的重要价值。

【关键词】图书馆元数据、书目管理、检索系统、数字化项目、知识组织、标准化、服务提升、质量、投入、重视。

1. 引言1.1 图书馆元数据的定义图书馆元数据是描述和管理图书馆资源的重要工具。

它是对图书馆资源的描述信息,包括资源的题录信息、分类号、出版信息、作者信息等。

通过元数据,图书馆可以更好地管理和组织自己的馆藏,提高资源的利用率和服务质量。

图书馆元数据的定义包括了多个方面:它是对馆藏资源进行描述和标识的标准化信息。

它是用于组织和检索图书馆馆藏的基本数据元素。

它是支持数字化项目和开放获取资源的重要工具。

图书馆元数据还可以用于知识组织和信息检索系统的构建。

图书馆元数据是图书馆服务的基础,是实现资源共享和知识传递的关键。

图书馆元数据的完整性和准确性将直接影响到图书馆服务的效果和用户体验。

图书馆应该高度重视元数据工作,不断完善元数据的管理和应用,以提升图书馆的服务水平和用户满意度。

1.2 图书馆元数据的重要性图书馆元数据的重要性可以说是图书馆服务的核心。

元数据是描述和管理信息资源的关键,能够帮助图书馆有效地组织、存储和检索信息。

元数据能够帮助用户快速找到所需的信息资源。

通过元数据的标记和分类,用户可以更加方便地搜索到符合自己需求的书目信息。

元数据可以提高信息资源的利用率和价值。

元数据与图书馆数字资源组织管理

元数据与图书馆数字资源组织管理

整体 结 构 形 成 具 体 的元 数 据 格 式 。这 种 元 数据 格 式 往
往 应 用 于 特 定 的主 题 或 专 业 领 域 ,适 用 于一 组 或 多组
1 元数 据的基本 内容
1 元数 据定 义 . 1
“ 数 据 ” ( td t)最 早 出现 于美 国航 空 与 宇 元 Mea aa
网络 信 息 资 源 具 有 动 态 性 、分 布 性 、 多元 件 和 无 序性 的特 点 , 目前 的 网络 信 息 资 源 存 在 着 不 规 范 、不
准 确 、不 开 放 等 问 题 。如 何 制 定 与 实 施 一 系 列 准 确 、
12 元数 据 主 要 格 式 .
元数据作为描述信息 资源的工具 ,一般由多个 按
( l n O en Unvri irr,D l n 1 6 2 ) Dai ca iest Lbay ai 0 3 a y a 1
Ab t a t sr c :Mea aa i te k y tc oo yo iia irr ,whc st o lo h r a iain a d ma a e nto ir r.I h s td t s h e e hn lg fdgtllb ay ih i heto fte og nz to n n g me fl a b y n ti p p r tri gfo t eiiin o mas o i a g a e n h tdaaa piains h tn a d n t gtlrs u c s a e ,sa tn rm he d fnto ,fr t,c dng ln u g s a d te mea t p lc to ,te sa d r si hediia e o r e o g n zto n g me twee e po e n h su so td t p lc t n i h iia irr o sr to r r p s d. r a iainma a e n r x lrd a d teis e fmea aaa p iai n t ed gtllb ay c n tucin we ep o oe o K e r s iia e o re ;mea aa ii ll r r;ifr t n og niain y wo d :d gtlr s u c s td t;dgt i a a b y n omai r a z t o o

以元数据为核心实现区域数字图书馆数据资源整合

以元数据为核心实现区域数字图书馆数据资源整合

标准 D C元数据标 准可描述 的资源类型 多样 . 以对 可
纸本图书描述 . 也可 以对 电子文献资 源描 述 。第三是 它 具有可重 复性 D C元数 据 的 1 5个元 素可 以选 择和 重
复 第 四可根据需要引入修饰词 根据描述资 源的要求
不 同. 以选择是否引进修饰词 如果 要求 高 . 可 可用修 饰 词对 资源 作进一 步 描 述 第 五 是 它具 有 很 强 的兼 容
重 庆科技学 院学报 ( 社会科学版)21年 期 0 第3 2
Junl fC ogi nvrt o c nead Tcnl ySc c ne di ) N . 02 ora o hnq g U i sy fSi c n eho g(oi Si csE i n o3 2 1 n e i e o l a e t o
的聚合 过 对所 有 电子资 源 实现统 一 元数 据仓 储管 通 理 . 分散 到各 个异 构数 据库 里 的资源 进 行物 理 的集 将 中, 在集 中过 程 中 。 元 数 据 进行 清 洗 、 对 去重 等 操 作 , 通 过对 集 中 的元数 据检 索 . 实现 对原 文 的定位 原文
以元数据为核JI 区域数字图书馆数据资源整台 I ! ! 实现
刘 子 辉 , 强 , 平 陈 杨
摘要 : 为避 免 重 复 建 设 造 成 浪 费 , 进 资 源 共 享 , 高 图 书馆 的 个 性 化 服 务 水 平 , 促 提 同一 区域 的 数 字 图 书馆 有 必要 进 行数 据 资 源 整合 提 出 了基 于数 据 仓 库 的 同一 区域 不 同 图 书馆 的数 字资 源整 合 方 案 。 关键词 : 图书 馆 : 源整 合 ; 据 仓 库 ; 数 据 资 数 元 中 图分 类 号 : 2 07 G 5. 3 文献标识码 : A 文 章 编 号 :63 1 9 (0 2 0 — 13 0 1 7 - 9 9 2 1 )3 0 5 - 2

数字图书馆元数据标准简析

数字图书馆元数据标准简析

数字图书馆元数据标准简析作者:隋敏来源:《管理观察》2010年第09期摘要:本文从元数据的基本概念出发,介绍了有关数字图书馆建设的各种元数据标准。

同时,以讨论MARC标准的局限性为原由,重点阐述了DC元数据的产生、意义、作用、结构以及DC 元数据实现的RDF/XML技术手段。

在数字图书馆建设中,必将形成MARC和DC长期并存的局面。

如何克服MARC的局限性和发挥 DC的优势,将是图书馆界的长期研究的课题。

关键词:数字图书馆元数据 MARC DC XML RDF1.元数据(metadata)“元数据”是英文单词“metadata”的中文意译,若直译则为“关于数据的结构化数据”。

广义地讲,通过对事物或信息资源进行简单再描述所得到的结构化数据都可以称作元数据。

例如,一本书的正文内容是书的数据,若将这本书的书名、作者、版本、出版社等信息编制成一条目录,那么这条目录就可以称作元数据,而书名、作者、版本、出版社则是元数据的元素。

元数据是属于计算机领域中的术语,最初是为了解决网络资源无序问题而提出的一个概念。

因此,元数据最基本的用途就是在网络环境下组织管理数据,从而实现信息资源的查询、阅读、交换和共享。

由于元数据主要是描述网上信息资源特征的数据,因此需要定义基本的描述元素,给出相应的语义和语法结构,并采用一定的格式进行存储。

元数据可以使计算机系统自动分析归纳信息资源的基本特征,较好地解决网络资源的发现、控制和管理问题。

2. 数字图书馆元数据标准有关数字图书馆的元数据,包括描述资源内容的元数据和描述服务的元数据。

这些元数据用于对数字图书馆资源进行结构化描述,以便满足数字图书馆信息检索和知识发现的需求。

元数据的定义与实现必须依据一定的标准进行。

对于不同领域,一般都会根据需求来制定一个标准或几个标准,目的是使大家在某个领域中都遵守同一规则使用元数据,以便实现数据信息交换和共享。

因为本文以研究数字图书馆为主,所以下面只列举一些与该领域有关的元数据标准和元数据实现的有关标准:MARC (Machine-Readable Catalog,机读目录)SGML (Standard Generalized Markup Language,标准通用置标语言)HTML (Hyper-Text Markup Language,超文本置标语言)XML (Extensible Markup Language,可扩展标置标语言)DC (Dublin Core,都柏林核心)RDF (Resource Description Framework,资源描述结构)Z39.50协议3. MARC的局限性用于描述文献的编目信息的 MARC标准,是数字图书馆应用中最常见的一种元数据标准。

图书馆数字资源的元数据管理与应用研究

图书馆数字资源的元数据管理与应用研究

图书馆数字资源的元数据管理与应用研究随着信息技术的迅速发展,数字资源在图书馆中的应用日益普及和重要。

数字资源的元数据管理和应用成为图书馆学界研究的热点之一。

元数据是描述信息资源特征的数据,它为数字资源的组织、分类、检索和利用提供了重要支撑。

本文旨在探讨图书馆数字资源的元数据管理与应用,并对相关研究进行深入分析。

首先,本文将从数字资源的概念和特点入手,介绍数字资源在图书馆中的重要性和应用范围。

随着数字化技术的广泛应用,图书馆拥有了大量的数字资源,如电子书籍、数字期刊、数字图片等。

这些数字资源的管理和利用对于提升图书馆服务水平具有重要意义。

而元数据作为数字资源的关键组成部分,发挥着至关重要的作用。

其次,本文将探讨数字资源的元数据管理。

元数据管理涉及到数字资源的描述、组织、存储和更新等方面。

有效的元数据管理可以提高数字资源的可管理性和检索效率。

在元数据管理中,分类编目、资源描述和链接技术是关键环节。

分类编目可以根据数字资源的特征对其进行分类和组织,从而实现利用效果的最大化。

资源描述则是对数字资源进行详细描述,包括标题、作者、主题词等信息。

而链接技术则可以将不同数字资源进行有机链接,提高信息检索的便捷性。

另外,本文还将分析数字资源的元数据应用。

元数据应用涉及到数字资源的利用、共享和推广。

通过元数据应用,图书馆可以更好地为读者提供个性化的信息服务,提高读者满意度。

此外,元数据应用还可以促进数字资源的共享和交流,加强图书馆之间的合作与交流。

通过元数据的精细化管理和应用,图书馆可以更好地发挥数字资源的作用,提高信息资源的利用效率。

最后,本文将就图书馆数字资源的元数据管理与应用进行未来展望。

随着信息技术的不断发展和图书馆数字化建设的深入推进,数字资源的元数据管理和应用将迎来更加广阔的发展空间。

未来,图书馆可以进一步探索数字资源的元数据标准化和互操作性,以实现数字资源的智能化管理和利用。

同时,图书馆可以借助大数据和人工智能技术,对数字资源进行深度挖掘和分析,为读者提供更加个性化和精准的信息服务。

元数据在数字图书馆的应用研究

元数据在数字图书馆的应用研究
广泛应用 在 图书馆 、 自然科 学 、 务 办公 、 会科 学 政 社
资 源而提 出 的 , 的 内涵 比书 目记 录 要 丰 富 得 多. 它 它可 以为各 种形态 的信息 资 源 提供 规 范 、 遍 的描 普 述方 法和检 索 工 具 , 为分 布 的 、 由多 种 资 源 组 成 的 信息 体系 ( 数字 图书馆 ) 如 提供整 合 的工 具与纽 带.
数据 的所 有者 ( h) 数据 的提供 方式 ( o 等信 息 w o、 hw) 的数 据 , 是数据 与数 据 用户 之 间的桥 梁 . 简言 之 , 元 数据 是关 于数据 的数据 .
字图书馆的信息组织和利用方式 , 同时元数据还是
实现 跨资源 库 语 义 互 操 作 的基 础 . 体 来 讲 , 数 具 元
总第 9 4期

丽: 元数据在数字图书馆的应用研究
7 7
提供给最终用户 以高质量的信息资源 . J
2 2 信 息的描 述与揭 示 .
馆核 心元素 和个别 元 素 . 中 , 心元 素 采 用 了 D 其 核 C
的l 4个元素, 并且在使用的过程中严格遵循 D C的 义定义 , 通用性 最强 , 此层次 的元素是数据交换
据在数字图书馆信息组织 中的必要性表现在 以下
几方 面 :
2 1 信息 的查找 与识别 .
浩瀚 的 网络 资 源 为 信 息 资 源 的生 成 带 来 了极
大的便利 , 几乎任何人在任何 时间内都可 以成为信 息资源的创建者 , 由于资源创建者 自身素质的差 但 异极大 , 且缺乏严格 的网络出版监督机制 , 导致 了
据简单地等同于传统的书 目记录. 我们知道元数据
产生 于网络 时代 , 它是 为 组织 与检 索海 量 网络信 息

DC元数据在中国数字图书馆建设中的应用之我见

DC元数据在中国数字图书馆建设中的应用之我见

设标准体系的逐步建立和完善 , C元数据标准逐渐 D 为业内人士熟悉。但在使用的过程 中还存在一些不 尽如人意的地方 , 本文就 D C元数据标准 中的几个
概念进行了区分 , 给出了最新 的 D C元数据术语集 对元素定义的必备属性和有则必备属性的规定 , 并
体系修饰词和语法编码体系修饰词 。下面是几个概 念的区分 。 11 D . C元素 限定 词 元素限定词通过限定元素的语义提高元素的专
Vo . No 1 14. .
Ma . 【 ) f 2 x6
D C元数据在 中国数字 图书馆建设中的应 用之我见
陈 家翠
( 苏州大学 图书馆 , 江苏 苏州 250 ) 106
摘 要: 最新版本的 D M 元数据术语规定 了元数据元素 、 CI 元素限定词和编码体 系修 饰词定义 的必 备属性和有 则必备属性 。本 文
区分了 D C元数据标准中关于修饰词的几个概念, 介绍 了 D M 元数据术语定义规范和 D CI C元数据在数字 图书馆建设 中的优势 , 探
讨了 本地应用纲要制定中应注意的问题 。
关键词 : C D 元数据 ; 数字图书馆 ; 元数据标准
中圈分 类号 : G2 5 文献标 识码 ; A 文章编号 : 7 — 3 9 20 ) l 05 o 1 2 57 I 06 O 一 19一 4 6
作者简介 : 陈家翠(9 3 ) 女 , 16 一 , 重庆梁平人 , 苏州大学副研究馆 员。 研究方 向: 数字图书馆。
维普资讯
西南农业大学学报 ( 社会科学版 )
AP U C I P AT ON T OF DC ME ADAT A I GI AL L B N DI T I RARY ONS RUC I N C NA C T T ON I HI

图书馆数字图书馆标准与规范

图书馆数字图书馆标准与规范

图书馆数字图书馆标准与规范数字图书馆的发展已经成为图书馆事业的重要组成部分,它为读者提供了更方便的阅读方式,并且可以储存大量的图书和资料。

然而,数字图书馆的建设和管理需要遵循一系列的标准与规范,以确保图书馆的正常运行和提供服务的质量。

本文将介绍数字图书馆标准与规范的重要性,以及常用的标准和规范的内容。

一、标准与规范的重要性数字图书馆标准与规范的制定是为了规范图书馆的建设和管理,确保数字图书馆的功能和服务都能够达到一定的标准。

首先,标准与规范能够提供技术上的指导,使得图书馆在数字化建设方面能够更加科学和高效地运作。

其次,标准与规范可以保证数字图书馆的互操作性,使得不同图书馆之间能够共享资源,并提供相应的服务。

最后,标准与规范还可以提供数据安全和保护方面的指导,保障用户的隐私和信息安全。

二、数字图书馆标准的内容数字图书馆标准主要涉及以下几个方面:1. 元数据标准:元数据是数字图书馆中重要的组成部分,它能够提供图书和资料的关键信息以及资源的组织结构。

元数据标准主要包括数据格式、数据元素、数据描述等内容,以确保元数据的一致性和可读性。

2. 数据格式标准:数字图书馆中的文献和资料以不同的格式存在,如文本、图片、视频等。

数据格式标准可以规定不同格式的文件的存储方式和编码方式,以方便用户使用和资源共享。

3. 检索标准:数字图书馆需要提供用户检索图书和资料的功能,检索标准可以规定检索语言、检索方式、索引规则等内容,以提高检索结果的准确性和查询效率。

4. 用户界面标准:数字图书馆的用户界面是用户获取信息的窗口,用户界面标准可以规定用户界面的布局、交互方式、字体颜色等内容,以提供良好的用户体验。

5. 安全与隐私标准:数字图书馆需要保护用户的隐私和信息安全,安全与隐私标准可以规定用户注册、登录、个人信息等方面的管理办法,以及数据的存储和传输的安全性要求。

三、数字图书馆规范的内容数字图书馆规范主要针对数字资源的采集、整理、存储和服务等各个环节,以确保数字图书馆的正常运作和高质量的服务。

元数据在数字图书馆信息组织中的应用

元数据在数字图书馆信息组织中的应用
元数 据 的最 主要 的功能
书馆资 源站 点具有 充分 的互 操作 性 和可扩 展性 的
基础 , 提 供 数字 图书馆 中资源 描 述 、 源 发现 、 是 பைடு நூலகம்
资源处 理 、资源评 价与排 序 以及 资源 的人 机交 互 和理解 的基本 要 素 ,它 还 承担 向数字 图书馆 中高 层 协议 中间件提供 标准 数据访 问接 口的功 能。
21 元 数据 标准 的选 择 .
义、 记 、 装 、 标 封 交换传 递 时所用 到 的语言 。 22 元 数据 标准 的设 计原 则 . 当无法 从现 有 元 数据 标 准 中选择 一 种 真正 适 合 的元 数 据 时 ,数字 图 书馆 需要 考 虑 自行设 计 元
第 5 期
邵 晓红 : 数 据 在 数 字 图 书 馆信 息 组 织 中 的应 用 元
1 5
的选择 与设 计 。在多数 情况 下 , 人们 主要 是选 择应
用 已有 的某个 或某 些 元数 据标 准 ,只有 当面 临特 殊 资源 或 特殊应 用 要求 、又有 必 要 的资 源 和 知识 条件 时才认 真考 虑设 计新 的元 数据标 准 【 1 1 。
供规 范 的定 义 、 述 、 换 和解 析 机 制 , 分 布式 描 交 为
制, 导致 了信息 资源 质量 的参差 不 齐 , 因特 网成 了
展示 这些 “ 品” 商 的杂货店 。作 为数 字 图书馆 的信
息组织 人员 ,其 首要 的任 务就 是利 用信 息 资源创 建者 提供 的简单 元数 据 ,对这 些杂 货店 的商 品进
第 1 5卷 第 5期
V0. 5 No5 1 . 1

州 大

图书馆数字 图书馆标准与规范

 图书馆数字 图书馆标准与规范

图书馆数字图书馆标准与规范图书馆数字化:图书馆标准与规范随着科技的快速发展,数字化成为了各行各业的趋势。

图书馆作为知识传播的重要场所,也积极地加入了数字化的行列。

图书馆数字化不仅使馆藏资源更加便捷地被读者利用,还提升了图书馆的服务能力和效率。

然而,要实现优质的数字化图书馆,必须遵循一定的标准与规范。

本文将探讨图书馆数字化中的标准与规范,并分析其重要性和影响。

一、数字化图书馆标准数字化图书馆标准是指制定和规范数字化图书馆建设与管理的一系列准则和标准。

这些标准涵盖了数字资源的选择、获取、处理、存储、访问及服务等方面。

下面将介绍几个重要的数字化图书馆标准。

1. 元数据标准元数据是指描述资源的数据,是数字化图书馆中不可或缺的一个组成部分。

元数据标准规定了元数据的内容、格式和交换方式,确保各个数字资源之间的互通性和互操作性。

常见的元数据标准包括Dublin Core、MARC等。

2. 数字资源格式标准数字资源格式标准规定了数字资源的文件格式和结构,包括文本、图像、音频、视频等格式。

标准化的数字资源格式有助于提高资源的可访问性和可持续性。

常见的数字资源格式标准有PDF、JPEG、MP3等。

3. 数字资源访问标准数字资源访问标准规定了数字资源的展现方式和操作规范,确保读者可以方便地对数字资源进行查找、阅读和下载。

标准化的数字资源访问有利于提升读者的阅读体验和满足读者的个性化需求。

常见的数字资源访问标准有CSS、HTML、OpenURL等。

二、数字化图书馆规范数字化图书馆规范是指数字化图书馆在建设和管理过程中所需遵循的一系列规范和要求。

这些规范主要包括数字资源采集与整理、版权保护、数字化技术应用等方面。

下面将介绍几个重要的数字化图书馆规范。

1. 版权合规规范数字化图书馆在数字资源的采集与整理过程中,必须遵循版权法和相关规定,确保所使用的资源符合法律要求,保护版权利益。

数字化图书馆需要建立专门的版权审核机制,确保所提供的数字资源不存在侵权问题。

图书馆藏书数字化元数据

图书馆藏书数字化元数据

图书馆藏书数字化元数据论文导读:在数字化工作中扮演极为核心角色的是元数据。

都蕴含于元数据结构中。

其作用如同目录。

事先评估清楚。

评估,图书馆藏书数字化元数据。

关键词:数字化,元数据,作用,评估在数字化工作中扮演极为核心角色的是元数据。

论文检测,评估。

首先,它是将隐藏的信息转换成为显著信息的关键机制。

数字资源的知识元素与相关链接,都蕴含于元数据结构中,我们可以通过这个机制可以有序地控制、管理、使用数字资源,并支持不同机构的数字化资源,为数字化资源共享提供可能性。

在研究图书馆藏书数字化元数据之前,有许多重要的因素及条件必须进行前期规划,事先评估清楚。

其次,图书馆自身的发展方向及目标,会关系到图书馆藏书数字化资源所需具备的功能,数字化在工作中的应用会给图书馆原有的工作方法和制度带来很大冲击及影响。

图书馆工作人员能否充分学习和体会这项变革,是进行各项数字化工作前需要的基本因素。

第三,图书馆藏书数字化元数据的设计,会关系到藏书属性的问题。

在图书馆中研发元数据必须先分析图书馆藏的特性进行,不同的藏书具有不同属性及性质,所展现的元数据就会有不同的评估重点。

藏书所归属在不同知识领域,通常会有其特定的知识体系,进而发展出不同面貌的知识结构,不同的学者对图书知识内容及性质经常会有不同的描述方式。

从藏书分类来看,图书馆藏书分类会直接影响元数据及检索系统发展的基本原则。

本文着重探讨研发藏书数字化元数据的相关因素、条件及作用。

1图书馆藏书数字化分类与检索系统评估的基本原则探讨馆藏图书分类结构,可以说是讨论图书馆的馆藏方向与图书分类相关的知识。

论文检测,评估。

虽然目前我们无法大幅改动馆藏原有的分类系统,但在不断进行图书研究和数字化的过程中,在评估数字化后的图书资源的共享和检索使用问题时,调整目前分类系统,是未来势在必行的工作。

综上所述,本文认为对藏书分类结构进行讨论时,要考虑如下的重要原则:1.1方便使用者使用是藏书分类的目的藏书分类是依据某些特定原则下来确定各类图书在知识体系中的位置,并且能够说明它们彼此之间的相互关系。

数字图书馆元数据方案设计说明书

数字图书馆元数据方案设计说明书

数字图书馆元数据方案设计说明书元数据方案就是数字图书馆中所使用的信息描述方法数字图书馆的运作无论是存取过程还是检索过程都是以元数据方案为基础实现的以下是数字图书馆元数据方案设计说明书欢迎阅读1数字图书馆元数据方案设计原则元数据方案为数字图书馆分布式信息资源的发现和检索奠定了基础因此元数据方案决定了数字图书馆的功能特征、运行模式和系统运行的总体性能为了实现这一总体性能达到共建共享信息资源的目的数字图书馆元数据方案应遵循下列原则1.1元数据方案的标准化原则在数字图书馆建设中标准问题最重要的是元数据的制作而与元数据的制作紧密相关的问题是元数据方案的设计然而目前在元数据方案的标准化方面存在很多问题首先就DC 系列元数据而言在同一元素的著录内容上存在较大的差异如北京大学拓片元数据要求在权限(Rights)元素中著录馆藏地址、允许使用的用户范围而在《数字式中文全文文献通用格式》规定著录有关权限管理的声明包括知识产权等其次对于同类型信息资源的组织有的图书馆已经采用DC元数据有的则仍然采用MARC元数据这种著录内容和同类信息资源所用元数据的不一致都会给数据交换的带来困难最后各个元数据所采用的编码语言也是各不相同有的采用HTML有的采用SGML或XML由于各个编码语言的标签设置、内容、可扩展性的不同则会影响元数据的通用性元数据方案的标准化原则具有广泛的内涵它包括元素著录内容的标准化、同类型数字化信息资源的著录所采用元数据的一致性、元数据方案所采用编码语言的统一性这几个方面1.2元数据方案的准确性原则所谓准确性原则一方面指元数据方案中元素的定义、使用的术语等不能模棱两可容易产生歧义导致不同的理解;另一方面指元数据方案能够准确地描述信息资源也就是说元数据方案不仅要规定元素的设置、著录规则、标记语言的使用而且要规定著录所依据的标准、传输交换语言等当前困扰各个搜索引擎的问题是如何提高其查准率搜索引擎的低查准率究其原因是其对信息资源特征的揭示不够准确、深入数字图书馆的信息资源类型多样既有文字信息也有音频、视频信息只有准确地揭示它们的特征提供高质量的元数据才能保证较高的查准率1.3元数据方案的通用性与专用性原则元数据方案的通用性与专用性都是相对而言的所谓通用性是指元数据方案可用于数字图书馆多种信息资源的元数据制作所谓专用性是指元数据方案只适用于数字图书馆某一特定类型信息资源的元数据制作具有通用性的元数据适用于组织多种类型的信息资源通用性元数据有两种:一种通用性元数据的结构非常庞大、复杂但是具有很好的描述深度因为所有的情况都已经定义了比如MARC元数据另一种通用性元数据其结构非常简单好学易用仅仅只有几个非常普遍的属性但对特定类型的信息资源的描述能力不够而具有很好专用性的元数据其对于某一特定类型的信息资源描述能力很强但无法覆盖其它类型的信息资源数字图书馆信息资源类型多样过分强调专用性会导致多种元数据各自为政因此在设计元数据方案时设计人员需要在通用性和专用性之间加以协调、平衡才能产生更好的效果1.4元素设置的可扩展性原则所谓元素设置的可扩展性原则是指在元数据方案设计时为元素、元素的限定词以及属性值的扩充留有一定的余地数字图书馆要处理的数字化信息资源非常广泛而且各类数字化信息资源的应用背景更为复杂如果元数据方案只提供最广泛意义上的描述一些针对特定应用背景的内容并不纳入那么应允许使用者在不破坏已规定的标准内容(如元素的语义定义)的条件下扩充一些元素或属性值此外元数据是一个发展活跃的领域新的元数据元素会不断出现老的元数据元素会不断修改完善数字图书馆的生存环境是一个不断变化的环境新的信息源也会层出不穷这就要求元数据方案允许将新的元数据元素容纳于其中或者要求修改更新已经注册的元数据方案1.5元数据方案的互操作性原则所谓元数据方案的互操作性是指在由不同的组织制定与管理且技术规范不尽相同的元数据环境下要向用户提供一个统一的数据检索界面确保系统对用户的一致性服务在具体应用上互操作性表现为易转换性即在所携信息损失最小的前提下可方便地转换为其它系统常用的元数据2数字图书馆元数据方案设计应注意的问题2.1非MARC元数据与数字图书馆信息资源组织的质量问题在此根据我国当前引进、研制元数据的状况将现存的元数据分为两类即MARC元数据和非MARC元数据MARC元数据包括USMARC、UNIMARC、CNMARC等非MARC元数据包括DC系列元数据和非DC系列元数据DC系列元数据是指我国在数字图书馆建设的过程中对DC元数据加以引进并改造而生成的针对特殊类型信息资源的元数据也就是说这些新出现的元数据是在DC元数据的基础上进行了扩充、改进例如DC元数据、北京大学拓片元数据、《数字式中文全文文献通用格式》以及清华大学的建筑元数据非DC系列元数据包括TEI头标、EAD、GILS等目前将非DC系列元数据用于数字图书馆信息资源组织的呼声很高美国图书馆协会(theAmericanLibraryAssociation简称ALA)编目:著录与检索委员会(CommitteeonCataloging:DescriptionandAccess简称CC:DA)在《元数据与编目规则研究报告》(CC:DATaskForceonmetadataandCatalogingRules:FinalReport)中以TEI头标、EAD等元数据为例就非DC系列元数据作为编目源的情况做出评估得出三点重要结论第一非MARC元数据在专门针对其用途而设计的系统中效率最高但在图书馆目录系统中的效率就不是最高的第二不符合AACR的普通元数据进入图书馆目录的时候总是需要图书馆编目人员对其进行严格审查第三绝大多数非MARC元数据方案没有提供足够的信息以区别相似的信息资源或者内容基本相同而不同版本信息资源也就是说只有充分地利用各种编目规则和其它一些质量保证手段非MARC元数据才能具有较高的质量才能用于图书馆信息资源组织众所周知非MARC元数据大多数是一些资源描述机构针对自己的需要而开发的在这些元数据方案中元数据的制作可以由专业的编目人员完成也可以由根本没有任何经验信息资源的提供者自己完成非专业人员制作的元数据具有费用低、元数据的专指性较好的优点但是这样做会导致对数字化信息资源的属性和特征的揭示程度差别很大进而影响元数据的总体质量到目前为止绝大多数元数据仍然由专业人员提供例如TEI头标是一种复杂的元数据绝大多数TEI文本都是由人文科学领域非图书馆专业人员创建而TEI头标通常是由图书馆员创建或维护如果让非专业人员参与元数据的制作那么数字图书馆元数据方案设计就应解决元数据制作质量的检测与管理问题2.2DC系列元数据与MARC元数据的关系目前有些数字图书馆纷纷采用DC元数据作为描述数字化信息资源的格式例如清华大学图书馆的建筑数字图书馆项目以DC元数据作为基本框架结合建筑资料的实际情况对DC元数据进行改造扩充为THDL——清华大学建筑数字图书馆元数据格式北京大学依据DC元数据开发了拓片元数据格式上海图书馆也使用了DC元数据自从DC元数据产生以来图书馆界争论不休的问题是图书馆是继续使用MARC元数据还是舍弃MARC元数据改用DC元数据?具体到我国在任何一个数字图书馆元数据方案的设计过程中必然要涉及到MARC元数据与DC系列元数据关系的处理DC元数据最初的定位是处于全文索引和复杂格式的元数据之间提供简单明了的元数据格式DC元数据与MARC元数据的最主要的区别在于DC元数据结构简单而MARC元数据复杂DC元数据经过数次研讨会后对其进行扩展使用修饰限定词使得DC元数据不可避免地复杂起来其扩展的原因有两个一是应用领域比较复杂DC元数据没有足够的元素来描述信息资源的各种重要特征;二是人们希望DC元数据应用于多个领域实际上无论如何扩展DC元数据不可能解决所有数字化信息资源的描述问题笔者建议:由国家标准化权威机构——全国信息与文献标准化技术委员会来制定适应于各类数字化信息资源的元数据方案这样做可以在全国范围内就某一类数字化信息资源采用何种元数据著录达成共识目前在MARC元数据与DC系列元数据并存的情况下信息资源的存储与检索必然涉及MARC元数据与DC系列元数据两者之间的转换是将全部MARC元数据转换为DC元数据还是将DC元数据转换为MARC元数据?笔者认为MARC元数据与DC元数据之间转换的目的是实现一条记录可以以MARC元数据和DC元数据两种格式来显示以及数据的交换与共享但是如果用户没有这种需求或者两者之间不转换并不影响数据交换则没有必要进行转换也就是说根据实际需要来决定是否需要MARC元数据与DC元数据之间相互转换MARC元数据与DC元数据之间的转换会产生很多问题由于MARC元数据的描述能力大大丰富于DC元数据如何尽量解决两者之间转换所产生的歧义与不确定性以及信息丢失等难题2.3元数据的编码语言问题元数据的编码语言是指针对元数据元素和结构进行定义和描述的具体语法和语义规则目前各种元数据使用的编码语言是不同的包括标准通用标记语言(StandardGeneralMarkupLanguage简称SGML)、超文本标记语言(HypertextMarkupLanguage简称HTML)、可扩展标记语言(ExtensibleMarkupLanguage简称XML)三种形式有些元数据明确规定使用何种标记语言如TEI头标、EAD和美国联邦地理数据委员会《数字地理空间元数据内容标准》使用SGML也有些元数据没有规定使用何种编码语言如DC元数据有使用HTML也有使用XML的从数据交换和共享的需要出发元数据的作用是传递计算机系统可以理解的描述信息和存储数据计算机首先要理解元数据的各个元素或字段序列化的方式即按怎样的顺序和结构来组织各个元素及其内容所使用的编码语言不同元数据编码规则以及记录格式也存在差异这样则不利于数据的交换和信息资源的共享因此从长远利益来看有必要对元数据的编码语言进行统一3对我国数字图书馆元数据方案设计的若干建议3.1推进元数据标准化进程提高元数据的互操作能力目前国内出现了许多种元数据例如拓片元数据、建筑元数据、古籍元数据、中文数字化全文文献元数据等由于每种元数据都是由不同图书馆研制而成的并且针对不同类型的数字化信息资源因此就会出现DC系列元数据与MARC元数据并存的局面这种局面有利于DC系列元数据与MARC元数据形成优势互补也可以使某些适合用DC系列元数据描述的特定类型信息资源被充分地揭示和利用同时这种局面也会带来一些问题目前我国DC系列元数据至少有4种以上那么对DC系列元数据是否一体化;那些特定类型信息资源以前的机读记录该如何处理等笔者主张DC系列元数据一体化反对各自为政DC系列元数据都是在DC元数据的基础上根据用户的需求与信息资源特点进行了修正所以这些元数据的核心或实质仍然是DC元数据这一点可以作为DC系列元数据一体化的基础但是这种一体化工作完成就需要各个研制单位之间的协调与合作需要以国家标准的形式出现加以强制执行从而结束元数据结构各自为政的局面对于那些原由MARC元数据著录的信息资源来说MARC记录已为受编信息资源提供了著录内容详尽查全率高的机读格式在受编信息资源数字化的过程中没有必要舍弃原有的元数据而采用其它元数据方案3.2选择适用的编码语言在数字图书馆元数据方案设计中编码语言的选择也是关键步骤之一目前在DC系列元数据中通常使用HTML、SGML或XML有比较才有鉴别和选择我们不妨对这三种编码语言的优劣进行分析比较XML是SGML语言的一个子集同HTML一起成为SGML家族的主要成员SGML是一种元语言可以用来定义其它更专门的标记语言HTML是由SGML定义出来的专门使用在上的标记语言SGML是很好的资料存储格式适用于任何复杂的文件但不便于网络传输SGML非常复杂不易学习掌握XML与HTML不同XML是SGML的一个简化版本实际上XML也是一种元语言与HTML不同的是XML并没有语义上的元素定义也没有预先定义好的一套标记系统在实际应用中可以根据需要定义自己的标记XML是可扩展的具有较强的灵活性和适用能力同时它很有可能在今后成为应用最为广泛的标记语言但是目前XML在网络上的应用不如HTML广泛由于HTML文档本身的结构性不强扩展能力差描述内容的能力也较弱因此不太可能成为今后数字图书馆元数据方案的主要编码语言笔者建议数字图书馆元数据方案的编码语言采用XML3.3数字图书馆元数据方案的设计应面向专业编目人员信息资源编目实际上是信息资源进行分析、判断和组织的过程组织过程包括分类、描述、归并及格式化等过程;分析过程则包括区分、验证、评估、比较、解释及综合过程总之信息资源编目是一个复杂的、信息增值的过程目前困扰信息资源编目的主要问题是费用一是时间的花费二是金钱的花费费用问题使得许多元数据方案的设计者希望所研制的元数据可以由非专业人员制作毫无疑问非专业人员制作元数据的费用低然而这种低费用是以牺牲元数据的质量为代价的笔者认为对于数字图书馆的建设而言元数据的总体质量是不容忽视的如果没有高质量的元数据数字化信息资源的利用也就成为一句空话甚至会像搜索引擎一样查准率很低所以建议数字图书馆元数据方案的设计应面向专业编目人员只有专业编目人员利用编目规则及书目控制等手段才能够提供具有较高质量的元数据3.4数字图书馆元数据方案的设计中应考虑到其它技术运用在数字图书馆建设的过程中必然要涉及到许多技术其中包括数据库技术、全文检索技术、开放式网络词表/分类技术、地理信息系统(GIS)等在数字图书馆元数据方案的设计中我们需要与这些技术进行衔接并加以应用以联合在线资源目录(CooperativeOnlineResourceCatalog简称CORC)为例加以说明CORC 是建立在网络环境下的为本地或网络电子资源创建书目元数据的系统是一种为电子资源编目的数据库和工具包CORC利用了网上杜威分类法数据库实现了编目过程中DDC号码和主题标目自动分配同时CORC数据库的软件平台采用Mantis这是一种适用于任何元数据定义与界面的网络资源编目系统工具箱Mantis用XML存储记录使得记录的输出非常容易且有MARC、DCHTML和DCRDF、XML多种格式可供选择CORC的成功在于其能够充分利用各种技术因此我国在数字图书馆元数据方案的设计过程中也需要考虑其它技术的运用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数字图书馆的定义
美国研究图书馆协会的定义
1、 数字图书馆并不是一个单一的实体; 2、 数字图书馆需要技术支持;链接许多信
息资源; 3、 多个数字图书馆及信息机构之间的链接 对终端用户透明; 4、 全球范围的对数字图书馆与信息服务的 获取是一个目标; 5、 数字图书馆的收藏不仅限于文献的替身, 她还把不能以印刷形式代替和传播的人工印 刷品数字化,加以收藏。
数字图书馆的定义
中国数图工程规划的定义:
是采用现代高新技术所支持的数字信息资 源系统,将成为下一代互联网网上信息资 源的管理模式,可从根本上改变目前网上 信息分散、不便使用的现状。可以说,数 字图书馆是运行在互联网上超大规模的、 便于使用的、没有时空限制的知识中心。
数字图书馆的要点
数字化资源(多媒体) 网络化分布化的体系结构 统一的透明的用户接口 全球化(非单一实体) 元数据与对象管理 新的服务体系与模式
数字图书馆的实践(国内)
中国试验型数字图书馆项目
1996年倡导,1997年立项,2001年结
题 国家图书馆、上海图书馆、南京图书 馆、深圳图书馆、辽宁省图书馆、中 山图书馆、桂林图书馆
数字图书馆的实践(国内)
中国数字图书馆工程
一期规划(2000-2005) 指导思想:
统筹规划,需求牵引,科技创新,滚动发 展。
国家图书馆
数字图书馆的实践
国际
数字图书馆先导计划(DLI 1、2) 美国回忆和美国国家数字图书馆计划 (NDLP)
国内
中国试验型数字图书馆项目 中国数字图书馆工程
美国DLI计划
由美国科学基金会NSF、国防部高等技 术开发署DARPA、美国航空航天总署 NASA等单位联合资助
DLI-1 ($24M, 1994.9~1998.9)
建设原则:
公益性为主、资源建设为核心、统一标准 规范、开放建设与利益共享、开发与引进 相结合
数字图书馆的实践(国内)
中国数字图书馆工程
建设目标:
在互联网上形成超大规模的、高质量的中文数字资源库 群,并通过国家骨干通信网向全国及全球提供高效服务; 总体技术与国际主流技术接轨。建设一批中文多媒体资 源库,总容量不低于20TB;联合引进若干国内需要的国 外专题资源库;实现全国大部分地区图书馆文献资源的 联合采编及馆际互借;完成开发具有中国特色的数字图 书馆智能应用系统;培养一批高水平的专业人才队伍, 持续发展中国数字图书馆工程。
数字图书馆的结构
KW结构
数字对象(Digital Object)
键元数据、数字资料、调度码
数字对象仓库(Repositories)
元对象(Meta Object)
图书馆自动化系统管理/服务模式
读者
图书馆 自动化 系统
图书馆管员
人工获取
书目索引等 二次文献
索引与对象间无完整性保证
书刊资料库 (物理馆藏)
Definition
The digital library is not a single entity The digital library requires technology to link the resources of many The linkages between the many digital libraries and information services are transparent to the end users Universal access to digital libraries and information services is a goal Digital library collections are not limited to document surrogates: they extend to digital artifacts that cannot be represented or distributed in printed formats (ARL, 1995)
数字图书馆与元数据
概念与要点
上海图书馆系统网络中心 赵亮
数字图书馆的定义
从不同的概念演变而来
电子图书馆、网络图书馆、虚拟图书馆、 没有围墙的图书馆、图书馆数字化等等
尚无一个全球范围公认的定义
数字图书馆的定义
定义一:
利用数字技术获取、存储、存取、发 布信息的图书馆
定义二:
数字图书馆为国家信息基础设施提供 关键性信息管理技术,同时提供其主 要的信息库和资源库。换句话说,数 字图书馆是国家信息基础设施的核心。
DLI-2 ($40M~$50M, 1999~2003)
DLI1研究项目
环境规划与多媒体信息系统(加州大学伯克利分校) 图象和空间参考信息综合服务的分布式数字图书馆 (加州大学圣巴巴拉分校) 集成声音、图象和语言理解技术, 创建和搜索数字视 频图书馆--Informedia(卡内基· 梅隆大学) 综合性科学文献数字图书馆(伊利诺大学厄尔巴那分 校) 智能信息搜索引擎(密歇根大学) 各类数字图书馆网络综合集成机制--InfoBus (斯坦 福大学)
美国回忆与NDLP计划
美国回忆(American Memory)由美 国国会图书馆实施,主要内容为特色历 史资源数字化。(1989-1995)
美国国家数字图书馆项目(NDLP)是 美国回忆的后续项目,目标是2000年 数字化美国国会图书馆的500万件藏品。 (1994-)计划总投资6000万美元。
பைடு நூலகம்
DLI-2在规模、范围、内容和方向 上的显著变化
受资助单位大幅度增加 在过去纯研究的风格外,增加了面向 实际问题的研究和开发 除保留了传统的体系结构、信息检索、 互操作主题之外,一些新的研究主题 受到关注,如:信息保藏、添加声音、 建立和维护数字图书馆的实际问题、 与医疗有关的电子病历、医学图象等 与情报学的联系密切 地理信息核医学情报是众多项目的交 汇点
数字图书馆的结构-IBM
访问入口 客户端 (ACCESS Client)
读者
查询 (SEARCH)
IBM Digital Library
存储 (STORE)
检索数据
Library Server
(Search Data)
对象内容 (Content Objects)
光盘库或磁 带库
数字图书馆的结构体系
相关文档
最新文档