元数据在电子化学位论文中的应用探讨
2000-2011年我国电子文件管理元数据研究综述
血 。 面 都 有所 不 同 ,因此 不能 单 纯 的将 元数 据 定 义 为著 录 信 子 文 件管 理 元数 据 是 电子 文件 管 理 系统 中的 “ 液 ”
件 管 理 需 求 , 关保 证 文件 的真 实性 、 靠性 、 定性 、 有 可 稳 安 数据 标 准 。
全 性 、 整性 、 完 可理 解 性 与可 利 用 性 的数 据 。 以看 出 , 可 这
关 于 电子 文 件 管 理 元 数 据 规 范 的研 究 目前 还 比 较
两 个 元数 据 的概 念 是 从作 用 的角度 对 电子 文件 领域 的 元 少 。只 有何 嘉 荪 、 更达 两 位 发表 了 3篇题 名 为 “ 金 电子 文 数 据 加 以定 义 的 , 现 了元 数据 在 电子 文件 管理 中 的作 件 管 理 元数 据 的规 范 ” 系列 论 文。 规范 包括 元数据 标 体 的 该
局 部 功 能 。代 表人 物 为 徐维 , 他指 出 “ 数据 要 遵循 的 规则 、 方法 和设 计 流程 等 元 指 元数据 系统 在 电子 文 件 管理 计 算机 系统 中所 能 发 挥 的 作 用 和 能 力。 电子 文 件 管理 的 目的就 是 通过 元 数据 的功
展 、国际 元 数据 标 ; 隹与档 案著 录 标 准 的 关联 以 及 电子 环 际国 内 元数 据标 准 和 规范 的研 究 ,也包 括 对 元数 据 的标 境 中两者 的本 质等 方面 对这 一 论 点进 行 了论 证 。 电子 文件 管理 元 数据 阶段 。 这一 阶段 我 国档 案 研 究
论元数据在电子公文管理中的应用
叁茎室夔
l 胡敏.科技类图 书剔 旧标准 量化探 讨 J .情报探 索
l 0
作 者 简 介
谭 忠顶 (9 4一 ) , 17 男 广西师范学院图书馆 馆员。
围, 不仅仅局限于 由国务院办公厅 所统一 配置 , 还应 包 含其 他各 级党政 机构 、 事业 单位 、 共 团体 等 , 企 公
4 于 锡 南 . 能 量 观 点 诠 释 科 学 文 献 的 “ 化 ” 象 [ ] 用 老 现 J. 理 论 探 讨 ,02 ( )3 3 2 0 8 :2— 4
想这些概率递减现 象也服从上 述的 ( 1一P )倍速 原理 。 这个猜想 尚需更 多的实际数据来证真 。
5 王崇德 文献计量学 引论[ .广西师范 大学出版社 , M]
Ab t a t T e p p r i t n r d c s h c n e t f ee to i d c me t , t e a ay e i — d p h h s r c h a e f s i t u e t e o c p o lc r n c o u n s h n n lz s n r o e t t e d f in i s o o a g e e t n c d c me t ma a e n . T e p w  ̄u t d t a e u e n t e e t e l e e i e ce ft d y l cr i o u n n g me t h o e l me a aa c n b s d i h n i i c o r f c ce o l cr n c d c me tw i h c u d me tma y n e so h l cr n c d c me t ma a e n .5 R f . y l fee to i o u n h c o l e n e d ft e e e to i o u n s n g me t e s Ke o d E e to i d c me t ;Mea a a i y l yW r s lcrnc o u ns td t ;L f c c e e
元数据技术与电子文件管理关系探析
在计算机专业术语 中,这样定义元数据 : “ 数据 是关 于数 据 的数据 。是 数 字信 息组 织 元 和处 理 的基本 工 具 。 各种 形 态 的数字 化信 息 为
单 元和 资源 集合提 供 了规 范 , 遍 的描述 标准 普
和 方 法。 ” 于 元 数据 的解 读 , 个 领 域 由于 对 各
新技 术应用 与档案 坝代 化管理
社 会信 息化 的趋 势使 得世 界各 国在 政治 、 经济 、 军事 等方 面对信 息基 础设 施 的依赖 性 不 断加 强 。 一方 面 ,随着 信 息 化 与 办公 自动化 (A程度 的不 断加 深 , 统 的纸 质 文 件 与档 案 o) 传 逐 步被 电子 文件 所替代 . 真正 的“ 纸化” 无 时代 在 不 久 的将 来 就会 成 为 现 实 。 由于 电子 文件 较 之传 统 文件 的较 多的不 同之处 , 得管理 原 使 理 与方 法都 要发 生相 应 的改 变。另 一方 面 , 社
对元 数据 应用 的侧 重 点各 不相 同 , 元数 据 的 对 定 义 也各 不 相 同。最 早 将 元 数据 引入 到档 案
会 的不断进步使得人们对档案信息的价值也 更 加 重视 。对 信 息 的利 用 也提 出 了更 高 的要
界的是美国匹兹堡大学的戴维一 比尔曼 , 他在
19 9 2的 “ ou e t g dc me t 一 文 中 首 先 D c m ni ou n” n
简 而言 之 , 以说 : 可 电子 文件 元 数据 是描
述 电子 文件 背 景 、 内容 、 结构 及 其 整个 管 理过 程并 可 为计 算机 及 网络 系统 自动 辨析 、 解 、 分
电子文件管理元数据
电子文件管理元数据汇报人:2023-12-13•元数据概述•电子文件管理元数据标准•元数据采集与描述目录•元数据存储与检索•元数据应用与案例分析•电子文件管理元数据的未来展望01元数据概述元数据的定义与特点元数据的定义元数据是关于数据的数据,用于描述数据的属性、特征和上下文。
在电子文件管理中,元数据用于描述电子文件的属性、内容和结构。
元数据的特点元数据具有多样性、结构性和动态性。
多样性指的是元数据可以包含多种类型的信息,如文本、图像、音频等;结构性指的是元数据可以采用不同的结构形式,如XML、JSON等;动态性指的是元数据可以随着时间和环境的变化而变化。
03提高电子文件的可利用性和可理解性通过元数据,可以方便地检索、浏览和利用电子文件,提高电子文件的可利用性和可理解性。
01描述和组织电子文件元数据可以用于描述电子文件的属性、内容和结构,帮助组织和管理电子文件。
02保证电子文件的真实性和完整性元数据可以记录电子文件的创建、修改和访问等信息,确保电子文件的真实性和完整性。
元数据在电子文件管理中的作用随着信息技术的发展,元数据经历了从手工到自动、从封闭到开放的发展历程。
未来,元数据将更加注重智能化、语义化和跨领域的应用。
同时,随着云计算、大数据等技术的发展,元数据的管理和应用也将更加高效和便捷。
元数据的发展历程与趋势元数据的发展趋势元数据的发展历程02电子文件管理元数据标准OAIS参考模型EDI/EDIFACT标准ebXML标准RosettaNet标准ISO 15489-1:2001《信息与文献-文件管理-元数据管理》GB/T 18894-2002《电子文件归档与管理规范》GB/T 18893-2002《电子档案管理规范》《电子签名法》《电子认证服务管理办法》01020304元数据应用元数据应用是实施电子文件管理的最终目的,它能够实现电子文件的共享和交换,提高电子文件的利用价值。
电子文件管理系统基于元数据的电子文件管理系统是实施电子文件管理的重要工具,它能够实现电子文件的捕获、存储、组织、检索、利用和处置等全过程管理。
基于元数据在电子档案管理中起到的作用探讨
基于元数据在电子档案管理中起到的作用探讨作者:孔庆宁来源:《群文天地》2012年第12期摘要:文章介绍了元数据定义以及基于元数据在电子档案管理中起到的重要作用。
关键词:元数据;电子档案;管理目前各种业务信息管理系统已经在运行应用,各种类型的电子文件产生于这些信息管理系统中,还有一些新的信息管理系统在建设,一些信息管理系统在升级改造,应当把基于元数据的电子文件管理的方式逐步应用到各个信息管理系统中,元数据集是电子文件管理的基础,人们通过电子文件的元数据记录电子文件整个生命周期的全部信息,依据元数据对电子文件进行有效的控制,保护电子文件真实,完整,有效,元数据是解决电子文件管理的重要工具。
一、电子文件元数据定义元数据基本定义:关于数据的数据(data about data)。
在信息管理领域,元数据被定义为:提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的描述。
在电子文件归档管理中它是描述电子文件数据属性的数据:包括文件的格式、硬件和软件环境、文件处理软件、编排结构、字处理和图形工具软件、字符集等数据。
电子文件元数据标准定义元数据是电子文件内容、背景、和结构信息及整个管理流程的数据。
其作用是描述信息资源或数据本身的特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估、选择等功能。
二、元数据在电子文件管理中的作用元数据作为数据管理的工具广泛应用于数据库、图书馆、情报、文档管理等多个领域,不同领域应用的元数据有其各不同,在电子文件管理中,元数据起到下面几方面作用:(一)电子文件元数据对电子文件内容、背景和结构信息进行了全面的描述,这是电子文件元数据的基本作用(二)用于电子文件完整性保障表现在两方面:单体电子文件,电子文件内容信息和元数据信息构成完整的电子文件信息集合,检测元数据项目是否齐全可以确定电子文件是否完整;集合体电子文件,元数据中记录了电子文件多个单体电子文件有机联系的数据,依据这些数据可以收集关联的电子文件,检测是否完整。
电子文件元数据方案
电子文件元数据方案一、引言在当今大数据时代,人们产生和使用的数据量急剧增加。
这些数据不仅数量庞大,而且具有多样性和复杂性。
传统的信息管理方式已经不能满足人们对数据处理的需求。
为此,电子文件元数据方案应运而生。
二、电子文件元数据的概念及作用元数据是为描述、管理和识别信息资源而存在的数据,它是信息资源的结构描述,可以用来描述信息资源的属性和组成,起到了信息资源的管理作用。
电子文件元数据是针对电子文件而设计的元数据,它是所谓“数据的数据”。
电子文件元数据发挥着重要的作用,主要包括:1. 电子文件的管理:电子文件元数据可以描述电子文件的属性和组成,记录电子文件的存储位置和使用情况,方便电子文件的管理。
2. 电子文件的检索:电子文件的元数据中包含了电子文件的关键信息,可以提供全文检索、分类检索、属性检索等多种检索方式,方便用户对电子文件进行快速检索。
3. 电子文件的传递:电子文件元数据中记录了电子文件的格式和版本信息,可以实现电子文件的跨平台传递和交换。
三、电子文件元数据方案的设计原则1. 标准化:电子文件元数据方案应采用国际通用的标准,避免重复设计和实现,提高系统的互通性和兼容性。
2. 统一性:电子文件元数据方案应适用于各种类型的电子文件,不能因为文件类型不同而导致元数据不一致,保证因材施教。
3. 完整性:电子文件元数据方案应覆盖电子文件的所有属性和组成信息,包括文件格式、文件大小、创建时间、修改时间、作者、标题、内容摘要、访问权限等。
4. 可扩展性:电子文件元数据方案应具有一定的可扩展性,可以随着需求的变化灵活地增加新的元数据信息。
5. 明确性:电子文件元数据方案应采用简洁明了的术语和描述,方便用户理解和应用。
四、电子文件元数据方案的设计方法1. 通过分析电子文件的使用目的和场景,确定需要记录的元数据信息。
2. 选择适合的元数据标准,如Dublin Core元数据标准、MARC21元数据标准、MODS元数据标准等。
浅析元数据的概念发展及其应用
关键 词 : 元数 据 ; 电子 文件 ; 念 概
K e r :mea t ; lcr ncdo u ns c n e y wo ds tdaa ee to i c me t; o c pt
中 图分 类 号 :P 9 T 3
( 阳体 育学 院档案 室 , 沈 沈阳 10 0 ) 1 1 2
( h na gP yi l d ct nIsi t, c ie f e S e yn 1 12, hn ) S e yn h sc uai n tue ArhvsOfc , hn a g1 0 0 C ia aE o t i
m t a ? hs ae dsr e t akrudadt ee p et lao rcs o e dt i oe o aea epr n e t dn etnc e dt Ti ppr eci sh bcgon n edvl m n 印pctnpoes f t a hp v ee udra ig f l r i a a b e h o i i m a an th d sn oe co
文 献 标识 码 : A
文 章 编 号 :0 6 4 1( 0 0)3 0 6 一 1 1 0 — 3 2 1 3 —ቤተ መጻሕፍቲ ባይዱ16 O 1
1 计 算 机 元数 据 电子 文件 元 数 据 是 描 述 电子 文件 背 景 、 内容 、 构 及 其 整 个 管 结 元 数据 最 早 由美 国 电子 文 件专 家戴 维 ・ 比尔 曼 引 进 电子 文 件 研 理 过 程 并 可 为 计 算 机 及 其 网 络 系 统 自动 辨 析 、 解 、 取 和 分 析 归 分 提 究 领 域 的 , 指 出 :在 电 子 环 境 中 , 录 可 以理 解 为广 泛 的 ‘ 录 ’ 纳的数据。它既可用于 保障相关 电子文件 的真 实性 、 他 “ 著 记 完整性 、 一致 电子 文件 著 录 中 所 运 用 的主 要 技 术 就 是 元数 据 技 术 。 ” 对 元 性 、 而 关联性和长 期有效性 ; 可帮助对分布式 网络环境 下的 电子文 又 数 据 最 初 的定 义则 是 : 数 据 是 关 于 数 据 的 数 据 , 是 元 数 据 是 描 件 进 行 有 效 的 集成 管理 和 协 助 提 供 集 成 服 务 , 是 构 建 数 字档 案 馆 元 或 更 述 数 据 的数 据 。 在 这 一层 面 上 , 数 据 的 含 义 和 信 息 技 术 领 域 的 元 信息组织体系必不可少的工具。电子文件管理 元数据真正的含义被 元 数据 含 义是 一 致 的 。 定 义 为 :在 对 电子 文件 及 其 文 件 创 建 和 管 理 有 关 的人 、 程 和 系统 “ 过 进 行 确 认 以 及 为 其 提 供 凭 证 和 背 景信 息 的 过 程 中 ,有 关 文 件 的 管 2 著 录 元 数据 ① 实现方式。传统的档案著录信息 的实现 方式是 “ 后端控 制” 理 、 用 和 文 件 可 理 解 性 的 元数 据 。 ” 电 子 文 件 管理 元数 据 是 专 门 , 利 “ 也就 是 文 件 归 档 以 后 才 由档 案 部 门 的工 作 人 员来 进 行 著 录 。 而档 案 设 计 用 于 满 足 电 子 文件 管 理 需 求 , 关保 证 文 件 的真 实 性 、 靠性 、 有 可 元 数 据 其 实 现 的 方式 是 “ 端 控 制 ” 即 在 文 件 创 建 时 , 同时 对 数 稳 定 性 、 前 , 就 安全 性 、 整 性 、 完 可理 解 性 和 可 利 用 性 的 数据 。 ” 字信 息 的有 关 信 息进 行 获取 ,并 随 着 人 们 对 信 息 对 象 的不 断 操 作 , 电子 文件 管 理 元数 据 的功 能 主 要 表 现 在 以下 几 个 方 面 : 更 好 ① 而不断增加新的内容 , 并且它一直伴 随于 数字信 息整个 生命 周期 的 的实 现 信 息 资 源 共享 。 档 案 信 息 进 行描 述是 实现 档 案信 息 资源 共 对 各个阶段 , 进行 的是全过程控制 , 直到信 息对 象被销毁。 ②实现环境 享 的 必 要 条 件 。 数据 的描 述 功 能 有 : 一 , 述 数 字 化信 息 的基 本 元 第 描 和 手 段 。 传 统著 录信 息主 要 实 现 环 境 是 手 工 管 理 环 境 , 即在 此 环 境 特征。通过 对数字化档案信息基本特征的描述 , 使得档案信息资源 下对 文件 进 行 著 录 。其 实 现 手段 主 要 是 采 用 手 工著 录 。而 元 数据 实 共 享 系 统 能够 通 过 元数 据 体 系 自动 搜 索 到 数 字 化 信 息 。第 二 , 述 描 现 的环 境 主 要 是 数 字 化 的 系统 环 境 , 即在 数 字 化环 境 下应 用 信 息 技 提 问 问 题 。 案信 息 资 源 的元 数 据体 系 为用 户 描 述 提 问 建 立 了表 达 档 术对 文 件 进 行控 制 。 的获 取 是 将 元 数据 系统 预 设 于计 算机 系统 之 框 架 , 数 据 体 系 将 帮助 用 户 有 效 、 法 的 提 问 , 而 实 现 档 案 信 息 它 元 合 从 中, 从而使大部分元数据可以由计算机 自动生成。 ③实现 目的。 传统 资 源 共 享 功 能 。 三 , 第 为档 案信 息组 织 提 供 了平 台 。 过 对档 案 信 息 通 的档 案 著 录 信 息 主要 是 用 于 描 述档 案 信 息 资 源 、 现 搜 寻 和 定 位 功 元 数 据 的描 述 , 确 了档 案 信 息 的 分 类 与 特 点 , 得 档 案 信 息 拥 有 实 明 使 能 , 到档 案 信 息 检 索 的作 用 。而 元数 据 不 仅 拥 有 传 统 档 案 著 录 的 者、 起 组织者深化了对档 案信息 的了解。②有效 的加强 了电子文件的 功能 , 还记录 了与档 案信息对象相关 的背景信 息、 技术状 况等多 方 凭证作用。 元数据通常是 由电子文件 管理 系统在 电子文件形成过程 面的信息 , 不仅可 以用于检 索, 可以用于保障文件的完整与真实 , 中动态产生 的, 可以是 由电子文件 管理 系统按功能软件同步生成 还 也 以及信息可读性 等多个方面 , 从而做 到有效地保证数字信息 的法律 的 , 论 采 取何 种 形 式 它都 是 文 件 形 成 、 用 保 管 过程 中 , 实 于 文 不 利 忠 效 力。 件的真实反 映 ,而 不是档案工作人 员根据 个人意志 随意赋 予的信 息 , 元 数据 一经 形成 就 被 封 装 起 来 , 其 只 能被 写入 和 读 取 , 能 且 使 不 3 电子 文 件 管 理 元数 据 而 元数 据 中有 关 于 利 用权 限 、 级 、 码 等信 息 , 密 密 文 件 由 内容 、 构 和 背 景 三 部 分 组成 , 构 反 映 了各 部 分 内 容 被 改 动和 删 除。 且 , 结 结 的组织情 况 , 背景则 反应后了文件形成过程 , 为管理这 些文件 内容 严 格 控 制 着 利 用 文件 的 用 户 级 别 , 绝 非 法 用 户 的介 入 , 而 使 电 杜 从 从 而 产 生 的信 息就 是 元 数 据 。电子 文件 出现 后 , 术 环 境 的变 迁 , 致 子 文件 不能 轻 易 地 被 打 开 ,减 少 了 对 电 子 文件 进 行 改动 的机 会 , 技 导 了元数据的复杂化。 电子文件 的结构包括 逻辑结 构和 物理 结构 , 背 而使 电子文件 的凭证作用进~步得 以保证。 能够 有效地防范 电子 ③ 第一, 防范主体风 险。 电子文件管理 元数据 防范主体风险 景除 了行政 背景 , 包括技术背景 , 还 如文件产生的软硬件平 台。 文件 文件风 险。 产生的软硬件平 台等技术信息是在 纸质环境 中不曾出现过 的, 却是 的 功 能 主 要 表 现 在 确 保 提供 电子 文 件 创 建 、管 理 和 利 用 的背 景 信 管 理 电子 文件 的 重 要 信 息 ,元 数 据 这 一概 念 正 好 能 够 概 括 这 些 信 息 : 确保 对重要 电子文件管理 的决定和行为作 出责任说 明 ; 确保提 息 。 对 于 一份 电子 文 件 而 言 , 些 为 了有 效 管 理 文 件 内 容 而 形 成 的 供作 为电子文件检索的主体检 索点。 那 第二 , 防范客体风险。 作为客体 信 息 可 能 与 文件 内容 分 散 存储 、 理 , 就 增 加 了保 存 、 理 元 数 据 的 电子 文件 其 完 整 的 构成 由 内容 层 、 构层 和 背 景 信 息 层 构成 。 管 这 管 结 的灵 活 性 。 同时 , 由于 计 算 机 软 硬 件 平 台 的 不 断 升 级 、 变换 , 电子 文 对于 内容层 , 元数据帮助确�
浅议DC元数据在数字化图书馆中的应用
创建者
出版者 权限
Dt a t e
T p ye
日期
类型
Ds ii 说明 Cn iu r ecpo r tn otbt r o 其他责任名 Fr a o t m
L nu g agae R lj e tn 8o 语种 关联
格式
Ietir 标识符 dnie f
发学位论文 的电子化 , 其作为将来数字化图书馆 的重要组成部分 。但 将
网络信 息资源 的存储 、 获取 、 使用和传输与传统信息资源又有很大不 同, 如何在浩如烟海 的网络信息空 间中高效 、迅速地做 到信息 的共享和变 换, 如何为 电子化的网络资 源提供 有效 的信息 组织方式 , 当今信息 网 是 络发展 的一 个热点 。 针对这一现象 , 许多元数据研究项 目纷纷 出现。 多 众
林核心数据( u l C r )V A核心类 目( R t C t o ) 艺术作品 D bn o 、R i e V Ac a gy、 er 著录类 目( a g e f t D s p o  ̄ rs f n 、 E C C t o so h ec t n f ok oA )R A H著录单 元 er i re i r i o 集合( E C e ete) 。而众 多的元数据研究项 目中, 图书馆界 R A He m n st l 等 在 和情 报界 影 响最 大 、应 用 最为 , 泛 的就是 D (' l 0 M t a C E b nc ) e d t ui a a
( u l C r) D bi o  ̄ n e L数据应 用的 实例 。 分析 了 D C元数 据开发应 用中存在 的问题 , 出了元 提
数 据 开发 的 几 点 建议 。
关键词 : C 元数据 ; D; 数字 图书馆 中图分类号 : 2 07 G 5. 6 文献标识码 : A
数字图书馆重要资源——电子化学位论文的发展分析
elcto i h si n is rat n o a ed p o e e r c t e s a d ds e n t i a d s me fc r blms. n o
[ y w rs T e i;Di e ai ; Ee t i;Mea t;D Ke od ] h ss s rt st o n l r c co n td a O e
维普资讯
文献资源建设
【 文章绾号 】10-35 20 )4 04 -0 04 2X(020 - 00 3
图节镩 建 设 20() 0 4 2
数字图 书馆重要资源
电子化 学位论 文 的发展分 析
T e A a s f l Ip r n Dg a L rr eo r : h n l i o alm ot t itl i ay R suc ys a i b e
t t : ig e ea c o el to i t e i a d e h : x n r s r x ̄ h f ec r n c h s s n dis ta i s er t n o . Thi a il a a y e t sg iia e f s r ce n lz s h t e in f nc o c
・
高校是 学位论文 的主要 来源 , 高校本 身也是学位 论文 的 主要利用者 。 在对学位论文多年 的使用 和共享过程 中, 一些高 校和研 究机构 为统一学 位论文 的数据格式 、 交换方式和提高 学位论文的利用效率 , 而成立 了研 究和开发学位论文的组织 。 这些组 织所制 定的关于 学位论文 的数据格式 、 著录方式等标 准被其成 员共 同采用 , 员之 间 的数据 交换 和共 享就有 了统 成 的基础, 大大方便了学位论文 的利用 和检索。 () 1 目前 国内研究和开 发学位论文 的组织, 比较有影 响的 是 由清 华大学 负责组织 、 协调 , 由进入 “ 1 工程 ” 1 21 的6 所高校 合作建设 的 “ 高校 学位论文 ” 数据 库项 目组 。 该项 目始于 19 95 年, 得到 国家教育 部C L 支持并 资助 。 库的建设采用统 A L S 数据 规范 、 散加工 、 中建库 的运作 模式 , 分 集 由各个参建高校著 录 自己的学位论文记录 , 然后提交给清 华大学, 建立统一 的数 据库 。 目前各成员高校 已提交 了数万 条记录, 以检索到 学位 可 论文的摘要级别 , 地址是 :
论元数据在电子档案管理中的应用
四 、 结 小
“ 定量管理” 定性管理 ” 与“ 有机结合起来 .
目前 , 数据 的 应 用 已成 为 电子 档 案 元 其 子等载体 的文件界定 为“ 机关文件材料 ” 管理 的关 键 . 重 要程 度 被 喻 为 电子 档 案 ,
激 励 机 制 对 完 成 工 作 任 务 具 有 极 其 重 要 步 促进 高校 办 学 质 量和 知名 度 的 提 高 。 的保 障 作 用 。在 学 科 建 设 、 课题 申报 、 科研 当 前 . 国 高校 的 科 技 发 展 呈 现 出 前 我
朱汇川
20 年 1 06 2月 1 日. 家档 案局 第 8 并 对 电子 文件 归 档 时 的 组 成 要 件 提 出特 8 国 号 令 正 式发 布 实施 《 关 文件 材 料 归档 范 殊 要 求 . 出 “ 关 对 应 归 档 电 子 文 件 的 机 指 机
围 和 文 书档 案 和 文 书 档 案 保 管 期 限 规 定》 元数 据 、 背景 信 息 等 要 进 行相 应 归档 ” 这 。
主动适应 , 自觉 地 去 实 现 管 理 目标 , 科 整 体 目标 的 共 同 实现 。 让 研 管 理 有 章 可 循 、 据 可 依 。 同 时 , 将 有 要
在 必行 。加 强 高校 科 研 管理 应将 管 理 工 作
与 科 技 发 展 有 机 地 结 合 起 来 . 新 传 统 的 更
加 引导 科 研 人 员 把 个 人 目标 和 监 督 作 用 因此 。 强 高 校 科 研 管理 工 潜在 的说 服 力 , 而 把 组 织 意 志 变 为 人 们 作 者 给个 体 目标 与 作 , 进 高校 科 研 工 作 的 健 康 持 续 发 展 势 促 促 的 自觉行 动 . 被 管 理 者 由被 动 接 受 变 为 使
德国电子学位论文元数据XMetaDiss及对我国的启示
学 位论 文是 学 生为 了获 取学 位 向学校 或 其他 学 术 单位 提 交 的学 术 研 究 论 文 。学 位 论 文 是 高 校 、 科
研 院所 图 书 馆 文 献 资 源 建 设 中非 常 宝 贵 的信 息 资
பைடு நூலகம்
源 , 中蕴涵 的富有创 造 性 的思 维和 成 果 , 接反 映 其 直 了各 学科 领 域 的前 沿 动态 和最 新 发 展 , 有 较 高 的 具 参 考 价 值[ 引。 电 子 学 位 论 文 ( T E D—— E eto i 1cr nc
在信 息社 会 , 络在 文字 、 网 图像 和声 音 的发 布 方
面 同传统 媒介 展 开 了激 烈 的竞 争 , 种 新 型 媒 介 赋 这
予 电子 出版 物 巨大 的 优势 : 间 和 空 间 的 空 前 可 及 时
T ei a d D sett n h s n israi )项 目所 采 用 的 元 数 据 。 s o ND TD项 目是 由美 国 弗 吉 尼 亚 理 工 大 学 于 1 9 L 97 年发 起 的 , 中文 名称 为“ 于 网络 的博 硕士 学 位 论文 基
Mea aa t d t St nd r o e t o C The e nd D i— a a d f r El c r ni s s a s
大
快 。在 可 以 预 见 的 将 来 , Mea s X tDi s将 进 一 步 与 固 E TD- MS及 DC Smpe i l 形成 鼎足 之 势 。本文 主 要介 李
探究电子档案元数据管理方案策略
探究电子档案元数据管理方案策略文/金彩平摘要:电子档案元数据管理方法与水平直接影响着保存电子档案的真实性。
为充分发挥出元数据的优势,本文对电子档案元数据管理方案进行深入分析,在明确管理系统技术架构、功能模块、数据库以及元数据管理设计的基础上,对元数据管理方案展开对比与评价,希望为电子档案元数据管理方案的实施提供科学参考与借鉴。
关键词:电子档案;元数据;数据库;管理方案前言电子档案具有十分重要的保存价值,是指实体档案数字化过程中产生的一类文件,具有体积小、容量大、检索便捷等特点。
在实际应用过程中,元数据管理成为电子档案有效保存应重点解决的问题。
在大数据、云计算、互联网等技术快速发展的背景下,有必要应用成本效益、工作效能、可操作性优良的元数据管理方案,以此实现电子档案管理系统的优化。
1电子档案元数据管理系统设计1.1元数据管理原则元数据的功能定位与模型描述是整合电子档案资源、创建档案利用服务的关键,在从整体角度分析电子档案元数据这一核心系统时,首先,尊重档案、尊重客观、尊重元数据与整体间的有机联系,以此保证元数据与档案内容信息间的关系,可通过可视化、可理解的形式展现出来。
其次,注重电子档案不同生命阶段中内容信息的著录,坚持前端控制与全过程管理原则,实现档案数字化管理系统有效运行。
最后,注重元数据扩展性、互操作性、标准化功能的运用,使得元数据与电子档案内容信息间构建起有效的逻辑关系,从而实现信息共享与数据交换。
1.2系统技术架构电子档案元数据管理系统是以JAVA为开发语言、MYSQL为后台数据库系统、XML为系统配置技术,在JE22平台上创建起来的,严格按照文档一体化理念进行设计,各功能模块、业务层独立且协同工作,具有较强的互操作性与扩展性。
前台展现层、系统业务层、系统服务层、数据访问层、数据存储层构成了电子档案元数据管理技术架构,强大的用户展示、档案数字化业务管理、系统开发服务、数据存储与转移功能,极大地提高了元数据的利用效率。
对我国电子政务信息资源元数据标准的思考
21 0 0年 0 9月
农 业 图 书 情 报 学 刊 J u n o irr n f r t n S i c sn Agi l r o r ̄ f b aya d I oma o c n e i L n i e r ut e c u
V0 . . 1 22 NO 0 .9
信 息 资源 元数 据是 按 照一定 规则 ,从 信 息资 源 中
信 息共 享与 合作 是 电子政 务应 用 系统 框架 的 目标 。 为 抽 取相 应 的特 征 ,组 成 的一 个特 征元 素集 合 ,这 种规 了实现 上述 目标 各发 达 国家在 电子政 务建 设上 大 多采 范 化 描 述 可 以 准确 和 完 备 地 说 明 信 息 资 源 的各 项 特 用 的方 法是 研究 和制 定符 合本 国的政 务信 息元 数 据标 征 。信 息 资源 元 数 据 的 主 要 内容 包 括 信 息 资 源 的标 准 ,用 于对 电 子政 务 信 息 资源 的描 述 、组 织 、管 理 , 识 、内容 、分 发 、数 据 质量 、数 据 表 现 、数 据 模式 、
后 , 才能 发 挥 标 准 的 功 效 ,才 能 实现 元 数 据 的 功 能 ,从 而 更 好 地 支持 政 务 信 息 资 源 共 享 、 实 现 业 务协 同 。 关 键 词 :标 准 ;元 数 据 ; 电子 政 务 ;信 息 资 源
中 图分 类 号 :G 5 .l 3 92
文 献 标 识 码 :B
随着 电子政 务建 设 的不 断深 人 .人们 充分 地 认 识 上 ,强 调必 须将 标准 做 “ ” 实 、落 “ ”后 ,才 能发 实 到 电子 政务 中 “ 电子 ” 是基础 , “ 务 ”是核 心 ,而 挥 标 准 的功效 。才 能实 现元 数据 的 功能 。 政
元数据在电子档案管理中的价值
、
元数 据有利 于保证 电子档案 的真 实性
和凭 证性 , 维护 电子档 案 的真 实面貌
在虚 拟 的计算机 环境 下 , 电子 文件具 有 易
更 改性 。 们 可 以对 文件 的 内容 和形 式进 行修 人
改或者 删 除 . 这样 容 易破 坏 原 电子档 案 , 害 损
二、 元数 据 有利 于 电子 档 案 的检 索 , 高 提
描述 电子 文件 数据属 性 的数据 , 括 文件 的格 包
式 、 排 结 构 、 件 和 软 件 环境 、 件处 理 软 编 硬 文
件 、字处理 和 图形 工具 软件 、 字符集 等数据 。
由此 可见 , 元数据 的 内容 及其 对 于 电子 文件 管 理 的价 值 已经得 到政府 的认 可 。
一
描述 ” “ 、 类型特 征” “ 、 功能 ” “ 字档案位 置 ” 、数 、 “ 指针 位置 ” “ 、 主题” “ 题 ”等元 素来保 证 电 、标 子档 案 的 真 实性 。通 过 这 些背 景 信息档 案 部
门在 管 理 电子档 案 的 时候 能够 很好 地 维 护 电 子档案 的真 实面 貌。
了电子档 案 的开发和 利 用水平 2 3
了电子档 案 的原 始 性和 真 实 性 。在 网络环 境
《 科技档案} 0 0 2 1 年第 4期
舒技术应用与档案坝代化管理
与纸质档 案相 比, 电子档案具 有载体和 信
息相分 离性 , 电子档 案的检 索也 有别于对传 对 细描述有利 于 电子档 案 的延续可读 , 证 了电 保
《 关文 件材料 归档 范 围和 文 书档案 保 管 机
期 限规定》 , 对 电子 文 件 的 归档 , 出“ 中 针 提 机 关对 应 归档 电子文件 的元 数据 、 背景信 息 等要
电子档案元数据标准化管理方案探讨
标准实践电子档案元数据标准化管理方案探讨■ 尹 洁(河北省标准化研究院)摘 要:隶属于电子文件的电子档案需要元数据的标准化管理,而在电子文件中,元数据管理占据着非常重要的作用,可以说元数据是电子文件的核心系统。
为了保证电子档案可以长时间保存又不会失去本身的特性,比如真实性,所以在安全角度上寻找和制定功能完整的元数据标准化管理方案,对于电子文件的整理具有重要的作用;其次因为电子文件比较广泛,我们应该对元数据的管理进行分类分析,并深入了解电子文档元数据的概念以及学习管理理念,根据我们整理的元数据标准化管理分类结果,制定相应、有效而且切实可行的方案,为了更好地长期使用电子文档元数据,我们还要追求科学和标准化的管理。
关键字:元数据标准化管理,电子文档,科学分类,有效方案DOI编码:10.3969/j.issn.1002-5944.2021.07.014Discussion on Metadata Standardization Management Scheme ofElectronic ArchivesYIN Jie(Hebei Standardization Institute)Abstract: The standardized management of metadata is needed in the management of electronic archives belonging to electronic documents. Metadata management plays a very important role in electronic documents, as it is the core system. In order to ensure that electronic files can be kept for a long time without losing their own characteristics such as authenticity, it is important to develop a metadata standardized management scheme with complete functions from the perspective of security, which plays an important role in the collation of electronic documents. As electronic documents are relatively extensive, we should classify and analyze the management of metadata and deeply understand the concept of electronic document metadata and learning management idea. Based on the classification results of metadata standardization management, corresponding, effective and feasible scheme is formulated. The scientific and standardized management is also needed in order to use electronic document metadata for a long time.Keywords: metadata standardization management, electronic documents, scientific classification, effective scheme1 引 言元数据,顾名思义,是将一个电子文件从最基础的背景开始,然后描述文件的内容,之后确定整个电子文件的整体结构,最后统计整个过程中整理的数据。
电子的文件元数据要求规范
电子的文件元数据要求规范电子文件的元数据是指记录文件有关信息的数据,通常包括文件的属性、特征和描述信息等。
规范的电子文件元数据管理对于实现文件的有效组织、检索和利用至关重要。
以下是电子文件元数据要求规范的讨论:1.元数据的一致性:元数据的命名、格式和内容应符合同一标准,以确保各个系统和平台之间的互操作性。
这意味着元数据的定义和使用应遵循行业内通用的规范,并且不同组织和部门之间需要达成一致。
3. 元数据的可扩展性:在规范电子文件的元数据时,应考虑到未来可能需要添加的新属性。
这就要求元数据模型能够灵活地扩展,以便支持新的需求和新的技术标准。
其中,命名空间(namespace)的设计是关键,可以通过命名空间为不同类型的元数据属性进行分类和扩展。
4.元数据的唯一性:为了避免冗余和混淆,元数据应该具有唯一性。
这意味着存储、管理和索引元数据时,需要确保唯一性,以避免数据不一致和重复。
6.元数据的可维护性:为了保证电子文件的元数据始终有效和准确,需要建立相应的维护机制。
这包括定期更新元数据、清理无用元数据、修复错误或失效的元数据等。
此外,还需要制定元数据的管理策略和规程,确保元数据的完整性和一致性。
7.元数据的安全性:电子文件的元数据可能会包含敏感的信息,如文件的权限、所有者等。
因此,在规范电子文件的元数据时,需要确保元数据的安全性,遵守隐私和数据保护的规定。
总结起来,规范电子文件的元数据要求意味着确保一致性、完整性、可扩展性、唯一性、可性、可维护性和安全性。
这些规范可以为组织提供更高效和可持续的电子文件管理和利用方式。
数字出版元数据技术应用[数字出版的元数据标准概况]
数字出版元数据技术应用[数字出版的元数据标准概况]元数据是数据的数据,这一概念的提出首先缘于对电子资源管理的需要。
互联网的爆炸式发展,使人们难以在海量的数据中准确找到自己所需的信息,于是人们就试图模仿图书馆使用的卡片方式来对数字资源进行相关的描述和编目。
现在,以数字方式出版的文献数量正在不断增加,再加上电子商务的运作方式已经深入渗透到了发行领域,出版物的贸易方式开始面临新的挑战。
在这种情况下,制定和规范数字出版的元数据标准就显得非常必要和紧迫了。
本文介绍了当前国际比较流行的几种数字出版元数据标准,及其主要特点。
在传统的图书文献领域,MARC记录格式已被长期实践证明是一种行之有效的描述文献的工具,但是不适合贸易特别是电子商务中作为知识产品的作品及其交易的要求。
为了提供一个能有效地支持出版发行商描述书目信息,从而支持其业务运作和作品交易的工作,国内外出版界提出了各种元数据标准,如国际数字出版论坛(IDPF)发布的电子书系列标准(EPUBI-13)、国际电工委员会(IEC)发布的电子书系列标准(IEC-TS *****-2006,IEC*****-2009,IEC *****-2009),美国书业研究会的ONIX标准。
目前国外出版业最常使用的元数据标准为在线信息交换(OnlineInformation eXchange,简称ONIX)标准。
该标准是一种描述、传递和交换出版物元数据的标准,用XML传递数据,是世界出版行业针对图书出版发行和销售的供应链制定的元数据标准。
ONIX的最初构想是在1999年由美国出版商协会(Association of American Publishers,简称AAP)主持召开的会议上提出的。
2000年1月,AAP出版了ONIX产品信息标准第一版,即ONIX ProduceInformation Standards 1.0。
在英国,图书工业通讯组织(BookIndustryCommunication,简称BIC)早于1998年就出版了BIC Basic标准,旨在满足所有零售书商的需求。
元数据概念及应用
元数据基础知识:Microsoft® SQL Server™ 2000 Meta Data Services 是一系列使您得以管理元数据的服务。
要使用Microsoft Meta Data Services,需要先了解元数据的特点。
如果不了解元数据的概念,本概述会帮助您了解Meta Data Services 所管理的数据类型。
元数据描述数据的结构和意义,就象描述应用程序和进程的结构和意义一样。
切记:元数据是抽象概念,具有上下文,在开发环境中有多种用途。
元数据是抽象概念当人们描述现实世界的现象时,就会产生抽象信息,这些抽象信息便可以看作是元数据。
例如,在描述风、雨和阳光这些自然现象时,就需要使用"天气"这类抽象概念。
还可以通过定义温度、降水量和湿度等概念对天气作进一步的抽象概括。
在数据设计过程中,也使用抽象术语描述现实世界的各种现象。
人们把人物、地点、事物和数字组织或指定为职员、顾客或产品数据。
在软件设计过程中,代表数据或存储数据的应用程序和数据库结构可以概括为开发和设计人员能够理解的元数据分类方案。
表或表单由对象派生出来,而对象又由类派生。
在元数据中有多个抽象概念级别。
可以描述一个数据实例,然后对该描述本身进行描述,接着再对后一个描述进行描述,这样不断重复,直到达到某个实际限度而无法继续描述为止。
通常情况下,软件开发中使用的元数据描述可扩展为二至三级的抽象概念。
比如"loan table" 数据实例可以描述为数据库表名。
数据库表又可以描述为数据库表对象。
最后,数据库表对象可以用一个抽象类描述,该抽象类确定所有派生对象都必须符合的固定特征集合。
元数据具有上下文人们通常把数据和元数据的区别称为类型/实例区别。
模型设计人员表述的是类型(如各种类或关系),而软件开发人员表述的是实例(如Table 类或Table Has Columns 关系)。
浅析元数据的概念发展及其应用
浅析元数据的概念发展及其应用作者:王烁来源:《价值工程》2010年第33期摘要:在电子文件日益发展的今天,元数据这一概念已得到广泛应用,那么到底元数据的内涵是什么?本文将针对元数据产生的背景及其发展应用的过程加以阐述,以便档案工作人员更加深刻的理解电子文件。
Abstract: With the growing electronic documents today, metadata concept has been widely used, and then in the end, what is the meaning of metadata? This paper describes the background and the development application process of metadata in hope to have a deeper understanding of electronic documents for archives staffs.关键词:元数据;电子文件;概念Key words: metadata;electronic documents;concept中图分类号:TP39 文献标识码:A文章编号:1006-4311(2010)33-0166-011计算机元数据元数据最早由美国电子文件专家戴维·比尔曼引进电子文件研究领域的,他指出:“在电子环境中,著录可以理解为广泛的‘记录’……电子文件著录中所运用的主要技术就是元数据技术。
”而对元数据最初的定义则是:元数据是关于数据的数据,或是元数据是描述数据的数据。
在这一层面上,元数据的含义和信息技术领域的元数据含义是一致的。
2著录元数据①实现方式。
传统的档案著录信息的实现方式是“后端控制”,也就是文件归档以后才由档案部门的工作人员来进行著录。
而档案元数据其实现的方式是“前端控制”,即在文件创建时,就同时对数字信息的有关信息进行获取,并随着人们对信息对象的不断操作,而不断增加新的内容,并且它一直伴随于数字信息整个生命周期的各个阶段,进行的是全过程控制,直到信息对象被销毁。
电子档案元数据的管理方案
电子档案元数据的管理方案作者:暂无来源:《经营者》 2018年第6期元数据的准确定义为:对各种信息资源进行结构化的描述,提供关于信息资源或数据的一种结构化数据。
它可以对各种电子数据本身的特征和属性进行描述,具有发现、检索、管理、描述等功能。
目前基于元数据的电子档案管理已经广泛应用于各行各业。
本文对元数据在电子档案管理中的功能、电子档案元数据管理方案等几个方面进行研究和探讨。
一、元数据在电子档案管理中的作用(一)保证电子档案的真实性和完整性因为电子档案与实体分离,并且可以通过相关的操作进行变更,所以它的真实性往往会受到怀疑。
但是,如果电子档案有了元数据,就可以将整个电子档案的形成、利用、处理的过程记录下来,从而保证整个电子档案的真实性和完整性。
(二)确保电子档案的长期可读性我们知道,电子档案的生成和保存主要是依靠电脑和一些软件,一旦电脑或者是软件运行出现问题,电子档案就无法识别。
在这种情况下,就可以利用元数据建立相应的模型对电子档案的格式信息、制作信息、转换方式等进行详细的记录与描述,这样就可以在电子档案迁移过程中保证其完整性和可读性。
(三)具有发现、检索、管理、描述等基本功能元数据最基本的功能就是描述功能,它可以对档案信息对象的属性和位置进行详细的描述,从而将所找对象的基本信息呈现在人们面前。
此外,因为元数据将主要信息展示出来了,所以就便于人们快速查找所需信息。
同时,元数据还可以对各种资源对象的各个部件之间的结构和关联模式进行管理。
二、电子档案元数据的管理方案电子档案元数据的管理方案有四种,即内封装、半封装、不封装、特定封装。
以下对电子档案元数据的这四种管理方案作介绍。
(一)内封装内封装主要就是指将电子档案的内容信息和相应的元数据进行绑定,使其形成一个完整的对象,目前我国常用的数据封装方法就是VEO和Mets。
VEO内封装常用的方法有两种,一种是在不对电子档案的内容信息作任何处理的前提下,将元数据封装到内容信息里面的特定位置;另一种就是将存储在电子档案内容中的文件进行编码转换,然后和元数据一起封装到特定结构当中。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
元数据在电子化学位论文中的应用探讨金毅王绍平(上海交通大学情报科学技术研究所,上海200030)摘要目前,元数据的研究和应用方兴未艾。
网络电子资源使用元数据的优点是显而易见的,但只有基本的元素和修饰词比较一致,有了统一的标准,而在某些专业领域的应用上还不成熟,研究也不够深入。
本文参考国内外在电子化学位论文和元数据研究和应用的最新成果,探讨了元数据在电子化学位论文中的应用,总结了电子化学位论文中使用元数据的优点并提出一个初步的元数据集。
关键词学位论文电子化元数据DCThe study on application of metadata in electronic thesis and dissertationJin Yi,Wang Shaoping(Institute of Information Science and Technology,Shanghai Jiao Tong University,Shanghai 200030)Abstract The study and application of metadata are booming now. The advantages of using metadata for network electronic resources are obvious. But only the basic metadata elements and qualifiers have unified standard. Research and application in some special areas are not deep. This article studies the latest research on metadata and electronic thesis, and discusses the usage of metadata in electronic thesis, concludes the advantages of the application, and proposes an initial metadata element set.Keywords thesis, dissertation, electronic, metadata, DC1 引言随着信息技术的发展和Internet应用的日益普及和深入,网上资源成为获取信息越来越重要的途径。
提供数字化、无纸化的电子网络信息服务是图书馆等信息提供者的当务之急。
研究生学位论文是研究生申请硕士或博士学位的研究成果,对于相关专业的研究开发有重要的参考价值。
现在许多高校都在积极研究和开发学位论文的电子化,作为将来数字化图书馆的重要组成部分,无疑是很有意义的工作。
但网络信息资源的存储、获取、使用和传输与传统信息资源又有很大不同,如何在浩如烟海的网络信息空间中高效、迅速地做到信息的共享和交换,如何为电子化的网络资源提供有效的信息组织方式,是当今信息网络发展的一个热点。
图书馆界和情报界对信息资源数据规范的研究已经很久了,元数据也不是新生事物,传统的图书馆卡片、图书的版权说明等都是元数据。
标准的元数据格式也已经广泛使用,如MARC(机读目录格式)、AACR(英美编目条例)等都是元数据的格式。
目前绝大部分的书目记录均采用上述格式,在数据检索的查准率和数据描述的丰富性上还没有其它的元数据格式可以超过它们。
但是MARC和AACR也有局限性:需要在专门的软件系统中使用,不太适合Internet的环境;编制记录要经专业训练,花费较长的时间;不易处理动态的多媒体信息;程序修订复杂、缓慢。
由于以上这些局限性,在网络环境中传统的数据描述格式已跟不上形势发展的需求,许多元数据研究项目纷纷出现。
众多的元数据研究项目中,在图书馆界和情报界影响最大、应用最为广泛的就是DC (Dublin Core)Metadata Element Set,既都柏林核心元数据集。
从1995年产生,经6年多的研究和探讨,DC已被翻译成多种文字,用户遍及世界各地。
许多国家已经将DC纳入国家标准中描述电子信息的一个部分,其影响正在不断扩大。
电子化的学位论文因其特点,非常适合采用以DC为基础的元数据来描述,具有很好的应用前景。
2 电子化学位论文采用元数据的优点DC元数据集由15个基本元素组成,这15个基本元素称为“简单DC”,分三个部分:内容描述部分、知识产权部分和外形描述部分。
根据DC的可选择性原则,可以简化着录项,最低限度只要7个元素(题名、主题、出版者、日期、类型、格式和标识符)就可以了。
为了描述需要详细着录的资源,DC又推出了“复杂DC”,引进了修饰词的概念,用于进一步明确元数据的特性。
这样可以把MARC、AACR的优点和各种已有的分类法、主题词表等控制语言吸收进来,极大地丰富了DC的描述性,并允许DC的地方版在15个基本元素的基础上增加新的元素和修饰词。
DC的整个元素集是可扩展的,每个元素可以重复使用或有选择地使用,而且还可以拥有子类型和子模式来增强功能。
这样,DC就具有可选择性、可修饰性、可重复性和可扩展性的优点。
在电子化学位论文中使用以DC为基础的元数据能充分发挥DC元数据在描述电子信息资源的优势,具有以下优点:(1)数据结构简单,可读性强。
DC只有15个基本着录项,而且可以重复使用或有选择地使用。
通过使用修饰词,可以方便地扩展和描述电子资源信息。
相对于MARC数据格式,DC的数据结构大大简化了。
而MARC元数据正如其名字本身所说明的,是计算机可读及处理的数据,对人而言,可读性很差,对软硬件平台的依赖性很强。
DC元数据使用标记语言的格式,兼容性和不依赖于软硬件平台的独立性都很强。
在电子化学位论文中考虑采用的元数据(参见表1)大部分能在DC元数据集中直接得到,一些描述学位论文所需要的扩展信息可以通过使用修饰词和扩展元素的办法解决。
(2)着录方便,生成记录简单快速。
使用者无需经过专业的培训就可以为自己的资源创建元数据,着录格式很容易掌握和理解。
上海交通大学从1996年开始要求研究生在论文答辩后提交学位论文的电子版本,在确定学位论文使用的元数据后,就可以让学生在网上提交电子版本论文的同时,填写一张简单的着录表格,经程序检查、处理后直接生成学位论文的元数据。
这样就可以让学生自己完成学位论文的数据着录,既大大减少了图书馆数据着录人员的工作,也使学位论文的数据可以在第一时间转入数据库并提供网上检索,数据滞后的时间将从几个月缩短为几天,甚至当天录入当天即可在网上检索到。
而目前采用传统的着录方式,必须使用专用的编目软件,着录人员要经过一段时间的严格培训,并且编目方法也要复杂得多,学位论文的数据无法在短时间内录入、转换入库,网上检索就更滞后了。
(3)DC是为电子资源量身定制的。
DC本身就是随着信息技术的发展和Internet应用的日益普及和深入应运而生,其可选择性、可修饰性、可重复性和可扩展性的特点可以有效揭示电子资源的特征,为网络电子资源的分类、组织和索引提供更好的途径。
DC描述的重点是电子资源的内容、内部结构及应用和管理,而不象传统的着录方法有很多外形特征的描述。
使用DC,能很好地反映电子化学位论文的内容和特征,比如学位论文的数据格式、全文指针、学位级别、保密级别等,都可以使用恰当的DC元素来反映。
(4)更适合在Internet上使用。
电子化学位论文最终是应该在Internet上检索和浏览的。
现在网上的搜索引擎,如Yahoo、Sohu、Sina等的工作方式,主要是通过自动搜索软件到站点抓取网页,将网页内容索引后建立数据库提供检索。
网页使用的HTML语言有一个META 标签可以定义网页的属性,一般常用来定义网页的主题词和摘要,这样搜索引擎可以直接将网页的主题词和摘要收录进数据库。
否则就只能对整个网页的内容进行索引,这必然使查准率受到影响,检索效率低下。
目前,DC元数据的存储与管理大致有以下几种方法:1)嵌入在信息资源中2)与通信协议捆绑3)存储在数据库中4)独立的元数据文件其中将DC元数据嵌入在信息资源中的方法目前使用得较多,一个最主要的应用领域是基于HTML的应用。
根据“DC元数据在HTML中的编码规则”(即RFC2731),DC元数据在HTML 中的应用主要与两个HTML标签有关,一个是上面提到的META标签,另一个是LINK标签。
通过使用这两个标签,DC元数据就方便地嵌入到HTML文件中。
这样搜索引擎可以有效地抓取和索引网页文件中的DC元数据。
本文的第3、4部分介绍了具体的使用方法和一个实例。
虽然将DC元数据嵌入到HTML文件中使用方便,句法简单,但考虑到HTML本身的结构性不强,扩展能力和描述能力较差,以后的应用方向应该是与XML相关,基于RDF(Resource Description Framework)的形式。
XML在结构化、扩展性、内容描述等方面都要大大优于HTML,是Internet发展的一个重要方向。
DC元数据可以很好地嵌入到基于XML的RDF框架中,适应将来技术发展的需要,也为不同元数据体系之间提供更好的互操作性。
此外,与通信协议捆绑也是一个很有前途的应用方向。
比如与图书情报界使用较多的Z39.50协议相联系,DC元数据可以得到更为有效和广泛的使用。
同时,DC元数据也可以象传统的元数据一样,存储在数据库中或作为独立的元数据文件存在。
在Internet的网络环境下,DC元数据的存储与管理有多种选择和很大的灵活性,有着乐观的发展前景。
3 电子化学位论文使用的元数据集确定电子化学位论文使用的元数据集,综合考虑了以下几个方面的因素:(1)目前国内学位论文使用的数据格式,比较统一的是由国家教育部CALIS支持并资助的高校学位论文数据库项目所采用的数据规范,该项目由进入“211工程”的62所学校合作建设,其数据格式也被参加的学校所共同采用。
该数据格式定义完整、详细,遵循国家标准GB/T 2901-92(书目信息交换用磁带格式),并使用标准推荐执行的“中国公共交换格式(CCFC)”着录。
电子化学位论文使用的元数据主要参考了该数据规范。
(2)在国外,电子化学位论文研究比较早,也比较有成果的是美国的ETD(Electronic Thesis and Dissertation)项目。
该项目目前有120个成员,包括105所大学和15个研究所。
上海交通大学是中国大陆唯一一所参加该项目的大学,从1999年开始与ETD项目组开展关于研究和实现学位论文电子化的交流,为自己的学位论文电子化建设提供了许多有益的建议。
ETD项目组在最近的会议上提出了ETD互用性元数据标准(ETD-ms: an Interoperability Metadata Standard for Electronic Theses and Dissertations,Version 1.00),该标准定义了用于描述电子化学位论文的元数据标准。