元数据转换及集成的研究现状述评

合集下载

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状一、引言元数据是描述数据的数据,它包含了对数据的定义、结构、特性以及与数据相关的其他信息。

元数据的作用不可忽视,它能够提供数据的背景信息、数据的来源和可信度,匡助数据的管理和使用,以及数据的集成和共享。

元数据标准则是对元数据进行定义和规范化的一种方式,它能够确保元数据的一致性、可互操作性和可维护性。

二、元数据的分类元数据可以根据其描述的对象进行分类,常见的元数据分类包括:1. 技术元数据:描述数据的存储、格式、访问权限等技术属性。

2. 业务元数据:描述数据的业务含义、数据的来源和用途等业务属性。

3. 行为元数据:描述数据的变更历史、操作记录等行为属性。

三、元数据标准的重要性元数据标准对于数据管理和数据管理至关重要,它能够提供以下好处:1. 数据一致性:通过定义统一的元数据标准,可以确保不同系统中的元数据描述一致,避免数据的混乱和重复。

2. 数据集成和共享:元数据标准可以提供数据的结构和关系信息,匡助数据的集成和共享。

3. 数据质量控制:元数据标准可以定义数据的质量指标和验证规则,匡助保证数据的质量。

4. 数据安全和隐私保护:元数据标准可以定义数据的访问权限和隐私保护规则,匡助保护数据的安全和隐私。

四、元数据标准的现状目前,元数据标准的发展已经取得了一定的成果,各个领域和组织都制定了相应的元数据标准。

以下是一些常见的元数据标准:1. Dublin Core:Dublin Core是一种用于描述网络资源的元数据标准,它定义了一组核心元素,包括标题、作者、主题、描述等。

2. CDISC:CDISC是临床数据交换标准组织,它制定了一系列用于临床研究数据管理的元数据标准,包括SDTM、ADaM等。

3. ISO/IEC 11179:ISO/IEC 11179是国际标准化组织和国际电工委员会联合制定的元数据标准,它定义了一套用于数据元素和数据定义的元数据模型和规范。

4. 数据库元数据标准:各个数据库厂商都制定了相应的数据库元数据标准,用于描述数据库的结构、索引、约束等信息。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状一、引言元数据是指描述数据的数据,它提供了关于数据的信息,如数据的结构、内容、格式、来源等。

元数据在数据管理和数据分析中起着重要的作用,它可以帮助用户了解数据的背景和特征,提高数据的可理解性和可管理性。

为了确保元数据的一致性和互操作性,制定和遵守元数据标准是非常重要的。

二、元数据的定义和分类1. 定义元数据是指描述数据的数据,它提供了关于数据的信息,如数据的结构、内容、格式、来源等。

元数据可以分为三个层次:业务元数据、技术元数据和管理元数据。

2. 分类(1)业务元数据:它描述了数据与业务之间的关系,包括数据的定义、业务规则、数据质量要求等。

例如,一个银行的业务元数据可以包括客户信息、账户信息、交易信息等。

(2)技术元数据:它描述了数据的物理特性和技术属性,包括数据的存储方式、数据的格式、数据的访问权限等。

例如,一个数据库的技术元数据可以包括表结构、索引信息、存储位置等。

(3)管理元数据:它描述了元数据的管理信息,包括元数据的创建时间、修改时间、所有者等。

例如,一个元数据管理系统的管理元数据可以包括元数据的版本号、元数据的更新记录等。

三、元数据标准的必要性和作用1. 必要性(1)提高数据的可理解性:元数据标准可以提供数据的定义、业务规则等信息,帮助用户理解数据的含义和用途。

(2)提高数据的可管理性:元数据标准可以提供数据的结构、格式等信息,帮助用户管理数据的存储和访问。

(3)提高数据的互操作性:元数据标准可以提供数据的来源、格式等信息,帮助不同系统之间共享和交换数据。

2. 作用(1)数据管理:元数据标准可以提供数据的结构、格式、业务规则等信息,帮助用户进行数据管理,如数据的存储、访问、更新等。

(2)数据分析:元数据标准可以提供数据的定义、业务规则等信息,帮助用户进行数据分析,如数据的查询、统计、建模等。

(3)数据集成:元数据标准可以提供数据的来源、格式等信息,帮助用户进行数据集成,如数据的抽取、转换、加载等。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状引言:元数据是指描述数据的数据,是数据的基本属性和特征,是数据的基本信息。

元数据标准是指对元数据进行描述和定义的规范和标准。

在当今数字化时代,元数据和元数据标准的重要性日益凸显。

本文将探讨元数据与元数据标准的现状,以及其在数据管理和信息化建设中的重要作用。

一、元数据的定义与功能1.1 元数据的定义元数据是指描述数据的数据,包括数据的结构、内容、来源、格式、质量等信息。

1.2 元数据的功能- 为数据提供描述和解释,匡助用户理解数据的含义和用途。

- 为数据管理和数据分析提供支持,提高数据的可发现性和可用性。

- 为数据集成和数据共享提供基础,促进数据资源的共享和利用。

二、元数据标准的分类与应用2.1 元数据标准的分类元数据标准可以分为结构化元数据标准和非结构化元数据标准两种。

2.2 结构化元数据标准结构化元数据标准是指按照一定的规范和格式对元数据进行描述和定义,如Dublin Core、MARC等。

2.3 非结构化元数据标准非结构化元数据标准是指对元数据进行描述和定义时不受特定格式和规范限制,如自定义元数据标准。

三、元数据标准的应用领域3.1 数据管理元数据标准在数据管理中起着关键作用,匡助组织对数据进行有效管理和利用。

3.2 数据交换元数据标准可以促进数据交换和数据共享,降低数据集成的难度和成本。

3.3 数据分析元数据标准可以提高数据分析的效率和准确性,匡助用户更好地理解和利用数据。

四、元数据与元数据标准的现状4.1 元数据的不完整性目前元数据存在不完整性和不一致性等问题,影响了数据的质量和可用性。

4.2 元数据标准的多样性不同领域和组织对元数据标准的要求不同,导致元数据标准的多样性和碎片化。

4.3 元数据标准的更新与维护元数据标准需要不断更新和维护,以适应数据管理和信息化建设的需求。

五、元数据与元数据标准的未来发展5.1 标准化与统一未来元数据标准需要更加标准化和统一,以提高数据资源的互操作性和可持续发展。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状一、引言元数据是指描述数据的数据,它包含了关于数据的各种属性和特征的信息。

元数据对于数据管理和数据分析非常重要,它能够提供数据的可理解性、可发现性和可重用性。

元数据标准是规范元数据的组织和结构,以确保元数据的一致性和互操作性。

本文将详细介绍元数据与元数据标准的现状。

二、元数据的定义与分类元数据可以分为三个主要类型:技术元数据、业务元数据和管理元数据。

1. 技术元数据:包括数据结构、数据格式、数据存储位置等与数据技术相关的信息。

2. 业务元数据:包括数据的含义、数据的业务规则、数据的业务流程等与业务相关的信息。

3. 管理元数据:包括数据的来源、数据的拥有者、数据的更新周期等与数据管理相关的信息。

三、元数据的重要性元数据在数据管理和数据分析中发挥着重要的作用。

1. 数据管理:元数据能够提供数据的可理解性和可发现性,匡助用户快速找到所需的数据,并理解数据的含义和结构。

2. 数据分析:元数据能够提供数据的可重用性,匡助用户在数据分析过程中准确理解数据的含义和规则,从而提高数据分析的准确性和效率。

四、元数据标准的现状元数据标准是保证元数据一致性和互操作性的基础,目前已经浮现了一些广泛应用的元数据标准。

1. Dublin Core:Dublin Core是一种用于描述网络资源的元数据标准,它包含了15个核心元素,如标题、作者、日期等。

2. 模式定义语言(Schema Definition Language,SDL):SDL是一种用于描述数据结构的元数据标准,它定义了数据的表、字段、索引等结构信息。

3. 统一建模语言(Unified Modeling Language,UML):UML是一种用于描述系统结构和行为的元数据标准,它包含了用例图、类图、时序图等各种图形表示方法。

五、元数据标准的应用元数据标准在各个领域都有广泛的应用。

1. 图书馆领域:元数据标准可以用于描述图书馆的图书、期刊、报纸等资源,匡助读者快速找到所需的图书和资料。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状一、引言元数据是指描述数据的数据,它提供了关于数据的信息,包括数据的定义、结构、属性、格式、使用方式等。

元数据对于数据管理和数据分析非常重要,它可以帮助组织和管理大量的数据,提高数据的可发现性、可用性和可重用性。

为了实现元数据的有效管理和交流,制定和遵守元数据标准是必不可少的。

二、元数据标准的定义元数据标准是指对元数据进行描述、组织和管理的规范和准则。

它包括元数据的命名规则、分类体系、属性定义、数据格式、数据字典等方面的规定。

元数据标准的制定可以确保元数据的一致性、可比性和可交互性,提高数据管理的效率和质量。

三、元数据标准的重要性1. 数据管理:元数据标准可以帮助组织对数据进行有效管理和组织,包括数据的采集、存储、整合和分析等过程。

通过统一的元数据标准,可以减少数据冗余和重复,提高数据的一致性和准确性。

2. 数据分析:元数据标准可以提供数据的详细描述和解释,帮助数据分析人员理解数据的含义和用途。

通过元数据标准,可以更快速地找到和使用需要的数据,提高数据分析的效率和准确性。

3. 数据共享:元数据标准可以提供数据的共享和交流的平台,帮助不同组织和系统之间进行数据的互操作。

通过遵守统一的元数据标准,可以实现数据的无缝对接和共享,促进数据的共享和合作。

四、元数据标准的现状目前,元数据标准在各个行业和领域都有不同的应用和发展。

以下是一些常见的元数据标准的现状:1. Dublin Core元数据标准Dublin Core是一种用于描述网络资源的元数据标准,它包括15个核心元素,如标题、作者、主题、日期等。

Dublin Core元数据标准已经被广泛应用于图书馆、档案馆和数字资源管理等领域。

2. CDISC SDTM元数据标准CDISC SDTM(Study Data Tabulation Model)是一种用于临床试验数据管理的元数据标准,它定义了临床试验数据的结构、属性和格式。

CDISC SDTM元数据标准已经成为临床试验数据管理的国际标准,被广泛应用于医药行业。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状一、引言元数据是描述数据的数据,它提供了关于数据的详细信息,包括数据的定义、结构、格式、属性、关系等。

元数据对于数据管理和数据分析非常重要,它能够帮助用户更好地理解和使用数据。

在数据管理领域,元数据的标准化是非常关键的,它能够提高数据的互操作性、可重用性和可管理性。

本文将介绍元数据的概念、元数据标准的意义以及当前元数据标准的现状。

二、元数据的概念元数据是指描述数据的数据,它是对数据进行定义、描述和管理的信息。

元数据可以包括数据的名称、类型、长度、格式、取值范围、关系等。

通过元数据,用户可以了解数据的结构、含义、用途和使用方式。

元数据可以分为三个层次:物理层元数据、逻辑层元数据和概念层元数据。

物理层元数据描述数据的存储方式、物理结构和访问方式;逻辑层元数据描述数据的逻辑结构和关系;概念层元数据描述数据的概念和含义。

三、元数据标准的意义元数据标准是对元数据进行定义和规范的标准。

元数据标准的制定和实施对于数据管理和数据分析具有重要意义。

首先,元数据标准能够提高数据的互操作性。

通过统一的元数据标准,不同系统和组织之间可以更好地共享和交换数据,提高数据的互操作性和集成性。

其次,元数据标准能够提高数据的可重用性。

通过标准化的元数据,用户可以更方便地找到和使用已有的数据资源,提高数据的可重用性和效率。

最后,元数据标准能够提高数据的可管理性。

通过统一的元数据标准,可以更好地管理和维护数据资源,提高数据的质量和可管理性。

四、当前元数据标准的现状目前,国内外已经出现了多种元数据标准,如Dublin Core、MARC、MODS、EAD等。

这些标准主要用于描述图书馆、档案馆和博物馆等特定领域的数据。

此外,还有一些通用的元数据标准,如ISO 19115、ISO 19139等,用于描述地理信息数据。

这些标准都是在特定领域或特定需求下制定的,具有一定的局限性。

在实际应用中,往往需要根据具体的需求和环境制定和使用元数据标准。

集成研究现状及分析评价

集成研究现状及分析评价
图1企业资源层次结构图
(二)战略集成
战略集成是指在共同发展战略的基础上进行战略的整合。战略集成对于提高效率、增强核心竞争力,使企业适应技术发展、市场竞争的需要。如何实现战略集成,是企业保持核心竞争力的重要保障。我国学者王海峰、杜龙正、李向辉(2010)基于系统科学的视角,运用物理—事理—人理(WSR)系统方法论对战略集成进行了详细的研究。他们认为战略集成分为四个部分,分别为:战略目标、战略选择、战略实施、战略控制。战略目标的集成包含整体目标—技术创新目标—企业家精神的集成;战略选择包括技术创新战略—关联战略—组织文化的集成;战略实施则需要考虑资源配置—组织创新—利益链的集成;战略控制需要考虑“硬”指标和“软”指标,定性和定量指标的集成。四个集成过程也不是简单的直线联系,而是相互作用和相互影响的。
5、选择竞争性
集成体的形成是有条件的,这些条件是集成主体选择集成单元的依据,集成主体通过对有关信息的搜集、分析和评价,并根据集成体整体目标最优的原则确定集成单元。在不完全信息的条件下,集成主体要选择最好的集成单元,这时,竞争就会起到很大的作用。选择的过程就是集成主体与集成单元之间合作—竞争的博弈过程。
三、集成的分类与研究现状
(一)资源集成
经济学中将资源定义为“生产过程中所使用的投入”,这一定义很好地反映了“资源”一词的经济学内涵。资源就是具有使用价值,可以为人类开发和利用的各种物质要素的总称。资源分为物质资源(如森林、矿产等)、技术资源、人力资源等。
企业资源集成分为两个方面,分为内部资源集成和外部资源集成。高伟增(2004)认为,企业内资源集成,就是将企业内各种资源依照管理级别逐级用局域网连接起来。企业内资源集成不是简单的资源相加,设置了分级代理结构:企业有一个总代理,各个生产部门都有一个生产代理,每台加工设备都有一个设备代理。企业总代理根据各个部门发送的请求有选择地向外发送。各个车间生产代理根据生产任务选择设备。设备代理根据设备现状决定是否选用该设备:是,则用该设备完成生产任务;否,要求车间生产代理重选设备。企业外部资源集成是指企业本身所拥有的供应商资源、客户资源、研发资源,通过网络集成起来,实现资源共享和信息共享,从而敏捷地、能动地响应灵活多变的市场,减少不必要的资源浪费,获得更大的市场利润。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状引言概述:元数据是指描述数据的数据,是对数据的描述和定义,可以帮助我们更好地理解和管理数据。

元数据标准是对元数据进行规范化和标准化的过程,旨在提高数据的可理解性、可管理性和可重用性。

本文将探讨元数据与元数据标准的现状,包括其定义、作用、应用领域和发展趋势。

一、元数据的定义和作用1.1 元数据的定义元数据是指描述数据的数据,它包含了数据的属性、结构、关系、来源、格式等信息。

元数据可以分为三个层次:结构层元数据、语义层元数据和应用层元数据。

1.2 元数据的作用元数据在数据管理中起到了重要的作用。

首先,元数据可以帮助我们理解数据的含义和结构,提供数据的上下文信息。

其次,元数据可以帮助我们管理数据,包括数据的存储、访问、维护和更新等。

此外,元数据还可以支持数据的集成和共享,提高数据的可重用性和互操作性。

1.3 元数据的应用领域元数据的应用领域非常广泛。

在数据管理领域,元数据被广泛应用于数据仓库、数据集成、数据质量管理等方面。

在信息系统开发和维护中,元数据可以帮助我们进行系统分析、设计和测试。

此外,元数据还在数据科学、人工智能和大数据等领域有着重要的应用。

二、元数据标准的现状2.1 元数据标准的定义元数据标准是对元数据进行规范化和标准化的过程,旨在提高数据的可理解性、可管理性和可重用性。

元数据标准包括元数据的定义、分类、命名规则、描述方式等方面的规范。

2.2 元数据标准的作用元数据标准可以帮助我们统一元数据的定义和描述方式,提高数据的一致性和可比性。

通过遵循元数据标准,可以减少数据管理的复杂性和错误率,提高数据管理的效率和质量。

2.3 元数据标准的发展趋势随着数据管理和数据科学的快速发展,元数据标准也在不断演化和完善。

未来的元数据标准将更加注重数据的语义描述和数据的上下文信息。

同时,元数据标准也将与其他标准(如数据质量标准、数据安全标准)进行整合,以提供更全面的数据管理解决方案。

三、元数据与元数据标准的挑战与解决方案3.1 元数据的挑战元数据的挑战主要包括数据的复杂性、数据的多样性和数据的时效性。

数据集成发展现状及未来趋势分析

数据集成发展现状及未来趋势分析

数据集成发展现状及未来趋势分析数据集成是指将来自不同源头的数据整合在一起,使其能够在一个统一的平台上进行管理和分析。

数据集成的目的是提供一个一致、完整和准确的数据视图,以帮助企业做出更好的决策。

随着大数据时代的到来,数据集成变得愈发重要,并且在不断发展和演变。

本文将对数据集成的现状进行分析,并预测未来的发展趋势。

目前,数据集成已经成为许多企业的关键战略之一。

数据集成解决了数据孤岛的问题,即将分布在各个系统和应用程序中的数据连接起来,提供了完整的数据视图。

数据集成的发展现状可以从以下几个方面进行分析。

首先,数据集成的技术不断进步。

传统的数据集成方式主要依赖于手动的数据转换和ETL(抽取、转换和加载)工具。

然而,随着技术的进步,现在出现了更加智能和自动化的数据集成工具。

这些工具可以通过自动识别和解析源系统中的数据结构,以及使用机器学习算法来实现智能转换和映射。

这些技术的发展使得数据集成变得更加高效和准确。

其次,云计算的发展推动了数据集成的进一步发展。

云计算提供了可扩展的存储和计算资源,使得企业可以更容易地进行数据集成。

云计算平台可以提供弹性计算,根据需求分配所需的资源,并在需要时自动伸缩。

因此,云计算为数据集成提供了更好的基础设施和更低的成本。

此外,数据集成的应用范围也在不断扩大。

除了传统的企业数据集成,越来越多的数据源如社交媒体、物联网设备和传感器等也需要集成到企业的数据平台中。

这些新的数据源使得数据集成更具挑战性,需要更高级的技术和方法来解决数据结构和格式的不确定性。

随着数据集成的发展,未来还存在一些重要的趋势。

首先,数据集成将更加注重实时性。

随着业务的快速发展和竞争的加剧,企业需要更快地获取和分析数据,以做出即时决策。

因此,实时数据集成将成为一个重要的趋势。

实时数据集成可以通过流式处理和事件驱动的架构来实现,使得数据能够实时地从源系统中抽取、转换和加载到目标系统中。

其次,数据集成将更加注重数据质量。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状引言:元数据是描述数据的数据,它提供了关于数据的信息,包括数据的结构、内容、质量以及数据的来源和使用方式等。

元数据在数据管理和数据分析中起着重要的作用,它能够帮助用户更好地理解和使用数据资源。

为了统一和规范元数据的表示和交换,制定元数据标准是必要的。

本文将介绍元数据的概念、重要性以及当前的元数据标准现状。

一、元数据的概念和重要性1. 元数据的概念元数据是指描述数据的数据,它包括数据的属性、结构、关系、语义以及数据的来源和使用方式等信息。

元数据可以帮助用户更好地理解和使用数据资源,提高数据的可发现性、可访问性和可重用性。

2. 元数据的重要性元数据在数据管理和数据分析中具有重要的作用,主要体现在以下几个方面:(1) 数据资源管理:元数据可以帮助用户更好地管理数据资源,包括数据的存储位置、访问权限、数据质量等信息,提高数据资源的利用效率。

(2) 数据集成和共享:元数据可以描述不同数据源之间的关系和映射规则,实现数据的集成和共享,提高数据的交互性和一致性。

(3) 数据分析和挖掘:元数据可以提供数据的语义信息,帮助用户理解数据的含义和背景,从而更好地进行数据分析和挖掘。

(4) 数据治理和合规性:元数据可以记录数据的来源、使用方式以及数据的安全和隐私要求,帮助组织进行数据治理和合规性管理。

二、元数据标准的概念和作用1. 元数据标准的概念元数据标准是指为了统一和规范元数据的表示和交换而制定的一套规范和约定。

元数据标准定义了元数据的结构、属性、编码规则以及元数据之间的关系,可以提高元数据的互操作性和可重用性。

2. 元数据标准的作用元数据标准在数据管理和数据分析中具有重要的作用,主要体现在以下几个方面:(1) 促进数据共享和交互:通过统一的元数据标准,不同组织和系统之间可以更好地共享和交换数据,提高数据的互操作性。

(2) 提高数据质量和一致性:元数据标准定义了数据的结构和属性,可以帮助用户更好地理解和使用数据,提高数据的质量和一致性。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状一、引言元数据是指描述数据的数据,它提供了关于数据的信息,包括数据的结构、内容、定义和关系等。

元数据对于数据管理和数据分析至关重要,它可以帮助用户理解数据的含义和上下文,并提供数据质量和数据安全的保障。

元数据标准是对元数据进行分类和定义的一套规范,它有助于不同系统和组织之间共享和集成元数据。

二、元数据的重要性1. 提高数据的可理解性:通过元数据,用户可以了解数据的含义、来源和使用方式,从而更好地理解数据。

2. 提高数据的质量:元数据可以记录数据的质量指标和验证规则,帮助用户评估数据的可靠性和准确性。

3. 改善数据的一致性:元数据标准化可以确保不同系统和组织之间的数据一致性,避免数据冗余和不一致的问题。

4. 促进数据的共享和集成:通过元数据标准,不同系统和组织可以共享和集成元数据,实现数据的无缝交互和共享。

三、元数据标准的现状目前,元数据标准在数据管理和数据分析领域得到了广泛的应用。

以下是一些常见的元数据标准:1. Dublin Core元数据标准:Dublin Core是一种用于描述网络资源的元数据标准,它定义了15个核心元素,包括标题、作者、主题、日期等。

Dublin Core标准简单易用,被广泛应用于图书馆和数字资源管理领域。

2. 统一建模语言(UML):UML是一种用于软件工程和系统建模的标准化语言,它可以用于描述系统的结构、行为和交互。

UML可以作为一种元数据标准,用于描述软件系统的元数据,帮助开发人员理解和管理系统的结构和功能。

3. 数据目录交换(DCAT)标准:DCAT是一种用于描述数据集和数据目录的元数据标准,它定义了数据集的属性、数据质量指标和数据访问方式等。

DCAT标准可以促进数据集的发现和共享,提高数据的可访问性和可用性。

4. 数据元数据标准(DAM):DAM是一种用于描述数据元数据的标准,它定义了数据元数据的属性、关系和定义方式。

DAM标准可以帮助用户理解和管理数据元数据,提高数据的可理解性和可管理性。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状一、引言元数据是指描述数据的数据,它提供了对数据的定义、结构、属性和关系的信息,是数据管理和数据分析的基础。

元数据标准是对元数据进行组织、管理和交换的规范和准则。

本文将探讨元数据的概念、作用以及当前元数据标准的现状。

二、元数据的概念和作用1. 元数据的概念元数据是数据的属性描述和数据间关系的描述,它包括数据的定义、结构、格式、语义和使用规则等信息。

元数据可以分为三个层次:结构元数据、描述元数据和管理元数据。

2. 元数据的作用元数据在数据管理和数据分析中起着重要的作用:- 数据管理:元数据可以帮助数据管理员理解和掌握数据的结构、属性和关系,从而更好地进行数据管理和维护。

- 数据分析:元数据可以提供数据的语义信息,帮助数据分析人员理解数据的含义和使用规则,从而更好地进行数据分析和决策。

三、元数据标准的现状1. 国际标准目前,国际上已经有一些通用的元数据标准,如Dublin Core、MARC、ISO 19115等。

这些标准主要用于描述文档、图书馆资源和地理信息等特定领域的元数据。

2. 行业标准不同行业也制定了一些特定的元数据标准,如金融行业的FIBO、医疗行业的HL7等。

这些标准主要用于描述特定行业的数据和业务。

3. 国内标准在国内,目前还没有一个统一的通用元数据标准。

不同机构和行业根据自身需求制定了各自的元数据标准,如教育行业的教育元数据标准、电子政务的电子政务元数据标准等。

四、元数据标准的挑战和发展趋势1. 挑战- 标准缺乏统一性:由于不同机构和行业制定了各自的元数据标准,导致标准缺乏统一性,不利于元数据的交换和共享。

- 标准更新困难:随着数据和业务的不断发展,元数据标准需要不断更新和演进,但更新标准存在一定的困难。

- 标准实施成本高:实施元数据标准需要投入大量的人力、物力和财力,对于一些中小型机构和企业来说,成本较高。

2. 发展趋势- 统一标准:随着数据交换和共享的需求增加,未来的发展趋势是制定统一的通用元数据标准,以便实现元数据的互操作性和共享性。

我国图书情报档案界元数据研究现状综述,徐拥军著

我国图书情报档案界元数据研究现状综述,徐拥军著

元数据英 文为 Metadata, 在 祖国大 陆译为 元 数 据 , 在台湾地区译为 诠释资料 或 超资 料 。关 于 元数据的基本含义 , 学者们大都认可 元数据是关 于 数据的数据 或 描述 数据 的数 据 的观 点。但对 于 其具体含义 , 又有不同阐释。张智雄同志 认为 , 元 数 据说得更具 体一 些 , 是指 描述 任何 Internet 数据 和 资源 , 促 进 Internet 信 息 资 源 的 组 织 和 发 现 的 数 据。[ 1] 李郎达 同志引 用国际 图联对 元数据 的定义 : Metadata 即描述资料 的资料 , 可 用来 协助对 网络 电
19
四川图书馆学报
同志认为 , 在数字图书馆中 , 元数据的主要作用是 分 布式资源发现和检索 奠定基 础 , 元数 据体系 具备 描 [ 23] 述、 整合、 控制和代理四个基本 功能。 孙 媛同志 认 为 : 数字图 书馆的最深层次的本质是信息资源的 共 建和共享 , 而统一 格式 正是 共享的 前提。元 数据 结 构作为一种新的信息 编目规 则 , 值得 图书馆 界借 鉴 和推广。 [ 24] 刘嘉 博士 介绍 了 元数 据在 我国 影响 最 大的 3 家数字图书馆 : 中国试验型数字式 图书馆、 中 国数字图书馆工程、 清华 大学建 筑数 字图书 馆中 的 [ 25] 应用。 7 元数据与知识管理 刘嘉博士认为 : 元数据在知识管理中同样能 够 发挥重要的 作用。因 特网及 万维 网的快 速发 展 , 促 成了对于 网 络空 间中 数 字信 息和 知 识的 传递 和 获 取。有鉴于此 , 知 识管 理成 为当今 的重 要课题。 元 数据能够通过完整描 述揭示 对象 的内涵 , 自 然能 够 在知识管理中发挥作用。元数据贯穿于信息对象 的 整个生命过 程 , 渗 透于 知识 管理的 各个 环节。知 识 从数据到信息的增值 过程中 所采 取的方 式 , 主要 与 信息对象的形式特征 有关 , 最根 本的 依据是 关于 信 息对象的元数据 ; 从信息到知识的增值过 程 , 则不 仅 限于外部的信息加工 与组织 , 而 且需 要对信 息对 象 内容的加工 和分析 , 其 根本 依据仍 然是 元数据。 在 知识管理的 前期 阶段 % % % 信 息增 值 ( 资 料 信息 知识 ) 的阶段中 , 元数 据发 挥着 重要 的作 用 ; 而 在知识 管 理 中的 其 它 阶 段 中 , 元 数 据 同 样 不 可 或 缺。[ 26] 牛金芳同 志从 知识 管 理的 定义 和元 数据 的 作用入手 , 探讨了 元数据 在图 书管 理、 文 件管 理、 网 络资源管理和企业知识管理等四类知识管理中的 重 要作用 , 认为 : 从某种程度上讲 , 元数据和知识管 理 [ 27] 是同义词 , 没有元数据就没有知识管理 。 8 元数据与电子文件管理

空间数据仓库元数据的研究现状综述

空间数据仓库元数据的研究现状综述

空间数据仓库元数据的研究现状综述空间数据仓库元数据的研究主要取决于地理空间元数据的研究,它们之间有区别又有联系,由于空间数据仓库元数据的研究较少,下面我们重点叙述一下地间元数据的研究现状,搞清地理空间元数据的研究现状对我们研究空间数据仓数据至关重要。

地理空间元数据的研究涉及计算机科学、信息科学及元数据主题涉及到的各个学科,对地理空间元数据的研究现状的说明有助于更好地开发和利理空间元数据。

地理空间元数据被列为数字地球的六大关键技术之一,它是数理空间信息共享的核心标准之一。

目前,越来越多的数据生产者和数据用户都认识到元数据的重要价值,国内外已有不少组织或部门对其进行研究。

1.国外对地理空间元数据的研究国际社会对地理信息标准化的研究工作已有十年左右,美国联邦地理数据委员会(FGDC)、开放GIS协会(OGC)、欧洲地理信息标准化委员会(CEN/TC287)以及国际标准化组织(150)地理信息/地球信息业技术委员会(150/TC211)等组织都己经成立了各自的工作组,并从影响地理数据发展的不同方面开始讨论地理信息共享标准的制定工作,元数据标准是他们主要的攻关课题,成为各个组织首要研究的内容(见表1.1)。

对于地理空间元数据标准的研究,目前国际上主要有三个组织做了大量的工作,它们是美国联邦地理数据委员会(FGDC)、欧洲地理信息标准化委员会(CEN/TC287)以及国际标准化组织(150)地理信息/地球信息业技术委员会(150/TCZll)。

(1)数字地理空间元数据内容标准(CSDGM)美国联邦地理数据委员会(FederalGeographicalDataCo咖ittee,FGDC)由农业部、商业部、能源部、内务部、国务院、交通部、环保局、国会图书馆、宇航炳、档案局等多个部门组成,并由内务部负责,其目的主要是负责联邦地理数据的协调发展、使用、共享和宣传,成立于1990年,17位专家组成。

1992年6月举办了地理空间元数据讨论会,与会者认为需要研制地理空间数据的元数据内容标准。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状一、引言元数据是指描述数据的数据,它提供了关于数据的定义、结构、特性和关系的信息。

元数据在数据管理和数据分析中起着至关重要的作用,它能够匡助用户更好地理解和利用数据。

为了确保元数据的一致性和可互操作性,制定元数据标准是必要的。

本文将探讨元数据的概念、作用以及元数据标准的现状。

二、元数据的概念和作用1. 元数据的概念元数据是指描述数据的数据,它包括数据的属性、结构、关系和语义等信息。

元数据可以分为三个层次:技术元数据、业务元数据和管理元数据。

技术元数据描述了数据的物理特性,如数据类型、长度、格式等;业务元数据描述了数据的业务含义和规则,如数据的定义、业务流程等;管理元数据描述了数据的管理信息,如数据的来源、更新时间等。

2. 元数据的作用元数据在数据管理和数据分析中起着重要的作用,具体表现在以下几个方面:- 数据发现和理解:通过元数据,用户可以了解数据的结构、含义和关系,从而更好地理解和利用数据。

- 数据集成和共享:元数据可以提供数据的一致性和互操作性,匡助不同系统间的数据集成和共享。

- 数据质量管理:通过元数据,用户可以了解数据的来源、更新时间等信息,从而评估数据的质量。

- 数据安全和隐私保护:元数据可以提供数据的敏感性和隐私保护策略,匡助保护数据的安全性和隐私性。

三、元数据标准的现状1. 元数据标准的定义元数据标准是指为了保证元数据的一致性和互操作性而制定的规范和规则。

元数据标准包括元数据模型、元数据词汇表、元数据分类和元数据命名规则等。

2. 元数据标准的分类目前,国际上存在多种元数据标准,主要包括以下几类:- 概念模型标准:如ISO/IEC 11179,它定义了元数据的概念模型和元数据的分类结构。

- 数据库元数据标准:如Oracle Metadata Standard,它定义了数据库元数据的结构和命名规则。

- 数据集成元数据标准:如Dublin Core,它定义了描述网络资源的元数据标准。

元数据质量评估研究现状剖析

元数据质量评估研究现状剖析

2 . 国 外 元 数 据 质 量 评 估 相 关研 究
国 外 专 门讨 论 元 数 据 质 量 的研 究 始 于 1 9 9 7年 。1 9 9 7年 , Wi l l i a n E . Mo e n等人在参与 G I L S评估的项 目中首次提出从准确性 、可获 取性 、浓缩性 、综合性 、内容 、一致性 、成本 、数据结构等 2 3个 方面 评估 G I L S系统的元数据质量。此后的研究 中, 研究者们根据评估 目标 、
林爱 群在对机构知识库 中 自动生成 的元数据 进行质量控制 的研 究主要要管 理元数据质量 , 需要先弄清楚如下这些基本问题 : 什么是高质
量的元数 据 , 哪些因素会 导致低质量 的元数据 , 从 哪些特征维度来评估 质量的高低 , 如何根据评估结果进行质量 的控制与管理 。国内研究者们 主要从以下两方面来探讨 元数据 质量管理与评估 问题 。
1 . 1 对 信 息质 量 评 估 的 相 关 问题研 究
参考 了国外 B r u c e 和H i l l m a n的模 型提出了评估 的两个维度 ,但其研究
没有 涉及评估 的 目的、方法 ,只包含两个维度的评估体系也不够完整。
l l
元数据终究是一种结构化的信息 , 对信息质量问题的研究 可为研究 元数据质量管理 、评估提供一定的参考。所以 ,受国外 “ 全面数据质量 管理 ”理论 的影响 ,一些国内学 者的研究 主要 围绕信息质量来展开 ,可 归纳 为以下 三个方 面。
由此可见 , 国内对元数据质量评估 的关注 尚处于起步 阶段 。 鉴于元
数据质量的重要 性 , 有必要将元数据质量评估作 为一个单 独的研 究主题
而不是仅仅包含在对信 息服务 、 信息资源库质量 评估 的研究 中。 围绕元 数据质量评估进行的系统研究应包括元数据质量评估 的方法 、 评估体系 的设计 , 尤其 是评估体 系中各维度 的具体量化方法和量化后评估结果 的

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状概述元数据是描述数据的数据,它提供了关于数据的信息,包括数据的结构、内容、来源、质量等方面的描述。

元数据对于数据管理和数据分析非常重要,它可以帮助用户理解数据的含义和背景,提高数据的可用性和可信度。

元数据标准是为了确保元数据的一致性和互操作性而制定的规范和规则。

1. 元数据的定义和分类元数据可以分为三个主要类别:技术元数据、业务元数据和管理元数据。

- 技术元数据描述了数据的物理特性和技术属性,如数据类型、长度、格式、存储位置等。

- 业务元数据描述了数据的业务含义和用途,如数据的定义、业务规则、数据所有权等。

- 管理元数据描述了数据的管理信息,如数据的来源、更新频率、质量标准等。

2. 元数据的重要性和作用元数据在数据管理和数据分析中起着至关重要的作用。

- 数据管理:元数据可以帮助用户理解数据的结构和内容,提高数据的可用性和可信度。

通过元数据,用户可以快速定位和访问所需的数据,减少数据的冗余和重复。

- 数据分析:元数据可以帮助用户理解数据的背景和含义,从而更好地进行数据分析和决策支持。

通过元数据,用户可以了解数据的来源、质量和可信度,提高数据分析的准确性和可靠性。

3. 元数据标准的定义和目的元数据标准是为了确保元数据的一致性和互操作性而制定的规范和规则。

元数据标准定义了元数据的结构、内容和格式,以及元数据的命名规则和编码约定。

元数据标准的目的是提高元数据的可管理性和可维护性,促进元数据的共享和交换。

4. 元数据标准的现状和挑战目前,各个行业和组织都在制定和实施元数据标准。

一些行业和组织已经建立了自己的元数据标准,如金融行业的FIBO标准、电信行业的TMF标准等。

然而,元数据标准的制定和实施仍然面临一些挑战。

- 多样性:不同行业和组织对元数据的需求和使用方式各不相同,导致元数据标准的多样性和复杂性。

- 一致性:由于缺乏统一的元数据标准,不同系统和应用之间的元数据往往存在不一致的问题。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状引言概述:元数据是指描述数据的数据,它提供了关于数据的信息,匡助我们更好地理解和管理数据。

元数据标准则是对元数据进行统一的定义和规范,以确保元数据的一致性和可互操作性。

本文将介绍元数据的概念和作用,以及当前元数据标准的现状。

一、元数据的概念和作用:1.1 元数据的定义:元数据是指描述数据的数据,它包含了数据的属性、结构、关系和语义等信息。

元数据可以匡助我们更好地理解和解释数据,提高数据的可用性和可信度。

1.2 元数据的作用:元数据可以用于数据的管理、组织和分析。

通过元数据,我们可以了解数据的来源、格式和用途,匡助我们更好地进行数据的整合和共享。

同时,元数据还可以用于数据的质量控制和数据的安全性保护。

二、元数据标准的现状:2.1 元数据标准的定义:元数据标准是对元数据进行统一的定义和规范,以确保元数据的一致性和可互操作性。

元数据标准可以包括元数据的结构、格式、命名规则和分类体系等方面的规定。

2.2 元数据标准的发展:目前,国际上已经浮现了一些元数据标准,如Dublin Core、MARC等。

这些标准主要用于描述文档、图书和多媒体等资源的元数据。

同时,一些行业和组织也制定了自己的元数据标准,如ISO 19115用于地理信息数据的描述。

2.3 元数据标准的应用:元数据标准在数据管理和信息系统中得到了广泛的应用。

它可以用于数据的检索和查询,匡助用户更快地找到所需的数据。

同时,元数据标准还可以用于数据的集成和共享,促进不同系统之间的互操作性。

三、元数据标准的挑战:3.1 多样性和复杂性:由于数据的多样性和复杂性,元数据标准的定义和规范面临着很大的挑战。

不同领域和行业对元数据的需求和定义不尽相同,这导致了元数据标准的多样性和复杂性。

3.2 技术和工具支持:元数据标准的实施需要相应的技术和工具支持。

目前,一些元数据管理系统和工具已经浮现,但仍然存在一些技术和工具的不足,如对多媒体和半结构化数据的支持不够完善。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状一、引言元数据是描述数据的数据,它提供了关于数据的信息,包括数据的定义、结构、属性以及与之相关的规则和约束。

元数据在数据管理和数据分析中起着重要的作用,它可以匡助用户理解和使用数据,并确保数据的准确性和一致性。

元数据标准是对元数据进行描述和组织的规范,它定义了元数据的结构、属性和关系,以及元数据的命名规则和约定。

二、元数据的重要性1. 数据理解和使用:元数据提供了关于数据的定义、结构和属性的信息,匡助用户理解和使用数据,减少数据的误解和错误使用。

2. 数据一致性和准确性:元数据记录了数据的来源、更新时间、数据质量等信息,可以匡助用户评估数据的准确性和一致性,并进行数据质量管理。

3. 数据集成和共享:元数据标准化可以提高数据的集成和共享能力,不同系统和组织之间可以通过共享元数据实现数据的互操作性。

4. 数据安全和隐私:元数据记录了数据的敏感性和访问控制规则,可以匡助用户进行数据安全和隐私管理,保护数据的机密性和完整性。

三、元数据标准的现状目前,元数据标准在不同领域和组织中存在着各种各样的实践和规范。

以下是一些常见的元数据标准:1. Dublin Core:Dublin Core是一种广泛应用的元数据标准,它定义了一组基本的元数据元素,用于描述各种类型的资源,包括文档、图片、音频等。

2. 数据库元数据标准:数据库管理系统(DBMS)通常会提供一些元数据标准,用于描述数据库的结构和属性,包括表、字段、索引等。

3. XML元数据标准:XML(可扩展标记语言)是一种常用的数据交换和描述语言,它提供了一些元数据标准,用于描述XML文档的结构、命名空间、数据类型等。

4. 数据仓库元数据标准:数据仓库是一个集成的、主题导向的、面向决策支持的数据集合,数据仓库通常会定义一些元数据标准,用于描述数据仓库的结构、指标、维度等。

5. 行业特定的元数据标准:不同行业和领域通常会有一些特定的元数据标准,用于描述特定类型的数据和资源,例如医疗领域的HL7标准、金融领域的FIBO标准等。

元数据与元数据标准现状

元数据与元数据标准现状

元数据与元数据标准现状一、引言元数据是指描述数据的数据,它提供了对数据的定义、结构、属性、关系和语义的描述,是数据管理和数据分析的重要基础。

元数据标准则是对元数据进行规范化和标准化的指南,以确保元数据的一致性、可互操作性和可持续性。

本文将探讨元数据的概念、重要性以及当前元数据标准的现状。

二、元数据的概念与重要性1. 元数据的概念元数据可以分为三个层次:结构元数据、描述元数据和管理元数据。

结构元数据描述数据的组织结构和关系,描述元数据描述数据的内容和属性,管理元数据描述数据的管理和使用规则。

2. 元数据的重要性元数据在数据管理和数据分析中发挥着重要作用:(1)数据集成:通过元数据可以了解不同数据源的结构和内容,从而实现数据集成和数据共享。

(2)数据质量控制:通过元数据可以追踪数据的来源和质量,帮助发现和修复数据质量问题。

(3)数据分析:通过元数据可以了解数据的属性和语义,帮助分析人员理解和使用数据。

(4)数据安全:通过元数据可以了解数据的敏感性和访问权限,帮助保护数据的安全性。

三、元数据标准的现状1. 国际标准国际上有多个组织和标准制定机构致力于制定元数据标准,如ISO、W3C和OMG等。

其中,ISO/IEC 11179是目前应用最广泛的元数据标准,它定义了元数据的基本概念、分类和管理规范。

2. 行业标准不同行业和领域有各自的元数据标准,如数据仓库领域的CWM(Common Warehouse Metamodel)和数据集成领域的XML元数据交换规范等。

这些标准主要针对特定领域的元数据需求进行了规范。

3. 国内标准我国也制定了一些元数据标准,如《信息资源元数据标准》和《数据元与数据元组编码规则》等。

这些标准主要用于指导政府和企事业单位的信息资源管理和数据管理。

四、元数据标准的应用与挑战1. 应用场景元数据标准的应用涵盖了多个方面,如数据集成、数据管理、数据分析、数据治理等。

通过遵循元数据标准,可以实现不同系统、不同组织之间的数据互操作和共享。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

元数据转换及集成的研究现状述评*伯琼(武汉大学信息管理学院,湖北武汉430072)摘要:元数据的转换及集成是对网络信息资源进行编目的关键问题,也是目前业界关注的热点之一。

本文通过大量翔实的资料对元数据转换和集成的研究现状进行了述评,从几个方面归纳了研究者的理论和观点,同时指出了研究现状中存在的一些问题。

关键词:元数据;转换;集成;研究现状;述评中图分类号:G25 文献标识码:A文章编号:1672 2698(2007)01 0054 04一、研究背景21世纪是一个网络时代,由于互联网的大量普及,网页内容以每12个月翻一番的速度向前发展,互联网现大约有4800万个知识来源,如果要给这些网页编目的话,估计需要花去全美国编目人员24年时间,按翻一番的速度,第二年就要花48年的时间。

面对IN TERNET提供的如此海量的信息,图书馆传统的信息组织方式已经跟不上网络信息资源的检索、存储、加工的需要。

1995年产生的DC元数据,由于它具有简练、易于理解、可扩展、能与其他元数据形式进行桥接,非专业人员也能操作等特性,使之成为了一个较好的网络信息资源描述工具。

而传统的MARC 著录由于它具有标准的通讯格式、完整详细的信息描述、多种检索点等优点,也同时被用于网络信息资源的描述,加上它与现存书目数据库的兼容性、检索的可靠性和数据结构的混合都居于各种元数据的首位,因此,对网络信息资源的编目将会出现DC和MARC两种格式长期并存的局面。

最后在实际编目应用中还需要把各种元数据格式进行集成,一个良好的兼容了各种元数据格式的编目系统才能为网络信息资源提供全面、方便、优质的编目。

由于元数据以及它们的转换和集成对网络信息资源编目的重要性,国内外的图书情报界对此给予了很大的关注。

从DC1995年诞生以后,2001年2月美国国会图书馆网络发展与MARC标准办公室(Net w o rk Development and M ARC Standards Office Li brary of Congress)给出了M ARC和DC的两个映射表: M ARC to Dublin Core Crossw alk(Unquali fied)和 M ARC to Dublin Cor e Cr ossw alk(Quali fied),这两个映射表分别对M ARC和DC的限定词、非限定进行了映射。

2001年3月,该机构又给出了 Dublin Core to MARC and GILS Crossw alk,并指出: A m apping betw een the elem ents in the Dub lin Core and USM ARC fields is necessary so that conversions betw een various syntax es can occur ac curately.[1](译:DC元素和USMARC字段之间的映射是必须的,以便于在各种语法之间能够进行精确的转换。

)2003年4月22日在法国召开的第三届数字图书馆发展研究讨会和2003年8月在挪威召开的第七届欧洲数字图书馆会议都把元数据及系统互操作作为会议讨论的主题之一。

中国图书馆学会2001年学会对元数据进行了热烈的讨论、2005年年会的第五分会场、2006年第三分会场都把元数据问题作为探讨议题之一。

此外,笔者利用GOOGLE检索关于 m apping betw een DC and M ARC有906000条, DC AND CNMARC有810条, mapping DC AND CNM ARC有70条, CORC AND M ETADATA有38800条, CONNEXION AND M ETADATA有259000条。

以上这些数据都说明了DC和M ARC 元数据是一个被关注的热点。

二、元数据转换及集成的研究现状综述(一)国内研究现状1.国内研究现状 为了全面了解国内图书情报界对DC、CNM ARC和MARC21转换与集成的研究状况,笔者分别对与该主题有关的图书、期刊论文、学位论文、会议论文、研究项目及有关网站进行了检索第20卷第1期2007年3月 青岛职业技术学院学报Journal of Qing dao Technical Co lleg eVol.20No.1Mar.2007*收稿日期:2006 11 16作者简介:伯琼(1971 ),女,重庆人,副研究馆员。

查阅。

(1)期刊论文数据库 对期刊论文的检索,笔者利用了中国学术期刊网和重庆维普进行查询。

对于DC和M ARC的研究,共检索出36篇,最集中的在2003、2004和2005年。

CORC研究2001年是最多的一年,随后几年都只有2~3篇文章,04年又增加到4篇。

对网络资源编目研究最多的是2006年,而元数据集成研究近年来受到了越来越多的关注,从最初的2002年的2篇逐年增加,05年达到5篇。

关于 网络资源编目有17篇,而 网络资源编目AND系统则只有2篇,所以这方面研究还比较缺乏,但相关的 联机编目系统的研究则有19篇。

可以看到国内研究者对传统联机编目系统关注较多,而对网络资源编目系统探讨比较少。

(2)学位论文数据库 学位论文主要利用了万方学位论文库和CNKI博硕论文库。

检索出跟主题相关的论文有12篇。

学位论文对有关主题的研究从2000年开始,大多集中在2003年和2004年,2004年达到5篇,2006年还有一篇有关研究的学位论文。

大多数相关的学位论文都是硕士论文,有一篇为博士论文。

这些数据说明这一主题是在校硕博士生比较关注的问题。

(3)网站 除了利用以上数据库对图书、期刊和学位论文进行检索,为了更好更全面地了解到有关图书情报界对本主题的关注程度以及有关成果和相关元素变动情况,笔者查找了一些专业网站,如:中国数字图书馆标准规范建设网站,里面很多地方都涉及到了DC和M ARC的映射、转换及集成研究。

2.国内研究现状分析 通过阅读所检出的文献内容,可以看到随着网络信息资源的飞速发展,以及随之带来的联机网络资源编目的需要,国内学者对DC和M ARC的转换以及集成做了大量的研究,研究内容主要集中在以下几个方面:(1)元数据在网络信息资源编目中的理论研究 黄如花教授提出:面对网络资源的快速增长,网络资源指南和搜索引擎的检索效果越来越不理想,其原因归根结底是没有建立完整有效的信息索引机制,而这种标准化的信息索引机制的建立必须以一个通用的、合理的、规范的网络信息资源著录规则为基础。

[2]吴建中博士指出:DC即都柏林核心元素集,其目的在于建立一套描述网络电子文献的方法,以实现网上信息的辩识、查询和检索。

它的优点是:简练、易于理解、可扩展、能与其他元数据形式进行桥接。

另一方面,随着描述电子资源的856字段的引入,M ARC因为它的数据结构严密,检索点的选取能保证其数据元素组成具有统一性,有利于数据交换,所以它也是一种描述能力很强的元数据格式[3]。

孙更新教授论述到:鉴于网络信息资源增长迅速、稳定性差等特点,DC用做描述网络信息资源的元数据标准,具有更多的优越性,但它在某些方面如描述信息的完备性、准确性、规范化都不如MARC格式,因而在一定时期内,DC还不可能取代M ARC格式,两种格式将是共存互补的局面。

[4](2)DC和MARC的映射 张晓林教授给出了元数据转换的定义: 元数据转换,又称元数据映射,指两个元数据格式间元素的直接转换。

[5]他进一步指出,元数据转换效率受到结构匹配程度、应用匹配程度、语义匹配程度和编码规则匹配程度的影响。

建立具体的映射表是元数据转换的关键,也是图书情报界研究的一个热点问题。

刘嘉博士采纳的是1997年MARC Standars Office颁布的DC和US M ARC对照表[6],吴建中博士提供了一个详细到子字段的DC和U SM ARC之间的对照表[4],此表非常详细,并对DC修饰词和词表有中文注释,其结构匹配程度、语义匹配程度和编码规则匹配程度都很不错。

对于DC和M ARC21的映射,Netw o rk Devel opment and M ARC Standars Office(美国国会图书馆网络发展与MA RC标准办公室)在2001年2月发布了一个具体的DC到M ARC21的详细映射表,国内大部分学者对DC和M ARC21映射表的研究都基于此表,如:黄如花教授的不含限定词的DC与M ARC21对照简表[2]、孙更新副教授的DC与M ARC21对照表[4]都对DC和M ARC21的映射做了全面研究,其中黄教授还对两种格式进行了应用匹配,即标明了可重复与不可重复。

对于DC和CN MARC的映射,因为目前还没有正式机构颁布一个标准映射表,所以对此研究的比较多。

最早的是1998年吴政睿副教授所做的DC到台湾机读目录格式的映射[7],刘嘉博士在此基础上简单归纳了一个DC到CNM ARC的映射表[8]。

程变爱在他的2001年硕士论文里首次试作了CNM ARC到DC的较为详细的映射[9],同年许四洋也在硕士论文里做了一个比较详细的DC到CNMARC的映射[10],该映射表比刘嘉博士的映射表更详细,但两者内容出入比较大。

在许四洋映射表的基础上,徐健在他的2003年硕士论文中做了进一步细化[11],但它没有指出字段或元素是否可以重复或者必备。

青岛职业技术学院学报2007年第1期(3)DC和M ARC的转换技术 建立了DC和MARC之间的映射之后,又如何实现它们的转换呢?张晓林馆长阐述到: 根据元数据定义和目标元数据定义之间的匹配情况,建立元数据元素间的映射定义,利用这个映射定义和标准转换模板定义语言(XST L)建立元数据转换模板和相应的解析规则,利用它们定制相应的转换程序语句,从而实现源元数据与目标元数据记录间的转换。

[5]杜燮祎在他的2003年硕士论文里尝试了DC和CNM ARC的相互转换,他先根据两者著录格式的语义,给出他们之间的映射,然后用RDF Scheme分别对它们进行定义,根据RDF Schem e将其统一于RDF描述,再据此设计XSLT转换模板,从而实现两者的相互转换。

[12]孙华、郑巧英也提出了一个DC和MARC转化系统的框图。

(4)DC和M ARC的集成系统 对于DC和MARC的集成,大多数研究者都是从国外的CORC 系统入手,因为CORC是目前为止世界上集成了多种格式、多种数据库的最好的系统。

吴建中博士对CORC系统做了全面的介绍,并举例详细说明了用CORC系统进行编目的方法。

他详细说明了CORC系统中用DC和M ARC两种格式进行记录创建的步骤和程序。

国内其他研究者也就CORC对我国网络信息资源编目的启示做了大量的研究。

相关文档
最新文档