主题数据库建设规范

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

项目编号INFO-115-C01

文档编号TR-REC-001 中国科学院数据应用环境建设与服务

主题数据库建设规范

(征求意见稿)

中国科学院数据应用环境建设与服务 项目组

2009年6月

目 录

1 范围 (1)

2 规范性引用文件 (1)

3 术语与定义 (2)

3.1 主题数据库 (2)

3.2 概念体系 (2)

3.3 概念树 (2)

3.4 逻辑数据库 (2)

3.5 索引库 (2)

3.6 元数据 (3)

4 主题数据库基本要求 (3)

5 总体架构 (4)

6 内容组织 (5)

6.1 数据库类型约定 (6)

6.2 概念体系 (6)

6.2.1 概念体系的要求 (8)

6.2.2 概念体系的构造方法 (8)

6.2.3 概念体系和概念树的表达 (8)

6.3 逻辑数据库 (10)

6.3.1 逻辑数据库的要求 (12)

6.3.2 逻辑数据库的构建 (12)

6.4 物理数据组织 (14)

6.4.1 专业库内容整理 (15)

6.4.2 建立映射转换规则 (15)

6.5 元数据 (16)

6.5.1 非关系型数据库的元数据 (17)

6.5.2 专业库的元数据 (17)

6.5.3 逻辑数据库的元数据 (18)

6.5.4 主题数据库的元数据 (18)

7 技术架构和接口规范 (18)

7.1.1 功能要求 (20)

7.1.2 应用系统与工具要求 (20)

7.1.3 接口规范 (20)

7.2 主题数据库 (21)

7.2.1 功能要求 (21)

7.2.2 应用系统与工具 (21)

7.2.3 接口规范 (22)

7.3 数据中心 (23)

7.3.1 功能要求 (23)

7.3.2 应用系统与工具 (24)

7.3.3 接口规范 (24)

8 服务 (24)

8.1 服务对象 (25)

8.2 服务方式与要求 (25)

8.2.1 在线发布方式 (26)

8.2.2 离线发布方式 (26)

8.3 数据交换格式 (26)

8.4 共享分级分类设置 (26)

8.5 其他服务要求 (27)

8.6 服务案例 (27)

9 运行维护 (28)

9.1 运维人员 (28)

9.2 基础运行环境 (28)

9.2.1 机房 (28)

9.2.2 互联网接入环境 (29)

9.2.3 网络服务器与存储设备 (29)

9.3 运行 (29)

9.3.1 运行模式 (29)

9.3.2 日志管理 (29)

9.4.1 基础设施安全 (31)

9.4.2 软件安全 (31)

9.4.3 数据安全 (32)

9.4.4 非技术防护措施 (32)

9.4.5 故障处理 (32)

9.5 备份和恢复 (33)

9.6 主题数据库的质量 (33)

附录A(规范性附录)标准实施一致性测试 (35)

A.1 内容组织 (35)

A.1.1 数据集名称及标识符 (35)

A.1.2 概念体系 (35)

A.1.3 逻辑数据库 (36)

A.1.4 物理数据组织 (36)

A.1.5 关系型数据集 (36)

A.1.6 文件型数据集 (37)

A.2 技术架构与接口规范 (37)

A.3 服务 (37)

A.4 共享 (38)

A.5 运行维护 (38)

A.6 主题数据库质量 (38)

主题数据库建设规范

1范围

本规范定义了主题数据库的总体架构,规定了主题数据库在内容组织、技术实现方面需要完成的工作和需要满足的要求,并提出了对主题数据库在运行维护和服务方面的要求。

本规范适用于中国科学院数据应用环境建设与服务项目中主题数据库的建设、运维和服务。

2规范性引用文件

下列文件对于本文件的引用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

TR-REC-013 元数据参考模型

TR-REC-014 数据集核心元数据规范

TR-REC-017 资源唯一标识符规范

TR-REC-018 科学数据分类规范与分类词表

TR-REC-019数据加工增值管理方法

TR-REC-031 建库技术指导规范

TR-REC-032 元数据访问服务接口规范

TR-REC-033 数据跨域互操作技术规范

TR-REC-034 跨域用户认证接口规范

TR-REC-035 数据库服务网站建设指导规范

TR-REC-051 数据服务指导性规范

TR-REC-062 技术文档参考规范

TR-REC-063 数据质量管理规范

TR-REC-064 数据质量评测方法与指标体系

TR-REC-065 共享服务评价指标体系

TR-REC-067 数据共享办法

3术语与定义

3.1主题数据库

面向特定学科或应用领域,由若干逻辑相关的数据资源按照统一的标准规范整合形成,具有系统性和完整性,并通过统一的系统提供一站式服务的数据库。

3.2概念体系

依据一定的知识结构组织起来的一个概念集合,其中的每个概念反映一定范围内的某些数据资源所具有的共同属性(或特征)。

3.3概念树

在概念体系的基础上建立起来的一个树状的(即依照层次、等级逐步展开的)、用于数据资源目录浏览式查询的知识编码结构。概念体系范围内的每一种内容或特征的数据资源,都可以在这一概念树中具有相应的位置;用户可以通过这一概念树,查检所需要的数据资源。

3.4逻辑数据库

将分布在一个或多个专业库中的、具有相同内容特征的数据整合形成的数据库,它可以是物理的,也可以是逻辑的。

若被整合的数据分布在不同的专业库中,它们通常是异构的,或者描述了同类实体在不同方面的属性。逻辑数据库的数据模型是在对这些数据进行分析的基础上为这些数据所描述的事物规定一个统一的数据模型,不同专业库中的相关数据可以通过一定的转换达到与该数据模型相符。

3.5索引库

按照逻辑数据库对检索服务及其结果概要显示的需求和设计,通过抽取和转换专业库中有关数据形成的数据库。索引库中除包含用于被整合数据的统一检索和概要显示的字段外,还必须包含指针字段,用于存储被整合数据的访问地址。

相关文档
最新文档