全国地质资料数据中心建设方案初探

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

以目前的网络和软件技术, 目录数据的组织方式 神经枢纽, 其长远的发展目标是作为与地质资料
主要有以下几种方案可供选择: 1.馆藏机构各自维护数据并分别上网服务, 互
文章编号: 1009- 4210( 2007) 06- 127- 05
技术方法研究 第 24 卷
全国地质资料数据中心建设方案初探
卜小平 1, 张翠光 2, 赵亚利 1
( 1.国土资源部 油气资源战略研究中心, 北京 100812; 2. 中国地质调查局 发展研究中心, 北京 100095)
摘 要: 通过介绍数据中心总体架构的三个层次
2.采 用 分 布 式 数 据 库 将 全 国 地 质 资 料 馆 、省 级
服 务 网 站 , 通 过 一 个 窗 口 与 其 他 核 心 层 级 数 据 网 馆 藏 机 构 、中 国 地 质 调 查 局 大 区 地 调 中 心 、专 业 地
站连接起来服务更为可行, 多家单位参与, 共同建 质调查中心及国务院委托地质资料保管单位等资
度, 充分利用因特网整合现有资源, 建立广泛的信息 搜集、保管、服务体系, 所以本文主要研究数据中心 的网络虚拟体部分。网络虚拟体侧重资源整合和提 供服务, 它由国家级和省级两个层次组成, 分目录网 络中心和数据中心两个阶段, 提供网络化资料服务 与网络化资料管理两方面功能。目录网络中心是初 级阶段, 是数据中心的准备和基础之一[3]。
会化共享服务体系, 基本实现了地质资料数据采 集- 管理- 服务全流程的信息化、地质资料管理的 数 字 化 、资 料 数 据 服 务 的 网 络 化 。据 笔 者 网 络 调 研 , 虽然各界对数据中心建设寄予厚望, 但囿于网络现 状和保密管理等的制约, 目前国外的地质资料上网 公开提供利用的主要是目录层次的数据, 地质资料 数据中心在各国的进展大都不尽如人意。
元 数 据 标 准 、数 据 中 心 数 据 库 开 发 设 计 规 范 、数 据 相对比较简单。这里所指的一个统一的数据库是相
中心数据接口及数据交换标准、地质资料数据分 对于一个处于某个层次的具体的目录网络中心而
级 分 类 及 发 布 策 略 、运 行 管 理 制 度 、数 据 共 享 的 激 言 的 , 就 国 家 级 目 录 网 络 中 心 而 言 , 它 将 主 要 集 中
据不完全统计, 截至 2006 年底, 全国地质资料 馆 馆 藏 资 料 总 量 达 102819 万 种 , 已 经 累 计 完 成 18000 种地质资料 的 数 字 化 , 占 馆 藏 总 量 的 18%左 右 ; 省 级 地 质 资 料 馆 藏 总 量 达 217980 种 , 已 数 字 化 56028 份,占 馆 藏 总 量 的 26%。 中 国 地 质 调 查局 积累建立了 12 类 54 个数据库, 正在开展的各类专 项地质调查还将产生大量的资料数据。另外, 根据 《地 质 资 料 管 理 条 例 实 施 办 法 》, 2003 年 3 月 1 日 起, 所有汇交的成果地质资料都要求同时提交电子 文档, 几年来也积累了大量的电子资料[2]。
向 社 会 提 供 从 目 录 到 内 容 的 “一 站 式 ”服 务 。
关键词: 地质资料; 数据中心; 方案
中图分类号: P621
文献标识码: A
一、建立地质资料数据中心的背景
2006 年 1 月 发 布 的 《国 务 院 关 于 加 强 地 质 工 作 的 决 定 》( 以 下 简 称 《决 定 》) 正 式 提 出 了 “地 质 资 料数据中心”概念。《决定》明确要求: “建立健全地 质资料信息共享和社会服务体系, 加快利用现代 信 息 共 享 技 术 , 建 设 国 家 地 质 资 料 数 据 中 心 ”和 “全 面 公 开 地 质 资 料 目 录 , 向 社 会 提 供 有 效 快 捷 的 地 质 资 料 信 息 服 务 ”[1]。
( 2) 仍 然 需 要 按 《条 例 》汇 交 、转 交 地 质 资 料 , 国 家 级 、省 级 馆 藏 机 构 是 数 据 中 心 的 骨 干 , 其 存 在
级, 对将数据中心由目录服务向内容服务转变非常 关键, 目前随着馆藏涉密地质资料清理工作的推
仍 然 非 常 必 要 , 这 对 资 料 备 份 安 全 管 理 、防 止 资 料 进 , 出 台 文 件 级 地 质 资 料 著 录 标 准 , 开 发 和 推 广 统
( 1) 这不是极端的全民参与地质资料服务, 不 位所有能集中起来的地质资料目录数据资源。
是每个地质队建一个小中心, 那样会使数据生产、
笔者认为, 方案三能比较成功地克服前两个方
管理及服务产生混乱, 同时会造成大量的重复建 案的缺点, 也是目前情况下比较现实可行的选择。
设和资金浪费。
将网络目录中心的目录数据由案卷级升级到文件
服务。这种方式数据集中程度最高, 以一个统一的
范围内各节点的资料数据。
窗口向社会提供网络目录数据检索服务, 方便社会
各层次的数据中心和数据节点执行统一的制 各界查询使用; 公众在一个窗口选择查询条件后一
度和标准规范体系是数据中心建立和运行的重要 次性在一个数据库获得所需资料的相关信息; 检索
基础和保障, 主要包括数据格式、地质资料数据集 、 速 度 快 , 结 果 完 整 准 确 明 了 ; 软 硬 件 及 网 络 维 护 也
收稿日期: 2007- 04- 29; 改回日期: 2007- 07- 09 作者简介: 卜 小 平 ( 1974- ) , 男 , 助 理 研 究 员 , 从事地 质 资 料 信 息 化 、地 矿 经 济 等 研 究 。
·12wk.baidu.com·
200476·65 国土资源科技管理
经过多年的努力, 我国已经建立了海量地质 资料数据的生产制度并积累了大量的数据; 各省 ( 区 、市 ) 已 经 按 统 一 标 准 、统 一 软 件 的 要 求 建 立 了 标 准 的 目 录 数 据 库 ; 以 数 字 化 、网 络 化 和 软 件 技 术 为代表的信息技术的快速发展和应用已经对社会 各 方 面 产 生 了 广 泛 深 入 的 影 响 ; 《决 定 》、信 息 化 相 关 标 准 及 以 《关 于 建 立 健 全 地 质 资 料 网 络 服 务 体 系的通知》为代表的有关规范性文件的出台也为 数据中心的建设奠定了制度基础。
数据中心网络虚拟体部分的框架如图 1 所示。
图 1 数据中心网络虚拟体框架
从数据管理和服务来说, 海量数据的存储投 资及维护难度巨大, 格式及所需支撑软件各不相
同, 目前分散存储的现实也难以彻底改变, 集中全 国的数据到一个中心, 统一向社会服务, 几乎不可
·128·
技术方法研究 第 24 卷
想象。因此无论从现实还是长远看, 建设“一站式”
封 锁 、方 便 用 户 使 用 具 有 重 要 意 义 。
一的文件级目录数据采集软件是当务之急。
( 二) 目录数据组织方式探讨
目录网络中心是地质资料数据中心的初级阶
要实现全国的地质资料数据上网服务, 目录 段, 可以独立向社会提供目录查询服务, 作为地质
数据的组织方式是要首先解决的核心技术问题。 资料保存及服务地点的指引, 但作为数据中心的
励 制 约 机 制 、收 费 标 准 和 收 费 方 式 等 。
部属馆藏机构和各省级地质资料馆馆藏资料的所
通 过 “一 站 式 ”网 站 连 接 建 立 的 分 布 数 据 网 站 有 非 涉 密 资 料 目 录 数 据 , 就 省 级 目 录 网 络 中 心 而
同时要注意两个问题:
言 , 它 将 集 中 省 ( 区 、市 ) 所 辖 各 类 地 质 资 料 保 管 单
国家级数据中心的核心层由全国地质资料 馆、国土资源部实物地质资料中心和中国质调查 局各大区中心资料保管部门、专业地质调查中心 组成, 扩展层由国土资源部所属公益性地勘单位 资料保管部门组成, 松散层由地质资料委托保管 单位的馆藏机构组成。各省级地质资料数据中心 的核心层由省级地质资料馆藏机构组成, 扩展层 由省级公益性地勘单位资料保管部门组成, 松散 层由各省( 区、市) 辖区内商业性地勘单位组成。各 数据中心内部的核心层、扩展层和松散层通过网 络连成一体, 国家级数据中心和各省级数据中心 通过互联网组成全国地质资料数据中心, 最终实 现资料管理和资料数据服务的网络化, 重点是前 述 核 心 : 全 国 地 质 资 料 馆 、中 国 地 质 调 查 局 大 区 地 调 中 心 、专 业 地 质 调 查 中 心 、各 省 区 地 质 资 料 馆 、 国务院委托地质资料保管单位。
从 1993 年 图 文 地 质 资 料 数 据 库 建 设 开 始 , 我 国地质资料的信息化至今已有 14 年的历史。以《地 质资料档案著录细则》等标准的出台为依托, 以 《成 果 地 质 资 料 目 录 数 据 库 系 统 》等 软 件 平 台 为 支 撑, 图文数字化在全国全面推进, 电子文件与纸质 资料汇交已成制度, 成果地质资料目录数据库已 基本建立起来, 全国地质资料馆和绝大多数省级 地质资料馆资料目录已通过互联网公开向社会提 供 查 询 。全 国 地 质 资 料 馆 以 及 北 京 、上 海 、天 津 、广 东等省馆相继建立了电子阅览室, 全国地质资料 馆还在地调专网以地质资料查询服务系统为平台 进行了图文数据的异地网络服务实验。
设, 共同维护, 满足社会对地质资料的需求。
料 保 管 单 位 的 目 录 数 据 组 织 起 来 对 社 会 服 务 。各 保
一个个存放数据资源的保管单位就是一个个 的数据节点( 图 1 中以网站 / 栏目表示节点是为了 突出以服务为核心的地质资料管理理念) , 不同层
管单位的目录数据库是节点数据库, 由数据库软件 以 影 射 的 方 式 连 接 成 一 个 虚 拟 的 整 体 。各 节 点 的 匹 配和协调是整个系统正常运行的基础, 其管理难度
次的数据节点以分布式技术组织成不同层次数据 较大; 数据的分布将不可避免地造成检索响应时间
中心。各节点可以直接通过网络发布信息, 节点和 下一级数据中心向数据中心汇总目录数据, 各数 据中心通过软件平台以比较集中的方式发布各自
长, 也容易造成检索结果的不完整、不准确。 3. 集 中 所 有 目 录 数 据 为 一 个 统 一 的 数 据 库 对 外
二、地质资料数据中心建设方案
( 一) 框架 目前, 地质资料界对全国地质资料数据中心的 概念还在探讨中, 比较有代表性的定义是: 以公益性馆 藏机构及其馆藏资料为主体, 集地质研究、调查成果、 地质勘查、国外地质资料矿产信息、政府相关管理信息 等于一体, 馆藏实体与网络虚拟体相结合, 以地质资料 及数字化信息为主要形式的地质资料信息搜集、保管、 开发、研究、服务基地。通过数据中心建设, 可以加强研 究开发力量, 集成资料信息, 提高综合管理和服务能 力, 使之成为政府公共服务的重要窗口和基地。 鉴于目前机构调整及体制更改困难重重的现 实, 笔者认为全国数据中心的概念以基本不改变现 有地质资料实体的管理体制为宜, 主要通过建立制
及两个阶段, 描述了国家数据中心和省级地质
资料数据中心的主要构成, 探讨了目录数据的
三种组织方式的优缺点, 并重点对数据中心的
八大特点做了深入阐述, 最后对地质资料数据
中心发展前景及存在问题进行了分析。研究表
明: 地质资料数据中心是保管实体与网络虚拟
体的统一, 目录数据中心是其神经枢纽, 通过它
将各地各系统的地质资料数据资源掌控起来,
随着信息技术和网络技术的广泛应用, 地质资 料 界 提 出 了 多 个 与 “地 质 资 料 数 据 中 心 ”内 涵 相 类 似 的 概 念 , 国 外 的 “地 质 资 料 一 站 式 服 务 ”就 是 其 中 之 一 。国 内 外 对 地 质 资 料 数 据 中 心 的 概 念 大 致 有 这么几点共同理解: ①数据中心的数据是指电子数 据; ②采用计算机技术和互联网技术; ③统一门户对 外提供服务。目前, 美、加、澳、英、荷、日等国家的地 质调查机构已基本建立了各自的地质资料信息社
相关文档
最新文档