地学元数据结构分析及其管理系统设计
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
U&%QR(66A : 2 2 BBB$9)=7+6+$’8 2 6+DH); 2 R V I*H8;: O?7P: 0);’?@A6@=8 ?7P: +D=>6QR(66A: 2 2 BBB$9)=7+6+$’8 2 6+DH);2 6+DH)W#X#RV 7+6+;)6U+*)V中国西部地区森林资源数据集O 2 U&: 7+6+;)6U+*)V OU&: OU& : 6@6H)V 森林资源数据集 O 2 U& : 6@6H)V OU& : 7;7+6)V!""!J%"J%!O 2 U& : 7;7+6)V
地学元数据的构架首先要从元数据的作用上分解为两个 第一层是目录信息, 主要用于对数据集信息进行宏观描 层次 。
’/(
因, 除了长期形成的体制、 政策和观念等问题以外, 地学数据的 多学 科 、 多标准、 多类型、 多尺度、 海量等特点也在技术层面上 阻碍了它的社会共享。 针对这一技术问题, 很多学者和科研人员做了大量的卓有
,wk.baidu.com%
/01 2 345 技术框架
的目标是建立一 /01(/);=>?’) 0);’?@A6@=8 1?+*)B=?C )
%
引言
近年来围绕着地球系统科学的一系列科学计划、 研究项目
行分析研究。
以及国际合作的开展, 科学数据管理与共享成为制约科学开展 中国科技界一直在呼吁和推动全社 的瓶颈。 自上世纪 &" 年代,
!( *( 会的数据共享 ’%, , 但地学数据共享的现状依然堪忧 ’), 。究其原
! 地学元数据的构架模式与方法 !$% 地学元数据的构架模式
,
地学元数据管理系统的设计
根 据 地 学 元 数 据 扩 展 的 模 式 和 方 法 , 利 用 -,. 推 荐 的
,$,
地学元数据管理系统 (44& ) 的设计
地 学 数 据 -)D 共 享 平 台 基 于 44& , 以元数据的透明访问
(资 源 描 述 框 架 ) 技术设计了地学元数据管理系统 /01 2 345 (4)6+7+6+ 4+8+9)*)86 &:;6)*, 。 44& 是 地 学 数 据 共 享 44& ) 平台的基础设施, 任何关于数据的查询、 交换、 上传、 下载、 订购 等共享业务都是以此为基础展开的。
解和认同的模式就是利用元数据的标准化来统一管理分布式 的数据资源, 并通过网络实现数据共享与服务。该模式随着互 联网技术的日益发展和进步得到了广泛的普及和应用。 基于这 种技术背景, 国内外许多行业数据中心为了尽快建立自身的共 享系统, 纷纷制定自己的元数据标准, 服务于本部门和行业的 数据交换与共享。 但与此同时, 跨越多个学科的地学领域, 却不 得不面临多种元数据标准共存的难题。 如何使当前使用的多种 有关地学数据的元数据标准统一在一个公共的框架下, 通过一 个兼容多标准的地学数据共享平台对外提供服务已成为地学 数据共享领域的核心问题。基于此, 文章对面向 ,-. 共享的地 学数据共享服务平台元数据基础设施的构架及其相关技术进
实现分布式的数据共享。该技术框架可以分解为三层, 即应用 服务层、 资源描述层以及数据资源层, 如图 # 所示。 其中应用服务层是由一系列的数据共享业务组成,如查 询、 浏览、 发布、 下载等, 这些服务通过资源描述层作为媒介访 问数据资源, 并且通过 -)D 为用户提供具体的服务。数据资源 层通过数据库给出了所有元数据的实际物理存储。 这一层需要
图N
/01 2 345 的三元组示例
O?7P : /01 ?7PQR(66A : 2 2 BBB$B,$=?9 2 %SSS 2 "! 2 !!J?7PJ;:86+IJ8;TR I*H8;: I*H8;: U&QR(66A : 2 2 BBB$9)=7+6+$’8 2 P@)H7; 2 R
图! 地学元数据扩展方法
森林普查, 西部资源 O 2 U& : OU& : C):B=?7V 森林资源, C):B=?7V
所谓模式 (&’()*+) , 在这里定义为一组元数据字段的集合, 不同领域数据集元数据结构的变化可以通过在相应的模式之 上施加操作而完成。在多种标准共存的情况下, 当试图扩展和 修改某一个模式时 (如地理学模式的元数据结构) , 仅仅去更改 这个模式就可以了, 而不会影响到其它的元数据模式。模式也 可以理解为地学领域某个学科主题下的核心元数据, 专用元数 据标准基于它所属的模式标准进行扩展。 一个专用标准只能从 属于一种模式, 而同一种模式可以为多个专用标准所公用。
图,
/01 2 345 的三元组结构
扩展思路和方法。 考虑到现有地学学科的多样性及元数据标准 的广泛性,地学元数据的组织框架可以设计为三个大的层面, 如图 ! 所示。第一层: 地学核心元数据; 第二层: 模式核心元数 据 (如 地 理 学 核 心 元 数 据 ) , 这是在第一层次基础上的扩展; 第 三层: 应用领域的专用元数据标准 (如遥感影像数据的元数据) , 这是在第一、 二层次基础上的扩展。 在这些弧线 (语句) 中, 三元组以更容易理解的 “主 J 谓 J 宾” 形式组织, 每个资源及每个文字都 (K?)7@’+6) , &>DL)’6, MDL)’6) 是一个顶点, 一个三元组 (!, 是一个由 " 指到 # 的弧, 以 ", #) “中国西部地区森林资源数据集” 的生产 ! 标示起来。如要表达 单位信息,相应的三元组模型如图 N 所示, /01 2 345 描 述 信 息见下。
?@A B CDE
文献标识码 G 中图分类号 HI)J
文章编号 %""!1&))%1 (!""# ) "#1"""#1")
!"#$%&’& (" )*+#,#+# -+./0+/.* 1(. 2*(,#+# #", ’+& )*+#,#+# )#"#3*4*"+ -%&+*4 5*6*$(74*"+
地学元数据结构分析及其管理系统设计
王卷乐 游松财 孙九林 (中国科学院地理科学与资源研究所, 北京 %""%"%)
012345: 637895:48;7<<$3=$=7
摘 要 在分析了地学数据的 ,-. 共享需求及其多学科特点基 础 上 , 设计了地学数据的可扩展元数据结构, 它包括地
学核心元数据、 模式核心元数据、 模式 (专用) 扩展元数据等三层体系, 并利用 ,)> 推荐的 ?@A B CDE 数据模型和方法开 发了地学数据共享平台的元数据管理系统 (DDF ) 。该 系 统 的 应 用 验 证 了 地 学 数 据 共 享 元 数 据 构 架 体 系 的 可 靠 性 和 适 用 性。 关键词 元数据 地学数据 网络共享
OU& : H+89>+9)V 中文 O 2 U& : H+89>+9)V OU&: A>DH@;()?V中国科学院地理科学与资源研究所O 2 U&: A>DH@;()?V A>?A=;)V 森林资源数据研究和信息共享 O 2 U& : A>?A=;)V OU& :
……
O 2 ?7P : 0);’?@A6@=8V /01V O 2 ?7P :
8#"3 9/#"$* :(/ -("30#’ -/" 9’/$’"
(K7;L4LML- NO P-N8<3QR4=35 F=4-7=-; 37S T3LM<35 ?-;NM<=-; ?-;-3<=R , >GF, U-49478 %""%"%)
!;&+.#0+: U3;-S N7 LR- 3735V;4; NO <-WM4<-2-7L 37S L-=R74=35 .NLL5-7-=X NO 8-NS3L3 ;R3<478, 37 M74ON<2 2-L3S3L3 3<=R4L-=LM<- 4; S-;487-S 37S .M45L MQ LN -7;M<- S4OO-<-7L S4;=4Q547- 2-L3S3L3 ;L37S3<S; 6N<X478 R3<2N74=355V 47 D-L3S3L3 (DDF ) D3738-2-7L FV;L-2 $HR4; LNQ1SN67 R4-<3<=RV 2NS-5 4; =N2QN;-S NO =N<- 2-L3S3L3 , ;=R-23 2-L3S3L3 , ;Q-=4O4=3L4N7 2-L3S3L3$G DDF, LR- Q<-;-7L3L4N7 NO LR- 8-N1S3L3 ;R3<478 2NS-5, 4; S-Y-5NQ-S M;478 ?@A B CDE L-=R7N5N8V <-=N22-7S-S .V ,)>$DDFZ; R4-<3<=RV 47=5MS-; ) L4-<;, 4$-$ , 3QQ54=3L4N7 L4-<, ?@A B CDE <-;NM<=- 23738-2-7L L4-<, 37S S3L3 <-;NM<=-; L4-<$?@A B CDE, ;-<Y-S 3; 3 24SS5- L4-<, Q53V; 37 42QN<L37L <N5- 47 DDF$@-Y-5NQ2-7L NO DDF ON< >R473 8-NS3L3 ;R3<478
,$!
地学元数据的 /01 2 345 表达机制
“资 源 J 属 性 J 值 ” 三元组来描述资源, 该 /01 采 用 简 单 的
三元组可以图解为一个有向图,并认为 /01 模型是一组连接 各节点的弧线, 见图 , 所示。
图% 地学元数据的扩展模式
!$!
地学元数据的构架方法
地学元数据的构架参考以上模型, 在此基础上建立自己的
个供多种元数据标准共存的框架。在这个框架中, 能够充分利 用各种元数据的优势, “ 并能够进行基于 -)D 的数据交换和再
EFG 。 这样使得元数据可以为网络上的各种应用提供一个基 利用”
础结构, 使应用程序之间能够在网络上交换元数据, 以促进网 络资源的自动化处理。简而言之, /01 是 一 个 使 用 345 语 法 来表达的简单元数据方案, 用来描述网络资源的特性, 以及资 源与资源之间的关系。 /01 框架由三个部分组成: /01 数据模 、 (&’()*+ ) 和 /01 语法 (&:86+I ) 。 型 (0+6+ 4=7)H) /01 模式
(RLLQ : Q<N9-=L B B 666$8-NS3L3$=7 ) Q<NY-; LR3L LR4; L-=R74WM- ;N5ML4N7 4; ;M4L3.5- ON< 6-.1N<4-7L-S 8-N;=4-7=-; S3L3 ;R3<478$
<*%=(.,&: 2-L3S3L3 , 8-N;=4-7=- S3L3 , ,-. ;R3<478 , ?@A B CDE
基金项目: 国家科技部科学数据共享工程—试点项目资助 (编号: !"")@0G!>"%" ) 作者简介: 王卷乐 (%J/+1 ) , 男, 中科院地理所博士, 主要研究方向为地理信息系统开发与科学数据网络共享技术。
计算机工程与应用
!""#$#
#
地学元数据通过核心元数据标准、 全集元数据标准和专用 标准之间的关系, 建立的元数据扩展模型, 如图 % 所示。
+( 。在诸多研究成果中, 一种被普遍理 成效的研究和开发工作 ’#,
述, 它适合在国家级空间信息交换中心或区域以及全球范围内 管理和查询元数据信息时使用。第二层是详细信息, 用来详细 或全面描述元数据标准内容, 是数据集生产者在提供数据集时 必须要提供的信息。 第一层次的元数据项目适用于数据集编目, 只需要元数据 全部应用范围内的最少元数据集。 比如只用于回答: “ 特定专题 的数据集是否存在 ( ‘什 么 ’ ) ?” 、 “是 否 覆 盖 特 定 的 地 区 ( ‘何 地’ ) ? ” 、 “ 数据集特定的日期或时段 ( ‘何时’ ) ? ” 以及 “了解更多 情况或订购数据集的联系方法 ( ‘谁’ ) ? ” 等基本问题。 这些元数 据项被称之为核心元数据。相应地, 第二层次的详细描述信息 则被称为全集元数据。 地学数据共享中应用到的任何一个实际的元数据方案都 是基于以上两个层次产生的专用元数据标准。 元数据专用标准 包含核心元数据元素, 并可根据需要选择全集元数据中的其它 元素, 必要时还可以按规则扩展基础标准中没有的元数据元素。