元数据与科学数据信息的组织和管理

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 国会图书馆国家数字化信息基础和保护计划(Library of Congress National Digital Information Infrastructure and Preservation Program)
– 国家档案纪录管理局以数据格为基础的永久性档案样 品
– 利用数据网格建立国家科学基金会科学数字化图书馆 – 知识之间相互关系的产生、管理、及检索是信息技术
2020/11/16
ADL2004 深圳
14
科学数据信息元数据的标准 (2)
Biological Data Profile
– 所有元素分成七大类:
标识 (Identification) 数据质量 (Data quality) 空间数据组织 (Spatial data organization) 空间参照 (Spatial reference) 实体和特性信息 (Entity and attribute information) 发行 (Distribution) 元数据参考信息(Metadata reference)
域的数据库,用户 发一个检索指令, 可以同时检索分布 于全美国的科学数 据信息
2020/11/16
ADL2004 深圳
11
美联邦科学联盟元数据通道(2)
检索过程的界面:
2020/11/16
ADL2004 深圳
12
wk.baidu.com
美联邦科学联盟的信息资源
最主要的特点是信息的来源和权威性
– 所收集的信息是有各部门的信息管理人员或图 书馆员选取,而不是像商业网站的自动收集
由CENDI支持协调
2020/11/16
ADL2004 深圳
9
目标
为从事科学工作的公民,包括专业科学人 员、学生、教师、工商业人士、及任何对 科学有兴趣的公众,提供跨部门的检索通 道来查找和使用经过选取的权威性的美国 政府有关科学技术的信息资源。
2020/11/16
ADL2004 深圳
10
美联邦科学联盟元数据通道(1)该集元结数了据各整个合学中科心领
2020/11/16
ADL2004 深圳
6
美国政府和民间利用元数据 管理利用科学数据信息的做法 (1)
酝酿 ( 1992-1994):
– 政府机构牵头制定标准
开发(1995-1998):
– 研究实施对策 – 将标准草案推出,发动公众对标准草案提修改意见 – 标准定稿,编制标准使用指南
整合服务(1999-现在)
专门学科领域的数据量以tens of terabytes 计, 许多学科正在计划建造更 大的数据库
用于组织这些数据的概念及相关关系复 杂性增加
从这些数据库中抽取知识无异于一个巨 大的挑战,必须动用最强的系统来应付 这样的挑战
2020/11/16
ADL2004 深圳
3
背景(2)
数字化图书馆、数据网格(data grids), 及永久 性档案一体化的发展
2004年数字图书馆前沿问题高级研讨班
元数据与科学数据信息的 组织和管理
2020/11/16
ADL2004 深圳
1
提要
科学数据信息资源的范围 美国政府和民间利用元数据管理利用科学数据信 息的做法 科学数据信息元数据的标准 下一步的计划
2020/11/16
ADL2004 深圳
2
背景 (1)
伴随计算技术的发展产生了大量的科学 观察和模拟数据
面临的主要挑战
2020/11/16
ADL2004 深圳
4
The BIRN data grid
2020/11/16
ADL2004 深圳
5
科学数据信息资源的范围
观察模拟数据 Observation and simulation data 分类术语表 Taxonomies 数学表达式 Mathematical expressions 分子、化学、基因表达式 Molecular, chemical, and genomic expressions 结构、物理、计算模型 Structural, physical and computational models 表格、图形、图表、地图、图片 Tables, graphs, charts, maps and images 实地与试验笔记 Field and laboratory notebooks 图书及其它学术文献 Monographs and other scholarly documents 述评 Critical reviews and discourse 实用分类系统 Ontologies 学术文献参考目录 Bibliographic references to scholarly literature
– 通过建立元数据通道,整合分散的科学数据信息 – 利用新的信息技术研究深层次组织科学数据信息提供
服务的方法
2020/11/16
ADL2004 深圳
7
美国政府和民间利用元数据 管理利用科学数据信息的做法 (2)
整合服务 (续)
– 具体过程:
建立跨政府部门的联合委员会(CENDI) 委员会下设两个关键的研究组:核心政策组与技术 设计组
在目标、政策、和设计方面取得一致意见
为浏览建立分类类目
选取、编目、索引政府各部门的资源
联合委员会与政府有关的项目(如firstgov.gov) 挂 钩
2002年春天试运转 2002年12月正式运行:
2020/11/16
ADL2004 深圳
8
美联邦科学联盟成员
农业部 商业部 国防部 教育部 能源部
公共卫生部 内务部 环境保护局 国家航空航天部 国家科学基金会
– 信息内容都产生于政府资助的研究开发项目或 类似的有美国政府投入的活动
– 各部门负责对联邦科学联盟中属于本部门的信 息内容进行更新
2020/11/16
ADL2004 深圳
13
科学数据信息元数据的标准 (1)
Biological Data Profile Ecological Metadata Language (EML) Content Standard for Digital Geospatial Metadata (CSDGM): Government standard for geospatial metadata Geography Markup Language, v2.0 NeesML (Network for Earthquake Engineering Simulation Metadata Language)
相关文档
最新文档