元数据与科学数据信息的组织及管理

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
expressions • 结构、物理、计算模型 Structural, physical and computational
models • 表格、图形、图表、地图、图片 Tables, graphs, charts, maps and
images • 实地与试验笔记 Field and laboratory notebooks • 图书及其它学术文献 Monographs and other scholarly documents • 述评 Critical reviews and discourse • 实用分类系统 Ontologies • 学术文献参考目录 Bibliographic references to scholarly literature
2.3 完整性报告
2.4 位置精确性(横向位置精 确性报告、纵向位置精确性报 告)
2.5 数据获取方法及有关文献 (方法、来源、过程步骤)
科学数据信息元数据的标准 (6)
实体和特性信息 (Entity and attribute information)
5.1 详细描述(特性名称、定义、 定义来源,特性允许值范围、特性 允许值的起始日期和终止日期、特 性值的精确性信息)
美国政府和民间利用元数据 管理利用科学数据信息的做法 (1)
• 酝酿 ( 1992-1994):
– 政府机构牵头制定标准
• 开发(1995-1998):
– 研究实施对策 – 将标准草案推出,发动公众对标准草案提修改意见 – 标准定稿,编制标准使用指南
• 整合服务(1999-现在)
– 通过建立元数据通道,整合分散的科学数据信息 – 利用新的信息技术研究深层次组织科学数据信息提供
• 用于组织这些数据的概念及相关关系复 杂性增加
• 从这些数据库中抽取知识无异于一个巨 大的挑战,必须动用最强的系统来应付 这样的挑战
本资料来源
背景(2)
• 数字化图书馆、数据网格(data grids), 及永久 性档案一体化的发展
– 国会图书馆国家数字化信息基础和保护计划(Library of Congress National Digital Information Infrastructure and Preservation Program)
美联邦科学联盟元数据通道(1)该集元结数了据各整个合学中科心领
域的数据库,用户 发一个检索指令, 可以同时检索分布 于全美国的科学数 据信息
美联邦科学联盟元数据通道(2)
检索过程的界面:
美联邦科学联盟的信息资源
• 最主要的特点是信息的来源和权威性
– 所收集的信息是有各部门的信息管理人员或图 书馆员选取,而不是像商业网站的自动收集
息、工具联系信息、工具有关文献)
科学数据信息元数据的标准 (4)
主题
层次
关键词是标识
类的一个子类,
共分主题、地
地点
点、层次、时 间四大块。
时间
科学数据信息元数据的标准 (5)
wk.baidu.com
数据质量信息 (Data quality)
2.1 特性准确性(特性准确性报 告、计量特性准确性评估)
2.2 逻辑一致性报告
– 国家档案纪录管理局以数据格为基础的永久性档案样 品
– 利用数据网格建立国家科学基金会科学数字化图书馆 – 知识之间相互关系的产生、管理、及检索是信息技术
面临的主要挑战
Next
本资料来源
The BIRN data grid
Back
科学数据信息资源的范围
• 观察模拟数据 Observation and simulation data • 分类术语表 Taxonomies • 数学表达式 Mathematical expressions • 分子、化学、基因表达式 Molecular, chemical, and genomic
科学数据信息元数据的标准 (3)
标识 (Identification) 类下的主要子类:
1.1 引用文献信息 1.2 描述(文摘、目的、补充信息) 1.3 内容所涉及的时间 1.4 状态(进展、维护及更新 1.5 空间地理数据 1.6 关键词(主题、地点、层次、时间) 1.7 检索限制 1.8 使用限制 1.9 联系信息 1.10 图片浏览 1.11 数据集制作单位或人员 1.12 安全信息 1.13 原始数据集环境 1.14 交叉参照 1.15 分析工具(分析工具描述、工具检索信
– 信息内容都产生于政府资助的研究开发项目或 类似的有美国政府投入的活动
– 各部门负责对联邦科学联盟中属于本部门的信 息内容进行更新
科学数据信息元数据的标准 (1)
科学数据信息元数据的标准 (2)
• Biological Data Profile
– 所有元素分成七大类:
– 标识 (Identification) – 数据质量 (Data quality) – 空间数据组织 (Spatial data organization) – 空间参照 (Spatial reference) – 实体和特性信息 (Entity and attribute information) – 发行 (Distribution) – 元数据参考信息(Metadata reference)
2004年数字图书馆前沿问题研讨班
元数据与科学数据信息的组织 和管理
提要
• 科学数据信息资源的范围 • 美国政府和民间利用元数据管理利用科学数据信
息的做法 • 科学数据信息元数据的标准 • 下一步的计划
背景 (1)
• 伴随计算技术的发展产生了大量的科学 观察和模拟数据
• 专门学科领域的数据量以tens of terabytes 计, 许多学科正在计划建造更 大的数据库
服务的方法
美国政府和民间利用元数据 管理利用科学数据信息的做法 (2)
美联邦科学联盟成员
• 农业部 • 商业部 • 国防部 • 教育部 • 能源部
• 公共卫生部 • 内务部 • 环境保护局 • 国家航空航天部 • 国家科学基金会
由CENDI支持协调
目标
• 为从事科学工作的公民,包括专业科学人 员、学生、教师、工商业人士、及任何对 科学有兴趣的公众,提供跨部门的检索通 道来查找和使用经过选取的权威性的美国 政府有关科学技术的信息资源。
相关文档
最新文档