科学数据共享工程通用标准培训

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2021/3/22
29
示例四:医药卫生科学数据集使用范 例
• 分别对每个试点的分类作 相应的Crosswalk,实现 标准之间的映射;
• 试点已有的标引结果可以 通过软件直接映射。
2021/3/22
7
一、编制背景
2021/3/22
8
背景
• 海量科学数据的共享需求
• 海量科学数据需要有序组织、管理
• 科学数据共享工程门户网站需要按照分类来组 织数据目录
• 数据用户需要从分类编码中查询数据
”、“省级森林资源数据”等小类,可以根据
查阅数据集的具体内容,得出应该属于哪个小
类。如,这个数据集是全国范围内的森林资源 概况,则最后的类就是“农业科学—林业科学 —森林资源数据—全国森林资源数据”,具体 编码为:AF1112。
2021/3/22
27
示例二:农业科学数据中心的“主要农作物种质资源评价数据库 ”
• 把用数据中心分类编码标准标引的结果集,直 接导入到以科学数据分类编码标准为依据的标 引结果集中。
2021/3/22
25
四、标准的使用
2021/3/22
26
示例一:林业科学数据中心的“森 林资源概况表”数据集
• 通过分析该数据集的内容,应该属于“农业科 学—林业科学—森林资源数据”,在“森林资 源数据”这个大类下,有“全国森林资源数据
代码
11 12 13 14 15 ……
15
中类
门类 亚门 大类 中类 类
海洋自然资源
资源 环境 科学
海洋 科学
海洋生物资源 海洋 资源 大洋矿产资源
海水化学资源
……
2021/3/22
代码
11 12 13 14 ……
总代码
RS1111 RS1112 RS1113 RS1114 ……
16
编码规则
• 门类、亚门类各为1位英文字母码,大类、中类各2位 数字码。采用线分类按门类、亚门类、大类、中类的 从属关系顺序编码。
2021/3/22
23
标引过程中组配方法的应用
• 在分类标引时,针对数据集的内容,从类目中 找出与数据集内容相对应的各个类目,用它们 的编码组配表达所标引的数据集内容。
2021/3/22
24
标准的映射及标引结果集的转换
• 把各个数据中心采用的分类编码标准中的类目 和科学数据分类编码标准中的类目对应起来。
• 通过分析该数据集的内容,应该属于“农业科 学—农业科学数据—作物科学-主要农作物种质 资源评价数据”,则具体编码为:AS1211。
2021/3/22
28
示例三:农业科学数据中心的“中 国湖泊数据库”
• 通过分析该数据集的内容,发现其既可以属于 “农业科学—农业科学数据—水产科学”(编 码为:AS2113),又可以属于“资源环境科学 —水文水资源科学—水资源—水资源调查”( 编码为:RH1211)。因此,可以采用组配的 方式,将这两个类目的代码,全部标注在这个 数据集上。
• 以数据中心有效管理、组织数据,最终用户快 捷地查找数据为目的
2021/3/22
19
分类依据(2)
• 以科学数据共享工程的规划为依托 • 充分考虑各个数据共享中心的分类编码 • 结合学科分类标准、行业分类标准
2021/3/22
20
分类编码标准的应用
• 该标准只适用于数据集的分类,并将分类结果 组织形成数据目录。该标准不适用于数据库的 改造,数据项的改造,数据项内容的代码填写 等。
第1位 第2位
门类 亚门类 字母码 字母码
第3位 第4位
大类 数字码
第5位 第6位
中类 数字码
2021/3/22
17
三、标准内容要点解析
2021/3/22
18
分类依据(1)
• 遵循“数据分类与编码基本原则与方法”标准 • 数据分类的基本单元(或者说分类的对象)是
数据集
• 保证高层数据分类统一,低层数据分类由各单 位自行研制
2021/3/22
21
分类编码标准的维护
• 随着科学数据共享工程的不断推进,该分类编 码标准必定会不断扩展和修订。
• 这种扩展必须是在遵从“数据分类与编码基本 原则与方法”的基础上的扩充。
2021/3/22
22
数据集的分类标引
• 分类标引的对象是数据集 • 分类标引是在数据集外部进行的 • 分类标引的最终结果是标引结果集(数据库)
代码 F R A T H C
2021/3/22
13
亚门类(资源环境科学为例)
亚门类
资 气象气候 源 水文水资源 环 海洋 境 地矿与土地资源科学
……
代码 W H S L ……
2021/3/22
14
大类
门类
资源环境 科学
亚门 类
海洋 科学
大类
海洋资源 海洋1/3/22
标准目次
• 附录A 资料性附录 科学数据共享 工程分类编码标准的使用实例
• 附录B 资料性附录 本标准与科学 数据共享工程中试点单位的分类标 准之间的映射
• 附录C 资料性附录 科学数据共享 工程数据分类编码标准XML文件
2021/3/22
12
门类
门类 基础科学 资源环境科学 农业科学 工程技术科学 医药卫生科学 区域与综合领域
科学数据共享工程通用标准培训
主要内容
一. 编制背景 二. 标准总体结构 三. 标准内容要点解析 四. 标准使用
2021/3/22
2
简介
2021/3/22
3
科学数据分类与编码方案
• 1 范围 • 2 规范性引用文件 • 3 术语和定义 • 4 分类原则 • 5 分类方法 • 6 编码规则 • 7 分类与编码的使用 • 8 分类代码表
2021/3/22
4
分类类目释义
• 6 大 门 类 、 31 亚 门 类 、 234 大 类 和 1008 中 类 , 共1279条类目的释义
2021/3/22
5
电子词典
2021/3/22
• 主要功能
– 分类类目的管理 – 分类类目的查询 – 数据集标引 – 分类映射 – ……
6
转换实例——mapping机制
2021/3/22
9
解决的问题
• 多学科、跨行业部门科学数据的分类 • 分类编码如何应用 • 如何支持网络信息化的数据集分类和共享 • 与已有科学数据共享工程中诸多试点的分类标
准之间如何交互
2021/3/22
10
二、标准总体结构
2021/3/22
11
• 1 范围 • 2 规范性引用文件 • 3 术语和定义 • 4 分类原则 • 5 分类方法 • 6 编码规则 • 7 分类编码的使用 • 8 分类代码表
相关文档
最新文档