气象数据集说明文档和元数据文档的制作说明
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
起始时间: 终止时间: 观测或统计频次: 共享级别: 联系方法 数据集责任人名: 数据集负责单位名: 数据集责任人职务:
8
数据集责任人角色代码: 联系信息
电话: 传真: 详细地址: 所在城市: 行政区: 邮政编码: 国家: e-mail: 元数据实体信息 元数据标识:MD+数据集代码 元数据语言: 元数据字符集: 元数据制作日期: 采用的元数据标准: 元数据标准版本: 联系方法 元数据责任人名: 元数据负责单位名: 元数据责任人职务: 元数据责任人角色代码: 联系信息 元数据责任人详细地址: 元数据责任人所在城市: 元数据责任人行政区: 元数据责任人邮政编码: 元数据责任人国家: 元数据责任人 E-Mail:
(8) 水平面直接辐射月总量 整型
0.01 兆焦耳/平方米
(9) 反射辐射月总量
整型
0.01 兆焦耳/平方米
z 物理量或模式产品,需说明产品所包含的变量名称、单位及其它有关产品内容的说明。
例如 NCEP 日平均、4 时次/日等压面资料数据变量名称及有关说明
序号 变量
文件名前缀 单位 最小信息位(精度)
1
(6)日、月、年数据集的时间范围或起、始年书写应规范。如定时、日值 数据集时间范围表示为:“xxxx 年 x 月 x 日——xxxx 年 x 月 x 日”;月值数据集 时间范围表示为:“xxxx 年 x 月——xxxx 年 x 月”;年值数据集时间范围表示为: “xxxx 年——xxxx 年”。
最西经度:
最东经度:
最北纬度:
最南纬度:
5
3.4.2.台站信息: 3.4.3.空间分辨率: 3.4.4.垂直范围: 对于高空观测资料等涉及高空垂直位置的资料应表述以下一项或几项内容。高度范围 (高度以“km”或等压面高度“hPa”表示,如“1000hPa-30hPa”)、层次等。例如:17 层 (单位:hPa): 1000, 925, 850, 700, 600, 500, 400, 300, 250, 200, 150, 100, 70, 50, 30, 20, 10 。
(4)documents :台站信息文件“SURF_CLI_CHN_MUL_MON_stations.rtf”。
数据总量:
3.3.时间属性
时间范围:
定时、日值数据集时间范围表示为:“xxxx 年 x 月 x 日——xxxx 年 x 月 x 日”;
月值数据集时间范围表示为:“xxxx 年 x 月——xxxx 年 x 月”;
主要包括:数据集的时间范围、空间范围和数据集实体文件的内容描述等能反映该数 据集主要特征的基本信息。
数据质量 数据质量描述: 数据处理过程:
数据来源: 数据集分类: 更新频率: 关键词
学科分类关键词: 要求列出描述数据集的可搜索的关键词,应依据数据集实体的要素内容可罗列多个 关键词,一般可以细分到要素。如果要素较多,则可以选择相对较为重要的要素作为关键 词。
3.4.5.投影方式: 3.5.观测仪器: 3.6.数据处理方法:
应比较详细说明数据集实体数据处理方法和制作过程,包括数据的统计方法、特殊 情况处理等。
3.7.数据质量状况 3.7.1 质量控制方法: 3.7.2 质量状况:
3.8.数据完整性: 4.引用文献: 5.数据集制作及技术支持
5.1.数据集制作人 姓名: 单位: 电话:
3.1.3.特征值说明:
3
例如:特征值 适用范围 意义
32744 所有要素 无观测
32766 所有要素 缺测
3.2.数据存储信息
3.2.1.存储格式和读取:
3.2.2.数据集在介质中的放置
存储介质及数量:
存储目录结构:
z 用文字表述清楚,如中国天气现象月值数据集
(1)datasets:存放数据集实体文件,按天气现象不同分为霜(20201)、结 冰 (20202)、浮尘 (20203)、扬沙 (20204)、沙尘暴 (20205)、轻雾 (20206)、雾 (20207)、 大风 (20208)、积雪 (20209)、雷暴 (20210)、飑线 (20211)、龙卷 (20212)、冰雹 (20213)、 降雪 (20214)、闪电 (20215)、吹雪 (20216)、雨凇 (20217)、雾凇 (20218)18 个目录; 每个目录下存放了 1951-2002 年 52 个数据文件。存放 1951 年 1 月-2001 年 12 月资料;
年值数据集时间范围表示为:“xxxx 年——xxxx 年”。
时间分辨率:
说明该数据集的时间分辨率,而不是资料来源的观测时次或方法。如每日 4 次观测(北 京时间 20 时、08 时、14 时和 20 时)、日值、月值等。
3.4.空间属性
3.4.1.地理范围
地理范围描述:
经纬度范围表示,经纬度数据用十进制,在其数据值后用 “W”、“E”分别表示西经和 东经,用“S”、“N”分别表示南纬和北纬。
最西经度: 最东经度: 最北纬度: 最南纬度:
垂向覆盖范围 垂向最低: 垂向最高: 垂向度量单位: 垂向基准名称:
时间覆盖范围 定时、日值数据集时间范围表示为:“xxxx 年 x 月 x 日——xxxx 年 x 月 x 日”; 月值数据集时间范围表示为:“xxxx 年 x 月——xxxx 年 x 月”; 年值数据集时间范围表示为:“xxxx 年——xxxx 年”。
(1) 温度
air
K
0.1
(2) 位势高度
hgt
m
1.
(3) 相对湿度
rhum
%
1.
(4) 比湿
shum
kg/kg
0.00001
(5) 垂直速度
omega Pascal/s 0.001
(6) 风速 u 分量
uwnd
m/s
0.1
(7) 风速 v 分量
vwnd
m/s
0.1
z 如果说明内容篇幅较多,可以采用附加文件方式说明。
(2description:数据集说明文档。
(4)documents:“1951-2002 年中国地面天气现象数据集台站信息”,文件 名为 SURF_CLI_CHN_WEP_MON_STATION.RTF。
z 如果目录结构较多,可以采用如下方式:
(1)datasets:包括气压(PRS)、气温(TEM)、相对湿度(RHU)、降水(PRE)、 风(WIN)、日照(SSD)5 个目录,这 5 个目录下有包括 1 到 3 个目录不等,目录结构如下:
50
PRE(降水量)
13201(20-20 时降水量)
50
WIN(风)
11002A(2 分钟平均风速) 50
11042(最大风速、风向) 50
11041(极大风速、风向) 50
SSD( 日照)
14032(日照时数)
50
(2)metadata:元数据文档。
(3)description:数据集说明文档。
月水平面直接辐射:RADI_MUL_CHN_MON-SRA-14201-YYYY.TXT
月反射辐射
:RADI_MUL_CHN_MON-RRA-14203-YYYY.TXT
2
其中,YYYY—年份。
3.1.2.数据集实体文件的内容描述:
z 数据集实体为数据型文件,应说明文件中所记录的气象要素名称、数据类型、单位(精 度)和对要素的简要文字描述。
数据集说明文档和元数据文档的制作说明
国家气象信息中心
1 数据集说明文档和元数据文档制作软件说明
(1)安装环境 该软件安装方便,适合在 Windows 98/ME/2000/XP 系统下运行。
(2)操作简便、界面友好。 文档制作软件设计合理,功能完善,具备文档编辑、浏览、定制模版等功能。
制作软件为用户提供了自定义文档模版的功能,能够在自定义模版之上新建文 档,从而提高工作效率。并提供了 XML 和 DOC(TXT)两种格式的文件浏览功能, 能够较方便地查看和修改文档内容。 (3)基本满足现有需要,方便文档网上发布
地理范围关键词: 层次关键词:
空间分辨率:有台站信息说明台站个数。 参考系:
7
时间标识 制作时间: 制作类型:
地理覆盖范围 地理范围描述:
注意此处经纬度的描述规定(与数据集说明文档的规定有所不同),数据集覆盖范围, 用十进制表示,保留两位小数,经度规定:东半球为正,西半球为负,纬度规定:北半球 为正,南半球为负。
(7)“地理范围描述”和“空间分辨率”不明确。 (8)气象数据集说明文档中“数据处理方法”、“数据质量状况”中的“质 量控制方法”、气象数据集元数据中“数据处理过程”是数据集文档中重要内容, 应当详细说明的。 (9)“光盘序号及要素”应清晰、明了、准确。
3 气象数据集说明文档制作说明
下面将数据集说明文档制作过程中说明不够明确或可能遇到的问题按摸版格式作详细 说明:
5.2.数据集文档编撰者 姓名: 单位: 电话:
5.3.技术支持 单位: 电话: 传真:
6
e-mail: 邮政编码: 单位地址: 6.其它:无
4 气象元数据说明文档制作说明
下面将数据集元数据说明文档制作过程中说明不够明确或可能遇到的问题按模版格式 作详细说明: 气象数据集元数据
数据集标识信息 数据集名称: 数据集代码: 摘要:
该采用 VB 编写程序,应用 XML 技术以实现文档编辑的功能要求,可以同 时形成 XML 和 DOC 两种格式的气象资料数据集说明文档。文档可包含流式媒 体信息,具有较强的扩展性,可较好地满足现有气象资料数据集说明文档编辑制 作需求,同时可以方便数据文档的网上发布。
2 数据集说明文档和元数据文档撰写中应注意的问题
例如中国高空探测资料定时值数据集中各要素的说明即采用此方式。
大部分站点为标准等压面和对流层顶资料,部分站点含有零度层、特性层、等高面风和 极 大 风 资 料 。 详 见 DOCUMENTS 目 录 下 “ 高 空 B01 格 式 说 明 ” 文 件 : UPAR_WEA_CHN_MUL_FTM_B01-FORMAT。
在气象数据集说明文档和元数据文档制作过程中发现气象数据集制作人员 在编撰数据集说明文档时对数据集说明文档主要项目的定义、要求和格式,存在 理解不一致、提法不规范的问题。主要有以下几个方面的问题:
(1)数据集说明文档中内容说明时标注的标号应区别于数据集说明文档各 个大类标号。
(2)数据集中文名称:数据集中文名称在整个气象数据集应完全一致。 (3)数据来源:数据来源是数据准确性、权威性的体现,也是未来追究数 据集质量的依据,应权威、具体、可寻,有明确出处,不应笼统地“取自当前数 据库”、“取自气侯资料统计结果”。由于数据库在不断更新,统计结果要有明确、 具体的来源。 (4) 数据文件要素种类及表示:各种要素数据文件名称要与数据集标识符 应完全一致。 (5) 提法不规范,不同数据集使用名称不统一。如“中国”和“我国”,“国 际交换站”和“194 站”,“建站-2000 年”等。
1 级目录
2 级目录
文件数
PRS(气压)
10004(平均本站气压)
50
10005(极端最高气压)
30
10006(极端最低气压)
30
TEM(气温)
12001(平均气温)
50
12011(极端最高气温)
50
12012(极端最低气温)
50
RHU(相对湿度)
4
13003(平均相对湿度)
50
13007(最小相对湿度)
例如中国辐射资料月值数据集中数据文件内容描述为:
序号 要素
数据类型
单位
(1) 区站号
整型
(2) 年
整型
(3) 月
整型
(4) 总辐射月总量
整型
0.01 兆焦耳/平方米
(5) 净全辐射月总量
整型
0.01 兆焦耳/平方米
(6) 散射辐射月总量
整型
0.01 兆焦耳/平方米
(7) 垂直面直接辐射月总量 整型
0.01 兆焦耳/平方米
气象数据集说明文档
1.数据集信息
数据集中文名称:
数据集代码:
数据集版本:
数据集建立时间:
2.数据来源:
数据来源说明应准确、规范,处于不断更新中的数据不能作为数据集制作的数据来源。
3.数据集实体
3.1.数据集实体内容说明
3.1.1.数据集实体文件名称:
说明数据文件的名称或命名规定。
例如中国辐射资料月值数据集中各要素数据文件的名称为:
月总辐射
:RADI_MUL_CHN_MON-QRA-14021-YYYY.TXT
月净全辐射
:RADI_MUL_CHN_MON-NRA-14016-YYYY.TXT
月散射辐射
:RADI_MUL_CHN_MON-DRA-14023-YYYY.TXT
月垂直面直接辐射:RADI_MUL_CHN_MON-SRA-14202-YYYY.TXT
8
数据集责任人角色代码: 联系信息
电话: 传真: 详细地址: 所在城市: 行政区: 邮政编码: 国家: e-mail: 元数据实体信息 元数据标识:MD+数据集代码 元数据语言: 元数据字符集: 元数据制作日期: 采用的元数据标准: 元数据标准版本: 联系方法 元数据责任人名: 元数据负责单位名: 元数据责任人职务: 元数据责任人角色代码: 联系信息 元数据责任人详细地址: 元数据责任人所在城市: 元数据责任人行政区: 元数据责任人邮政编码: 元数据责任人国家: 元数据责任人 E-Mail:
(8) 水平面直接辐射月总量 整型
0.01 兆焦耳/平方米
(9) 反射辐射月总量
整型
0.01 兆焦耳/平方米
z 物理量或模式产品,需说明产品所包含的变量名称、单位及其它有关产品内容的说明。
例如 NCEP 日平均、4 时次/日等压面资料数据变量名称及有关说明
序号 变量
文件名前缀 单位 最小信息位(精度)
1
(6)日、月、年数据集的时间范围或起、始年书写应规范。如定时、日值 数据集时间范围表示为:“xxxx 年 x 月 x 日——xxxx 年 x 月 x 日”;月值数据集 时间范围表示为:“xxxx 年 x 月——xxxx 年 x 月”;年值数据集时间范围表示为: “xxxx 年——xxxx 年”。
最西经度:
最东经度:
最北纬度:
最南纬度:
5
3.4.2.台站信息: 3.4.3.空间分辨率: 3.4.4.垂直范围: 对于高空观测资料等涉及高空垂直位置的资料应表述以下一项或几项内容。高度范围 (高度以“km”或等压面高度“hPa”表示,如“1000hPa-30hPa”)、层次等。例如:17 层 (单位:hPa): 1000, 925, 850, 700, 600, 500, 400, 300, 250, 200, 150, 100, 70, 50, 30, 20, 10 。
(4)documents :台站信息文件“SURF_CLI_CHN_MUL_MON_stations.rtf”。
数据总量:
3.3.时间属性
时间范围:
定时、日值数据集时间范围表示为:“xxxx 年 x 月 x 日——xxxx 年 x 月 x 日”;
月值数据集时间范围表示为:“xxxx 年 x 月——xxxx 年 x 月”;
主要包括:数据集的时间范围、空间范围和数据集实体文件的内容描述等能反映该数 据集主要特征的基本信息。
数据质量 数据质量描述: 数据处理过程:
数据来源: 数据集分类: 更新频率: 关键词
学科分类关键词: 要求列出描述数据集的可搜索的关键词,应依据数据集实体的要素内容可罗列多个 关键词,一般可以细分到要素。如果要素较多,则可以选择相对较为重要的要素作为关键 词。
3.4.5.投影方式: 3.5.观测仪器: 3.6.数据处理方法:
应比较详细说明数据集实体数据处理方法和制作过程,包括数据的统计方法、特殊 情况处理等。
3.7.数据质量状况 3.7.1 质量控制方法: 3.7.2 质量状况:
3.8.数据完整性: 4.引用文献: 5.数据集制作及技术支持
5.1.数据集制作人 姓名: 单位: 电话:
3.1.3.特征值说明:
3
例如:特征值 适用范围 意义
32744 所有要素 无观测
32766 所有要素 缺测
3.2.数据存储信息
3.2.1.存储格式和读取:
3.2.2.数据集在介质中的放置
存储介质及数量:
存储目录结构:
z 用文字表述清楚,如中国天气现象月值数据集
(1)datasets:存放数据集实体文件,按天气现象不同分为霜(20201)、结 冰 (20202)、浮尘 (20203)、扬沙 (20204)、沙尘暴 (20205)、轻雾 (20206)、雾 (20207)、 大风 (20208)、积雪 (20209)、雷暴 (20210)、飑线 (20211)、龙卷 (20212)、冰雹 (20213)、 降雪 (20214)、闪电 (20215)、吹雪 (20216)、雨凇 (20217)、雾凇 (20218)18 个目录; 每个目录下存放了 1951-2002 年 52 个数据文件。存放 1951 年 1 月-2001 年 12 月资料;
年值数据集时间范围表示为:“xxxx 年——xxxx 年”。
时间分辨率:
说明该数据集的时间分辨率,而不是资料来源的观测时次或方法。如每日 4 次观测(北 京时间 20 时、08 时、14 时和 20 时)、日值、月值等。
3.4.空间属性
3.4.1.地理范围
地理范围描述:
经纬度范围表示,经纬度数据用十进制,在其数据值后用 “W”、“E”分别表示西经和 东经,用“S”、“N”分别表示南纬和北纬。
最西经度: 最东经度: 最北纬度: 最南纬度:
垂向覆盖范围 垂向最低: 垂向最高: 垂向度量单位: 垂向基准名称:
时间覆盖范围 定时、日值数据集时间范围表示为:“xxxx 年 x 月 x 日——xxxx 年 x 月 x 日”; 月值数据集时间范围表示为:“xxxx 年 x 月——xxxx 年 x 月”; 年值数据集时间范围表示为:“xxxx 年——xxxx 年”。
(1) 温度
air
K
0.1
(2) 位势高度
hgt
m
1.
(3) 相对湿度
rhum
%
1.
(4) 比湿
shum
kg/kg
0.00001
(5) 垂直速度
omega Pascal/s 0.001
(6) 风速 u 分量
uwnd
m/s
0.1
(7) 风速 v 分量
vwnd
m/s
0.1
z 如果说明内容篇幅较多,可以采用附加文件方式说明。
(2description:数据集说明文档。
(4)documents:“1951-2002 年中国地面天气现象数据集台站信息”,文件 名为 SURF_CLI_CHN_WEP_MON_STATION.RTF。
z 如果目录结构较多,可以采用如下方式:
(1)datasets:包括气压(PRS)、气温(TEM)、相对湿度(RHU)、降水(PRE)、 风(WIN)、日照(SSD)5 个目录,这 5 个目录下有包括 1 到 3 个目录不等,目录结构如下:
50
PRE(降水量)
13201(20-20 时降水量)
50
WIN(风)
11002A(2 分钟平均风速) 50
11042(最大风速、风向) 50
11041(极大风速、风向) 50
SSD( 日照)
14032(日照时数)
50
(2)metadata:元数据文档。
(3)description:数据集说明文档。
月水平面直接辐射:RADI_MUL_CHN_MON-SRA-14201-YYYY.TXT
月反射辐射
:RADI_MUL_CHN_MON-RRA-14203-YYYY.TXT
2
其中,YYYY—年份。
3.1.2.数据集实体文件的内容描述:
z 数据集实体为数据型文件,应说明文件中所记录的气象要素名称、数据类型、单位(精 度)和对要素的简要文字描述。
数据集说明文档和元数据文档的制作说明
国家气象信息中心
1 数据集说明文档和元数据文档制作软件说明
(1)安装环境 该软件安装方便,适合在 Windows 98/ME/2000/XP 系统下运行。
(2)操作简便、界面友好。 文档制作软件设计合理,功能完善,具备文档编辑、浏览、定制模版等功能。
制作软件为用户提供了自定义文档模版的功能,能够在自定义模版之上新建文 档,从而提高工作效率。并提供了 XML 和 DOC(TXT)两种格式的文件浏览功能, 能够较方便地查看和修改文档内容。 (3)基本满足现有需要,方便文档网上发布
地理范围关键词: 层次关键词:
空间分辨率:有台站信息说明台站个数。 参考系:
7
时间标识 制作时间: 制作类型:
地理覆盖范围 地理范围描述:
注意此处经纬度的描述规定(与数据集说明文档的规定有所不同),数据集覆盖范围, 用十进制表示,保留两位小数,经度规定:东半球为正,西半球为负,纬度规定:北半球 为正,南半球为负。
(7)“地理范围描述”和“空间分辨率”不明确。 (8)气象数据集说明文档中“数据处理方法”、“数据质量状况”中的“质 量控制方法”、气象数据集元数据中“数据处理过程”是数据集文档中重要内容, 应当详细说明的。 (9)“光盘序号及要素”应清晰、明了、准确。
3 气象数据集说明文档制作说明
下面将数据集说明文档制作过程中说明不够明确或可能遇到的问题按摸版格式作详细 说明:
5.2.数据集文档编撰者 姓名: 单位: 电话:
5.3.技术支持 单位: 电话: 传真:
6
e-mail: 邮政编码: 单位地址: 6.其它:无
4 气象元数据说明文档制作说明
下面将数据集元数据说明文档制作过程中说明不够明确或可能遇到的问题按模版格式 作详细说明: 气象数据集元数据
数据集标识信息 数据集名称: 数据集代码: 摘要:
该采用 VB 编写程序,应用 XML 技术以实现文档编辑的功能要求,可以同 时形成 XML 和 DOC 两种格式的气象资料数据集说明文档。文档可包含流式媒 体信息,具有较强的扩展性,可较好地满足现有气象资料数据集说明文档编辑制 作需求,同时可以方便数据文档的网上发布。
2 数据集说明文档和元数据文档撰写中应注意的问题
例如中国高空探测资料定时值数据集中各要素的说明即采用此方式。
大部分站点为标准等压面和对流层顶资料,部分站点含有零度层、特性层、等高面风和 极 大 风 资 料 。 详 见 DOCUMENTS 目 录 下 “ 高 空 B01 格 式 说 明 ” 文 件 : UPAR_WEA_CHN_MUL_FTM_B01-FORMAT。
在气象数据集说明文档和元数据文档制作过程中发现气象数据集制作人员 在编撰数据集说明文档时对数据集说明文档主要项目的定义、要求和格式,存在 理解不一致、提法不规范的问题。主要有以下几个方面的问题:
(1)数据集说明文档中内容说明时标注的标号应区别于数据集说明文档各 个大类标号。
(2)数据集中文名称:数据集中文名称在整个气象数据集应完全一致。 (3)数据来源:数据来源是数据准确性、权威性的体现,也是未来追究数 据集质量的依据,应权威、具体、可寻,有明确出处,不应笼统地“取自当前数 据库”、“取自气侯资料统计结果”。由于数据库在不断更新,统计结果要有明确、 具体的来源。 (4) 数据文件要素种类及表示:各种要素数据文件名称要与数据集标识符 应完全一致。 (5) 提法不规范,不同数据集使用名称不统一。如“中国”和“我国”,“国 际交换站”和“194 站”,“建站-2000 年”等。
1 级目录
2 级目录
文件数
PRS(气压)
10004(平均本站气压)
50
10005(极端最高气压)
30
10006(极端最低气压)
30
TEM(气温)
12001(平均气温)
50
12011(极端最高气温)
50
12012(极端最低气温)
50
RHU(相对湿度)
4
13003(平均相对湿度)
50
13007(最小相对湿度)
例如中国辐射资料月值数据集中数据文件内容描述为:
序号 要素
数据类型
单位
(1) 区站号
整型
(2) 年
整型
(3) 月
整型
(4) 总辐射月总量
整型
0.01 兆焦耳/平方米
(5) 净全辐射月总量
整型
0.01 兆焦耳/平方米
(6) 散射辐射月总量
整型
0.01 兆焦耳/平方米
(7) 垂直面直接辐射月总量 整型
0.01 兆焦耳/平方米
气象数据集说明文档
1.数据集信息
数据集中文名称:
数据集代码:
数据集版本:
数据集建立时间:
2.数据来源:
数据来源说明应准确、规范,处于不断更新中的数据不能作为数据集制作的数据来源。
3.数据集实体
3.1.数据集实体内容说明
3.1.1.数据集实体文件名称:
说明数据文件的名称或命名规定。
例如中国辐射资料月值数据集中各要素数据文件的名称为:
月总辐射
:RADI_MUL_CHN_MON-QRA-14021-YYYY.TXT
月净全辐射
:RADI_MUL_CHN_MON-NRA-14016-YYYY.TXT
月散射辐射
:RADI_MUL_CHN_MON-DRA-14023-YYYY.TXT
月垂直面直接辐射:RADI_MUL_CHN_MON-SRA-14202-YYYY.TXT