水文年鉴中编印说明数据统计探讨

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

水文年鉴中编印说明数据统计探讨
谢运山;马玮
【摘要】每年的水文年鉴资料汇编都需要大量的人力、物力投入其中,卷册前面
的编印说明每年都需要进行相关数据的统计、复核,但是其中有一些是有规律性的,可以采用编程方式予以解决。

结合几个卷册的有关内容利用VFP编程语言进行编
程试算,对其中的资料索引、各参编单位测站数统计和刊印资料站年数统计表的统计、水雨情等方面的资料统计都可以很好的完成,节省了人力,提高了效率和精度。

且程序可以根据各卷册的具体情况进行补充完善,具有较强的通用性和可扩展性。

【期刊名称】《吉林水利》
【年(卷),期】2016(000)007
【总页数】5页(P41-45)
【关键词】水文年鉴;汇编:统计;资料整编;VFP
【作者】谢运山;马玮
【作者单位】江苏省水文水资源勘测局镇江分局,江苏镇江 212028;江苏省水文
水资源勘测局镇江分局,江苏镇江 212028
【正文语种】中文
【中图分类】P337
水文年鉴是按照统一格式要求进行汇编的水文资料,按流域、水系进行卷册分类。

其主要内容包括前面的编印说明、水文水位站一览表、雨量站一览表及分布图、降雨量等值线图、各种月年统计表等以及正文部分的各种整编表项等。

是水文部门将
相关水文资料以年鉴的形式进行汇编刊印并保存的重要档案资料。

每年的年鉴资料汇编审查都需要大量的人力、物力投入其中,卷册前面的编印说明每年都需要进行相关数据的统计、复核,但是其中有一些是有规律性的,完全可以采用编程方式予以解决,笔者结合6卷6、7、19、20册等卷册的有关内容进行
编程试算,完全可以解决其中的数据统计问题,解放了人力,提高了效率和精度。

考虑到VFP数据库管理数据有较强的规律性,且与Excel也有较强的互动性,采
用VFP编程进行相关数据的统计比较方便易行。

基于此,采用VFP软件编程实现年鉴编印说明中的第1部分“各参编单位测站数统计表”、“各参编单位刊印资
料站年数统计表”、第5部分的雨情、水情、沙情等统计以及“水位、流量、泥沙、水温资料索引表”和“降水量、水面蒸发量站一览表(含资料索引)”功能。

其他一些功能还有待进一步完善。

主要分三步,一是需要利用南方片资料整编程序的输出功能生成水位水文站一览表、降水量水面蒸发量站一览表、相关卷册的月年平均流量对照表.xls、月年平均水位
对照表.xls、各站月年降水量对照表.xls等一览表和对照表。

为了统计的准确性,需要在“水位水文站一览表”一站多断面的相关测站后面加备注列,以便在统计水文站、水位站时扣除。

备注内容可以为约定的“1”或者其他字符。

蒸发站的统计可以在进行整编成果表项统计完成后再进行。

相关卷册的表格输出都是利用南方片资料整编程序中的“整编表项、对照表电子表格输出”界面的各项功能。

如图1所示。

二是准备好相关卷册的ceb电子书。

在进行相关数据统计前首先将排好版的ceb
电子书另存为txt文件,以便为统计页码也就是为水位、流量、泥沙、降水量资料索引做准备。

同时需要将另存后的文件内容复制出来粘贴到一个新建的文本文件中,否则程序运行后会因为是乱码而不能识别。


下面二图对比:
三是将水文水位站一览表、降水量水面蒸发量站一览表中需要用到的采用“””替换的上一个同名全部再替换回来,如水系、站别、领导机关等内容。

以便在后面进行统计时有用。

编印说明中的统计工作量较大,如果是人工统计,一是工作量较大,二是重复劳动(每年都要做同样的工作),三是出错的可能性较大,四是规律性较强。

利用计算机编程来进行相关数据统计,则能达到事半功倍的效果。

考虑到水文资料各整编成果表均有一定的规律性,而作为数据库管理的Visual FoxPro(简称VFP)对于数据管理则具有较大的优势,因此,以VFP数据库编程语言进行编程来处理年鉴汇
编资料比较方便实用。

3.1 具体程序界面
将一些相关注意点直接列在程序界面上,有助于程序使用者更好的理解、执行。

3.2 进行各种整编成果表项类别和页码的统计
主要有三种方法,一是直接利用ceb电子表格里面目录中的数据来进行统计,以“水位资料”和“降水量资料”为控制信息来进行统计,年鉴汇编中具体各测站成果基本上是以“水位资料”开始,以降水量资料和蒸发资料结束,而“降水量资料”一般均包含“逐日降水量表、降水量摘录表、各时段最大降水量表(1)、各时段最大降水量表(2)”这四项内容,“水面蒸发量资料”则包含“逐日水面蒸发量表”这一项。

各卷册内容不同的主要是水位资料、流量资料、潮流量资料、水温资料、输沙率资料以及其他一些各具地方特色的相关资料,如6卷20册中有“水温资料”大项没有“输沙率资料”大项,6卷7册中有“输沙率资料”大项没有“水温资料”大项,而流量资料中各小项也是各卷册有所不同。

所以在进行统计时可以利用这个目录进行各成果表项的统计,根据水文水位站一览表和降水量一览表在相关表项的最后一列再增加相关表项的统计列。

目录部分内容如下:
水位资料
逐日平均水位表1耀46………………………
洪水水位摘录表47耀56……………………
逐潮高低潮位表57耀62……………………
潮位月年统计表63耀64……………………
逐日最高、最低潮(水)位表65耀71…………
流量资料
实测流量成果表72耀108……………………
实测大断面成果表109耀129………………
……
……
各时段最大降水量表(2)632耀636…………
水面蒸发量资料
逐日水面蒸发量表637耀645………………
方法二是直接利用“**水系水位水文站整编成果一览表”,但需要将空栏和空列
删除,因为这个一览表中包括一些雨量站和所有类型的整编成果表项,即卷册内没有这些整编成果的表项和测站也一起列出来了。

截图如下:
方法三:利用ceb电子版内的成果生成各站整编成果表项。

这个是相对比较准确,且可以对目录中统计不准确进行纠正。

Ceb电子版PDF文件另存为txt文件后,
各整编成果表项前均有一个“书”字,这样我们可以利用这个特性来进行整编成果表项的统计。

文字内容如下:

1裕溪河巢湖闸(闸上游)站逐日平均水位表
表内水位(冻结基面以上米数)-1.894m=黄海基面以上米数


一月二月三月四月五月六月七月八月九月十月十一月十二月
19.579.279.238.858.598.648.799.049.069.288.97 8.91 2482223805561850207289.0290截图如下:
本程序采用第三种方法,并以“**水系水位水文站一览表.xls”和“**水系降水量水面蒸发量站一览表.xls”为底本,将各整编成果表项加在列的最后面。

这个转换过程里面也遇到一些问题,主要有以下两种情况,一是纵向排版中主要有“降水量摘录表”有些特殊,各文字间均有空格,即:“降水量摘录表”,在转换时需要加以区别,其他各整编成果表项的文字均相连无其他字符间隔。

二是“堰闸流量率定成果表”也有些特殊,主要是横向排版导致。

在完成成果表项的统计的同时即进行相应测站的统计,这个在统计工作进行前需要对“堰闸流量率定成果表”的内容采取一些人工干预,即在程序运行前先人工将该页码中测站名所在行进行手工分行。

由上图可以看出横向排版后,该页文字在另存为txt文件后变成一行了,程序识别有些困难,因此需要先进行分行,建议在测站名序号前回车换行,如本图例中即在“附注”后面回车换行。

统计测站名主要是根据关键字“站”来进行的,但需要在识别过程中处理好各种附注以及文字中含有“站”字但不是测站名相关信息的行。

同时“各时段最大降水量表(1)”和“各时段最大降水量表(2)”由于是统一在一张表中,各测站名中没有“站“字,所以也需要再单独处理。

主要是根据“各时段最大降水量表(1)”和“各时段最大降水量表(2)”所在页码范围内的相关内容进行测站名的提取。

在提取整编成果表项和测站名、测站成果表所在页码等相关信息时主要用到以下四
个数据库表:整编成果表项.dbf、页码信息表.dbf、测站列表及所在页码表.dbf、zh.dbf,数据库文件表结构分别见表1、表2、表3、表4[1-2]:
表1主要是成果表项、成果表项序号、开始行数、参编单位1、2、3、4、5等信息。

表2主要是页码,正确页码,开始行数,结束行数等信息。

表3主要是站名、页码、开始行数、成果表项、成果表项序号、领导机关、水系
等信息。

根据排版后的ceb文本文件统计成果表项的个数和对应行数、页码对应的行数,
并提取所有测站,根据测站名所在行数确定成果表项和页码。

如图8所示。

在统计页码的过程中还需要将页码进行处理,ceb文件另存后的txt文本文件中页码顺序是颠倒的,如上图中所示,页码“—874—”正确的应为“478”。

3.3 完成资料索引和“编印资料概况”中两个表的统计
在按照整编成果表项生成各测站的页码后,打开“整编成果表项.dbf”、“测站
列表及所在页码表.dbf”等数据库文件,运行excel程序打开“**水系水位水文站一览表.xls”[3],将提取的成果表项添加到列的最后面,再按站将各成果表项
所在页码添加到一览表中对应的位置上。

当运行到“逐日降水量表”表项时保存水位水文站一览表,并按成果表项对各参编单位进行统计,统计数据直接填到“整编成果表项.dbf”的各列中。

关闭“**水系水位水文站一览表.xls”,打开“**水系
降水量水面蒸发量站一览表.xls”,将相关测站的页码填至右侧列中对应位置,并
按省进行统计各成果表项,填至“整编成果表项.dbf”各列中,并进行各类成果表项的合计统计。

最后再用程序生成“各参编单位刊印资料站年数统计表”、“水位、流量、泥沙、水温资料索引表”和“降水量、水面蒸发量站一览表(含资料索引)”。

在进行统计前需要先编程将“**水系水位水文站一览表.xls”和“**水系降水量水
面蒸发量站一览表.xls”表中重复的表头删除,只保留最上面一个。

编印说明开始部分的“各参编单位测站数统计表”需要借助一览表中的站别进行
统计,并扣除附注列备注的重复统计数据。

在按参编单位进行分项统计时主要是按照领导机关的前两个字进行统计,如安徽省卷册中领导机关就有“安徽省水文局”、“安徽省广德县人民政府”、“安徽省宣城市人民政府”、“安徽省合肥市水务局”等单位,在进行统计时全部归为安徽,参编单位为“安徽省水文局”。

蒸发
站按照“逐日水面蒸发量表”所有测站进行统计并按参编单位分列。

3.4 雨、水情等概况统计
这一部分主要是根据水位水文站一览表、降水、蒸发站一览表和相关月年统计表进行统计。

首先按月年统计表中测站名将一览表中对应测站的水系添加到月年统计表中,然后再按水系进行相关数据统计,如雨情部分的各水系平均年降水量、最大年降水量、最大日降水量、最小年降水量、年最大24小时降水量以及本卷册平均降水量等资料。

水情部分则与雨情有所不同,可以将需要统计的测站列入一个txt
文件中,文件名统一为“流量统计测站名”,这样在执行程序时可以自动调用该文件,按里面所列的测站统计相关数据。

如水位站只统计最高水位、流量站统计最大流量、年最大径流量等。

初步设计水位站前加数字1表示统计最高水位、水文站
前数字2表示统计流量和水位。

一般各卷册统计类别都比较固定,也可以针对各卷情况单独编程进行相关数据的统计。

为了确保月年统计表中数据的准确性,可以在测站页码统计好后先将各月年统计表中的数据与各单个成果表里的月年统计数值进行比较,统计出不同之处,顺便作为表间错情统计工作之一。

然后再进行本部分的统计工作,以确保统计数据无误。

部分卷册还需要进行特殊水雨情统计,如梅雨期的雨量统计、台风期间的水雨情统计分析、部分月极值和日极值的挑选、引排水量的合并统计等。

这种情况可以利用排版文件进行统计,比较方便,目前只考虑同月的日期内降水量统计。

跨月的要考虑闰年的情况。

程序界面如图9所示。

对于规律性的数据统计,本程序能很好地解决,有效地提高了工作效率,减轻了数据复核的工作量,提高了数据统计的精度。

同时本程序是根据排版后的文件和水位水文雨量测站一览表进行统计的,适用于所有不同的水系、参编单位和水雨情统计,具有较强的通用性。

如果在统计过程中发现有特殊的地方,可以对程序再进行补充完善,从这一点来说程序具有较强的可扩展性。

【相关文献】
[1]谢运山,谢海文,赵德友等.水文资料整编流量测验数据的检查[J].水文,2015(02):
61-64.
[2]赵德友,谢运山.利用VFP和CASS生成雨量等值线图方法综述[J].人民长江,2015(10):71-73.
[3]谢运山,傅太生,谢海文,等.VFP和CAD在流量定线中的应用[J].人民长江,2014(05):24-27.。

相关文档
最新文档