大样本降水空间插值研究_以2009年中国年降水为例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第30卷第7期2011年07月
地理科学进展
PROGRESS IN GEOGRAPHY
V ol.30,No.7July,2011
收稿日期:2010-08;修订日期:2010-12.基金项目:国家科技支撑计划课题(2008BAH31B01);科技部科技基础性工作专项(2008FY110300-01)。作者简介:曾红伟(1982-),男,湖南衡阳人,博士研究生,主要从事水文遥感与水文模拟研究。E-mail:zenghw.09b@ 通讯作者:李丽娟(1961-),女,吉林省吉林市人,博士,研究员,主要从事土地利用变化的水文响应和流域生态需水。
E-mail:lilj@
811-818页
大样本降水空间插值研究
——以2009年中国年降水为例曾红伟1,2,李丽娟1,张永萱3,柳玉梅1,2
(1.中国科学院地理科学与资源研究所,北京100101;2.中国科学院研究生院,北京100049;
3.北京师范大学地理学与遥感科学学院,北京100875)
摘要:以2009年全国2203个气象台站累积降水数据为例,采取逐步抽稀方法,定量分析大样本的数据样本量、样本空间分布、以及不同空间插值方法对插值结果的影响。研究表明:①在随机抽样中,总体而言,平均绝对误差(MAE)、均方根误差(RMSE)随着插值样本量的减小而增加、相关系数递减,特别当抽样比<20%时,MAE 、RMSE 显著增加,R 2显著减少;②以Thiessen 多边形剖分的方式检验随机抽样、等间隔抽样、分区单站点控制面积约束抽样分布的均匀性,经交叉验证后知,样本空间分布对降水空间插值的结果影响比较复杂,并非越均匀越好;③对随机组中抽样比 4%的数据和等间隔组,采用Kriging 方法插值,插值结果优于IDW 方法。以等间隔分布的(50%,50%)、(20%,80%)数据为例,采用IDW 、Kriging 方法,得到2009年全国降水空间分布图,降水空间分布规律与中国2009年实际降水量分布吻合。
关键词:大样本量;样本空间分布;空间插值方法;Thiessen 多边形;中国
1引言
降水是气象、水文模拟最重要的信息之一,也是水文模型重要的驱动变量[1]。空间化的降雨信息对于区域水文、水资源分析以及区域水资源管理、旱涝灾害管理、生态环境治理都有重要意义[2]。
站点观测、卫星遥感反演、气象模型模拟是获取降水数据的主要方式[3-4]。站点观测连续性强,精度较高、空间覆盖性较差;卫星遥感反演连续性较差,空间覆盖性较高[5];气象模型模拟的降水数据在中、高纬度具有相对较高精度,而在低纬地区精度较差[4]。准确的降水空间分布数据,理论上可以由高密度的站点数量来采集[2],因此以观测站降水数据为基础,利用空间插值技术是获取降水空间分布的重要手段。
相比其他气象要素,降水在空间、时间尺度上具有更强的不确定性,其空间插值具有更大的困难[1,6-7]。目前,用于降水插值的方法较多[8-9],比较典型的有泰森多边形法、反距离权重法、趋势面法、克里格法[10-11]等,较好的插值结果,通常需要对
降水数据、插值算法参数的选取进行优化[12-16]。
目前,全国共有2419个气象台站(中国气象科学数据共享服务网),以2009年全国降水空间分布为例,要获取所有台站全年逐日气象观测数据需要较大的费用支出,因此,在全国尺度上,要获取较好的空间插值结果,需要多少个气象台站参与插值;相同样本条件下,降水台站应满足何种空间分布,采用何种插值方法,是一个值得研究的问题。本文以2009年全国2203个气象台站(不包括台湾地区)逐日降水数据为基础,采取逐步抽稀方法,定量分析大样本数据条件下,降水空间插值所需样本量、空间分布、空间插值方法对插值结果的影响。
2数据与方法
2.1数据来源、处理
从中国气象科学数据共享服务网(/index.jsp)下载2009年全国逐日、空间分辨率为0.25°×0.25°的364天(2009-12-9数据缺失)的
地理科学进展30卷
降水栅格数据(asc 格式)。
采用Java 语言编写ArcEngine 二次开发程序程序,将364天的asc 格式数据转换成grid 格式数据,设置数据地理坐标为GCS_WGS_84,采用批处理方式将364天的降水栅格数据相加,得到全国2009年累积降水总量(图1a)。
在ArcMap 平台下,利用Extract Values To Points 分析功能,以全年累积降水栅格数据为基础,提取全国(不包含台湾地区)2203个气象台站(图1b)全年累积降水数据。由于栅格数据来自专业权威网站,因此,本文认为提取的台站降水数据准确度可靠,提取的各站点全年累积降水站点数据与实测数据误差很小,可以作为实测数据进行插值分析。2.2研究方法
本文主要分析气象台站数量、空间分布及空间插值方法对插值结果的影响,研究方法如下:
(1)气象台站数量对插值结果的影响2203个气象台站,属于大样本数据,样本量越大,获取数据难度越大,花费的时间和经费越多,插值复杂性越高,反之亦然。为探讨中国区域降水空间插值所必需的气象站点数量,采用随机抽样法提取90%、80%、70%、60%、50%、40%、30%、20%、10%、5%、4%的气象台站进行插值,由于后续需要进行不同插值方法的比较,而采用Kriging 方法,样本量最好大于80个[17],故最少抽取到4%(88个站点)站点。此步骤的插值方法统一采用IDW(Inverse Distance Weight)方法,以插值点和样本点间的距离为权重进行加权平均,其计算公式如下:
Z =(∑
i =1n
z i
d p
i )/∑i =1n
1d p
i
(1)
式中:Z 为估算值;z i 为第i 个样点的观测值;d i 为插值点到第i 个点的距离;
n 为参与插值的样点的数目;p 为用于计算距离权重的冥系数。通常,p 值取RMSE 最小值时的p 值。
(2)气象站空间分布对插值结果的影响
中国气象台站基本按照县级行政单元进行布设,即每个县一个气象台站,而不同县之间面积差异较大,导致气象台站在空间上分布极不均匀,总体上东部、东南部地区气象台站比较稠密,而西北、青藏高原及一些偏远山区气象台站比较稀疏,在样本量相同的情况下,气象站点空间分布的差异将产生不同的插值结果。为定量说明气象台站的空间分布对插值结果的影响,以年降水数据为例,利用IDW 插值方法,对随机抽样、等间隔抽样、分区站点控制面积约束抽样3种方式下,插值结果进行了比较。
(3)不同插值方法对插值结果的影响目前插值方法多种多样,除前言所提到的插值方法外,还包括在气象要素上常用的薄盘样条法[18-19](TPS ,专用气象插值软件ANUSPLIN 自带的方法)。普遍的观点是没有适合每一个气象要素的最佳插值方法[20-21]。因此需要对不同的插值方法进行比较。在步骤(1)的IDW 插值基础上,对(1)和(2)方式处理完的数据组采用Kriging (公式2),Co-Kriging [22]两种方法进行插值,并比较IDW 和Kriging 插值结果的精度,并分析插值结果与实际降水量的差异。
图12009年降水(a)及气象台站(b)分布图
Fig.12009's precipitation(a)and meteorological stations(b)
750km
2009年降水量/mm
High :6115.3Low :3.2
750km
气象站
a.年降水分布
b.气象站分布
812