模型选择准则在洪水频率分析中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1研究背景
水利工程的规划、设计和运行经常依赖洪水频率分析,其为决策提供了统计基础[1]。洪水概率分布线型的选择是洪水频率计算的首要问题[2],线型的选择正确与否直接影响着设计值的精度。目前,我国《水利水电工程设计洪水计算规范》[3]规定:“频率曲线的线型一般应采用皮尔逊3型。特殊情况,经分析论证后也可采用其它线型。”虽然该线型能适应于我国大部分地区的资料,但仍有许多地区,它不能很好地适配资料[4]。水文频率曲线线型的选择,仍是频率分析中尚需研究的问题。洪水频率分析中,理论频率分布曲线线型的选择也就是频率分布模型的选择。频率分布模型的选择常见的方法有:目估经验定线法、拟合优度准则法、统计试验法。目估经验定线法受主观因素影响较大。李松仕[2]认为拟合优度准则法要受经验频率公式选用的影响,且采用这种准则,对于参数越多,弹性也越好的线型必然入选。统计试验法需要预先选定置信度,这给线型的选择带来一定的人为性。王艳君等[5]研究了AIC (Akaike Information Criterion )与BIC (Bayesian Information Criterion )在SR (Stock Recruitment )模型选择中的应用,结果表明,AIC 和BIC 在SR 模型选择中是有效的。刘攀等[6]认为贝叶斯模型综合能根据各线型的后验概率设置权重进行加权平均,以此减小线型选择的不确定性。李松仕[2]选用全国已审定工程的68个站点洪水资料系列,应用AIC 准则分析洪水频率分布线型的适应性。Giuliano Di Baldassarre 等[7]通过蒙特卡罗模拟实验,利用合成样本数据,通过大量的数值分析,将较少应用于水文的模型选择准则:AIC 、BIC 、ADC (AndersonDarling Criterion )用来进行洪水频率分析。分析结果表明:模型选择准则是减少设计洪水计算不确定性的有效工具。
本文以广东省珠江第二大水系北江流域的长坝、坪石、犁市、韶关4站以及韩江流域的溪口站和珠江三角洲的流溪河站的洪峰流量频率分析为背景,选用6种常用的频率分布线型(模型)进行分析计算,采用线性矩法估计出各模型的参数,分别用AIC 、AICc (Corrected Akaike Information )、BIC 和ADC 模型选择信息准则进行考虑历史洪水的频率分布模型的选择分析。
文章编号:0559-9350(2010)01-0080-06模型选择准则在洪水频率分析中的应用
舒晓娟1,2,陈洋波2,任启伟2
(1.广东水利电力职业技术学院,广东广州510635;2.中山大学地理科学与规划学院,广东广州510275)
摘要:以广东省北江流域的长坝、坪石、犁市、韶关4站以及韩江流域的溪口站和珠江三角洲的流溪河站的洪峰流量频率分析为背景,选用6种常用的频率分布线型(模型)进行分析计算,采用线性矩法估计出模型的参数,分别用较少用于水文的模型选择准则AIC 、AICc 、BIC 和ADC 进行考虑历史洪水的频率分布模型的选择。结果表明:4种不同模型选择准则对同一站的洪水洪峰流量频率分布线型的选择结果基本一致,与实际资料拟合较好。6站选择的最优线型虽然传统的皮尔逊3型比较多,但最多的是LN 型。关键词:历史洪水;频率分析;模型选择准则;线性矩法
中图分类号:P333.9文献标识码:A
收稿日期:2009-08-25
基金项目:国家自然科学基金资助项目(50479033)
作者简介:舒晓娟(1974-),女,湖北武穴人,讲师,博士生,主要从事水文水资源研究。E-mail :shuxj@
水
利学报SHUILI XUEBAO 2010年1月
第41卷第1期
2模型选择准则
最早的模型选择信息准则由著名统计学家Akaike [8-9]于1973年提出,AIC 准则则是目前常用的模型选择准则,在经济、交通、建筑等领域应用较多。AIC 信息准则基于最大熵原理,可检验出不同模型间差异显著性,且能综合权衡模型适用性和参数个数之间的关系,计算简单、客观。但AIC 值的大小受样本容量的影响较大,当样本容量相对模型参数的个数较小时,可通过Hurvich 等[10]提出的改进的AICc 准则来减少偏差。但AIC 信息准则在样本容量趋于无穷大时,由AIC 信息准则选择的模型不收敛于真实模型,它所含的未知参数通常比真实模型的要多[11]。为了克服AIC 信息准则理论的不足,Schwarz [12]于1978年提出BIC 信息准则。BIC 与AIC 相似,但BIC 基于Bayesian 理论,对增加的模
型参数加上更大的惩罚项。ADC 准则则基于Anderson-Darling 统计检验理论的应用,近年来由Laio 等
[13-14]提出。Calenda 等[15]研究后认为:对于小样本和不对称样本,ADC 与AIC 和BIC 的计算结果相似,当样本的不对称程度增加时,ADC 会表现得更好一些。当根据不同的样本资料估计模型参数时,ADC 在模型选择时,表现得更好。
应用以上信息准则进行模型选择时,可根据样本资料算出不同模型的AIC 值、AIC C 值、BIC 值、ADC 值,取得最小AIC 值、AIC C 值、BIC 值、ADC 值的模型为选用模型。AIC 值、AIC C 值、BIC 值、ADC 值的计算公式分别如下:
AIC =-2ln [L (D |θ)]+2m 式中:L (D |θ)是数据组D (x i ,i =1,n )的最大似然值;θ为模型参数的最大似然估计值;m 为模型参数
的个数。
AIC C =-2ln [L (D |θ)]+2m (n n -m -1),n /m <40BIC =-2ln [L (D |θ)]+ln (n )m
ADC =ìíîïïïï0.0403+0.116(ΔAD -ξβ)η0.861,1.2ξ ΔAD éëêêùûúú0.0403+0.116(0.2ξβ)η0.861(ΔAD -0.2ξξ),1.2ξ>ΔAD 其中:ΔAD =-n -1n åi =1n
{}
()2i -1ln éëùûG ()x i ,θ+()2n +1-2i ln éëùû1-G ()x i ,θ;G (x i ,θ)为累积频率分布函数;ξ、β和η可根据文献[14]的列表查到极端事件频率分析常用的7种频率分布模型的相应值。3
应用3.1计算资料以广东省北江流域的长坝、坪石、犁市、韶关4站以及韩江流域的溪口站和珠江三角洲的流溪河站的洪峰流量频率分析为背景。计算所选的6站洪峰流量资料情况如表1,表中所列的浈江发源于江西省信丰县石碣,在广东韶关与武江汇合后,始称北江。北江是珠江第二大水系,在思贤滘与西江相通并进入珠江三角洲。韩江流域是广东省第二大流域。
表1
6站计算资料站点
实测系列/年份
历史洪水/年份
所在流域长坝1953—20061915、1931浈江坪石1958—20061853、1915武江犁市1952—20061853、1915武江韶关1951—20061915、1931、1935北江溪口1951—20021842韩江流溪河1959—1998
1881、1925、1947珠江三角洲(1)
(2)
(3)(4)