气象中的统计方法总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国近20年来气象统计预报综述
中国近20年来气象统计预报综述
谢炯光曾琮
(广东省气象台)
摘要
近20年来,多元统计分析方法有了长足的进步,涌现出不少新方法、新技术。
本文着重介绍了近20年来气象统计预报在中国气象业务科研中的一些应用和发展,主要从多元统计分析意义上来选材。
关键词:多元分析、气象统计、预报。
一、前言
气象统计预报在中国气象业务预报和科研工作中占有重要的位置,特别是在模式统计释用及中长期预报业务中,统计预报更是扮演着一个重要的角色,多元分析中的回归分析、典型相关分析、EOF分析等更是气象预报和分析不可少缺的工具。
近20年来,气象统计预报在中国取得了长足的发展。
本文主要综述统计方法在气象预报业务中的各个方面的应用及其所取得的一些成绩。
二、多元统计分析在气象预报业务中的应用
1、回归分析
广东、江西、河北、辽宁等气象局[1]用0、1权重回归、逐步回归、多元回归等方法,得出晴雨MOS预报方程。
1978年曹鸿兴等、史久恩等[2]用逐步回归建立最高、最低气温预报方程。
新疆自治区气象台张家宝等[3]以预报员经验为基础,采用完全预报(Perfect Prog Method)方法,应用0、1权重回归建立了有无寒潮的预报。
上海气象台丁长根、黄家鑫[4]用逐步回归建立U、V和S(全风速)预报方程。
1965年W.F.Massy[5]提出的主成份回归、1970年Hoerl和Kennard[6]提出的岭估计(Ridge estimate)以及Webster等人[7]提出的特征根回归(Latent root regression, LRR)对在回归分析中出现复共线性(Multi-collinearity)有较好的处理。
冯耀煌[8]在预报集成中,应用了岭回归技术,李耀先[ 9]用岭回归作水稻产量年景预测。
魏松林[10]用特征根回归建立长春6-8月平均气温的特征根回归。
Furnialhe 和Wilson提出的穷尽所有回归的算法,比较彻底地解决了最优回归(即最优子集回归)的问题。
张万诚[11]用最优子集回归作低纬高原雨季开始预报。
在气象预报的实际工作中,常要考虑多个自变量(预报因子)与多个因变量(预报量)的关系。
中国数学家张尧庭[12]解决了这一问题的算法,徐一鸣等[13]用多预报量双重筛选逐步回归作台风路径预报,严华生等[14]用多因变量多自变量建立大气环流--区域水稻产量预报。
引入非线性回归是近年来发展的趋势。
冯耀煌等[15]、姜子俊等[16] 提出了一种选择非线性最优预报因子和建立非线性预报方程的方法,可用于长、中短期预报。
近年来由于数值预报模式的频繁更迭,使模式输出统计预报方法受到新的考验,黄嘉佑等[17]介绍了卡尔曼滤波在天气预报中的应用,刘春霞等[18]用此方法制作了广东省冬季的最低气温预报。
近年来,卡尔曼滤波技术在短期气候预测中也得到了应用[19]。
2、判别分析
广东省徐闻气象局[20]用二级判别做台风登陆地段的预报。
Fisher、Bayes以及逐步判别等虽然在气象实际中广泛应用,但严格地说,这些方法仅当变量为正态分布时才可应用,Logistic判别对变量的基本假设条件较宽,对未经正态检验的变量应用本方法是可行的,且可用于既有连续变量又有多值离散变量的情形。
吕纯濂等[21] 将Logistic判别引入中国气象界,并研究了二次Logistic判别[22]分析及逐步判别[23]
在气象中的应用。
3、相关分析
近20年来在气象统计中用得较多的主要有典型相关(CCA)分析和奇异值分解(SVD)方法。
CCA是提取两个气象场的最大线性相关摸态的方法。
朱盛明、祝浩敏[24]在数值预报的解释应用中用典型相关分析提取有物理意义的预报因子作预报方程。
陈嘉玲、谢炯光[25]用典型相关分析作中期冷空气预报。
黄嘉佑[26]用典型相关分析作副高的统计动力预报。
近年来发展了一种新的CCA改进方法,称为典型相关分析的BP(Barnert 和Preisendorfer)方法,在气象统计中也得到了应用[27]。
奇异值分解(SVD)也是提取两个场的最大线性相关摸态的方法,SVD方法可以变成是两个要素场关系的扩大EOF分析。
谢炯光等[28]用奇异值分解方法,求出了广东省前汛期(4-6月)西太平洋场海温与广东省降水场的6对奇异向量,来作汛期降水趋势预报。
江志红等[29]用SVD方法讨论了中国夏半年降水与北太平洋海温异常的关系。
4、气象场的分解及其应用
50年代中期由Loreng引入到大气科学研究中的主成份分析以及后来发展的扩展经验正交函数、复经验正交函数、旋转主分量分析、R型、Q型因子分析、对应分析、主震荡型(Principal Oscillation Parterns,PPOS)。
使气象研究及业务水平进入一个更高层次。
4.1 经验正交函数(EOF)分解
章基嘉等[30]应用经验正交函数对亚洲500hPa侯平均环流与我国侯平均气温之关系的时空结构进行分析。
用EOF逐年划分自然天气季节,张邦林、丑纪范[31]提出了一种时空综合的经验正交函数分析方法,多数的经验正交函数分解是在标量场上展开的,但风场也用经验正交函数展开,周紫东等[32]、王盘兴[33] ]讨论了气象向量场的经验正交函数展开方法及其应用。
4.2 主成份(主分量)分析及其因子分析
气象分析预报中,常要分析许多变量,而变量间往往互有影响,如何从多个变量中找出很少几个综合性的指标代替原来较多的指标,而且所找到的综合指标又能尽可能多地反映原来数据的信息,而且主成份之间又是相互独立的主成份分析。
何敏等[34]用主分量研究了欧亚地区大气环流年际振荡的时空分布特征,谢炯光[35]用主分量与非线性降维和相似综合作广东月降水量分布预报,陈创买等[36]提出一种气候场的主分量逐步回归预报模型,该模型将气候场的预报变成对气候场主分量的预报,并通过相关分析和逐步回归,求得气候场的主分量与各种不同的因子场的主分量因子之间的联系。
用于广东年降水的预报。
4.3 扩展经验正交函数(EEOF)
1982年Weare 和Nasstrom[37]提出的EEOF分解可以得到气象场空间分布结构,
也可以得到随时间变化空间分布结构的变化。
张先恭等[38]用EEOF做太平洋海表温度与中国降水准3.5年周期变化。
谢炯光[39]提出一种月、季降水预测的新方法,用EEOF分解得到的前期特征向量
场,来预测后期的降水场分布特征。
4.4复经验正交函数(CEOF)
Rasmusson和Barnetl提出的复经验正交函数(CEOF)[40]能表现出气象场的位相变化及空间传播特征。
黄嘉佑[41]使用复经验正交函数分析中国降水长期变化的准两年周期振动,魏凤英等[42]用CEOF分析了近百年中国东部旱涝的分布及其年际变化特征,符综斌等[43]曾将CEOF分析用于Elnino增暖的振幅和位相变化,毕幕莹[44]用CEOF分析研究了夏季西太平洋副高的振荡。
4.5 因子分析、旋转主因子分析(RPC)
将主成份分析向前推进一步,就是因子分析,因子分析又分R型分析和Q型分析两种,我们知道,由于主因子是通过原始变量的线性组合得到的,因而可以了解到其天气意义。
但哪一个主因子的天气意义更重要些,可通过因子荷载矩阵进行分析,一般来说因子荷载矩阵越简单越易解释。
为此,使每个因子的荷载平方按列向0或1两端分化。
使主因子在每个变量上的荷载趋近于1,而在其它变量上的荷载接近于0,这样,就更容易解释主因子的天气意义。
这种变换称为旋转主因子分析,一般分正交旋转与斜交旋转两种方式。
极大方差旋转是正交旋转,是气象预测、科研业务中最常用的旋转方法。
谢炯光等[45]用因子分析和旋转因子分析对西太平洋8个海区进行了分析,对头4个主因子的物理意义进行了初步的解释,进而用它建立了广东省各月降水与海温的预报方程。
黄嘉佑[46]用斜旋主分量分析了我国夏季气温及降水场(1951-1987年)的时空特征,王敬方等[47]用旋转主分量(RPC)方法,分析近40年来我国夏季温度变化的规律。
4.6 对应分析
对应分析是一种综合了R型及Q型因子分析特点的多元统计分析技术,黄嘉佑[48]、李麦村等[49]用该方法发现副高逐月变化曲线与赤道海温变化十分相似,谢炯光[50]用对应分析对4-6月逐月的连续变化进行分型,把各月的降水连续变化分为连升型、连降型、降后升型等四型,并利用回归分析作出各型的预报,在前汛期降水趋势和冬半年(1-3月)气温趋势的预测中收到了较好的效果。
4.7 主振荡型(POP)分析
主振荡型(POP)是Hasselmamm和Storch在20世纪80年代末提出来的[51]。
章基嘉等[52]对离散化场时间序列推导了主振荡型分析方法的两个导出量:主振荡型(POP)及其伴随相关型(ACP)。
通过热带太平洋SST矩平场时间序列POP及相应区域850hPa风场ACP的计算例子,给出了它们的实际算法。
5 聚类分析
郑祖光[53]在首先不能确定用几个因子和分成几类的情况下,提出用变K变N方案。
章基嘉等[54]应用K-均值聚类法对东亚各自然天气季节500hPa平均环流进行分型试验。
在聚类分析中多数的分类样品是相互独立的,分类时彼此是平等的,但在一些问题中,样品的分类是不能打破顺序的。
比如,对某一阶段气象要素数据进行分段以确定不同时段的气候特征。
这种分类,称为分割更为形象一些,Fisher提出了最优分割的算法,谢炯光等[55]利用最优分割,对中国T106数值预报输出产品的各种物理意义明确的预报因子进行最优二分割,挑选出晴雨及有无大于25毫米降水的预报因子,建立概率回归方法,做24-144小时的晴雨,大于25毫米降水的完全概率预报,在业务中收到较好效果。
最优二分割的进一步优化,产生了一种叫做AID的分割算法(Automatic Interaction Detection),利用AID方法,不但可以分类,还可以根据新的样品落区在哪一类作出预报。
AID具有解决一些非线性问题的能力。
谢炯光
等[56]据天气学实践选出47个与广东省台风、暴雨关系密切的预报因子,利用AID 方法,进行计算做出台风暴雨的短期预报。
6 谱分析
6.1 功率谱
李小泉等[57]利用谱分析研究500hPa环流指数的变化,谱分析也常常与其它方法相
结合应用于天气分析与预报中,黄嘉佑[58]在研究海温场与太平洋副热带高压之间
的关系时使用交叉谱发现,海温不单有明显的两年振动周期,而且这种振动存在于太
平洋地区的气压系统中,关系十分密切,它们之间的凝谱平方值高值0.65的临界值。
符淙斌[59]利用协谱与正交谱研究纬向和经向垂直环流强度之间的反相耦合振荡关系。
6.2 最大熵谱分析
在连续功率谱估计中,自相关函数估计与样本量大小有关,1967年Burg提出了一
种称之为“最大熵”谱估计的方法,具有分辨率高、适用于短序列等优点。
缪锦海[60]讨论了最大熵谱的优良特性和预报误差过滤下系数阶段的确定。
曹鸿兴等[61]讨论
了气象历史序列的最大熵谱分析。
魏凤英[62]用最大熵谱提取1952-1995年华北地区春季干旱指数序列的显著周期。
6.3 奇异谱分析(SSA)
奇异谱分析(Singular Spectrum Analysis)是从时间序列的动力重构出发与经验正
交函数(EOF)相结合的一种统计分析技术,特别适合用于大气的非线性振动。
吴洪宝[63]、、刘健文等[64]系统介绍了奇异谱的原理及其在气象中的应用。
谢炯光等[65]用SSA方法对登陆广东省的热带气旋的演变规律进行了分析,发现年登陆广东的热带气旋存在明显的8年,准3年的周期振荡,登陆珠江口以西的热带气旋,存在12年,准2年的振荡周期。
6.4 小波分析
小波分析是从傅立叶分析方法发展起来的并被认为是傅立叶分析方法的突破性进展。
戴新刚和丑纪范[66]用子波变换研究了长江和黄河流域径流的周期性问题,纪忠萍
等[67]用小波分析对广州近百年来气候变化的多时间尺度进行分析,纪忠萍等[68]
用小波变换分析广东省低温阴雨的年景趋势变化,着重分析了重低温阴雨年在小波
系数图中的分布特征,并根据分析结果对未来1-2年的低温阴雨年景进行了预测估计。
7 时间序列分析模型
在气象上用得较多的主要有自回归模型(AR)、滑动平均模型(MA)、自回归滑动平均模型(ARMA)、自回归求和滑动平均(ARIMA)模型。
气象要素的时间序列多数是属非线性变化的,上述的时间序列建模模型均为线性模型。
而时间序列分析中的
门限自回归模型(TAR)是一种非线性模型,它利用逐段线性化手段来处理非线性
系统。
由于门限的控制作用,保证了递推的稳定性。
门限自回归模型可以有效地描
述非线性振动现象,可以解释自然界各种类型的稳定循环。
丁裕国等[69]利用奇异
谱分析对Nino海区SSTA月际序列作短期气候预测试验,采用AR(P)模型,结果发现在SSA分析基础上的AR模型对ENSO海区的SST预报特别有效。
史久恩等[70]
用自激励门限自回归模型作SOI(南方涛动指数)的预报,其结果与线性AR模型相比较,结果表明非线性门限自回归模型拟合SOI数据,比线性模型更能有效地反映数据的内在规律。
8 多层递阶方法
1983年中国韩志刚教授[71]提出了建立在现代控制理论中“系统辨识”基础上的含时变参数的新型统计预测方法―多层递阶方法。
这种时间序列的新预报方法在气象预
报服务中取得了较好的效果[72],不少学者在使用过程中对这种方法的应用方面作了进一步的改进,使其在气象预报应用上得到进一步的提高[73]。
9 均生函数模型
曹鸿兴、魏凤英等提出了时间序列的均值生成函数(Mean Generating Function, MGF,简称均生函数)模型。
均生函数预测模型既可以作多步预测,又可以较好地预测极值,为短期气候预测开辟了一条新的途径。
魏凤英、曹鸿兴[74] 在《长期预测的数学模型及其应用》与《现代气候统计诊断预测技术》两书中对均生函数模型的数学原理及其在气象中的应用作了详细的介绍。
10 灰色系统预测模型
“灰色系统”理论,是我国学者邓聚龙教授提出的新型理论。
到目前为止,人们对天气(气候)系统的演变规律、发生、发展、消亡机制,子系统间的相互作用的了解尚不清楚、不充分,限制了动力和统计方法对天气(气候)系统的深入研究。
天气气候系统,由于其复杂性,是一个典型的部分信息已知和部分信息未知的灰色系统。
因此,邓聚龙教授提出的灰色系统理论为气象预测和分析研究提供了一个有力的工具。
曹鸿兴、翁文洁等人对灰色分析与预测及其在气象中的应用作了推广[75],邓聚龙[76]在“灰色预测与决策”一书中对灰色系统的理论的来龙去脉,具体计算方法作了详细的介绍,并把GM(1,1)模型、灾变预测、季节灾变预测、拓扑预测等方法在气象中的实际应用作了介绍。
谢定升等[77]根据GM(1,1)模型的方法原理,作降水峰日的中期预报。
11 车贝雪夫多项式展开
经典车贝雪夫多项式展开只适用于矩形网格,周家斌将车贝雪夫展开推广到不规则格点上,并将其用于气象要素的分布预报[78]。
周家斌提出了一种用车贝雪夫多项式做时间序列预报的迭代算法,这是一个非线性、非参数方法,无需对序列作平稳或其它假定。
它的拟合和实际预报效果较好[79]。
12 神经网络原理在气象中的应用
近年来神经网络在气象中的应用快速发展。
周曾奎等[80]利用神经BP网络模型输出判断台风移向趋势-西进、北上、西北移。
于波等[81]结合模糊判断技术利用多层神经网络对GMS云图的台风云系进行图像识别。
谢炯光等[82]利用神经BP网络进行月雨量集成预报试验,金龙等[83]提出了小波变换与神经网络相结合的多步预测模型。
13 非线性动力学
林振山[84]首先提出了诺干相空间预报模型,并提出将相空间模处理组合法用于业务预报中。
周家斌[85]提出了相空间向量相似方法,相轨迹变率方法,空间变换方法和相空间模方法等4种以混沌理论为基础的预报方法,这些方法已经用于南方涛动强度、北京降水和华北降水分布的预报。
14 分形
近年分形的思路和方法正逐步在气象分析和业务中得到应用。
刘式达等[86]指出分数维是气候系统结构的特征,是气候系统中尺度变换后的不变数。
付昱华[87]应用分形分布模型N=C/rD的推广形式,即连续变维分形(分维数D是r的连续函数,而不是常量)预测台风路径。
三、结束语
近20年来统计气象学在中国取得了长足的发展,统计预报在中国气象业务预报和科研中占有重要的位置。
主要表现在:
1 在数值预报产品统计释用中,统计预报方法发挥了积极的作用。
2 随着计算技术和计算机的发展,以场分析和场相关的统计预报方法如SVD、EEOF、CCA分析等方法得以在业务上得到了广泛应用,对提高业务预报精确率帮助很大。
3 一些新的统计方法由于种种原因,用在气候分析中较多,用在业务预测上较少,有待今后进一步开发。
4 近年来国内外一些数学界的研究新成果,如自记忆方程、主振荡模、混沌分形、小波分析等引入到气象界的速度很快,如何使其在天气预测中更快、更好地发挥作用值得研究。
5 在统计预报的使用中,如何发挥统计预报的长处,避免其不足的地方,要继续研究。