资料同化方法的理论发展及应用综述
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分析增量通过其周围影响区域内观测增量的线性组合而加权, 观测权重与观测位置和格点之间的距离成
反 比 [ 3] 。 该 方 法 的 表 达 式 可 写 为 :
n
#w!i, j "$y !i "- xb !i "%
xa !j "=xb !j "+ i = 1
n
( 1)
#w!i, j "
i=1
式 中 , xb !i "为 插 值 到 观 测 点 i 上 的 背 景 场 信 息 ; y !i "为 相 应 的 观 测 值 ; xa !j "为 格 点 j 的 订 正 值 ; 权 函
最优插值法( 简称 OI) , 资料同化才有了基于统计估计理论的基础。从统计意义上来说, 它是一种均方差最
小的线性插值方法[9] 。相比逐步订正法而言, 这里最大的改进就是权重考虑了背景场和观测误差的统计特
征, 故又称之为统计插值法。这种方法在 20 世纪 80—90 年代的数值天气预报业务中得到了广泛应用。它
不断增多, 这就为资料同化带来了更多的机遇和挑战, 对它也提出了更高的要求。如何在客观分析中引入
这些非常规资料, 成为资料同化的研究热点。20 世纪 60 年代后期, Danard 等[11] 指出气象和海洋分析所面
临的问题, 就是如何同化不同来源的信息。随后有了变分方法, 资料同化就转化为一个求解表征分析场与
且在第一台电子数字计算机上进行计算, 成功地完成了第一次数值天气预报。随着计算机的发展, 20 世纪
40—50 年代, 人们逐渐发展了气象领域中的客观分析方法( 简称 OA) 。早期的 OA 方法较简单, 如 1949 年
Panofsky[4] 的多项式拟合方法, 就是用多项式展开去拟合包含数个分析格点的一小块分析区域的所有观测
过程中, 一个主要困难是如何合理设计背景场误差协方差矩阵 B 的模型, 不仅需要正确定义所有模型变量
之间的背景协方差, 而且要求各变量的误差合理, 因为这会决定在分析场中观测场和背景场的权重, 另外
背景误差协方差矩阵必须是正定的。
该方法有很多优点。首先, 不同 OI 中的局部分析, 3DVAR 进行的是三维空间的全局分析, 避免了分析
矩阵 K。它是通过迭代一个代价函数, 产生一个分析时刻的大气真实状态的最优估计, 通常目标泛函可表
示为:
J
!x
"=Jb
+Jo
=
1 2
!x-
xb
"T B-
1
!x-
xb
"+
1 2
#yo - H !x "$T !E+F
"- 1 %yo - H !x "&
( 3)
式中, x 为模式状态变量构成的分析变量; xb 为 x 的先验估计, 常称背景场向量; B 为背景误差协方差矩阵;
不是全局最优的问题; 其次, 观测算子可以是非线性的; 第三, 它可以将一些额外的项, 加到目标泛函里来
实现一些外部的弱约束, 如平衡项或平滑项; 第四, 计算中只需要求切线性算子及其伴随算子, 等等。正由
是通过简化算法给定最佳线性无偏估计方程中的权矩阵。其计算公式为:
xa =xb +K !y- H $xb %"
( 2)
式中, xa 为模型的分析场。xb 为模型的背景场。y 为观测向量。H 为观测算子。分析场的增益矩阵 K=BHT
( HBHT+O) - 1, 通 常 也 称 之 为 权 矩 阵 , 其 中 , B 为 背 景 误 差 协 方 差 矩 阵 ( xb- xt) , xt 为 真 实 的 模 型 状 态 变 量 ; O
(Fra Baidu bibliotek4)
式中, O 为观测误差协方差矩阵。
为了求式( 4) 的极小值, 一般利用目标函数的梯度信息, 其梯度为:
’J !x "=B- 1 !x- xb "- HTO- 1 %yo - H !x "&
( 5)
使得梯度为零的那个 x 就是所要求的 xa, 由于很难用解析的方法求得, 因此大多采用数值求解。 3DVAR 是在某一时刻进行的分析, 前一时刻的同化结果可作为后一时刻模式运行的初始场。在实现
要计算量相对较小。它的缺点是不能适用于观测算子较复杂的系统, 当对模型的不同部分采用不同的观测
数据集时, 会使分析场产生伪噪声, 并且无法确保大尺度与小尺度分析之间的一致[10] 。
2.3 变分法
·2·
Vol.30 NO.4
官元红 等 资料同化方法的理论发展及应用综述
2007 年第 4 期
随着观测技术和数值模式的发展, 观测系统不断完善, 观测资料的时空分布不断扩大, 类型和数目也
迭代求解方法, 形成了实际可操作的逐步订正法, 引入了背景场的概念, 解决了多项式拟合中的不连续问
题。但由函数表达式可以看出, 逐步订正法的权重函数仅仅依赖于测站到格点的距离, 而与测站的分布无
关, 从而采用这种方法得到的分析结果在统计意义上往往不是最优的。
2.2 最优插值法
以上介绍的方法都没有充分利用资料和模式的误差, 同时缺乏理论基础。直到 1963 年 Gandin 提出了
! " 2 2
数
w !i, j
"=max
0,
R - di, j
22
, 其中 di, j 为格点 i、j 之间的距离, R 是给定的影响半 径 ( 常 数 ) 。w( i, j) 随 距 离
R +di, j
增加而递减, 当观测点超出该给定的范围( di, j>R) 时, 权函数为 0, 即当观测点超过影响半径时, 该观测没有
为观测误差协方差矩阵( y- H $xt %) ; H 是 H 的微分; T 代表矩阵的转置; - 1 代表矩阵的逆。
对于最优插值法, 关键就是如何求 K。此方法的基本假设是, 对于一个模型变量, 在确定它的增量时,
只有几个观测值是重要的。如果在观测值的选择方面给出正确假设, 最优插值法就可以很简单地实施, 需
观测场及背景场之间偏差的目标函数的极小化问题。变分法的优点是进一步摆脱了观测量和分析量之间
存在线性关系的限制, 使得直接同化非常规资料成为可能, 同时也可以把模式作为一个强约束下进行求
解, 从而得到物理和动力上与模式协调的初始场。它包括三维变分和四维变分。
2.3.1 三维变分
三维变分( 简称 3DVAR) 不仅可以用来处理观测算子为非线性的情况, 而且也避 免 了 求 OI 中 的 增 益
点, 展开系数用最小二乘法确定。由于其分析是在小区域内进行的, 所以往往导致分析在拟合的各区域之
间不连续[5] 。
2.1 逐步订正法
1954 年, Gilchrist 等[6] 提出了理想的逐步订正法。其原理是从每一个观测中减去背景场得到观测增量,
通过分析观测增量得到分析增量, 然后将分析增量加到背景场上得到最终的分析场。每一个分析格点上的
( 1. 南 京 信 息 工 程 大 学 , 江 苏 南 京 210044; 2. 中 国 科 学 院 大 气 物 理 研 究 所 , 北 京 100029; 3. 江 西 省 气 象 台 , 江 西 南 昌 330046)
摘 要 : 简 单 介 绍 了 资 料 同 化 的 概 念 、功 能 及 分 类 , 回 顾 了 资 料 同 化 的 发 展 历 程 , 对 各 个 时 期 发 展 的 各 种 方 法 的 理 论 进 行 了 概 述 , 并 指 出 了 每 种 方 法 的 优 缺 点 及 应 用 进 展 。目 前 , 三 维 变 分 在 业 务 上 得 到 了 广 泛 的 应 用 和 推 广 , 随 着 研 究 的 深 入 和 计 算 机 水 平 的 不 断 提 高 , 四 维 变 分 和 集 合 Kalman 滤 波 在 将 来 业 务 预 报 中 有 广 泛 的 应 用 前景。 关键词: 资料同化, 三维变分, 四维变分, 集合卡尔曼滤波, 综述。 中 图 分 类 号 : P435 文 献 标 识 码 : A
权 重 , 对 分 析 不 产 生 影 响 ; 当 i、j 重 合 ( di, j=0) 时 , 权 函 数 为 1; 当 0<di, j<R 时 , 0<w( i, j) <1, 即 分 析 场 是 背 景
场和观测场加权平均的结果。
1955 年 Bergthorson 等[7] 证明了该方法是一种有效的方法。1959 年 Cressman[8] 在该方法的基础上采用
矩阵的转置; - 1 代表矩阵的逆。
变分问题就是求使式( 3) 取得极小时的大气分析状态的迭代解, 这个解代表了大气真实状态的一个最
大似然估计( 最小方差) 。
由于代表性误差的复杂性, 因此通常只考虑观测误差, 从而式( 3) 可改写为:
J
!x
"=
1 2
!x-
xb
"T B- 1
!x-
xb
"+
1 2
%yo - H !x "&T O- 1 %yo - H !x "&
0 引言
数值天气预报业务中, 为了得到精确的预报值, 准确的初值、合理的边值和完善的模式都是十分重要 的。近年来, 随着模式的不断发展完善, 对初始条件的精确性要求也日趋提高, 物理学家 Bjerknes[1] 曾把天 气预报归结为初值问题, 好的初始条件越来越被认为是整个数值预报领域的一个重要方面, 初始条件的精 确性直接影响着数值天气预报的成败。另外, 随着观测技术的发展, 全球天气观测系统的不断完善, 观测资 料的时空分布不断扩大, 类型和数目也不断增多, 资料同化作为一种资料分析方法, 如何有效地利用这些 资料为数值预报提供更多的信息, 是一个值得研究的问题。因此, 近年来, 在很多研究工作者的共同努力 下, 资料同化发展较快, 从早期没有理论基础的客观分析, 发展到如今基于统计估计和变分两种理论的分 析方法, 对产生再分析资料和提高预报的准确性等方面做出了很大贡献。文中回顾了资料同化的发展历 程, 对各个阶段发展的各种方法的特点进行了分析, 并做了简单对比, 旨在为人们根据所采用的模型、观测 资料的相对质量和可用的计算资源选择何种同化方法提供参考。
2 资料同化方法的发展
收稿日期: 2007- 08- 13. 基 金 项 目 : 南 京 信 息 工 程 大 学 科 研 基 金 项 目 ( 编 号 : Y521) . 第一作者简介: 官 元 红 ( 1978— ) , 女 , 讲 师 , 博 士 研 究 生 , 主 要 从 事 资 料 同 化 和 气 候 预 测 研 究.
第 30 卷第 4 期 2007 年 12 月
气象与减灾研究
METEOROLOGY AND DISASTER REDUCTION RESEARCH
文章编号: 1007- 9033( 2007) 04- 0001- 08
Vol.30 NO.4 De c .2007
资料同化方法的理论发展及应用综述
官元红 1, 2 , 周广庆 2 , 陆维松 1 , 陈建萍 3
1 资料同化的概念
在为数值天气预报模式提供准确、合理的初值问题上, 资料同化是一种行之有效的方法。它是由早期 气象学中的分析技术发展起来的 [2- 3] 。其基本含义是根据一定的优化标准和方法, 将不同空间、不同时间、 采用不同观测手段获得的观测数据与数学模型有机结合, 纳入统一的分析与预报系统, 建立模型与数据相 互协调的优化关系, 使分析结果的误差达到最小。
一 个 资 料 同 化 系 统 包 括 观 测 数 据 集 、动 力 模 型 和 数 据 同 化 方 案 三 部 分 。 以 模 式 的 一 种 初 估 状 态 、气 候 态或其他一些不重要的状态为初始场, 由模式得到的解常称之为背景场; 结合观测数据集, 通过同化过程 产生能够相对准确反映真实状态的一种最优估计, 称之为分析场。一般而言, 分析场是背景场和观测场的 加权平均, 其方差始终比观测场和背景场的方差小。
E 、F 分别代表观测误差和代表性误差, 代表性误差是一个观测算子在从模式空间向观测空间转换时产生
的不精确性的一种估计, 将观测算子近似为线性算子就可产生这种误差; H 是观测算子, 它将模式格点上
的分析变量通过空间插值和物理变换到观测空间与观测相当的量, 方便与观测量比较; yo 为观测值; T 代表
·1·
2007 年第 4 期
气象与减灾研究
Vol.30 NO.4
早在 1922 年, Richadson 就首次将同化的思想用于数值天气预报的主观分析中。他把观测资料手工插
值到网格点上, 作为数值预报的初始场。由于他预报中所采用的原始方程没有做任何滤波处理, 导致最后
预报以失败而告终。1950 年 Charney 等采用主观分析方法确定初值, 使用的预报方程是正压涡度方程, 并