基于加权马尔可夫链的降水预测应用研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
! ! 服从自由度为 (m - 1 ) 2 的 x2 分布 , 其中 P ij 为转移概率 , 由 给定显 著性水平 , 查表可得分位点 x2 ( m - 1 ) 2 值 , 计算后 得统计量 x 2 值。 若 x 2 > x2 (m - 1 ) 2 , 则可认为序列 { x i } 符合马 尔可夫性 , 否则可认为该序列不可作为马尔可夫链来处理。
m
2 . 3! 指标值的样本均值 - 标准差分级法
对于指标值的分 级 , 传统的方法是应 用样本均值 与样本标 准差来 刻画指标值 的变化区 间 , 设指标值序 列为 x 1, x 2, %, xn , 样本均值为 x, 样本标准差为 s = 1 ( x - x ) 2。 如果这 n - 1 i= 1 i
n- k
2 . 2! 随机变量序列的马尔可夫性检验
随机序列是否具 有马尔可夫性 , 是应 用马尔可夫 链模型分 析和解决实际问 题的 必要 前提 [ 5] 。通 常离 散序 列的 马尔 可夫 链可用 x 2 统 计量来检验。 设 所讨论的指标值序列包含有 m 个可能的状态 , 用 f ij 表示 指 标值序列 x 1, x2, %, xn 中从状态 i经过 1步转移到 达状态 j的 频数 , i, j ∃ E。 将转移频数矩阵的第 j列之和除以各行各列的总 和所得的值称为边际 概率 , 记为 P* j, 有
( 2002AA 2Z4263) 。 ! 作者简介 : 冉景江 ( 1970 ), 男 , 重庆 人 , 博士 研究 生 , 主 要从 事水资源管理与水环 境保护研究 。
! 第 4 期 ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! 冉景江等 : 基于加权马尔可夫链的降水预测应用 研究 干时段的指标值的 状态进 行预 测 , 然后 , 按前 面各 年与该 年相 依关系的强弱进行 加权 求和 , 充分 合理 地利用 信息 进行预 测 , 这就是加权马尔可 夫链 预测 的基本 思想。传 统的 马尔可 夫链 预测方法与加权马尔 可夫链 预测方 法 [ 6] 都没 有对 指标值 序列 进行马尔可夫性检验 , 这是一个缺陷。本 研究提出的 加权马尔 可夫链预测方法弥补 了这个缺陷 , 具体方法如下 : ( 1) 计算指标值序列的均 值、 均方差 , 建立指标值的分级标 准 , 确定马尔可夫链的状态空间。可根据 资料序列的 长短及具 体问题的要求 进行。可 以样 本均方 差为 标准 [ 5~ 7] 也 可用 有序 聚类的方法建立分 级标准
[ 7]
33
总和所得的值称为转 移概率 , 记为 P ij , i, j ∃ E, 即有 P ij = ! ! f ij
∋
m
( 9) f ij
j= 1
实际上这是从状态 i 经过 一步 转移 到达 状态 j 的转 移频
率。 由频率的稳定性知道 , 当式 ( 9) 的分母 充分大时 , 转 移频率 近似于转移概率 , 它可以 用来 估计转 移概 率。 因此 我们就 转移 概率的记号 P ij 来表示转 移频 率 , 并称之 为转 移概 率。 于是 , 应 用中一步转移概率矩 阵可表示为 P = (P ij ) ! ! ! i , j∃ E ( 10 )
∋w P
i= 1 k
( k) i
! ! ! i∃ E
( 8)
m ax( P i , i ∃ E ) 所对 应的状 态即 为该时 段指 标值的 预测
∋
n
状态。 待该时段的指标值确定后 , 将其加入到原 始序列中 , 再重 复步骤 ( 1 ) ~ ( 7 ), 可进行下 一时段指标值状态的预测。
是 一个弱相关 (相关系数的绝对值 ( 0. 2 ) 序列 , 则可以看做是 独立同分布的序列。 由中心极限定理知 : P { x - 1 . 5s ( x < x + 1. 5 s} ) 2 ( 1. 5 ) - 1 = 0. 87; P { x - s( x < x + s } ) 2 ( 1. 0 ) - 1 = 0. 68 。 于是 , 可按 指标是 否落 在 ( - ∗ , x - 1. 0s ), ( x 1. 0s, x - 0 . 5 s) , ( x - 0. 5 s , x + 0. 5 s), ( x + 0. 5s, x + 1. 0s ), ( x + 1. 0s, + ∗ ) 内 , 把指标值分成 5 组。 利用 这种方 法对指 标值进 行分类 , 不考虑物理成因 对指 标值的 影响 , 仅 仅从 统计的 角度 简单地把样本均 值作 为 指标 值的 中 心 , 这 种 方法 操作 较 为方 便 , 因此应用也较广泛。
时间需要计算到的最 大阶数 )。 应的各阶转 移概 率矩 阵即 可预 测出 该时 段的 状态 概率 P (i k ) , i ∃ E, k 为滞时 (步长 ) , k = 1, 2, %, m。 ( 7 ) 将同一 状态的 各预测 概率加权 和作为 指标值 处于该 状态的预测概率 , 即 Pi = ! !
水文
泥沙
基于加权马尔可夫链的降水预测应用研究
冉景江 , 赵燮京 , 梁 ! 川
1 , 2 1 2
( 1. 农业部 长江上游农业资源与环境重点开放实验室 , 四川 成 都 610066; 2. 四川大学 水电学院 , 四川 成都 610065)
摘 ! 要 : 介绍了加权马尔可夫链的预测方法与模型 , 以川中丘 陵区简 阳市为 例 , 根 据 1974~ 2003 年 的降水 量资料 , 采用 均值 - 方差法对年降水量进行了 状态分级 , 应用加权马尔可夫链对该地区的旱涝状态 进行预测和分析。结果表明 : 该方 法客观、 准确、 可靠、 简便 , 为区域降水的中 短期预测提供了新的解决途径。 关 ! 键 ! 词 : 加权马尔可夫链 ; 降水量 ; 预测 中图分类号 : TV 125! ! ! 文献标识码 : A! ! ! 文章编号 : 1000 1379( 2006) 04 0032 03 ! ! M a rkov 过程是研究某一事 件的状 态及状 态之 间转移 规律 的随机过程 , 它的基本特征是 ∀ 无后效性 # 即状态转移概率仅与 转移出发状态、 转移步数、 转移 后状态有关 , 而与转移 前的初始 时刻无关。马尔可 夫链 是时 间和状 态都 离散 的 M arkov 过 程。 其分析是一种以概率 论和随机过程理论为基 础 , 应用 数学模型 来分析客观对象发展 变化过程中的数理关系 的一种统计 方法 , 其通过把事物不同阶 段联系起来分析其变化 的规律 , 实质属于 动态分析法。我们把 具有 离散的 状态 和时间 序列 的某一 个过 程 可视为马尔可夫链 , 根据 n 时刻的状态就可以预测 n + 1时刻 的状态 , 这就是应用马尔可夫链模型解决各种预测 问题的基本 思想。以川中丘陵区多年降水情况为例 , 介绍使用 加权 M a rkov cha in 模型进行预测的步骤和方法。 态 j 的概率 , 此时转 移概率 与初始 时刻无 关 , k 取 1 时 , P ij 记为 P ij ( 1) 。 齐次 M a rkov链完全由其初始分布 { P 0 ( i0 ), i0 ∃ E } 及其一 步状态转移概率矩阵 P = (P ij ), i, j ∃ E 所决定。 若已知时刻 n的绝 对分布 P (n ) = {Pn ( j), j ∃ E }, 则时刻 n + 1 的绝对分布为 P ( n + 1 ) = P ( n) ! P =
将指标 进行 分级。确 定马尔 可夫
链的状态空间 E = { 1 , 2 , % , m }。 ( 2) 按所建立的 分级标准 , 确 定资料序 列各时 段指标 值所 对应的状态。 ( 3) 对所得结果 进行统计 , 可 得到不同 步长马 尔可夫 链的 转移概率矩阵 , 它决定了指标值状态转移过程的概率法则。 ( 4) 马尔可夫性 检验。 ( 5) 计算各阶自 相关系 数 rk , k ∃ E ( E 为 所研 究序列 的状 态空间 )。
1! 马尔可夫链与加权马尔可夫链
1 . 1! 马尔可夫链的定义及性质
马尔可夫链的数 学表述 : 定义 1: 设有离散的随机变量 过程 {X n , n ∃ N, N = 0, 1, 2, % } , X n 的所有可能取值的全体 称为 {X n } 的状 态空 间 , 记为 E = { x1 , x2 , % } 。 若对 任意的 正整数 n 及任 意的 x i, ( xi1 , x i2, %, x in , xin+ 1 ) ∃ E, 只要 : P (X 1 = xi1 , X 2 = xi 2, %, X n = xim ) > 0 P (X n+ 1 = xin+ 1 | X n = x in ) 则称 { X n } 为 M arkov链
m
∋∋
m ij
( 11 ) f ij
i= 1 j = 1
当 n 充分大时 , 统计量 x2 = 2
∋
| rk |
( 7) 式 ( 9 ) 定义。
∋ ∋f
i= 1 j = 1
m
log
Pij P* j
( 12 )
k= 1
将 w k 作为各种滞时 (步 长 ) 的马尔可夫链的权重 ( m 为按 ( 6 ) 分别以前面若干时段的指标值为 初始状态 , 结 合其相
∋P
i∃ E
n
( i) P ij
( 5)
1 . 2! 加权马而可夫链预测
对于一列相依的 随机变量 , 用步长为 1 的马尔可 夫链模型 和初始分布推算出未 来时段的绝对分布来做预测分 析 [ 2] , 可称 之为基于绝对分布的 马尔可夫链预测方法。对于利用各 阶 ( 多 步长 ) 马尔可夫链求得的 绝对分 布叠加 来做预 测分析 [ 5] , 可称 之为叠加 马尔 可 夫 链预 测 法。对 于 这两 种 M arkov 链 预 测方 法 , 其各自都存在一定 的局限 性 , 对于 基于绝 对分 布的马 尔可 夫链预测方法 , 默 认所 论的 马尔 可夫 链满 足 ∀ 齐次 性 # 缺 乏依 据 , 事实上 , 应用中所论及的随 机变量序列 , 尽管满足 马尔可夫 性 , 但 ∀ 齐次性 # 一般都不满足。另外该法没有考虑到对应各阶 ( 各种步长 ) 马尔可夫链的绝对分布在预测中所起的作用 , 因此 没有能充分利用已 知数 据资 料的信 息。而对 于叠 加马尔 可夫 链预测方法 , 尽管应用了各阶 ( 各种步长 ) 马尔可夫链的绝对分 布叠加来预测状态 , 但没有考虑到各阶马 尔可夫链对 应的绝对 概率在叠加中所起的 作用 , 即认为各阶马 尔可夫链的 绝对概率 所起的作用是相同 的 , 这显然 是不 科学的 , 事 实上 满足马 尔可 夫性的相依时间序列 , 其各阶自相关性是不一致的。 一列相依的随机 变量 , 其各阶自相关 系数刻画了 各种滞时 的状态间的相关关系 的强弱。因此 , 可考虑先分别依其前面若 ! 收稿日期 : 2005 12 21 ! 基金项目 : 国家 ∀ 863# 课题 ∀ 高效 节水灌 溉体系 的优化配 置 #
第 28卷第 4期 ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! 人 ! 民 ! 黄 ! 河 ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! V ol. 28, N o. 4 ! ! 2006 年 4月 ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! Y ELLOW ! R I VER! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! A pr . , 2006! !
m
rk =
∋
( x l - x ) ( xl+ k - x ) /
l= 1
∋
n
( xl - x ) 2
( 6) P* ! !
j
∋f
=
m i= 1 m
ij
l= 1
式中 : rk 为第 k 阶滞时的自相关系数 ; x l 为第 l 时段的指标值 ; x 为指标均值 ; n 为指标序列的长度。 对各阶自相关系 数规范化 , 即 w k = | rk | / ! !
[ 1~ பைடு நூலகம்]
[ 1]
( 1) ( 2)
有 : ! P (X n+ 1 = xin+ 1 | X 1 = x i1, X 2 = x i2, %, X n = x in ) = ! 。 ( 3)
定义 2 : 若 {X n } 为 M arkov链, 对任意的 x i, xj ∃ E;m & n , 总有 : P (X n+ 1 = xj | X n = xi ) = P (X m+ 1 = x j | Xm = x i ) 则 称 {X n } 为齐次的 M arkov链。 对齐次的 M arkov链 , 有对任意 的 m, k ∃ T , 有 : P ij (m; k) = p ij ( k) ! ! ! i , j∃ E ( 4) 式中 : P ij ( m; k ) 为系统在 m 时刻处在状态 i, 经 k 步状态转移到 达状态 j的概率 ; P ij ( k ) 为系统从状态 i , 经 k步状态转移到达状