马尔可夫链在天气预测中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
马尔可夫链在天气预测中的应用
龚海涛
(数学系,093班25号)
摘要:马尔可夫链是一种预测方法,模式先假设某一时间各种状态之间的转移概率是基于
当前状态的而与其他因素无关,然后利用这一转移概率来推测未来状态的分布情况。本文将利用马尔可夫链对鞍山市区天气状态进行探究,通过对鞍山市区从2010年2月7号到2012年2月6号共730天的天气历史经验数据进行马尔可夫链分析,得到鞍山市天气状况的稳定分布。
关键字:马尔可夫链;转移概率矩阵
一、引言
马尔可夫链模型(Markov Chain Model )是一种常用的概率模型也叫马尔可夫分析(Markov Chain Analysis),其原理为利用概率转移矩阵所进行的模拟分析。此模型为一动态模型,参数可随时间而变,故可以用来预测未来事物变化状态的趋势。
马尔可夫链的基本概念是在1907年由俄国数学家马尔可夫(Markov )从布朗运动(Brown motion )的研究中提出的,后经由Wiener 、Kolmogorve 、Feller 、Doeblin 及Lery 等人的研究整理而于1930到1940年代建立此模型(杨超然,1977)。
二、马尔可夫链的基本介绍
定义2.1(Markov 过程)随机过程{X n ,n=0,1,2,3,…}若它只取有限或可列个值E 0,E 1,E 2,…(我们用{0,1,2,…}来标记E 0,E 1,E 2,…,并称它们是过程的状态。{0,1,2,…}或其子集记为S ,称为过程的状态空间)对任意的n ≥0及状态i, j, i 0, i 1, … i n-1有
P{X n+1=j|X 0=i 0,X 1=i 1, …X n-1=i n-1,X n =i}=P{ X n+1=j|X n =i} (2.1)
式(2.1)刻画的Markov 链的特性称为Markov 性[1]。
Markov 链表示一个随机序列的条件概率只与最近的系统状态有关,而与先前系统状态无关,所以Markov 性也被称为无后效性[2]。Markov 性也可以用一句通俗的话来概括——已知现在,将来与过去无关。 定义2.2(转移概率)称式(2.1)中的条件概率P{ X n+1=j|X n =i}为Markov 链{X n ,n=0,1,2,3,…}的一步转移概率,简称转移概率[1]。
定义2.3(时齐马尔可夫链)当Markov 链的转移概率P{ X n+1=j|X n =i}只与状态i,j 有关,而与n 无关时,称Markov 链为时齐的,并记P ij = P{ X n+1=j|X n =i}(n ≥0)。
不管Markov 链的状态是否有限,我们都可以将P ij (i,j ∈S )排成一个矩阵的形式,令
()⎪⎪⎪⎪⎪⎪
⎪⎪⎭
⎫
⎝
⎛==
434241403332313023222120
1312111003020100ij P P P P P P P P P P P P P P P P P P P P P P (2.2)
定义2.4(转移概率矩阵)称式(2.2)为转移概率矩阵,容易看出P ij (i,j ∈S )有性质 (1)P ij ≥0,i,j ∈S (2)
∑i
ij
P
=1,S i ∈∀ (2.3)
定理2.1(Chapman-kolmogorov,C-K 方程)
P
)
n m (ij
+=
p
p )n (k j
S
k )m (ik
∑∈或P (m+n)=P (m)P (n) (2.4)
其中
P
m ij
= P { X n+m =j|X n =i}为m 步转移概率,
⎪⎭
⎫ ⎝⎛=p p
)
m (ij )
m (为m 步转移概率矩阵。 三、数据分析
因为今天的天气状况很显然与昨天有一定关系而与前天及更早前的关系不大,即天气具
有无后效性,所以我们就可以用马尔可夫模型来对未来天气进行模拟预报。而且这种预测也是很有意义的,因为有一句老话说“天有不测之风云”,所以如果我们能将未来的天气状况预测出来,那对我们的生产生活都很有帮助。当然了天气预报更科学而且也更准确,我做此文是想仅从历史经验数据出发来预测,因为两种预测方法迥然不同,所以我的预测与天气预报没有可比性。
1. 状态空间的类
天气有很多种状态,比如说晴、晴转多云、多云、小雨、中雨、大雨等等。为了简化研究我按降水与否以及日照或降水强度将天气状态简单分为以下四类,具体分类标准见表1:
表1:天气分类标准表
原始历史天气数据来自“天气风雨录”网站(/anshan/tianqi )。
一共录得从2010年2月7日到2012年2月6日共计730日的历史天气状况,根据上表的分类标准我们可以将原始数据转换成如表2
所示的天气状况数据。
表2 :2010年2月7日到2012年2月6日的天气状况表
2. 转移概率矩阵
根据表2所示的730日的天气状态数据,可得到729个天气转移情况数据,
对这些转移数据进行统计我们可以得到表3:
表3:天气转移情况统计表(单位:天数) 根据表3我们可以得到天气变化的一步转移概率矩阵P(1)
⎪⎪
⎪
⎪
⎪
⎭⎫
⎝⎛=255815.0348837.0069767.0325581.0060869.0234783.0252174.0452174.0093024.019186.0261628.0453488.0022556.0097744.0240602.0639098.0)1(P
根据C-K 方程(2.4)式我们有P(2)=P(1)*P(1)=P(1)2,所以有
⎪⎪
⎪⎪
⎪
⎭
⎫
⎝
⎛=100508.0216348
.0202404
.048074.006352.0168936.0238222.0529322.0070042.0172017.0242432.0525509.0048516.0139447.0242939.0569098.0)2(P 由P(2)矩阵我们可以看出当前的天气对后天的天气的影响已经很小,如今天“晴”后
天“晴”的概率为0.569098,而今天“大”后天“晴”的概率为0.48074,相差无几,这说