2010年5月苏北赛算法:马尔可夫链。适合很多题型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
马尔可夫链
在自然界与社会现象中,许多随机现象遵循下列演变规律,已知某个系统(或过程)在时刻0t t =所处的状态,与该系统(或过程)在时刻0t t >所处的状态与时刻0t t <所处的状态无关。例如,微分方程的初值问题描述的物理系统属于这类随机性现象。随机现象具有的这种特性称为无后效性(随机过程的无后效性),无后效性的直观含义:已知“现在”,“将来”和“过去”无关。
在贝努利过程(){}
,1X n n ≥中,设()X n 表示第n 次掷一颗骰子时出现的点数,易见,今后出现的点数与过去出现的点数无关。
在维纳过程(){}
,0X t t ≥中,设()X t 表示花粉在水面上作布朗运动时所处的位置,易见,已知花粉目前所处的位置,花粉将来的位置与过去的位置无关。
在泊松过程(){,0}N t t ≥中,设()N t 表示时间段[0,]t 内进入某商店的顾客数。易见,已知时间段0[0,]t 内进入商店的顾客数()0N t ,在时间段()0[0,]t t t >内进入商店的顾客数
()N t 等于()0N t 加上在时间段0(,]t t 内进入商店的顾客数()()0N t N t -,而与时刻0t 前进
入商店的顾客无关。 一、马尔可夫过程
定义:给定随机过程
(){},X t t T ∈。如果对任意正整数3n ≥,任意的
12,,1,,n i t t t t T i n <<<∈= ,任意的11,,,n x x S -∈ S 是()X t 的状态空间,总有
()()()1111|,n n n n P X x X t x X t x --≤==
()()
11|,n n n n n P X x X t x x R --=≤=∈ 则称(){}
,X t t T ∈为马尔可夫过程。
在这个定义中,如果把时刻1n t -看作“现在”,时刻n t 是“将来”,时刻12,,n t t - 是“过去”。马尔可夫过程要求:已知现在的状态()11n n X t x --=,过程将来的状态()n X t 与过程过去的状态()()1122,,n n X t x X t x --== 无关。这就体现了马尔可夫过程具有无后效性。通常也把无后效性称为马尔可夫性。
从概率论的观点看,马尔可夫过程要求,给定()()1111,,n n X t x X t x --== 时,()n X t 的条件分布仅与()11n n X t x --=有关,而与()()12,,n X t X t - 无关。
二、马尔可夫链及其转移概率
马尔可夫链是参数离散、状态离散的最简单的马尔可夫过程。在马尔可夫链
(){},X t t T ∈中,一般取参数空间{}0,1,2,T = 。马尔可夫链的状态空间E 的一般形式
是{}0,1,2,E = 。
1、马尔柯夫链定义:
一个随机序列{X(t), t=1,2,3,…}取值于正整数空间E ={0,1,2,……},或者为E 的子集, 如果有:()()()()
1111|,n n n n P X t x X t x X t x --===
()()()
11|n n n n P X t x X t x --=== x i ∈E ={0,1,2,……} ; i=1,2,…
则称为序列(){}
,X t t T ∈为马尔柯夫(Markov)链。这种序列具有马尔可夫性,也叫无后致性。注意:t 和i 均取整数。 2、马尔柯夫链的含义:
可以这样理解:序列(){}X t 的“将来”只与“现在”有关而与“过去”无关。 3、马尔柯夫链的状态:
马尔柯夫链序列(){
}
X t 中的某一个符号X(t i )的数值一定为E 中的某一个元素x i (或x j ),这时,称x I (或x j )为随机序列的一个状态Si 。 4、马尔柯夫链的一步转移概率
马尔柯夫(Markov)链的统计特性用条件概率(状态转移概率)来描述: 习惯上把转移概率记做
()()()()()()()()(1)
11|1|n n ij ij P X t x X t x P X t j X t i p t p t -+===+====
这称为马氏链的一步转移概率。为马尔柯夫链从状态i 变为状态j 的条件概率。 它满足:(概率的加法公式)
p ij (1)(t)≥0 i j ∈E
()1
ij j E
p t i E ∈=∈∑
5、马尔柯夫链的K 步转移概率:
其k 步转移概率为:为马尔柯夫链从状态i 经过k 步(k 个单位时间)后变为状态j 的条件概率:
()()()()()
|k ij P X t k j X t i p t +===
它满足:
p (k)ij (t)≥0 i j ∈E
()
()1k ij
j E
p
t i E ∈=∈∑
6、平稳马尔柯夫链的性质:
如果马尔柯夫链是平稳的,即与时刻无关,与t 无关,我们讨论的马尔柯夫链只是这种最简
单的情况。这种平稳马氏链称为齐次马氏链。由于这种齐次马尔柯夫链的转移概率与时间无关,因此去掉其时间变量t ,其中的一步转移概率为()
1ij ij p p =,k 步转移概率为()
k ij p ,n 步转移概率为()
n ij p 。
定义2:向量()
12,,,n u u u u = 称为概率向量,如果u 满足: 1
0,1,2,,1n
j i
i u j n
u
=≥==∑
定义3:若方阵P 的每行都为概率向量,则称此方阵为概率矩阵。
可以证明,如果矩阵A 和B 皆为概率矩阵,则,,k
k
AB A B 也都是概率矩阵(k 为正整数)
由所有一步转移概率组成的矩阵称为一步转移概率矩阵表示为:
11
12121
2221
2n n n n nn p p p p p p P p p p ⎛⎫ ⎪
⎪
= ⎪ ⎪⎝⎭
120.80.180.020.80.20.650.250.10.70.3001P P ⎛⎫⎛⎫ ⎪== ⎪
⎪⎝⎭
⎪⎝⎭
转移矩阵必为概率矩阵,且具有以下两个性质: 1)()
(
)
1k k P
P P -=
2) ()
k k P
P =
下面主要学习正则链和吸收链
1、正则链:这类马氏链的特点是,从任意状态出发经过有限次转移都能达到另外的任意状态,有如下定义.
定义4 一个有n 个状态的马氏链如果存在正整数N ,使从任意状态i 经过N 次转移都已大于零的概率到达状态(),1,2,,j i j n = ,则称为正则链。
正则链的判断方法:对于概率矩阵P ,若幂次方m
P 的所有元素皆为正数(指m
P 的每一元素大于零),则矩阵P 称为正规概率矩阵,此时马氏链称为正则链,或者称马氏链具有遍历性。
遍历性的直观含义:一个遍历的马尔可夫链经过相当长的时间后,它处于各个状态的概率趋于稳定,且概率稳定值与初始状态无关。在工程技术中,当马尔可夫链的极限概率分布存在时,它的遍历性表示一个系统经过相当长时间后趋于平衡状态,这时,系统处于各个状态的概率分布即不依赖于初始状态,也不在随时间的推移而改变。
设系统的极限分布(也是稳态分布)用行向量()013,,,,n πππππ=
来表示,一步转移概