随机过程 第五章 连续时间的马尔可夫链

合集下载

第五章 连续时间马尔可夫链-随机过程

第五章 连续时间马尔可夫链-随机过程

二、连续时间马尔可夫链的状态逗留时间和转移速率 命题 以 i 记过程在转移到另一状态之前停留在状态 i 的时 间,则对一切 s,t0 有 P{ i t s | i s} P{ i t } ,因此, 随机变量 i 是无记忆的必有指数分布,其参数设为 v i
证明: P{ i t s | i s}
P{T1 t } 1 e t
P{T1 T2 t } P{T1 T2 t | T1 x } e t dx
0 t
= (1 e 2 ( t x ) ) e x dx (1 e t )2
0
t
P{T1 T2 T3 t } P{T1 T2 T3 t | T1 T2 x }dFT1 T2 ( x )
i 1 n
其中 f 是密度函数(5.3.2)
e (t x) ,0 x t f ( x) 1 et 0, 其它
但因为(5.3.1)是 n 个密度为 f 的随机变量的子样 Y1,Y2,, Yn 的顺序统计量 Y(1),Y(2),, Y(n)的联合密度函数。于是得 命题 5.3.1 一个尤尔过程,其 X(0)=1,则给定 X(t)=n+1 时,出生时刻 S1,S2,, Sn 的分布如同取自密度为(5.3.2)的母体的容量为 n 的子 样 Y1,Y2,, Yn 的顺序统计量 Y(1),Y(2),, Y(n)的分布。
0 1 2 3
…Байду номын сангаас
n
n

2
3
… (n 1)
若对一切 n, n 0 (即若死亡是不可能的),则生灭过程称为纯 生过程,i 个个体开始的纯生过程,生长率为 n , n i 。

随机过程Ch5-连续时间的马尔可夫链

随机过程Ch5-连续时间的马尔可夫链

推论:对有限齐次马尔可夫过程,有
qii qij ji
称该马尔可夫过程为保守的。
证: pij (h) 1 1 pii (h) pij (h)
jI
ji
lim1
h0
pii (h) h
lim h0
ji
pij (h) h
qij
ji
即 qii qij 状态空间有限 ji
若状态空间为I 1,2,, N有限,
为的指数变量,而在回到状态0之前,它停留 在状态1的时间是参数为的指数变量。显然该
马氏链是一个齐次马氏链。
其状态转移概率为:
p01h p10 h
h h
0h 0h
由指数分布的无后效性得到。
理由如下:设正常工作为0状态,故障为1状态。
设器件寿命X服从参数为的指数分布。
f
x
ex
,
x0
0, x 0
则器件在0, t 正常工作,即寿命超过t的概率为: PX t exdx et
t
已知器件用了t小时,器件寿命超过t h,
即在t,t h器件不坏的概率为:
p00h PX t h / X t
PX
t h, X
PX t
t
PX PX
t h t
eth eh 1 h 0h
互通:i j i j,j i。 若所有状态都是互通的,则称此马尔可夫链 为不可约的。
定理5.7 设连续时间马尔可夫链是不可 约的,则有下列性质:
(1)若它是正常返的,则极限 lim t
pij (t)
存在
且等于j >0,jI。这里j 是
jq jj kqkj,
j 1
k j
jI
的唯一非负解,此时称{j >0,jI}是该

随机过程Ch5-连续时间的马尔科夫链

随机过程Ch5-连续时间的马尔科夫链

连续时间马尔可夫链I 马尔可夫链543210 1 2 3 4 5 T25.1 连续时间马尔可夫链定义5.1 设随机过程{X(t),t 0},状态空间I={0,1,2,},若对任意0t1<t2<<t n+1 及非负整数i1,i2, ,i n+1 I,有P{X(t n+1)=i n+1|X(t1)=i1, X(t2)=i2,, X(t n)=i n}=P{X(t n+1)=i n+1|X(t n)=i n},则称{X(t),t 0}为连续时间马尔可夫链。

转移概率:在s时刻处于状态i,经过时间t后转移到状态j的概率p ij(s,t)= P{X(s+t)=j|X(s)=i} 35.1 连续时间马尔可夫链定义5.2 齐次转移概率p ij(s,t)=p ij(t)(与起始时刻s无关,只与时间间隔t有关) •转移概率矩阵P(t)=(p ij(t)) ,i,j I,t 0,称为齐次马尔科夫过程性质:若i为过程在状态转移之前停留在状态i的时间,则对s, t0有P{ s t | s} P{ t}i(1)i i(2)i 服从指数分布45.1 连续时间马尔可夫链证(1) 事实上i i i its s+ti{ s} {X(u) i,0 u s | X(0) i} i{ s t} {X(u) i,0 u s,iX(v) i, s v s t | X(0) i}55.1 连续时间马尔可夫链P{ s t | s} P{X (u) i,0 u s,i iX (v) i,s v s t | X (u) i,0 u s} P{X (v) i,s v s t | X (u) i,0 u s}条件概率P{X (v) i,s v s t | X (s) i}马尔可夫性P{X (u) i,0 u t | X (0) i}齐次性P{ t}i65.1 连续时间马尔可夫链(2)设i的分布函数为F(x), (x0),则生存函数G(x)=1-F(x)P{ t} P{ s t | s }i i iP {isP { t,i s}Ps}iP { s t}t}P{ s}P {iiiG (s t) G(s)G (t)7 由此可推出G(x)为指数函数,G(x)=e -x,则F(x)=1-G(x)=1-e -x为指数分布函数。

连续时间马氏链

连续时间马氏链

X (n) i 有关,而与以前的状态 X(n 1 ) in1 ,…, X( 0 ) i0 无关。
一、连续时间马尔科夫链的有关定义及其性质
现在讨论时间连续状态离散的马尔可夫过程,取时间参数 t 0 ,状态空间 I={0,1,2,…} 定义 4.17 设随机过程 { X (t ), t 0} 的状态空间为 I={in,n0},若对任意的 0t1<t2<…<tn<tn+1,及 i1 , i2 ,
pij ( s,t ) P{ X (t s ) j | X ( s ) i }
它表示系统在 s 时刻处于状态 i,经过时间 t 后转移到状态 j 的转移概率。 若上述概率与 s 无关,则称连续时间马尔科夫链为齐次马尔科夫链,此时转移概率简 记为
pij ( s,t ) pij (t )
定义 4.16 设随机过程 { X(t),t T } ,其中时间 T={0,1,…},状态空间 I={0,1,2,…}, 若对任一时刻 n,以及任意状态 i0 ,i1, ,in1,i,j ,
1 2014 年 12 月 11 日星期四 大连海事大Байду номын сангаас数学系
第五章 连续时间马氏链
有 P{ X(n 1 ) j | X(n) i, X(n 1 ) in1 ,
定义 4.18 对于任一 t0,记
p j (t ) P{ X (t ) j }
p j p j (0) P{ X (0) j }, j I
分别称 { p j (t ), j I } 和 { p j , j I } 为齐次马氏链的绝对概率分布和初始概率分布。 性质 2:对任意 0 t0 t1 tn , i0 ,i1, ,in I ,有

第五章 连续时间马尔可夫链

第五章  连续时间马尔可夫链

的停留时间
i 超过x的概率为1,则称状态i为吸收状态. 随机过程讲义
第五章 连续时间的马尔可夫链
定理5.1 齐次马尔可夫过程的转移概率具有下列性:
(1) pij(t) 0; (2)
kI
p (t ) 1;
jI ij
(3) pij ( t s ) pik ( t ) pkj ( s ) 证 由概率的定义, (1)(2)显然成立, 下证(3).
ji
p ( t )
ijtຫໍສະໝຸດ qij .ji
说明 对状态空间无限的齐次马尔可夫过程, 一般只有
qii qij .
ji
随机过程讲义
第五章 连续时间的马尔可夫链
二、柯尔莫哥洛夫方程
问题:若连续时间齐次马尔可夫链具有有限状态空间为 I={0,1,2, ,n}, 则其转移速率可构成矩阵
iI iI
(4) p j ( t ) pi ( t ) pij ( );
iI
jI
pi pii1 ( t1 ) pi1i2 ( t 2 t1 )
, X ( t n ) in }
pin1in ( t n t n1 ).
随机过程讲义
第五章 连续时间的马尔可夫链
分布律
(n) pij 0,
转移方程
( n) ( l ) ( nl ) pij pik pkj k I

j I
(n) pij 1
时间 连续
1 , i j lim pij ( t ) t 0 0 , i j
pij ( t ) 0
p (t ) 1
j I ij
则对一切i,j及t 0, 有
( t ) qik pkj ( t ) qii pij ( t ) Qi Pj . pij

随机过程课件-c5

随机过程课件-c5
引理5.1 设齐次马尔可夫过程满足正则性条件,则对 于任意i,j∈I,pij(t)是t的一致连续函数。 转移概率的正则性条件:
⎧1 , i = j lim pij (t ) = ⎨ t →0 ⎩0 , i ≠ j
5 连续时间的马尔可夫链
12
转移速率
5 连续时间的马尔可夫链
13
Q矩阵
若连续时间齐次马尔可夫链具有有限状态空间I={0,1,2,…,n}
λ
λ
26
求其平稳分布。
pij(t)极限存在且与i无关,存在平稳分布
5 连续时间的马尔可夫链
27
或者
此Markov链是不可约的
5 连续时间的马尔可夫链
28
5 连续时间的马尔可夫链
29
5.3 生灭过程
5 连续时间的马尔可夫链
30
Q矩阵
I = {0,1,2,3,...}
⎛ − λ0 ⎜ ⎜ μ1 ⎜ Q=⎜ ⎜ ⎜ ⎜ ⎜ ⎝
⎛ − q00 ⎜ ⎜ q10 Q =⎜ ⎜ ⎜ q ⎝ n0 q01 − q11 qn1 q0 n ⎞ ⎟ q1n ⎟ ⎟ ⎟ − qnn ⎟ ⎠
Q= P′ (0)
利用Q可以推出任意时间间隔的转移概率所满足的方程组,从 而求解转移概率。
5 连续时间的马尔可夫链
14
微分方程
P′(t)=QP(t) 定理5.5 (科尔莫戈罗夫向前方程) 在适当的正则条件下有
5 连续时间的马尔可夫链
22
渐近性质
5 连续时间的马尔可夫链
23
5 连续时间的马尔可夫链
24
回顾
转移概率: pij(s,t)= P{X(s+t)=j|X(s)=i} P(s+t)=P(s)P(t) 转移速率 Q= P′ (0) 科尔莫戈罗夫微分方程 向后方程:P′(t)=QP(t) 向前方程:P′(t)=P(t)Q

随机过程第五章

随机过程第五章
对于任一t≥0,记
p j (t ) P{ X (tபைடு நூலகம்) j}, p j p j (0) P{ X (0) j}, jI
分别称{pj(t),j∈I}和{pj,j∈I}为齐次马尔可夫过程的绝对概率分布和初始概 率分布。 定理5.2 齐次马尔可夫过程的绝对概率及有限维概率分布具有下列性质: 1. 2. 3. 4.
例题:证明泊松过程为连续时间齐次马尔可夫链,并求其pij (t) 、qij 。 例题:一个城市划分成两个区域A和B,各区被指定一辆消防车1和2负责。 当接到报警电话时,不论其来自A区还是B区,只要有一辆消防车空闲就 会被服务;当两辆车都忙时,呼叫被拒绝。假设两区的报警电话都是泊松 分布(参数为λ j ,j=A,B,也用1,2表示 ),两辆车服务于不同区的时 间为独立的指数分布(参数为μ ij ,i=1,2 ,j=A,B ),则两辆消防车的 状态为连续时间齐次马尔可夫链。

定理5.6 齐次马尔可夫过程在t时刻处于状态j∈I的绝对概率pj(t)满足下列方程
pj (t ) p j (t )q jj
p (t)q
k k j
kj
定义5.4 设pij(t)为连续时间马尔可夫链的转移概率,若存在时刻t1和t2,使得
pij (t1 ) 0, p ji (t2 ) 0
p j (t ) 0
p
jI
j
(t ) 1
i ij
p j (t ) pj
p p (t ) (t ) p (t ) p
iI i iI
ij (
)
5.
P{X (t1 ) i1 ,, X (t n ) in }
p p
i iI
ii1 (t1 ) pi1i2

5--连续时间马尔可夫链--beamer

5--连续时间马尔可夫链--beamer
特别地, 当 ������������+1 − ������������ = ������ 时, 有
������ (������ (������) = ������, ������ (2������) = ������, · · · , ������ (������������) = ������|������ (0) = ������) = [������������������ (������)] .
(������ −������)!
当 ������
������,
⎩ 0, ������ = ������, ������ ̸= ������.
第五章: 连续时间马尔可夫链
当 ������ < ������,
其中 ������������������ 是马氏链.
������������������ (0) = ������������������
并且对于 ������ ������, 有
∞ ∞ ∑︁ ������������ (������) ∑︁ ������������ ������ −������ ������������������ = (������)������ ������������ (−1)������−������ ������! ������! ������=0 ∞ ∑︁
称矩阵 ������ = (������������������ (������))������,������ ∈������ 为马氏链的一步转移概率矩阵, 简称为转移矩阵.
韩参变量 (某某大学)
第五章: 连续时间马尔可夫链
3 / 61
连续时间马氏链的性质
1. ������������������ 是 ������ 函数, 即 ������������������ (0) = ������������������ = ⎧ ⎨ 1, ⎩ 0, ������ = ������, ������ ̸= ������.

随机过程第五章连续时间的马尔可夫链

随机过程第五章连续时间的马尔可夫链

第五章 连续时间的马尔可夫链5.1连续时间的马尔可夫链考虑取非负整数值的连续时间随机过程}.0),({≥t t X定义5.1 设随机过程}.0),({≥t t X ,状态空间}0,{≥=n i I n ,若对任意121...0+<<<≤n t t t 及I i i i n ∈+121,...,,有})(,...)(,)()({221111n n n n i t X i t X i t X i t X P ====++=})()({11n n n n i t X i t X P ==++ (5.1) 则称}.0),({≥t t X 为连续时间马尔可夫链.由定义知,连续时间马尔可夫链是具有马尔可夫性的随机过程,即过程在已知现在时刻n t 及一切过去时刻所处状态的条件下,将来时刻1+n t 的状态只依赖于现在状态而与过去无关.记(5.1)式条件概率一般形式为),(})()({t s p i s X j t s X P ij ===+ (5.2) 它表示系统在s 时刻处于状态i,经过时间t 后转移到状态j 的转移概率. 定义5.2 若(5.2)式的转移概率与s 无关,则称连续时间马尔可夫链具有平稳的或齐次的转移概率,此时转移概率简记为 ),(),(t p t s p ij ij =其转移概率矩阵简记为).0,,()),(()(≥∈=t I j i t p t P ij以下的讨论均假定我们所考虑的连续时间马尔可夫链都具有齐次转移概率.简称为齐次马尔可夫过程.假设在某时刻,比如说时刻0,马尔可夫链进入状态i,而且接下来的s 个单位时间单位中过程未离开状态i,(即未发生转移),问随后的t 个单位时间中过程仍不离开状态i 的概率是多少呢?由马尔可夫我们知道,过程在时刻s 处于状态i 条件下,在区间[s,s+t]中仍然处于i 的概率正是它处于i 至少t 个单位的无条件概率..若记i h 为记过程在转移到另一个状态之前停留在状态i 的时间,则对一切s,t 0≥有},{}{t h P s h t s h P i i i >=>+>可见,随机变量i h 具有无记忆性,因此i h 服从指数分布.由此可见,一个连续时间马尔可夫链,每当它进入状态i,具有如下性质: (1) 在转移到另一状态之前处于状态i 的时间服从参数为i v 的指数分布; (2) 当过程离开状态i 时,接着以概率ij p 进行状态j,1=∑≠ij ij p .上述性质也是我们构造连续时间马尔可夫链的一种方法.当∞=i v 时,称状态i 为瞬时状态,因为过程一旦进入此状态立即就离开.0=i v 时,称状态i 为吸收状态,因为过程一旦进入状态就永远不再离开了.尽管瞬时状态在理论上是可能的,但以后假设对一切i, ∞<≤i v 0.因此,实际上一个连续时间的马尔可夫链是一个这样的随机过程,它按照一个离散时间的马尔可夫链从一个状态转移到另一个状态,但在转移到下一个状态之前,它在各个状态停留的时间服从指数分布.此外在状态i 过程停留的时间与下一个到达的状态必须是相互独立的随机变量.因此下一个到达的状态依赖于i h ,那么过程处于状态i 已有多久的信息与一个状态的预报有关,这与马尔可夫性的假定相矛盾.定理5.1 齐次马尔可夫过程的转移概率具有下列性质: ;0)1(≥ij p (2);1=∑∈ij Ij p(3) ∑∈=+Ik kj ik ij s p t p s t p )()()(.其中(3)式即为连续时间齐次马尔可夫链的切普曼—柯尔哥洛夫方程.证明 只证(3).由全概率公式及马尔可夫性可得 ===+=+)})0()({)(i X j s t X P s t p ij =∑∈===+Ik i X k t X j s t X P })0()(,)({=})()({})0()({k t X j s t X P i X k t X P Ik ==+==∑∈∑∈=Ik kj ik s p t p )()(.对于转移概率)(t p ij ,一般还假定它满足: ⎩⎨⎧≠==→.,0,1)(lim 0j i ji t p ij t (5.3) 称(5.3)式为正则条件.正则条件说明,过程刚进入某状态不可能立即又跳跃到另一状态.这正好说明一个物理系统要在有限时间内发生限多次跳跃,从而消耗无穷多的能量这是不可能的.定义5.3 对于任 一0≥t 记 },)({)(j t X P t p j ==,},)0({)0(I j j X P p p j j ∈===分别称}{},),({,I j p I j t p j j ∈∈ 齐次马尔可夫过程的绝对概率分布和初始概率分布.定理5.2齐次马尔可夫过程的绝对概率及有限维概率分布具有下列性质: (1) ,0)(≥t p j (2),1)(=∑∈t p j Ij(3) )()(t p p t p ij Ii i j ∑∈=;(4) );()()(h p t p h t p ij Ii i j ∑∈=+(5)).()...(})(,...,)({112111211-∈--====-∑n n i i i i ii Ii i n n t t p t t p p p i t X i t X p n n例5.1试证明泊松过程}0),({≥t t X 为连续时间齐次马尔可夫链. 证明 先证泊松过程具有马尔可夫性,再证明齐次性.由泊松过程的定义 它是独立增量过程,且X(0)=0.11,...0+<<<n n t t t ,有})(,...,)()({1111n n n n i t X i t X i t X P ===++= ,.)0()()()({1111i X t X i i t X t X P n n n n =--==-++ =,111212)()(,...)()(---=--=-n n n n i i t X t X i i t X t X } = })()({11n n n n i i t X t X P -=-++ . 另一方面,因为})()({11n n n n i t X i t X P ==++=})0()()()({11n n n n n n i X t X i i t X t X P =--=-++ =})()({11n n n n i i t X t X P -=-++所以})(,...,)()({1111n n n n i t X i t X i t X P ===++=})()({11n n n n i t X i t X P ==++. 即泊松过程是一个连续时间马尔可夫过程.以下证明齐次性. 当i j ≥ 时,由泊松过程的定义})()({i s X j t s X P ==+= })()({i j s X t s X P -=-+=)!()(i j t eij t---λλ j<i.时,由于过程的增量只取非负整数,故,0),(=t s p ij 所以⎪⎩⎪⎨⎧<≥-==--i j ij i j t e t p t s p i j t ij ij ,0,)!()()(),(λλ, 即转移概率只与t 有关,泊松过程具有齐次性. 5.2柯尔莫哥洛夫微分方程对于连续时间齐次马尔可夫链转移概率)(t p ij 的求解一般比较复杂.下面首先讨论)(t p ij 的可微性及)(t p ij 满足的柯尔莫哥洛夫微分程.引理5.1 设齐次马尔可夫过程满足正则性条件(5.3),则对于任意固定的)(,,t p I j i ij ∈是t 的一致连续函数.证明 设h>0,由定理5.1得)()()()()(t p t p h p t p h t p ij rj Ir ir ij ij -=-+∑∈)()()()()(t p t p h p t p h p ij ij ii rj ir ir -+=∑≠=)()](1[)()(t p h p t p h p ij ii rj ir ir --=∑≠故有)],(1[)()](1[)()(h p t p h p t p h t p ii ij ii ij ij --≥--=-+ ),(1)()()()()(h p h p t p h p t p h t p ii ir ir rj ir ir ij ij -=≤≤-+∑∑≠≠因此).(1)()(h p t p h t p ii ij ij -≤-+对于h<0,同样有).(1)()(h p t p h t p ii ij ij --≤-+ 综上所述得到).(1)()(h p t p h t p ii ij ij -≤-+ 由正则性条件知,0)()(lim 0=-+→t p h t p ij ij h即)(t p ij 关于t 是一致连续的.以下我们恒设齐次马尔可夫过程满足正则性条件(5.3)式.定理5.3 设)(t p ij 是齐次马尔可夫过程的转移概率,则下列极限存在 (1);)(1lim 0∞≤==∆∆-→∆ii i ii t q v t t p (2).,)(lim 0j i q tt p ij ij t ≠∞<=∆∆→∆我们称ij q 为齐次马尔可夫过程从状态i 到状态j 的转移概率或跳跃强度.定理中的极限的概率意义为:在长为t ∆的时间区间内,过程从状态i 转移到另一其他状态的转移概率为)(1t p ii ∆-等于t q ii ∆加一个比t ∆高阶的无穷小量,而过程从状态i 转移到状态j 的转移概率为)(t p ij ∆等于t q ij ∆加一个比t ∆高阶的无穷小量. 推论 对有限齐次马尔可夫过程,有 ∞<=∑≠ij ij ii q q证明 由定理5.1 ,有)()(1,1)(t p t p t pij ij ii Ij ij∆=∆-=∆∑∑≠∈由于求和是在有限集中进行,故有.)(lim )(1lim 00∑∑≠≠→∆→∆=∆∆=∆∆-=ij ij ij i j t ii t ii q t t p t t p q (5.4)对于状态空间无限的齐次马尔可夫过程,一般只有 ∑≠≥ij ij ii q q .若连续时间齐次马尔可夫是具有有限状态空间I={0,1,2,…,n},则其转移速率构成以下形式的矩阵⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡---=nn n n n n q q q q q qq q q Q .....................11111000100 (5.5) 由(5.4)式知,Q 矩阵的每一行元素之和为0,对角线元素为负或0,其余.0,≥ij q 利用Q 矩阵可以推出任意时间间隔t 的转移概率所满足的方法组,从而可以求解转移概率.由切普曼---柯尔莫哥洛夫方程有 ),()()(t p h p h t p Ik kj ik ij ∑∈=+或等价地)()](1[)()()()(t p h p t p h p t p h t p ij ii kj ik ik ij ij --=-+∑≠两边除以h 后令0→h 取极限,应用定理5.3得到 )()()(lim )()(lim 00t p q t p hh p ht p h t p ij ii kj ik ik h ij ij h -=-+∑≠→→ (5.6) 假定在(5.6)式的右边可交换极限与求和,再运用定理5.3,于是得到以下结论: 定理5.4 (柯尔莫哥洛夫向后方程)假设,ii ik ik q q =∑≠则对一切i,j 及0≥t ,有,)()(ij ii ik kj ik ijp q t p q t p -='∑≠ (5.7) 证明 只要证明(5.6)式右边极限与求和可交换次序.现在对于任意固定的N,有 ≥∑≠→)()(inflim 0t p hh p kj ik ik h )()()(inf lim ,,0t p q t p h h p kj Nk i k ik kj Nk i k ik h ∑∑<≠<≠→= 因为上式对一切N 成立,所以)()()(inflim ,,0t p q t p h h p kj i k ik kj i k ik h ∑∑≠≠→≥ (5.8) 为了倒转不等式,注意对于N>i,由于,1)(≤t p kj 所以≤∑≠→)()(sup lim ,0t p hh p kj i k ik h ≤+≤∑∑≥<≠→])()()(sup[lim ,0Nk ik kj Nk i k ik h h h p t p h h p ≤--+≤∑∑<≠<≠→])()(1)()(sup[lim ,,0Nk i k ik ii kj Nk i k ik h h h p h h p t p h h p ,)(,,∑∑<≠<≠-+≤Nk i k ikii kj Nk i k ikqq t p q令∞→N ,由定理5.3和条件得 )()()(sup lim ,,0t p q t p h h p kj i k ik kj i k ik h ∑∑≠≠→≤. 上式连同(5.8)可得 )()()(lim ,,0t p q t p h h p kj i k ik kj i k ik h ∑∑≠≠→=.定理5.4中)(t p ij 满足的微分方程组以柯尔莫可洛夫向后方程著称.称它们为向后方程,是因为在计算时刻t+h 的状态的概率分布时我们对退后到时刻h 的状态取条件,即我们从)()(})0()({..})(,)0()({)(h p t p i X k h X P k h X i X j h t X P h t p ik Ik kj Ik ij ∑∑∈∈======+=+开始计算.对时刻t 的状态取条件,我们可以导出另一组方程,称为柯尔莫哥洛夫向前方程.可得),()()(h p t p h t p kj Ik ik ij ∑∈=+)()()()()(t p h p t p t p h t p ij kj Ik ik ij ij -=-+∑∈=)()](1[)()(t p h p h p t p ij jj kj jk ik --=∑≠,所以 )}.()(1)()({lim )()(lim 00t p h h p h h p t p ht p h t p ij jj kj jk ik h ij ij h --=-+∑≠→→假定我们能交换极限与求和,则由定理5.3便得到),()()(t p q q t p t p ij ii jk kj ik ij-='∑≠ 令人遗憾的是上述极限与求和的交换不是恒成立,所以上式并非总是成立.然而在大多数模型中----包括全部生灭过程与全部有限状态的模型,它们是成立的. 定理5.5(柯尔莫哥洛夫向前方程) 在适当的正则条件下,,)()()(jj ij kj ik ik ijq t p q t p t p -='∑≠ (5.9) 利用方程组(5.7)或(5.9)及初始条件 .,0)0(,1)0(j i p p ij ii ≠==我们可以解得)(t p ij .柯尔莫哥洛夫向后和向前方程虽然形式不同,但是可以证明它们所求得的解)(t p ij 是相同的.在实际应用中,当固定最后所处状态j,研究)(t p ij 时(i=0,1,2,…,n),采用向后方程比较方便;当固定状态i,研究)(t p ij 时(j=0,1,2,…,),则采用向前方程较方便.向后方程和向前方程可以写成矩阵形式),()(t QP t P =' (5.10) ,)()(Q t P t P =' (5.11) 其中⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡---= (222120121110)020100q q q q q qq q q Q ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=............ (222120121110)020100p p p p p pp p p P 这样,连续时间马尔可夫链的转移概率的求解问题就是矩阵微分方程的求解问题,其转移概率由其转移速率矩阵Q 决定.特别地,若Q 是一个有限维矩阵,则(5.10)和(5.11)的解为 .!)()(0∑∞===j jQtj Qt et P定理5.6 .齐次马尔可夫过程在t 时刻处于状态I j ∈的绝对概率)(t p j 满足下列方程:.)()()(kj jk k jj j j q t p q t p t p ∑≠+-=' (5.12)证明 由定理5.2,有)()(t p p t p ij Ii i j ∑∈=t将向前方程(5.9)式两边乘以,i p 并对i 求和得.)())(()(kj jk ikiIi jj ijiIi ijIi iq t pp q t pp t p p ∑∑∑∑≠∈∈∈+-='故 .)()()(kj jk k jj j j q t p q t p t p ∑≠+-=' .与离散马尔可夫链类似,我们讨论转移概率 )(t p ij 当 ∞→t 时的极限分布与平稳分布的有限性质.定义5.4 设)(t p ij 为连续时间马尔可夫链的转移概率,若存在时刻 21,t t ,使得 ,0)(1>t p ij ,0)(2>t p ij则称状态i 和j 是互通的.若所有状态都是互通的,则称此马尔可夫链为不可约定理5.7 设连续时间的马尔可夫是不可约的,则有下列性质:(1) 若它是正常返的,则极限)(lim t p ij t ∞→存在且等于.,0I j j ∈>π这里.,0I j j ∈>π是方程组1,==∑∑∈≠Ij j kj jk k jj j q q πππ (5.13)的唯一非负解.此时称.,0{I j j ∈>π是该过程的平稳分布,并且有 .)(lim j j t t p π=∞→ (2) 若它是零常返的或非常返的,则.,,0)(lim )(lim I j i t p t p j t ij t ∈==∞→∞→在实际问题中,有些问题可以用柯尔莫哥洛夫方程直接求解,有些问题虽然不能求解但是可以用方程(5.13)求解.例5.2 考虑两个状态的连续时间马尔可夫链,在转移到状态1之前链在状态0停留的时间是参数为λ的指数变量,而在回到状态0之前它停留在状态1的时间是参数为μ的指数变量,显然该链是一个齐次马尔可夫过程,其状态转移概率为 ),()(01h o h h p +=λ),()(10h o h h p +=μ由定理5.3知,)()(lim )(1lim 1001010011011q h p dhdhh p h h p q h h h ====-==→→μ,)()(lim )(1lim 0100101000000q h p dhdhh p h h p q h h h ====-==→→λ由柯尔莫哥洛夫向前方程得到)()()(000100t p t p t p λμ-='=,)()(00μμλ++-t p 其中最后一个等式来自).(1)(0001t p t p -=因为,1)0(00=p 由常数变易法得 ,)()(00t e t p μλμλλμλμ+-+++=若记,,00μλμμμλλλ+=+=则,)()(0000t e t p μλλμ+-+=类似地由向前方程)()()(010001t p t p t p μλ-=' 可解得 ,)()(0001t e t p μλλλ+--= 由对称性知,)()(0011t e t p μλμλ+-+= ,)()(0010t e t p μλμμ+--= 转移概率的极限为),(lim )(lim 10000t p t p t t ∞→∞→==μ),(lim )(lim 11001t p t p t t ∞→∞→==λ 由此可见,当∞→t 时, )(t p ij 的极限存在且与i 无关.定理5.6知,平稳分布为 0100,λπμπ== 若取初始分布为平稳分布,即,}0)0({00μ===p X P ,}1)0({01λ===p X P 则过程在时刻t 的绝对概率分布为 )()()(1010000t p p t p p t p +==0)(000)(00]1[][μμλμλμμλμλ=-+++-+-t t e e=0)(000)(00][]1[λμλλλμμλμλ=++-+-+-t t e e .例5.3 机器维修问题.设例5.2中状态0代表某机器正常工作状态1代表机器出故障.状态转移概率与例5.2相同,即在h 时间内,机器从正常工作变为出故障的概率为),()(01h o h h p +=λ在h 时间内,机器从有故障变为经修复后正常工作的概率为),()(10h o h h p +=μ试求在t=0时正常工作的机器,在t=5时为正常工作的概率.解 由例5.2已求得该过程的Q 矩阵为⎪⎪⎭⎫⎝⎛--=μμλλQ .根据题意,要求机器最后所处的状态为正常工作,只需计算)(00t p 即可. 由例5.2知,)()(0000t e t p μλλμ+-+=,,00μλμμμλλλ+=+=故 ,)5(5)(0000μλλμ+-+=e p 因为P{X(0)=0}=1=,0p 所以====)5()5(}0)5({0000p p p X P .)5(5)(0000μλλμ+-+=e p 5.3 生灭过程连续时间马尔可夫链的一类重要特殊情形是生灭过程,它的特征是在很短的时间内,系统的状态只能从状态i 转移到状态i-1或i+1或保持不变,确切定义如下. 定义5.5 设齐次马尔可夫过程}0),({≥t t X 的状态空间为I={0,1,2,…},转移概率为)(t p ij ,如果,0),()(1,>+=+i i i i h o h h p λλ)()()(1010101t p p t p p t p +=,0,0),()(01,=>+=-μμμi i i i h o h h p ),()(1)(,h o h h p i i i i ++-=μλ则称 }0),({≥t t X 为生灭过程,i λ为出生率,i μ为死亡率.若,λλi i =μλμμ,(,i i =是正常数),则称}0),({≥t t X 为线性生灭过程.若0≡i μ,则称}0),({≥t t X 为纯生过程. 若0≡i λ,则称}0),({≥t t X 为纯灭过程. 生灭过程可作如下概率解释:若以X(t)表示一个生物群体在t 时刻的大小,则在很短的时间h 内(不计高阶无穷小),群体变化有三种可能,状态由i 变到i+1,即增加一个个体,其概率为h i λ;.状态由i 变到i-1,即减少一个个体,.其概率为h i μ;群体大小保持不变,其概率为.)(1h i i μλ+- 由定理5.3得到 ,0,)()(,0≥+=-==i h p dhdt q i i h ii ii μλ ⎩⎨⎧≥-=≥+====,1,1,,0,1,)()(0i i j i i j h p dh dt q i i h ij ij μλ,2,0≥-=j i q ij 故柯尔莫哥洛夫向前方程为.,),()()()()(1,11,1I j i t p t p t p t p j i j ij j j j i j ij∈++-='++--μμλλ 故柯尔莫哥洛夫向后方程为.,),()()()()(,11,I j i t p t p t p t p j i i ij j j j i i ij∈++-='+-λμλμ 因为上述方程组的求解较为困难,我们讨论其平稳分布.由(5.13)式,有 ,1100πμπλ=.1,)(1111≥+=+++--j j j j j j j j πμπλπμλ 逐步递推得,2),()(,≥-=j i h o h p j i,0101πμλπ=…, ,11--=j jj j πμλπ 再利用11=∑∞=j j π,得平稳分布,11211100)......1(-∞=-∑+=j jj μμμλλλπ,112111021110)......1(......-∞=--∑+=j jj j j j μμμλλλμμμλλλπ例5.4 生灭过程例子M/M/S 排队系统.假设顾客按照参数为λ的泊松过程来到一个有s 个服务员的服务站,即相继来到之间的时间是均值为λ1的独立指数随机变量,每一个顾客一来到,如果有服务员空闲,则直接进行服务,否则此顾客加入排队系列.当一个服务员结束对一位顾客的服务时顾客就离开服务系统,排队中的下一顾客进入服务. 假定相继的服务时间是独立的指数随机变量,均值为μ1.如果我们以X(t)记时刻t 系统中的人数,则}0),({≥t t X 是生灭过程⎩⎨⎧>≤≤=,,,1,s n s s n n n μμμ.0,≥=n n λλM/M/s 排队系统中M 表示马尔可夫过程,s 代表s 个服务员.特别在M/M/1排队系统中,μμλλ==n n ,,若1<μλ,则由(5.14)可得.0),1()()(1)(1≥-=+=∑∞=n n n nnn μλμλμλμλπ。

第5章 Markov链

第5章 Markov链

������, ������ ∈ ������; ∀������ ∈ ������ 为随机矩阵 ,若 ������������������ ≥ 0(������, ������ ∈ ������) ,且对
定义 5.1.4 称矩阵 ������ = ������������������ ∀ ������ ∈ ������,有
0 0 0 0
11
5.1 基本概念
例 5.1.8 (Wright-Fisher 遗传模型)基因控制着生物的特征,它们是成 对出现的.控制同一特征的不同基因称为等位基因,记这对等位基因为 ������和������ , 分别称为显性的与隐性的.在一个总体中基因������和������ 出现的频率称为基因频率, 分别记为������和1 − ������. 设总体中的个体数为2������,每个个体的基因按基因������的基因频率的大小,在下 一代中转移成为基因 ������.即如果在第 ������ 代母体中基因������出现了 ������ 次,基因 ������ 出现了
6
5.1 基本概念
例 5.1.3 在任意给定的一天,加里的心情或者是快乐的(cheerful,C),或 者是一般的(so-so,S),或者是忧郁的(glum,G). 如果今天他是快乐的,则明天 他分别以概率 0.5,0.4,0.1 是 C,S,G.如果今天他感觉一般,则明天他分别 以概率 0.3,0.4,0.3 为 C,S,G.如果今天他是忧郁的,则明天他分别以概率 0.2,0.3,0.5 为 C,S,G. 以 ������������ 记加里在第 ������ 天的心情, 则 ������������ , ������ ≥ 0 是一个三个状态的马尔可夫链 (状态 0=C,状态 1=S,状态 2=G),具有转移概率矩阵 0.5 ������ = 0.3 0.2 0.4 0.4 0.3 0.1 0.3 0.5

连续时间的Markov链

连续时间的Markov链

第五章 连续时间的马尔可夫链第四章我们讨论了时间和状态都是离散的Markov 链,本章我们研究的是时间连续、状态离散的Markov 过程,即连续时间的Markov 链. 连续时间的Markov 链可以理解为一个做如下运动的随机过程:它以一个离散时间Markov 链的方式从一个状态转移到另一状态,在两次转移之间以指数分布在前一状态停留. 这个指数分布只与过程现在的状态有关,与过去的状态无关(具有无记忆性),但与将来转移到的状态独立.连续时间马尔可夫链的基本概念定义 设随机过程{(),0}X t t ≥,状态空间{,1}n I i n =≥,若对任意的正整数1210n t t t +≤<<<L 及任意的非负整数121,,,n i i i I +∈L ,条件概率满足{}111122()|(),(),,()n n n n P X t i X t i X t i X t i ++====L{}11()|()n n n n P X t i X t i ++=== ()则称{(),0}X t t ≥为连续时间的Markov 链.由定义知,连续时间的Markov 链是具有Markov 性(或称无后效性)的随机过程,它的直观意义是:过程在已知现在时刻n t 及一切过去时刻所处状态的条件下,将来时刻1n t +的状态只依赖于现在的状态而与过去的状态无关.记式条件概率的一般形式为{()|()}(,)ij P X s t j X s i p s t +=== ()它表示系统在s 时刻处于状态i ,经过时间t 后在时刻s t +转移到状态j 的转移概率,通常称它为转移概率函数.一般地,它不仅与t 有关,还与s 有关.定义 若式的转移概率函数与s 无关,则称连续时间Markov 链具有平稳的转移概率函数,称该Markov 链为连续时间的齐次(或时齐)Markov 链. 此时转移概率函数简记为(,)()ij ij p s t p t =.相应地,转移概率矩阵简记为()(()),(,,0)ij P t p t i j I t =∈≥.若状态空间{0,1,2,}I =L ,则有()000102101112012()()()...()()()()()............()()()............ij n n n p t p t p t p t p t p t P t p t p t p t p t ⎛⎫ ⎪ ⎪⎪== ⎪ ⎪ ⎪⎝⎭L L ()假设在某时刻,比如说时刻0,Markov 链进入状态i ,在接下来的s 个单位时间内过程未离开状态i (即未发生转移),我们要讨论的问题是在随后的t 个单位时间中过程仍不离开状态i 的概率是多少?由Markov 性知,过程在时刻s 处于状态i 的条件下,在区间[,]s s t +中仍处于状态i 的概率正是它处在状态i 至少t 个单位时间的(无条件)概率,若记i τ为过程在转移到另一状态之前停留在状态i 的时间,则对一切,0s t ≥有{|}{}i i i P s t s P t τττ>+>=>可见,随机变量i τ具有无记忆性,因此,i τ服从指数分布.因此,一个连续时间的Markov 链,每当它进入状态i ,具有如下性质: (1) 在转移到另一个状态之前处在状态i 的时间服从参数为i v 的指数分布; (2) 当过程离开状态i 时,接着以概率ij p 进入状态j ,且1ijj ip≠=∑.当i v =∞时,称状态i 是瞬时状态,因为过程一旦进入状态就离开;若0i v =,称状态为吸收状态. 因为过程一旦进入永远不再离开.尽管瞬时状态在理论上是可能的,但我们以后还是假设一切i ,0i v ≤<∞.因此,考虑连续时间Markov 链,可以按照离散时间的Markov 链从一个状态转移到另个状态,但在转移到另一状态之前,它在各个状态停留的时间服从指数分布,而且在状态i 停留的时间与下一个状态必须是相互独立的随机变量.定理 齐次Markov 链的转移概率函数具有下列性质:(1)()0ij p t ≥; (2)()1ij j Ip t ∈=∑;(3)()()()ij ikkj k Ip t s pt p s ∈+=∑.(2)式表明转移概率矩阵中任一元素行和为1;(3)式称为连续时间齐次Markov 链的Chapman Kolmogorov -方程,简称C K -方程.证明 (1)和(2)由概率定义及()ij p t 的定义易知,下面只证明(3)式 由全概率公式和Markov 性可得(){()|(0)}ij p t s P X t s j X i +=+=={(),()|(0)}k IP X t s j X t k X i ∈=+===∑{()|(0)}{()|()}k IP X t k X i P X t s j X t k ∈===+==∑{()|(0)}{()|(0)}k IP X t k X i P X s j X k ∈=====∑()()ikkj k Ipt p s ∈=∑对于转移概率函数,我们约定1,,lim ()0ij ij t i j p t i jδ→=⎧==⎨≠⎩ () 称上式为连续性条件或正则性条件.连续性条件保证转移概率函数()ij p t 在边界点0t =处右连续.它的直观意义在于:当系统经过很短时间,其状态几乎不变,也就是认为系统刚进入一个状态又立刻离开这个状态是不可能的.定义 连续时间Markov 链{(),0}X t t ≥在初始时刻(即零时刻)取各状态的概率(0){(0)},i i p p P X i i I ===∈ ()称为它的初始分布.{(),0}X t t ≥在t 时刻取各状态的概率(){()},j p t P X t j == ,0j I t ∈≥称为它在时刻t 的绝对(概率)分布.初始分布和绝对分布都是概率分布,对于任意0t ≥,()j p t 总满足: (1)0()1j p t ≤≤; (2)()1j jp t =∑.利用全概率公式容易得到()(0)(),j i ij i Ip t p p t j I ∈=∈∑ ()()式表明:连续时间Markov 链的绝对概率分布完全由其初始分布和转移概率函数所确定.下面举一个简单的例子说明转移概率函数的计算方法.例 证明Poisson 过程{(),0}N t t ≥是连续时间的齐次Markov 链. 证明 先证明Poisson 过程具有Markov 性.由Poisson 过程的独立增量性和()0N t =,对任意1210n n t t t t +<<<<<L ,有1111{()|(),,()}n n n n P N t i N t i N t i ++===L=1111{()()|()(0),n n n n P N t N t i i N t N i ++-=--=212111()(),,()()}n n n n N t N t i i N t N t i i ---=--=-L11{()()}n n n n P N t N t i i ++=-=- 另一方面,因为11{()|()}n n n n P N t i N t i ++===11{()()|()(0)}n n n n n n P N t N t i i N t N i ++-=--==11{()()}n n n n P N t N t i i ++-=-因此 1111{()|(),,()}n n n n P N t i N t i N t i ++===L =11{()|()}n n n n P N t i N t i ++== 即Poisson 过程是连续时间的Markov 链.再证齐次性. 当j i ≥时,由Poisson 过程的定义,得到{()|()}{()()}P N s t j N s i P N s t N s j i +===+-=-()()!j itt ej i λλ--=-当j i <时,由于过程的增量只取非负整数值,因此,(,)0ij p s t =,故(),(,)()()!0,j it ij ij t ej i p s t p t j i j iλλ--⎧≥⎪==-⎨⎪<⎩即转移概率函数只与t 有关,因此,Poisson 过程具有齐次性.容易看出,固定,i j 时,()ij p t 是关于t 的连续可微函数。

第5章 马尔可夫链

第5章 马尔可夫链

转移),而后M→M(无转移).于是转移概率为 P{U→U|M}·P{
M→M}=0.8×0.7=0.56.其它转移概率类似可得.转移方

.
是 UM→UM UM→DM UM→UW UM→DW
DM→UM DM→DM DM→UW DM→DW UW→UM UW→DM UW→UW UW→DW 转移概PD=率W矩→阵U为M DW→DM DW→UW DW→DW
硬币W具有转移概率
.
在任何给定时刻硬币被替换的概率为30%,替换完成时,
硬币的状态不变.这一Markov链有4个状态,分别记为 1:UM; 2:DM; 3:UW; 4:DW.
状态1,3表示正面U,状态2,4表示反面D. 转移矩阵为4×4
马尔可夫链
我们可以计算转移概率, 比如UM→UM,首先有 U→U(无
pij表示过程处在状态i时, 下一次转移到状态j的概率. 由于概率值非负且过程必须转移到某个状态,所以有
pij≥0, i,j≥0(即i,j∈I);
pij=j10, i=0,1,2,…(即i∈I)
(★)
我们称P{Xn+1=j|Xn=i}=pij为Markov链 {Xn,n=0,1,2,…}的
马尔可夫链
马尔可夫链
可夫链的特性为Markov性,亦称“无后效性”.此性质说 明:
要确定过程将来的状态, 知道它此刻的状态就足够了,
并不需要对它以往状况的认识. 也就是说
对于一个马尔可夫链,在给定过去的状态X0,X1,…,Xn-1 和过现在的状态Xn时, 将来的状态Xn+1的条件分布独立于
去的状态而只依赖于现在的状态.
PU4U
=0.5648.
马尔可夫链
例5.13(隐Markov链模型) 这里用简单例子引出隐 Markov

5.连续时间的马尔可夫链3

5.连续时间的马尔可夫链3
顾客以及每个顾客所需的服务时间服从怎样的分布,常用的分 布有指数分布,定长分布等;
(三)各种排队模型的记号 排队模型将如下六个特征按顺序由各自的符号给出,
并用斜线隔开:
输入过程/服务分布/服务台个数/系统容量/顾客源数/排队规则
例4 M/M/S/n/∞/FIFO
表示顾客按泊松过程来到,时间间距为指数分布, 服务时间为指数分布,有s个服务员,系统容量为n 个,顾客来源无限,排队规则是先到先服务。
j1 12 j
即当状态空间 I 1,2, , 时,平稳分布为
0=
1+
j 1
01 12
1
j1 j
1=
0 1
0,
2=
01 12

0

j
=
01 12
j1 j

0

应用举例
例1 泊松过程 N t ,t 0 是生率为
的纯生过程。
状态空间 I 0,1,2, , 状态转移速率图如下
顾客
到达 等待服务 排队规则
提供服务 的服务台 服务时间
随机服务系统示意图
顾客离去
这里“顾客”和“服务台”是广义的,如病人到医院看 病, “顾客”是病人,“服务台”是医院;某人去商店 去购物, “顾客”是购买货物者,“服务台”是柜台; 打电话到寻呼台, “顾客”是打电话的人,“服务台” 是寻呼台;……
解:此系统为M/M/1损失制 = 4,= 2
53
(1)平稳分布
0
=5, 11
1
=
6. 11
(2)系统处于无顾客状态的概率为 即可以接通的
概率为 0 = 151,因每分钟呼唤 =0.8 次,故每分钟
每分钟可以接通的概率

随机过程-第五章 马尔可夫链

随机过程-第五章 马尔可夫链
假设当前四种鲜奶的市场份额为 (vA , vB , vC , vD ) (25%,30%,35%,10%) , 试求半年后 鲜奶的市场份额。 解:根据题设首先可写出一步转移概率矩阵
0.95 0.02 0.02 0.01 0.3 0.6 0.06 0.04 P 0.2 0.1 0.7 0 0.2 0.2 0.1 0.5
P
jS
ij
1, i S 。则称该矩阵为随机矩阵。
显然,随机矩阵的各行元素之和都等于 1。
例 5.1 赌徒输光问题 :考虑一赌徒,在每局赌博中他以概率 p 赢得 1 元,以概率
q 1 p 输掉 1 元,假设各局赌博是相互独立的,赌徒开始有 i ( ቤተ መጻሕፍቲ ባይዱ i n )元,且他在赌
显然, Markov 链的统计特征由其初始分布 P{ X 0 i0 } 和转移概率 P{ X k i X k 1 ik 1} ( k 1, 2,, n )决定。
定义 5.3 时齐 Markov 链: 当 Markov 链的转移概率 P{ X n1 j X n i} 只与状态 i, j 有
m n m, n 0 使得 P ij 0, Pjk 0 ,利用 C-K 方程(1)可知
n n Pikm n Pirm Prk Pijm Pjk 0 rS
K 类似地可以证明存在 K 0 使得 Pki 0 。
称互通的两个状态属于同一个类,且由命题 5.1 可知,任何一个状态不能同时属于两个 不同的类,即任意两个不同的类不相交。 思考:对例 5.1 中的赌徒问题的状态分类? 定义 5.7 可约:若 Markov 链只存在一个类,则称它为不可约的;否则称为可约的。 在不可约的 Markov 链中,一切状态都是彼此互通的。

随机过程的连续时间马尔可夫过程与转移概率

随机过程的连续时间马尔可夫过程与转移概率

随机过程的连续时间马尔可夫过程与转移概率随机过程是概率论中研究的重要课题,它描述了随机事件在时间上的演化规律。

马尔可夫过程是一类常见的随机过程,它具有马尔可夫性质,即在给定当前状态下,未来状态的概率分布只与当前状态有关,与过去的状态无关。

本文将重点讨论随机过程中的连续时间马尔可夫过程以及与之相关的转移概率。

一、连续时间马尔可夫过程的定义连续时间马尔可夫过程是指在时间上呈连续变化的随机过程,它的状态空间和状态转移概率在时间的任意一段内都保持不变。

具体而言,对于一个连续时间马尔可夫过程,其状态空间可以用S表示,状态转移概率可以用P(t)表示,其中t表示时间。

二、连续时间马尔可夫过程的特点1. 马尔可夫性质:连续时间马尔可夫过程具有马尔可夫性质,即在给定当前状态下,未来状态的概率分布只与当前状态有关,与过去的状态无关. 这一性质使得马尔可夫过程具有很好的简化性和计算性.2. 独立增量性质:连续时间马尔可夫过程具有独立增量性质,即在不重叠的时间间隔上的状态变量是相互独立的.3. 示性函数的连续性:连续时间马尔可夫过程中,随机变量状态的转移概率是连续函数,这也是它与离散时间马尔可夫过程的一个重要区别。

三、连续时间马尔可夫链与转移概率对于连续时间马尔可夫过程,其状态转移概率可以由转移概率矩阵来表示。

转移概率矩阵是一个关于时间t的函数,记作P(t)。

它的元素Pij(t)表示在时间t内从状态i转移到状态j的概率。

转移概率矩阵满足以下性质:1. Pij(t) ≥ 0,对于所有的i、j和t都成立。

2. 对于任意固定的i和t,有ΣjPij(t) = 1,即在固定时间t内,从状态i出发转移到所有可能状态j的概率之和为1。

3. 转移概率矩阵P(t)的乘积P(s+t)等于P(s)乘以P(t),即P(s+t) =P(s)P(t),其中s和t为任意的正实数。

根据转移概率矩阵P(t)的性质,我们可以得出连续时间马尔可夫过程的转移概率随时间的推移而改变,但在任意一段时间内始终保持一致。

连续时间马尔可夫链定义

连续时间马尔可夫链定义

为连续时间马氏链的齐次转移矩阵 其中
p00 (t ) p10 (t ) P(t ) pi j (t ) p20 (t ) ...
pij (t ) 0
p01 (t ) p11 (t ) p21 (t ) ...
p02 (t ) p12 (t ) p22 (t ) ...
0
6 4 10 例:Q 2.5 2.5 0 1 1 2
2.5 1
4
6
1
2 1
状态流图
8
4 Q矩阵P(t)
依据K氏微分方程,可以从Q矩阵求得P(t), P(0)=I. 例:考察E={0,1}的连续时间马氏链X,设t极小
p01 (t ) t o(t ) p10 (t ) t o(t )
lim j '(t ) lim i (t ) qij
t t i
写成矩阵形式: Q 0
12
4 平稳概率例题
一个连续时间的马氏链E={0,1,2},其状态强度转移矩阵和状 态转移图为 1 1 0 平衡方程: Q 2 3 1 0 1 1 ( 0 , 1, 2 ) Q 0 列出方程组
k
初值: i (0) pi
为求瞬时概率分布函数的方程组
10
5 平稳分布
定义 j (t ) j ( j E ) 存在,且 j 1 ,则{ }称为齐次 若lim t j j 马尔可夫链的平稳分布 如何判别连续马尔可夫链的平稳分布必定存在?
转移概率矩阵是标准的 不可约的齐次马氏链,则极限存在,且与初始分布无关 正常返的齐次马氏链,则此极限值为平稳分布,且全部大 于0
11

随机过程-第五章-连续时间的马尔可夫链

随机过程-第五章-连续时间的马尔可夫链

第五章 连续时间的马尔可夫链5.1连续时间的马尔可夫链考虑取非负整数值的连续时间随机过程}.0),({≥t t X定义5.1 设随机过程}.0),({≥t t X ,状态空间}0,{≥=n i I n ,若对任意121...0+<<<≤n t t t 及I i i i n ∈+121,...,,有})(,...)(,)()({221111n n n n i t X i t X i t X i t X P ====++=})()({11n n n n i t X i t X P ==++ (5.1) 则称}.0),({≥t t X 为连续时间马尔可夫链.由定义知,连续时间马尔可夫链是具有马尔可夫性的随机过程,即过程在已知现在时刻n t 及一切过去时刻所处状态的条件下,将来时刻1+n t 的状态只依赖于现在状态而与过去无关.记(5.1)式条件概率一般形式为),(})()({t s p i s X j t s X P ij ===+ (5.2) 它表示系统在s 时刻处于状态i,经过时间t 后转移到状态j 的转移概率.定义5.2 若(5.2)式的转移概率与s 无关,则称连续时间马尔可夫链具有平稳的或齐次的转移概率,此时转移概率简记为),(),(t p t s p ij ij =其转移概率矩阵简记为).0,,()),(()(≥∈=t I j i t p t P ij以下的讨论均假定我们所考虑的连续时间马尔可夫链都具有齐次转移概率.简称为齐次马尔可夫过程.假设在某时刻,比如说时刻0,马尔可夫链进入状态i,而且接下来的s 个单位时间单位中过程未离开状态i,(即未发生转移),问随后的t 个单位时间中过程仍不离开状态i 的概率是多少呢?由马尔可夫我们知道,过程在时刻s 处于状态i 条件下,在区间[s,s+t]中仍然处于i 的概率正是它处于i 至少t 个单位的无条件概率..若记i h 为记过程在转移到另一个状态之前停留在状态i 的时间,则对一切s,t 0≥有},{}{t h P s h t s h P i i i >=>+>可见,随机变量i h 具有无记忆性,因此i h 服从指数分布.由此可见,一个连续时间马尔可夫链,每当它进入状态i,具有如下性质:(1) 在转移到另一状态之前处于状态i 的时间服从参数为i v 的指数分布;(2) 当过程离开状态i 时,接着以概率ij p 进行状态j,1=∑≠ij ij p .上述性质也是我们构造连续时间马尔可夫链的一种方法.当∞=i v 时,称状态i 为瞬时状态,因为过程一旦进入此状态立即就离开.0=i v 时,称状态i 为吸收状态,因为过程一旦进入状态就永远不再离开了.尽管瞬时状态在理论上是可能的,但以后假设对一切i, ∞<≤i v 0.因此,实际上一个连续时间的马尔可夫链是一个这样的随机过程,它按照一个离散时间的马尔可夫链从一个状态转移到另一个状态,但在转移到下一个状态之前,它在各个状态停留的时间服从指数分布.此外在状态i 过程停留的时间与下一个到达的状态必须是相互独立的随机变量.因此下一个到达的状态依赖于i h ,那么过程处于状态i 已有多久的信息与一个状态的预报有关,这与马尔可夫性的假定相矛盾.定理5.1 齐次马尔可夫过程的转移概率具有下列性质:;0)1(≥ij p(2) ;1=∑∈ij I j p(3) ∑∈=+Ik kj ik ij s p t p s t p )()()(.其中(3)式即为连续时间齐次马尔可夫链的切普曼—柯尔哥洛夫方程.证明 只证(3).由全概率公式及马尔可夫性可得===+=+)})0()({)(i X j s t X P s t p ij=∑∈===+Ik i X k t X j s t X P })0()(,)({=})()({})0()({k t X j s t X P i X k t X P Ik ==+==∑∈∑∈=Ik kj ik s p t p )()(.对于转移概率)(t p ij ,一般还假定它满足:⎩⎨⎧≠==→.,0,1)(lim 0j i j i t p ij t (5.3) 称(5.3)式为正则条件.正则条件说明,过程刚进入某状态不可能立即又跳跃到另一状态.这正好说明一个物理系统要在有限时间内发生限多次跳跃,从而消耗无穷多的能量这是不可能的.定义5.3 对于任 一0≥t 记},)({)(j t X P t p j ==,},)0({)0(I j j X P p p j j ∈===分别称}{},),({,I j p I j t p j j ∈∈ 齐次马尔可夫过程的绝对概率分布和初始概率分布. 定理5.2齐次马尔可夫过程的绝对概率及有限维概率分布具有下列性质:(1) ,0)(≥t p j(2) ,1)(=∑∈t p j I j(3) )()(t p p t p ij Ii i j ∑∈=;(4) );()()(h p t p h t p ij Ii i j ∑∈=+(5)).()...(})(,...,)({112111211-∈--====-∑n n i i i i ii I i i n n t t p t t p p p i t X i t X p n n例5.1试证明泊松过程}0),({≥t t X 为连续时间齐次马尔可夫链.证明 先证泊松过程具有马尔可夫性,再证明齐次性.由泊松过程的定义它是独立增量过程,且X(0)=0.11,...0+<<<n n t t t ,有})(,...,)()({1111n n n n i t X i t X i t X P ===++= ,.)0()()()({1111i X t X i i t X t X P n n n n =--==-++=,111212)()(,...)()(---=--=-n n n n i i t X t X i i t X t X }= })()({11n n n n i i t X t X P -=-++ .另一方面,因为})()({11n n n n i t X i t X P ==++ =})0()()()({11n n n n n n i X t X i i t X t X P =--=-++=})()({11n n n n i i t X t X P -=-++ 所以})(,...,)()({1111n n n n i t X i t X i t X P ===++=})()({11n n n n i t X i t X P ==++.即泊松过程是一个连续时间马尔可夫过程.以下证明齐次性.当i j ≥ 时,由泊松过程的定义})()({i s X j t s X P ==+= })()({i j s X t s X P -=-+=)!()(i j t e ij t ---λλ j<i.时,由于过程的增量只取非负整数,故,0),(=t s p ij 所以⎪⎩⎪⎨⎧<≥-==--i j i j i j t e t p t s p ij t ij ij ,0,)!()()(),(λλ, 即转移概率只与t 有关,泊松过程具有齐次性.5.2柯尔莫哥洛夫微分方程对于连续时间齐次马尔可夫链转移概率)(t p ij 的求解一般比较复杂.下面首先讨论)(t p ij 的可微性及)(t p ij 满足的柯尔莫哥洛夫微分程.引理5.1 设齐次马尔可夫过程满足正则性条件(5.3),则对于任意固定的)(,,t p I j i ij ∈是t 的一致连续函数.证明 设h>0,由定理5.1得)()()()()(t p t p h p t p h t p ij rj Ir ir ij ij -=-+∑∈)()()()()(t p t p h p t p h p ij ij ii rj ir ir -+=∑≠=)()](1[)()(t p h p t p h p ij ii rj ir ir --=∑≠故有)],(1[)()](1[)()(h p t p h p t p h t p ii ij ii ij ij --≥--=-+),(1)()()()()(h p h p t p h p t p h t p ii ir ir rj i r ir ij ij -=≤≤-+∑∑≠≠因此).(1)()(h p t p h t p ii ij ij -≤-+对于h<0,同样有).(1)()(h p t p h t p ii ij ij --≤-+综上所述得到).(1)()(h p t p h t p ii ij ij -≤-+由正则性条件知,0)()(lim 0=-+→t p h t p ij ij h即)(t p ij 关于t 是一致连续的.以下我们恒设齐次马尔可夫过程满足正则性条件(5.3)式.定理5.3 设)(t p ij 是齐次马尔可夫过程的转移概率,则下列极限存在(1);)(1lim 0∞≤==∆∆-→∆ii i ii t q v tt p(2).,)(lim 0j i q t t p ij ij t ≠∞<=∆∆→∆我们称ij q 为齐次马尔可夫过程从状态i 到状态j 的转移概率或跳跃强度.定理中的极限的概率意义为:在长为t ∆的时间区间内,过程从状态i 转移到另一其他状态的转移概率为)(1t p ii ∆-等于t q ii ∆加一个比t ∆高阶的无穷小量,而过程从状态i 转移到状态j 的转移概率为)(t p ij ∆等于t q ij ∆加一个比t ∆高阶的无穷小量.推论 对有限齐次马尔可夫过程,有∞<=∑≠ij ij ii q q证明 由定理5.1 ,有)()(1,1)(t p t p t pij ij ii I j ij ∆=∆-=∆∑∑≠∈ 由于求和是在有限集中进行,故有.)(lim )(1lim 00∑∑≠≠→∆→∆=∆∆=∆∆-=ij ij ij i j t ii t ii q t t p t t p q (5.4) 对于状态空间无限的齐次马尔可夫过程,一般只有∑≠≥ij ij ii q q .若连续时间齐次马尔可夫是具有有限状态空间I={0,1,2,…,n},则其转移速率构成以下形式的矩阵⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡---=nn n n n n q q q q q q q q q Q .....................101111000100 (5.5) 由(5.4)式知,Q 矩阵的每一行元素之和为0,对角线元素为负或0,其余.0,≥ij q利用Q 矩阵可以推出任意时间间隔t 的转移概率所满足的方法组,从而可以求解转移概率.由切普曼---柯尔莫哥洛夫方程有),()()(t p h p h t p Ik kj ik ij ∑∈=+或等价地)()](1[)()()()(t p h p t p h p t p h t p ij ii kj ik ik ij ij --=-+∑≠两边除以h 后令0→h 取极限,应用定理5.3得到)()()(lim )()(lim 00t p q t p hh p h t p h t p ij ii kj i k ik h ij ij h -=-+∑≠→→ (5.6) 假定在(5.6)式的右边可交换极限与求和,再运用定理5.3,于是得到以下结论:定理5.4 (柯尔莫哥洛夫向后方程)假设,ii ik ik q q =∑≠则对一切i,j 及0≥t ,有,)()(ij ii ik kj ik ijp q t p q t p -='∑≠ (5.7) 证明 只要证明(5.6)式右边极限与求和可交换次序.现在对于任意固定的N,有≥∑≠→)()(inf lim 0t p h h p kj i k ik h )()()(inf lim ,,0t p q t p h h p kj Nk i k ik kj N k i k ik h ∑∑<≠<≠→= 因为上式对一切N 成立,所以 )()()(inf lim ,,0t p q t p h h p kj i k ik kj i k ik h ∑∑≠≠→≥ (5.8) 为了倒转不等式,注意对于N>i,由于,1)(≤t p kj 所以≤∑≠→)()(sup lim ,0t p hh p kj i k ik h ≤+≤∑∑≥<≠→])()()(sup[lim ,0N k ik kj N k i k ik h h h p t p h h p ≤--+≤∑∑<≠<≠→])()(1)()(sup[lim ,,0Nk i k ik ii kj N k i k ik h h h p h h p t p h h p ,)(,,∑∑<≠<≠-+≤N k i k ik ii kj N k i k ik q q t p q令∞→N ,由定理5.3和条件得)()()(sup lim ,,0t p q t p h h p kj i k ik kj i k ik h ∑∑≠≠→≤. 上式连同(5.8)可得)()()(lim ,,0t p q t p h h p kj i k ik kj i k ik h ∑∑≠≠→=.定理5.4中)(t p ij 满足的微分方程组以柯尔莫可洛夫向后方程著称.称它们为向后方程,是因为在计算时刻t+h 的状态的概率分布时我们对退后到时刻h 的状态取条件,即我们从)()(})0()({..})(,)0()({)(h p t p i X k h X P k h X i X j h t X P h t p ik I k kj I k ij ∑∑∈∈======+=+开始计算.对时刻t 的状态取条件,我们可以导出另一组方程,称为柯尔莫哥洛夫向前方程.可得 ),()()(h p t p h t p kj Ik ik ij ∑∈=+)()()()()(t p h p t p t p h t p ij kj Ik ik ij ij -=-+∑∈=)()](1[)()(t p h p h p t p ij jj kj jk ik --=∑≠,所以)}.()(1)()({lim )()(lim 00t p hh p h h p t p h t p h t p ij jj kj j k ik h ij ij h --=-+∑≠→→ 假定我们能交换极限与求和,则由定理5.3便得到),()()(t p q q t p t p ij ii jk kj ik ij-='∑≠ 令人遗憾的是上述极限与求和的交换不是恒成立,所以上式并非总是成立.然而在大多数模型中----包括全部生灭过程与全部有限状态的模型,它们是成立的.定理5.5(柯尔莫哥洛夫向前方程) 在适当的正则条件下,,)()()(jj ij kj ik ik ijq t p q t p t p -='∑≠ (5.9) 利用方程组(5.7)或(5.9)及初始条件.,0)0(,1)0(j i p p ij ii ≠==我们可以解得)(t p ij .柯尔莫哥洛夫向后和向前方程虽然形式不同,但是可以证明它们所求得的解)(t p ij 是相同的.在实际应用中,当固定最后所处状态j,研究)(t p ij时(i=0,1,2,…,n),采用向后方程比较方便;当固定状态i,研究)(t p ij 时(j=0,1,2,…,),则采用向前方程较方便.向后方程和向前方程可以写成矩阵形式),()(t QP t P =' (5.10),)()(Q t P t P =' (5.11)其中⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡---=............ (222120121110)020100q q q q q q q q q Q ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡= (22)2120121110020100p p p p p p p p p P 这样,连续时间马尔可夫链的转移概率的求解问题就是矩阵微分方程的求解问题,其转移概率由其转移速率矩阵Q 决定.特别地,若Q 是一个有限维矩阵,则(5.10)和(5.11)的解为.!)()(0∑∞===j jQt j Qt e t P 定理5.6 .齐次马尔可夫过程在t 时刻处于状态I j ∈的绝对概率)(t p j 满足下列方程: .)()()(kj jk k jj j j q t p q t p t p ∑≠+-=' (5.12)证明 由定理5.2,有)()(t p p t p ij Ii i j ∑∈=t将向前方程(5.9)式两边乘以,i p 并对i 求和得.)())(()(kj j k ik i I i jj ij iI i ij I i i q t p p q t p p t p p ∑∑∑∑≠∈∈∈+-='故 .)()()(kj jk k jj j j q t p q t p t p ∑≠+-=' .与离散马尔可夫链类似,我们讨论转移概率 )(t p ij 当 ∞→t 时的极限分布与平稳分布的有限性质.定义5.4 设)(t p ij 为连续时间马尔可夫链的转移概率,若存在时刻 21,t t ,使得,0)(1>t p ij ,0)(2>t p ij则称状态i 和j 是互通的.若所有状态都是互通的,则称此马尔可夫链为不可约的. 定理5.7 设连续时间的马尔可夫是不可约的,则有下列性质:(1) 若它是正常返的,则极限)(lim t p ij t ∞→存在且等于.,0I j j ∈>π这里.,0I j j ∈>π是方程组1,==∑∑∈≠Ij j kj j k k jj j q q πππ (5.13)的唯一非负解.此时称.,0{I j j ∈>π是该过程的平稳分布,并且有.)(lim j j t t p π=∞→(2) 若它是零常返的或非常返的,则.,,0)(lim )(lim I j i t p t p j t ij t ∈==∞→∞→在实际问题中,有些问题可以用柯尔莫哥洛夫方程直接求解,有些问题虽然不能求解但是可以用方程(5.13)求解.例5.2 考虑两个状态的连续时间马尔可夫链,在转移到状态1之前链在状态0停留的时间是参数为λ的指数变量,而在回到状态0之前它停留在状态1的时间是参数为μ的指数变量,显然该链是一个齐次马尔可夫过程,其状态转移概率为),()(01h o h h p +=λ),()(10h o h h p +=μ由定理5.3知由柯尔莫哥洛夫向前方程得到)()()(000100t p t p t p λμ-='=,)()(00μμλ++-t p 其中最后一个等式来自).(1)(0001t p t p -=因为,1)0(00=p 由常数变易法得,)()(00t e t p μλμλλμλμ+-+++=若记,,00μλμμμλλλ+=+=则 ,)()(0000t e t p μλλμ+-+=类似地由向前方程)()()(010001t p t p t p μλ-=' 可解得 ,)()(0001t e t p μλλλ+--=由对称性知,)()(0011t e t p μλμλ+-+=,)()(0010t e t p μλμμ+--=转移概率的极限为),(lim )(lim 10000t p t p t t ∞→∞→==μ),(lim )(lim 11001t p t p t t ∞→∞→==λ由此可见,当∞→t 时, )(t p ij 的极限存在且与i 无关.定理5.6知,平稳分布为0100,λπμπ==若取初始分布为平稳分布,即,}0)0({00μ===p X P ,}1)0({01λ===p X P则过程在时刻t 的绝对概率分布为,)()(lim )(1lim 1001010011011q h p dh d h h p h h p q h h h ====-==→→μ,)()(lim )(1lim 010********00q h p dhd h h p h h p q h h h ====-==→→λ)()()(1010000t p p t p p t p +==0)(000)(00]1[][μμλμλμμλμλ=-+++-+-t t e e=0)(000)(00][]1[λμλλλμμλμλ=++-+-+-t t e e .例5.3 机器维修问题.设例5.2中状态0代表某机器正常工作状态1代表机器出故障.状态转移概率与例 5.2相同,即在h 时间内,机器从正常工作变为出故障的概率为),()(01h o h h p +=λ在h 时间内,机器从有故障变为经修复后正常工作的概率为),()(10h o h h p +=μ试求在t=0时正常工作的机器,在t=5时为正常工作的概率.解 由例5.2已求得该过程的Q 矩阵为⎪⎪⎭⎫ ⎝⎛--=μμλλQ . 根据题意,要求机器最后所处的状态为正常工作,只需计算)(00t p 即可.由例5.2知,)()(0000t e t p μλλμ+-+=,,00μλμμμλλλ+=+=故 ,)5(5)(0000μλλμ+-+=e p因为P{X(0)=0}=1=,0p 所以====)5()5(}0)5({0000p p p X P .)5(5)(0000μλλμ+-+=e p5.3 生灭过程连续时间马尔可夫链的一类重要特殊情形是生灭过程,它的特征是在很短的时间内,系统的状态只能从状态i 转移到状态i-1或i+1或保持不变,确切定义如下.定义 5.5 设齐次马尔可夫过程}0),({≥t t X 的状态空间为I={0,1,2,…},转移概率为)(t p ij ,如果,0),()(1,>+=+i i i i h o h h p λλ,0,0),()(01,=>+=-μμμi i i i h o h h p),()(1)(,h o h h p i i i i ++-=μλ则称 }0),({≥t t X 为生灭过程,i λ为出生率,i μ为死亡率.)()()(1010101t p p t p p t p +=,2),()(,≥-=j i h o h p j i若,λλi i =μλμμ,(,i i =是正常数),则称}0),({≥t t X 为线性生灭过程.若0≡i μ,则称}0),({≥t t X 为纯生过程. 若0≡i λ,则称}0),({≥t t X 为纯灭过程.生灭过程可作如下概率解释:若以X(t)表示一个生物群体在t 时刻的大小,则在很短的时间h 内(不计高阶无穷小),群体变化有三种可能,状态由i 变到i+1,即增加一个个体,其概率为h i λ;.状态由i 变到i-1,即减少一个个体,.其概率为h i μ;群体大小保持不变,其概率为.)(1h i i μλ+-由定理5.3得到,0,)()(,0≥+=-==i h p dh d t q i i h ii ii μλ ⎩⎨⎧≥-=≥+====,1,1,,0,1,)()(0i i j i i j h p dh d t q i i h ij ij μλ ,2,0≥-=j i q ij故柯尔莫哥洛夫向前方程为.,),()()()()(1,11,1I j i t p t p t p t p j i j ij j j j i j ij∈++-='++--μμλλ 故柯尔莫哥洛夫向后方程为.,),()()()()(,11,I j i t p t p t p t p j i i ij j j j i i ij∈++-='+-λμλμ 因为上述方程组的求解较为困难,我们讨论其平稳分布.由(5.13)式,有,1100πμπλ=.1,)(1111≥+=+++--j j j j j j j j πμπλπμλ逐步递推得,0101πμλπ=…, ,11--=j jj j πμλπ 再利用11=∑∞=j j π,得平稳分布,11211100)......1(-∞=-∑+=j j j μμμλλλπ, 112111021110)......1(......-∞=--∑+=j jj j j j μμμλλλμμμλλλπ 例5.4 生灭过程例子M/M/S 排队系统.假设顾客按照参数为λ的泊松过程来到一个有s 个服务员的服务站,即相继来到之间的时间是均值为λ1的独立指数随机变量,每一个顾客一来到,如果有服务员空闲,则直接进行服务,否则此顾客加入排队系列.当一个服务员结束对一位顾客的服务时顾客就离开服务系统,排队中的下一顾客进入服务.假定相继的服务时间是独立的指数随机变量,均值为μ1.如果我们以X(t)记时刻t 系统中的人数,则}0),({≥t t X 是生灭过程⎩⎨⎧>≤≤=,,,1,s n s s n n n μμμ .0,≥=n n λλM/M/s 排队系统中M 表示马尔可夫过程,s 代表s 个服务员.特别在M/M/1排队系统中,μμλλ==n n ,,若1<μλ,则由(5.14)可得.0),1()()(1)(1≥-=+=∑∞=n n n nn n μλμλμλμλπ。

随机过程4-5时间连续状态连续的马尔科夫过程,维纳过程

随机过程4-5时间连续状态连续的马尔科夫过程,维纳过程

(5.3)式表示过程的无后效性。需要指出,这种定义 马尔科夫过程的方式,亦适用马尔科夫链和时间连续状态 离散的马尔科夫过程。
(5.5)式给出的形式为
F( x, t | x/ , t / ) FX(t)(x | X(t / ) x/ ), t / t
(5.6)
此式称为马尔科夫过程 X(t) 的转移概率分布函数。
(5. 8)

F( x | x/ , ) F( x, t / | x/ , t / )
(5. 9)
称 X(t) 为时齐马尔科夫过程。
如果(5. 4)和(5. 5)式中条件分布函数对 x 的导数存在,
第4章 马尔科夫过程
第7页

f ( x,tm s | x1, t1, x2 , t2 , ..., xm , tm )
首先它在起始时刻位于原点;又在各个不相交时间间隔 中花粉沿 x 方向的位移是互不影响,相互独立的;且在每 一段时间间隔中沿 x 方向位移服从正态分布,由于左移与 右移距离的概率分布是对称的。所以数学期望为零,而刻 划位移分散程度的方差正比于时间间隔的长度。
第4章 马尔科夫过程
第16页
鉴于上述原因,维纳过程亦称为布朗运动。 由定义,维纳过程是平稳独立增量过程。
此时马尔科夫过程是时齐的。
第4章 马尔科夫过程
第9页
例如,函数
f (x | x/ , )
1
e ,
(
x x/ )2 2 2
2
0, 0
可作为时齐马尔科夫过程的转移分布密度。
第4章 马尔科夫过程
第10页
二、切普曼——柯尔莫哥洛夫方程
定理1 设 {X (t), t [0, )} 是马尔科夫过程,则对 0 t1 t2 t3 有
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章 连续时间的马尔可夫链5.1连续时间的马尔可夫链考虑取非负整数值的连续时间随机过程}.0),({≥t t X定义5.1 设随机过程}.0),({≥t t X ,状态空间}0,{≥=n i I n ,若对任意121...0+<<<≤n t t t 及I i i i n ∈+121,...,,有})(,...)(,)()({221111n n n n i t X i t X i t X i t X P ====++=})()({11n n n n i t X i t X P ==++ (5.1) 则称}.0),({≥t t X 为连续时间马尔可夫链.由定义知,连续时间马尔可夫链是具有马尔可夫性的随机过程,即过程在已知现在时刻n t 及一切过去时刻所处状态的条件下,将来时刻1+n t 的状态只依赖于现在状态而与过去无关.记(5.1)式条件概率一般形式为),(})()({t s p i s X j t s X P ij ===+ (5.2) 它表示系统在s 时刻处于状态i,经过时间t 后转移到状态j 的转移概率.定义5.2 若(5.2)式的转移概率与s 无关,则称连续时间马尔可夫链具有平稳的或齐次的转移概率,此时转移概率简记为 ),(),(t p t s p ij ij =其转移概率矩阵简记为).0,,()),(()(≥∈=t I j i t p t P ij以下的讨论均假定我们所考虑的连续时间马尔可夫链都具有齐次转移概率.简称为齐次马尔可夫过程.假设在某时刻,比如说时刻0,马尔可夫链进入状态i,而且接下来的s 个单位时间单位中过程未离开状态i,(即未发生转移),问随后的t 个单位时间中过程仍不离开状态i 的概率是多少呢?由马尔可夫我们知道,过程在时刻s 处于状态i 条件下,在区间[s,s+t]中仍然处于i 的概率正是它处于i 至少t 个单位的无条件概率..若记i h 为记过程在转移到另一个状态之前停留在状态i 的时间,则对一切s,t 0≥有},{}{t h P s h t s h P i i i >=>+>可见,随机变量i h 具有无记忆性,因此i h 服从指数分布.由此可见,一个连续时间马尔可夫链,每当它进入状态i,具有如下性质: (1) 在转移到另一状态之前处于状态i 的时间服从参数为i v 的指数分布;(2) 当过程离开状态i 时,接着以概率ij p 进行状态j,1=∑≠ij ij p .上述性质也是我们构造连续时间马尔可夫链的一种方法.当∞=i v 时,称状态i 为瞬时状态,因为过程一旦进入此状态立即就离开.0=i v 时,称状态i 为吸收状态,因为过程一旦进入状态就永远不再离开了.尽管瞬时状态在理论上是可能的,但以后假设对一切i, ∞<≤i v 0.因此,实际上一个连续时间的马尔可夫链是一个这样的随机过程,它按照一个离散时间的马尔可夫链从一个状态转移到另一个状态,但在转移到下一个状态之前,它在各个状态停留的时间服从指数分布.此外在状态i 过程停留的时间与下一个到达的状态必须是相互独立的随机变量.因此下一个到达的状态依赖于i h ,那么过程处于状态i 已有多久的信息与一个状态的预报有关,这与马尔可夫性的假定相矛盾.定理5.1 齐次马尔可夫过程的转移概率具有下列性质:;0)1(≥ij p (2);1=∑∈ij Ij p(3) ∑∈=+Ik kj ik ij s p t p s t p )()()(.其中(3)式即为连续时间齐次马尔可夫链的切普曼—柯尔哥洛夫方程. 证明 只证(3).由全概率公式及马尔可夫性可得 ===+=+)})0()({)(i X j s t X P s t p ij =∑∈===+Ik i X k t X j s t X P })0()(,)({=})()({})0()({k t X j s t X P i X k t X P Ik ==+==∑∈∑∈=Ik kj ik s p t p )()(.对于转移概率)(t p ij ,一般还假定它满足:⎩⎨⎧≠==→.,0,1)(lim 0j i ji t p ij t(5.3)称(5.3)式为正则条件.正则条件说明,过程刚进入某状态不可能立即又跳跃到另一状态.这正好说明一个物理系统要在有限时间内发生限多次跳跃,从而消耗无穷多的能量这是不可能的.定义5.3 对于任 一0≥t 记 },)({)(j t X P t p j ==,},)0({)0(I j j X P p p j j ∈===分别称}{},),({,I j p I j t p j j ∈∈ 齐次马尔可夫过程的绝对概率分布和初始概率分布.定理5.2齐次马尔可夫过程的绝对概率及有限维概率分布具有下列性质: (1) ,0)(≥t p j (2),1)(=∑∈t p j Ij(3) )()(t p p t p ij Ii i j ∑∈=;(4) );()()(h p t p h t p ij Ii i j ∑∈=+(5)).()...(})(,...,)({112111211-∈--====-∑n n i i i i ii Ii i n n t t p t t p p p i t X i t X p n n例5.1试证明泊松过程}0),({≥t t X 为连续时间齐次马尔可夫链. 证明 先证泊松过程具有马尔可夫性,再证明齐次性.由泊松过程的定义它是独立增量过程,且X(0)=0.11,...0+<<<n n t t t ,有})(,...,)()({1111n n n n i t X i t X i t X P ===++= ,.)0()()()({1111i X t X i i t X t X P n n n n =--==-++ =,111212)()(,...)()(---=--=-n n n n i i t X t X i i t X t X } = })()({11n n n n i i t X t X P -=-++ . 另一方面,因为})()({11n n n n i t X i t X P ==++=})0()()()({11n n n n n n i X t X i i t X t X P =--=-++ =})()({11n n n n i i t X t X P -=-++所以})(,...,)()({1111n n n n i t X i t X i t X P ===++=})()({11n n n n i t X i t X P ==++. 即泊松过程是一个连续时间马尔可夫过程.以下证明齐次性. 当i j ≥ 时,由泊松过程的定义})()({i s X j t s X P ==+= })()({i j s X t s X P -=-+=)!()(i j t eij t---λλ j<i.时,由于过程的增量只取非负整数,故,0),(=t s p ij 所以⎪⎩⎪⎨⎧<≥-==--i j ij i j t e t p t s p i j t ij ij ,0,)!()()(),(λλ, 即转移概率只与t 有关,泊松过程具有齐次性.5.2柯尔莫哥洛夫微分方程对于连续时间齐次马尔可夫链转移概率)(t p ij 的求解一般比较复杂.下面首先讨论)(t p ij 的可微性及)(t p ij 满足的柯尔莫哥洛夫微分程.引理5.1 设齐次马尔可夫过程满足正则性条件(5.3),则对于任意固定的)(,,t p I j i ij ∈是t 的一致连续函数.证明 设h>0,由定理5.1得)()()()()(t p t p h p t p h t p ij rj Ir ir ij ij -=-+∑∈)()()()()(t p t p h p t p h p ij ij ii rj ir ir -+=∑≠=)()](1[)()(t p h p t p h p ij ii rj ir ir --=∑≠故有)],(1[)()](1[)()(h p t p h p t p h t p ii ij ii ij ij --≥--=-+ ),(1)()()()()(h p h p t p h p t p h t p ii ir ir rj ir ir ij ij -=≤≤-+∑∑≠≠因此).(1)()(h p t p h t p ii ij ij -≤-+对于h<0,同样有).(1)()(h p t p h t p ii ij ij --≤-+ 综上所述得到).(1)()(h p t p h t p ii ij ij -≤-+ 由正则性条件知,0)()(lim 0=-+→t p h t p ij ij h 即)(t p ij 关于t 是一致连续的.以下我们恒设齐次马尔可夫过程满足正则性条件(5.3)式.定理5.3 设)(t p ij 是齐次马尔可夫过程的转移概率,则下列极限存在 (1);)(1lim 0∞≤==∆∆-→∆ii i ii t q v t t p (2).,)(lim 0j i q tt p ij ij t ≠∞<=∆∆→∆我们称ij q 为齐次马尔可夫过程从状态i 到状态j 的转移概率或跳跃强度.定理中的极限的概率意义为:在长为t ∆的时间区间内,过程从状态i 转移到另一其他状态的转移概率为)(1t p ii ∆-等于t q ii ∆加一个比t ∆高阶的无穷小量,而过程从状态i 转移到状态j 的转移概率为)(t p ij ∆等于t q ij ∆加一个比t ∆高阶的无穷小量. 推论 对有限齐次马尔可夫过程,有 ∞<=∑≠ij ij ii q q证明 由定理5.1 ,有)()(1,1)(t p t p t pij ij ii Ij ij∆=∆-=∆∑∑≠∈由于求和是在有限集中进行,故有.)(lim )(1lim 00∑∑≠≠→∆→∆=∆∆=∆∆-=ij ij ij i j t ii t ii q t t p t t p q (5.4)对于状态空间无限的齐次马尔可夫过程,一般只有 ∑≠≥ij ij ii q q .若连续时间齐次马尔可夫是具有有限状态空间I={0,1,2,…,n},则其转移速率构成以下形式的矩阵⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡---=nn n n n n q q q q q qq q q Q .....................11111000100 (5.5) 由(5.4)式知,Q 矩阵的每一行元素之和为0,对角线元素为负或0,其余.0,≥ij q 利用Q 矩阵可以推出任意时间间隔t 的转移概率所满足的方法组,从而可以求解转移概率.由切普曼---柯尔莫哥洛夫方程有 ),()()(t p h p h t p Ik kj ik ij ∑∈=+或等价地)()](1[)()()()(t p h p t p h p t p h t p ij ii kj ik ik ij ij --=-+∑≠两边除以h 后令0→h 取极限,应用定理5.3得到 )()()(lim )()(lim 00t p q t p hh p ht p h t p ij ii kj ik ik h ij ij h -=-+∑≠→→ (5.6) 假定在(5.6)式的右边可交换极限与求和,再运用定理5.3,于是得到以下结论: 定理5.4 (柯尔莫哥洛夫向后方程)假设,ii ik ik q q =∑≠则对一切i,j 及0≥t ,有,)()(ij ii ik kj ik ijp q t p q t p -='∑≠ (5.7) 证明 只要证明(5.6)式右边极限与求和可交换次序.现在对于任意固定的N,有≥∑≠→)()(inflim 0t p hh p kj ik ik h )()()(inf lim ,,0t p q t p h h p kj Nk i k ik kj Nk i k ik h ∑∑<≠<≠→= 因为上式对一切N 成立,所以)()()(inflim ,,0t p q t p h h p kj i k ik kj i k ik h ∑∑≠≠→≥ (5.8) 为了倒转不等式,注意对于N>i,由于,1)(≤t p kj 所以 ≤∑≠→)()(sup lim ,0t p hh p kj i k ik h ≤+≤∑∑≥<≠→])()()(sup[lim ,0Nk ik kj Nk i k ik h h h p t p h h p ≤--+≤∑∑<≠<≠→])()(1)()(sup[lim ,,0Nk i k ik ii kj Nk i k ik h h h p h h p t p h h p ,)(,,∑∑<≠<≠-+≤Nk i k ikii kj Nk i k ikqq t p q令∞→N ,由定理5.3和条件得)()()(sup lim ,,0t p q t p h h p kj i k ik kj i k ik h ∑∑≠≠→≤. 上式连同(5.8)可得 )()()(lim ,,0t p q t p h h p kj i k ik kj i k ik h ∑∑≠≠→=.定理5.4中)(t p ij 满足的微分方程组以柯尔莫可洛夫向后方程著称.称它们为向后方程,是因为在计算时刻t+h 的状态的概率分布时我们对退后到时刻h 的状态取条件,即我们从)()(})0()({..})(,)0()({)(h p t p i X k h X P k h X i X j h t X P h t p ik Ik kj Ik ij ∑∑∈∈======+=+开始计算.对时刻t 的状态取条件,我们可以导出另一组方程,称为柯尔莫哥洛夫向前方程.可得),()()(h p t p h t p kj Ik ik ij ∑∈=+)()()()()(t p h p t p t p h t p ij kj Ik ik ij ij -=-+∑∈=)()](1[)()(t p h p h p t p ij jj kj jk ik --=∑≠,所以 )}.()(1)()({lim )()(lim 00t p h h p h h p t p ht p h t p ij jj kj jk ik h ij ij h --=-+∑≠→→假定我们能交换极限与求和,则由定理5.3便得到),()()(t p q q t p t p ij ii jk kj ik ij-='∑≠ 令人遗憾的是上述极限与求和的交换不是恒成立,所以上式并非总是成立.然而在大多数模型中----包括全部生灭过程与全部有限状态的模型,它们是成立的. 定理5.5(柯尔莫哥洛夫向前方程) 在适当的正则条件下,,)()()(jj ij kj ik ik ijq t p q t p t p -='∑≠ (5.9) 利用方程组(5.7)或(5.9)及初始条件 .,0)0(,1)0(j i p p ij ii ≠==我们可以解得)(t p ij .柯尔莫哥洛夫向后和向前方程虽然形式不同,但是可以证明它们所求得的解)(t p ij 是相同的.在实际应用中,当固定最后所处状态j,研究)(t p ij 时(i=0,1,2,…,n),采用向后方程比较方便;当固定状态i,研究)(t p ij 时(j=0,1,2,…,),则采用向前方程较方便.向后方程和向前方程可以写成矩阵形式),()(t QP t P =' (5.10) ,)()(Q t P t P =' (5.11) 其中⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡---= (222120121110)020100q q q q q qq q q Q ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=............ (222120121110)020100p p p p p pp p p P 这样,连续时间马尔可夫链的转移概率的求解问题就是矩阵微分方程的求解问题,其转移概率由其转移速率矩阵Q 决定.特别地,若Q 是一个有限维矩阵,则(5.10)和(5.11)的解为 .!)()(0∑∞===j jQtj Qt et P定理5.6 .齐次马尔可夫过程在t 时刻处于状态I j ∈的绝对概率)(t p j 满足下列方程:.)()()(kj jk k jj j j q t p q t p t p ∑≠+-=' (5.12)证明 由定理5.2,有)()(t p p t p ij Ii i j ∑∈=t将向前方程(5.9)式两边乘以,i p 并对i 求和得.)())(()(kj jk ikiIi jj ijiIi ijIi iq t pp q t pp t p p ∑∑∑∑≠∈∈∈+-='故 .)()()(kj jk k jj j j q t p q t p t p ∑≠+-=' .与离散马尔可夫链类似,我们讨论转移概率 )(t p ij 当 ∞→t 时的极限分布与平稳分布的有限性质.定义5.4 设)(t p ij 为连续时间马尔可夫链的转移概率,若存在时刻 21,t t ,使得 ,0)(1>t p ij ,0)(2>t p ij则称状态i 和j 是互通的.若所有状态都是互通的,则称此马尔可夫链为不可约的.定理5.7 设连续时间的马尔可夫是不可约的,则有下列性质:(1) 若它是正常返的,则极限)(lim t p ij t ∞→存在且等于.,0I j j ∈>π这里.,0I j j ∈>π是方程组1,==∑∑∈≠Ij j kj jk k jj j q q πππ (5.13)的唯一非负解.此时称.,0{I j j ∈>π是该过程的平稳分布,并且有 .)(lim j j t t p π=∞→ (2) 若它是零常返的或非常返的,则.,,0)(lim )(lim I j i t p t p j t ij t ∈==∞→∞→在实际问题中,有些问题可以用柯尔莫哥洛夫方程直接求解,有些问题虽然不能求解但是可以用方程(5.13)求解.例5.2 考虑两个状态的连续时间马尔可夫链,在转移到状态1之前链在状态0停留的时间是参数为λ的指数变量,而在回到状态0之前它停留在状态1的时间是参数为μ的指数变量,显然该链是一个齐次马尔可夫过程,其状态转移概率为 ),()(01h o h h p +=λ),()(10h o h h p +=μ由定理5.3知由柯尔莫哥洛夫向前方程得到)()()(000100t p t p t p λμ-='=,)()(00μμλ++-t p 其中最后一个等式来自).(1)(0001t p t p -=因为,1)0(00=p 由常数变易法得 ,)()(00t e t p μλμλλμλμ+-+++=若记,,00μλμμμλλλ+=+=则,)()(0000t e t p μλλμ+-+=类似地由向前方程)()()(010001t p t p t p μλ-=' 可解得 ,)()(0001t e t p μλλλ+--=,)()(lim )(1lim 1001010011011q h p dhdhh p h h p q h h h ====-==→→μ,)()(lim )(1lim 0100101000000q h p dhdhh p h h p q h h h ====-==→→λ由对称性知,)()(0011t e t p μλμλ+-+= ,)()(0010t e t p μλμμ+--= 转移概率的极限为),(lim )(lim 10000t p t p t t ∞→∞→==μ),(lim )(lim 11001t p t p t t ∞→∞→==λ 由此可见,当∞→t 时, )(t p ij 的极限存在且与i 无关.定理5.6知,平稳分布为 0100,λπμπ== 若取初始分布为平稳分布,即,}0)0({00μ===p X P ,}1)0({01λ===p X P 则过程在时刻t 的绝对概率分布为 )()()(1010000t p p t p p t p +==0)(000)(00]1[][μμλμλμμλμλ=-+++-+-t t e e=0)(000)(00][]1[λμλλλμμλμλ=++-+-+-t t e e .例5.3 机器维修问题.设例5.2中状态0代表某机器正常工作状态1代表机器出故障.状态转移概率与例5.2相同,即在h 时间内,机器从正常工作变为出故障的概率为),()(01h o h h p +=λ在h 时间内,机器从有故障变为经修复后正常工作的概率为),()(10h o h h p +=μ试求在t=0时正常工作的机器,在t=5时为正常工作的概率. 解 由例5.2已求得该过程的Q 矩阵为⎪⎪⎭⎫⎝⎛--=μμλλQ .根据题意,要求机器最后所处的状态为正常工作,只需计算)(00t p 即可. 由例5.2知,)()(0000t e t p μλλμ+-+=,,00μλμμμλλλ+=+=故 ,)5(5)(0000μλλμ+-+=e p 因为P{X(0)=0}=1=,0p 所以====)5()5(}0)5({0000p p p X P .)5(5)(0000μλλμ+-+=e p)()()(1010101t p p t p p t p +=5.3 生灭过程连续时间马尔可夫链的一类重要特殊情形是生灭过程,它的特征是在很短的时间内,系统的状态只能从状态i 转移到状态i-1或i+1或保持不变,确切定义如下. 定义5.5 设齐次马尔可夫过程}0),({≥t t X 的状态空间为I={0,1,2,…},转移概率为)(t p ij ,如果,0),()(1,>+=+i i i i h o h h p λλ,0,0),()(01,=>+=-μμμi i i i h o h h p),()(1)(,h o h h p i i i i ++-=μλ则称 }0),({≥t t X 为生灭过程,i λ为出生率, i μ为死亡率.若,λλi i =μλμμ,(,i i =是正常数),则称}0),({≥t t X 为线性生灭过程. 若0≡i μ,则称}0),({≥t t X 为纯生过程. 若0≡i λ,则称}0),({≥t t X 为纯灭过程. 生灭过程可作如下概率解释:若以X(t)表示一个生物群体在t 时刻的大小,则在很短的时间h 内(不计高阶无穷小),群体变化有三种可能,状态由i 变到i+1,即增加一个个体,其概率为h i λ;.状态由i 变到i-1,即减少一个个体,.其概率为h i μ;群体大小保持不变,其概率为.)(1h i i μλ+-由定理5.3得到,0,)()(,0≥+=-==i h p dh d t q i i h ii ii μλ ⎩⎨⎧≥-=≥+====,1,1,,0,1,)()(0i i j i i j h p dh d t q ii h ij ij μλ ,2,0≥-=j i q ij故柯尔莫哥洛夫向前方程为.,),()()()()(1,11,1I j i t p t p t p t p j i j ij j j j i j ij∈++-='++--μμλλ 故柯尔莫哥洛夫向后方程为.,),()()()()(,11,I j i t p t p t p t p j i i ij j j j i i ij∈++-='+-λμλμ 因为上述方程组的求解较为困难,我们讨论其平稳分布.由(5.13)式,有 ,1100πμπλ=,2),()(,≥-=j i h o h p j i.1,)(1111≥+=+++--j j j j j j j j πμπλπμλ逐步递推得,0101πμλπ=…, ,11--=j jj j πμλπ 再利用11=∑∞=j j π,得平稳分布,11211100)......1(-∞=-∑+=j j j μμμλλλπ, 112111021110)......1(......-∞=--∑+=j jj j j j μμμλλλμμμλλλπ 例5.4 生灭过程例子M/M/S 排队系统.假设顾客按照参数为λ的泊松过程来到一个有s 个服务员的服务站,即相继来到之间的时间是均值为λ1的独立指数随机变量,每一个顾客一来到,如果有服务员空闲,则直接进行服务,否则此顾客加入排队系列.当一个服务员结束对一位顾客的服务时顾客就离开服务系统,排队中的下一顾客进入服务. 假定相继的服务时间是独立的指数随机变量,均值为μ1.如果我们以X(t)记时刻t 系统中的人数,则}0),({≥t t X 是生灭过程⎩⎨⎧>≤≤=,,,1,s n s s n n n μμμ .0,≥=n n λλM/M/s 排队系统中M 表示马尔可夫过程,s 代表s 个服务员.特别在M/M/1排队系统中,μμλλ==n n ,,若1<μλ,则由(5.14)可得.0),1()()(1)(1≥-=+=∑∞=n n n nnn μλμλμλμλπ。

相关文档
最新文档