第章离散时间的马尔可夫链
随机过程第四章马尔可夫链

0,
p(n) ij
1, i,
jI
jI
即P(n)也为随机矩阵.
当n
1时,
p (1) ij
pij
,
P (1)
P
当n
0时,规定pi(j0)
0 , i 1 , i
j j
13
4.1 马尔可夫链与转移概率
• 定理4.1 设{Xn, nT}为马尔可夫链, 则对任意 整数n0, 0l<n和i,jI, n步转移概率 p具i(jn) 有性
Ckx 0
pxqy ,
,
k ( j i)为偶数 k ( j i)为奇数
11
4.1 马尔可夫链与转移概率
例4.4 具有吸收壁和反射壁的随机游动状态空间 {1,2,3,4}, 1为吸收壁, 4为反射壁.
解:状态转移图
状态转移矩阵
1 3
1 0 0 0
1
1
3
1 1
3
1
1
1 1 1
1 3
1 3
2
P 3
5
4.1 马尔可夫链与转移概率
= =P{Xn=in|Xn-1=in-1}P{Xn-1=in-1 |Xn-2=in-2}
P{X1=i1|X0=i0}P{X0=i0} 马尔可夫链的统计特性完全由条件概率 P{Xn+1=in+1|Xn=in}确定。
6
4.1 马尔可夫链与转移概率
定义 称条件概率pij(n)= P{Xn+1=j|Xn=i} 为马尔 可夫链{Xn, nT}在时刻n的一步转移概率,简 称转移概率,其中i,jI.
P{X 0 i}P{X1 i1 | X 0 i} iI
P{X 2 i2 | X1 i1} P{X n in | X n1 in1}
第6讲 第4章马尔科夫链

P=
2 1/3 1/3 1/3 0 0
3
0
1/3 1/3 1/3
0
1
2
345源自4 0 0 1/3 1/3 1/3
5 0 0 0 0 1
.
称状态 5 为吸收态。 吸收态是位于对角线上的概率1所对应的状态。 吸收态也是马尔科夫链研究的一个问题。 ---- 但是本教材对此不作过多讨论
.
例4.3 无限制随机游动
质点在数轴的整点上做随机游动,每次移动一格,向 右移动概率为p,向左移动概率为q(p+q=1), X n 表 示质点在n时所处的位置,则 Xn 是一齐次马尔科夫链, 写出一步和k步转移概率。
解 状态空间I={0,±1,±2,…}
pi,i1 p,
pi,i1 q,
M M M M L
L
0
p
L
P L q 0 p
L
q
0
p
L
MMMM
.
例4. 生灭链
某种生物群体在n时刻的数量为 X n ,n时刻有 量时,到n+1时刻增加到 i 1 个数量的概率为
i 个数
bi ,
减少到 i 1 个数量的概率为 ai ,保持数量不变的概
率为 ri 1 ai bi 。 a0 0
则 Xn ,n 0 是齐次马尔科夫链。
状态空间I={0, 1,2,…}
P X 0 i0 P X n1 i1 | X 0 i0 L P X nm im | X 0 i0 ,L X nm1 im1
在甲获得1分的情况下, 再赛2局比赛结束的概率: p(1 r) .
.
注1:为方便,我们也可把这5个状态依次用序号表示。
比如 p23表示:甲现处于第二个状态,一步后变为第3
马尔可夫链▏小白都能看懂的马尔可夫链详解

马尔可夫链▏小白都能看懂的马尔可夫链详解1.什么是马尔可夫链在机器学习算法中,马尔可夫链(Markov chain)是个很重要的概念。
马尔可夫链(Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain),因俄国数学家安德烈·马尔可夫(俄语:Андрей Андреевич Марков)得名,为状态空间中经过从一个状态到另一个状态的转换的随机过程。
该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。
这种特定类型的“无记忆性”称作马尔可夫性质。
马尔科夫链作为实际过程的统计模型具有许多应用。
在马尔可夫链的每一步,系统根据概率分布,可以从一个状态变到另一个状态,也可以保持当前状态。
状态的改变叫做转移,与不同的状态改变相关的概率叫做转移概率。
随机漫步就是马尔可夫链的例子。
随机漫步中每一步的状态是在图形中的点,每一步可以移动到任何一个相邻的点,在这里移动到每一个点的概率都是相同的(无论之前漫步路径是如何的)。
2.一个经典的马尔科夫链实例用一句话来概括马尔科夫链的话,那就是某一时刻状态转移的概率只依赖于它的前一个状态。
举个简单的例子,假如每天的天气是一个状态的话,那个今天是不是晴天只依赖于昨天的天气,而和前天的天气没有任何关系。
这么说可能有些不严谨,但是这样做可以大大简化模型的复杂度,因此马尔科夫链在很多时间序列模型中得到广泛的应用,比如循环神经网络RNN,隐式马尔科夫模型HMM等。
假设状态序列为由马尔科夫链定义可知,时刻Xt+1 的状态只与Xt 有关,用数学公式来描述就是:既然某一时刻状态转移的概率只依赖前一个状态,那么只要求出系统中任意两个状态之间的转移概率,这个马尔科夫链的模型就定了。
看一个具体的例子。
这个马尔科夫链是表示股市模型的,共有三种状态:牛市(Bull market), 熊市(Bear market)和横盘(Stagnant market)。
马尔可夫链

P (x n 1 k | x 0 i )P (x n j | x n 1 k ) rij (n 1)Pkj
k 1 k 1 m
m
n 步转移概率矩阵: rij (n ) 看成一个二维矩阵第 i 行第 j 列的元素。 讨论 n 时: 例 1 中,每一个 rij (n ) 都收敛于一个极限值,不依赖于初始状态 i。
Wj Wk pkj
k 1 m
1 Wk
k 1
m
3、另外有
Wj 0 ,对于所有的非常返状态 j Wj 0 ,对于所有的常返状态 j
1 Wm ] [0 0 1] ,可用 MATLAB 解决。 pm1 pmm 1 1
P(x 0 i0 , x1 i1, , x n in ) P(x 0 i0 )Pi i Pi i Pi
01 12 n 1 n
i
图形上,一个状态序列能表示为在转移概率图中的一个转移弧线序列。在给定初始状态下, 该路径的概率等于每个弧线上转移概率的乘积。 n 步转移概率 定义: rij (n ) P (x n i | x 0 i ) 计算在当前状态条件下,未来某个时期状态的概率分布。 当前状态 i,n 个时间段后的状态将是 j 的计算公式:C-K 方程
1 0 0 0 0.3 0.4 0.3 0 0 0.3 0.4 0.3 0 0 1 0
转移概率图
例 3:一个教授抽取测试卷子。卷子的难度分成 3 种:困难、中等和容易。如果本次抽到的 困难的卷子,则下次分别有 0.5 的概率抽中中等和容易的卷子。如果本次抽到的是中等的卷 子,则下次仍旧 0.5 的概率为中等难度,另外有 0.25 的概率抽中困难或容易的卷子。如果本 次抽到的是容易的卷子, 则下次仍旧 0.5 的概率为容易难度, 另外有 0.25 的概率抽中困难或 中等的卷子。 转移概率矩阵
离散时间马氏链 -回复

离散时间马氏链-回复离散时间马尔可夫链(Discrete-Time Markov Chain)是一种随机过程,它的状态在离散的时间步长内发生变化。
这种变化是由一个概率转移矩阵来描述的,该矩阵表示从一个状态转移到另一个状态的概率。
本文将逐步介绍离散时间马尔可夫链的基本概念、性质以及其在实际中的应用。
一、基本概念1. 马尔可夫链:马尔可夫链是一种特殊的随机过程,它满足无后效性,即当前状态只与前一状态有关,而与其他历史状态无关。
2. 状态空间:马尔可夫链的状态空间是所有可能状态的集合。
3. 转移概率:在马尔可夫链中,从一个状态转移到另一个状态的概率称为转移概率。
4. 初始分布:马尔可夫链的初始状态分布通常用一个向量来表示,这个向量的每个元素对应于状态空间中的一个状态,其值表示开始时处于该状态的概率。
5. 转移矩阵:马尔可夫链的转移矩阵是一个方阵,其中的每个元素表示从一个状态转移到另一个状态的概率。
二、性质1. 无后效性:马尔可夫链最重要的特性就是无后效性,也称为马尔可夫性质。
这意味着系统未来的状态只与当前状态有关,而不依赖于过去的任何状态。
2. 平稳分布:如果一个马尔可夫链在经过足够长时间后,无论初始状态如何,其状态分布都会收敛到一个固定的分布,那么这个分布就称为平稳分布。
3. 回顾性和展望性:回顾性是指系统的当前状态可以完全由过去的状态决定;展望性则是指系统的未来状态只与当前状态有关。
三、应用1. 信息检索:在信息检索中,马尔可夫链可以用来预测用户下一个可能的查询词,从而提高搜索结果的相关性。
2. 自然语言处理:马尔可夫链模型被广泛应用于自然语言处理任务,如词性标注、命名实体识别等。
3. 生物信息学:马尔可夫链模型在生物信息学中有多种应用,如蛋白质序列分析、基因结构预测等。
4. 经济学和金融学:马尔可夫链模型也被用于经济学和金融学领域,如股票价格预测、经济周期分析等。
四、总结离散时间马尔可夫链是一种重要的随机过程模型,其无后效性的特性使得它在许多领域都有广泛的应用。
12离散参数马氏链上

例1 Bernoulli序列是离散参数齐次马尔可夫
链. 验证 在Bernoulli序列{Xn,n=1,2,3,}中, 对任
意正整数 m, t1 t2 tm tm1
X t1 , X t2 , , X tm , X tm1 相互独立, 故对
jk 0,1, (k 1, 2,, m 1)
P{X (tm ) i}
四. 离散参数齐次马尔可夫链
定义3 设离散参数马尔可夫链
{X (t),t t0 ,t1,t2 ,,tn ,}
如果一步转移概率pij(tm)不依赖于参数tm 即对任意两个不等的参数tm和tk, mk,有
pij (tm ) pij (tk ) pij
则称此马尔可夫链具有齐次性或时齐性,称 X(t)为离散参数齐次马尔可夫链.
对于状态空间S内的任意两个状态 i 和j , 恒有
(1)
p(n) ij
(tm
)
0
(2)
p(n) ij
(tm
)
1,
n
1,
2,
jS
p(n) ij
(tm
)
P{X (tmn ) j | X (tm ) i}
jS
jS
P{X (tmn )
jS
j, X (tm ) i}
P{X (tm )
i}
1
P{X (tm ) i}
二.马尔可夫链的分类
状态空间S是离散的(有限集或可列集),参数 集T可为离散或连续的两类.
本课程主要介绍离散参数马尔可夫链.
三.离散参数马尔可夫链
1. 转移概率
定义2 设离散参数马尔可夫链 {X (t),t t0 ,t1,t2 ,,tn ,}
条件概率 P{X (tm1) j | X (tm ) i} pij (tm ) 称为X(t)在时刻(参数)tm由状态 i 一步转
马尔可夫链的基本原理和使用方法

马尔可夫链是一个非常有趣的数学概念,它在许多领域都有着重要的应用,包括自然语言处理、金融建模、生物信息学等。
本文将介绍马尔可夫链的基本原理和使用方法,希望能够帮助读者更好地理解和应用这一概念。
马尔可夫链最早由俄罗斯数学家安德烈·马尔可夫在20世纪初提出,它是一种描述离散时间随机过程的数学工具。
在马尔可夫链中,当前状态的未来发展只依赖于当前状态,而不依赖过去的状态。
换句话说,马尔可夫链具有“无记忆”的性质,每一步的转移只与当前状态有关。
马尔可夫链由状态空间、初始概率分布和状态转移概率矩阵组成。
状态空间指的是系统可能处于的所有状态的集合,初始概率分布指的是系统在初始时刻各个状态的概率分布,状态转移概率矩阵则描述了系统从一个状态转移到另一个状态的概率。
通过这些元素,我们就可以描述一个离散时间的随机过程,并进行相应的分析和计算。
在实际应用中,马尔可夫链经常用来建模一些具有随机性的现象。
举一个简单的例子,假设我们想要模拟一个赌博游戏,玩家可以选择抛硬币正面朝上或者反面朝上。
我们可以用一个2个状态的马尔可夫链来描述这个游戏,其中状态1表示硬币正面朝上,状态2表示硬币反面朝上。
我们可以通过状态转移概率矩阵来描述硬币抛掷的规律,然后利用马尔可夫链的性质来计算玩家在游戏中的各种概率。
除了简单的模拟之外,马尔可夫链还可以用来解决一些实际问题。
例如,我们可以利用马尔可夫链来建立语言模型,从而实现自然语言处理中的词语预测和生成。
在这种应用中,状态空间对应于词语的集合,状态转移概率矩阵则描述了词语之间的转移规律。
通过对大量文本数据的训练和学习,我们可以得到一个基于马尔可夫链的语言模型,从而实现对文本的自动处理和生成。
另外,马尔可夫链还可以用来进行金融建模。
在金融市场中,许多价格的变化具有随机性,这就为马尔可夫链的应用提供了机会。
我们可以利用马尔可夫链来建立股票价格的模型,从而进行风险管理、投资决策等方面的分析。
第四章 马尔可夫链

第四章 马尔可夫链随机过程在不同时刻下的状态之间一般具有某种关系,马尔可夫(Markov )过程就是描述一类状态之间具有某种特殊统计联系的随机过程.Markov 过程在近代物理学、生物学、管理科学、信息处理与数字计算方法等领域都有重要的应用.按其状态和时间参数是连续的或离散的,它可分为三类:(1)时间、状态都是离散的Markov 过程,称为Markov 链;(2)时间连续、状态离散的Markov 过程,称为连续时间的Markov 链;(3)时间、状态都连续的Markov 过程.本章主要讨论Markov 链,有关连续时间的Markov 链的相关理论将在下章讨论.4.1 马尔可夫链的概念和例子独立随机试验模型最直接的推广就是Markov 链模型,早在1906年俄国数学家Markov 对它进行研究而得名,以后Kolmogorov 、Feller 、Doob 等数学家发展了这一理论.4.1 .1 Markov 链的定义假设Markov 过程{,}n X n T ∈的参数集T 是离散时间集合,即{0,1,2,}T =,相应n X 可能取值的全体组成的状态空间是离散状态集012{,,,}I i i i =.定义 4.1 设有一随机过程{,}n X n T ∈,若对于任意整数n T ∈和任意011,,,n i i i I +∈,条件概率满足11001111{|,,,}{|}n n n n n n n n P X i X i X i X i P X i X i ++++=======则称{,}n X n T ∈为离散时间的Markov 链,简称Markov 链(Markov chains )或马氏链.从定义可以看出:Markov 链具有Markov 性(即无后效性),如果把时刻n 看作现在,那么,1n +是将来的时刻,而0,1,2,,1n -是过去的时刻.Markov 性表示在确切知道系统现在状态的条件下,系统将来的状况与过去的状况无关,而且Markov 链的统计特征完全由条件概率11{|}n n n n P X i X i ++==所决定. 因此,如何确定这个条件概率,是研究Markov 链理论和应用中十分重要的问题之一. 4.1.2 转移概率定义 4.2 称条件概率1(){|}ij n n p n P X j X i +=== (4.1)为Markov 链{,}n X n T ∈在时刻n 的一步转移概率,其中,i j I ∈,简称转移概率(transition probability ).一般地,转移概率()ij p n 不仅仅与状态,i j 有关,而且与时刻n 有关,如果()ij p n 不依赖时刻n 时,则称Markov 链具有平稳转移概率.定义 4.3 若对任意,i j I ∈,Markov 链{,}n X n T ∈的转移概率()ij p n 与n 无关,则称Markov 链是齐次的(或称时齐的)(time homogeneous -),并记()ij p n 为ij p . 下面只讨论齐次Markov 链,并且通常将“齐次”两字省去.定义 4.4 设P 表示一步转移概率ij p 所组成的矩阵,且状态空间{1,2,}I =,则1112121222...........................n n p p p P p p p ⎛⎫ ⎪= ⎪ ⎪⎝⎭称为系统状态的一步转移概率矩阵(transition probability matrix ),它具有性质: (1)0,,ij p i j I ≥∈; (2)1,ijj Ipi I ∈=∈∑.(2)式说明一步转移概率矩阵中任一行元素之和为1,通常称满足性质(1)(2)的矩阵为随机矩阵.定义 4.5 称条件概率(){|},n ij m n m p P X j X i +=== ,,0,1i j I m n ∈≥≥ (4.2)为Markov 链{,}n X n T ∈的n 步转移概率,并称()()()n n ij P p =为Markov 链{,}n X n T ∈的n 步转移矩阵.其中()()0,1n n ij ij j Ip p ∈≥=∑,即()n P 也是一个随机矩阵.特别地,当1n =时,(1)ij ij p p =,此时,一步转移矩阵(1)P P =.我们还规定(0)0,1,iji jpi j ≠⎧=⎨=⎩Markov 链n 步转移概率满足重要的Chapman Kolmogorov -方程(简称C K -方程)。
马尔可夫链是状态离散时间

马尔可夫链是状态离散时间1.引言1.1 概述马尔可夫链,又被称为马尔可夫过程,是一种离散时间的随机过程。
它的独特之处在于其未来状态的概率只与当前状态有关,与其过去状态无关。
这种特性使马尔可夫链成为研究系统状态演变和预测的重要数学工具。
马尔可夫链的应用广泛,涉及到许多领域。
例如,在自然语言处理中,马尔可夫链被用来建模文本语言的演化规律和预测下一个单词的出现概率。
在金融领域,马尔可夫链被用来分析股票价格的变化和预测市场趋势。
在生物学中,马尔可夫链被应用于研究DNA序列的特征和分析蛋白质结构。
通过理解和应用马尔可夫链,我们可以更好地理解和预测系统的演变过程。
它为我们提供了一种数学模型,用于描述和解决许多现实世界中的问题。
马尔可夫链不仅具有理论意义,更有着广泛的实际应用,为众多领域的研究人员提供了有力的工具和方法。
本文将全面探讨马尔可夫链的定义、特点以及其在各个领域中的应用。
通过对其重要性的总结,我们可以更好地认识到马尔可夫链在研究和理解系统状态演变方面的价值。
并且,我们还将展望马尔可夫链未来的发展趋势,以期在更多领域中发挥更大的作用。
1.2 文章结构文章结构是指文章的框架和组织方式,它对于阐述主题和向读者传达清晰的信息非常重要。
本文主要介绍马尔可夫链及其应用领域,为了使读者更好地理解和掌握马尔可夫链的知识,本文将按照以下结构来展开讨论:第一部分是引言,主要包括概述、文章结构和目的三个方面。
在概述部分,将简要介绍马尔可夫链的基本概念和特点,引起读者的兴趣;在文章结构部分,给出全文的大致框架和组织方式,让读者对文章内容有整体的了解;在目的部分,明确本文的目标,即介绍马尔可夫链的定义、特点和应用领域,以便读者清楚知道本文的主要内容和意图。
第二部分是正文,主要包括马尔可夫链的定义和特点以及其应用领域两部分。
在马尔可夫链的定义和特点部分,将详细介绍马尔可夫链的基本定义、状态转移概率和马尔可夫性质,并解释它们的意义和特点;在马尔可夫链的应用领域部分,将列举并详细阐述马尔可夫链在自然语言处理、金融市场预测、排队系统等领域的具体应用案例,以及它们在实际应用中的作用和效果。
随机过程第四章习题解答

第四章习题解答4.1Y1,Y2,···是来自总体Y的随机变量,与X0独立,h(x,y)是实函数.对于n 1,取X n=h(X n−1,Y n).设{X n}的状态空间为I,验证{X n}是马氏链,给出转移概率p ij.解:由题知,Y k与X1,···,X k−1独立,k 1,∀n,i,j,i1,...,i n−1∈I有,P(X n+1=j|X n=i,X n−1=i n−1, (X0)i0)=P(h(i,Y n+1)=j|X n=i,X n−1=i n−1,···,X0=i0)=P(h(i,Y n+1)=j|X n=i)=P(h(i,Y)=j)=P(h(i,Y1)=j|X0=i)=P(X1=j|X0=i).∴X n是马氏链,P ij=P(h(i,Y)=j).4.2设{X i,i 0}是取非负整数值的独立同分布的随机变量序列,V ar(X0)>0.验证以下随机序列是马氏链:(a){X n,n 0};(b){S n,n 0},其中S n=∑ni=0X i;(c){ξn,n 0},其中ξn=∑ni=0(1+X i).解:∀n,i,j,i0,···,i n−1∈N+,(a).P(X n+1=j|X n=i,X n−1=i n−1,···,X0=i0)=P(X n+1=j)= P(X n+1=j|X n=i)=P(X1=j)=P(X1=j|X0=i).1第四章离散时间马尔可夫链第四章离散时间马尔可夫链(b).P(S n+1=j|S n=i,S n−1=i n−1,···,X0=i0)=P(X n+1=j−i|X n=i−i n−1,···,X0=i0)=P(X n+1=j−i)=P(X n+1=j−i,S n=i|S n=i)=P(S n+1=j|S n=i)=P(X1=j−i)=P(X1=j−i|X0=i)=P(S1=j|S0=i).(c).P(ξn+1=j|ξn=i,ξn−1=i n−1,···,ξ0=i0)=P(X n+1=ji −1)=P(X n+1=ji−1|ξn=i)=P(ξn+1=j|ξn=i)=P(X1=ji −1)=P(X1=ji−1|X0=i)=P(ξ1=j|ξ0=i).4.3马氏链的状态空间是I=(1,2,3,4,5),转移概率矩阵P=0.20.80000.50.5000000.50.500.20.3000.500001界定马氏链的状态。
第0 31_06讲马尔可夫链

= ∑ P{ξ (n + m + r ) = j / ξ (n + m) = k }
k
P{ξ (n + m) = k / ξ (n) = i} P{ξ (n + m) = k / ξ (n) = i}
( m) (r ) = ∑ Pik (n) ⋅Pkj ( n + m) k
证明 2 利用马尔可夫链的有限维条件概率密度可以用转移概率,有
系统在时刻 n+m 的概率分布是 P{ ξ (n + m) = j}, j = 0,1, " 写成概率分布矢量,
w (n + m) = [P{ξ (n + m) = 0}, P{ξ (n + m) = 1}, " , P{ξ (n + m) = i}, "]
它们之间的关系是,
P {ξ (n + m) = j} = ∑ P {ξ (n + m) = j / ξ (n) = i} ⋅ P {ξ (n) = i}
⎤ ⎥ ⎥ ⎥, ⎥ ⎥ ⎥ ⎦
一步转移概率矩阵的第 i 行第 j 列元素是从状态 i 转移到状态 j 的概率,每个 元素都是非负的,每一行元素的和是 1。 定义,齐次马尔可夫链 如果马尔可夫链的一步转移概率满足条件 P{ ξ (k + 1) = j / ξ (k ) = i} = Pij ,与 k 无 关,则称这个马尔可夫链是齐次的。 马尔可夫链的分析问题, 分析状态转移的概率: 按照马尔可夫链的描述,确定马尔可夫链的状态空间和一步转移概率矩阵, 按照马尔可夫链的一步转移概率矩阵,确定马尔可夫链的 n 步转移概率矩阵, 进一步分析状态的概率: 确定经过 n 步到达某个状态的概率, 确定经过 n 步第一次到达某个状态的概率, 确定常返状态的极限分布, 确定从非常返状态到达特定状态的概率分布。
马尔可夫链的基本原理和使用方法(四)

马尔可夫链的基本原理和使用方法马尔可夫链是一种随机过程,它的基本原理是当前状态的转移概率只依赖于前一个状态,和之前的状态无关。
这种特性使得马尔可夫链在许多领域都有着广泛的应用,比如金融、生态学、自然语言处理等。
在本文中,我们将探讨马尔可夫链的基本原理和使用方法。
1. 马尔可夫链的基本原理马尔可夫链的基本原理可以用数学公式来表达。
设有一个有限的状态空间S={1,2,...,n},则一个离散时间的马尔可夫链是一个序列X={X0, X1, X2, ...},其中Xi表示在第i个时刻系统所处的状态,且满足以下马尔可夫性质:P(Xi+1 = j | Xi = i0, Xi-1 = i1, ..., X0 = i0) = P(Xi+1 = j | Xi = i0)其中P(Xi+1 = j | Xi = i0)表示在当前状态为i0的情况下,下一个状态为j的概率。
这个条件概率只依赖于当前状态,和之前的状态无关,这就是马尔可夫性质。
2. 马尔可夫链的使用方法马尔可夫链在实际应用中有着广泛的用途,其中最常见的就是用来建模随机过程。
在金融领域,马尔可夫链被用来建立股票价格的模型,帮助投资者预测未来的股价走势。
在生态学中,马尔可夫链被用来研究物种的迁移和数量变化,从而帮助保护生物多样性。
在自然语言处理领域,马尔可夫链被用来建立文本生成模型,从而帮助计算机理解和生成自然语言。
除了建模随机过程外,马尔可夫链还被广泛用于解决一些特定的问题,比如:a. 随机游走随机游走是一种通过随机转移来描述某个随机过程的方法。
在数学上,随机游走可以用马尔可夫链来建模。
通过分析随机游走的性质,可以帮助我们理解和预测一些具有不确定性的现象,比如股票价格的波动、气候变化等。
b. 马尔可夫决策过程马尔可夫决策过程是一种用来描述决策问题的数学模型。
在马尔可夫决策过程中,决策者需要根据当前状态和可选的行动来选择最优的策略。
通过分析马尔可夫决策过程,可以帮助我们理解和优化一些具有随机性和不确定性的决策问题,比如供应链管理、资源分配等。
4-4离散参数马尔可夫链(4)-极限定理

Ci 是相通的常返闭集,且为有限集。因
( n) p ij 1(n 1) jci
与
n ( n) lim pij 0 jci
矛盾.故S有限时无零常返状态
解放军电子技术学院
卢
推论l 有限马尔可夫链没有零常返状态,也不 可能全是非常返. 推论2 不可约的有限马尔可夫链的状态都是正常 返状态.
的极限性质
卢
解放军电子技术学院
j为非常返状态或零常返状态
j为非常返状态或零常返状态
定理:若j为非常返状态或0常返状态,则对任意 i S
n (n) lim pij 0
(n) ( l ) ( n l ) ( l ) ( n l ) 证:pij fij p jj fij p jj l 1 l 1
lim p
n
(n) ij
1 . uj
推论3:设不可约、正常返、周期d的马氏链, 其状态空间为C,则有
( nd ) lim pij
其中C
d 1
n
Cr
r 0
d , i, j同时属于Cr j 0, 其他
卢
解放军电子技术学院
单位时间内平均返回的次数
定理:对任意状态i, j , 有 1 (k ) lim pij n n k 1
f
l 0
ij
l N 1
f ij (ld r )
卢
解放军电子技术学院
f 已证
l 0
N
ij
(ld r ) p jj ((n l )d ) pij (nd r ) fij (ld r ) p jj ((n l )d )
随机过程-第五章 马尔可夫链

0.95 0.02 0.02 0.01 0.3 0.6 0.06 0.04 P 0.2 0.1 0.7 0 0.2 0.2 0.1 0.5
P
jS
ij
1, i S 。则称该矩阵为随机矩阵。
显然,随机矩阵的各行元素之和都等于 1。
例 5.1 赌徒输光问题 :考虑一赌徒,在每局赌博中他以概率 p 赢得 1 元,以概率
q 1 p 输掉 1 元,假设各局赌博是相互独立的,赌徒开始有 i ( ቤተ መጻሕፍቲ ባይዱ i n )元,且他在赌
显然, Markov 链的统计特征由其初始分布 P{ X 0 i0 } 和转移概率 P{ X k i X k 1 ik 1} ( k 1, 2,, n )决定。
定义 5.3 时齐 Markov 链: 当 Markov 链的转移概率 P{ X n1 j X n i} 只与状态 i, j 有
m n m, n 0 使得 P ij 0, Pjk 0 ,利用 C-K 方程(1)可知
n n Pikm n Pirm Prk Pijm Pjk 0 rS
K 类似地可以证明存在 K 0 使得 Pki 0 。
称互通的两个状态属于同一个类,且由命题 5.1 可知,任何一个状态不能同时属于两个 不同的类,即任意两个不同的类不相交。 思考:对例 5.1 中的赌徒问题的状态分类? 定义 5.7 可约:若 Markov 链只存在一个类,则称它为不可约的;否则称为可约的。 在不可约的 Markov 链中,一切状态都是彼此互通的。
刘次华版随机4-1离散参数马尔可夫链(1)

成立,称{X(n), n≥0} 为离散参数马氏链.
解放军电子技术学院
卢
定义2 设{X(n):n≥0} 为马氏链,状态空间为 E={0,1,2,…},称条件概率
(n) pij (m) P( X (m n) j | X (m) i)
为马氏链在m 时刻的n 步转移概率. 称
P pij (m)
卢
第m步状态
第m+k步状态
第m+k+s步状态
pij
( s k )
pir
rE
(k )
prj
( s)
解放军电子技术学院
卢
要证
pij ( s k ) pir ( k ) prj ( s ) .
rE
pij
rE
( s k )
P{ X (m k s) j X (m) i}
2) p j (n) pi (n 1) pij
iE
iE
令 PT (n) ( p1 (n), p1(n), )
PT (n) PT (0)P( n) PT (n) PT (n 1) P
卢
解放军电子技术学院
(n) 1) p j (n) pi pij iE
p j (n) PX n j P X 0 i, X n j
rE
pir
rE
(k )
prj .
解放军电子技术学院
卢
(s)
已证
pij ( s k ) pir ( k ) prj ( s ) .
rE
称k步转移矩阵
若记 P
(k )
( pij
(k )
),
第4章 马尔可夫链

d0
两式相比
r j rc
uj 1 rc
故
ua
ra rc 1 rc
(
q )a p
(
q )c p
1
(
q p
)c
当 r 1
u0 uc 1 cd0
而
u j (c j)d0
c j
因此 故
u j c c a b
ua
c
c
由以上计算结果可知
当 r 1 即 p q 时,甲先输光的概率为
当r
pi
p(n) ij
iI
(2) pj (n) pi (n 1) pij iI
(3)PT (n) PT (0)P(n)
(4)PT (n) PT (n 1)P
由(1)知,绝对概率由初始分布和n步转移概率完全确定
(1)
pn ( j)
pi
p(n) ij
iI
证 P{X n j} P{X n j, X 0 i} P{X n j, X 0 i} i
需讨论 r
当 r 1
c 1
1 u0 uc
(u j u j1)
c 1
j0
j0 c1
d j
c1 j 0
r jd0
1 rc 1 r
d0
而 u j u j uc (ui ui1)
i j
c 1
c 1
di
rid0
i j
i j
r j (1 r r c j1)d0
r j rc 1 r
称概率向量
PT (n) ( p1(n), p2(n),L ),(n 0)
为 n 时刻的绝对概率向量,而称
PT (0) ( p1 , p2 ,L )
第二节离散时间马尔可夫链的几个性质-资料

j
1 Mj
而且i可由下述关系式唯一地确定
i 1
j ip ij
i
i
16
4.2 遍历性
如果齐次马氏链的一个状态j是非周期、正常返 的,则此状态j为遍历的。 如果一个不可约的马氏链所有状态均为遍历的, 则此马氏链就是遍历链。(修正书 25页)
遍历链
平稳分布:存在、与 初始分布无关、唯一、
且全部都大于0
21
5.5离散时间马尔可夫链性质举例
S={0,1,2,3}
0
1
2
3
状态个数有限 不可约 非周期的 正常返 遍历链
22
第二节 离散时间马尔可夫链的几个性质
1 互通性 2 周期性 3 常返性 4 遍历性
1
1 .1互通性
若对某一n1,有
p (n) ij
0
,则称系统X可以自
状态I到达状态j,并记ij。如果ij,并且ji,
则状态i与j互通,并记为ij
若对一切n1,有
p (n) ij
0
或
p (n) ji
0
,或两式
均成立,则称状态i与j不通
(书 第24页)
6
1.6不可约
可约的马氏链:
1
1
2,3 闭集
2/3
0
1
2
3
1/3
1
4 闭集(吸收态)
1
0
1 2/3 2 1
1/3
7
2 .1周期性
定义
若记di为数集{n:
n1,
p (n) ii
0
}的最大公约数,则
称它为状态i的周期。若对一切n1有
p (n) ii
0,
则约定di=.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章 离散时间的马尔可夫链§1 随机过程的基本概念定义1 设(,,)P ΩF 是概率空间,(, )E E 是可测空间,T 是指标集. 若对任何t T ∈,有:t X E Ω→,且t X ∈F E ,则称{}(), t X t T ω∈是(, , )P ΩF 上的取值于(,)E E 中的随机过程,在无混淆的情况下简称{(), }t X t T ω∈为随机过程,称(,)E E 为状态空间或相空间,称E 中的元素为状态,称T 为时间域. 对每个固定的ω∈Ω,称()t X ω为{}(), t X t T ω∈对应于ω的轨道或现实,对每个固定的t T ∈,称()t X ω为E 值随机元. 有时()t X ω也记为 设T ⊂R ,{}, t t T ∈F 是F 中的一族单调增的子σ代数(σ代数流),即① t t T ∀∈⇒⊂F F ,且t F 是σ代数; ② , , s t s t T s t ∀∈<⇒⊂F F . 若 ()t t X t T ∈∀∈F E ,则称{}, t X t T ∈是{}t F 适应的随机过程,或适应于{}t F 的随机过程.特别地,若令 是由{}, , s X s t s T ≤∈所生成的σ代数,则{}, t X t T ∈是{}t F 适应的随机过程. 当1(, )(, )E =R E B 时,称{}, t X t T ∈为实值随机过程; 当(, )(, )E =C C E B 时,称{}, t X t T ∈为复值随机过程;当(, )(, )nn E =R E B 时,称{}, t X t T ∈为n 维随机过程;当E 是可列集(有限集)时,称{}, t X t T ∈为可列(有限)随机过程;当, T =+R R 或[], a b 时,称{}, t X t T ∈为连续参数的随机过程;当T =Z 或+Z 时,称{}, t X t T ∈为离散参数的随机过程(随机序列);当, (), n n n T =+R R Z 或() (2)nn ≥+Z 时,称{}, t X t T ∈为随机场.随机过程的四种类型:(1)指标集T 离散,状态空间E 离散的随机过程; (2)指标集T 离散,状态空间E 连续的随机过程; (3)指标集T 连续,状态空间E 离散的随机过程; (4)指标集T 连续,状态空间E 连续的随机过程.然而,以上分类是表面的,更深刻的是按随机过程的概率结构而分类.例如:马尔可夫(Markov )过程、平稳过程、独立增量过程、二阶矩过程、正态过程、泊松(Poisson )过程、生灭过程、分枝过程、更新过程、鞅等. 对于随机过程{}, t X t T ∈而言,可以这样设想,有一个作随机游动的质点M ,以t X 表示在时刻t 质点M 的位置,于是{}, t X t T ∈描绘了质点M 所作的随机运动的变化过程,一般把“t X x =”形象地说成“在时刻t 质点M 处于状态x ”. 定义2 设{}, t X t T ∈是概率空间(,,)P ΩF上的、以(,)E E 为状态空间的随机过程,T =+R (或R 或直线上的任一区间).如果A ∀∈E ,有则称{}, t X t T ∈是可测的. 设{}, t t T ∈F 是F 中的一族单调增的子σ代数. 如果, ,t T A ∀∈∈E有则称{}, t X t T ∈关于{}, t t T ∈F 循序可测.命题1 设:t X E Ω→, ()t t X t T ∈∀∈F E ,{}, t t T ∈F 是F中的一族单调增的子σ代数.如果{}, t X t T ∈关于{}, t t T ∈F 循序可测,则{}, t X t T ∈是可测的. 定义3 设{}, t X t T ∈是随机过程,称 为随机过程{}, t X t T ∈的一维分布函数;称为随机过程{}, t X t T ∈的二维分布函数;一般地,称 为随机过程{}, t X t T ∈的n 维分布函数;而称 为随机过程{}, t X t T ∈的有限维分布函数族.随机过程{}, t X t T ∈的有限维分布函数族F 具有下列性质:1. 对1n ∀≥,12,,,n t t t T ∀∈L ,及12,,,n t t t L 的任意排列12,,,n i i i t t t L ,有121212,,,,,,12(,,,)(,,,)i i i n n n t t t i i i t t t n F x x x F x x x =L L L L (对称性)2. 对1m n ∀≤≤,有12121,,,12,,,,,,12(,,,)(,,,,,,)m m m n t t t m t t t t t m F x x x F x x x +=+∞+∞L L L L L L (相容性)注 若知道了随机过程{}, t X t T ∈的有限维分布函数族F ,便知道了这一随机过程中任意有限个随机变量的联合分布,也就可以完全确定它们之间的相互关系. 可见,随机过程的有限维分布函数族能够完整地描述随机过程的统计特征. 但是在实际问题中,要知道随机过程的有限维分布函数族是不可能的,因此,人们想到了用随机过程的某些数字特征来刻画随机过程. 定义4 设{}, t X t T ∈是随机过程,称为{}, t X t T ∈的均值函数;称 为{}, t X t T ∈的方差函数;称 为{}, t X t T ∈的协方差函数;称 为{}, t X t T ∈的相关函数.注 若{}, t X t T ∈是复值随机过程,则方差函数的定义为协方差函数的定义为 相关函数的定义为 性质(1)(,)(), C t t D t t T =∈;(2)(,)(,)()(), ,C s t R s t m s m t s t T =-∈; (3)若()0m t ≡,则 (,)(,), ,C s t R s t s t T =∈.§2 马尔可夫链的定义在实际中有一类很广泛的随机过程,其特点是:过去只影响现在,而不影响将来. 这种随机过程称为马尔可夫过程. 状态离散的马尔可夫过程称为马尔可夫链,本章介绍时间离散的马尔可夫链(简称马尔可夫链).马尔可夫(Markov )过程的研究始于1906年,是随机过程的一个重要分支,它在近代物理、生物学、管理科学、信息处理、自动控制、金融保险等方面有着许多重要应用. 在本章中,无特别声明我们总是假设:1. 参数集合{}0,1,2,T=L ;2. 状态空间{}0,1,2,S =L 或{},2,1,0,1,2,S =--L L 或其子集.定义5 设{}, 0n X n ≥是定义在概率空间(, , )P ΩF上的随机过程,状态空间为S . 若对于任意的1n ≥及任意的整数120,n t t t t ≤<<<<L 12,,,,n i i i j S ∈L ,有 则称{}, 0n X n ≥为马尔可夫链,简称马氏链. 等式()*称为马氏性或无后效性,且假定()*式两端的条件概率都有意义(以下涉及到条件概率的式子都作类似的假定). 定理1 随机过程{}, 0n X n ≥是马尔可夫链的充要条件是对任意的1n ≥及任意的12,,,,n i i i j S ∈L ,有§3 转移概率对于马尔可夫链{}, 0n X n ≥,描述它概率性质最重要的是它在时刻m 的一步转移概率{}1(), ,ij m m p m P X j X i i j S +===∈.马尔可夫链是描述某些特定的随机现象的数学模型,而产生这种特定的随机现象的具体模型一般称为系统,因此我们经常把事件{}m X i =说成是在时刻m 时系统处于状态i ,把{}1m m P X jX i +==说成已知在时刻m 时系统处于状态i ,而在时刻1m +时系统转移到状态j 的概率等等.定义6 设{}, 0n X n ≥是状态空间为S 的马尔可夫链,称为系统在时刻m 时处于状态i 的条件下, 经n 步转移到状态j 的n 步转移概率,简称时刻m 的n 步转移概率.显然,()()n ij p m 具有下列性质: (1)()()0, ,n ij p m i j S ≥∈;(2){}()()1, n ij m n m j Sj Sp m P X j X i i S +∈∈====∈∑∑. 上述性质说明了,对于任意给定的i S ∈及0, 1m n ≥≥,{}()(), n ijpm j S ∈是一个概率分布. 规定: (1)(1)()()ij ij p m p m =;(2)(0)1, ,()0, .ijij i j p m i j δ=⎧==⎨≠⎩ 若()()n ij p m 与m 无关,则称{}, 0n X n ≥是时齐的或齐次的马尔可夫链. 此时,记()()(), ,, 1n n ij ij p p m i j S n =∈≥;一步转移概率记为(1), ,ij ij p p i j S =∈.对时齐的马尔可夫链{}, 0n X n ≥,有以下恒设马尔可夫链{}, 0n X n ≥是时齐的,并简称为马尔可夫链.性质 马尔可夫链{}, 0n X n ≥的n 步转移概率()n ij p 具有下列性质(1)(),,0n ij i j S p ∀∈≥; (2)(),1n ij j Si S p ∈∀∈=∑. 定理2(Chapman-Kolmogorov ) 设()n ijp 是马尔可夫链{}, 0n X n ≥的n 步转移概率,则 ,,,0i j S m n ∀∈≥,有()()()m n m n ij ik kj k Sp p p +∈=∑ (C-K 方程)证明{}{}{}()00, m n ij m n m m n k Sp P X j X i PX k X j X i +++∈=======U定理3 马尔可夫链{}, 0n X n ≥的一步转移概率ij p 可以确定所有的n 步转移概率()n ij p .证明 由C-K 方程,显然. 记()()(1),,(), ()n n ij i j S ij i j S p p ∈∈===PP P . 称()n P 为马尔可夫链{}, 0n X n ≥的n 步转移矩阵,称P 为马尔可夫链{}, 0n X n ≥的(一步)转移矩阵. 此时,C-K 方程可表示为()()()m n m n +=P P P 且()n n =P P .定义7 设{}, 0n X n ≥是马尔可夫链,对任意的0n ≥,称{}π()i n n P X i ==,i S ∈为绝对概率,特别地,称{}0π(0), i P X i i S ==∈为初始概率.显然,绝对概率和初始概率具有下列性质:故对任意0n ≥,{}π(), i n i S ∈是概率分布,通常称为绝对(概率)分布;特别,{}π(0), i i S ∈称为初始(概率)分布. 记{}{}(0)π(0), ()π()i i i S i S n n ∈∈∏=∏=.定理4 设{}, 0n X n ≥是马尔可夫链, 则它的任意有限维概率分布完全由初始分布和一步转移概率决定.证明 对任意的1n ≥,任意的整数120n t t t ≤<<<L 及任意的12,,,n i i i S ∈L ,有§4 若干例子定义8 设012, , ,ξξξL 是取整数值的独立同分布的随机变量序列,令0nn kk X ξ==∑,则称{}, 0n X n ≥为随机游动.定理5 随机游动{}, 0n X n ≥是时齐的马尔可夫链. (证明略)例1(无限制的随机游动)若随机游动{}, 0n X n ≥的状态空间为{,2,1,S =--L }0,1,2,L ,且转移概率为其中01,1p q p <<=-. 求:n 步转移概率()n ijp . 解 设在n 步转移中,向右移动x 步,向左移动y 步,则经n 步从i 到达j ,x 和y 应满足,x y n x y j i +=-=-. 所以由于, x y 只能取正整数,故()n j i +-与()n j i --必须是偶数. 又因在n 步转移中有x 步向右移动,故经n 步转移由i 到j 共有C xn种方式,于是 特别例2(带有一个吸收壁的随机游动) 设{}, 0n X n ≥是随机游动,其状态空间为{}0,1,2,S =L ,若转移概率为则称{}, 0n X n ≥为带有吸收壁0的随机游动. 其转移矩阵为例3(带有两个吸收壁的随机游动) 设{}, 0n X n ≥是随机游动,其状态空间为{}0,1,2,,S b =L ,其转移概率为其转移矩阵为例4(带有一个反射壁的随机游动) 设{}, 0n X n ≥是随机游动,其状态空间为{}0,1,2,S =L ,其转移概率为 其转移矩阵为例5(带有两个反射壁的随机游动) 设{}, 0n X n ≥是随机游动,其状态空间为{}, 0n X n ≥,其转移概率为 其转移矩阵为例6(带有弹性壁的随机游动) 设{}, 0n X n ≥是随机游动,其状态空间为{},2,1,0,1,2,S =--L L ,其转移概率为其转移矩阵为 例7 设{}, 0n X n ≥是只有两个状态({}0, 1S =)的随机游动,其转移矩阵为这里p q +未必等于1. 求()n P ,0lim π()n n →∞,1lim π()n n →∞.解 ()()()0001()()1011n n n n n p p p p ⎛⎫= ⎪⎝⎭P由C-K 方程,得同理可求()()()011011, , n n n p p p ,故 设初始分布为{}01(0)π(0), π(0)∏=,则故0lim π()n q n p q →∞=+,同理 1lim π()n pn p q→∞=+.例8 设{}, 0n X n ≥是马尔可夫链,状态空间{}1,2,3S =,转移矩阵为初始分布为{}{}123π(0), π(0), π(0)16, 12, 1=,求(1)二步转移矩阵(2)P ;(2){}132,1P X X ==;(3){}32102,2, 22PXX X X =≠≠=.解 (1)(2)2143401434014338141412141412151403414034143163716⎛⎫⎛⎫⎛⎫ ⎪⎪ ⎪=== ⎪⎪ ⎪ ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭PP .(2)由全概率公式、乘法公式、马氏性,得3(2)2211π(0)i i i p p ==∑ (注:也可直接由定理4得到) (3)由加法公式、乘法公式、马氏性,得 例9 设随机游动{}, 0n X n ≥的状态空间{}0,1,2,,S b =L ,其中0和b 是吸收壁,初始状态为a ,转移概率为 求质点被0点吸收的概率.解 设i u 表示质点初始位置为i 而被0点吸收的概率,则 由于1 p q +=,故11()()i i i i p u u q u u +--=-.(1)若12 p q ==,则11i i i i u u u u C +--=-=(常数),故10, .i i i u C u u iC u -=+=+ 因01, 0b u u ==,故1C b =-,从而1i i u b =-+,故1a au b=-.(2)若 p q ≠,则从而相加,得 011()(1)1()bb q p u u u q p -=+--,所以 故§5 状态的分类设{}, 0n X n ≥是马氏链,S 为状态空间,ij p 为转移概率.定义9 设A S ⊂,令称A T 为{}, 0n X n ≥首达A 的时刻(或A 的首达时),A T 是随机变量,其可能值为1,2,,.+∞L 当A为单点集{}j 时,记{}j T 为j T . 令则()n ij f 表示系统从状态i 出发, 经n 步首次到达状态j 的概率.利用乘法公式、马氏性易知:()n ii f 表示系统从i 出发, 经n 步首次返回i 的概率. 下面的定理是联系转移概率()n ij p 和首达概率()n ijf 之间关系的常用定理.定理6 对任意状态 , , 1i j S n ∈≥,有 ()()()1.nn m n m ijij jj m p f p -==∑证明 {}{}()00,n ij n j n p P X j X i P T n X j X i ====≤==令则ij f 表示系统从状态i 出发,经有限次到达状态j 的概率(也可以说成系统从状态i 出发,迟早要到达状态j 的概率). 显然有特别,ii f 表示从状态i 出发,迟早要返回状态i 的概率.定义10 若1ii f =,则称i 是常返状态;若1ii f <,则称i 是非常返状态或滑过状态. (显然,吸收状态是常返状态)对于常返状态i ,因{}01ii i f P T X i =<∞==,这表明,从状态i 出发必定要返回它自身.记{}{}:, 1, :, 1Rii N ii S i i S f S i i S f =∈==∈<,则,. R N R N S S S S S φ==U I例10 设马氏链{}, 0n X n ≥的状态空间为{}1,2,3,4S =,转移矩阵为试判别状态的常返性.解 (1)()111114,0(2)n f f n ==≥ 1114.f = 故{}{}2,3,4,1.R N S S ==记00(),()ij j i i E T X i E T X i μμ====,则ij μ表示系统从状态i 出发,首达状态j 的平均时间;i μ表示系统从状态i 出发,首次返回i 的平均时间. 记j N 表示系统经过j N 的次数,j N 是随机变量,()j n I X 表示系统在时刻n 经过状态j 的次数,即则1().j jn n N IX ∞==∑记00(), ()ij j i i m E N X i m E N X i ====,则ij m 表示系统从状态i 出发,经过状态j 的平均次数;i m 表示系统从状态i 出发,返回状态i 的平均次数.定理7 设, i j S ∈,则 ()()11, .n n ij ij i ii n n m pm p ∞∞====∑∑证明 001()(())ij j jn n m E N X i E IX X i ∞=====∑定理8 设 , i j S ∈,则{}0, ,0,.ijR j N f j S P N X i j S ∈⎧=∞==⎨∈⎩证明 {}{}{}0001lim j j j n n P N X i P N n X i P N n X i ∞→∞=⎧⎫=∞==≥==≥=⎨⎬⎩⎭I而 故推论 设i S ∈,则 {}01,,0, .R i N i S P N X i i S ∈⎧=∞==⎨∈⎩该推论说明了定义6的合理性,即:如果状态i 是常返的,则以概率1,系统无穷次返回状态i ;如果状态i 是非常返的,则以概率1,系统只有有限次返回状态i ,亦即系统无穷次返回状态i 的概率为0. 定理9 设 , i j S ∈,则证明 (1)若 , 0R ij j S f ∈=,则 1n ∀≥,有()0n ij f =,由定理6知, 1n ∀≥,有()0n ij p =,所以0()0ij j m E N X i ===.(2)若 , 0R ij j S f ∈>,则由定理8知,{}00jPNX i =∞=>,所以ij m =0()j E N X i β==∞.(3)若 N j S ∈,则由定理8知,{}00jPNX i =∞==,所以推论 设 i S ∈,则 0,,()(1), .R i i iiii N i S m E N X i f f i S ∞∈⎧===⎨-∈⎩定义11 设 , i j S ∈,若 1n ∃≥,使()0n ij p >,则称状态i 可达状态j ,记为i j →;若 1n ∀≥,有()0n ij p =,则称状态i 不可达状态j ,记为i j →/;若i j →且j i →,则称状态i 和状态j 相通(或互通),记为i j ↔.定理10 (1)若i k →且kj →,则i j →;(2)若i k ↔且k j ↔,则i j ↔.证明 因i k →且k j →,所以 1, 1m n ∃≥≥,使得()()0, 0m n ik kj p p >>,由C-K 方程,有()()()()()0m n m n m n ij il lj ik kj l Sp p p p p +∈=≥>∑,故i j →.(2)由(1)易知(2)成立.定理11 设 , i j S ∈,则(1)0ij i j f →⇔>;(2)0ij ji i j f f ↔⇔>. 证明 只证明(1). ""⇒ 设i j →,则 1n ∃≥,使()0n ij p >,而因此,(1)(2)(), ,,n ij ij ij f f f L 中至少有一个大于0,从而()10m ij ij m f f ∞==>∑.""⇐ 设0ij f >,因()1m ij ij m f f ∞==∑,所以 1n ∃≥,使()0n ij f >,故即i j →. 定理12 (1)()1n Rii n i S p ∞=∈⇐⇒=∞∑;(2)()1n Nii n i S p ∞=∈⇐⇒<∞∑,这时必有()lim 0n iin p →∞=; (3)若, , , R i j S i S i j ∈∈→,则R j S ∈,且1ii ij ji jj f f f f ====. 证明 由定理7及定理9的推论即知(1)和(2);(3)略. 对于常返状态,即R i S ∈,由于()11n ii ii n f f ∞===∑,因此{}(), 1n ii f n ≥是一个概率分布,故易知 1.i μ≥定义12 设状态i 是常返的,即R i S ∈. 若i μ<∞,则称i 是正常返的;若i μ=∞,则称i 是零常返的. 记{}{}0:, , :, R R i R R i S i i S S i i S μμ+=∈<∞=∈=∞.定义13 (1)设C S ⊂,若 , i C j S C ∀∈∈-,有i j →/,则称C 是闭集;(2)设C S ⊂,若 , i j C ∀∈,都有i j →,则称C 是不可约的;(3)若S 是不可约的,则称马氏链{}, 0n X n ≥是不可约的(即 , i j S i j ∀∈⇒→). 定理13 设C S ⊂,则下列各条等价 (1)C 是闭集; (2)(), ,10n ij i C j C n p ∀∈∉≥⇒=;(3) , 0ij i C j C f ∀∈∉⇒=.注 (1)若C 是闭集,则 , 1i C n ∀∈≥,有()1n ij j Cp ∈=∑. (2)整个状态空间S 是闭集,是最大的闭集;吸收状态i (即1ii p =)是闭集,是最小的闭集. 定理14 0,, R R R S S S +都是闭集.证明 设, .R R i S j S ∈∉ 若0ij f >,则i j →,故 R j S ∈. 矛盾,从而0ij f =,由上面的定理13,知R S 是闭集. 同理可证0, R R S S +也是闭集.例11 设{}, 0n X n ≥是马尔可夫链,状态空间为{}1,2,3,4,5S =,转移矩阵为问状态空间{}1,2,3,4,5S =中是否含有真的不可约的闭子集?{}, 0n X n ≥是否是不可约马尔可夫链. 解 易知,状态3是吸收状态,故{}3是闭集;{}{}{}1,4, 1,3,4, 1,2,3,4均是闭集;其中{}{}3, 1,4均是不可约的;因为S 含有真的闭子集,所以{}, 0n X n ≥为非不可约马尔可夫链.例12 设马尔可夫链{}, 0n X n ≥的状态空间为{}1,2,,9S =L ,状态之间的转移概率如图所示.由图可见:自状态1出发,再返回状态1的可能步数为显然T 的最大公约数为2. 但2T ∉,即自状态1出发经过2步不能返回状态1. 但我们仍把2定义为状态2的周期.定义i S ∈为状态i . 若{:n n ≥ 由定义知,如果状态i 有周期d ,则对一切[]0mod()n d ≠,都有()0n ii p =. 但这并不是说对任意的nd ,都有()0nd iip >. 如在例12中,状态1的周期2d =,但(2)110p =. 然而有如下结论.定理15 设状态i 的周期为d ,则存在正整数M ,对一切n M ≥,有()0nd iip >.证明 略(证明用到了初等数论的知识).定理16 设状态i S ∈,如果集合{}()1, 0n iin n f ≥>非空,则证明 记 {}()G.C.D 1, 0n iid n n p =≥>,{}()G.C.D 1, 0n iic n n f =≥>,由定理6有 从而{}{}()()1, 01, 0n n iiiin n p n n f ≥>⊃≥>,于是有 1d c ≤≤. 如果1c =,则1d c ==. 如果1c >,只需证明d c ≥,为此只需证明c 是{}()1, 0n iin n p ≥>的公约数即可. 换言之,只需证明对于一切[]0mod()n c ≠,都有()0n ii p =.实际上,由c 的定义知,当1r c ≤<时,有()0r iif =. 于是,对1n c ≤<,有现假设当, 0,1,2,,1n kc r k N =+=-L 时,有()0n ii p =. 注意到[]0mod()n c ≠时,有()0n ii f =.则由定理6得于是,由归纳法知,当[]0mod()n c ≠时,有()0n ii p =.定理17 设状态i 常返且有周期d ,则()lim nd ii i n p d μ→∞=.(其中i μ为状态i 的平均返回时间,当i μ=∞时,约定0i d μ=)证明 见可数状态的马尔可夫过程,胡迪鹤,武汉大学出版社,1983,2526P -. 定义15 非周期的正常返状态称为遍历状态. 定理18 设i 是常返状态,则① i 是零常返状态⇐⇒()lim0n ii n p →∞=; ② i 是遍历状态⇐⇒()lim10n ii i n p μ→∞=>.证明 ① 设i 是零常返状态,则i μ=∞,由定理17,得 ()lim 0nd ii n p →∞=,而当[]0mod()n d ≠时,有()0n iip =,于是得()lim 0n ii n p →∞=. 反之,设()lim 0n ii n p →∞=,假设i 是正常返状态,则i μ<∞,于是由定理17,得()lim0nd ii n p →∞>,矛盾.② 设()lim10n ii i n p μ→∞=>,由①知,i 不能是零常返状态,从而只能是正常返状态,由定理17,得()limnd ii i n p d μ→∞=,注意到()()lim lim nd n ii ii n n p p →∞→∞=,得1d =,所以,i 是遍历状态. 反之,由定理17是显然的.定理19 设状态, i j S ∈,且i j ↔,则(1)i 与j 同为常返状态或同为非常返状态;如果同为常返状态,则它们同为正常返状态或同为零常返状态. (2)i 与j 有相同的周期.证明 (1)由于i j ↔,由可达的定义知存在1l ≥和1n ≥,使得由C-K 方程,对任意的1m ≥,总有()()()()()l m n l m n m ii ij jj ji jj p p p p p αβ++≥=,()()()()()l m n n m l m jj ji ii ij iip p p p p αβ++≥= 将上式两边从1到∞求和,得()()11l m n m iijj m m pp αβ∞∞++==≥∑∑,()()11l m n m jj iim m p p αβ∞∞++==≥∑∑ 可见,()1k ii k p ∞=∑与()1k jjk p∞=∑相互控制,所以它们同为无穷或同为有限. 由定理12知,i 与j 同为常返状态或同为非常返状态.若i 与j 同为常返状态,在以上的不等式中取极限,令m →∞,得()()lim lim l m n m ii jj m m p p αβ++→∞→∞≥, ()()lim lim l m n m jj ii m m p p αβ++→∞→∞≥因此,()limk iik p →∞与()lim k jj k p →∞同为正或同为零,由定理18知,i 与j 同为正常返状态或同为零常返状态. (2)设状态i 的周期为d ,状态j 的周期为c . 因为 ()()0, 0l n ij ji p p αβ=>=>,所以对任一使()0m jj p >的m ,必有()()()()()0l m n l m n m ii ij jj ji jj p p p p p αβ++≥=>,从而d 可除尽l m n ++. 又因为()()()0l n l n ii ij ji p p p αβ+≥=>,所以d 也可除尽l n +. 因此,d 可除尽m . 这说明d c ≤. 同理可证d c ≥. 故d c =,即状态i 与j 有相同的周期.注 状态的常返性与马尔可夫链的初始分布是无关的定理20 状态空间S 可唯一地分解成有限个或可列无穷个互不相交的子集之和,即(1)(2)N R R S S S S =U U UL ,且使得(1)每个()k R S 是常返状态组成的不可约闭集;(2)()k R S 中的状态或全是正常返状态,或全是零常返状态,且有相同的周期; (3)N S 是由全体非常返状态组成,自()k R S 中的状态不能到达N S 中的状态.定理21 周期为d 的不可约马尔可夫链,其状态空间S 可唯一地分解为d 个互不相交的子集之和,即0121d S S S S S -=U U UL U ,且使得自r S 中任一状态出发,经一步转移必进入1r S +中,0,1,2,,1r d =-L . (约定:0d S S =)证明 (1)任意取定一状态i S ∈,令{}()0, 0nd r r ij S j n p +=∃≥>使,0,1,2,,1r d =-L因S 是不可约的,即S 中的状态是互通的,故10d r r S S -==U.(2)若r t j S S ∃∈I (r t ≠),由定义知,必存在非负整数n 和m 使得()0nd r ij p +>,()0md t ij p +>.又由于j i ↔,必存在正整数h ,使()0h ji p >,于是由C-K 方程,有()()()0nd r h nd r h ii ij ji p p p +++≥>, ()()()0md t h md t h ii ij ji p p p +++≥>所以,d 能除尽nd r h ++,又能除尽md t h ++,从而d 能除尽 故d 能除尽r t -,注意到 01, 01r d t d ≤≤-≤≤-,故只能0r t-=,这说明,当r t ≠时,r t S S =∅I .(3)下面证明对任一r j S ∈,有11r jk k S p +∈=∑. 事实上最后一个等式是因:r j S ∈,由定义有()0nd r ij p +>,而当1r k S +∉时,由定义有(1)0nd r ikp ++=,由C-K 方程,有(1)()0nd r nd r ik ij jk p p p +++=≥,故0jk p =.(4)最后证明分解的唯一性,这只需证明{}0121,,,,d S S S S -L 不依赖于最初取定的状态i . 亦即只需证明:对取定的状态i ,如果, r j k S ∈,则对另取的状态i ',仍有, r j k S '∈(r '可以与r 不同). 设对i 的分解为{}0121,,,,d S S S S -L ,对i '的分解为{}0121,,,,d S S S S -''''L ,又设, r j k S ∈,t i S '∈. 于是,当r t ≥时,自i '出发,以概率1只能在, ,r t r t d --+ 2,r t d -+L 等这些步上转移到j 或k ,从而, rt j k S -'∈;当r t <时,自i '出发,以概率1只能在(), 2, 3,d t r r t d r t d r t d --=-+-+-+L 等这些步上转移到j 或k ,从而, r t d j k S -+'∈.定理22 设{}, 0n X n ≥是周期为d 的不可约的马尔可夫链,则得一新的马尔可夫链{}, 0nd X n ≥,其一步转移矩阵为()()()d d ijp =P ,原马尔可夫链{}, 0n X n ≥按照定理21分解出的每个r S ,是新马尔可夫链{}, 0nd X n ≥的不可约的闭集,且r S 中的状态对新马尔可夫链是非周期的.(证明略)例13 设不可约马尔可夫链{}, 0n X n ≥的状态空间为{}1,2,3,4,5,6S =,周期为3d =,转移矩阵为对取定的状态1,易知 故{}{}{}0121,4,63,52SS S S ==U U U U . 马尔可夫链{}3, 0n X n ≥的转移矩阵为§6 n 步转移概率()n ij p 的渐近性质与平稳分布对()n ijp 极限性质,我们讨论两个问题. 一是()lim n ij n p →∞是否存在;二是其极限是否与i 有关. 这就与马尔可夫链的所谓平稳分布有密切联系.定理23 若j S ∈是非常返状态或零常返状态,则对任意i S ∈,有()lim0n ij n p →∞=.证明 因j S ∈是非常返状态或零常返状态,所以()lim 0n jj n p →∞=(由定理12和定理18). 由定理6,对正整数Nn <,有固定N ,令n →∞,得再令N→∞,因()11k ij k f ∞=≤∑,所以()lim 0n ijn p →∞=. 推论1 如果马尔可夫链的状态空间S 是有限集,则S 中的状态不可能全是非常返状态,也不可能含有零常返状态,从而不可约的有限马尔可夫链的状态都是正常返状态. 证明 设{}0,1,2,,SN =L . 如果所有状态都是非常返状态,则对任意, i j S ∈,由定理23知()lim 0n ijn p→∞=,从而 ()10N n ijj p ==→∑(n →∞). 矛盾. 如果S 中有零常返状态i ,设{}, Cj j S i j =∈→,若i j →,由定理12,有j i →,即C 中的状态是互通的,从而C 是不可约. 又由定理19知,C 中全是零常返状态,从而由定理14知,C 是闭集,即C 是不可约的闭集. 故()1n ij j Cp ∈=∑. 令n →∞,注意到C 是有限集,由定理23得()10n ij j C p ∈=→∑(n →∞). 矛盾.于是,有限马尔可夫链的状态空间必含有正常返状态. 对于不可约的有限马尔可夫链,由于所有状态是互通的,故所有状态都是正常返状态.推论2 若马尔可夫链的非常返状态构成的集合N S 是有限集,则N S 不是闭集. 证明 若N S 是闭集,将产生矛盾.推论3 若马尔可夫链的状态空间S 有一个零常返状态,则必有无限多个零常返状态. 证明 设有零常返状态i S ∈,令{}, Cj j S i j =∈→,若C 是有限集,将产生矛盾.定理23考虑的是非常返状态或零常返状态的渐近分布,但当j S ∈是正常返状态时,()lim n ij n p →∞不一定存在,即使存在也可能与i 有关. 因此,我们退而研究()nd ijp 及()11n k ij k p n =∑的极限. 记()0(), 01md r ij ij m f r f r d ∞+==≤≤-∑. 则()ij f r 表示系统从状态i 出发,经[]mod()n r d =步首次到达状态j 的概率,显然定理24 设j S ∈是正常返状态,周期为d ,则 i S ∀∈及01r d ≤≤-,有证明 因为当[]0mod()n d ≠时,()0n jj p =. 所以于是,对1N n ≤<,有固定N ,令n →∞,由定理17,得再令N→∞,得于是,得推论 设周期为d 的、不可约的、正常返的马尔可夫链的状态空间为S ,则对一切, i j S ∈,有 其中10d k k SS -==U 为定理21中所给出. 特别,当1d =时,对一切, i j S ∈,有证明 在定理24中,令0r =,得 其中()0(0)md ij ij m f f ∞==∑. 如果i 与j 不在同一个k S 中,则由定理21知()0nd ij p =,注意到()()nd nd ij ij f p ≤,得()0nd ij f =,故(0)0ij f =.如果i 与j 同属于某个k S ,则当[]0mod()n d ≠时,()0n ij p =,从而()0n ij f =,故由定理12(3)知,1ij f =.定理25 对任意状态, i j S ∈,有证明 当j 为非常返状态或零常返状态时,由定理23知,()lim0n ij n p →∞=,故现设j 为正常返状态,周期为d . 注意到:如果有d 数列满足lim , 0,1,2,,1nd r r n a b r d +→∞==-L . 则必有令(), 0,1,2,,1nd r nd r ij a p r d ++==-L . 由定理24,有从而得推论 设不可约的、常返的马尔可夫链的状态空间为S ,则对 , i j S ∀∈,有 当j μ=∞时,约定10jμ=.证明 由定理19知,S 中的状态或全为正常返状态或全为零常返状态. 如果全为正常返状态,则, 1j ij f μ<∞=(定理12),由定理25得如果全为零常返状态,则j μ=∞,由定理25得 注 由定理25知,当j 为正常返状态时,尽管()lim n ijn p →∞不一定存在,但其平均值极限()11lim n k ij n k p n →∞=∑总存在. 特别,当马尔可夫链还是不可约时,()11lim n k ij n k p n →∞=∑与i 无关. 定义16 设{}, 0n X n ≥是状态空间为S 的马尔可夫链,如果存在实数集合{}π, j j S ∈,满足(1)π0, j j S ≥∈; (2)π1j j S∈=∑;(3)ππ, j i ij i S p j S ∈=∈∑.则称{}, 0n X n ≥是平稳的马尔可夫链,称{}π, j j S ∈为马尔可夫链{}, 0n X n ≥的平稳分布.对于平稳分布{}π, jj S ∈,有一般,有 ()ππ, 1n jiiji S p n ∈=≥∑.若初始分布{}π(0), jj S ∈是马尔可夫链{}, 0nXn ≥的平稳分布,则即对任何1n ≥,绝对概率等于初始概率.由此可见,当我们能判定马尔可夫链的初始分布{}π(0), jj S ∈是一平稳分布时,则该马尔可夫链在任何时刻的绝对分布{}π(), jn j S ∈都与初始分布相同. 事实上,平稳分布就是不因转移步数变化而改变的分布. 马尔可夫链处于状态j 的概率与时间推移无关,即具有平稳性.与平稳分布相关的是所谓极限分布的概念. 对于不可约的马尔可夫链,若状态j 是非周期的,则以后称{}1, jj S μ∈为极限分布.定理26 非周期不可约的马尔可夫链是正常返的充分必要条件是它存在平稳分布,且此平稳分布就是极限分布{}1, jj S μ∈.证明 “⇐”设存在平稳分布{}π, jj S ∈,于是有由于π0, j j S ≥∈和π1j j S∈=∑,故可以交换极限与求和顺序,两边令n →∞得因为π1j j S∈=∑,故至少存在一个π0k >,即10k μ>,从而 ()lim 10n ik k n p μ→∞=>,故k 是正常返的,从而马尔可夫链是正常返的,且所有的 1π0j j μ=>.“⇒”设马尔可夫链是正常返的,于是由C-K 方程,对任意正整数N (若S 是有限集,则不必如此),有 两边令m →∞,得 再令N→∞,得()()0111n n kj kj k k S j k k p p μμμ∞=∈⎛⎫⎛⎫≥= ⎪⎪⎝⎭⎝⎭∑∑ (*) 下面进一步证明,只能等式成立. 由 先令n →∞,再令N →∞,得将(*)式对j 求和,并假定对某个j ,(*)式为严格大于,则于是导致自相矛盾的结果 故(*)式对一切j 都只能成立等式再令n →∞,得 由此可知 故{}1, jj S μ∈是平稳分布.推论1 非周期的、不可约的、正常返的马尔可夫链的平稳分布是唯一的,就是极限分布. 推论2 若不可约的马尔可夫链的所有状态是非常返或零常返的,则不存在平稳分布. 证明 用反正法.设{}π, jj S ∈是马尔可夫链的平稳分布,则由定理23,有故 π0, j j S =∈,从而π0j j S∈=∑,与平稳分布π1j j S ∈=∑矛盾.例14 设马尔可夫链{}, 0n X n ≥的转移矩阵为求马尔可夫链的平稳分布及各状态的平均返回时间.解 因马尔可夫链是不可约的、非周期的,且状态有限,所以该马尔可夫链存在平稳分布{}{}123π, 1,2,3π, π, πjj ==,满足31ππ, 1,2,3ji ij i p j ===∑,即解上述方程组,得平稳分布为由定理26,得各状态的平均返回时间分别为§7 可逆性设马尔可夫链{}, 0n X n ≥的初始分布为{}π(0), i i S ∈,状态空间S 为可列集,n 步转移概率为()n ijp . 定义17 称马尔可夫链{}, 0n X n ≥可逆,如果:对任意的0n ≥,1m ≥,及任意的012,,,,m i i i i S ∈L ,均有定理27 马尔可夫链{}, 0n X n ≥可逆的充分必要条件是:对任意的, i j S ∈,有证明 “⇒”设马尔可夫链{}, 0n X n ≥可逆,由定义,对任意的0n ≥及任意的, i j S ∈,有{}{}00,,n n P X i X j P X j X i =====,从而即()()π(0)π(0)n n i ij j ji p p =,当1n =时,有π(0)π(0)i ij j ji p p =.“⇐”设对任意的, i j S ∈,有π(0)π(0)i ij j ji p p =. 则对任意的0n ≥,1m ≥,及任意的012,,,,m i i i i S ∈L ,由定理4,有由定义知,马尔可夫链{}, 0n X n ≥是可逆的.。