马尔可夫过程的研究及其应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
马尔可夫过程的研究及其应用
概率论的思想通常都很微秒,即使在今天看来仍没有被很好地理解。尽管构成概率论的思想有点含糊,但是概率论的结果被应用在整个社会当中,当工程师估计核反应堆的安全时,他们用概率论确定某个部件及备用系统出故障的似然性。当工程师设计电话网络时,他们用概率论决定网络的容量是否足够处理预期的流量。当卫生部门的官员决定推荐或不推荐公众使用一种疫苗时,他们的决定部分的依据概率分析,即疫苗对个人的危害及保证公众健康的益处。概率论在工程实际、安全分析,乃至整个文化的决定中,都起着必不可少的作用。关于概率的信息虽然不能让我们肯定的预测接下来发生个什么,但是它允许我们预测某一事件或时间链的长期频率,而这个能力十分有用。概率论的思想不断渗透到我们的文化当中,人们逐渐熟悉运用概率论的语言思考大自然。
世界并不是完全确定的,不是每个“事件”都是已知“原因”的必然结果。当科学家们对自然了解的更多,他们才能认知现象—例如,气体或液体中分子的运动,或液体的波动。由此引入了人们对布朗运动的定性与定量描述。在人们思考布朗运动的同时,俄国数学家马尔可夫开始研究现在所谓的随机过程。在实际中遇到的很多随机现象有如下的共同特性:它的未来的演变,在已知它目前状态的条件下与以往的状况无关。描述这种随时间推进的随机现象的演变模型就是马尔可夫过程。例如森林中动物头数的变化构成——马尔可夫过程。在现实世界中,有很多过程都是马尔可夫过程,如液体中微粒所作的布朗运动、传染病受感染的人数、车站的候车人数等,都可视为马尔可夫过程。关于该过程的研究,1931年A.H.柯尔莫哥洛夫在《概率论的解析方法》一文中首先将微分方程等分析的方法用于这类过程,奠定了马尔可夫过程的理论基础。1951年前后,伊藤清建立的随机微分方程的理论,为马尔可夫过程的研究开辟了新的道路。1954年前后,W.费勒将半群方法引入马尔可夫过程的研究。流形上的马尔可夫过程、马尔可夫向量场等都是正待深入研究的领域。
安德烈•马尔可夫(A.A.Markov,1856-1922),1856年6月14日生于梁赞;1922年7月20日卒于圣彼得堡。马尔可夫上中学时,大部分课程学得不好,惟独数学成绩常常都得满分,并开始自学微积分,有一次他独立地发现了一种常系数线性常微分方程的解法,就写信给著名数学家布尼亚科夫斯基,信被转到彼得堡数学系科尔金和佐洛塔廖夫手里,从此马尔可夫与彼得堡大学的数学家建立了联系。1874年考入彼得堡大学数学系学习,在学习期间他深受切比雪夫、科尔金、佐洛塔廖夫等数学家的启发和影响,1878年大学毕业,并以《用连分数求微分方程的积分》一文获金质奖章。1880年以题目为《论行列式为正的二元二次齐次》的论文取得硕士学位并在彼得堡大学任教。1884年获物理数学博士学位,1886年成为教授,1890年当选为彼得堡科学院候补院士,1896年当选为院士,1905年退休时彼得堡大学授予他功勋教授称号。马尔可夫研究的范围很广,对概率论、数理统计、数论、函数逼近论、微分方程、数的几何等都有建树。在概率论方面,他深入研究并发展了其老师切比雪夫的矩方法,使中心极限定理的证明成为可能。他推广了大数定律和中心极限定理的应用范围。他提出并研究了一种能够用数学分析方法研究自然过程的一般图式,这种图式后人即以他的姓氏命名为马尔可夫链。他还开创了一种无后效性随机过程的研究,即在已知当前状态的情况下,过程的未来状态与其过去状态无关,这就是现在大家耳熟能详的马尔可夫过程。马尔可夫的工作极大的丰富了概率论的内容,促使它成为自然科学和技术直接有关的最重要的数学领域之一。
20世纪50年代以前,研究马尔可夫过程的主要工具是微分方程和半群理论(即分析方法);1936年前后就开始探讨马尔可夫过程的轨道性质,直到把微分方程和半群理论的分析方法同研究轨道性质的概率方法结合运用,才使这方面的研究工作进一步深化,并形成了对轨道分析必不可少的强马尔可夫性概念。1942 年,伊藤清用他创立的随机积分和随机微分方程理论来研究一类特殊而重要的马尔可夫过程──扩散过程,开辟了研究马尔可夫过程的
又一重要途径。近年来,鞅论方法也已渗透到马尔可夫过程的研究中,它与随机微分方程结合在一起,已成为目前处理多维扩散过程的工具。此外,马尔可夫过程与分析学中的位势论有密切的联系。对马尔可夫过程的研究,推动了位势理论的发展,并为研究偏微分方程提供了概率论的方法。最近十多年发展起来的吉布斯随机场和无穷粒子随机系统,是由于统计物理的需要而提出的。
马尔可夫随机场(Markov Random Field )包含两层意思。一是什么是马尔可夫,二是什么是随机场。
马尔可夫性(无后效性)的定义为:过程或系统在时刻
0t 所处的状态为已知的条件下,过程在时刻0t t 所处状态的条件分布,与过程在时刻0t 之前所处的状态无关的特性成为马尔可夫性或无后效性。即:过程“将来”的情况与“过去”的情况是无关的。马尔可夫一般是马尔可夫性质的简称。拿天气来打个比方。如果我们假定天气是马尔可夫的,其意思就是我们假设今天的天气仅仅与昨天的天气存在概率上的关联,而与前天及前天以前的天气没有关系。其它如传染病和谣言的传播规律,就是马尔可夫的。
随机场包含两个要素:位置(site ),相空间(phase space )。当给每一个位置中按照某种分布随机赋予相空间的一个值之后,其全体就叫做随机场。我们不妨拿种地来打个比方。“位置”好比是一亩亩农田;“相空间”好比是种的各种庄稼。我们可以给不同的地种上不同的庄稼,这就好比给随机场的每个“位置”,赋予相空间里不同的值。所以,俗气点说,随机场就是在哪块地里种什么庄稼的事情。还是拿种地打比方,如果任何一块地里种的庄稼的种类仅仅与它邻近的地里种的庄稼的种类有关,与其它地方的庄稼的种类无关,那么这些地里种的庄稼的集合,就是一个马尔可夫随机场。
马尔可夫链,因安德烈•马尔可夫(A.A.Markov ,1856-1922)得名,是数学中具有马尔可夫性质的离散时间随机过程。该过程中,在给定当前知识或信息的情况下,过去(即当期以前的历史状态)对于预测将来(即当期以后的未来状态)是无关的。
马尔可夫链是随机变量X_1,X_2,X_3...的一个数列。这些变量的范围,即他们所有可能取值的集合,被称为“状态空间”,而X_n 的值则是在时间n t 的状态。如果X_{n+1}对于过去状态的条件概率分布仅是X_n 的一个函数,则P(X_{n+1}=x|X_0, X_1, X_2, … X_n) = P(X_{n+1}=x|X_n)。这里x 为过程中的某个状态。上面这个恒等式可以被看作是马尔可夫性质。马尔可夫在1906年首先做出了这类过程 。而将此一般化到可数无限状态空间是由柯尔莫果洛夫在1936年给出的。
在数学中,马尔可夫链式最简单的一种马尔可夫过程,这里用实际例子对其进行解释。想象一个粒子沿实数轴以离散步骤来回移动。假设它从0点开始运动,并且只能向左或向右移动一个单位长度,假设它向右移动的概率是p ,那么向左移动的概率就是1-p 。如果我们令p=0.5,那么就可以把这个马尔可夫过程简化为下面的模型:粒子沿一条直线移动,每次只能移动一步,通过投掷硬币决定走哪个方向,正面代表向前,反面代表向后。投掷一次硬币,走一步,不断的重复这个过程。这就是以为布朗运动的数学模型。用马尔可夫链创建一维布朗运动的数学模型后,我们可以问,移动n 步后,粒子在0点的概率是多少,或者投掷硬币足够多次以后,粒子不在0点并且永远不回到0点的概率是多少。人们已经深入的研究过马尔可夫链。虽然它很简单,但是有许多复杂的推广。在物理上,这些推广可以用来研究“扩散”现象,这一过程是不同气体或液体混合后分子的随机运动的结果。扩散过程也出现在生命科学,例如有事用扩散方程描述物种的运动。在数学上,一维马尔可夫链已经被广泛推广,其中最明显的是把粒子的一维运动变为二维或更高维的运动。一个更精细的推广则是