随机矩阵理论

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

随机矩阵(Random/Stochastic Matrix)

定义1:如果矩阵中至少有一个元素为随机量,那么该矩阵称为随机矩阵.实际上,正是由于随机参数的引入,使得原来确定性的矩阵元素变为随机的定义:一般地,如果一个矩阵的元素是非负的,且每一列元素的和为1,则这个矩阵称为随机的。随机矩阵的列可以看成是概率向量。

要了解随机矩阵的话可以去看非负矩阵的书,有问题也可以拿上来讨论。

粗略一点的话直接用圆盘定理,然后取分量全为1的向量证明1是特征值。

精细一点的话去看Perron-Frobenius定理。左特征向量一般有两种定义,对于实矩阵的实特征向量来讲可以不用区别。

基本的性质就是“双正交性”,直接从PAQ=J,PQ=I来获取,只是需要注意亏损的特征值对应的左右特征向量可能无法满足内积非零。网络上系统性的材料并不太多,所以最好还是找书看,就你的情况而言可以找以下几种名字的书:

随机矩阵

非负矩阵

矩阵论

1.利用Perron-Frobenius定理证明:随机矩阵的主特征值为1。

2.左右特征向量之间的关系是什么,以及提出这种概念的现实意义:如有利于更加便捷地进行数值计算和求解?你既然这样问了就说明你还不知道Perron-Frobenius定理的内容,自己先去看书。至于左右特征向量,理论上讲特征子空间的结构需要同时用左右特征向量来描述。从计算的角度讲单纯知道某一个右特征向量对计算同一个特征值的左特征向量没有任何帮助。

我估计你想算稳态分布,去看一下GTH算法。随机矩阵问题的核心是它的极限行为。我想随机矩阵重要的不是它有一个特征值为1.而是其它特征值(模长都小于1)与1 之差的最小模长。这个又叫做“谱隙”,这个值反映了随机矩阵所决定的Markov链的收敛速度。至于特征向量,则对应Markov链在极限状态下的“平稳分布”。因此谱隙和特征向量都是很重要的量。它们都刻画了系统的极限行为。非负矩阵理论和普通的高代中的Jordan型之类的理论有根本的不同,这个不同在于,随机矩阵有明显的“图论”甚至组合的意义,很多时候我们不关心非负矩阵的元素大小是多少,而是关心非零元在矩阵中的“位置”。至于具体的数值计算,主要是要靠迭代的办法。建议你先看Horn 的matrix analysis (矩阵分析),上面讨论的很详细,你问的问题都可以找到答案。之后可以看一下Markov链方面的书,对具体背景和应用有个了解。

最近一个月来一直在看Google排序的核心算法---PageRank排序算法[1][2],在多篇论文中涉及到图论、马尔可夫链的相关性质说明与应用[3][4][5],而最为关键,一直让我迷惑的一句话是"A stochastic matrix has principal/primary eigenvalue 1"[3][4][5][6][7][8]。可能对于系统学习过矩阵理论的人,它很平淡,不值得单独拿出来讨论或者说明。而我在此不得不承认自己的无知。尽管在高等代数中学习过关于矩阵性质的一些讨论,但从来没有接触过所谓的随机矩阵(Stochastic Matrix),更不要说其性质了。于是,我从网上努力的寻找相关文献,但结果不是特别理想,并没有关于随机矩阵的详细介绍以及相关性质的证明。我想也许一方面是我搜索技术还不成熟,或者是搜索的关键词不准确,亦或者是网上关于它的资料本就很缺乏。在这里我想将最近搜集的相关资料拿出来整理一下思路,以备将来之用,也是对自己学习的一个真实记录和督促。随机矩阵实际上是非负矩阵(Nonnegative matrix)的一类,而非负矩阵是指矩阵元素都是非负(Nonnegative)的,当然非负要与正矩阵(Positive matrix)进行细微的区分。非负矩阵在计算数学、图论、线性规划、自动控制等领域有着广泛的应用,对其特征值,尤其是最大特征值(注意这里的最大是从模的角度或者说是绝对值概念上的最大)特征值,也就是矩阵的主特征值(principal/primary eigenvalue)的估计有很重要的意义[9]。随机

矩阵说来如此之重要,那么到底什么样的矩阵才是随机矩阵呢?假如随便给你一个非负矩阵,该如何判定它是否属于随机矩阵呢?随机矩阵实际上应当分成行随机矩阵(Row stochastic matrix)和列随机矩阵(Column stochastic matrix)。行随机矩阵是指方阵的行和等于1;而列随机矩阵就是其列和等于1的非负矩阵。那么同时满足行和列和都是1的非负矩阵就是双随机矩阵(Double stochastic matrix),单位矩阵就是一种双随机矩阵。从研究的角度,其实只要研究行矩阵的性质即可,毕竟列随机矩阵只是行随机矩阵的转置矩阵。因此以下的讨论完全从行随机矩阵出发。既然随机矩阵A行和为1,那么假设e=(1,1,...,1),则e的转置向量e',即是矩阵的一个特征向量,对应于A的特征值1。这样对于证明随机矩阵的主特征值是1还有一定的距离。假设A的n个特征值为λ(i),其中i=1,2,...,n;若要证明性质成立,则必须证明|λ(i)|<=1。现今有一个特征值是1,只要证明其余各特征值的绝对值都小于等于1即可。于是我又查找了相关资料,并在“数学博士论坛”发帖请教,得到的回复是要证明它,粗略地讲利用圆盘定理即可,若要精细的证明还要利用Perron-Frobenius Theorm[9][10][11][12]。一个个新的概念和方法出现在面前,看来需要系统的学习数值方法、数值计算理论。查找到的资料[10]表明任何矩阵的谱半径都不大于该矩阵任意诱导矩阵范数,而随机矩阵的L1-Norm值是1,那么谱半径(是主特征值的等价说法)不大于1,而由于1是A的一个特征值,那么就不可能出现绝对值大于1的特征值了:1确实是随机矩阵A的主特征值。那么对上述性质的证明就等价于证明资料[10]中的结论了。其实,“任意复数域上的矩阵的谱半径不大于其任意一种诱导范数”只是矩阵的一个基本的性质。其具体证明见下图:

根据以上的证明结果可知,对任意的行随机矩阵,其谱半径是1,即最大特征值是1得证。由此可知,其实矩阵的一个小小的性质对于没有系统学习过矩阵理论的人有时确实是一个难题。要入行,就当懂行规,要入门,就当精通门路。随机矩阵的主特征值以及second largest eigenvalue的比值是幂法收敛速度的一个基本的衡量标准。PageRank的计算有多种方式,而对此的研究也是不计其数,当然最传统的还是利用幂法来确定抓取入库的各网页的PageRank值。由于web网页的数量巨大,针对幂法收敛速度的考虑就不是多余无用的分析。而两特征值的“谱隙”(Eigengap)主要用来衡量利用幂法求解得到的PR值的稳定性的。由此看来,特征值分析对于理解PageRank算法起到关键作用。

相关文档
最新文档