电子科大矩阵理论平时作业-论文

合集下载

矩阵分析方法及应用论文

矩阵分析方法及应用论文

矩阵分析方法及应用论文矩阵分析方法是一种应用矩阵论和线性代数的数学工具,用于研究和解决与矩阵相关的问题。

矩阵可以用于描述线性变换、矢量空间和方程组等数学对象。

矩阵分析方法可以应用于多个领域,包括数学、物理、工程、计算机科学等。

在以下回答中,我将简要介绍矩阵分析方法的基本原理和一些应用,并提供一些相关论文的例子。

首先,让我们来了解一下矩阵分析的基本原理。

矩阵是一个由数值排列成的矩形数组,可以表示为一个m×n的矩阵,其中m表示行数,n表示列数。

矩阵的元素可以是实数或复数。

通过矩阵分析,我们可以研究矩阵的性质、运算规则和应用。

矩阵乘法是矩阵分析中最基本的操作之一。

当两个矩阵相乘时,第一个矩阵的列数必须等于第二个矩阵的行数。

矩阵乘法的结果是一个新的矩阵,其行数等于第一个矩阵的行数,列数等于第二个矩阵的列数。

矩阵乘法可以表示线性变换和矢量的线性组合等概念。

另一个重要的矩阵分析方法是特征值和特征向量的计算。

矩阵的特征值是矩阵与一个非零向量之间的一个简单乘法关系。

特征向量是与特征值对应的非零向量。

特征值和特征向量在物理、工程和计算机科学等领域中有广泛的应用,例如图像处理、机器学习和数据压缩等。

矩阵分析方法在多个领域有着广泛的应用。

下面是一些矩阵分析方法的应用领域及相应的论文例子:1. 图像处理:矩阵分析方法在图像处理中被广泛应用,例如图像压缩和恢复。

论文例子:《基于矩阵分解的图像压缩算法研究》、《基于矩阵分析方法的图像恢复技术研究》。

2. 数据处理:矩阵分析方法在数据挖掘和机器学习中起着重要作用,例如矩阵分解和矩阵推荐系统。

论文例子:《基于矩阵分解的矩阵推荐系统研究》、《基于矩阵分析的数据挖掘技术研究》。

3. 信号处理:矩阵分析方法在信号处理中具有广泛的应用,例如语音信号处理和音频编码。

论文例子:《基于矩阵分析方法的语音信号处理技术研究》、《基于矩阵分解的音频编码算法研究》。

4. 控制系统:矩阵分析方法在控制系统设计和分析中具有重要作用,例如状态空间表示和线性二次型控制器设计。

Gram-Schmidt orthogonalization_100 years and more(综述)(给学生)

Gram-Schmidt orthogonalization_100 years and more(综述)(给学生)

NUMERICAL LINEAR ALGEBRA WITH APPLICATIONSNumer.Linear Algebra Appl.(2012)Published online in Wiley Online Library().DOI:10.1002/nla.1839Gram–Schmidt orthogonalization:100years and more Dedicated to Pete Stewart on the occasion of his70th birthday.Steven J.Leon1,Åke Björck2,*,†and Walter Gander31Department of Mathematics,University of Massachusetts,Dartmouth,MA02747-2300,U.S.A.2Department of Mathematics,Linköping University,58183Linköping,Sweden3Department of Computer Science,ETH,8092Zürich,SwitzerlandSUMMARYIn1907,Erhard Schmidt published a paper in which he introduced an orthogonalization algorithm that has since become known as the classical Gram–Schmidt process.Schmidt claimed that his procedure was essen-tially the same as an earlier one published by J.P.Gram in1883.The Schmidt version was thefirst to become popular and widely used.An algorithm related to a modified version of the process appeared in an1820treatise by place.Although related algorithms have been around for almost200years,it is the Schmidt paper that led to the popularization of orthogonalization techniques.The year2007marked the 100th anniversary of that paper.In celebration of that anniversary,we present a comprehensive survey of the research on Gram–Schmidt orthogonalization and its related QR factorization.Its application for solving least squares problems and in Krylov subspace methods are also reviewed.Software and implementation aspects are also discussed.Copyright©2012John Wiley&Sons,Ltd.Received10September2010;Revised20March2012;Accepted20March2012KEY WORDS:Gram–Schmidt;orthogonalization;least squares;error analysis1.INTRODUCTIONIn commemoration of the hundredth anniversary of the1907paper by Erhard Schmidt[107]where this process was published,we present a survey of the research on Gram–Schmidt orthogonalization, its related QR factorization,and the algebraic least squares problem.We begin with an introductory section where we define the Gram–Schmidt process and the related QR factorization and briefly discuss the application of these concepts to least squares problems. Section2deals with the early history of the classical Gram–Schmidt process(CGS)algorithm and other related algorithms.The section begins with brief biographies of Gram and Schmidt and a dis-cussion of their original papers relating to orthogonality.This is followed by a survey of the19th century papers on least squares problems.Here we examine some of the works by Gauss,Laplace, Cauchy,and Bienaymé.Later sections feature noteworthy work by Heinz Rutishauser and a host of contemporary authors and focus on such issues as the use of Gram–Schmidt orthogonalization for stably solving least squares problems,loss of orthogonality,reorthogonalization,and applications of Gram–Schmidt to Krylov subspace methods for large sparse problems.*Correspondence to:Åke Björck,Department of Mathematics,University of Linköping,SE58183Linköping,Sweden.†E-mail:ake.bjorck@liu.seS.J.LEON,Å.BJÖRCK AND W.GANDER1.1.The QR factorization and the algebraic least squares problemJames&James Mathematics Dictionary[71]defines the Gram–Schmidt process as follows: The process of forming an orthogonal sequence f q n g from a linearly independent sequence f x n g of members from afinite or infinite inner-product space by defining q n inductively asq1D x1,q n D x n n 1Xk D1h q k,x n ik q k k2q k,n>2.(1)To obtain an orthonormal sequence,one can replace each q n by q n=k q n k.By construction,span.q1,:::,q k/D span.x1,:::,x k/,k>1.Having an orthogonal basis for this nested sequence of subspaces will simplify many operations. This is the reason why applications of the Gram–Schmidt process are ubiquitous in mathematics. Let A2R m n be a real matrix with linearly independent columns a1,a2,:::,a n.Then the Gram–Schmidt process can be used to compute an orthonormal basis q1,q2,...,q n for the column space of A.Furthermore,each column vector a k,k D1,:::,n,in A can be expressed as a linear combinationa k D r1k q1C r2k q2C C r kk q k,r kk¤0.k D1,:::,n.(2) Assume that q1,:::,q k 1have been determined.Multiplying(2)with q Tjfrom the left and usingorthogonality,it follows that q Tja k D r jk,j D1,:::,k 1,andw kÁr kk q k D a k k 1Xj D1r jk q j.(3)As a k is not a linear combination of q1,:::,q k 1,it follows that w k¤0andq k D w k=r kk,r kk D k w k k2D.w Tkw k/1=2.(4)Note that the term r jk q j that is subtracted from a k is equal to q j q Tja k D P j a k,the orthogonalprojection of a k onto the one-dimensional subspace spanned by q j.The matrix P j D q j q Tjis thecorresponding orthogonal projector.It follows that P2j D P j,and P?jD I q j q Tjis the orthogonalprojector onto the orthogonal complement.In matrix terms,(2)can be conveniently written as a factorization of A into a product Q times RA D.q1,q2,:::,q n/8ˆˆˆˆˆˆˆˆˆˆˆ:r11r12 r1nr22 r2n......r nn9>>>>>>>>>>>;ÁQR(5)where R2R n n is an upper triangular matrix with nonzero diagonal entries and Q T Q D I n.It can easily be shown that if the diagonal entries of R are required to be positive,then the QR factor-ization(5)is uniquely determined.The Gram–Schmidt process uses elementary column operations to transform the matrix A into an orthogonal matrix Q to give R and Q(explicitly)in the QR factorization(5).One of the most important applications of Gram–Schmidt orthogonalization is the solution of algebraic least squares ing matrix notations,these problems take the formminxk A x b k22(6) where A2R m n is a matrix with linearly independent columns.The vector b2R m is a vector of observations,whose entries are subject to random errors of equal variance.A vector x is a leastGRAM–SCHMIDT ORTHOGONALIZATION:100YEARS AND MOREsquares solution if and only if the corresponding residual vector r D b A x is orthogonal to span.a1,:::,a n/.This condition is equivalent toA T.b A x/D0,(7)or A T A x D A T b,which is the system of normal equations.The matrix A T A D R T Q T QR D R T R is symmetric positive defiing the QR factorization,the normal equations become R T R x D R T Q T b.Here the nonsingular factor R T cancels.Hence,the least squares solution satisfies the triangular linear systemR x D c,c D Q T b,which is easily solved using back substitution.This shows the close connection between the Gram–Schmidt process and the least squares problem.It is also possible to form A T A and A T b explicitly and solve the normal equations by(Hermitian) Gaussian elimination(indeed,Gauss developed his elimination process for solving least squares problems;see Stewart[119]).The Cholesky algorithm‡is a more modern version of this method. In this,the factorization A T A D R T R is computed directly,and then the system R T R x D A T b is solved by forward and back substitution.In this context,R(or rather L D R T)is known as the Cholesky factor of A T ingfloating point arithmetic,the method of normal equations may give less accurate solutions than those obtained using a QR rmation may be lost already in forming the normal equations.The Gram–Schmidt process readily extends to the complex case with inner product equal toh q,x i D q H x.In the QR factorization(5)of a complex matrix A2C n n,the factor Q is unitary,Q H Q D I,and R upper triangular with real and positive diagonal elements r i i,i D1,:::,n.Pierre-Simon Laplace Jørgen Pedersen Gram Erhard Schmidt2.EARLY HISTORYIn1907,Erhard Schmidt published a paper[107]on integral equations.In that paper,he made use of an orthonormalization technique that has since become known as the CGS.He remarked in the paper that in essence the formulas were presented by J.P.Gram[58].The algorithm has become well known and is included as a standard topic in elementary linear algebra textbooks.The earliest linkage of the two names Gram and Schmidt to describe the orthonormalization process appears ‡AndréLouis Cholesky(1875–1918)was a French military officer involved in geodesy and surveying in Crete and North Africa just before World War I.He developed the algorithm named after him,and his work was posthumously publishedby a fellow officer,Benoit,in1924.S.J.LEON,Å.BJÖRCK AND W.GANDERto be in a1935paper by Wong[142].An apparently slight change in the CGS process gives the modified Gram–Schmidt process(MGS).When the computations are carried out infinite preci-sion arithmetic,MGS has better stability properties,in particular when used to solve algebraic least squares problems.One feature of the MGS algorithm is the use of successive orthogonalization. This tool,applied to a least squares problem,can be found in a book by Laplace[79]on the analytic theory of probabilities.2.1.Short biographies of J.P.Gram and E.SchmidtErhard Schmidt(1876–1959)was born in Dorpat,Estonia.He was a student of David Hilbert and did his thesis work in the area of integral equations.He received his doctoral degree from the University of Göttingen in1905and his habilitation from Bonn in1906.In the following years,he held positions in Zürich,Erlangen,and Breslau(presently Wroclaw),and in1917he assumed a professorship at the University of Berlin.He was instrumental in setting up an Institute for Applied Mathematics in Berlin and in helping to establish Berlin as a leading center for applied mathematics.Schmidt was joint head of the mathematics department in Berlin until1952and served as Director of the Mathematics Research Institute of the German Academy of Science of Berlin from the end of World War II until1958.Schmidt was co-founder andfirst editor of the journal Mathematische Nachrichten.Schmidt’s work in thefield of integral equations is particularly note-worthy.His methods are now classical,and they stand out for their simplicity and mathematical elegance.He is considered to have played a leading role in the development of modern functional analysis.Also worth mentioning are his work on the so-called Hilbert–Schmidt(or Schmidt)oper-ators and his well-known theorem,which states when a kernel operator can be expressed as an expansion in terms of eigenfunctions.Jørgen Pedersen Gram(1850–1916)was born in Nustrup,Denmark.He had already published one important paper in modern algebra prior to receiving a masters degree in mathematics in1873. Two years later,he went to work for the Hafnia Insurance Company.He quickly worked his way up to a senior position.At the same time,he did important research developing mathematical mod-els for forest management.He also did research in probability and numerical analysis,which he applied to calculations in actuarial science.His orthogonalization method was included in his PhD thesis[57]published in1879.This had important applications to the development of the theory of integral equations.Gram went on to found his own insurance company in1884.While a director of this company until1910,he published articles in number theory and was active in the Danish Mathematical society.He served as editor of Tidskrift før Mathematik from1883until1889.For more infor-mation on the lives of Gram and Schmidt,see Baumgärtel et al.[7],Bernkopf[8],Rohrbach[101], Schröder[109],and the MacTutor online biographies of O’Conner and Robertson[89]and[88]. 2.2.The papers of Gram and SchmidtJ.P.Gram’s original1879thesis[57]on integral equations was written in Danish.The results became more accessible to the general mathematics community when a German version[58]was published in1883.In this paper,Gram was concerned with series expansions of real functions using least squares.Gram was influenced by the work of Chebyshev,and his original orthogonaliza-tion procedure was applied to orthogonal polynomials.He derived a representation for resulting orthogonal functions in terms of determinants and applied the results to applications involving integral equations.In thefirst part of the paper,Gram was concerned withfinding the best weighted least squares approximation to a data set by a linear combination of functions X1,X2,:::,X n.Gram represented the data set as a vector x D.x1,x2,:::/of x values and a vector o D.o1,o2,:::/of observed y values.The weights were given by a vector v D.v1,v2,:::/.The coefficients of the bestfity.x/D a1X1.x/C a2X2.x/C C a n X n.x/GRAM–SCHMIDT ORTHOGONALIZATION:100YEARS AND MOREare determined using the normal equations to minimize X iv i .o i y i /2where y i D y.x i /,i D 1,2,:::.Letting y .k/denote the best fit when only k <n functions are used,Gram developed a scheme for updating from y .m 1/to y .m/for m 6n .In this scheme,the solution y .n/can be represented as a linear combination of the formy .n/D A 1C 1ˆ1.x/C A 2C 2ˆ2.x/C C A n C nˆn .x/where ˆr .x/depends on X 1.x/,:::,X r .x/,and the ˆk ’s are orthogonal with respect to the discrete inner product defined by the data x and weights v x .Thus,X iv i ˆm .x i /ˆn .x i /D 0.m ¤n/and the coefficients are given by A k DX i v i ˆk .x i /o i ,C k D X i v i ˆk .x i /2.Although Gram did not use inner-product notation,for notational convenience we will use it to describe his algorithm for constructing the orthogonal sequence ˆ1,ˆ2,:::,ˆn .Starting with a sequence X 1,X 2,:::of independent vectors (or functions)in an inner-product space,the Gram method generates a sequence ˆ1,ˆ2,:::of orthogonal vectors.In the Gram procedure,each ˆk is defined in terms of determinants.Specifically for k D 1,2,:::,set D k D ˇˇˇˇˇˇˇˇˇh X 1,X 1i h X 1,X 2i h X 1,X k i h X 2,X 1i h X 2,X 2i h X 2,X k i ...h X k ,X 1i h X k ,X 2i h X k ,X k i ˇˇˇˇˇˇˇˇˇ.If we let Q Dk denote the determinant obtained by replacing the entries in the last column of D k with the vectors X 1,X 2,:::,X k and set ˆk D Q D k D ˇˇˇˇˇˇˇˇˇh X 1,X 1i h X 1,X 2i h X 1,X k 1i X 1h X 2,X 1i h X 2,X 2i h X 2,X k 1i X 2...h X k ,X 1i h X k ,X 2i h X k ,X k 1i X k ˇˇˇˇˇˇˇˇˇthen Gram showed that the vectors ˆ1,ˆ2,:::will be mutually orthogonal.Although the entries of the last column of Q D k are vectors rather than scalars,we evaluate the determinant using the cofactor expansion along its last column.Interpreted this way,the determinant representation ˆk D Q D k expands to a linear combination of X 1,X 2,:::,X k ,and it follows thatspan .ˆ1,:::,ˆk /D span .X 1,:::,X k /,k D 1,2,:::The remaining parts of the paper were concerned with orthogonal functions defined in terms of non-discrete inner products.Erhard Schmidt,in his famous 1907paper [107],was concerned with solving the integral equationf.s/D '.s/ Z baK.s ,t/'.t/d tfor the unknown function '.In the paper,Schmidt applied an orthogonalization process to a sequence of functions 1,:::, n with respect to the inner producth f ,g i DZ baf.x/g.x/d x .S.J.LEON,Å.BJÖRCK AND W.GANDERThe Schmidt paper popularized the orthogonalization process,and as a result of this paper the names Gram and Schmidt have become forever linked.The Schmidt paper did not use inner-product or norm notation.The following is the algorithm as originally presented by Schmidt in the1907paper.1.x/D1.x/q Rba1.y/2d y2.x/D2.x/ 1.x/R ba2.´/ 1.´/d´q Rba. 2.y/ 1.y/R ba2.´/ 1.´/d´/2d y...n .x/Dn.x/P D n 1D1.x/R ban.´/ .´/d´q Rba. n.y/P D n 1D1.y/R ban.´/ .´/d´/2d y.Schmidt’s primary use of his algorithm was to orthogonalize afinite set of eigenfunctions of an integral equation corresponding to a multiple ter in the paper,Schmidt applied the same procedure to an infinite sequence of functions.In a footnote to his1907paper,Schmidt gives credit to Gram,stating that his procedure is equivalent to the one introduced earlier by Gram in[58].Actually,from an algorithmic point of view,the two procedures are quite different.The Gram–Schmidt process has two characteristic properties that are clearly evident in the algorithm presented in Schmidt’s1907paper.Thefirst property is that the k th vector q k (or function)is a linear combination of a k and its predecessors.Second,the combination is expressed in terms of the vector a k and the previous GS vectors q1,:::,q k 1.On the other hand, the Gram paper[58]honors thefirst property but not the second.In the Gram procedure,each q k is expressed in terms of determinants involving the vectors a1,:::,a k.These formulas are difficult to use in practice,as Gram’s subsequent examples show.2.3.The papers of Legendre and GaussIn1799,Gauss used the principle of minimizing the sum of the absolute errors with the added con-dition that the sum of the errors be equal to zero.He showed that the solution must then satisfy exactly n out of the m equations.Gauss argued that,because by the principles of probability greater or smaller errors are equally possible in all equations,it is evident that a solution that satisfies pre-cisely n equations must be regarded as less consistent with the laws of probability.He was then led to the principle of least squares.Adrien-Marie Legendre was thefirst to publish the method of least squares in the appendix of his1805book[81]on new methods for determining the orbits of comets.He gave no theoretical justification,and this remained for Gauss to do in his1809Theoria Motus Corporum Celestium [48].Much to the annoyance of Legendre,Gauss claimed here to have discovered the method of least squares in1795and wrote‘Our principle,which we have made use of since1795,has lately been published by Legendre...’(English translation,C.H.Davis[45]).There is clear evidence that Gauss was right in his claim to have used the method10years earlier to do astronomical ing the method of least squares,Gauss was able to win critical acclaim in astronomical circles for correctly determining the orbit of the asteroid Ceres.We quote from a historical note in the textbook[83].On January1,1801,the Italian astronomer G.Piazzi discovered the asteroid Ceres.He was able to track the asteroid for six weeks,but it was lost due to interference caused by the sun.A number of leading astronomers published papers predicting the orbit of the asteroid.Gauss also published a fore-cast,but his predicted orbit differed considerably from the others.Ceres was relocated by one observer on December7and by another on January1,1802.In both cases the position was very close to that predicted by Gauss.GRAM–SCHMIDT ORTHOGONALIZATION:100YEARS AND MOREThe method of least squares quickly became the standard procedure for analysis of astronomical and geodetic data.In[48],Gauss gave hisfirst justification of the principle of least squares.He assumed here that the errors were uncorrelated and normally distributed with zero mean and equal variance.In1811,Laplace[78]gave a different justification of the principle of least squares. He used his central limit theorem to show that asymptotically the least squares solution would minimize the mean absolute error.The definitive treatment of principle of least squares was given by Gauss1821–1823in two memoirs Theoria Combinationis[46,47].Here,the assumption of a normal distribution was dropped and the method of least squares given a sound theoretical base (an English translation of these memoirs by G.W.Stewart is available in[49]).Gauss proves the optimality of the least squares estimate without any assumptions that the random variables follow a particular distribution.For more detailed accounts of the invention of the principle of least squares,the reader is referred to the excellent reviews by Placket[96],Stigler[122,123],Goldstine[54,Sec.4.9], and Stewart[119].2.4.The treatise of LaplaceIn1816,Laplace published his major treatise Théorie Analytique des Probabilités[79](Analytic Theory of Probability).The third edition,which appeared in1820,contains three supplements.In thefirst supplement,the goal of Laplace is to compute the mass of Jupiter(and Saturn)from a sys-tem of normal equations provided by the French astronomer Bouvard and from this same system to compute the distribution of error in the solution assuming a normal distribution of the noise on the observations.The parameters of the noise are not placefirst proves that,when the solu-tion is computed from the linear least squares problem,the distribution of error is independent of the parameter of the input noise.Although Laplace did not use matrices,it is possible to go back and reinterpret his results using modern matrix notation.The discussion that follows is based on material submitted to us by Julien Langou.This material is also included in the introductory section of his report[77].The report also includes a translation of the relevant sections of the Laplace treatise. The method which Laplace introduces consists in successively projecting the system of equations orthogonally to a column of the matrix A.These actions eliminate the associated couple observa-tion/variable from the updated system.Ultimately,Laplace eliminates all the variables but the one of interest in the linear least squares problem,which eliminates all the columns but one in place is indeed introducing the main technique behind the Gram–Schmidt algorithm(successive orthogonal projections.)In thefirst part,Laplace uses this method to prove that,given an overdetermined sys-tem with a normal perturbation on the right-hand side,its solution has a centered normal distribution and is uncorrelated with the corresponding residual vector r D b A x.In the second part,Laplace gives an example of a6 6system.Once the matrix A is reduced to a single column vector,Laplace is able to relate the variance of the variable of interest to the norm of this column vector and the norm of the residual vector r.The components of the unnor-malized Gram–Schmidt vectors are generated in the course of Laplace’s algorithm as well as the elimination coefficients,which are the elements of the matrix R in the QR factorization.As these are not of primary interest for Laplace,they are discarded as soon as they are place then explains how to compute the norm of the projected column of observation of interest from the normal equations using Gaussian elimination performed in reverse order.The last coefficient computed will be equal to the norm of thefirst column orthogonally projected successively to the span of the remaining place observes that these conditions are equivalent to the partial derivatives of the sum of squares being zero and therefore provides a way to get the value of the solution from the normal equations.Laplace correctly explains and observes the property that all the remaining modified columns, after elimination/projection,are orthogonal to the residual r of the least squares problem.How-ever,Laplace did not interpret his results with orthogonality;in particular,he did not observe that the modified column vectors were mutually place viewed his algorithm as an elimination process involving transformations that preserved orthogonality with the residual vector. Laplace then used Gauss’algorithm to solve two6 6systems of normal equations to recomputeS.J.LEON,Å.BJÖRCK AND W.GANDERthe mass of Jupiter and Saturn.The originality of the work consists in assessing the reliability of these computations by estimating the variance of the distribution of error in the solution.2.5.The papers of Cauchy and BienayméIn1748,before the development of the principle of least squares,Tobias Mayer had developed a method for‘solving’overdetermined systems of equations,later known as the method of averages; see Whittaker and Robinson[137,p.258].The m equations in n unknowns are separated into n groups and group-wise summed.In this way,the overdetermined system is replaced by a square linear system,which can be solved by elimination.This method was later improved by Laplace. Cauchy[21,22]developed a related interpolation algorithm,which leads to systems of the formZ T A x D Z T b,Z D.´1,:::,´n/where´ij D˙1.An advantage of this choice is that the formation of the new system requires no multiplications.A modern treatment of the method of averages is given by Dahlquist et al.[27]. Bienaymé[9]noted in1853that Cauchy’s choice of Z was not optimal in the least squares sense. The choice of Z D A gives rise to the normal equations.More generally,if Z has the same column space as A,then the method becomes‘la méthode la plus avantageuse’,that is,the method yielding the least squares solution to A x D b.The matrix Z in Bienaymé’s algorithm can be determined one column at a time as the elimination steps are carried out.We now examine this algorithm in more detail.Let Z2R m n be a matrix of full column rank.The elements of the matrix C D Z T Aare c ij D´Ti a j.By elimination of x1,the elements of the matrix26i,j6n are transformedas follows´T i a j!´T i a.2/j Á´T i a j´Tia1´T1a1´T1a j D´T ia j´T1a j´T1a1a1Á.We obtain the reduced system8ˆˆˆˆˆˆˆˆ:´T2a.2/2´T2a.2/n......´T n a.2/2´T n a.2/n9>>>>>>>>;8ˆˆˆˆˆˆˆ:x2...x n9>>>>>>>;D8ˆˆˆˆˆˆˆˆ:´T2b.2/...´T n b.2/9>>>>>>>>;where we have defineda.2/ j D a j´T1a j´T1a1a1,26j6n,b.2/D b´T1b´T1a1a1.As the vectors´2,:::,´n are not used in this step,only the vector´1needs to be chosen at this stage.The structure of the reduced system is similar to thefirst.Continuing the elimination,in the last step´n is chosen and used to form the single equation´T n a.n/n x n D´T n b.n/.This elimination gives a triangular system for the solution x.The matrix Z can be determined one column at a time as the elimination steps are carried out.To obtain the least squares solution,we should choose Z so that the range space of Z equals that of A. This condition will be satisfied if we set Z D.q1,:::,q n/D.a1,a.2/2,:::a.n/n/,whereq j D a.j/j D a.j 1/jq Tj 1a.j 1/jqj 1q j 1q j 1,26j6n.This choice gives an implicit version of Gaussian elimination for the normal equations A T A x D A T b.We shall see that this is algebraically equivalent to the square root free version of the modified Gram–Schmidt procedure,where the q j vectors are orthogonal but not normalized to have unit length.As mentioned,this algorithm was originally derived already by Laplace[79]. The relationship between MGS and this implicit version of Gaussian elimination for the normal equations has been rediscovered several times,for example,by Späth[113].GRAM–SCHMIDT ORTHOGONALIZATION:100YEARS AND MORE3.GRAM–SCHMIDT AND QR FACTORIZATION3.1.Classical versus modified Gram–SchmidtThe CGS process applied to a matrix A 2R m n proceeds in n steps.In step k ,k D 2,:::,n ,the vector a k is orthogonalized against q 1,:::,q k 1.The orthogonalization is carried out according to(3),and the vector q k is obtained by normalization;see (4).In step k ,the CGS algorithm computes the k th columns of R and Q ,and columns k C 1,:::,n have not yet been touched.Such an algorithm is called left-looking.The main work in CGS is performed in two matrix–vector multiplications.The process can be summarized using MATLAB notations as follows:Classical Gram–Schmidt algorithm:In MGS,each time a new column q k is computed,all remaining columns of the (modified)matrix are orthogonalized against it,and the k th row of R is determined.Such an algorithm is called right-looking.At the start of step k ,the matrix A D A .1/has been transformed into the form .Q k 1j A .k//D q 1,:::,q k 1j a .k/k ,:::,a .k/n Á,k D 1,:::,n ,where the columns in A .k/are orthogonal to Q k 1.Normalizing the vector a .k/kgives r kk D k a .k/k k 2and q k D 1r kk a .k/k .(8)If k <n ,the columns in A .k/are orthogonalized against q k ,giving.0A .k C 1//D I q k q T k A .k/D A .k/ q k l T k ,l T k D q T k A .k/D .r kk ,:::,r kn /.(9)The main work in MGS is performed in one matrix–vector multiplication and one rank 1update and can be summarized in MATLAB as follows:Modified Gram–Schmidt algorithm:One advantage of MGS is that it allows a column pivoting strategy to be used,which produces an upper triangular matrix R with non-increasing diagonal elements;see Section 5.By skipping the normalization in the Gram–Schmidt process,one obtains a square root free algorithm where A D QR with R unit upper triangular and Q T Q D D a positive diagonal matrix.。

矩阵研究毕业论文

矩阵研究毕业论文

0 引言为了利用矩阵研究线性变换, 希望能找到线性空间的基使线性变换在该基下的矩阵具有最简单的形式, 因此我们引进了特征值与特征向量. 特征值与特征向量在线性变换中起着举足轻重的作用, 充分利用特征值与特征向量的命题与性质对我们解题带来极大的帮助, 能使复杂的问题变的简单, 化简为易, 化繁为简. 本文就矩阵的特征值与特征向量在一些解题中的应用作了初步的探讨.1. 关于矩阵的特征值与特征向量的一般理论我们知道, 在有限维线性空间中, 取了一组基之后, 线性变换就可以用矩阵来表示. 为了利用矩阵来研究线性变换, 对于每个给定的线性变换, 我们希望能找到一组基使得它的矩阵具有最简单的形式. 从现在开始, 我们主要的来讨论, 在适当的选择基之后, 一个线性变换的矩阵可以化成什么样的简单形式. 为了这个目的, 先介绍特征值和特征向量的概念, 它们对于线性变换的研究具有基本的重要性.定义 1.1 设A 是数域P 上的一个n 阶方阵,若存在一个数P λ∈以及一个非零n 维列向量n x P ∈,使得Ax x λ=则称λ是矩阵A 的一个特征值,向量x 称为矩阵A 关于特征值λ的特征向量. 定义1.2 设A 是数域P 上一n 级矩阵, λ是一个文字. 矩阵A E -λ的行列式nnn n n n a a a a a a a a a A E ---------=-λλλλ212222111211,称为A 的特征多项式, 这是数域P 上的一个次多项式.设T 是n 维线性空间V 上的一个线性变换,求解T 的特征值与特征向量的方法可以分成一下三几步:1) 在线性空间V 中取一组基12,,,nξξξ, 写出/A 在这组基下的矩阵A ;2) 求出A 的特征多项式E Aλ-在数域P 中全部的根, 它们也就是线性变换/A 的全部特征值;3) 对于A 的每个特征值,j λ求其次线性方程组()0jI A X λ-=的一组基础解系:12,,,.t ηηη于是A 的属于jλ的全部特征值组成的集合是}{1122,0,1,2,,t t i i k k k k K k i t ηηη+++∈≠=例1 设V 是数域K 上3维线性空间,T 是V 上的一个线性变换,它在在V 的一个基1α,2α,3α下的矩阵A 是222214241A -⎛⎫ ⎪=-- ⎪⎪-⎝⎭,求A 的全部特征值与特征向量. 解: 因为特征多项式为2222214(3)(6)241I A λλλλλλ--⎛⎫ ⎪-=+-=-+ ⎪⎪+⎝⎭所以A 的全部特征值3(二重),-6.对于特征值3,解齐次线性方程组(3)0I A X -=,12312312322024402440x x x x x x x x x +-=⎧⎪+-=⎨⎪++=⎩得到一个基础解系:210-⎡⎤⎢⎥⎢⎥⎢⎥⎣⎦, 201⎡⎤⎢⎥⎢⎥⎢⎥⎣⎦因此,A 的属于3的两个线性无关的特征向量就是1122ζαα=-+,2132ζαα=+ 而A 的属于3的全部特征向量就是 .{}11221212,,,0k k k k K k k ζζ+∈且不全为对于特征值-6代入, 求出(6)0I A X --=的一个基础解系:122⎡⎤⎢⎥⎢⎥⎢⎥-⎣⎦.因此, A 的属于特征值-6的一个线性无关的特征向量就是312322ζααα=+-,而A 的属于特征值-6的全部特征向量是{}3,0k k K k ζ∈≠且.例2 设T 是复数域上n 维线性空间V 上的一个线性变换()1n >,它在V 的一个基12,,,nααα下的矩阵A 是1012210000010000001n n A ααααα--⎛⎫ ⎪ ⎪⎪= ⎪ ⎪ ⎪-----⎝⎭,求T 的特征值和特征向量. 解 :1012201221100001000100001000010000100001n n n n I A λλλλααααλαλαλαλαλαλα-------=-+--=--+令01221000100001000001001n n n D λαλαλαλαλα----=--+下面用数学归纳法求解()2n D n ≥当2n =时,22101.1D λαλαλαλα==++-+假设对于上述形式的1n -阶行列式,有012-132000100001000001001n n n D λαλαλαλαλα----=--+n-1n-2n-210=+++λαλαλα,对于n 阶行列式,把它第1行展开,得12102112111210121210000100010010(1)001000100101()(1)(1).n n n n n n n n n n n n D xλαλαλλαλαλαλλλλαλαλααλαλαλαλα+----+----=---+----+-=+++++--=++++根据数学归纳法原理,此命题对一切自然数2n ≥都成立. 故121210.n n n I A λλαλαλαλα---=++++即为T 的特征多项式.设12,,n λλλ 是I A λ-的全部复根. 对于1i n ≤≤,有111122201111,n n n n i i i i i i i ii i i n i A λλλλλλλλλλααλαλ-----⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪----⎝⎭⎝⎭⎝⎭ 因此12'(1,,,,)n i i i λλλ-(1i n ≤≤)是A 的属于特征值i λ的一个特征向量. 由于()()11,2,,110,2,3,,n i n I A n λ--⎛⎫-=-≠⎪⎝⎭而i I A λ-=,因此()1i rank I A n λ-=-. 从而齐次线性方程组()0i I A X λ-=的解空间的维数为(1)1n n --=. 于是A 的属于特征值i λ的所有特征向量组成的集合是{}21'(1,,,,)|,0.n i i i k k C k λλλ-∈≠从而T 的属于特征值i λ的全部特征向量是{}21'123()|,0.n i i i k k C k αλαλαλ-++++∈≠(1i n ≤≤)例2 在空间[]nP x (n>1)中(P 为实数域), 求微分运算D'()()f x f x ∂= 的 特征多项式,并证明:D 在任何一组基下的矩阵不可能是对角矩阵. 证:在[]nP x 中取一组基()211,,,,2!1!n x x x n --微分运算D 在此基下的矩阵为.0000100001000010⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=DD 的特征多项式是.01000010001n D E λλλλλ=---=-从而D 的特征多项式为nλ. 因此D 的特征值为210n λλλ====.又D 的对应特征值0的奇次线性方程组()0A X -=的系数矩阵的秩为n-1,从而基础解系只含一个向量.它小于[]nP x 的维数n(n>1),故D 不可能同任何对角矩阵相似.所以微分运算D 在任何基下的矩阵都不可能是对角形. 2矩阵特征值与特征向量的五个应用2.1特征值与特征向量判断线性变换可对角化的应用定义2.1.1如果V 中存在一个基,使得线性变换A 在这个基下的的矩阵是对角矩阵,那么A 可对角化.由于线性变换A 在V 的不同基下的矩阵是相似的,因此线性变换A 可对角化当且仅当A 在V 的基下的矩阵A 可对角.定理2.1.1域F 上n 维线性空间V 上线性变换A 可对角化当且仅当A 有n 个线性无关的特征向量12,,,nξξξ,此时A 在基12,,,nξξξ下的矩阵A 为1000,00n λλ⎛⎫ ⎪⎪ ⎪⎝⎭其中i λ是i ξ所属的特征值(即i i i A ξλξ=),1,2,,.i n = 矩阵A 称为线性变换A 的标准形,除了主对角线上元素的排列次序外,A 的标准形是有A 唯一决定的.推论2.1.1 域F 上n 维线性空间V 上线性变换A 可对角化当且仅当V 中存在由A的特征向量组成的一个基.定义2.1.2设A 是域F 上线性空间V 上的一个线性变换,0λ是A 的一个特征值,令 {}00|,defV A V λααλαα==∈ .易验证V λ 是V 的一个子空间,称0V λ是A 的属于特征值0λ的特征子空间. 0V λ中全部非零向量就是A 的属于特征值0λ的全部特征向量. 由于()00000().V A I A Ker I A λααλαλααλ∈⇔=⇔-=⇔∈-因此 00().V Ker I A λλ=-即线性变换A 的属于特征值0λ的特征子空间等于线性变换0I A λ- 的核.设V 是域F 上n 维线性空间,V 上线性变换A 在V 的一个基12,,,nααα下的矩阵为A,λ是A 的一个特征值. 设σ是V 到nF 的一个同构映射,它把V 中向量对应于它在基12,,,nααα下的坐标,则()0V λσ等于n 元齐次线性方程组()00I A X λ-=的解空间,即矩阵A 的属于特征值0λ的特征子空间. 于是()()00dim V n rank I A λλ=-- .定理2.1.2设A 是域F 上n 维线性空间V 上的一个线性变换,则A 可对角化⇔A 有n 个线性无关的特征向量⇔V 中存在由A 的特征向量组成的一个基⇔A 的属于不同特征值的特征子空间的维数之和等于n 12,s V V V V λλλ⇔=⊕⊕⊕其中12,,,sλλλ 是A 的所有不同的特征值.例 3 设T 是复数域上n 维线性空间V 上的一个线性变换()1n >,它在V 的一个基12,,,nααα下的矩阵A 是1012210000010000001n n A ααααα--⎛⎫ ⎪ ⎪⎪= ⎪ ⎪ ⎪-----⎝⎭,称它是Frobennis 矩阵. 求T 的特征多项式和属于特征值i λ的全部特征向量(1,2,3,,)i n =;T 是否可对角化?令122221211112111n n n n n n P λλλλλλλλλ---⎛⎫⎪ ⎪ ⎪= ⎪⎪ ⎪⎝⎭情形112,,n λλλ两两不等. 此时0.p ≠从而P 的列向量组线性无关. 于是A 有n 个线性无关的特征向量,因此A 可对角化.此时{}112,,n p AP diag λλλ-=从而T 可对角化.情形 212,,n λλλ中有相等的. 此时0.p = 从而P 线性相关. 这时A 没有n 个线性无关的特征向量,因此A 不可对角化, 从而T 不可对角化.例4 设T 是数域K 上n 维线性空间V 上的对合变换(即T 满足2T I =),(1)证明T 有特征值,且它的特征值是1或-1.(2)判断T 是否可对角化;若可以对角化,请写出它的标准形. 解:设T 在V 的一个基12,,,nααα下的矩阵是A ,由2T I =,可得2A I =. 即A 是数域K 上的对合矩阵,设0λ是对合矩阵A 的一个特征值,则有0,α≠使0.A αλα=从而2200.A A αλαλα== 由于2A I =,因此20αλα=,即20(1)0.λα-=由于0,α≠因此2010.λ-= 即01.λ=± 当A I =时,1是A 的特征值,-1不是;当A I =-时,-1是A 的特征值,1不是; 当A I ≠±时,0.I A ±≠由于()()rank I A rank I A n -++=因此 ()().rank I A n rank I A n -=-+< 从而0.I A -=从而1是A 的一个特征值.同理可证,-1是A 的一个特征值.(1)从而,T 有特征值,且它的特征值是1或-1.(2)设().rank I A r +=由于()()rank I A rank I A n -++=,因此().rank I A n r -=- 属于特征值1的特征子空间1W 的维数为1dim ()();W n rank I A n n r r =--=--=属于特征值-1的特征子空间1W -的维数为1dim ()();W n rank I A n rank I A n r -=---=-+=-由于11dim dim (),W W r n r n -+=+-=因此A 可对角化.A 的相似标准形为{},.r n r diag I I --从而T 可对角化,且它的相似标准形为0,0rn r I I -⎛⎫ ⎪-⎝⎭其中().r rank I A =+2.2 特征值与特征向量在确定可对角化矩阵的应用当矩阵A 可对角化时,可根据A 的特征值和特征向量来确定它的元素.例 5 设3阶方阵A 的特征值1231,0,1,λλλ===-对应的特征向量分别是1231222,2,1.211ξξξ-⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪==-= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭求A .分析:此题给了3阶矩阵A 的3个不相同的特征值及其对应的特征向量,那么矩阵A 可对角化,显然可用A 的特征值和特征向量来确定它的元素.解:由i ξ是方阵A 对应于特征值i λ 的特征向量,于是i i i A ξλξ=()1,2,3.i =令()123122221212P ξξξ-⎛⎫⎪==-- ⎪⎪⎝⎭,则112212219212P -⎛⎫ ⎪=- ⎪⎪--⎝⎭, ,PA PD =其中100000,001D ⎛⎫ ⎪= ⎪ ⎪-⎝⎭ 由上式可得:11021012,3220A PDP --⎛⎫ ⎪== ⎪⎪⎝⎭ 即为所求.2.3特征值与特征向量在n 阶矩阵的高次幂的求解中的应用当n 阶矩阵A 可对角化时,即矩阵A 可与对角阵相似时,可应用矩阵的特征值与特征向量计算其高次幂()k A k N *∈,且比较简单.当n 阶矩阵A 满足下面的四个条件之一时,即可对角化,即1.A PDP -=n 阶矩阵A 有n 个线性无关的特征向量. n 阶矩阵A 有n 个互不相等的特征值.n 阶矩阵A 的每个特征值的几何重数等于其代数重数. A 为是对称矩阵. 对于(){}11212,,,,,,,,n n A PDP P D diag ξξξλλλ-===其中12,,,nλλλ是A 的n 个互不相等的特征值,i ξ是A 的属于特征值i λ的特征向量()1,2,,.i n =例6 已知矩阵122212221A ⎛⎫ ⎪= ⎪⎪⎝⎭,求k A (其中k N *∈). 分析:矩阵的高次幂的求解一般是有技巧的,这里因为矩阵A 为实对称矩阵,故可对角化. 可按上面讨论的方法求之.解 因为,T A A =所以矩阵A 为实对称矩阵,故A 可对角化为D .()()212221251221I A λλλλλλ----=---=-+---故A 的特征值为1231,5,λλλ==-=当1λ=-时,解齐次线性方程()0,I A X --=求出一个基础解系:12111,001ηη--⎛⎫⎛⎫⎪ ⎪== ⎪ ⎪⎪ ⎪⎝⎭⎝⎭ 当5λ=时,可求()50A X λ-=的一个基础解系:311,1η⎛⎫ ⎪= ⎪ ⎪⎝⎭ 令111101,011P --⎛⎫ ⎪= ⎪ ⎪⎝⎭()1001,1,5010005D diag -⎛⎫ ⎪=--=- ⎪⎪⎝⎭ 则()11,1,5P AP D diag -==--则1A PDP -=于是()()()()()()()()1111111111111()()1001112111101010121301100511121515151152153k kkkkk k k k k k k k k k k A PP APP PP APP PP APP P P AP P AP PAP P -------------==⎛⎫----⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪=--- ⎪ ⎪ ⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭-+-+-+=-+-+-()()()()111151515215k kk k k k k k---⎛⎫⎪ ⎪+ ⎪ ⎪-+-+-+⎝⎭2.4 特征值与特征向量在求一些特殊数列通项公式的应用由一些特殊数列的递推公式,构造关系矩阵A ,并列出递推关系,当关系矩阵A 可对角化时,可利用A 的特征值与特征向量求解这些数列的通项公式.例7 斐波那契(Fibonacci )数列是0,1,1,2,3,5,8,13,它满足下列递推公式:21,n n n ααα++=+ 0,1,2,n=以及初始条件010, 1.αα== 求Fibonacci 数列的通项公式,并且求1lim.nn n αα→∞+解 由2111,,n n n n n ααααα++++=+⎧⎨=⎩ 可得21111.,10n n n n αααα+++⎛⎫⎛⎫⎛⎫= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭令11,10A ⎛⎫= ⎪⎝⎭ 1,0,1,2,n n n D n αα+⎛⎫== ⎪⎝⎭上式可写成1,n n D AD +=又由1001,0D αα⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭ 所以0,.n n D A D n N *=∈于是求Fibonacci 数列的通项公式就只要去计算nA .可利用A 的相似标准形来求简化nA 的计算.211111122I A λλλλλλλ⎛⎫⎛---==--=-- ⎪ ⎪-⎝⎭⎝⎭于是A的特征值为12λλ==从而A 可对角化.对于特征值1λ,解奇次线性方程组()10,I A X λ-=求出一个基础解系:11,1λη⎛⎫= ⎪⎝⎭对于特征值2λ,可求出()20I A X λ-=的一个基础解系:22,1λη⎛⎫= ⎪⎝⎭ 令12,11P λλ⎛⎫= ⎪⎝⎭ 则1120,0P AP λλ-⎛⎫= ⎪⎝⎭从而12121121211212112010011101.1nn nn n n n n A P P λλλλλλλλλλλλλλ-++-⎛⎫⎛⎫⎛⎫⎛⎫== ⎪⎪ ⎪-⎝⎭⎝⎭⎭⎝-⎛⎫⎛⎫=⎪ ⎪-⎝⎭⎭由于110n n n A αα+⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭因此))2121211110.n nn n n n nλαλλλλλ-⎛⎫⎛⎫==- ⎪⎪-⎝⎭⎝⎭⎡⎤⎢⎥=-⎢⎥⎝⎭⎝⎭⎣⎦即为Fibonacci 数列的通项公式. 于是211211112212111lim lim lim112nn nnnn nn n nnλλαλλαλλλλλλλ++→∞→∞→∞+⎛⎫- ⎪-⎝⎭==-⎛⎫- ⎪⎝⎭==例8已知()11,1,2i ii i ib cc b c--=⎧⎪⎨=+⎪⎩其中2,3,.i =设11,b c已知,求,.n nb c解由题可得1101,2,3,1122i ii ib bic c--⎛⎫⎛⎫⎛⎫⎪==⎪ ⎪⎪⎝⎭⎝⎭⎝⎭令01,1122B⎛⎫⎪=⎪⎝⎭则111,n nnb bBc c-⎛⎫⎛⎫=⎪ ⎪⎝⎭⎝⎭下面求1n B-.()111.11222I Bλλλλλ-⎛⎫-==-+⎪--⎝⎭因此B的全部特征值是11,.2-从而B可对角化.对于特征值1,解奇次线性方程组()0,I B X-=得到它的一个基础解系:11,1ξ⎛⎫= ⎪⎝⎭对于特征值1,2-解齐次线性方程组10,2I B X ⎛⎫--= ⎪⎝⎭得到它的一个基础解系:22.1ξ-⎛⎫= ⎪⎝⎭ 令12,11P -⎛⎫= ⎪⎝⎭ 则110.102P BP -⎛⎫⎪= ⎪-⎝⎭ 从而1111122111010210121211111130211122213111222n n n n n n n n B P P ---------⎛⎫⎪= ⎪-⎝⎭⎛⎫-⎛⎫⎛⎫ ⎪= ⎪ ⎪ ⎪⎛⎫--⎝⎭⎝⎭ ⎪ ⎪⎝⎭⎝⎭⎛⎫⎛⎫⎛⎫--+- ⎪ ⎪⎪⎝⎭⎝⎭ ⎪= ⎪⎛⎫⎛⎫ ⎪--+- ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭因此22111111111112,3232111112.3232n n n n n n b b c c b c ----⎧⎡⎤⎡⎤⎛⎫⎛⎫=--++-⎪⎢⎥⎢⎥ ⎪ ⎪⎝⎭⎝⎭⎢⎥⎢⎥⎪⎣⎦⎣⎦⎨⎡⎤⎡⎤⎪⎛⎫⎛⎫=--++-⎢⎥⎢⎥ ⎪ ⎪⎪⎝⎭⎝⎭⎢⎥⎢⎥⎣⎦⎣⎦⎩2.5特征值与特征向量行列式计算中的应用用矩阵的特征值和特征向量计算三对角形的方法如下:设00000000000n a b c a b c a D a b ca =按第一行展开,得:12,n n n D aD cbD --=- 3,4,n =上式可写成21,n n n D aD cbD ++=- n N +∈由于2111,,n n n n n D aD cbD D D ++++=-⎧⎨=⎩ 令2111,,,10n n n n n n D D a cb d d A n N D D +++++-⎛⎫⎛⎫⎛⎫===∈ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭因此111,n nn n d Ad d A d +-==()2,3,n =其中2211D a cb d D a ⎛⎫-⎛⎫== ⎪⎪⎝⎭⎝⎭ 这样求nD 的问题就转化为nd 的问题,因而转化为求1,n A -即存在可逆矩阵P 使得 1P AP D -=(对角形),就可以算出1.n A -由201a cbI A a cb λλλλλ--==-+=-得A 的特征值12λλ==1) 若24a cb ≠① 若240,a cb -<则A 有两个不相等的复特征值12,,λλ在复数域上对应于12,λλ的特征向量分别为12,.ξξ取()12,P ξξ=则P 可逆 于是就有11111200n n n AP P λλ----⎛⎫=⎪⎝⎭所以111n n n n D d A d D+-⎛⎫== ⎪⎝⎭从而可求出nD .如果A 限制在实数域上,A 有复特征值,这时A 不可对角化.② 若240,a cb ->则A 有两个不同的特征值,则A 可对角化,按在复数域上的情况可求出nD2) 若24,a cb =这时A 有重根.若A 有两个线性无关的特征向量,则A 可对角化;若A 只有一个特征向量,这时可利用相似变换,把A 化若当标准形1100λλ⎛⎫ ⎪⎝⎭,可以算出1n A -,即可求出n D .例9 计算n 阶行列式:950004950004900.9500049n D =解:按第一行展开,得:12920,n n n D D D --=-()3,4,n =上式可写成21920,n n n D D D ++=-()n N +∈ 由2111920,,n n n n n D D D D D ++++=-⎧⎨=⎩ 令2111920,,,10n n n n n n D D d d A n N D D +++++-⎛⎫⎛⎫⎛⎫===∈ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭得111,n nn n d Ad d A d +-==()2,3,n =其中211619D d D ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭ 由于()()2920920451I A λλλλλλλ--==-+=---因此A 的特征值是124, 5.λλ==对于特征值14,λ=解其次线性方程组()40,I A X -=求出一个基础解系:14,1η⎛⎫= ⎪⎝⎭对于特征值25,λ=解其次线性方程组()50,I A X -=求出一个基础解系:25,1η⎛⎫= ⎪⎝⎭令45,11P ⎛⎫= ⎪⎝⎭ 则140,05P AP -⎛⎫= ⎪⎝⎭ 从而14005A P P-⎛⎫= ⎪⎝⎭111111111400545154011140554 5.4 4.554 5.4 4.5n n n n n n n n n n n n A P P---------⎛⎫= ⎪⎝⎭-⎛⎫⎛⎫⎛⎫= ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎛⎫--= ⎪--⎝⎭由于11619n n n D A D +-⎛⎫⎛⎫= ⎪ ⎪⎝⎭⎝⎭因此()11111161545.44.5549n n n n n n n D ----++⎛⎫=--=- ⎪⎝⎭例10 计算n 阶行列式:2120000121200012120000000210022n D ------=.解:将nD 按第一列展开得:1231232(2)22,n n n n n n n D D D D D D D ------=--+=+- ()4,5,6,n =上式可写成32122,n n n n D D D D +++=+-()n N *∈ 根据321221122,,,n n n n n n n n D D D D D D D D +++++++=+-⎧⎪=⎨⎪=⎩ 令323121*********,,100,5,0102n n n n n n n n D D D D D A D D D D ααα++++++-⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪===== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭ 可得1,n n A αα+=11,n n A αα-=由于()()()2121011201I A λλλλλλλ---=-=-+-- 因此A 的特征值是1231,1, 2.λλλ==-= 对于特征值11,λ= 解其次线性方程组()0,I A X -=得到一个基础解系;111,1η⎛⎫ ⎪= ⎪ ⎪⎝⎭ 同理,分别可求231, 2.λλ=-=的一个特征向量23141,2,11ηη⎛⎫⎛⎫ ⎪ ⎪=-= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭ 令114112,111P ⎛⎫ ⎪=- ⎪ ⎪⎝⎭ 则1100010002P AP -⎛⎫ ⎪=- ⎪ ⎪⎝⎭ 于是1100010002A P P -⎛⎫ ⎪=- ⎪ ⎪⎝⎭从而()()()()11111111111000100021001143361112010132611100220211233611121326202112n n n n n n n n n n n A P P -------+--⎛⎫ ⎪=- ⎪ ⎪⎝⎭⎛⎫-⎛⎫⎛⎫ ⎪ ⎪ ⎪=--- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪- ⎪⎝⎭⎝⎭⎝⎭⎛⎫--⎛⎫ ⎪ ⎪ ⎪=-- ⎪ ⎪ ⎪- ⎪⎝⎭-⎝⎭于是()()()1121111123361011121325,62022112n n n n n n n n n D D D -+++--⎛⎫--⎛⎫⎛⎫⎛⎫ ⎪ ⎪ ⎪⎪ ⎪=-- ⎪ ⎪⎪ ⎪ ⎪ ⎪⎪- ⎪⎝⎭⎝⎭⎝⎭-⎝⎭从而()()()()()121013123 3.16 2.12562112263n n n nn n n n D -+⎛⎫ ⎪=-+-++-+-- ⎪ ⎪⎝⎭-=-++3.小结本文利用特征值与特征向量的一些命题和性质来探讨特征值与特征向量在一些解题计算中的应用,充分应用命题和性质给我们的解题带来很大的方便.参考文献[1] 大学数学系几何与代数教研室前代数小组.高等代数(第三版)[M].北京:高等教育出版社,2003.[2] 同济大学应用数学系. 工程数学- 线性代数(第4版) [M] . 北京:高等教育出版社,2003.[3] 奚传志. 矩阵的特征值与特征向量在行列式计算中的应用枣庄师专学报,1992年2期[4] 李淑花. 关于一类线性代数习题的快速解法[J]. 高等数学研究.[5] 谢国瑞. 线性代数及应用[M]. 北京:高等教育出版社,1999.[6] 戴华. 矩阵特征值反问题的若干进展[J]. 南京航空航天大学学报,1995.[7] 钱吉林.高等代数题解精粹[M].北京:中央民族大学出版社.[8]邵丽丽.矩阵的特征值和特征向量的研究.菏泽学院.计算机与信息工程系.山东菏泽(274015)[9] 朱凤娟.特征值与特征向量逆问题的研究[J].滨州学院学报2007.6 .[10] [英]S.巴比特. 科技工作者用矩阵方法[M] .北京:化学工业出版社.1984.126-137.[11]丘维声,高等代数(第二版)下册.北京:高等教育出版社[12] tephen H.Friedbeng等.Linear Algebra(4th Edition) [M].Prentice Hall/Pearson,1998.[13] Verler.W.J.Vectors Structures and Solutions of linear Matrix Equation, linear Algebra Appl;1975.[14]丘维声,高等代数(第二版)上册.北京:高等教育出版社[15] 熊全淹,线性代数[M].北京;高等教育出版社,1987.4.[16]丘维声,高等代数学习指导(下册).北京:清华大学出版社,2009[17]杨子胥,高等代数习题解(下册).济南:科学技术出版社,2009[18]丘维声,高等代数学习指导(上册).北京:清华大学出版社,2009致谢本学位论文是在我的指导老师张宝环老师的亲切关怀与细心指导下完成的.由于经验的匮乏,难免有许多考虑不周到的地方,从论文的选题、资料的搜集到论文的撰写编排整个过程中,张老师始终都给予了悉心的指导和不懈的支持,并为我指点迷津,帮助我开拓思路,精心点拨,热忱鼓励.张老师的一丝不苟的作风,严谨求实的态度,踏踏实实的精神,不仅授我以文,而且教我做人,给我以终生受益无穷之道.感谢老师们对我的教育培养.他们细心指导我的学习与研究.在此,我要向诸位老师深深地鞠上一躬.同时我要感谢同组的同学们,是我们相互的鼓励和支持才使得做论文的过程充满着快乐和感动.在此,我对所有帮助我的老师和同学们表达我衷心的感谢!。

矩阵数学论文3000字_矩阵数学毕业论文范文模板

矩阵数学论文3000字_矩阵数学毕业论文范文模板

矩阵数学论文3000字_矩阵数学毕业论文范文模板矩阵数学论文3000字(一):Pre5G获GSMA双料大奖揭秘:竟是多维矩阵的数学创新论文最受评委认可的是Pre5G的高技术含量,它是通过高超、复杂的数学方法实现的,绝非技术的简单包装。

如果每一年巴塞罗那MWC展会都会树立几个风向标的话,那么“创新加速5G”无疑是本届MWC大会当仁不让的主题。

本届展会的第二天,中国的5G创新再次掀起了MWC的高潮,中兴通讯凭借Pre5GMassiveMIMO荣获全球移动大奖“最佳移动技术突破”(BestMobileTechnologyBreakthrough)以及CTO选择奖(OutstandingoverallMobileTechnology-TheCTO’sChoice2016),一时间被全球广泛关注。

由GSM协会主办的MWC是全球最具影响力的移动通信领域的盛会,全球移动大奖则是目前被业界认可的最高荣誉,被誉为“通信业的奥斯卡奖”。

而CTO选择奖的重量级在于,获奖技术是从6个移动专项获奖中再次选出最佳的一个“奖中奖”,该奖项的评委是由来自全球16家运营商的首席技术官组成的,他们非常看重入选内容的独到创新点,以及是否可以真正改善客户体验、降低成本,真正通过创新提升运营商商业价值。

而且,中兴通讯今年作为惟一的中国企业获此殊荣。

事实上,这也是5G领域第一次获得行业最高奖项并获得CTO的一致认可,两大奖项不仅奠定了中兴通讯在无线宽带领域的领军者形象,更意味着从3G的试探、4G的积极,到5G的超前,中国技术的不断创新已经获得全球认可。

颠覆式创新的核心GSMA大奖评委会给出的获奖点评是“Pre5GMassiveMIMO技术是移动宽带演进上的颠覆性创新”。

从技术上看,Pre5G最主要的技术MassiveMIMO通过128天线阵元,支持多达12到16流的动态beamforming,在不改变空口、不增加频点、不改变终端的前提下,快速实现了频谱效率倍增,三维立体覆盖能力超强,且Pre5G兼容4G终端,使得现网引入Pre5G更加从容。

矩阵理论论文

矩阵理论论文

矩阵分解在信号和图像处理方面的应用矩阵理论是一门发展完善、理论严谨、方法独特的理论基础课程,它对培养学生的逻辑能力、推理能力具有重要作用,但它又能广泛应用于各个领域。

矩阵理论主要内容包括线性空间、线性变换、范数理论;矩阵分析;矩阵分解;广义逆矩阵;特征值的估计以及广义特征值等。

用矩阵的理论和方法来处理现代工程技术中的各种问题已经越来越普遍。

下面简单介绍一下矩阵的奇异值分解在信号和图像处理方面的简单应用。

此方法近年来在数据降维和压缩,滤波器设网络节点估计、小波变换结果的后续处理等很多领域都获得了重要的应用。

在滤波器设计方面,VOZALIS等将SVD 用于协同滤波,他们的研究结果表明,SVD提高了协同滤波过程中预测的质量和精度。

而在消噪方面,LEHTOLA等利用SVD和数学形态学相结合,对心电信号(Electrocardiogram,ECG)进行处理,消除了噪声的影响,提高了心电图诊断的准确性。

同时奇异值分解已用于从孕妇皮肤测量信号中提取胎儿心电信号。

在另一些研究中SVD则被利用来实现特征提取和弱信号分离,如LIU等利用SVD从背景噪声强烈的振动信号中提取周期性冲击信息。

SVD在神经网络中也获得了应用,如TEOH等利用SVD实现了对隐层空间中模式的线性独立性分析,进而决定了隐层神经元节点的数目。

SVD的正交化特性在对小波和小波包变换结果的后续处理中也得到了有效的应用,如XIE等利用SVD对小波包分解后的肌电信号进行正交化处理,以获得代表肢体运动模式的最优特征,进而对肌电信号进行分类,用于对假肢的控制。

小波多分辨分析的本质就是把信号在一系列不同层次的空间上进行分解,获得相应的近似和细节信号,从而以不同的层次显示信号的各种概貌和细节特征[9],这种多分辨思想使得小波分析在很多领域获得了极为广泛的应用。

基于这种多分辨分析思想的思考,赵学智在SVD中提出了一种矩阵二分递推构造方法,根据该方法得到的SVD分解结果将分属于不同层次的空间,而且下一层次空间的基矢量是利用上一层次的近似基矢量而获得的,实现了利用SVD以不同的层次来展现信号的概貌和细部特征。

矩阵论文——精选推荐

矩阵论文——精选推荐

矩阵变换法在降低OFDM信号峰均功率比中的应用摘要:近年来,正交频分复用(OFDM)技术继单载波扩频技术(如CDMA)之后,成为主流的传输技术。

目前,OFDM技术已经在DAB(数字广播)、DVB(数字电视)、IEEE802.1lg/a/n,802,16d/e等系统中获得了广泛的应用,正在标准化的3GPP LTE(长期演进)和3GPP2 AIE(空中接口演进)技术也很可能选用OFDM及其改进型(下行OFDMA、上行DFT-S-OFDM)作为基本多址技术。

OFDM的一个主要不足是其发送信号具有很高的峰值与平均功率(PAFR)。

当发送信号的瞬时功率超出功率放大器的动态范围时,将会导致信号的裁剪而产生非线性的信号失真,造成信号畸变,导致频带内的噪声功率增加和频带外的功率扩散,还将破坏各子载波之间的正交性。

本文针对矩阵变换方法的降峰均比性能、实现复杂度,对信号抗噪声性能的影响、对信息速率的影响等方面进行了研究和比较,都进行了较详细的研究和仿真。

关键词:矩阵变换法 OFDM 峰均功率比1.引言近几年来,随着对下一代无线通信系统研究的进展,OFDM渐渐成为主流技术。

与传统的单载波传输方式相比,OFDM具有如下的优点【1】:(1) 频谱效率高:由于FFT变换的正交性使各子载波可以部分重叠,理论上可以接近Nyquist极限。

以OFDM为基础的多址技术OFDMA(正交频分多址)可以实现小区内各用户之间的正交性,从而有效避免用户间干扰。

这使OFDM系统可以实现很高的小区容量。

(2) 带宽扩展性强:由于OFDM系统的信号带宽取决于使用的子载波的数量。

因此OFDM系统具有很好的带宽扩展性。

小到几百KHz,达到几百MHz,都比较容易实现。

尤其是随着移动通信宽带化(将由<5MHz增加到最大20MHz以上),OFDM系统对大带宽的有效支持。

成为其相对于单载波技术(如CDMA)的“决定性优势”。

(3) 抗多径衰落:由于OFDM将宽带传输转化为很多子载波上的窄带传输,每个子载波上的信道可以看作平坦衰落信道,从而人人降低了接收机均衡器的复杂度。

电子科大矩阵理论试题答案(2005级)

电子科大矩阵理论试题答案(2005级)

2005级硕士研究生《矩阵理论》试卷参考答案一、判断题(40分)(对者打∨,错者打⨯) 1、A n 为阶实对称矩阵,n R x 对中的列向量,||x |Ax =定义, ||x||x 则为向量 的范数. ( ⨯ )2、设A n 为阶Hermite 矩阵,12,,,n λλλ是矩阵A 的特征值,则2221||||nm i i A λ==∑.( ∨ ) 3、如果m n A C ⨯∈,且0A ≠,()H AA AA --=, 则2||||AA n -=. ( ⨯ ) 4、设||||a 为丛属于向量范数||||a x 的算子范数,2H H E uu =-(其中,E 为n 阶单位矩阵,2||||1n u C u ∈=且),则||||a H n = ( ⨯ )5、设1/51/51/51/51/62/61/61/61/71/73/71/71/81/81/84/8A ⎛⎫⎪⎪=⎪⎪⎝⎭,则A 矩阵的谱半径()1r A <. ( ∨ )因为||||1A ∞<,故结论成立6、若(1)m m A C m ⨯∈>严格对角占优,则A 的谱半径()||2||.m r A A ∞< ( ∨ )7、若设n x R ∈,则212||||||||||x x x ≤≤. ( ∨ )8、设111122223333A ⎛⎫ ⎪= ⎪ ⎪⎝⎭,则1||||1m A +=. ( ⨯ )9、设G 为矩阵()m n r A C r n ⨯∈<的广义逆A -,A BD =为A 的最大秩分解,则 秩()DGB n =. ( ⨯ )10、设A ⎛⎫ ⎪⎪ ⎪⎝⎭0.90.010.12=0.010.80.130.010.020.4,则A 的特征值均为实数. ( ∨ )二、证明:(1) 当0A =时,||||0A =;当0A ≠时,存在,i j 使得0ij a ≠,从而|||||0ij A a ≥>。

(2) ,||||||ij i jkA ka=,||||ij i jk a =||||||k A =.(3) ,||||||ij ij i jA B a b +=+,|||)ij ij i ja b ≤+,,||max ||)ij ij i ji ja b ≤+||||||||A B ≤+.(4) 22211||||||mn ij j i j Ax a x ===∑∑22111(||||)m nnij j i j j a x ===≤∙∑∑∑22111(||)||m nnij j i j j a x ===≤∙∑∑∑222max ||||||ij ijmn a x ≤∙222||||||||A x ≤∙三、证明:()||||1r A A ∞≤=|1|0E A -=⇒1为A 的特征值 ∴()1r A =四、设m n D C ⨯∈为列满秩矩阵,D +为M-P 广义逆,n n A C ⨯∈,证明: 2||||||||A DAD += 为n n C ⨯上的矩阵范数. (10分)证明:(1) 当0A =时,||||0A =;当0A ≠时,m n D C ⨯∈为列满秩矩阵, 则1()H H D D D D +-=, D D E +=。

成都电子科技大学矩阵论课程结课论文

成都电子科技大学矩阵论课程结课论文

集成电路噪声模型的矩阵表示摘要:本文给出了集成电路的噪声模型及其矩阵表示,首先介绍了分立器件的噪声矩阵,根据叠加原理得出二端口网络及二端口互联网络的噪声模型。

运用矩阵理论分析集成电路噪声,直观,方便,主要运算过程都涉及矩阵的转置、矩阵的逆、矩阵的共轭以及矩阵的四则运算,便于进行计算机信息处理。

关键词:集成电路噪声二端口网络矩阵理论1引言噪声是影响现代电子系统性能的一个主要因素,随着集成电路工艺技术的发展,电源电压越来越低,噪声对电子系统的影响越来越大,已经成为大多数模拟电路设计中要考虑的最主要因素。

集成电路的低噪声化及其噪声特性分析是通信与信息系统领域中的重要研究课题,在近代信息技术各个应用领域中,低噪声集成电路的需求量越来越大,而且对噪声特性的要求越来越高,其原因是器件和电路的噪声水平及噪声特性直接关系到信号检测灵敏度和电路或系统的可靠性,关系到系统的整体性能,在电子系统设计阶段,不仅要选用低噪声集成电路器件,而且要对不同集成电路进行噪声分析,并优化各种参数及结构,显然,应用有效的噪声分析手段不仅可以大大缩短研制周期,节省研制费用,而且可保证研制开发的集成电路应用系统具有优良的性质。

集成电路应用系统通常是一个比较复杂的系统,然而,任何一个复杂的系统都可以分解成相对比较简单的单元,使大系统变成小系统,使复杂问题简单化,从而便于分析。

本文先讨论分立原件的噪声模型,进而分析互联电路网络的噪声。

2.MOSFET’s器件的噪声矩阵随着CMOS工艺技术的进步,CMOS 技术在无线通讯领域中的应用成为可能, 相应地MOSFET’s的噪声行为日益受到重视,近来有许多作者致力于MOSFET’s的噪声模型研究,一个精确的噪声模型可以使电路设计者更加充分利用现有技术。

图1是一个典型的MOSFET等效噪声电路模型,其中考虑了如下的噪声电流源:沟道噪声(i ds),栅极诱生噪声(i gs),栅极电阻热噪声(i g),源漏电阻热噪声(i s,i d)。

矩阵在数学中的应用本科毕业论文

矩阵在数学中的应用本科毕业论文

本科毕业论文(设计)题目矩阵在数学中的应用____________________________________毕业论文(设计)原创性声明本人所呈交的毕业论文(设计)是我在导师的指导下进行的研究工作及取得的研究成果。

据我所知,除文中已经注明引用的内容外,本论文(设计)不包含其他个人已经发表或撰写过的研究成果。

对本论文(设计)的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意。

作者签名:日期:毕业论文(设计)授权使用说明本论文(设计)作者完全了解**学院有关保留、使用毕业论文(设计)的规定,学校有权保留论文(设计)并向相关部门送交论文(设计)的电子版和纸质版。

有权将论文(设计)用于非赢利目的的少量复制并允许论文(设计)进入学校图书馆被查阅。

学校可以公布论文(设计)的全部或部分内容。

保密的论文(设计)在解密后适用本规定。

作者签名:指导教师签名:日期:日期:注意事项1.设计(论文)的内容包括:1)封面(按教务处制定的标准封面格式制作)2)原创性声明3)中文摘要(300字左右)、关键词4)外文摘要、关键词5)目次页(附件不统一编入)6)论文主体部分:引言(或绪论)、正文、结论7)参考文献8)致谢9)附录(对论文支持必要时)2.论文字数要求:理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。

3.附件包括:任务书、开题报告、外文译文、译文原文(复印件)。

4.文字、图表要求:1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。

图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画3)毕业论文须用A4单面打印,论文50页以上的双面打印4)图表应绘制于无格子的页面上5)软件工程类课题应有程序清单,并提供电子文档5.装订顺序1)设计(论文)2)附件:按照任务书、开题报告、外文译文、译文原文(复印件)次序装订3)其它目录摘要 (I)Abstract. (II)1 前言 (1)2 有关概念及重要结论 (1)2.1矩阵的概念 (1)2.2矩阵的秩 (2)2.3矩阵的逆 (3)2.4 用矩阵表示二次型 (3)3 矩阵的应用 (6)3.1矩阵的高次幂 (6)3.1.1 矩阵的幂 (6)3.1.2矩阵高次幂的求法 (7)3.2 解线性方程组 (13)3.2.1线性方程组的有解判定定理 (13)3.2.2 线性方程组一般形式的运用 (14)3.3 解矩阵方程 (16)3.4 矩阵对角化方法 (19)3.4.1 讨论对于有n个特征单根的n阶方阵 (19)3.4.2 讨论对于有特征重根的n阶方阵 (21)结论 (24)致谢 (24)参考文献 (24)矩阵及应用杨灿(重庆三峡学院数学与统计学院数学与应用数学专业2010级重庆万州 404100)摘要:矩阵理论既是学习经典数学的基础,又是一门很有实用价值的数学理论.随着科学技术的发展,这一理论已成为现代各科技领域处理大量数据的有效工具.本文就是利用矩阵的基本理论,把矩阵作为计算工具,对实际问题如方程组的解、矩阵的幂、二次型进行了较为系统的研究并简化了一些计算.关键词: 矩阵;矩阵的幂;线性方程组Matrix and Its ApplicationYANG Can(Grade 2010, Mathematics and Applied Mathematics, College of Mathematics and statistics, Chongqing Three Gorges University, Wan Zhou, Chongqing 404100 )Abstract:Matrix theory is not only the foundation of learning classical mathematics,but also is a very useful mathematical theory.With the development of science and technology,this theory has become the effective tool for modern technology in the field of large amounts of data.This article is on the undamental theory of matrix,the matrix as a calculation tool,the practical problems such as the solution of the equations,the power of matrix,the two type are systematically studied and some simplified calculation.Keywords:Matrix; The power of matrix; Linear equation2014届数学与应用数学专业毕业设计(论文)1 前言矩阵是数学中的一个重要的基本概念,是代数学的主要研究对象之一,也是数学研究和应用的一个重要工具.“矩阵”这个词是由西尔维斯特首先使用的,他是为了将数字的矩形阵列区别于行列式而发明了这个术语.而实际上,矩阵在它的课题诞生之前就已经发展的很好了.18世纪中期,数学家们开始研究二次曲线和二次曲面的方程简化问题,即二次型的化简.在这一问题的研究中,数学家们得到了与后来的矩阵理论密切相关的许多概念和结论.1748年,瑞士数学家欧拉(L .Euler,1707—1783)在将三个变数的二次型化为标准形时,隐含地给出了特征方程的概念.1773年,法国数学家拉格朗日(J .L .Lagrange,1736—1813)在讨论齐次多项式时引入了线性变换.1801年德国数学家高斯(C .F .Gauss,1777一1855)在《算术研究》中,将欧拉与拉格朗日的二次型理论进行了系统的推广,给出了两个线性变换的复合,而这个复合的新变换其系数矩阵是原来两个变换的系数矩阵的乘积.另外,高斯还从拉格朗日的工作中抽象出了型的等价概念,在研究两个互逆变换的过程中孕育了两个矩阵的互逆概念.在线性方程组的讨论中,我们看到,线性方程组的一些重要性质反映在它的系数矩阵和增广矩阵的性质上,并且解线性方程组的过程也表现为变换这些矩阵的过程.除了线性方程组之外,还有大量的各种各样的问题也都提出矩阵的概念,并且这些问题的研究常常反映为有关矩阵的某些方面的研究,甚至于有些性质完全不同的、表面上完全没有联系的问题,归结成矩阵问题以后却是相同的.这使矩阵成为数学中一个极其重要的应用广泛的概念,因而也就使矩阵成为代数特别是线性代数的一个主要研究对象,也是处理高等数学很多问题的有力工具.矩阵的秩是一个基本的概念,也是矩阵最重要的数量特征之一,它在初等变换下是一个不变量.矩阵的秩是反映矩阵固有特性的一个重要概念,无论是在线性代数中,还是在解析几何中,甚至在概率论中,都有不可忽略的作用.矩阵方幂在高等代数题解、矩阵稳定性讨论及预测、控制等方面有广泛的应用,它的求解原理贯穿于代数教学过程的始终,可以用到矩阵各方面的知识.其计算量往往较大,但方法适当,可大大简化其计算难度.本文将给出六种求矩阵方幂地方法.矩阵方程是矩阵运算的一部分,这里我们主要讨论如何求解矩阵方程的问题.掌握简单的矩阵方程的求法,对于求解复杂的矩阵方程有很大帮助.2 有关概念及重要结论2.1矩阵的概念为了便于叙述并考虑以后的应用,我们引进矩阵的概念.由mn 个数排列而成的m 行(横的)n 列(纵的)的表⎪⎪⎪⎪⎪⎭⎫⎝⎛mn m m n n a a a a a a a a a 212222111211称为一个n m ⨯杨灿:矩阵及其应用矩阵.定义 1 把矩阵A 的行换成同序数的列得到的新矩阵, 称为A 的转置矩阵, 记作T A (或A ').即若,212222111211⎪⎪⎪⎪⎪⎭⎫⎝⎛=mn m m n n a a a a a a a a a A 则⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=mn n n m m Ta a a a a a a a a A 212221212111. 2.2矩阵的秩定义2 所谓矩阵的行秩就是指矩阵的行向量组的秩;所谓矩阵的列秩就是指矩阵的列向量组的秩.引理1 如果齐次方程组⎪⎪⎩⎪⎪⎨⎧=+++=+++=+++000221122221211212111n sn s s nn n n x a x a x a x a x a x a x a x a x a 的系数矩阵⎪⎪⎪⎪⎪⎭⎫⎝⎛=sn s s n n a a a a a a a a a A 212222111211的行秩n r <,那么它有非零解.定理1 矩阵的行秩与列秩相等.定理 2 n n ⨯矩阵⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n a a a a a a a a a A 212222111211的行列式为零的充分必要条件是A 的秩小于n .推论 1 齐次线性方程组⎪⎪⎩⎪⎪⎨⎧=+++=+++=+++000221122221211212111n nn n n nn n n x a x a x a x a x a x a x a x a x a 有非零解的充分必要条件是它的系数矩阵⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n a a a a a a a a a A 212222111211的行列式等于零.2.3矩阵的逆我们知道,n 阶单位矩阵E 单位性质,即对于任意n 阶方阵A 都有A EA AE ==,是否存在n 阶方阵B 使得E AB =呢?即是否与数域P 中数一样的性质:1)0(1=⋅⇒∈≠∀-a a P a .为此,我们引进逆矩阵的概念.定义1 n 阶方阵A 称为可逆的,如果有n 阶方阵B ,使得E BA AB ==. (2.3.1)这里E 是n 级单位矩阵.并且称B 为A 的一个逆矩阵.定义2 如果矩阵B 适合(2.3.1),那么B 就称为A 的逆矩阵,记为1-A . 定理1 n 阶矩阵A 可逆的充分必要条件是A 非退化,此时,A 的逆矩阵为0,1*1≠==-A d A dA . 定理2 给出了矩阵可逆时逆矩阵的计算公式.下面给出可逆矩阵的一些性质: 性质1 如果n 阶方阵A 可逆,那么0≠=A d ,并且dA 11=-. 性质2 如果矩阵B A ,同级且都可逆,那么T A 与AB 也可逆,且11111)(,)()(-----==A B AB A A T T .性质3 如果n 阶方阵A 可逆,那么kA N k ,∈∀也可逆,并且k k A A )()(11--=. 性质4 如果n 阶方阵A 可逆,那么k A Z k ,∈∀也可逆,并且k k A A )()(11--=.性质5 如果n 阶方阵A 可逆,那么Z l k ∈∀,,有l k l k k l kl l k A A A A A A +===,)()(. 定理3 A 是一个n s ⨯矩阵,如果P 是s s ⨯可逆矩阵,Q 是n n ⨯可逆矩阵,那么)()()(A r AQ r PA r ==.推论1 在定3的假设下有,)()(A r PAQ r =成立.2.4 二次型及矩阵表示定义1 设P 是一个数域,一个系数ij a 在数域P 中的n x x x ,,,21 的二次齐次多项式 jinj i ij i ni ii n xx a x a x x x f ∑∑≤≤≤=+=121212),,,( . (2.4.1)定义2 记ij ji a a =,把n 元二次型(2.4.1),写成对称形式j i ni nj ij n x x a x x x f ∑∑===1121),,,( . (2.4.2)这样,系数ij a 可以构成一个n n ⨯对称矩阵⎪⎪⎪⎪⎪⎭⎫⎝⎛==nn n n n n nn ij a a a a a aa a a a A 212222111211)(, (2.4.3) 称(2.4.3)为n 元二次型(1)的矩阵. 令Tn x x x x ),,,(21 =,则有i n i j nj ij j i n i n j ij n x x a x x a x x x f ∑∑∑∑======111121)(),,,( ,=⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛∑∑∑===n j j nj n j j j n j j j n x a xa x a x x x 1121121),,,( ,=⎪⎪⎪⎪⎪⎭⎫⎝⎛⎪⎪⎪⎪⎪⎭⎫⎝⎛n nn n n n n n x x x a a a a a a a a a x x x 2121222211121121),,,(,=Ax x T, (2.4.4)这就是二次型的矩阵表示.对确定的n 元二次型(2.4.1),就确定唯一的对称矩阵(2.4.3)通过(2.4.4)联系起来,即Ax x xx a x x x f T jin i nj ij n ==∑∑==1121),,,( .因此,一个n 元二次型(2.4.1)对应一个n 阶对称矩阵.每个二次型都有一个对称矩阵与之对应;反之,每个对称矩阵也有一个二次型与之对应.二次型与它的矩阵是相互唯一确定的.一般地,关于二次型的矩阵有下列结果.定理1 设B 是n n ⨯矩阵,则Bx x x x x f Tn =),,,(21 是一个二次型,它的矩阵为2BB T +.2.5 特征值与特征向量n 维线性变换空间V 与矩阵空间nn p ⨯是同构关系,可以通过矩阵来研究线性变换的性质,我们希望找到一组基,,,21n ξξξ 使得线性变换A L 在这组基下的矩阵A 的形式最简单.这个问题的一个简单设想是A 是否可以是对角形式?即),,,(,,,3,2,1,21n j j j A a a a diag A n j a L ===ξξ.这个设想可以归结为:对线性空间V 的线性变换ξξk L A =,P k ∈.这就是线性变换的特征值与特征向量.定义1 设A L 是数域P 上线性空间V 的一个线性变换,如果对于数域P 中一数0λ,存在一个非零向量ξ,使得ξλξ0=A L .那么0λ称为A L 的是一个特征值,而ξ称为A L 的属于特征值0λ的一个特征向量.定义2 设A 是数域P 上一n 级矩阵, λ是一个文字. 矩阵A -E λ的行列式nnn n nn a a a a a a a a a ---------=A -E λλλλ212222111211,称为A 的特征多项式, 这是数域P 上的一个n次多项式.上面的分析说明, 如果0λ是线性变换A L 的特征值, 那么0λ一定是矩阵A 的特征多项式的一个根; 反过来, 如果0λ是矩阵A 的特征多项式在数域P 中的一个根, 即00=-E A λ, 那么齐次线性方程组⎪⎪⎩⎪⎪⎨⎧=-----=---+-=----0)(0)(0)(022111222012112121110n nn n n nn n n x a x a x a x a x a x a x a x a x a λλλ (2.5.1)就有非零解. 这时,如果),,,(00201n x x x 是方程组(2.5.1)的一个非零解, 那么非零解向量.n n x x x ζζζζ0202101+++= .满足(2.5.1)式, 即0λ是线性变换A L 的一个特征值, ζ就是属于特征值0λ的一个特征向量.定理1 设A L 是数域P 上n 维线性空间V 的一个变换,则P ∈0λ是A L 的一个特征值当且仅当0λ是A L 的特征多项式)()(λλA L f f A≡的一个根.定理2 设0λ是线性空间V 的线性变换A L 的一个特征值,则集合{}V L V A ∈==ααλααλ,00 (2.5.2)构成V 的一个子空间.在有限维情形,)(dim 00A E R n V --=λλ,其中,V n dim =,A 是A L 在V 在某个基下的矩阵.定义3 设0λ是线性空间V 的线性变换A L 的一特征值,式(2.5.2)定义的V 的子空间称为A L 的对应特征值0λ的特征子空间0λV因此, 确定一个线性变换A 的特征值与特征向量的方法可以分成一下几步: (1)在线性空间V 中取一组基n ζζζ,,,21 , 写出A L 在这组基下的矩阵A ;(2)求出A 的特征多项式A -E λ在数域P 中全部的根, 它们也就是线性变换A L 的全部特征值;(3)把所得的特征值逐个代入方程组(2.5.1)式, 对于每一个特征值, 解方程组(2.5.1)式,求出一组基础解系, 它们就是属于这个特征值的几个线性无关的特征向量在基n ζζζ,,,21 下的坐标, 这样, 我们也就求出了属于每个特征值的全部线性无关的特征向量.矩阵A 的特征多项式的根有时也称为A 的特征值, 而相应的线性方程组(2.5.1)式的解也就称为A 的属于这个特征值的特征向量.3 矩阵的应用3.1矩阵的高次幂3.1.1 矩阵的幂定义1 设方阵n n ij a A ⨯=)(, 规定.,,0为自然数个k A A A A E A k k⋅⋅⋅==k A 称为A 的k 次幂.方阵的幂满足以下运算规律(假设运算都是可行的): (1) );,(为非负整数n m A A A n m n m +=(2) .)(mn n m A A =注意: 一般地,,)(m m m B A AB ≠ m 为自然数命题1 设B A ,均为n 阶矩阵,,BA AB = 则有,)(m m m B A AB = m 为自然数,反之不成立.3.1.2 矩阵高次幂的求法矩阵方幂在高等代数题解、矩阵稳定性讨论及预测、控制等方面有广泛的应用,它的求解原理贯穿于代数教学过程的始终,可以用到矩阵各方面的知识.其计算量往往较大,但方法适当,可大大简化其计算难度.本文将给出六种求矩阵方幂地方法.3.1.2.1 利用凯莱——哈密尔顿(Cayley —Hamilton )定理求方阵的幂定理1 (Cayley —Hamilton 定理)设A 是n 阶矩阵,)(λf 是A 的特征多项式,则0)(=λf . 设A 是数域P 上n 阶方阵,其特征多项式为)(λf ,为求A n(n 是正整数),令n g λλ=)(,做带余除法,)()()()(λλλλr q f g +=.由定理1知,)()(λλr g =,并且)(λr 的次数小于)(λg 的次数,进而可得n r g A =A =A )()(.利用上定理求幂时在计算过程中可分为两种情形:1、所求矩阵的幂指数相对较低,可直接利用定理1及余式定理求出)(λr .例1 已知 ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=101121002A ,求5A .解 令5)(λλ=g 矩 阵A 的 特 征 多 项 式 为)1()2(11121002)det()(2--=-----=A -I =λλλλλλλf 做带余除法,6811649)1750)(()(225+-+++==λλλλλλλf g 于是,由定理1知I +A -A =I +A -A ++A +A A =A =A 68116496811649)1750)(()(2225f g⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=1000100016810112100211610334300449 ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=10313132310032 2、所求矩阵的幂指数相对较高,不便用上法直接求出余式.此种情形下矩阵的特征多项式有重根和无重根时分别给出下面的解法.(1)矩阵的特征多项式无重根.对于i ni i c q f r q f g λλλλλλλ∑=+=+=1)()()()()()(,以其n 个不同的特征值分别代入此式即可求出)(λr .例2 已知⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=A 211110101,求991003A -A .解 令991003)(λλλ-=g .矩阵A 的特征多项式为)3)(1(211110101)det()(--=-------=A -I =λλλλλλλλf .做带余除法,注意到)(λf 的次数是3,即c b a q f g +++=-=λλλλλλλ299100)()(3)(. 以3,1,0=λ分别代入上式得0)0(==c g .2)1(-=++=c b a g .039)3(=++=c b a g . 所以0,3,1=-==c b a .由定理1 ,A -A =I +A +A =A -A =A 33)(2299100c b a g⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=0000110112111101013631321312.(3)矩阵的特征多项式有重根.同上法,为获得足够的信息求出)(λr ,可对)()()()(λλλλr q f g +=求导.例3 已知⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=A 210111111,求100A .解 A 的特征多项式是)2()1()det()(2--=A -E =λλλλf 令100)(λλ=g ,做带余除法0122)()()(b b b q f g +++=λλλλλ以2,1=λ分别代入上式,有⎩⎨⎧=++==++=100012012234)2(1)1(b b b g b b b g 为求)2,1,0(=i b i ,就)(λg 对λ求导得10012'2'1002)()()()]1()2)(1(2[)(λλλλλλλλλ=+++-+--=b b q g q g 以1=λ代入上式,有100212=+b b ,从而求得 1000201110022102,3022,2201-=-=-=b b b , 于是 I +A +A =A0122100b b b .3.1.2.2 对于秩为1的n 阶方阵A 有下面定理定理1 对于n 阶方阵A,若1)(=A rank ,那么A 可分解为一个列向量与一个行向量的乘积'αβ=A ,其中⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=n n b b b b a a a a .,.321321 βα.例4 已知⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=A 1233321231211,求n A . 解 显然1)(=A rank ,并且⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=A 1233321231211⎥⎦⎤⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=3121132`1,而331211321=⎥⎦⎤⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡,所以⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡=A =⎥⎦⎤⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=A ---123332123121133312113213111n n n n .3.1.2.3 可分解为数量矩阵和零幂矩阵之和的情况要点 观察推敲矩阵A ,看其是否可以分解为一个数量矩阵E λ与一个零幂矩阵P 之和,即P +E =λA ,其中O m ≠P ,但O m =P+1,因为数量矩阵E λ和P 可以交换,于是由二项式定理得m m n kn n k k n nk k k n nk nnm n n k n k n A P ⎪⎪⎭⎫ ⎝⎛++P +=P ⎪⎪⎭⎫ ⎝⎛=P E ⎪⎪⎭⎫ ⎝⎛=P +E =---=-=∑∑λλλλλλ 100)()(.例5 已知矩阵,⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=2000420000210042A ,求n A . 解 观察矩阵A 的特点,可先将其分块写成⎪⎪⎭⎫ ⎝⎛=C O O B A ,其中⎪⎪⎭⎫ ⎝⎛=2142B ,⎪⎪⎭⎫⎝⎛=2042C ,则⎪⎪⎭⎫ ⎝⎛=n nn C OO B A ,下面就先求n B 和nC . 显然1)(=B r ,即pq B =,这里⎪⎪⎭⎫⎝⎛=12p ,⎪⎪⎭⎫⎝⎛=21q ,且4=qp ,所以B B n n 14-=. 至于P +E =⎪⎪⎭⎫⎝⎛+E =⎪⎪⎭⎫ ⎝⎛=2004022042C ,⎪⎪⎭⎫ ⎝⎛=P 0040满足O P =2,代入上述给出的二 次项式公式⎥⎦⎤⎢⎣⎡⋅=P +E =P E +E =+E =---nn nn n n nnnn n n P C 2024222)2()2()2(111. 因此本题得解 ⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⋅⋅⋅=---n n n n n n n A 2024200004200442111. 3.1.2.4 归纳法例6 已知⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=100101αβαA ,求其n 次幂. 解 先来计算A 的较低次幂2A 和3A ,由矩阵乘法直接计算得⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+=10021022122αβααA ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+=100310333123αβααA ,……由此猜想⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡+-=100102)1(12αβααn n n n n A n. 以下用数学归纳法加以证明. (1)当1=n 时成立.(2)归纳假设结论对k n =时亦成立,即⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡+-=100102)1(12αβααk k k k k A k . 所以当1+=k n 时,A A Ak k =+1,而⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡+(++++(=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡+-=100)110)1(2)1()11100101100102)1(122αβαααβααβααk k k k k k k k k k A A k , 即当1+=k n 时成立,从而证明结论成立.即⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡+-=100102)1(12αβααk k k k k A k. 3.1.2.5 利用相似变换法要点 若已知矩阵可以经过相似变换化为对角阵时,即存在可逆矩阵P ,使Λ=AP P -1,其中Λ为对角阵,其对角线上元素为矩阵A 的特征值.由上可得1-PΛP =A ,1-P PΛ=A n n .于是求A的方幂就转化为求过渡矩阵P 和对角阵nΛ,而对于P 和阵nΛ,我们应用代数知识要好求得多了,具体如下:例7 已知⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=A 122212221,求其n 次幂. 解 经过计算,矩阵A 的特征值1-=λ和5=λ,对于特征值1-=λ有线性无关特征向量T )101(1-=α和()3011Tα=-()T 1102-=α.对于特征值5=λ有特征向量()T 1113=α.令()⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--==P 111110101,,321ααα,即P 可逆,且有,5000)1(000)1(,5000100011⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=Λ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=Λ=AP P -n n n n 于是.,11--P PΛ=A PΛP =A nn计算得⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+-+-+-+-+-+-+-+-+-=A ++++++n n nn n n n n n n nn n n n n nn n 52)1(5)1(5)1(5)1(52)1(5)1(5)1(5)1(52)1(31111111.3.1.2.6 利用Jordan 标准形例8 已知⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-----=A 411301621,求k A .解 第一步:首先求矩阵A 的若尔当标准形.由⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--→⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--+=A -E 2)1(0001000141131621λλλλλλ.从而初等因子为)1(-λ,2)1(-λ,故A 的若尔当标准形⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=100010001J .第二步:求可逆矩阵T 使J AT T =-1,即TJ AT =.设),,(321ααα=T ,所以有332211,,αααααα=A =A =A .由22αα=A 得32)(αα-=A -E ,设()Tx x x 3212,,=α,()Ty y y 3213,,=α,则由⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-----→⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡------=A -E 3221321000311622311311622)(y y y y y y y , 而32)(αα-=A -E 有解,故32y y =,又33αα=A ,从而0)(3=A -E α即0311311622321=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡---y y y , 于是有03321=-+y y y ,所以得212y y =.令132==y y ,则21=y .于是T )112(3=α,再解T )001(2-=α.于是求得()⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-==101100213,,321αααT . 第三步:由第二步得1-=A TJT .⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+------=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡---⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-==A -k k k k k k k kk k TTJ k k 31316221010311110100100011011002131.3.2 解线性方程组3.2.1线性方程组的有解判定定理定理1 (克拉默法则) 如果线性方程组⎪⎪⎩⎪⎪⎨⎧=+++=+++=+++nn nn n n n n n n b x a x a x a b x a x a x a b x a x a x a 22112222212111212111 (4.2.1)的系数矩阵⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n a a a a a a a a a A 212222111211的行列式,0≠=A d 那么线性方程组(4.2.1)有解,并且解是唯一的,解可以通过系数表为,,,,2211dd x d dx d d x n n ===其中j d 是矩阵A 中第j 列换成方程组的常数项n b b b ,,,21 所成的矩阵的行列式,即.,,2,1,1,1,121,221,22111,111,111n j a a b a a a a b a a a a b a a d nnj n nj n n nj j nj j j==+-+-+- 定理(线性方程组的有解判定定理) 线性方程组⎪⎪⎩⎪⎪⎨⎧=+++=+++=+++sn sn s s n n n n b x a x a x a b x a x a x a b x a x a x a 22112222212*********有解的充分必要条件为它的系数矩阵⎪⎪⎪⎪⎪⎭⎫⎝⎛=sn s s n n a a a a a a a a a A 212222111211与增广矩阵⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=s sns s n n b a a a b a a a b a a a A 21222221111211有相同的秩.3.2.2 线性方程组一般形式的运用例9 求下述齐次线性方程组的一个基础解系⎪⎪⎩⎪⎪⎨⎧=+++-=++-+-=---+-=+-+-0931050320117630426354321543215432154321x x x x x x x x x x x x x x x x x x x x把方程组的系数矩阵经过初等行变换化成阶梯形矩阵:⎪⎪⎪⎪⎪⎭⎫⎝⎛---→⎪⎪⎪⎪⎪⎭⎫ ⎝⎛---------000000000078100650219131051312111716341263于是方程组的一般解为:⎩⎨⎧+=--=543542178652x x x x x x x 其中542,,x x x 是自由未知量.令0,0,1542===x x x 得)0,0,0,1,2(1=η 0,1,0542===x x x 得)0,1,8,0,5(2-=η 1,0,0542===x x x 得)1,0,7,0,6(3-=η 这里321,,ηηη就是方程组的一个基础解系.例10 解线性方程组:⎪⎪⎩⎪⎪⎨⎧-=++-+-=++-+-=---+-=++-+2573431272327225354321543215432154321x x x x x x x x x x x x x x x x x x x x解 把此方程组的增广矩阵经过初等行变换化成阶梯形矩阵:⎪⎪⎪⎪⎪⎭⎫⎝⎛------→⎪⎪⎪⎪⎪⎭⎫ ⎝⎛--------→⎪⎪⎪⎪⎪⎭⎫ ⎝⎛----------000000666100121010875001000000666100545110112111257343112111721132712253从而得到此方程组的一般解为:⎪⎩⎪⎨⎧-+=---=-+=66662875543542541x x x x x x x x x 其中54,x x 是自由未知量. 对于方程个数与未知量个数相等的非齐次线性方程组,如果它的系数行列式不为零,我们还可以用克莱姆法则求解.但是这种方法计算量很大,因此我们一般不用它,只是对少数字母系数的方程组采用克莱姆法来进行求解.例11 非齐次线性方程组⎪⎪⎩⎪⎪⎨⎧=+--=++-=+--=+--321934443522134321432143214321x x x x a x x x x x x x x x x x x 求当a 为何值时方程组有解?此时有多少解?解 把方程组的增广矩阵经过初等行变换化成阶梯形矩阵:⎪⎪⎪⎪⎪⎭⎫⎝⎛---→⎪⎪⎪⎪⎪⎭⎫ ⎝⎛-------00000340000211001131132211193444352211311a a ⎪⎪⎪⎪⎪⎭⎫⎝⎛---→⎪⎪⎪⎪⎪⎭⎫ ⎝⎛-------00000340000211001131132211193444352211311a a 显然,当34≠a 时,方程组无解;当34=a 时,方程组无解,此时由于阶梯形矩阵的非零行有2行,而未知量有4个,所以方程组有无穷多个解,易求出一般解为⎩⎨⎧+-=+-=27443421x x x x x 其中42,x x 是自由未知量.3.3 解矩阵方程矩阵方程是矩阵运算的一部分,这里我们主要讨论如何求解矩阵方程的问题.掌握简单的矩阵方程的求法,对于求解复杂的矩阵方程有很大帮助.简单的矩阵方程有三种形式:.,,C AXB C XA C AX ===如果这里的A 、B 都是可逆矩阵,则求解时需要找出矩阵的逆,注意左乘和右乘的区别.它们的解分别为.,,1111----===B A X CA X C A X例如,求解方程C AC =先考察A 是否可逆,如果A 可逆时,方程两边同时左乘1-A ,得,11C A AX A --=即,1C A X -=这里要注意只能左乘不能右乘,因为矩阵的乘法不满足交换律.同样,对于方程,C XA =只能右乘1-A ,得,11--=CA XAA 即.1-=CA X 而对于方程,C AXB =只能是左乘1-A 而右乘1-B ,得,1111----=CB A ACBBA 即.11--=CB A X看下面解矩阵方程例题:例12 ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡315432343122321X 解 先求出1-A ,则,111253232313431223211⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-则⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=332123315432111253232313154321343122321X 例13 ⎥⎦⎤⎢⎣⎡-=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡212101343122321X解 先求出1-A ,则,111253232313431223211⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-则⎥⎥⎦⎤⎢⎢⎣⎡--=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----⎥⎦⎤⎢⎣⎡-=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡-=-27525120111253232312121013431223212121011X 例14 ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡3154321325343122321X解 先求出1-A ,则,111253232313431223211⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎥⎦⎤⎢⎣⎡--=⎥⎦⎤⎢⎣⎡-532113251, 则⎥⎦⎤⎢⎣⎡--⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=⎥⎦⎤⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=--532131543211125323231132531543234312232111X ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡---=⎥⎦⎤⎢⎣⎡--⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=131148735331332123当矩阵方程C AXB C XA C AX ===,,中的A 、B 不是方阵或者是不可逆的方阵时,前面的方法就不能用了.这时,我们需要用待定元素法来求矩阵方程.设未知矩阵X 的元素为ij x ,即)(ij x X =,然后由所给的矩阵方程列出ij x 所满足的线性方程组,通过解线性方程组求出所有元素ij x ,从而得到所求矩阵)(ij x X =.例15 解矩阵方程⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡-4152102011X解 利用元素法,先确定X 的行数等于左边矩阵的行数3,X 的列数等于积矩阵的列数2,则X 是23⨯的矩阵.设⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=2221y y y x x x X ,则⎥⎦⎤⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡-41521020112121y y y x x x. 即⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡++--4152222111y y x x y y x x ,于是得方程组⎪⎪⎩⎪⎪⎨⎧=+=+=-=-4212522211y y x x y y x x . 解得⎪⎪⎩⎪⎪⎨⎧-=-=-=-=y y x x y y x x 2421522211,所以⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=y y y x x x X 245212,其中y x ,为任意实数.例16 解矩阵方程,C AX =其中⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--=031334213A ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=7577111793C . 解 由于0=A ,所以A 是不可逆矩阵,需要用元素法求解.设,222111⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=z y x z y x z yxX 则⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡--7577111793031334213222111z y x z y x z y x,即 ⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡++++-+-+-+-+-+-7577111793323334334334232323111212121212121z z y y x x z z z y y y xx x z z z y y y x x x .比较第一列元素得⎪⎩⎪⎨⎧=+=+-=+-73133432312121x x x x x x x x ,解得⎩⎨⎧-=-=9537121x x x x 同样,比较第二、三列元素可得对应方程组,分别解得7537,3535121121-=-=-=-=z z z z y y y y ,所以可得 ⎥⎦⎤⎢⎣⎡------=7573535953711111`1z z y y x x X ,其中111,,z y x 是任意实数. 总之,对于矩阵方程,当系数矩阵是方阵时,先判断是否可逆.如果可逆,则可以利用左乘或右乘逆矩阵的方法求未知矩阵,如果方阵不可逆或是系数矩阵不是方阵,则需要用待定元素法通过解方程确定未知矩阵.3.4 矩阵对角化方法3.4.1 讨论对于有n 个特征单根的n 阶方阵3.4.1.1 基本原理引理1 设A 是秩为r 的n m ⨯阶矩阵,且()n TE A−−−→−行初等变换⎪⎪⎭⎫ ⎝⎛*--n r n mr n rmP D )()(0 其中D 是秩为r 的行满秩矩阵,则齐次线性方程组0=AX 的一个基础解系即为矩阵P 所含的r n -个行向量),,2,1(r n i i -= ξ.引理2 矩阵A 的特征矩阵)(λA 经过一系列行初等变换可化为上三角形的λ-矩阵)(λB ,且)(λB 的主对角线上元素乘积的λ多项式的解为矩阵A 的全部特征根.引理3 对于数域P 上的n 阶方阵A ,若A 的特征多项式在P 内有n 个单根,则由特征向量构成的n 阶可逆矩阵T ,使得⎪⎪⎪⎪⎪⎭⎫⎝⎛=-n AT T λλλ211定理1 若数域P 上的n 阶方阵A 的特征多项式)(λf 在P 内有n 个单根,则A 可通过如下方法对角化:设()())()()(,)(λλλλλQ B E A A E A n TT T −−−→−-=行初等变换且)()1λB 为上三角形矩阵,则有方阵A 的特征根i λ即为)(λB 中主对角线上各个元素乘积的解;)2对于方阵A 的每一个特征根i λ,总有)(i B λ中零行向量所对应的)(i Q λ中的行向量i ξ与之对应.3.4.1.2举例说明例17 设⎪⎪⎪⎭⎫ ⎝⎛=210131012A ,问方阵A 是否可以化为对角形,若可以,求出其对角化后的方阵.解 ()⎪⎪⎪⎭⎫ ⎝⎛-------=100210010131001012)(λλλλE A T−−−−−−→−第一行与第二行互换⎪⎪⎪⎭⎫ ⎝⎛-------100210001012010131λλλ −−−−−−−−−→−-行上乘以第一行再加到第二)2(λ⎪⎪⎪⎭⎫ ⎝⎛---+-+----10021002125500101312λλλλλλ−−−−−−→−第二行与第三行互换⎪⎪⎪⎭⎫ ⎝⎛-+-+------02125501002100101312λλλλλλ −−−−−−−−−−→−+-行上乘以第二行再加到第三)55(2λλ⎪⎪⎪⎭⎫ ⎝⎛+----------5521)4)(2)(1(001002100101312λλλλλλλλ =())()(λλQ B由题意知)4)(2)(1(---λλλ=0⇒11=λ,22=λ,43=λ ,此时方阵A 有3个特征单根,故方阵A 可以化为对角形;将11=λ代入)()(λλQ B 和中知)(λB 的第三行为零,由定理1知)(λQ 的第三行向量)1,1,1(-即为属于1λ的特征向量,同理可知)1,2,1(),1,0,1(-分别为属于32λλ和的特征向量.于是可得⎪⎪⎪⎭⎫ ⎝⎛--=111201111T ,使得⎪⎪⎪⎭⎫ ⎝⎛=-4211AT T .3.4.2 讨论对于有特征重根的n 阶方阵对于有特征重根的方阵,可以通过上述方法将其化为上三角形矩阵,接着再对上三角形矩阵施行一系列初等变换将其化为对角形矩阵,这样就避免了上三角形矩阵中非零行向量可能不构成行满秩的情形. 3.4.2.1基本定理定理2 设TT A E A -=λλ)(,则()())()()(λλλP D E A T −−−→−初等变换且)(λD 为对角形矩阵,则有)1对于A 的每个特征根i λ,)(i P λ中与)(i D λ的零行对应的行向量即为属于i λ的特征向量;)2设s λλλ ,,21为A 的所有不同的特征根,重数分别为s r r r ,,21,则A 可以化成对角形⇔)(i D λ中的零行数目等于i λ的重数),,2,1(s i r i =.由此我们不难得到对于有特征重根的方阵化为对角形方阵的简单步骤如下:)1作()()())()()()()(λλλλλP D Q B E A T −−−→−−−−→−初等变换行初等变换,其中))(),(),(()(21λλλλn d d d diag D =,则A 的特征根恰为0)()()(21=λλλn d d d 的根;)2若A 的特征根全在P 内,且每个i λ有)(i D λ中零行数目等于i λ的重数,则A 可以化为对角形方阵,否则A 不可以化为对角形方阵;)3对于每个特征根i λ,在)(i P λ中取出与)(i D λ中零行对应的行向量),,,(21im i i P P P 得A属于i λ的特征向量且都是线性无关的. 3.4.2.2 举例说明例18 ⎪⎪⎪⎭⎫⎝⎛-=110111110)1A ; ⎪⎪⎪⎭⎫ ⎝⎛--=100112001)2B问方阵A 和B 是否可以化为对角形,若可以,试求出其对角化后的方阵.解 ()⎪⎪⎪⎭⎫ ⎝⎛------=10011101011100101)()1λλλλE A T−−−−−−→−第一行与第三行互换⎪⎪⎪⎭⎫ ⎝⎛------00101010111100111λλλ−−−−−−−−→−-行上乘以第一行再加到第二)1(⎪⎪⎪⎭⎫ ⎝⎛------0010111020100111λλλλ−−−−−−−→−行上乘以第一行再加到第三λ⎪⎪⎪⎭⎫ ⎝⎛-------λλλλλλλ0110110201001112 −−−−−−−−→−-二行上)乘以第三行再加到第(1⎪⎪⎪⎭⎫⎝⎛---------λλλλλλλ011011110111122−−−−−−−−−→−-三行上)乘以第二行再加到第(1λ⎪⎪⎪⎭⎫⎝⎛++------------112)1(001111010*******λλλλλλλλλ−−−−−−−−−→−-列上乘以第二列再加到第三)(2λ⎪⎪⎪⎭⎫ ⎝⎛++----------+--112)1(00111010100111222λλλλλλλλλ−−−−−−−−−−→−-+-列上乘以第一列再加到第三)1(2λλ⎪⎪⎪⎭⎫ ⎝⎛++----------112)1(0011101010001122λλλλλλλ−−−−−−→−第二行加到第一行上⎪⎪⎪⎭⎫⎝⎛++------------112)1(001110101100122λλλλλλλλ())()(λλP D =由题意知0)1(2=-λλ⇒01=λ,)(12二重=λ,因为)(2λD 中零行数目≠1等于2λ的重数,故A 不可以化为对角形方阵.)2 ()⎪⎪⎪⎭⎫ ⎝⎛--+-=100110010010001021)(λλλλE A T2014届数学与应用数学专业毕业(论文)第 23 页 共 24页−−−−−−→−第二行与第三行互换⎪⎪⎪⎭⎫ ⎝⎛+---010*********001021λλλ −−−−−−−−−→−+行上乘以第二行再加到第三)1(λ⎪⎪⎪⎭⎫ ⎝⎛+----1101001001100010212λλλλ −−−−−−−−−→−-列上乘以第二列再加到第三)1(λ⎪⎪⎪⎭⎫ ⎝⎛+----110100100010001)1(2212λλλλ −−−−−−−−→−-列上乘以第一列再加上第三)2(⎪⎪⎪⎭⎫ ⎝⎛+---1101001000100010212λλλ −−−−−−−→−行上乘以第二行再加到第一2⎪⎪⎪⎭⎫ ⎝⎛+---1101001000102010012λλλ())()(λλP D =. 由题意知0)1)(1(2=--λλ⇒)(11二重=λ,12-=λ,此时)(1λD 中零行数等于=21λ的重数,故B 可以化为对角形方阵;将11=λ代人)()(λλP D 和中知)(λD 的第一行和第三行为零,由定理2知)(λP 的第一行向量)2,0,1(和第三行向量)2,1,0(即为属于1λ的特征向量,同理可知)0,1,0(为属于2λ的特征向量.由此可知⎪⎪⎪⎭⎫ ⎝⎛=022110001T 使得⎪⎪⎪⎭⎫ ⎝⎛-=-1111BT T .结 论通过以上对矩阵的学习,我们知道,想要在学习过程中灵活应用矩阵思想,首先要理解矩阵思想,在此基础上,遇到难解的数学问题,能发现矩阵是可以解决此类问题的关键,最后能正确无误的利用矩阵思想把数学问题得以解决.矩阵是代数特别是线性代数的一个主要研究对象,他对于研究矩阵的相关运算、解线性与非线性方程组、特征值和特征向量的求解方法、对角化及二次型矩阵、求解矩阵高次幂等重要问题都有极为广泛的应用.杨灿:矩阵及其应用参考文献[1]李志慧,李永明.高等代数中的典型问题与方法[M].科学出版社,2008.205-211[2]王萼芳,石生明.高等代数(第三版).高等教育出版社[3] 张禾瑞.高等代数(第五版)[M].北京:高等教育出版社,2007[4] 吕林根,许道子.解析几何[M].北京:高等教育出版社,2006[5] 许以超.线性代数与矩阵[M].北京:高等教育出版社,1992[6] 李师正.高等代数解题方法与技巧[M].北京:高等教育出版社,2004[7] 徐仲,张凯院,陆全,冷国伟.矩阵论简明教程[M].北京:科学出版社,2005[8] 贾美娥.矩阵的秩与运算的关系[J].赤峰学院学报,2010,26(9):3-4[9] 钟成义,肖宏儒.方阵秩与零特征值代数重数相关性探讨[J].高等数学研究.2009,12(1):96-97[10] 史明仁. 线性代数600证明题详解[M]. 北京科学技术出版社.1985[11] 徐德余.高等代数(第二版)[M].四川大学出版社.2005:175-178[12] 丘维声. 高等代数[M]. 北京: 高等教育出版社, 1996[13] 赵树嫄. 线性代数(第三版[M]). 北京: 中国人民大学出版社, 2006[14] 程云鹏.矩阵论[M].第二版.西安:西北工业大学出版社,2002[15] 赵树塬.线性代数[M].北京:中国人民大学出版社,1997[16] 李君文.线性代数理论与解题方法[M].长沙 :湖南大学出版社,2002致谢从上学期选题、收集资料到这学期写开题报告,完成初稿,到定稿,期间几个月历经喜悦、聒噪、痛苦、彷徨,在写论文时心情如此复杂,到今天随着论文的完成,都落下了帷幕.在此论文撰写过程中,要特别感谢我的导师向以华老师的指导与督促,同时感谢他的谅解与包容.没有老师的帮助也就没有今天的这篇论文.求学历程是艰苦的,但又是快乐的.感谢我大学所有教过的老师,谢谢他们在这四年中的教诲.在这四年的学期中结识的各位生活和学习上的挚友让我得到了人生最大的一笔财富.在此,也对他们表示衷心感谢.本文参考了大量的文献资料,在此,向各学术界的前辈们致敬!第24页共24 页。

矩阵论论文

矩阵论论文

研究生课程论文/研究报告课程名称:矩阵论任课教师:论文/研究报告题目:矩阵论的应用—线性定常系统建模和线性定常系统状态方程求解完成日期:年月日学科:学号:姓名:成绩:矩阵论的应用—线性定常系统建模和线性定常系统状态方程求解摘要我们知道在进行系统的分析和设计时,首先要建立数学模型然后再进行求解分析。

根据系统分析、设计所用方法不同,或所要解决的问题不同,描述同一系统的数学模型亦有所不同。

本文先介绍描述系统内部特性和端部特性的状态空间表达式及其在s 域分析得到传递函数,然后再利用系统状态转移矩阵求线性定常系统状态方程的解。

关键词:数学模型、状态空间表达式、传递函数、线性定常系统状态方程的解一、线性定常系统的状态空间表达式及其传递函数如下图1所示电路图,电压u(t)为电路的输入量,电容上的电压uc(t)为电路的输出量。

R 、L 、C 分别为电路的电阻、电感、电容。

由电路知识可知,回路中的电流i(t)和电容上电压uc(t)的变化规律满足如下方程:()()()()di t L Ri t uc t u t dt ++= 1()()i t dt uc t C=⎰ 其中i(t)和uc(t)为该电路系统的状态变量(状态变量就是确定系统状态的最小一组变量)。

状态空间:以选择的一组状态变量为坐标轴而构成的正交空间,成为正交空间。

系统在任意时刻的状态可以用状态空间中的一个点来表示。

图1将上式方程组改写成状态空间表达式为:()11()()1()()00di t R i t dt L Lu t L duc t uc t Cdt --⎡⎤⎛⎫⎡⎤ ⎪⎢⎥⎡⎤⎢⎥=+ ⎪⎢⎥⎢⎥⎢⎥ ⎪⎣⎦⎢⎥ ⎪⎣⎦⎢⎥⎝⎭⎣⎦① 如将电容上的电压uc 作为电路的输出量,则[]()()01()i t uc t uc t ⎡⎤=⎢⎥⎣⎦②令x=()()i t uc t ⎡⎤⎢⎥⎣⎦,u=u(t),y=uc(t),A=110R L LC --⎛⎫⎪ ⎪ ⎪ ⎪⎝⎭,b=10L ⎡⎤⎢⎥⎢⎥⎣⎦,C=[]01,则上面方程改写成如下:x 、=Ax+bu ③ y=Cx ④其中x 为2维的状态变量;u 为标量输入;y 为标量输出;A 为2X2系数矩阵;b 为2X1输入矩阵;C 为1X2输出矩阵。

矩阵论文

矩阵论文

矩阵分析姓名:秦梦瑶学号: 20135035020【摘要】矩阵理论是工科线性代数中的一个重要内容,而逆矩阵是其非常重要并且是较难理解的一部分内容,然而在许多线性代数教科书中逆矩阵相关知识点的应用几乎未涉及到,以至于很多学习矩阵论的人错误地认为所学东西没有多大用处。

为了使学习的人对所学逆矩阵有具体地,形象地认识,而不只是停留在抽象的概念,结论的机械记忆上,为了能使逆矩阵的本质掌握起来更简单。

本文介绍可逆矩阵在保密通信中应用。

【关键词】矩阵信息安全应用一.信息安全简介1信息安全,简称信安,意为保护信息及信息系统免受未经授权的进入、使用、披露、破坏、修改、检视、记录及销毁。

政府、军队、公司、金融机构、医院、私人企业积累了大量的有关他们的雇员、顾客、产品、研究、金融数据的机密信息。

绝大多数此类的信息现在被收集、产生、存储在电子计算机内,并通过网络传送到别的计算机。

万一诸如一家企业的顾客、财政状况、新产品线的机密信息落入了其竞争对手的掌握,这种安全性的丧失可能会导致经济上的损失、法律诉讼甚至该企业的破产。

保护机密的信息是商业上的需求,并且在许多情况中也是道德和法律上的需求。

对于个人来说,信息安全对于其个人隐私具有重大的影响,但这在不同的文化中的看法差异相当大。

信息安全的领域在最近这些年经历了巨大的成长和进化。

有很多方式进入这一领域,并将之作为一项事业。

它提供了许多专门的研究领域,包括:安全的网络和公共基础设施、安全的应用软件和数据库、安全测试、信息系统评估、企业安全规划以及数字取证技术等等。

自从人类有了书写文字之后,国家首脑和军队指挥官就已经明白,使用一些技巧来保证通信的机密以及获知其是否被篡改是非常有必要的。

恺撒被认为在公元前50年发明了凯撒密码,它被用来防止秘密的消息落入错误的人手中时被读取。

第二次世界大战使得信息安全研究取得了许多进展,并且标志着其开始成为一门专业的学问。

20世纪末以及21世纪初见证了通信、计算机硬件和软件以及数据加密领域的巨大发展。

矩阵论课程论文~

矩阵论课程论文~

研究生课程论文西尔维斯特及其矩阵理论课程名称矩阵论姓名郭辉学号1000203040专业检测技术与自动化装置任课教师刘强开课时间2009.09——2010.01教师评阅意见:论文成绩评阅日期课程论文提交时间:10年 3 月 4 日西尔维斯特及其矩阵理论摘要矩阵是伴随着其他理论的研究而产生的,众多数学家为其早期的发展做了大量的工作。

在此基础上,西尔维斯特创用了矩阵一词,引进了与矩阵有关的一些基本概念,给出了矩阵的一些重要结论和著名定理,为矩阵理论的发展做出了重要贡献。

关键词矩阵的早期发展西尔维斯特矩阵名词矩阵理论矩阵思想的萌芽由来已久,早在公元前一世纪,我国最重要的数学经典著作《九章算术》已能够相当成熟地运用矩阵形式解方程组,魏晋时期的数学家刘徽又在《九章算术注》中进一步完善,给出了完整的演算程序[1]。

但那时矩阵概念仅是用来作为线性方程组系数的排列形式解决实际问题,并没有建立独立完善的矩阵理论。

从18世纪早期到19世纪中叶,这种排列形式在线性方程组和行列式计算中应用日益广泛。

在逻辑上,矩阵的概念先于行列式的概念,而在历史上次序正相反[2],因此在矩阵引进的时候它的许多基本性质就已经非常清楚了。

行列式以及代数型的发展为矩阵理论进一步的发展提供了条件。

在矩阵发展的早期,矩形阵列本身并没有引起单独的注意但是,19世纪数学家们在其他数学领域的研究工作导致了矩形阵列更加形式的计算,促进了矩阵理论的诞生。

西尔维斯特在矩阵理论方面的贡献,不仅体现在对矩阵理论内容上的发展,即从不同领域的研究中发展出来的有关矩阵的概念,以及随之引起的相似、对角化和标准型的矩阵分类等等,还有其更深刻的地方:一方面他的工作使得当时比较零散的矩阵知识趋于系统化、理论化,为凯莱创立矩阵理论提供了有利条件;另一方面,西尔维斯特的行列式和矩阵的思想,为代数不变量理论的创立奠定了重要基础。

1.矩阵的早期发展矩阵的早期发展是伴随其他理论的研究而产生的。

电子科大矩阵理论06试题参考答案

电子科大矩阵理论06试题参考答案

2006级硕士研究生《矩阵理论》试卷一、判断题(40分)(对者打∨,错者打⨯) 1、设m nA R⨯∈的奇异值为12n σσσ≥≥≥ ,则2221||||ni i A σ==∑. ( ⨯ )2、设n n A C ⨯∈,且有某种算子范数||||⋅,使得||||1A <,则11||()||1||||E A A -->-,其中E 为n 阶单位矩阵. ( ⨯ )111()()()()E E A E A E A A E A ---=--=---⇒11()()E A E A E A ---=+-⇒ 11||()||||()||E A E A E A ---=+-1||||||||||()||E A E A -≤+-⇒1||||1||()||1||||1||||E E A A A --≤=--3、设2H A E uu =-(其中,E 为n 阶单位矩阵,2||||1n u C u ∈=且),则2||||m A =( ∨ )(2)H H HA E u u =- (2)H H E uu =-2H E uu =-A =(2)(2)H H HA A E u u E u u=--224H H H H E u u u u u u u u E=--+=2||||mA n∴4、设123424681101A ⎛⎫ ⎪= ⎪ ⎪⎝⎭,则A 的M -P 广义逆A +的秩()1rank A +=. ( ⨯ )5、设矩阵n n A C ⨯∈,0A ≠且,2||()||1H H A A A A +=则. ( ∨ ) ()H H B A A A A +=⇒H B B =⇒2||||()B B ρ=则;2B B =⇒01B ⇒的特征值为或者0A ≠⇒1B ⇒是的特征值()1H r B B =6、若A 为列满秩矩阵,则H H A A A 1)(-既是A 的左逆又是A 的M -P 广义逆A +.( ∨ )7、设n εεε,,,21 线性空间n V 的一组基,n n n V x x x x ∈++=εεε 2211,则. )0(||||||||||2222211≥++=i n n k x k x k x k x 是n V 上向量x 的范数. ( ⨯ )8、设⎪⎪⎪⎭⎫ ⎝⎛=01821022330A ,则A 有三个实特征值. ( ∨ )9、设G 为矩阵()m n r A C r n ⨯∈<的广义逆A -,A BD =为A 的最大秩分解,则r DGB =2||||. ( ⨯ ) 10、设)1()(>∈=⨯n C a A n n ij 为严格对角占优矩阵,),,,(22nn ii a a a diag D =,A D EB 1--=(E 为n 阶单位矩阵),则B 的谱半径1)(≥B r . ( ⨯ )二、计算与证明(60分)1. 设矩阵U 是酉矩阵, 12diag(,,,)n A a a a = , 证明: UA 的所有特征值λ满足不等式{||}||{||}max min i i iia a λ≤≤. (10分)证: PAx x μ=⇒H H H H x A P x μ=⇒H H H x A Ax x x μ=⇒2222222211221||||||||||||||||nn n ii a x a x a x x μ=+++=⇒∑222222111||||||||nnniiii i i mx x Mx μ===≤≤⇒∑∑∑222||m M μ≤≤⇒||m M μ≤≤。

矩阵理论中的矩阵分析的实际应用论文

矩阵理论中的矩阵分析的实际应用论文

矩阵分析在同步捕获性能研究新应用摘要:该文提出了一种利用概率转移矩阵计算捕获传输函数的方法,通过将以往分析方法中的流程图转换为概率转移矩阵,仅需知道一步转移概率矩阵,利用现代计算机编程语言(如MAPLE,MATLAB等)的符号运算功能,即可得到捕获系统的传输函数:通过对传输函数求导,可计算平均捕获时间。

矩阵分析方法可完整地计算出捕获系统的传输函数,可弥补流程图方法在分析传统连续搜索捕获方案的传输函数时所忽略的项;可纠正流程图方法在分析非连续搜索捕获方案的传输函数时所引起的误差。

关键词:CDMA;矩阵分析;传输函数;流程图;捕获A Novel Acquisition Performance Evaluation Approach Based on Matrix AnalysisAbstract:A novel acquisition performance analysis approach is proposed based on matrix analysis.Given the first step transition probability matrix,the transfer function of acquisition system can be obtained by utilizing the symbol operation function of computer programming such as MAPLE,MATLAB and so on,and the mean acquisition time can be computed by differentiating the transfer function.The transfer function of acquisition system can be computed perfectly by matrix analysis,it not only complements the items neglected in that of conventional serial acquisition scheme but also corrects the error items in that of nonconsecutive acquisition scheme.Key words:CDMA;Matrix analysis ;Transfer function;Flow diagram ;Acquisition1 引言同步是直接序列扩频码分多址(DS- CDMA1)系统接收的第一步,因为数据解调只能在同步成功后进行。

矩阵在通信中的应用论文

矩阵在通信中的应用论文

矩阵理论(论文)矩阵理论在通信领域的应用学生:学号:矩阵理论在通信领域的应用【摘要】矩阵是数学的基本概念之一,也是线性代数的核心内容。

矩阵广泛运用于各个领域,如数学建模、密码学、化学、通信和计算机科学等,解决了大量的实际问题。

本文主要介绍矩阵在通过信领域的应用,如:在保密通信中,应用逆矩阵对通信的信息进行加密;在信息论中,利用矩阵理论计算信源熵、信道容量等;在信息论的信道编码中,利用监督矩阵,生成矩阵,对信道中的信息进行编码,利用错误图样对信道传输的信息进行纠正;此外,矩阵分析在MIMO技术这个模块中也有着很重要的应用,基本可以说矩阵分析是MIMO技术研究的基础。

关键词:矩阵;保密通信;信道容量;信道编码;MIMO1、引言随着科技快速稳健的发展,通信技术也得到了飞速的发展,人们对通信的要求也不断提高,不仅要求通信的实时性、有效性,还要求通信的保密性。

而现实环境中,由于噪声的影响,常常使通信出现异常,这就要求人们对接收到的信号能够更好的实现检错纠错。

此外,在频谱资源的匮乏己经成为实现高速可靠传输通信系统的瓶颈。

一方面,是可用的频谱有限;另一方面,是所使用的频谱利用率低下。

因此,提高频谱利用率就成为解决实际问题的重要手段。

多进多出(MIMO)[1]技术即利用多副发射天线和多副接收天线进行无线传输的技术,该技术能够很好的解决频谱利用率的问题。

然而对以上通信中存在的问题的分析和研究都需要用到矩阵理论的知识,本文把矩阵理论和其在通信领域的应用紧密结合,通过建立一些简单的分析模型,利用矩阵知识将通信领域很多复杂的计算和推导变得简单明了。

2、矩阵在通信领域中的应用2.1 矩阵在保密通信中的应用[2]保密通信是当今信息时代的一个非常重要的课题, 而逆矩阵正好在这一领域有其应用。

我们可以用逆矩阵[3][4]所传递的明文消息进行加密(即密文消息),然后再发给接收方,而接收方则可以采用相对应的某种逆运算将密文消息编译成明文。

大学矩阵数学论文1200字_大学矩阵数学毕业论文范文模板

大学矩阵数学论文1200字_大学矩阵数学毕业论文范文模板

大学矩阵数学论文1200字_大学矩阵数学毕业论文范文模板大学矩阵数学论文1200字(一):浅谈矩阵在离散数学中的应用摘要:离散数学是计算机学科的一门重要的专业基础课,扎实的基础是非常重要的。

本文就矩阵在离散数学中的各种应用展开讨论,并实例说明。

关键词:矩阵;离散数学;运用引言:随着计算机科学的发展,重点研究有限系统的离散数学已经成为一门越发重要的科学,数字计算机本质上是一个有限结构,它的许多性质都可以在有限数学系统的框架下得到解释。

矩阵是一种有力的数学工具,本文就矩阵在离散数学中的应用展开讨论,总结了矩阵在离散数学中的应用类型,以期对初学者和数学工作者在学习离散数学时提供学习辅导和参考资料。

定义1给出m×n个数,按一定顺序排成一个m行、n列的矩形数表此数表称为m行n列矩阵。

常记a=,或a=(),或。

有关应用及其举例一、二元关系的表示定义2设a,b为有限集,构造一个矩阵,以a的元素和b的元素分别标注其行与列,对于a∈a和b∈b。

视a,b是否具有关系r,在a行和b列交叉处标上1或0.这样得到的矩阵称为关系矩阵。

例如:a={1,2,3,4},在a上定义二元关系r为大于关系,表示x大于y,采用列举法为r={<2,1>,<3,1>,<4,1>,<3,2>,<4,2>,<4,3>}.则关系矩阵为二、图的表示和邻接矩阵定义3设无向图g=,v={v1,v2,vn},e={e1,e2,,em}。

令为节点vi 与边ej关联的次数,则称矩阵为g的关联矩阵,记为m(g)。

例如:无向图g如下所示,则m(g)为:定义4设图g=为有向图,v={v1,v2,vn},即有n个节点,令是vi邻接到vj的边的数目,则称矩阵为g的邻接矩阵,记为a(g)。

例如:有向图g如下三、用矩阵求关系合成和偏序中的盖住关系(一)关系合成设和分别表示关系r和s的矩阵,令m=,则m中的非零元素表示其对应的元素具有关系。

电子科技大学级硕士研究生《矩阵理论》试题

电子科技大学级硕士研究生《矩阵理论》试题

|
xn
xn
|
an1
|
x1xnx2 Nhomakorabeaxn
| a12 | x2 x1
| a22 |
| an2 | x2
xn
| a1n | xn
x1
| a2n | xn
x2
| ann |
∑ →
D−1BD 的每个
Gerschgorin
圆为
Si
={z ∈ C
:|
z−
|
aii
||≤
Ri },
Ri
(
)
= 例如 x (0,1, 0,, 0) ≠ 0 ,但 || x ||= 0
4、|| x ||∞ ≤|| x ||1≤ n || x ||∞ .
n

||
x
||∞
=max i
|
xi
|≤
i =1
|
xi
|
= || x ||1≤
n max i
|
xi
|=n ||
x ||∞
5、设 A 为 n 阶酉矩阵,则 A= A+ A= + A E.
=
0 AH
A
0
,则
||
B
||2
=||
A
||2
.
(5 分)
0
证:
B
=
AH
A
0

BH
=
0
AH
A
0

BB H
=
AAH
0 AH A

r ( BB H
)
=
r( AAH )
→ || B ||2 =|| A ||2

矩阵理论的论文作业

矩阵理论的论文作业

矩阵分解在数值计算中的应用【摘要】矩阵的分解是将一个矩阵分解为较为简单的或具有某种特性的若干矩阵的和或者乘积,这是矩阵理论及其应用中比较常见的方法。

由于矩阵的这些特殊的分解形式,一方面反映了矩阵的某些数值特性,如矩阵的秩、特征值、奇异值等;另一方面矩阵的分解方法与过程往往为某些有效的数值计算方法和理论分析提供了重要的依据,它是应用于解最优化问题、特征值问题、最小二乘方问题的主要数学工具.在广义逆矩阵问题和统计学方面都有重要应用。

关键词 : 矩阵分解 对角化 逆矩阵 范数 条件数 斜量法引言矩阵分解在工程中的应用主要是在解线性方程组中,而这主要就是关系到储存和计算时间的问题上面,如何实现最小的储存和最少的计算时间是在工程计算中的头等问题。

在这方年就牵涉到很多对矩阵进行怎样的分解,这篇文章介绍;了基本的关于三角分解相关的内容以及关于界的稳定性的考虑。

最后就是介绍了斜量法运用,并对其进行了些许改进。

1. 矩阵的三角分解数值求解线性方程族的方法中有一个主要是直接法,假设计算中没有舍入误差,经过有限次算术运算能够给出问题的精确解的数值方法。

其中高斯消去法就是利用矩阵的分解实现的。

矩阵的一种有效而且应用广泛的分解法就是三角分解法,将一个矩阵分解为一个酉矩阵(或正交矩阵)与一个三角矩阵的乘积或者三角矩阵与三角矩阵的乘积。

考虑一般的线性方程组,设其中的系数矩阵A 是可逆的,1111n m mn a a A a a ⎛⎫ ⎪=⎪ ⎪⎝⎭(1-1) 设矩阵A 的第一列中至少有一个是非零元素(否则A 就是奇异矩阵)不妨设为1i a 若一般的记初等矩阵[1]101(,)11i P i j j i j⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦(1-2) 根据矩阵理论的知识我们知道矩阵(,)P i j 左乘矩阵A ,作用就是对换A 的第i 和第j行,右乘A 的作用是对换A 第i 和第j 列。

因此通过取11(1,)P P i =,则矩阵111()ij A P A a ==中的1110a ≠。

5西安电子科技大学矩阵论

5西安电子科技大学矩阵论
• (2)分配律 (x , y + z)= (x , y)+ (x , z) • (3)齐次律 (kx , y) = k (x , y) • (4)非负性 , (x , x)≥0
– 当且仅当x=0时, (x ,x)=0
( x , ky ) = k ( x , y )
lexu@
′= x3 x3 + k31 y1 + k32 y2
′ x2 ′| | x2
′ x3 ′| | x3
k31 = − ( x3 , y1 ) k32 = − ( x3 , y2 )
xi′ yi = | xi′ |
kij = − xi , y j
(
)
. . .
矩阵论
′ xi + ∑ kij y j x = i
{x , x
' 1
' 2
' , , x n
}
' ' 且 [x1' , x 2 ] = [x1 , x 2 ,, x n ]C 则 , , x n
B = C −1 AC
定理
n阶方阵A和B相似的充要条件是A和B为同一线 性变换在不同基下的矩阵
lexu@ 矩阵论
= x ( y1 , x) y1 + ( y2 , x) y2 + + ( yn , x) yn
证明
yi
lexu@
x= ξ1 y1 + ξ 2 y2 + + ξ n yn
(i = 1, 2, , n)
ξi = ( yi , x)
矩阵论
15
正规矩阵 实对称矩阵与厄米矩阵
矩阵论
11
内积空间 以n维向量空间为例

矩阵论课程论文

矩阵论课程论文

西安理工大学研究生课程论文报告课程名称:矩阵论课程代号:任课教师:论文报告题目:矩阵函数在线性定常系统状态转移矩阵求解中的应用完成日期:2015 年10 月25 日学科:电力电子与电力传动学号:姓名:成绩:矩阵函数在线性定常系统状态转移矩阵求解中的应用摘 要控制系统的运动是系统性能定量分析的重要内容。

“运动”是物理学上的一个概念,它是通过求系统方程的解)(t x 、)(t y 来分析研究的。

由于状态方程是矩阵微分(差分)方程,输出方程式为矩阵代数方程,因此求系统方程的解主要是求状态方程的解。

而求状态方程的解的关键是求状态转移矩阵。

本文主要介绍了矩阵对角化标准型,约当标准型,凯莱-哈密顿定理及矩阵函数知识在线性定常系统的齐次状态方程的状态转移矩阵求解中的应用。

关键词:状态转移矩阵,约当标准型,凯莱-哈密顿定理,矩阵函数.1.问题提出线性系统有线性定常系统和线性时变系统,最为基本的是线性定常系统。

而线性定常系统根据有无初始输入,分为线性定常齐次方程,和线性定常非齐次方程。

本文只给出线性定常系统的齐次状态方程的状态转移矩阵的求解。

线性定常系统齐次方程的解亦即系统的自由解,是指系统输入为零时,由初始状态引起的自由运动。

线性定常系统齐次状态方程为()()t Ax t x= ()1-1其中,x 是n 维状态向量;A 为n n ⨯系数矩阵。

设初始时刻00=t ,系统的初始状态()()00x t x =。

仿照标量微分方程求解的方法求方程()1-1的解。

设方程()1-1的解为t 的向量幂级数形式,即)(t x = ++++++k k t b t b t b t b b 332210 ()2-1式中,() ,2,1,0=i b i 为n 维向量。

式()2-1代入方程()1-1得()+++++=+++++-k k k k t b t b t b b b A t kb t b t b b 3322101232132 ()3-1既然式()2-1是方程()1-1的解,则式()3-1对任意的t 都成立。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高维随机矩阵理论在数组信号检测与估计中的应用摘要本文中,我们展示了高维随机矩阵理论在频谱中的要素、相关源的检测并解决了在大数组中的估计问题。

这些结果适用于样本空间的协方差矩阵中所检测的数据。

可以看出,可以实现的检测样品尺寸大小小于传统方法所要求的。

如果确定了预定的方向,可以通过给设置限制条件,包括从高维随机矩阵理论中提出的,可以得到更加准确的估计。

一组理论用来解决可行性问题。

讨论了一些没有解决的问题。

问题声明我们认为,当p很大时,检测映射在数列p(q<p)的传感器上的q的数量以及他们的到达方向是个问题。

该模型的成像机制如下。

在每个时间t的第j个信号出现在场景中时,第i个传感器的加性噪声和在第i个传感器接收到的数据可以分别用平方可积的复数值随机变量序列表示。

随机向量和奇异空间的协方差矩阵。

此外,假设随机变量序列,和,未知,与随机变量序列独立。

让(被标准化)和。

这些由阵列传感器收集的数据被建模成为随机向量的观测值,A 是根据阵列的几何尺寸和信号参数的p*q的矩阵,假设秩为q。

在数据处理中的检测问题是从观测到的n个快照中估计q。

根据上述假设,随机向量由空间的协方差决定,表示p*p 的单位矩阵。

此外,R的p-q的最小特征值等于。

这些特征值被称为噪声特征值,频谱的其余部分被称为信号的特征值。

由于不知道R的频谱,所以必须从观察到的样本协方差矩阵中推断。

严格的说,必须决定观察到的频谱从哪分成噪声和信号的特征值。

这个估计问题是确定源的到达方向。

在标准的假设下,这个问题是可以通过了解R,用MUSIC方法解决的。

然而,在实践中当n不是足够大时只能得到,从而导致较差的估计。

在本文中,我们把发挥维随机矩阵谱理论的要素,并展示他们的相关源检测与估计。

高维随机矩阵理论设M是一个有实特征值的m*m维随机矩阵。

然后,的经验分布函数是一个随机过程。

我们现在回顾的主要成果,发现一个极限定理:定理1设是的独立同分布的实值随机变量。

对中的每一个m,设,n=n(m),m/n→y>0,m→+∞,使为m*m的对称非负有限维随机矩阵与独立,存在一个整数序列使得对中每一个k有满足克莱曼法则的充分条件,,有且仅有离散函数H在时。

使。

依概率弱收敛于在离散函数F当,内核遍历所有w的所有非负整数使得使得和。

此外,此时唯一确定F。

下面的定理在是单位矩阵的倍数时适用。

定理2 当,F已知,代数密度在是正实数。

最大的特征值几乎可以肯定收敛[依各自概率]于当且仅当[分别有]。

此外,如果是标准高斯化,当时,的最小特征值收敛于。

还几个有关于F的结果在[14]中提到,包括在y→0时,F收敛于H,和通过y和H计算F的方法。

信号检测中的应用现有的方法,比如在信息论的基础上,依靠样本空间的协方差的噪声特征值之间的相关性。

在源的数量很大时,为了获得很好的估计,需要很大的样本量(有时是无法得到的)。

在信号上附加假设时(包括快照的独立性),定理1表明,p和n充分大时,有很大的可能性,经验离散函数接近于离散函数F,当m=p,y=p/n和。

当H是这样时进一步的分析表明,可以计算的到当且仅当F可以被分解成至少2个间隔,当最左边的间隔具有质量(p-q)/p。

例如,在模拟[14]中,p=50,的结果为1.058,从而可以允许相对较小的样本大小。

然而,模拟显示比起分解F特征值分解更加有效。

因此,下面的数学验证这种现象是有效的,会被分解成2个数量级与传感器相同的2组,每个组左依赖于真正的协方差举证的最小特征值重数。

因此,检测可以以大大小于以前方法所要求的样本大小实现。

方位估计中的应用在我们的基本假设下,波达方向可以通过MUSIC算法的空间协方差矩阵R计算。

在实践中,由于缺乏对R的认识,必须在观察样本协方差矩阵的基础上就行计算。

因为往往是R的较差的近似,该方法可以在应用于MUSIC前通过以一个满足上述先验约束的矩阵来代替。

通过调用一套理论来估算和表示的约束,这个可行性问题可以归结为找到子集中的一个R在一般情况下,直接找到一个在S中的点是不可能的。

使投影映射到,是在中距离Q最近的(为了使计算可追踪,我们应采取Frobenius距离)。

在特定的集合和初始点,序列将收敛于,其中。

在这个方案中,集合周期性的更新,通过当前集合预测下一集合。

首先,我们可以在R-空间带来的问题构建一套真正的协方差矩阵的估计。

根据上述假设,R的秩为q是一个明显的先验约束。

因此,可以考虑(封闭的,非凸)矩阵的秩最多为q。

其他的限制可能会从这个几何数组中出现。

因此,如果等间距的传感器阵列是线性的,R将有一个Toeplitz矩阵结构,并可取是Toeplitz矩阵的子空间。

几个在阵列处理中使用投影到的应用已经被报道,列入[9],通常被称为Toeplitzation。

文献[2]提出通过和交替预测。

应该指出的是,在这样的过程中,可能会出现正定性的损失。

因此,应该加入第三个集合,即正定矩阵。

在模拟中,通过使用协方差矩阵约束而不是他原是对应的已经被报道,特别是当样本数目n的信噪比很低时。

在上述方法中,想要直接估计R,这限制了对噪声提供的信息利用。

另一种方法是估计无噪声p*n的数据矩阵模型中。

H的估计值可以通过各种约束条件合成。

然后可以形成约束估计,例如,,对它使用MUSIC。

现在让我考虑可以施加到H上的约束。

为此目的,对给定的H估计值定义了剩余矩阵。

注意到,我们有。

因此,所有涉及到N的统计信息可以加在上,并可以根据这个规则建立几个集合。

举例来说,在我们的假设下,Y()应该看起来像零均值、均方差为的独立同分布。

一个直接用于分析样品均值的应用将导致一组类型其中Y()是通过层叠得到的矢量的实部和虚部。

以类似的方式,可以得到Y()的其他统计。

H-空间框架也使得运用高维随机矩阵的性质变得可能。

事实上,根据理论2,可以通过Y()的最大奇异值获得一个限制(在高斯情况下也为最小)。

在最大奇异值的情况下,可以获得其中表示谱范,表示置信区间。

当然,前面提到的所有有关的约束条件也可用在H-空间。

例如,设置与Toeplitz相关的约束开放的问题高维随机矩阵有几个在应用于上述阵列信号处理中存在着几个数学问题。

三个最相关的概述如下。

扩展定理1定理1的应用需要2个在形成信号向量S(t)的假设。

首先是S(t)=CV(t),其中C是一个固定的q q的奇异矩阵,V(t)是独立同分布的随机变量的噪声成分。

由于通常假定信号和噪声成分是高斯的,这并不会称为一个主要的问题。

第二假设是整个快照下的独立的信号向量。

这个更加严重,即使在几个数学处理下假定的独立样本(例如,在标准信息论中计算q),并在大多数的文献中的模拟中都能找到。

扩展定理1中是否具有固定列的可能性还需要调查。

特征值分解在检测问题中,遵照精确的额特征值分解的模拟是惊人的。

更强的极限性质比弱收敛的离散函数是更加有效的,证明了这种追求是值得的。

结果基本上是扩展定理2上的的极端特征值。

收敛速度这个问题的普遍问题是如何快速的接近极限值。

[14]表明,对于p=50分离噪声和信号的特征值R与分离的F是一致的。

初步分析表明收敛速度1/m,支持通过限制行为可以不需要很高的m这个观点。

这里提到了2个另外的问题。

预测计算集合论建议的方法来确定到达方向是有一个缺点,在涉及到计算每次迭代预测的数值时单调乏味。

一般情况下,集的形式由给出,其中是一个给定的函数。

通过求解最小化问题得到矩阵Q’在上的投影可以通过拉格朗日乘法器得到。

但是,在不是凸面的情况下,可能会出现局部最小值。

在这种情况下,应该提出高效的综合方法来结局最小化问题。

收敛的可行点由于存在非凸集,一个可行点的连续投影算法的收敛性不能保证任何的初步估计。

虽然用提供的的迭代点开始是个明智的选择(例如,在R-空间方法,或者在H-空间方法),但它并不能保证收敛。

因此,收敛性问题值得进一步调查。

参考文献[1]Z. D. Bai, J. W. Silverstein, and Y. Q. Yin, “A Note on the Largest Eigenvalue of a Large Dimensional Sample Covariance Matrix,” Journal of Multivariate Analysis, vol. 26, no. 2, pp. 166-168, August 1988.[2] J. A. Cadzow, “Signal Enhancement - A Composite Property Mapping Algorithm,” IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 36, no. 1, pp. 49-62, January 1988.[3]P. L. Combettes a nd M. R. Civanlar, “The Founda tions of Set Theoretic Es timation,” ICASSP Proceedings, pp. 2921-2924. Toronto, Canada, May 14-17, 1991.[4] P. L. Combettes and H. J. Trussell, “Method of Suc cessive Projections for Finding a Common Point of Sets in Metric Spaces,” Journal of Optimization The ory and Applications, vol. 67, no. 3, pp. 487-507, December 1990.[5]P. L. Combettes and H. J. Trussell, “The Use of Noise Properties in Set Theoretic Estimation,” IEEE Trans- actions on Signal Processing, vol. 39, no. 7, pp. 1630- 1641, July 1991.[6]S. Geman, “A Limit Theorem for the Norm of Ran dom Matrices,” The Annals of Probability, vol. 8, no. 2, pp. 252-261, April 1980.[7] U. Grenander and J. W. Silverstein, “Spectral Anal ysis of Networks with R andom Topologies,” SIAM Journal on Applied Mathematics, vol. 32, no. 2, pp. 499-519, March 1977.[8]D. Jonsson, “Some L imit Theorems for the Eigenvalues of a Sample Covari ance Matrix,” Journal of Multivariate Analysis, vol. 12, no. 1, pp. 1-38, March 1982.[9]J. P. Lecadre and P. Lopez, “Estimation d’une Ma- trice Interspectrale de Structure Imposee,” Traitement du Signal, vol. 1, pp. 4-17, December 1984.[10] V. A. Marˇcenko and L. A. Pastur, “Distribution of Eigenvalues for Some Sets of Random Matrices,” Mathematics of the USSR Sbornik, vol. 1, no. 4, pp. 457-483, 1967.[11] R. O. Schmidt, “Multiple Emitter Location and Signal Parameter Estimation,” IEEE Transactions on Antennas and Propagation, vol. AP-34, no. 3, pp. 276- 280, March 1986.[12]J. W. Silv erstein, “The Smallest Eigenvalue of a Large Dimensional Wishart Matrix,” The Annals of Probability, vol. 13, no. 4, pp. 1364-1368, November 1985.[13] J. W. Silverstein, “On the Weak Limit of the Largest Eigenvalue of a Large Dimensional Sample Covariance Matrix,” Journal of Multivariate Analysis,vol. 30, no. 2, pp. 307-311, August1989.[14] J. W. Silverstein and P. L. Combettes, “Signal Detec tion via Spectral Theory of Large Dimensional Ran dom Matrices,” IEEE Transactions on Signal Processing, vol. 40, no. 8, August 1992.[15] Y. Q. Yin, “Limiting Spectral Distribution for a Class of Random Matrices,” Journal of Multivariate Analysis, vol. 20, no. 1, pp. 50-68, October 1986.[16]Y. Q. Yin, Z. D. Bai, and P. R. Krishnaiah, “On the Limit of the Largest Eigenvalue of the Large Dimen sional Sample Covariance Matrix,” Probability Theory and Related Fields, vol. 78, no. 4, pp. 509-521, Au- gust 1988.。

相关文档
最新文档